CN115427570A

CN115427570A - 用于靶向pcsk9的组合物和方法

Info

Publication number: CN115427570A
Application number: CN202180019446.7A
Authority: CN
Inventors: B·奥克斯; S·希金斯; H·斯平纳; S·丹尼; B·T·斯塔尔; K·泰勒; K·班尼; I·科林; M·阿迪勒; C·乌尔内斯
Original assignee: Scribe Therapy
Current assignee: Scribe Therapy
Priority date: 2020-01-10
Filing date: 2021-01-08
Publication date: 2022-12-02
Also published as: JP2023510352A; EP4087930A1; AU2021206270A1; KR20220125332A; IL294620A; CA3163714A1; WO2021142342A1; US20230167424A1

Abstract

本文提供了包含可用于修饰PCSK9基因的2类V型CRISPR多肽、引导核酸(gNA)和任选的供体模板核酸的系统。该系统也可用于引入至细胞，例如具有该PCSK9基因中的突变的真核细胞。还提供了使用此类CasX:gNA系统来修饰具有此类突变的细胞的方法。

Description

用于靶向PCSK9的组合物和方法

相关申请案的交叉参考

本申请要求于2020年1月10日提交的美国临时专利申请号62,959,685的优先权，所述美国临时专利申请的内容以全文引用的方式并入本文中。

通过引用并入序列表

本申请含有已经以ASCII格式经由EFS-WEB递交的序列表并且所述序列表据此通过引用整体并入。创建于2021年1月6日的所述ASCII副本命名为SCRB_017_01WO_SeqList_ST25.txt，并且大小为4.07MB。

背景技术

在哺乳动物中，胆固醇通过乳化作用在脂蛋白中运输。脂蛋白颗粒根据其密度分类如下：低密度脂蛋白(LDL)、极低密度脂蛋白(VLDL)、高密度脂蛋白(HDL)和乳糜微粒。表面LDL受体在胆固醇吸收过程中被内在化。胆固醇含量丰富的细胞会阻止其LDL受体的合成，以防止LDL颗粒中的新胆固醇被吸收。相反，当细胞缺乏胆固醇时，LDL受体的合成会得到促进。当这一过程未经调节时，过量的LDL颗粒将在血液中流动，而不会被LDL受体吸收。血液中的LDL颗粒被氧化并被巨噬细胞吸收，然后巨噬细胞变得充盈并形成泡沫细胞。这些泡沫细胞会被困在血管壁中，并导致动脉粥样硬化斑块的形成，这是心脏病发作、中风和其他严重医学问题的主要原因之一。

肝蛋白前蛋白转化酶枯草杆菌蛋白酶/kexin 9型(PCSK9)是一种分泌型球状自激活丝氨酸蛋白酶，其在LDL颗粒的胞吞过程中与低密度脂蛋白受体(LDL-R)结合，从而阻止LDL-R再循环到细胞表面并引起LDL-胆固醇清除率降低。PCSK9与LDL-R结合(通过EGF-A域)，从而阻止受体-配体复合物的构象变化，转而将LDL-R重定向至溶酶体。由于低密度脂蛋白颗粒(LDL)的受体通常在细胞外液内转运每个颗粒数千个脂肪分子(包括胆固醇)，因此阻断或抑制PCSK9的功能以促进LDL-R介导的LDL胆固醇清除可以降低LDL颗粒浓度。PCSK9主要在肝、肠、肾和中枢神经系统中表达，但也在动脉壁如内皮、平滑肌细胞和巨噬细胞中高度表达，具有可调节血管稳态和动脉粥样硬化的局部效应。

PCSK9是前蛋白转化酶(PC)家族的一员，其基因在约2％至3％的家族性高胆固醇血症(FH)个体中发生突变(Sepideh Mikaeeli,S.等人，Functional analysis of naturalPCSK9 mutants in modern and archaic humans.FEBS J.2019年8月6日，doi:10.1111/febs.15036)。研究人员已经鉴定了几种导致遗传形式的高胆固醇(高胆固醇血症)的PCSK9突变。这些突变改变了PCSK9蛋白中的单个蛋白构建单元(氨基酸)。研究人员将导致高胆固醇血症的突变描述为“功能获得”，因为它们似乎增强了PCSK9蛋白的活性或赋予该蛋白一种新的非典型功能(Blesa,S.等人，A New PCSK9 Gene Promoter Variant Affects GeneExpression and Causes Autosomal Dominant Hypercholesterolemia.J.Clin.Endocrinol.&Metab.93:3577(2008))。过度活跃的PCSK9蛋白大大减少了肝细胞表面上的低密度脂蛋白受体的数量。由于从血液中清除低密度脂蛋白的受体较少，PCSK9基因发生功能获得性突变的人具有非常高的血液胆固醇水平。常染色体显性高胆固醇血症(ADH)是一种遗传性病症，其特征是低密度脂蛋白(LDL)-胆固醇水平升高，导致早发性心血管疾病的高风险。在不同的人群中，PCSK9中大约有10种突变已被鉴定为该疾病的病因。导致高胆固醇血症的PCSK9的所有已知突变都会增加这种蛋白酶的酶活性(Bleasa,S.,2008)。此外，PCSK9的突变可导致常染色体显性家族性低β脂蛋白血症，从而可导致肝脂肪变性、肝硬化和其他病症。

CRISPR/Cas系统的出现和这些最小系统的可编程性质促进了它们作为基因组操作和工程的通用技术的用途。然而，目前在体内产生PCSK9保护性变异体和功能丧失性突变体的方法是无效的，因为需要修饰大量细胞来调节胆固醇水平。其他问题涉及脱靶效应、基因组不稳定性或可能由基因组编辑导致的致癌性修饰，以及基因编辑系统缺乏安全的递送方式。因此，仍然需要改进的组合物和方法来调节PCSK9。本文提供了用于靶向PCSK9的组合物和方法，以及递送载体，以满足这种需求。

发明内容

本公开涉及在编辑具有一个或多个突变的前蛋白转化酶枯草杆菌蛋白酶/kexin9型(PCSK9)基因靶核酸序列中使用的经修饰的2类V型CRISPR蛋白和引导核酸。可修饰2类V型CRISPR蛋白和引导核酸以被动进入靶细胞。2类V型CRISPR蛋白和引导核酸可用于靶核酸修饰的多种方法，也提供了这些方法。

在一个方面，本公开涉及2类V型CRISPR蛋白和引导核酸系统(例如CasX:gNA系统)以及用于改变细胞中包含编码PCSK9蛋白的基因(PCSK9基因)的靶核酸的方法。在本公开的一些实施例中，CasX:gNA系统可用于敲低或敲除具有一个或多个突变(其可以是功能获得性突变)的PCSK9基因，以减少或消除突变PCSK9基因产物的表达及由此引起的患有PCSK9病症的受试者的高胆固醇血症的升高。在其他实施例中，CasX:gNA系统可用于校正具有功能获得性突变的PCSK9基因的序列。

在一些实施例中，2类V型:gNA系统gNA是gRNA，或gDNA，或RNA和DNA的嵌合体，并且可以是单分子gNA或双分子gNA。在其他实施例中，系统gNA具有靶向序列，其包含与SEQ IDNO:247-303、315-436、612-2100或2286-13861的序列具有至少约50％、至少约60％、至少约70％、至少约80％、至少约85％、至少约90％或至少约95％或100％序列同一性的序列。在一些实施例中，gNA具有由一定序列组成的靶向序列，该序列选自由SEQ ID NO:247-303、315-436、612-2100和2286-13861组成的组。在一些实施例中，gNA的靶向序列与PCSK9基因的外显子内或其附近的序列互补。在另一个实施例中，gNA的靶向序列与PCSK9基因的内含子内或其附近的序列互补。在另一个实施例中，gNA的靶向序列与PCSK9基因的内含子-外显子连接处内或其附近的序列互补。在另一个实施例中，gNA的靶向序列与PCSK9基因的调节元件内或其附近的序列互补。在另一个实施例中，gNA的靶向序列与PCSK9基因的基因间区内或其附近的序列互补。gNA可包含含有14至30个连续核苷酸的靶向序列。在其他实施例中，gNA的靶向序列由20个核苷酸组成。在其他实施例中，靶向序列由19个核苷酸组成。在其他实施例中，靶向序列由18个核苷酸组成。在其他实施例中，靶向序列由17个核苷酸组成。在其他实施例中，靶向序列由16个核苷酸组成。在其他实施例中，靶向序列由15个核苷酸组成。

在一些实施例中，gNA具有支架，该支架包含选自由如表1中所列的SEQ ID NO:4-16组成的组的序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的序列。在其他实施例中，CasX:gNA系统gNA具有支架，该支架包含选自由如表2中所列的SEQ IDNO:2101-2286组成的组的序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的序列。

在一些实施例中，CasX:gNA系统包含参考CasX序列或CasX变异体，该参考CasX序列包含SEQ ID NO:1-3中的任何一个序列，该CasX变异体包含如表3、5-7和9中所列的SEQID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486或488或490的序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、或至少约90％、或至少约95％、或至少约96％、或至少约97％、或至少约98％、或至少约99％序列同一性的序列。在这些实施例中，相对于参考CasX蛋白，CasX变异体表现出一种或多种改进特征。在一些实施例中，该CasX蛋白对选自由TTC、ATC、GTC和CTC组成的组的前间隔子邻近基序(PAM)序列具有结合亲和力。在一些实施例中，与SEQ ID NO:1-3的任何一种CasX蛋白对选自由TTC、ATC、GTC和CTC组成的组的PAM序列的结合亲和力相比，该CasX蛋白对PAM序列的结合亲和力至少高1.5倍。

在本公开的2类V型CRISPR:gNA系统的一些实施例中，CRISPR分子和gNA分子在核糖核酸蛋白复合物(RNP)中缔合在一起。在一个具体的实施例中，相比于类似分析系统中包含参考CasX蛋白和参考gNA的RNP的编辑效率及/或结合，当PAM序列TTC、ATC、GTC或CTC中的任一者位于与细胞分析系统中的gNA的靶向序列具有一致性的非靶链序列5’的1个核苷酸处时，包含CasX变异体和gNA变异体的RNP表现出靶DNA中靶序列的较大编辑效率及/或结合。

在一些实施例中，该系统进一步包含含有核酸的供体模板，该核酸包含编码PCSK9蛋白或RNA序列的基因的至少一部分、PCSK9调节区或编码区和调节区两者，并且其中PCSK9编码基因部分选自由PCSK9外显子、PCSK9内含子和PCSK9内含子-外显子连接处组成的组，其中供体模板用于敲低或敲除PCSK9基因或用于校正PCSK9基因中的突变。在一些实施例中，该系统进一步包含含有核酸的供体模板，该核酸包含编码SEQ ID NO:33的至少一部分的序列。在其他实施例中，该系统进一步包含含有核酸的供体模板，该核酸包含相对于SEQID NO:33的野生型PCSK9基因序列具有一个或多个突变的核酸序列。在一些情况下，供体序列是单链DNA模板或单链RNA模板。在其他情况下，供体模板是双链DNA模板。

在其他实施例中，本公开提供了编码本文描述的任一实施例的系统的核酸，以及包含所述核酸的载体。在一些实施例中，载体选自由逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒(AAV)载体、单纯疱疹病毒(HSV)载体、质粒、微环、纳米质粒和RNA载体组成的组。在其他实施例中，载体是病毒样粒子(VLP)，其包含本文描述的任一实施例的CasX和gNA的RNP，以及任选的供体模板核酸。

在其他实施例中，本公开提供了修饰细胞的PCSK9靶核酸序列的方法，其中PCSK9基因包含一个或多个突变，其中所述方法包括向细胞中引入：a)包含本文公开的任何实施例的2类V型:gNA系统的组合物，该系统包括第一gNA；b)本文公开的任何实施例的核酸；c)本文公开的任何实施例的载体；d)本文公开的任何实施例的VLP；或e)前述两者或更多者的组合，其中第一gNA靶向的细胞的PCSK9靶核酸序列被2类V型CRISPR蛋白(例如CasX)修饰。在该方法的一些实施例中，该方法包括向群体的细胞中引入第二gNA或编码第二gNA的核酸，其中与第一gNA相比，第二gNA具有与PCSK9靶核酸的不同或重叠部分互补的靶向序列，引起群体的细胞的PCSK9靶核酸中的额外断裂。在该方法的一些实施例中，修饰包括与野生型序列相比，在靶核酸序列中引入一个或多个核苷酸的插入、缺失、取代、重复或倒位。在一些情况下，该方法还包括使靶核酸与本文公开的任一实施例的供体模板核酸接触。在该方法的一些实施例中，供体模板包含含有PCSK9基因的至少一部分的核酸以用于校正(通过敲入)PCSK9基因的突变，或包含含有突变或异源序列的序列以用于敲除突变PCSK9。在修饰导致PCSK9基因敲低的那些情况下，与未经修饰的细胞相比，非功能性PCSK9蛋白的表达减少至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。在修饰导致PCSK9基因敲除的其他情况下，群体的细胞的靶核酸被修饰，使得至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％的细胞不表达可检测水平的非功能性PCSK9蛋白。PCSK9蛋白的表达可通过流式细胞术、ELISA、基于细胞的分析、蛋白质印迹或本领域已知的或实例中描述的其他方法来测量。

在一些情况下，细胞中靶核酸序列的修饰发生在体内。在一些实施例中，细胞是选自由啮齿动物细胞、小鼠细胞、大鼠细胞、灵长类动物细胞、非人灵长类动物细胞和人类细胞组成的组的真核细胞。在一些实施例中，细胞是肝细胞，或肠、肾、中枢神经系统的细胞，平滑肌细胞，巨噬细胞，视网膜细胞，或动脉壁如内皮的细胞。在一些实施例中，细胞是眼细胞。在其他实施例中，本公开提供了修饰靶核酸序列的方法，其中使用编码CasX蛋白和一种或多种gNA并且任选地还包含供体模板的载体接触靶细胞。在一些情况下，载体是选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV44.9、AAV-Rh74或AAVRh10的腺相关病毒(AAV)载体。在其他情况下，载体是慢病毒载体。在其他实施例中，本公开提供了使用载体接触靶细胞的方法，其中载体是病毒样粒子，其包含本文描述的任一实施例的CasX和gNA的RNP，以及任选的供体模板核酸。在该方法的一些实施例中，将载体以治疗有效剂量施用于受试者。受试者可以是小鼠、大鼠、猪、非人灵长类动物或人类。该剂量可以通过选自由静脉内、门静脉内注射、腹膜内、肌内、皮下、眼内和口服途径组成的组的施用途径施用。

在其他实施例中，本公开提供了治疗有需要的受试者的PCSK9或相关病症的方法，该方法包括修饰受试者的细胞中编码PCSK9基因的基因，该修饰包括使所述细胞与治疗有效剂量的以下物质接触：i)包含本文公开的任何实施例的CasX和gNA及任选的供体模板的组合物，该gNA包括第一gNA；ii)编码(i)的组合物的核酸；载体，该载体选自由逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒(AAV)载体、单纯疱疹病毒(HSV)载体、质粒、微环、纳米质粒、DNA载体和RNA载体组成的组，并且包含(ii)的核酸；iii)包含(i)的组合物的VLP；或iv)(i)-(iii)中两者或更多者的组合，其中第一gNA靶向的细胞的PCSK9基因被CasX蛋白(和任选的供体模板)修饰，使得PCSK9基因的突变被校正或补偿，并且表达功能性PCSK9蛋白。在前述治疗受试者的PCSK9相关疾病的方法的其他实施例中，PCSK9基因被敲低或敲除，使得非功能性PCSK9蛋白的表达减少或消除。在一些实施例中，受试者选自由啮齿动物、小鼠、大鼠、非人灵长类动物和人类组成的组。在上文中，载体或VLP通过选自静脉内、门静脉内注射、腹膜内、肌内、皮下、眼内或口服途径的施用途径施用于受试者。在一些实施例中，PCSK9相关病症选自由以下病症组成的组：常染色体显性高胆固醇血症(ADH)、高胆固醇血症、总胆固醇水平升高、高脂血症、低密度脂蛋白(LDL)水平升高、LDL-胆固醇水平升高、高密度脂蛋白水平降低、肝脂肪变性、冠心病、局部缺血、中风、外周血管疾病、血栓形成、2型糖尿病、高血压、动脉粥样硬化、肥胖症、阿尔茨海默病、神经变性、年龄相关性黄斑变性(AMD)或其组合。

在一些情况下，该方法引起选自由以下组成的组的至少一个临床相关终点的改善：LDL-胆固醇从基线的百分比变化、粥样斑块体积的减少、冠状动脉斑块的减少、动脉粥样硬化性心血管疾病(ASCVD)、心血管性死亡、非致死性心肌梗死、缺血性中风、非致死性中风、冠状动脉血运重建、视敏度和不稳定型心绞痛的减少。在其他情况下，该方法使得至少两个临床相关终点的改善。

在另一个方面，本公开提供了包含本文所述核酸、载体、2类V型CRISPR蛋白、gNA和基因编辑对的药物组合物和试剂盒。

在另一个方面，本文提供了包含基因编辑对的组合物，或包含或编码基因编辑对的载体组合物，用作治疗患有PCSK9相关疾病的受试者的药物。

在另一个方面，本文提供了2类V型CRISPR:gNA系统，包含2类V型CRISPR:gNA系统的组合物，包含或编码2类V型CRISPR:gNA系统的载体，包含2类V型CRISPR:gNA系统的VLP，或使用2类V型CRISPR:gNA系统编辑的细胞群，用作治疗PCSK9相关疾病的药物。

在另一个方面，本文提供了2类V型CRISPR:gNA系统，包含2类V型CRISPR:gNA系统的组合物，或包含或编码2类V型CRISPR:gNA系统的载体，包含2类V型CRISPR:gNA系统的VLP，使用2类V型CRISPR:gNA系统编辑的细胞群，用于治疗有需要的受试者的PCSK9相关疾病的方法。

在另一个方面，本文提供了2类V型CRISPR:gNA系统，包含2类V型CRISPR:gNA系统的组合物，或包含或编码2类V型CRISPR:gNA系统的载体，包含2类V型CRISPR:gNA系统的VLP，使用2类V型CRISPR:gNA系统编辑的细胞群，用于制造治疗有需要的受试者的PCSK9相关疾病的药物。

通过引用的并入

本说明书中所提及的所有公开案、专利及专利申请案均以引用的方式并入本文中，其引用的程度如各个别公开案、专利或专利申请案经特定及个别地指示以引用的方式并入一般。2020年6月5日提交的PCT/US2020/036505的内容和2020年12月3日提交的美国临时专利申请号63/121,196的内容(都公开了CasX变异体和gNA变异体)据此以全文引用的方式并入。

附图说明

本公开的新颖特征在随附权利要求书中细致阐述。将参考阐述利用本公开原理的说明性实施例及其附图的以下详细描述来获得对本公开的特征及优势的更好理解：

图1示出了如实例1中所述的通过胶体考马斯染色观测的StX2纯化级分的SDS-PAGE凝胶。

图2示出了如实例1中所述的使用Superdex 200 16/600pg凝胶过滤对StX2进行的尺寸排阻色谱分析的色谱图。

图3示出了如实例1中所述的通过胶体考马斯染色观测的StX2纯化级分的SDS-PAGE凝胶。

图4为示出了如实例2中所述的用于组装CasX构建体的pSTX34质粒中的组分的组织的示意图。

图5为示出了如实例2中所述的生成CasX 119变异体的步骤的示意图。

图6示出了如实例2中所述的在Bio-Rad Stain-Free^TM凝胶上观测的纯化样品的SDS-PAGE凝胶。

图7示出了如实例2中所述的Superdex 200 16/600pg凝胶过滤的色谱图。

图8示出了如实例2中所述的通过胶体考马斯染色的凝胶过滤样品的SDS-PAGE凝胶。

图9示出了如实例10中所述的HEK293T细胞中的6种靶基因的编辑分析的结果。每个点表示使用各个间隔子的结果。

图10示出了如实例10中所述的HEK293T细胞中的6种靶基因的编辑分析的结果，其中各个条形表示由各个间隔子获得的结果。

图11示出了如实例10中所述的HEK293T细胞中的4种靶基因的编辑分析的结果。每个点表示使用各个间隔子，利用CTC PAM的结果。

图12为如实例12中所述的由sgRNA174和CasX变异体形成的RNP的活性分率的定量分析的结果的图示。等摩尔量的RNP及靶标经共培育且在指定时间点测定裂解靶标的量。针对各时间点显示三个独立重复样的平均值及标准差。展示合并重复样的双相拟合。“2”是指SEQ ID NO:2的参考CasX蛋白。

图13示出了如实例12中所述的由CasX2(SEQ ID NO:2的参考CasX蛋白)和修饰的sgRNA形成的RNP的活性分率的定量。等摩尔量的RNP及靶标经共培育且在指定时间点测定裂解靶标的量。针对各时间点显示三个独立重复样的平均值及标准差。展示合并重复样的双相拟合。

图14示出了如实例12中所述的在引导限制条件下由CasX 491和修饰的sgRNA形成的RNP的活性分率的定量。等摩尔量的RNP及靶标经共培育且在指定时间点测定裂解靶标的量。示出了数据的双相拟合。

图15示出了如实例12中所述的由sgRNA174和CasX变异体形成的RNP的裂解速率的定量。靶DNA与20倍过量的指定RNP一起培育，且在指定时间点测定裂解靶标的量。示出了每个时间点的三个独立重复的平均值和标准偏差，除了示出了单个重复的488和491。展示合并重复样的单相拟合。

图16示出了如实例12中所述的由CasX2和sgRNA变异体形成的RNP的裂解速率的定量。靶DNA与20倍过量的指定RNP一起培育，且在指定时间点测定裂解靶标的量。针对各时间点显示三个独立重复样的平均值及标准差。展示合并重复样的单相拟合。

图17示出了如实例12中所述的由CasX2和sgRNA变异体形成的RNP的初始速度的定量。将前述裂解实验之前两个时间点与线性模型拟合以确定初始裂解速度。

图18示出了如实例12中所述的由CasX491和sgRNA变异体形成的RNP的裂解速率的定量。靶DNA与20倍过量的指定RNP在10℃下一起培育，且在指定时间点测定裂解靶标的量。示出了时间点的单相拟合。

图19为如实例21中所述的示出了用于分析参考CasX蛋白或单引导RNA(sgRNA)或其变异体的有效性的示例性方法的图解和实例荧光活化细胞分选(FACS)图。偶联至与gRNA间隔子互补的gRNA靶序列的报道子(例如，GFP报道子)整合至报道子细胞系中。细胞经CasX蛋白和/或sgRNA变异体转化或转染，其中sgRNA的间隔子基序与报道子的gRNA靶序列互补且靶向gRNA靶序列。通过FACS分析CasX:sgRNA核糖核蛋白复合物裂解靶序列的能力。丧失报道子表达的细胞指示发生CasX:sgRNA核糖核蛋白复合物介导的裂解及插入缺失形成。

图20示出了如实例23中所述的EGFP破坏分析中基因编辑的结果。编辑通过携有GFP报道子的HEK293细胞中的插入缺失形成及GFP破坏来测量。该图示出了SEQ ID NO:5的CasX sgRNA变异体相对于SEQ ID NO:4的参考在10个靶标上的编辑效率的提高。当跨越10个靶标取平均值时，sgRNA SEQ ID NO:5的编辑效率相比于SEQ ID NO:4提高了176％。

图21示出了如实例24中所述的在EGFP破坏分析中基因编辑的结果，其中通过将延伸的茎环序列(在X轴中指示)交换为额外的序列以生成序列示于表2中的支架，从而在SEQID NO:5的sgRNA支架中获得了进一步的编辑改进。

图22为示出了如实例24中所述的由DME突变生成的sgRNA变异体相对于作为CasX参考sgRNA的SEQ ID NO:5归一化的改进倍数的图示。ATTATCTCATTACT以SEQ ID NO:13862提供。

图23为示出了通过组合(堆叠)示出改进裂解的支架茎突变、示出改进裂解的DME突变和使用示出改进裂解的核酶附属物(附属物及其序列列于实例24的表16中)产生的变异体相对于SEQ ID NO:5参考CasX sgRNA归一化的改进倍数的图示。在此分析中，相比于SEQ ID NO:5，所得的sgRNA变异体产生2倍或更大的裂解改进。用实例23中描述的E6(TGTGGTCGGGGTAGCGGCTG(SEQ ID NO:17))和E7(TCAAGTCCGCCATGCCCGAA(SEQ ID NO:18))的间隔子靶序列进行EGFP编辑分析。

图24是通过在HEK293T细胞中PCSK9基因座处的CasX的NGS进行分析的编辑结果的图示，示出了总编辑百分比，如实例25中所述。

图25是通过在Hep2G细胞中PCSK9基因座处的CasX的NGS进行分析的编辑结果的图示，示出了总编辑百分比，如实例26中所述。

图26是通过在AML12细胞中PCSK9基因座处的CasX的NGS进行分析的编辑结果的图示，示出了总编辑百分比，如实例27中所述。

具体实施方式

虽然本文中已显示及描述示例性实施例，但本领域技术人员将显而易知此类实施例仅作为实例提供。在不背离本文所要求保护的本发明的情况下，本领域技术人员现将想到许多变化、改变及替代。应理解，本文所述的实施例的各种替代例可用于实践本公开的实施例。预期权利要求书界定本发明的范围，且因此涵盖这些权利要求书及其等效物的范围内的方法及结构。

除非另外定义，否则本文中所用的所有技术及科学术语均具有与本发明所属领域的普通技术人员通常所理解相同的含义。尽管与本文所述的方法及材料类似或等效的方法及材料可用于实践或测试本发明实施例，但下文描述适合的方法及材料。在冲突的情况下，将以专利说明书(包括定义)为准。另外，所述材料、方法及实例仅为说明性的且不旨在为限制性的。在不脱离本发明的情况下，本领域技术人员现将想到诸多变化、改变及取代。

定义

术语“多核苷酸”及“核酸”在本文中可互换使用，是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式。因此，术语“多核苷酸”及“核酸”涵盖单链DNA；双链DNA；多链DNA；单链RNA；双链RNA；多链RNA；基因组DNA；cDNA；DNA-RNA杂合体；及包含嘌呤及嘧啶碱基或其他天然、经化学或生物化学修饰、非天然或衍生化核苷酸碱基的聚合物。

“可杂交”或“互补”可互换使用，意指核酸(例如RNA、DNA)包含使其能够在温度及溶液离子强度的适当体外及/或体内条件下以序列特异性、反向平行方式(即，核酸特异性结合于互补核酸)与另一核酸非共价结合(形成沃森-克里克(Watson-Crick)碱基对及/或G/U碱基对)、“退火”或“杂交”的核苷酸序列。应当理解，多核苷酸的序列不必与待特异性杂交的靶核酸100％互补；其可以具有至少约70％、至少约80％、或至少约90％、或至少约95％序列同一性且仍与靶核酸序列杂交。此外，多核苷酸可在一个或多个区段上杂交，使得中间或邻近区段不参与杂交事件(例如环结构或发夹结构、“凸起”、“气泡”等)。

出于本公开的目的，“基因”包括编码基因产物(例如蛋白质、RNA)的DNA区以及调节基因产物生产的所有DNA区，无论此类调节元件序列是否邻近于编码及/或经转录序列。因此，基因可包括调节序列，其包括但不必限于启动子序列、终止子、翻译调节序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因座控制区。编码序列编码转录或转录及翻译后的基因产物；本公开的编码序列可包含片段且不必含有全长开放阅读框架。基因可包括经转录的链，例如含有编码序列的链，以及互补链。

术语“下游”是指位于参考核苷酸序列的3’处的核苷酸序列。在某些实施例中，下游核苷酸序列与转录起始点之后的序列相关。举例来说，基因的翻译起始密码子位于转录起始位点下游。

术语“上游”是指位于参考核苷酸序列的5’处的核苷酸序列。在某些实施例中，上游核苷酸序列与位于编码区或转录起始点的5’侧上的序列相关。举例来说，大部分启动子位于转录起始位点上游。

术语“调节元件”在本文中可与术语“调节序列”互换使用，且旨在包括启动子、增强子及其他表达调节元件(例如转录终止信号，如聚腺苷酸化信号及聚-U序列)。示例性调节元件包括转录启动子，例如但不限于CMV、CMV+内含子A、SV40、RSV、HIV-Ltr、延长因子1α(EF1α)、MMLV-ltr以及其他调节元件，如内部核糖体进入位点(IRES)或P2A肽以准许自单一转录物、金属硫蛋白、转录增强子元件、转录终止信号、聚腺苷酸化序列、用于使翻译起始优化的序列及翻译终止序列翻译多个基因。应了解，适当调节元件的选择将取决于待表达的经编码组分(例如蛋白质或RNA)或核酸是否包含多个需要不同聚合酶或不旨在表达为融合蛋白的组分。

术语“启动子”是指含有RNA聚合酶结合位点、转录起始位点、TATA盒及/或B识别元件且有助于或促进相关可转录多核苷酸序列及/或基因(或转基因)的转录及表达的DNA序列。启动子可以合成方式产生或可衍生自已知或天然存在的启动子序列或另一启动子序列。启动子可在待转录的基因近端或远程。启动子亦可包括嵌合启动子，其包含两种或更多种异源序列的组合以赋予某些特性。本公开的启动子可包括与本文已知或提供的其他启动子序列在组成上类似，但与其不相同的启动子序列的变异体。启动子可根据与相关编码或可转录序列或基因的表达模式相关的标准分类，该序列或基因可操作地连接于启动子，例如组成性、发育性、组织特异性、诱导性启动子等。

术语“增强子”是指当与称为转录因子的特异性蛋白质结合时，调节相关基因的表达的调节元件DNA序列。增强子可位于基因的内含子中，或基因的编码序列的5’或3’处。增强子可在基因近端(即，在启动子的几十或数百个碱基对(bp)内)，或可位于基因远程(即，与启动子相距数千个bp、数十万个bp或甚至数百万个bp)。单一基因可通过超过一种增强子调节，其均被设想为在本公开的范围内。

如本文所用，“重组”意指特定核酸(DNA或RNA)为克隆、限制及/或连接步骤的各种组合的产物，产生具有与天然系统中发现的内源核酸可区分的结构性编码或非编码序列的构建体。一般来说，编码结构性编码序列的DNA序列可组装自cDNA片段及短寡核苷酸接头，或组装自一系列合成寡核苷酸，以得到能够自细胞或游离转录及翻译系统中所含的重组转录单元表达的合成核酸。此类序列可以未经内部非翻译序列，或内含子(其通常存在于真核基因中)间断的开放阅读框架的形式提供。包含相关序列的基因组DNA亦可用于形成重组基因或转录单元。非翻译DNA的序列可存在于开放阅读框架的5’或3’，其中此类序列不干扰编码区的操纵或表达，且可实际上用于通过各种机制调节所需产物的生产(参见上文的“增强子”及“启动子”)。

术语“重组多核苷酸”或“重组核酸”是指不天然存在的多核苷酸或核酸，例如经由人工干预由序列的两个另外分离区段的人工组合制得。此人工组合通常通过化学合成手段或通过人工操纵核酸的分离区段，例如通过基因工程化技术来实现。可进行此类操作以用编码相同或保守氨基酸，同时通常引入或去除序列识别位点的冗余密码子来替换密码子。或者，进行其以将具有所需功能的核酸区段连接在一起以产生功能的所需组合。此人工组合通常通过化学合成手段或通过人工操纵核酸的分离区段，例如通过基因工程化技术来实现。

类似地，术语“重组多肽”或“重组蛋白”是指并非天然存在的多肽或蛋白质，例如通过经由人工干预将氨基序列的两个另外分离的区段人工组合而制得。因此，例如包含异源氨基酸序列的蛋白质为重组的。

如本文所用，术语“接触”意指在两个或更多个实体之间建立物理连接。例如，使靶核酸序列与引导核酸接触意味着使靶核酸序列和引导核酸共享物理连接；例如，在序列共享序列类似性时可以杂交。

“解离常数”或“K_d”可互换使用且意指配位体“L”与蛋白质“P”之间的亲和力；即配位体与特定蛋白质结合的紧密程度。其可使用式K_d＝[L][P]/[LP]计算，其中[P]、[L]及[LP]分别表示蛋白质、配位体及复合物的摩尔浓度。

本公开提供了可用于修饰靶核酸序列的组合物及方法。如本文所用，“修饰”包括但不限于裂解、切割、编辑、缺失、敲入、敲除等。

术语“敲除”是指基因的消除或基因的表达。例如，可以通过缺失或添加导致阅读框破坏的核苷酸序列来敲除基因。作为另一实例，可以通过用不相关的序列替换基因的一部分来敲除基因。如本文所用，术语“敲低”是指基因或其基因产物的表达减少。作为基因敲低的结果，蛋白质活性或功能可能会减弱，或者蛋白质水平可能会降低或消除。

如本文所用，“同源定向修复”(HDR)是指在修复细胞中的双链断裂期间发生的DNA修复形式。此方法需要核苷酸序列同源性，且使用供体模板来修复或敲除靶DNA，且使得遗传信息自供体(例如供体模板)转移至靶标。如果供体模板不同于靶DNA序列且供体模板的一部分或所有序列在适当基因组基因座处并入至靶DNA中，那么同源定向修复可通过插入、缺失或突变引起靶核酸序列的序列的改变。

如本文所用，“非同源末端连接”(NHEJ)是指通过断裂末端彼此直接连接而修复DNA中的双链断裂，而无需同源模板(相比于同源定向修复，其需要同源序列来引导修复)。NHEJ通常引起插入缺失；双链断裂位点附近核苷酸序列的损失(缺失)或插入。

如本文所用，“微同源性介导的末端连接”(MMEJ)是指诱变DSB修复机制，其始终与侧接断裂位点的缺失结合，而无需同源模板(相比于同源定向修复，其需要同源序列来引导修复)。MMEJ通常引起双链断裂位点附近核苷酸序列的损失(缺失)。

多核苷酸或多肽(或蛋白质)与另一多核苷酸或多肽具有某一百分比“序列类似性”或“序列一致性”意指当比对时，碱基或氨基酸的百分比相同，且当比较两个序列时在相同的相对位置。序列类似性(可互换地称为百分比类似性、百分比一致性或同源性)可以多种不同方式确定。为了确定序列类似性，序列可使用本领域中已知的方法及计算机程序比对，包括在万维网上于ncbi.nlm.nih.gov/BLAST可用的BLAST。核酸内的核酸序列的特定伸长部之间的百分比互补性可使用任何便利方法确定。实例性方法包括BLAST程序(基本局部比对搜索工具)及PowerBLAST程序(Altschul等人,J.Mol.Biol.,1990,215,403-410；Zhang及Madden,Genome Res.,1997,7,649-656)或通过使用Gap程序(Wisconsin SequenceAnalysis Package,用于Unix的版本8,Genetics Computer Group,University ResearchPark,Madison Wis.)，例如使用默认设定，其使用史密斯及沃特曼算法(algorithm ofSmith and Waterman)(Adv.Appl.Math.,1981,2,482-489)。

术语“多肽”及“蛋白质”在本文中可互换使用，且是指任何长度的氨基酸的聚合形式，其可包括编码及非编码氨基酸、化学或生物化学修饰或衍生的氨基酸及具有经修饰肽主链的多肽。该术语包括融合蛋白，包括但不限于具有异源氨基酸序列的融合蛋白。

“载体”或“表达载体”为复制子，例如质粒、噬菌体、病毒或黏质粒，另一DNA区段(即“插入物”)可与其连接，以引起细胞中经连接区段的复制或表达。

应用于核酸、多肽、细胞或生物体的如本文所用的术语“天然存在的”或“未修饰”或“野生型”是指自然界中发现的核酸、多肽、细胞或生物体。

如本文所用，“突变”是指相比于野生型或参考氨基酸序列或野生型或参考核苷酸序列，一个或多个氨基酸或核苷酸的插入、缺失、取代、重复或倒位。

如本文所用，术语“经分离”意在描述处于与多核苷酸、多肽或细胞天然存在的环境不同的环境中的多核苷酸、多肽或细胞。经分离的遗传修饰宿主细胞可存在于遗传修饰宿主细胞的混合群体中。

如本文所用，“宿主细胞”指示真核细胞、原核细胞或来自以单细胞实体培养的多细胞生物体(例如细胞系)的细胞，所述真核细胞或原核细胞用作核酸的受体(例如表达载体)，且包括已通过核酸遗传修饰的原始细胞的后代。应理解，单细胞的后代可因天然、偶发或故意突变而不一定与原始亲本具有完全相同的形态或基因组或总DNA互补序列。“重组宿主细胞”(亦称为“遗传修饰宿主细胞”)为其中已引入异源核酸，例如表达载体的宿主细胞。

术语“保守氨基酸取代”是指具有类似侧链的氨基酸残基的蛋白质中的互换性。举例来说，具有脂肪族侧链的一组氨基酸由甘氨酸、丙氨酸、缬氨酸、亮氨酸及异亮氨酸组成；具有脂肪族-羟基侧链的一组氨基酸由丝氨酸及苏氨酸组成；具有含酰胺侧链的一组氨基酸由天冬酰胺及谷氨酰胺组成；具有芳香族侧链的一组氨基酸由苯丙氨酸、酪氨酸及色氨酸组成；具有碱性侧链的一组氨基酸由赖氨酸、精氨酸及组氨酸组成；且具有含硫侧链的一组氨基酸由半胱氨酸及甲硫氨酸组成。示例性保守氨基酸取代组为：缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸及天冬酰胺-谷氨酰胺。

术语“低密度脂蛋白(LDL)”是指脂蛋白的五个主要组之一，从最小密度(较低重量体积比的颗粒)到最大密度(较大重量体积比的颗粒)为：乳糜微粒、极低密度脂蛋白(VLDL)、低密度脂蛋白(LDL)、中密度脂蛋白(IDL)和高密度脂蛋白(HDL)。脂蛋白在细胞外液中将脂质(脂肪)转移到身体周围，从而促进脂肪通过受体介导的胞吞作用转移到细胞体。LDL颗粒的直径约为220-275埃。

“低密度脂蛋白(LDL)受体”是指一种839个氨基酸(去除21个氨基酸的信号肽后)的受体蛋白，其介导富含胆固醇的LDL颗粒的胞吞作用。它是一种细胞表面受体，识别在乳糜微粒残余物和VLDL残余物(IDL)中发现的脱辅基蛋白B100和apoE蛋白，引起LDL-胆固醇的结合和胞吞。这一过程发生在所有有核细胞中，但主要发生在肝脏中，肝脏从循环中去除约70％的LDL。人LDLR基因部分地在NCBI数据库(ncbi.nlm.nih.gov)中描述为参考序列NG_009060.1，该参考序列通过引用并入本文。

如本文所用，“治疗(treatment)”或“治疗(treating)”在本文中可互换使用，且是指获得有益或所需结果，包括但不限于治疗益处及/或预防益处的方法。治疗效益意指根除或改善所治疗的潜在病症或疾病。治疗益处亦可通过与潜在病症相关的一种或多种症状的根除或改善或一种或多种临床参数的改进，使得在受试者中观测到改进来达成，尽管如此，受试者仍可能罹患潜在病症。

如本文所用，术语“治疗有效量”和“治疗有效剂量”是指单独或作为组合物一部分的药物或生物制剂的量，其当以一个或重复剂量向如人类或实验动物的受试者施用时，能够对疾病状态或病症的任何症状、方面、测量参数或特征具有任何可检测的有益影响。此类效应不必绝对有益。

如本文所用，“施用”意指向受试者给予一定剂量的化合物(例如，本公开的组合物)或组合物(例如，药物组合物)的方法。

如本文所用，“受试者”为哺乳动物。哺乳动物包括但不限于驯养动物、非人灵长类动物、人类、兔子、小鼠、大鼠及其他啮齿动物。

I.通用方法

除非另外规定，否则本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学及重组DNA的常规技术，其可见于例如以下的标准教科书：Molecular Cloning:A Laboratory Manual,第3版(Sambrook等人,Harbor LaboratoryPress2001)；Short Protocols in Molecular Biology,第4版(Ausubel等人编,JohnWiley&Sons 1999)；Protein Methods(Bollag等人,John Wiley&Sons 1996)；NonviralVectors for Gene Therapy(Wagner等人编,Academic Press 1999)；Viral Vectors(Kaplift及Loewy编,Academic Press 1995)；Immunology Methods Manual(I.Lefkovits编,Academic Press 1997)；及Cell and Tissue Culture:Laboratory Procedures inBiotechnology(Doyle及Griffiths,John Wiley&Sons 1998)，所述文献的公开内容以引用的方式并入本文中。

当提供值范围时，应理解除非上下文另外明确指出，否则包括端点且在该范围的上限与下限之间的各个中间值(至下限的单位的十分之一)及在该规定范围内的任何其他指定值或中间值均被涵盖。这些较小范围的上限及下限可独立地包括于较小范围中，且亦被涵盖，在所述范围内受到任何特定排他性限制。当所述范围包括限值中的一者或两者时，也包括排除那些所包括限值的任一者或两者的范围。

除非另外规定，否则本文中所用的所有技术及科学术语具有与本发明所属领域的普通技术人员通常所理解相同的含义。本文中所提及的所有公开案以引用的方式并入本文中以结合所述公开案所列举的方法及/或材料来公开且描述。

必须注意，除非上下文另有明确规定，否则如在本文中及所附权利要求书中所使用，单数形式“一个”、“一种”及“该”包括多个指示物。

应了解，出于明晰的目的而在独立实施例的背景下描述的本公开的某些特征亦可以组合形式提供于单一实施例中。在其他情况下，为简洁起见而在单一实施例的背景下描述的本公开的各种特征亦可分别或以任何适合的子组合提供。关于本公开的实施例的所有组合旨在由本公开特定涵盖且在本文中公开，如同单独且明确地公开每一组合一般。另外，各种实施例及其要素的所有子组合亦由本公开特定涵盖且在本文中公开，如同单独且明确地在本文中公开每一此类子组合一般。

II.PCSK9基因的遗传编辑系统

在第一方面，本公开提供了包含CRISPR核酸酶蛋白和一种或多种引导核酸(gNA)以及编码CRISPR核酸酶蛋白和gNA的核酸的系统，用于修饰或编辑PCSK9基因(本文称为“靶核酸”)以修饰PCSK9基因产物的表达。

如本文所用，“系统”，例如包含本公开的CRISPR核酸酶蛋白和一种或多种gNA以及编码CRISPR核酸酶蛋白和gNA的核酸的系统，可与术语“组合物”互换使用。

PCSK9基因编码前蛋白转化酶枯草杆菌蛋白酶/kexin 9型(“PCSK9”)，这是一种与低密度脂蛋白颗粒(LDL)受体结合的蛋白质，用于将LDL转运到细胞中。PCSK9基因涵盖跨越人类基因组的chr1:55,039,476-55,064,853(GRCh38/hg38)的序列(该符号是指染色体1(chr1)，起始于染色体1上的55,039,476bp至55,064,853bp(智人更新注释版本109.20190905，GRCh38.p13)(NCBI)。人PCSK9基因部分地在NCBI数据库(ncbi.nlm.nih.gov)中描述为参考序列NG_009061.1，该参考序列通过引用并入本文。PCSK9基因座有12个外显子，产生3636bp的mRNA，该mRNA编码692个氨基酸的蛋白质，该蛋白质在其合成后，经历自催化切割反应，由此切除前域，产生具有540个氨基酸的活化蛋白质。前域保持附着于抵抗素样催化域，可能是因为前域充当伴侣蛋白并促进折叠和分泌(Seidah,NG等人，Proc Natl Acad Sci USA 100(3):928(2003))。分泌型前蛋白转化酶神经凋亡调节转化酶1(NARC-1)：肝再生和神经元分化(Seidah NG等人)。这种蛋白质也称为神经凋亡调节转化酶，它是一种丝氨酸蛋白酶，属于枯草杆菌蛋白酶的蛋白酶K亚家族。

人PCSK9基因(HGNC:20001)编码具有以下序列的蛋白质(Q8NBP7)：MGTVSSRRSWWPLPLLLLLLLLLGPAGARAQEDEDGDYEELVLALRSEEDGLAEAPEHGTTATFHRCAKDPWRLPGTYVVVLKEETHLSQSERTARRLQAQAARRGYLTKILHVFHGLLPGFLVKMSGDLLELALKLPHVDYIEEDSSVFAQSIPWNLERITPPRYRADEYQPPDGGSLVEVYLLDTSIQSDHREIEGRVMVTDFENVPEEDGTRFHRQASKCDSHGTHLAGVVSGRDAGVAKGASMRSLRVLNCQGKGTVSGTLIGLEFIRKSQLVQPVGPLVVLLPLAGGYSRVLNAACQRLARAGVVLVTAAGNFRDDACLYSPASAPEVITVGATNAQDQPVTLGTLGTNFGRCVDLFAPGEDIIGASSDCSTCFVSQSGTSQAAAHVAGIAAMMLSAEPELTLAELRQRLIHFSAKDVINEAWFPEDQRVLTPNLVAALPPSTHGAGWQLFCRTVWSAHSGPTRMATAVARCAPDEELLSCSSFSRSGKRRGERMEAQGGKLVCRAHNAFGGEGVYAIARCCLLPQANCSVHTAPPAEASMGTRVHCHQQGHVLTGCSSHWEVEDLGTHKPPVLRPRGQPNQCVGHREASIHASCCHAPGLECKVKEHGIPAPQEQVTVACEEGWTLTGCSALPGTSHVLGAYAVDNTCVVRSRDVSTTGSTSEGAVTAVAICCRSRHLAQASQELQ(SEQID NO:33)。

在一些实施例中，本公开提供了被专门设计成修饰真核细胞中具有功能获得性突变的PCSK9基因的系统。在一些情况下，CRISPR系统被设计成敲低或敲除PCSK9基因。在其他情况下，CRISPR系统被设计成校正PCSK9基因中的一个或多个突变。一般来说，PCSK9基因的任何部分都可以使用本文提供的可编程组合物和方法来靶向，本文对此进行了更充分的描述。

在一些实施例中，CRISPR核酸酶是2类V型核酸酶。在一些实施例中，2类V型核酸酶选自由Cas12a、Cas12b、Cas12c、Cas12d(CasY)、Cas12J、CasZ和CasX组成的组。在一些实施例中，本公开提供了包含一种或多种CasX蛋白和一种或多种引导核酸(gNA)的系统，作为CasX:gNA系统。

在一些实施例中，本公开的CasX:gNA系统包含一种或多种CasX蛋白、一种或多种引导核酸(gNA)和一种或多种供体模板核酸，所述供体模板核酸包含编码PCSK9基因的一部分的核酸，其中该核酸包含野生型序列、编码功能性PCSK9蛋白的一部分的cDNA序列、与编码突变体PCSK9的基因组核酸序列相比一个或多个核苷酸的缺失、插入或突变。在一些实施例中，与野生型PCSK9基因相比，供体模板包含一个或多个突变，这些突变用于插入以敲除或敲低(下文将更充分描述)具有一个或多个突变的靶核酸序列。在其他情况下，CasX:gNA系统可以任选地进一步包含供体模板，以用于在靶细胞中引入(或敲入)编码产生野生型PCSK9蛋白的序列(SEQ ID NO:33)的全部或部分基因。

在PCSK9突变跨越多个外显子的那些情况下，本公开考虑了足够长度的供体模板，该长度也可以被优化以在供体模板中的外显子之间包含长度缩短(相对于基因组内含子)的合成内含子序列，从而确保PCSK9基因座的正确表达和加工。在一些实施例中，供体多核苷酸包含至少约10、至少约50、至少约100、或至少约200、或至少约300、或至少约400、或至少约500、或至少约600、或至少约700、或至少约800、或至少约900、或至少约1000、或至少约10,000、或至少约15,000或至少约30,000个核苷酸。在其他实施例中，供体多核苷酸包含至少约10至约30,000个核苷酸、或至少约100至约15,000个核苷酸、或至少约400至约10,000个核苷酸、或至少约600至约5000个核苷酸、或至少约1000至约2000个核苷酸，其中PCSK9基因部分选自由PCSK9外显子、PCSK9内含子、PCSK9内含子-外显子连接处、PCSK9调节区、PCSK9编码区、PCSK9非编码区、PCSK9基因的任何前述部分的组合或整个PCSK9基因组成的组。在一些实施例中，PCSK9基因部分包含任何PCSK9外显子序列、PCSK9内含子序列、PCSK9内含子-外显子连接序列或PCSK9调节区序列的组合。在一些实施例中，供体模板为单链DNA模板或单链RNA模板。在其他实施例中，供体模板为双链DNA模板。

在一些实施例中，本公开提供了本文所述的任一实施例的CasX和gNA的基因编辑对，其能够在其用于基因编辑之前结合在一起并且因此“预复合”为核糖核蛋白复合物(RNP)。使用预复合的RNP在将系统组分递送至细胞或靶核酸序列以编辑靶核酸序列方面赋予优势。在一些实施例中，功能性RNP可以通过电泳或化学手段离体递送至细胞。在其他实施例中，功能性RNP可以通过载体以其功能形式离体或体内递送。gNA可以通过包括具有与靶核酸序列的序列互补的核苷酸序列的靶向序列(或“间隔子”)来为复合物提供靶特异性，而预复合的CasX:gNA的CasX蛋白提供了位点特异性活性，例如靶序列的裂解或切割，该活性由于其与gNA的关联而被引导至靶核酸序列内的靶位点(例如，稳定在PCSK9基因内的靶位点)。CasX:gNA系统的CasX蛋白和gNA组分及其序列、特征和功能以及它们在编辑PCSK9基因中的用途更充分描述于下文。

III.遗传编辑系统的引导核酸

在另一个方面，本公开涉及包含与PCSK9基因的靶核酸序列互补的靶向序列的引导核酸(gNA)，其中gNA能够与CRISPR蛋白形成复合物，该CRISPR蛋白对在互补的非靶链中包含TC基序的前间隔子邻近基序(PAM)序列具有特异性，并且其中PAM序列位于与靶核酸的靶链中的靶核酸序列互补的非靶链中的序列5’的1个核苷酸处。在一些实施例中，gNA能够与2类V型CRISPR核酸酶形成复合物。在一个具体的实施例中，gNA能够与CasX核酸酶形成复合物。

在一些实施例中，本公开涉及在CasX:gNA系统中使用的引导核酸(gNA)，所述系统可用于细胞中PCSK9基因的基因组编辑。本公开提供了特别设计的引导核酸(“gNA”)，其具有与PCSK9基因互补(并因此能够与之杂交)的靶向序列作为基因编辑CasX:gNA系统的组成部分。可在实施例的gNA中使用的针对PCSK9靶核酸的靶向序列的代表性但非限制性实例被呈现为SEQ ID NO:247-303、315-436、612-2100和2286-13861。在一些实施例中，gNA为脱氧核糖核酸分子(“gDNA”)；在一些实施例中，gNA为核糖核酸分子(“gRNA”)，且在其他实施例中，gNA为嵌合体，且包含DNA及RNA两者。如本文所用，术语gNA、gRNA和gDNA涵盖天然存在的分子，以及序列变异体。

可以设想，在一些实施例中，在通过使用CasX:gNA系统修饰靶核酸序列的方法中递送多个gNA(例如，两个或更多个)，然后通过宿主细胞修复机制如非同源末端连接(NHEJ)、同源定向修复(HDR，其可以包括例如插入供体模板以替换PCSK9外显子的全部或一部分)、同源非依赖性靶向整合(HITI)、微同源介导的末端连接(MMEJ)、单链退火(SSA)或碱基切除修复(BER)对其进行编辑。例如，当需要被设计成缺失PCSK9基因的一个或多个突变外显子的编辑事件时，可以使用一对gNA，以便在PCSK9基因内携带突变的外显子的两个不同位点5’和3’结合和裂解。在核酸的上下文中，裂解是指通过核酸酶使核酸分子(无论是DNA还是RNA)的共价主链断裂。单链裂解和双链裂解都是可能的，并且双链裂解可以由于两个不同的单链裂解事件而发生。在一些实施例中，由本文所述实施例的CasX:gNA系统和细胞修复系统引入的小插入缺失可以恢复突变体PCSK9基因的蛋白质阅读框架(“重构”策略)。当使用重构策略时，细胞可以与单个gNA接触。参考gNA及gNA变异体。

在一些实施例中，本公开的gNA包含天然存在的gNA(“参考gNA”)的序列。在其他情况下，本公开的参考gNA可经受一种或多种诱变方法，例如本文所述的诱变方法，其可包括深度突变进化(DME)、深度突变扫描(DMS)、易错PCR、盒式诱变、随机诱变、交错延伸PCR、基因改组或域交换，以便产生一个或多个具有相对于参考gNA修饰的序列的gNA变异体，其中gNA变异体表现出相对于参考gNA增强或改变的特性。gNA变异体亦包括包含一个或多个外源序列(例如与5’或3’端融合或插入内部)的变异体。参考gNA的活性可用作与gNA变异体的活性进行比较的基准，由此测量gNA变异体的功能或其他特性的改进。在其他实施例中，参考gNA可经受一个或多个有意的特异性靶向突变以产生gNA变异体，例如合理设计的变异体。

本公开的gNA包含两个区段：靶向序列和蛋白结合区段。gNA的靶向区段包括核苷酸序列(可互换地称为引导序列、间隔子、靶向子或靶向序列)，其与靶核酸序列(例如靶ssRNA、靶ssDNA、双链靶DNA的一条链等)内的特定序列(靶位点)互补(且因此与其杂交)，下文将更充分描述。gNA的靶向序列能够结合至靶核酸序列，包括编码序列、编码序列的互补序列、非编码序列，且结合至调节元件。蛋白质结合区段(或“活化子”或“蛋白质结合序列”)与CasX蛋白质以复合物的形式相互作用(例如，结合)，形成RNP(下文将更充分描述)。蛋白质结合区段在本文中替代地称为“支架”，其由几个区组成，下文将更充分描述。

在双引导RNA(dgRNA)的情况下，靶向子和活化子部分各自具有双螺旋体形成区段，其中靶向子的双螺旋体形成区段和活化子的双螺旋体形成区段彼此具有互补性，并彼此杂交以形成双链双螺旋体(gRNA的dsRNA双螺旋体)。当gNA是gRNA时，术语“靶向子”或“靶向子RNA”在本文中用于指CasX双引导RNA(及因此当“活化子”和“靶向子”例如,通过插入核苷酸连接在一起时，CasX单引导RNA)的crRNA样分子(crRNA：“CRISPR RNA”)。crRNA有一个与tracrRNA退火的5’区，其后是靶向序列的核苷酸。因此，举例来说，引导RNA(dgRNA或sgRNA)包含引导序列及crRNA的双螺旋形成区段，其亦可称为crRNA重复序列。对应tracrRNA样分子(活化子)也包含核苷酸的双螺旋体形成段，其形成引导RNA的蛋白结合区段的dsRNA双螺旋体的另一半。因此，呈对应对形式的靶向子和活化子杂交以形成双引导NA，在本文中称为“双引导NA”、“双分子gNA”、“dgNA”、“双分子引导NA”或“二分子引导NA”。CasX蛋白对靶核酸序列(例如，基因组DNA)的位点特异性结合和/或裂解可以发生在由gNA的靶向序列和靶核酸序列之间的碱基配对互补性确定的一个或多个位置(例如，靶核酸的序列)。因此，例如，本公开的gNA具有与靶核酸互补的序列，因此可以与靶核酸杂交，所述靶核酸邻近与TC PAM基序或PAM序列(例如ATC、CTC、GTC或TTC)互补的序列。由于引导序列的靶向序列与靶核酸序列的序列杂交，因此只要考虑到PAM序列的位置，靶向子就可以由用户修饰以与特定靶核酸序列杂交。因此，在一些情况下，靶向子的序列可以为非天然存在的序列。在其他情况下，靶向子的序列可以是天然存在的序列，源自待编辑的基因。在其他实施例中，gNA的活化子和靶向子彼此共价连接(而不是彼此杂交)且包含单分子，在本文中称为“单分子gNA”、“一分子引导NA”、“单引导NA”、“单引导RNA”、“单分子引导RNA”、“一分子引导RNA”、“单引导DNA”、“单分子DNA”或“一分子引导DNA”(“sgNA”、“sgRNA”或“sgDNA”)。在一些实施例中，sgNA包括“活化子”或“靶向子”且因此可分别为“活化子-RNA”及“靶向子-RNA”。

总的来说，本公开的组装gNA包含四个不同的区或域：RNA三螺旋体、支架茎、延伸茎和靶向序列，在本公开的实施例中，该靶向序列对靶核酸具有特异性并且位于gNA的3’端。RNA三螺旋体、支架茎和延伸茎在一起被称为gNA的“支架”。

a.RNA三螺旋体

在本文提供的引导RNA(包括参考sgRNA)的一些实施例中，存在RNA三螺旋体，并且RNA三螺旋体包含UUU—nX(～4-15)—UUU茎环(SEQ ID NO:19)的序列，其在2个中间茎环(支架茎环和延伸茎环)之后以AAAG结束，形成也可延伸穿过三螺旋体进入双螺旋假结中的假结。三螺旋体的UU-UUU-AAA序列形成为靶向序列、支架茎与延伸茎之间的连接。在示例性CasX sgRNA中，首先对UUU-环-UUU区进行编码，然后是支架茎环，且接着为延伸茎环，其由四环连接，且接着AAAG封闭三螺旋体，随后变为靶向序列。

b.支架茎环

在本公开的sgNA的一些实施例中，三螺旋区之后是支架茎环。支架茎环为与CasX蛋白(例如CasX变异蛋白)结合的gNA区。在一些实施例中，支架茎环为相当短且稳定的茎环。在一些情况下，支架茎环不耐受许多变化，且需要一些形式的RNA气泡。在一些实施例中，支架茎是CasX sgNA功能所需的。尽管CasX sgNA的支架茎可能与Cas9的连接茎类似地作为重要茎环，但在一些实施例中，其具有与CRISPR/Cas系统中发现的许多其他茎环不同的所需凸起(RNA气泡)。在一些实施例中，这个凸起的存在在与不同CasX蛋白相互作用的sgNA中是保守的。gNA的支架茎环序列的示例性序列包含序列CCAGCGACUAUGUCGUAUGG(SEQID NO:20)。在其他实施例中，本公开提供了gNA变异体，其中支架茎环被替换为来自具有近端5’和3’端的异源性RNA源的RNA茎环序列，例如但不限于选自MS2、Qβ、U1发夹II、Uvsx或PP7茎环的茎环序列。在一些情况下，gNA的异源性RNA茎环能够结合蛋白质、RNA结构、DNA序列或小分子。

c.延伸茎环

在本公开的CasX sgNA的一些实施例中，支架茎环之后是延伸茎环。在一些实施例中，延伸茎包含很大程度上未经CasX蛋白结合的合成tracr及crRNA融合物。在一些实施例中，延伸茎环可为高度展性的。在一些实施例中，通过延伸茎环中tracrRNA与crRNA之间的GAAA四环接头或GAGAAA接头制得单引导gRNA。在一些情况下，CasX sgNA的靶向子和活化子通过中间核苷酸彼此连接，且接头的长度可为3至20个核苷酸。在本公开的CasX sgNA的一些实施例中，延伸茎为位于核糖核蛋白复合物中的CasX蛋白外部的大型32-bp环。sgNA的延伸茎环序列的示例性序列包含序列GCGCUUAUUUAUCGGAGAGAAAUCCGAUAAAUAAGAAGC(SEQ IDNO:21)。在一些实施例中，延伸茎环包含GAGAAA间隔子序列。在一些实施例中，本公开提供gNA变异体，其中延伸茎环被替换为来自具有近端5’及3’端的异源性RNA源的RNA茎环序列，例如但不限于选自MS2、Qβ、U1发夹II、Uvsx或PP7茎环的茎环序列。在此类状况下，异源性RNA茎环增加gNA的稳定性。在其他实施例中，本公开提供了具有延伸茎环区的gNA变异体，所述茎环区包含至少10、至少100、至少500、至少1000或至少10,000个核苷酸，或至少10-10,000、至少10-1000或至少10-100个核苷酸。

d.靶向序列

在本公开的gNA的一些实施例中，延伸茎环之后是形成三螺旋体一部分的区，且接着是gNA 3’端的靶向序列(或“间隔子”)。靶向序列将CasX核糖核蛋白整体复合物(即，RNP)靶向至待修饰基因的靶核酸序列的特定区。因此，例如，当TC PAM基序或PAM序列TTC、ATC、GTC或CTC中的任一者位于与靶序列互补的非靶链序列的5’端1个核苷酸处时，本公开的gNA靶向序列与真核细胞中的核酸中的PCSK9基因的一部分(例如真核染色体、染色体序列、真核RNA等)具有序列互补性，且因此可与其杂交，作为RNP的组成部分。可以修饰gNA的靶向序列，使得gNA可以靶向任何所需靶核酸序列的所需序列，只要考虑到PAM序列位置即可。在一些实施例中，gNA支架在靶向序列的5'端，靶向序列位于gNA的3'端。在一些实施例中，被RNP的核酸酶识别的PAM基序序列是TC。在其他实施例中，被RNP的核酸酶识别的PAM序列是NTC。

在一些实施例中，gNA的靶向序列与编码PCSK9蛋白的基因的一部分互补，该部分可包含一个或多个突变。在一些实施例中，gNA的靶向序列与PCSK9外显子互补，该外显子选自由外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9、外显子10、外显子11和外显子12组成的组。在一些实施例中，gNA的靶向序列对PCSK9内含子具有特异性。在一些实施例中，gNA的靶向序列对PCSK9内含子-外显子连接处具有特异性。在一些实施例中，gNA的靶向序列与包含PCSK9基因或其互补序列的一个或多个单核苷酸多态性(SNP)的序列互补。在PCSK9编码序列内或在PCSK9非编码序列内的SNP皆在本公开的范围内。在其他实施例中，gNA的靶向序列与PCSK9基因的基因间区的序列互补，或者与PCSK9基因的基因间区互补的序列互补。在其他实施例中，gNA的靶向序列与PCSK9基因的调节元件互补。在靶向序列对调节元件具有特异性的那些情况下，此类调节元件包括但不限于启动子区、增强子区、基因间区、5'非翻译区(5'UTR)、3'非翻译区(3'UTR)、保守元件和包含顺式调节元件的区。启动子区旨在涵盖编码序列的起始点的5kb内的核苷酸，或在基因增强子元件或保守元件的情况下，可与靶核酸的基因的编码序列相距数千bp、数十万bp或甚至数百万bp。在前述内容中，靶标是其中靶标的编码基因旨在经敲除或敲低以使得靶向蛋白质在细胞中不表达或以较低水平表达的那些靶标。

在一些实施例中，靶向序列具有14至35个连续核苷酸。在一些实施例中，靶向序列具有14、15、16、18、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个连续核苷酸。在一些实施例中，靶向序列由20个连续核苷酸组成。在一些实施例中，靶向序列由19个连续核苷酸组成。在一些实施例中，靶向序列由18个连续核苷酸组成。在一些实施例中，靶向序列由17个连续核苷酸组成。在一些实施例中，靶向序列由16个连续核苷酸组成。在一些实施例中，靶向序列由15个连续核苷酸组成，并且靶向序列可包含0至5、0至4、0至3或0至2个相对于靶核酸序列的失配且保留足够结合特异性，以使得含有包含靶向序列的gNA的RNP可相对于靶核酸形成互补键。

针对野生型PCSK9核酸的靶向序列的代表性但非限制性实例被呈现为SEQ ID NO:315-436、612-2100和2286-13861，并显示在下表A中，代表PCSK9靶核酸的靶向序列。在一个实施例中，gNA的靶向序列包含与选自由SEQ ID NO:315-436、612-2100和2286-13861组成的组的序列具有至少约65％、至少约75％、至少约85％或至少约95％同一性的序列。在另一个实施例中，gNA的靶向序列由一定序列组成，该序列选自由SEQ ID NO:315-436、612-2100和2286-13861组成的组。在前述实施例中，胸腺嘧啶(T)核苷酸可以取代任何靶向序列中的一个或多个或所有尿嘧啶(U)核苷酸，使得gNA可以是gDNA或gRNA，或RNA和DNA的嵌合体。在一些实施例中，选自由SEQ ID NO:315-436、612-2100和2286-13861组成的组的靶向序列具有至少1、2、3、4、5或6个或更多个取代尿嘧啶核苷酸的胸腺嘧啶核苷酸。在其他实施例中，本公开的gNA、gRNA或gDNA包含1、2、3个或更多个选自由SEQ ID NO:315-436、612-2100和2286-13861组成的组的靶向序列，或与SEQ ID NO:315-436、612-2100和2286-13861的一个或多个序列具有至少50％同一性、至少55％同一性、至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少85％同一性、至少90％同一性、至少95％同一性的靶向序列。在一些实施例中，gNA的靶向序列包含选自由SEQ ID NO:315-436、612-2100和2286-13861组成的组的序列，其中从该序列的3’端去除了单个核苷酸。在其他实施例中，gNA的靶向序列包含选自由SEQ ID NO:315-436、612-2100和2286-13861组成的组的序列，其中从该序列的3’端去除了两个核苷酸。在其他实施例中，gNA的靶向序列包含选自由SEQ ID NO:315-436、612-2100和2286-13861组成的组的序列，其中从该序列的3’端去除了三个核苷酸。在其他实施例中，gNA的靶向序列包含选自由SEQ ID NO:315-436、612-2100和2286-13861组成的组的序列，其中从该序列的3’端去除了四个核苷酸。在其他实施例中，gNA的靶向序列包含选自由SEQ ID NO:315-436、612-2100和2286-13861组成的组的序列，其中从该序列的3’端去除了五个核苷酸。

表A.对PCSK9具有特异性的靶向序列

SEQ ID NO:	PAM序列
		315-436、612-2,100、2,286-3,183	ATCN
3,184-7,251	TTCN
		7,252-11,521	CTCN
11,522-13,861	GTCN

在一些实施例中，靶向序列与编码SEQ ID NO:33的PCSK9蛋白的突变或破坏PCSK9蛋白的功能或表达的突变的核酸序列互补。几种错义突变(S127R、D129G、F216L、D374H和D374Y)与高胆固醇血症和早发性动脉粥样硬化相关；因此被认为是功能获得性突变(Shilpa Pandit,S.等人，Functional analysis of sites within PCSK9 responsiblefor hypercholesterolemias.J Lipid Res.,49:1333(2008))，并且本公开考虑了与编码PCSK9基因中这些突变的DNA序列互补的靶向序列，包括选自由以下组成的组的序列：AGCAGGUCGCCUCUCAUCUU(SEQ ID NO:272)、CAUCUUCACCAGGAAGCCAG(SEQ ID NO:273)、CCUCUCAUCUUCACCAGGAA(SEQ ID NO:274)、UGGUGAAGAUGAGAGGCGAC(SEQ ID NO:275)、GUGGAGGCGGGUCCCGUCCU(SEQ ID NO:281)、AGCCACUGCAGCACCUGCUU(SEQ ID NO:287)、UUGGUGCCUCCAGCCACUGC(SEQ ID NO:288)、AGCUACUGCAGCACCUGCUU(SEQ ID NO:289)和UUGGUGCCUCCAGCUACUGC(SEQ ID NO:290)。

几种突变被认为是功能丧失性突变，包括R46L、G106R、Y142X、N157K、R237W和C679X，并与低胆固醇血症相关(Berke,K.等人，Missense Mutations in the PCSK9 GeneAre Associated With Hypocholesterolemia and Possibly Increased Response toStatin Therapy.Arteriosclerosis Thrombosis and Vascular Biol.26:1094(2006))，并且本公开考虑了与编码PCSK9基因中这些突变的DNA序列互补的靶向序列。对PCSK9突变具有特异性的示例性靶向序列，以及间隔子靶向的PCSK9突变的ClinVar(/www.ncbi.nlm.nih.gov/clinvar/)标识符在下表B中给出。

表B.PCSK9突变的靶向序列

针对突变PCSK9核酸的靶向序列的代表性但非限制性实例被呈现为SEQ ID NO:247-303，并且在上面示出为表B。在一个实施例中，gNA的靶向序列包含与选自由SEQ IDNO:247-303组成的组的序列具有至少约65％、至少约75％、至少约85％或至少约95％同一性的序列。在另一个实施例中，gNA的靶向序列由一定序列组成，该序列选自由SEQ ID NO:247-303组成的组。在一些实施例中，选自由SEQ ID NO:247-303组成的组的靶向序列具有至少1、2、3、4、5或6个或更多个取代尿嘧啶核苷酸的胸腺嘧啶核苷酸。在其他实施例中，本公开提供了包含1、2、3个或更多个gNA的CasX:gNA系统，所述gNA包含选自由SEQ ID NO:247-303组成的组的靶向序列，或与SEQ ID NO:247-303的一个或多个序列具有至少50％同一性、至少55％同一性、至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少85％同一性、至少90％同一性、至少95％同一性的靶向序列。在一些实施例中，gNA的靶向序列包含选自由SEQ ID NO:247-303组成的组的序列，其中从该序列的3’端去除了单个核苷酸。在其他实施例中，gNA的靶向序列包含选自由SEQ ID NO:247-303组成的组的序列，其中从该序列的3’端去除了两个核苷酸。在其他实施例中，gNA的靶向序列包含选自由SEQ ID NO:247-303组成的组的序列，其中从该序列的3’端去除了三个核苷酸。在其他实施例中，gNA的靶向序列包含选自由SEQ ID NO:3247-303组成的组的序列，其中从该序列的3’端去除了四个核苷酸。在其他实施例中，gNA的靶向序列包含选自由SEQID NO:247-303组成的组的序列，其中从该序列的3’端去除了五个核苷酸。

在一些实施例中，CasX:gNA系统包含第一gNA且进一步包含第二(及任选地第三、第四、第五或更多)gNA，其中第二gNA或额外gNA具有与靶核酸序列的相比于第一gNA的靶向序列不同或重叠的部分互补的靶向序列，使得靶核酸中的多个点经靶向，且例如通过CasX在靶核酸中引入多个断裂。应了解，在此类状况下，第二或额外gNA与CasX蛋白的额外拷贝复合。通过选择gNA的靶向序列，可以使用本文所述的CasX:gNA系统修饰或编辑包含靶核酸内特定位置的靶核酸序列的限定区，包括促进供体模板的插入或包含PCSK9基因的突变的区或外显子的切除。

e.gNA支架

除了靶向序列域之外，gNA的其余组成部分在本文中称为支架。在一些实施例中，gNA支架衍生自天然存在的序列，在下文描述为参考gNA。在其他实施例中，gNA支架为参考gNA的变异体，其中引入突变、插入、缺失或域取代以赋予gNA所需特性。

在一些实施例中，CasX参考gRNA包含分离或衍生自δ变形菌纲(Deltaproteobacteria)的序列。在一些实施例中，序列为CasX tracrRNA序列。分离或衍生自δ变形菌纲的示例性CasX参考tracrRNA序列可以包括：ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(SEQ ID NO:22)和ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGG(SEQID NO:23)。分离或衍生自δ变形菌纲的示例性crRNA序列可以包含CCGAUAAGUAAAACGCAUCAAAG(SEQ ID NO:24)的序列。在一些实施例中，CasX参考gNA包含与分离或衍生自δ变形菌纲的序列具有至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少81％同一性、至少82％同一性、至少83％同一性、至少84％同一性、至少85％同一性、至少86％同一性、至少86％同一性、至少87％同一性、至少88％同一性、至少89％同一性、至少89％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性、至少99.5％同一性或100％同一性的序列。

在一些实施例中，CasX参考引导RNA包含分离或衍生自浮霉菌门(Planctomycetes)的序列。在一些实施例中，序列为CasX tracrRNA序列。分离或衍生自δ变形菌纲的示例性CasX参考tracrRNA序列可以包括：UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGAGA(SEQ ID NO:8)和UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGG(SEQ ID NO:9)。分离或衍生自浮霉菌门的示例性crRNA序列可以包含UCUCCGAUAAAUAAGAAGCAUCAAAG(SEQID NO:27)的序列。在一些实施例中，CasX参考gNA包含与分离或衍生自浮霉菌门的序列具有至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少81％同一性、至少82％同一性、至少83％同一性、至少84％同一性、至少85％同一性、至少86％同一性、至少86％同一性、至少87％同一性、至少88％同一性、至少89％同一性、至少89％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性、至少99.5％同一性或100％同一性的序列。

在一些实施例中，CasX参考gNA包含分离或衍生自宋氏细菌暂定种(CandidatusSungbacteria)的序列。在一些实施例中，序列为CasX tracrRNA序列。分离或衍生自宋氏细菌暂定种的示例性CasX参考tracrRNA序列可包含以下序列：GUUUACACACUCCCUCUCAUAGGGU(SEQ ID NO:10)、GUUUACACACUCCCUCUCAUGAGGU(SEQ ID NO:11)、UUUUACAUACCCCCUCUCAUGGGAU(SEQ ID NO:12)及GUUUACACACUCCCUCUCAUGGGGG(SEQ IDNO:13)。在一些实施例中，CasX参考引导RNA包含与分离或衍生自宋氏细菌暂定种的序列具有至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少81％同一性、至少82％同一性、至少83％同一性、至少84％同一性、至少85％同一性、至少86％同一性、至少86％同一性、至少87％同一性、至少88％同一性、至少89％同一性、至少89％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性、至少99.5％同一性或100％同一性的序列。

表1提供了参考gRNA tracr的序列和支架序列。在一些实施例中，本公开提供了gNA序列，其中gNA具有支架，其包含相对于具有表1的SEQ ID NO:4-16中的任一者的序列的参考gNA序列具有至少一个核苷酸修饰的序列。应了解，在其中载体包含用于gNA的DNA编码序列或其中gNA为gDNA或RNA及DNA的嵌合体的那些实施例中，胸腺嘧啶(T)碱基可取代本文所述的gNA序列实施例(包括表1和表2的序列)中的任一者的尿嘧啶(U)碱基。

表1.参考gRNA tracr和支架序列

f.gNA变异体

在另一方面中，本公开涉及引导核酸变异体(替代地，在本文中称为“gNA变异体”或“gRNA变异体”)，其包含相对于参考gRNA支架的一个或多个修饰。如本文所用，“支架”是指除间隔子序列之外的gNA功能所需的gNA的所有部分。

在一些实施例中，gNA变异体的支架是包含对包含SEQ ID NO:4或SEQ ID NO:5的参考gRNA的序列的一个或多个额外改变的变异体。在其中参考gRNA的支架衍生自SEQ IDNO:4或SEQ ID NO:5的那些实施例中，gNA变异体的一个或多个改进或增加的特征相比于SEQ ID NO:4或SEQ ID NO:5中的相同特征得到了改进。在一些实施例中，gNA变异体包含相对于本公开的参考gRNA序列的一个或多个核苷酸取代、插入、缺失或交换或替换区。在一些实施例中，突变可发生于参考gRNA的任何区中以产生gNA变异体。在一些实施例中，gNA变异序列的支架与SEQ ID NO:4或SEQ ID NO:5的序列具有至少20％、至少30％、至少40％、至少50％、至少60％、或至少70％、至少80％、至少85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、或至少约99％同一性。

在一些实施例中，gNA变异体包含参考gRNA的一个或多个区内的一个或多个核苷酸变化，这些变化改进了参考gRNA的特性。示例性区包括RNA三螺旋体、假结、支架茎环及延伸茎环。在一些情况下，变异支架茎进一步包含气泡。在其他情况下，变异支架进一步包含三螺旋环区。在其他情况下，变异支架进一步包含5'非结构化区。在一些实施例中，gNA变异支架包含与SEQ ID NO:14具有至少60％序列同一性的支架茎环。在其他实施例中，gNA变异体包含具有CCAGCGACUAUGUCGUAGUGG(SEQ ID NO:32)的序列的支架茎环。在其他实施例中，本公开提供了相对于SEQ ID NO:5包含C18G取代、G55插入、U1缺失和经修饰的延伸茎环的gNA支架，其中原始6nt环和13个在环最近端的碱基对(总共32个核苷酸)经Uvsx发夹(4nt环和5个环近侧碱基对；总共14个核苷酸)取代，且延伸茎的环远侧碱基通过A99的缺失和G64U的取代而转化为与新Uvsx发夹邻接的完全碱基配对茎。在前述实施例中，gNA支架包含序列ACUGGCGCUUUUAUCUGAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAGUG GGUAAAGCUCCCUCUUCGGAGGGAGCAUCAAAG(SEQ ID NO:2238)。

当将变异体gNA与本文描述的参考gRNA进行比较时，具有一个或多个改进功能或特征，或添加一种或多种新功能的所有gNA变异体均被设想为在本公开的范围内。这种gNA变异体的代表性实例是引导序列174(SEQ ID NO:2238)，其设计描述于实例中。在一些实施例中，gNA变异体向包含gNA变异体的RNP添加新功能。在一些实施例中，gNA变异体具有选自以下的改进特征：改进的稳定性；改进的溶解度；改进的gNA转录；改进的核酸酶活性抗性；增加的gNA折叠速率；折叠期间减少的副产物形成；增加的生产性折叠；改进的与CasX蛋白的结合亲和力；当与CasX蛋白复合时改进的与靶DNA的结合亲和力；当与CasX蛋白复合时改进的基因编辑；当与CasX蛋白复合时改进的编辑特异性；以及当与CasX蛋白复合时改进的在靶DNA的编辑中利用较大范围的一个或多个PAM序列，包括ATC、CTC、GTC或TTC(也称为ATCN、CTCN、GTCN和TTCN PAM)的能力，及其任何组合。在一些情况下，gNA变异体的改进特征中的一个或多个是相对于SEQ ID NO:4或SEQ ID NO:5的参考gNA改进至少约1.1至约100,000倍。在其他情况下，gNA变异体的一种或多种改进特征是相对于SEQ ID NO:4或SEQ IDNO:5的参考gNA改进至少约1.1、至少约10、至少约100、至少约1000、至少约10,000、至少约100,000倍或更大改进。在其他情况下，gNA变异体的改进特征中的一个或多个是相对于SEQID NO:4或SEQ ID NO:5的参考gNA改进约1.1至100,00倍、约1.1至10,00倍、约1.1至1,000倍、约1.1至500倍、约1.1至100倍、约1.1至50倍、约1.1至20倍、约10至100,00倍、约10至10,00倍、约10至1,000倍、约10至500倍、约10至100倍、约10至50倍、约10至20倍、约2至70倍、约2至50倍、约2至30倍、约2至20倍、约2至10倍、约5至50倍、约5至30倍、约5至10倍、约100至100,00倍、约100至10,00倍、约100至1,000倍、约100至500倍、约500至100,00倍、约500至10,00倍、约500至1,000倍、约500至750倍、约1,000至100,00倍、约10,000至100,00倍、约20至500倍、约20至250倍、约20至200倍、约20至100倍、约20至50倍、约50至10,000倍、约50至1,000倍、约50至500倍、约50至200倍或约50至100倍。在其他情况下，gNA变异体的一种或多种改进特征是相对于SEQ ID NO:4或SEQ ID NO:5的参考gNA改进约1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、25倍、30倍、40倍、45倍、50倍、55倍、60倍、70倍、80倍、90倍、100倍、110倍、120倍、130倍、140倍、150倍、160倍、170倍、180倍、190倍、200倍、210倍、220倍、230倍、240倍、250倍、260倍、270倍、280倍、290倍、300倍、310倍、320倍、330倍、340倍、350倍、360倍、370倍、380倍、390倍、400倍、425倍、450倍、475倍或500倍。

在一些实施例中，可如下创建gNA变异体：通过使参考gRNA经受一种或多种诱变方法，如下文描述的诱变方法，其可以包括深度突变进化(DME)、深度突变扫描(DMS)、易错PCR、盒式诱变、随机诱变、交错延伸PCR、基因改组或域交换，以便生成本公开的gNA变异体。参考gRNA的活性可用作与gNA变异体的活性进行比较的基准，从而衡量gNA变异体功能的改进。在其他实施例中，参考gRNA可经受一个或多个有意的靶向突变、取代或域交换以产生gNA变异体，例如合理设计的变异体。由此类方法产生的示例性gRNA变异体描述于实例中，且gNA支架的代表性序列呈现于表2中。

在一些实施例中，gNA变异体包含相比于参考引导核酸支架序列的一个或多个修饰，其中一个或多个修饰选自：gNA变异体区中的至少一个核苷酸取代；gNA变异体区中的至少一个核苷酸缺失；gNA变异体区中的至少一个核苷酸插入；gNA变异体区的全部或一部分的取代；gNA变异体区的全部或一部分的缺失；或前述的任何组合。在一些情况下，修饰是在一个或多个区中取代gNA变异体中的1至15个连续或非连续核苷酸。在其他情况下，修饰是在一个或多个区中缺失gNA变异体中的1至10个连续或非连续核苷酸。在其他情况下，修饰是在一个或多个区中插入gNA变异体中的1至10个连续或非连续核苷酸。在其他情况下，修饰为通过来自具有近端5'及3'端的异源性RNA源的RNA茎环序列取代支架茎环或延伸茎环。在一些情况下，本公开的gNA变异体在一个区中包含两个或更多个修饰。在其他情况下，本公开的gNA变异体在两个或更多个区中包含修饰。在其他情况下，gNA变异体包含此段中所述的前述修饰的任何组合。

在一些实施例中，将5'G添加到gNA变异序列以用于体内表达，因为当+1核苷酸为G时，从U6启动子的转录更高效且相对于起始位点更一致。在其他实施例中，将两个5'G添加到gNA变异序列用于体外转录以提高生产效率，因为T7聚合酶强烈偏好+1位置中的G和+2位置中的嘌呤。在一些情况下，将5'G碱基添加至表1的参考支架。在其他情况下，将5’G碱基添加至表2的变异支架。

表2提供了示例性gNA变异支架序列。在表2中，(-)表示在相对于SEQ ID NO:5的参考序列的指定位置处的缺失，(+)表示在相对于SEQ ID NO:5的指示位置处插入指定碱基，(:)表示相对于SEQ ID NO:5的缺失或取代的指定起始:终止坐标处的碱基范围，且多个插入、缺失或取代通过逗号分隔；例如，A14C，U17G。在一些实施例中，gNA变异支架包含表2中所列的SEQ ID NO:2101-2285中的任一者，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的序列。在一些实施例中，gNA变异支架包含一定序列或基本上由一定序列组成，该序列选自由表2中所列的SEQ ID NO:2101-2285组成的组。应了解，在其中载体包含用于gNA的DNA编码序列或其中gNA为gDNA或RNA及DNA的嵌合体的那些实施例中，胸腺嘧啶(T)碱基可取代本文所述的gNA序列实施例中的任一者的尿嘧啶(U)碱基。

表2.示例性gNA支架序列

在一些实施例中，gNA变异体包含tracrRNA茎环，其包含序列–UUU-N4-25-UUU–(SEQ ID NO:34)。举例来说，gNA变异体包含支架茎环或其替代物，经两个促进三螺旋区的三联体U基序侧接。在一些实施例中，支架茎环或其替代物包含至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少21个核苷酸、至少22个核苷酸、至少23个核苷酸、至少24个核苷酸或至少25个核苷酸。

在一些实施例中，gNA变异体包含在间隔区的5’端的位置具有-AAAG-的crRNA序列。在一些实施例中，-AAAG-序列紧靠间隔区的5’端。

在一些实施例中，对参考gNA的至少一个核苷酸修饰以产生gNA变异体包含CasX变异gNA中相对于参考gRNA的至少一个核苷酸缺失。在一些实施例中，gNA变异体包含相对于参考gNA缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续或非连续核苷酸。在一些实施例中，至少一个缺失包含相对于参考gNA缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个连续核苷酸。在一些实施例中，gNA变异体包含相对于参考gNA的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个核苷酸缺失，且所述缺失不在连续核苷酸中。在其中gNA变异体中存在两个或更多个相对于参考gRNA的非连续缺失的那些实施例中，如本文所述的任何缺失长度及缺失长度的任何组合涵盖于本公开的范围内。举例来说，在一些实施例中，gNA变异体可包含一个核苷酸的第一缺失，及两个核苷酸的第二缺失，且该两个缺失不连续。在一些实施例中，gNA变异体包含参考gRNA的不同区中的至少两个缺失。在一些实施例中，gNA变异体包含参考gRNA的相同区中的至少两个缺失。举例来说，所述区可为gNA变异体的延伸茎环、支架茎环、支架茎气泡、三螺旋环、假结、三螺旋体或5’端。参考gRNA中任何核苷酸的缺失涵盖于本公开的范围内。

在一些实施例中，参考gRNA的至少一个核苷酸修饰以产生gNA变异体包含至少一个核苷酸插入。在一些实施例中，gNA变异体包含相对于参考gRNA插入1、2、3、4、5、6、7、8、9或10个连续或非连续核苷酸。在一些实施例中，至少一个核苷酸插入包含相对于参考gRNA插入1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个连续核苷酸。在一些实施例中，gNA变异体包含相对于参考gRNA的2个或更多个插入，且所述插入不连续。在其中gNA变异体中存在两个或更多个相对于参考gRNA的非连续插入的那些实施例中，如本文所述的任何插入长度及插入长度的任何组合涵盖于本公开的范围内。举例来说，在一些实施例中，gNA变异体可包含一个核苷酸的第一插入，及两个核苷酸的第二插入，且该两个插入不连续。在一些实施例中，gNA变异体包含参考gRNA的不同区中的至少两个插入。在一些实施例中，gNA变异体包含参考gRNA的相同区中的至少两个插入。举例来说，所述区可为gNA变异体的延伸茎环、支架茎环、支架茎气泡、三螺旋环、假结、三螺旋体或5’端。在参考gRNA中的任何位置插入任何A、G、C、U(或T，于对应DNA中)或其组合涵盖于本公开的范围内。

在一些实施例中，参考gRNA的至少一个核苷酸修饰以生成gNA变异体包含至少一个核酸取代。在一些实施例中，相对于参考gRNA，gNA变异体包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个连续或非连续经取代核苷酸。在一些实施例中，相对于参考gRNA，gNA变异体包含1-4个核苷酸取代。在一些实施例中，至少一个取代包含相对于参考gRNA取代1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个连续核苷酸。在一些实施例中，gNA变异体包含相对于参考gRNA的2个或更多个取代，且所述取代不连续。在其中gNA变异体中存在两个或更多个相对于参考gRNA的非连续取代的那些实施例中，如本文所述的任何经取代核苷酸长度及经取代核苷酸长度的任何组合涵盖于本公开的范围内。举例来说，在一些实施例中，gNA变异体可包含一个核苷酸的第一取代，及两个核苷酸的第二取代，且该两个取代不连续。在一些实施例中，gNA变异体包含参考gRNA的不同区中的至少两个取代。在一些实施例中，gNA变异体包含参考gRNA的相同区中的至少两个取代。举例来说，所述区可为gNA变异体的三螺旋体、延伸茎环、支架茎环、支架茎气泡、三螺旋环、假结、三螺旋体或5’端。在参考gRNA中的任何位置取代任何A、G、C、U(或T，于对应DNA中)或其组合涵盖于本公开的范围内。

本文所述的取代、插入及缺失中的任一者可经合并以产生本公开的gNA变异体。举例来说，gNA变异体可包含相对于参考gRNA的至少一个取代及至少一个缺失、相对于参考gRNA的至少一个取代及至少一个插入、相对于参考gRNA的至少一个插入及至少一个缺失或相对于参考gRNA的至少一个取代、一个插入及一个缺失。

在一些实施例中，gNA变异体包含与SEQ ID NO:4-16中的任一者具有至少20％同一性、至少30％同一性、至少40％同一性、至少50％同一性、至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少85％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性或至少99％同一性的支架区。在一些实施例中，gNA变异体包含与SEQ ID NO:4-16中的任一者至少60％同源(或一致)的支架区。

在一些实施例中，gNA变异体包含与SEQ ID NO:14具有至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少85％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性或至少99％同一性的tracr茎环。在一些实施例中，gNA变异体包含与SEQ ID NO:14至少60％同源(或一致)的tracr茎环。

在一些实施例中，gNA变异体包含与SEQ ID NO:15具有至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少85％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性或至少99％同一性的延伸茎环。在一些实施例中，gNA变异体包含与SEQ ID NO:15至少60％同源(或一致)的延伸茎环。

在一些实施例中，gNA变异体包含外源延伸茎环，其中与参考gNA的此类差异描述如下。在一些实施例中，外源延伸茎环与本文公开的参考茎环区(例如，SEQ ID NO:15)几乎没有或没有同一性。在一些实施例中，外源茎环为至少10bp、至少20bp、至少30bp、至少40bp、至少50bp、至少60bp、至少70bp、至少80bp、至少90bp、至少100bp、至少200bp、至少300bp、至少400bp、至少500bp、至少600bp、至少700bp、至少800bp、至少900bp、至少1,000bp、至少2,000bp、至少3,000bp、至少4,000bp、至少5,000bp、至少6,000bp、至少7,000bp、至少8,000bp、至少9,000bp、至少10,000bp、至少12,000bp、至少15,000bp或至少20,000bp。在一些实施例中，gNA变异体含有包含至少10、至少100、至少500、至少1000或至少10,000个核苷酸的延伸茎环区。在一些实施例中，异源性茎环增加gNA的稳定性。在一些实施例中，异源性RNA茎环能够结合蛋白质、RNA结构、DNA序列或小分子。在一些实施例中，替代茎环的外源茎环区包含RNA茎环或发夹，其中所得gNA具有增加的稳定性，且取决于环的选择，可与某些细胞蛋白质或RNA相互作用。此类外源延伸茎环可包含例如热稳定RNA，如MS2(ACAUGAGGAUUACCCAUGU(SEQ ID NO:35))、Qβ(UGCAUGUCUAAGACAGCA(SEQ ID NO:36))、U1发夹II(AAUCCAUUGCACUCCGGAUU(SEQ ID NO:37))、Uvsx(CCUCUUCGGAGG(SEQ ID NO:38))、PP7(AGGAGUUUCUAUGGAAACCCU(SEQ ID NO:39))、噬菌体复制环(AGGUGGGACGACCUCUCGGUCGUCCUAUCU(SEQ ID NO:40))、吻合环_a(UGCUCGCUCCGUUCGAGCA(SEQ ID NO:41))、吻合环_b1(UGCUCGACGCGUCCUCGAGCA(SEQ ID NO:42))、吻合环_b2(UGCUCGUUUGCGGCUACGAGCA(SEQ ID NO:43))、G四螺旋体M3q(AGGGAGGGAGGGAGAGG(SEQ IDNO:44))、G四螺旋体端粒篮(GGUUAGGGUUAGGGUUAGG(SEQ ID NO:45))、帚曲菌素-蓖麻毒素环(CUGCUCAGUACGAGAGGAACCGCAG(SEQ ID NO:46))或假结(UACACUGGGAUCGCUGAAUUAGAGAUCGGCGUCCUUUCAUUCUAUAUACUUUGGA GUUUUAAAAUGUCUCUAAGUACA(SEQ ID NO:47))。在一些实施例中，外源茎环包含长非编码RNA(lncRNA)。如本文所用，lncRNA是指长度长于大约200bp的非编码RNA。在一些实施例中，外源茎环的5'及3’端碱基配对，即相互作用以形成双螺旋RNA区。在一些实施例中，外源茎环的5’及3’端碱基配对，且外源茎环的5’与3’端之间的一个或多个区不碱基配对。在一些实施例中，至少一个核苷酸修饰包含：(a)在一个或多个区中取代gNA变异体的1至15个连续或非连续核苷酸；(b)在一个或多个区中缺失gNA变异体的1至10个连续或非连续核苷酸；(c)在一个或多个区中插入gNA变异体的1至10个连续或非连续核苷酸；(d)经来自具有近端5'及3'端的异源性RNA源的RNA茎环序列取代支架茎环或延伸茎环；或(a)-(d)的任何组合。

在一些实施例中，gNA变异体包含CCAGCGACUAUGUCGUAGUGG(SEQ ID NO:32)的支架茎环序列。在一些实施例中，gNA变异体包含与其具有至少1、2、3、4或5个失配的CCAGCGACUAUGUCGUAGUGG(SEQ ID NO:32)的支架茎环序列。

在一些实施例中，gNA变异体含有包含小于32个核苷酸、小于31个核苷酸、小于30个核苷酸、小于29个核苷酸、小于28个核苷酸、小于27个核苷酸、小于26个核苷酸、小于25个核苷酸、小于24个核苷酸、小于23个核苷酸、小于22个核苷酸、小于21个核苷酸或小于20个核苷酸的延伸茎环区。在一些实施例中，gNA变异体含有包含小于32个核苷酸的延伸茎环区。在一些实施例中，gNA变异体进一步包含热稳定茎环。

在一些实施例中，gNA变异体包含SEQ ID NO:2201-2285中的任一者，或与其具有至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％同一性的序列。在一些实施例中，gNA变异体包含选自由SEQ ID NO:2106、2237、2238、2239、2241、2244、2275、2279、2280和2285组成的组的序列。

在本公开的gNA变异体的一些实施例中，gNA变异体包含至少一个修饰，其中相比于SEQ ID NO:5的参考引导支架的至少一个修饰选自以下中的一者或多者：(a)三螺旋环中的C18G取代；(b)茎气泡中的G55插入；(c)U1缺失；(d)延伸茎环的修饰，其中(i)6nt环及13个环近端碱基对经Uvsx发夹置换；且(ii)A99的缺失及G65U的取代产生经完全碱基配对的环远程碱基。在此类实施例中，gNA变异体包含SEQ ID NO:2236、2237、2238、2241、2244、2248、2249或2259-2285中的任一者的序列。

在示例性实施例中，sgRNA变异体包含对SEQ ID NO:2238的序列的一个或多个额外改变(变异支架174，参考表2)。

在示例性实施例中，sgRNA变异体包含对SEQ ID NO:2239的序列的一个或多个额外改变(变异支架175，参考表2)。

在一些实施例中，gNA变异体进一步包含更充分描述于上文中的位于gNA 3’端的间隔子(或靶向序列)，其包含至少14至约35个核苷酸，其中间隔子被设计成具有与靶DNA互补的序列。在一些实施例中，gNA变异体包含与靶DNA互补的至少10至30个核苷酸的靶向序列。在一些实施例中，靶向序列具有14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。在一些实施例中，gNA变异体包含具有20个核苷酸的靶向序列。在一些实施例中，靶向序列具有25个核苷酸。在一些实施例中，靶向序列具有24个核苷酸。在一些实施例中，靶向序列具有23个核苷酸。在一些实施例中，靶向序列具有22个核苷酸。在一些实施例中，靶向序列具有21个核苷酸。在一些实施例中，靶向序列具有20个核苷酸。在一些实施例中，靶向序列具有19个核苷酸。在一些实施例中，靶向序列具有18个核苷酸。在一些实施例中，靶向序列具有17个核苷酸。在一些实施例中，靶向序列具有16个核苷酸。在一些实施例中，靶向序列具有15个核苷酸。在一些实施例中，靶向序列具有14个核苷酸。

在一些实施例中，gNA变异体的支架是具有CasX变异蛋白的RNP的一部分，所述CasX变异蛋白包含表3、5、6、7和9中所列的SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490中任一者的序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约85％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％同一性的序列。在前述实施例中，gNA进一步包含间隔子序列。

在gNA变异体的实施例中，gNA变异体进一步包含更充分描述于上文中的位于gNA3’端的间隔子(或靶向序列)，其包含至少14至约35个核苷酸，其中间隔子被设计成具有与靶核酸互补的序列。在一些实施例中，gNA变异体包含与靶核酸互补的至少10至30个核苷酸的靶向序列。在一些实施例中，靶向序列具有14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。在一些实施例中，gNA变异体包含具有20个核苷酸的靶向序列。在一些实施例中，靶向序列具有25个核苷酸。在一些实施例中，靶向序列具有24个核苷酸。在一些实施例中，靶向序列具有23个核苷酸。在一些实施例中，靶向序列具有22个核苷酸。在一些实施例中，靶向序列具有21个核苷酸。在一些实施例中，靶向序列具有19个核苷酸。在一些实施例中，靶向序列具有18个核苷酸。在一些实施例中，靶向序列具有17个核苷酸。在一些实施例中，靶向序列具有16个核苷酸。在一些实施例中，靶向序列具有15个核苷酸。在一些实施例中，靶向序列具有14个核苷酸。在一些实施例中，本公开提供了用于包含在本公开的gNA变异体中的靶向序列，其包含选自由SEQ ID NO:247-303、315-436、612-2100或2286-13861组成的组的序列，或与其具有至少50％同一性、至少55％同一性、至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少85％同一性、至少90％同一性、至少95％同一性的序列。在一些实施例中，gNA变异体的靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从该序列的3’端去除了单个核苷酸。在其他实施例中，gNA变异体的靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从该序列的3’端去除了两个核苷酸。在其他实施例中，gNA变异体的靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从该序列的3’端去除了三个核苷酸。在其他实施例中，gNA变异体的靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从该序列的3’端去除了四个核苷酸。在其他实施例中，gNA变异体的靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从该序列的3’端去除了五个核苷酸。

在一些实施例中，gNA变异体进一步包含位于gNA 3’端的间隔子(靶向)区，其中间隔子被设计成具有与靶核酸互补的序列。在一些实施例中，靶核酸包含位于间隔子5’的PAM序列，其中至少单个核苷酸将PAM与间隔子的第一核苷酸分开。在一些实施例中，PAM位于靶区的非靶向链上，即与靶核酸互补的链。在一些实施例中，PAM序列为ATC。在一些实施例中，ATC PAM的靶向序列包含选自由SEQ ID NO:315-436、612-2100和2286-3183组成的组的序列，或与SEQ ID NO:315-436、612-2100和2286-3183具有至少50％同一性、至少55％同一性、至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少85％同一性、至少90％同一性、至少95％同一性的序列。在一些实施例中，ATC PAM的靶向序列选自由SEQ ID NO:315-436、612-2100和2286-3183组成的组。在一些实施例中，PAM序列为CTC。在一些实施例中，CTC PAM的靶向序列包含选自由SEQ ID NO:7252-11521组成的组的序列，或与SEQ ID NO:7252-11521具有至少50％同一性、至少55％同一性、至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少85％同一性、至少90％同一性、至少95％同一性的序列。在一些实施例中，CTC PAM的靶向序列选自由SEQ ID NO:7252-11521组成的组。在一些实施例中，PAM序列为GTC。在一些实施例中，GTC PAM的靶向序列包含选自由SEQ ID NO:11522-13861组成的组的序列，或与SEQ IDNO:11522-13861具有至少50％同一性、至少55％同一性、至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少85％同一性、至少90％同一性、至少95％同一性的序列。在一些实施例中，GTC PAM的靶向序列选自由SEQ ID NO:11522-13861组成的组。在一些实施例中，PAM序列为TTC。在一些实施例中，TTC PAM的靶向序列包含选自由SEQ ID NO:3184-7251组成的组的序列，或与SEQ ID NO:3184-7251具有至少50％同一性、至少55％同一性、至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少85％同一性、至少90％同一性、至少95％同一性的序列。在一些实施例中，TTC PAM的靶向序列选自由SEQ ID NO:3184-7251组成的组。

在一些实施例中，gNA变异体包含位于gNA 3’端的靶向序列，其中该靶向序列与包含突变的靶核酸序列互补，其中该突变是功能获得性突变。在前述的一个具体实施例中，相对于SEQ ID NO:33的序列，突变包含选自由S127R、D129G、F216L、D374H和D374Y组成的组的氨基酸取代。在前述的另一个具体实施例中，靶向序列包含选自由表B中所列的SEQ ID NO:247-303组成的组的序列。在前述的另一个具体实施例中，靶向序列包含选自由以下组成的组的序列：AGCAGGUCGCCUCUCAUCUU(SEQ ID NO:272)、CAUCUUCACCAGGAAGCCAG(SEQ ID NO:273)、CCUCUCAUCUUCACCAGGAA(SEQ ID NO:274)、UGGUGAAGAUGAGAGGCGAC(SEQ ID NO:275)、GUGGAGGCGGGUCCCGUCCU(SEQ ID NO:281)、AGCCACUGCAGCACCUGCUU(SEQ ID NO:287)、UUGGUGCCUCCAGCCACUGC(SEQ ID NO:288)、AGCUACUGCAGCACCUGCUU(SEQ ID NO:289)和UUGGUGCCUCCAGCUACUGC(SEQ ID NO:290)。在前述的另一个具体实施例中，靶向序列由一定序列组成，该序列选自由以下组成的组：AGCAGGUCGCCUCUCAUCUU(SEQ ID NO:272)、CAUCUUCACCAGGAAGCCAG(SEQ ID NO:273)、CCUCUCAUCUUCACCAGGAA(SEQ ID NO:274)、UGGUGAAGAUGAGAGGCGAC(SEQ ID NO:275)、GUGGAGGCGGGUCCCGUCCU(SEQ ID NO:281)、AGCCACUGCAGCACCUGCUU(SEQ ID NO:287)、UUGGUGCCUCCAGCCACUGC(SEQ ID NO:288)、AGCUACUGCAGCACCUGCUU(SEQ ID NO:289)和UUGGUGCCUCCAGCUACUGC(SEQ ID NO:290)。在其他实施例中，gNA变异体包含位于gNA 3’端的靶向序列，其中该靶向序列与包含突变的靶核酸序列互补，其中该突变是功能丧失性突变。在前述的一个具体实施例中，相对于SEQ IDNO:33的序列，突变包含选自由R46L、G106R、Y142X、N157K、R237W或C679X组成的组的氨基酸取代。

g.与CasX蛋白形成复合物

在一些实施例中，当相比于参考gRNA时，gNA变异体具有改进的与CasX蛋白(例如参考CasX或CasX变异蛋白)形成复合物的能力。在一些实施例中，当相比于参考gRNA时，gNA变异体具有改进的针对CasX蛋白(例如参考或变异蛋白)的亲和力，由此改进其与CasX蛋白形成核糖核蛋白(RNP)复合物的能力，如实例中所述。在一些实施例中，改进核糖核蛋白复合物形成可提高组装功能性RNP的效率。在一些实施例中，大于90％、大于93％、大于95％、大于96％、大于97％、大于98％或大于99％的包含本公开gNA变异支架及其间隔子的RNP有能力对靶核酸进行基因编辑。

在一些实施例中，可改进gNA变异体与CasX蛋白形成复合物的能力的示例性核苷酸变化可包括以热稳定茎环替换支架茎。不希望受任何理论束缚，以热稳定茎环替换支架茎可增加gNA变异体与CasX蛋白的总体结合稳定性。或者或另外，去除一大段茎环可改变gNA变异体折叠动力学，且使得功能性折叠gNA更容易且更快速地结构组装，例如通过减轻gNA变异体自身可变得“缠结”的程度。在一些实施例中，支架茎环序列的选择可随着用于gNA的不同间隔子而改变。在一些实施例中，支架序列可适于间隔子且因此适于靶序列。生物化学分析可用于评估CasX蛋白与gNA变异体结合以形成RNP的结合亲和力，包括实例的分析。举例来说，普通技术人员可测量结合至固定CasX蛋白的荧光标记gNA的量的变化，作为对增加额外未标记的“冷竞争者”gNA的浓度的反应。或者或另外，可监测荧光信号或查看其如何变化，因为不同量的经荧光标记的gNA流经固定CasX蛋白。或者，可使用体外裂解分析相对于界定靶核酸序列评估形成RNP的能力。

h.gNA稳定性

在一些实施例中，当相比于参考gRNA时，gNA变异体具有改进的稳定性。在一些实施例中，增加的稳定性及有效折叠可增加gNA变异体持续存在于靶细胞内部的程度，其可由此提高形成能够执行CasX功能(例如基因编辑)的功能性RNP的概率。在一些实施例中，增加的gNA变异体稳定性亦可允许在向细胞递送较低量gNA的情况下的类似结果，其可转而降低基因编辑期间的脱靶效应的概率。可以多种方式评估引导NA稳定性，包括例如在体外通过组装该引导序列、在模拟细胞内环境的溶液中培育不同时段且接着经由本文所述的体外裂解分析来测量功能活性。或者或另外，gNA可在初始转染/转导gNA之后的不同时间点自细胞收获，以确定gNA变异体相对于参考gRNA保持的时长。

i.溶解度

在一些实施例中，当相比于参考gRNA时，gNA变异体具有改进的溶解度。在一些实施例中，当相比于参考gRNA时，gNA变异体具有改进的CasX蛋白:gNA RNP溶解度。在一些实施例中，CasX蛋白:gNA RNP的溶解度通过将核酶序列添加至gNA变异体的5'或3'端，例如参考sgRNA的5'或3'来改进。一些核酶，例如M1核酶可经由RNA介导的蛋白质折叠增加蛋白质的溶解度。包含如本文所述的gNA变异体的CasX RNP的增加的溶解度可经由本领域技术人员已知的多种方法评估，例如通过在表达CasX及gNA变异体的裂解大肠杆菌的可溶部分的凝胶上获取密度测定法读数。

j.核酸酶活性抗性

在一些实施例中，与参考gRNA相比，gNA变异体具有改进的核酸酶活性抗性，这可例如增加变异体gNA在细胞内环境中的持久性，从而改进基因编辑。核酸酶活性抗性可经由本领域技术人员已知的多种方法来评估。举例来说，测量核酸酶活性抗性的体外方法可包括例如使参考gNA与具有一种或多种示例性RNA核酸酶的变异体接触及测量降解。或者或另外，使用本文所述的方法测量gNA变异体于细胞环境中的续存可指示gNA变异体的核酸酶抵抗性程度。

k.对靶DNA的结合亲和力

在一些实施例中，相对于参考gRNA，gNA变异体具有对靶DNA的改进亲和力。在某些实施例中，相对于包含参考gRNA的RNP的亲和力，包含gNA变异体的核糖核蛋白复合物对靶DNA的亲和力有所提高。在一些实施例中，RNP对靶DNA的改进亲和力包括对靶序列的改进亲和力、对PAM序列的改进亲和力、RNP搜索用于靶序列的DNA的改进能力或其任何组合。在一些实施例中，对靶DNA的改进亲和力为增加的总体DNA结合亲和力的结果。

在不希望受到理论约束的情况下，gNA变异体中影响CasX蛋白中OBD的功能的核苷酸变化可能会增加CasX变异蛋白与前间隔子邻近基序(PAM)结合的亲和力，以及结合或利用除了由SEQ ID NO:2的参考CasX蛋白识别的典型TTC PAM以外更多PAM序列(包括选自由TTC、ATC、GTC和CTC组成的组的PAM序列)，从而增加CasX变异蛋白对靶DNA序列的亲和力和多样性，使得与参考CasX相比，可编辑和/或结合的靶核酸序列大大增加。如下文更充分地描述，相比于参考CasX，增加可编辑的靶核酸的序列是指PAM及前间隔子序列及其根据非靶链定向的方向性。这不意味着由非靶链，而不是靶链的PAM序列决定裂解或在机制上涉及靶识别。举例来说，当参考TTC PAM时，其可实际上为靶标裂解所需的互补GAA序列，或其可为来自两条链的核苷酸的某一组合。在本文公开的CasX蛋白的情况下，PAM位于前间隔子的5’端，其中至少单个核苷酸将PAM与前间隔子的第一核苷酸分离。或者或另外，影响增加CasX变异蛋白对靶DNA链的亲和力的螺旋形I及/或螺旋形II域的功能的gNA的变化可增加包含变异gNA的CasX RNP对靶DNA的亲和力。不受理论或机理的约束，与靶DNA的增强结合可引起RNP对靶DNA的增强裂解速率，其中与参考CasX和SEQ ID NO:4或SEQ ID NO:5的gNA的RNP相比，RNP在体外分析中具有至少5倍、至少10倍或至少30倍的增加的裂解速率。

l.添加或改变gNA功能

在一些实施例中，相对于参考gRNA，gNA变异体可包含改变gNA变异体的拓扑结构的较大结构变化，由此允许不同gNA功能。举例来说，在一些实施例中，gNA变异体用先前鉴别的稳定RNA结构或茎环交换参考gRNA支架的内源茎环，该RNA结构或茎环可与蛋白质或RNA结合伴侣相互作用以将额外部分募集至CasX或将CasX募集至特定位置，例如具有与所述RNA结构的结合伴侣的病毒衣壳内部。在其他情境下，RNA可彼此补充(如在吻合环中)，使得两个CasX蛋白可共定位以在靶DNA序列处更有效地基因编辑。此类RNA结构可包括MS2、Qβ、U1发夹II、Uvsx、PP7、噬菌体复制环、吻合环_a、吻合环_b1、吻合环_b2、G四螺旋体M3q、G四螺旋体端粒篮、帚曲菌素-蓖麻毒素环或假结。

在一些实施例中，gNA变异体包含末端融合伴侣。示例性末端融合物可包括gRNA与自裂解核酶或蛋白质结合基序的融合物。如本文所用，“核酶”是指具有一种或多种与蛋白质酶类似的催化活性的RNA或其区段。示例性核酶催化活性可包括例如RNA的裂解及/或连接、DNA的裂解及/或连接或肽键形成。在一些实施例中，此类融合可改进支架折叠或募集DNA修复机构。举例来说，在一些实施例中，gRNA可与丁型肝炎病毒(HDV)反基因组核酶、HDV基因组核酶、手斧核酶(来自宏基因组数据)、env25手枪核酶(代表物来自Aliistipesputredinis)、HH15最小锤头核酶、烟草环斑病毒(TRSV)核酶、WT病毒锤头核酶(及合理变异体)或扭曲姊妹1或RBMX募集基序融合。锤头核酶为在RNA分子内的特定位点处催化可逆裂解及连接反应的RNA基序。锤头核酶包括I型、II型及III型锤头核酶。HDV、手枪及手斧核酶具有自裂解活性。包含一种或多种核酶的gNA变异体可允许相比于gRNA参考物扩展的gNA功能。举例来说，在一些实施例中，包含自裂解核酶的gNA可转录及加工为成熟gNA，作为多顺反子转录物的一部分。此类融合物可出现于gNA的5’或3’端。在一些实施例中，gNA变异体在5’及3’端处均包含融合物，其中各融合物独立地如本文所述。在一些实施例中，gNA变异体包含噬菌体复制环或四环。在一些实施例中，gNA包含能够结合蛋白质的发夹环。举例来说，在一些实施例中，发夹环为MS2、Qβ、U1发夹II、Uvsx或PP7发夹环。如表16所述，编码核酶的示例性序列选自由SEQ ID NO:598-611组成的组。

在一些实施例中，gNA变异体包含一个或多个RNA适体。如本文所用，“RNA适体”是指以高亲和力及高特异性结合靶标的RNA分子。在一些实施例中，gNA变异体包含一个或多个核糖开关。如本文所用，“核糖开关”是指在结合小分子时改变状态的RNA分子。在一些实施例中，gNA变异体进一步包含一个或多个蛋白质结合基序。在一些实施例中，将蛋白质结合基序添加到本公开的参考gRNA或gNA变异体可允许CasX RNP与额外蛋白质缔合，其可例如将那些蛋白质的功能添加到CasX RNP。

m.化学修饰的gNA

在一些实施例中，本公开涉及化学修饰的gNA。在一些实施例中，本公开提供了一种化学修饰的gNA，其具有引导RNA功能且降低了对通过核酸酶裂解的易感性。包含除四种典型核糖核苷酸A、C、G及U或脱氧核苷酸以外的任何核苷酸的gNA为经化学修饰的gNA。在一些情况下，经化学修饰的gNA包含除天然磷酸二酯核苷酸间键以外的任何主链或核苷酸间键。在某些实施例中，保留功能包括经修饰gNA结合至本文所描述的任一实施例的CasX的能力。在某些实施例中，保留功能包括经修饰gNA结合至PCSK9靶核酸序列的能力。在某些实施例中，保留功能包括靶向CasX蛋白或预复合CasX蛋白gNA结合到靶核酸序列的能力。在某些实施例中，保留功能包括通过CasX-gNA切割靶多核苷酸的能力。在某些实施例中，保留功能包括通过CasX-gNA裂解靶核酸序列的能力。在某些实施例中，保留功能是本公开实施例的含有CasX蛋白的CasX系统中gNA的任何其他已知功能。

在一些实施例中，本公开提供了一种化学修饰的gNA，其中核苷酸糖修饰并入至选自由以下组成的组的gNA中：2′-O—C1-4烷基(如2′-O-甲基(2′-OMe))、2'-脱氧基(2′-H)、2′-O—C1-3烷基-O—C1-3烷基(如2′-甲氧基乙基(“2′-MOE”))、2'-氟基(“2'-F”)、2'-氨基(“2'-NH₂”)、2'-阿拉伯糖基(“2'-阿糖”)核苷酸、2'-F-阿拉伯糖基(“2'-F-阿糖”)核苷酸、2'-锁定核酸(“LNA”)核苷酸、2'-解锁核酸(“ULNA”)核苷酸、L形式的糖(“L-糖”)和4'-硫代核糖基核苷酸。在其他实施例中，并入引导RNA的核苷酸间连键修饰选自由以下组成的组：硫代磷酸酯“P(S)”(P(S))、膦酰基羧酸酯(P(CH₂)_nCOOR)(如膦酰基乙酸酯“PACE”(P(CH₂COO^-)))、硫代膦酸羧酸酯((S)P(CH₂)_nCOOR)(如硫代膦酸乙酸酯“thioPACE”((S)P(CH₂)_nCOO^-)))、烷基膦酸酯(P(C_1-3烷基)(如甲基膦酸酯-P(CH₃))、硼烷膦酸酯(P(BH₃))和二硫代磷酸酯(P(S)₂)。

在某些实施例中，本公开提供经化学修饰的gNA，其中核碱基(“碱基”)修饰并入至选自由以下组成的组的gNA中：2-硫尿嘧啶(“2-thioU”)、2-硫胞嘧啶(“2-thioC”)、4-硫尿嘧啶(“4-thioU”)、6-硫鸟嘌呤(“6-thioG”)、2-氨基腺嘌呤(“2-aminoA”)、2-氨基嘌呤、假尿嘧啶、次黄嘌呤、7-去氮鸟嘌呤、7-去氮-8-氮杂鸟嘌呤、7-去氮腺嘌呤、7-去氮-8-氮杂腺嘌呤、5-甲基胞嘧啶(“5-methylC”)、5-甲基尿嘧啶(“5-methylU”)、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5,6-去氢尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、5-乙炔基胞嘧啶、5-乙炔基尿嘧啶、5-烯丙基尿嘧啶(“5-allylU”)、5-烯丙基胞嘧啶(“5-allylC”)、5-氨基烯丙基尿嘧啶(“5-aminoallylU”)、5-氨基烯丙基-胞嘧啶(“5-aminoallylC”)、无碱基核苷酸、Z碱基、P碱基、非结构化核酸(“UNA”)、异鸟嘌呤(“isoG”)、异胞嘧啶(“isoC”)、5-甲基-2-嘧啶、x(A、G、C、T)及y(A、G、C、T)。

在其他实施例中，本公开提供经化学修饰的gNA，其中在核苷酸糖、核碱基、磷酸二酯键及/或磷酸核苷酸，包括包含一个或多个¹⁵N、¹³C、¹⁴C、氘、³H、³²P、¹²⁵I、¹³¹I原子或其他用作示踪剂的原子或元素的核苷酸上引入一个或多个同位素修饰。

在一些实施例中，并入至gNA中的“末端”修饰选自由以下组成的组：PEG(聚乙二醇)；烃接头(包括：杂原子(O、S、N)取代的烃间隔基；卤基取代的烃间隔基；含酮基、羧基、酰氨基、亚硫酰基、胺甲酰基、硫羰胺甲酰基的烃间隔基)；精胺接头；包括附接到例如6-荧光素-己基的接头的荧光染料(例如荧光素、若丹明、花青)的染料；淬灭剂(例如dabcyl、BHQ)及其他标记(例如生物素、地高辛、吖啶、抗生蛋白链菌素、抗生物素蛋白、肽和/或蛋白质)。在一些实施例中，“末端”修饰包含将gNA结合(或连接)至包含脱氧核苷酸及/或核糖核苷酸的寡核苷酸的另一分子、肽、蛋白质、糖、寡糖、类固醇、脂质、叶酸、维生素及/或其他分子。在某些实施例中，本公开提供经化学修饰的gNA，其中“末端”修饰(上文所述)经由例如2-(4-丁基酰氨基荧光素)丙烷-1,3-二醇双(磷酸二酯)接头的接头定位于gNA序列内部，该接头以磷酸二酯键形式并入且可并入gNA中的两个核苷酸之间的任何位置。

在一些实施例中，本公开提供具有末端修饰的经化学修饰的gNA，该末端修饰包含末端官能团，例如胺、硫醇(或巯基)、羟基、羧基、羰基、亚硫酰基、硫羰基、胺甲酰基、胺(硫甲酰)基、磷酰基、烯烃、炔烃、卤素或官能团封端的接头，其可随后结合至选自由以下组成的组的所需部分：荧光染料、非荧光标记、标签(例如¹⁴C、生物素、抗生物素蛋白、抗生蛋白链菌素或含有同位素标记，例如¹⁵N、¹³C、氘、³H、³²P、¹²⁵I等的部分)、寡核苷酸(包含脱氧核苷酸及/或核糖核苷酸，包括适体)、氨基酸、肽、蛋白质、糖、寡糖、类固醇、脂质、叶酸及维生素。共轭采用本领域中熟知的标准化学方法，包括但不限于经由N-羟基丁二酰亚胺、异硫氰酸酯、DCC(或DCI)偶合，和/或如出版社爱思唯尔科学公司(Eslsevier Science)GregT.Hermanson在《Bioconjugate Techniques》第3版(2013)中所述的任何其他标准方法，该文献的内容以全文引用的方式并入本文中。

IV.用于修饰靶核酸的蛋白质

本公开提供了包含CRISPR核酸酶的系统，其可用于真核细胞的基因组编辑。在一些实施例中，基因组编辑系统中使用的CRISPR核酸酶是2类V型核酸酶。尽管2类V型CRISPR-Cas系统的成员具有差异，但它们具有一些共同特征，这些特征将它们与Cas9系统区分开来。首先，2类V型核酸酶具有单RNA引导的含RuvC域的效应子，但没有HNH域，并且它们识别非靶向链上的靶区上游5’的富含T的PAM，这不同于依赖靶序列3’侧富含G的PAM的Cas9系统。V型核酸酶在PAM序列的远端产生交错的双链断裂，这不同于Cas9，后者在靠近PAM的近端位点产生一个平端。此外，当被顺式结合的靶dsDNA或ssDNA激活时，V型核酸酶反式降解ssDNA。在一些实施例中，实施例的V型核酸酶识别5′-TC PAM基序，并产生仅被RuvC域裂解的交错末端。在一些实施例中，V型核酸酶选自由Cas12a、Cas12b、Cas12c、Cas12d(CasY)、CasZ和CasX组成的组。在一些实施例中，本公开提供了包含CasX蛋白和一种或多种gNA酸的系统(CasX:gNA系统)，这些系统被专门设计成修饰真核细胞中的靶核酸序列。

如本文所用，术语“CasX蛋白”是指蛋白质家族，且涵盖所有天然存在的CasX蛋白(“参考CasX”)、与天然存在的CasX蛋白具有至少50％同一性的蛋白以及相对于天然存在的CasX蛋白具有一种或多种改进特征的CasX变异体，下文将更充分描述。

CasX变异体实施例的示例性改进特征包括但不限于改进的变异体折叠、对gNA的改进结合亲和力、对靶核酸的改进结合亲和力、利用较大范围的PAM序列编辑及/或结合靶DNA的改进能力、改进的靶DNA解旋、增加的编辑活性、改进的编辑效率、改进的编辑特异性、增加的可有效编辑的真核基因组的百分比、增加的核酸酶活性、增加的用于双链裂解的靶链负载、减少的用于单链切割的靶链负载、减少的脱靶裂解、改进的DNA非靶链的结合、改进的靶核酸序列裂解速率、改进的蛋白质稳定性、改进的蛋白质:gNA(RNP)复合物稳定性、改进的蛋白质溶解度、改进的核糖核蛋白复合物(RNP)形成、更高百分比的裂解感受态RNP、改进的蛋白质:gNA(RNP)复合物溶解度、改进的蛋白质产率、改进的蛋白质表达及改进的融合特征，如下文更充分描述。在一些实施例中，当以可比较的方式分析时，CasX变异体和gNA变异体的RNP表现出一种或多种改进特征，其相对于SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的参考CasX蛋白和表1的gNA的RNP改进至少约1.1至约100,000倍。在其他情况下，CasX变异体和gNA变异体的RNP的一种或多种改进特征是相对于SEQ ID NO:1、SEQ ID NO:2或SEQID NO:3的参考CasX蛋白和表1的gNA的RNP改进至少约1.1、至少约10、至少约100、至少约1000、至少约10,000、至少约100,000倍或更多。在其他情况下，当以可比较的方式分析时，CasX变异体和gNA变异体的RNP的改进特征中的一个或多个是相对于SEQ ID NO:1、SEQ IDNO:2或SEQ ID NO:3的参考CasX蛋白和表1的gNA的RNP改进约1.1至100,00倍、约1.1至10,00倍、约1.1至1,000倍、约1.1至500倍、约1.1至100倍、约1.1至50倍、约1.1至20倍、约10至100,00倍、约10至10,00倍、约10至1,000倍、约10至500倍、约10至100倍、约10至50倍、约10至20倍、约2至70倍、约2至50倍、约2至30倍、约2至20倍、约2至10倍、约5至50倍、约5至30倍、约5至10倍、约100至100,00倍、约100至10,00倍、约100至1,000倍、约100至500倍、约500至100,00倍、约500至10,00倍、约500至1,000倍、约500至750倍、约1,000至100,00倍、约10,000至100,00倍、约20至500倍、约20至250倍、约20至200倍、约20至100倍、约20至50倍、约50至10,000倍、约50至1,000倍、约50至500倍、约50至200倍或约50至100倍。在其他情况下，当以可比较的方式分析时，CasX变异体和gNA变异体的RNP的一种或多种改进特征是相对于SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的参考CasX蛋白和表1的gNA的RNP改进约1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、25倍、30倍、40倍、45倍、50倍、55倍、60倍、70倍、80倍、90倍、100倍、110倍、120倍、130倍、140倍、150倍、160倍、170倍、180倍、190倍、200倍、210倍、220倍、230倍、240倍、250倍、260倍、270倍、280倍、290倍、300倍、310倍、320倍、330倍、340倍、350倍、360倍、370倍、380倍、390倍、400倍、425倍、450倍、475倍或500倍。在一个具体的实施例中，与SEQ ID NO:1-3的参考CasX蛋白和SEQ IDNO:4或SEQ ID NO:5的参考gNA的RNP相比，CasX变异体和gNA变异体的RNP在体外分析中表现出增加至少5倍、至少10倍或至少30倍的增加的裂解速率。这种改进的支持性数据在下面的实例中给出。

术语“CasX变异体”包括为融合蛋白的变异体；即CasX“融合至”异源序列。此包括包含CasX变异体序列及CasX与异源蛋白或其域的N端、C端或内部融合物的CasX变异体。

本公开的CasX蛋白包含以下域中的至少一者：非靶链结合(NTSB)域、靶链负载(TSL)域、螺旋形I域、螺旋形II域、寡核苷酸结合域(OBD)及RuvC DNA裂解域(其中的最后一者可在催化死亡的CasX变异体中经修饰或缺失)，下文将更充分描述。另外，与参考CasX蛋白和参考gNA的RNP相比，本公开的CasX变异蛋白在与gNA复合成为RNP时，利用PAM TC基序(包括选自TTC、ATC、GTC或CTC的PAM序列)，具有增强的高效编辑和/或结合靶DNA的能力。在前文中，与包含参考CasX蛋白和参考gNA的RNP在可比分析系统中的编辑效率和/或结合相比，PAM序列位于与分析系统中gNA的靶向序列具有同一性的前间隔子的非靶链的5′端至少1个核苷酸处。在一个实施例中，CasX变异体和gNA变异体的RNP在可比较的分析系统中与包含参考CasX蛋白和参考gNA的RNP相比表现出更高的编辑效率和/或靶DNA中靶序列的结合，其中靶DNA的PAM序列是TTC。在另一实施例中，CasX变异体和gNA变异体的RNP在可比较的分析系统中与包含参考CasX蛋白和参考gNA的RNP相比表现出更高的编辑效率和/或靶DNA中靶序列的结合，其中靶DNA的PAM序列是ATC。在另一实施例中，CasX变异体和gNA变异体的RNP在可比较的分析系统中与包含参考CasX蛋白和参考gNA的RNP相比表现出更高的编辑效率和/或靶DNA中靶序列的结合，其中靶DNA的PAM序列是CTC。在另一实施例中，CasX变异体和gNA变异体的RNP在可比较的分析系统中与包含参考CasX蛋白和参考gNA的RNP相比表现出更高的编辑效率和/或靶DNA中靶序列的结合，其中靶DNA的PAM序列是GTC。在前述实施例中，与SEQ ID NO:1-3的任何一种CasX蛋白及表1的SEQ ID NO:4和5的gNA的RNP对PAM序列的编辑效率和/或结合亲和力相比，增加的对一个或多个PAM序列的编辑效率和/或结合亲和力至少大1.5倍或更多。

在一些实施例中，CasX蛋白可结合及/或修饰(例如裂解、切割、甲基化、去甲基等)靶核酸及/或与靶核酸相关的多肽(例如组蛋白尾的甲基化或乙酰化)。在一些实施例中，CasX蛋白为催化死亡的(dCasX)，但保留结合靶核酸的能力。示例性催化死亡的CasX蛋白包含CasX蛋白的RuvC域的活性位点中的一个或多个突变。在一些实施例中，催化死亡的CasX蛋白包含SEQ ID NO:1的残基672、769和/或935处的取代。在一个实施例中，催化死亡的CasX蛋白包含SEQ ID NO:1的参考CasX蛋白中D672A、E769A和/或D935A取代。在其他实施例中，催化死亡的CasX蛋白包含SEQ ID NO:2的参考CasX蛋白中氨基酸659、756和/或922处的取代。在一些实施例中，催化死亡的CasX蛋白包含SEQ ID NO:2的参考CasX蛋白中D659A、E756A和/或D922A取代。在其他实施例中，催化死亡的CasX蛋白包含CasX蛋白的全部或一部分RuvC域的缺失。应了解，相同的前述取代可类似地引入至本公开的CasX变异体中，产生dCasX变异体。在一个实施例中，全部或一部分RuvC域自CasX变异体缺失，产生dCasX变异体。在一些实施例中，无催化活性的dCasX变异蛋白可用于碱基编辑或表观遗传修饰。在对DNA的较高亲和力下，在一些实施例中，相对于催化活性CasX，无催化活性的dCasX变异蛋白可以更快地发现其靶核酸、与靶核酸保持结合的时间更长、以更稳定方式结合靶核酸或其组合，从而与保留其裂解能力的CasX变异体相比，改善催化死亡的CasX变异蛋白的这些功能。

a.非靶链结合域

本公开的参考CasX蛋白包含非靶链结合域(NTSBD)。NTSBD为先前未发现于任何Cas蛋白中的域；举例来说，此域不存在于Cas蛋白，例如Cas9、Cas12a/Cpf1、Cas13、Cas14、CASCADE、CSM或CSY中。不受理论或机制束缚，CasX中的NTSBD允许结合至非靶DNA链且可帮助非靶及靶链的解旋。NTSBD被认为负责非靶DNA链的解旋或呈解旋状态的非靶DNA链的捕捉。NTSBD与迄今为止派生的CryoEM模型结构中的非靶链直接接触，且可含有非典型锌指域。NTSBD亦可在解旋、引导RNA侵入及R环形成期间于稳定DNA中起作用。在一些实施例中，示例性NTSBD包含SEQ ID NO:1的氨基酸101-191或SEQ ID NO:2的氨基酸103-192。在一些实施例中，参考CasX蛋白的NTSBD包含四链β折叠。

b.靶链负载域

本公开的参考CasX蛋白包含靶链负载(TSL)域。TSL域为某些Cas蛋白，例如Cas9、CASCADE、CSM或CSY中未发现的域。不希望受理论或机制所束缚，认为TSL域负责辅助将靶DNA链负载至CasX蛋白的RuvC活性位点中。在一些实施例中，TSL用以放置或捕捉呈折叠状态的靶链，其将靶链DNA主链的易切断磷酸置于RuvC活性位点中。TSL包含由TSL的主体分隔的cys4(CXXC、CXXC锌指/带域(SEQ ID NO:48))。在一些实施例中，示例性TSL包含SEQ IDNO:1的氨基酸825-934或SEQ ID NO:2的氨基酸813-921。

c.螺旋形I域

本公开的参考CasX蛋白包含螺旋形I域。除CasX以外的某些Cas蛋白具有可以类似方式命名的域。然而，在一些实施例中，相比于非CasX蛋白，CasX蛋白的螺旋形I域包含一个或多个独特结构特征，或包含独特序列，或其组合。举例来说，在一些实施例中，相比于可具有类似名称的其他Cas蛋白中的域，CasX蛋白的螺旋形I域包含一个或多个独特二级结构。举例来说，在一些实施例中，相比于其他CRISPR蛋白，CasX蛋白中的螺旋形I域包含布置、数目及长度独特的结构及序列的一个或多个α螺旋。在某些实施例中，螺旋形I域负责与引导RNA的结合DNA及间隔子相互作用。不希望受理论所束缚，认为在一些情况下，螺旋形I域可促进前间隔子邻近基序(PAM)的结合。在一些实施例中，示例性螺旋形I域包含SEQ ID NO:1的氨基酸57-100和192-332，或SEQ ID NO:2的氨基酸59-102和193-333。在一些实施例中，参考CasX蛋白的螺旋形I域包含一个或多个α螺旋。

d.螺旋形II域

本公开的参考CasX蛋白包含螺旋形II域。除CasX以外的某些Cas蛋白具有可以类似方式命名的域。然而，在一些实施例中，相比于可具有类似名称的其他Cas蛋白中的域，CasX蛋白的螺旋形II域包含一个或多个独特结构特征，或独特序列，或其组合。举例来说，在一些实施例中，螺旋形II域包含沿靶DNA:引导RNA通道对准的一个或多个独特结构性α螺旋束。在一些实施例中，在包含螺旋形II域的CasX中，靶链及引导RNA与螺旋形II(且在一些实施例中，螺旋形I域)相互作用，以允许RuvC域接近靶DNA。螺旋形II域负责结合至引导RNA支架茎环以及结合DNA。在一些实施例中，示例性螺旋形II域包含SEQ ID NO:1的氨基酸333-509，或SEQ ID NO:2的氨基酸334-501。

e.寡核苷酸结合域

本公开的参考CasX蛋白包含寡核苷酸结合域(OBD)。除CasX以外的某些Cas蛋白具有可以类似方式命名的域。然而，在一些实施例中，OBD包含一种或多种独特功能特征，或包含相对于CasX蛋白独特的序列，或其组合。举例来说，在一些实施例中，桥连螺旋(BH)、螺旋形I域、螺旋形II域及寡核苷酸结合域(OBD)一起负责将CasX蛋白结合至引导RNA。因此，举例来说，在一些实施例中，OBD相对于CasX蛋白的独特的处在于其与螺旋形I域，或螺旋形II域或两者功能上相互作用，所述域各自可相对于如本文所述的CasX蛋白为独特的。具体地，在CasX中，OBD很大程度上结合引导RNA支架的RNA三螺旋体。OBD亦可负责结合至前间隔子邻近基序(PAM)。示例性OBD域包含SEQ ID NO:1的氨基酸1-56和510-660，或SEQ ID NO:2的氨基酸1-58和502-647。

f.RuvC DNA裂解域

本公开的参考CasX蛋白包含RuvC域，其包括2个部分RuvC域(RuvC-I及RuvC-II)。RuvC域为所有12型CRISPR蛋白的祖先域。RuvC域源自TNPB(转座酶B)样转座酶。与其他RuvC域类似，CasX RuvC域具有负责配位镁(Mg)离子及裂解DNA的DED催化三联体。在一些实施例中，RuvC具有负责裂解DNA的两条链(一个接一个地，最可能首先为靶向序列中11-14个核苷酸(nt)处的非靶链，且接着随后为靶序列之后2-4个核苷酸附近的靶链)的DED基序活性位点。具体地，在CasX中，RuvC域的独特之处在于其亦负责结合对CasX功能重要的引导RNA支架茎环。示例性RuvC域包含SEQ ID NO:1的氨基酸661-824和935-986，或SEQ ID NO:2的氨基酸648-812和922-978。

g.参考CasX蛋白

本公开提供了天然存在的CasX蛋白(在本文中称为“参考CasX蛋白”)，其充当催化靶向双链DNA(dsDNA)中特定序列处的双链断裂的核酸内切酶。序列特异性由其所复合的相关gNA的靶向序列提供，该靶向序列与靶核酸内的靶序列杂交。举例来说，参考CasX蛋白可自天然存在的原核生物，例如δ变形菌纲、浮霉菌门或宋氏细菌暂定种物种分离。参考CasX蛋白(有时在本文中称为参考CasX蛋白)为V型CRISPR/Cas核酸内切酶，其属于能够与引导NA相互作用以形成核糖核蛋白(RNP)复合物的CasX(有时称为Cas12e)蛋白家族。在一些实施例中，包含参考CasX蛋白的RNP复合物可经由gNA的靶向序列(或间隔子)与靶核酸中的靶序列之间的碱基配对靶向至靶核酸中的特定位点。在一些实施例中，包含参考CasX蛋白的RNP能够裂解靶DNA。在一些实施例中，包含参考CasX蛋白的RNP能够切割靶DNA。在一些实施例中，包含参考CasX蛋白的RNP能够编辑靶DNA，例如在如下那些实施例中，其中参考CasX蛋白能够裂解或切割DNA，接着为非同源末端连接(NHEJ)、同源定向修复(HDR)、同源非依赖性靶向整合(HITI)、微同源介导的末端连接(MMEJ)、单链退火(SSA)或碱基切除修复(BER)。在一些实施例中，包含CasX蛋白的RNP为催化死亡(无催化活性或基本上无裂解活性)CasX蛋白(dCasX)，但保留结合靶DNA的能力，这更充分描述于前文。

在一些情况下，V型参考CasX蛋白分离或衍生自δ变形菌纲。在一些实施例中，CasX蛋白包含与以下序列具有至少50％同一性、至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少81％同一性、至少82％同一性、至少83％同一性、至少84％同一性、至少85％同一性、至少86％同一性、至少86％同一性、至少87％同一性、至少88％同一性、至少89％同一性、至少89％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性、至少99.5％同一性或100％同一性的序列：

在一些情况下，V型参考CasX蛋白分离或衍生自浮霉菌门。在一些实施例中，CasX蛋白包含与以下序列具有至少50％同一性、至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少81％同一性、至少82％同一性、至少83％同一性、至少84％同一性、至少85％同一性、至少86％同一性、至少86％同一性、至少87％同一性、至少88％同一性、至少89％同一性、至少89％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性、至少99.5％同一性或100％同一性的序列：

在一些实施例中，CasX蛋白包含SEQ ID NO:2，或与其至少60％类似的序列。在一些实施例中，CasX蛋白包含SEQ ID NO:2，或与其至少80％类似的序列。在一些实施例中，CasX蛋白包含SEQ ID NO:2，或与其至少90％类似的序列。在一些实施例中，CasX蛋白包含SEQ ID NO:2，或与其至少95％类似的序列。在一些实施例中，CasX蛋白由SEQ ID NO:2的序列组成。在一些实施例中，CasX蛋白包含相对于SEQ ID NO:2的序列具有至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少20个、至少30个、至少40个或至少50个突变的序列或由其组成。这些突变可为插入、缺失、氨基酸取代或其任何组合。

在一些情况下，V型参考CasX蛋白分离或衍生自宋氏细菌暂定种。在一些实施例中，CasX蛋白包含与以下序列至少50％同一性、至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少81％同一性、至少82％同一性、至少83％同一性、至少84％同一性、至少85％同一性、至少86％同一性、至少86％同一性、至少87％同一性、至少88％同一性、至少89％同一性、至少89％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性、至少99.5％同一性或100％同一性的序列：

在一些实施例中，CasX蛋白包含SEQ ID NO:3，或与其至少60％类似的序列。在一些实施例中，CasX蛋白包含SEQ ID NO:3，或与其至少80％类似的序列。在一些实施例中，CasX蛋白包含SEQ ID NO:3，或与其至少90％类似的序列。在一些实施例中，CasX蛋白包含SEQ ID NO:3，或与其至少95％类似的序列。在一些实施例中，CasX蛋白由SEQ ID NO:3的序列组成。在一些实施例中，CasX蛋白包含相对于SEQ ID NO:3的序列具有至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少20个、至少30个、至少40个或至少50个突变的序列或由其组成。这些突变可为插入、缺失、氨基酸取代或其任何组合。

h.CasX变异蛋白

本公开提供了参考CasX蛋白的变异体(在本文中可互换地称为“CasX变异体”或“CasX变异蛋白”)，其中相对于参考CasX蛋白(包括SEQ ID NO:1-3的序列)，CasX变异体在至少一个域中包含至少一个序列修饰。在一些实施例中，相比于参考CasX蛋白，CasX变异体展现至少一种改进特征。当相比于本文所述的参考CasX蛋白时改进CasX变异蛋白的一种或多种功能或特征的所有变异体都被设想为在本公开的范围内。在一些实施例中，修饰为参考CasX的一个或多个氨基酸中的突变。在其他实施例中，修饰为参考CasX的一个或多个域经来自不同CasX的一个或多个域取代。在一些实施例中，插入包括插入来自不同CasX蛋白的部分或所有域。突变可出现于参考CasX蛋白的任何一个或多个域中，且可包括例如一个或多个域的一部分或全部的缺失，或参考CasX蛋白的任何域中的一个或多个氨基酸取代、缺失或插入。CasX蛋白的域包括非靶链结合(NTSB)域、靶链负载(TSL)域、螺旋形I域、螺旋形II域、寡核苷酸结合域(OBD)及RuvC DNA裂解域。将引起CasX蛋白的特征改进的参考CasX蛋白的任何氨基酸序列变化视为本公开的CasX变异蛋白。举例来说，相对于参考CasX蛋白序列，CasX变异体可包含一个或多个氨基酸取代、插入、缺失或交换域，或其任何组合。在一个特定的特征中，本公开的CasX变异蛋白具有优于参考CasX蛋白的优点，因为它们对选自TTC、ATC、GTC或CTC的更大多样性的PAM序列具有结合亲和力，这使得CasX变异体与参考CasX蛋白相比能够编辑显著更大部分的靶核酸。

在一些实施例中，CasX变异蛋白包含参考CasX蛋白的至少两个域中的每一者中的至少一个修饰，包括SEQ ID NO:1-3的序列。在一些实施例中，CasX变异蛋白包含参考CasX蛋白的至少2个域、至少3个域、至少4个域或至少5个域中的至少一个修饰。在一些实施例中，CasX变异蛋白包含参考CasX蛋白的至少一个域中的两个或更多个修饰。在一些实施例中，CasX变异蛋白包含参考CasX蛋白质的至少一个域中的至少两个修饰、参考CasX蛋白的至少一个域中的至少三个修饰或参考CasX蛋白的至少一个域中的至少四个修饰。在一些实施例中，其中与参考CasX蛋白相比，CasX变异体包含两个或更多个修饰，每个修饰在独立地选自由NTSBD、TSLD、螺旋形I域、螺旋形II域、OBD和RuvC DNA裂解域组成的组中的域中进行。

在一些实施例中，CasX变异蛋白的至少一个修饰包含SEQ ID NO:1-3的参考CasX蛋白的一个域的至少一部分的缺失。在一些实施例中，缺失在NTSBD、TSLD、螺旋形I域、螺旋形II域、OBD或RuvC DNA裂解域中。

适用于产生本公开的CasX变异蛋白的诱变方法可包括例如深度突变进化(DME)、深度突变扫描(DMS)、易错PCR、盒式诱变、随机诱变、交错延伸PCR、基因改组或域交换。在一些实施例中，CasX变异体例如通过选择参考CasX中的一个或多个所需突变而设计。在某些实施例中，参考CasX蛋白的活性用作比较一种或多种CasX变异体的活性，由此测量CasX变异体的功能改进的基准。CasX变异体的示例性改进包括但不限于改进的变异体折叠、对gNA的改进结合亲和力、对靶DNA的改进结合亲和力、对一个或多个PAM序列的改变结合亲和力、改进的靶DNA解旋、增加的活性、改进的编辑效率、改进的编辑特异性、增加的核酸酶活性、增加的用于双链裂解的靶链负载、减少的用于单链切割的靶链负载、减少的脱靶裂解、改进的DNA非靶链的结合、改进的靶核酸序列裂解速率、改进的蛋白质稳定性、改进的蛋白质:gNA复合物稳定性、改进的蛋白质溶解度、改进的蛋白质:gNA复合物溶解度、改进的蛋白质产率、改进的蛋白质表达及改进的融合特征，如下文更充分地描述。

在本文所述的CasX变异体的一些实施例中，至少一个修饰包含：(a)与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的参考CasX相比，CasX变异体中1至100个连续或非连续氨基酸的取代；(b)与参考CasX相比，CasX变异体中1至100个连续或非连续氨基酸的缺失；(c)与参考CasX相比，CasX中1至100个连续或非连续氨基酸的插入；或(d)(a)-(c)的任何组合。在一些实施例中，至少一个修饰包含：(a)与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的参考CasX相比，CasX变异体中5至10个连续或非连续氨基酸的取代；(b)与参考CasX相比，CasX变异体中1至5个连续或非连续氨基酸的缺失；(c)与参考CasX相比，CasX中1至5个连续或非连续氨基酸的插入；或(d)(a)-(c)的任何组合。

在一些实施例中，CasX变异蛋白包含相对于SEQ ID NO:1、SEQ ID NO:2或SEQ IDNO:3的序列具有至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少20个、至少30个、至少40个或至少50个突变的序列或由其组成。这些突变可为插入、缺失、氨基酸取代或其任何组合。

在一些实施例中，CasX变异蛋白包含参考CasX蛋白的至少一个域中的至少一个氨基酸取代。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白包含至少约1-4个氨基酸取代、1-10个氨基酸取代、1-20个氨基酸取代、1-30个氨基酸取代、1-40个氨基酸取代、1-50个氨基酸取代、1-60个氨基酸取代、1-70个氨基酸取代、1-80个氨基酸取代、1-90个氨基酸取代、1-100个氨基酸取代、2-10个氨基酸取代、2-20个氨基酸取代、2-30个氨基酸取代、3-10个氨基酸取代、3-20个氨基酸取代、3-30个氨基酸取代、4-10个氨基酸取代、4-20个氨基酸取代、3-300个氨基酸取代、5-10个氨基酸取代、5-20个氨基酸取代、5-30个氨基酸取代、10-50个氨基酸取代或20-50个氨基酸取代，这些氨基酸取代可以是连续的或非连续的或位于不同域中。如本文所用，“连续氨基酸”是指在多肽的一级序列中连续的氨基酸。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白包含至少约100个或更多个氨基酸取代。在一些实施例中，氨基酸取代为保守取代。在其他实施例中，取代为非保守的；例如极性氨基酸取代非极性氨基酸，或反之亦然。

任何氨基酸可在本文所述的取代中取代任何其他氨基酸。取代可为保守取代(例如碱性氨基酸取代另一碱性氨基酸)。取代可为非保守取代(例如碱性氨基酸取代酸性氨基酸，或反之亦然)。举例来说，参考CasX蛋白中的脯氨酸可取代以下中的任一者以产生本公开的CasX变异蛋白：精氨酸、组氨酸、赖氨酸、天冬氨酸、谷氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、甘氨酸、丙氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、色氨酸、酪氨酸或缬氨酸。

在一些实施例中，CasX变异蛋白包含相对于参考CasX蛋白的至少一个氨基酸缺失。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白包含1-4个氨基酸、1-10个氨基酸、1-20个氨基酸、1-30个氨基酸、1-40个氨基酸、1-50个氨基酸、1-60个氨基酸、1-70个氨基酸、1-80个氨基酸、1-90个氨基酸、1-100个氨基酸、2-10个氨基酸、2-20个氨基酸、2-30个氨基酸、3-10个氨基酸、3-20个氨基酸、3-30个氨基酸、4-10个氨基酸、4-20个氨基酸、3-300个氨基酸、5-10个氨基酸、5-20个氨基酸、5-30个氨基酸、10-50个氨基酸或20-50个氨基酸的缺失。在一些实施例中，相对于参考CasX蛋白，CasX变异体包含至少约100个连续氨基酸的缺失。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50或100个连续氨基酸的缺失。在一些实施例中，CasX变异蛋白包含1、2、3、4、5、6、7、8、9或10个连续氨基酸的缺失。

在一些实施例中，CasX变异蛋白包含相对于参考CasX蛋白的两个或更多个缺失，且该两个或更多个缺失不为连续氨基酸。举例来说，第一缺失可在参考CasX蛋白的第一域中，且第二缺失可在参考CasX蛋白的第二域中。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个非连续缺失。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白包含至少20个非连续缺失。各非连续缺失可具有本文所述的氨基酸的任何长度，例如1-4个氨基酸、1-10个氨基酸等。

在一些实施例中，CasX变异蛋白包含相对于SEQ ID NO:1、SEQ ID NO:2或SEQ IDNO:3的序列的至少一个氨基酸插入。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白包含1个氨基酸的插入、2-3个连续氨基酸、2-4个连续氨基酸、2-5个连续氨基酸、2-6个连续氨基酸、2-7个连续氨基酸、2-8个连续氨基酸、2-9个连续氨基酸、2-10个连续氨基酸、2-20个连续氨基酸、2-30个连续氨基酸、2-40个连续氨基酸、2-50个连续氨基酸、2-60个连续氨基酸、2-70个连续氨基酸、2-80个连续氨基酸、2-90个连续氨基酸、2-100个连续氨基酸、3-10个连续氨基酸、3-20个连续氨基酸、3-30个连续氨基酸、4-10个连续氨基酸、4-20个连续氨基酸、3-300个连续氨基酸、5-10个连续氨基酸、5-20个连续氨基酸、5-30个连续氨基酸、10-50个连续氨基酸或20-50个连续氨基酸的插入。在一些实施例中，CasX变异蛋白包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续氨基酸的插入。在一些实施例中，CasX变异蛋白包含至少约100个连续氨基酸的插入。

在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白包含两个或更多个插入，且该两个或更多个插入不为序列的连续氨基酸。举例来说，第一插入可在参考CasX蛋白的第一域中，且第二插入可在参考CasX蛋白的第二域中。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个非连续插入。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白包含至少10至约20个或更多个非连续插入。各非连续插入可具有本文所述的氨基酸的任何长度，例如1-4个氨基酸、1-10个氨基酸等。

任何氨基酸或氨基酸的组合可以插入本文所述的插入物中。举例来说，脯氨酸、精氨酸、组氨酸、赖氨酸、天冬氨酸、谷氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、甘氨酸、丙氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、色氨酸、酪氨酸或缬氨酸或其任何组合可插入至本公开的参考CasX蛋白中以产生CasX变异蛋白。

本文所述的取代、插入及缺失实施例的任何排列可经组合以产生本公开的CasX变异蛋白。举例来说，CasX变异蛋白可包含相对于参考CasX蛋白序列的至少一个取代及至少一个缺失、相对于参考CasX蛋白序列的至少一个取代及至少一个插入、相对于参考CasX蛋白序列的至少一个插入及至少一个缺失或相对于参考CasX蛋白序列的至少一个取代、一个插入及一个缺失。

在一些实施例中，CasX变异蛋白与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3中的一者具有至少约60％序列类似性、至少70％类似性、至少80％类似性、至少85％类似性、至少86％类似性、至少87％类似性、至少88％类似性、至少89％类似性、至少90％类似性、至少91％类似性、至少92％类似性、至少93％类似性、至少94％类似性、至少95％类似性、至少96％类似性、至少97％类似性、至少98％类似性、至少99％类似性、至少99.5％类似性、至少99.6％类似性、至少99.7％类似性、至少99.8％类似性或至少99.9％类似性。

在一些实施例中，CasX变异蛋白与SEQ ID NO:2或其部分具有至少约60％序列类似性。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的Y789T的取代、SEQ ID NO:2的P793的缺失、SEQ ID NO:2的Y789D的取代、SEQ ID NO:2的T72S的取代、SEQ ID NO:2的I546V的取代、SEQ ID NO:2的E552A的取代、SEQ ID NO:2的A636D的取代、SEQ ID NO:2的F536S的取代、SEQ ID NO:2的A708K的取代、SEQ ID NO:2的Y797L的取代、SEQ ID NO:2的L792G的取代、SEQ ID NO:2的A739V的取代、SEQ ID NO:2的G791M的取代、SEQ ID NO:2的位置661处A的插入、SEQ ID NO:2的A788W的取代、SEQ ID NO:2的K390R的取代、SEQ ID NO:2的A751S的取代、SEQ ID NO:2的E385A的取代、SEQ ID NO:2的位置696处P的插入、SEQ IDNO:2的位置773处M的插入、SEQ ID NO:2的G695H的取代、SEQ ID NO:2的位置793处AS的插入、SEQ ID NO:2的位置795处AS的插入、SEQ ID NO:2的C477R的取代、SEQ ID NO:2的C477K的取代、SEQ ID NO:2的C479A的取代、SEQ ID NO:2的C479L的取代、SEQ ID NO:2的I55F的取代、SEQ ID NO:2的K210R的取代、SEQ ID NO:2的C233S的取代、SEQ ID NO:2的D231N的取代、SEQ ID NO:2的Q338E的取代、SEQ ID NO:2的Q338R的取代、SEQ ID NO:2的L379R的取代、SEQ ID NO:2的K390R的取代、SEQ ID NO:2的L481Q的取代、SEQ ID NO:2的F495S的取代、SEQ ID NO:2的D600N的取代、SEQ ID NO:2的T886K的取代、SEQ ID NO:2的A739V的取代、SEQ ID NO:2的K460N的取代、SEQ ID NO:2的I199F的取代、SEQ ID NO:2的G492P的取代、SEQ ID NO:2的T153I的取代、SEQ ID NO:2的R591I的取代、SEQ ID NO:2的位置795处AS的插入、SEQ ID NO:2的位置796处AS的插入、SEQ ID NO:2的位置889处L的插入、SEQ IDNO:2的E121D的取代、SEQ ID NO:2的S270W的取代、SEQ ID NO:2的E712Q的取代、SEQ IDNO:2的K942Q的取代、SEQ ID NO:2的E552K的取代、SEQ ID NO:2的K25Q的取代、SEQ ID NO:2的N47D的取代、SEQ ID NO:2的位置696处T的插入、SEQ ID NO:2的L685I的取代、SEQ IDNO:2的N880D的取代、SEQ ID NO:2的Q102R的取代、SEQ ID NO:2的M734K的取代、SEQ IDNO:2的A724S的取代、SEQ ID NO:2的T704K的取代、SEQ ID NO:2的P224K的取代、SEQ IDNO:2的K25R的取代、SEQ ID NO:2的M29E的取代、SEQ ID NO:2的H152D的取代、SEQ ID NO:2的S219R的取代、SEQ ID NO:2的E475K的取代、SEQ ID NO:2的G226R的取代、SEQ ID NO:2的A377K的取代、SEQ ID NO:2的E480K的取代、SEQ ID NO:2的K416E的取代、SEQ ID NO:2的H164R的取代、SEQ ID NO:2的K767R的取代、SEQ ID NO:2的I7F的取代、SEQ ID NO:2的M29R的取代、SEQ ID NO:2的H435R的取代、SEQ ID NO:2的E385Q的取代、SEQ ID NO:2的E385K的取代、SEQ ID NO:2的I279F的取代、SEQ ID NO:2的D489S的取代、SEQ ID NO:2的D732N的取代、SEQ ID NO:2的A739T的取代、SEQ ID NO:2的W885R的取代、SEQ ID NO:2的E53K的取代、SEQ ID NO:2的A238T的取代、SEQ ID NO:2的P283Q的取代、SEQ ID NO:2的E292K的取代、SEQ ID NO:2的Q628E的取代、SEQ ID NO:2的R388Q的取代、SEQ ID NO:2的G791M的取代、SEQ ID NO:2的L792K的取代、SEQ ID NO:2的L792E的取代、SEQ ID NO:2的M779N的取代、SEQ ID NO:2的G27D的取代、SEQ ID NO:2的K955R的取代、SEQ ID NO:2的S867R的取代、SEQID NO:2的R693I的取代、SEQ ID NO:2的F189Y的取代、SEQ ID NO:2的V635M的取代、SEQ IDNO:2的F399L的取代、SEQ ID NO:2的E498K的取代、SEQ ID NO:2的E386R的取代、SEQ IDNO:2的V254G的取代、SEQ ID NO:2的P793S的取代、SEQ ID NO:2的K188E的取代、SEQ IDNO:2的QT945KI的取代、SEQ ID NO:2的T620P的取代、SEQ ID NO:2的T946P的取代、SEQ IDNO:2的TT949PP的取代、SEQ ID NO:2的N952T的取代、SEQ ID NO:2的K682E的取代、SEQ IDNO:2的K975R的取代、SEQ ID NO:2的L212P的取代、SEQ ID NO:2的E292R的取代、SEQ IDNO:2的I303K的取代、SEQ ID NO:2的C349E的取代、SEQ ID NO:2的E385P的取代、SEQ IDNO:2的E386N的取代、SEQ ID NO:2的D387K的取代、SEQ ID NO:2的L404K的取代、SEQ IDNO:2的E466H的取代、SEQ ID NO:2的C477Q的取代、SEQ ID NO:2的C477H的取代、SEQ IDNO:2的C479A的取代、SEQ ID NO:2的D659H的取代、SEQ ID NO:2的T806V的取代、SEQ IDNO:2的K808S的取代、SEQ ID NO:2的位置797处AS的插入、SEQ ID NO:2的V959M的取代、SEQID NO:2的K975Q的取代、SEQ ID NO:2的W974G的取代、SEQ ID NO:2的A708Q的取代、SEQ IDNO:2的V711K的取代、SEQ ID NO:2的D733T的取代、SEQ ID NO:2的L742W的取代、SEQ IDNO:2的V747K的取代、SEQ ID NO:2的F755M的取代、SEQ ID NO:2的M771A的取代、SEQ IDNO:2的M771Q的取代、SEQ ID NO:2的W782Q的取代、SEQ ID NO:2的G791F的取代、SEQ IDNO:2的L792D的取代、SEQ ID NO:2的L792K的取代、SEQ ID NO:2的P793Q的取代、SEQ IDNO:2的P793G的取代、SEQ ID NO:2的Q804A的取代、SEQ ID NO:2的Y966N的取代、SEQ IDNO:2的Y723N的取代、SEQ ID NO:2的Y857R的取代、SEQ ID NO:2的S890R的取代、SEQ IDNO:2的S932M的取代、SEQ ID NO:2的L897M的取代、SEQ ID NO:2的R624G的取代、SEQ IDNO:2的S603G的取代、SEQ ID NO:2的N737S的取代、SEQ ID NO:2的L307K的取代、SEQ IDNO:2的I658V的取代、SEQ ID NO:2的位置688处PT的插入、SEQ ID NO:2的位置794处SA的插入、SEQ ID NO:2的S877R的取代、SEQ ID NO:2的N580T的取代、SEQ ID NO:2的V335G的取代、SEQ ID NO:2的T620S的取代、SEQ ID NO:2的W345G的取代、SEQ ID NO:2的T280S的取代、SEQ ID NO:2的L406P的取代、SEQ ID NO:2的A612D的取代、SEQ ID NO:2的A751S的取代、SEQ ID NO:2的E386R的取代、SEQ ID NO:2的V351M的取代、SEQ ID NO:2的K210N的取代、SEQ ID NO:2的D40A的取代、SEQ ID NO:2的E773G的取代、SEQ ID NO:2的H207L的取代、SEQ ID NO:2的T62A的取代、SEQ ID NO:2的T287P的取代、SEQ ID NO:2的T832A的取代、SEQID NO:2的A893S的取代、SEQ ID NO:2的位置14处V的插入、SEQ ID NO:2的位置13处AG的插入、SEQ ID NO:2的R11V的取代、SEQ ID NO:2的R12N的取代、SEQ ID NO:2的R13H的取代、SEQ ID NO:2的位置13处Y的插入、SEQ ID NO:2的R12L的取代、SEQ ID NO:2的位置13处Q的插入、SEQ ID NO:2的V15S的取代、SEQ ID NO:2的位置17处D的插入或其组合。

在一些实施例中，CasX变异蛋白包含对参考CasX蛋白氨基酸序列的至少两个氨基酸变化。至少两个氨基酸变化可为对参考CasX蛋白氨基酸序列的取代、插入或缺失或其任何组合。在一些实施例中，对参考CasX变异蛋白的序列的至少两个氨基酸变化选自由以下组成的组：SEQ ID NO:2的Y789T的取代、SEQ ID NO:2的P793的缺失、SEQ ID NO:2的Y789D的取代、SEQ ID NO:2的T72S的取代、SEQ ID NO:2的I546V的取代、SEQ ID NO:2的E552A的取代、SEQ ID NO:2的A636D的取代、SEQ ID NO:2的F536S的取代、SEQ ID NO:2的A708K的取代、SEQ ID NO:2的Y797L的取代、SEQ ID NO:2的L792G的取代、SEQ ID NO:2的A739V的取代、SEQ ID NO:2的G791M的取代、SEQ ID NO:2的位置661处A的插入、SEQ ID NO:2的A788W的取代、SEQ ID NO:2的K390R的取代、SEQ ID NO:2的A751S的取代、SEQ ID NO:2的E385A的取代、SEQ ID NO:2的位置696处P的插入、SEQ ID NO:2的位置773处M的插入、SEQ ID NO:2的G695H的取代、SEQ ID NO:2的位置793处AS的插入、SEQ ID NO:2的位置795处AS的插入、SEQ ID NO:2的C477R的取代、SEQ ID NO:2的C477K的取代、SEQ ID NO:2的C479A的取代、SEQ ID NO:2的C479L的取代、SEQ ID NO:2的I55F的取代、SEQ ID NO:2的K210R的取代、SEQID NO:2的C233S的取代、SEQ ID NO:2的D231N的取代、SEQ ID NO:2的Q338E的取代、SEQ IDNO:2的Q338R的取代、SEQ ID NO:2的L379R的取代、SEQ ID NO:2的K390R的取代、SEQ IDNO:2的L481Q的取代、SEQ ID NO:2的F495S的取代、SEQ ID NO:2的D600N的取代、SEQ IDNO:2的T886K的取代、SEQ ID NO:2的A739V的取代、SEQ ID NO:2的K460N的取代、SEQ IDNO:2的I199F的取代、SEQ ID NO:2的G492P的取代、SEQ ID NO:2的T153I的取代、SEQ IDNO:2的R591I的取代、SEQ ID NO:2的位置795处AS的插入、SEQ ID NO:2的位置796处AS的插入、SEQ ID NO:2的位置889处L的插入、SEQ ID NO:2的E121D的取代、SEQ ID NO:2的S270W的取代、SEQ ID NO:2的E712Q的取代、SEQ ID NO:2的K942Q的取代、SEQ ID NO:2的E552K的取代、SEQ ID NO:2的K25Q的取代、SEQ ID NO:2的N47D的取代、SEQ ID NO:2的位置696处T的插入、SEQ ID NO:2的L685I的取代、SEQ ID NO:2的N880D的取代、SEQ ID NO:2的Q102R的取代、SEQ ID NO:2的M734K的取代、SEQ ID NO:2的A724S的取代、SEQ ID NO:2的T704K的取代、SEQ ID NO:2的P224K的取代、SEQ ID NO:2的K25R的取代、SEQ ID NO:2的M29E的取代、SEQ ID NO:2的H152D的取代、SEQ ID NO:2的S219R的取代、SEQ ID NO:2的E475K的取代、SEQ ID NO:2的G226R的取代、SEQ ID NO:2的A377K的取代、SEQ ID NO:2的E480K的取代、SEQ ID NO:2的K416E的取代、SEQ ID NO:2的H164R的取代、SEQ ID NO:2的K767R的取代、SEQ ID NO:2的I7F的取代、SEQ ID NO:2的M29R的取代、SEQ ID NO:2的H435R的取代、SEQID NO:2的E385Q的取代、SEQ ID NO:2的E385K的取代、SEQ ID NO:2的I279F的取代、SEQ IDNO:2的D489S的取代、SEQ ID NO:2的D732N的取代、SEQ ID NO:2的A739T的取代、SEQ IDNO:2的W885R的取代、SEQ ID NO:2的E53K的取代、SEQ ID NO:2的A238T的取代、SEQ ID NO:2的P283Q的取代、SEQ ID NO:2的E292K的取代、SEQ ID NO:2的Q628E的取代、SEQ ID NO:2的R388Q的取代、SEQ ID NO:2的G791M的取代、SEQ ID NO:2的L792K的取代、SEQ ID NO:2的L792E的取代、SEQ ID NO:2的M779N的取代、SEQ ID NO:2的G27D的取代、SEQ ID NO:2的K955R的取代、SEQ ID NO:2的S867R的取代、SEQ ID NO:2的R693I的取代、SEQ ID NO:2的F189Y的取代、SEQ ID NO:2的V635M的取代、SEQ ID NO:2的F399L的取代、SEQ ID NO:2的E498K的取代、SEQ ID NO:2的E386R的取代、SEQ ID NO:2的V254G的取代、SEQ ID NO:2的P793S的取代、SEQ ID NO:2的K188E的取代、SEQ ID NO:2的QT945KI的取代、SEQ ID NO:2的T620P的取代、SEQ ID NO:2的T946P的取代、SEQ ID NO:2的TT949PP的取代、SEQ ID NO:2的N952T的取代、SEQ ID NO:2的K682E的取代、SEQ ID NO:2的K975R的取代、SEQ ID NO:2的L212P的取代、SEQ ID NO:2的E292R的取代、SEQ ID NO:2的I303K的取代、SEQ ID NO:2的C349E的取代、SEQ ID NO:2的E385P的取代、SEQ ID NO:2的E386N的取代、SEQ ID NO:2的D387K的取代、SEQ ID NO:2的L404K的取代、SEQ ID NO:2的E466H的取代、SEQ ID NO:2的C477Q的取代、SEQ ID NO:2的C477H的取代、SEQ ID NO:2的C479A的取代、SEQ ID NO:2的D659H的取代、SEQ ID NO:2的T806V的取代、SEQ ID NO:2的K808S的取代、SEQ ID NO:2的位置797处AS的插入、SEQ ID NO:2的V959M的取代、SEQ ID NO:2的K975Q的取代、SEQ ID NO:2的W974G的取代、SEQ ID NO:2的A708Q的取代、SEQ ID NO:2的V711K的取代、SEQ ID NO:2的D733T的取代、SEQ ID NO:2的L742W的取代、SEQ ID NO:2的V747K的取代、SEQ ID NO:2的F755M的取代、SEQ ID NO:2的M771A的取代、SEQ ID NO:2的M771Q的取代、SEQ ID NO:2的W782Q的取代、SEQ ID NO:2的G791F的取代、SEQ ID NO:2的L792D的取代、SEQ ID NO:2的L792K的取代、SEQ ID NO:2的P793Q的取代、SEQ ID NO:2的P793G的取代、SEQ ID NO:2的Q804A的取代、SEQ ID NO:2的Y966N的取代、SEQ ID NO:2的Y723N的取代、SEQ ID NO:2的Y857R的取代、SEQ ID NO:2的S890R的取代、SEQ ID NO:2的S932M的取代、SEQ ID NO:2的L897M的取代、SEQ ID NO:2的R624G的取代、SEQ ID NO:2的S603G的取代、SEQ ID NO:2的N737S的取代、SEQ ID NO:2的L307K的取代、SEQ ID NO:2的I658V的取代、SEQ ID NO:2的位置688处PT的插入、SEQ ID NO:2的位置794处SA的插入、SEQ ID NO:2的S877R的取代、SEQID NO:2的N580T的取代、SEQ ID NO:2的V335G的取代、SEQ ID NO:2的T620S的取代、SEQ IDNO:2的W345G的取代、SEQ ID NO:2的T280S的取代、SEQ ID NO:2的L406P的取代、SEQ IDNO:2的A612D的取代、SEQ ID NO:2的A751S的取代、SEQ ID NO:2的E386R的取代、SEQ IDNO:2的V351M的取代、SEQ ID NO:2的K210N的取代、SEQ ID NO:2的D40A的取代、SEQ ID NO:2的E773G的取代、SEQ ID NO:2的H207L的取代、SEQ ID NO:2的T62A的取代、SEQ ID NO:2的T287P的取代、SEQ ID NO:2的T832A的取代、SEQ ID NO:2的A893S的取代、SEQ ID NO:2的位置14处V的插入、SEQ ID NO:2的位置13处AG的插入、SEQ ID NO:2的R11V的取代、SEQ IDNO:2的R12N的取代、SEQ ID NO:2的R13H的取代、SEQ ID NO:2的位置13处Y的插入、SEQ IDNO:2的R12L的取代、SEQ ID NO:2的位置13处Q的插入、SEQ ID NO:2的V15S的取代和SEQ IDNO:2的位置17处D的插入。在一些实施例中，对参考CasX蛋白的至少两个氨基酸变化选自表3的序列中公开的氨基酸变化。

在一些实施例中，CasX变异蛋白包含对参考CasX蛋白氨基酸序列的超过一个取代、插入及/或缺失。在一些实施例中，参考CasX蛋白包含SEQ ID NO:2或基本上由其组成。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的S794R的取代及Y797L的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的K416的取代及EA708K的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的A708K的取代及P793的缺失。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的P793的缺失及P793AS的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的Q367K的取代及I425S的取代。在一些实施例中，CasX变异蛋白包含SEQ IDNO:2的A708K的取代、位置793处P的缺失及A793V的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的Q338R的取代及A339E的取代。在一些实施例中，CasX变异蛋白包含SEQ IDNO:2的Q338R的取代及A339K的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的S507G的取代及G508R的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代及位置793处P的缺失。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的C477K的取代、A708K的取代及位置793处P的缺失。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代及位置793处P的缺失。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代、位置793处P的缺失及A739V的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的C477K的取代、A708K的取代、位置793处P的缺失及A739V的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及A739V的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代、位置793处P的缺失及M779N的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代、位置793处P的缺失及M771N的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、708K的取代、位置793处P的缺失及D489S的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代、位置793处P的缺失及A739T的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代、位置793处P的缺失及D732N的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代、位置793处P的缺失及G791M的取代。在一些实施例中，CasX变异蛋白包含SEQID NO:2的L379R的取代、708K的取代、位置793处P的缺失及Y797L的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及M779N的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及M771N的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及D489S的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及A739T的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及D732N的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及G791M的取代。在一些实施例中，CasX变异蛋白包含SEQ IDNO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及Y797L的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及T620P的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的A708K的取代、位置793处P的缺失及E386S的取代。在一些实施例中，CasX变异蛋白包含SEQID NO:2的E386R的取代、F399L的取代及位置793处P的缺失。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的R581I及A739V的取代。在一些实施例中，CasX变异体包含此段之前述实施例的任何组合。

在一些实施例中，CasX变异蛋白包含对参考CasX蛋白氨基酸序列的超过一个取代、插入及/或缺失。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的A708K的取代、位置793处P的缺失及A739V的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代及位置793处P的缺失。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的C477K的取代、A708K的取代及位置793处P的缺失。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代及位置793处P的缺失。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代、位置793处P的缺失及A739V的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的C477K的取代、A708K的取代、位置793处P的缺失及A739的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及A739V的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及T620P的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的M771A的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代、位置793处P的缺失及D732N的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的W782Q的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的M771Q的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的R458I的取代及A739V的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代、位置793处P的缺失及M771N的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代、位置793处P的缺失及A739T的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及D489S的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及D732N的取代。在一些实施例中，CasX变异体包含此段之前述实施例的任何组合。

在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的V711K的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及Y797L的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代及位置793处P的缺失。

在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代、位置793处P的缺失及M771N的取代。在一些实施例中，CasX变异蛋白包含SEQID NO:2的A708K的取代、位置793处P的取代及E386S的取代。

在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477K的取代、A708K的取代及位置793处P的缺失。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L792D的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的G791F的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的A708K的取代、位置793处P的缺失及A739V的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、A708K的取代、位置793处P的缺失及A739V的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的C477K的取代、A708K的取代及位置793处P的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L249I的取代及M771N的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的V747K的取代。在一些实施例中，CasX变异蛋白包含SEQ ID NO:2的L379R的取代、C477的取代、A708K的取代、位置793处P的缺失及M779N的取代。在一些实施例中，CasX变异蛋白包含F755M的取代。

在一些实施例中，CasX变异蛋白包含400至2000个氨基酸、500至1500个氨基酸、700至1200个氨基酸、800至1100个氨基酸或900至1000个氨基酸。

在一些实施例中，CasX变异蛋白包含一个或多个修饰，其包含形成发生gNA:靶DNA复合的通道的非连续残基区。在一些实施例中，CasX变异蛋白包含一个或多个修饰，其包含形成与gNA结合的界面的非连续残基区。举例来说，在参考CasX蛋白的一些实施例中，螺旋形I、螺旋形II及OBD域全部接触或邻近gNA:靶DNA复合物，且对这些域中的任一者内的非连续残基的一个或多个修饰可改进CasX变异蛋白的功能。

在一些实施例中，CasX变异蛋白包含一个或多个修饰，其包含形成与非靶链DNA结合的通道的非连续残基区。举例来说，CasX变异蛋白可包含对NTSBD的非连续残基的一个或多个修饰。在一些实施例中，CasX变异蛋白包含一个或多个修饰，其包含形成与PAM结合的界面的非连续残基区。举例来说，CasX变异蛋白可包含对螺旋形I域或OBD的非连续残基的一个或多个修饰。在一些实施例中，CasX变异蛋白含有包含非连续表面暴露残基区的一个或多个修饰。如本文所用，“表面暴露残基”是指CasX蛋白的表面上的氨基酸，或其中氨基酸的至少一部分，例如主链或一部分侧链在蛋白质的表面上的氨基酸。例如CasX的细胞蛋白质的表面暴露残基(其暴露于水性细胞内环境)经常选自带正电亲水性氨基酸，例如精氨酸、天冬酰胺、天冬氨酸、谷氨酰胺、谷氨酸、组氨酸、赖氨酸、丝氨酸及苏氨酸。因此，举例来说，在本文提供的变异体的一些实施例中，相比于参考CasX蛋白，表面暴露残基的区包含一个或多个插入、缺失或取代。在一些实施例中，一个或多个带正电残基取代一个或多个其他带正电残基，或带负电残基，或不带电残基，或其任何组合。在一些实施例中，一个或多个取代氨基酸残基接近结合核酸，例如RuvC域或螺旋形I域中接触靶DNA的残基，或OBD或螺旋形II域中结合gRNA的残基可取代一个或多个带正电或极性氨基酸。

在一些实施例中，CasX变异蛋白包含一个或多个修饰，其包含经由参考CasX蛋白的域中的疏水性填充形成核的非连续残基区。不希望受任何理论束缚，经由疏水性填充形成核的区富含疏水性氨基酸，例如缬氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、色氨酸及半胱氨酸。举例来说，在一些参考CasX蛋白中，RuvC域包含邻近于活性位点的疏水袋。在一些实施例中，该区的2至15个残基为带电、极性或碱基堆叠的。带电氨基酸(在本文中可互换地称为残基)可包括例如精氨酸、赖氨酸、天冬氨酸和谷氨酸，且这些氨基酸的侧链可形成盐桥，前提是亦存在桥连伴侣。极性氨基酸可包括例如谷氨酰胺、天冬酰胺、组氨酸、丝氨酸、苏氨酸、酪氨酸及半胱氨酸。在一些实施例中，极性氨基酸可取决于其侧链标识而形成质子供体或受体形式的氢键。如本文所用，“碱基堆叠”包括氨基酸残基(例如色氨酸、酪氨酸、苯丙氨酸或组氨酸)的芳香族侧链与核酸中的堆叠核苷酸碱基的相互作用。在空间上紧邻以形成CasX变异蛋白的功能性部分的对非连续氨基酸区的任何修饰被设想为在本公开的范围内。

i.具有来自多种源蛋白质的域的CasX变异蛋白

在某些实施例中，本公开提供了嵌合CasX蛋白，其包含来自两种或更多种不同CasX蛋白的蛋白域，如两种或更多种参考CasX蛋白，或两种或更多种如本文所述的CasX变异蛋白序列。如本文所用，“嵌合CasX蛋白”是指含有至少两个分离或衍生自不同来源，例如两种天然存在的蛋白质的域的CasX，在一些实施例中，该两种蛋白质可分离自不同物种。举例来说，在一些实施例中，嵌合CasX蛋白包含来自第一CasX蛋白的第一域及来自不同的第二CasX蛋白的第二域。在一些实施例中，第一域可选自由以下组成的组：NTSB、TSL、螺旋形I、螺旋形II、OBD和RuvC域。在一些实施例中，第二域选自由以下组成的组：NTSB、TSL、螺旋形I、螺旋形II、OBD和RuvC域，其中第二域不同于前述第一域。例如，嵌合CasX蛋白可包含来自SEQ ID NO:2的CasX蛋白的NTSB、TSL、螺旋形I、螺旋形II、OBD域，以及来自SEQ ID NO:1的CasX蛋白的RuvC域，或反之亦然。作为另一实例，嵌合CasX蛋白可包含来自SEQ ID NO:2的CasX蛋白的NTSB、TSL、螺旋形II、OBD和RuvC域，以及来自SEQ ID NO:1的CasX蛋白的螺旋形I域，或反之亦然。因此，在某些实施例中，嵌合CasX蛋白可包含来自第一CasX蛋白的NTSB、TSL、螺旋形II、OBD和RuvC域，以及来自第二CasX蛋白的螺旋形I域。在嵌合CasX蛋白的一些实施例中，第一CasX蛋白的域衍生自SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的序列，且第二CasX蛋白的域衍生自SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的序列，且第一及第二CasX蛋白不相同。在一些实施例中，第一CasX蛋白的域包含衍生自SEQ ID NO:1的序列，且第二CasX蛋白的域包含衍生自SEQ ID NO:2的序列。在一些实施例中，第一CasX蛋白的域包含衍生自SEQ ID NO:1的序列，且第二蛋白的域包含衍生自SEQ ID NO:3的序列。在一些实施例中，第一CasX蛋白的域包含衍生自SEQ ID NO:2的序列，且第二蛋白的域包含衍生自SEQ ID NO:3的序列。

在一些实施例中，CasX变异蛋白包含至少一个嵌合域，其包含来自第一CasX蛋白的第一部分及来自不同的第二CasX蛋白的第二部分。如本文所用，“嵌合域”是指含有至少两个分离或衍生自不同来源，例如两种天然存在的蛋白质的部分的单个域，或来自两种参考CasX蛋白的域部分。至少一个嵌合域可为如本文所述的NTSB、TSL、螺旋形I、螺旋形II、OBD或RuvC域中的任一者。在一些实施例中，CasX域的第一部分包含SEQ ID NO:1的序列，且CasX域的第二部分包含SEQ ID NO:2的序列。在一些实施例中，CasX域的第一部分包含SEQID NO:1的序列，且CasX域的第二部分包含SEQ ID NO:3的序列。在一些实施例中，CasX域的第一部分包含SEQ ID NO:2的序列，且CasX域的第二部分包含SEQ ID NO:3的序列。在一些实施例中，至少一个嵌合域包含嵌合RuvC域。作为前述的实例，嵌合RuvC域包含SEQ ID NO:1的氨基酸661至824及SEQ ID NO:2的氨基酸922至978。作为前述的替代实例，嵌合RuvC域包含SEQ ID NO:2的氨基酸648至812及SEQ ID NO:1的氨基酸935至986。在一些实施例中，CasX蛋白包含来自第一CasX蛋白的第一域及来自第二CasX蛋白的第二域，及至少一个嵌合域，其包含使用此段中所述的实施例的方法自不同CasX蛋白分离的至少两个部分。

在一些实施例中，CasX变异蛋白包含如表3中所列的SEQ ID NO:49-160的序列。在一些实施例中，CasX变异蛋白由如表3中所列的SEQ ID NO:49-160的序列组成。在其他实施例中，CasX变异蛋白包含与表3中所列的序列具有至少60％同一性、至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少81％同一性、至少82％同一性、至少83％同一性、至少84％同一性、至少85％同一性、至少86％同一性、至少86％同一性、至少87％同一性、至少88％同一性、至少89％同一性、至少89％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性、至少99.5％同一性的序列。

表3：CasX变异序列

(*如果在左列中指示了数字，它表示不同于分配给它的SEQ ID NO的CasX变异体识别号；在指示的地方，是相对于SEQ ID NO:2)

在一些实施例中，CasX变异蛋白包含选自由SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488和490组成的组的序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、或至少约95％、或至少约95％、或至少约96％、或至少约97％、或至少约98％、或至少约99％序列同一性的序列。在一些实施例中，CasX变异蛋白包含选自由SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488和490组成的组的序列。在一些实施例中，CasX变异蛋白包含选自由SEQ ID NO:49-160组成的组的序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、或至少约95％、或至少约95％、或至少约96％、或至少约97％、或至少约98％、或至少约99％序列同一性的序列。在一些实施例中，CasX变异蛋白包含选自由SEQ ID NO:49-160组成的组的序列。

在一些实施例中，当相比于参考CasX蛋白，例如SEQ ID NO:1、SEQ ID NO:2或SEQID NO:3的参考蛋白时，CasX变异蛋白具有CasX蛋白的一或多种改进特征。在一些实施例中，CasX变异体的至少一种改进特征是相对于参考蛋白改进至少约1.1至约100,000倍。在一些实施例中，CasX变异体的至少一种改进特征是相比于参考CasX蛋白改进至少约1.1至约10,000倍、改进至少约1.1至约1,000倍、改进至少约1.1至约500倍、改进至少约1.1至约400倍、改进至少约1.1至约300倍、改进至少约1.1至约200倍、改进至少约1.1至约100倍、改进至少约1.1至约50倍、改进至少约1.1至约40倍、改进至少约1.1至约30倍、改进至少约1.1至约20倍、改进至少约1.1至约10倍、改进至少约1.1至约9倍、改进至少约1.1至约8倍、改进至少约1.1至约7倍、改进至少约1.1至约6倍、改进至少约1.1至约5倍、改进至少约1.1至约4倍、改进至少约1.1至约3倍、改进至少约1.1至约2倍、改进至少约1.1至约1.5倍、改进至少约1.5至约3倍、改进至少约1.5至约4倍、改进至少约1.5至约5倍、改进至少约1.5至约10倍、改进至少约5至约10倍、改进至少约10至约20倍、改进至少10至约30倍、改进至少10至约50倍或改进至少10至约100倍。在一些实施例中，CasX变异体的至少一种改进特征是相对于参考CasX蛋白改进至少约10至约1000倍。

在一些实施例中，CasX变异蛋白的至少一种改进特征是相对于参考CasX蛋白改进至少约5、至少约10、至少约20、至少约30、至少约40、至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约250、至少约500、至少约1000、至少约5,000或至少约10,000倍。在一些实施例中，CasX变异蛋白相对于参考CasX蛋白改进至少约1.1、至少约1.2、至少约1.3、至少约1.4、至少约1.5、至少约1.6、至少约1.7、至少约1.8、至少约1.9、至少约2、至少约2.1、至少约2.2、至少约2.3、至少约2.4、至少约2.5、至少约2.6、至少约2.7、至少约2.8、至少约2.9、至少约3、至少约3.5、至少约4、至少约4.5、至少约5、至少约5.5、至少约6、至少约6.5、至少约7.0、至少约7.5、至少约8、至少约8.5、至少约9、至少约9.5、至少约10、至少约11、至少约12、至少约13、至少约14、至少约15、至少约20、至少约30、至少约40、至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约500、至少约1,000或至少约10,000倍。相对于参考CasX蛋白中的相同特征，CasX变异蛋白中可改进的示例性特征包括但不限于改进的变异体折叠、对gNA的改进结合亲和力、对靶DNA的改进结合亲和力、对一个或多个PAM序列的改变结合亲和力、改进的靶DNA解旋、增加的活性、改进的编辑效率、改进的编辑特异性、增加的核酸酶活性、增加的用于双链裂解的靶链负载、减少的用于单链切割的靶链负载、减少的脱靶裂解、改进的DNA非靶链的结合、改进的靶核酸序列裂解速率、改进的蛋白质稳定性、改进的蛋白质:gNA复合物稳定性、改进的蛋白质溶解度、改进的核糖核蛋白复合物(RNP)形成、更高百分比的裂解感受态RNP、改进的蛋白质:gNA复合物(RNP)溶解度、改进的蛋白质产率、改进的蛋白质表达及改进的融合特征。在一些实施例中，变异体包含至少一种改进特征。在其他实施例中，变异体包含至少两种改进特征。在其他实施例中，变异体包含至少三种改进特征。在一些实施例中，变异体包含至少四种改进特征。在其他实施例中，变异体包含至少五种、至少六种、至少七种、至少八种、至少九种、至少十种、至少十一种、至少十二种、至少十三种或更多种改进特征。这些改进特征更详细描述于下文中。

j.蛋白质稳定性

在一些实施例中，本公开提供相对于参考CasX蛋白具有经改进稳定性的CasX变异蛋白。在一些实施例中，CasX变异蛋白的经改进稳定性引起较高稳态蛋白质的表达，其提高编辑效率。在一些实施例中，CasX变异蛋白的经改进稳定性使得较大分率的CasX蛋白以功能性构象保持折叠，且提高编辑效率或改进纯化能力以用于制造目的。如本文所用，“功能性构象”是指构象为其中蛋白质能够结合gNA及靶DNA的CasX蛋白。在其中CasX变异体不携有一个或多个使其催化死亡的突变的实施例中，CasX变异体能够裂解、切割或以其他方式修饰靶DNA。举例来说，在一些实施例中，功能性CasX变异体可用于基因编辑，且功能性构象是指“编辑感受态”构象。在一些示例性实施例，包括其中CasX变异蛋白产生较大分率的以功能性构象保持折叠的CasX蛋白的那些实施例中，相比于参考CasX蛋白，例如基因编辑的应用需要较低浓度的CasX变异体。因此，在一些实施例中，相比于参考CasX，具有经改进稳定性的CasX变异体在一种或多种基因编辑背景下具有经改进效率。

在一些实施例中，本公开提供相对于参考CasX蛋白具有经改进热稳定性的CasX变异蛋白。在一些实施例中，CasX变异蛋白在特定温度范围内具有改进的CasX变异蛋白热稳定性。不希望受任何理论束缚，一些参考CasX蛋白天然地在生态栖位处于地下水及沉积物中的生物体中起作用；因此，一些参考CasX蛋白可能已进化为在比某些应用可能需要的温度更低或更高的温度下展现最优选功能。举例来说，CasX变异蛋白的一种应用为哺乳动物细胞的基因编辑，其通常在约37℃下进行。在一些实施例中，相比于参考CasX蛋白，如本文所述的CasX变异蛋白在至少16℃、至少18℃、至少20℃、至少22℃、至少24℃、至少26℃、至少28℃、至少30℃、至少32℃、至少34℃、至少35℃、至少36℃、至少37℃、至少38℃、至少39℃、至少40℃、至少41℃、至少42℃、至少44℃、至少46℃、至少48℃、至少50℃、至少52℃或更高温度下具有改进的热稳定性。在一些实施例中，相比于参考CasX蛋白，CasX变异蛋白具有改进的热稳定性及功能，产生改进的基因编辑功能，例如哺乳动物基因编辑应用，其可包括人类基因编辑应用。

在一些实施例中，本公开提供了相对于参考CasX蛋白:gNA复合物具有改进的CasX变异蛋白:gNA复合物稳定性的CasX变异蛋白，使得RNP保持于功能形式。稳定性改进可包括增加的热稳定性；蛋白水解降解抗性；增强的药物动力学特性；跨越一系列pH条件、盐条件及张力的稳定性。在一些实施例中，复合物改进的稳定性使得编辑效率提高。

在一些实施例中，本公开提供相对于参考CasX蛋白:gNA复合物具有改进的CasX变异蛋白:gNA复合物热稳定性的CasX变异蛋白。在一些实施例中，CasX变异蛋白相对于参考CasX蛋白具有改进的热稳定性。在一些实施例中，CasX变异蛋白:gNA复合物在至少16℃、至少18℃、至少20℃、至少22℃、至少24℃、至少26℃、至少28℃、至少30℃、至少32℃、至少34℃、至少35℃、至少36℃、至少37℃、至少38℃、至少39℃、至少40℃、至少41℃、至少42℃、至少44℃、至少46℃、至少48℃、至少50℃、至少52℃或更高的温度下相对于包含参考CasX蛋白的复合物具有改进的热稳定性。在一些实施例中，与参考CasX蛋白:gNA复合物相比，CasX变异蛋白具有改进的CasX变异蛋白:gNA复合物热稳定性，其使得针对基因编辑应用，如哺乳动物基因编辑应用(其可包括人类基因编辑应用)的功能改进。

在一些实施例中，CasX变异蛋白改进的稳定性及/或热稳定性包含CasX变异蛋白相对于参考CasX蛋白更快的折叠动力学、CasX变异蛋白相对于参考CasX蛋白更慢的去折叠动力学、CasX变异蛋白相对于参考CasX蛋白在折叠时更大的自由能释放、相对于参考CasX蛋白更高的50％的CasX变异蛋白未折叠的温度(Tm)或其任何组合。这些特征可改进大范围的值；例如相比于参考CasX蛋白改进至少1.1、至少1.5、至少10、至少50、至少100、至少500、至少1,000、至少5,000或至少10,000倍。在一些实施例中，CasX变异蛋白改进的热稳定性包含CasX变异蛋白相对于参考CasX蛋白更高的Tm。在一些实施例中，CasX变异蛋白的Tm为约20℃至约30℃、约30℃至约40℃、约40℃至约50℃、约50℃至约60℃、约60℃至约70℃、约70℃至约80℃、约80℃至约90℃或约90℃至约100℃。热稳定性通过测量“熔融温度”(Tm)来测定，熔融温度定义为一半分子变性的温度。测量蛋白质稳定性的特征，例如Tm及去折叠自由能的方法为本领域普通技术人员所知，且可使用标准生物化学技术在体外测量。举例来说，Tm可使用差示扫描热测量定来测量，差示扫描热测量定为一种热分析技术，其中测量增加样品及参考的温度所需的热量差作为温度的函数(Chen等人(2003)Pharm Res 20:1952-60；Ghirlando等人(1999)Immunol Lett 68:47-52)。或者或另外，CasX变异蛋白Tm可使用市售方法，例如ThermoFisher Protein Thermal Shift system系统来测量。或者或另外，圆二色性可用于测量折叠及去折叠的动力学，以及Tm(Murray等人(2002)J.ChromatogrSci 40:343-9)。圆二色性(CD)依赖于左手侧及右手侧圆偏振光被例如蛋白质的不对称分子不等地吸收。蛋白质的某些结构，例如α螺旋及β折叠具有特征性CD光谱。因此，在一些实施例中，CD可用于确定CasX变异蛋白的二级结构。

在一些实施例中，CasX变异蛋白改进的稳定性及/或热稳定性包含CasX变异蛋白相对于参考CasX蛋白改进的折叠动力学。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白的折叠动力学改进至少约5倍、至少约10倍、至少约50倍、至少约100倍、至少约500倍、至少约1,000倍、至少约2,000倍、至少约3,000倍、至少约4,000倍、至少约5,000倍或至少约10,000倍改进。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白的折叠动力学改进至少约1kJ/mol、至少约5kJ/mol、至少约10kJ/mol、至少约20kJ/mol、至少约30kJ/mol、至少约40kJ/mol、至少约50kJ/mol、至少约60kJ/mol、至少约70kJ/mol、至少约80kJ/mol、至少约90kJ/mol、至少约100kJ/mol、至少约150kJ/mol、至少约200kJ/mol、至少约250kJ/mol、至少约300kJ/mol、至少约350kJ/mol、至少约400kJ/mol、至少约450kJ/mol或至少约500kJ/mol。

相对于参考CasX蛋白，可增加CasX变异蛋白的稳定性的示例性氨基酸变化可包括但不限于以下氨基酸变化：增加CasX变异蛋白内的氢键数目、增加CasX变异蛋白内的二硫桥键数目、增加CasX变异蛋白内的盐桥数目、增强CasX变异蛋白的部分之间的相互作用、增加CasX变异蛋白的埋入疏水表面积或其任何组合。

k.蛋白质产率

在一些实施例中，本公开提供相对于参考CasX蛋白，在表达及纯化期间具有改进产率的CasX变异蛋白。在一些实施例中，相对于参考CasX蛋白，自细菌或真核宿主细胞纯化的CasX变异蛋白的产率经改进。在一些实施例中，细菌宿主细胞为大肠杆菌细胞。在一些实施例中，真核细胞是酵母、植物(例如烟草)、昆虫(例如草地贪夜蛾(Spodopterafrugiperda)sf9细胞)、小鼠、大鼠、仓鼠、天竺鼠、猴子或人类细胞。在一些实施例中，真核宿主细胞是哺乳动物细胞，包括但不限于HEK293细胞、BHK细胞、NS0细胞、SP2/0细胞、YO骨髓瘤细胞、P3X63小鼠骨髓瘤细胞、PER细胞、PER.C6细胞、杂交瘤细胞、NIH3T3细胞、COS、HeLa或CHO细胞。

在一些实施例中，CasX变异蛋白的改进产率经由密码子优化达成。细胞使用64种不同的密码子，其中的61种编码20种标准氨基酸，而另外3种充当终止密码子。在一些情况下，单一氨基酸由超过一个密码子编码。对于相同的天然存在的氨基酸，不同生物体展现朝向使用不同密码子的偏移。因此，蛋白编码序列中密码子的选择，及将密码子选择与蛋白质将表达的生物体匹配可在一些情况下显著影响蛋白质翻译且因此影响蛋白质表达量。在一些实施例中，CasX变异蛋白由已经密码子优化的核酸编码。在一些实施例中，编码CasX变异蛋白的核酸已经密码子优化以表达于细菌细胞、酵母细胞、昆虫细胞、植物细胞或哺乳动物细胞中。在一些实施例中，哺乳动物细胞为小鼠、大鼠、仓鼠、天竺鼠、猴或人类。在一些实施例中，CasX变异蛋白由已经密码子优化以表达于人类细胞中的核酸编码。在一些实施例中，CasX变异蛋白由已去除降低原核生物及真核生物中的翻译速率的核苷酸序列的核酸编码。举例来说，大于三个胸腺嘧啶残基成一列的运行可降低某些生物体中的翻译速率，或内部聚腺苷酸化信号可减少翻译。

在一些实施例中，如本文所述的溶解度及稳定性的改进使得CasX变异蛋白的产率相对于参考CasX蛋白改进。

可通过本领域中已知的方法评估表达及纯化期间改进的蛋白质产率。例如，可如下地测定CasX变异蛋白的量：通过在SDS-page凝胶上运行蛋白质，且将CasX变异蛋白与事先已知其量或浓度的对照进行比较，以确定蛋白质的绝对含量。或者或另外，纯化CasX变异蛋白可在SDS-page凝胶上紧邻经历相同纯化过程的参考CasX蛋白运行，以确定CasX变异蛋白产率的相对改进。或者或另外，蛋白质含量可使用免疫组织化学方法，例如通过针对CasX的抗体的蛋白质印迹或ELISA，或通过HPLC来测量。对于溶液中的蛋白质，可通过测量蛋白质的内在UV吸光度，或通过使用蛋白质依赖性颜色变化的方法，例如劳立分析(Lowryassay)、史密斯铜/双金鸡纳酸分析(Smith copper/bicinchoninic assay)或布拉福染料分析(Bradford dye assay)来确定浓度。此类方法可用于计算在某些条件下通过表达获得的总蛋白质(如总可溶性蛋白质)产率。举例来说，此可与参考CasX蛋白在类似表达条件下的蛋白质产率比较。

l.蛋白质溶解度

在一些实施例中，CasX变异蛋白相对于参考CasX蛋白具有改进的溶解度。在一些实施例中，相对于包含参考CasX蛋白的核糖核蛋白复合物，CasX变异蛋白具有改进的CasX:gNA核糖核蛋白复合物变异体溶解度。

在一些实施例中，蛋白质溶解度的改进使得自蛋白质纯化技术，例如自大肠杆菌纯化的蛋白质产率较高。在一些实施例中，CasX变异蛋白改进的溶解度可使得细胞中的活性能够更高效，因为更可溶的蛋白质不大可能在细胞中聚集。蛋白质聚集体可在某些实施例中对细胞为毒性或繁重的，且不希望受任何理论束缚，增加CasX变异蛋白的溶解度可改善此蛋白质聚集结果。另外，CasX变异蛋白改进的溶解度可允许增强的调配物，准许递送更高有效剂量的功能蛋白，例如在所需基因编辑应用中。在一些实施例中，CasX变异蛋白相对于参考CasX蛋白改进的溶解度使得CasX变异蛋白在纯化期间的产率改进，产率大至少约5倍、至少约10倍、至少约20倍、至少约30倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍、至少约100倍、至少约250倍、至少约500倍或至少约1000倍。在一些实施例中，CasX变异蛋白相对于参考CasX蛋白改进的溶解度将CasX变异蛋白在细胞中的活性改进了至少约1.1倍、至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约2.1倍、至少约2.2倍、至少约2.3倍、至少约2.4倍、至少约2.5倍、至少约2.6倍、至少约2.7倍、至少约2.8倍、至少约2.9倍、至少约3倍、至少约3.5倍、至少约4倍、至少约4.5倍、至少约5倍、至少约5.5倍、至少约6倍、至少约6.5倍、至少约7.0倍、至少约7.5倍、至少约8倍、至少约8.5倍、至少约9倍、至少约9.5倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍或至少约15倍的更大活性。

测量CasX蛋白质溶解度及其于CasX变异蛋白中的改进的方法将为本领域普通技术人员显而易见。举例来说，在一些实施例中，可通过在裂解大肠杆菌的可溶部分的凝胶上获取密度测定法读数来测量CasX变异蛋白溶解度。替代地或另外，可通过测量可溶性蛋白质产物在整个蛋白质纯化过程中的维持情况来测量CasX变异蛋白溶解度的改进。举例来说，可溶性蛋白质产物可在凝胶亲和纯化、标签裂解、阳离子交换纯化、于尺寸排阻色谱(SEC)柱上运行蛋白质的一个或多个步骤处测量。在一些实施例中，在纯化过程的各步骤之后读取凝胶上的每一蛋白质带的密度测定值。在一些实施例中，当相比于参考CasX蛋白时，具有改进溶解度的CasX变异蛋白可在蛋白质纯化过程的一个或多个步骤处维持较高浓度，同时不溶性蛋白质变异体可由于缓冲液交换、过滤步骤、与纯化柱的相互作用等而在一个或多个步骤处损失。

在一些实施例中，当相比于参考CasX蛋白时，改进CasX变异蛋白的溶解度产生就蛋白质纯化期间蛋白质的mg/L而言较高的产率。

在一些实施例中，当在编辑分析，例如本文所述的EGFP破坏分析中评估时，改进CasX变异蛋白的溶解度使得相比于较不可溶的蛋白质，编辑事件的量能够更大。

m.对gNA的蛋白质亲和力

在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白对gNA的亲和力改进，使得形成核糖核蛋白复合物。CasX变异蛋白对gNA增加的亲和力可例如针对RNP复合物生成产生更低Kd，其可在一些情况下使得核糖核蛋白复合物形成更稳定。在一些实施例中，相对于参考CasX蛋白，CasX变异蛋白针对gNA的Kd增加至少约1.1倍、至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。在一些实施例中，相比于SEQ ID NO:2的参考CasX蛋白，CasX变异体对gNA的结合亲和力增加约1.1至约10倍。

在一些实施例中，CasX变异蛋白对gNA增加的亲和力使得当递送至哺乳动物细胞，包括体内递送至受试者时，核糖核蛋白复合物的稳定性增加。此增加的稳定性可影响复合物于受试者细胞中的功能及效用，以及使得当递送至受试者时改进血液中的药物动力学特性。在一些实施例中，CasX变异蛋白增加的亲和力，及核糖核蛋白复合物增加的所得稳定性允许向受试者或细胞递送较低剂量的CasX变异蛋白，同时仍具有所需活性；例如体内或体外基因编辑。可使用分析，例如本文实例所述的体外裂解分析来评估增强的形成RNP及将其保持于稳定形式的能力。在一些实施例中，当与包含SEQ ID NOS:1-3的参考CasX的RNP相比，包含本公开的CasX变异体的RNP在复合为RNP时能够实现至少高2倍、至少高5倍或至少高10倍的K_裂解速率。

在一些实施例中，当CasX变异蛋白及gNA均保持于RNP复合物中时，CasX变异蛋白对gNA的较高亲和力(更紧密结合)允许编辑事件的量更大。可使用编辑分析，如本文所述的EGFP破坏分析来评估增加的编辑事件。

在不希望受理论约束的情况下，在一些实施例中，螺旋形I域中的氨基酸变化可增加CasX变异蛋白与gNA靶向序列的结合亲和力，而螺旋形II域中的变化可增加CasX变异蛋白与gNA支架茎环的结合亲和力，且寡核苷酸结合域(OBD)中的变化增加CasX变异蛋白与gRNA三螺旋体的结合亲和力。

测量CasX蛋白对CasX gNA的结合亲和力的方法包括使用纯化的CasX蛋白及gNA的体外方法。如果gNA或CasX蛋白用荧光团标记，那么可通过荧光偏振测量对参考CasX及变异蛋白的结合亲和力。或者或另外，可通过生物层干涉测量术、电泳迁移率变动分析(EMSA)或过滤结合来测量结合亲和力。定量RNA结合蛋白，例如本公开的参考CasX及变异蛋白对特定gNA，例如参考gNA及其变异体的绝对亲和力的额外标准技术包括但不限于等温量热法(ITC)及表面等离子体子共振(SPR)，以及实例的方法。

n.对靶核酸的亲和力

在一些实施例中，相对于参考CasX蛋白对靶核酸的亲和力，CasX变异蛋白对靶核酸的结合亲和力改进。在一些实施例中，相比于对靶核酸不具有增加的亲和力的参考CasX蛋白，对其靶核酸具有较高亲和力的CasX变异体可更快速地裂解靶核酸序列。

在一些实施例中，对靶核酸改进的亲和力包含对靶核酸的靶序列或前间隔子序列改进的亲和力、对PAM序列改进的亲和力、改进的搜索用于靶序列的DNA的能力或其任何组合。不希望受理论束缚，认为CRISPR/Cas系统蛋白质，例如CasX可通过沿DNA分子的一维扩散发现其靶序列。认为该方法(1)包括核糖核蛋白与DNA分子结合，接着为(2)在靶序列处停顿，在一些实施例中，其中的任一者可受CasX蛋白对靶核酸序列改进的亲和力影响，由此相比于参考CasX蛋白改进CasX变异蛋白的功能。

在一些实施例中，具有改进的靶核酸亲和力的CasX变异蛋白具有增加的对DNA的总体亲和力。在一些实施例中，具有改进的靶核酸亲和力的CasX变异蛋白具有增加的对特定PAM序列的亲和力或利用所述特定PAM序列的能力，所述特定PAM序列不为由SEQ ID NO:2的参考CasX蛋白识别的典型TTCPAM，包括选自由TTC、ATC、GTC及CTC组成的组的PAM序列，由此相比于野生型CasX核酸酶增加可编辑的靶DNA的量。不希望受理论束缚，可能的是由于利用超出野生型参考CasX的那些序列的额外PAM序列的能力，这些蛋白质变异体可总体上更强有力地与DNA相互作用，且可具有增强的接近及编辑靶DNA内的序列的能力，由此允许针对靶序列搜索CasX蛋白的更高效方法。在一些实施例中，对DNA的较高总体亲和力亦可增加CasX蛋白质可有效地起始及完成结合及解旋步骤的频率，由此促进靶链侵入及R环形成，且最终促进靶核酸序列裂解。

不希望受理论束缚，可能的是增加非靶DNA链的解旋或呈解旋状态的非靶DNA链的捕捉效率的NTSBD中的氨基酸变化可增加CasX变异蛋白对靶DNA的亲和力。或者或另外，增加NTSBD在解旋期间稳定DNA的能力的NTSBD中的氨基酸变化可增加CasX变异蛋白对靶DNA的亲和力。或者或另外，OBD中的氨基酸变化可增加CasX变异蛋白结合至前间隔子邻近基序(PAM)的亲和力，由此增加CasX变异蛋白对靶核酸序列的亲和力。替代地或另外，螺旋形I和/或II、RuvC及TSL域中增加CasX变异蛋白对靶核酸链的亲和力的氨基酸变化可增加CasX变异蛋白对靶核酸序列的亲和力。

在一些实施例中，与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的参考蛋白相比，CasX变异蛋白对靶核酸序列的结合亲和力增加。在一些实施例中，相对于SEQ ID NO:1、SEQID NO:2或SEQ ID NO:3的参考CasX蛋白，本公开的CasX变异蛋白对靶核酸分子的亲和力增加至少约1.1倍、至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。

在一些实施例中，CasX变异蛋白对靶核酸的非靶链的结合亲和力改进。如本文所用，术语“非靶链”是指不与gNA中的靶向序列形成沃森及克里克(Watson and Crick)碱基对，且与靶DNA链互补的DNA靶核酸序列的链。在一些实施例中，相比于SEQ ID NO:1、SEQ IDNO:2或SEQ ID NO:3的参考蛋白，CasX变异蛋白对靶核酸的非靶链的结合亲和力增加约1.1至约100倍。

测量CasX蛋白(如参考或变异体)对靶核酸分子的亲和力的方法可包括电泳迁移率变动分析(EMSA)、过滤结合、等温量热法(ITC)及表面等离子体子共振(SPR)、荧光偏振及生物层干涉测量法(BLI)。测量CasX蛋白对靶标的亲和力的其他方法包括测量随时间推移的DNA裂解事件的体外生物化学分析。

o.对靶位点改进的特异性

在一些实施例中，相对于SEQ ID NO:1-3的参考CasX蛋白，CasX变异蛋白对靶核酸序列具有改进的特异性。如本文所用，“特异性”(可互换地称为“靶特异性”)是指CRISPR/Cas系统核糖核蛋白复合物裂解与靶核酸序列类似，但不相同的脱靶序列的程度；例如，相对于参考CasX蛋白，具有较高特异性程度的CasX变异体RNP将展现减少的序列脱靶裂解。CRISPR/Cas系统蛋白质的特异性及潜在有害的脱靶效应的减少可为极其重要的，以便达成用于哺乳动物受试者的可接受治疗指数。

在一些实施例中，相对于SEQ ID NO:1-3的参考CasX蛋白，CasX变异蛋白对与gNA的靶向序列互补的靶序列内的靶位点具有改进的特异性。不希望受理论束缚，可能的是螺旋形I及II域中增加CasX变异蛋白对靶核酸链的特异性的氨基酸变化可增加CasX变异蛋白对靶核酸的总体特异性。在一些实施例中，增加CasX变异蛋白对靶核酸的特异性的氨基酸变化亦可使得CasX变异蛋白对DNA的亲和力降低。

测试CasX蛋白(例如变异体或参考)靶特异性的方法可包括引导及环化以通过测序体外报道裂解效应(CIRCLE-seq)，或类似方法。简言之，在CIRCLE-seq技术中，基因组DNA经剪切且通过连接茎-环衔接子而环化，所述衔接子在茎-环区中带切口以暴露4个核苷酸的回文突出端。此后为其余线性DNA的分子内连接及降解。含有CasX裂解位点的环状DNA分子随后经CasX线性化，且衔接子连接至暴露末端，接着进行高通量测序以产生含有关于脱靶位点的信息的配对末端读段。可用于检测脱靶事件，且因此检测CasX蛋白质特异性的额外分析包括用于检测及定量那些所选脱靶位点处形成的插入缺失(插入及缺失)的分析，例如失配检测核酸酶分析及下一代测序(NGS)。示例性失配检测分析包括核酸酶分析，其中来自用CasX及sgNA处理的细胞的基因组DNA经PCR扩增、变性及再杂交以形成杂双螺旋DNA，其含有一条野生型链及一条具有插入缺失的链。失配经失配检测核酸酶，例如Surveyor核酸酶或T7核酸内切酶I识别及裂解。

p.前间隔子及PAM序列

本文中，前间隔子定义为与引导RNA的靶向序列互补的DNA序列及与该序列互补的DNA，它们分别称为靶链及非靶链。如本文所用，PAM为5’端的位置接近前间隔子的核苷酸序列，其与gNA的靶向序列结合帮助CasX定向及定位以潜在地裂解前间隔子链。

PAM序列可简并，且特定RNP构建体可具有支持不同裂解效率的不同优选及容许的PAM序列。除非另外说明，否则遵循惯例，本公开是指PAM及前间隔子序列及其根据非靶链定向的方向性。这不意味着由非靶链，而不是靶链的PAM序列决定裂解或在机制上涉及靶识别。举例来说，当参考TTC PAM时，其可实际上为靶标裂解所需的互补GAA序列，或其可为来自两条链的核苷酸的某一组合。在本文公开的CasX蛋白的情况下，PAM位于前间隔子的5’，其中单个核苷酸将PAM与前间隔子的第一核苷酸分离。因此，在参考CasX的情况下，TTC PAM应被理解为意指遵循式5’-…NNTTCN(前间隔子)NNNNNN…3’(SEQ ID NO:218)的序列，其中‘N’为任何DNA核苷酸且‘(前间隔子)’为与引导RNA的靶向序列具有一致性的DNA序列。在具有扩展的PAM识别的CasX变异体的情况下，TTC、CTC、GTC或ATC PAM应被理解为意指遵循下式的序列：

5’-…NNTTCN(前间隔子)NNNNNN…3’(SEQ ID NO:218)；

5’-…NNCTCN(前间隔子)NNNNNN…3’(SEQ ID NO:219)；

5’-…NNGTCN(前间隔子)NNNNNN…3’(SEQ ID NO:220)；或

5’-…NNATCN(前间隔子)NNNNNN…3’(SEQ ID NO:221)。或者，TC PAM应被理解为意指遵循下式的序列：

5’-…NNNTCN(前间隔子)NNNNNN…3’(SEQ ID NO:222)。

在一些实施例中，相比于类似分析系统中包含参考CasX蛋白的RNP的编辑效率及/或结合，当PAM序列TTC、ATC、GTC或CTC中的任一者位于与细胞分析系统中的gNA的靶向序列具有一致性的前间隔子的非靶链5’的1个核苷酸处时，具有改进的PAM序列编辑的CasX变异体展现靶DNA中靶序列的较大编辑效率及/或结合。在一些实施例中，PAM序列为TTC。在一些实施例中，PAM序列为ATC。在一些实施例中，PAM序列为CTC。在一些实施例中，PAM序列为GTC。

q.DNA的解旋

在一些实施例中，CasX变异蛋白相对于参考CasX蛋白具有改进的解旋DNA的能力。先前已显示不佳dsDNA解旋会削弱或阻止CRISPR/Cas系统蛋白质AnaCas9或Cas14s裂解DNA的能力。因此，不希望受任何理论束缚，可能的是通过一些本公开的CasX变异蛋白增加的DNA裂解活性至少部分归因于增强的发现及解旋靶位点处的dsDNA的能力。测量CasX蛋白(例如变异体或参考)解旋DNA的能力的方法包括但不限于观测荧光偏振或生物层干涉测量术中dsDNA靶标增加的缔合速率的体外分析。

不希望受理论束缚，认为NTSB域中的氨基酸变化可产生具有增加的DNA解旋特征的CasX变异蛋白。或者或另外，与PAM相互作用的OBD或螺旋形域区中的氨基酸变化亦可产生具有增加的DNA解旋特征的CasX变异蛋白。

r.催化活性

本文公开的CasX:gNA系统的核糖核蛋白复合物包含结合靶核酸序列并裂解靶核酸序列的CasX变异蛋白。在一些实施例中，CasX变异蛋白相对于参考CasX蛋白具有改进的催化活性。不希望受理论束缚，认为在一些情况下，靶链裂解可为Cas12样分子产生dsDNA断裂中的限制因素。在一些实施例中，CasX变异蛋白改进DNA的靶链的弯曲及此链的裂解，使得通过CasX核糖核蛋白复合物裂解dsDNA的总效率改进。

在一些实施例中，CasX变异蛋白相比于参考CasX蛋白具有增加的核酸酶活性。具有增加的核酸酶活性的变异体可例如经由RuvC核酸酶域中的氨基酸变化来产生。在一些实施例中，CasX变异体包含具有切口酶活性的核酸酶域。在前述内容中，CasX:gNA系统的CasX切口酶在非靶链中PAM位点3’的10-18个核苷酸内产生单链断裂。在其他实施例中，CasX变异体包含具有双链裂解活性的核酸酶域。在前述内容中，CasX:gNA系统的CasX在靶链上的PAM位点5’的18-26个核苷酸和非靶链上3’的10-18个核苷酸内产生双链断裂。可通过多种方法，包括实例的那些方法分析核酸酶活性。在一些实施例中，CasX变异体的K裂解常数与参考CasX相比大至少2倍，或至少3倍，或至少4倍，或至少5倍，或至少6倍，或至少7倍，或至少8倍，或至少9倍，或至少10倍。

在一些实施例中，与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的参考CasX蛋白和gNA的RNP相比，CasX变异蛋白具有与gNA形成RNP的改进特征，产生更高百分比的裂解感受态RNP。所谓裂解感受态意指所形成的RNP具有裂解靶核酸的能力。在一些实施例中，与SEQID NO:1、SEQ ID NO:2或SEQ ID NO:3的参考CasX蛋白和gNA的RNP相比，CasX变异体和gNA的RNP表现出至少2倍、或至少3倍、或至少4倍、或至少5倍、或至少10倍的裂解速率。

在一些实施例中，与参考CasX相比，CasX变异蛋白具有增加的用于双链裂解的靶链负载。具有增加的靶链负载活性的变异体可例如经由TLS域中的氨基酸变化来产生。

不希望受理论束缚，TSL域中的氨基酸变化可产生具有改进的催化活性的CasX变异蛋白。或者或另外，RNA:DNA双螺旋的结合通道周围的氨基酸变化亦可改进CasX变异蛋白的催化活性。

在一些实施例中，CasX变异蛋白相比于参考CasX蛋白具有增加的附带裂解活性。如本文所用，“附带裂解活性”是指在识别及裂解靶核酸序列之后，核酸的额外非靶向裂解。在一些实施例中，CasX变异蛋白相比于参考CasX蛋白具有减少的附带裂解活性。

在一些实施例，例如涵盖其中靶核酸序列的裂解并非所需结果的应用的那些实施例中，改进CasX变异蛋白的催化活性包括改变、降低或消除CasX变异蛋白的催化活性。在一些实施例中，包含dCasX变异蛋白的核糖核蛋白复合物结合至靶核酸序列且不裂解靶核酸。

在一些实施例中，包含CasX变异蛋白的CasX核糖核蛋白复合物结合靶DNA，但在靶DNA中产生单链切口。在一些实施例，尤其是其中CasX蛋白为切口酶的那些实施例中，CasX变异蛋白具有减少的针对单链切口的靶链负载。具有减少的靶链负载的变异体可例如经由TSL域中的氨基酸变化来产生。

用于表征CasX蛋白的催化活性的示例性方法可包括但不限于体外裂解分析，包括以下实例的那些。在一些实施例中，DNA产物于琼脂糖凝胶上的电泳可查询链裂解的动力学。

s.对PCSK9靶RNA的亲和力

在一些实施例中，包含参考CasX蛋白或其变异体的核糖核蛋白复合物结合至靶PCSK9DNA且裂解靶核酸序列。在一些实施例中，当与参考CasX蛋白相比时，参考CasX蛋白的变异体增加CasX变异蛋白对靶PCSK9 RNA的特异性，且增加CasX变异蛋白相对于靶RNA的活性。举例来说，当相比于参考CasX蛋白时，CasX变异蛋白可显示增加的对靶RNA的结合亲和力，或增加的靶RNA裂解。在一些实施例中，包含CasX变异蛋白的核糖核蛋白复合物结合至靶RNA及/或裂解靶RNA。在一些实施例中，相比于SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的参考蛋白，CasX变异体对PCSK9靶RNA的结合亲和力增加至少约二倍至约10倍。

t.突变组合

本公开提供了Cas X变异体，其是来自单独CasX变异蛋白的突变的组合。在一些实施例中，本文描述的任何域的任何变异体可以与本文描述的其他变异体组合。在一些实施例中，本文描述的任何域内的任何变异体可以与本文描述的其他变异体在同一域中组合。在一些实施例中，不同氨基酸变化的组合可以产生新的优化变异体，其功能通过氨基酸变化的组合得到进一步改善。在一些实施例中，组合氨基酸变化对CasX蛋白功能的影响是线性的。如本文所用，线性组合是指当单独分析时其对功能的影响等于每个单独氨基酸变化的影响的总和的组合。在一些实施例中，组合氨基酸变化对CasX蛋白功能的影响是协同的。如本文所用，具有协同作用的变异体组合是指当单独分析时其对功能的影响大于每个单独氨基酸变化的影响的总和的组合。在一些实施例中，组合氨基酸变化产生CasX变异蛋白，其中CasX蛋白的一种以上功能相对于参考CasX蛋白得到改善。

u.CasX融合蛋白

在一些实施例中，本公开提供包含与CasX融合的异源蛋白的CasX蛋白。在其他情况下，CasX为本文所述的任一实施例的CasX变异体。

在一些实施例中，CasX变异蛋白包含SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490中的任一者，其与一种或多种具有不同所关注活性的蛋白或其域融合，产生融合蛋白。例如，在一些实施例中，CasX变异蛋白与抑制转录、修饰靶核酸序列或修饰与核酸相关的多肽(例如，组蛋白修饰)的蛋白质(或其域)融合。

在一些实施例中，异源多肽(或异源氨基酸，例如半胱氨酸残基或非天然氨基酸)可插入CasX蛋白内的一个或多个位置以产生CasX融合蛋白。在其他实施例中，半胱氨酸残基可插入CasX蛋白内的一个或多个位置，接着结合下文所述的异源多肽。在一些替代实施例中，异源多肽或异源氨基酸可在CasX变异蛋白的N端或C端处添加。在其他实施例中，异源多肽或异源氨基酸可插入CasX蛋白的序列内部。

在一些实施例中，CasX变异融合蛋白保留RNA引导序列特异性靶核酸结合及裂解活性。在一些情况下，CasX变异融合蛋白具有(保留)没有异源蛋白插入的对应参考CasX变异蛋白的50％或更大的活性(例如裂解及/或结合活性)。在一些情况下，CasX变异融合蛋白保留没有异源蛋白插入的对应CasX蛋白的至少约60％、或至少约70％或更大、至少约80％、或至少约90％、或至少约92％、或至少约95％、或至少约98％、或至少约100％的活性(例如，裂解和/或结合活性)。

在一些情况下，相对于没有插入的异源氨基酸或异源多肽的CasX蛋白的活性，CasX变异融合蛋白保留(具有)靶核酸结合活性。在一些情况下，CasX变异融合蛋白保留没有异源蛋白插入的对应CasX蛋白的至少约60％、或至少约70％或更大、至少约80％、或至少约90％、或至少约92％、或至少约95％、或至少约98％、或至少约100％的结合活性。

在一些情况下，相对于没有插入的异源氨基酸或异源多肽的亲本CasX蛋白的活性，CasX变异融合蛋白保留(具有)靶核酸结合和/或裂解活性。例如，在一些情况下，CasX变异融合蛋白具有(保留)对应亲本CasX蛋白(没有该插入的CasX蛋白)的50％或更大的结合和/或裂解活性。例如，在一些情况下，CasX变异融合蛋白具有(保留)对应亲本CasX蛋白(没有该插入的CasX蛋白)的60％或更大(70％或更大、80％或更大、90％或更大、92％或更大、95％或更大、98％或更大、或100％)的结合及/或裂解活性。测量CasX蛋白和/或CasX融合蛋白的裂解和/或结合活性的方法是本领域普通技术人员已知的并且可以使用任何方便的方法。

多种异源多肽适合包括于本公开的参考CasX或CasX变异融合蛋白中。在一些情况下，融合伴侣可调节靶DNA的转录(例如抑制转录、增加转录)。举例来说，在一些情况下，融合伴侣为抑制转录的蛋白质(或来自蛋白质的域)(例如转录阻遏物，一种经由募集转录抑制剂蛋白、修饰靶DNA(例如甲基化)、募集DNA修饰剂、调节与靶DNA相关的组蛋白、募集组蛋白修饰剂(例如修饰组蛋白的乙酰化及/或甲基化的那些)等起作用的蛋白质)。在一些情况下，融合伴侣为增加转录的蛋白质(或来自蛋白质的域)(例如转录活化因子，一种经由募集转录活化因子蛋白、修饰靶DNA(例如去甲基化)、募集DNA修饰剂、调节与靶DNA相关的组蛋白、募集组蛋白修饰剂(例如修饰组蛋白的乙酰化及/或甲基化的那些)等起作用的蛋白质)。

在一些情况下，融合伴侣具有修饰靶核酸序列的酶活性；例如，核酸酶活性、甲基转移酶活性、去甲基酶活性、DNA修复活性、DNA损伤活性、脱氨基活性、岐化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解螺旋酶活性、光裂合酶活性或糖基化酶活性。在一些实施例中，CasX变异体包含SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490中的任一者，及具有甲基转移酶活性、去甲基酶活性、乙酰转移酶活性、脱乙酰基酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、豆蔻酰化活性或去豆蔻酰化活性的多肽。

在一些实施例中，CasX变异体包含SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490的任一者，及具有修饰与靶核酸相关的多肽(例如，组蛋白)的酶活性(例如，甲基转移酶活性、去甲基酶活性、乙酰转移酶活性、脱乙酰基酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、豆蔻酰化活性或去豆蔻酰化活性)的融合伴侣。

可用作融合伴侣以增加转录的蛋白质(或其片段)的实例包括但不限于：转录激活因子，例如VP16、VP64、VP48、VP160、p65亚域(例如，来自NFkB)，以及EDLL的激活域和/或TAL激活域(例如，用于植物中的活性)；组蛋白赖氨酸甲基转移酶，例如SET1A、SET1B、MLL1至5、ASH1、SYMD2、NSD1等；组蛋白赖氨酸去甲基化酶，例如JHDM2a/b、UTX、JMJD3等；组蛋白乙酰转移酶，例如GCN5、PCAF、CBP、p300、TAF1、TIP60/PLIP、MOZ/MYST3、MORF/MYST4、SRC1、ACTR、P160、CLOCK等；和DNA去甲基化酶，例如十-十一易位(TET)双加氧酶1(TET1CD)、TET1、DME、DML1、DML2、ROS1等。

可用作融合伴侣以减少转录的蛋白质(或其片段)的实例包括但不限于：转录阻遏物，例如Kruppel相关盒(KRAB或SKD)；KOX1阻遏域；Mad mSIN3相互作用域(SID)；ERF阻遏域(ERD)、SRDX阻遏域(例如，用于植物中的阻遏)等；组蛋白赖氨酸甲基转移酶，例如Pr-SET7/8、SUV4-20H1、RIZ1等；组蛋白赖氨酸去甲基化酶，例如JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、JARID1A/RBP2、JARID1B/PLU-1、JARID 1C/SMCX、JARID1D/SMCY等；组蛋白赖氨酸脱乙酰酶，例如HDAC1、HDAC2、HDAC3、HDAC8、HDAC4、HDAC5、HDAC7、HDAC9、SIRT1、SIRT2、HDAC11等；DNA甲基化酶，例如HhaI DNA m5c-甲基转移酶(M.HhaI)、DNA甲基转移酶1(DNMT1)、DNA甲基转移酶3a(DNMT3a)、DNA甲基转移酶3b(DNMT3b)、METI、DRM3(植物)、ZMET2、CMT1、CMT2(植物)等；和外周募集元件，例如核纤层蛋白A、核纤层蛋白B等。

在一些情况下，CasX变异体的融合伴侣包含SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490中的任一者，其具有修饰靶核酸序列的酶活性(例如，ssRNA、dsRNA、ssDNA、dsDNA)。可由融合伴侣提供的酶活性的实例包括但不限于：核酸酶活性，例如由限制酶(例如，FokI核酸酶)提供；甲基转移酶活性，例如由甲基转移酶(例如，Hhal DNA m5c-甲基转移酶(M.Hhal)、DNA甲基转移酶1(DNMT1)、DNA甲基转移酶3a(DNMT3a)、DNA甲基转移酶3b(DNMT3b)、METI、DRM3(植物)、ZMET2、CMT1、CMT2(植物)等)提供；去甲基酶活性，例如由去甲基酶(例如，十-十一易位(TET)双加氧酶1(TET1CD)、TET1、DME、DML1、DML2、ROS1等)提供；DNA修复活性；DNA损伤活性；脱氨基活性，如由脱氨酶(例如，胞嘧啶脱氨酶，例如APOBEC蛋白，如大鼠APOBECl)提供；岐化酶活性；烷基化活性；脱嘌呤活性；氧化活性；嘧啶二聚体形成活性；整合酶活性，例如由整合酶和/或解离酶(例如，Gin转化酶，如Gin转化酶的高度活化突变体GinH106Y；人类免疫缺陷病毒1型整合酶(IN)；Tn3解离酶等)提供；转座酶活性；重组酶活性，例如由重组酶(例如，Gin重组酶的催化域)提供；聚合酶活性；连接酶活性；解螺旋酶活性；光裂合酶活性及糖基化酶活性)。

在一些情况下，本公开的CasX变异蛋白与选自以下的多肽融合：增加转录的域(例如，VP16域、VP64域)、减少转录的域(例如，KRAB域，例如来自Kox1蛋白)、组蛋白乙酰转移酶(例如，组蛋白乙酰转移酶p300)的核催化域、提供可检测信号的蛋白质/域(例如，荧光蛋白，如GFP)、核酸酶域(例如，Fokl核酸酶)或碱基编辑剂(例如，胞苷脱氨酶，如APOBEC1)。

在一些实施例中，CasX变异体包含SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490中的任一者，以及具有修饰与靶核酸(例如，ssRNA、dsRNA、ssDNA、dsDNA)相关的蛋白质(例如，组蛋白、RNA结合蛋白、DNA结合蛋白等)的酶活性的融合伴侣。可由融合伴侣提供的酶活性(修饰与靶核酸相关的蛋白质)的实例包括但不限于：甲基转移酶活性，例如由组蛋白甲基转移酶(HMT)(例如，杂色抑制子3-9同源物1(SUV39H1，亦称为KMT1A)、常染色质组蛋白赖氨酸甲基转移酶2(G9A，亦称为KMT1C和EHMT2)、SUV39H2、ESET/SETDB 1等、SET1A、SET1B、MLL1至5、ASH1、SYMD2、NSD1、DOT1L,Pr-SET7/8、SUV4-20H1、EZH2、RIZ1)提供；去甲基酶活性，例如由组蛋白去甲基酶(例如，赖氨酸去甲基酶1A(KDM1A，亦称为LSD1)、JHDM2a/b、JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、JARID1A/RBP2、JARID1B/PLU-1、JARID1C/SMCX、JARID1D/SMCY、UTX、JMJD3等)提供；乙酰转移酶活性，例如由组蛋白乙酰酶转移酶(例如，人类乙酰转移酶p300、GCN5、PCAF、CBP、TAF1、TIP60/PLIP、MOZ/MYST3、MORF/MYST4、HB01/MYST2、HMOF/MYST1、SRC1、ACTR、P160、CLOCK等的催化核/片段)提供；脱乙酰基酶活性，例如由组蛋白脱乙酰基酶(例如，HDAC1、HDAC2、HDAC3、HDAC8、HDAC4、HDAC5、HDAC7、HDAC9、SIRT1、SIRT2、HDAC11等)提供；激酶活性；磷酸酶活性；泛素连接酶活性；去泛素化活性；腺苷酸化活性；去腺苷酸化活性；SUMO化活性；去SUMO化活性；核糖基化活性；去核糖基化活性；豆蔻酰化活性；及去豆蔻酰化活性。

CasX变异体的合适融合伴侣的其他实例为(i)二氢叶酸还原酶(DHFR)不稳定域(例如，以生成化学可控的主题RNA引导多肽或条件活性RNA引导多肽)，以及(ii)叶绿体转运肽。

在一些实施例中，CasX变异体包含SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490中的任一者和叶绿体转运肽，该叶绿体转运肽包括但不限于：MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKCMQVWPPIGKKKFETLSYLPPLTRDSRA(SEQ ID NO:31)；MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKS(SEQ ID NO:304)；MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQVWPPIEKKKFETLSYLPDLTDSGGRVNC(SEQ ID NO:13863)；MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(SEQ ID NO:305)；MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(SEQ ID NO:306)；MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLFCSFRISASVATAC(SEQ ID NO:307)；MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPHRFDRRCLSMVV(SEQ ID NO:308)；MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAGGDATSLSVTTSARATPKQQRSVQRGSRRFPSVVVC(SEQ ID NO:309)；MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQNLDITSIASNGGRVQC(SEQ ID NO:310)；MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTSGVKCSAAVTPQASPVISRSAAAA(SEQ ID NO:13864)；以及MGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS(SEQ ID NO:311)。

在一些情况下，本公开的CasX变异蛋白可包括内体逃逸肽。在一些情况下，内体逃逸多肽包含氨基酸序列GLFXALLXLLXSLWXLLLXA(SEQ ID NO:312)，其中每个X独立地选自赖氨酸、组氨酸和精氨酸。在一些情况下，内体逃逸多肽包含氨基酸序列GLFHALLHLLHSLWHLLLHA(SEQ ID NO:313)或HHHHHHHHH(SEQ ID NO:314)。

当靶向ssRNA靶核酸序列时与CasX变异蛋白一起使用的融合伴侣的非限制性实例包括(但不限于)：剪接因子(例如，RS域)；蛋白质翻译组分(例如，翻译起始、伸长和/或释放因子；例如eIF4G)；RNA甲基化酶；RNA编辑酶(例如，RNA脱氨基酶，例如作用于RNA的腺苷脱氨酶(ADAR)，包括A至I和/或C至U编辑酶)；解螺旋酶；RNA结合蛋白等。应理解，异源多肽可包括整个蛋白质，或在一些情况下可包括蛋白质片段(例如功能域)。

在一些实施例中，CasX变异体包含SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490中的任一者，包含能够与ssRNA相互作用的任何域的融合伴侣(出于本公开的目的，其包括分子内和/或分子间二级结构，例如双链RNA双螺旋体，如发夹、茎环等)，无论是瞬时的还是不可逆的、直接的或间接的，包括但不限于选自由以下组成的组的效应子域：核酸内切酶(例如RNA酶III、来自蛋白质如SMG5和SMG6的CRR22 DYW域、Dicer和PIN(PilT N-末端)域)；负责刺激RNA裂解的蛋白和蛋白域(例如CPSF、CstF、CFIm和CFIIm)；核酸外切酶(例如XRN-1或核酸外切酶T)；脱腺苷化酶(例如HNT3)；负责无义介导的RNA衰减的蛋白和蛋白域(例如UPF1、UPF2、UPF3、UPF3b、RNP SI、Y14、DEK、REF2和SRm160)；负责稳定RNA的蛋白和蛋白域(例如PABP)；负责抑制翻译的蛋白和蛋白域(例如Ago2和Ago4)；负责刺激翻译的蛋白和蛋白域(例如Staufen)；负责(例如，能够)调节翻译的蛋白和蛋白域(例如，翻译因子，如起始因子、延伸因子、释放因子等，例如，eIF4G)；负责RNA聚腺苷酸化的蛋白和蛋白域(例如PAP1、GLD-2和Star-PAP)；负责RNA聚尿苷化的蛋白和蛋白域(例如CI Dl和末端尿苷酸转移酶)；负责RNA定位的蛋白和蛋白域(例如来自IMP1、ZBP1、She2p、She3p和Bicaudal-D)；负责RNA核保留的蛋白和蛋白域(例如Rrp6)；负责RNA核输出的蛋白和蛋白域(例如TAP、NXF1、THO、TREX、REF和Aly)；负责抑制RNA剪接的蛋白和蛋白域(例如PTB、Sam68和hnRNP Al)；负责刺激RNA剪接的蛋白和蛋白域(例如富含丝氨酸/精氨酸(SR)的域)；负责降低转录效率的蛋白和蛋白域(例如FUS(TLS))；以及负责刺激转录的蛋白和蛋白域(例如CDK7和HIV Tat)。或者，效应子域可选自包含以下各者的组：核酸内切酶；能够刺激RNA裂解的蛋白和蛋白域；核酸外切酶；脱腺苷化酶；具有无义介导的RNA衰减活性的蛋白和蛋白域；能够稳定RNA的蛋白和蛋白域；能够抑制翻译的蛋白和蛋白域；能够刺激翻译的蛋白和蛋白域；能够调节翻译的蛋白和蛋白域(例如翻译因子，例如起始因子、延伸因子、释放因子等，例如eIF4G)；能够对RNA进行聚腺苷酸化的蛋白和蛋白域；能够对RNA进行聚尿苷化的蛋白和蛋白域；具有RNA定位活性的蛋白和蛋白域；能够对RNA进行核保留的蛋白和蛋白域；具有RNA核导出活性的蛋白和蛋白域；能够抑制RNA剪接的蛋白和蛋白域；能够刺激RNA剪接的蛋白和蛋白域；能够降低转录效率的蛋白和蛋白域；以及能够刺激转录的蛋白和蛋白域。另一适合的异源多肽为PUF RNA结合域，其更详细地描述于以全文引用的方式并入本文中的WO2012068627中。

可用作(以整体或其片段形式)与CasX变异体的融合伴侣的一些RNA剪接因子具有模块化组织，其具有独立的序列特异性RNA结合模块及剪接效应子域。举例来说，富含丝氨酸/精氨酸(SR)的蛋白质家族的成员含有结合至前mRNA中的外显子剪接增强子(ESE)的N端RNA识别基序(RRM)及促进外显子包涵的C端RS域。作为另一实例，hnRNP蛋白hnRNP Al经由其RRM域结合至外显子剪接沉默子(ESS)，且经由C端富含甘氨酸的域抑制外显子包涵。一些剪接因子可通过结合至两个替代位点之间的调节序列而调节剪接位点的替代使用。例如，ASF/SF2可识别ESE且促进使用内含子近侧位点，而hnRNP AI可结合至ESS且使剪接转向使用内含子远侧位点。此类因子的一种应用为产生调节内源基因，尤其是疾病相关基因的替代性剪接的ESF。例如，Bcl-x前mRNA产生两种剪接异构体，具有两个可选的5'剪接位点，以编码功能相反的蛋白质。长剪接同工型Bcl-xL为强力细胞凋亡抑制剂，其表达于长寿命的有丝分裂后细胞中且在许多癌细胞中上调，保护细胞免受凋亡信号影响。短同工型Bcl-xS为促细胞凋亡同工型，且在具有高周转率的细胞(例如发育淋巴细胞)中以高表达量表达。通过位于核外显子区或外显子延伸区中(即，在两个选择性5'剪接位点之间)的多个cc元件调节两种Bcl-x剪接同工型的比率。关于更多实例，参见WO2010075303，其以全文引用的方式并入本文中。

与CasX变异体一起使用的其他合适的融合伴侣包括但不限于作为边界元件的蛋白质(或其片段)(例如，CTCF)、提供外周募集的蛋白质及其片段(例如，核纤层蛋白A、核纤层蛋白B等)和蛋白质对接元件(例如，FKBP/FRB，Pill/Abyl等)。

在一些情况下，与CasX变异体一起使用的异源多肽(融合伴侣)提供亚细胞定位，即异源多肽含有亚细胞定位序列(例如用于靶向至细胞核的核定位信号(NLS)；保持融合蛋白在细胞核之外的序列，例如核输出序列(NES)；保持融合蛋白滞留于细胞质中的序列；用于靶向至线粒体的线粒体定位信号；用于靶向至叶绿体的叶绿体定位信号；ER滞留信号等)。在一些实施例中，主题RNA引导多肽或条件活性RNA引导多肽和/或主题CasX融合蛋白不包括NLS，以使得蛋白质不靶向至细胞核(这可能是有利的，例如当靶核酸序列是存在于细胞溶质中的RNA时)。在一些实施例中，融合伴侣可提供标签(即，异源多肽为可检测标记)以易于跟踪及/或纯化(例如荧光蛋白，例如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)、青色荧光蛋白(CFP)、mCherry、tdTomato等；组氨酸标签，例如6×His标签；血凝素(HA)标签；FLAG标签；Myc标签等)。

在一些情况下，CasX变异蛋白包括(融合至)核定位信号(NLS)。在一些情况下，CasX变异蛋白融合至2个或更多个、3个或更多个、4个或更多个、或5个或更多个、6个或更多个、7个或更多个、8个或更多个NLS。在一些情况下，一个或多个NLS(2个或更多个、3个或更多个、4个或更多个、或5个或更多个NLS)位于N端及/或C端处或附近(例如在其50个氨基酸内)。在一些情况下，一个或多个NLS(2个或更多个、3个或更多个、4个或更多个、或5个或更多个NLS)位于CasX变异体的N端处或附近(例如在其50个氨基酸内)。在一些情况下，一个或多个NLS(2个或更多个、3个或更多个、4个或更多个、或5个或更多个NLS)位于CasX变异体的C端处或附近(例如在其50个氨基酸内)。在一些情况下，一个或多个NLS(3个或更多个、4个或更多个、或5个或更多个NLS)位于N端及C端处或附近(例如在其50个氨基酸内)。在一些情况下，一个NLS位于N端且一个NLS位于C端。在一些情况下，参考或CasX变异蛋白包括(融合至)1至10个NLS(例如1-9、1-8、1-7、1-6、1-5、2-10、2-9、2-8、2-7、2-6或2-5个NLS)。在一些情况下，参考或CasX变异蛋白包括(融合至)2至5个NLS(例如2-4或2-3个NLS)。

NLS的非限制性实例包括衍生自以下的序列：SV40病毒大T-抗原的NLS，具有氨基酸序列PKKKRKV(SEQ ID NO:217)；来自核质蛋白的NLS(例如，具有序列KRPAATKKAGQAKKKK(SEQ ID NO:223)的双分型核质蛋白NLS；具有氨基酸序列PAAKRVKLD(SEQ ID NO:224)或RQRRNELKRSP(SEQ ID NO:161)的c-myc NLS；hRNPAl M9 NLS，其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:162)；来自输入蛋白-α的IBB域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:163)；肌瘤T蛋白的序列VSRKRPRP(SEQID NO:164)及PPKKARED(SEQ ID NO:165)；人类p53的序列PQPKKKPL(SEQ ID NO:166)；小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:167)；流感病毒NS1的序列DRLRR(SEQ ID NO:168)及PKQKKRK(SEQ ID NO:169)；丁型肝炎病毒抗原的序列RKLKKKIKKL(SEQ ID NO:170)；小鼠Mxl蛋白的序列REKKKFLKRR(SEQ ID NO:171)；人类聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:172)；类固醇激素受体(人类)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:173)；博纳病(Borna disease)病毒P蛋白(BDV-P1)的序列PRPRKIPR(SEQ ID NO:174)；丙型肝炎病毒非结构蛋白(HCV-NS5A)的序列PPRKKRTVV(SEQID NO:175)；LEF1的序列NLSKKKKRKREK(SEQ ID NO:176)；ORF57 simirae的序列RRPSRPFRKP(SEQ ID NO:177)；EBV LANA的序列KRPRSPSS(SEQ ID NO:178)；甲型流感蛋白的序列KRGINDRNFWRGENERKTR(SEQ ID NO:179)；人类RNA解螺旋酶A(RHA)的序列PRPPKMARYDN(SEQ ID NO:180)；核仁RNA解螺旋酶II的序列KRSFSKAF(SEQ ID NO:181)；TUS-蛋白的序列KLKIKRPVK(SEQ ID NO:182)；与输入蛋白-α相关的序列PKKKRKVPPPPAAKRVKLD(SEQ ID NO:183)；来自HTLV-1中的Rex蛋白的序列PKTRRRPRRSQRKRPPT(SEQ ID NO:184)；来自秀丽隐杆线虫(Caenorhabditis elegans)的EGL-13蛋白的序列MSRRRKANPTKLSENAKKLAKEVEN(SEQ ID NO:185)；及序列KTRRRPRRSQRKRPPT(SEQ ID NO:186)、RRKKRRPRRKKRR(SEQ ID NO:187)、PKKKSRKPKKKSRK(SEQ ID NO:188)、HKKKHPDASVNFSEFSK(SEQ ID NO:189)、QRPGPYDRPQRPGPYDRP(SEQ IDNO:190)、LSPSLSPLLSPSLSPL(SEQ ID NO:191)、RGKGGKGLGKGGAKRHRK(SEQ ID NO:192)、PKRGRGRPKRGRGR(SEQ ID NO:193)、PKKKRKVPPPPAAKRVKLD(SEQ ID NO:183)及PKKKRKVPPPPKKKRKV(SEQ ID NO:194)。一般来说，NLS(或多个NLS)具有足以在真核细胞的细胞核中驱动参考或CasX变异融合蛋白的积聚的强度。可通过任何适合的技术进行细胞核中的积聚的检测。举例来说，可检测标记物可与参考或CasX变异融合蛋白融合，使得可观测到细胞内的位置。细胞核亦可自细胞分离，可接着通过任何适合于检测蛋白质的方法，例如免疫组织化学、蛋白质印迹或酶活性分析来分析其内容。亦可确定细胞核中的积聚。

在一些情况下，CasX变异融合蛋白包括“蛋白质转导域”或PTD(亦称为CPP-细胞穿透肽)，其是指促进穿越脂质双层、胶束、细胞膜、细胞器膜或囊泡膜的蛋白质、多核苷酸、碳水化合物或有机或无机化合物。连接至另一分子(其可在小极性分子至大型大分子及/或纳米粒子范围内)的PTD促进分子穿越膜，例如自细胞外空间进入细胞内空间，或自胞溶质进入细胞器内。在一些实施例中，PTD共价连接至CasX变异融合蛋白的氨基末端。在一些实施例中，PTD共价连接至CasX变异融合蛋白的羧基末端。在一些情况下，PTD在适合的插入位点处插入CasX变异融合蛋白的序列内部。在一些情况下，CasX变异融合蛋白包括(结合至、融合至)一个或多个PTD(例如两个或更多个、三个或更多个、四个或更多个PTD)。在一些情况下，PTD包括一个或多个核定位信号(NLS)。PTD的实例包括但不限于包含YGRKKRRQRRR(SEQID NO:195)、RKKRRQRR(SEQ ID NO:196)、YARAAARQARA(SEQ ID NO:197)、THRLPRRRRRR(SEQID NO:198)及GGRRARRRRRR(SEQ ID NO:199)的HIV TAT的肽转导域；包含足以引导进入细胞的多个精氨酸(例如，3、4、5、6、7、8、9、10或10至50个精氨酸(SEQ ID NO:200))的聚精氨酸序列；VP22域(Zender等人(2002)Cancer Gene Ther.9(6):489-96)；果蝇触角足蛋白转导域(Noguchi等人(2003)Diabetes 52(7):1732-1737)；截短人类降钙素肽(Trehin等人(2004)Pharm.Research21:1248-1256)；聚赖氨酸(Wender等人(2000)Proc.Natl.Acad.Sci.USA 97:13003-13008)；RRQRRTSKLMKR(SEQ ID NO:201)；Transportan GWTLNSAGYLLGKINLKALAALAKKIL(SEQ ID NO:202)；KALAWEAKLAKALAKALAKHLAKALAKALKCEA(SEQ ID NO:203)；及RQIKIWFQNRRMKWKK(SEQ ID NO:204)。在一些实施例中，PTD为可活化CPP(ACPP)(Aguilera等人(2009)Integr Biol(Camb)6月；1(5-6):371-381)。ACPP包含经由可裂解接头连接至匹配的聚阴离子(例如Glu9或“E9”)的聚阳离子CPP(例如Arg9或“R9”)，其将净电荷降至接近零且因此抑制黏附及吸收至细胞中。在接头裂解之后，聚阴离子释放，局部揭露聚精氨酸及其固有黏附性，因此“活化”ACPP以穿过膜。

在一些实施例中，CasX变异融合蛋白可包括经由接头多肽(例如一个或多个接头多肽)连接至内部插入的异源氨基酸或异源多肽(异源氨基酸序列)的CasX蛋白。在一些实施例中，CasX变异融合蛋白可经由接头多肽(例如一个或多个接头多肽)在C末端及/或N末端连接至异源多肽(融合伴侣)。接头多肽可具有多个氨基酸序列中的任一者。蛋白质可通过一般具有可挠性性质的间隔子肽连接，但不排除其他化学键。适合的接头包括长度为4个氨基酸至40个氨基酸，或长度为4个氨基酸至25个氨基酸的多肽。这些接头一般通过使用合成、编码接头的寡核苷酸产生以偶联蛋白质。可使用具有一定程度的可挠性的肽接头。连接肽可具有几乎任何氨基酸序列，应记住，优选接头将具有产生总体可挠性肽的序列。使用小氨基酸，例如甘氨酸及丙氨酸在产生可挠性肽中有用。产生此类序列对于本领域技术人员为常规的。多种不同接头为市售的且被视为适合使用。实例接头多肽包括甘氨酸聚合物(G)n、甘氨酸-丝氨酸聚合物(包括例如，(GS)n、GSGGSn(SEQ ID NO:205)、GGSGGSn(SEQ ID NO:206)及GGGSn(SEQ ID NO:207)，其中n为至少1的整数)、甘氨酸-丙氨酸聚合物、丙氨酸-丝氨酸聚合物、甘氨酸-脯氨酸聚合物、脯氨酸聚合物及脯氨酸-丙氨酸聚合物。实例接头可包含氨基酸序列，其包括但不限于GGSG(SEQ ID NO:208)、GGSGG(SEQ ID NO:209)、GSGSG(SEQID NO:210)、GSGGG(SEQ ID NO:211)、GGGSG(SEQ ID NO:212)、GSSSG(SEQ ID NO:213)、GPGP(SEQ ID NO:214)、GGP、PPP、PPAPPA(SEQ ID NO:215)、PPPGPPP(SEQ ID NO:216)等。普通技术人员应认识到，结合至上文所述的任何元件的肽的设计可包括完全或部分可挠性的接头，以使得接头可包括可挠性接头以及一个或多个赋予较不可挠结构的部分。

V.用于修饰PCSK9基因的系统和方法

本文提供的CRISPR蛋白、引导核酸及其变异体可用于各种应用，包括作为治疗学、诊断学和用于研究。在一些实施例中，为了实现本公开的基因编辑方法，本文提供了可编程的CasX:gNA系统。本文提供的CasX:gNA系统的可编程特性允许在PCSK9基因的靶核酸序列中的一个或多个预先确定的感兴趣的区进行精确定位，以达到预期的效果(切割、裂解、修复等)。在一些实施例中，可能需要敲低或敲除受试者中包含突变(例如导致高胆固醇血症或常染色体显性高胆固醇血症的显性突变)的PCSK9蛋白的表达。术语“敲除”是指基因的消除或基因的表达。例如，可以通过缺失或添加导致阅读框破坏的核苷酸序列来敲除基因。作为另一实例，可以通过用不相关或异源的序列替换基因的一部分来敲除基因。如本文所用，术语“敲低”是指基因或其基因产物的表达减少。作为基因敲低的结果，蛋白质活性或功能可能会减弱，或者蛋白质水平可能会降低或消除。在此类实施例中，可以使用具有对编码PCSK9蛋白的基因的一部分或PCSK9调节区特异的靶向序列的gNA。根据所使用的CasX蛋白和gNA，该事件可能是一个裂解事件，允许敲低/敲除表达。在一些实施例中，PCSK9基因表达可以通过引入随机插入或缺失(插入缺失)来破坏或消除，例如通过利用不精确的非同源DNA末端连接(NHEJ)修复途径。在此类实施例中，PCSK9的靶向区包括PCSK9基因的编码序列(外显子)，因为在编码序列中插入或缺失核苷酸可以产生移码突变。这种方法也可用于非编码区，如内含子或调节区，以干扰PCSK9基因的表达。在其他实施例中，本公开提供了用于校正PCSK9基因中突变的系统和方法，其中通过设计gNA的靶向序列或通过引入供体模板在选择的位置引入插入或缺失来敲入校正序列，下文将更充分描述。

在一些实施例中，本文提供的用于修饰PCSK9靶核酸的CasX:gNA系统包含如表3、5、6、7或9中所列的SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490的CasX变异体或与其具有至少60％同一性、至少70％同一性、至少80％同一性、至少81％同一性、至少82％同一性、至少83％同一性、至少84％同一性、至少85％同一性、至少86％同一性、至少86％同一性、至少87％同一性、至少88％同一性、至少89％同一性、至少89％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性或至少99.5％同一性的变异体序列，gNA支架包含表2的序列或与其具有至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少81％同一性、至少82％同一性、至少83％同一性、至少84％同一性、至少85％同一性、至少86％同一性、至少86％同一性、至少87％同一性、至少88％同一性、至少89％同一性、至少89％同一性、至少90％同一性、至少91％同一性、至少92％同一性、至少93％同一性、至少94％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性、至少99.5％同一性的序列，并且gNA包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的靶向序列或与其具有至少65％同一性、至少70％同一性、至少75％同一性、至少80％同一性、至少85％同一性、至少90％同一性或至少95％同一性的序列并具有15至30个氨基酸。

在其他实施例中，本公开提供了编码前述CasX变异蛋白和gNA的一种或多种多核苷酸。在一些情况下，CasX:gNA系统还包含供体模板核酸，其中供体模板可通过宿主细胞的HDR或HITI修复机制插入。在实施例中，供体模板可包含一定核酸，该核酸包含PCSK9基因的至少一部分，其选自由PCSK9外显子、PCSK9内含子、PCSK9内含子-外显子连接处和PCSK9调节元件及其组合组成的组。在实施例中，供体模板可包含编码SEQ ID NO:33的全部或一部分的序列。在一些实施例中，例如对于敲低/敲除修饰，供体模板序列将与需要重组的PCSK9基因组序列具有至少约60％、70％、80％、90％、95％、98％、99％或99.9％的序列同一性，使得在插入后，PCSK9基因产物的表达减少或消除，从而与PCSK9基因未被修饰的细胞相比，非功能性PCSK9蛋白的表达减少至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。在一些实施例中，供体模板包含用于校正PCSK9基因的突变的序列，其中插入后，与PCSK9基因未被修饰的细胞相比，群体细胞对功能性PCSK9蛋白的表达增加至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。在其他实施例中，校正供体模板的插入修饰了细胞的PCSK9基因，使得至少约50％、至少约60％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％或至少约95％的修饰细胞表达可检测水平的功能性PCSK9。在一些实施例中，校正供体模板的插入修饰了细胞的PCSK9基因，使得至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％的修饰细胞不表达可检测水平的非功能性PCSK9蛋白。

在其他实施例中，供体模板包含一段序列，以截短要从PCSK9基因中切除的突变外显子；例如，两个或更多个连续外显子，其可以进一步包含两个或更多个连续外显子之间的插入内含子，或者含外显子和缩短的合成内含子的cDNA。供体模板可以是短的单链或双链寡核苷酸，或长的单链或双链寡核苷酸。供体模板序列包含在断裂位点的5’和3’侧侧接两个同源区(“同源臂”)的序列，使得靶DNA区和两个侧接序列之间的同源定向修复导致在靶区插入供体模板。在PCSK9突变跨越多个外显子的那些情况下，本公开的方法考虑了使用足够长度的供体模板，该长度也可以被优化以在供体模板中的外显子之间包含长度缩短(相对于基因组内含子)的合成内含子序列，从而确保PCSK9基因座的正确表达和加工。在一些实施例中，供体多核苷酸包含至少约10、至少约50、至少约100、或至少约200、或至少约300、或至少约400、或至少约500、或至少约600、或至少约700、或至少约800、或至少约900、或至少约1000、或至少约10,000或至少约15,000个核苷酸。在其他实施例中，供体多核苷酸包含至少约10至约15,000个核苷酸，或至少约100至约10,000个核苷酸，或至少约400至约8,000个核苷酸，或至少约600至约5000个核苷酸，或至少约1000至约2000个核苷酸。供体模板序列可包含相比于基因组序列的某些序列差异，例如限制位点、核苷酸多形性、可选标记物(例如耐药性基因、荧光蛋白、酶等)等，其可用于评估供体核酸于裂解位点处的成功插入，或在一些情况下可用于其他目的(例如表示靶向基因组基因座处的表达)。或者，这些序列差异可包括侧接重组序列，例如FLP、loxP序列等，其可稍后经活化以去除标记序列。

多种策略和方法可用于使用本文提供的CasX:gNA系统来修饰细胞中的靶核酸序列。如本文所用，“修饰”包括但不限于裂解、切割、编辑、缺失、敲入、敲除、修复/校正、外显子跳读等。取决于所用的CasX蛋白和gNA，编辑事件可以是裂解事件，随后引入随机插入或缺失(插入缺失)或其他突变(例如，一个或多个核苷酸的取代、重复或倒位)，例如通过利用不精确的非同源DNA末端连接(NHEJ)修复途径(这可以产生例如移码突变)。或者，编辑事件可以是裂解事件，随后是同源定向修复(HDR)、同源非依赖性靶向整合(HITI)、微同源介导的末端连接(MMEJ)、单链退火(SSA)或碱基切除修复(BER)，引起靶核酸序列的修饰。

在一个实施例中，本公开提供了修饰细胞群体中包含一个或多个突变的PCSK9基因的靶核酸序列的方法，该方法包括向该群体的每个细胞中引入：i)CasX:gNA系统，其包含本文所述任一实施例的CasX和gNA；ii)CasX:gNA系统，其包含本文所述任一实施例的CasX、gNA和供体模板；iii)核酸，其编码CasX和gNA并任选地包含供体模板；iv)载体，其选自由逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒(AAV)载体和单纯疱疹病毒(HSV)载体组成的组，并包含上述(iii)的核酸；v)VLP，其包含本文所述任一实施例的CasX:gNA系统；或vi)(i)至(v)中两者或更多者的组合，其中gNA靶向的细胞的靶核酸序列被CasX蛋白修饰。在该方法的一些实施例中，群体的至少约1％、至少约2％、至少约3％、至少约4％、至少约5％、至少约6％、至少约7％、至少约8％、至少约9％或至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％或更多的细胞的PCSK9靶核酸被修饰。在该方法的一些实施例中，群体细胞中的PCSK9基因被修饰，使得与PCSK9基因未被修饰的细胞相比，非功能性PCSK9蛋白的表达减少至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。在该方法的其他实施例中，群体细胞的PCSK9基因被修饰，使得至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％的修饰细胞不表达可检测水平的非功能性PCSK9蛋白。

在该方法的一个实施例中，将CasX:gNA系统的CasX和gNA作为RNP引入细胞。多核苷酸可以通过本文所述的载体或使用本领域已知的常规方法(例如电穿孔、显微注射或用化学方法)作为质粒引入待修饰的细胞中。在该方法的一些实施例中，待修饰的细胞选自由啮齿动物细胞、小鼠细胞、大鼠细胞和非人灵长类动物细胞组成的组。在该方法的其他实施例中，待修饰的细胞是人类细胞。在该方法的一些实施例中，细胞群的修饰在受试者体内进行，其中受试者选自由啮齿动物、小鼠、大鼠、非人灵长类动物和人类组成的组。在该方法的其他实施例中，细胞群的修饰离体进行。在该方法的一些实施例中，待修饰的群体细胞选自由祖细胞、造血干细胞和多能干细胞组成的组。在该方法的其他实施例中，细胞是诱导多能干细胞。在所述方法的一些实施例中，修饰的细胞是肝细胞，或肠、肾、中枢神经系统的细胞，平滑肌细胞，巨噬细胞或动脉壁如内皮的细胞。在一些实施例中，该群体的细胞相对于要施用所述细胞的受试者是自体的。在该方法的其他实施例中，该群体的细胞相对于要施用所述细胞的受试者是同种异体的。

在该方法的一些实施例中，gNA的靶向序列与包含PCSK9基因的一个或多个单核苷酸多态性(SNP)的序列互补。在其他实施例中，gNA的靶向序列与PCSK9基因的外显子剪接增强子的序列互补。

在修饰靶核酸序列的方法的一些实施例中，靶核酸序列包含PCSK9基因的全部或一部分。在一些实施例中，待修饰的PCSK9基因包含对应于编码SEQ ID NO:33的全部或部分序列的多核苷酸的野生型序列，或包含跨越人类基因组chr1:55,039,476-55,064,853(GRCh38/hg38)的多核苷酸序列(该符号是指染色体1(chr1)，起始于染色体1上的55,039,476bp至55,064,853bp(智人更新注释版本109.20190905，GRCh38.p13)(NCBI)。在该方法的一些实施例中，gNA的靶向序列与PCSK9外显子的序列互补，该外显子选自由外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9、外显子10、外显子11和外显子12组成的组。

在修饰靶核酸序列的方法的一些实施例中，修饰靶核酸序列包括切割靶核酸以在靶核酸序列中引入单链断裂，其中PCSK9基因的修饰包括引入突变、插入或缺失。在一些实施例中，修饰包括裂解靶核酸序列以在靶核酸中引入双链断裂，其中PCSK9基因的修饰包括与野生型序列相比引入一个或多个核苷酸的突变、插入或缺失。在一些实施例中，要通过该方法校正的突变是功能获得性突变。在其他实施例中，要通过该方法校正的突变是功能丧失性突变。在一些情况下，待修饰的PCSK9蛋白包含破坏PCSK9蛋白的功能的突变。在用于校正一个或多个突变的方法的一些实施例中，修饰引起群体细胞中PCSK9基因的突变的校正或补偿，使得细胞表达功能性PCSK9蛋白。在该方法的一些实施例中，与PCSK9基因未被修饰的细胞相比，群体细胞对功能性PCSK9蛋白的表达增加了至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。

在修饰靶核酸序列的方法的一些实施例中，修饰PCSK9基因包括CasX:gNA复合物与靶核酸序列的结合。在一些实施例中，CasX是无催化活性的CasX(dCasX)蛋白，其保留了结合gNA和靶核酸序列的能力。例如，靶核酸序列包含含有突变的PCSK9序列，并且dCasX:gRNA复合物与靶序列的结合干扰或抑制突变PCSK9等位基因的转录。在一些实施例中，dCasX包含对应于SEQ ID NO:1的CasX蛋白的残基D672、E769和/或D935或对应于SEQ IDNO:2的CasX蛋白的残基D659、E756和/或D922处的突变。在前述的一些实施例中，CasX参考蛋白中的突变是丙氨酸或甘氨酸取代该残基。

将核酸(例如，包含供体多核苷酸序列的核酸，编码CasX蛋白和/或gNA的一种或多种核酸，或包含它们的载体)引入细胞的方法是本领域已知的，并且可以使用任何方便的方法将核酸(例如，表达构建体)引入细胞。适合的方法包括例如病毒感染、转染、脂质体转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、核转染、电穿孔、通过与供体DNA融合或募集供体DNA的细胞穿透CasX蛋白直接添加、细胞挤压、磷酸钙沉淀、直接显微注射、纳米粒子介导的核酸递送等。

在该方法的一些实施例中，CasX可以作为RNA序列提供。RNA可通过直接化学合成提供，或可体外转录自DNA(例如编码mRNA的DNA，该mRNA包含编码CasX蛋白变异体的序列)。一旦合成，RNA便可例如通过将核酸引入至细胞中的任何熟知技术(包括但不限于显微注射、电穿孔和转染)引入至细胞中，以翻译成CasX蛋白。

可使用充分发展的转染技术，及获自Qiagen的市售

试剂、获自Stemgent的Stemfect^TM RNA转染试剂盒及获自Mirus Bio LLC的

转染试剂盒、Lonza核转染、Maxagen电穿孔等将核酸引入细胞中。

在体外条件下将包含编码本公开的CasX:gNA系统(和任选的供体模板序列)的序列的重组表达载体引入细胞中可以在促进细胞存活和CasX:gNA产生的任何合适的培养基中和任何合适的培养条件下进行。将重组表达载体引入靶细胞中可在体内、体外或离体进行。在该方法的一些实施例中，载体可直接提供至靶宿主细胞。例如，可使细胞与载体接触，使得载体被细胞摄取，所述载体具有编码本文所述的任一实施例的CasX和gNA的核酸，并且任选地具有供体模板序列。使细胞与为质粒的核酸载体接触的方法包括电穿孔、氯化钙转染、显微注射、转导及脂质体转染，为本领域中熟知的。对于病毒载体递送，可使细胞与病毒粒子接触，所述病毒粒子包含主题病毒表达载体及编码CasX和gNA的核酸以及任选的供体模板。在一些实施例中，载体是腺相关病毒(AAV)载体，其中AAV选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV 44.9、AAV-Rh74或AAVRh10。在其他实施例中，载体是慢病毒载体。逆转录病毒，例如慢病毒，可适用于本公开的方法。常用的逆转录病毒载体是“缺陷性的”，例如不能产生生产性感染所需的病毒蛋白。确切而言，载体的复制需要包装细胞系中的生长。为了产生包含所关注核酸的病毒粒子，通过包装细胞系将包含该核酸的逆转录病毒核酸包装至病毒衣壳中。不同包装细胞系提供并入至衣壳中的不同包膜蛋白(亲嗜性、双嗜性或嗜异性)，并且该包膜蛋白决定病毒粒子对细胞的特异性或嗜性(对鼠类及大鼠为亲嗜性的；对大部分哺乳动物细胞类型，包括人类、狗及小鼠为双嗜性的；且对除了鼠类细胞的大部分哺乳动物细胞类型为嗜异性的)。适当包装细胞系可用于确保细胞经包装病毒粒子靶向。将主题载体表达载体引入包装细胞系中以及收集通过包装细胞系产生的病毒粒子的方法是本领域中熟知的，包括美国专利号5,173,414；Tratschin等人，Mol.Cell.Biol.5:3251-3260(1985)；Tratschin等人，Mol.Cell.Biol.4:2072-2081(1984)；Hermonat和Muzyczka，PNAS 81:6466-6470(1984)；以及Samulski等人，J.Virol.63:03822-3828(1989)。也可以通过直接微量注射(例如，RNA注射)引入核酸。

在一些实施例中，将载体以治疗有效剂量施用于受试者。在上文中，受试者选自由小鼠、大鼠、猪、非人灵长类动物和人类组成的组。在具体实施例中，受试者为人类。在该方法的一些实施例中，将载体以至少约1x 10⁵个载体基因组/kg(vg/kg)、至少约1x 10⁶vg/kg、至少约1x 10⁷vg/kg、至少约1x 10⁸vg/kg、至少约1x 10⁹vg/kg、至少约1x 10¹⁰vg/kg、至少约1x 10¹¹vg/kg、至少约1x 10¹²vg/kg、至少约1x 10¹³vg/kg、至少约1x 10¹⁴vg/kg、至少约1x10¹⁵vg/kg、或至少约1x 10¹⁶vg/kg的剂量施用于受试者。在该方法的其他实施例中，将VLP以至少约1x 10⁵个粒子/kg、至少约1x 10⁶个粒子/kg、至少约1x 10⁷个粒子/kg、至少约1x10⁸个粒子/kg、至少约1x 10⁹个粒子/kg、至少约1x 10¹⁰个粒子/kg、至少约1x 10¹¹个粒子/kg、至少约1x 10¹²个粒子/kg、至少约1x 10¹³个粒子/kg、至少约1x 10¹⁴个粒子/kg、至少约1x 10¹⁵个粒子/kg、或至少约1x 10¹⁶个粒子/kg的剂量施用于受试者。

载体或VLP可以通过选自由静脉内、门静脉内注射、腹膜内、肌内、皮下、眼内和口服途径组成的组的施用途径施用。在一些实施例中，载体是包含本公开的CasX:gNA系统的AAV载体，并且通过眼内注射递送至受试者的一只或两只眼睛。

在其他实施例中，本公开提供了使用本文所述任一实施例的CasX:gNA系统修饰靶核酸序列的方法，并且所述方法还包括使靶核酸序列与额外的CRISPR蛋白或编码额外的CRISPR蛋白的多核苷酸接触。在一些实施例中，额外的CRISPR蛋白是CasX蛋白，其序列不同于CasX:gNA系统的CasX。在一些实施例中，额外的CRISPR蛋白不是CasX蛋白；例如，额外的CRISPR蛋白可以是Cpf1、Cas9、Cas12a或Cas13a。

本文所述的CasX:gNA系统和方法可用于工程化改造其中PCSK9的突变与疾病相关的多种细胞，例如肝、肠、肾、中枢神经系统的细胞、平滑肌细胞、巨噬细胞或动脉壁如内皮的细胞，以产生其中包含突变的PCSK9被校正或敲除的一个或多个细胞。因此，该方法可用于修饰细胞以应用于患有PCSK9相关病症的受试者，该病症例如但不限于常染色体显性高胆固醇血症(ADH)、高胆固醇血症、总胆固醇水平升高、高脂血症、低密度脂蛋白(LDL)水平升高、LDL-胆固醇水平升高、高密度脂蛋白水平降低、肝脂肪变性、冠心病、局部缺血、中风、外周血管疾病、血栓形成、2型糖尿病、高血压、动脉粥样硬化、肥胖症、阿尔茨海默病、神经变性、年龄相关性黄斑变性(AMD)或其组合。

VI.多核苷酸和载体

在另一个方面，本公开涉及编码2类V型核酸酶和gNA的多核苷酸，其可用于编辑包含一个或多个突变的PCSK9基因。在另外的实施例中，本公开提供了编码PCSK9基因的部分或全部的供体模板多核苷酸。在一些情况下，供体模板的PCSK9基因包含用于敲低或敲除靶核酸中PCSK9基因的突变或异源序列。在其他情况下，供体模板包含用于敲入功能性PCSK9基因或其部分的校正序列。在其他实施例中，本公开提供了载体，所述载体包含编码本文所述CasX蛋白和CasX gNA的多核苷酸，以及实施例的供体模板。

在一些实施例中，本公开提供了编码SEQ ID NO:1-3的参考CasX的多核苷酸序列。在其他实施例中，本公开提供了编码本文所述任一实施例的CasX变异体的多核苷酸序列，包括表3、5、6、7和9中所列的SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488和490的CasX蛋白变异体，或与表3、5、6、7和9中所列的SEQ IDNO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488和490的序列具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的序列。在一些实施例中，本公开提供了编码本文描述的任一实施例的gNA序列的分离多核苷酸序列。在一些实施例中，本公开提供了多核苷酸，所述多核苷酸编码表1或表2中所列的SEQ ID NO:4-16或2101-2285的gNA支架序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的序列。在一些实施例中，多核苷酸编码选自由SEQ ID NO:2101-2285组成的组的gNA支架序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的序列。在其他实施例中，本公开提供了gNA，所述gNA包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的靶向序列多核苷酸，或与其具有至少约65％、至少约75％、至少约85％或至少约95％同一性的序列，以及编码靶向序列的DNA。在一些实施例中，编码支架序列的多核苷酸进一步包含编码靶向序列的序列，使得能够结合CasX和靶序列的gNA可以表达为sgNA或dgNA。在其他实施例中，本公开提供了编码gNA序列的分离的多核苷酸序列，该gNA序列具有与包含一个或多个突变的PCSK9基因杂交的支架和靶向序列。在一些情况下，多核苷酸序列编码与PCSK9基因外显子杂交的支架和靶向序列的gNA，该外显子选自由外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9、外显子10、外显子11和外显子12组成的组。在其他实施例中，多核苷酸序列编码包含与PCSK9内含子杂交的靶向序列的gNA。在其他实施例中，多核苷酸序列编码包含与PCSK9内含子-外显子连接处杂交的靶向序列的gNA。在其他实施例中，多核苷酸序列编码包含与PCSK9基因的基因间区杂交的靶向序列的gNA。在其他实施例中，多核苷酸序列编码包含与PCSK9调节区杂交的靶向序列的gNA。在一些情况下，PCSK9调节区是PCSK9启动子或增强子。在一些情况下，PCSK9调节区位于PCSK9转录起始位点的5’、PCSK9转录起始位点的3’或位于PCSK9内含子中。在一些情况下，PCSK9调节区位于PCSK9基因的内含子中。在其他情况下，PCSK9调节区包含PCSK9基因的5’UTR。在其他情况下，PCSK9调节区包含PCSK9基因的3’UTR。在一些情况下，PCSK9序列是野生型序列。在其他情况下，PCSK9序列包含一个或多个突变。

在其他实施例中，本公开提供了供体模板核酸，其中供体模板包含与预期进行基因编辑的靶核酸的靶序列具有同源性但不完全同一性的核苷酸序列。供体模板序列通常与其替换的基因组序列不同，并且可能包含相对于基因组序列的一个或多个单碱基变化、插入、缺失、倒位或重排，条件是与靶序列具有足够的同源性以支持同源定向修复，或者供体模板具有同源臂，由此插入可导致剪接掉包含突变的外显子，从而恢复PCSK9基因的阅读框，或者供体模板包含野生型序列，从而在插入后，突变被校正。在一些实施例中，供体模板具有与蛋白质靶核酸杂交并插入在由CasX引入的断裂位点的序列，从而实现基因序列的修饰。在PCSK9突变跨越多个外显子的那些情况下，本公开考虑了足够长度的供体模板，该长度也可以被优化以在供体模板中的外显子之间包含长度缩短(相对于基因组内含子)的合成内含子序列，从而确保PCSK9基因座的正确表达和加工。在一些实施例中，供体多核苷酸包含至少约10、至少约50、至少约100、或至少约200、或至少约300、或至少约400、或至少约500、或至少约600、或至少约700、或至少约800、或至少约900、或至少约1000、或至少约10,000或至少约15,000个核苷酸。在其他实施例中，供体多核苷酸包含至少约10至约15,000个核苷酸，或至少约100至约10,000个核苷酸，或至少约400至约8,000个核苷酸，或至少约600至约5000个核苷酸，或至少约1000至约2000个核苷酸。在一些实施例中，供体模板为单链DNA模板或单链RNA模板。在其他实施例中，供体模板为双链DNA模板。

在一些实施例中，本公开涉及产生编码本文描述的任一实施例的参考CasX、CasX变异体或gNA的多核苷酸序列(包括其变异体)的方法，以及表达由多核苷酸序列表达的蛋白质或转录的RNA的方法。通常，所述方法包括产生编码本文描述的任一实施例的CasX或gNA的多核苷酸序列，并将编码基因并入至适合宿主细胞的表达载体中。为了产生本文描述的任一实施例的编码的CasX或gNA，所述方法包括用包含编码多核苷酸的表达载体转化合适的宿主细胞，并在导致或允许本文描述的任一实施例的所得CasX或gNA在转化的宿主细胞中表达或转录的条件下培养宿主细胞，从而产生CasX或gNA，其通过本文描述的方法(例如下文实例中)或通过本领域已知的标准纯化方法回收。分子生物学中的标准重组技术用于制备本公开的多核苷酸和表达载体。

根据本公开，编码本文描述的任一实施例的参考CasX、CasX变异体或gNA的核酸序列用于产生重组DNA分子，其指导在适当的宿主细胞中的表达。几种克隆策略适用于实施本公开，其中许多用于生成包含编码本公开组合物或其互补序列的基因的构建体。在一些实施例中，克隆策略用于创建编码构建体的基因，该构建体包含编码参考CasX、CasX变异体或gNA的核苷酸并用于转化宿主细胞以表达组合物。

在一种方法中，首先制备含有编码参考CasX、CasX变异体或gNA的DNA序列的构建体。用于制备此类构建体的示例性方法在实例中进行了描述。然后在CasX或gNA的情况下，将该构建体用于创建适合转化宿主细胞(例如原核或真核宿主细胞)的表达载体，以表达和回收蛋白构建体。如果需要，宿主细胞是大肠杆菌。在其他实施例中，宿主细胞是真核细胞。真核宿主细胞可选自BHK细胞、HEK293细胞、HEK293T细胞、Lenti-X HEK293细胞、NS0细胞、SP2/0细胞、YO骨髓瘤细胞、P3X63小鼠骨髓瘤细胞、PER细胞、PER.C6细胞、杂交瘤细胞、NIH3T3细胞、COS、HeLa、CHO、酵母细胞或本领域已知的适于生产重组产物的其他真核细胞。实例中描述了用于创建表达载体、宿主细胞转化以及参考CasX、CasX变异体或gNA的表达和回收的示例性方法。

编码参考CasX、CasX变异体或gNA构建体的基因可以在一个或多个步骤中制备，要么采用完全合成的方式，要么通过合成结合酶促过程，如限制性酶介导的克隆、PCR和重叠延伸，包括在实例中更充分描述的方法。例如，本文公开的方法可用于连接编码所需序列的各种组分(例如，CasX和gNA)基因的多核苷酸序列。使用基因合成的标准技术从寡核苷酸组装编码多肽组合物的基因。

在一些实施例中，编码CasX蛋白的核苷酸序列经密码子优化。这种类型的优化可能需要对编码核苷酸序列进行突变，以模拟预期宿主生物体或细胞在编码相同CasX蛋白时的密码子偏好。因此，密码子可改变，但经编码蛋白质保持不变。例如，如果CasX蛋白的预期靶细胞是人类细胞，则可以使用人类密码子优化的CasX编码核苷酸序列。作为另一非限制性实例，如果预期宿主细胞是小鼠细胞，则可以生成小鼠密码子优化的CasX编码核苷酸序列。作为另一非限制性实例，如果预期宿主细胞是植物细胞，则可以生成植物密码子优化的编码CasX蛋白变异体的核苷酸序列。作为另一非限制性实例，如果预期宿主细胞是昆虫细胞，则可以生成昆虫密码子优化的CasX蛋白编码核苷酸序列。可以使用优化密码子使用和氨基酸组成的算法进行基因设计，该算法适用于生产参考CasX、CasX变异体或gNA时使用的宿主细胞。在本公开的一种方法中，创建编码构建体的组分的多核苷酸文库，然后进行组装，如上所述。然后组装所得基因，并且所得基因用于转化宿主细胞并产生和回收参考CasX、CasX变异体或gNA组合物以评估其性质，如本文所述。

在一些实施例中，编码gNA的核苷酸序列可操作地连接到控制元件，例如转录控制元件，如启动子。在一些实施例中，编码CasX蛋白的核苷酸序列可操作地连接到控制元件，例如转录控制元件，如启动子。在其他情况下，编码CasX和gNA的核苷酸被连接并可操作地连接到单个控制元件。在一些情况下，启动子为组成性活化启动子。在一些情况下，启动子为可调节启动子。在一些情况下，启动子为诱导型启动子。在一些情况下，启动子为组织特异性启动子。在一些情况下，启动子为细胞类型特异性启动子。在一些情况下，转录控制元件(例如启动子)在靶向的细胞类型或靶向的细胞群体中起作用。例如，在一些情况下，转录控制元件可以在真核细胞中起作用，例如神经元、脊髓运动神经元、少突胶质细胞或神经胶质细胞。真核启动子(在真核细胞中起作用的启动子)的非限制性实例包括EF1α、EF1α核启动子、来自巨细胞病毒(CMV)即刻早期的那些、单纯疱疹病毒(HSV)胸苷激酶、早期及晚期SV40、来自逆转录病毒的长末端重复序列(LTR)及小鼠金属硫蛋白-I。真核启动子的其他非限制性实例包括CMV启动子全长启动子、最小CMV启动子、鸡β-肌动蛋白启动子、hPGK启动子、HSV TK启动子、Mini-TK启动子、赋予神经元特异性表达的人类突触蛋白I启动子、选择性表达于神经元中的Mecp2启动子、最小IL-2启动子、劳氏肉瘤病毒增强子/启动子(单一)、形成脾脏病灶的病毒长末端重复序列(LTR)启动子、SV40启动子、SV40增强子及早期启动子、TBG启动子：来自人类甲状腺素结合球蛋白基因的启动子(肝脏特异性)、PGK启动子、人类泛素C启动子、UCOE启动子(HNRPA2B1-CBX3的启动子)、组蛋白H2启动子、组蛋白H3启动子、U1a1小核RNA启动子(226nt)、U1b2小核RNA启动子(246nt)26、TTR最小增强子/启动子、b-驱动蛋白启动子、人类eIF4A1启动子、ROSA26启动子及3-磷酸甘油醛脱氢酶(GAPDH)启动子。

合适的载体和启动子的选择完全在本领域普通技术人员的能力范围之内，因为它涉及控制表达，例如，用于修饰PCSK9基因。表达载体亦可含有用于翻译起始及转录终止的核糖体结合位点。表达载体亦可包括用于扩增表达的适合的序列。表达载体也可包括编码蛋白质标签(例如，6xHis标签、血凝素标签、荧光蛋白等)的核苷酸序列，这些蛋白质标签可与CasX蛋白融合，从而产生用于纯化或检测的嵌合CasX蛋白。

在一些实施例中，编码每个gNA变异体或CasX蛋白的核苷酸序列可操作地连接到诱导型启动子、组成型活性启动子、空间受限启动子(即，转录控制元件、增强子、组织特异性启动子、细胞类型特异性启动子等)或时间受限启动子。在其他实施例中，将编码gNA或CasX的单个核苷酸序列与前述启动子类别之一连接，然后通过下述常规方法将其引入待修饰的细胞中。

在某些实施例中，适合的启动子可衍生自病毒且可因此称为病毒启动子，或其可衍生自任何生物体，包括原核或真核生物体。适合的启动子可用于通过任何RNA聚合酶(例如pol I、pol II、pol III)驱动表达。示例性启动子包括但不限于SV40早期启动子、小鼠乳腺肿瘤病毒长末端重复序列(LTR)启动子；腺病毒主要晚期启动子(Ad MLP)；单纯疱疹病毒(HSV)启动子；巨细胞病毒(CMV)启动子，例如CMV即刻早期启动子区(CMVIE)、劳氏肉瘤病毒(RSV)启动子、人类U6小核启动子(U6)、增强型U6启动子、人类HI启动子(HI)、POL1启动子、7SK启动子、tRNA启动子等。

在一些实施例中，一种或多种编码CasX和gNA并且任选地包含供体模板的核苷酸序列各自可操作地连接到可在真核细胞中操作的启动子(在其控制下)。诱导型启动子的实例可以包括但不限于T7 RNA聚合酶启动子、T3 RNA聚合酶启动子、异丙基-β-D-硫代吡喃半乳糖苷(IPTG)-调节的启动子、乳糖诱导的启动子、热休克启动子、四环素调节的启动子、类固醇调节的启动子、金属调节的启动子、雌激素受体调节的启动子等。因此，在一些实施例中，诱导型启动子可以由包括但不限于强力霉素；雌激素和/或雌激素类似物；IPTG等的分子调节。

在某些实施例中，适合使用的诱导型启动子可包括本文所述或本领域普通技术人员已知的任何诱导型启动子。诱导型启动子的实例包括但不限于化学/生物化学调节和物理调节的启动子，如醇调节启动子、四环素调节启动子(例如，无水四环素(aTc)反应性启动子及其他四环素反应性启动子系统，其包括四环素阻遏蛋白(tetR)、四环素操纵序列(tetO)和四环素反式激活融合蛋白(tTA)、类固醇调节启动子(例如，基于大鼠糖皮质激素受体、人类雌激素受体、蛾蜕皮激素受体的启动子，以及来自类固醇/类视黄素/甲状腺受体超家族的启动子)、金属调节启动子(例如，衍生自来自酵母、小鼠及人类的金属硫蛋白(结合和螯合金属离子的蛋白)基因的启动子)、发病机制调节启动子(例如，由水杨酸、乙烯或苯并噻二唑(BTH)诱导)、温度/热诱导性启动子(例如，热休克启动子)以及光调节启动子(例如，来自植物细胞的光反应性启动子)。

在一些情况下，启动子是空间受限启动子(即，细胞类型特异性启动子、组织特异性启动子等)，使得在多细胞生物体中，启动子在特定细胞的亚群中是活跃的(即，“开启”)。空间受限启动子亦可称为增强子、转录控制元件、控制序列等。可使用任何便利的空间受限启动子，只要启动子在靶向宿主细胞(例如真核细胞；原核细胞)中起作用。

在一些情况下，启动子为可逆启动子。适合的可逆启动子，包括可逆诱导型启动子为本领域中已知的。此类可逆启动子可分离及衍生自多种生物体，例如真核生物及原核生物。衍生自第一生物体的用于第二生物体(例如第一原核生物及第二真核生物、第一真核生物及第二原核生物等)的可逆启动子的修饰在本领域中为熟知的。此类可逆启动子及基于此类可逆启动子但也包含额外控制蛋白的系统包括但不限于醇调节启动子(例如，醇脱氢酶I(alcA)基因启动子、对醇反式激活蛋白(AlcR)有反应的启动子等)、四环素调节启动子(例如，包括Tet活化子、TetON、TetOFF等的启动子系统)、类固醇调节启动子(例如，大鼠糖皮质激素受体启动子系统、人类雌激素受体启动子系统、类视黄素启动子系统、甲状腺启动子系统、蜕皮激素启动子系统、米非司酮启动子系统等)、金属调节启动子(例如，金属硫蛋白启动子系统等)、发病机制相关调节启动子(例如，水杨酸调节启动子、乙烯调节启动子、苯并噻二唑调节启动子等)、温度调节启动子(例如，热休克诱导性启动子(例如，HSP-70、HSP-90、大豆热休克启动子等)、光调节启动子、合成诱导型启动子等。

本公开的重组表达载体还可包含促进本公开的CasX蛋白和gNA的稳健表达的元件。举例来说，重组表达载体可包括以下中的一者或多者：聚腺苷酸化信号(poly(A))、内含子序列或转录后调节元件，例如土拔鼠肝炎转录后调节元件(WPRE)。示例性poly(A)序列包括hGH poly(A)信号(短)、HSV TK poly(A)信号、合成聚腺苷酸化信号、SV40 poly(A)信号、β-珠蛋白poly(A)信号等。本领域普通技术人员将能够选择要包括于本文所述的重组表达载体中的适合元件。

编码参考CasX、CasX变异体或gNA序列的多核苷酸可以单独克隆到表达载体中。载体包括细菌质粒、病毒载体等。在一些实施例中，载体是重组表达载体，其包含编码CasX蛋白的核苷酸序列。在其他实施例中，本公开提供了包含编码CasX蛋白的核苷酸序列和编码CasX gNA的核苷酸序列的重组表达载体。在一些情况下，编码CasX蛋白变异体的核苷酸序列和/或编码CasX gNA的核苷酸序列可操作地连接到在所选细胞类型中可操作的启动子。在其他实施例中，编码CasX蛋白变异体的核苷酸序列和编码CasX gNA的核苷酸序列在单独载体中提供。

在一些实施例中，本文提供了一种或多种重组表达载体，其包含诸如以下的序列：(i)供体模板核酸的核苷酸序列，其中供体模板包含与靶核酸序列(例如，靶基因组)的PCSK9序列具有同源性的核苷酸序列；(ii)编码CasX gNA(例如，gRNA)的核苷酸序列，其与靶向的基因组的靶PCSK9基因座的序列(例如，被配置为单或双引导RNA)杂交并可操作地连接到在靶细胞如真核细胞中可操作的启动子；和(iii)编码CasX蛋白的核苷酸序列，其可操作地连接到在靶细胞如真核细胞中可操作的启动子。在一些实施例中，包含供体模板并编码CasX gNA和CasX蛋白的序列位于不同的重组表达载体中，并且在其他实施例中，一个、两个或所有三个多核苷酸序列(对于供体模板、CasX和gNA)位于相同的重组表达载体中。

通过多种程序将核酸序列插入载体中。通常，使用本领域已知的技术将DNA插入适当的限制性核酸内切酶位点。载体组分通常包括但不限于信号序列、复制起点、一种或多种标记基因、增强子元件、启动子和转录终止序列中的一种或多种。含有一种或多种这些组分的合适载体的构建采用本领域技术人员已知的标准连接技术。此类技术在本领域中是众所周知的并且在科学和专利文献中得到充分描述。各种载体是公开的。例如，载体可以是质粒、粘粒、病毒粒子或噬菌体的形式，它们可以方便地进行重组DNA程序，并且载体的选择通常取决于将其引入的宿主细胞。因此，载体可以是自主复制载体，即作为染色体外实体存在的载体，其复制独立于染色体复制，例如质粒。替代地，该载体可以是当被引入宿主细胞时，被整合到宿主细胞基因组中并与已整合入的染色体一起复制的载体。一旦引入合适的宿主细胞中，CasX PCSK9编辑系统的表达就可以使用本领域已知的任何核酸或蛋白质分析来确定。例如，参考CasX或CasX变异体的转录mRNA的存在可以通过常规杂交分析(例如，Northern印迹分析)、扩增程序(例如RT-PCR)、SAGE(美国专利号5,695,937)和基于阵列的技术(参见例如，美国专利号5,405,783、5,412,087和5,445,934)，使用与CasX多核苷酸的任何区互补的探针进行检测和/或定量。

本公开提供了含有复制和控制序列的质粒表达载体的用途，该复制和控制序列与宿主细胞相容并被宿主细胞识别并且可操作地连接到编码多肽的基因以用于多肽的受控表达或RNA的转录。此类载体序列对于多种细菌、酵母和病毒是众所周知的。可以使用的有用的表达载体包括例如染色体、非染色体和合成DNA序列的段。“表达载体”是指含有DNA序列的DNA构建体，该DNA序列可操作地连接到合适的控制序列，该控制序列能够影响编码多肽的DNA在合适的宿主中的表达。要求是载体在所选宿主细胞中是可复制的和可行的。可以根据需要使用低拷贝数或高拷贝数载体。载体的控制序列包括影响转录的启动子、控制这种转录的任选操纵子序列、编码合适的mRNA核糖体结合位点的序列以及控制转录和翻译终止的序列。启动子可以是在所选宿主细胞中显示转录活性的任何DNA序列，并且可以衍生自编码与宿主细胞同源或异源的蛋白质的基因。

重组表达载体可通过多种方法递送至靶宿主细胞，如下文更充分描述。此类方法包括例如病毒感染、转染、脂质体转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、核转染、电穿孔、通过与供体DNA融合或募集供体DNA的细胞穿透CasX蛋白直接添加、细胞挤压、磷酸钙沉淀、直接显微注射、纳米粒子介导的核酸递送等。

重组表达载体序列可包装至病毒或病毒样粒子(在本文中亦称为“粒子”或“病毒粒子”)中，以用于细胞的后续感染及转化(离体、体外或体内)。此类粒子或病毒粒子将通常包括将载体基因组衣壳化或包装的蛋白质。合适的表达载体可以包括基于牛痘病毒的病毒表达载体；脊髓灰质炎病毒；腺病毒；逆转录病毒载体(例如，鼠白血病病毒)、脾坏死病毒和衍生自逆转录病毒的载体，如劳斯肉瘤病毒、哈维肉瘤病毒、禽白血病病毒、慢病毒、人类免疫缺陷病毒、骨髓增殖性肉瘤病毒和乳腺肿瘤病毒等。

在一些实施例中，本公开的重组表达载体为重组腺相关病毒(AAV)载体。在一些实施例中，本公开的重组表达载体为重组慢病毒载体。在一些实施例中，本公开的重组表达载体为重组逆转录病毒载体。

AAV是一种小型(20nm)非致病性病毒，在使用病毒载体在体内或离体递送到细胞(如真核细胞)以制备向受试者施用的细胞的情况下，其可用于治疗人类疾病。产生构建体，例如编码如本文所述的CasX蛋白及/或CasX gNA实施例中的任一者的构建体，且经AAV反向末端重复(ITR)序列侧接，由此使得能够将AAV载体包装至AAV病毒粒子中。

“AAV”载体可指天然存在的野生型病毒自身或其衍生物。该术语涵盖所有亚型、血清型及假型，及天然存在的及重组形式，除了另外要求时。如本文所用，术语“血清型”是指基于衣壳蛋白与界定抗血清的反应性鉴别且区别于其他AAV的AAV，例如存在许多已知的灵长类动物AAV血清型。在一些实施例中，AAV载体选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV 44.9、AAV-Rh74(恒河猴源性AAV)及AAVRh10，及这些血清型的经修饰衣壳。举例来说，血清型AAV-2用于指含有自AAV-2的cap基因编码的衣壳蛋白及含有来自相同AAV-2血清型的5’及3’ITR序列的基因组的AAV。假型AAV是指含有来自一种血清型的衣壳蛋白及包括第二血清型的5’-3’ITR的病毒基因组的AAV。将预期假型rAAV具有衣壳血清型的细胞表面结合特性及与ITR血清型一致的遗传特性。假型重组AAV(rAAV)使用本领域中描述的标准技术产生。如本文所用，举例来说，rAAV1可用于指衣壳蛋白及5'-3'ITR均来自相同血清型的AAV，或其可指具有来自血清型1的衣壳蛋白及来自不同AAV血清型(例如AAV血清型2)的5'-3'ITR的AAV。对于本文中说明的各实例，载体设计及生产的规格描述衣壳及5'-3'ITR序列的血清型。

“AAV病毒”或“AAV病毒粒子”是指由至少一种AAV衣壳蛋白(优选野生型AAV的所有衣壳蛋白)及衣壳化多核苷酸构成的病毒粒子。如果粒子另外包含异源多核苷酸(即，除了要递送至哺乳动物细胞的野生型AAV基因组以外的多核苷酸)，那么其通常称为“rAAV”。示例性异源多核苷酸为包含本文所述的任一实施例的CasX蛋白及/或sgRNA及任选的供体模板的多核苷酸。

“腺相关病毒反向末端重复”或“AAV ITR”意指发现于AAV基因组的每一端处的本领域公认的区，其以顺式在一起起作用，作为DNA复制起点及病毒的包装信号。AAV ITR连同AAV rep编码区提供自插入两个侧接ITR之间的核苷酸序列的有效切除及解救，及将该核苷酸序列整合至哺乳动物细胞基因组中。

AAV ITR区的核苷酸序列为已知的。参见例如Kotin,R.M.(1994)Human GeneTherapy5:793-801；Berns,K.I.“Parvoviridae and their Replication”,FundamentalVirology,第2版,(B.N.Fields及D.M.Knipe编)。如本文所用，AAV ITR不必具有所描绘的野生型核苷酸序列，而是可经改变，例如通过核苷酸的插入、缺失或取代。另外，AAV ITR可衍生自若干AAV血清型中的任一者，包括但不限于AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV-Rh74及AAVRh10，及这些血清型的经修饰衣壳。此外，侧接AAV载体中的所选核苷酸序列的5’及3’ITR不必相同或衍生自相同AAV血清型或分离株，只要其如所预期地起作用，即允许自宿主细胞基因组或载体切除及解救所关注序列，及允许将异源序列整合至受体细胞基因组中(当AAV Rep基因产物存在于细胞中时)。使用AAV血清型将异源序列整合至宿主细胞中为本领域中已知的(参见例如，WO2018195555A1和US20180258424A1，其通过引用并入本文)。

“AAV rep编码区”意指编码复制蛋白Rep 78、Rep 68、Rep 52及Rep 40的AAV基因组区。已显示这些Rep表达产物具有许多功能，包括识别、结合及切割AAV的DNA复制起点、DNA解螺旋酶活性及调节自AAV(或其他异源)启动子的转录。复制AAV基因组总体需要Rep表达产物。“AAV cap编码区”意指编码衣壳蛋白VP1、VP2及VP3，或其功能同源物的AAV基因组区。这些Cap表达产物提供包装病毒基因组总体需要的包装功能。

在一些实施例中，用于将CasX及gNA的编码序列及任选的PCSK9供体模板核苷酸递送至宿主细胞的AAV衣壳可衍生自若干AAV血清型中的任一者，包括但不限于AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV 44.9、AAV-Rh74(恒河猴源性AAV)及AAVRh10，并且AAV ITR衍生自AAV血清型2。

为了产生rAAV病毒粒子，使用已知技术，例如通过转染将AAV表达载体引入至适合的宿主细胞中。包装细胞通常用于形成病毒粒子；此类细胞包括HEK293细胞(及本领域中已知的其他细胞)，其包装腺病毒。多种转染技术为本领域中总体已知的；参见例如Sambrook等人(1989)Molecular Cloning,a laboratory manual,Cold Spring HarborLaboratories,New York。尤其适合的转染方法包括磷酸钙共沉淀、直接显微注射至经培养细胞中、电穿孔、脂质体介导的基因转移、脂质介导的转导及使用高速微弹的核酸递送。

在一些实施例中，经上述AAV表达载体转染的宿主细胞使得能够提供AAV辅助功能，以便复制及衣壳化由AAV ITR侧接的核苷酸序列，以产生rAAV病毒粒子。AAV辅助功能一般为AAV源性编码序列，其可经表达以得到AAV基因产物，所述产物转而以反式起作用以进行生产性AAV复制。AAV辅助功能在本文中用于补充自AAV表达载体缺失的所需AAV功能。因此，AAV辅助功能包括一种或两种编码rep及cap编码区的AAV ORF(开放阅读框架)，或其功能同源物。可使用本领域技术人员已知的方法将辅助功能引入至宿主细胞中且接着表达于宿主细胞中。通常，辅助功能通过用无关的辅助病毒感染宿主细胞来提供。在一些实施例中，辅助功能使用辅助功能载体提供。取决于所利用的宿主/载体系统，多种适合的转录及翻译控制元件(包括组成型及诱导型启动子、转录增强子元件、转录终止子等)中的任一者可用于表达载体中。

在其他实施例中，逆转录病毒(例如慢病毒)可适合用作递送本公开的CasX:gNA系统的编码核酸的载体。常用的逆转录病毒载体为“缺陷性的”，例如无法产生生产性感染所需的病毒蛋白，且可称为病毒样粒子(VLP)。确切而言，载体的复制需要包装细胞系中的生长。为了产生包含所关注核酸的病毒粒子，通过包装细胞系将包含核酸的逆转录病毒核酸包装至VLP衣壳中。不同包装细胞系提供并入至衣壳中的不同包膜蛋白(亲嗜性、双嗜性或嗜异性)，该包膜蛋白决定病毒粒子对细胞的特异性(对鼠类及大鼠为亲嗜性的；对大部分哺乳动物细胞类型，包括人类、狗及小鼠为双嗜性的；且对除了鼠类细胞的大部分哺乳动物细胞类型为嗜异性的)。适当包装细胞系可用于确保细胞经包装病毒粒子靶向。将主题载体表达载体引入至包装细胞系中及收集通过包装细胞系产生的病毒粒子的方法为本领域中熟知的。

在其他实施例中，本公开提供了体外产生的VLP，其包含本文所述的任一实施例的CasX和gNA的CasX:gNA RNP复合物，以及任选的供体模板。来自不同病毒的结构蛋白的组合可用于产生VLP，包括来自病毒科的组分，病毒科包括细小病毒科(例如，腺相关病毒)、逆转录病毒科(例如，HIV)、黄病毒科(例如，丙型肝炎病毒)、副粘病毒科(例如，Nipah)和噬菌体(例如，Qβ、AP205)。在一些实施例中，本公开提供了使用逆转录病毒组分设计的VLP系统，包括慢病毒，如HIV，其中将包含编码各种组分的核酸的单个质粒引入包装细胞中，继而产生VLP。在一些实施例中，VLP逆转录病毒组分可衍生自任何逆转录病毒科，包括正逆转录病毒亚科(Othoretrovirinae)(慢病毒、α逆转录病毒、β逆转录病毒、δ逆转录病毒、ε逆转录病毒、γ逆转录病毒)和泡沫逆转录病毒亚科(Spumaretrovirinae)。在2020年12月4日提交的PCT/US2020/063488中描述了包括CasX编辑系统的示例性VLP，该专利的内容以全文引用的方式并入本文中。在一些实施例中，本公开提供了具有逆转录病毒衣壳的VLP，该衣壳包含CasX:gNA RNP，其中在施用和进入靶细胞后，RNP分子自由转运到细胞核中。前述提供优于本领域其他载体的优势在于病毒转导至分裂和非分裂细胞是有效的，并且VLP递送有效且短寿命的RNP，其逃避原本会检测到外来蛋白质的受试者的免疫监视机制。

在一些实施例中，VLP系统包含a)包含编码融合多肽的序列的第一核酸，该融合多肽包含：i)Gag多蛋白的一种或多种组分；ii)本文描述的任一实施例的CasX蛋白；和任选地iii)蛋白酶裂解位点，其中蛋白酶裂解位点位于融合蛋白的gag多蛋白组分和CasX蛋白之间；b)第二核酸，其包含编码本文描述的任一实施例的引导NA的序列；和c)第三核酸，其包含编码慢病毒pol多蛋白的序列，该多蛋白包含能够裂解CasX蛋白和gag多蛋白之间的蛋白酶裂解位点的蛋白酶。在前述实施例中，Gag多蛋白的一种或多种组分选自由基质蛋白(MA)、核衣壳蛋白(NC)、衣壳蛋白(CA)、p1-p6蛋白、PP21/24肽、P12/P3/P8肽、p2肽、P10肽、p68 Gag多肽、p3 Gag多肽组成的组。在前述的一些实施例中，VLP系统还包含第四核酸，该第四核酸包含编码提供与靶细胞的结合的假型病毒包膜蛋白或糖蛋白的序列，或替代地，该核酸编码提供与靶细胞的结合的抗体片段，或包含假型病毒包膜蛋白或糖蛋白和抗体片段两者。包膜蛋白或糖蛋白可衍生自本领域已知的赋予VLP嗜性的任何包膜病毒，包括但不限于由以下组成的组：甲型流感病毒、乙型流感病毒、丙型流感病毒、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、丁型肝炎病毒、戊型肝炎病毒、轮状病毒、诺沃克病毒、肠道腺病毒、细小病毒、登革热病毒、猴痘、单负链病毒目(Mononegavirales)、狂犬病病毒、拉格斯蝙蝠病毒、莫科拉病毒、杜文黑基病毒、欧洲蝙蝠病毒1、欧洲蝙蝠病毒2、澳大利亚蝙蝠病毒、暂时热病毒、水泡病毒、水泡性口炎病毒(VSV)、单纯疱疹病毒1型、单纯疱疹病毒2型、水痘带状疱疹病毒、巨细胞病毒、爱泼斯坦-巴尔病毒(EBV)、人类疱疹病毒(HHV)、人类疱疹病毒6型、人类疱疹病毒8型、人类免疫缺陷病毒(HIV)、乳头瘤病毒、鼠丙型疱疹病毒、阿根廷出血热病毒、玻利维亚出血热病毒、萨比亚相关出血热病毒、委内瑞拉出血热病毒、拉沙热病毒、马丘波病毒、淋巴细胞性脉络丛脑膜炎病毒(LCMV)、克里米亚-刚果出血热病毒、汉坦病毒、裂谷热病毒、埃博拉出血热病毒、马尔堡出血热病毒、科萨努尔森林病病毒、鄂木斯克出血热病毒、蜱传脑炎病毒、亨德拉病毒、尼帕病毒、重型天花病毒、轻型天花病毒、委内瑞拉马脑炎病毒、东部马脑炎病毒、西部马脑炎病毒、SARS相关冠状病毒(SARS-CoV)和西尼罗河病毒。在一些实施例中，用于生产VLP的包装细胞选自由以下组成的组：HEK293细胞、Lenti-X293T细胞、BHK细胞、HepG2、Saos-2、HuH7、NS0细胞、SP2/0细胞、YO骨髓瘤细胞、A549细胞、P3X63小鼠骨髓瘤细胞、PER细胞、PER.C6细胞、杂交瘤细胞、VERO、NIH3T3细胞、COS、WI38、MRC5、A549、HeLa细胞(例如，B-50)、CHO细胞和HT1080细胞。在生产和回收包含本文所述任一实施例的CasX:gNA RNP的VLP后，VLP可用于通过施用这种VLP来编辑受试者的靶细胞的方法，如下文更充分描述。

VII.治疗方法

本公开提供了治疗有需要的受试者的PCSK9相关病症的方法，该病症包括但不限于常染色体显性高胆固醇血症(ADH)、高胆固醇血症、总胆固醇水平升高、低密度脂蛋白(LDL)水平升高、高密度脂蛋白水平降低、肝脂肪变性、动脉粥样硬化性心血管疾病和冠状动脉疾病、局部缺血、中风、外周血管疾病、血栓形成、2型糖尿病、高血压、肥胖症、阿尔茨海默病、神经变性、年龄相关性黄斑变性(AMD)或其组合。在一些实施例中，本公开的方法可以通过向受试者施用本公开的组合物来预防、治疗和/或改善受试者的PCSK9相关病症。在一些实施例中，向受试者施用的组合物还包含药学上可接受的载体、稀释剂或赋形剂。

在一些情况下，受试者的PCSK9基因的一个或两个等位基因包含突变。在一些情况下，PCSK9相关病症突变是功能获得性突变，包括但不限于编码选自由以下组成的组的氨基酸取代的突变：相对于SEQ ID NO:33的序列的S127R、D129G、F216L、D374H和D374Y。在其他情况下，PCSK9相关病症突变是功能丧失性突变，包括但不限于编码选自由以下组成的组的氨基酸取代的突变：相对于SEQ ID NO:33的序列的R46L、G106R、Y142X、N157K、R237W和C679X。在其他情况下，PCSK9相关病症突变包含表B中公开的PCKS9等位基因。在其他情况下，PCSK9基因编码改变PCSK9蛋白的功能或表达的突变，例如但不限于，与野生型序列相比，一个或多个核苷酸的取代、缺失或插入。

在一些实施例中，本公开提供了治疗有需要的受试者的PCSK9或相关病症的方法，所述方法包括修饰受试者细胞中的PCSK9基因，该修饰包括使所述细胞与治疗有效剂量的以下物质接触：i)包含本文描述的任一实施例的CasX和gNA的组合物；ii)包含本文描述的任一实施例的CasX、gNA和供体模板的组合物；iii)编码或包含(i)或(ii)的组合物的一种或多种核酸；iv)载体，该载体选自由逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒(AAV)载体、单纯疱疹病毒(HSV)载体组成的组，并且包含(iii)的核酸；v)包含(i)或(ii)的组合物的VLP；或vi)(i)-(v)中两者或更多者的组合，其中细胞的PCSK9基因被CasX蛋白和任选的供体模板修饰，使得表达野生型或功能性PCSK9蛋白。在该方法的一些实施例中，使用具有本文描述的任一实施例的支架的第二gNA，其中与第一gNA相比，第二gNA具有与靶核酸的不同或重叠部分互补的靶向序列，引起受试者细胞的PCSK9靶核酸中的额外断裂。在上文中，该基因可以通过NHEJ宿主修复机制进行修饰，或者与通过HDR或HITI机制插入的供体模板一起使用，以切除或校正突变，引起功能性PCSK9蛋白的表达。被治疗的受试者的经修饰的细胞可以是选自由啮齿动物细胞、小鼠细胞、大鼠细胞、灵长类动物细胞、非人灵长类动物细胞和人类细胞组成的组的真核细胞。在一些实施例中，被治疗的受试者的真核细胞是人类细胞。在一些实施例中，细胞是参与LDL产生的细胞，包括但不限于肝细胞，或肠、肾、中枢神经系统的细胞，平滑肌细胞，巨噬细胞，视网膜细胞，或动脉壁如内皮的细胞。在一些实施例中，细胞是眼细胞。在一些实施例中，细胞包含细胞中PCSK9基因的至少一个经修饰的等位基因，其中该修饰用于校正受试者中的突变。在一些情况下，受试者的突变是功能获得性突变。在其他情况下，受试者的突变是功能丧失性突变。

在治疗方法的一些实施例中，该方法包括向受试者施用治疗有效剂量的本文描述的任一实施例的载体，该载体包含或编码CasX蛋白和gNA，以及任选的供体模板(上文所述)，其中受试者的细胞与载体的接触使得细胞的靶核酸被CasX:gNA复合物修饰。在一些实施例中，该方法包括施用包含或编码CasX和靶向PCSK9基因中不同位置的多个gNA的载体，其中受试者的细胞与CasX:gNA复合物的接触使得细胞的靶核酸被修饰。在一个具体实施例中，载体是选自由AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV 44.9、AAV-Rh74或AAVRh10组成的组的AAV。将实施例的载体以治疗有效剂量施用于受试者。在一些实施例中，将载体以至少约1x 10⁵个载体基因组/kg(vg/kg)、至少约1x10⁶vg/kg、至少约1x 10⁷vg/kg、至少约1x 10⁸vg/kg、至少约1x 10⁹vg/kg、至少约1x 10¹⁰vg/kg、至少约1x 10¹¹vg/kg、至少约1x 10¹²vg/kg、至少约1x10¹³vg/kg、至少约1x 10¹⁴vg/kg、至少约1x 10¹⁵vg/kg、或至少约1x 10¹⁶vg/kg的剂量施用于受试者。在该方法的其他实施例中，将VLP以至少约1x 10⁵个粒子/kg、至少约1x 10⁶个粒子/kg、至少约1x 10⁷个粒子/kg、至少约1x 10⁸个粒子/kg、至少约1x 10⁹个粒子/kg、至少约1x 10¹⁰个粒子/kg、至少约1x 10¹¹个粒子/kg、至少约1x 10¹²个粒子/kg、至少约1x 10¹³个粒子/kg、至少约1x 10¹⁴个粒子/kg、至少约1x 10¹⁵个粒子/kg、或至少约1x 10¹⁶个粒子/kg的剂量施用于受试者。载体或VLP可以通过选自由静脉内、门静脉内注射、腹膜内、肌内、皮下、眼内和口服途径组成的组的施用途径施用。在治疗受试者的PCSK9相关病症的方法的一些实施例中，受试者选自由小鼠、大鼠、猪、非人灵长类动物和人类组成的组。

在治疗方法的其他实施例中，该方法包括进一步向受试者施用额外的CRISPR蛋白或编码额外的CRISPR蛋白的多核苷酸。在前述实施例中，额外的CRISPR蛋白具有不同于该方法的第一CasX蛋白的序列。在一些实施例中，额外的CRISPR蛋白不是CasX蛋白；即是Cpf1、Cas9、Cas10、Cas12a或Cas13a。在一些情况下，治疗方法中使用的gNA是单分子gNA(sgNA)。在其他情况下，gNA是双分子gNA(dgNA)。在其他情况下，该方法包括使靶核酸序列与靶向PCSK9基因的不同或重叠序列的多个gNA接触。

多种治疗策略已用于设计用于治疗患有PCSK9相关病症的受试者的方法的组合物。在一些实施例中，本发明提供治疗患有PCSK9相关病症的受试者的方法，该方法包括根据包含一个或多个连续剂量的治疗方案，使用治疗有效剂量向该受试者施用本文公开的任一实施例的CasX:gNA组合物或载体。在治疗方案的一些实施例中，组合物或载体的治疗有效剂量以单次剂量施用。在治疗方案的其他实施例中，治疗有效剂量以经至少两周、或至少一个月、或至少两个月、或至少三个月、或至少四个月、或至少五个月、或至少六个月的时段的两个或更多个剂量向受试者施用。在治疗方案的一些实施例中，有效剂量通过选自由静脉内、门静脉内注射、腹膜内、肌内、皮下、眼内和口服途径组成的组的途径施用。

在治疗患有PCSK9相关病症的受试者的方法的一些实施例中，该方法包括根据包含一个或多个连续剂量的治疗方案，使用治疗有效剂量向受试者施用呈本文公开的VLP内的RNP形式的CasX:gNA组合物。

在一些实施例中，向患有PCSK9相关病症的受试者施用治疗有效量的CasX:gNA模态(包括包含编码CasX蛋白的多核苷酸及引导核酸的载体)，或施用本文公开的CasX-gNA组合物以敲低或敲除PCSK9表达引起潜在PCSK9相关病症的预防或改善，使得在受试者中观测到改善，尽管如此，受试者仍可能罹患潜在病症。在一些实施例中，施用治疗有效量的CasX-gNA模态引起至少一个临床相关终点的改善，包括但不限于LDL-胆固醇从基线的百分比变化、粥样斑块体积的减少、冠状动脉斑块的减少、动脉粥样硬化性心血管疾病(ASCVD)、心血管性死亡、非致死性心肌梗死、缺血性中风、非致死性中风、冠状动脉血运重建、不稳定型心绞痛或视敏度的减少。在一些实施例中，施用治疗有效量的CasX-gNA模态引起至少两个临床相关终点的改善。在一些实施例中，受试者选自小鼠、大鼠、猪、狗、非人灵长类动物和人类。

在一些实施例中，治疗方法还包括施用化学治疗剂，其中该药剂能有效降低LDL水平。此类药剂包括但不限于他汀类、烟酸、贝特类或抗PCSK9抗体药物。

从被治疗的受试者获得用于分析以确定治疗效果的样品(例如体液或组织)的方法，以及制备允许分析的样品的方法是本领域技术人员所熟知的。分析RNA和蛋白质水平的方法已在上文讨论，并且为本领域技术人员所熟知。还可以通过本领域已知的常规临床方法，从与本发明的一种或多种化合物接触的动物收集的上述流体、组织或器官中测量与靶基因表达相关的生物标记物，从而评估治疗效果。PCSK9病症的生物标记物包括但不限于PCSK9水平、低密度脂蛋白(LDL-胆固醇)、载脂蛋白B、非HDL胆固醇、甘油三酯和脂蛋白a、可溶性CD40配体、骨桥蛋白(OPN)、骨保护素(OPG)、基质金属蛋白酶(MMP)和髓过氧化物酶(MPOP)，其中将标记物的浓度与已知生理正常或未患有PCSK9病症的受试者中的浓度进行比较。

存在几种表达PCSK9突变形式的小鼠模型，并且这些小鼠模型适于评价治疗方法。PCSK9相关病症的转基因小鼠模型包括具有hPCSK9的敲入小鼠模型(Carreras,A.In vivogenome and base editing of a human PCSK9 knock-in hypercholesterolemic mousemodel.MC Biology 17:4(2019)；Herbert B.等人，Increased secretion oflipoproteins in transgenic mice expressing human D374Y PCSK9 underphysiological genetic control.Arterioscler Thromb Vasc Biol.30(7):1333(2010))。

VIII.药物组合物、试剂盒和制品

在一些实施例中，本公开提供了药物组合物，所述药物组合物包含：i)本公开的任一实施例的CasX蛋白和一种或多种gNA，其包含对PCSK9基因具有特异性的靶向序列；ii)编码(i)的CasX和gNA的一种或多种核酸；iii)包含(ii)的一种或多种核酸的载体；或iv)包含(i)的CasX和gNA的RNP的VLP；以及一种或多种药学上合适的赋形剂。在一些实施例中，药物组合物被配制用于选自由静脉内、门静脉内注射、腹膜内、肌内、皮下、眼内和口服途径组成的组的施用途径。在一个实施例中，药物组合物是液体形式或冷冻形式。在另一个实施例中，药物组合物位于用于单次注射的预填充注射器中。在另一个实施例中，药物组合物是固体形式，例如药物组合物是冻干的。

在其他实施例中，本文提供了包含本公开的任一实施例的CasX蛋白和一种或多种CasX gNA及合适的容器(例如管、小瓶或平板)的试剂盒，所述CasX gNA包含对PCSK9基因具有特异性的靶向序列。在示例性实施例中，本公开的试剂盒包含SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488、490中任一者的CasX变异体。

在一些实施例中，试剂盒包含gNA或编码gNA的载体，其中gNA包含选自由SEQ IDNO:247-303、315-436、612-2100或2286-13861组成的组的序列。在一些实施例中，gNA包含选自由SEQ ID NO:2101-2285组成的组的序列。在一些实施例中，gNA包含选自由SEQ IDNO:2236、2237、2238、2241、2244、2248、2249和2259-2285组成的组的序列。

在某些实施例中，本文提供了包含CasX蛋白和gNA编辑对的试剂盒，该编辑对包含表3、5、6、7和9中所列的SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488、490的CasX变异蛋白和本文所述的gNA变异体(例如，SEQ ID NO:2101-2285)。在示例性实施例中，本公开的试剂盒包含CasX和gNA编辑对，其中CasX变异体包含SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488、490中的任一者。在一些实施例中，基因编辑对的gNA包含SEQ ID NO:247-303、315-436、612-2100或2286-13861中的任一者。在一些实施例中，基因编辑对的gNA包含SEQ IDNO:2101-2285中任一者的支架序列和SEQ ID NO:247-303、315-436、612-2100或2286-13861中任一者的靶向序列。在一些实施例中，基因编辑对的gNA包含SEQ ID NO:2236、2237、2238、2241、2244、2248、2249或2259-2285中任一者的支架序列和SEQ ID NO:247-303、315-436、612-2100或2286-13861中任一者的靶向序列。

在一些实施例中，试剂盒进一步包含缓冲剂、核酸酶抑制剂、蛋白酶抑制剂、脂质体、治疗剂、标记、标记显色剂、或前述的任何组合。在一些实施例中，试剂盒进一步包含药学上可接受的载剂、稀释剂或赋形剂。

在一些实施例中，试剂盒包含用于基因修饰应用的适当对照组合物，及使用说明书。

在一些实施例中，试剂盒包含载体，其包含编码本公开的CasX蛋白、本公开的CasXgNA、任选的供体模板或其组合的序列。

IX.列举的实施例

本说明书阐述大量示例性配置、方法、参数等。然而，应认识到，此类描述并不旨在作为本公开的范围的限制，而是替代地作为示例性实施例的描述而提供。上文所述的本发明主题的实施例可有益地单独或与一个或多个其他方面或实施例组合。在不限制前述说明书的情况下，本公开的某些非限制性实施例提供于下文中。如本领域技术人员在阅读本公开时将显而易见，经单独编号的实施例中的每一者可与之前或之后经单独编号的实施例中的任一者一起使用或组合。这旨在为实施例的所有此类组合提供支持，且不限于以下明确提供的实施例组合：

本发明可以通过参考以下列举的说明性实施例来定义：

实施例1.一种包含CasX蛋白和引导核酸(gNA)的CasX:gNA系统，其中所述gNA包含靶向序列，所述靶向序列与包含前蛋白转化酶枯草杆菌蛋白酶/kexin 9型(PCSK9)基因的靶核酸序列互补。

实施例2.根据实施例1所述的CasX:gNA系统，其中所述PCSK9基因包含一个或多个突变。

实施例3.根据实施例1或实施例2所述的CasX:gNA系统，其中所述PCSK9基因编码包含一个或多个突变的PCSK9蛋白。

实施例4.根据实施例3所述的CasX:gNA系统，其中所述一个或多个突变包含选自由以下组成的组的氨基酸取代：相对于SEQ ID NO:33的序列的S127R、D129G、F216L、D374H和D374Y。

实施例5.根据实施例2至4中任一项所述的CasX:gNA系统，其中所述突变是功能获得性突变。

实施例6.根据前述实施例中任一项所述的CasX:gNA系统，其中所述gNA是引导RNA(gRNA)。

实施例7.根据实施例1至6中任一项所述的CasX:gNA系统，其中所述gNA是引导DNA(gDNA)。

实施例8.根据实施例1至6中任一项所述的CasX:gNA系统，其中所述gNA是包含DNA和RNA的嵌合体。

实施例9.根据实施例1至8中任一项所述的CasX:gNA系统，其中所述gNA是单分子gNA(sgNA)。

实施例10.根据实施例1至8中任一项所述的CasX:gNA系统，其中所述gNA是双分子gNA(dgNA)。

实施例11.根据实施例1至10中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列与包含所述PCSK9基因的一个或多个单核苷酸多态性(SNP)的序列互补。

实施例12.根据实施例1至10中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列包含选自由SEQ ID NO:247-303、315-436、612-2100和2286-13861组成的组的序列。

实施例13.根据实施例1至10中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了单个核苷酸。

实施例14.根据实施例1至10中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了两个核苷酸。

实施例15.根据实施例1至10中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了三个核苷酸。

实施例16.根据实施例1至10中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了四个核苷酸。

实施例17.根据实施例1至10中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了五个核苷酸。

实施例18.根据实施例1至10中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列包含与选自由SEQ ID NO:247-303、315-436、612-2100和2286-13861组成的组的序列具有至少约65％、至少约75％、至少约85％或至少约95％同一性的序列。

实施例19.根据实施例1至10中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列包含相对于SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列具有一个或多个单核苷酸多态性(SNP)的序列。

实施例20.根据实施例1至19中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列与所述PCSK9基因的非编码区互补。

实施例21.根据实施例1至19中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列与所述PCSK9基因的编码区互补。

实施例22.根据实施例1至19中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列与PCSK9外显子的序列互补。

实施例23.根据实施例1至19中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列与PCSK9内含子的序列互补。

实施例24.根据实施例1至19中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列与PCSK9内含子-外显子连接处的序列互补。

实施例25.根据实施例1至19中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列与PCSK9调节区的序列互补。

实施例26.根据实施例1至19中任一项所述的CasX:gNA系统，其中所述gNA的所述靶向序列与所述PCSK9基因的基因间区的序列互补。

实施例27.根据实施例1至26中任一项所述的CasX:gNA系统，所述CasX:gNA系统还包含第二gNA，其中与前述实施例中任一项的所述gNA的所述靶向序列相比，所述第二gNA具有与所述靶核酸序列的不同或重叠部分互补的靶向序列。

实施例28.根据实施例1至27中任一项所述的CasX:gNA系统，其中所述gNA具有支架，所述支架包含选自由SEQ ID NO:4-16和2101-2285组成的组的序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的序列。

实施例29.根据实施例1至28中任一项所述的CasX:gNA系统，其中所述gNA具有支架，所述支架包含相对于参考gNA序列具有至少一个修饰的序列，所述参考gNA序列选自由SEQ ID NO:4-16的序列组成的组。

实施例30.根据实施例29所述的CasX:gNA系统，其中所述参考gNA的所述至少一个修饰包括所述gNA序列的核苷酸的至少一个取代、缺失或插入。

实施例31.根据实施例1至30中任一项所述的CasX:gNA系统，其中所述gNA是经化学修饰的。

实施例32.根据实施例1至31中任一项所述的CasX:gNA系统，其中所述CasX蛋白包含具有SEQ ID NO:1-3中任一者的序列的参考CasX蛋白、具有SEQ ID NO:49-160、439、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490的序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、或至少约99％序列同一性的序列的CasX变异蛋白。

实施例33.根据实施例32所述的CasX:gNA系统，其中所述CasX蛋白对选自由TTC、ATC、GTC和CTC组成的组的前间隔子邻近基序(PAM)序列具有结合亲和力。

实施例34.根据实施例32或实施例33所述的CasX:gNA系统，其中所述CasX变异蛋白相对于具有选自SEQ ID NO:1-3的序列的参考CasX蛋白包含至少一个修饰。

实施例35.根据实施例34所述的CasX:gNA系统，其中相对于所述参考CasX蛋白，所述至少一个修饰包括在所述CasX变异蛋白的域中的至少一个氨基酸取代、缺失或插入。

实施例36.根据实施例35所述的CasX:gNA系统，其中所述域选自由非靶链结合(NTSB)域、靶链负载(TSL)域、螺旋形I域、螺旋形II域、寡核苷酸结合域(OBD)和RuvC DNA裂解域组成的组。

实施例37.根据实施例32至36中任一项所述的CasX:gNA系统，其中所述CasX蛋白进一步包含一个或多个核定位信号(NLS)。

实施例38.根据实施例37所述的CasX:gNA系统，其中所述一个或多个NLS选自由以下组成的序列的组：PKKKRKV(SEQ ID NO:217)、KRPAATKKAGQAKKKK(SEQ ID NO:223)、PAAKRVKLD(SEQ ID NO:224)、RQRRNELKRSP(SEQ ID NO:161)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:162)、RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQID NO:163)、VSRKRPRP(SEQ ID NO:164)、PPKKARED(SEQ ID NO:165)、PQPKKKPL(SEQ IDNO:166)、SALIKKKKKMAP(SEQ ID NO:167)、DRLRR(SEQ ID NO:168)、PKQKKRK(SEQ ID NO:169)、RKLKKKIKKL(SEQ ID NO:170)、REKKKFLKRR(SEQ ID NO:171)、KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:172)、RKCLQAGMNLEARKTKK(SEQ ID NO:173)、PRPRKIPR(SEQ ID NO:174)、PPRKKRTVV(SEQ ID NO:175)、NLSKKKKRKREK(SEQ ID NO:176)、RRPSRPFRKP(SEQ ID NO:177)、KRPRSPSS(SEQ ID NO:178)、KRGINDRNFWRGENERKTR(SEQ ID NO:179)、PRPPKMARYDN(SEQ ID NO:180)、KRSFSKAF(SEQ ID NO:181)、KLKIKRPVK(SEQ ID NO:182)、PKTRRRPRRSQRKRPPT(SEQ ID NO:184)RRKKRRPRRKKRR(SEQ ID NO:187)、PKKKSRKPKKKSRK(SEQ ID NO:188)、HKKKHPDASVNFSEFSK(SEQ ID NO:189)、QRPGPYDRPQRPGPYDRP(SEQ IDNO:190)、LSPSLSPLLSPSLSPL(SEQ ID NO:191)、RGKGGKGLGKGGAKRHRK(SEQ ID NO:192)、PKRGRGRPKRGRGR(SEQ ID NO:193)、MSRRRKANPTKLSENAKKLAKEVEN(SEQ ID NO:185)、PKKKRKVPPPPAAKRVKLD(SEQ ID NO:183)和PKKKRKVPPPPKKKRKV(SEQ ID NO:194)。

实施例39.根据实施例37或实施例38所述的CasX:gNA系统，其中所述一个或多个NLS位于所述CasX蛋白的C端。

实施例40.根据实施例37或实施例38所述的CasX:gNA系统，其中所述一个或多个NLS位于所述CasX蛋白的N端。

实施例41.根据实施例37或实施例38所述的CasX:gNA系统，其中所述一个或多个NLS位于所述CasX蛋白的N端和C端。

实施例42.根据实施例32至41中任一项所述的CasX:gNA系统，其中与参考CasX蛋白和所述gNA相比，所述CasX变异蛋白和所述gNA表现出至少一种或多种改进特征。

实施例43.根据实施例42所述的CasX:gNA系统，其中所述改进特征选自由以下组成的组：改进的所述CasX蛋白的折叠、所述CasX蛋白对所述gNA的改进结合亲和力、改进的核糖核蛋白复合物(RNP)形成、更高百分比的裂解感受态RNP、对所述靶核酸序列的改进结合亲和力、对一个或多个PAM序列的改变结合亲和力、改进的所述靶核酸序列的解链、增加的活性、增加的靶核酸序列裂解速率、改进的编辑效率、改进的编辑特异性、增加的核酸酶活性、增加的用于双链裂解的靶链负载、减少的用于单链切割的靶链负载、减少的脱靶裂解、改进的DNA非靶链的结合、改进的CasX蛋白质稳定性、改进的蛋白质:引导RNA复合物稳定性、改进的蛋白质溶解度、改进的蛋白质:gNA复合物溶解度、改进的蛋白质产率、改进的蛋白质表达和改进的融合特征。

实施例44.根据实施例42或实施例43所述的CasX:gNA系统，其中相对于SEQ IDNO:1、SEQ ID NO:2或SEQ ID NO:3的所述参考CasX蛋白，所述CasX变异蛋白的所述改进特征是改进至少约1.1至约100,000倍。

实施例45.根据实施例42或实施例43所述的CasX:gNA系统，其中相对于SEQ IDNO:1、SEQ ID NO:2或SEQ ID NO:3的所述参考CasX蛋白，所述CasX变异蛋白的所述改进特征是改进至少约10倍、至少约100倍、至少约1,000倍或至少约10,000倍。

实施例46.根据实施例43至45中任一项所述的CasX:gNA系统，其中所述改进特征是对所述靶核酸序列的改进结合亲和力。

实施例47.根据实施例43至45中任一项所述的CasX:gNA系统，其中所述改进特征是增加的靶核酸序列裂解速率。

实施例48.根据实施例43至45中任一项所述的CasX:gNA系统，其中所述改进特征是增加的对一个或多个PAM序列的结合亲和力，其中所述一个或多个PAM序列选自由TTC、ATC、GTC和CTC组成的组。

实施例49.根据前述实施例中任一项所述的CasX:gNA系统，其中所述CasX变异蛋白和所述gNA在RNP中缔合在一起。

实施例50.根据实施例49所述的CasX:gNA系统，其中与参考CasX和所述gNA的RNP相比，所述RNP具有更高百分比的裂解感受态RNP。

实施例51.根据实施例32至50中任一项所述的CasX:gNA系统，其中所述CasX变异蛋白包含具有切口酶活性的核酸酶域。

实施例52.根据实施例51所述的CasX:gNA系统，其中所述CasX变异体可仅裂解双链靶核酸分子的一条链。

实施例53.根据实施例1至50中任一项所述的CasX:gNA系统，其中所述CasX变异蛋白包含具有双链裂解活性的核酸酶域。

实施例54.根据实施例1至41中任一项所述的CasX:gNA系统，其中所述CasX蛋白为无催化活性CasX(dCasX)蛋白，且其中所述dCasX及所述gNA保留结合至所述靶核酸序列的能力。

实施例55.根据实施例54所述的CasX:gNA系统，其中所述dCasX包含以下残基处的突变：

a)对应于SEQ ID NO:1的所述参考CasX蛋白的D672、E769及/或D935；或

b)对应于SEQ ID NO:2的所述参考CasX蛋白的D659、E756及/或D922。

实施例56.根据实施例55所述的CasX:gNA系统，其中所述突变是丙氨酸对所述残基的取代。

实施例57.根据实施例1至53中任一项所述的CasX:gNA系统，所述CasX:gNA系统进一步包含供体模板核酸。

实施例58.根据实施例57所述的CasX:gNA系统，其中所述供体模板包含一定核酸，所述核酸包含所述PCSK9基因的至少一部分，其中所述PCSK9基因部分选自由PCSK9外显子、PCSK9内含子、PCSK9内含子-外显子连接处、所述PCSK9调节区或其组合组成的组。

实施例59.根据实施例57或实施例58所述的CasX:gNA系统，其中所述供体模板包含与位于所述靶核酸中的裂解位点侧翼的序列互补的同源臂。

实施例60.根据实施例57至59所述的CasX:gNA系统，其中所述供体模板的大小范围为10-15,000个核苷酸。

实施例61.根据实施例57至60中任一项所述的CasX:gNA系统，其中所述供体模板是单链DNA模板或单链RNA模板。

实施例62.根据实施例57至60中任一项所述的CasX:gNA系统，其中所述供体模板是双链DNA模板。

实施例63.根据实施例57至62中任一项所述的CasX:gNA系统，其中与野生型PCSK9基因相比，所述供体模板包含一个或多个突变。

实施例64.根据实施例57至62中任一项所述的CasX:gNA系统，其中与野生型PCSK9基因相比，所述供体模板包含异源序列。

实施例65.根据实施例57至62中任一项所述的CasX:gNA系统，其中所述供体模板包含野生型PCSK9基因的全部或一部分。

实施例66.一种核酸，所述核酸包含编码根据实施例1至56中任一项所述的CasX:gNA系统的序列。

实施例67.根据实施例66所述的核酸，其中编码所述CasX蛋白的所述序列经密码子优化以表达于真核细胞中。

实施例68.一种载体，所述载体包含根据实施例66或实施例67所述的核酸。

实施例69.根据实施例68所述的载体，其中所述载体进一步包含启动子。

实施例70.一种包含供体模板的载体，其中所述供体模板包含一定核酸，所述核酸包含PCSK9基因的至少一部分，其中所述PCSK9基因部分选自由PCSK9外显子、PCSK9内含子、PCSK9内含子-外显子连接处和PCSK9调节区组成的组。

实施例71.根据实施例70所述的载体，其中与野生型PCSK9基因相比，所述供体模板包含一个或多个突变。

实施例72.根据实施例70或实施例71所述的载体，所述载体进一步包含根据实施例66或实施例67所述的核酸。

实施例73.根据实施例68至70中任一项所述的载体，其中所述载体选自由逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒(AAV)载体、单纯疱疹病毒(HSV)载体、病毒样粒子(VLP)、质粒、微环、纳米质粒和RNA载体组成的组。

实施例74.根据实施例73所述的载体，其中所述载体是AAV载体。

实施例75.根据实施例74所述的载体，其中所述AAV载体选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV-Rh74或AAVRh10。

实施例76.根据实施例73所述的载体，其中所述载体是逆转录病毒载体。

实施例77.根据实施例73所述的载体，其中编码所述VLP的所述载体包含编码gag多蛋白、根据实施例32至56中任一项所述的CasX蛋白和根据实施例1至31中任一项的gNA的一种或多种核酸。

实施例78.一种病毒样粒子(VLP)，所述VLP包含根据实施例32至56中任一项所述的CasX蛋白和根据实施例1至31中任一项所述的gNA。

实施例79.根据实施例78所述的VLP，其中所述CasX蛋白和所述gNA在RNP中缔合在一起。

实施例80.一种修饰PCSK9靶核酸序列的方法，所述方法包括使所述靶核酸序列与CasX蛋白和包含靶向序列的引导核酸(gNA)接触，其中所述接触包括向细胞中引入：

a)根据实施例1至65中任一项所述的CasX:gNA系统；

b)根据实施例66或实施例67所述的核酸；

c)根据实施例68至77中任一项所述的载体；

d)根据实施例78或实施例79所述的VLP；或者

e)其组合，

实施例81.其中所述接触使得所述PCSK9靶核酸序列被所述CasX蛋白修饰。

实施例82.根据实施例80所述的方法，其中所述CasX蛋白及所述gNA在核糖核蛋白复合物(RNP)中缔合在一起。

实施例83.根据实施例80或实施例81所述的方法，所述方法进一步包括第二gNA或编码所述第二gNA的核酸，其中所述第二gNA具有与所述靶核酸序列的不同部分或其互补序列互补的靶向序列。

实施例84.根据实施例80至82中任一项所述的方法，其中所述PCSK9基因包含突变。

实施例85.根据实施例83所述的方法，其中所述突变是功能获得性突变。

实施例86.根据实施例80至82中任一项所述的方法，其中所述PCSK9基因包含野生型序列。

实施例87.根据实施例80至85中任一项所述的方法，其中所述修饰包括在所述靶核酸序列中引入单链断裂。

实施例88.根据实施例80至85中任一项所述的方法，其中所述修饰包括在所述靶核酸序列中引入双链断裂。

实施例89.根据实施例80至87中任一项所述的方法，其中所述修饰包括与所述野生型序列相比，在所述靶核酸序列中引入一个或多个核苷酸的插入、缺失、取代、重复或倒位。

实施例90.根据实施例80至88中任一项所述的方法，其中所述靶核酸序列的所述修饰发生在细胞内部。

实施例91.根据实施例80至89中任一项所述的方法，其中所述靶核酸序列的所述修饰发生在体内。

实施例92.根据实施例80至90中任一项的方法，其中所述细胞为真核细胞。

实施例93.根据实施例91所述的方法，其中所述真核细胞选自由啮齿动物细胞、小鼠细胞、大鼠细胞、猪细胞、灵长类动物细胞、非人灵长类细胞和人类细胞组成的组。

实施例94.根据实施例92所述的方法，其中所述真核细胞是人类细胞。

实施例95.根据实施例80至94中任一项所述的方法，其中所述细胞选自由肝细胞、肠细胞、肾细胞、中枢神经系统细胞、平滑肌细胞、巨噬细胞和动脉内皮细胞组成的组。

实施例96.根据实施例80至94中任一项所述的方法，其中所述方法进一步包括使所述靶核酸序列与互补于PCSK9基因的至少一部分的供体模板接触，其中将所述供体模板插入所述靶核酸序列中以替换所述靶核酸序列的全部或一部分。

实施例97.根据实施例96所述的方法，其中与所述野生型PCSK9基因序列相比，所述供体模板包含一个或多个突变，并且其中所述插入引起所述PCSK9基因的敲低或敲除。

实施例98.根据实施例96所述的方法，其中所述供体模板包含野生型PCSK9基因序列的全部或一部分，其中所述插入校正了所述PCSK9基因的一个或多个突变。

实施例99.根据实施例96至98中任一项所述的方法，其中所述供体模板的大小范围为10-15,000个核苷酸。

实施例100.根据实施例96至98中任一项所述的方法，其中所述供体模板的大小范围为100-1,000个核苷酸。

实施例101.根据实施例96至100中任一项所述的方法，其中所述供体模板是单链DNA模板或单链RNA模板。

实施例102.根据实施例96至100中任一项所述的方法，其中所述供体模板是双链DNA模板。

实施例103.根据实施例96至102中任一项所述的方法，其中通过同源定向修复(HDR)插入所述供体模板。

实施例104.根据实施例80至103中任一项的方法，其中所述载体以治疗有效剂量施用于受试者。

实施例105.根据实施例104所述的方法，其中所述受试者选自由以下组成的组：小鼠、大鼠、猪、非人灵长类动物及人类。

实施例106.根据实施例104所述的方法，其中所述受试者是人类。

实施例107.根据实施例80至106中任一项所述的方法，其中所述载体以至少约1×1010个载体基因组(vg)，或至少约1x 10¹¹vg，或至少约1x 10¹²vg，或至少约1x 10¹³vg，或至少约1x 10¹⁴vg，或至少约1x 10¹⁵vg，或至少约1x 10¹⁶vg的剂量施用。

实施例108.根据实施例80至106中任一项所述的方法，其中所述载体通过选自由静脉内、门静脉内注射、腹膜内、肌内、皮下和口服途径组成的组的施用途径施用。

实施例109.根据实施例80至108中任一项所述的方法，所述方法包括使所述靶核酸序列进一步与额外的CRISPR蛋白或编码所述额外的CRISPR蛋白的多核苷酸接触。

实施例110.根据实施例109所述的方法，其中所述额外的CRISPR蛋白是具有与根据前述实施例中任一项所述的CasX蛋白不同的序列的CasX蛋白。

实施例111.根据实施例109所述的方法，其中所述额外的CRISPR蛋白不是CasX蛋白。

实施例112.一种改变细胞的PCSK9靶核酸序列的方法，所述方法包括使所述细胞与以下物质接触：

a)根据实施例1至65中任一项所述的CasX:gNA系统；

b)根据实施例66或实施例67所述的核酸；

c)根据实施例68至77中任一项所述的载体；

d)根据实施例78或实施例79所述的VLP；或者

e)其组合。

实施例113.根据实施例112所述的方法，其中所述细胞已经被修饰，使得与未被修饰的细胞相比，所述PCSK9蛋白的表达减少至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。

实施例114.根据实施例112或实施例113所述的方法，其中所述细胞已经被修饰，使得所述细胞不表达可检测水平的所述PCSK9蛋白。

实施例115.一种通过根据实施例112或实施例113所述的方法修饰的细胞群，其中所述细胞已经被修饰，使得至少10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％的所述修饰细胞不表达可检测水平的PCSK9蛋白。

实施例116.根据实施例115所述的细胞群，其中所述细胞是非灵长类哺乳动物细胞、非人灵长类动物细胞或人类细胞。

实施例117.根据实施例115或实施例116所述的细胞群，其中所述细胞选自由肝细胞、肠细胞、肾细胞、中枢神经系统细胞、平滑肌细胞、巨噬细胞和动脉内皮细胞组成的组。

实施例118.一种治疗有需要的受试者的PCSK9相关病症的方法，所述方法包括修饰所述受试者的细胞中的PCSK9基因，所述修饰包括使所述细胞与以下物质接触：

a)根据实施例1至65中任一项所述的CasX:gNA系统；

b)根据实施例66或实施例67所述的核酸；

c)根据实施例68至77中任一项所述的载体；

d)根据实施例78或实施例79所述的VLP；或者

e)其组合。

实施例119.根据实施例118所述的方法，其中所述PCSK9相关病症选自由常染色体显性高胆固醇血症(ADH)、高胆固醇血症、LDL升高、动脉粥样硬化性心血管疾病和冠状动脉疾病组成的组。

实施例120.根据实施例118或实施例119所述的方法，所述方法进一步包括第二gNA或编码所述第二gNA的核酸，其中所述第二gNA具有与所述靶核酸序列的不同或重叠部分互补的靶向序列。

实施例121.根据实施例118至120中任一项所述的方法，其中所述修饰在所述PCSK9基因中引入一个或多个突变，或者其中所述PCSK9蛋白的表达被抑制或阻止。

实施例122.根据实施例118至121中任一项所述的方法，其中所述方法包括使所述细胞与根据实施例57至65中任一项所述的供体模板接触。

实施例123.根据实施例118至122中任一项所述的方法，其中所述细胞选自由肝细胞、肠细胞、肾细胞、中枢神经系统细胞、平滑肌细胞、巨噬细胞和动脉内皮细胞组成的组。

实施例124.根据实施例118至123中任一项的方法，其中所述载体以治疗有效剂量施用于受试者。

实施例125.根据实施例124所述的方法，其中所述受试者选自由以下组成的组：小鼠、大鼠、猪、非人灵长类动物及人类。

实施例126.根据实施例124所述的方法，其中所述受试者是人类。

实施例127.根据实施例118至126中任一项所述的方法，其中所述载体以至少约1×10¹⁰个载体基因组(vg)，或至少约1x 10¹¹vg，或至少约1x 10¹²vg，或至少约1x 10¹³vg，或至少约1x 10¹⁴vg，或至少约1x 10¹⁵vg，或至少约1x 10¹⁶vg的剂量施用于所述受试者。

实施例128.根据实施例118至127中任一项所述的方法，其中所述载体通过选自由静脉内、门静脉内注射、腹膜内、肌内、皮下和口服途径组成的组的施用途径施用。

实施例129.根据实施例118至128中任一项所述的方法，所述方法包括使所述靶核酸序列进一步与额外的CRISPR蛋白或编码所述额外的CRISPR蛋白的多核苷酸接触。

实施例130.根据实施例129所述的方法，其中所述额外的CRISPR蛋白是具有与根据前述实施例中任一项所述的CasX不同的序列的CasX蛋白。

实施例131.根据实施例130所述的方法，其中所述额外的CRISPR蛋白不是CasX蛋白。

实施例132.根据实施例118至131中任一项所述的方法，其中所述方法进一步包括施用化学治疗剂。

实施例133.根据实施例118至132中任一项所述的方法，其中所述方法引起选自由以下组成的组的至少一个临床相关终点的改善：LDL-胆固醇从基线的百分比变化、粥样斑块体积的减少、冠状动脉斑块的减少、动脉粥样硬化性心血管疾病(ASCVD)、心血管性死亡、非致死性心肌梗死、缺血性中风、非致死性中风、冠状动脉血运重建和不稳定型心绞痛的减少。

实施例134.根据实施例118至132中任一项所述的方法，其中所述方法引起选自由以下组成的组的至少两个临床相关终点的改善：LDL-胆固醇从基线的百分比变化、粥样斑块体积的减少、冠状动脉斑块的减少、动脉粥样硬化性心血管疾病(ASCVD)、心血管性死亡、非致死性心肌梗死、缺血性中风、非致死性中风、冠状动脉血运重建或不稳定型心绞痛的减少。

以下实例仅为说明性的且不意图以任何方式限制本公开的任何方面。

实例

实例1：CasX Stx2的产生、表达及纯化

1.生长和表达

源自浮霉菌门(Planctomycetes)(包含SEQ ID NO:2的CasX氨基酸序列并由以下SEQ ID NO:437的序列编码)的CasX Stx2(本文也称为CasX2)的表达构建体由针对大肠杆菌优化密码子的基因片段(Twist Biosciences)构建。组装的构建体含有TEV-可裂解、C端、TwinStrep标签，且克隆至含有氨苄青霉素抗性基因的pBR322衍生的质粒主链中。将表达构建体转化至化学感受态BL21*(DE3)大肠杆菌中，且起子培养物在37℃、200RPM下在UltraYield烧瓶(Thomson Instrument Company)中于补充有羧苄青霉素的LB培养液中生长过夜。第二天，此培养物以1:100比率(起子培养物：表达培养物)用于种子表达培养物。将表达培养物接种至补充有羧苄青霉素的Terrific Broth(Novagen)中且在37℃、200RPM下于UltraYield烧瓶中生长。一旦培养物达到2的光密度(OD)，便将其冷却至16℃，且从1M原料中添加IPTG(异丙基β-D-1-硫代半乳糖苷)至1mM的最终浓度。培养物在16℃、200RPM下诱导20小时，随后通过在4℃下以4,000xg离心15分钟收获。将细胞浆料称重且以每克细胞浆料5mL裂解缓冲液的比率再悬浮于裂解缓冲液(50mM HEPES-NaOH，250mM NaCl，5mM MgCl₂，1mM TCEP，1mM苯甲脒-HCL，1mM PMSF，0.5％CHAPS，10％甘油，pH 8)中。一旦再悬浮，便将样品冷冻于-80℃直至纯化。

表4：CasX Stx2构建体的DNA序列

2.纯化

冷冻样品在4℃下在磁力搅拌下解冻过夜。通过超声处理降低所得裂解物的黏度，且通过使用Emulsiflex C3(Avestin)在17k PSI下分三次均质化来完成裂解。通过在4℃下以50,000x g离心30分钟来澄清裂解物且收集上清液。通过重力流将澄清的上清液上样到Heparin 6Fast Flow柱(GE Life Sciences)。用5CV肝素缓冲液A(50mM HEPES-NaOH，250mMNaCl，5mM MgCl₂，1mM TCEP，10％甘油，pH 8)洗涤柱子，接着用5CV肝素缓冲液B(NaCl浓度调节至500mM的缓冲液A)洗涤。用5CV的肝素缓冲液C(将NaCl浓度调整到1M的缓冲液A)洗脱蛋白质，收集级分。通过Bradford Assay分析各级分中的蛋白质，并将含蛋白质的级分汇集起来。通过重力流将合并的肝素洗脱液应用于Strep-Tactin XT Superflow柱(IBA LifeSciences)。用5CV的Strep缓冲液(50mM HEPES-NaOH，500mM NaCl，5mM MgCl₂，1mM TCEP，10％甘油，pH 8)洗涤柱子。使用添加50mM D-生物素的5CV Strep缓冲液自柱子洗脱蛋白质且收集级分。将含有CasX的级分合并，使用30kDa截止自旋浓缩器在4℃下浓缩，并在Superdex 200pg柱(GE Life Sciences)上通过尺寸排阻色谱法纯化。柱子用SEC缓冲液(25mM磷酸钠，300mM NaCl，1mM TCEP，10％甘油，pH 7.25)平衡，该缓冲液由AKTA纯FPLC系统(GE Life Sciences)操作。在适当分子量下洗脱的含CasX的级分经汇集，使用30kDa截止旋转浓缩器在4℃下浓缩，等分，且在液氮中急冻，随后存储于-80℃下。

3.结果

来自整个纯化程序的样品通过SDS-PAGE解析且通过胶体考马斯染色观测，如图1和图3中所示。在图1中，自左至右，通道为：分子量标准，沉淀物：细胞裂解之后的不溶性部分，裂解物：细胞裂解之后的可溶性部分，流经：不结合肝素柱的蛋白质，洗涤：洗涤缓冲液中自柱洗脱的蛋白质，洗脱：自肝素柱洗脱的蛋白质伴以洗脱缓冲液，流经：不结合StrepTactinXT柱的蛋白质，洗脱：自StrepTactin XT柱洗脱的蛋白质伴以洗脱缓冲液，注射：注射至s200凝胶过滤柱上的浓缩蛋白质，冷冻：已浓缩及冷冻的来自s200洗脱的汇集级分。在图3中，从右到左的通道是注射(将蛋白质样品注入凝胶过滤柱)分子量标记，通道3-9是指示洗脱体积的样品。来自凝胶过滤的结果如图2所示。68.36mL峰对应于CasX的表观分子量且含有大多数CasX蛋白。通过胶体考马斯染色评估，每升培养物的平均产量为0.75mg纯化CasX蛋白，纯度为75％。

实例2：CasX构建体119、438和457

为了产生CasX 119、438及457构建体(表5中的序列)，经密码子优化的CasX37构建体(基于实例1的Stx2构建体，编码浮霉菌门CasX SEQ ID NO:2，具有经融合NLS进行的A708K取代及[P793]缺失，及连接的引导序列和非靶向序列)使用标准克隆方法克隆至哺乳动物表达质粒(pStX；参见图4)中。为了构建CasX 119，在两个反应中使用Q5 DNA聚合酶(New England BioLabs目录号M0491L)并分别使用引物oIC539和oIC88以及oIC87和oIC540对CasX 37构建体DNA进行PCR扩增(参见图5)。为了构建CasX 457，在四个反应中使用Q5DNA聚合酶并分别使用引物oIC539和oIC212、oIC211和oIC376、oIC375和oIC551以及oIC550和oIC540对CasX 365构建体DNA进行PCR扩增。为了构建CasX 438，在四个反应中使用Q5DNA聚合酶并分别使用引物oIC539和oIC689、oIC688和oIC376、oIC375和oIC551以及oIC550和oIC540对CasX 119构建体DNA进行PCR扩增。然后使用Zymo clean DNA清洁及浓缩器(Zymo Research目录号4014)纯化所得PCR扩增产物，并使用XbaI和SpeI消化pStX主链。使用Zymoclean凝胶DNA回收试剂盒(Zymo Research目录号D4002)从1％琼脂糖凝胶(GoldBio目录号A-201-500)进行凝胶提取，从而纯化消化的主链片段，然后使用Gibson组装(NewEngland BioLabs目录号E2621S)将三个片段拼凑在一起。将pStx34中的组装产物转化至化学感受态或电感受态Turbo Competent大肠杆菌细菌细胞，接种于含有羧苄青霉素的LB-琼脂板(LB:Teknova目录号L9315，琼脂：Quartzy目录号214510)上。挑取个别菌落且使用Qiagen Qiaprep spin Miniprep试剂盒(Qiagen目录号27104)遵循制造商的方案进行小量制备。使用Sanger测序法对所得质粒进行测序。编码靶向所关注基因的靶向序列的序列基于CasX PAM位置而设计。靶向序列DNA以由靶向序列及该序列的反向互补序列组成的单链DNA(ssDNA)寡核苷酸(Integrated DNA Technologies)形式订购。这两个寡核苷酸退火在一起且通过Golden Gate组装，使用T4 DNA连接酶(New England BioLabs目录号M0202L)及适合于质粒的限制酶个别地或整体地克隆至pStX中。将Golden Gate产物转化至化学或电感受态细胞，例如NEB Turbo competent大肠杆菌(NEB目录号C2984I)中，接种于含有羧苄青霉素的LB-琼脂板(LB：Teknova目录号L9315，琼脂：Quartzy目录号214510)上。挑取个别菌落且使用Qiagen Qiaprep spin Miniprep试剂盒(Qiagen目录号27104)进行小量制备，并且使用Sanger测序法对所得质粒进行测序。SaCas9及SpyCas9对照质粒与上文所述的pStX质粒类似地制备，其中pStX的蛋白质及引导区交换相应蛋白质及引导区。CasX 119和457蛋白的表达和回收使用实例1的通用方法进行(但是DNA序列为在大肠杆菌中表达进行了密码子优化)。CasX 119的分析测定结果如在图6至8所示。通过胶体考马斯染色评估，在纯度为75％的条件下，每升培养物中的CasX 119的平均产量为1.56mg纯化的CasX蛋白。图6示出了纯化样品的SDS-PAGE凝胶，在Bio-Rad Stain-Free^TM凝胶上可视化，如上所述。自左至右，通道为：沉淀物：细胞裂解之后的不溶性部分，裂解物：细胞裂解之后的可溶性部分，流经：不结合肝素柱的蛋白质，洗涤：洗涤缓冲液中自柱洗脱的蛋白质，洗脱：自肝素柱洗脱的蛋白质伴以洗脱缓冲液，流经：不结合StrepTactinXT柱的蛋白质，洗脱：自StrepTactinXT柱洗脱的蛋白质伴以洗脱缓冲液，注射：注射至s200凝胶过滤柱上的浓缩蛋白质，冷冻：已浓缩及冷冻的来自s200洗脱的汇集级分。

图7示出了Superdex 200 16/600pg凝胶过滤的色谱图，如所述。CasX变异体119蛋白的凝胶过滤运行绘制为280nm吸光度与洗脱体积的关系。65.77mL峰对应于CasX变异体119的表观分子量且含有大多数CasX变异体119蛋白。图8示出了凝胶过滤样品的SDS-PAGE凝胶，如所述，用胶体考马斯染色。来自指定级分的样品通过SDS-PAGE解析且通过胶体考马斯染色。自右向左，注射：注射至凝胶过滤柱上的蛋白质样品、分子量标记、通道3-10：来自指定洗脱体积的样品。

表5：CasX 119、438和457的序列

实例3：CasX构建体488和491

为了产生CasX 488构建体(表6中的序列)，经密码子优化的CasX 119构建体(基于实例1的CasX Stx2构建体，编码浮霉菌门CasX SEQ ID NO:2，具有经融合NLS进行的A708K取代、L379R取代及[P793]缺失，及连接的引导序列和非靶向序列)用作起始构建体，并使用实例2的方法产生。为了产生CasX 491(表6中的序列)，使用Q5 DNA聚合酶(New EnglandBioLabs目录号M0491L)对CasX 484构建体DNA进行PCR扩增，该构建体用作起始构建体，并使用实例2的方法产生(参见图5)。使用Sanger测序法对所得质粒进行测序。编码靶向所关注基因的靶向序列的序列基于CasX PAM位置而设计，如实例2所述。SaCas9及SpyCas9对照质粒与上文所述的pStX质粒类似地制备，其中pStX的蛋白质及引导区交换相应蛋白质及引导区。SaCas9及SpyCas9的靶向序列获自文献或根据确立方法合理地设计。使用实例1和实例2的通用方法进行CasX构建体的表达和回收，获得了相似的结果。

表6：CasX 488和491的序列

实例4：CasX构建体278-280、285-288、290、291、293、300、492和493的设计及产生

为了产生CasX 278-280、285-288、290、291、293、300、492和493构建体(表7中的序列)，对哺乳动物表达载体中的经密码子优化的CasX 119构建体(基于实例2的CasX Stx37构建体)的N端和C端进行操纵，以缺失或添加NLS序列(表8中的序列)。构建体278、279及280为仅使用SV40 NLS序列的N端及C端操纵。构建体280在N端上不具有NLS且在C端上添加两个SV40 NLS，在两个SV40 NLS序列之间具有三重脯氨酸接头。为了产生构建体492和493，构建体280和291用作起始构建体。克隆方法如实例2中所述进行。使用Sanger测序法对所得质粒进行测序。编码靶向所关注基因的靶向序列的序列基于CasX PAM位置而设计，并且如实例2所述进行制备。利用实例1和2的通用方法，使用质粒生产和回收CasX蛋白。使用Sanger测序法对所得质粒进行测序。编码靶向所关注基因的靶向间隔子序列的序列基于CasX PAM位置而设计。使用实例1和实例2的通用方法进行CasX构建体的表达和回收，获得了相似的结果。

表7：CasX 278-280、285-288、290、291、293、300、492和493序列

表8：核定位序列列表

实例5：CasX构建体387、395、485-491及494的设计及产生

为了产生CasX 395、CasX 485、CasX 486、CasX 487，经密码子优化的CasX 119(基于实例2的CasX 37构建体)用作起始构建体。CasX 435、CasX 438和CasX 484类似地基于实例2的CasX 119构建体，其中Gibson引物被设计用于在其自身载体中扩增氨基酸192-331的CasX SEQ ID NO:1螺旋I域，以分别替换pStx1中CasX 119、CasX 435、CasX 438和CasX484上的该对应区(aa 193-332)。为了产生CasX 488、CasX 489、CasX 490、CasX 435、CasX438以及CasX 484和CasX 491(表9中的序列)，将经密码子优化的CasX 119(基于实例2的CasX37构建体)分别克隆到4kb分级中，并设计Gibson引物以在其自身载体中扩增氨基酸101-191的CasX Stx1 NTSB域和氨基酸192-331的螺旋I域，从而分别替换pStx1中CasX119、CasX435、CasX 438和CasX 484上的该类似区(aa 103-332)。利用实例1和2的通用方法，使用质粒生产和回收CasX蛋白。使用Sanger测序法对所得质粒进行测序。编码靶向所关注基因的靶向间隔子序列的序列基于CasX PAM位置而设计。使用实例1和实例2的通用方法进行CasX构建体的表达和回收，获得了相似的结果。

表9：CasX 395和485-491的序列

实例6：RNA引导序列的产生

为了产生RNA单引导序列及间隔子，通过用Q5聚合酶(NEB M0491)根据推荐方案，通过用于各主链的模板寡核苷酸及具有T7启动子及间隔子序列的扩增引物进行PCR来产生用于体外转录的模板。用于引导序列及间隔子的T7启动子、引导序列及间隔子的DNA引物序列呈现于下表10中。对于各支架标记为“正向主链”及“反向主链”的模板寡核苷酸以各20nM的最终浓度包括在内，且扩增引物(T7启动子及独特间隔子引物)以各1μM的最终浓度包括在内。sg2、sg32、sg64及sg174引导序列分别对应于SEQ ID NO:5、2104、2106及2238，除了sg2、sg32及sg64经额外5’G修饰以提高转录效率(比较表10与表2中的序列)。7.37间隔子靶向β2-微球蛋白(B2M)。在PCR扩增之后，模板经清洁且通过酚-氯仿-异戊醇萃取分离，接着进行乙醇沉淀。

在含有50mM Tris pH 8.0、30mM MgCl₂、0.01％Triton X-100、2mM亚精胺、20mMDTT、5mM NTP、0.5μM模板及100μg/mL T7 RNA聚合酶的缓冲液中进行体外转录。将反应物在37℃下培育过夜。每1mL转录体积添加20单位的DNA酶I(Promega#M6101))且培育一小时。RNA产物经由变性PAGE纯化、经乙醇沉淀且再悬浮于1×磷酸盐缓冲盐水中。为了折叠sgRNA，将样品加热至70℃后维持5分钟且接着冷却至室温。将反应物补充至1mM最终MgCl₂浓度，加热至50℃后维持5分钟且接着冷却至室温。将最终RNA引导序列产物存储于-80℃。

表10：用于产生引导RNA的序列

实例7：RNP组装

CasX及单引导RNA(sgRNA)的纯化野生型及RNP在即将进行实验之前制备，或经制备且在液氮中急冻且存储于-80℃以便后续使用。为了制备RNP复合物，将CasX蛋白与sgRNA以1:1.2摩尔比一起培育。简言之，将sgRNA添加至Buffer#1(25mM NaPi、150mM NaCl、200mM海藻糖、1mM MgCl2)中，接着将CasX在涡旋下缓慢添加至sgRNA溶液中，且在37℃下培育10分钟以形成RNP复合物。RNP复合物在使用之前经由用200μl Buffer#1预润湿的0.22μmCostar 8160过滤器过滤。必要时，RNP样品用0.5ml Ultra 100-Kd截止过滤器(Millipore零件号UFC510096)浓缩，直至获得所需体积。如实例12中所述评估感受态RNP的形成。

实例8：评估对引导RNA的结合亲和力

纯化野生型及改进CasX将在含有氯化镁以及肝素的低盐缓冲液中与含有3’Cy7.5部分的合成单引导RNA一起培育，以防止非特异性结合及聚集。sgRNA将维持于10pM的浓度，而蛋白质将在独立结合反应中自1pM滴定至100μM。在允许反应达到平衡之后，样品将穿过具有硝化纤维素膜及带正电尼龙膜的真空歧管过滤器-结合分析，所述膜分别结合蛋白质及核酸。膜将经成像以鉴别引导RNA，且将通过针对各蛋白质浓度在硝化纤维素相对于尼龙膜上的荧光的量来确定结合相对于未结合RNA的分率，以计算蛋白质-sgRNA复合物的解离常数。亦将通过sgRNA的改进变异体进行实验，以确定这些突变是否亦影响引导对于野生型及突变蛋白的亲和力。我们亦将进行电迁移率变动分析以与过滤器-结合分析定性比较，及确认可溶性结合而非聚集为蛋白质-RNA结合的主要贡献因素。

实例9：评估对靶DNA的结合亲和力

纯化野生型及改进CasX将与携有与靶核酸互补的靶向序列的单引导RNA复合。RNP复合物将与含有PAM及适当靶核酸序列(在靶链上具有5’Cy7.5标记)的双链靶DNA在含有氯化镁以及肝素的低盐缓冲液中一起培育，以防止非特异性结合及聚集。靶DNA将维持于1nM的浓度，而RNP将在独立结合反应中自1pM滴定至100μM。在允许反应达到平衡之后，样品将在天然5％聚丙烯酰胺凝胶上运行以分离结合及未结合靶DNA。凝胶将经成像以鉴别靶DNA的迁移率变动，且将对于各蛋白质浓度计算结合相对于未结合DNA的分率，以确定RNP-靶DNA三元复合物的解离常数。预期实验将证明与包含参考CasX和参考gNA的RNP相比，包含CasX变异体和gNA变异体的RNP的结合亲和力提高。

实例10：编辑基因靶标PCSK9、PMP22、TRAC、SOD1、B2M及HTT

此研究的目的为评估CasX变异体119及gNA变异体174编辑六个基因靶标中的核酸序列的能力。

材料及方法

基于靶向所关注的所需基因座的PAM要求(TTC或CTC)以无偏方式设计用于除了B2M及SOD1之外的所有靶标的间隔子。先前已经由针对这些基因进行的慢病毒间隔子筛选而在靶向外显子内鉴别靶向B2M及SOD1的间隔子。设计用于其他靶标的间隔子以单链DNA(ssDNA)寡核苷酸对形式订购自Integrated DNA Technologies(IDT)。ssDNA间隔子对退火在一起且经由Golden Gate克隆而克隆至含有以下组分的基础哺乳动物表达质粒构建体中：EF1A启动子下的经密码子优化的CasX119蛋白+NLS、U6启动子下的引导支架174、羧苄青霉素及嘌呤霉素抗性基因。将组装产物转化至化学感受态大肠杆菌中，接种于含有羧苄青霉素的Lb-琼脂板(LB：Teknova目录号L9315，琼脂：Quartzy目录号214510)上，且在37℃下培育。挑取个别菌落且使用Qiagen Qiaprep spin Miniprep试剂盒(Qiagen目录号27104)遵循制造商的方案进行小量制备。经由Sanger测序法(Quintara Biosciences)经引导支架区对所得质粒进行测序以确保正确连接。

在补充有10％胎牛血清(FBS；Seradigm，#1500-500)、100单位/毫升青霉素及100mg/ml链霉素(100×-青霉素-链霉素；GIBCO#15140-122)、丙酮酸钠(100×，Thermofisher#11360070)、非必需氨基酸(100×Thermofisher#11140050)、HEPES缓冲液(100×Thermofisher#15630080)及2-巯基乙醇(1000×Thermofisher#21985023)的达尔伯克氏改进伊格尔培养基(DMEM；Corning Cellgro，#10-013-CV)中生长HEK293T细胞。使用TryplE将细胞每3-5天继代一次，且维持于37℃及5％CO2的培育箱中。

在第0天，HEK293T细胞以每孔30k个细胞接种于96孔平底板中。在第1天，使用lipofectamine 3000根据制造商的方案，细胞经100ng质粒DNA转染。在第2天，将细胞转换至含有嘌呤霉素的FB培养基。在第3天，此培养基经含有嘌呤霉素的新鲜FB培养基替换。此时间点之后的方案取决于所关注基因而趋异。针对PCSK9、PMP22及TRAC的第4天：验证细胞已完成选择且转换至无嘌呤霉素的FB培养基。针对B2M、SOD1及HTT的第4天：验证细胞已完成选择且使用TryplE 1:3继代至含有无嘌呤霉素的FB培养基的新板中。针对PCSK9、PMP22及TRAC的第7天：细胞自板中上升，在dPBS中洗涤，计数，且以每微升10,000个细胞再悬浮于Quick Extract(Lucigen，QE09050)中。根据制造商的方案提取基因组DNA且存储于-20℃下。针对B2M、SOD1及HTT的第7天：细胞自板中上升，在dPBS中洗涤，且根据制造商的方案用Quick-DNA Miniprep Plus试剂盒(Zymo，D4068)提取基因组DNA且存储于-20℃下。

NGS分析：使用下一代测序(NGS)分析来分析来自各实验样品的细胞中的编辑。使用KAPA HiFi HotStart ReadyMix PCR试剂盒(KR0370)进行所有PCR。对于PCSK9、PMP22及TRAC，基因组DNA样品PCR的模板为QE中的5μl基因组DNA，每μL 10k个细胞。对于B2M、SOD1及HTT，基因组DNA样品PCR的模板为水中的400ng基因组DNA。设计对所关注的靶基因组位置具有特异性的引物以形成靶扩增子。这些引物在5’端含有额外序列以引入Illumina读段及2个序列。另外，其含有充当独特分子标识符(UMI)的7nt随机序列。使用Fragment AnalyzerDNA分析仪试剂盒(Agilent，dsDNA 35-1500bp)评估扩增子的质量及定量。根据制造商的说明书在Illumina Miseq上测序扩增子。将所得测序读段与参考序列比对且分析插入缺失。将具有不与估计的切割位置对准的编辑或在间隔区中具有出人意料的对偶基因的样品丢弃。

结果

为了验证在多个基因座处由CasX:gNA 119.174实现的编辑，在HEK 293T细胞中进行克隆质粒转染实验。设计了多个间隔子(表11，列出了实际gNA间隔子的编码DNA和RNA序列)，并将其克隆到编码CasX 119核酸酶和引导序列174支架的表达质粒中。HEK 293T细胞经质粒DNA转染，用嘌呤霉素选择，且在转染后六天收获用于基因组DNA。经由下一代测序(NGS)分析基因组DNA且与参考DNA序列比对以分析插入或缺失(插入缺失)。CasX:gNA119.174能够在6个靶基因上有效地生成插入缺失，如图9和10中所示。插入缺失率在间隔子之间变化，但中值编辑速率始终为60％或更高，且在一些情况下，观测到高达91％的插入缺失率。另外，表明具有非典型CTC PAM的间隔子能够在所有测试靶基因的情况下产生插入缺失(图11)。

结果表明CasX变异体119及gNA变异体174可在人类细胞中的多个基因座处始终且有效地产生插入缺失。分析中所用的许多间隔子的无偏选择展示119.174RNP分子编辑基因座的总体有效性，而通过TTC及CTC PAM靶向间隔子的能力表明其相比于仅通过TTC PAM编辑的参考CasX增加的通用性。

表11：靶向各个基因座的间隔子序列。

实例11：体外评估差分PAM识别

纯化野生型及工程化CasX变异体将与携有固定靶向序列的单引导RNA复合。RNP复合物将以100nM的最终浓度添加至含有MgCl2的缓冲液，且以10nM的浓度与5’Cy7.5标记的双链靶DNA一起培育。将通过含有与靶核酸序列邻近的不同PAM的不同DNA底物进行独立反应。将在固定时间点获取反应物的等分试样且通过添加等体积的50mM EDTA及95％甲酰胺淬灭。样品将在变性聚丙烯酰胺凝胶上运行，以分离裂解及未裂解的DNA底物。将观测结果且将测定非典型PAM通过CasX变异体的裂解速率。

实例12：CasX:gNA体外裂解分析

1.与野生型参考CasX相比，确定蛋白质变异体的裂解感受态分率

使用体外裂解分析确定相比于参考CasX，CasX变异体形成活性RNP的能力。如下产生用于裂解分析的β-2微球蛋白(B2M)7.37靶标。具有序列TGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCT(非靶链，NTS(SEQ ID NO:596)及TGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCT(靶链，TS(SEQ ID NO:597))的DNA寡核苷酸与5’荧光标记(分别为LI-COR IRDye700和800)一起购买。如下地形成dsDNA靶标：通过在1×裂解缓冲液(20mM Tris HCl pH7.5，150mM NaCl，1mM TCEP，5％甘油，10mM MgCl₂₎中以1:1比率混合寡核苷酸，加热至95℃后保持10分钟，且使溶液冷却至室温。

CasX RNP于37℃下使用在1×裂解缓冲液(20mM Tris HCl pH 7.5，150mM NaCl，1mM TCEP，5％甘油，10mM MgCl₂₎中1μM最终浓度的指示CasX及引导序列(参见图表)复原10分钟(其中除非另外指明，否则指示引导序列为1.5倍过量)，随后移至冰上直至准备使用。使用7.37靶标，以及具有与7.37靶标互补的间隔子的sgRNA。

制备最终RNP浓度为100nM且最终目标浓度为100nM的裂解反应物。在37℃下进行反应且通过添加7.37靶DNA起始。在5、10、30、60及120分钟处获取等分试样且通过添加至95％甲酰胺，20mM EDTA中淬灭。样品通过在95℃下加热10分钟变性，且在10％脲-PAGE凝胶上运行。使用LI-COR Odyssey CLx对凝胶进行成像并使用LI-COR Image Studio软件进行定量，或者施用Cytiva Typhoon对凝胶进行成像并使用Cytiva IQTL软件进行定量。使用Prism绘制及分析所得数据。我们假设CasX在分析条件下基本上以单周转酶形式起作用，如由以下观测结果指示：亚化学计算量的酶即使在扩展时间标度下亦无法裂解大于化学计算量的目标，且替代地接近随着存在的酶的量缩放的平稳段。因此，靶标在长时间标度内通过等摩尔量的RNP裂解的分率指示RNP的何种分率为恰当形成的且对于裂解具活性。用双相速率模型拟合裂解迹线，因为裂解反应在此浓度范围内明显偏离单相，且对于三个独立重复样中的每一者确定平稳段。计算平均值及标准差以确定活性分率(表12)。图表示于图12中。

对于针对CasX2+引导序列174+7.37间隔子、CasX119+引导序列174+7.37间隔子、CasX457+引导序列174+7.37间隔子、CasX488+引导序列174+7.37间隔子及CasX491+引导序列174+7.37间隔子形成的RNP确定表观活性(感受态)分率。确定的活性分率展示于表12中。所有CasX变异体均具有高于野生型CasX2的活性分率，表明相比于野生型CasX，工程化CasX变异体在测试条件下与相同引导序列形成显著更具活性且稳定的RNP。这可归因于对sgRNA增加的亲和力、在sgRNA存在下增加的稳定性或溶解度、或工程化CasX:sgRNA复合物的裂解感受态构象的更大稳定性。与CasX2相比，向sgRNA中添加CasX457、CasX488或CasX491时，观察到的沉淀物显著减少，表明RNP的溶解度增加。

2.体外裂解分析–确定CasX变异体相比于野生型参考CasX的k_裂解

对于CasX2.2.7.37、CasX2.32.7.37、CasX2.64.7.37及CasX2.174.7.37，也使用相同的方案测定裂解感受态分率为16±3％、13±3％、5±2％及22±5％，如图13和表12中所示。

第二组引导序列在不同条件下进行了测试，以更好地隔离引导序列对RNP形成的贡献。将174、175、185、186、196、214和215个带有7.37间隔子的引导序列与CasX491混合，最终浓度为1μM的引导序列和1.5μM的蛋白质，而不是像以前那样使用过量的引导序列。结果示于图14和表12。这些引导序列中的许多都表现出优于174的额外改进，其中185和196分别实现了44％和46％的感受态分率，而在这些引导限制条件下，174为17％。

数据指示相比于野生型CasX及野生型sgRNA，CasX变异体及sgRNA变异体均能够通过引导RNA形成较高程度的活性RNP。

与野生型参考CasX相比，CasX变异体119、457、488和491的表观裂解速率是通过体外荧光分析来测定的，用于裂解靶7.37。

CasX RNP于37℃下使用在1×裂解缓冲液(20mM Tris HCl pH 7.5，150mM NaCl，1mM TCEP，5％甘油，10mM MgCl₂₎中1μM最终浓度的指示CasX(参见图15)和1.5倍过量的指示引导序列复原10分钟，随后移至冰上直至准备使用。以200nM的最终RNP浓度及10nM的最终靶浓度建立裂解反应。在37℃下进行反应且通过添加靶DNA起始。在0.25、0.5、1、2、5及10分钟处获取等分试样且通过添加至95％甲酰胺，20mM EDTA中淬灭。样品通过在95℃下加热10分钟变性，且在10％脲-PAGE凝胶上运行。凝胶用LI-COR Odyssey CLx成像，并使用LI-CORImage Studio软件进行定量，或用Cytiva Typhone成像，并使用Cytiva IQTL软件进行定量。使用Prism绘制及分析所得数据，且针对各CasX:sgRNA组合重复样个别地确定非靶链裂解的表观一阶速率常数(k_裂解)。具有独立拟合的三个重复的平均值和标准偏差如表12所示，裂解迹线如图15所示。

测定野生型CasX2和CasX变异体119、457、488和491的表观裂解速率常数，每个分析中使用引导序列174和间隔子7.37(见表12和图15)。相对于野生型CasX2，所有CasX变异体都提高了裂解速率。CasX457的裂解速度比119慢，尽管如上所确定具有更高的感受态分率。CasX488和CasX491具有较大幅度的最高裂解速率；由于靶标在第一个时间点几乎完全被裂解，真正的裂解速率超过了该分析的分辨率，报告的k_裂解应作为下限。

数据表明，相比于野生型CasX2，CasX变异体具有较高活性水准，其中k_裂解速率至少高出30倍。

3.体外裂解分析：比较引导变异体与野生型引导序列

亦通过野生型参考CasX2及参考引导序列2相比于引导变异体32、64及174进行裂解分析，以确定变异体是否改进裂解。如上文所述地进行实验。由于许多所得RNP在测试时间内未接近靶标的完全裂解，我们确定初始反应速度(V₀)而非一阶速率常数。前两个时间点(15及30秒)与各CasX:sgRNA组合及重复样的线拟合。确定三个重复样的斜率的平均值及标准差。

在分析条件下，CasX2在引导序列2、32、64及174的情况下的V₀为20.4±1.4nM/min、18.4±2.4nM/min、7.8±1.8nM/min及49.3±1.4nM/min(参见表12及图16至17)。引导序列174表明，所得RNP的裂解速率大幅改进(相对于2为约2.5倍，参见图17)，而引导序列32及64的表现与引导序列2类似或比其更差。值得注意的是，引导序列64支持比引导序列2更低的裂解速率，但在体内的表现好得多(数据未示出)。产生引导序列64的一些序列改变可能以参与三螺旋体形成的核苷酸为代价来改进体内转录。引导序列64改进的表达可能解释其改进的体内活性，而其降低的稳定性可导致不当体外折叠。

使用具有间隔子7.37和CasX491的引导序列174、175、185、186、196、214和215进行了额外的实验，以确定相对裂解速率。为了将裂解动力学降低到用我们的分析可测量的范围，裂解反应在10℃下孵育。结果如图18和表12。在这些条件下，215是唯一支持比174更快的裂解速率的引导序列。196在引导限制条件下表现出最高的RNP活性分率，其动力学与174基本相同，再次强调了不同的变异体导致不同特征的改进。

这些数据支持，在该分析的条件下，使用带有CasX的大多数引导变异体导致RNP的活性水平高于使用野生型引导变异体的RNP，初始裂解速度的改善范围为约2倍至>6倍。表12中的数值从左到右表示RNP构建体的CasX变异体、sgRNA支架和间隔子序列。在下表的RNP构建体名称中，从左至右表示CasX蛋白变异体、引导支架和间隔子。

表12：裂解及RNP形成分析的结果

*平均值及标准差

实例13：PCSK9的CasX:gNA编辑

该实例阐述了制备和测试能够修饰PCSK9基因座的组合物的参数。

实验设计：

A)PCSK9修饰间隔子选择过程：

20bp XTC PAM间隔子将被设计成靶向人类基因组中的以下区：

(a)PCSK9顺式增强子元件

(b)在脊椎动物中高度保守的PCSK9近端非编码遗传元件(UCSC基因组浏览器)

(c)PCSK9基因组位点。PCSK9基因被定义为跨越人类基因组的chr1:55,039,476-55,064,853(GRCh38/hg38)的序列(该符号是指染色体1(chr1)，起始于染色体1上的55,039,476bp至55,064,853bp(智人更新注释版本109.20190905，GRCh38.p13)(NCBI)。PCSK9靶向间隔子可以类似地从其他基因组组装。

B)用于产生PCSK9靶向构建体的方法：

为了产生PCSK9靶向构建体，将表11的PCSK9靶向间隔子克隆到基础哺乳动物表达质粒构建体(pStX)中，该构建体由以下组分组成：经密码子优化的CasX(构建体CasX 119分子和rRNA引导序列174(119.174)；序列见表)+NLS；和哺乳动物选择标记嘌呤霉素。间隔子序列DNA将以由间隔子序列和该序列的反向互补序列组成的单链DNA(ssDNA)寡核苷酸形式从Integrated DNA Technologies(IDT)订购。这两个寡核苷酸将退火在一起且通过GoldenGate组装，使用T4 DNA连接酶(New England BioLabs目录号M0202L)及适合于质粒的限制酶个别地或整体地克隆至pStX中。组装产物将被转化至化学或电感受态细菌细胞中，接种于含有羧苄青霉素的Lb-琼脂板(LB：Teknova目录号L9315，琼脂：Quartzy目录号214510)上，并培育直至出现菌落。将挑取个别菌落且使用Qiagen Qiaprep spin Miniprep试剂盒(Qiagen目录号27104)遵循制造商的方案进行小量制备。将使用Sanger测序法对所得质粒进行测序以确保正确连接。SaCas9和SpyCas9对照质粒(具有基于Cas蛋白特异性PAM选择的间隔子)将以与上述pStX质粒类似的方式制备。

C)产生PCSK9报道子系的方法：

在HEPG2细胞系中，荧光编码DNA(例如，GFP)将被敲入在最后一个PCSK9外显子的3’端。经修饰细胞将每3-5天通过连续继代扩增，且维持于由以下各者组成的成纤维细胞(FB)培养基中：达尔伯克氏改进伊格尔培养基(DMEM；Corning Cellgro，#10-013-CV)，补充有10％胎牛血清(FBS；Seradigm，#1500-500)，或其他适当培养基，及100单位/毫升青霉素及100mg/ml链霉素(100×-青霉素-链霉素；GIBCO#15140-122)，且可另外包括丙酮酸钠(100×，Thermofisher#11360070)、非必需氨基酸(100×Thermofisher#11140050)、HEPES缓冲液(100×Thermofisher#15630080)及2-巯基乙醇(1000×Thermofisher#21985023)。将在37℃和5％CO2下培育细胞。1-2周后，将单个GFP+细胞分选到FB或其他合适的培养基中。报道子系克隆将通过每3-5天连续继代扩增且在37℃及5％CO2下维持于培育箱中的FB培养基中。将通过基因组测序以及使用PCSK9靶向分子对PCSK9基因座的功能修饰来表征这些细胞系。最佳报道子系将被鉴别为如下细胞系：i)具有正确整合在靶PCSK9基因座的单拷贝GFP，ii)保持与未修饰细胞相当的倍增时间，iii)当使用下述方法分析时，PCSK9基因破坏后导致GFP荧光减少。

D)评估PCSK9-GFP报道子细胞系中PCSK9修饰活性的方法：

PCSK9报道子细胞将以20-40k个细胞/孔接种在96孔板的100μl FB(或其他合适的)培养基中，且在具有5％CO2的37℃培育箱中培养。第二天，将检查经接种细胞的汇合度。理想情况下，转染时细胞应该达到约75％的汇合度。如果细胞将处于适当的汇合度，则将进行转染。

按照制造商的方案，使用Lipofectamine 3000以每孔100-500ng转染具有靶向PCSK9的合适间隔子的每个CasX构建体(CasX 119和引导序列174)，每个构建体使用3个孔作为重复样。靶向PCSK9的SaCas9和SpyCas9将用作基准对照。对于各Cas蛋白类型，非靶向质粒将用作阴性对照。

在以0.3-3μg/ml进行嘌呤霉素选择24-48小时以选择成功转染的细胞，接着在FB或其他合适的培养基中恢复24-48小时之后，经由流式细胞术分析经转染细胞中的荧光。在此方法中，细胞针对适当正向及侧向散射进行设门，针对单细胞进行选择且接着针对报道子表达进行设门(Attune Nxt Flow Cytometer，Thermo Fisher Scientific)，以定量荧光团的表达水平。将对各样品收集至少10,000个事件。然后将数据用于计算抗体标记阴性(编辑)细胞的百分比。

将裂解来自实例的每个样品的细胞亚群，并按照制造商的方案使用快速提取(Quick extract)溶液提取基因组。将使用T7E1分析来分析编辑。简而言之，将在热循环仪上使用PCR程序，使用引物(例如，预期靶标周围500bp的区)扩增靶向编辑位点的基因组基因座。然后PCR扩增子将在热循环仪上按照杂交程序进行杂交，随后用T7核酸内切酶在37℃下处理30分钟。然后将在2％琼脂糖凝胶上或在片段分析仪(Fragment Analyzer)上分析样品以观察DNA条带。

实例14：评估HEPG2或HEK293T细胞中PCSK9修饰活性的方法。

HEPG2细胞或HEK293T细胞将以20-40k个细胞/孔接种在96孔板的100μl FB培养基中，且在具有5％CO2的37℃培育箱中培养。第二天，将检查经接种细胞的汇合度。转染时细胞应该达到约75％的汇合度。如果细胞处于适当的汇合度，则将进行转染。

按照制造商的方案，使用Lipofectamine 3000以每孔100-500ng转染具有引导序列174和表11的靶向PCSK9的间隔子的CasX构建体119，并且将每个构建体放置到3个孔中作为重复样。非靶向质粒将用作阴性对照。在以1-3μg/ml进行嘌呤霉素选择24-48小时以选择成功转染的细胞，接着在FB培养基中恢复24-48小时之后，将通过如上所述的T7E1分析或如下所述的蛋白质印迹来分析细胞的编辑。

实例15：在慢病毒载体中包装PCSK9靶向CasX构建体的方法。

包装靶向PCSK9的PCSK9靶向CasX:gNA构建体(例如，实例2的CasX 119和实例6的引导序列174以及表11或编码SEQ ID NO:315-436、612-2100或2286-13861中任一者的间隔子)的慢病毒粒子将通过以下方式产生：使用编码CasX的转基因质粒、引导RNA、慢病毒包装质粒和VSV-G包膜质粒的基于聚乙烯亚胺的转染来转染70％–90％汇合度的HEK293T。为了产生慢病毒粒子，将在转染后12小时更换培养基，并将在转染后36-48小时收获病毒。病毒上清液将使用0.45μm膜滤器过滤，并在适当情况下在FB培养基(成纤维细胞培养基，其由以下成分构成：含Glutamax的DMEM(Gibco 10566-016)，补充有MEM-NEAA(Thermo 11140050)、丙酮酸钠(Thermo 11360070)、HEPES(Thermo 15630080)、2-巯基乙醇(Gibco 21985023)、青霉素/链霉素(Thermo 15140122)和10％体积分数的胎牛血清(FBS，VWR#97068-085))中稀释。

实例16：通过慢病毒筛选评估PCSK9修饰的方法。

慢病毒质粒将按照标准克隆程序产生，使得每个慢病毒质粒具有一个经密码子优化的携带NLS的CasX分子(例如，构建体CasX 119分子)和一个具有靶向PCSK9的间隔子的rRNA引导序列174(119.174)(表11中的间隔子序列或SEQ ID NO:315-436、612-2100或2286-13861序列的DNA对应物；即，T取代U碱基)与嘌呤霉素选择标记。进行克隆，使得最终滴度涵盖全部文库大小的>100倍的靶向所有已知PAM的所有可能PCSK9间隔子以及它们在PCSK9基因中的对应间隔区及调节区。如果文库大小为约5000，则被评估的文库将>5x10⁵。

通过使用包含间隔子文库的质粒、慢病毒包装质粒和VSV-G包膜质粒的基于聚乙烯亚胺的转染来转染70％–90％汇合度的HEK293T，从而产生慢病毒粒子。为了产生粒子，在转染后12小时更换培养基，并在转染后36-48小时收获病毒。

病毒上清液使用0.45μm膜滤器过滤，在适当情况下在FB培养基中稀释，并添加到靶细胞(在这种情况下为PCSK9-GFP报道子细胞系)中。如果需要，以5-20μg/ml添加补充聚凝胺以增强转导效率。在转导后24-48小时在FB培养基中使用0.3-3μg/ml的嘌呤霉素选择经转导的细胞，并在具有5％CO2的37℃培育箱中在FB或其他合适的培养基中生长7-10天。

在SH-100或MA900 SONY分选仪上分选细胞。在这个过程中，细胞针对适当正向和侧向散射进行设门，针对单细胞进行选择且接着针对报道子表达进行设门。基于荧光水平来建立不同的细胞分选门(关＝完全敲除，中等＝部分破坏或敲低(KD)，高＝无编辑，极高＝增强子)，以区分和收集通过i)高功能PCSK9破坏分子、ii)仅降低表达的分子和iii)增加表达的分子来编辑的细胞。如果在人类患者细胞中使用两种颜色，也可以运行该分析来识别等位基因特异性引导序列。按照制造商的推荐方案，使用快速提取(Quick Extract)(Lucigen目录号QE09050)溶液从每组分选的细胞中收集基因组DNA。

然后通过PCR直接从基因组中扩增来自每个收集库的间隔子文库，并收集用于在Miseq上进行深度测序。根据特定活性的门和丰度来进行间隔子分析；间隔子命中的NGS分析的详细方法见下文。

然后，重新克隆从每个分选组中选择的引导序列，并通过流式细胞术和T7E1分析和/或蛋白质印迹，在报道子细胞系和原代人细胞系中分别验证其活性，并通过NGS分析来评估插入缺失谱。接下来的步骤可能类似于在评估报道子细胞系中PCSK9修饰活性的方法中提供的描述。

间隔子命中的NGS分析的方法

来自上述慢病毒筛选的数据将使用下一代(NGS)测序进行分析。使用下一代测序(NGS)评估每个间隔子破坏PCSK9基因的能力。通过含有间隔子的慢病毒主链的特异性扩增来产生NGS文库。为每个分选的群体产生不同的文库(对应于低、中、高PCSK9表达的GFP高、中、低，等等)，然后用Illumina Hiseq进行评估。

来自Illumina Hiseq的测序读段针对衔接子序列和低测序质量区进行了修剪。基于它们的重叠序列来合并成对的末端读段，以形成每个测序片段的单一共有序列。使用bowtie2将共有序列与设计的间隔子序列进行比对。与超过一个设计的间隔子序列比对的读段被丢弃。

每个间隔子序列的“丰度”被定义为与该序列比对的读段的数量。将每个测序文库的丰度制成表格，形成计数表，该表给出每个测序文库(即，分选群体)中每个间隔子序列的丰度。最后，接着通过以下方式将丰度数归一化以考虑每个文库的不同测序深度：除以该文库中的总读段计数，再乘以文库间的平均读段计数。归一化计数表用于确定每个门(高、中、低，等等)中每个间隔子的活性。

通过在内源性人PCSK9基因座敲入GFP来构建PCSK9-GFP报道子系。偶联至与gRNA间隔子互补的gRNA靶向序列的报道子(例如，GFP报道子)整合至报道子细胞系中。细胞经CasX蛋白和/或sgRNA变异体转化或转染，其中sgRNA的间隔子基序与报道子的gRNA靶序列互补且靶向gRNA靶序列。通过FACS分析CasX:sgRNA核糖核蛋白复合物裂解靶核酸序列的能力。丧失报道子表达的细胞指示发生CasX:sgRNA核糖核蛋白复合物介导的裂解及插入缺失形成。该报道系统基于成功修饰(编辑)PCSK9基因座后减少的GFP荧光(通过流式细胞术检测)。

出于筛选目的，将测试表11的PCSK9间隔子或与gNA支架连接的SEQ ID NO:315-436、612-2100或2286-13861中的任一者。将在报道子细胞系中用CasX蛋白(CasX 119与gNA174的构建体)测试间隔子(使用SaCas9和SpyCas9作为对照)。将在PCSK9-GFP报道子细胞中评估GFP荧光和编辑的减少，使用嘌呤霉素选择成功进行脂质转染的这些细胞并随后通过FACS分析GFP破坏。预计CasX 119和引导序列174可以编辑至少5-10％的细胞，证明CasX可以修饰内源性PCSK9基因座，并且比SaCas9和SpyCas9系统更有效。将进行T7E1分析或蛋白质印迹来分析PCSK9-GFP报道子细胞系中的基因编辑。具有PCSK9靶向间隔子和非靶向对照(NT)的CasX 119和引导序列174将被脂质转染入PCSK9-GFP报道子细胞，使用嘌呤霉素选择成功进行脂质转染的这些细胞，并随后在T7E1分析中分析基因编辑，证明PCSK9基因座的成功编辑。

实例17：使用采用慢病毒构建体的CasX以等位基因特异性方式编辑PCSK9基因的方法

设计并进行实验以显示CasX编辑PCSK9基因座的能力。永久治疗PCSK9相关病症的一种策略是特异性破坏基因的突变拷贝，同时保留野生型(WT)等位基因。具有两个野生型等位基因的HEK293细胞应可由表11的WT CasX间隔子或SEQ ID NO:315-436、612-2100或2286-13861中的任一者编辑，但不可由突变CasX间隔子(例如，与WT PCSK9基因序列没有足以结合的同源性的间隔子)编辑。该实例将额外证明CasX间隔子区分相差单个核苷酸的中靶和脱靶等位基因的能力。HEK293细胞以20-40k个细胞/孔接种在96孔板的100μl FB培养基中，且在具有5％CO2的37℃培育箱中培养。第二天，检查经接种细胞的汇合度，以确保细胞在转染时将达到约75％的汇合度。如果细胞处于适当的汇合度，则使用实例15的病毒上清液(具有CasX 119和引导序列174，该引导序列具有靶向PCSK9的间隔子，如上所述)进行转染，每个构建体使用3个孔作为重复样。靶向PCSK9的SaCas9和SpyCas9用作基准对照。对于各Cas蛋白类型，非靶向质粒用作阴性对照。将用0.3-3μg/ml的嘌呤霉素选择成功转染的细胞24-48小时，然后在FB培养基中恢复24-48小时。将裂解来自实验的每个样品的细胞亚群，并将按照制造商的方案使用快速提取(Quick extract)溶液提取基因组。将使用T7E1分析来分析编辑。简而言之，在热循环仪上使用PCR程序，使用引物(例如，预期靶标周围500bp的区)扩增靶向编辑位点的基因组基因座。然后PCR扩增子在热循环仪上按照杂交程序进行杂交，随后用T7核酸内切酶在37℃下处理30分钟。然后在2％琼脂糖凝胶上或在片段分析仪(Fragment Analyzer)上分析样品以观察DNA条带。

实例18：在源自常染色体显性高胆固醇血症(ADH)患者的细胞系中证明等位基因特异性编辑的方法。

将在供应商推荐的条件下获取和培养源自ADH患者的细胞。将使用Lipofectamine3000按照制造商的方案用CasX构建体(例如，CasX 119与引导序列174和表11的PCSK9间隔子或SEQ ID NO:247-303的间隔子的RNP)转染细胞，或使用Lonza nucleofector试剂盒根据制造商的方案对细胞进行核转染，并接种在96孔板中进行培育和生长。或者，CasX构建体可以按照实例15包装在慢病毒中，并且用于转导患者来源的细胞。将使用含有0.3-3μg/ml嘌呤霉素的培养基选择成功进行脂质转染或核转染或慢病毒转导的细胞2-4天或更长时间，然后在不含嘌呤霉素的培养基中恢复2天或更长时间。PCSK9基因座的编辑可以在基因组、转录组和蛋白质组水平进行评估。在选择和恢复期结束时，将裂解来自实验的每个样品的细胞亚群，并且使用快速提取(QE)溶液按照制造商的方案提取基因组；将在RIPA细胞裂解缓冲液中裂解另一细胞亚群以用于蛋白质组分析；另一细胞亚群可以继代以用于在稍后时间点分析。一小部分经QE处理的样品将用于使用T7E1分析来评估编辑。简而言之，将在热循环仪上使用PCR程序，使用引物(例如，预期靶标周围500bp的区)扩增靶向编辑位点的基因组基因座。然后PCR扩增子将在热循环仪上按照杂交程序进行杂交，随后用T7核酸内切酶在37℃下处理30分钟。然后将在2％琼脂糖凝胶上或在片段分析仪(Fragment Analyzer)上分析样品以观察DNA条带，从而证实CasX构建体可以成功编辑PCSK9突变。另一小部分经QE处理的样品将用于使用NGS来评估PCSK9基因座处的编辑。

蛋白质组分析将通过蛋白质印迹进行。在RIPA缓冲液中裂解的样品将首先根据制造商的方案使用比色蛋白质定量分析(如BCA(Pierce)或Bradford(BioRad))对蛋白质含量进行定量。定量后，样品将在补充有β-巯基乙醇的Laemmli缓冲液中稀释，以便每孔上样2.5-20μg总蛋白。样品将在95-100℃下热变性5-10分钟，然后冷却至室温。然后样品将被上样到聚丙烯酰胺凝胶上并在其上运行。一旦凝胶已运行，蛋白质将被转移到PVDF膜上，在室温下封闭至少1小时，并用抗PCSK9的一抗和适当的上样对照进行标记。在室温下，在摇床上用PBST(补充有0.1v/v％Triton X100的PBS)洗涤印迹三次，每次洗涤五分钟。然后，在室温下，使用合适的与报道子结合的二抗来标记一抗1小时。在室温下，在摇床上用PBST(补充有0.1v/v％Triton X100的PBS)洗涤印迹三次，每次洗涤五分钟。随后将添加任何必要的底物，根据需要进行淬火，并在凝胶成像仪上成像。将使用适当的软件按照制造商的方案对条带强度进行定量。

实例19：通过AAV递送PCSK9靶向构建体的方法：用编码的CasX系统制备和回收AAV。

该实例描述产生及表征包装CasX分子及引导序列的AAV载体所遵循的典型方案。

材料及方法：

对于AAV生产，使用三质粒转染方法，并且需要三种必需质粒–携带待包装于AAV中的所关注PCSK9基因的pTransgene质粒、pRC和pHelper质粒。将编码CasX及引导RNA的DNA克隆至AAV转基因盒中的ITR之间，以产生pTransgene质粒。构建的转基因质粒经由全长质粒测序、限制消化及功能测试(包括哺乳动物细胞的体外转染)来验证。AAV生产所需的额外质粒(pRC质粒及pHelper质粒)购自商业供应商(Aldevron,Takara)。

对于AAV生产，HEK293细胞在具有5％CO2的37℃培育箱中于FB培养基中培养。HEK293细胞的10-40个15cm培养皿用于单批病毒生产。对于单个15cm培养皿，将45-60μg质粒以1∶1∶1摩尔比一起混合在4ml FB培养基中，并在室温下与聚乙烯亚胺(PEI)(即以3μgPEI/μg DNA)复合10分钟。所用的三种质粒的比例可以变化以优化病毒生产。接着将PEI-DNA复合物缓慢滴至HEK293细胞的15cm板上，且将经转染细胞的板移回至培育箱中。第二天，可将培养基换成含2％FBS的FB(在适当情况下，而不是10％FBS(成纤维细胞培养基，其由以下成分构成：含Glutamax的DMEM(Gibco 10566-016)，补充有MEM-NEAA(Thermo11140050)、丙酮酸钠(Thermo 11360070)、HEPES(Thermo 15630080)、2-巯基乙醇(Gibco21985023)、青霉素/链霉素(Thermo 15140122)和10％体积分数的胎牛血清(FBS，VWR#97068-085)))。在质粒初始转染后48-120小时之间的任何时间，可从上清液、或从细胞沉淀物、或从上清液和细胞沉淀物的组合中收获AAV。

如果在转染后72小时后收获病毒，可在此时收集来自细胞的培养基以增加病毒产率。转染后2-5天，收集培养基和细胞。收获时序可改变以优化病毒产率。通过离心来沉淀细胞，并从顶部收集培养基。细胞在37℃下裂解于具有高盐含量及高盐活性核酸酶的缓冲液中1小时。细胞亦可使用额外方法裂解，例如顺序冻融，或通过洗涤剂的化学裂解。收获时收集的培养基，及在更早时间点收集的任何培养基用1:5稀释度的含有40％PEG8000及2.5MNaCl的溶液处理，且在冰上培育2小时，以使AAV沉淀。培育亦可在4℃下进行过夜。来自培养基的AAV沉淀物通过离心来沉淀，再悬浮于具有高盐活性核酸酶的高盐含量缓冲液中且与裂解的细胞沉淀物合并。合并的细胞裂解物接着通过离心和经由0.45μm过滤器过滤来澄清，且在AAV Poros亲和力树脂柱(Thermofisher Scientific)上纯化。病毒自柱洗脱至中和溶液中。在此阶段，病毒可进行额外轮次的纯化以提高病毒制剂质量。洗脱的病毒接着经由qPCR滴定以定量病毒产率。对于滴定，病毒样品首先用DNA酶消化以去除任何非包装病毒DNA，DNA酶经去活化，且接着通过蛋白酶K进行病毒衣壳破坏以暴露包装的病毒基因组，以用于滴定。

预计将从使用此处所述方法生产的一批病毒获得约1x10¹²个病毒基因组。

实例20：小鼠模型中PCSK9编辑的体内评价。

在第一组实验中，野生型C57BL/6J小鼠将用于测试编码CasX和靶向至PCSK9的引导RNA的AAV颗粒，或包含CasX和靶向至PCSK9的引导RNA的RNP的XDP在体内编辑小鼠PCSK9基因的能力。(Carreras等人，BMC Biology 2019 17:4)。

材料及方法

编码CasX 491和gRNA 174的AAV(表13，利用构建体3A、36A和37A)，或包装CasX491和gRNA 174(表15-pXDP0017、pXDP0001、pGP2、pStx42.174.27.5)构建体的RNP的XDP将经由尾静脉注射施用于10至14周龄C57BL/6J小鼠，这些构建体使用间隔子序列27.5(AAV的间隔子序列GAGGCTAGAGGACTGAGCCA(SEQ ID NO:225)和XDP的间隔子序列GAGGCUAGAGGACUGAGCCA(SEQ ID NO:226))来靶向小鼠PCSK9基因。作为实验对照，也将编码或包装CasX和gRNA构建体的AAV或XDP施用于对照组，这些构建体靶向小鼠基因组中的安全港位点，例如，mRosa26基因座。在施用相应载体后1个月和3个月，将使用酶比色分析来评估血浆中的胆固醇水平，并且将通过ELISA或蛋白质印迹分析来评估血浆中的PCSK9水平。将在施用载体后1个月和3个月处死小鼠亚群，并将处理组织以通过NGS、qPCR和免疫组织学在基因组、转录组和蛋白质组水平评估PCSK9基因编辑。还将使用既定的脱靶分析工具(例如GUIDE-Seq)评估组织的脱靶编辑。此外，CasX的表达也将通过免疫组织学在所关注组织中进行测量。该结果有望证明在小鼠中编辑PCSK9基因的能力，并伴随着胆固醇水平的降低。

表13：靶向小鼠PCSK9基因座的AAV构建体的序列

构建体	DNA序列
		3A	(SEQ ID NO:227)
36A	(SEQ ID NO:228)
		37A	(SEQ ID NO:229)

具有人PCSK9肝特异性表达的高胆固醇血症转基因小鼠模型将用于测试编码CasX和引导RNA的AAV颗粒或包装CasX和引导RNA的RNP的XDP(它们靶向人PCSK9)在体内编辑PCSK9基因的能力。(Carreras等人，BMC Biology 2019 17:4)。

编码CasX 491和gRNA 174的AAV(表14，其列出了构建体3、36和37的序列)或包装CasX 491和gRNA 174构建体(表15，其列出了pXDP0017、pXDP0001、pGP2、pStx42.174.6.8的序列)的RNP的XDP将经由尾静脉注射施用于10至14周龄转基因小鼠，这些构建体靶向人PCSK9基因(AAV的间隔子序列TGGCTTCCTGGTGAAGATGA(SEQ ID NO:515)和XDP的间隔子序列UGGCUUCCUGGUGAAGAUGA(SEQ ID NO:559))。作为实验对照，将施用包装CasX和gRNA构建体的AAV或XDP，这些构建体靶向小鼠基因组中的安全港位点，例如，mRosa26基因座。在施用相应载体后1个月和3个月，将使用酶比色分析来评估血浆中的胆固醇水平，并且将通过ELISA或蛋白质印迹分析来评估血浆中的PCSK9水平。将在施用载体后1个月和3个月处死小鼠亚群，并将处理组织以通过NGS、qPCR和免疫组织学在基因组、转录组和蛋白质组水平评估PCSK9基因编辑。还将使用既定的脱靶分析工具(例如GUIDE-Seq)评估组织的脱靶编辑。此外，CasX的表达也将通过免疫组织学在所关注组织中进行测量。该结果有望证明在小鼠中编辑人PCSK9基因的能力，并伴随着胆固醇水平的降低。

表14：靶向PCSK9基因座的AAV构建体的序列

构建体	DNA序列
		3	(SEQ ID NO:230)
36	(SEQ ID NO:231)
		37	(SEQ ID NO:232)

表15：靶向人PCSK9基因座(间隔子6.8)和小鼠PCSK9基因座(间隔子27.5)的XDP构建体的序列

实例21：用于测量sgNA和CasX蛋白活性的分析

使用多种分析对CasX蛋白和sgNA深度突变进化(DME)文库和修饰的突变体进行初步筛选，并测量所选蛋白质和sgNA变异体相对于CasX参考sgNA和蛋白质的活性。

大肠杆菌CRISPRi筛选：

简言之，将氯霉素(CM)耐受性质粒上的死亡CasX DME库与羧苄青霉素(Carb)耐受性质粒上的GFP gNA的生物三倍体转化(以>5×库大小)到具有基因整合和组成型表达的GFP和RFP的MG1655中。细胞在EZ-RDM+Carb、CM及无水四环素(aTc)诱导剂中生长过夜。大肠杆菌基于GFP而非RFP抑制的前1％的门进行FACS分选，收集，且立即重新分选以进一步富集高度功能性CasX分子。接着生长双重分选库且收集DNA用于highseq上的深度测序。此DNA亦重新转化至板上且挑取个别克隆用于进一步分析。

大肠杆菌毒素选择：

简言之，含有阿拉伯糖诱导性毒素的羧苄青霉素耐受性质粒转化至大肠杆菌细胞中且变为电感受态。将具有氯霉素耐受性质粒上的毒素靶向gNA的CasX DME文库的生物三倍体转化(以>5x文库大小)到所述细胞中，并在LB+CM和阿拉伯糖诱导剂中生长。裂解毒素质粒的大肠杆菌在诱导培养基中存活且生长至对数中期，且回收具有功能性CasX裂解剂的质粒。按需要重复此选择。接着生长所选库且收集DNA用于highseq上的深度测序。此DNA亦重新转化至板上且挑取个别克隆用于进一步分析及测试。

基于慢病毒的筛选EGFP筛选：

在转染时以70％-90％的汇合度于HEK293细胞中产生慢病毒粒子。基于含有CasXDME库的质粒的转染使用聚乙烯亚胺转染细胞。慢病毒载体经用于粒子生产的慢病毒包装质粒及VSV-G包膜质粒共转染。在转染后12小时更换培养基，且在转染后36-48小时收集病毒。使用0.45mm膜滤器过滤病毒上清液，适当时于细胞培养基中稀释，且添加至具有整合GFP报道子的靶细胞HEK细胞中。必要时，补充凝聚胺以增强转导效率。经转导的细胞在转导后24-48小时使用嘌呤霉素选择，且生长7-10天。然后对细胞进行GFP破坏分类，并收集高功能的CasX-sgNA或蛋白质变异体(参见图19)。接着经由PCR直接自基因组扩增库且收集用于在highseq上进行深度测序。此DNA亦可重新克隆及重新转化至板上且挑取个别克隆用于进一步分析。

实例22：分析HEK EGFP报道子的编辑效率

为了分析CasX参考sgNA及蛋白质及其变异体的编辑效率，将EGFP HEK293T报道子细胞接种至96孔板中，且根据制造商的方案用lipofectamine 3000(Life Technologies)及100-200ng编码参考或CasX变异蛋白、P2A-嘌呤霉素融合物及参考或变异sgNA的质粒DNA进行转染。次日用1.5μg/ml嘌呤霉素选择细胞2天，并在选择后7天通过荧光激活细胞分选(FACS)分析以允许从细胞中清除EGFP蛋白。使用Attune NxT流式细胞仪及高通量自动进样器跟踪经由编辑的EGFP破坏。

实例23：CasX参考sgRNA的裂解效率

SEQ ID NO:4(如下)的参考CasX sgRNA描述于WO 2018064371和US10570415B2中，其内容通过引用并入本文：

ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGAGAAACCGAUAAGUAAAACGCAUCAAAG(SEQ ID NO:4)。

研究发现，改变SEQ ID NO:4的sgRNA参考序列，产生SEQ ID NO:5(如下)能够提高CasX裂解效率。序列为：UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGAGAGAAAUCCGAUAAAUAAGAAGCAUCAAAG(SEQ ID NO:5)。

为了分析CasX参考sgRNA及其变异体的编辑效率，将EGFP HEK293T报道子细胞接种至96孔板中，且根据制造商的方案用lipofectamine 3000(Life Technologies)及100-200ng编码参考CasX蛋白、P2A-嘌呤霉素融合物及sgRNA的质粒DNA进行转染。次日用1.5μg/ml嘌呤霉素选择细胞2天，并在选择后7天通过荧光激活细胞分选(FACS)分析以允许从细胞中清除EGFP蛋白。使用Attune NxT流式细胞仪及高通量自动进样器跟踪经由编辑的EGFP破坏。

当通过CasX参考和sgNA变异体测试EGFP报道子的裂解时，使用下列间隔子靶序列：当通过CasX参考和sgNA变异体测试EGFP报道子的裂解时，使用下列间隔子靶序列：E6(TGTGGTCGGGGTAGCGGCTG(SEQ ID NO:17))和E7(TCAAGTCCGCCATGCCCGAA(SEQ ID NO:18))。

图20示出了与SEQ ID NO:4的sgRNA相比，SEQ ID NO:5的sgRNA的裂解效率提高的实例。相比于SEQ ID NO:4，SEQ ID NO:5的编辑效率改进176％。因此，选择SEQ ID NO:5作为DME和其他sgNA变异体设计的参考sgRNA，如下所述。

实例24:具有改进靶裂解的gNA变异体的设计、创建和评估

设计和测试了引导核酸(gNA)变异体，以评估裂解活性相对于参考gNA的改进。如本文所述，这些引导序列是通过DME或合理设计和替换或添加引导部分(例如延伸的茎或在末端添加核酶)发现的。

实验设计：

所有引导序列都在HEK293T或HEK293T报道子系中进行了如下测试。哺乳动物细胞维持在5％CO2的37℃培育箱中。在补充有10％胎牛血清(FBS；Seradigm，#1500-500)、100单位/毫升青霉素及100mg/ml链霉素(100x-Pen-Strep；GIBCO#15140-122)并另外包括丙酮酸钠(100×，Thermofisher#11360070)、非必需氨基酸(100x Thermofisher#11140050)、HEPES缓冲液(100x Thermofisher#15630080)及2-巯基乙醇(1000x Thermofisher#21985023)的达尔伯克氏改进伊格尔培养基(DMEM；Corning Cellgro，#10-013-CV)中生长HEK293T人肾细胞及其衍生物。将细胞以每孔20,000-30,000个细胞接种到96孔板中，并使用0.25-1uL的Lipofectamine 3000(Thermo Fisher Scientific#L3000008)、50-500ng含有CasX和靶向报道子或靶基因的参考或变异CasX引导序列的质粒按照制造商的方案进行转染。24至72小时后，更换培养基，添加0.3至3.0ug/ml的嘌呤霉素(Sigma#P8833)以选择转化。选择后24至96小时，通过流式细胞术对细胞进行分析，针对适当正向及侧向散射对细胞进行设门，针对单细胞对细胞进行选择，然后针对绿色荧光蛋白(GFP)或抗体报道子表达进行设门(Attune Nxt流式细胞仪，Thermo Fisher Scientific)，以定量荧光团的表达水平。对各样品收集至少10,000个事件。对于HEK293T-GFP基因组编辑报道子细胞系，流式细胞术用于定量GFP阴性(编辑)细胞的百分比，并将每个变异体的GFP破坏的细胞数与参考引导序列进行比较，以生成变化倍数测量值。

结果:

测量通过DME产生的sgNA变异体的结果，并与SEQ ID NO:4的参考gNA进行比较。这些结果呈现在图22中，与参考gNA相比，大多数变异体显示出0.1至近1.5倍的改进。通过合理设计和替换或添加引导部分(如延伸的茎或在末端添加核酶)生成的变异体的结果分别如图21和23所示；再次示出许多构建体的改进。下表16列出了图23中以数字表示的变异体的添加及其编码序列。我们观察到，与参考相比，C18G等单一突变提高了引导活性。此外，与参考引导序列相比，合理地将不同的茎环交换为延伸茎环，如MS2、QB、PP7、UvsX等，提高了活性，截短原始的延伸茎环也是如此。最后，我们证明虽然大多数核酶会破坏活性，但在参考引导RNA中添加3'HDV可以将活性提高20至50％。

表16：添加到gNA的3'和5’端的延伸

结果支持以下结论：DME和合理设计可用于改善gNA的性能，并且许多这些变异RNA现在可与靶向序列一起使用，作为本文所述CasX:gNA系统的组成部分，用于编辑靶核酸序列。

实例25：CasX分子119和引导支架174编辑HEK293T细胞中的PCSK9基因座

实验的目的是证明当通过质粒转染递送时，使用CasX 119、引导序列174和靶向WT序列的间隔子的构建体在HEK293T细胞中编辑PCSK9基因座。

材料及方法：

在事先不知道活性的情况下，基于PAM的可用性来手动选择靶向PCSK9的间隔子(表11中的序列)。HEK293T细胞以20-40k个细胞/孔接种在96孔板的100μl FB培养基中，且在具有5％CO2的37℃培育箱中培养。第二天，检查经接种细胞的汇合度，以确保细胞在转染时达到约75％的汇合度。如果细胞处于适当的汇合度，则进行转染。使用Lipofectamine3000按照制造商的方案将每个CasX和引导序列构建体(例如，CasX 119的序列见表5；引导序列174的序列见表2；并且PCSK9间隔子序列见表11)以每孔100-500ng转染到HEK293T细胞中，每个构建体使用3个孔作为重复样。靶向PCSK9的SaCas9和SpyCas9用作基准对照。对于各Cas蛋白类型，非靶向质粒用作阴性对照。用0.3-3μg/ml的嘌呤霉素选择成功转染的细胞24-48小时，然后在FB培养基中恢复24-96小时。裂解来自该实验的每个样品的细胞，并按照制造商的方案和标准实践提取基因组。使用NGS分析来分析来自每个实验样品的细胞中的编辑。简而言之，使用对所关注靶基因组位置具有特异性的引物，通过PCR扩增基因组DNA，以形成靶扩增子。这些引物在5’端含有额外序列以引入Illumina读段1和2序列。另外，其含有充当独特分子标识符(UMI)的16nt随机序列。使用Fragment Analyzer DNA分析仪试剂盒(Agilent，dsDNA 35-1500bp)评估扩增子的质量及定量。根据制造商的说明书在IlluminaMiseq上测序扩增子。对测序得到的原始fastq文件进行如下处理：(1)使用程序cutadapt(v.2.1)针对质量和衔接子序列修剪这些序列；(2)使用程序flash2(v2.2.00)将来自读段1和读段2的序列合并成单一插入序列；(3)共有插入序列与预期的扩增子序列和间隔子序列一起通过程序CRISPResso2(v 2.0.29)运行。该程序定量了在间隔子3'端周围的窗口中修饰的读段百分比(30bp窗口以距间隔子3'端–3bp为中心)。CasX分子的活性被定量为在该窗口内任何地方包含插入和/或缺失的读段的总百分比。

结果:

图24的图示表明，利用靶向至PCSK9的十种不同间隔子的构建体能够以不同的活性水平编辑PCSK9基因座，平均编辑率为70％。每个数据点是由单个间隔子产生的编辑结果的NGS读段的平均测量值。这些结果表明，在该分析的条件下，具有适当引导序列的CasX能够编辑PCSK9基因座，并且与Spy Cas9相比在更大程度上进行这种编辑(基于平均编辑)，同时表现出比Sau Cas9多得多的编辑。

实例26：CasX 119和引导支架174编辑HepG2细胞中的PCSK9基因座

进行实验以证明使用慢病毒递送的CasX 119、引导序列174和靶向WT PCSK9序列的间隔子的构建体在HepG2细胞中编辑PCSK9基因座的能力。

材料及方法：

使用实例15的方法通过以下方式产生慢病毒粒子：使用包含靶向PCSK9基因座的间隔子(表11的序列6.7、6.8和6.9)的CasX质粒、慢病毒包装质粒和VSV-G包膜质粒的基于聚乙烯亚胺的转染来转染70％–90％汇合度的HEK293T。为了产生粒子，在转染后12小时更换培养基，并在转染后36-48小时收获病毒。使用0.45μm膜滤器过滤病毒上清液，适当时在培养基中稀释，并添加到在HepG2培养基(含10％FBS和1％青霉素-链霉素的EMEM)中培养的HepG2靶细胞中。如果需要，以5-20μg/ml添加补充聚凝胺以增强转导效率。在转导后24-48小时在HepG2培养基中使用0.3-3μg/ml的嘌呤霉素选择经转导的细胞，并在具有5％CO2的37℃培育箱中在HepG2培养基中生长6天。然后收获细胞，并使用NGS分析编辑。简而言之，使用对所关注靶基因组位置具有特异性的引物，通过PCR扩增基因组DNA，以形成靶扩增子。这些引物在5’端含有额外序列以引入Illumina读段1和2序列。另外，其含有充当独特分子标识符(UMI)的16nt随机序列。使用Fragment Analyzer DNA分析仪试剂盒(Agilent，dsDNA35-1500bp)评估扩增子的质量及定量。根据制造商的说明书在Illumina Miseq上测序扩增子。对测序得到的原始fastq文件进行如下处理：(1)使用程序cutadapt(v.2.1)针对质量和衔接子序列修剪这些序列；(2)使用程序flash2(v2.2.00)将来自读段1和读段2的序列合并成单一插入序列；并且(3)共有插入序列与预期的扩增子序列和间隔子序列一起通过程序CRISPResso2(v 2.0.29)运行。该程序定量了在间隔子3'端周围的窗口中修饰的读段百分比(30bp窗口以距间隔子3'端–3bp为中心)。CasX分子的编辑活性被定量为在该窗口内任何地方包含插入和/或缺失的读段的总百分比。

结果:

图25的图示表明，具有靶向至PCSK9的三种不同间隔子的构建体能够以不同的活性水平编辑PCSK9基因座，平均编辑率为60％。每个数据点是由单个间隔子产生的编辑结果的NGS读段的平均测量值。

结果表明，在该分析的条件下，具有适当靶向的引导序列的CasX能够高度有效地编辑HepG2细胞中的PCSK9基因座。

实例27：CasX 491和引导支架174编辑AML12细胞中的PCSK9基因座

进行实验以证明当通过转染递送时，在AML12细胞中编辑野生型PCSK9基因座的能力。

材料及方法：

用1000ng编码CasX 491以及具有间隔子27.1至27.7的gRNA支架174的质粒转染鼠肝细胞系AML12细胞，这些间隔子靶向野生型鼠PCSK9(表17中的序列)。转染的细胞在具有5％CO2的37℃培育箱处培育的AML12培养基(DMEM:F12，补充有10％胎牛血清、10μg/ml胰岛素、5.5μg/ml转铁蛋白、5ng/ml硒、40ng/ml地塞米松)中生长6天。然后收获细胞，并使用NGS进行编辑分析。简而言之，使用对所关注靶基因组位置具有特异性的引物，通过PCR扩增基因组DNA，以形成靶扩增子。这些引物在5’端含有额外序列以引入Illumina读段1和2序列。另外，其含有充当独特分子标识符(UMI)的16nt随机序列。使用Fragment Analyzer DNA分析仪试剂盒(Agilent，dsDNA 35-1500bp)评估扩增子的质量及定量。根据制造商的说明书在Illumina Miseq上测序扩增子。对测序得到的原始fastq文件进行如下处理：(1)使用程序cutadapt(v.2.1)针对质量和衔接子序列修剪这些序列；(2)使用程序flash2(v2.2.00)将来自读段1和读段2的序列合并成单一插入序列；并且(3)共有插入序列与预期的扩增子序列和间隔子序列一起通过程序CRISPResso2(v 2.0.29)运行。该程序定量了在间隔子3'端周围的窗口中修饰的读段百分比(30bp窗口以距间隔子3'端–3bp为中心)。CasX分子的活性被定量为在该窗口内任何地方包含插入和/或缺失的读段的总百分比。

表17：靶向小鼠PCSK9基因座的间隔子序列

结果：

图26的图示表明，具有三种不同间隔子的构建体能够以至少6％-7％的平均编辑率编辑PCSK9基因座，而其他间隔子产生较低的编辑量。每个数据点是由单个间隔子产生的编辑结果的NGS读段的平均测量值。结果表明，在该分析的条件下，具有适当靶向的引导序列的CasX能够编辑AML12细胞中的PCSK9基因座。

Claims

1.一种包含2类V型CRISPR蛋白和第一引导核酸(gNA)的系统，其中所述gNA包含与前蛋白转化酶枯草杆菌蛋白酶/kexin 9型(PCSK9)基因靶核酸序列互补的靶向序列，其中所述PCSK9基因包含一个或多个突变。

2.根据权利要求1所述的系统，其中所述PCSK9基因在选自由以下组成的组的区中包含一个或多个突变：

a.PCSK9内含子；

b.PCSK9外显子；

c.PCSK9内含子-外显子连接处；

d.PCSK9调节元件；和

e.基因间区。

3.根据权利要求1或权利要求2中任一项所述的系统，其中与所述野生型PCSK9基因序列相比，所述突变是一个或多个核苷酸的插入、缺失、取代、重复或倒位。

4.根据权利要求1至3中任一项所述的系统，其中所述突变是功能获得性突变。

5.根据权利要求3所述的系统，其中所述一个或多个突变包含选自由以下组成的组的氨基酸取代：相对于SEQ ID NO:33的序列的S127R、D129G、F216L、D374H和D374Y。

6.根据权利要求1至5所述的系统，其中所述gNA的所述靶向序列与编码所述S127R、D129G、F216L、D374H或D374Y取代的靶核酸序列互补。

7.根据权利要求6所述的系统，其中所述gNA的所述靶向序列包含选自由以下组成的组的序列：AGCAGGUCGCCUCUCAUCUU(SEQ ID NO:272)、CAUCUUCACCAGGAAGCCAG(SEQ ID NO:273)、CCUCUCAUCUUCACCAGGAA(SEQ ID NO:274)、UGGUGAAGAUGAGAGGCGAC(SEQ ID NO:275)、GUGGAGGCGGGUCCCGUCCU(SEQ ID NO:281)、AGCCACUGCAGCACCUGCUU(SEQ ID NO:287)、UUGGUGCCUCCAGCCACUGC(SEQ ID NO:288)、AGCUACUGCAGCACCUGCUU(SEQ ID NO:289)和UUGGUGCCUCCAGCUACUGC(SEQ ID NO:290)。

8.根据权利要求1至3中任一项所述的系统，其中所述突变是功能丧失性突变。

9.根据权利要求8所述的系统，其中所述一个或多个突变包含选自由以下组成的组的氨基酸取代：相对于SEQ ID NO:33的序列的R46L、G106R、Y142X、N157K、R237W和C679X。

10.根据权利要求9所述的系统，其中所述gNA的所述靶向序列与编码所述R46L、G106R、Y142X、N157K、R237W或C679X取代的靶核酸序列互补。

11.根据权利要求1至10中任一项所述的系统，其中所述PCSK9基因编码非功能性PCSK9蛋白。

12.根据权利要求1至11中任一项所述的系统，其中所述gNA是引导RNA(gRNA)。

13.根据权利要求1至11中任一项所述的系统，其中所述gNA是引导DNA(gDNA)。

14.根据权利要求1至11中任一项所述的系统，其中所述gNA是包含DNA和RNA的嵌合体。

15.根据权利要求1至14中任一项所述的系统，其中所述gNA是单分子gNA(sgNA)。

16.根据权利要求1至14中任一项所述的系统，其中所述gNA是双分子gNA(dgNA)。

17.根据权利要求1至16中任一项所述的系统，其中所述gNA的所述靶向序列包含选自由SEQ ID NO:247-303、315-436、612-2100和2286-13861的序列组成的组的序列，或与其具有至少约65％、至少约75％、至少约85％或至少约95％同一性的序列。

18.根据权利要求1至16中任一项所述的系统，其中所述gNA的所述靶向序列包含选自由SEQ ID NO:247-303、315-436、612-2100和2286-13861的序列组成的组的序列。

19.根据权利要求1至16中任一项所述的系统，其中所述gNA的所述靶向序列包含SEQID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了单个核苷酸。

20.根据权利要求1至16中任一项所述的系统，其中所述gNA的所述靶向序列包含SEQID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了两个核苷酸。

21.根据权利要求1至16中任一项所述的系统，其中所述gNA的所述靶向序列包含SEQID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了三个核苷酸。

22.根据权利要求1至16中任一项所述的系统，其中所述gNA的所述靶向序列包含SEQID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了四个核苷酸。

23.根据权利要求1至16中任一项所述的系统，其中所述gNA的所述靶向序列包含SEQID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了五个核苷酸。

24.根据权利要求17至23中任一项所述的系统，其中所述gNA的所述靶向序列包含相对于SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列具有一个或多个单核苷酸多态性(SNP)的序列。

25.根据权利要求1至24中任一项所述的系统，其中所述gNA的所述靶向序列与PCSK9外显子的序列互补。

26.根据权利要求1至24中任一项所述的系统，其中所述gNA的所述靶向序列与PCSK9外显子1或外显子2的序列互补。

27.根据权利要求1至24中任一项所述的系统，其中所述gNA的所述靶向序列与PCSK9内含子的序列互补。

28.根据权利要求1至24中任一项所述的系统，其中所述gNA的所述靶向序列与PCSK9内含子-外显子连接处的序列互补。

29.根据权利要求1至24中任一项所述的系统，其中所述gNA的所述靶向序列与PCSK9调节元件的序列互补。

30.根据权利要求1至23中任一项所述的系统，其中所述gNA的所述靶向序列与包含所述PCSK9基因的一个或多个单核苷酸多态性(SNP)的序列互补。

31.根据权利要求1至24中任一项所述的系统，其中所述gNA的所述靶向序列与所述PCSK9基因的基因间区的序列互补。

32.根据权利要求1至31中任一项所述的系统，所述系统进一步包含第二gNA，其中与所述第一gNA的所述靶向序列相比，所述第二gNA具有与所述PCSK9靶核酸的不同或重叠部分互补的靶向序列。

33.根据权利要求32所述的系统，其中所述第二gNA具有与所述第一gNA靶向的相同外显子互补的靶向序列。

34.根据权利要求32所述的系统，其中所述第二gNA具有与所述第一gNA靶向的不同外显子互补的靶向序列。

35.根据权利要求32所述的系统，其中所述第二gNA具有与所述第一gNA靶向的所述外显子3’的内含子互补的靶向序列。

36.根据权利要求32至35中任一项所述的系统，其中所述第二gNA的所述靶向序列包含选自由SEQ ID NO:247-303、315-436、612-2100和2286-13861的序列组成的组的序列，或与其具有至少约65％、至少约75％、至少约85％或至少约95％同一性的序列。

37.根据权利要求32至35中任一项所述的系统，其中所述第二gNA的所述靶向序列包含选自由SEQ ID NO:247-303、315-436、612-2100和2286-13861的序列组成的组的序列。

38.根据权利要求32至35中任一项所述的系统，其中所述第二gNA的所述靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了单个核苷酸。

39.根据权利要求32至35中任一项所述的系统，其中所述第二gNA的所述靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了两个核苷酸。

40.根据权利要求32至35中任一项所述的系统，其中所述第二gNA的所述靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了三个核苷酸。

41.根据权利要求32至35中任一项所述的系统，其中所述第二gNA的所述靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了四个核苷酸。

42.根据权利要求32至35中任一项所述的系统，其中所述第二gNA的所述靶向序列包含SEQ ID NO:247-303、315-436、612-2100或2286-13861的序列，其中从所述序列的3’端去除了五个核苷酸。

43.根据权利要求1至42中任一项所述的系统，其中所述第一gNA和/或所述第二gNA具有支架，所述支架包含选自由SEQ ID NO:2201-2285组成的组的序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的序列。

44.根据权利要求1至42中任一项所述的系统，其中所述第一gNA和/或所述第二gNA具有支架，所述支架包含选自由SEQ ID NO:2201-2285组成的组的序列。

45.根据权利要求1至42中任一项所述的系统，其中所述第一gNA和/或所述第二gNA具有支架，所述支架由一定序列组成，所述序列选自由SEQ ID NO:2201-2285组成的组。

46.根据权利要求1至45中任一项所述的系统，其中所述第一gNA支架和/或所述第二gNA支架包含相对于参考gNA序列具有至少一个修饰的序列，所述参考gNA序列选自由SEQID NO:4-16组成的组。

47.根据权利要求46所述的系统，其中所述参考gNA的所述至少一个修饰包含所述参考gNA序列的核苷酸的至少一个取代、缺失或取代。

48.根据权利要求1至47中任一项所述的系统，其中所述第一gNA和/或所述第二gNA是化学修饰的。

49.根据权利要求1至48中任一项所述的系统，其中所述2类V型CRISPR蛋白是具有SEQID NO:1-3中任一者的序列的参考CasX蛋白，具有SEQ ID NO:49-160、329、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490的序列，或与其具有至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、或至少约95％、或至少约95％、或至少约96％、或至少约97％、或至少约98％、或至少约99％序列同一性的序列的CasX变异蛋白。

50.根据权利要求1至49中任一项所述的系统，其中所述2类V型CRISPR蛋白是具有SEQID NO:49-160、329、441、443、445、447-460、472、474、476、478、480、482、484、486、488或490的序列的CasX变异蛋白。

51.根据权利要求49所述的系统，其中所述CasX变异蛋白相对于具有选自SEQ ID NO:1-3的序列的参考CasX蛋白包含至少一个修饰。

52.根据权利要求51所述的系统，其中相对于所述参考CasX蛋白，所述至少一个修饰包括在所述CasX变异蛋白的域中的至少一个氨基酸取代、缺失或取代。

53.根据权利要求52所述的系统，其中所述域选自由非靶链结合(NTSB)域、靶链负载(TSL)域、螺旋形I域、螺旋形II域、寡核苷酸结合域(OBD)和RuvC DNA裂解域组成的组。

54.根据权利要求49至53中任一项所述的系统，其中所述CasX蛋白进一步包含一个或多个核定位信号(NLS)。

55.根据权利要求54所述的系统，其中所述一个或多个NLS选自由SEQ ID NO:161-194、217和223-224组成的序列的组。

56.根据权利要求54或权利要求55所述的系统，其中所述一个或多个NLS在所述CasX蛋白的C端处或附近表达。

57.根据权利要求54或权利要求55所述的系统，其中所述一个或多个NLS在所述CasX蛋白的N端处或附近表达。

58.根据权利要求54或权利要求55所述的系统，所述系统包含位于所述CasX蛋白的N端处或附近以及C端处或附近的一个或多个NLS。

59.根据权利要求49至58中任一项所述的系统，其中所述2类V型CRISPR蛋白能够与所述gNA形成核糖核蛋白复合物(RNP)。

60.根据权利要求49至58中任一项所述的系统，其中所述CasX变异体能够与所述gNA形成核糖核蛋白复合物(RNP)。

61.根据权利要求49至58中任一项所述的系统，其中所述CasX变异体和所述gNA复合为RNP。

62.根据权利要求61所述的系统，其中包含所述CasX变异蛋白和所述gNA的RNP与包含SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的所述参考CasX蛋白和包含SEQ ID NO:4-16中任一者的序列的gNA的RNP相比表现出至少一种或多种改进特征。

63.根据权利要求62所述的系统，其中所述改进特征选自由以下组成的组中的一者或多者：所述CasX变异体的改进折叠；对引导核酸(gNA)的改进结合亲和力；对靶DNA的改进结合亲和力；在靶DNA的编辑中利用较大范围的一个或多个PAM序列的改进能力，所述一个或多个PAM序列包括ATC、CTC、GTC或TTC；所述靶DNA的改进解旋；增加的编辑活性；改进的编辑效率；改进的编辑特异性；增加的核酸酶活性；改进的靶核酸序列裂解速率；增加的用于双链裂解的靶链负载；减少的用于单链切割的靶链负载；减少的脱靶裂解；改进的非靶DNA链的结合；改进的蛋白质稳定性；改进的蛋白质溶解度；改进的核糖核蛋白复合物(RNP)形成；更高百分比的裂解感受态RNP；改进的蛋白质:gNA复合物(RNP)稳定性；改进的蛋白质:gNA复合物溶解度；改进的蛋白质产率；改进的蛋白质表达；以及改进的融合特征。

64.根据权利要求62或权利要求63所述的系统，其中所述CasX变异蛋白和所述gNA变异体的所述RNP的所述改进特征相对于SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的所述参考CasX蛋白和包含SEQ ID NO:4-16中任一者的序列的所述gNA的所述RNP改进至少约1.1至约100倍或更多。

65.根据权利要求62或权利要求63所述的系统，其中所述CasX变异蛋白的所述改进特征是相对于SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的所述参考CasX蛋白和包含SEQ IDNO:4-16中任一者的序列的所述gNA改进至少约1.1、至少约2、至少约10、至少约100倍或更多。

66.根据权利要求64或权利要求65所述的系统，其中所述改进特征是对所述靶核酸序列的改进结合亲和力。

67.根据权利要求61至66中任一项所述的系统，其中相比于类似分析系统中包含参考CasX蛋白和参考gNA的RNP的编辑效率及/或结合，当所述PAM序列TTC、ATC、GTC或CTC中的任一者位于与细胞分析系统中的所述gNA的所述靶向序列具有一致性的所述非靶链序列5’的1个核苷酸处时，包含所述CasX变异体和所述gNA变异体的所述RNP表现出所述靶核酸中靶序列的较大编辑效率及/或结合。

68.根据权利要求67所述的系统，其中所述PAM序列为TTC。

69.根据权利要求68所述的系统，其中所述gNA的所述靶向序列包含选自由SEQ ID NO:3184-7251组成的组的序列。

70.根据权利要求67所述的系统，其中所述PAM序列为ATC。

71.根据权利要求70所述的系统，其中所述gNA的所述靶向序列包含选自由SEQ ID NO:315-436、612-2100和2286-3183组成的组的序列。

72.根据权利要求67所述的系统，其中所述PAM序列为CTC。

73.根据权利要求72所述的系统，其中所述gNA的所述靶向序列包含选自由SEQ ID NO:7252-11521组成的组的序列。

74.根据权利要求67所述的系统，其中所述PAM序列为GTC。

75.根据权利要求74所述的系统，其中所述gNA的所述靶向序列包含选自由SEQ ID NO:11522-13861组成的组的序列。

76.根据权利要求61至75中任一项所述的系统，其中与SEQ ID NO:1-3的所述参考CasX蛋白和SEQ ID NO:4-16的所述gNA的RNP相比，所述RNP具有百分比高至少5％、至少10％、至少15％或至少20％的裂解感受态RNP。

77.根据权利要求60至75中任一项所述的系统，其中与SEQ ID NO:1-3的所述参考CasX蛋白的RNP相比，所述RNP在体外分析中具有增加至少5倍、至少10倍或至少30倍的裂解速率。

78.根据权利要求49至77中任一项所述的系统，其中所述CasX变异蛋白包含具有切口酶活性的RuvC DNA裂解域。

79.根据权利要求49至77中任一项所述的系统，其中所述CasX变异蛋白包含具有双链裂解活性的RuvC DNA裂解域。

80.根据权利要求49至75中任一项所述的系统，其中所述CasX蛋白是无催化活性CasX(dCasX)蛋白，并且其中所述dCasX和所述gNA的RNP保留结合至所述PCSK9靶核酸的能力。

81.根据权利要求80所述的系统，其中所述dCasX包含以下残基处的突变：

a.对应于SEQ ID NO:1的CasX蛋白的D672、E769及/或D935；或

b.对应于SEQ ID NO:2的CasX蛋白的D659、E756及/或D922。

82.根据权利要求81所述的系统，其中所述突变是丙氨酸对所述残基的取代。

83.根据权利要求1至79中任一项所述的系统，所述系统进一步包含供体模板核酸。

84.根据权利要求83所述的系统，其中所述供体模板包含一定核酸，所述核酸包含PCSK9基因的至少一部分，其选自由PCSK9外显子、PCSK9内含子、PCSK9内含子-外显子连接处和PCSK9调节元件或其组合组成的组。

85.根据权利要求84所述的系统，其中所述供体模板包含野生型核酸序列。

86.根据权利要求84所述的系统，其中所述供体模板包含相对于所述野生型PCSK9基因序列具有一个或多个突变的核酸序列。

87.根据权利要求83至86中任一项所述的系统，其中所述供体模板的大小范围为10-15,000个核苷酸。

88.根据权利要求83至87中任一项所述的系统，其中所述供体模板是单链DNA模板或单链RNA模板。

89.根据权利要求83至87中任一项所述的系统，其中所述供体模板是双链DNA模板。

90.根据权利要求83至89中任一项所述的系统，其中所述供体模板在所述供体模板的5’和3’端处或附近包含同源臂，所述同源臂与位于所述2类V型CRISPR蛋白引入的所述PCSK9靶核酸中的裂解位点侧翼的序列互补。

91.根据权利要求1至90中任一项所述的系统，其中所述靶核酸序列与位于前间隔子邻近基序(PAM)序列3’的1个核苷酸处的非靶链序列互补。

92.根据权利要求91所述的系统，其中所述PAM序列包含TC基序。

93.根据权利要求91所述的系统，其中所述PAM序列包含ATC、GTC、CTC或TTC。

94.根据权利要求91至93中任一项所述的系统，其中所述2类V型CRISPR蛋白包含RuvC域。

95.根据权利要求94所述的系统，其中所述RuvC域在所述靶核酸序列中产生交错双链断裂。

96.根据权利要求91至95中任一项所述的系统，其中所述2类V型CRISPR蛋白不包含HNH核酸酶域。

97.一种核酸，所述核酸包含根据权利要求83至90中任一项所述的供体模板。

98.一种核酸，所述核酸包含编码根据权利要求49至82中任一项所述的CasX的序列。

99.根据权利要求98所述的核酸，其中编码所述CasX蛋白的所述序列经密码子优化以表达于真核细胞中。

100.一种核酸，所述核酸包含编码根据权利要求1至48中任一项所述的gNA的序列。

101.一种载体，所述载体包含根据权利要求1至48中任一项所述的gNA、根据权利要求49至82中任一项所述的CasX蛋白或根据权利要求97至100中任一项所述的核酸。

102.根据权利要求101所述的载体，其中所述载体进一步包含启动子。

103.根据权利要求101或权利要求102所述的载体，其中所述载体选自由逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒(AAV)载体、单纯疱疹病毒(HSV)载体、病毒样粒子(VLP)、质粒、微环、纳米质粒、DNA载体和RNA载体组成的组。

104.根据权利要求103所述的载体，其中所述载体是AAV载体。

105.根据权利要求104所述的载体，其中所述AAV载体选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV 44.9、AAV-Rh74或AAVRh10。

106.根据权利要求105所述的载体，其中所述AAV载体选自AAV1、AAV2、AAV5、AAV8或AAV9。

107.根据权利要求103所述的载体，其中所述载体是逆转录病毒载体。

108.根据权利要求103所述的载体，其中所述载体是包含gag多蛋白的一种或多种组分的VLP载体。

109.根据权利要求108所述的载体，其中所述Gag多蛋白的所述一种或多种组分选自由基质蛋白(MA)、核衣壳蛋白(NC)、衣壳蛋白(CA)、p1-p6蛋白、PP21/24肽、P12/P3/P8肽、p2肽、P10肽、p68 Gag多肽、p3 Gag多肽和蛋白酶裂解位点组成的组。

110.根据权利要求108或权利要求109所述的载体，所述载体包含所述CasX蛋白和所述gNA。

111.根据权利要求110所述的载体，其中所述CasX蛋白和所述gNA在RNP中缔合在一起。

112.根据权利要求108至111中任一项所述的载体，所述载体进一步包含所述供体模板。

113.根据权利要求108至112中任一项所述的载体，所述载体进一步包含提供所述VLP与靶细胞结合和融合的假型病毒包膜糖蛋白或抗体片段。

114.一种宿主细胞，所述宿主细胞包含根据权利要求101至113中任一项所述的载体。

115.根据权利要求114所述的宿主细胞，其中所述宿主细胞选自由BHK、HEK293、HEK293T、NS0、SP2/0、YO骨髓瘤细胞、P3X63小鼠骨髓瘤细胞、PER、PER.C6、NIH3T3、COS、HeLa、CHO和酵母细胞组成的组。

116.一种药物组合物，所述药物组合物包含：

a.根据权利要求1至96中任一项所述的系统；

b.根据权利要求97至100中任一项所述的核酸；或

c.根据权利要求101至113中任一项所述的载体，

和一种或多种药学上合适的赋形剂。

117.根据权利要求116所述的药物组合物，其中所述药物组合物被配制用于选自由静脉内、门静脉内注射、腹膜内、肌内、皮下、眼内和口服途径组成的组的施用途径。

118.根据权利要求116所述的药物组合物，其中所述药物组合物为液体形式或冷冻形式。

119.根据权利要求116至118中任一项所述的药物组合物，其中所述药物组合物位于用于单次注射的预填充注射器中。

120.一种修饰细胞群体中的PCSK9靶核酸序列的方法，其中所述PCSK9靶核酸包含一个或多个突变，所述方法包括向所述群体的细胞中引入：

a.根据权利要求1至96中任一项所述的系统；

b.根据权利要求97至100中任一项所述的核酸；

c.根据权利要求101至113中任一项所述的载体；

d.根据权利要求116至119中任一项所述的药物组合物；或

e.(a)至(d)中两者或更多者的组合，

其中所述第一gNA靶向的所述细胞的所述PCSK9靶核酸序列被所述2类V型蛋白修饰。

121.根据权利要求120所述的方法，其中所述修饰包括在所述群体的所述细胞的所述PCSK9靶核酸序列中引入单链断裂。

122.根据权利要求120所述的方法，其中所述修饰包括在所述群体的所述细胞的所述PCSK9靶核酸序列中引入双链断裂。

123.根据权利要求120至122中任一项所述的方法，所述方法进一步包括向所述群体的所述细胞中引入第二gNA或编码所述第二gNA的核酸，其中与所述第一gNA相比，所述第二gNA具有与所述PCSK9靶核酸的不同或重叠部分互补的靶向序列，引起所述群体的所述细胞的所述PCSK9靶核酸中的额外断裂。

124.根据权利要求120至123中任一项所述的方法，其中所述修饰包括在所述群体的所述细胞的所述PCSK9靶核酸中引入一个或多个核苷酸的插入、缺失、取代、重复或倒位。

125.根据权利要求120至124中任一项所述的方法，其中所述群体的至少约1％、至少约2％、至少约3％、至少约4％、至少约5％、至少约6％、至少约7％、至少约8％、至少约9％或至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％或更多的所述细胞的所述PCSK9靶核酸被修饰。

126.根据权利要求120至124中任一项所述的方法，其中所述修饰引起所述群体的所述细胞中的所述PCSK9基因的敲低或敲除，使得与所述PCSK9基因未被修饰的细胞相比，非功能性PCSK9蛋白的表达减少至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。

127.根据权利要求120至126中任一项所述的方法，其中所述群体的所述细胞的所述PCSK9基因被修饰，使得至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％的所述修饰细胞不表达可检测水平的非功能性PCSK9蛋白。

128.根据权利要求120至124中任一项所述的方法，其中所述修饰引起所述群体的所述细胞中所述PCSK9基因的所述突变的校正或补偿，使得所述细胞表达功能性PCSK9蛋白。

129.根据权利要求120至124和128中任一项所述的方法，其中与所述PCSK9基因未被修饰的细胞相比，所述群体的所述细胞对所述功能性PCSK9蛋白的表达增加了至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。

130.根据权利要求120至123中任一项所述的方法，其中所述方法包括将所述供体模板的序列插入所述群体的所述细胞的所述PCSK9基因靶核酸序列的所述断裂位点。

131.根据权利要求130所述的方法，其中所述供体模板的所述序列的所述插入是由同源定向修复(HDR)或同源非依赖性靶向整合(HITI)介导。

132.根据权利要求130或权利要求131所述的方法，其中所述供体模板的所述序列的插入引起所述群体的所述细胞中所述PCSK9基因的校正或补偿，使得所述细胞表达功能性PCSK9蛋白。

133.根据权利要求130至132中任一项所述的方法，其中与所述PCSK9基因未被修饰的细胞相比，所述群体的所述细胞对所述功能性PCSK9蛋白的表达增加了至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。

134.根据权利要求130至132中任一项所述的方法，其中所述群体的所述细胞的所述PCSK9基因被修饰，使得至少约50％、至少约60％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％或至少约95％的所述修饰细胞表达可检测水平的功能性PCSK9。

135.根据权利要求130或权利要求131所述的方法，其中所述供体模板的所述序列的插入引起所述群体的所述细胞中的所述PCSK9基因的敲低或敲除，使得与所述PCSK9基因未被修饰的细胞相比，非功能性PCSK9蛋白的表达减少至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。

136.根据权利要求130或权利要求131所述的方法，其中所述群体的所述细胞的所述PCSK9基因被修饰，使得至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％的所述修饰细胞不表达可检测水平的非功能性PCSK9蛋白。

137.根据权利要求120至136中任一项所述的方法，其中所述细胞是真核的。

138.根据权利要求137所述的方法，其中所述真核细胞选自由啮齿动物细胞、小鼠细胞、大鼠细胞和非人灵长类动物细胞组成的组。

139.根据权利要求137所述的方法，其中所述真核细胞为人类细胞。

140.根据权利要求137至139所述的方法，其中所述真核细胞选自由肝细胞、肠细胞、肾细胞、中枢神经系统细胞、平滑肌细胞、巨噬细胞、视网膜细胞和动脉内皮细胞组成的组。

141.根据权利要求120至140中任一项所述的方法，其中所述细胞群体的所述PCSK9基因靶核酸序列的所述修饰在体外或离体发生。

142.根据权利要求120至140所述的方法，其中所述细胞群体的所述PCSK9基因靶核酸序列的所述修饰在受试者体内发生。

143.根据权利要求142所述的方法，其中所述受试者选自由啮齿动物、小鼠、大鼠和非人灵长类动物组成的组。

144.根据权利要求142所述的方法，其中所述个体为人类。

145.根据权利要求142至144中任一项所述的方法，其中所述方法包括向所述受试者施用治疗有效剂量的AAV载体。

146.根据权利要求145所述的方法，其中所述AAV载体以至少约1x10⁵个载体基因组/kg(vg/kg体重)、至少约1x10⁶vg/kg、至少约1x10⁷vg/kg、至少约1x10⁸vg/kg、至少约1x10⁹vg/kg、至少约1x10¹⁰vg/kg、至少约1x10¹¹vg/kg、至少约1x10¹²vg/kg、至少约1x10¹³vg/kg、至少约1x10¹⁴vg/kg、至少约1x10¹⁵vg/kg、或至少约1x10¹⁶vg/kg的剂量施用于所述受试者。

147.根据权利要求145所述的方法，其中所述AAV载体以至少约1x10⁵vg/kg至约1x10¹⁶vg/kg、至少约1x10⁶vg/kg至约1x10¹⁵vg/kg、至少约1x10⁷vg/kg至约1x10¹⁴vg/kg、至少约1x10⁸vg/kg至约1x10¹³vg/kg、至少约1x10⁹vg/kg至约1x10¹²vg/kg、或至少约1x10¹⁰vg/kg至约1x10¹¹vg/kg的剂量施用于所述受试者。

148.根据权利要求142至144中任一项所述的方法，其中所述方法包括向所述受试者施用治疗有效剂量的VLP。

149.根据权利要求148所述的方法，其中所述VLP以至少约1x10⁵个粒子/kg体重(粒子/kg)、至少约1x10⁶个粒子/kg、至少约1x10⁷个粒子/kg、至少约1x10⁸个粒子/kg、至少约1x10⁹个粒子/kg、至少约1x10¹⁰个粒子/kg、至少约1x10¹¹个粒子/kg、至少约1x10¹²个粒子/kg、至少约1x10¹³个粒子/kg、至少约1x10¹⁴个粒子/kg、至少约1x10¹⁵个粒子/kg、至少约1x101⁶个粒子/kg的剂量施用于所述受试者。

150.根据权利要求148所述的方法，其中所述VLP以至少约1x10⁵个粒子/kg至约1x10¹⁶个粒子/kg、至少约1x10⁶个粒子/kg至约1x10¹⁵个粒子/kg、至少约1x10⁷个粒子/kg至约1x10¹⁴个粒子/kg、至少约1x10⁸个粒子/kg至约1x10¹³个粒子/kg、至少约1x10⁹个粒子/kg至约1x10¹²个粒子/kg、至少约1x10¹⁰个粒子/kg至约1x10¹¹个粒子/kg的剂量施用于所述受试者。

151.根据权利要求142至150中任一项所述的方法，其中所述载体或VLP通过选自由静脉内、门静脉内注射、腹膜内、肌内、皮下、眼内和口服途径组成的组的施用途径施用于所述受试者。

152.根据权利要求142至151中任一项所述的方法，所述方法进一步包括使所述细胞群体的所述PCSK9靶核酸序列与以下物质接触：

a.与所述第一gNA相比，靶向所述PCSK9靶核酸的不同或重叠部分的额外的CRISPR核酸酶和gNA；

b.编码(a)的所述额外的CRISPR核酸酶和所述gNA的一个或多个多核苷酸；

c.包含(b)的所述多核苷酸的载体；或

d.包含所述额外的CRISPR核酸酶和(a)的所述gNA的VLP；

其中与所述第一gNA靶向的所述序列相比，所述接触引起所述PCSK9基因在所述序列中不同位置处的修饰。

153.根据权利要求152所述的方法，其中所述额外的CRISPR核酸酶是具有与根据前述权利要求中任一项所述的CasX蛋白不同的序列的CasX蛋白。

154.根据权利要求152所述的方法，其中所述额外的CRISPR核酸酶不是CasX蛋白。

155.根据权利要求154所述的方法，其中所述额外的CRISPR核酸酶选自由Cas9、Cas12a、Cas12b、Cas12c、Cas12d(CasY)、Cas12J、Cas13a、Cas13b、Cas13c、Cas13d、CasX、CasY、CasZ、Cas14、Cpf1、C2cl、Csn2、Cas Phi及其序列变异体组成的组。

156.一种细胞群体，所述细胞群体通过根据权利要求142至155中任一项所述的方法来修饰，其中所述细胞已经被修饰，使得至少70％、至少75％、至少80％、至少85％、至少90％或至少95％的所述修饰细胞不表达可检测水平的非功能性PCSK9蛋白。

157.一种细胞群体，所述细胞群体通过根据权利要求142至156中任一项所述的方法来修饰，其中所述PCSK9靶核酸的所述突变在所述群体的所述修饰细胞中得到校正或补偿，从而引起所述修饰细胞表达功能性PCSK9蛋白。

158.根据权利要求157所述的细胞群体，其中所述细胞已经被修饰，使得与所述PCSK9基因未被修饰的细胞相比，功能性PCSK9蛋白的表达增加至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。

159.根据权利要求156至158中任一项所述的细胞群体，其中所述细胞选自由肝细胞、肠细胞、肾细胞、中枢神经系统细胞、平滑肌细胞、巨噬细胞、视网膜细胞和动脉内皮细胞组成的组。

160.一种治疗有需要的受试者的PCSK9相关疾病的方法，所述方法包括向所述受试者施用治疗有效量的根据权利要求156至159中任一项所述的细胞。

161.根据权利要求160所述的方法，其中所述PCSK9相关疾病是常染色体显性高胆固醇血症(ADH)、高胆固醇血症、总胆固醇水平升高、高脂血症、低密度脂蛋白(LDL)水平升高、LDL-胆固醇水平升高、高密度脂蛋白水平降低、肝脂肪变性、冠心病、局部缺血、中风、外周血管疾病、血栓形成、2型糖尿病、高血压、动脉粥样硬化、肥胖症、阿尔茨海默病、神经变性、年龄相关性黄斑变性(AMD)或其组合。

162.根据权利要求160或权利要求161所述的方法，其中所述受试者选自由啮齿动物、小鼠、大鼠和非人灵长类动物组成的组。

163.根据权利要求160至162中任一项所述的方法，其中所述受试者是人类。

164.根据权利要求160至163中任一项所述的方法，其中所述细胞相对于待施用所述细胞的所述受试者是自体的。

165.根据权利要求160至163中任一项所述的方法，其中所述细胞相对于待施用所述细胞的所述受试者是同种异体的。

166.根据权利要求160至165中任一项所述的方法，其中所述细胞通过选自由静脉内、门静脉内注射、腹膜内、肌内、皮下、眼内和口服途径组成的组的施用途径施用。

167.一种治疗有需要的受试者的PCSK9相关疾病的方法，所述方法包括修饰所述受试者的细胞中具有一个或多个突变的PCSK9基因，所述修饰包括使所述细胞与治疗有效剂量的以下物质接触：

a.根据权利要求1至96中任一项所述的系统；

b.根据权利要求97至100中任一项所述的核酸；

c.根据权利要求101至107中任一项所述的载体；

d.根据权利要求108至113中任一项所述的VLP；

e.根据权利要求116至119中任一项所述的药物组合物；或

f.(a)至(e)中两者或更多者的组合，

其中所述第一gNA靶向的所述细胞的所述PCSK9基因被所述CasX蛋白修饰。

168.根据权利要求167所述的方法，其中所述修饰包括在所述细胞的所述PCSK9基因中引入单链断裂。

169.根据权利要求167所述的方法，其中所述修饰包括在所述细胞的所述PCSK9基因中引入双链断裂。

170.根据权利要求167至169中任一项所述的方法，所述方法进一步包括向所述受试者的所述细胞中引入第二gNA或编码所述第二gNA的核酸，其中与所述第一gNA相比，所述第二gNA具有与所述靶核酸的不同或重叠部分互补的靶向序列，引起所述受试者的所述细胞的所述PCSK9靶核酸中的额外断裂。

171.根据权利要求167至169中任一项所述的方法，其中所述修饰包括在所述细胞的所述PCSK9基因中引入一个或多个核苷酸的插入、缺失、取代、重复或倒位。

172.根据权利要求167至170中任一项所述的方法，其中所述修饰包括将所述供体模板的序列插入所述细胞的所述PCSK9基因靶核酸序列的所述断裂位点中。

173.根据权利要求172所述的方法，其中所述供体模板的所述序列的所述插入是由同源定向修复(HDR)或同源非依赖性靶向整合(HITI)介导。

174.根据权利要求167至173中任一项所述的方法，其中所述修饰引起所述受试者的所述修饰细胞中所述PCSK9基因的所述突变的校正或补偿。

175.根据权利要求174所述的方法，其中所述突变的校正引起所述受试者的所述修饰细胞表达功能性PCSK9蛋白。

176.根据权利要求174或权利要求175所述的方法，其中所述修饰细胞的所述PCSK9基因表达水平增加的功能性PCSK9蛋白，并且其中与所述PCSK9基因未被修饰的细胞相比，所述增加为至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。

177.根据权利要求167至173中任一项所述的方法，其中所述修饰引起敲低或敲除所述受试者的所述修饰细胞中的所述PCSK9基因，使得至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％的所述修饰细胞不表达可检测水平的非功能性PCSK9蛋白。

178.根据权利要求167至173中任一项所述的方法，其中所述修饰引起敲低或敲除所述受试者的所述修饰细胞中的所述PCSK9基因，使得与所述PCSK9基因未被修饰的受试者相比，所述受试者中非功能性PCSK9蛋白的表达减少至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％或至少约90％。

179.根据权利要求167至178中任一项所述的方法，其中所述受试者选自由啮齿动物、小鼠、大鼠和非人灵长类动物组成的组。

180.根据权利要求167至178中任一项所述的方法，其中所述受试者是人类。

181.根据权利要求167至180中任一项所述的方法，其中经修饰的所述细胞选自由肝细胞、肠细胞、肾细胞、中枢神经系统细胞、平滑肌细胞、巨噬细胞、视网膜细胞和动脉内皮细胞组成的组。

182.根据权利要求167至181中任一项所述的方法，其中所述PCSK9相关疾病是常染色体显性高胆固醇血症(ADH)、高胆固醇血症、总胆固醇水平升高、高脂血症、低密度脂蛋白(LDL)水平升高、LDL-胆固醇水平升高、高密度脂蛋白水平降低、肝脂肪变性、冠心病、局部缺血、中风、外周血管疾病、血栓形成、2型糖尿病、高血压、动脉粥样硬化、肥胖症、阿尔茨海默病、神经变性、年龄相关性黄斑变性(AMD)或其组合。

183.根据权利要求167至182中任一项所述的方法，其中所述载体以治疗有效剂量施用于所述受试者。

184.根据权利要求167至183中任一项所述的方法，其中所述载体是AAV，并且以至少约1x10⁵个载体基因组(vg)/kg、至少约1x10⁶vg/kg、至少约1x10⁷vg/kg、至少约1x10⁸vg/kg、至少约1x10⁹vg/kg、至少约1x10¹⁰vg/kg、至少约1x10¹¹vg/kg、至少约1x10¹²vg/kg、至少约1x10¹³vg/kg、至少约1x10¹⁴vg/kg、至少约1x10¹⁵vg/kg、或至少约1x10¹⁶vg/kg的剂量施用于所述受试者。

185.根据权利要求167至183中任一项所述的方法，其中所述载体是AAV，并且以至少约1x10⁵vg/kg至约1x10¹⁶vg/kg、至少约1x10⁶vg/kg至约1x10¹⁵vg/kg、至少约1x10⁷vg/kg至约1x10¹⁴vg/kg、至少约1x10⁸vg/kg至约1x10¹³vg/kg、至少约1x10⁹vg/kg至约1x10¹²vg/kg、或至少约1x10¹⁰vg/kg至约1x10¹¹vg/kg的剂量施用于所述受试者。

186.根据权利要求167至182中任一项所述的方法，其中所述VLP以治疗有效剂量施用于所述受试者。

187.根据权利要求186所述的方法，其中所述VLP以至少约1x10⁵个粒子/kg、至少约1x10⁶个粒子/kg、至少约1x10⁷个粒子/kg、至少约1x10⁸个粒子/kg、至少约1x10⁹个粒子/kg、至少约1x10¹⁰个粒子/kg、至少约1x10¹¹个粒子/kg、至少约1x10¹²个粒子/kg、至少约1x10¹³个粒子/kg、至少约1x10¹⁴个粒子/kg、至少约1x10¹⁵个粒子/kg、至少约1x10¹⁶个粒子/kg的剂量施用于所述受试者。

188.根据权利要求186所述的方法，其中所述VLP以至少约1x10⁵个粒子/kg至约1x10¹⁶个粒子/kg、至少约1x10⁶个粒子/kg至约1x10¹⁵个粒子/kg、至少约1x10⁷个粒子/kg至约1x10¹⁴个粒子/kg、至少约1x10⁸个粒子/kg至约1x10¹³个粒子/kg、至少约1x10⁹个粒子/kg至约1x10¹²个粒子/kg、至少约1x10¹⁰个粒子/kg至约1x10¹¹个粒子/kg的剂量施用于所述受试者。

189.根据权利要求183至188中任一项所述的方法，其中所述载体或VLP通过选自由静脉内、门静脉内注射、腹膜内、肌内、皮下、眼内和口服途径组成的组的施用途径施用。

190.根据权利要求167至189中任一项所述的方法，其中所述方法引起选自由以下组成的组的至少一个临床相关终点的改善：LDL-胆固醇从基线的变化、粥样斑块体积的减少、冠状动脉斑块的减少、动脉粥样硬化性心血管疾病(ASCVD)、心血管性死亡、非致死性心肌梗死、缺血性中风、非致死性中风、冠状动脉血运重建、不稳定型心绞痛或视敏度的减少。

191.根据权利要求167至189中任一项所述的方法，其中所述方法引起选自由以下组成的组的至少两个临床相关终点的改善：LDL-胆固醇从基线的变化、粥样斑块体积的减少、冠状动脉斑块的减少、动脉粥样硬化性心血管疾病(ASCVD)、心血管性死亡、非致死性心肌梗死、缺血性中风、非致死性中风、冠状动脉血运重建、不稳定型心绞痛或视敏度的减少。

192.根据权利要求1至96中任一项所述的系统、根据权利要求97至100中任一项所述的核酸、根据权利要求101至107中任一项所述的载体、根据权利要求108至113中任一项所述的VLP、根据权利要求116至119中任一项所述的药物组合物或其组合，用作治疗PCSK9相关疾病的药物。