CN118076728A

CN118076728A - 用于疗法的工程细胞

Info

Publication number: CN118076728A
Application number: CN202280047607.8A
Authority: CN
Inventors: J·A·左瑞斯; C·M·马古利斯
Original assignee: Coastal Bioscience Co
Current assignee: Coastal Bioscience Co
Priority date: 2021-05-04
Filing date: 2022-05-04
Publication date: 2024-05-24

Abstract

描述了用于基因修饰细胞以包括一个或多个功能缺失性修饰和/或以包括一个或多个功能获得性修饰的策略、系统、组合物和方法，以及包括一个或多个功能缺失性修饰和/或包括一个或多个功能获得性修饰的修饰的细胞(和这些细胞的组合物)。在某些方面，这些修饰的细胞在必需基因的编码区内包括至少一个功能获得性修饰。

Description

用于疗法的工程细胞

相关申请的交叉引用

本发明申请主张2021年5月4日提交的美国临时专利申请No.63/184,202、2021年5月5日提交的63/184,453、2021年8月3日提交的63/228,645、2021年8月16日提交的63/233,701、2021年8月16日提交的63/233,690、2021年8月16日提交的63/233,688、2021年10月22日提交的63/270,895、2021年11月3日提交的63/275,269、2022年1月7日提交的63/297,518和2022年3月21日提交的63/321,890的权益。每个优先权专利申请的全部内容作为参考并入本文。

背景技术

存在多种用于治疗癌症的治疗方法，如基因工程细胞疗法的使用。然而，工程细胞可以显示出有限的肿瘤细胞杀伤和/或有限的持久性。仍需要用于有效治疗癌症的工程细胞疗法。

发明概述

本发明公开的一些方面基于，至少部分基于用于基因修饰NK细胞和/或多潜能干细胞(例如，iPSC)的方法和系统，所述细胞(例如)分化成修饰的iNK细胞以包括一个或多个功能获得性修饰(例如，一个或多个本文所描述的功能获得性修饰)并且任选地以包括一个或多个功能缺失性修饰(例如，一个或多个本文所描述的功能缺失性修饰)，以及修饰的NK细胞和/或修饰的多潜能干细胞(例如，iPSC)，所述细胞分化成包括一个或多个功能获得性修饰(例如，一个或多个本文所描述的功能获得性修饰)并且任选地包括一个或多个功能缺失性修饰(例如，一个或多个本文所描述的功能缺失性修饰)的修饰的iNK细胞(和这些细胞的组合物)。在本发明公开的某些方面，这些(例如)分化成修饰的iNK细胞的修饰的NK细胞和/或修饰的多潜能干细胞(例如，iPSC)包括位于必需基因(例如，本文所描述的必需基因)的编码区内的至少一个功能获得性修饰。

在一个方面，本发明公开的特征在于自然杀伤(NK)细胞(或者这些NK细胞的子代或子代细胞，或者这些NK细胞的群体)，其包含：(a)导致一个或多个基因产物功能缺失的一个或多个基因组编辑；和/或(b)包含外源编码序列的基因组，其中所述外源编码序列与必需基因的编码序列位于同一读框且位于其下游(3')，并且其中所述必需基因的至少一部分包含外源编码序列。

在一些实施方式中，一个或多个基因组编辑导致以下中的一种或多种的功能缺失：腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)，两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLA II类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合。

在一些实施方式中，外源编码序列编码(i)FcγRIII(CD16)或其变体和/或(ii)膜结合的白介素15(mbIL-15)。

在一些实施方式中，基因组包含第一外源编码序列和第二外源编码序列。在一些实施方式中，第一外源编码序列编码FcγRIII(CD16)或其变体。在一些实施方式中，第二外源编码序列编码mbIL-15。在一些实施方式中，第一外源编码序列编码FcγRIII(CD16)或其变体并且第二外源编码序列编码mbIL-15。

在一些实施方式中，基因组包含：(i)位于必需基因的第一等位基因的第一外源编码序列和第二外源编码序列；和(ii)位于必需基因的第二等位基因的第一外源编码序列和第二外源编码序列。

在一些实施方式中，第一外源编码序列位于第二外源编码序列的上游(5')。在一些实施方式中，基因组包含：(i)位于必需基因的编码序列和第一外源编码序列之间的第一调控元件；和(ii)位于第一外源编码序列和第二外源编码序列之间的第二调控元件。在一些实施方式中，第一调控元件是IRES或2A元件并且第二调控元件是IRES或2A元件。在一些实施方式中，基因组包含位于第二外源编码序列下游(3')的多腺苷酸化序列。在一些实施方式中，基因组包含位于第二外源编码序列下游(3')和位于多腺苷酸化序列上游(5')的3'未翻译区(UTR)序列。

在一些实施方式中，第二外源编码序列位于第一外源编码序列的上游(5')。在一些实施方式中，基因组包含：(i)位于必需基因的编码序列和第二外源编码序列之间的第一调控元件；和(ii)位于第二外源编码序列和第一外源编码序列之间的第二调控元件。在一些实施方式中，第一调控元件是IRES或2A元件并且第二调控元件是IRES或2A元件。在一些实施方式中，基因组包含位于第一外源编码序列下游(3')的多腺苷酸化序列。在一些实施方式中，基因组包含位于第一外源编码序列下游(3')和位于多腺苷酸化序列上游(5')的3'未翻译区(UTR)序列。

在一些实施方式中，第一外源编码序列是或者包含SEQ ID NO：166。在一些实施方式中，第二外源编码序列是或者包含SEQ ID NO：172。在一些实施方式中，CD16是或者包含SEQ ID NO：184所示的氨基酸序列。在一些实施方式中，mbIL-15包含IL-15、接头、寿司结构域和IL-15Rα。在一些实施方式中，mbIL-15是或者包含SEQ ID NO：190所示的氨基酸序列。

在一些实施方式中，NK细胞是诱导性多能干细胞(iPSC)-来源的NK(iNK)细胞。

在一些实施方式中，必需基因编码细胞存活和/或增殖所需的基因产物。在一些实施方式中，必需基因是管家基因，例如，表3中所列的基因。在一些实施方式中，必需基因编码3-磷酸甘油醛脱氢酶(GAPDH)。

在一些实施方式中，NK细胞包含：(i)导致CISH功能缺失的基因组编辑；和(ii)导致TGFβRII功能缺失的基因组编辑。

在一些实施方式中，NK细胞用作药剂。在一些实施方式中，NK细胞用于在疾病、病症或病况，例如，肿瘤和/或癌症的治疗中使用。

在一些实施方式中，NK细胞或NK细胞群体的特征在于当与肿瘤细胞接触时，相对于参考NK细胞群体对肿瘤细胞的参考杀伤水平，NK细胞对肿瘤细胞的杀伤水平提高(例如，提高至少约10％、20％、40％、60％、80％、100％、150％、200％、300％或更多)，例如，如使用任何已知方法所测量的，例如，使用实施例11或实施例15中所描述的方法所测量的。

在一些实施方式中，NK细胞或NK细胞群体的特征在于当与肿瘤细胞和抗体接触时，相对于参考NK细胞群体诱导的ADCC参考水平，NK细胞诱导的抗体依赖性的细胞介导的细胞毒作用(ADCC)水平提高(例如，提高至少约10％、20％、40％、60％、80％、100％、150％、200％、300％或更多)，例如，如使用任何已知方法所测量的，例如，使用实施例11或实施例15中所描述的方法所测量的。

在一些实施方式中，相对于参考NK细胞群体的参考持久性水平，NK细胞群体的持久性水平提高(例如，提高至少约10％、20％、40％、60％、80％、100％、150％、200％、300％或更多)，例如，如使用任何已知方法所测量的，例如，使用实施例14或实施例15中所描述的方法所测量。在一些实施方式中，在与肿瘤细胞接触后测量持久性水平。

在一些实施方式中，参考NK细胞群体不包含含有包含第一外源编码序列和第二外源编码序列的基因组的NK细胞。在一些实施方式中，参考NK细胞群体不包含含有导致TGFβRII功能缺失的基因组编辑和导致CISH功能缺失的基因组编辑的NK细胞。在一些实施方式中，参考NK细胞群体不包含含有包含第一外源编码序列和第二外源编码序列的基因组的NK细胞，并且不包含含有导致TGFβRII功能缺失的基因组编辑和导致CISH功能缺失的基因组编辑的NK细胞。

在一些方面，本发明公开提供了包含本文所描述的NK细胞、子代或子代细胞或者NK细胞群体的药物组合物。在一些实施方式中，药物组合物包含药物可用的载体。

在另一个方面，本发明公开提供了治疗病况、病症和/或疾病的方法，所述方法包括向患有所述病况、病症和/或疾病的受试者施用本文所描述的NK细胞、子代或子代细胞或者NK细胞群体，或者本文所描述的药物组合物。在一些实施方式中，受试者患有肿瘤，例如，实体瘤。在一些实施方式中，受试者患有癌症。

在一些实施方式中，NK细胞、子代或子代细胞或者NK细胞群体对受试者是同种异体的。在一些实施方式中，NK细胞、子代或子代细胞或者NK细胞群体对受试者是自体同源的。在一些实施方式中，所述方法还包括向受试者施用抗体。在一些实施方式中，所述抗体是西妥昔单抗、利妥昔单抗或西妥昔单抗。在一些实施方式中，所述受试者是人。

在另一个方面，本发明公开的特征在于方法，所述方法包括向受试者施用本文所描述的NK细胞、子代或子代细胞或者NK细胞群体，或者本文所描述的药物组合物。在一些实施方式中，受试者患有肿瘤，例如，实体瘤。在一些实施方式中，受试者患有癌症。

在另一个方面，本发明公开提供了提高NK细胞的肿瘤杀伤能力的方法，所述方法包括：(a)向NK细胞基因组敲入FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列，其中将第一外源编码序列和第二外源编码序列敲入必需基因读框和下游(3')；和(b)敲出NK细胞的一个或多个基因，其中所述一个或多个基因编码腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLA II类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合；借此相对于参考NK细胞的肿瘤杀伤活性的参考水平，提高NK细胞的肿瘤杀伤活性水平(例如，提高至少约10％、20％、40％、60％、80％、100％、150％、200％、300％或更多)，例如，如使用任何已知方法所测量的，例如，使用实施例11或实施例15中所描述的方法所测量的。

在一些实施方式中，参考NK细胞不包含含有第一外源编码序列和第二外源编码序列的基因组。在一些实施方式中，参考NK细胞不包含导致TGFβRII功能缺失的基因组编辑和导致CISH功能缺失的基因组编辑。在一些实施方式中，参考NK细胞不包含含有第一外源编码序列和第二外源编码序列的基因组，并且不包含导致TGFβRII功能缺失的基因组编辑和导致CISH功能缺失的基因组编辑。

在另一个方面，本发明公开提供了提高NK细胞诱导的抗体依赖性的细胞介导的细胞毒作用(ADCC)的方法，所述方法包括：(a)向NK细胞基因组敲入FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列，其中将第一外源编码序列和第二外源编码序列敲入必需基因的读框和下游(3')；和(b)敲出NK细胞的一个或多个基因，其中所述一个或多个基因编码腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLA II类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合；借此相对于参考NK细胞诱导的ADCC参考水平，提高NK细胞诱导的ADCC水平(例如，提高至少约10％、20％、40％、60％、80％、100％、150％、200％、300％或更多)，例如，如使用任何已知方法所测量的，例如，使用实施例11或实施例15中所描述的方法所测量的。

在另一个方面，本发明公开提供了提高NK细胞持久性的方法，所述方法包括：(a)向NK细胞基因组敲入FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列，其中将第一外源编码序列和第二外源编码序列敲入必需基因的读框和下游(3')；和(b)敲出NK细胞的一个或多个基因，其中所述一个或多个基因编码腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLA II类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合；借此相对于参考NK细胞的参考持久性水平提高NK细胞的持久性水平(例如，提高至少约10％、20％、40％、60％、80％、100％、150％、200％、300％或更多)，例如，如使用任何已知方法所测量的，例如，如使实施例14或实施例15中所描述的方法所测量的。在一些实施方式中，在NK细胞与肿瘤细胞接触后，测量持久性水平。

在另一个方面，本发明公开的特征在于生产基因修饰的NK细胞的方法，所述方法包括：(a)向NK细胞基因组敲入FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列，其中将第一外源编码序列和第二外源编码序列敲入必需基因的读框和下游(3')；和(b)敲出NK细胞的一个或多个基因，其中所述一个或多个基因编码腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLA II类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合。

在一些实施方式中，敲入包括将NK细胞与：(i)导致必需基因的内源编码序列内断裂的核酸酶和(ii)包含含有与必需基因的外源编码序列或部分编码序列位于同一读框和下游(3')的第一外源编码序列和第二外源编码序列的敲入盒的供体模板接触，其中通过断裂的同源介导修复(HDR)将所述敲入盒整合到细胞基因组中。

在一些实施方式中，核酸酶是CRISPR/Cas核酸酶并且敲入还包括将NK细胞与CRISPR/Cas核酸酶的向导分子接触。

在一些实施方式中，敲出包括将NK细胞与一个或多个导致一个或多个基因的内源编码序列内断裂的核酸酶接触。在一些实施方式中，一个或多个核酸酶是CRISPR/Cas核酸酶并且敲出还包括将NK细胞与一个或多个CRISPR/Cas核酸酶的向导分子接触。

在一些实施方式中，必需基因编码NK细胞存活和/或增殖所需的基因产物。在一些实施方式中，必需基因是管家基因，例如，表3中所列的基因。在一些实施方式中，必需基因编码3-磷酸甘油醛脱氢酶(GAPDH)。

在一些实施方式中，所述方法包括敲出编码CISH的基因和敲出编码TGFβRII的基因。

在一个方面，本发明公开的特征在于NK细胞、多潜能人干细胞或者从这些干细胞分化的修饰的iNK细胞，其中所述细胞包括：(i)导致以下中的一个或多个功能缺失的一个或多个基因组编辑：腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLA II类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合；和(ii)包含FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列的基因组，其中第一外源编码序列和第二外源编码序列与必需基因，例如，GAPDH基因的编码序列位于同一读框和下游(3')，其中必需基因，例如，GAPDH基因的编码序列的至少一部分包含外源编码序列。

在一个方面，本发明公开的特征在于NK细胞、多潜能人干细胞或者从这些干细胞分化的修饰的iNK细胞，其中所述细胞包括：(i)基因组FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列，其中第一外源编码序列和第二外源编码序列与必需基因，例如，GAPDH基因的编码序列位于同一读框和下游(3')，其中必需基因，例如，GAPDH基因的编码序列的至少一部分包含外源编码序列；并且其中所述细胞包含(ii)导致以下中的一个或多个功能缺失的一个或多个基因组编辑：腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLA II类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合。

在一些实施方式中，细胞包含导致TGFβ信号通路的激动剂功能缺失的基因组编辑和导致CISH功能缺失的基因组编辑。

在一些实施方式中，细胞包含导致TGFβ受体功能缺失或者TGFβ受体显性负性变体的基因组编辑。在一些实施方式中，TGFβ受体是TGFβ受体II(TGFβRII)。

在一些实施方式中，细胞表达选自下列的一个或多个多潜能性标志物：SSEA-3、SSEA-4、TRA-1-60、TRA-1-81、TRA-2-49/6E、ALP、Sox2、E-钙粘素、UTF-1、Oct4、Rex1和Nanog。

在一些实施方式中，GAPDH基因的外源编码序列包含GAPDH基因编码序列的约2000、1500、1000、750、500、400、300、200、100或50个碱基对。在一些实施方式中，GAPDH基因的外源编码序列包含GAPDH基因编码序列的约200个碱基对。

在一些实施方式中，GAPDH基因的外源编码序列编码GAPDH基因所编码的蛋白质的C末端片段。在一些实施方式中，C末端片段长度小于约500、250、150、125、100、75、50、25、20、15或10个氨基酸。在一些实施方式中，C末端片段长度小于约25个氨基酸。在一些实施方式中，C末端片段包括由覆盖断裂的GAPDH基因的内源编码序列区所编码的氨基酸序列。

在一些实施方式中，GAPDH基因的外源编码序列与细胞的GAPDH基因的相应内源编码序列的同一性小于100％。在一些实施方式中，GAPDH基因的外源编码序列已相对于细胞的GAPDH基因的相应内源编码序列进行了密码子优化以除去核酸酶，例如，Cas的靶标位点。在一些实施方式中，核酸酶是Cas(例如，Cas9、Cas12a、Cas12b、Cas12c、Cas12e、CasX或CasΦ(Cas12j)或其变体)，GAPDH基因的外源编码序列包括Cas的至少一个PAM位点，并且所述至少一个PAM位点(或者所有PAM位点)已进行了密码子优化或者通过沉默和/或错义突变饱和。

在一些实施方式中，细胞基因组包含能够使GAPDH基因所编码的基因产物以及作为单独基因产物的第一和第二外源编码序列表达的调控元件，任选地，其中所述基因产物中的至少一种是蛋白质并且所述调控元件使得与其它基因产物分离的蛋白质能够表达。在一些实施方式中，细胞基因组包含定位在GAPDH基因的编码序列和第一外源编码序列之间和/或第一外源编码序列和第二外源编码序列之间的IRES或2A元件。

在一些实施方式中，细胞基因组不包含报告基因，例如，荧光报告基因或者抗生素抗性基因。

在另一个方面，本发明公开的特征在于NK细胞、多潜能人干细胞或者从该干细胞分化的iNK细胞，其包含基因组修饰，其中所述修饰包含：(i)导致含细胞因子诱导型SH2的蛋白(CISH)功能缺失的基因组编辑和(ii)导致TGFβ信号通路的激动剂功能缺失的基因组编辑；和(iii)细胞基因组中GAPDH基因的内源编码序列内外源敲入盒的插入，其中所述敲入盒包含FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列，其中第一外源编码序列和第二外源编码序列与编码GAPDH的外源编码序列或部分编码序列或其功能性变体位于同一读框和下游(3')，其中所述细胞表达FcγRIII(CD16)或其变体、mbIL-15和GAPDH或其功能性变体，任选地其中从内源GAPDH启动子表达FcγRIII(CD16)或其变体、mbIL-15和GAPDH。

在另一个方面，本发明公开的特征在于NK细胞、多潜能人干细胞或者从该干细胞分化的iNK细胞，其包含基因组修饰，其中所述修饰包含：(i)外源敲入盒在细胞基因组中的GAPDH基因的内源编码序列内的插入，其中所述敲入盒包含FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列，其中所述第一外源编码序列和第二外源编码序列与编码GAPDH的外源编码序列或部分编码序列或其功能性变体位于同一读框且位于其下游(3')，其中所述细胞表达FcγRIII(CD16)或其变体、mbIL-15和GAPDH或其功能性变体，任选地其中从内源GAPDH启动子表达FcγRIII(CD16)或其变体、mbIL-15和GAPDH，并且其中从这种干细胞分化的NK细胞、多潜能人干细胞或iNK细胞还包含(ii)导致以下中的一种或多种的功能缺失的一种或多种基因组编辑：腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLAII类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合。

在一些实施方式中，编码GAPDH的外源编码序列或部分编码序列包含GAPDH基因编码序列的约2000、1500、1000、750、500、400、300、200、100或50个碱基对。在一些实施方式中，编码GAPDH的外源编码序列或部分编码序列包含GAPDH基因的编码序列的约200个碱基对。

在一些实施方式中，编码GAPDH的外源编码序列或部分编码序列编码GAPDH的C末端片段。在一些实施方式中，C末端片段长度小于约500、250、150、125、100、75、50、25、20、15或10个氨基酸。在一些实施方式中，C末端片段长度小于约25个氨基酸。在一些实施方式中，C末端片段包括由覆盖断裂的GAPDH基因的内源编码序列区所编码的氨基酸序列。

在一些实施方式中，编码GAPDH的外源编码序列或部分编码序列与细胞的GAPDH基因的相应内源编码序列的同一性小于100％。在一些实施方式中，编码GAPDH的外源编码序列或部分编码序列已相对于细胞的GAPDH基因的相应内源编码序列进行了密码子优化以除去核酸酶，例如，Cas的靶标位点。在一些实施方式中，核酸酶是Cas(例如，Cas9、Cas12a、Cas12b、Cas12c、Cas12e、CasX、CasΦ(Cas12j))或其变体)，编码GAPDH的外源编码序列或部分编码序列包括Cas的至少一个PAM位点，并且至少一个PAM位点(或全部PAM位点)已密码子优化或用沉默和/或错义突变饱和。

在一些实施方式中，第一外源编码序列位于第二外源编码序列的上游(5')，并且细胞基因组包含位于第二外源编码序列下游的多腺苷酸化序列和任选地3'UTR序列，并且如果存在3'UTR序列，则3'UTR序列定位在第二外源编码序列的3'和多腺苷酸化序列的5'。

在一些实施方式中，第二外源编码序列位于第一外源编码序列的上游(5')，并且细胞基因组包含位于第一外源编码序列下游的多腺苷酸化序列和任选地3'UTR序列，并且如果存在3'UTR序列，则3'UTR序列定位在第一外源编码序列的3'和多腺苷酸化序列的5'。

在一些实施方式中，敲入盒包含第一外源编码序列、接头(例如，T2A、P2A和/或IRES)和第二外源编码序列。在一些实施方式中，基因组-编辑的细胞包含(i)在GAPDH基因的等位基因之一或两者处的敲入盒；和(ii)在等位基因之一或两者处的一个或多个功能缺失性修饰。在一些实施方式中，基因组-编辑的细胞表达FcγRIII(CD16)或其变体、mbIL-15和GAPDH或其功能性变体。

在一些实施方式中，工程细胞包含(i)位于等位基因之一或两者处的一个或多个功能缺失性修饰(例如，导致以下中的至少一种功能缺失的至少一个基因组编辑：CISH；TGFβ信号转导通路；ADORA2A；具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)；β-2微球蛋白(B2M)；程序细胞死亡蛋白1(PD-1)；II类，主要组织相容性复合体，反式激活因子(CIITA)；自然杀伤细胞受体NKG2A(自然杀伤组2A)；两种或更多种HLAII类组织相容性抗原α链基因和/或两种或更多种HLA II类组织相容性抗原β链基因；分化簇32B(CD32B、FCGR2B)；T细胞受体α恒定区(TRAC)；或其两种或更多种的任意组合)和(ii)FcγRIII(CD16)或其变体的编码序列和mbIL-15的编码序列的多顺反子敲入(例如，在GAPDH基因的等位基因之一或两者处)。

在一些实施方式中，工程细胞包含(i)位于等位基因之一或两者处的一个或多个功能缺失性修饰(例如，导致以下中的至少一种功能缺失的至少一个基因组编辑：CISH；TGFβ信号转导通路；ADORA2A；具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)；β-2微球蛋白(B2M)；程序细胞死亡蛋白1(PD-1)；II类，主要组织相容性复合体，反式激活因子(CIITA)；自然杀伤细胞受体NKG2A(自然杀伤组2A)；两种或更多种HLAII类组织相容性抗原α链基因和/或两种或更多种HLA II类组织相容性抗原β链基因；分化簇32B(CD32B、FCGR2B)；T细胞受体α恒定区(TRAC)；或其两种或更多种的任意组合)；和双等位基因敲入(例如，位于GAPDH基因的第一等位基因处的第一外源编码序列和位于GAPDH基因的第二等位基因处的第二外源编码序列)。

在一些实施方式中，本发明公开的特征在于分化的iNK细胞，其中所述分化的iNK细胞是本文所描述的多潜能人干细胞的子代细胞。在一些实施方式中，细胞不表达内源CD3、CD4和/或CD8。

在一些实施方式中，使用包含含有根据SEQ ID NO：258-364、1155、1162和1173中任一项的核苷酸序列或由其组成的靶向结构域序列的向导RNA产生了在任何本文所描述的细胞中导致CISH功能缺失的基因组编辑。在一些实施方式中，使用包含含有与SEQ ID NO：258-364、1155、1162和1173中任一项相同或者相差不超过1、2或3个核苷酸的核苷酸序列或由其组成的靶向结构域序列的向导RNA产生了在任何本文所描述的细胞中导致CISH功能缺失的基因组编辑。在一些实施方式中，使用包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列和(ii)表6中所示的5'延伸序列的向导RNA产生了在任何本文所描述的细胞中导致CISH功能缺失的基因组编辑。在一些实施方式中，使用包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列，(ii)定位在所述靶向结构域序列5'的包含SEQ ID NO：1153所示的核苷酸序列或由其组成的骨架序列和(iii)位于骨架序列5'的SEQ ID NO：1154的核苷酸序列的向导RNA产生了在任何本文所描述的细胞中导致CISH功能缺失的基因组编辑。

在一些实施方式中，使用包含含有根据SEQ ID NO：29-257、1157、1161和1172中任一项的核苷酸序列或由其组成的靶向结构域序列的向导RNA产生了在任何本文所描述的细胞中导致TGFβRII功能缺失的基因组编辑。在一些实施方式中，使用包含含有与SEQ ID NO：29-257、1157、1161和1172中任一项相同或者相差不超过1、2或3个核苷酸的核苷酸序列或由其组成的靶向结构域序列的向导RNA产生了在任何本文所描述的细胞中导致TGFβRII功能缺失的基因组编辑。在一些实施方式中，使用包含(i)含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域序列和(ii)表6中所示的5'延伸序列的向导RNA产生了在任何本文所描述的细胞中导致TGFβRII功能缺失的基因组编辑。在一些实施方式中，使用包含(i)含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域序列，(ii)定位在所述靶向结构域序列5'的包含SEQ ID NO：1153所示的核苷酸序列或由其组成的骨架序列和(iii)位于骨架序列5'的SEQ ID NO：1154的核苷酸序列的向导RNA产生了在任何本文所描述的细胞中导致TGFβRII功能缺失的基因组编辑。

在一些实施方式中，使用包含下列的核糖核蛋白(RNP)复合物产生了在任何本文所描述的细胞中导致CISH功能缺失的基因组编辑：(i)RNA-导向的核酸酶(例如，Cas12a变体，例如，包含选自M537R、F870L和H800A的1、2或3个氨基酸替换的Cas12a变体，例如，包含与SEQ ID NO：62具有90％、95％或100％同一性的氨基酸序列的Cas12a变体)和(ii)包含含有根据SEQ ID NO：258-364、1155、1162和1173中任一项的核苷酸序列或由其组成的靶向结构域序列的向导RNA。在一些实施方式中，使用包含下列的核糖核蛋白(RNP)复合物产生了在任何本文所描述的细胞中导致CISH功能缺失的基因组编辑：(i)RNA-导向的核酸酶(例如，Cas12a变体，例如，包含选自M537R、F870L和H800A的1、2或3个氨基酸替换的Cas12a变体，例如，包含与SEQ ID NO：62具有90％、95％或100％同一性的氨基酸序列的Cas12a变体)和(ii)包含含有与SEQ ID NO：258-364、1155、1162和1173中任一项相同或相差不超过1、2或3个核苷酸的核苷酸序列或由其组成的靶向结构域序列的向导RNA。在一些实施方式中，使用包含下列的核糖核蛋白(RNP)复合物产生了在任何本文所描述的细胞中导致CISH功能缺失的基因组编辑：(i)RNA-导向的核酸酶(例如，Cas12a变体，例如，包含选自M537R、F870L和H800A的1、2或3个氨基酸替换的Cas12a变体，例如，包含与SEQ ID NO：62具有90％、95％或100％同一性的氨基酸序列的Cas12a变体)和(ii)向导RNA，其包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列和(ii)表6中所示的5'延伸序列。在一些实施方式中，使用包含下列的核糖核蛋白(RNP)复合物产生了在任何本文所描述的细胞中导致CISH功能缺失的基因组编辑：(i)RNA-导向的核酸酶(例如，Cas12a变体，例如，包含选自M537R、F870L和H800A的1、2或3个氨基酸替换的Cas12a变体，例如，包含与SEQ IDNO：62具有90％、95％或100％同一性的氨基酸序列的Cas12a变体)和(ii)向导RNA，其包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列，(ii)含有定位在所述靶向结构域序列5'的SEQ ID NO：1153所示的核苷酸序列或由其组成的骨架序列和(iii)位于所述骨架序列5'的SEQ ID NO：1154的核苷酸序列。

在一些实施方式中，使用包含下列的核糖核蛋白(RNP)复合物产生了在任何本文所描述的细胞中导致TGFβRII功能缺失的基因组编辑：(i)RNA-导向的核酸酶(例如，Cas12a变体，例如，包含选自M537R、F870L和H800A的1、2或3个氨基酸替换的Cas12a变体，例如，包含与SEQ ID NO：62具有90％、95％或100％同一性的氨基酸序列的Cas12a变体)，和(ii)包含含有根据SEQ ID NO：29-257、1157、1161和1172中任一项的核苷酸序列或由其组成的靶向结构域序列的向导RNA。在一些实施方式中，使用包含下列的核糖核蛋白(RNP)复合物产生了在任何本文所描述的细胞中导致TGFβRII功能缺失的基因组编辑：(i)RNA-导向的核酸酶(例如，Cas12a变体，例如，包含选自M537R、F870L和H800A的1、2或3个氨基酸替换的Cas12a变体，例如，包含与SEQ ID NO：62具有90％、95％或100％同一性的氨基酸序列的Cas12a变体)和(ii)包含与SEQ ID NO：29-257、1157、1161和1172中任一项相同或相差不超过1、2或3个核苷酸的核苷酸序列或由其组成的靶向结构域序列的向导RNA。在一些实施方式中，使用包含下列的核糖核蛋白(RNP)复合物产生了在任何本文所描述的细胞中导致TGFβRII功能缺失的基因组编辑：(i)RNA-导向的核酸酶(例如，Cas12a变体，例如，包含选自M537R、F870L和H800A的1、2或3个氨基酸替换的Cas12a变体，例如，包含与SEQ ID NO：62具有90％、95％或100％同一性的氨基酸序列的Cas12a变体)，和(ii)向导RNA，其包含(i)含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域序列和(ii)表6中所示的5'延伸序列。在一些实施方式中，使用包含下列的核糖核蛋白(RNP)复合物产生了在任何本文所描述的细胞中导致TGFβRII功能缺失的基因组编辑：(i)RNA-导向的核酸酶(例如，Cas12a变体，例如，包含选自M537R、F870L和H800A的1、2或3个氨基酸替换的Cas12a变体，例如，包含与SEQ ID NO：62具有90％、95％或100％同一性的氨基酸序列的Cas12a变体)，和(ii)向导RNA，其包含(i)含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域序列，(ii)含有定位在所述靶向结构域序列5'的SEQ ID NO：1153所示的核苷酸序列或由其组成的骨架序列和(iii)位于所述骨架序列5'的SEQ ID NO：1154的核苷酸序列。

在另一个方面，本发明公开的特征在于制备细胞，例如，本文所描述的细胞的方法，所述方法包括：(A)将NK细胞、多潜能人干细胞或人诱导性多能干细胞与：RNA-导向的核酸酶和包含含有与258-364、1155、1162和1173中任一项相同或相差不超过1、2或3个核苷酸的核苷酸序列或由其组成的靶向结构域序列的向导RNA；和RNA-导向的核酸酶和包含含有与29-257、1157、1161和1172中任一项相同或相差不超过1、2或3个核苷酸的核苷酸序列或由其组成的靶向结构域序列的向导RNA接触；和(B)将细胞与：(i)在所述细胞中导致3-磷酸甘油醛脱氢酶(GAPDH)基因的内源编码序列内断裂的核酸酶和(ii)包含含有FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列的敲入盒的供体模板接触，其中第一外源编码序列和第二外源编码序列与GAPDH基因的外源编码序列或部分编码序列位于同一读框和下游(3')，其中通过所述断裂的同源介导修复(HDR)将所述敲入盒整合到所述细胞的基因组，从而导致产生表达：(a)FcγRIII(CD16)或其变体、(b)mbIL-15和(c)GAPDH或其功能性变体的基因组-编辑的细胞。

在一些实施方式中，所述方法包括将细胞与：(1)向导RNA，其包含(i)含有SEQ IDNO：1155或1162的核苷酸序列或由其组成的靶向结构域序列和(ii)表6中所示的5'延伸序列；和(2)向导RNA，其包含(i)包含SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域序列和(ii)表6中所示的5'延伸序列接触。

在一些实施方式中，所述方法包括将细胞与下列接触：(1)向导RNA，其包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列，(ii)含有定位在所述靶向结构域序列5'的SEQ ID NO：1153的核苷酸序列或由其组成的骨架序列和(iii)位于所述骨架序列5'的SEQ ID NO：1154的核苷酸序列；和(2)向导RNA，其包含(i)含有SEQ IDNO：1157或1161的核苷酸序列或由其组成的靶向结构域，(ii)含有定位在所述靶向结构域序列5'的SEQ ID NO：1153的核苷酸序列或由其组成的骨架序列和(iii)位于所述骨架序列5'的SEQ ID NO：1154的核苷酸序列。

在一些实施方式中，RNA导向的核酸酶是Cas12a变体。在一些实施方式中，Cas12a变体包含选自M537R、F870L和H800A的一个或多个氨基酸替换。在一些实施方式中，Cas12a变体包含氨基酸替换M537R、F870L和H800A。在一些实施方式中，Cas12a变体包含与SEQ IDNO：62具有90％、95％或100％同一性的氨基酸序列。

在另一个方面，本发明公开的特征在于制备细胞，例如，本文所描述的细胞的方法，所述方法包括：(A)将NK细胞、多潜能人干细胞或人诱导性多能干细胞与下列接触：核糖核蛋白(RNP)复合物，其包含(i)RNA-导向的核酸酶(例如，Cas12a变体，例如，包含选自M537R、F870L和H800A的1、2或3个氨基酸替换的Cas12a变体，例如，包含与SEQ ID NO：62具有90％、95％或100％同一性的氨基酸序列的Cas12a变体)和(ii)包含含有与SEQ ID NO：258-364、1155、1162和1173中任一项相同或相差不超过1、2或3个核苷酸的核苷酸序列或由其组成的靶向结构域序列的向导RNA；和核糖核蛋白(RNP)复合物，其包含(i)RNA-导向的核酸酶(例如，Cas12a变体，例如，包含选自M537R、F870L和H800A的1、2或3个氨基酸替换的Cas12a变体，例如，包含与SEQ ID NO：62具有90％、95％或100％同一性的氨基酸序列的Cas12a变体)和(ii)包含含有与SEQ ID NO：29-257、1157、1161和1172中任一项相同或相差不超过1、2或3个核苷酸的核苷酸序列或由其组成的靶向结构域序列的向导RNA；和(B)将细胞与下列接触：(i)在细胞中在3-磷酸甘油醛脱氢酶(GAPDH)基因的内源编码序列内导致断裂的核酸酶，和(ii)包含含有FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列的敲入盒的供体模板，其中第一外源编码序列和第二外源编码序列与GAPDH基因的外源编码序列或部分编码序列位于同一读框和下游(3')，其中通过所述断裂的同源介导修复(HDR)将所述敲入盒整合到细胞基因组中，从而导致产生表达：(a)FcγRIII(CD16)或其变体、(b)mbIL-15和(c)GAPDH或其功能性变体的基因组-编辑的细胞。

在一些实施方式中，所述方法包括将细胞与下列接触：(1)包含向导RNA的RNP，所述向导RNA包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列，和(ii)表6中所示的5'延伸序列；和(2)包含向导RNA的RNP，所述向导RNA包含(i)含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域，和(ii)表6中所示的5'延伸序列。

在一些实施方式中，所述方法包括将细胞与下列接触：(1)包含向导RNA的RNP，所述向导RNA包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列，(ii)含有定位在所述靶向结构域序列5'的SEQ ID NO：1153的核苷酸序列或由其组成的骨架序列和(iii)位于所述骨架序列5'的SEQ ID NO：1154的核苷酸序列；和(2)包含向导RNA的RNP，所述向导RNA包含(i)含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域，(ii)含有定位在所述靶向结构域序列5'的SEQ ID NO：1153的核苷酸序列或由其组成的骨架序列和(iii)位于所述骨架序列5'的SEQ ID NO：1154的核苷酸序列。

在另一个方面，本发明公开的特征在于制备细胞，例如，本文所描述的细胞的方法，所述方法包括：(A)将NK细胞、多潜能人干细胞或人诱导性多能干细胞与下列接触：(i)包含含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列的向导RNA；和包含含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域序列的向导RNA；和(ii)包含与SEQ ID NO：58-66之一具有90％、95％或100％的同一性的氨基酸序列(或其部分)的RNA导向的核酸酶；和(B)将细胞与下列接触：(i)在细胞中在3-磷酸甘油醛脱氢酶(GAPDH)基因的内源编码序列内导致断裂的核酸酶，和(ii)包含含有FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列的敲入盒的供体模板，其中所述第一外源编码序列和第二外源编码序列与GAPDH基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')，其中通过断裂的同源介导修复(HDR)将敲入盒整合到细胞的基因组中，从而导致产生表达下列的基因组-编辑的细胞：(a)FcγRIII(CD16)或变体、(b)mbIL-15和(c)GAPDH或其功能性变体。

在另一个方面，本发明公开的特征在于制备细胞，例如，本文所描述的细胞的方法，所述方法包括：(A)将NK细胞、多潜能人干细胞或人诱导性多能干细胞与下列接触：(1)RNP，其包含(i)包含含有SEQ ID NO：1155或1162所示的核苷酸序列或由其组成的靶向结构域序列的向导RNA；和(ii)包含与SEQ ID NO：58-66之一具有90％、95％或100％的同一性的氨基酸序列(或其部分)的RNA导向的核酸酶；和(2)RNP，其包含(i)包含含有SEQ ID NO：1157或1161所示的核苷酸序列或由其组成的靶向结构域序列的向导RNA；和(ii)包含与SEQID NO：58-66之一具有90％、95％或100％的同一性的氨基酸序列(或其部分)的RNA导向的核酸酶；和(B)将细胞与下列接触：(i)在细胞中在3-磷酸甘油醛脱氢酶(GAPDH)基因的内源编码序列内导致断裂的核酸酶，和(ii)包含含有FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列的敲入盒的供体模板，其中所述第一外源编码序列和第二外源编码序列与GAPDH基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')，其中通过断裂的同源介导修复(HDR)将敲入盒整合到细胞基因组中，从而导致产生了表达下列的基因组-编辑的细胞：(a)FcγRIII(CD16)或其变体、(b)mbIL-15和(c)GAPDH或其功能性变体。

在另一个方面，本发明公开的特征在于制备细胞，例如，本文所描述的细胞的方法，所述方法包括：(A)将NK细胞、多潜能人干细胞或人诱导性多能干细胞与下列接触：(1)向导RNA，其包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列，和(ii)表6中所示的5'延伸序列；(2)向导RNA，其包含(i)含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域，和(ii)表6中所示的5'延伸序列；和(3)包含与SEQID NO：58-66之一具有90％、95％或100％的同一性的氨基酸序列(或其部分)的RNA导向的核酸酶；和(B)将细胞与下列接触：(i)在细胞中在3-磷酸甘油醛脱氢酶(GAPDH)基因的内源编码序列内导致断裂的核酸酶，和(ii)包含含有FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列的敲入盒的供体模板，其中所述第一外源编码序列和第二外源编码序列与GAPDH基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')，其中通过断裂的同源介导修复(HDR)将敲入盒整合到细胞基因组中，从而导致产生了表达下列的基因组-编辑的细胞：(a)FcγRIII(CD16)或其变体、(b)mbIL-15和(c)GAPDH或其功能性变体。

在另一个方面，本发明公开的特征在于制备细胞，例如，本文所描述的细胞的方法，所述方法包括：(A)将NK细胞、多潜能人干细胞或人诱导性多能干细胞与下列接触：(1)RNP，其包含(a)向导RNA，其包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列，和(ii)表6中所示的5'延伸序列；和(b)包含与SEQ ID NO：58-66之一具有90％、95％或100％的同一性的氨基酸序列(或其部分)的RNA导向的核酸酶；和(2)RNP，其包含(a)向导RNA，其包含(i)含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域，和(ii)表6中所示的5'延伸序列；和(b)包含与SEQ ID NO：58-66之一具有90％、95％或100％的同一性的氨基酸序列(或其部分)的RNA导向的核酸酶；和(B)将细胞与下列接触：(i)在细胞中在3-磷酸甘油醛脱氢酶(GAPDH)基因的内源编码序列内导致断裂的核酸酶，和(ii)包含含有FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列的敲入盒的供体模板，其中所述第一外源编码序列和第二外源编码序列与GAPDH基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')，其中通过断裂的同源介导修复(HDR)将敲入盒整合到细胞基因组中，从而导致产生了表达下列的基因组-编辑的细胞：(a)FcγRIII(CD16)或其变体、(b)mbIL-15和(c)GAPDH或其功能性变体。

在另一个方面，本发明公开的特征在于制备细胞，例如，本文所描述的细胞的方法，所述方法包括：(A)将NK细胞、多潜能人干细胞或人诱导性多能干细胞与下列接触：(1)向导RNA，其包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列，(ii)含有定位在所述靶向结构域序列5'的SEQ ID NO：1153的核苷酸序列或由其组成的骨架序列和(iii)位于所述骨架序列5'的SEQ ID NO：1154的核苷酸序列；(2)向导RNA，其包含(i)含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域，(ii)含有定位在所述靶向结构域序列5'的SEQ ID NO：1153的核苷酸序列或由其组成的骨架序列和(iii)位于所述骨架序列5'的SEQ ID NO：1154的核苷酸序列；和(3)包含与SEQ ID NO：58-66之一具有90％、95％或100％的同一性的氨基酸序列(或其部分)的RNA导向的核酸酶；和(B)将细胞与下列接触：(i)在细胞中在3-磷酸甘油醛脱氢酶(GAPDH)基因的内源编码序列内导致断裂的核酸酶，和(ii)包含含有FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列的敲入盒的供体模板，其中所述第一外源编码序列和第二外源编码序列与GAPDH基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')，其中通过断裂的同源介导修复(HDR)将敲入盒整合到细胞基因组中，从而导致产生了表达下列的基因组-编辑的细胞：(a)FcγRIII(CD16)或其变体、(b)mbIL-15和(c)GAPDH或其功能性变体。

在另一个方面，本发明公开的特征在于制备细胞，例如，本文所描述的细胞的方法，所述方法包括：(A)将NK细胞、多潜能人干细胞或人诱导性多能干细胞与下列接触：(1)RNP，其包含(a)向导RNA，其包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列，(ii)含有定位在所述靶向结构域序列5'的SEQ ID NO：1153的核苷酸序列或由其组成的骨架序列和(iii)位于所述骨架序列5'的SEQ ID NO：1154的核苷酸序列；和(b)包含与SEQ ID NO：1144-1151之一具有90％、95％或100％的同一性的氨基酸序列(或其部分)的RNA导向的核酸酶；和(2)RNP，其包含(a)向导RNA，其包含(i)含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域，(ii)含有定位在所述靶向结构域序列5'的SEQ ID NO：1153的核苷酸序列或由其组成的骨架序列和(iii)位于所述骨架序列5'的SEQ ID NO：1154的核苷酸序列；和(b)包含与SEQ ID NO：1144-1151之一具有90％、95％或100％的同一性的氨基酸序列(或其部分)的RNA导向的核酸酶；和(B)将细胞与下列接触：(i)在细胞中在3-磷酸甘油醛脱氢酶(GAPDH)基因的内源编码序列内导致断裂的核酸酶，和(ii)包含含有FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列的敲入盒的供体模板，其中所述第一外源编码序列和第二外源编码序列与GAPDH基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')，其中通过断裂的同源介导修复(HDR)将敲入盒整合到细胞基因组中，从而导致产生了表达下列的基因组-编辑的细胞：(a)FcγRIII(CD16)或其变体、(b)mbIL-15和(c)GAPDH或其功能性变体。

在另一个方面，本发明公开的特征在于制备修饰的细胞，例如，修饰的NK细胞、修饰的多潜能人干细胞、从这种干细胞分化的修饰的NK细胞的方法，所述方法包括：(A)将细胞与下列接触：(i)在细胞中在必需基因，如(例如)3-磷酸甘油醛脱氢酶(GAPDH)基因的内源编码序列内引起断裂的RNA导向的核酸酶和向导RNA，和(ii)包含含有FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列的敲入盒的供体模板，其中所述第一外源编码序列和第二外源编码序列与必需基因，例如，GAPDH基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')，其中通过断裂的同源介导修复(HDR)将敲入盒整合到细胞基因组中，从而导致产生了表达下列的基因组-编辑的细胞：(a)FcγRIII(CD16)或其变体、(b)mbIL-15和(c)必需基因，例如，GAPDH或其功能性变体；和(B)将细胞(例如，NK细胞或多潜能人干细胞或人诱导性多能干细胞)与以下中的一种或多种接触：至少一个RNA导向的核酸酶和至少一个包含靶向结构域序列的向导RNA，其中RNA导向的核酸酶和向导RNA在所关心的基因的内源编码序列内引起基因组编辑，例如，断裂或导致所关心的基因的功能缺失的基因组编辑，其中所关心的基因包括，例如，腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLA II类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合。

在一些实施方式中，所述方法包括将细胞与下列接触：(1)向导RNA，其包含(i)含有SEQ ID NO：1155或1162的核苷酸序列或由其组成的靶向结构域序列，和(ii)表6中所示的5'延伸序列；和(2)向导RNA，其包含(i)含有SEQ ID NO：1157或1161的核苷酸序列或由其组成的靶向结构域，和(ii)表6中所示的5'延伸序列。

在另一个方面，本发明公开的特征在于制备修饰的细胞群体，例如，修饰的NK细胞群体、修饰的多潜能人干细胞群体、从这些干细胞分化的修饰的NK细胞群体的方法，所述方法包括：(A)将细胞群体与下列接触：(i)在所述细胞群体内的至少一个细胞中的必需基因，如(例如)3-磷酸甘油醛脱氢酶(GAPDH)基因的内源编码序列内造成断裂的RNA导向的核酸酶和向导RNA(例如，一起配置为RNP)，和(ii)包含敲入盒的供体模板，所述敲入盒包含FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列，其中第一外源编码序列和第二外源编码序列与所述必需基因，例如，GAPDH基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')，其中通过断裂的同源介导修复(HDR)将所述敲入盒整合到所述细胞的基因组中，从而导致基因组-编辑的细胞表达：(a)FcγRIII(CD16)或其变体、(b)mbIL-15和(c)所述必需基因，例如，GAPDH或其功能性变体；和(B)将所述细胞群体(例如，NK细胞群体或者多潜能人干细胞群体或者诱导的人诱导性多能干细胞群体)与以下中的一种或多种接触：至少一种RNA导向的核酸酶和包含靶向结构域序列的向导RNA，其中所述RNA导向的核酸酶和所述向导RNA在所述细胞群体中的至少一个细胞内的所关心的基因的内源编码序列内引起基因组编辑，例如，导致断裂的基因组编辑和/或导致所关心的基因功能缺失的基因组编辑，其中所关心的基因包括，例如，腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLA II类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合。在一些实施方式中，将细胞群体任选地与在所关心的第一基因的内源编码序列内引起基因组编辑的至少第一RNA导向的核酸酶和第一向导RNA以及在所关心的第二基因的内源编码序列内引起基因组编辑的第二RNA导向的核酸酶和第二向导RNA接触；并且，任选地，其中将细胞群体与分别在所关心的第三、第四和/或第五(或更多)基因的内源编码序列内导致基因组编辑的第三、第四和/或第五(或更多)RNA导向的核酸酶和第三、第四和/或第五(或更多)向导RNA接触。

在一些实施方式中，RNA导向的核酸酶编辑效率较高，例如，其中RNA导向的核酸酶能够编辑细胞群体中约60％至100％的细胞，例如，群体中至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或至少99％的细胞。在一些实施方式中，RNA导向的核酸酶配置有向导RNA以形成RNP，并且所述RNP在细胞群体中至少60％的细胞中(例如，细胞群体中至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的细胞中)导致必需基因内(例如，表3中提供的任何必需基因(如，例如，GAPDH)的基因座中的末端外显子内)的断裂。在一些实施方式中，RNA导向的核酸酶配置有向导RNA以形成RNP，并且在细胞群体与RNA导向的核酸酶和向导RNA(RNP)以及供体模板接触后的4天至9天之间(例如，4天、5天、6天、7天、8天或9天)，所述RNP在细胞群体中至少50％的细胞中(例如，细胞群体中至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的细胞中)诱导敲入盒在必需基因处(例如，表3中提供的任何必需基因(如，例如，GAPDH)的基因座中的末端外显子内)整合。在一些实施方式中，RNA导向的核酸酶包括Cas9、Cas12a、Cas12b、Cas12c、Cas12e、CasX或者CasΦ(Cas12j)或其变体，例如，能够编辑细胞群体中约60％至100％的细胞的变体。

在一些实施方式中，细胞群体中至少50％(例如，至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％)的细胞包含敲入盒，所述敲入盒包含在所述细胞群体与供体模板和在所述必需基因的内源编码序列内引起断裂的RNA导向的核酸酶和向导RNA(例如，一起配置为RNP)接触后的4天至9天之间(例如，4天、5天、6天、7天、8天或9天)在基因组中的必需基因处整合的第一和第二外源编码序列。

在一些实施方式中，细胞群体中至少50％(例如，至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％)的细胞包含敲入盒，所述敲入盒包含在所述细胞群体与供体模板和在所述必需基因的内源编码序列内引起断裂的RNA导向的核酸酶和向导RNA(例如，一起配置为RNP)接触后的4天至9天之间(例如，4天、5天、6天、7天、8天或9天)在基因组中的必需基因处整合的第一和第二外源编码序列，并且细胞群体中至少60％的细胞(例如，至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％)包含在所述细胞群体与在所关心的基因的内源编码序列内引起基因组编辑的RNA导向的核酸酶和向导RNA(例如，一起配置为RNP)接触后的(例如)4天至9天之间(例如，4天、5天、6天、7天、8天或9天)，在所关心的基因的内源编码序列内的基因组编辑(例如，导致断裂的基因组编辑和/或导致功能缺失的基因组编辑)。

在一些实施方式中，细胞群体中至少50％(例如，至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％)的细胞包含敲入盒，所述敲入盒包含在所述细胞群体与供体模板和在所述必需基因的内源编码序列内引起断裂的RNA导向的核酸酶和向导RNA(例如，一起配置为RNP)接触后的4天至9天之间(例如，4天、5天、6天、7天、8天或9天)在基因组中的必需基因处整合的第一和第二外源编码序列，并且细胞群体中至少60％的细胞(例如，至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％)包含在所述细胞群体与在所关心的基因的内源编码序列内引起基因组编辑的RNA导向的核酸酶和向导RNA(例如，一起配置为RNP)接触后的(例如)4天至9天之间(例如，4天、5天、6天、7天、8天或9天)，在所关心的基因的内源编码序列内的基因组编辑(例如，导致断裂的基因组编辑和/或导致功能缺失的基因组编辑)。在一些实施方式中，细胞群体中至少50％(例如，至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％)的细胞包含敲入盒，所述敲入盒包含在所述细胞群体与供体模板和在所述必需基因的内源编码序列内引起断裂的RNA导向的核酸酶和向导RNA(例如，一起配置为RNP)接触后的4天至9天之间(例如，4天、5天、6天、7天、8天或9天)在基因组中的必需基因处整合的第一和第二外源编码序列；并且细胞群体中至少60％的细胞(例如，至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％)包含在所述细胞群体与在内源CISH编码序列内引起基因组编辑的RNA导向的核酸酶和向导RNA(例如，一起配置为RNP)接触后的(例如)4天至9天之间(例如，4天、5天、6天、7天、8天或9天)，在内源CISH编码序列内的基因组编辑(例如，导致断裂的基因组编辑和/或导致功能缺失的基因组编辑)；并且细胞群体中至少60％的细胞(例如，至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％)包含在所述细胞群体与在内源TGFβRII编码序列内引起基因组编辑的RNA导向的核酸酶和向导RNA(例如，一起配置为RNP)接触后的(例如)4天至9天之间(例如，4天、5天、6天、7天、8天或9天)，在内源TGFβRII编码序列内的基因组编辑(例如，导致断裂的基因组编辑和/或导致功能缺失的基因组编辑)。

在一些实施方式中，细胞群体中至少50％(例如，至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％)的细胞在所述细胞群体与RNA导向的核酸酶和向导RNA(例如，一起配置为RNP)和供体模板接触后的(例如)4天至9天之间(例如，4天、5天、6天、7天、8天或9天)表达FcγRIII(CD16)或其变体和mbIL-15。在一些实施方式中，细胞群体中至少50％(例如，至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％)的细胞在所述细胞群体与RNA导向的核酸酶和向导RNA(例如，一起配置为RNP)和供体模板接触后的(例如)4天至9天之间(例如，4天、5天、6天、7天、8天或9天)表达FcγRIII(CD16)或其变体和mbIL-15，并且细胞群体中至少60％的细胞(例如，至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或至少99％)在所述细胞群体与在内源CISH和TGFβRII编码序列内引起基因组编辑的RNA导向的核酸酶和向导RNA(例如，配置为RNP)接触后不表达CISH或TGFβRII。

附图说明

当与附图一起阅读时，根据多种示例性实施方式的下列描述，将更充分地理解本文所描述的教导内容。应理解以下所描述的附图仅出于说明的目的，并且不意欲以任何方式限制本发明教导内容的范围。

图1显示了示例性AsCpf1(AsCas12a)向导RNA在GAPDH基因上的结合位置，以及转染后三天靶向GAPDH基因的示例性向导RNA的筛选结果。结果来自来源于活细胞的gDNA。

图2显示了转染后三天靶向GAPDH基因的示例性AsCpf1(AsCas12a)向导RNA的筛选结果。结果来自来源于活细胞的gDNA。

图3A显示了靶向根据本发明公开的某些实施方式的必需基因的示例性整合策略。在具体的实施方式中，使用CRISPR基因编辑(例如，通过Cas12a、Cas9、Cas12b、Cas12c、Cas12e、CasX或CasΦ(Cas12j)或其变体，例如，具有高编辑效率，例如，能够编辑细胞群体中约60％至100％的细胞的变体)在末端外显子内(例如，必需基因的终止密码子上游(5')约500bp内)引入双链断裂并且施用具有设计以介导切割位点处的同源介导修复(HDR)的同源臂的供体质粒，从而导致产生了携带在必需基因基因座处整合的所关心的货物的活细胞群体。通过CRISP核酸酶编辑，但不能经历货物在必需基因基因座处的整合的那些细胞不能存活。

图3B显示了靶向根据本发明公开的某些实施方式的GAPDH基因的示例性整合策略。尽管图3B显示了其中在诱导性多能干细胞(iPSC)中修饰GAPDH基因的策略，但是该策略可以应用于多种细胞类型，包括原代细胞，例如，T细胞、NK细胞、干细胞、iPSC和从iPSC分化的细胞，例如，iPSC-来源的T细胞或NK细胞，以用于治疗癌症。

图3C显示了靶向根据本发明公开的某些实施方式的GAPDH基因的示例性整合策略。该图显示应随时间存活的唯一细胞是经历使GAPDH基因座恢复并且包括所关心的货物的盒的靶向整合的那些细胞以及未编辑的细胞。如果核酸酶和向导RNA在切割必需基因靶标位点时非常有效并且引入显著降低必需基因产物功能的插缺，则在CRISPR编辑后未编辑的细胞群体应较小。

图3D显示了靶向根据本发明公开的某些实施方式的必需基因的示例性整合策略。在具体的实施方式中，使用CRISPR基因编辑(例如，通过Cas12a、Cas9、Cas12b、Cas12c、Cas12e、CasX或CasΦ(Cas12j)或其变体，例如，具有高编辑效率，例如，能够编辑细胞群体中约60％至100％的细胞的变体)引入双链断裂以靶向5'外显子(例如，必需基因的起始密码子下游(3')约500bp内)并且施用具有设计以介导切割位点处的同源介导修复(HDR)的同源臂的供体质粒，从而导致产生了携带在必需基因基因座处整合的所关心的货物的活细胞群体。通过CRISP核酸酶编辑，但不能经历货物在必需基因基因座处的整合的那些细胞不能存活。

图4显示了在靶向GAPDH基因的示例性AsCpf1(AsCas12a)向导RNA的不同浓度(0.625μM至4μM)下的编辑效率。

图5显示了当还存在dsDNA质粒(“PLA”)时，电穿孔后4天GAPDH基因中编码“货物”的CD47的敲入(KI)效率。使用质粒的两种不同浓度测量敲入效率。使用靶向敲入“货物”的3'位置的ddPCR测量敲入。

图6显示了当还存在dsDNA质粒时，电穿孔后9天GAPDH基因中编码“货物”的CD47的敲入效率。使用靶向敲入“货物”的5'和3'位置两者的ddPCR测量敲入，从而提高结果的可靠性。

图7显示了在转染后7天测量的包含编码“货物”序列的GFP蛋白的敲入盒向iPSC的GAPDH基因座的整合效率。(A)显示了示例性显微镜学(明场和荧光)图像，且(B)显示了示例性流式细胞术数据。图像和流式细胞术数据显示了与货物和向导RNA转染(RSQ22337+PLA1593或RSQ24570+PLA1651)相比，单独货物转染(PLA1593或PLA1651)的插入率，另外，将使用具有适当货物的示例性外显子编码区靶向向导RNA(RSQ22337+PLA1593)的插入率与使用具有适当货物的内含子靶向向导RNA(RSQ24570+PLA1651)的插入率相比较。

图8A显示了用于向GAPDH基因座插入的双顺反子敲入盒(例如，包含通过接头隔开的两个顺反子)的示意图。通过接头序列将前导GAPDH外显子9编码区和编码所关心的蛋白的外源序列隔开，并且第二GAPDH等位基因可以包含靶标敲入盒插入、插缺，或者是野生型(WT)。

图8B显示了用于向GAPDH基因座插入的双等位基因敲入盒的示意图。编码所关心的蛋白的外源“货物”序列位于不同的敲入盒上。对于每个构建体，通过接头序列将前导GAPDH外显子9编码区与编码所关心的蛋白的外源序列隔开。

图9A显示了用于向GAPDH基因座插入的双顺反子敲入盒的示意图，其具有通过接头序列P2A、T2A和/或IRES隔开的前导GAPDH外显子9编码区和编码GFP和mCherry的外源序列。

图9B是在RNP和双顺反子敲入盒核转染后9天iPSC的一组示例性显微图象(明场和荧光)，所述RNP包含靶向GAPDH的RSQ22337(SEQ ID NO：95)和Cas12a(SEQ ID NO：62)并且所述双顺反子敲入盒包含在GAPDH基因座插入的编码GFP和mCherry分子的“货物”序列。显示了iPSC，其包含具有接头P2A和T2A的示例性“货物”分子PLA1582(包含供体模板SEQ IDNO：41)、具有接头T2A和P2A的PLA1583(包含供体模板SEQ ID NO：42)和具有接头T2A和IRES的PLA1584(包含供体模板SEQ ID NO：43)。结果显示可以以双顺反子方式插入至少两种不同的货物并且不管所使用的接头类型如何，表达是可检测的。以2×100μm在Keyence显微镜上采集所有图像。

图9C显示了示例性“货物”分子GFP和mCherry从包含所描述的接头对的多种双顺反子分子(X轴)的表达定量(Y轴)。将作为唯一“货物”蛋白的mCherry用作相对对照。

图10A显示了在GAPDH基因处双等位基因GFP和mCherry敲入的示例性流式细胞术数据。

图10B显示了在GAPDH基因处双等位基因GFP和mCherry敲入后的流式细胞术分析之前的细胞群体荧光成像。

图10C是显示在GAPDH基因处双等位基因GFP和mCherry敲入的示例性流式细胞术分析数据的柱状图。用0.5μM包含Cas12a(SEQ ID NO：62)和RSQ22337(SEQ ID NO：95)的RNP和2.5μg(5次试验)或5μg(1次试验)GFP和mCherry供体模板核转染细胞。

图11A显示了在用gRNA和包含具有重组到多个基因座中的编码GFP的“货物”序列的敲入盒的适当的供体模板转染后7天，在iPSC中GFP表达的示例性流式细胞术数据。

图11B显示了如在用所指明的gRNA转染后48小时通过CRISPR编辑推理(ICE)测定所测量的，具有编辑事件的细胞的百分比。

图11C显示了如通过使用FITC通道(以过滤用所指明的示例性gRNA和敲入盒组合转染的iPSC的GFP信号)所实施的流式细胞术所确定的相对整合“货物”(GFP)表达强度。

图11D显示了如通过使用FITC通道(以过滤用靶向所指明的必需基因的示例性gRNA转染的iPSC的GFP信号)所实施的流式细胞术所确定的相对整合“货物”(GFP)表达强度。通过百分比表示每个必需基因处的敲入效率。

图12显示了突出显示包含含有GFP蛋白编码“货物”序列的敲入盒的供体模板向iPSC的TBP基因座的整合效率的示例性流式细胞术数据。

图13是描述iPSC群体中GAPDH或TBP等位基因中敲入盒整合比例的示例性ddPCR结果。

图14是在电穿孔和转导后7天所测量的，以多种RNP浓度和多种AAV6感染复数(MOI)率(vg/细胞)，使用包含靶向GAPDH的RSQ22337和Cas12a(SEQ ID NO：62)的RNP，AAV6介导的GFP向T细胞的敲入的示例性流式细胞术数据的柱状图图示。Y轴表示表达GFP的细胞群体的百分比，而X轴显示了AAV6 MOI。

图15是在分化细胞中在AAV6介导的GFP在GAPDH基因处的敲入后，显示细胞存活力的示例性流式细胞术数据的柱状图图示。显示了在AAV6介导的GFP载货转导和用1μM包含RSQ22337和Cas12a(SEQ ID NO：62)的RNP电穿孔后4天的T细胞存活力；Y轴表示作为总细胞群体函数的细胞存活力，而X轴列出了用于转导细胞的多种MOI。

图16A显示了以5E4 MOI通过包含靶向GAPDH的敲入GFP货物的AAV6转导并用4μM包含Cas12a(SEQ NO：62)和RSQ22337的RNP转化的T细胞群体的示例性流式细胞图。

图16B显示了未通过AAV6转导，而是仅用4μM包含Cas12a(SEQ NO：62)和RSQ22337的RNP转化的T细胞的示例性对照实验流式细胞图。

图17A是显示使用包含RSQ22337和Cas12a(SEQ ID NO：62)的RNP在GAPDH基因座处，或者在TRAC基因座处，AAV6介导的GFP向T细胞的敲入的示例性流式细胞术数据的柱状图。整合构建体分别包含约500bp长的同源臂，并且用相同浓度的RNP和AAV MOI转导T细胞。显示了三个独立生物学重复的平均值和标准偏差，在目标整合中观察到显著性差异(使用非配对t检验，p＝0.0022)。

图17B显示了以5E4 MOI通过靶向GAPDH处敲入的包含GFP货物的AAV6转导并用4μM包含Cas12a(SEQ ID：62)和RSQ22337的RNP转化的T细胞群体的示例性流式细胞图。

图17C显示了如图17B所述，通过AAV6转导并且用RNP转化的T细胞群体以及未经历RNP转染(“空”)的T细胞群体的示例性扩增和存活力数据。

图17D显示了如图17B所述使用包含RSQ22337和Cas12a(SEQ ID NO：62)的RNP在GAPDH基因座处，或者在TRAC基因座处，AAV6介导的GFP向T细胞的敲入的示例性流式细胞术数据。整合构建体分别包含约500bp长的同源臂，并且用相同浓度的RNP和AAV MOI转导T细胞。显示了三个独立生物学重复，在目标整合中观察到显著性差异(使用非配对t检验，p＝<0.001)。

图17E显示了使用包含RSQ22337和Cas12a(SEQ ID NO：62)的RNP在GAPDH基因座(GAPDH KI)处，或者在TRAC基因座(TRAC KI)处，AAV6介导的GFP向T细胞的敲入的示例性流式细胞术数据。在不同的AAV6浓度下检查敲入效率。整合构建体分别包含约500bp长的同源臂。X轴定量AAV6浓度(vg/ml)，而Y轴定量如通过流式细胞术所检测的表达GFP的细胞的百分比。在每个AAV6浓度，对每个敲入位置显示了三个独立生物学重复。观察了AAV6浓度的EC50的显著性差异。****p＝<0.0001(非配对t检验)。

图18A是显示编码在iPSC的GAPDH基因处整合的“货物”的CD16的敲入效率的柱状图。使用靶向敲入货物5'(5'测定)和3'(3'测定)位置的ddPCR，在整体编辑的细胞群体的第0天和第19天测定靶向整合(TI)。

图18B是使用靶向敲入货物5'(5'CDN探针)和3'(3'多聚A探针)位置的ddPCR所测量的，显示具有编码在GAPDH基因整合的“货物”的CD16的iPSC克隆的基因型的柱状图。显示了4个示例性细胞系的结果，将两个细胞系分类为纯合敲入，其靶向整合(TI)率分别为88.5％(克隆1)和90.5％(克隆2)，并将两个细胞系分类为杂合敲入，其TI率分别为45.6％(克隆1)和46.5％(克隆2)。

图19A显示了来自第32天时分化为iNK的纯合克隆1CD16敲入iPSC的示例性流式细胞术数据。数据突出显示了敲入盒的整合效率和高表达(例如，约98％)，所述敲入盒包含编码进入iPSC的GAPDH基因的“货物”序列的CD16蛋白。另外，数据显示“货物”在GADPH基因处的敲入不抑制分化过程，如通过高CD56+CD45+群体比例所表示的。

图19B显示了来自第32天时分化为iNK的纯合克隆2CD26敲入iPSC的示例性流式细胞术数据。数据突出显示了敲入盒的整合效率和表达，所述敲入盒包含编码进入iPSC的GAPDH基因的“货物”序列的CD16蛋白。

图19C显示了来自第32天时分化为iNK的杂合克隆1CD16敲入iPSC的示例性流式细胞术数据。数据突出显示了敲入盒的整合效率和高表达(例如，约97.8％)，所述敲入盒包含编码进入iPSC的GAPDH基因的“货物”序列的CD16蛋白。

图19D显示了来自第32天时分化为iNK的杂合克隆2CD16敲入iPSC的示例性流式细胞术数据。数据突出显示了敲入盒的整合效率和表达，所述敲入盒包含编码进入iPSC的GAPDH基因的“货物”序列的CD16蛋白。

图20是示例性实体瘤细胞杀伤测定的示意图，其显示使用分化为iNK细胞的敲入iPSC杀伤从癌细胞系(例如，SK-OV-3卵巢癌细胞)所产生的3D球形体。可以在3D球形体杀伤阶段期间任选地添加抗体和/或细胞因子。

图21A显示了图20中所述的实体瘤杀伤测定结果。在GAPDH基因处包含CD16敲入的纯合克隆分化为iNK细胞并且起作用以降低肿瘤细胞球形体的尺寸，具体地在添加抗体，例如，10μg/mL曲妥珠单抗之后；抗体的添加促进了抗体依赖性细胞毒性(ADCC)和通过iNK的肿瘤细胞杀伤。对照“WT PCS”细胞是未用RNP或质粒电穿孔且与测试细胞处于相同iNK细胞分化阶段的整体未编辑的亲代克隆。Y轴显示归一化的总积分红色对象强度，其代表肿瘤细胞丰度，而X轴显示效应因子比靶细胞(E：T)之比。

图21B显示了图20中所述的实体瘤杀伤测定结果。在GAPDH基因处包含CD16敲入的杂合克隆分化为iNK细胞并且起作用以降低肿瘤细胞球形体的尺寸，具体地在添加抗体，例如，10μg/mL曲妥珠单抗之后；抗体的添加促进了ADCC和通过iNK的肿瘤细胞杀伤。对照“WTPCS”细胞是未用RNP或质粒电穿孔且与测试细胞处于相同iNK细胞分化阶段的整体未编辑的亲代克隆。Y轴显示归一化的总积分红色对象强度，其代表肿瘤细胞丰度，而X轴显示E：T比。

图22显示了体外连续杀伤测定的结果，其中在GAPDH基因处包含CD16敲入的纯合或杂合克隆分化为iNK细胞并且在添加或不添加抗体(0.1μg/mL利妥昔单抗)的情况下，顺序用血液学癌细胞(例如，Raji细胞)攻毒。X轴表示时间(0-598hr.)，其中约每48小时添加另外的肿瘤细胞丸剂(5,000个细胞)，并且Y轴表示如通过归一化的总红色对象面积(例如，肿瘤细胞的存在)所测量的杀伤效力。星号(*)表示在先前不存在利妥昔单抗的试验中添加0.1μg/mL利妥昔单抗的发生。数据显示所编辑的iNK细胞(在GAPDH基因处CD16敲入；克隆“Homo_C1”、“Homo_C2”、“Het_C1”和“Het_C2”)继续杀伤血液学癌细胞，而来源于亲代iPSC的未编辑的(“PCS”)或对照编辑的iNK(“GFP Bulk”)在相同时间点失去了这种功能。

图23显示了以3.16:1的效应因子比靶标(E:T)比，CD16表达和肿瘤球形体尺寸减小之间的相关性(R²为0.768)。显示了分化的iNK细胞，其来源于iPSC整体编辑的细胞或者在GAPDH基因处具有CD16敲入的iPSC各个克隆。Y轴表示归一化的肿瘤细胞杀伤值，而X轴表示表达CD16的细胞群体的百分比。

图24A是显示在使用用于CD16货物、CAR货物或双等位基因GFP/mCherry货物向GAPDH基因敲入的质粒和2μM包含靶向GAPDH基因的RSQ22337和Cas12a(SEQ ID NO：62)的RNP对两种不同的iPSC系的核转染后9天所测量的示例性ddPCR数据的柱状图。

图24B显示了使用用于CXCR2货物向GAPDH基因敲入(GAPDH::CXCR2)的质粒和2μM包含靶向GAPDH基因的RSQ22337和Cas12a(SEQ ID NO：62)的RNP编辑的iPSC系或者仅用RNP转化的对照iPSC(野生型)的示例性流式细胞术数据。在X轴上记录CXCR2表达，表达CXCR2的编辑的细胞为整体编辑的细胞群体的29.2％，而CXCR2的表面表达为整体编辑的细胞群体的8.53％。

图25是显示在使用靶向敲入“货物”5'(5'CDN探针)和3'(3'多聚A探针)位置的ddPCR在电穿孔后第0天所测量的，使用包含靶向GAPDH基因的RSQ22337和Cas12a(SEQ IDNO：62)的RNP，一系列敲入盒货物序列，如CD16-P2A-CAR、CD16-IRES-CAR、CAR-P2A-CD16、CAR-IRES-CD16和mbIL-15向GAPDH基因中的敲入效率的柱状图。

图26图示显示了可以用作如本文所描述的敲入货物序列的膜结合的IL15.IL15Rα(mbIL-15)构建体。

图27是当作为整体编辑的群体的百分比所测量的mbIL-15进入GAPDH基因的TI的柱状图。显示了在向iNK细胞分化的过程的第28天，来自iPSC的TI率。

图28A显示了在向iNK分化的第39天，来自整体编辑的mbIL-15GAPDH基因敲入iPSC群体的示例性流式细胞术数据。

图28B显示了在向iNK分化的第39天，来自整体编辑的mbIL-15GAPDH基因敲入iPSC群体的示例性流式细胞术数据。

图28C显示了在iPSC分化的第32天、第39天、第42天和第49天，与也分化为iNK细胞的亲代克隆细胞(“WT”)相比，分化为iNK细胞的整体编辑的mbIL-15GAPDH基因敲入iPSC群体的表面表达表型(作为群体百分比测量)。

图29显示了两种体外肿瘤细胞杀伤测定的结果。在不存在或存在10μg/mL利妥昔单抗，以1(A)或2.5(B)的E：T比测量时，当与也分化为iNK细胞的WT亲代细胞相比，在GAPDH基因处包含mbIL-15敲入的整体编辑的iPSC群体的两个生物学重复(S1和S2)分化为iNK细胞(对于S2，在分化的第56天，并且对于S1，在分化的第63天)并且起作用以降低血液学癌细胞(例如，Raji细胞)的荧光信号(实验重复两次，R1和R2)。

图30A显示了如图20所述的实体瘤杀伤测定结果。当与也分化为iNK细胞的WT亲代细胞相比时，在GAPDH基因处包含mbIL-15敲入的整体编辑的iPSC群体的两个生物学重复(S1和S2)分化为iNK细胞(iPSC分化的第39天)并且起作用以降低肿瘤细胞球形体的尺寸。5ng/mL外源IL-15的添加提高了通过iNK的肿瘤细胞杀伤。Y轴显示归一化的总积分红色对象强度，其代表肿瘤细胞丰度，而X轴显示E：T比。

图30B显示了如图20所述的实体瘤杀伤测定结果。当与在相应分化阶段和E：T比(显示的E:T比为约31.6)，也分化为iNK细胞的WT亲代细胞相比时，在GAPDH基因处包含mbIL-15敲入的整体编辑的iPSC群体的两个生物学重复(S1和S2)分化为iNK细胞(iPSC分化的第39天)并且起作用以降低肿瘤细胞球形体的尺寸。5ng/mL外源IL-15的添加是稳健的WTiNK细胞球形体减小所必需的，而mbIL-15 KI iNK细胞能够在无外源IL-15的情况下降低肿瘤体积。X轴表示时间(0-100hr)，而Y轴表示如通过归一化的总红色对象面积(例如，肿瘤细胞的存在)所测量的杀伤效力。

图30C显示了如图20所述的实体瘤杀伤测定结果。当与在相应iNK细胞分化阶段的WT亲代细胞相比，在GAPDH基因处包含mbIL-15敲入的整体编辑的群体的两个生物学重复(S1和S2)分化为iNK细胞(例如，在分化的第39天、第42天、第49天、第56天和第63天)并起作用以减小肿瘤细胞球形体的尺寸(实验重复两次，R1和R2)。

图30D显示了如图20所述的实体瘤杀伤测定结果。当与在相应iNK细胞分化阶段的WT亲代细胞相比，在GAPDH基因处包含mbIL-15敲入的整体编辑的iPSC群体的两个生物学重复(S1和S2)分化为iNK细胞(例如，在分化的第39天、第42天、第49天、第56天和第63天；重复两次，R1和R2)并起作用以减小肿瘤细胞球形体的尺寸(实验重复两次，R1和R2)。细胞群体补充外源IL-15(5ng/mL)，从而当与未添加的细胞相比，在所测试的每个成熟阶段导致了更稳健的iNK细胞诱导的球形体减小(图30C)(实验重复两次，R1和R2)。

图31A显示了如图20所述的实体瘤杀伤测定结果。在GAPDH基因处包含mbIL-15敲入的整体编辑的iPSC群体的两个生物学重复(S1和S2)分化为iNK细胞(对于S1，iPSC分化的第63天，并且对于S2，iPSC分化的第65天)并且起作用以减小肿瘤细胞球形体的尺寸。Y轴表示如通过归一化的总红色对象面积(例如，肿瘤细胞的存在)所测量的杀伤效力，而X轴表示E:T细胞比；实验重复两次或三次，R1、R2和R2.1。

图31B显示了如31A中所述的实体瘤杀伤测定结果，但是添加了10μg/mL赫塞汀抗体，该添加引发了ADCC肿瘤细胞杀伤。

图31C显示了31A中所述的实体瘤杀伤测定结果，但是添加了5ng/mL外源IL-15。

图31D显示了如31A中所述的实体瘤杀伤测定结果，但是添加了5ng/mL外源IL-15和10μg/mL赫塞汀抗体，该添加引发了ADCC肿瘤细胞杀伤。

图32显示了如图20所述的实体瘤杀伤测定的两个独立细胞组和3-5个重复的累加结果。当在不存在外源IL-15的情况下，与分化的WT亲代细胞iNK相比时，在GAPDH基因处包含mbIL-15敲入的两个独立的整体编辑的群体(S1和S2)分化为iNK细胞(对于组1，iPSC分化的第39和49天，并且对于S2，iPSC分化的第42天)并且起作用以显著降低肿瘤细胞球形体的尺寸(P＝0.034，+/-标准偏差，非配对t检验)；另外，当在存在5ng/mL外源IL-15的情况下，与分化的WT亲代细胞相比，分化的敲入细胞倾向于显著降低肿瘤细胞球形体的尺寸(P＝0.052，+/-标准偏差，非配对t检验)。

图33A示意性显示了对于在如本文所描述的靶标基因处的整合，包含与GFP序列偶联的膜结合的IL15.IL15Rα(mbIL-15)的敲入盒货物序列。

图33B示意性显示了对于在如文所描述的靶标基因处的整合，包含CD16、IL15和IL15Rα的敲入盒货物序列。

图33C示意性显示了对于在如文所描述的靶标基因处的整合，包含CD16和膜结合的IL15.IL15Rα(mbIL-15)的敲入盒货物序列。

图34A显示了使用ddPCR所测量的，来自使用包含靶向GAPDH基因的RSQ22337和Cas12a(SEQ ID NO：62)的RNP，用包含插入GAPDH基因中的与GFP序列偶联的膜结合的IL15.IL15Rα(mbIL-15)的货物序列的PLA1829(参见图33A)转化后7天的整体编辑的iPSC群体，或者来自仅用RNP转化的对照WT细胞的示例性流式细胞术数据。Y轴显示了IL-15Rα表达，而X轴上显示了GFP表达。

图34B显示了使用ddPCR所测量的，来自使用包含靶向GAPDH基因的RSQ22337和Cas12a(SEQ ID NO：62)的RNP，用在GAPDH基因中插入的，包含CD16、IL-15和IL15Rα的货物序列，或者包含CD16和膜结合的IL15.IL15Rα(mbIL-15)的货物序列的PLA1832或PLA1834(参见图33B和33C)转化后7天的整体编辑的iPSC群体的示例性流式细胞术数据。Y轴显示了IL-15Rα表达，X轴显示了GFP表达。

图35A是显示使用ddPCR所测量的，如图34A所述，在用PLA1829(5μg)和2μM包含靶向GAPDH基因的RSQ22337和Cas12a(SEQ ID NO：62)的RNP转化后，各个集落的基因型的柱状图。显示了各个纯合(～100％ TI)、杂合(～50％ TI)或野生型(～0％ TI)细胞。

图35B是显示使用ddPCR所测量的，如图34B所述，用PLA1832(5μg)和2μM包含靶向GAPDH基因的RSQ22337和Cas12a(SEQ ID NO：62)的RNP转化后，各个集落的基因型的柱状图。显示了各个纯合(～100％ TI)、杂合(～50％ TI)或野生型(～0％ TI)细胞。

图35C是显示使用ddPCR所测量的，如图34B所述，用PLA1834(5μg)和2μM靶向GAPDH基因的RSQ22337和Cas12a(SEQ ID NO：62)的RNP转化后，各个集落的基因型的柱状图。显示了各个纯合(～100％ TI)、杂合(～50％ TI)或野生型(～0％TI)细胞。

图36A显示了在分化为iNK的第32天所测量的，在GAPDH基因处包含来自PLA1829、PLA1832或PLA1834的敲入货物序列(如图34A-34C所述)的细胞的示例性流式细胞术数据；仅用RNP转化“WT”细胞并且也处于分化为iNK的第32天。数据突出显示了包含编码“货物”序列的IL-15Rα蛋白的敲入盒的整合效率和表达。Y轴定量来自所指明的表达IL-15Rα的群体的细胞的百分比，而X轴表示集落基因型。

图36B显示了在分化为iNK的第32天所测量的，在GAPDH基因处包含来自PLA1829、PLA1832或PLA1834的敲入货物序列(如图34A-34C所述)的细胞的示例性流式细胞术数据；仅用RNP转化“WT”细胞并且也处于分化为iNK的第32天。数据突出显示了包含编码“货物”序列的CD16蛋白的敲入盒的整合效率和表达。Y轴定量来自所指明的表达CD16的群体的细胞的百分比，而X轴表示集落基因型。

图36C显示了在分化为iNK的第32天所测量的，在GAPDH基因处包含来自PLA1829、PLA1832或PLA1834的敲入货物序列(如图34A-34C所述)的细胞的示例性流式细胞术数据；仅用RNP转化“WT”细胞并且也处于分化为iNK的第32天。数据突出显示了包含编码“货物”序列的IL-15Rα蛋白的敲入盒的整合效率和表达。Y轴定量表达IL-15Rα的细胞群体的中值荧光强度(MFI)，而X轴表示集落基因型。

图36D显示了在分化为iNK的第32天所测量的，在GAPDH基因处包含来自PLA1829、PLA1832或PLA1834的敲入货物序列(如图34A-34C所述)的细胞的示例性流式细胞术数据；仅用RNP转化“WT”细胞并且也处于分化为iNK的第32天。数据突出显示了包含编码“货物”序列的CD16蛋白的敲入盒的整合效率和表达。Y轴定量表达CD16的细胞群体的中值荧光强度(MFI)，而X轴表示集落基因型。

图36E显示了来自未编辑的(WT)细胞或者在GAPDH基因座处包含来自PLA1834的敲入货物序列的纯合细胞(CD16^+/+/mbIL-15^+/+)的示例性流式细胞术数据。数据突出显示了包含编码货物序列的CD16和IL-15Rα蛋白的敲入盒的整合效率和表达。Y轴定量来自所指明的表达所选基因的群体的细胞的百分比，而X轴表示所选基因是CD16还是IL-15Rα。

图36F显示了在不存在曲妥珠单抗(赫塞汀)的情况下，在细胞毒性测定之前或之后，来自在GAPDH基因处包含来自PLA1829或PLA1834的敲入货物序列的iNK细胞，或者来自WT细胞的示例性流式细胞术数据。

图36G显示了在存在曲妥珠单抗(赫塞汀)的情况下，在细胞毒性测定之前或之后，来自在GAPDH基因处包含来自PLA1829或PLA1834的敲入货物序列的iNK细胞，或者来自WT细胞的示例性流式细胞术数据。

图36H显示了来自在GAPDH基因处包含来自PLA1834的敲入货物序列的纯合iNK细胞(CD16^+/+/mbIL-15^+/+)或者未编辑的(WT)细胞的两个独立流式细胞术分析的CD16表面表达。在2D细胞杀伤(LDH)测定之前或之后并且在不存在或存在曲妥珠单抗的情况下评价CD16表面表达。Y轴定量来自所指明的CD56/CD16+群体的细胞的百分比，而X轴表示样品是在2D杀伤测定之前还是之后。

图36I显示了在2D细胞杀伤测定(LDH测定)中通过纯合PLA1834-转化的(CD16^+/+/mbIL-15^+/+)iNK细胞或者未编辑的(WT)iNK细胞所证实的细胞毒性百分比。以1(左图)或2.5(右图)的E：T比，在存在或不存在10μg/ml曲妥珠单抗的情况下进行测定。Y轴定量细胞毒性百分比，而X轴表示曲妥珠单抗的存在或不存在。*p<0.05，**p<0.01(双向ANOVA)。

图36J显示了在不存在细胞因子、IL-2和IL-15的情况下，在体外持久性测定后，在GAPDH基因处包含来自PLA1829或PLA1834的敲入货物序列的iNK细胞或者未编辑的(WT)iNK细胞的总细胞数(左侧图版)。在右上图版中显示了相对于包含来自PLA1829的纯合敲入的细胞，包含来自PLA1834的敲入的细胞的变化倍数。在右下图版中显示了相对于未编辑的(WT)细胞，包含来自PLA1834的纯合敲入(CD16^+/+/mbIL-15^+/+)的细胞的变化倍数。

图37A显示了如图20所述的实体瘤杀伤测定的结果。在GAPDH基因处包含纯合CD16敲入的克隆分化为iNK细胞并且起作用以减小肿瘤细胞球形体的尺寸，具体地在添加抗体，例如，10μg/mL曲妥珠单抗后。抗体的添加促进了抗体依赖性细胞毒性(ADCC)和通过iNK的肿瘤细胞杀伤。对照“WT”细胞是未用RNP或质粒电穿孔且与测试细胞处于相同iNK细胞分化阶段的整体未编辑的亲代克隆。Y轴显示归一化的总积分红色对象强度，其代表肿瘤细胞丰度，而X轴显示效应因子比靶细胞(E：T)之比。“WT”细胞的IC50为3.0的E：T比，而SLEEK CD16KI细胞的IC50为0.5的E：T比。

图37B显示了如图20所示，所实施的3D肿瘤球形体杀伤测定的结果。在不存在(左图)或存在(右图)10μg/ml曲妥珠单抗的情况下，以E：T比10将纯合PLA1834-转化的(CD16^+/+/mbIL-15^+/+)iNK细胞和未编辑的(WT)iNK细胞引入SK-OV-3肿瘤细胞。上图版显示了肿瘤球形体在第0小时和第100小时的成像，其中用于测量肿瘤细胞丰度的红色对象信号是可见的。下图版显示了如经由Y轴上的积分红色目标强度和X轴上的以小时为单位的时间所测量的球形体尺寸。

图37C显示了如图20所示，所实施的3D肿瘤球形体杀伤测定的结果。以不同的E：T比，对SK-OV-3肿瘤细胞使用了未编辑的(WT)iNK细胞、周围血液NK细胞和纯合PLA1834-转化的(CD16^+/+/mbIL-15^+/+)iNK细胞的两个克隆。在左图版中，存在5ng/ml外源IL-15和10μg/ml曲妥珠单抗。对于每种细胞或克隆类型进行了两个独立实验，除了对于周围血液NK细胞进行了一个实验。在左下图版中的表中提供了基于左上图版的IC50值，并且所述IC50值突出显示CD16^+/+/mbIL-15^+/+iNK细胞在杀伤肿瘤细胞中效力更大。右图版显示了在存在和不存在10μg/ml曲妥珠单抗的情况下对于纯合PLA1834-转化的(CD16^+/+/mbIL-15^+/+)iNK细胞和未编辑的(WT)iNK细胞，来自3D肿瘤球形体杀伤测定的IC50值。*p<0.05，**p<0.01(非配对t检验)。

图38A显示了在乳酸脱氢酶(LDH)细胞毒性测定中通过mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞或者未编辑的(WT)iNK细胞所证实的细胞毒性百分比。测试了mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞的三个不同克隆(A2、A4、C4)。以1的E：T比，在存在或不存在10μg/ml曲妥珠单抗的情况下进行测定。Y轴定量细胞毒性百分比，而X轴表示所检验的iNK细胞。误差线表示标准偏差。

图38B显示了未编辑的(WT)和mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞的流式细胞术数据。检验了mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞的两个克隆(A2、A4)。将细胞对于活的hCD45+细胞预设门，并对于CD16/CD56表达进行进一步分析。与约50％的WT iNK细胞相比，约100％的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞显示出高CD16表达。

图38C是体内肿瘤杀伤测定的示意图。对小鼠腹膜内接种0.25×10⁶个SKOV3-luc细胞，并且在2-6天后使肿瘤成瘤，将小鼠随机分组。1天后，小鼠腹膜内接受2×10⁶或者5×10⁶个mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞以及2.5mpk曲妥珠单抗。在一些处理组中，小鼠在引入iNK细胞后35天(如箭头所指示)或者21、28和35天(如箭头所指示)接受2.5mpk曲妥珠单抗的额外剂量。追踪小鼠长达引入iNK细胞后90天。X轴表示从引入NK细胞起的时间。

图38D显示了图38C中所描述的体内肿瘤杀伤测定的平均结果及平均值的标准误差。通过每条水平线表示小鼠组。组包括接受mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞(DKI iNK)及曲妥珠单抗、单独的曲妥珠单抗或者同种型对照的小鼠。分别通过箭头和空心箭头(arrowhead)表示接受总计4个剂量或2个剂量的组的曲妥珠单抗的剂量。X轴表示从NK细胞引入起的时间，而Y轴表示如使用体内成像系统(IVIS)通过生物发光成像(BLI)所测量的肿瘤负荷。

图38E显示了图38C中所描述的经受体内肿瘤杀伤测定的小鼠的存活。通过每条水平线表示小鼠组。与单独剂量施用曲妥珠单抗的小鼠相比，剂量施用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞结合曲妥珠单抗(5M DKI iNK+Tras.×4，2M DKI iNK+Tras×2)的小鼠具有延长的存活。X轴表示从NK细胞引入起的时间，而Y轴表示小鼠的存活百分比。

图38F显示了图38C中所描述的经受体内肿瘤杀伤测定的小鼠的生物发光成像。沿图版顶部表示小鼠的处理组，而沿图版左侧表示自NK细胞引入起的时间。如图所示，右侧色标表示生物发光的辐射率(p/sec/cm²/sr)(从最低2.23×10⁶至最大5.57×10⁷)。

图38G显示了通过图38C中所描述的经受体内肿瘤杀伤测定的小鼠的腹腔灌洗所获得的细胞的流式细胞术数据。顶行显示了在第90天处死后，根据如图38C中所述的体内肿瘤杀伤测定，来自接受5×10⁶个mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞+曲妥珠单抗的小鼠的数据。底行显示了在第118天处死后，根据如图38C中所述的体内肿瘤杀伤测定，来自接受2×10⁶个mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞+曲妥珠单抗的小鼠的数据。使用人CD46(hCD46)标志物，通过流式细胞术鉴别了iNK细胞(左上和左下中的插图)并且对于CD16/CD56的表达进行了进一步分析。数据突出显示mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞体内持续至少118天。

图39A是体内肿瘤杀伤测定的示意图。对小鼠腹膜内接种0.25×10⁶个SKOV3-luc细胞，并且在2-6天后使肿瘤成瘤，将小鼠随机分组。1天后，小鼠腹膜内接受5×10⁶个(5M)未编辑的(WT)或mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞。在一些处理组中，小鼠在引入iNK细胞时(第0天)接受单剂量的2.5mpk曲妥珠单抗或者在引入iNK细胞后的第0、7和14天(如箭头所指示)接受多个剂量的2.5mpk曲妥珠单抗。

图39B显示了图39A中所描述的体内肿瘤杀伤测定的肿瘤负荷(中值和四分位距)。通过每条水平线表示小鼠组。每个处理组具有8只小鼠。组包括接受未编辑的(WT)iNK细胞、mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞(DKI iNK)或同种型对照的小鼠。所使用的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK克隆(A2)对应于如图35C、38A和38B中所鉴别的A2克隆。X轴表示从NK细胞引入起的时间，而Y轴表示如使用体内成像系统(IVIS)通过生物发光成像(BLI)所测量的肿瘤负荷。

图39C显示了图39A中所描述的体内肿瘤杀伤测定的肿瘤负荷(中值和四分位距)。通过每条水平线表示小鼠组。每个处理组具有8只小鼠。组包括接受未编辑的(WT)iNK细胞+曲妥珠单抗、mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞(DKI iNK)+曲妥珠单抗、单独的曲妥珠单抗或同种型对照的小鼠。所使用的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK克隆(A2、A4)对应于如图35C、38A和38B中所鉴别的A2和A4克隆。通过箭头表示第0天时曲妥珠单抗的剂量施用。X轴表示从NK细胞引入起的时间，而Y轴表示如使用体内成像系统(IVIS)通过生物发光成像(BLI)所测量的肿瘤负荷。

图39D显示了图39A中所描述的经受体内肿瘤杀伤测定的小鼠的存活。通过每条水平线表示小鼠组。与单独剂量施用曲妥珠单抗(曲妥珠单抗×1)的小鼠相比，剂量施用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞结合曲妥珠单抗(DKI iNK+Tras.×1)的小鼠具有显著延长的存活。X轴表示从NK细胞引入起的时间，而Y轴表示小鼠的存活百分比。****p<0.0001(对数秩Mantel-Cox检验)。

图39E显示了图39A中所描述的体内肿瘤杀伤测定的肿瘤负荷(中值和四分位距)。通过每条水平线表示小鼠组。每个处理组具有8只小鼠。组包括接受未编辑的(WT)iNK细胞结合曲妥珠单抗(TRA×3)、mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞结合曲妥珠单抗(TRA×3)、单独的曲妥珠单抗(TRA×3)或者同种型对照的小鼠。所使用的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK克隆对应于如(例如)图35C、38A和38B中所鉴别的A2克隆。与剂量施用WT iNK细胞+曲妥珠单抗的小鼠相比，剂量施用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞+曲妥珠单抗的小鼠具有显著降低的肿瘤负荷。通过箭头表示在第0、7和14天曲妥珠单抗的剂量施用。X轴表示从NK细胞引入起的时间，而Y轴表示如使用体内成像系统(IVIS)通过生物发光成像(BLI)所测量的肿瘤负荷。***p<0.001(非配对t检验)。

图39F显示了图39A中所描述的经受体内肿瘤杀伤测定的小鼠的存活。通过每条水平线表示小鼠组。与剂量施用WT iNK细胞结合曲妥珠单抗(×3)的小鼠相比，剂量施用mbIL-15/CD16(CD16^+/+/mIL-15^+/+)DKI iNK细胞结合曲妥珠单抗(×3)的小鼠具有显著延长的存活。另外，与单独的曲妥珠单抗(TRA×3，TRA×1)相比，剂量施用mbIL-15/CD16(CD16^+/+/mIL-15^+/+)DKI iNK细胞+曲妥珠单抗(×3)或者WT iNK细胞+曲妥珠单抗(×3)的小鼠具有显著更大的存活概率。X轴表示从NK细胞引入起的时间，而Y轴表示小鼠的存活百分比。*p<0.05(非配对t检验)。

图39G显示了如图39A中所描述的，在第33天所测量的体内肿瘤杀伤测定的肿瘤负荷/小鼠。左图版显示了接受单剂量曲妥珠单抗(在引入iNK细胞后第0天)的小鼠的数据。右图版显示了接受三个剂量的曲妥珠单抗(在引入iNK细胞后第0、7和14天)的小鼠的数据。X轴表示处理组，而Y轴表示如使用体内成像系统(IVIS)通过生物发光成像(BLI)所测量的肿瘤负荷。**p<0.01，****p<0.0001，ns表示不显著(非配对t检验)。

图39H显示了如图39A中所描述的，在第11天(左图版)和第54天(右图版)所测量的体内肿瘤杀伤测定的肿瘤负荷/小鼠。与剂量施用未编辑的iNK细胞结合曲妥珠单抗或者单独的曲妥珠单抗的小鼠相比，剂量施用mbIL-15/CD16(CD16^+/+/mIL-15^+/+)DKI iNK细胞结合曲妥珠单抗(DKI iNK+Tras.×1)的小鼠在第11天和在第54天具有显著降低的肿瘤负荷。X轴表示处理组，而Y轴表示如使用体内成像系统(IVIS)通过生物发光成像(BLI)所测量的肿瘤负荷。***p<0.001，****p<0.0001(曼-惠特尼检验)。

图39I显示了图39A中所描述的经受体内肿瘤杀伤测定的小鼠的代表性生物发光成像。沿图版顶部表示小鼠的处理组，而沿图版左侧表示自NK细胞引入起的时间。每个处理组具有8只小鼠。图片下方的表显示了在引入NK细胞后第40天处理组中无肿瘤小鼠数目/总小鼠数目(来自图版上方)。如图所示，底部色标表示生物发光的辐射率(p/sec/cm²/sr)(从最低2.30×10⁵至最大3.72×10⁷)。

图39J显示了通过图39A中所描述的经受体内肿瘤杀伤测定的小鼠的腹腔灌洗所获得的细胞的流式细胞术数据。顶行显示了在第144天处死后，根据如图39A中所述的体内肿瘤杀伤测定，来自接受WT iNK细胞+曲妥珠单抗(×3)的小鼠的代表性数据。底行显示了在第144天处死后，根据如图39A中所述的体内肿瘤杀伤测定，来自接受mbIL-15/CD16(CD16^+/+/mIL-15^+/+)DKI iNK细胞+曲妥珠单抗(×3)的小鼠的代表性数据。使用人CD45(hCD45)标志物，通过流式细胞术鉴别了iNK细胞(左上和左下中的插图)并且对于人CD16(hCD16)和人CD56(hCD56)的表达进行了进一步分析。数据突出显示mbIL-15/CD16(CD16^+/+/mIL-15^+/+)DKI iNK细胞体内持续至少144天并且几乎所有的这些细胞继续在它们的表面上表达CD16。

图40显示了在不存在或存在活化素A(1ng/mL或4ng/ml ActA)的情况下，在多种培养基中生长的人诱导性多能干细胞(hiPSC)的多潜能性标志物的细胞形态的显微镜图和流式细胞术。

图41显示了在具有或不具有活化素A(1ng/mL、2ng/mL、4ng/mL或10ng/mL)的情况下在培养基中培养的TGFβRII敲除的hiPSC(克隆7)或CISH/TGFβRII DKO hiPSC(克隆7)的形态。

图42显示了在具有或不具有活化素A(1ng/mL、2ng/mL、4ng/mL或10ng/mL)的情况下在培养基中培养的TGFβRII敲除的hiPSC(克隆9)的形态。

图43A显示了对于单敲除和双敲除hiPSC，在CISH和TGFβRII基因座的整体编辑率。

图43B显示了在活化素A中培养的TGFβRII敲除的hiPSC、CISH敲除的hiPSC和双敲除hiPSC中Oct4和SSEA4的表达。

图44显示了在活化素A中培养的TGFβRII敲除的hiPSC、CISH敲除的hiPSC和双敲除的hiPSC的Nanog和Tra-1-60的表达。

图45是与STEMdiff^TMTrilineage分化试剂盒(STEMCELL Technologies Inc.)有关的程序的示意图。

图46A显示了在活化素A中培养的TGFβRII敲除的hiPSC、CISH敲除的hiPSC和双敲除的hiPSC的分化标志物的表达。

图46B显示了在活化素A中培养的TGFβRII/CISH双敲除的hiPSC的染色体组型。

图46C显示了对未编辑的亲代PSC系、编辑的TGFβRII KO克隆(C7)和表示为RUCDR的其它代表性(未编辑的)细胞系所实施的扩大的活化素A浓度曲线。维持每个系所需的活化素A的最小浓度随与亲代对照相比需要更高的基线活化素A的量的TGFβRII KO克隆(0.5ng/ml vs 0.1ng/ml)而轻微改变。

图46D显示了当与单独的基础培养基(未添加活化素A)一起培养时，未编辑的亲代PSC系、编辑的TGFβRII KO克隆(C7)和未编辑的RUCDR细胞系中干性标志物的表达。TGFβRIIKO iPSC不维持干性标志物表达，而两种未编辑的系能够维持干性标志物在E8中的表达。

图47A是用于产生编辑的iPSC克隆，随后分化为增强的CD56+iNK细胞并对其进行鉴定的示例性方法的示意图。

图47B是在分化过程的第二阶段期间，使用STEMDiff APEL2的iNK细胞分化过程的示意图。

图47C是在分化过程的第二阶段期间，使用NK-MACS以及15％血清的iNK细胞分化过程的示意图。

图47D显示了当使用分别如图47C和图47B所示的NK-MACS或Apel2方法分化时，在分化第39天，未编辑的PCS-来源的iNK细胞的扩增倍数和表达CD45和CD56的iNK细胞的百分比。

图47E在上图版中显示了当使用分别如图47C和图47B所示的NK-MACS或Apel2方法分化时，来源于未编辑的PCS iPSC的分化的iNK细胞的表面表达表型的热图(作为群体百分比测量)。底部图版显示了显示通过这两种方法所产生的iNK中的差异的代表性柱状图。

图47F显示了当使用分别如图47C和图47B所示的NK-MACS或Apel2方法分化时，分化的编辑的iNK(TGFβRII敲除、CISH敲除和双敲除(DKO))和未编辑的亲代iPSC(WT)的表面表达表型的热图(作为群体百分比测量)。

图47G显示了当使用分别如图47C和图47B所示的NK-MACS或Apel2方法分化时，未编辑的iNK细胞效应功能。

图48显示了与亲代野生型克隆相比，编辑的克隆(TGFβRII敲除、CISH敲除和双敲除)的分化表型。

图49显示了与亲代克隆iNK和野生型细胞相比，编辑的iNK(TGFβRII敲除、CISH敲除和双敲除)的表面表达表型。

图50A显示了与亲代克隆iNK(“WT”)和周围血液-来源的自然杀伤细胞相比，编辑的iNK(TGFβRII敲除、CISH敲除和双敲除)的表面表达表型。

图50B是显示与亲代克隆iNK细胞(“未编辑的iNK细胞”)相比，编辑的iNK细胞(TGFβRII/CISH双敲除)的表面表达表型的流式细胞术柱状图。

图50C显示在hiPSC分化后第25天、第32天和第39天，与亲代克隆iNK细胞(“未编辑的iNK细胞”)相比编辑的iNK细胞(TGFβRII/CISH双敲除)的表面表达表型(作为群体百分比测量)(来自至少5个单独的分化的平均值)。

图50D显示在IL-15诱导的激活后10分钟和120分钟，与亲代克隆CD56+iNK细胞(“未编辑的iNK”)相比，编辑的CD56+iNK细胞(“CISH KO iNK”)的pSTAT3表达表型(作为群体百分比测量)。简要地，在处于细胞因子饥饿条件中的前一天，将第39天或第40天的iNK铺板。第二天，用10ng/ml的IL15刺激细胞所指明的时间长度。在时间点结束时立即固定细胞，对CD56染色，然后胞内染色。在NovoCyte Quanteon上处理细胞，并在FlowJo中分析数据。所示数据是所实施的>3次实验的代表性实验。

图50E显示在IL-15和TGF-β诱导的激活后10分钟和120分钟，与亲代克隆CD56+iNK细胞(“未编辑的iNK细胞”)相比，编辑的CD56+iNK细胞(TGFβRII/CISH双敲除,“DKO iNK”)的pSMAD2/3表达表型(作为群体百分比测量)。简要地，在处于细胞因子饥饿条件中的前一天，将第39天或第40天的iNK铺板。第二天，用10ng/ml的IL-15和50ng/ml的TGF-β刺激细胞所指明的时间长度。在时间点结束时立即固定细胞，对CD56染色，然后胞内染色。在NovoCyte Quanteon上处理细胞，并在FlowJo中分析数据。所示数据是所实施的>3次实验的代表性实验。

图50F显示了在使用或不使用佛波醇豆蔻酸酯乙酸酯(PMA)和离子霉素(IMN)刺激的情况下，与亲代克隆CD56+iNK细胞(未编辑的iNK，"WT IFNg")相比，编辑的CD56+iNK细胞(TGFβRII/CISH双敲除，"DKO IFNg")的IFN-γ表达表型(作为群体百分比测量)。数据是代表性的。它是从单次分化所产生的，并且测定中的每个条件以2个技术重复进行。**p<0.05vs未编辑的iNK细胞(配对t检验)。

图50G显示了在使用或不使用佛波醇豆蔻酸酯乙酸酯(PMA)和离子霉素(IMN)刺激的情况下，与亲代克隆CD56+iNK细胞(未编辑的iNK细胞，“WT TNFa”)相比，编辑的CD56+iNK细胞(TGFβRII/CISH双敲除，“DKO TNF a”)的TNF-α表达表型(作为群体百分比测量)。数据是代表性的。它是从单次分化所产生的，并且测定中的每个条件以2个技术重复进行。**p<0.05vs未编辑的iNK细胞(配对t检验)。

图51A是示例性实体瘤细胞杀伤测定的示意图，其显示了在存在或不存在IL-15和TGF-β的情况下，使用编辑的iNK细胞(TGFβRII/CISH双敲除)杀伤SK-OV-3卵巢细胞。

图51B显示了如图51A所述的实体瘤杀伤测定的结果。iNK细胞起作用以减小肿瘤细胞球形体尺寸。某些编辑的iNK细胞(CISH单敲除，“CISH_2、4、5和8”)并未显著不同于亲代克隆iNK细胞(“WT_2”)，而当在存在TGF-β的情况下测量时，与亲代克隆iNK细胞(“WT_2”)相比，某些编辑的iNK细胞(TGFβRII单敲除，“TGFβRII_7”和TGFβRII/CISH双敲除“DKO”)在效应因子-靶标(E:T)比为1或以上时的表现显著更好。****p<0.0001vs未编辑的iNK细胞(双向方差分析，Sidak多重比较检验)。

图51C显示了与未编辑的iNK细胞相比，编辑的iNK细胞的效应功能。

图52显示了体外连续杀伤测定的结果，其中在存在10ng/ml IL-15和10ng/mlTGF-β的情况下，用血液学癌细胞(例如，Nalm6细胞)对iNK细胞连续攻毒；X轴表示时间，其中每48小时添加肿瘤细胞，而Y轴表示如通过归一化的总红色对象面积(例如，肿瘤细胞的存在)所测量的杀伤效力。数据显示编辑的iNK细胞(TGFβRII/CISH双敲除)持续杀伤血液学癌细胞，而未编辑的iNK细胞在相同时间点失去了这种功能。

图53显示了当在存在1ng/mL或10ng/mL IL-15的情况下培养时，在hiPSC分化后的第25天、第32天和第39天，与亲代克隆iNK细胞(“WT”)相比，某些编辑的iNK克隆细胞(CISH单敲除“CISH_C2、C4、C5和C8”、TGFβRII单敲除“TGFβRII-C7”和TGFβRII/CISH双敲除“DKO-C1”)的表面表达表型(作为群体百分比测量)。

图54A是体内肿瘤杀伤测定的示意图。对小鼠腹膜内接种1×10⁶个SKOV3-luc细胞，小鼠随机分组，并且4天后，腹膜内引入20×10⁶个iNK细胞。追踪小鼠长达肿瘤植入后60天。X轴表示从植入起的时间，而Y轴表示如通过总生物发光(p/s)所测量的杀伤效力。

图54B显示了如图54A所述的体内体瘤杀伤测定结果。通过每条水平线表示单个小鼠。数据显示未编辑的iNK细胞(“未编辑的iNK”)和DKO编辑的iNK细胞(TGFβRII/CISH双敲除)两者均能比媒介物更好地防止肿瘤生长，而编辑的iNK细胞对肿瘤细胞的体内杀伤显著优于媒介物。每个实验组分别具有9只动物。***p<0.001，****p<0.0001，通过双向ANOVA分析。

图54C显示了图54B中所描述的体内肿瘤杀伤测定的平均结果及平均值的标准误差。通过每条水平线表示小鼠群体。数据显示DKO编辑的iNK细胞(TGFβRII/CISH双敲除)比媒介物或未编辑的iNK细胞显著更好地体内防止肿瘤生长和杀死肿瘤细胞。***p<0.001，****p<0.0001，通过双向ANOVA分析。

图55A显示在hiPSC分化后第25天、第32天和第39天或者第28天、第36天和第39天，与亲代克隆iNK细胞(“PCS_WT”)相比，整体编辑的iNK细胞(左图版-ADORA2A单敲除)或者某些编辑的iNK克隆细胞(右图版-ADORA2A单敲除)的表面表达表型(作为群体百分比测量)。来自多个分化的代表性数据。

图55B显示了与亲代克隆iNK细胞(“未编辑的iNK”)相比，对于编辑的iNK克隆细胞(ADORA2A单敲除)，在5'-(N-乙基甲酰氨基)腺苷(“NECA”，腺苷激动剂)激活后的环AMP(cAMP)浓度表型。Y轴表示平均cAMP浓度，单位nM(代表ADORA2A激活)，而X轴表示NECA浓度，单位nM。

图55C显示了体外连续杀伤测定的结果，其中在存在100μM NECA和10ng/ml IL-15的情况下，用血液学癌细胞(例如，Nalm6细胞)对iNK细胞连续攻毒；X轴表示时间，其中每48小时添加肿瘤细胞，而Y轴表示如通过总红色对象面积(例如，肿瘤细胞的存在)所测量的杀伤效力。数据显示在模拟腺苷抑制的条件下，编辑的iNK细胞(“ADORA2A KO iNK”)比未编辑的iNK细胞(“Ctrl iNK”)更有效地杀伤血液学癌细胞。

图56A显示在hiPSC分化后的第25天、第32天和第39天，与亲代克隆iNK细胞(“WT_2”)相比，某些编辑的iNK克隆细胞(TGFβRII/CISH/ADORA2A三敲除，“CRA_6”和“CR+A_8”)的表面表达表型(作为群体百分比测量)。数据表示多个分化。

图56B显示了与亲代克隆iNK细胞(“未编辑的iNK”)相比，对于编辑的iNK克隆细胞(TGFβRII/CISH/ADORA2A三敲除，“TKO iNK”)，在NECA(腺苷激动剂)激活后的环AMP(cAMP)浓度表型。Y轴表示平均cAMP浓度，单位nM(代表ADORA2A激活)，而X轴表示NECA浓度，单位nM。

图56C显示了在无IL-15的情况下，如图51A所述的实体瘤杀伤测定的结果。iNK细胞起作用以减小肿瘤细胞球形体尺寸。Y轴测量总积分红色对象(例如，肿瘤细胞的存在)，而X轴表示效应细胞比靶细胞(E：T)比。当在存在TGF-β的情况下测量时，与亲代克隆iNK细胞(“对照”)相比，编辑的iNK细胞(ADORA2A单敲除“ADORA2A”、TGFβRII/CISH双敲除“DKO”或者TGFβRII/CISH/ADORA2A三敲除“TKO”)具有更低的EC50率(来自至少3个单独的分化的平均值)。

图57显示了在iPSC中使用体外编辑，对于基因座TGFβRII、CISH、ADORA2A、TIGIT和NKG2A的向导RNA选择测定的结果。

图58A显示了以5E4 MOI通过包含靶向GAPDH处敲入的CD19 CAR货物的AAV6，但是不添加RNP时所转导的T细胞群体的示例性流式细胞图。

图58B显示了以5E4 MOI通过包含靶向GAPDH处敲入的CD19 CAR货物的AAV6转导并用1μM包含Cas12a(SEQ ID：62)和RSQ22337的RNP转化的T细胞群体的示例性流式细胞图。

图58C显示了如图58A和图58B所述，通过AAV6转导的T细胞群体的示例性扩增和存活力数据。

图58D显示了已用靶向TRAC基因座的RNP转化的T细胞群体的示例性流式细胞图。

图58E显示了以5E4 MOI通过包含靶向GAPDH处敲入的CD19 CAR货物的AAV6转导并用4μM包含Cas12a(SEQ ID：62)和RSQ22337的RNP和靶向TRAC基因座的RNP转化的T细胞群体的示例性流式细胞图。

图58F显示了柱状图，该柱状图显示了来源于对用靶向TRAC的RNP、靶向GAPDH的RNP转化和/或用包含靶向GAPDH处敲入的CD19 CAR货物的AAV6转导的T细胞群体所实施的示例性流式细胞术实验的基因型数据。当用靶向GAPDH的RNP转化并用包含靶向GAPDH的CD19 CAR货物的AAV6转导细胞时，观察到具有CD19 CAR KI的T细胞的比率大于90％。当用靶向TRAC的RNP、靶向GAPDH的RNP转化并用包含靶向GAPDH的CD19 CAR货物的AAV6转导细胞时，观察到具有TRAC KO和CD19CAR KI的T细胞的比率大于80％。

图58G显示了以5E4 MOI通过包含靶向GAPDH处敲入的CD19 CAR货物的AAV6转导并用4μM包含Cas12a(SEQ ID：62)及RSQ22337的RNP、靶向TRAC的RNP和靶向TGFBR2的RNP转化的T细胞群体的示例性流式细胞图。

图58H显示了柱状图，该柱状图显示了来源于对用靶向GAPDH的RNP(包含Cas12a(SEQ ID NO：62)和RSQ22337)转化并用包含靶向GAPDH处敲入的GFP货物、靶向GAPDH处敲入的CD19 CAR货物或靶向GAPDH处敲入的HLA-E alloshield货物的AAV6转导的T细胞群体所实施的示例性流式细胞术实验的基因型数据。对于每个编辑的T细胞群体，观察到GAPDH基因座处转基因整合效率大于80％。

图58I显示了体外肿瘤细胞杀伤测定的结果，其中用血液学癌细胞(例如，Raji细胞)对在GAPDH基因处包含CD19 CAR敲入的T细胞攻毒。当与仅包含癌细胞的对照样品相比时或者当与用Raji细胞攻毒的在GAPDH基因处包含GFP敲入的T细胞相比时，在测试样品中观察到显著的Raji细胞溶胞。N＝4，1个生物学重复，4个技术重复，显示了平均值和平均值的标准误差，使用单因素方差分析的统计分析提供了<0.0001的P值。

图58J显示了体外肿瘤细胞杀伤测定的结果，其中用血液学癌细胞(例如，Raji细胞)对在GAPDH基因处包含CD19 CAR敲入以及TRAC和/或TGFBR2敲除的T细胞攻毒。在以E：T为2共培养24小时后，如通过LDH释放所评价的，与在GAPDH基因处包含GFP敲入的T细胞或者未编辑的T细胞相比，通过包含CD19 CAR敲入的T细胞观察到了显著的细胞毒性。提供了通过Raji细胞所释放的平均自发LDH(水平短划线)和通过裂解缓冲液处理所释放的平均LDH(水平实线)进行比较。每个实心圆表示来自一个生物样品的4个技术重复的数据。X轴表示T细胞组，而Y轴作为相对荧光单元(RFU)定量LDH释放，如使用560nm的激发波长和590nm的发射波长通过酶标仪所检测的。黑线表示平均值。不显著(n.s.)、***p<0.001、****p<0.0001(非配对t检验)。

图59显示了如本文所描述的修饰的T细胞中的HLA-E表面表达。左图版显示了与空转导的对照细胞(无AAV6转导)相比，以5E4 MOI用包含靶向GAPDH处敲入的B2M-HLA-E货物的AAV6转导并用1μM包含Cas12a(SEQ ID：62)及RSQ22337的RNP转化的T细胞中的HLA-E表面表达。右图版显示了在GAPDH包含B2M-HLA-E货物敲入的T细胞的扩增数据和空转导的对照T细胞的扩增数据。用PE抗-人HLA-E抗体克隆：3D12(1:100稀释)对细胞染色。

图60A是如本文所描述的，使用一步或连续方法修饰的T细胞的比较，其中将靶向不同基因座的RNP的组合在一起(一步)或连续施用于T细胞。左图版显示了来自对于使用靶向TRAC、B2M和GAPDH的RNP(每类RNP 0.5μM)转化结合以5E4 MOI使用包含靶向GAPDH处敲入的GFP货物的AAV6的转导，经历一步电穿孔的T细胞的示例性流式细胞术数据。右图版显示了来自经历了一系列电穿孔的T细胞的示例性流式细胞术数据，所述电穿孔用于其中将靶向GAPDH的RNP(5μM)施用于细胞的转化，以及以5E4 MOI使用包含靶向GAPDH处敲入的GFP货物的AAV6的转导，并在4天后，以0.5μM每种RNP使用靶向TRAC的RNP和靶向B2M的RNP转化。流式细胞术数据测定了具有至少TRAC敲除的细胞数目、具有至少B2M敲除的细胞数目和具有TRAC和B2M敲除两者并且还显示出GFP表达的细胞数目。这些结果表明当与连续KI和KO法相比时，一步KO/KI具有相当的效率。

图60B显示了如本文所描述的，在使用一步法修饰的T细胞中发现的编辑事件总数，所述方法包括用靶向TRAC、B2M、CIITA、TGFBR2和GAPDH的RNP(包括Cas12a(SEQ ID NO：62)和RSQ22337)转化T细胞群体，并用包含靶向GAPDH基因处敲入的GFP货物的AAV6转导细胞。以大于80％的单个比率发生每个编辑事件(KO或货物KI)。

图61A显示了以5E4 MOI通过包含靶向GAPDH处敲入的GFP货物的AAV6，但是不添加RNP时所转导的NK细胞群体的示例性流式细胞图。

图61B显示了以5E4 MOI通过包含靶向GAPDH处敲入的GFP货物的AAV6转导并用4μM包含Cas12a(SEQ ID：62)和RSQ22337的RNP转化的NK细胞群体的示例性流式细胞图。

图61C显示了以5E4 MOI通过包含靶向GAPDH处敲入的CD19 CAR货物的AAV6，但是不添加RNP时所转导的NK细胞群体的示例性流式细胞图。

图61D显示了以5E4 MOI通过包含靶向GAPDH处敲入的CD19 CAR货物的AAV6转导并用4μM包含Cas12a(SEQ ID：62)和RSQ22337的RNP转化的NK细胞群体的示例性流式细胞图。

图61E显示了柱状图，该柱状图显示了来源于对用靶向GAPDH的RNP(包含Cas12a(SEQ ID NO：62)和RSQ22337)转化并以5E4 MOI用包含靶向GAPDH处敲入的GFP货物或者靶向GAPDH处敲入的CD19 CAR货物的AAV6转导的NK细胞群体所实施的示例性流式细胞术实验的基因型数据。在每个编辑的NK细胞群体中，观察到GAPDH基因座处转基因整合效率大于80％。

图61F显示了体外肿瘤细胞杀伤测定的结果，其中用血液学癌细胞(例如，Raji细胞)对在GAPDH基因处包含CD19 CAR敲入的NK细胞攻毒。当与对照NK细胞(未编辑的)相比时，在包含CD19 CAR KI的编辑的NK细胞中观察到了显著更大的Raji细胞溶胞。N＝3，1个生物学重复，3个技术重复，显示了平均值和平均值的标准误差，使用单因素方差分析的统计分析提供了<0.05的P值。

图61G显示了体外肿瘤杀伤测定的结果，其中用血液学癌细胞(Nalm6细胞)对在GAPDH基因处包含CD19 CAR敲入(KI)或者GFP敲入(KI)的NK细胞攻毒。如在以E:T为1共培养2小时后，通过BATDA释放所评价的，通过包含CD19 CAR敲入的NK细胞，观察到比包含GFP敲入的NK细胞显著更大的细胞毒性。提供了通过Nalm6细胞所释放的平均自发BATDA(水平短划线)和通过裂解缓冲液处理所释放的平均BATDA(水平实线)进行比较。每个实心圆表示来自一个生物样品的8个技术重复的数据。X轴表示NK细胞组，而Y轴如通过时间分辨荧光计所检测的，作为相对荧光单元(RFU)定量BATDA释放。黑色水平线表示平均值。****p<0.0001(非配对t检验)。

图62A显示了mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞和未编辑的(WT)iNK细胞的体外持久性测定的结果。X轴表示从除去外源细胞因子支持起的天数，而Y轴表示活细胞的总数。

图62B显示了mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞和CD16/mbIL-15DKI(DKI)iNK细胞的体外持久性测定的平均结果。X轴表示从除去外源细胞因子支持起的天数，而Y轴表示活细胞的总数。

图63A显示了体外肿瘤细胞杀伤测定的平均结果，其中以多种E：T比(例如，1:1、5:1、10:1)将使用或不使用10μg/ml西妥昔单抗(CTX)的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞添加至Detroit-562(咽癌)细胞。X轴表示从初始接种Detroit-562细胞起的时间，单位小时：分钟：秒，而Y轴表示如通过电阻抗所测量的溶胞百分比。N＝3，误差线表示标准偏差。

图63B显示了体外肿瘤细胞杀伤测定的平均结果，其中以多种E：T比(例如，1:1、5:1、10:1)将使用或不使用10μg/ml西妥昔单抗(CTX)的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞添加至FaDu(咽癌)细胞。X轴表示从初始接种FaDu细胞起的时间，单位小时：分钟：秒，而Y轴表示如通过电阻抗所测量的溶胞百分比。N＝3，误差线表示标准偏差。

图63C显示了体外肿瘤细胞杀伤测定的平均结果，其中以多种E：T比(例如，1:1、5:1、10:1)将使用或不使用10μg/ml西妥昔单抗(CTX)的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞添加至HT29(结肠直肠腺癌)细胞。X轴表示从初始接种HT29细胞起的时间，单位小时：分钟：秒，而Y轴表示如通过电阻抗所测量的溶胞百分比。N＝3，误差线表示标准偏差。

图63D显示了体外肿瘤细胞杀伤测定的平均结果，其中以多种E：T比(例如，1:1、5:1、10:1)将使用或不使用10μg/ml西妥昔单抗(CTX)的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞添加至HCT116(结肠直肠癌)细胞。X轴表示从初始接种HCT116细胞起的时间，单位小时：分钟：秒，而Y轴表示如通过电阻抗所测量的溶胞百分比。N＝3，误差线表示标准偏差。

图64A显示了体外肿瘤细胞杀伤测定的平均结果，其中以E：T比10:1将mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞或未编辑的(WT)iNK细胞添加至HT29(结肠直肠腺癌)细胞。X轴表示从初始接种HT29细胞起的时间，单位小时：分钟：秒，而Y轴表示如通过电阻抗所测量的溶胞百分比。N＝3，误差线表示标准偏差。

图64B显示了mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞和未编辑的(WT)iNK细胞的体外持久性测定的结果。将DKI/DKO或WT iNK细胞与HT-29细胞以10:1的E：T比共培养4天。X轴表示评价类别(例如，所有细胞中活NK细胞的百分比，CD16+活NK细胞的百分比)，而Y轴表示如通过流式细胞术所测量的百分比。黑色水平线表示平均值。

图64C显示了来自mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞和未编辑的(WT)iNK细胞的体外持久性测定之前和之后的示例性流式细胞术数据。将DKI/DKO或WT iNK细胞与HT-29细胞以1:1的E：T比共培养4天。

图65A显示了来自未编辑的(WT)iNK细胞或者mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞的示例性流式细胞术数据。数据突出显示了包含编码货物序列的CD16和IL-15Rα蛋白的敲入盒的整合效率和表达。X轴表示所选基因是CD16还是IL-15Rα，而Y轴定量了来自所指明的表达所选基因的群体的细胞的百分比。水平线表示组平均值。N＝1，****p<0.0001(双向方差分析)。

图65B显示了如图20所示，所实施的3D肿瘤球形体杀伤测定的结果。以不同的E：T比，对SK-OV-3肿瘤细胞使用未编辑的(WT)iNK细胞或mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞。将DKI/DKO或WT iNK细胞与肿瘤球形体共培养并每2小时成像以测量红色目标强度(代表肿瘤细胞丰度)多至4天。在添加iNK细胞时，将数据对红色目标强度进行归一化。在右图版中的表中提供了基于左图版的IC50值，并且所述IC50值突出显示了DKI/DKO iNK细胞在杀伤肿瘤细胞中更大的效力。X轴表示从将iNK细胞添加至肿瘤球形体起的时间，单位小时，而Y轴表示如通过红色目标强度所测量的归一化的球形体尺寸。N＝1，2个技术重复/细胞系。

图65C显示了如图20所示，所实施的3D肿瘤球形体杀伤测定的结果。以不同的E：T比并且在存在10μg/ml曲妥珠单抗或IgG(对照)的情况下，对SK-OV-3肿瘤细胞使用未编辑的(WT)iNK细胞或者mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRIIDKO(DKI/DKO)iNK细胞。将DKI/DKO或WT iNK细胞与肿瘤球形体共培养并每2小时成像以测量红色目标强度(代表肿瘤细胞丰度)多至4天。DKI/DKO iNK细胞证实了比WT iNK细胞显著更大的抗体依赖性的细胞介导的细胞毒作用(ADCC)。X轴表示处理组，而Y轴表示计算的IC50(例如，杀伤100小时后，降低SK-OV-3球形体所需的E：T比)。数据表示11个独立实验。****p<0.0001(非配对t检验)。

图65D显示了在不存在细胞因子IL-2和IL-15的情况下，未编辑的(WT)iNK细胞和mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞的体外持久性测定的结果。X轴表示从除去外源细胞因子支持起的培养天数，而Y轴作为活细胞百分比表示存活力。N＝1，2个技术重复/细胞系，误差线表示标准偏差。

图65E显示了在用TGFβ(TGFb)处理后，未编辑的(WT)iNK细胞和mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞的体外SMAD2/3磷酸化测定的结果。将DKI/DKO iNK细胞或WT iNK细胞在细胞因子饥饿条件下铺板，并在第二天，将10ng/ml TGFβ加入至iNK细胞。在所指明的时间后立即固定细胞。X轴表示从添加TGFβ起的时间，单位分钟，而Y轴表示归一化的SMAD2/3磷酸化水平。数据表示一个独立实验。水平短划线表示用媒介物处理后的SMAD2/3磷酸化水平。

图65F显示了如图20所示，所实施的3D肿瘤球形体杀伤测定的结果。在存在10ng/ml TGFβ或IgG(对照)的情况下，以E：T比31.6，对SK-OV-3肿瘤细胞使用未编辑的(WT)iNK细胞或者mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞。将DKI/DKO或WT iNK细胞与肿瘤球形体共培养并每2小时成像以测量红色目标强度(代表肿瘤细胞丰度)多至100天。左图版中显示了DKI/DKO iNK细胞的结果，而右图版中显示了WT iNK细胞的结果。X轴表示从将iNK细胞添加至肿瘤球形体起的时间，单位小时，而Y轴表示如通过红色目标强度所测量的归一化的球形体尺寸。N＝1。

图65G显示了体外连续杀伤测定的结果，其中用Nalm6肿瘤细胞对未编辑的(WT)iNK细胞或者mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞攻毒。在第0天，在存在10ng/ml TGFβ的情况下，将10×10³个Nalm6肿瘤细胞和2×10⁵个iNK细胞一起铺板。以48小时的间隔，加入5×10³个Nalm6肿瘤细胞的丸剂以再次攻毒iNK细胞群体。X轴表示发生攻毒的次数，而Y轴表示如通过红色目标强度所测量的肿瘤负荷。N＝1，三个技术重复/细胞系，误差线表示标准偏差。

图66A是体内肿瘤杀伤测定的示意图。对小鼠静脉内(IV)接种0.125×10⁶(0.125e6)个SKOV3-luc细胞，并且进行19天以使得肿瘤成瘤，在第-2天，对小鼠成像以建立预处理肿瘤负荷并随机分至两组。2天后，在第0天，第一组小鼠静脉内接受20×10⁶(20e6)个mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞结合2.5mpk曲妥珠单抗(Tras)，且第二组小鼠仅腹膜内接受2.5mpk曲妥珠单抗(Tras)。每周使用体内成像系统(IVIS)对小鼠成像以评价随时间的肿瘤负荷。

图66B显示了图66A中所描述的体内肿瘤杀伤测定的肿瘤负荷(中值和四分位距)。通过每条水平线表示小鼠组。每个处理组具有4只小鼠。组包括接受mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞结合单剂量曲妥珠单抗(DKI/DKOiNK+Tras.)、单独的单剂量曲妥珠单抗(仅Tras.)或者同种型对照的小鼠。与剂量施用单独的曲妥珠单抗的小鼠相比，剂量施用DKI/DKO iNK细胞结合曲妥珠单抗的小鼠具有显著降低的肿瘤负荷。通过箭头表示第0天时曲妥珠单抗的剂量。垂直短划线表示iNK细胞的剂量。X轴表示从NK细胞引入起的时间，单位为天，而Y轴表示如使用体内成像系统(IVIS)通过生物发光成像(BLI)所测量的肿瘤负荷。

图66C显示了图66A中所描述的经受体内肿瘤杀伤测定的小鼠的代表性生物发光成像。沿图版顶部表示小鼠的处理组，而沿图版左侧表示从用iNK细胞结合曲妥珠单抗或者单独的曲妥珠单抗剂量施用起的时间。每个处理组具有4只小鼠。如图所示，右侧色标表示生物发光的辐射率(p/sec/cm²/sr)(从最低3.94×10⁴至最大7.02×10⁵)。

图67A是体内肿瘤杀伤测定的示意图。对小鼠腹膜内接种0.25×10⁶个SKOV3-luc细胞，并且在4天后使肿瘤成瘤，将小鼠随机分组。1天后，一些小鼠组腹膜内接受5×10⁶(5E6)个未编辑的(WT)或者mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRIIDKO(DKI/DKO)iNK细胞。在一些处理组中，小鼠在引入iNK细胞后0、7和14天(如箭头所指示)接受2.5mpk曲妥珠单抗剂量，总计接受3剂量曲妥珠单抗。每周使用体内成像系统(IVIS)对小鼠成像以评价随时间的肿瘤负荷。

图67B显示了图67A中所描述的体内肿瘤杀伤测定的肿瘤负荷(中值和四分位距)。通过每条水平线表示小鼠组。每个处理组具有5-6只小鼠。组包括接受未编辑的iNK细胞(WTiNK)、mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO iNK细胞(DKI/DKO iNK)或同种型对照的小鼠。X轴表示从NK细胞引入起的时间，而Y轴表示如使用体内成像系统(IVIS)通过生物发光成像(BLI)所测量的肿瘤负荷。

图67C显示了图67A中所描述的体内肿瘤杀伤测定的肿瘤负荷(中值和四分位距)。通过每条水平线表示小鼠组。每个处理组具有5-6只小鼠。组包括接受未编辑的(WT)iNK细胞结合曲妥珠单抗(WT+Tras.×3)、mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRIIDKO(DKI/DKO)iNK细胞结合曲妥珠单抗(DKI DKO+Tras.×3)、单独的曲妥珠单抗或者同种型对照的小鼠。与剂量施用WT iNK细胞结合曲妥珠单抗或者单独的曲妥珠单抗的小鼠相比，剂量施用DKI/DKO iNK细胞结合曲妥珠单抗的小鼠具有显著降低的肿瘤负荷。通过箭头表示在第0、7和14天曲妥珠单抗的剂量施用。X轴表示从NK细胞引入起的时间，而Y轴表示如使用体内成像系统(IVIS)通过生物发光成像(BLI)所测量的肿瘤负荷。****p<0.0001(单因素方差分析)。

图67D显示了图67A中所描述的经受体内肿瘤杀伤测定的小鼠的存活。通过每条水平线表示小鼠组。X轴表示从NK细胞引入起的时间，而Y轴表示小鼠的存活百分比。*p<0.05，**p<0.01(对数秩Mantel-Cox检验)。

图67E显示了图67A中所描述的经受体内肿瘤杀伤测定的小鼠的代表性生物发光成像。沿图版顶部表示小鼠的处理组，而沿图版左侧表示自NK细胞引入起的时间。每个处理组具有5-6只小鼠。图片下方的表显示了在引入NK细胞后第31天处理组中完全肿瘤清除小鼠数目/总小鼠数目(来自图版上方)。

发明详述

定义和缩写

除非另作说明，否则以下术语中的每一个具有在本节中所述的含义。

不定冠词“一个”(“a”和“an”)是指至少一个相关名词，并且与术语“至少一个”和“一个或多个”是可互换使用的。连词“或”和“和/或”作为非排他析取词是可互换使用的。

如本文所使用的，术语“癌症”(还与术语“赘生”可互换使用)是指具有自主生长能力的细胞，即以快速增殖细胞生长为特征的异常状态或病况。癌性疾病状态可以被分类为病理性，即表征或构成疾病状态，例如，恶性肿瘤生长，或者可以被分类为非病理性，即偏离正常但与疾病状态无关，例如，与伤口修复相关的细胞增殖。

如本文所使用的术语“CRISPR/Cas核酸酶”表示具有DNA核酸酶活性的任何CRISPR/Cas蛋白质，例如，在存在向导分子的情况下，对DNA靶标位点，例如，细胞中基因组序列内的DNA靶标位点显示出特异性结合(或者“靶向”)的Cas9或Cas12蛋白质。本文所公开的策略、系统和方法可以使用本文所公开的或者本领域那些技术人员已知的CRISPR/Cas核酸酶的任意组合。本领域那些技术人员将知道适用于本发明公开的背景的其它CRISPR/Cas核酸酶和变体，并且将理解本发明公开不限于该方面。

如本文所使用的术语“分化”是非特化(“非专能”)或较少特化的细胞获取特化细胞，如(例如)血细胞的特征的过程。在一些实施方式中，分化的细胞或分化诱导的细胞是细胞谱系内占据更特化(“专能”)位置的细胞。例如，在用细胞培养基中的适合的分化因子处理后，可以将iPS细胞(iPSC)分化为多种更高分化的细胞类型，例如，造血干细胞、淋巴细胞和其它细胞类型。用于将多潜能和多能细胞类型分化为更高分化的细胞类型的适合的方法、分化因子和细胞培养基是本领域技术人员熟知的。在一些实施方式中，应用于分化过程时，术语“专能”是指通过分化路径行进到如下的点的细胞，其中在正常情况下，它将继续分化为特定的细胞类型或细胞类型的亚型，并且在正常情况下，不可以分化为不同细胞类型(除特定的细胞类型或细胞类型的亚型以外)，也不可以恢复到较低分化的细胞类型。

如本文所使用的，术语“分化标志物”、“分化标志物基因”或“分化基因”是指其表达指示细胞，如多潜能细胞内发生的细胞分化的基因或蛋白质。在一些实施方式中，分化标志物基因包括(但不限于)以下基因：CD34、CD4、CD8、CD3、CD56(NCAM)、CD49、CD45、NK细胞受体(分化簇16(CD16))、自然杀伤组-2成员D(NKG2D)、CD69、NKp30、NKp44、NKp46、CD158b、FOXA2、FGF5、SOX17、XIST、NODAL、COL3A1、OTX2、DUSP6、EOMES、NR2F2、NR0B1、CXCR4、CYP2B6、GAT A3、GATA4、ERBB4、GATA6、HOXC6、INHA、SMAD6、RORA、NIPBL、TNFSF11、CDH11、ZIC4、GAL、SOX3、PITX2、APOA2、CXCL5、CER1、FOXQ1、MLL5、DPP10、GSC、PCDH10、CTCFL、PCDH20、TSHZ1、MEGF10、MYC、DKK1、BMP2、LEFTY2、HES1、CDX2、GNAS、EGR1、COL3A1、TCF4、HEPH、KDR、TOX、FOXA1、LCK、PCDH7、CD1D FOXG1、LEFTY1、TUJ1、T基因(Brachyury)、ZIC1、GATA1、GATA2、HDAC4、HDAC5、HDAC7、HDAC9、NOTCH1、NOTCH2、NOTCH4、PAX5、RBPJ、RUNX1、STAT1和STAT3。

如本文所使用的术语“分化标志物基因谱”或“分化基因谱”、“分化基因表达谱”、“分化基因表达签名”、“分化基因表达组”、“分化基因组”或“分化基因签名”是指多种分化标志物基因的表达或表达水平。

如本文所使用的术语“核酸酶”是指催化磷酸二酯键裂解的任何蛋白。在一些实施方式中，核酸酶是DNA核酸酶。在一些实施方式中，当它切割细胞中的双链DNA，例如，基因组DNA时，核酸酶是导致单链断裂的“切口酶”。在一些实施方式中，当它切割细胞中的双链DNA，例如，基因组DNA时，核酸酶导致双链断裂。在一些实施方式中，核酸酶结合与所产生的断裂位置重叠或邻近的双链DNA内的特定靶标位点。在一些实施方式中，核酸酶导致产生了含有在3'和5'取向两者上从0(钝端)至22个核苷酸的范围内的悬突的双链断裂。如本文所讨论的，CRISPR/Cas核酸酶、锌指核酸酶(ZFN)、转录激活因子样效应因子核酸酶(TALEN)和大范围核酸酶是可以根据本发明公开所述的策略、系统和方法使用的示例性核酸酶。

如本文所使用的，术语“编辑的iNK细胞”是指已被修饰以在细胞发育的某个时间点改变至少一种基因的至少一种表达产物的iNK细胞。在一些实施方式中，可以使用(例如)基因编辑技术，如CRISPR-Cas或(例如)显性负性构建体来引入修饰。在一些实施方式中，在iNK细胞分化成iNK细胞之前的时间点编辑iNK细胞，例如，在前体阶段、在干细胞阶段等。在一些实施方式中，将编辑的iNK细胞与未编辑的iNK细胞(通过分化iPSC细胞产生的NK细胞，该iPSC细胞和/或iNK细胞不具有修饰，例如，基因修饰)进行比较。

如本文所使用的，术语“胚胎干细胞”是指来源于胚胎囊胚的内细胞团的多潜能干细胞。在一些实施方式中，胚胎干细胞是多潜能的，并在发育过程中产生三个主要胚层：外胚层、内胚层和中胚层的所有衍生物。在一些这些实施方式中，胚胎干细胞不会促进胚外膜或胎盘，即不是全能的。

如本文所使用的，在核酸的背景下术语“内源的”是指在(例如)细胞的基因组内其天然位置处的天然核酸(例如，基因、蛋白质编码序列)。

如本文相对于细胞所使用的术语“必需基因”是指编码细胞存活和/或增殖所需的至少一种基因产物的基因。必需基因可以是对于所有细胞类型的存活所必需的管家基因或者在特定培养条件下在特定细胞类型中对于存活和/或增殖必需表达的基因，例如，对于iPS或ES细胞的正确分化或者iPS-或ES-来源的细胞的扩增必需表达的基因。在一些实施方式中，必需基因的功能缺失导致细胞存活显著降低，例如，当与细胞类型相同，但无相同必需基因功能缺失的细胞相比时，以必需基因功能缺失为特征的细胞存活。在一些实施方式中，必需基因的功能缺失导致受影响的细胞死亡。在一些实施方式中，必需基因的功能缺失导致细胞增殖显著降低，例如，细胞分裂能力中的显著降低，其可以在细胞需要完成细胞周期的显著时间段中表现，或者在一些优选的实施方式中，在细胞完成细胞周期并因此增殖的能力完全丧失中表现。

在核酸的背景中，如本文所使用的术语“外源的”是指使用(例如)基因编辑或基因工程技术，例如，HDR基整合技术，人工引入人造构建体(例如，敲入盒或供体模板)或引入细胞基因组的核酸(无论是天然的还是非天然的)。

术语“基因组编辑系统”是指具有RNA导向的DNA编辑活性的任何系统。

当用于表示CRISPR/Cas系统时，术语“向导分子”或者“向导RNA”或者“gRNA”是促进CRISPR/Cas核酸酶，例如，Cas9或Cas12蛋白与DNA靶标位点，如细胞中基因组序列内的DNA靶标位点特异性结合(或“靶向”)的任何核酸。尽管向导分子通常是RNA分子，但是在本领域中熟知包括DNA/RNA杂交分子的化学修饰的RNA分子可以用作向导分子。

如本文所使用的，术语“造血干细胞”或者“确定的造血干细胞”是指CD34-阳性(CD34+)干细胞。在一些实施方式中，CD34-阳性干细胞能够产生成熟骨髓和/或淋巴样细胞类型。在一些实施方式中，骨髓和/或淋巴样细胞类型包括(例如)T细胞、自然杀伤(NK)细胞和/或B细胞。

如本文所使用的术语“诱导性多能干细胞”、“iPS细胞”或“iPSC”是指通过被称为重编程的方法(例如，去分化)得自分化的体细胞(例如，成人、新生儿或胎儿)的干细胞。在一些实施方式中，重编程细胞能够分化为具有全部三个胚层或外胚层：中胚层、内胚层和外胚层的组织。自然界中不存在iPSC。

如本文所使用的术语“iPS-来源的NK细胞”或“iNK细胞”是指已通过分化iPS细胞产生的自然杀伤细胞，所述iPS细胞可以或可以不具有基因修饰。

如本文所使用的术语“iPS-来源的T细胞”或“iT细胞”是指已通过分化iPS细胞产生的T细胞，所述iPS细胞可以或可以不具有基因修饰。

如本文所使用的，术语“多能干细胞”是指具有分化为具有一个或多个胚层(外胚层、中胚层和内胚层)，但非全部三个胚层的细胞的发育潜力的细胞。因此，在一些实施方式中，多能细胞还可以被称为“部分分化细胞”。多能细胞在本领域中是熟知的，并且多能细胞的实例包括成熟干细胞，如(例如)造血干细胞和神经干细胞。在一些实施方式中，“多能”表示细胞可以形成多种类型的给定谱系的细胞，而非其它谱系的细胞。例如，多能造血细胞可以形成多种不同类型的血细胞(红细胞、白细胞、血小板等)，但不能形成神经元。因此，在一些实施方式中，“多能性”是指发育潜力程度低于全能和多潜能的细胞状态。

如本文所使用的，术语“多潜能”是指细胞形成所有体或体细胞(即胚体)或给定生物(例如，人)的谱系的能力。例如，胚胎干细胞是一类多潜能干细胞，其能够从三个胚层，即外胚层、中胚层和内胚层中的每个形成细胞。通常，可以将多潜能性描述为范围在不能够产生完整生物体的不完全或部分多潜能细胞(例如，上胚层干细胞或EpiSC)到能够产生完整生物体的更原始、更多潜能的细胞(例如，胚胎干细胞或诱导性多能干细胞)的发育潜能的连续体。

如本文所使用的，术语“多潜能性”是指具有分化为具有全部三个胚层(外胚层、中胚层和内胚层)的发育潜力的细胞。在一些实施方式中，可以部分通过评价细胞的多潜能性特征来确定多潜能性。在一些实施方式中，多潜能性特征包括(但不限于)：(i)多潜能干细胞形态；(ii)无限自我更新的潜力；(iii)多潜能干细胞标志物的表达，所述标志物包括(但不限于)SSEA1(仅小鼠)、SSEA3/4、SSEA5、TRA1-60/81、TRAl-85、TRA2-54、GCTM-2、TG343、TG30、CD9、CD29、CD133/凸素(prominin)、CD140a、CD56、CD73、CD90、CD105、OCT4(也称为POU5F1)、NANOG、SOX2、CD30和/或CD50；(iv)分化为全部3种体细胞谱系(外胚层、中胚层和内胚层)的能力；(v)由3种体细胞谱系组成的畸胎瘤形成；和(vi)由来自3种体细胞谱系的细胞组成的拟胚体的形成。

如本文所使用的，术语“多潜能干细胞形态”是指胚胎干细胞的经典形态学特征。在一些实施方式中，正常胚胎干细胞形态的特征在于小且圆形的形状，其具有高核质比、明显存在的核仁以及典型的细胞内间隙。

当在本文中对于敲入盒使用时，术语“多顺反子(polycistronic)”或者“多顺反子(multicistronic)”是指敲入盒可以从相同mRNA转录本表达两种或更多种蛋白质的事实。类似地，“双顺反子”敲入盒是可以从相同mRNA转录本表达两种蛋白质的敲入盒。

如本文所使用的术语“多核苷酸”(包括(但不限于)“核苷酸序列”、“核酸”、“核酸分子”、“核酸序列”和“寡核苷酸”)是指一系列核苷酸碱基(也称为“核苷酸”)并且表示两个或更多个核苷酸的任何链。在一些实施方式中，多核苷酸、核苷酸序列、核酸等可以是其嵌合混合物或其衍生物或修饰形式，它们是单链或双链的。在一些这些实施方式中，修饰可以在碱基部分、糖部分或磷酸骨架处发生，例如，以改善分子的稳定性、其杂交参数等。通常，核苷酸序列通常携带遗传信息，包括(但不限于)细胞机器用于制造蛋白质和酶的信息。在一些实施方式中，核苷酸序列和/或遗传信息包含双链或单链基因组DNA、RNA、任何合成和遗传操纵的多核苷酸，和/或正义和/或反义多核苷酸。在一些实施方式中，核酸含有修饰的碱基。

如下表1所示，在本文所提供的核苷酸序列中使用常规IUPAC表示法(还参见Cornish-Bowden,Nucleic Acids Res.1985；13(9):3021-30，作为参考并入本文)。然而，应注意在序列可能由DNA或RNA编码的那些情况下，例如，在某些CRISPR/Cas向导分子靶向结构域中，“T”表示“胸腺嘧啶或尿嘧啶”。

表1：IUPAC核酸表示法

符号	碱基
		A	腺嘌呤
T	胸腺嘧啶或尿嘧啶
		G	鸟嘌呤
C	胞嘧啶
		U	尿嘧啶
K	G或T/U
		M	A或C
R	A或G
		Y	C或T/U
S	C或G
		W	A或T/U
B	C、G或T/U
		V	A、C或G
H	A、C或T/U
		D	A、G或T/U
N	A、C、G或T/U

具体地，例如，在细胞发育潜力的背景中，如本文所使用的术语“潜能”或“发育潜能”是指细胞可获得的所有发育选择的总和(即发育潜能)。在一些实施方式中，细胞潜能的连续体包括(但不限于)全能细胞、多潜能细胞、多能细胞、寡能细胞、单能细胞和末端分化细胞。

如本文对于疾病所使用的术语“预防(prevent、preventing和prevention)是指哺乳动物，例如人中疾病的预防，其包括(a)避免或排除疾病；(b)影响对疾病的易患性；或者(c)预防或延迟疾病至少一种症状的发病。

如本文所使用的术语“蛋白质”、“肽”和“多肽”是可互换使用的以表示通过肽键连接在一起的氨基酸的连续链。这些术语包括单个蛋白质、结合在一起的蛋白质的组或复合物，以及这些蛋白质的片段或部分、变体、衍生物和类似物。除非另作说明，否则在本文中使用常规表示法来表示肽序列，在左侧以氨基或N末端开始，并且前进至右侧的羧基或C末端。可以使用标准单字母或三字母缩写。

如本文所使用的术语“所关心的基因产物”可以是指包括任何多核苷酸的基因所编码的任何产物或多肽。在一些实施方式中，基因产物是非通过本发明公开的靶细胞所天然表达的蛋白质。在一些实施方式中，基因产物是赋予细胞新治疗活性的蛋白质，如(但不限于)嵌合抗原受体(CAR)或其抗原-结合片段、T细胞受体或其抗原结合部分、FcγRIII(CD16)的非天然存在的变体、白介素15(IL-15)、白介素15受体(IL-15R)或其变体、白介素12(IL-12)、白介素-12受体(IL-12R)或其变体、人白细胞抗原G(HLA-G)、人白细胞抗原E(HLA-E)、白细胞表面抗原分化簇CD47(CD47)或者其两种或更多种的任意组合。应理解本发明公开的方法和细胞不局限于任何具体的所关心的基因产物并且所关心的基因产物的选择将取决于细胞类型和细胞的最终用途。

如本文所使用的术语“报告基因”是指已引入细胞，例如，整合到细胞基因组的外源基因，其赋予适合于人工选择的特性。常见的报告基因是编码荧光蛋白，例如，绿色荧光蛋白(GFP)的荧光报告基因和赋予细胞抗生素抗性的抗生素抗性基因。

如本文所使用的术语“重编程”或者“去分化”或者“提高细胞潜能”或者“提高发育潜能”是指提高细胞潜能或使细胞去分化为低分化状态的方法。例如，在一些实施方式中，与非重编程状态的相同细胞相比，具有提高的细胞潜能的细胞具有更强的发育可塑性(即可以分化为更多细胞类型)。也就是说，在一些实施方式中，重编程细胞是处于比在非重编程状态下相同细胞更低分化状态的细胞。在一些实施方式中，“重编程”是指将体细胞或多能干细胞去分化为多潜能干细胞，也称为诱导性多能干细胞或iPSC。用于从体细胞或多能干细胞产生iPSC的适合的方法是本领域技术人员所熟知的。

术语“RNA导向的核酸酶”和“RNA导向的核酸酶分子”在本文中是可互换使用的。在一些实施方式中，RNA导向的核酸酶是RNA导向的DNA核酸内切酶。在一些实施方式中，RNA-导向的核酸酶是CRISPR核酸酶。RNA导向的核酸酶的非限制性实例列于下表5中，并且本文所公开的方法和组合物可以使用本文所公开的或本领域那些技术人员已知的RNA导向的核酸酶的任何组合。本领域那些技术人员将知道适用于本发明公开的背景下的其它核酸酶和核酸酶变体，并且将理解本发明公开不限于该方面。

考虑本发明公开，其它适合的RNA导向的核酸酶(例如，Cas9和Cas12核酸酶)对于技术人员将是显而易见的，并且本发明公开不受限于本文所提供的示例性的适合的核酸酶。在一些实施方式中，适合的核酸酶是Cas12a、Cas9、Cas12b、Cas12c、Cas12e、CasX或者CasΦ(Cas12j)或其变体(例如，具有高编辑效率的变体，例如，能够编辑细胞群体中约60％至100％的细胞的变体)。在一些实施方式中，本发明公开还涵盖了核酸酶变体，例如，Cas9、Cpf1(Cas12a，如Mad7 Cas12a变体)、Cas12b、Cas12e、CasX或CasΦ(Cas12j)核酸酶变体。在一些实施方式中，核酸酶是核酸酶变体，其是指与核酸酶的野生型氨基酸序列相比，包含以一个或多个氨基酸替换、缺失或添加为特征的氨基酸序列的核酸酶。在一些实施方式中，适合的核酸酶和/或核酸酶变体还可以包括纯化标签(例如，多聚组氨酸标签)和/或信号肽，例如，包含核定位信号序列或由其组成的信号肽。在本文其它处更详细地描述了适合的核酸酶和核酸酶变体的一些非限制性实例，并且还包括在2019年3月14日提交且标题为“Systems and Methods for the Treatment of Hemoglobinopathies”的PCT专利申请PCT/US2019/22374中描述的那些，该专利申请的全部内容作为参考并入本文。在一些实施方式中，RNA导向的核酸酶是氨基酸球菌属种(Acidaminococcus sp.)Cpf1变体(AsCpf1变体)。在一些实施方式中，基于本发明公开，适合的Cpf1核酸酶变体(包括适合的AsCpf1变体)对于本领域技术人员而言将是已知的或显而易见的，并且包括(但不限于)本文所公开的Cpf1变体或本领域已知的其它Cpf1变体。例如，在一些实施方式中，RNA导向的核酸酶是氨基酸球菌属种(Acidaminococcus sp.)Cpf1 RR变体(AsCpf1-RR)。在另一个实施方式中，RNA导向的核酸酶是Cpf1 RVR变体。例如，适合的Cpf1变体包括具有M537R取代、H800A取代和/或F870L取代或其任何组合(根据AsCpf1野生型序列的编号方案)的那些。

如本文所使用的术语“受试者”表示人或非人动物。在一些实施方式中，人受试者可以是任何年龄(例如，胎儿、婴儿、儿童、青年人或成年人)。在一些实施方式中，人受试者可以处于患病风险或患有疾病，或者可能需要基因或特定基因的组合的改变。作为另外一种选择，在一些实施方式中，受试者可以是非人动物，其可以包括(但不限于)哺乳动物。在一些实施方式中，非人动物是非人灵长类动物、啮齿类(例如，小鼠、大鼠、仓鼠、豚鼠等)、兔、狗、猫等。在本发明公开的某些实施方式中，非人动物受试者是家畜，例如，牛、马、绵羊、山羊等。在某些实施方式中，非人动物受试者是禽类，例如，鸡、火鸡、鸭等。

如本文所使用的术语“治疗(treatment、treat和treating)”表示旨在逆转、减轻、延缓疾病、病症或病况或其一种或多种症状的发病，或者抑制其发展，使其得到改善，降低其严重程度，预防或延缓其复发，和/或改善如本文所描述的疾病、病症或病况的一种或多种症状的临床干预。在一些实施方式中，病况包括损伤。在一些实施方式中，损伤可以是急性或慢性的(例如，来自导致(例如)继发损坏，如组织损伤的潜在疾病或病症的组织损伤)。在一些实施方式中，可以在出现一种或多种症状之后和/或在已诊断疾病之后向受试者施用治疗，例如，处于如本文所描述的iPSC-来源的NK细胞或iPSC-来源的NK细胞群体形式的治疗。可以在不存在症状的情况下施用治疗，例如，以预防或延缓症状的发病或者抑制疾病的发病或发展。例如，在一些实施方式中，可以在症状发病之前向易感受试者施用治疗(例如，根据基因或其它易感因素)。在一些实施方式中，还可以在症状解决后继续治疗，例如，以预防或延缓它们的复发。在一些实施方式中，治疗导致疾病、病症或病况的一种或多种症状的改善和/或消退。

如本文所使用的术语“变体”是指如多肽或多核苷酸的实体，其与参考实体显示出显著的结构同一性，但与参考实体相比，在一个或多个化学部分的存在或水平方面与参考实体在结构上不同。在多个实施方式中，变体在功能上也与其参考实体不同。通常，具体实体是否被恰当地视为参考实体的“变体”是基于其与参考实体的结构同一性程度的。如本文所使用的，术语“功能性变体”是指赋予与参考实体相同的功能的变体，例如，必需基因的基因产物的功能性变体是促进细胞的存活和/或增殖的变体。应理解功能性变体不需要与参考实体功能等价，只要它赋予与参考实体相同的功能。

靶细胞

本发明公开的方法可以用于编辑任何细胞的基因组。在某些实施方式中，靶细胞是干细胞，例如，iPS或ES细胞。在某些实施方式中，靶细胞可以是iPS-或ES-来源的细胞，其中在供体细胞向iPSC重编程过程期间的任何阶段、在iPSC阶段期间和/或在iPSC或ESC分化为特化细胞或甚至分化为或处于最终特化细胞状态的过程的任何阶段进行基因修饰。在某些实施方式中，靶细胞可以是iPS-来源的NK细胞(iNK细胞)或iPS-来源的T细胞(iT细胞)，其中在供体细胞向iPSC重编程过程期间的任何阶段、在iPSC阶段期间和/或在iPSC分化为iNK或iT状态的过程的任何阶段，例如，在中间状态，如(例如)iPSC-来源的HSC状态或甚至分化为或处于最终iNK或iT细胞状态的任何阶段进行基因修饰。

在某些实施方式中，靶细胞是以下中的一种或多种：长期造血干细胞、短期造血干细胞、多能祖细胞、谱系限制性祖细胞、淋巴样祖细胞、髓样祖细胞、共同髓样祖细胞、红系祖细胞、巨核细胞红系祖细胞、视网膜细胞、感光细胞、视杆细胞、视锥细胞、视网膜色素上皮细胞、小梁网细胞、耳蜗毛细胞、外毛细胞、内毛细胞、肺泡上皮细胞、支气管上皮细胞、肺泡上皮细胞、肺上皮祖细胞、横纹肌细胞、心肌细胞、肌卫星细胞、神经元、神经元干细胞、间充质干细胞、诱导多潜能干细胞(iPS)、胚胎干细胞、成纤维细胞、单核细胞源性巨噬细胞或树突细胞、巨核细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、肥大细胞、网织红细胞、B细胞，例如祖B细胞(progenitor B cell)、前B细胞、祖B细胞(Pro B cell)、记忆B细胞、血浆B细胞、胃肠上皮细胞、胆管上皮细胞、胰腺导管上皮细胞、肠干细胞、肝细胞、肝星形细胞、库柏法细胞、成骨细胞、破骨细胞、脂肪细胞、前脂肪细胞、胰岛细胞(例如，β细胞、α细胞、δ细胞)、胰腺外分泌细胞、施旺细胞或少突胶质细胞。在一些实施方式中，靶细胞是神经元祖细胞。在一些实施方式中，靶细胞是神经元。

在一些实施方式中，靶细胞是循环血细胞，例如，网织红细胞、巨核细胞红系祖细胞(MEP)、髓样祖细胞(CMP/GMP)、淋巴样祖细胞(LP)、造血干细胞/祖细胞(HSC)或内皮细胞(EC)。在一些实施方式中，靶细胞是以下中的一种或多种：骨髓细胞(例如，网织红细胞、红系细胞(例如，成红细胞)、MEP细胞、髓样祖细胞(CMP/GMP)、LP细胞、红系祖细胞(EP)、HSC、多能祖细胞(MPP)、内皮细胞(EC)、血原性内皮(HE)细胞或间质干细胞)。在一些实施方式中，靶细胞是以下中的一种或多种：髓样祖细胞(例如，共同髓样祖细胞(CMP)或粒细胞巨噬细胞祖细胞(GMP))。在一些实施方式中，靶细胞是淋巴样祖细胞，例如，共同淋巴祖细胞(CLP)。在一些实施方式中，靶细胞是红系祖细胞(例如，MEP细胞)中的一种或多种。在一些实施方式中，靶细胞是以下中的一种或多种：造血干细胞/祖细胞(例如，长期HSC(LT-HSC)、短期HSC(ST-HSC)、MPP细胞或谱系限制性祖细胞(LRP))。在某些实施方式中，靶细胞是CD34⁺细胞、CD34⁺CD90⁺细胞、CD34⁺CD38^-细胞、CD34⁺CD90⁺CD49f⁺CD38^-CD45RA^-细胞、CD105⁺细胞、CD31⁺或CD133⁺细胞或CD34⁺CD90⁺CD133⁺细胞。在一些实施方式中，靶细胞是以下中的一种或多种：脐血CD34⁺HSPC、脐带静脉内皮细胞、脐带动脉内皮细胞、羊水CD34⁺细胞、羊水内皮细胞、胎盘内皮细胞或胎盘造血CD34⁺细胞。在一些实施方式中，靶细胞是以下中的一种或多种：动员的外周血造血CD34⁺细胞(在受试者用动员剂，例如，G-CSF或普乐沙福(Plerixafor)治疗之后)。在一些实施方式中，靶细胞是外周血内皮细胞。在一些实施方式中，靶细胞是外周血自然杀伤细胞。

在某些实施方式中，靶细胞是原代细胞，例如，分离自人受试者的细胞。在某些实施方式中，靶细胞是免疫细胞，例如，分离自人受试者的原代免疫细胞。在某些实施方式中，靶细胞是分离自受试者，例如，人受试者的细胞群体的一部分。在一些实施方式中，细胞群体包含分离自受试者的免疫细胞群体。在一些实施方式中，细胞群体包含肿瘤浸润淋巴细胞(TIL)，例如，分离自人受试者的TIL。在一些实施方式中，靶细胞分离自健康受试者，例如，健康人供体。在一些实施方式中，靶细胞分离自患有疾病或病的受试者，例如，需要治疗的人患者。

在某些实施方式中，靶细胞是免疫细胞，例如，原代免疫细胞，例如，CD8⁺ T细胞、CD8⁺初始T细胞、CD4⁺中央记忆T细胞、CD8⁺中央记忆T细胞、CD4⁺效应记忆T细胞、CD4⁺效应记忆T细胞、CD4⁺ T细胞、CD4⁺干细胞记忆T细胞、CD8⁺干细胞记忆T细胞、CD4⁺辅助性T细胞、调节性T细胞、细胞毒性T细胞、自然杀伤T细胞、CD4⁺初始T细胞、TH17 CD4⁺ T细胞、TH1 CD4⁺ T细胞、TH2 CD4⁺ T细胞、TH9 CD4⁺ T细胞、CD4⁺Foxp3⁺ T细胞、CD4⁺CD25⁺CD127^-T细胞或者CD4⁺CD25⁺CD127^-Foxp3⁺ T细胞。在一些实施方式中，靶细胞是α-βT细胞、γ-δT细胞或Treg。在一些实施方式中，靶细胞是巨噬细胞。在一些实施方式中，靶细胞是先天淋巴样细胞。在一些实施方式中，靶细胞是树突状细胞。在一些实施方式中，靶细胞是β-细胞，例如，胰腺β-细胞。

在一些实施方式中，靶细胞分离自患有癌症的受试者。

在一些实施方式中，靶细胞分离自患有癌症的受试者，所述癌症包括(但不限于)：听神经瘤；腺癌；肾上腺癌；肛门癌；血管肉瘤(例如，淋巴管肉瘤、淋巴管内皮肉瘤、血管肉瘤)；阑尾癌；良性单克隆丙种球蛋白病；胆癌(例如，肝胆管型肝癌)；胆管癌；膀胱癌；骨癌；乳腺癌(例如，乳腺腺癌、乳腺乳头状癌、乳腺癌、乳腺髓样癌)；脑癌(例如，脑膜瘤、成胶质细胞瘤、神经胶质瘤(例如，星形细胞瘤、寡枝神经胶质细胞瘤、成神经管细胞瘤)；支气管癌；类癌瘤；心脏肿瘤；宫颈癌(例如，宫颈腺癌)；绒毛膜癌；脊索瘤；颅咽管瘤；结肠直肠癌(例如，结肠癌、直肠癌、结肠直肠腺癌)；结缔组织癌；上皮癌；原位管癌；室管膜瘤；内皮肉瘤(例如，卡波氏肉瘤、卡波济氏肉瘤)；子宫内膜癌(例如，子宫癌、子宫肉瘤)；食道癌(例如，食管腺癌、Barrett腺癌)；尤文氏肉瘤；眼癌(例如，眼内黑素瘤、成视网膜细胞瘤)；熟悉嗜曙红细胞过多；胆囊癌；胃癌(例如，胃腺癌)；胃肠道间质瘤(GIST)；生殖细胞癌；头颈癌(例如，头颈鳞状细胞癌、口腔癌(例如，口腔鳞状细胞癌)、咽喉癌(例如，喉癌、咽癌、鼻咽癌、口咽癌)；造血性癌症(例如，淋巴瘤、原发性肺淋巴瘤、支气管-相关淋巴组织淋巴瘤、脾脏淋巴瘤、淋巴结边缘区淋巴瘤、儿童B细胞非霍奇金氏淋巴瘤)；成血管细胞瘤；组织细胞增多病；舌癌；炎性肌纤维母细胞瘤；免疫细胞淀粉样变性；肾癌(例如，肾胚细胞瘤，也叫做威尔姆氏瘤、肾细胞癌)；肝癌(例如，肝细胞癌(HCC)、恶性肝癌)；肺癌(例如，支气管癌、小细胞肺癌(SCLC)、非小细胞肺癌(NSCLC)、肺腺癌)；平滑肌肉瘤(LMS)；黑素瘤；中线道癌；多发性内分泌瘤综合征；肌肉癌；间皮瘤；鼻咽癌；成神经细胞瘤；纤维神经瘤(例如，1型或2型神经纤维瘤(NF)、施旺细胞瘤)；神经内分泌系统癌(例如，胃肠胰神经内分泌瘤(GEP-NET)、类癌瘤)；骨肉瘤(例如，骨癌)；卵巢癌(例如，囊腺癌、卵巢胚胎癌、卵巢腺癌)；乳头状腺癌；胰腺癌(例如，胰腺腺癌、胰腺导管内乳头状黏液肿瘤(IPMN)、胰岛细胞瘤)；甲状旁腺癌；乳头状腺癌；阴茎癌(例如，阴茎和阴囊的佩吉特病)；咽癌；松果体瘤；垂体癌；胸膜肺胚细胞瘤；原始神经外胚层瘤(PNT)；浆细胞瘤；肿瘤伴随综合征；上皮内赘生物；前列腺癌(例如，前列腺腺癌)；直肠癌；横纹肌肉瘤；成视网膜细胞瘤；唾液腺癌；皮肤癌(例如，鳞状细胞癌(SCC)、角化棘皮瘤(KA)、黑素瘤、基底细胞癌(BCC))；小肠癌(例如，阑尾癌)；软组织肉瘤(例如，恶性纤维组织细胞瘤(MFH)、脂肪肉瘤、恶性周围神经鞘膜肿瘤(MPNST)、软骨肉瘤、纤维肉瘤、粘液肉瘤)；皮脂腺癌；胃癌；小肠癌；汗腺癌；滑膜瘤；睾丸癌(例如，精原细胞瘤、睾丸胚胎癌)；胸腺癌；甲状腺癌(例如，甲状腺乳头状癌、乳头状甲状腺癌(PTC)、髓样甲状腺癌)；尿道癌；子宫癌；阴道癌；外阴癌(例如，外阴的佩吉特病)或其任意组合。

在一些实施方式中，靶细胞分离自患有血液学病症的受试者。在一些实施方式中，靶细胞分离自患有镰刀形红细胞贫血症的受试者。在一些实施方式中，靶细胞分离自患有β-地中海贫血的受试者。

干细胞

本发明公开所述的方法可以用于干细胞。干细胞通常是具有产生未改变的子代细胞(自我更新；细胞分裂产生至少一个与亲代细胞相同的子代细胞)并产生特化细胞类型(潜能)的能力的细胞。干细胞包括(但不限于)胚胎干(ES)细胞、胚胎生殖(EG)细胞、生殖系干(GS)细胞、人间充质干细胞(hMSC)、脂肪组织来源的干细胞(ADSC)、多能成体祖细胞(MAPC)、多能成体生殖系干细胞(maGSC)和非限制性体干细胞(USSC)。通常，干细胞可以无限分裂。分裂后，干细胞可以继续作为干细胞，成为前体细胞或继续进行终末分化。前体细胞是可以产生具有至少一种给定细胞类型的完全分化的功能性细胞的细胞。通常，前体细胞可以分裂。分裂后，前体细胞可以继续作为前体细胞或者可以继续进行终末分化。

通常，多潜能干细胞在本领域中是已知的。本发明公开提供了与多潜能干细胞有关的技术(例如，系统、组合物、方法等)。在一些实施方式中，多潜能干细胞是干细胞，所述干细胞：(a)当植入免疫缺陷(SCID)小鼠中时，能够诱导畸胎瘤；(b)能够分化成具有全部三个胚层的细胞类型(例如，可以分化为外胚层、中胚层和内胚层细胞类型)；和/或(c)表达胚胎干细胞的一种或多种标志物(例如，人胚胎干细胞表达OCT-4、碱性磷酸酶、SSEA-3表面抗原、SSEA-4表面抗原、nanog、TRA-1-60、TRA-1-81、Sox-2、REX1等)。在一些方面，人多潜能干细胞不显示分化标志物的表达。在一些实施方式中，使用本发明公开的方法编辑的ES细胞和/或iPSC维持了它们的多潜能性，例如，(a)当植入免疫缺陷(SCID)小鼠中时，能够诱导畸胎瘤；(b)能够分化成具有全部三个胚层的细胞类型(例如，可以分化为外胚层、中胚层和内胚层细胞类型)；和/或(c)表达胚胎干细胞的一种或多种标志物。

在一些实施方式中，ES细胞(例如，人ES细胞)可以来源于胚囊或桑椹胚的内细胞团。在一些实施方式中，ES细胞可以分离自胚胎的一个或多个裂殖细胞，例如，不破坏胚胎其余部分。在一些实施方式中，可以通过体细胞核移植产生ES细胞。在一些实施方式中，ES细胞可以来源于卵细胞与精液或DNA的受精作用、核移植、单性生殖，或者通过产生ES细胞的方式，例如，通过HLA区域中的纯合。在一些实施方式中，可以产生人ES细胞或者人ES细胞可以来源于通过以下方式产生的接合子、裂殖细胞或胚囊期哺乳动物胚胎：精液和卵细胞的融合、核移植、单性生殖或者染色质的重编程以及重编程染色质向质膜的后续掺入以产生胚细胞。示例性人ES细胞在本领域中是已知的并且包括(但不限于)MAO1、MAO9、ACT-4、No.3、H1、H7、H9、H14和ACT30ES细胞。在一些实施方式中，不考虑它们的来源或者用于产生它们的具体方法，可以基于以下情况鉴别人ES细胞，例如，(i)分化成具有全部三个胚层的细胞的能力，(ii)至少Oct-4和碱性磷酸酶的表达和/或(iii)当植入免疫受损的动物中时，产生畸胎瘤的能力。在一些实施方式中，ES细胞已作为细胞系连续传代。

iPS细胞

诱导性多能干细胞(iPSC)是一类通过诱导某些基因的表达，人工来源于非多潜能细胞，如成人体细胞(例如，成纤维细胞或其它适合的体细胞)的一类多潜能干细胞。iPSC可以来源于任何生物，如哺乳动物。在一些实施方式中，从小鼠、大鼠、兔、豚鼠、山羊、猪、牛、非人灵长类动物或人产生iPSC。iPSC在许多方面类似于ES细胞，如某些干细胞基因和蛋白质的表达、染色质甲基化模式、倍增时间、拟胚体形成、畸胎瘤形成、活嵌合体形成、潜能和/或可分化性。用于产生iPSC的多种适合的方法在本领域中是已知的。在一些实施方式中，可以通过某些干细胞相关基因(如Oct-3/4(Pouf51)和Sox-2)向非多潜能细胞，如成人成纤维细胞的转染获得iPSC。可以通过病毒载体，如反转录病毒、慢病毒或腺病毒实现转染。其它适合的重编程方法包括不整合到宿主细胞基因组中的载体的使用，例如，附加型载体，或者还描述了经由编码RNA直接递送或者作为蛋白质递送重编程因子。例如，可以使用反转录病毒系统通过Oct-3/4、Sox-2、Klf4和/或c-Myc，或者使用慢病毒系统通过Oct-4、Sox-2、NANOG和/或LIN28转染细胞。3-4周后，少量转染的细胞开始在形态和生物化学方面变得类似于多潜能干细胞，并且可以通过形态学选择、倍增时间，或者通过报告基因和抗生素选择分离转染的细胞。在一个示例中，通过Yu等人,Science 2007；318(5854):1224或Takahashi等人,Cell 2007；131:861-72所描述的方法产生来自成年人细胞的iPSC。多种适合于重编程的方法是本领域技术人员已知的，并且本发明公开不限于该方面。

在一些实施方式中，本文所描述的用于编辑和货物整合方法的靶细胞是iPSC，其中编辑的iPSC随后分化为(例如)iPSC-来源的免疫细胞。在一些实施方式中，分化细胞是iPSC-来源的免疫细胞。在一些实施方式中，分化细胞是iPSC-来源的iNK细胞、iPSC-来源的T细胞(例如，iPSC-来源的α-βT细胞、γ-δT细胞、Treg、CD4+ T细胞或者CD8+ T细胞)、iPSC-来源的树突状细胞或者iPSC-来源的巨噬细胞。在一些实施方式中，分化细胞是iPSC-来源的胰腺β-细胞。

iNK细胞

在一些实施方式中，本发明公开提供了产生iNK细胞(例如，基因修饰的iNK细胞)，例如，来源于基因修饰的干细胞(例如，iPSC)的iNK细胞的方法。

在一些实施方式中，可以在供体细胞向iPSC重编程过程期间的任何阶段、iPSC阶段期间和/或iPSC向iNK状态分化的过程的任何阶段，例如，在中间状态，如(例如)iPSC-来源的HSC状态，或甚至分化为或处于最终iNK细胞状态的任何阶段产生本发明公开的iNK细胞中存在的基因修饰。

例如，可以在一个或多个不同的细胞阶段(例如，从供体向iPSC重编程、iPSC向iNK分化)产生本发明公开的基因修饰的iNK细胞中存在的一个或多个基因组修饰。在一些实施方式中，在将供体细胞重编程为iPSC状态前，制备本文所提供的基因修饰的iNK细胞中存在的一个或多个基因组修饰。在一些实施方式中，同时、时间接近和/或在重编程/分化过程的相同细胞阶段，例如，在供体细胞阶段、在重编程过程期间、在iPSC阶段或者在分化过程，例如，从iPSC向iNK分化过程期间，制备了本文所提供的基因修饰的iNK细胞中存在的所有编辑。在一些实施方式中，在不同时间和/或在从供体细胞向iPSC向iNK的重编程/分化过程的不同细胞阶段制备本文所提供的基因修饰的iNK细胞中存在的两个或更多个编辑。例如，在一些实施方式中，在供体细胞阶段制备第一编辑并且在iPSC阶段制备第二(不同)编辑。在一些实施方式中，在重编程阶段(例如，供体向iPSC)制备第一编辑，并且在iPSC阶段制备第二(不同)编辑。

多种细胞类型可以用作可以经受本文所描述的重编程、分化和/或基因工程策略的供体细胞。例如，供体细胞可以是多潜能干细胞或分化的细胞，例如，体细胞，如(例如)成纤维细胞或T淋巴细胞。在一些实施方式中，操纵供体细胞(例如，经受重编程、分化和/或基因工程)以产生本文所描述的iNK细胞。

供体细胞可以来自任何适合的生物。例如，在一些实施方式中，供体细胞是哺乳动物细胞，例如，人细胞或非人灵长类动物细胞。在一些实施方式中，供体细胞是体细胞。在一些实施方式中，供体细胞是干细胞或祖细胞。在某些实施方式中，供体细胞不是或过去不是人胚胎的一部分并且其获得不涉及人胚胎的破坏。

在一些实施方式中，基因修饰的iNK细胞来源于iPSC，其反过来来源于体细胞供体细胞。任何适合的体细胞均可用于产生iPSC，并且反过来产生iNK细胞。已描述了从多种体细胞供体细胞类型获得iPSC的适合策略并且这些策略在本领域中是已知的。在一些实施方式中，体细胞供体细胞是成纤维细胞。在一些实施方式中，体细胞供体细胞是成熟T细胞。

例如，在一些实施方式中，获得iPSC并随后获得iNK细胞的体细胞供体细胞是发育成熟的T细胞(经历过胸腺选择的T细胞)。发育成熟的T细胞的一个标志是重排的T细胞受体基因座。在T细胞成熟期间，TCR基因座经历V(D)J重排以产生完整的V-结构域外显子。这些重排在将T细胞重编程为iPSC的整个过程中以及在将所得的iPSC分化为体细胞的整个过程中保留。

在某些实施方式中，体细胞供体细胞为CD8⁺ T细胞、CD8⁺初始T细胞、CD4⁺中央记忆T细胞、CD8⁺中央记忆T细胞、CD4⁺效应记忆T细胞、CD4⁺效应记忆T细胞、CD4⁺ T细胞、CD4⁺干细胞记忆T细胞、CD8⁺干细胞记忆T细胞、CD4⁺辅助性T细胞、调节性T细胞、细胞毒性T细胞、自然杀伤T细胞、CD4⁺初始T细胞、TH17 CD4⁺ T细胞、TH1 CD4⁺ T细胞、TH2 CD4⁺ T细胞、TH9 CD4⁺T细胞、CD4⁺Foxp3⁺ T细胞、CD4⁺CD25⁺CD127^-T细胞或者CD4⁺CD25⁺CD127^-Foxp3⁺ T细胞。

T细胞对于iPSC的产生可以是有利的。例如，可以相对容易地编辑T细胞，例如，通过CRISPR-基方法或者其它基因工程方法。另外，重排的TCR基因座允许基因追踪单个细胞和它们的子代细胞。例如，如果重编程、扩增、培养和/或分化策略在NK细胞产生中涉及单细胞的克隆扩增，则重排的TCR基因座可用作明确鉴别细胞及其子代细胞的遗传标志物。反过来，这允许将细胞群鉴定为真实克隆，或鉴定混合群体或克隆群体中的污染细胞。使用T细胞产生具有多个编辑的iNK细胞的另一个潜在优势是在T细胞培养物中选择与染色体易位有关的某些核型畸变。当通过CRISPR技术编辑细胞时，并且具体地当产生具有多个编辑的细胞时，这类畸变可以造成问题。使用T细胞来源的iPSC作为获得治疗性淋巴细胞的起点可以允许在淋巴细胞中表达预筛选的TCR，例如，通过针对特定抗原(例如肿瘤抗原)的结合活性选择T细胞，将所选择的T细胞重编程为iPSC，然后由这些iPSC获得表达TCR的淋巴细胞(例如，T细胞)。该策略可以允许在其它细胞类型中激活TCR，例如，通过遗传或表观遗传策略。另外，T细胞在整个重编程过程期间保留了它们的“表观遗传记忆”的至少一部分，并因此与使用不相关的细胞，如成纤维细胞作为iNK获得起点的方法相比，相同或密切相关的细胞类型，如iNK细胞的后续分化可以更有效和/或导致产生更高质量的细胞群体。

在一些实施方式中，如本文所描述的正在被操纵的供体细胞，例如，正在进行重编程和/或经历基因工程的细胞是以下中的一种或多种：长期造血干细胞、短期造血干细胞、多能祖细胞、谱系限制性祖细胞、淋巴样祖细胞、髓样祖细胞、共同髓样祖细胞、红系祖细胞、巨核细胞红系祖细胞、视网膜细胞、感光细胞、视杆细胞、视锥细胞、视网膜色素上皮细胞、小梁网细胞、耳蜗毛细胞、外毛细胞、内毛细胞、肺泡上皮细胞、支气管上皮细胞、肺泡上皮细胞、肺上皮祖细胞、横纹肌细胞、心肌细胞、肌卫星细胞、神经元、神经元干细胞、间充质干细胞、诱导多潜能干细胞(iPS)、胚胎干细胞、成纤维细胞、单核细胞源性巨噬细胞或树突细胞、巨核细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、肥大细胞、网织红细胞、B细胞，例如祖B细胞(progenitor B cell)、前B细胞、祖B细胞(Pro B cell)、记忆B细胞、血浆B细胞、胃肠上皮细胞、胆管上皮细胞、胰腺导管上皮细胞、肠干细胞、肝细胞、肝星形细胞、库柏法细胞、成骨细胞、破骨细胞、脂肪细胞、前脂肪细胞、胰岛细胞(例如，β细胞、α细胞、δ细胞)、胰腺外分泌细胞、施旺细胞或少突胶质细胞。

在一些实施方式中，供体细胞是以下中的一种或多种：循环血细胞，例如，网织红细胞、巨核细胞红系祖细胞(MEP)、髓样祖细胞(CMP/GMP)、淋巴样祖细胞(LP)、造血干细胞/祖细胞(HSC)或内皮细胞(EC)。在一些实施方式中，供体细胞是以下中的一种或多种：骨髓细胞(例如，网织红细胞、红系细胞(例如，成红细胞)、MEP细胞、髓样祖细胞(CMP/GMP)、LP细胞、红系祖细胞(EP)、HSC、多能祖细胞(MPP)、内皮细胞(EC)、血原性内皮(HE)细胞或间质干细胞)。在一些实施方式中，供体细胞是以下中的一种或多种：髓样祖细胞(例如，共同髓样祖细胞(CMP)或粒细胞巨噬细胞祖细胞(GMP))。在一些实施方式中，供体细胞是以下中的一种或多种；淋巴样祖细胞，例如，共同淋巴祖细胞(CLP)。在一些实施方式中，供体细胞是红系祖细胞(例如，MEP细胞)中的一种或多种。在一些实施方式中，供体细胞是以下中的一种或多种：造血干细胞/祖细胞(例如，长期HSC(LT-HSC)、短期HSC(ST-HSC)、MPP细胞或谱系限制性祖细胞(LRP))。在某些实施方式中，供体细胞是CD34⁺细胞、CD34⁺CD90⁺细胞、CD34⁺CD38^-细胞、CD34⁺CD90⁺CD49f⁺CD38^-CD45RA^-细胞、CD105⁺细胞、CD31⁺或CD133⁺细胞，或者CD34⁺CD90⁺CD133⁺细胞。在一些实施方式中，供体细胞是以下中的一种或多种：脐血CD34⁺HSPC、脐带静脉内皮细胞、脐带动脉内皮细胞、羊水CD34⁺细胞、羊水内皮细胞、胎盘内皮细胞或胎盘造血CD34⁺细胞。在一些实施方式中，供体细胞是以下中的一种或多种：动员的外周血造血CD34⁺细胞(在受试者用动员剂，例如，G-CSF或普乐沙福(Plerixafor)治疗之后)。在一些实施方式中，供体细胞是外周血内皮细胞。在一些实施方式中，供体细胞是外周血自然杀伤细胞。

在一些实施方式中，供体细胞是分裂的细胞。在一些实施方式中，供体细胞是未分裂的细胞。

在一些实施方式中，例如，在免疫肿瘤学治疗方法的背景中，向对其有需要的受试者施用由本文所描述的一种或多种方法和/或策略所产生的基因修饰的(例如，编辑的)iNK细胞。在一些实施方式中，可以使用本领域已知的任何适合的方法，将供体细胞或本文所提供的重编程、分化和/或基因工程策略的任何阶段的任何细胞维持在培养中或储存(例如，在液氮中冷冻)，例如，用于后续鉴定或向对其有需要的受试者施用。

基因修饰的细胞

功能缺失性修饰

在一些实施方式中，将本文所描述的靶细胞(例如，本文所描述的NK细胞或干细胞(例如，iPSC))基因工程化以在本文所描述的一个或多个靶标中引入破环(例如，敲除)。例如，在一些实施方式中，可以将本文所描述的靶细胞(例如，本文所描述的NK细胞或干细胞(例如，iPSC))基因工程化以敲除一个或多个靶标基因中的全部或一部分，在一个或多个靶标基因中引入移码和/或引起所编码的基因产物截短(例如，通过引入提前终止密码子)。在一些实施方式中，可以使用基因编辑系统，例如，如本文所描述的基因编辑系统将本文所描述的靶细胞(例如，本文所描述的NK细胞或干细胞(例如，iPSC))基因工程化以敲除全部或部分靶标基因。在一些这些实施方式中，基因编辑系统可以是或者包含CRISPR系统、锌指核酸酶系统、TALEN和/或大范围核酸酶。

在一些实施方式中，本发明公开提供了适合于高效敲除(例如，高比例的细胞群体包含敲除)的方法。在一些实施方式中，高效敲除导致细胞群体中至少65％的细胞包含敲除(例如，细胞群体中至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的细胞包含敲除)。

在某些实施方式中，本发明公开提供了本文所描述的基因工程化靶细胞(例如，本文所描述的NK细胞或干细胞(例如，iPSC))和/或子代细胞，其包含TGF信号转导，例如，TGFβ信号转导中的破环。在一些实施方式中，这在(例如)其中期望从多潜能干细胞产生分化的细胞(例如，NK细胞)的情况下是有用的，其中在分化的细胞中TGF信号转导，例如，TGFβ信号转导被破坏。

TGFβ信号转导抑制或降低对于治疗应用有用的一些分化的细胞类型的存活和/或活性，例如，TGFβ信号转导是自然杀伤细胞的负调节剂，其可以用于免疫治疗应用。在一些实施方式中，期望产生临床有效个数的包含破坏TGF信号转导的基因修饰的自然杀伤细胞，因此避免TGFβ对这些细胞的临床效果的副作用。在一些实施方式中，作为替代，从多潜能干细胞，例如，从得自供体的成熟NK细胞获得这些NK细胞是有利的。修饰干细胞而不是分化细胞尤其具有以下益处：允许特定基因型，例如，具有特定基因修饰(例如，在不存任何不期望的(例如，脱靶)修饰的情况下的TGFβRII的靶向破坏)的特定干细胞克隆的克隆获得、鉴定和/或扩增。在一些实施方式中，将干细胞，例如，人iPSC基因工程化以不表达一种或多种TGFβ受体，例如，TGFβRII，或者表达TGFβ受体的显性失活变体，例如，显性失活TGFβRII变体。在KR710923.1、NM_001024847.2和NM_003242.5中说明了TGFβRII的示例性序列。示例性显性失活TGFβRII公开于Immunity.2000Feb；12(2):171-81。

在某些实施方式中，本发明公开提供了本文所描述的基因工程化靶细胞(例如，本文所描述的NK细胞或干细胞(例如，iPSC))和/或子代细胞，其另外或作为另外一种选择包含白介素信号转导，例如，IL-15信号转导中的破环。IL-15是与白介素-2(IL-2)具有结构相似性的细胞因子，其结合至由IL-2/IL-15受体β链(CD122)和常见的γ链(γ-C，CD132)组成的复合物并通过复合物信号转导。在NG_029605.2中提供了IL-15的示例性序列。IL-15信号转导的破环可以是有用的，例如，在其中希望从多潜能干细胞产生分化细胞，但是所述分化细胞中某些信号转导通路(例如，IL-15)被破坏的情况下。IL-15信号转导可以抑制或降低一些类型的分化细胞的存活和/或活性，如对于治疗应用可以是有用的细胞。例如，IL-15信号转导是自然杀伤(NK)细胞的负调节剂。

CISH(由CISH基因编码)位于IL-15受体下游并且可以在NK细胞中起到IL-15信号转导的负调节剂的作用。如本文所使用的，术语“CISH”是指含细胞因子诱导型SH2的蛋白(参见，例如，Delconte等人,Nat Immunol.2016Jul；17(7):816-24；作为NG_023194.1说明了CISH的示例性序列)。在一些实施方式中，CISH调控的破环可以提高Jak/STAT途径的激活，从而导致NK细胞的存活、增殖和/或效应功能。因此，在一些实施方式中，基因工程化NK细胞(例如，iNK细胞，例如，从包含CISH调控破坏的基因工程化hiPSC产生)对IL-15-介导的信号传导显示出比非基因工程化NK细胞更大的反应性。在一些这些实施方式中，相对于非基因工程化NK细胞，基因工程化NK细胞显示出更大的效应功能。

在一些实施方式中，基因工程化NK细胞、干细胞和/或子代细胞另外或作为另外一种选择包含下列中的一个或多个的破坏和/或功能缺失：B2M、NKG2A、PD1、TIGIT、ADORA2a、CIITA、HLA II类组织相容性抗原α链基因、HLA II类组织相容性抗原β链基因、CD32B或TRAC。

如本文所使用的，术语“B2M”(β2微球蛋白)是指发现与几乎所有有核细胞表面上的主要组织相容性复合体(MHC)I类重链结合的血清蛋白。作为NG_012920.2说明了B2M的示例性序列。

如本文所使用的，术语“NKG2A”(自然杀伤组2A)是指属于杀伤细胞凝集素-样受体家族，也称为NKG2家族的蛋白，它是优先在NK细胞中表达的一组跨膜蛋白。该蛋白家族的特征在于II型膜取向以及C-型凝集素结构域的存在。参见，例如，Kamiya-T等人,J ClinInvest 2019https://doi.org/10.1172/JCI123955。作为AF461812.1显示了NKG2A的示例性序列。

如本文所使用的，术语“PD1”(细胞程序死亡蛋白1)，也称为CD279(分化簇279)是指存在于在通过下调免疫系统调节免疫系统对人体细胞的应答以及通过抑制T细胞炎性活性促进自体耐受性中具有作用的细胞表面上的蛋白。PD1是免疫检查点并针对自体免疫进行保护。PD1的示例性序列表示为NM_005018.3。

如本文所使用的，术语“TIGIT”(具有Ig和ITIM结构域的T细胞免疫受体)是指免疫球蛋白的PVR(脊髓灰质炎病毒受体)家族的成员。在几类T细胞，包括滤泡性B辅助T细胞(TFH)上表达该基因的产物。TIGIT的示例性序列如NM_173799.4中所示。

如本文所使用的，术语“ADORA2A”是指腺嘌呤核苷A2a受体，它是鸟苷酸-结合蛋白(G蛋白)偶联受体(GPCR)超家族的成员，其被再分为几类和亚型。这种蛋白，A2A亚型的腺苷受体，使用腺苷作为优选的内源激动剂并且优先与G蛋白的G(s)和G(olf)家族相互作用以提高胞内cAMP水平。NG_052804.1中提供了ADORA2a的示例性序列。

如本文所使用的，术语“CIITA”是指位于核中起到II类主要组织相容性复合体基因转录的正调节剂作用的蛋白，并且它被称为这些基因表达的“主控制因子(mastercontrol factor)”。所述蛋白也结合GTP并且使用GTP结合来帮助其自身向核的转运。该基因中的突变与II型裸淋巴细胞综合征(也称为遗传性MHC II类缺陷或HLA II类-缺陷型联合免疫缺陷)有关，并且提高了对类风湿性关节炎、多发性硬化和可能的心肌梗塞的敏感性。参见，例如，Chang等人,J Exp Med 180:1367-1374；和Chang等人,Immunity.1996Feb；4(2):167-78，以上每篇文献的全部内容作为参考并入本文。作为NG_009628.1显示了CIITA的示例性序列。

在一些实施方式中，例如，通过基因组编辑，破坏，例如，敲除两种或更多种HLA II类组织相容性抗原α链基因和/或两种或更多种HLA II类组织相容性抗原β链基因。例如，在一些实施方式中，破坏，例如，敲除选自HLA-DQA1、HLA-DRA、HLA-DPA1、HLA-DMA、HLA-DQA2和HLA-DOA的两种或更多种HLA II类组织相容性抗原α链基因。对于另一个实例，在一些实施方式中，破坏，例如，敲除选自HLA-DMB、HLA-DOB、HLA-DPB1、HLA-DQB1、HLA-DQB3、HLA-DQB2、HLA-DRB1、HLA-DRB3、HLA-DRB4和HLA-DRB5的两种或更多种HLA II类组织相容性抗原β链基因。参见，例如，Crivello等人,J Immunol January 2019,ji1800257；DOI:https://doi.org/10.4049/jimmunol.1800257，该文献的全部内容作为参考并入本文。

如本文所使用的，术语“CD32B”(分化簇32B)是指低亲和力免疫球蛋白γFc区受体II-b蛋白，在人中，通过FCGR2B基因编码该蛋白。参见，例如，Rankin-CT等人,Blood2006108(7):2384-91，该文献的全部内容作为参考并入本文。

如本文所使用的，术语“TRAC”是指TRAC基因座所编码的T细胞受体α亚基(恒定区)。

功能获得性修饰

在一些实施方式中，可以另外使用(例如)基因编辑系统，例如，如本文所描述的基因编辑系统对本文所描述的靶细胞(例如，本文所描述的NK细胞或干细胞(例如，iPSC))基因工程化以包含导致本文所描述的一个或多个所关心的基因产物的表达。在一些这些实施方式中，基因编辑系统可以是或者包含CRISPR系统、锌指核酸酶系统、TALEN和/或大范围核酸酶。

在一些实施方式中，通过本发明公开所述的方法产生细胞，例如，包括将细胞与在细胞中的必需基因的内源编码序列内导致断裂的核酸酶接触的方法，其中所述必需基因编码细胞存活和/或增殖所需的至少一个基因产物。细胞还与供体模板接触，所述供体模板包含含有与必需基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')的所关心的基因产物的外源编码序列的敲入盒。通过断裂的同源介导修复(HDR)将敲入盒整合到细胞基因组中，从而导致产生表达所关心的基因产物和所述细胞的存活和/或增殖所需的必需基因所编码的基因产物的基因组编辑的细胞或其功能性变体。对于示例性方法，这在图3中得到显示。在一些实施方式中，将细胞与供体模板接触，所述供体模板包含含有与必需基因的外源编码序列或部分编码序列位于同一读框且位于其上游(5')的所关心的基因产物的外源编码序列的敲入盒。

在一些实施方式中，细胞包含具有与必需基因的编码序列位于同一读框且位于其下游(3')的所关心的基因产物的外源编码序列的基因组，其中所述必需基因编码所述细胞存活和/或增殖所需的基因产物。

在一些实施方式中，细胞包含具有与必需基因的编码序列位于同一读框且位于其上游(5')的所关心的基因产物的外源编码序列的基因组，其中所述必需基因编码所述细胞存活和/或增殖所需的基因产物。

在一些实施方式中，细胞包含基因组修饰，其中所述基因组修饰包含外源敲入盒在细胞基因组中的必需基因的内源编码序列内的插入，其中所述必需基因编码所述细胞存活和/或增殖所需的基因产物，其中所述敲入盒包含与编码所述必需基因的基因产物的外源编码序列或部分编码序列位于同一读框且位于其下游(3')的所关心的基因产物的外源编码序列或其功能性变体，并且其中所述细胞表达所关心的基因产物和所述细胞存活和/或增殖所需的必需基因所编码的基因产物或其功能性变体。在一些实施方式中，从必需基因的内源启动子表达所关心的基因产物和所述必需基因所编码的基因产物。

供体模板

在一个方面，本发明公开提供了包含敲入盒的供体模板，所述敲入盒具有与必需基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')的所关心的基因产物的外源编码序列，其中所述必需基因编码细胞存活和/或增殖所需的基因产物。

在一个方面，本发明公开提供了设计包含敲入盒的供体模板的动力，所述敲入盒具有与必需基因的外源编码序列或部分编码序列位于同一读框且位于其上游(5')的所关心的基因产物的外源编码序列，其中所述必需基因编码细胞存活和/或增殖所需的基因产物；参见，例如，图3D。

在一些实施方式中，供体模板用于在通过同源介导修复(HDR)编辑细胞基因组中使用。

供体模板设计详细描述于文献中，例如PCT专利公开No.WO2016/073990A1中。供体模板可以是单链或双链的并且可以用于帮助双链断裂(DSB)的HDR-基修复，并且对于将新序列插入靶标序列或者替换全部靶标序列是特别有用的。在一些实施方式中，供体模板是供体DNA模板。在一些实施方式中，供体DNA模板是双链的。

无论是单链还是双链的，供体模板通常包括与要切割的靶标序列内或附近(例如，侧接或邻近)的DNA区域同源的区域。这些同源区域在本文中被称为“同源臂”，并且以下相对于敲入盒(其可以通过未显示的其它间隔序列与同源臂之一或两者分开)示意地显示了这些同源区域：

[5′同源臂]-[敲入盒]-[3'同源臂]。

同源臂可具有任何适合的长度(如果仅使用一个同源臂，包括0个核苷酸)，并且5'和3'同源臂可以具有相同长度或者可以具有不同长度。适当同源臂长度的选择可受多种因素影响，如对避免与某些序列(如Alu重复序列或其它极为常见的元件)的同源性或微同源性的期望。例如，可以缩短5'同源臂以避免序列重复元件。在其它实施方式中，可以缩短3'同源臂以避免序列重复元件。在一些实施方式中，可以缩短5'和3‘同源臂两者以避免包括某些序列重复元件。

供体模板可以是核酸载体，如病毒基因组或环状双链DNA，例如，质粒。包含供体模板的核酸载体可以包括其它编码或非编码元件。例如，可以作为包括某些基因组主链元件(例如，就AAV基因组来说，末端反向重复)的病毒基因组的一部分递送供体模板核酸(例如，在AAV、腺病毒、仙台病毒或慢病毒基因组中)。在一些实施方式中，供体模板包含在未线性化的质粒内。在一些实施方式中，供体模板包含在已线性化的质粒内。在一些实施方式中，供体模板包含在直链dsDNA片段内。在一些实施方式中，可以作为AAV基因组的一部分递送供体模板核酸。在一些实施方式中，可以作为单链寡聚供体(ssODN)，例如，作为来源于m13噬菌体合成的长多kb ssODN，或者作为另外一种选择，短ssODN，例如，包含所关心的小基因、标签和/或探针的短ssODN递送供体模板核酸。在一些实施方式中，可以作为Doggybone^TMDNA(dbDNA^TM)模板递送供体模板核酸。在一些实施方式中，可以作为DNA微环递送供体模板核酸。在一些实施方式中，可以作为整合缺陷型慢病毒颗粒(IDLV)递送供体模板核酸。在一些实施方式中，可以作为MMLV-来源的反转录病毒递送供体模板核酸。在一些实施方式中，可以作为piggyBac^TM序列递送供体模板核酸。在一些实施方式中，可以作为复制性EBNA1附加体递送供体模板核酸。

在某些实施方式中，5'同源臂的长度可以为约25至约1,000个碱基对，例如，长度为至少约100、200、400、600或800个碱基对。在某些实施方式中，5'同源臂包含约50至800个碱基对，例如，100至800、200至800、400至800、400至600或者600至800个碱基对。在某些实施方式中，3'同源臂的长度可以为约25至约1,000个碱基对，例如，长度为至少约100、200、400、600或800个碱基对。在某些实施方式中，3'同源臂包含约50至800个碱基对，例如，100至800、200至800、400至800、400至600或者600至800个碱基对。在某些实施方式中，5'和3'同源臂的长度是对称的。在某些实施方式中，5'和3'同源臂的长度是不对称的。

在某些实施方式中，5'同源臂为小于约3,000个碱基对、小于约2,900个碱基对、小于约2,800个碱基对、小于约2,700个碱基对、小于约2,600个碱基对、小于约2,500个碱基对、小于约2,400个碱基对、小于约2,300个碱基对、小于约2,200个碱基对、小于约2,100个碱基对、小于约2,000个碱基对、小于约1,900个碱基对、小于约1,800个碱基对、小于约1,700个碱基对、小于约1,600个碱基对、小于约1,500个碱基对、小于约1,400个碱基对、小于约1,300个碱基对、小于约1,200个碱基对、小于约1,100个碱基对、小于约1,000个碱基对、小于约900个碱基对、小于约800个碱基对、小于约700个碱基对、小于约600个碱基对、小于约500个碱基对或者小于约400个碱基对。

在某些实施方式中，例如，当通过本文所描述的方法将病毒载体用于引入敲入盒时，5'同源臂为小于约1,000个碱基对、小于约900个碱基对、小于约800个碱基对、小于约700个碱基对、小于约600个碱基对、小于约500个碱基对、小于约400个碱基对或者小于约300个碱基对。在某些实施方式中，例如，当通过本文所描述的方法将病毒载体用于引入敲入盒时，5'同源臂为约400-600个碱基对，例如，约500个碱基对。

在某些实施方式中，3'同源臂为小于约3,000个碱基对、小于约2,900个碱基对、小于约2,800个碱基对、小于约2,700个碱基对、小于约2,600个碱基对、小于约2,500个碱基对、小于约2,400个碱基对、小于约2,300个碱基对、小于约2,200个碱基对、小于约2,100个碱基对、小于约2,000个碱基对、小于约1,900个碱基对、小于约1,800个碱基对、小于约1,700个碱基对、小于约1,600个碱基对、小于约1,500个碱基对、小于约1,400个碱基对、小于约1,300个碱基对、小于约1,200个碱基对、小于约1,100个碱基对、小于1,000个碱基对、小于约900个碱基对、小于约800个碱基对、小于约700个碱基对、小于约600个碱基对、小于约500个碱基对或者小于约400个碱基对。

在某些实施方式中，例如，当通过本文所描述的方法将病毒载体用于引入敲入盒时，3'同源臂为小于约1,000个碱基对、小于约900个碱基对、小于约800个碱基对、小于约700个碱基对、小于约600个碱基对、小于约500个碱基对、小于约400个碱基对或者小于约300个碱基对。在某些实施方式中，例如，当通过本文所描述的方法将病毒载体用于引入敲入盒时，3'同源臂为约400-600个碱基对，例如，约500个碱基对。

在某些实施方式中，5'和3'同源臂侧接断裂并且距断裂边缘小于100、75、50、25、15、10或5个碱基对。在某些实施方式中，5'和3'同源臂侧接内源终止密码子。在某些实施方式中，5'和3'同源臂侧接定位在内源终止密码子，例如，必需基因的终止密码子上游(5')约500个碱基对(例如，约500个碱基对、约450个碱基对、约400个碱基对、约350个碱基对、约300个碱基对、约250个碱基对、约200个碱基对、约150个碱基对、约100个碱基对、约50个碱基对或者约25个碱基对)内的断裂。在某些实施方式中，5'同源臂涵盖了断裂边缘。

敲入盒

在一些实施方式中，供体模板内的敲入盒包含与必需基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')的所关心的基因产物的外源编码序列。在一些实施方式中，供体模板内的敲入盒包含与必需基因的外源编码序列或部分编码序列位于同一读框且位于其上游(5')的所关心的基因产物的外源编码序列。在一些实施方式中，敲入盒是多顺反子敲入盒。在一些实施方式中，敲入盒是双顺反子敲入盒。在一些实施方式中，敲入盒不包含报告基因，例如，荧光报告基因或者抗生素抗性基因。

在一些实施方式中，通过两个包含不同“货物”序列的敲入盒靶向单个必需基因的基因座。在一些实施方式中，一个等位基因将引入一个敲入盒，而其它等位基因将引入其它敲入盒。在一些实施方式中，对于两个不同的敲入盒中的每一个，用于产生适当的DNA断裂的gRNA可以是相同的。在一些实施方式中，对于两个不同的敲入盒中的每一个，用于产生适当的DNA断裂的gRNA可以是不同的，从而对于每个等位基因在不同位置引入“货物”序列。在一些实施方式中，每个等位基因的这种不同位置仍可以在最后一个外显子编码区内。在一些实施方式中，每个等位基因的这种不同位置可以在倒数第二个外显子(倒数第二)和/或最后一个(最后)外显子编码区内。在一些实施方式中，等位基因中的至少一个的这种不同位置可以在第一个外显子内。在一些实施方式中，等位基因中的至少一个的这种不同位置可以在第一个或第二个外显子内。

为了正确恢复基因修饰的细胞中的必需基因编码区(从而产生起作用的基因产物)，敲入盒不需要包含对应于必需基因的整个编码序列的外源编码序列。的确，基于必需基因的内源编码序列中断裂的位置，可以有可能通过提供包含必需基因的部分编码序列的敲入盒恢复必需基因，例如，所述部分编码序列对应于覆盖断裂和断裂下游整个区域(减终止密码子)的必需基因的内源编码序列的一部分，和/或对应于覆盖断裂和断裂上游整个区域(多至且任选地包括起始密码子)的必需基因的内源编码序列的一部分。

为了使敲入盒尺寸最小化，在一些实施方式中，事实上使断裂定位在必需基因的内源编码序列的最后1500、1000、750、500、400、300、200、100或50个碱基对内(朝向编码序列3'端)可以是有利的。在一些实施方式中，可以从内源翻译终止信号(例如，终止密码子)3'-至-5'定义编码序列中碱基对的位置。在一些实施方式中，如本文所使用的，“内源编码序列”可以包括外显子和内含子碱基对两者，并且是指在内源功能性翻译终止信号5'存在的基因序列。在一些实施方式中，内源编码序列内的断裂包含一条DNA链内的断裂。在一些实施方式中，内源编码序列内的断裂包含两条DNA链内的断裂。在一些实施方式中，断裂位于内源编码序列最后1000个碱基对内。在一些实施方式中，断裂位于内源编码序列最后750个碱基对内。在一些实施方式中，断裂位于内源编码序列最后600个碱基对内。在一些实施方式中，断裂位于内源编码序列最后500个碱基对内。在一些实施方式中，断裂位于内源编码序列最后400个碱基对内。在一些实施方式中，断裂位于内源编码序列最后300个碱基对内。在一些实施方式中，断裂位于内源编码序列最后250个碱基对内。在一些实施方式中，断裂位于内源编码序列最后200个碱基对内。在一些实施方式中，断裂位于内源编码序列最后150个碱基对内。在一些实施方式中，断裂位于内源编码序列最后100个碱基对内。在一些实施方式中，断裂位于内源编码序列最后75个碱基对内。在一些实施方式中，断裂位于内源编码序列最后50个碱基对内。在一些实施方式中，断裂位于内源编码序列最后21个碱基对内。

在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的C末端片段，例如，长度小于500、250、150、125、100、75、50、25、20、15或10个氨基酸的片段。在一些实施方式中，对敲入盒中的必需基因的外源部分编码序列进行密码子优化。在一些实施方式中，对敲入盒中的必需基因的外源部分编码序列进行密码子优化以消除至少一个PAM位点。在一些实施方式中，对敲入盒中的必需基因的外源部分编码序列进行密码子优化以消除不止一个PAM位点。在一些实施方式中，对敲入盒中的必需基因的外源部分编码序列进行密码子优化以消除所有相关的核酸酶特异性PAM位点。在一些实施方式中，必需基因所编码的蛋白质的C末端片段为约140个氨基酸长。在一些实施方式中，必需基因所编码的蛋白质的C末端片段为约130个氨基酸长。在一些实施方式中，必需基因所编码的蛋白质的C末端片段为约120个氨基酸长。在一些实施方式中，C末端片段包括由覆盖断裂的必需基因的内源编码序列区所编码的氨基酸序列。在一些实施方式中，C末端片段包括由必需基因的1个外显子内的内源编码序列区所编码的氨基酸序列。在一些实施方式中，C末端片段包括由必需基因的2个外显子内的内源编码序列区所编码的氨基酸序列。在一些实施方式中，C末端片段包括由必需基因的3个外显子内的内源编码序列区所编码的氨基酸序列。在一些实施方式中，C末端片段包括由必需基因的4个外显子内的内源编码序列区所编码的氨基酸序列。在一些实施方式中，C末端片段包括由必需基因的5个外显子内的内源编码序列区所编码的氨基酸序列。

在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的C末端片段，例如，长度小于500、250、150、125、100、75、50、25、20、19、18、17、16、15、14、13、12、11、10、9、8或7个氨基酸的片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的20个氨基酸的C末端片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的19个氨基酸的C末端片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的18个氨基酸的C末端片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的17个氨基酸的C末端片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的16个氨基酸的C末端片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的1个氨基酸的C末端片段。

在一些实施方式中，例如，当必需基因包括如图3A的示例性方法中所示的多个外显子时，可以有利地使断裂位于必需基因的最后一个外显子内。在一些实施方式中，例如，当必需基因包括如图3A的示例性方法中所示的多个外显子时，可以有利地使断裂位于必需基因的倒数第二个外显子内。然而，应理解本发明公开不局限于断裂的任何具体位置并且基于必需基因的性质和长度以及所关心的基因产物的外源编码序列的长度，可用的位置将改变。例如，对于包括少量外显子的必需基因或者当所关心的基因产物较小时，可以有可能将断裂定位在上游外显子中。

为了使敲入盒尺寸最小化，在一些实施方式中，事实上使断裂定位在必需基因的内源编码序列的前1500、1000、750、500、400、300、200、100或50个碱基对内(即从编码序列的5'端开始)可以是有利的。在一些实施方式中，可以从内源翻译起始信号(例如，起始密码子)5'-至-3'定义编码序列中碱基对的位置。在一些实施方式中，如本文所使用的，“内源编码序列”可以包括外显子和内含子碱基对两者，并且是指在内源功能性翻译起始信号3'存在的基因序列。在一些实施方式中，内源编码序列内的断裂包含一条DNA链内的断裂。在一些实施方式中，内源编码序列内的断裂包含两条DNA链内的断裂。在一些实施方式中，断裂位于内源编码序列的前1000个碱基对内。在一些实施方式中，断裂位于内源编码序列的前750个碱基对内。在一些实施方式中，断裂位于内源编码序列的前600个碱基对内。在一些实施方式中，断裂位于内源编码序列的前500个碱基对内。在一些实施方式中，断裂位于内源编码序列的前400个碱基对内。在一些实施方式中，断裂位于内源编码序列的前300个碱基对内。在一些实施方式中，断裂位于内源编码序列的前250个碱基对内。在一些实施方式中，断裂位于内源编码序列的前200个碱基对内。在一些实施方式中，断裂位于内源编码序列的前150个碱基对内。在一些实施方式中，断裂位于内源编码序列的前100个碱基对内。在一些实施方式中，断裂位于内源编码序列的前75个碱基对内。在一些实施方式中，断裂位于内源编码序列的前50个碱基对内。在一些实施方式中，断裂位于内源编码序列的前21个碱基对内。

在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的N末端片段，例如，长度小于500、250、150、125、100、75、50、25、20、15或10个氨基酸的片段。在一些实施方式中，必需基因所编码的蛋白质的N末端片段为约140个氨基酸长。在一些实施方式中，必需基因所编码的蛋白质的N末端片段为约130个氨基酸长。在一些实施方式中，必需基因所编码的蛋白质的N末端片段为约120个氨基酸长。在一些实施方式中，N末端片段包括由覆盖断裂的必需基因的内源编码序列区所编码的氨基酸序列。在一些实施方式中，N末端片段包括由必需基因的1个外显子内的内源编码序列区所编码的氨基酸序列。在一些实施方式中，N末端片段包括由必需基因的2个外显子内的内源编码序列区所编码的氨基酸序列。在一些实施方式中，N末端片段包括由必需基因的3个外显子内的内源编码序列区所编码的氨基酸序列。在一些实施方式中，N末端片段包括由必需基因的4个外显子内的内源编码序列区所编码的氨基酸序列。在一些实施方式中，N末端片段包括由必需基因的5个外显子内的内源编码序列区所编码的氨基酸序列。

在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的N末端片段，例如，长度小于500、250、150、125、100、75、50、25、20、19、18、17、16、15、14、13、12、11、10、9、8或7个氨基酸的片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的20个氨基酸的N末端片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的19个氨基酸的N末端片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的18个氨基酸的N末端片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的17个氨基酸的N末端片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的16个氨基酸的N末端片段。在一些实施方式中，敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的1个氨基酸的N末端片段。

在一些实施方式中，敲入盒中的必需基因的外源编码序列或部分编码序列与细胞的必需基因的相应内源编码序列的同一性小于100％，例如，小于99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、85％、80％、75％、70％、65％、60％、55％或小于50％(即当使用使相应序列之间比对最大化的标准成对序列比对工具比对两条序列时)。例如，在一些实施方式中，相对于细胞的必需基因的相应内源编码序列，对敲入盒中的必需基因的外源编码序列或部分编码序列进行密码子优化，例如，以防止核酸酶与靶标位点的进一步结合。作为另外一种选择或者另外，可以对其进行密码子优化以降低敲入盒向细胞基因组整合后重组的可能性和/或提高敲入盒向细胞基因组整合后必需基因的基因产物和/或所关心的基因产物的表达。

在一些实施方式中，敲入盒包含相对于内源敲入位点不同的一个或多个核苷酸或碱基对(例如，是突变)。在一些实施方式中，敲入盒中的这些突变提供了对核酸酶切割的耐受性。在一些实施方式中，敲入盒中的这些突变防止核酸酶在同源重组后切割靶标基因座。在一些实施方式中，敲入盒中的这些突变存在于靶标基因的一个或多个编码区和/或非编码区内。在一些实施方式中，敲入盒中的这些突变是沉默突变。在一些实施方式中，敲入盒中的这些突变是沉默突变和/或错义突变。

在一些实施方式中，敲入盒中的这些突变存在于靶标前间隔基序和/或靶标前间隔邻近基序(PAM)位点内。在一些实施方式中，敲入盒包括通过沉默突变饱和的靶标前间隔基序和/或PAM位点。在一些实施方式中，敲入盒包括被沉默突变约30％、40％、50％、60％、70％、80％或90％饱和的靶标前间隔基序和/或PAM位点。在一些实施方式中，敲入盒包括被沉默突变和/或错义突变饱和的靶标前间隔基序和/或PAM位点。在一些实施方式中，敲入盒包括靶标前间隔基序和/或PAM位点，其包含至少1个突变、至少2个突变、至少3个突变、至少4个突变、至少5个突变、至少6个突变、至少7个突变、至少8个突变、至少9个突变、至少10个突变、至少11个突变、至少12个突变、至少13个突变、至少14个突变或者至少15个突变。

在一些实施方式中，在不损失一部分内源蛋白天然功能的情况下，可以不通过密码子优化突变靶标位点中编码某些氨基酸的某些密码子。在一些实施方式中，可以不通过密码子优化突变靶标位点中编码某些氨基酸的某些密码子。

在一些实施方式中，仅在一部分编码序列中对敲入盒进行密码子优化。例如，在一些实施方式中，敲入盒编码必需基因所编码的蛋白质的C末端片段，例如，长度小于500、250、150、125、100、75、50、25、20、19、18、17、16、15、14、13、12、11、10、9、8或7个氨基酸的片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的20个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的19个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的18个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的17个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的16个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的15个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的14个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的13个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的12个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的11个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的10个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的9个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的8个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的7个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的6个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的5个氨基酸的C末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的小于5个氨基酸的氨基酸C末端片段。

在一些实施方式中，仅在一部分编码序列中对敲入盒进行密码子优化。例如，在一些实施方式中，敲入盒编码必需基因所编码的蛋白质的N末端片段，例如，长度小于500、250、150、125、100、75、50、25、20、19、18、17、16、15、14、13、12、11、10、9、8或7个氨基酸的片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的20个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的19个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的18个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的17个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的16个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的15个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的14个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的13个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的12个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的11个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的10个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的9个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的8个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的7个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的6个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的5个氨基酸的N末端片段。在一些实施方式中，已密码子优化的敲入盒中的必需基因的外源部分编码序列编码必需基因所编码的蛋白质的小于5个氨基酸的氨基酸N末端片段。

在一些实施方式中，敲入盒包含编码接头肽的一个或多个序列，例如，所述接头肽位于必需基因的外源编码序列或部分编码序列和本文所描述的“货物”序列和/或调控元件之间。这些接头肽在本领域中是已知的，它们中的任一种可以包括在本文所描述的敲入盒中。在一些实施方式中，接头肽包含氨基酸序列GSG。

在一些实施方式中，敲入盒包含其它调控元件，如多腺苷酸化序列，和任选地3'UTR序列，其位于所关心的基因产物的外源编码序列的下游。如果存在3'UTR序列，则3'UTR序列定位在外源编码序列的3'和多腺苷酸化序列的5'。

在一些实施方式中，敲入盒包含其它调控元件，如5'UTR和起始密码子，其位于所关心的基因产物的外源编码序列的上游。如果存在5'UTR序列，则5'UTR序列定位在“货物”序列和/或外源编码序列的5'。

示例性同源臂(HA)

在某些实施方式中，供体模板包含与GAPDH基因座区域同源的5'和/或3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：1、2或3所示的序列或由其组成的5'同源臂。在一些实施方式中，5'同源臂包含与SEQ ID NO：1、2或3所示的序列具有至少85％、90％、95％、98％或99％的同一性的序列或由其组成。在一些实施方式中，供体模板包含含有SEQ ID NO：4或5所示的序列或由其组成的3'同源臂。在某些实施方式中，3'同源臂包含与SEQ ID NO：4或5所示的序列具有至少85％、90％、95％、98％或99％的同一性的序列或由其组成。

在一些实施方式中，供体模板包含含有SEQ ID NO：1的5'同源臂和含有SEQ IDNO：4的3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：2的5'同源臂和含有SEQ ID NO：4的3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：3的5'同源臂和含有SEQ ID NO：5的3'同源臂。

在一些实施方式中，侧接核酸酶切割位点的序列延伸可以在5'和3'同源臂两者中重复。在一些实施方式中，设计这种重复以优化HDR效率。在一些实施方式中，可以对重复序列之一进行密码子优化，而其它序列未进行密码子优化。在一些实施方式中，可以对重复序列两者进行密码子优化。在一些实施方式中，密码子优化可以除去靶标PAM位点。在一些实施方式中，重复序列可以不超过：100bp长、90bp长、80bp长、70bp长、60bp长、50bp长、40bp长、30bp长或者20bp长。

SEQ ID NO：1-位于GAPDH基因座的敲入盒插入的示例性5'HA

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAG

SEQ ID NO：2-位于GAPDH基因座的敲入盒插入的示例性5'HA

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCT

SEQ ID NO：3-位于GAPDH基因座的敲入盒插入的示例性5'HA

GGCTTTCCCATAATTTCCTTTCAAGGTGGGGAGGGAGGTAGAGGGGTGATGTGGGGAGTACGCTGCAGGGCCTCACTCCTTTTGCAGACCACAGTCCATGCCATCACTGCCACCCAGAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATCTCTTGGTACGACAATGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAG

SEQ ID NO：4-位于GAPDH基因座的敲入盒插入的示例性3'HA

ATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：5-位于GAPDH基因座的敲入盒插入的示例性3'HA

AGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTTCATCTTCTAGGTATGACAACGAATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCT

在一些实施方式中，供体模板包含与TBP基因座区域同源的5'和/或3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：6、7或8所示的序列或由其组成的5'同源臂。在一些实施方式中，5'同源臂包含与SEQ ID NO：6、7或8所示的序列具有至少85％、90％、95％、98％或99％的同一性的序列或由其组成。在一些实施方式中，供体模板包含含有SEQ ID NO：9、10或11所示的序列或由其组成的3'同源臂。在某些实施方式中，3'同源臂包含与SEQ ID NO：9、10或11所示的序列具有至少85％、90％、95％、98％或99％的同一性的序列或由其组成。

在一些实施方式中，供体模板包含含有SEQ ID NO：6的5'同源臂和含有SEQ IDNO：9的3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：7的5'同源臂和含有SEQ ID NO：10的3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：8的5'同源臂和含有SEQ ID NO：11的3'同源臂。

SEQ ID NO：6-位于TBP基因座的敲入盒插入的示例性5'HA

GCAGACTTCCATTTACAGTGAGGAGGTGAGCATTGCATTGAACAAAAGATGGCGTTTTCACTTGGAATTAGTTATCTGAAGCTTTAGGATTCCTCAGCAATATGATTATGAGACAAGAAAGGAAGATTCAGAAATGAGTCTAGTTGAAGGCAGCAATTCAGAGAAGAAGATTCAGTTGTTATCATTGCCGTCCTGCTTGGTTTATGGCCTGGTTCAGGACCAAGGAGAGAAGTGTGAATACATGCCTCTTGAGCTATAGAATGAGACGCTGGAGTCACTAAGATGATTTTTTAAAAGTATTGTTTTATAAACAAAAATAAGATTGTGACAAGGGATTCCACTATTAATGTTTTCATGCCTGTGCCTTAATCTGACTGGGTATGGTGAGAATTGTGCTTGCAGCTTTAAGGTAAGAATTTTACCATCTTAATATGTTAAGAAGTGCCATTTCAGTCTCTCATCTCTACTCCAACTTGTCTTCTTAGGTGCTAAAGTCAGAGCCGAAATCTACGAGGCCTTCGAGAACATCTACCCCATCCTGAAGGGCTTCAGAAAGACCACC

SEQ ID NO：7-位于TBP基因座的敲入盒插入的示例性5'HA

CTGACCACAGCTCTGCAAGCAGACTTCCATTTACAGTGAGGAGGTGAGCATTGCATTGAACAAAAGATGGCGTTTTCACTTGGAATTAGTTATCTGAAGCTTTAGGATTCCTCAGCAATATGATTATGAGACAAGAAAGGAAGATTCAGAAATGAGTCTAGTTGAAGGCAGCAATTCAGAGAAGAAGATTCAGTTGTTATCATTGCCGTCCTGCTTGGTTTATGGCCTGGTTCAGGACCAAGGAGAGAAGTGTGAATACATGCCTCTTGAGCTATAGAATGAGACGCTGGAGTCACTAAGATGATTTTTTAAAAGTATTGTTTTATAAACAAAAATAAGATTGTGACAAGGGATTCCACTATTAATGTTTTCATGCCTGTGCCTTAATCTGACTGGGTATGGTGAGAATTGTGCTTGCAGCTTTAAGGTAAGAATTTTACCATCTTAATATGTTAAGAAGTGCCATTTCAGTCTCTCATCTCTACTCCAACTTGTCTTCTTAGGGGCTAAAGTGCGGGCCGAGATCTACGAGGCCTTCGAGAATATCTACCCCATCCTGAAGGGCTTCAGAAAGACCACC

SEQ ID NO：8-位于TBP基因座的敲入盒插入的示例性5'HA

ACAAAAGATGGCGTTTTCACTTGGAATTAGTTATCTGAAGCTTTAGGATTCCTCAGCAATATGATTATGAGACAAGAAAGGAAGATTCAGAAATGAGTCTAGTTGAAGGCAGCAATTCAGAGAAGAAGATTCAGTTGTTATCATTGCCGTCCTGCTTGGTTTATGGCCTGGTTCAGGACCAAGGAGAGAAGTGTGAATACATGCCTCTTGAGCTATAGAATGAGACGCTGGAGTCACTAAGATGATTTTTTAAAAGTATTGTTTTATAAACAAAAATAAGATTGTGACAAGGGATTCCACTATTAATGTTTTCATGCCTGTGCCTTAATCTGACTGGGTATGGTGAGAATTGTGCTTGCAGCTTTAAGGTAAGAATTTTACCATCTTAATATGTTAAGAAGTGCCATTTCAGTCTCTCATCTCTACTCCAACTTGTCTTCTTAGGTGCTAAAGTCAGAGCAGAAATTTATGAAGCATTCGAGAACATCTACCCTATTCTAAAGGGATTCAGGAAGACGACG

SEQ ID NO：9-位于TBP基因座的敲入盒插入的示例性3'HA

CAGAAATTTATGAAGCATTTGAAAACATCTACCCTATTCTAAAGGGATTCAGGAAGACGACGTAATGGCTCTCATGTACCCTTGCCTCCCCCACCCCCTTCTTTTTTTTTTTTTAAACAAATCAGTTTGTTTTGGTACCTTTAAATGGTGGTGTTGTGAGAAGATGGATGTTGAGTTGCAGGGTGTGGCACCAGGTGATGCCCTTCTGTAAGTGCCCACCGCGGGATGCCGGGAAGGGGCATTATTTGTGCACTGAGAACACCGCGCAGCGTGACTGTGAGTTGCTCATACCGTGCTGCTATCTGGGCAGCGCTGCCCATTTATTTATATGTAGATTTTAAACACTGCTGTTGACAAGTTGGTTTGAGGGAGAAAACTTTAAGTGTTAAAGCCACCTCTATAATTGATTGGACTTTTTAATTTTAATGTTTTTCCCCATGAACCACAGTTTTTATATTTCTACCAGAAAAGTAAAAATCTTTTTTAAAAGTGTTGTTTTT

SEQ ID NO：10-位于TBP基因座的敲入盒插入的示例性3'HA

TAGGTGCTAAAGTCAGAGCAGAAATTTATGAAGCATTTGAAAACATCTACCCTATTCTAAAGGGATTCAGGAAGACGACGTAATGGCTCTCATGTACCCTTGCCTCCCCCACCCCCTTCTTTTTTTTTTTTTAAACAAATCAGTTTGTTTTGGTACCTTTAAATGGTGGTGTTGTGAGAAGATGGATGTTGAGTTGCAGGGTGTGGCACCAGGTGATGCCCTTCTGTAAGTGCCCACCGCGGGATGCCGGGAAGGGGCATTATTTGTGCACTGAGAACACCGCGCAGCGTGACTGTGAGTTGCTCATACCGTGCTGCTATCTGGGCAGCGCTGCCCATTTATTTATATGTAGATTTTAAACACTGCTGTTGACAAGTTGGTTTGAGGGAGAAAACTTTAAGTGTTAAAGCCACCTCTATAATTGATTGGACTTTTTAATTTTAATGTTTTTCCCCATGAACCACAGTTTTTATATTTCTACCAGAAAAGTAAAAATCTTT

SEQ ID NO：11-位于TBP基因座的敲入盒插入的示例性3'HA

AAGGGATTCAGGAAGACGACGTAATGGCTCTCATGTACCCTTGCCTCCCCCACCCCCTTCTTTTTTTTTTTTTAAACAAATCAGTTTGTTTTGGTACCTTTAAATGGTGGTGTTGTGAGAAGATGGATGTTGAGTTGCAGGGTGTGGCACCAGGTGATGCCCTTCTGTAAGTGCCCACCGCGGGATGCCGGGAAGGGGCATTATTTGTGCACTGAGAACACCGCGCAGCGTGACTGTGAGTTGCTCATACCGTGCTGCTATCTGGGCAGCGCTGCCCATTTATTTATATGTAGATTTTAAACACTGCTGTTGACAAGTTGGTTTGAGGGAGAAAACTTTAAGTGTTAAAGCCACCTCTATAATTGATTGGACTTTTTAATTTTAATGTTTTTCCCCATGAACCACAGTTTTTATATTTCTACCAGAAAAGTAAAAATCTTTTTTAAAAGTGTTGTTTTTCTAATTTATAACTCCTAGGGGTTATTTCTGTGCCAGACACA

在一些实施方式中，供体模板包含与G6PD基因座区域同源的5'和/或3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：12所示的序列或由其组成的5'同源臂。在一些实施方式中，5'同源臂包含与SEQ ID NO：12所示的序列具有至少85％、90％、95％、98％或99％的同一性的序列或由其组成。在一些实施方式中，供体模板包含含有SEQ IDNO：13所示的序列或由其组成的3'同源臂。在某些实施方式中，3'同源臂包含与SEQ ID NO：13所示的序列具有至少85％、90％、95％、98％或99％的同一性的序列或由其组成。

在一些实施方式中，供体模板包含含有SEQ ID NO：12的5'同源臂和含有SEQ IDNO：13的3'同源臂。

SEQ ID NO：12-位于G6PD基因座的敲入盒插入的示例性5'HA

GGCCCGGGGGACTCCACATGGTGGCAGGCAGTGGCATCAGCAAGACACTCTCTCCCTCACAGAACGTGAAGCTCCCTGACGCCTATGAGCGCCTCATCCTGGACGTCTTCTGCGGGAGCCAGATGCACTTCGTGCGCAGGTGAGGCCCAGCTGCCGGCCCCTGCATACCTGTGGGCTATGGGGTGGCCTTTGCCCTCCCTCCCTGTGTGCCACCGGCCTCCCAAGCCATACCATGTCCCCTCAGCGACGAGCTCCGTGAGGCCTGGCGTATTTTCACCCCACTGCTGCACCAGATTGAGCTGGAGAAGCCCAAGCCCATCCCCTATATTTATGGCAGGTGAGGAAAGGGTGGGGGCTGGGGACAGAGCCCAGCGGGCAGGGGCGGGGTGAGGGTGGAGCTACCTCATGCCTCTCCTCCACCCGTCACTCTCCAGCCGAGGCCCCACGGAGGCAGACGAGCTGATGAAGAGAGTGGGCTTCCAGTACGAGGGAACCTACAAATGGGTCAACCCTCACAAGCTG

SEQ ID NO：13-位于G6PD基因座的敲入盒插入的示例性3'HA

GTGGGTGAACCCCCACAAGCTCTGAGCCCTGGGCACCCACCTCCACCCCCGCCACGGCCACCCTCCTTCCCGCCGCCCGACCCCGAGTCGGGAGGACTCCGGGACCATTGACCTCAGCTGCACATTCCTGGCCCCGGGCTCTGGCCACCCTGGCCCGCCCCTCGCTGCTGCTACTACCCGAGCCCAGCTACATTCCTCAGCTGCCAAGCACTCGAGACCATCCTGGCCCCTCCAGACCCTGCCTGAGCCCAGGAGCTGAGTCACCTCCTCCACTCACTCCAGCCCAACAGAAGGAAGGAGGAGGGCGCCCATTCGTCTGTCCCAGAGCTTATTGGCCACTGGGTCTCACTCCTGAGTGGGGCCAGGGTGGGAGGGAGGGACGAGGGGGAGGAAAGGGGCGAGCACCCACGTGAGAGAATCTGCCTGTGGCCTTGCCCGCCAGCCTCAGTGCCACTTGACATTCCTTGTCACCAGCAACATCTCGAGCCCCCTGGATGTCC

在一些实施方式中，供体模板包含与E2F4基因座区域同源的5'和/或3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：14、15或16所示的序列或由其组成的5'同源臂。在一些实施方式中，5'同源臂包含与SEQ ID NO：14、15或16所示的序列具有至少85％、90％、95％、98％或99％的同一性的序列或由其组成。在一些实施方式中，供体模板包含含有SEQ ID NO：17、18或19所示的序列或由其组成的3'同源臂。在某些实施方式中，3'同源臂包含与SEQ ID NO：17、18或19所示的序列具有至少85％、90％、95％、98％或99％的同一性的序列或由其组成。

在一些实施方式中，供体模板包含含有SEQ ID NO：14的5'同源臂和含有SEQ IDNO：17的3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：15的5'同源臂和含有SEQ ID NO：18的3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：16的5'同源臂和含有SEQ ID NO：19的3'同源臂。

SEQ ID NO：14-位于E2F4基因座的敲入盒插入的示例性5'HA

CCAGGGGGCTGTAGTGGGGCCAGGCTGGACCTCTGTGCCCTGAGCATGGCTTTCTTGTTTTTCAGTTTTGGAACTCCCCAAAGAGCTGTCAGAAATCTTTGATCCCACACGAGGTAGGCTGCTGCATTCCTCCCTGAGGCTAGGGGTAAGGGACACAGCTCATTGGGTCCTATGGCTGTTTTCTTGCCCTTTTGAGGACCTTGTTGTGGCGCTTATGGTAACTGGGGCAAAGGGTGAAGTTCCTGATGGGCAGGTGGGGTTCCCTTTCCTGGGCTTTGGTGGGTGGAGAGGTGGGAGCTGGAATGTTAGTAACTGAGCTCCCTCCATTCCCAGAGTGCATGAGCTCGGAGCTGCTGGAGGAGTTGATGTCCTCAGAAGGTGGGTGGCCCTGGAAGGTGGGAGTGGGTGTGGGCAGGGGTTGGGCTGCTGCTAGGGGAGCCCTGGCCCAGGGCCTGAGACTAGTGCTCTCTGCAGTGTTCGCCCCTCTGCTGAGACTTTCTCCTCCTCCTGGCGACCACGACTACATCTACAACCTGGACGAGAGCGAGGGCGTGTGCGACCTGTTTGATGTGCCCGTGCTGAACCTG

SEQ ID NO：15-位于E2F4基因座的敲入盒插入的示例性5'HA

CCAGGCTGGACCTCTGTGCCCTGAGCATGGCTTTCTTGTTTTTCAGTTTTGGAACTCCCCAAAGAGCTGTCAGAAATCTTTGATCCCACACGAGGTAGGCTGCTGCATTCCTCCCTGAGGCTAGGGGTAAGGGACACAGCTCATTGGGTCCTATGGCTGTTTTCTTGCCCTTTTGAGGACCTTGTTGTGGCGCTTATGGTAACTGGGGCAAAGGGTGAAGTTCCTGATGGGCAGGTGGGGTTCCCTTTCCTGGGCTTTGGTGGGTGGAGAGGTGGGAGCTGGAATGTTAGTAACTGAGCTCCCTCCATTCCCAGAGTGCATGAGCTCGGAGCTGCTGGAGGAGTTGATGTCCTCAGAAGGTGGGTGGCCCTGGAAGGTGGGAGTGGGTGTGGGCAGGGGTTGGGCTGCTGCTAGGGGAGCCCTGGCCCAGGGCCTGAGACTAGTGCTCTCTGCAGTGTTTGCCCCTCTGCTTCGTCTTAGTCCTCCTCCGGGCGACCACGACTACATCTACAACCTGGACGAGAGCGAGGGCGTGTGCGACCTGTTTGATGTGCCCGTGCTGAACCTG

SEQ ID NO：16-位于E2F4基因座的敲入盒插入的示例性5'HA

GTCAGAAATCTTTGATCCCACACGAGGTAGGCTGCTGCATTCCTCCCTGAGGCTAGGGGTAAGGGACACAGCTCATTGGGTCCTATGGCTGTTTTCTTGCCCTTTTGAGGACCTTGTTGTGGCGCTTATGGTAACTGGGGCAAAGGGTGAAGTTCCTGATGGGCAGGTGGGGTTCCCTTTCCTGGGCTTTGGTGGGTGGAGAGGTGGGAGCTGGAATGTTAGTAACTGAGCTCCCTCCATTCCCAGAGTGCATGAGCTCGGAGCTGCTGGAGGAGTTGATGTCCTCAGAAGGTGGGTGGCCCTGGAAGGTGGGAGTGGGTGTGGGCAGGGGTTGGGCTGCTGCTAGGGGAGCCCTGGCCCAGGGCCTGAGACTAGTGCTCTCTGCAGTGTTTGCCCCTCTGCTTCGTCTTTCTCCACCCCCGGGAGACCACGATTATATCTACAACCTGGACGAGAGTGAAGGTGTCTGTGACCTCTTCGACGTGCCCGTGCTCAACCTC

SEQ ID NO：17-位于E2F4基因座的敲入盒插入的示例性3'HA

CCACCCCCGGGAGACCACGATTATATCTACAACCTGGACGAGAGTGAAGGTGTCTGTGACCTCTTTGATGTGCCTGTTCTCAACCTCTGACTGACAGGGACATGCCCTGTGTGGCTGGGACCCAGACTGTCTGACCTGGGGGTTGCCTGGGGACCTCTCCCACCCGACCCCTACAGAGCTTGAGAGCCACAGACGCCTGGCTTCTCCGGCCTCCCCTCACCGCACAGTTCTGGCCACAGCTCCCGCTCCTGTGCTGGCACTTCTGTGCTCGCAGAGCAGGGGAACAGGACTCAGCCCCCATCACCGTGGAGCCAAAGTGTTTGCTTCTCCCTTTCTGCGGCCTTCGCCAGCCCAGGCTCGGCTGCCACCCAGTGGCACAGAACCGAGGAGCTGCCATTACCCCCCATAGGGGGCAGTGTCTTGTTCCTGCCAGCCTCAGTGTCTTGCTTCTGCCAGCTCCTTCCCCTAGGAGGGAAGGGTGGGGTGGAACTGGGCACATG

SEQ ID NO：18-位于E2F4基因座的敲入盒插入的示例性3'HA

ATTATATCTACAACCTGGACGAGAGTGAAGGTGTCTGTGACCTCTTTGATGTGCCTGTTCTCAACCTCTGACTGACAGGGACATGCCCTGTGTGGCTGGGACCCAGACTGTCTGACCTGGGGGTTGCCTGGGGACCTCTCCCACCCGACCCCTACAGAGCTTGAGAGCCACAGACGCCTGGCTTCTCCGGCCTCCCCTCACCGCACAGTTCTGGCCACAGCTCCCGCTCCTGTGCTGGCACTTCTGTGCTCGCAGAGCAGGGGAACAGGACTCAGCCCCCATCACCGTGGAGCCAAAGTGTTTGCTTCTCCCTTTCTGCGGCCTTCGCCAGCCCAGGCTCGGCTGCCACCCAGTGGCACAGAACCGAGGAGCTGCCATTACCCCCCATAGGGGGCAGTGTCTTGTTCCTGCCAGCCTCAGTGTCTTGCTTCTGCCAGCTCCTTCCCCTAGGAGGGAAGGGTGGGGTGGAACTGGGCACATGCCAGCACCACTTCTAGCTT

SEQ ID NO：19-位于E2F4基因座的敲入盒插入的示例性3'HA

TGACTGACAGGGACATGCCCTGTGTGGCTGGGACCCAGACTGTCTGACCTGGGGGTTGCCTGGGGACCTCTCCCACCCGACCCCTACAGAGCTTGAGAGCCACAGACGCCTGGCTTCTCCGGCCTCCCCTCACCGCACAGTTCTGGCCACAGCTCCCGCTCCTGTGCTGGCACTTCTGTGCTCGCAGAGCAGGGGAACAGGACTCAGCCCCCATCACCGTGGAGCCAAAGTGTTTGCTTCTCCCTTTCTGCGGCCTTCGCCAGCCCAGGCTCGGCTGCCACCCAGTGGCACAGAACCGAGGAGCTGCCATTACCCCCCATAGGGGGCAGTGTCTTGTTCCTGCCAGCCTCAGTGTCTTGCTTCTGCCAGCTCCTTCCCCTAGGAGGGAAGGGTGGGGTGGAACTGGGCACATGCCAGCACCACTTCTAGCTTCCTTCGCTATCCCCCACCCCCTGACCCTCCAGCTCCTCCTGGCCCTCTCACGTGCCCACTTCTGCTGG

在一些实施方式中，供体模板包含与KIF11基因座区域同源的5'和/或3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：20、21或22所示的序列或由其组成的5'同源臂。在一些实施方式中，5'同源臂包含与SEQ ID NO：20、21或22所示的序列具有至少85％、90％、95％、98％或99％的同一性的序列或由其组成。在一些实施方式中，供体模板包含含有SEQ ID NO：23、24或25所示的序列或由其组成的3'同源臂。在某些实施方式中，3'同源臂包含与SEQ ID NO：23、24或25所示的序列具有至少85％、90％、95％、98％或99％的同一性的序列或由其组成。

在一些实施方式中，供体模板包含含有SEQ ID NO：20的5'同源臂和含有SEQIDNO：23的3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：21的5'同源臂和含有SEQ ID NO：24的3'同源臂。在一些实施方式中，供体模板包含含有SEQ ID NO：22的5'同源臂和含有SEQ ID NO：25的3'同源臂。

SEQ ID NO：20-位于KIF11基因座的敲入盒插入的示例性5'HA

AGAGCAGGGTTTCTTGACAGCAGTGCTATTGGCATTTTAAACTGGATAATTCTTTGTTGTGATGGGCTTTCCTGTGGACTGTACTATGTTGGTACACAAGAAAAACAGTGTACTATGTGAATACTCACTCAAAGCCAGTAGCACTCCCTGATTGTAACACCAAAAAAGTCTCTCAGCATTGCCAAATGTCCCCTGTGGCAGCAGAATCACTCCCTGATGAGAACCACTACCCTGGAGTAAAATCTATAACTATGTCTTAGAAAATAACACAGAAAATTAATATTTCTTTCACTCTACTCCTTCCATTAGTGATCAAATAAAGAAGGCATTTGGCGCTACTTGCCAAATTGTTGGCTCAAACTTGTGCTGAACCTTTTTTGGTTTTCTACACTTAAGTTTTTTTGCCTATAACCCAGAGAACTTTGAAAATAGAGTGTAGTTAATGTGTATCTAATGTTACTTTGTATTGACTTAATTTACCGGCCTTTAATCCACAGCATAAGAAGTCCCACGGCAAGGACAAAGAGAACCGGGGCATCAACACACTGGAACGGTCCAAGGTCGAGGAAACAACCGAGCACCTGGTCACCAAGAGCAGACTGCCTCTGAGAGCCCAGATCAACCTG

SEQ ID NO：21-位于KIF11基因座的敲入盒插入的示例性5'HA

TTCCTGTGGACTGTACTATGTTGGTACACAAGAAAAACAGTGTACTATGTGAATACTCACTCAAAGCCAGTAGCACTCCCTGATTGTAACACCAAAAAAGTCTCTCAGCATTGCCAAATGTCCCCTGTGGCAGCAGAATCACTCCCTGATGAGAACCACTACCCTGGAGTAAAATCTATAACTATGTCTTAGAAAATAACACAGAAAATTAATATTTCTTTCACTCTACTCCTTCCATTAGTGATCAAATAAAGAAGGCATTTGGCGCTACTTGCCAAATTGTTGGCTCAAACTTGTGCTGAACCTTTTTTGGTTTTCTACACTTAAGTTTTTTTGCCTATAACCCAGAGAACTTTGAAAATAGAGTGTAGTTAATGTGTATCTAATGTTACTTTGTATTGACTTAATTTTCCCGCCTTAAATCCACAGCATAAAAAATCACATGGAAAAGACAAAGAAAACAGAGGCATTAACACACTGGAGAGGTCTAAAGTGGAAGAAACAACCGAGCACCTGGTCACCAAGAGCAGACTGCCTCTGAGAGCCCAGATCAACCTGSEQ ID NO：22-位于KIF11基因座的敲入盒插入的示例性5'HA

TTAAACTGGATAATTCTTTGTTGTGATGGGCTTTCCTGTGGACTGTACTATGTTGGTACACAAGAAAAACAGTGTACTATGTGAATACTCACTCAAAGCCAGTAGCACTCCCTGATTGTAACACCAAAAAAGTCTCTCAGCATTGCCAAATGTCCCCTGTGGCAGCAGAATCACTCCCTGATGAGAACCACTACCCTGGAGTAAAATCTATAACTATGTCTTAGAAAATAACACAGAAAATTAATATTTCTTTCACTCTACTCCTTCCATTAGTGATCAAATAAAGAAGGCATTTGGCGCTACTTGCCAAATTGTTGGCTCAAACTTGTGCTGAACCTTTTTTGGTTTTCTACACTTAAGTTTTTTTGCCTATAACCCAGAGAACTTTGAAAATAGAGTGTAGTTAATGTGTATCTAATGTTACTTTGTATTGACTTAATTTTCCCGCCTTAAATCCACAGCATAAAAAATCACATGGAAAAGACAAAGAAAACAGAGGCATCAACACACTGGAACGGTCCAAGGTCGAGGAAACAACCGAGCACCTGGTCACCAAGAGCAGACTGCCTCTGAGAGCCCAGATCAACCTG

SEQ ID NO：23-位于KIF11基因座的敲入盒插入的示例性3'HA

AAAAAATCACATGGAAAAGACAAAGAAAACAGAGGCATTAACACACTGGAGAGGTCTAAAGTGGAAGAAACTACAGAGCACTTGGTTACAAAGAGCAGATTACCTCTGCGAGCCCAGATCAACCTTTAATTCACTTGGGGGTTGGCAATTTTATTTTTAAAGAAAACTTAAAAATAAAACCTGAAACCCCAGAACTTGAGCCTTGTGTATAGATTTTAAAAGAATATATATATCAGCCGGGCGCGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATTGCTTGAGCCCAGGAGTTTGAGACCAGCCTGGCCAACGTGGCAAAACCTCGTCTCTGTTAAAAATTAGCCGGGCGTGGTGGCACACTCCTGTAATCCCAGCTACTGGGGAGGCTGAGGCACGAGAATCACTTGAACCCAGGAAGCGGGGTTGCAGTGAGCCAAAGGTACACCACTACACTCCAGCCTGGGCAACAGAGCAAGACT

SEQ ID NO：24-位于KIF11基因座的敲入盒插入的示例性3'HA

AACTACAGAGCACTTGGCTACATAGAGCAGATTACCTCTGCGAGCCCAGATCAACCTTTAATTCACTTGGGGGTTGGCAATTTTATTTTTAAAGAAAACTTAAAAATAAAACCTGAAACCCCAGAACTTGAGCCTTGTGTATAGATTTTAAAAGAATATATATATCAGCCGGGCGCGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATTGCTTGAGCCCAGGAGTTTGAGACCAGCCTGGCCAACGTGGCAAAACCTCGTCTCTGTTAAAAATTAGCCGGGCGTGGTGGCACACTCCTGTAATCCCAGCTACTGGGGAGGCTGAGGCACGAGAATCACTTGAACCCAGGAAGCGGGGTTGCAGTGAGCCAAAGGTACACCACTACACTCCAGCCTGGGCAACAGAGCAAGACTCGGTCTCAAAAACAAAATTTAAAAAAGATATAAGGCAGTACTGTAAATTCAGTTGAATTTTGATATCT

SEQ ID NO：25-位于KIF11基因座的敲入盒插入的示例性3'HA

ATTAACACACTGGAGAGTTCTGAAGTGGAAGAAACTACAGAGCACTTGGTTACAAAGAGCAGATTACCTCTGCGAGCCCAGATCAACCTTTAATTCACTTGGGGGTTGGCAATTTTATTTTTAAAGAAAACTTAAAAATAAAACCTGAAACCCCAGAACTTGAGCCTTGTGTATAGATTTTAAAAGAATATATATATCAGCCGGGCGCGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATTGCTTGAGCCCAGGAGTTTGAGACCAGCCTGGCCAACGTGGCAAAACCTCGTCTCTGTTAAAAATTAGCCGGGCGTGGTGGCACACTCCTGTAATCCCAGCTACTGGGGAGGCTGAGGCACGAGAATCACTTGAACCCAGGAAGCGGGGTTGCAGTGAGCCAAAGGTACACCACTACACTCCAGCCTGGGCAACAGAGCAAGACTCGGTCTCAAAAACAAAATTTAAAAAAGATATAAGGC

末端反向重复(ITR)

在某些实施方式中，供体模板包含AAV来源的序列。在某些实施方式中，供体模板包含AAV构建体典型的AAV来源的序列，如顺式作用5'和3'末端反向重复(ITR)(参见，例如，B.J.Carter,in“Handbook of Parvoviruses”,主编,P.Tijsser,CRC Press,第155 168页(1990)，该文献以其全部内容作为参考并入本文)。通常，ITR能够形成发夹。形成发夹的能力可以有助于ITR自引发(self-prime)的能力，从而允许独立于引发酶的第二DNA链的合成。ITR还在AAV构建体(例如，编码序列)向靶细胞的基因组的整合中起作用。ITR还可以帮助AAV构建体在AAV颗粒中的有效衣壳化。

在一些实施方式中，本文所描述的供体模板包括在rAAV颗粒(例如，AAV6颗粒)内。在一些实施方式中，ITR是或者包含约145个核酸。在一些实施方式中，使用全部或基本全部编码ITR的序列。在一些实施方式中，AAV ITR序列可以得自任何已知的AAV，包括目前所识别的哺乳动物AAV类型。在一些实施方式中，ITR是AAV6 ITR。

在本发明公开中所使用的AAV构建体的实例是含有货物序列(例如，本文所描述的供体模板)的“顺式作用”构建体，其中供体模板侧接5'或“左侧”和3'或“右侧”AAV ITR序列。5'和左侧命名表示ITR序列相对于整个构建体从左至右读取，以正义方向的位置。例如，在一些实施方式中，当以正义取向线性显示构建体时，5'或左侧ITR是接近于给定构建体的靶标基因座启动子(与多腺苷酸化序列相反)的ITR。同时，3'和右侧命名表示ITR序列相对于整个构建体，从左至右读取，以正义方向的位置。例如，在一些实施方式中，当以正义取向线性显示构建体时，3'或右侧ITR是接近于给定构建体的靶标基因座中的多腺苷酸化序列(与启动子序列相反)的ITR。根据有义链，以5'至3'顺序显示了如本文所提供的ITR。因此，本领域技术人员将理解当从正义转变为反义方向时，5'或“左侧”取向ITR也可以显示为3'或“右侧”ITR。此外，将给定正义ITR序列(例如，5'/左侧AAV ITR)转换为反义序列(例如，3'/右侧ITR序列)在本领域技术人员的能力内。本领域的技术人员将理解如何修饰给定ITR序列以用作5'/左侧或3'/右侧ITR或其反义形式。

例如，在一些实施方式中，ITR(例如，5'ITR)可以具有根据SEQ ID NO：158的序列。在一些实施方式中，ITR(例如，3'ITR)可以具有根据SEQ ID NO：159的序列。在一些实施方式中，如本领域中已知的，ITR包括一个或多个修饰，例如，截短、缺失、替换或插入。在一些实施方式中，ITR包含少于145个核苷酸，例如，127、130、134或141个核苷酸。例如，在一些实施方式中，ITR包含110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144或145个核苷酸。

5'AAV ITR序列的非限制性实例包括SEQ ID NO：158。3'AAV ITR序列的非限制性实例包括SEQ ID NO：159。在一些实施方式中，5'和3'AAV ITR(例如，SEQ ID NO：158和159)侧接本文所描述的供体模板(例如，包含5'HA、敲入盒和3'HA的供体模板)。修饰ITR序列的能力在本领域技术范围内。(参见，例如，教科书，如Sambrook等人“MolecularCloning.ALaboratory Manual”,第2版,Cold Spring Harbor Laboratory,New York(1989)；和K.Fisher等人,J Virol.,70:520 532(1996)，以上每篇文献以其全部内容作为参考并入本文)。在一些实施方式中，5'ITR序列与SEQ ID NO：158所表示的5'ITR序列具有至少85％、90％、95％、98％或99％的同一性。在一些实施方式中，3'ITR序列与SEQ ID NO：159所表示的3'ITR序列具有至少85％、90％、95％、98％或99％的同一性。

SEQ ID NO：158-用于敲入盒插入的示例性5'ITR

CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT

SEQ ID NO：159-用于敲入盒插入的示例性3'ITR

AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG

侧接未翻译区，5'UTR和3'UTR

在一些实施方式中，本文所描述的敲入盒包括未翻译区(UTR)的全部或部分，如5'UTR和/或3'UTR。基因的UTR转录但不翻译。5'UTR从转录起始位点开始并延续至起始密码子，但是不包括起始密码子。3'UTR紧跟在终止密码子后开始并延续直至转录终止信号。可以将UTR的调控和/或控制特征引入任何本文所描述的敲入盒以增强或另外调节必需靶标基因座和/或货物序列的表达。

天然5'UTR包括在翻译起始中起作用的序列。在一些实施方式中，5'UTR包含序列，如Kozak序列，其通常已知参与核糖体起始多种基因翻译的过程。Kozak序列具有共有序列CCR(A/G)CCAUGG，其中R是起始密码子(AUG)上游三个碱基处的嘌呤(A或G)，并且起始密码子之后是另一个“G”。5'UTR还已知形成参与延伸因子结合的二级结构。5'UTR的非限制性实例包括来自下列基因的那些：白蛋白、血清淀粉样蛋白A、脱脂蛋白A/B/E、转铁蛋白、甲胎蛋白、促红细胞生成素和因子VIII。

在一些实施方式中，UTR可以包含非内源调控区。在一些实施方式中，包含非内源调控区的UTR是3'UTR。在一些实施方式中，包含非内源调控区的UTR是5'UTR。在一些实施方式中，非内源调控区可以是至少一个抑制性核酸的靶标。在一些实施方式中，抑制性核酸抑制靶标基因的表达和/或活性。在一些实施方式中，抑制性核酸是短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、反义寡核苷酸、向导RNA(gRNA)或核酶。在一些实施方式中，抑制性核酸是内源分子。在一些实施方式中，抑制性核酸是非内源分子。在一些实施方式中，抑制性核酸显示出组织特异性表达模式。在一些实施方式中，抑制性核酸显示出细胞特异性表达模式。

在一些实施方式中，敲入盒可以包含不止一个非内源调控区，例如，2、3、4、5、6、7、8、9或10个调控区。在一些实施方式中，敲入盒可以包含4个非内源调控区。在一些实施方式中，构建体可以包含不止一个非内源调控区，其中不止一个非内源调控区中的至少一个不与其它非内源调控区中的至少一个相同。

在一些实施方式中，3'UTR紧邻所关心的基因的终止密码子的3'存在。在一些实施方式中，来自通过靶细胞转录的mRNA的3'UTR可以包括在任何本文所描述的敲入盒中。在一些实施方式中，3'UTR来源于内源靶标基因座并且可以包括内源序列的全部或部分。在一些实施方式中，3'UTR序列与SEQ ID NO：26所示的序列具有至少85％、90％、95％或98％的同一性。

SEQ ID NO：26-用于敲入盒插入的示例性3'UTR

GCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGA

多腺苷酸化序列

在一些实施方式中，本文所提供的敲入盒构建体可以包括多腺苷酸化(多聚(A))信号序列。大部分新生真核mRNA在它们的3'端具有多聚(A)尾，其在包括初级转录本的切割和受多聚(A)信号序列驱动的偶联的多腺苷酸化反应的复杂过程期间添加(参见，例如，Proudfoot等人,Cell 108:501-512,2002，该文献以其全部内容作为参考并入本文)。多聚(A)尾赋予了mRNA稳定性和可转移性(Molecular Biology of the Cell,第3版,B.Alberts等人,Garland Publishing,1994，该文献以其全部内容作为参考并入本文)。在一些实施方式中，多聚(A)信号序列定位在编码序列的3'。

如本文所使用的，“多腺苷酸化”是指聚腺苷部分或其修饰变体与信使RNA分子的共价连接。在真核生物中，大部分信使RNA(mRNA)分子在3'端多聚腺苷酸化。3'多聚(A)尾是通过酶聚腺苷酸聚合酶的作用添加至前体mRNA的腺嘌呤核苷酸的长序列(例如，50、60、70、100、200、500、1000、2000、3000、4000或5000)。在一些实施方式中，将多聚(A)尾添加至含有特定序列，例如，多腺苷酸化(或多聚(A))信号的转录本上。多聚(A)尾和相关蛋白帮助保护mRNA避免被核酸外切酶降解。多腺苷酸化还在转录终止、mRNA从核的排出以及翻译中起作用。多腺苷酸化通常在核中在DNA向RNA转录后立即发生，但是还可以在细胞质中随后发生。在转录终止后，通过与RNA聚合酶结合的核酸内切酶复合物的作用切割mRNA链。切割位点的特征通常在于碱基序列AAUAAA在切割位点附近的存在。在mRNA已切割后，将腺苷残基添加至切割位点的游离3'端。

如本文所使用的，“多聚(A)信号序列”或“多腺苷酸化信号序列”是引发mRNA的核酸内切酶切割和一系列腺苷向切割的mRNA的3'端的添加的序列。

存在几种可以使用的多聚(A)信号序列，包括来源于牛生长激素(bGH)的那些信号序列(Woychik等人,Proc.Natl.Acad.Sci.US.A.81(13):3944-3948,1984；美国专利No.5,122,458，每篇文献以其全部内容作为参考并入本文)、小鼠-β-球蛋白、小鼠-α-球蛋白(Orkin等人,EMBO J 4(2):453-456,1985；Thein等人,Blood71(2):313-319,1988，每篇文献以其全部内容作为参考并入本文)、人胶原蛋白、多形瘤病毒(Batt等人,Mol.CellBiol.15(9):4783-4790,1995，该文献以其全部内容作为参考并入本文)、单纯疱疹病毒胸苷激酶基因(HSV TK)、IgG重链基因多腺苷酸化信号(US2006/0040354，该专利以其全部内容作为参考并入本文)、人生长激素(hGH)(Szymanski等人,Mol.Therapy15(7):1340-1347,2007，该文献以其全部内容作为参考并入本文)、包含SV40多聚(A)位点，如SV40晚期和早期多聚(A)位点的组(Schek等人,Mol.Cell Biol.12(12):5386-5393,1992，该文献以其全部内容作为参考并入本文)。

多聚(A)信号序列可以是AATAAA。AATAAA序列可以被其它与AATAAA同源且能够信号转导多腺苷酸化的六核苷酸序列替换，所述六核苷酸序列包括ATTAAA、AGTAAA、CATAAA、TATAAA、GATAAA、ACTAAA、AATATA、AAGAAA、AATAAT、AAAAAA、AATGAA、AATCAA、AACAAA、AATCAA、AATAAC、AATAGA、AATTAA或AATAAG(参见，例如，WO 06/12414，该专利以其全部内容作为参考并入本文)。

在一些实施方式中，多聚(A)信号序列可以是合成多腺苷酸化位点(参见，例如，Promega的pCl-neo表达构建体，其基于Levitt等人,Genes Dev.3(7):1019-1025,1989，该文献以其全部内容作为参考并入本文)。在一些实施方式中，多聚(A)信号序列是可溶性神经纤毛蛋白-1(sNRP)的多腺苷酸化信号(AAATAAAATACGAAATG)(参见，例如，WO 05/073384，该文献以其全部内容作为参考并入本文)。在一些实施方式中，多聚(A)信号序列包含SV40多聚(A)位点或由其组成。在一些实施方式中，多聚(A)信号序列包含SEQ ID NO：27或由其组成。在一些实施方式中，多聚(A)信号序列包含bGHpA或由其组成。在一些实施方式中，多聚(A)信号序列包含SEQ ID NO：28或由其组成。多聚(A)信号序列的其它实例在本领域中是已知的。在一些实施方式中，多聚(A)序列与SEQ ID NO：27或28所示的序列具有至少85％、90％、95％、98％或99％的同一性。

SEQ ID NO：27-示例性SV40多聚(A)信号序列

AACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTA

SEQ ID NO：28-示例性bGH多聚(A)信号序列

CTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGG

IRES和2A元件

在一些实施方式中，敲入盒包含使得必需基因所编码的基因产物以及作为单独基因产物的所关心的基因产物能够表达的调控元件，例如，定位在必需基因的外源编码序列或部分编码序列和所关心的基因产物的外源编码序列之间的IRES或2A元件。

在一些实施方式中，敲入盒可以包含多个所关心的基因产物(例如，至少两个所关心的基因产物)。在一些实施方式中，可以通过使得作为不止一种基因产物表达至少两种所关心的基因产物的调控元件，例如，定位在至少两个编码序列之间的IRES或2A元件将所关心的基因产物隔开，从而帮助产生至少两种肽产物。

内部核糖体进入位点(IRES)元件是对于该目的常用的一类调控元件。如本领域所熟知的，IRES元件使得翻译从mRNA内部区域起始，并因此从相同的mRNA转录本表达两种不同的蛋白。最初在脊髓灰质炎病毒RNA中发现了IRES，其中它促进病毒基因组在真核细胞中翻译。自此，已发现了多种IRES序列——多数来自病毒，但是一些来自细胞mRNA，例如，参见Mokrejs等人,Nucleic Acids Res.2006；34(Database issue):D125-D130。

2A元件是为了该目的常用的另一类调控元件。这些2A元件编码所谓的“自切割”2A肽，它是首先在细小核糖核酸病毒中发现的短肽(约20个氨基酸)。术语“自切割”不完全准确，因为这些肽被认为通过使核糖体跳过2A元件C末端处肽键的合成来起作用，从而导致2A序列末端和下一个肽下游之间分离。存在于C末端的甘氨酸(G)和脯氨酸(P)之间发生“切割”，这表示上游顺反子，即必需基因所编码的蛋白质将具有少量来自添加至末端的2A肽的其它残基，而下游顺反子，即所关心的基因产物将从脯氨酸(P)开始。

下表2列出了4种常用的2A肽(有时，任选的将GSG序列添加至肽的N末端已改善切割效率)。存在多种可以适合于本文所描述的方法和组合物的潜在的2A肽(参见，例如，Luke等人,Occurrence,function and evolutionary origins of‘2A-like’sequences invirus genomes.J Gen Virol.2008)。本领域技术人员已知对于特定敲入盒特异的2A肽的选择最终将取决于一些因素，如细胞类型或实验条件。本领域技术人员将认识到编码特定2A肽的核苷酸序列可以是不同的，但仍编码适合于诱导所期望的切割事件的肽。

表2：示例性IRES和2A肽以及核酸序列

必需基因

必需基因可以是细胞存活和/或增殖所必需的任何基因。在一些实施方式中，必需基因是所有细胞类型存活所必需的管家基因，例如，表3中所列的基因。还参见Eisenberg,Trends in Gen.2014；30(3):119-20和Moein等人,Adv.Biomed Res.2017；6:15中所讨论的其它管家基因。表4列出了多种细胞类型，包括iPSC/ESC所必需的其它基因(还参见Yilmaz等人,Nat.Cell Biol.2018；20:610-619中所讨论的必需基因，该文献的全部内容作为参考并入本文)。

在一些实施方式中，必需基因是GAPDH并且DNA核酸酶在外显子9中导致断裂，例如，双链断裂。在一些实施方式中，必需基因是TBP并且DNA核酸酶在外显子7或外显子8中导致断裂，例如，双链断裂。在一些实施方式中，必需基因是E2F4并且DNA核酸酶在外显子10中导致断裂，例如，双链断裂。在一些实施方式中，必需基因是G6PD并且DNA核酸酶在外显子13中导致断裂，例如，双链断裂。在一些实施方式中，必需基因是KIF11并且DNA核酸酶在外显子22中导致断裂，例如，双链断裂。

表3：示例性管家基因

Ensembl ID	基因符号	Ensembl ID	基因符号
				ENSG00000075624	ACTB	ENSG00000231500	RPS18
ENSG00000116459	ATP5F1	ENSG00000112592	TBP
				ENSG00000166710	B2M	ENSG00000072274	TFRC
ENSG00000111640	GAPDH	ENSG00000164924	YWHAZ
				ENSG00000169919	GUSB	ENSG00000089157	RPLP0
ENSG00000165704	HPRT1	ENSG00000142541	RPL13A
				ENSG00000102144	PGK1	ENSG00000147604	RPL7
ENSG00000196262	PPIA	ENSG00000205250	E2F4
				ENSG00000138160	KIF11	ENSG00000160211	G6PD

表4：其它示例性必需基因

/>

本文中所使用的基因符号(包括在表3和4中)基于人类基因命名委员会(HGNC)中所发现的那些，其在万维网网址www.genenames.org上是可搜索的。为每个基因符号提供了Ensembl ID并且Ensembl ID在万维网网址www.ensembl.org上是可查找的。

表3和4中所提供的基因是必需基因的非限制性实例。尽管基于本领域中的知识，其它必需基因将对技术人员是显而易见的，但是可以确定特定基因对于根据本发明公开的用途的适合性，例如，如本文所讨论的。例如，在一些实施方式中，可以通过分析基因组中其它处的潜在脱靶位点来选择特定必需基因。在一些实施方式中，对于本文所描述的方法，仅选择具有在人基因组中唯一的一个或多个gRNA靶标位点的必需基因。在一些实施方式中，对于本文所描述的方法，仅选择具有存在于人基因组中仅一个其它基因座中的一个或多个gRNA靶标位点的必需基因。在一些实施方式中，对于本文所描述的方法，仅选择具有存在于人基因组中仅两个其它基因座中的一个或多个gRNA靶标位点的必需基因。

所关心的基因产物

本发明公开的方法、系统和细胞使得所关心的基因能够在细胞的必需基因处整合。所关心的基因可以编码任何所关心的基因产物。在某些实施方式中，所关心的基因产物包括抗体、抗原、酶、生长因子、受体(例如，细胞表面、胞质或核受体)、激素、淋巴因子、细胞因子、趋化因子、报告分子、任何上述分子的功能性片段或任何上述分子的组合。

在一些实施方式中，所关心的基因产物的序列可以包括(但不限于)原核序列、来自真核mRNA的cDNA、来自真核(例如，哺乳动物)DNA的基因组DNA序列和合成DNA序列。例如，所关心的基因可以编码miRNA、shRNA、天然多肽(即自然界中存在的多肽)或其片段；变体多肽(即与天然多肽的序列同一性小于100％的天然多肽的突变体)或其片段；工程化多肽或肽片段、治疗肽或多肽、成像标志物、可选择标志物、降解信号等。

在一些实施方式中，示例性的所关心的基因产物是赋予细胞治疗价值，例如，新的治疗活性的一种基因产物。在一些实施方式中，示例性的所关心的基因产物是多肽，如嵌合抗原受体(CAR)或其抗原-结合片段、T细胞受体或其抗原结合片段、FcγRIII(CD16)的非天然存在的变体、白介素15(IL-15)、白介素15受体(IL-15R)或其变体、白介素12(IL-12)、白介素-12受体(IL-12R)或其变体、人白细胞抗原G(HLA-G)、人白细胞抗原E(HLA-E)、白细胞表面抗原分化簇CD47(CD47)或者其两种或更多种的任意组合。应理解本发明公开的方法和细胞不局限于任何具体的所关心的基因产物并且所关心的基因产物的选择将取决于细胞类型和细胞的最终用途。

在一些实施方式中，所关心的基因产物可以是细胞因子。在一些实施方式中，细胞因子从使用本文所描述的方法所产生的修饰的细胞的表达使得所述细胞因子能够体内局部剂量施用(例如，在对其有需要的受试者内)和/或避免向对其有需要的受试者全身施用高剂量细胞因子的需要(例如，可以施用低剂量的细胞因子)。在一些实施方式中，降低了与施用细胞因子有关的剂量限制毒性的风险，同时维持了细胞因子介导的细胞功能。在一些实施方式中，为了有助于细胞功能而无需另外使用高剂量的可溶性细胞因子，将IL2、IL4、IL6、IL7、IL9、IL10、IL11、IL12、IL15、IL18、IL21、IFN-α、IFN-β和/或它们各自受体中的一种或多种的部分或完整的肽引入细胞以使得细胞因子能够在表达或不表达细胞因子本身的情况下信号传导，借此维持或改善细胞生长、增殖、扩增和/或效应功能，同时降低细胞因子毒性风险。在一些实施方式中，在细胞表面上表达对于细胞因子信号转导所引入的细胞因子和/或其各自天然或修饰的受体。在一些实施方式中，组成性激活细胞因子信号转导。在一些实施方式中，细胞因子信号转导的激活是可诱导的。在一些实施方式中，细胞因子信号转导的激活是瞬时的和/或暂时的。在一些实施方式中，所关心的基因产物可以是IL2、IL3、IL4、IL6、IL7、IL9、IL10、IL11、IL12、IL13、IL15、IL21、GM-CSF、IFN-a、IFN-b、IFN-g、促红细胞生成素和/或各自细胞因子受体。在一些实施方式中，所关心的基因产物可以是CCL3、TNFα、CCL23、IL2RB、IL12RB2或IRF7。

在一些实施方式中，所关心的基因产物可以是趋化因子和/或各自趋化因子受体。在一些实施方式中，趋化因子受体可以是(但不限于)CCR2、CCR5、CCR8、CX3C1、CX3CR1、CXCR1、CXCR2、CXCR3A、CXCR3B或CXCR2。在一些实施方式中，趋化因子可以是(但不限于)CCL7、CCL19或CXL14。

如本文所使用的，术语“嵌合抗原受体”或“CAR”是指已修饰以向表达CAR的细胞提供靶向特异性蛋白的新能力的受体蛋白。在本发明公开的背景中，修饰以包含CAR或抗原结合片段的细胞可以用于免疫疗法以靶向和破坏与疾病或病症有关的细胞，例如，癌细胞。在一些实施方式中，CAR可以结合至任何所关心的抗原。

所关心的CAR可以包括(但不限于)靶向间皮素、EGFR、HER2和/或MICA/B的CAR。到目前为止，靶向间皮素的CAR T细胞疗法已在患有间皮瘤、非小细胞肺癌和乳腺癌(NCT02414269)的受试者的临床I期试验中显示出早期效力迹象。类似地，靶向EGFR、HER2和MICA/B的CAR已在早期研究中显示出希望(参见，例如，Li等人(2018),Cell Death&Disease,9(177)；Han等人(2018)Am.J.Cancer Res.,8(1):106-119；和Demoulin 2017)Future Oncology,13(8)；以上文献中每一篇的全部内容明确以其全部作为参考并入本文)。

CAR对于本领域技术人员是熟知的并且包括以下专利中所描述的那些，例如：WO13/063419(间皮素)、WO15/164594(EGFR)、WO13/063419(HER2)、WO16/154585(MICA和MICB)，以上文献中每一篇的全部内容明确以其全部作为参考并入本文。在一些实施方式中，所关心的基因产物是任何适合的CAR、NK细胞特异的CAR(NK-CAR)、T细胞特异的CAR或者将细胞，例如，NK细胞靶向至靶细胞，例如，与疾病或病症有关的细胞的其它结合剂，它们可以在本文所提供的修饰的细胞中表达。示例性CAR和结合剂包括(但不限于)双重特异性抗原结合CAR、可开关CAR、可二聚化CAR、分拆CAR、多链CAR、诱导型CAR、结合下列的CAR和结合剂：BCMA、雄激素受体、PSMA、PSCA、Muc1、HPV病毒肽(即E7)、EBV病毒肽、WT1、CEA、EGFR、EGFRvIII、IL13Rα2、GD2、CA125、EpCAM、Muc16、碳酸酐酶IX(CAIX)、CCR1、CCR4、癌胚抗原(CEA)、CD3、CD5、CD7、CD10、CD19、CD20、CD22、CD23、CD24、CD26、CD30、CD33、CD34、CD35、CD38CD41、CD44、CD44V6、CD49f、CD56、CD70、CD92、CD99、CD123、CD133、CD135、CD148、CD150、CD261、CD362、CLEC12A、MDM2、CYP1B、livin、细胞周期素1、NKp30、NKp46、DNAM1、NKp44、CA9、PD1、PDL1、巨细胞病毒抗原(CMV)、上皮细胞糖蛋白-40(EGP-40)、GPRC5D、受体酪氨酸激酶erb-B2,3,4、EGFIR、ERBB叶酸结合蛋白(FBP)、胎儿乙酰胆碱受体(AChR)、叶酸受体-a、神经节糖苷G3(GD3)、人表皮生长因子受体2(HER-2)、人端粒酶反转录酶(hTERT)、ICAM-1、整合素B7、白介素-13受体亚基α-2(IL-13Ra2)、K-轻链、激酶插入区域受体(KDR)、路易斯A(CA19.9)、路易斯Y(Le Y)、L1细胞粘附分子(LI-CAM)、LILRB2、黑素瘤抗原家族A 1(MAGE-Al)、MICA/B、粘蛋白16(Muc-16)、NKCSI、NKG2D配体、c-Met、癌症-睾丸抗原NYES0-1、癌胚抗原(h5T4)、PRAME、前列腺干细胞抗原(PSCA)、PRAME前列腺-特异性膜抗原(PSMA)、肿瘤-相关糖蛋白72(TAG-72)、TIM-3、TRBCI、TRBC2、血管内皮生长因子R2(VEGF-R2)、胚胎性癌肉瘤蛋白(WT-1)、病原体抗原或其任意适当组合。基于本发明公开和本领域中的常识，其它适合用于本文所提供的修饰的细胞的CAR和结合剂将对本领域技术人员是显而易见的。这些其它适合的CAR包括Davies and Maher,Adoptive T-cell Immunotherapy of Cancer UsingChimeric Antigen Receptor-Grafted T Cells,Archivum Immunologiae et TherapiaeExperimentalis 58(3):165-78(2010)的图3中所描述的那些，该文献的全部内容作为参考并入本文。其它适合本文所描述的方法的CAR包括：CD171-特异性CAR(Park等人,Mol Ther(2007)l5(4):825-833)、EGFRvIII-特异性CAR(Morgan等人,Hum Gene Ther(2012)23(10):1043-1053)、EGF-R-特异性CAR(Kobold等人,J Natl Cancer Inst(2014)l07(l):364)、碳酸酐酶K-特异性CAR(Lamers等人,Biochem Soc Trans(2016)44(3):951-959)、FR-a-特异性CAR(Kershaw等人,Clin Cancer Res(2006)12(20):6106-6015)、HER2-特异性CAR(Ahmed等人,J Clin Oncol(2015)33(15)1688-l696；Nakazawa等人,Mol Ther(2011)19(12):2133-2143；Ahmed等人,Mol Ther(2009)17(10):1779-1787；Luo等人,Cell Res(2016)26(7):850-853；Morgan等人,Mol Ther(2010)l8(4):843-85l；Grada等人,Mol Ther NucleicAcids(2013)9(2):32)、CEA-特异性CAR(Katz等人,Clin Cancer Res(2015)21(14):3149-3159)、ILl3Ra2-特异性CAR(Brown等人,Clin Cancer Res(2015)2l(l8):4062-4072)、GD2-特异性CAR(Louis等人,Blood(2011)118(23):6050-6056；Caruana等人,Nat Med(2015)2l(5):524-529)、ErbB2-特异性CAR(Wilkie等人,J Clin Immunol(2012)32(5):1059-1070)、VEGF-R-特异性CAR(Chinnasamy等人,Cancer Res(2016)22(2):436-447)、FAP-特异性CAR(Wang等人,Cancer Immunol Res(2014)2(2):154-166)、MSLN-特异性CAR(Moon等人,ClinCancer Res(2011)17(14):4719-30)、CDl9-特异性CAR(Axicabtagene ciloleucel和Tisagenlecleucel/>)。还参见，Li等人,J Hematol and Oncol(2018)11(22)，其回顾了肿瘤-特异性CAR的临床试验。在一些实施方式中，CAR是抗EGFRCAR。在一些实施方式中，CAR是抗CD19 CAR。在一些实施方式中，CAR是抗BCMA CAR。在一些实施方式中，CAR是抗CD7 CAR。

如本文所使用的，术语“CD16”是指免疫球蛋白G的Fc部分的受体(FcγRIII)，并且它参与抗原-抗体复合物从循环中的除去以及其它抗体-依赖性应答。在一些实施方式中，CD16蛋白是hCD16变体。在一些实施方式中，hCD16变体是高亲和力F158V变体。

在一些实施方式中，所关心的基因产物包括高亲和力不可切割的CD16(hnCD16)或其变体。在一些实施方式中，高亲和力不可切割的CD16或其变体包括下列中的至少任一种：(a)CD16的胞外域结构域中的F176V和S197P(参见，例如，Jing等人,Identification of anADAM17 Cleavage Region in Human CD16(FcγRIII)and the Engineering of a Non-Cleavable Version of the Receptor in NK Cells；PLOS One,2015)；(b)来源于CD64的完全或部分胞外域；(c)非天然(或非CD16)跨膜结构域；(d)非天然(或非CD16)胞内结构域；(e)非天然(或非CD16)信号转导结构域；(f)非天然刺激性结构域；和(G)非来源于CD16且来源于相同或不同多肽的跨膜、信号转导和刺激性结构域。在一些实施方式中，非天然跨膜结构域来源于CD3D、CD3E、CD3G、CD3s、CD4、CD5、CD5a、CD5b、CD27、CD2S、CD40、CDS4、CD166、4-lBB、OX40、ICOS、ICAM-1、CTLA-4、PD-1、LAG-3、2B4、BTLA、CD16、IL7、IL12、IL15、KIR2DL4、KIR2DS1、NKp30、NKp44、NKp46、NKG2C、NKG2D或T细胞受体(TCR)多肽。在一些实施方式中，非天然刺激性结构域来源于CD27、CD2S、4-lBB、OX40、ICOS、PD-1、LAG-3、2B4、BTLA、DAP10、DAP12、CTLA-4或者NKG2D多肽。在一些其它实施方式中，非天然信号转导结构域来源于CD3s、2B4、DAP10、DAP12、DNAM1、CD137(41BB)、IL21、IL7、IL12、IL15、NKp30、NKp44、NKp46、NKG2C或者NKG2D多肽。在hnCD16变体的一些具体实施方式中，非天然跨膜结构域来源于NKG2D，非天然刺激性结构域来源于2B4且非天然信号转导结构域来源于CD3。在一些实施方式中，所关心的基因产物包括高亲和力可切割CD16(hnCD16)或其变体。在一些实施方式中，高亲和力可切割CD16或其变体包括至少F176V。在一些实施方式中，高亲和力可切割CD16或其变体不包含S197P氨基酸替换。

如本文所使用的，术语“IL-15/IL15RA”或者“白介素-15”(IL-15)是指与白介素-2(IL-2)具有结构相似性的细胞因子。与IL-2一样，IL-15结合至由IL-2/IL-15受体β链(CD122)和常见的γ链(γ-C，CD132)组成的复合物并通过所述复合物发出信号。在病毒感染后，单核吞噬细胞(和一些其它细胞)分泌IL-15。这种细胞因子诱导自然杀伤细胞的细胞增殖。IL-15受体α(IL15RA)以非常高的亲和力特异性结合IL15，并且能够独立于其它亚基结合IL-15(参见，例如，Mishra等人,Molecular pathways:Interleukin-15signaling inhealth and in cancer,Clinical Cancer Research,2014)。据表明这种性质允许通过一个细胞产生IL-15，并通过另一个细胞内吞，然后呈递给第三方细胞。据报道IL15RA提高细胞凋亡抑制剂BCL2L1/BCL2-XL和BCL2的细胞增殖和表达。NG_029605.2中提供了IL-15的示例性序列，并且NM_002189.4中提供了IL-15RA的示例性序列。在一些实施方式中，IL-15R变体是组成型活性的IL-15R变体。在一些实施方式中，组成型活性的IL-15R变体是IL-15R和IL-15R激动剂之间的融合，例如，IL-15蛋白或其IL-15R-结合片段之间的融合。在一些实施方式中，IL-15R激动剂是IL-15或其IL-15R-结合变体。示例性适合的IL-15R变体无限制地包括以下中所描述的那些，例如，Mortier E等人,2006；The Journal of BiologicalChemistry 2006 281:1612-1619；或者Bessard-A等人,Mol Cancer Ther.2009Sep；8(9):2736-45，以上每篇文献的全部内容作为参考并入本文。在一些实施方式中，IL-15的膜结合反式递呈是比可溶性IL-15更有效的激活途径(参见，例如，Imamura等人,Autonomousgrowth and increased cytotoxicity of natural killer cells expressingmembrane-bound interleukin-15,Blood,2014)。在一些实施方式中，IL-15R表达包括：使用自切割肽的IL15和IL15Ra表达；IL15和IL15Ra的融合蛋白；具有IL15Ra胞内结构域截短的IL15/IL15Ra融合蛋白；IL15和IL15Ra的膜结合的寿司结构域的融合蛋白；IL15和IL15Rβ的融合蛋白；IL15和常规受体γC的融合蛋白，其中常规受体γC是天然或修饰的；和/或IL15Rβ的同源二聚体。

如本文所使用的，术语“IL-12”是指白介素-12，它是对T细胞和自然杀伤细胞起作用的细胞因子。在一些实施方式中，基因工程化干细胞和/或子代细胞包含导致一种或多种白介素12(IL12)通路激动剂，例如，IL-12、白介素12受体(IL-12R)或其变体(例如，IL-12R的组成型活性变体，例如，融合至IL-12R激动剂的IL-12R(IL-12RA))的表达的基因修饰。

在一些实施方式中，所关心的基因产物包含其在细胞，例如，如本文所描述的修饰的细胞中的表达使得所述细胞能够抑制或逃避向受试者移植或植入后的免疫排斥的蛋白或多肽。在一些实施方式中，所关心的基因产物是HLA-E、HLA-G、CTL4、CD47或相关配体。

在一些实施方式中，所关心的基因产物是T细胞受体(TCR)或其抗原-结合片段，例如，重组TCR。在一些实施方式中，重组TCR可以结合至所关心的抗原，例如，选自(但不限于)下列的抗原：CD279、CD2、CD95、CD152、CD223CD272、TIM3、KIR、A2aR、SIRPa、CD200、CD200R、CD300、LPA5、NY-ESO、PD1、PDL1或MAGE-A3/A6。在一些实施方式中，TCR或其抗原-结合片段可以结合至病毒抗原，例如，来自甲型肝炎、乙型肝炎、丙型肝炎(HCV)、人乳头状瘤病毒(HPV)(例如，HPV-16(如HPV-16E6或HPV-16E7)、HPV-18、HPV-31、HPV-33或HPV-35)、埃-巴二氏病毒(EBV)、人疱疹病毒8(HHV-8)、人T细胞白血病病毒01(HTLV-1)、人T细胞白血病病毒-2(HTLV-2)或巨细胞病毒(CMV)的抗原。

在一些实施方式中，所关心的基因产物包括可以结合至CD47、PD1、CTLA4、CD28、OX40、4-1BB及其配体的单链可变片段。

如本文所使用的，术语“HLA-G”是指HLA的非经典I型重链旁系同源物。这种I型分子是由重链和轻链组成的异源二聚体(β-2微球蛋白)。重链锚定在膜中。在胎儿来源的胎盘细胞上表达HLA-G。HLA-G是NK细胞抑制性受体KIR2DL4的配体，并因此滋养母细胞对这种HLA的表达保护其抵抗NK细胞-介导的死亡。参见，例如，Favier等人,TolerogenicFunction of Dimeric Forms of HLA-G Recombinant Proteins:AComparative StudyInVivo PLOS One 2011，该文献的全部内容作为参考并入本文。作为NG_029039.1描述了HLA-G的示例性序列。

如本文所使用的，术语“HLA-E”是指HLA I类组织相容性抗原，α链E，有时还称为MHC I类抗原E。HLA-E基因编码人中的HLA-E蛋白。人HLA-E是非经典MHC I类分子，其特征在于有限的多态性和比其经典旁系同源物低的细胞表面表达。这种I型分子是由重链和轻链组成的异源二聚体(β-2微球蛋白)。重链锚定在膜中。HLA-E结合来源于其它I类分子的前导肽的有限肽亚型。表达HLA-E的细胞逃避同种异体应答和NK细胞的溶胞。参见，例如，Geornalusse-G等人,Nature Biotechnology 2017 35(8)，该文献的全部内容作为参考并入本文。在NM_005516.6中提供了HLA-E蛋白的示例性序列。

如本文所使用的，术语“CD47”有时也称为“整合素相关蛋白”(IAP)，它是指人中由CD47基因所编码的跨膜蛋白。CD47属于免疫球蛋白超家族，与膜整合素相伴，并且还结合配体血小板反应蛋白-1(TSP-1)和信号-调节蛋白α(SIRPα)。CD47起到允许表达CD47的细胞逃避巨噬细胞攻击的巨噬细胞信号的作用。参见，例如，Deuse-T等人,Nature Biotechnology2019 37:252–258，该文献的全部内容作为参考并入本文。

在一些实施方式中，所关心的基因产物包含嵌合开关受体(参见，例如，WO2018094244A1-TGFBeta Signal Converter；Ankri等人,Human T cells Engineered toexpress a programmed death 1/28costimulatory retargeting moleculedisplayenhanced antitumor activity,The Journal of Immunology,October 15,2013,191；Roth等人,Pooled knockin targeting for genome engineering of cellularimmunotherapies,Cell.2020Apr30；181(3):728-744.e21；和Boyerinas等人,A NovelTGF-β2/Interleukin Receptor Signal Conversion Platform That Protects CAR/TCRT Cells from TGF-β2-Mediated Immune Suppression and Induces T Cell SupportiveSignaling Networks,Blood,2017)。在一些实施方式中，嵌合开关受体是工程化细胞表面受体，其包含来自内源细胞表面受体的胞外域和异源胞内信号转导域，从而胞外域的配体识别导致不同于细胞表面受体的野生型形式所激活的信号转导级联的那种信号转导级联的激活。在一些实施方式中，嵌合开关受体包含融合至胞内结构域的抑制性细胞表面受体的胞外结构域，其导致激活信号，而不是通常通过抑制性细胞表面受体转导的抑制信号的传输。在一些实施方式中，来源于已知抑制免疫效应细胞激活的细胞表面受体的胞外结构域可以融合至激活胞内结构域。在这种实施方式中，相应配体的接触可以然后激活提高，而不是抑制免疫效应细胞激活的信号转导级联。例如，在一些实施方式中，所关心的基因产物是PD1-CD28开关受体，其中PD1的胞外结构域融合至CD28的胞内信号转导域(参见，例如，Liu等人,Cancer Res76:6(2016),1578-1590和Moon等人,Molecular Therapy 22(2014),S201)。在一些实施方式中，所关心的编码基因产物是或包含CD200R的胞外结构域和CD28的胞内信号转导域(参见Oda等人,Blood 130:22(2017),2410-2419)。

在一些实施方式中，所关心的基因产物是报告基因(例如，GFP、mCherry等)。在一些实施方式中，使用报告基因来确认敲入盒的表达能力的适合性。在某些实施方式中，所关心的基因产物可以是彩色或荧光蛋白，如：蓝色/UV蛋白，例如，TagBFP、mTagBFP2、Azurite、EBFP2、mKalamal、Sirius、Sapphire、T-Sapphire；蓝绿色蛋白，例如，ECFP、Cerulean、SCFP3A、mTurquoise、mTurquoise2、单体Midoriishi-Cyan、TagCFP、mTFPl；绿色蛋白，例如，EGFP、Emerald、Superfolder GFP、单体Azami Green、TagGFP2、mUKG、m Wasabi、Clover、mNeonGreen；黄色蛋白，例如，EYFP、Citrine、Venus、SYFP2、TagYFP；橙色蛋白，例如，单体Kusabira-Orange、mKOK、mK02、mOrange、m0range2；红色蛋白，例如，mRaspberry、mStrawberry、mTangerine、tdTomato、TagRFP、TagRFP-T、mApple、mRuby、mRuby2；远红外蛋白，例如，mPlum、HcRed-Tandem、mKate2、mNeptune、NirFP；近IR蛋白，例如，TagRFP657、IFPl.4、iRFP；长斯托克斯位移蛋白，例如，mKeima Red、LSS-mKatel、LSS-mKate2、mBeRFP；光激活蛋白，例如，PA-GFP、PAmCherryl、PATagRFP；光转化蛋白，例如，Kaede(绿色)、Kaede(红色)、KikGRl(绿色)、KikGRl(红色)、PS-CFP2、PS-CFP2、mEos2(绿色)、mEos2(红色)、mEos3.2(绿色)、mEos3.2(红色)、PSmOrange、PSmOrange、光开关蛋白，例如，Dronpa及其组合。

在一些实施方式中，本文所提供的所关心的基因可以任选地包括用于蛋白表达的时间和/或空间控制的编码不稳定结构域的序列(“不稳定序列”)。不稳定序列的非限制性实例包括编码FK506序列、二氢叶酸还原酶(DHFR)序列或其它示例性不稳定序列的序列。

在不存在稳定配体的情况下，通过泛素化降解可操作性连接至不稳定序列的蛋白序列。相反，在存在稳定配体的情况下，蛋白降解受到抑制，借此允许蛋白序列可操作性连接至要活性表达的不稳定序列。作为蛋白表达稳定的阳性控制，可以通过传统方法检测蛋白表达，所述方法包括酶促、放射照相、比色、荧光或其它光谱测定；荧光激活细胞分选(FACS)测定；免疫学测定(例如，酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组织化学)。

不稳定序列的其它实例在本领域中是已知的。在一些实施方式中，不稳定序列是FK506-和雷帕霉素-结合蛋白(FKBP12)序列，并且稳定配体是Shield-1(Shld1)(Banaszynski等人(2012)Cell 126(5):995-1004，该文献以其全部内容作为参考并入本文)。在一些实施方式中，不稳定序列是DHFR序列，并且稳定配体是甲氧苄啶(TMP)(Iwamoto等人(2010)Chem Biol 17:981-988，该文献以其全部内容作为参考并入本文)。在一些实施方式中，不稳定结构域是小分子辅助关闭(small molecule-assisted shutoff，SMASh)，其中将组成型降解决定子与蛋白酶及其来源于丙型肝炎病毒的相应切割位点组合。在一些实施方式中，不稳定结构域包含HaloTag系统、dTag系统和/或纳米抗体(参见，例如，Luh等人,Prey for the proteasome:targeted protein degradation-amedicinal chemist’sperspective；Angewandte Chemie,2020)。

在一些实施方式中，不稳定序列可以用于暂时控制如本文所描述的修饰的细胞。

在一些实施方式中，所关心的基因产物可以是自杀基因(参见，例如，Zarogoulidis等人,Suicide Gene Therapy for Cancer-Current Strategies；J GenetSyndr Gene Ther.2013)。在一些实施方式中，自杀基因可以使用基因介导的酶前药疗法(GDEPT)方法、二聚化诱导方法和/或治疗性单克隆抗体介导的方法。在一些实施方式中，自杀基因是生物学惰性的，具有充分的生物利用度谱、充分的生物分布谱并且可以以固有可接受的毒性和/或无毒性为特征。在一些实施方式中，自杀基因编码能够在细胞水平将无毒前药转化为毒性产物的蛋白。在一些实施方式中，自杀基因可以改善本文所描述的细胞的安全性谱(参见，例如，Greco等人,Improving the safety of cell therapy with theTK-suicide gene；Front Pharmacology.2015；Jones等人,Improving the safety ofcell therapy products by suicide gene transfer；Frontiers Pharmacology,2014)。在一些实施方式中，自杀基因是单纯疱疹病毒胸苷激酶(HSV-TK)。在一些实施方式中，自杀基因是胞嘧啶脱氨酶(CD)。在一些实施方式中，自杀基因是凋亡基因(例如，半胱天冬氨酸酶)。在一些实施方式中，自杀基因是二聚化诱导，例如，包含可诱导FAS(iFAS)或可诱导半胱天冬氨酸酶9((iCasp9)/AP1903系统。在一些实施方式中，自杀基因是CD20抗原，并且可以通过临床级抗-CD20抗体施用消除表达这种抗原的细胞。在一些实施方式中，自杀基因是截短的人EGFR多肽(huEGFRt)，其赋予对药物级抗-EGFR单克隆抗体，例如，西妥昔单抗的敏感性。在一些实施方式中，自杀基因是c-myc标签，其赋予对药物级抗-cmyc抗体的敏感性。

SEQ ID NO：161-示例性DHFR不稳定氨基酸序列

MISLIAALAVDYVIGMENAMPWNLPADLAWFKRNTLNKPVIMGRHTWESIGRPLPGRKNIILSSQPSTDDRVTWVKSVDEAIAACGDVPEIMVIGGGRVIEQFLPKAQKLYLTHIDAEVEGDTHFPDYEPDDWESVFSEFHDADAQNSHSYCFEILERR

SEQ ID NO：162-示例性DHFR不稳定核苷酸序列

GGTACCATCAGTCTGATTGCGGCGTTAGCGGTAGATTACGTTATCGGCATGGAAAACGCCATGCCGTGGAACCTGCCTGCCGATCTCGCCTGGTTTAAACGCAACACCTTAAATAAACCCGTGATTATGGGCCGCCATACCTGGGAATCAATCGGTCGTCCGTTGCCAGGACGCAAAAATATTATCCTCAGCAGTCAACCGAGTACGGACGATCGCGTAACGTGGGTGAAGTCGGTGGATGAAGCCATCGCGGCGTGTGGTGACGTACCAGAAATCATGGTGATTGGCGGCGGTCGCGTTATTGAACAGTTCTTGCCAAAAGCGCAAAAACTGTATCTGACGCATATCGACGCAGAAGTGGAAGGCGACACCCATTTCCCGGATTACGAGCCGGATGACTGGGAATCGGTATTCAGCGAATTCCACGATGCTGATGCGCAGAACTCTCACAGCTATTGCTTTGAGATTCTGGAGCGGCGATAA

SEQ ID NO：163-示例性不稳定结构域

ATCAGTCTGATTGCGGCGTTAGCGGTAGATTACGTTATCGGCATGGAAAACGCCATGCCGTGGAACCTGCCTGCCGATCTCGCCTGGTTTAAACGCAACACCTTAAATAAACCCGTGATTATGGGCCGCCATACCTGGGAATCAATCGGTCGTCCGTTGCCAGGACGCAAAAATATTATCCTCAGCAGTCAACCGAGTACGGACGATCGCGTAACGTGGGTGAAGTCGGTGGATGAAGCCATCGCGGCGTGTGGTGACGTACCAGAAATCATGGTGATTGGCGGCGGTCGCGTTATTGAACAGTTCTTGCCAAAAGCGCAAAAACTGTATCTGACGCATATCGACGCAGAAGTGGAAGGCGACACCCATTTCCCGGATTACGAGCCGGATGACTGGGAATCGGTATTCAGCGAATTCCACGATGCTGATGCGCAGAACTCTCACAGCTATTGCTTTGAGATTCTGGAGCGGCGA

SEQ ID NO：164-示例性FKBP12不稳定肽氨基酸序列

MGVEKQVIRPGNGPKPAPGQTVTVHCTGFGKDGDLSQKFWSTKDEGQKPFSFQIGKGAVIKGWDEGVIGMQIGEVARLRCSSDYAYGAGGFPAWGIQPNSVLDFEIEVLSVQ

在一些实施方式中，单个所关心的基因产物的编码序列可以包括在敲入盒中。在一些实施方式中，两个所关心的基因产物的编码序列可以包括在单个敲入盒中；在一些实施方式中，这可以被称为双顺反子或多顺反子构建体。在一些实施方式中，大于两个所关心的基因产物的编码序列可以包括在单个敲入盒中；在一些实施方式中，这可以被称为多顺反子构建体。在一些实施方式中，当不止一个所关心的基因产物的不止一个编码序列包括在敲入盒中时，这些序列可以具有连接它们的接头序列。接头序列在本领域中是通常已知的，在SEQ ID NO：164000中标识了示例性接头序列。在一些实施方式中，当不止一个所关心的基因产物的不止一个编码序列包括在敲入盒中时，可以通过接头序列、IRES和/或2A元件连接这些序列。

在一些实施方式中，编码所关心的基因产物的多核苷酸包括SEQ ID NO：162-163、165-182或164000中任一项所示的序列或者由其组成。在一些实施方式中，编码所关心的基因产物的多核苷酸包含与SEQ ID NO：162-163、165-182或164000中任一项具有至少85％、90％、95％、96％、97％、98％、99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％或99.9％的同一性的序列或者由其组成。在一些实施方式中，编码所关心的基因产物的多核苷酸包括SEQ ID NO：162-163、165-182或164000中任一项所示的功能性变体或者由其组成。在一些实施方式中，编码所关心的基因产物的多核苷酸包含相对于SEQID NO：162-163、165-182或164000中任一项具有1、2、3、4、5、6、7、8、9或10个突变(例如，替换、插入和/或缺失)的核苷酸序列或由其组成。

SEQ ID NO：164000-示例性接头序列

TCTGGCGGAGGAAGCGGAGGCGGAGGATCTGGTGGTGGTGGATCTGGCGGCGGTGGTAGTGGCGGAGGTTCTCTGCAA

SEQ ID NO：165-示例性CD16敲入盒序列

ATGTGGCAACTGCTGCTGCCTACAGCTCTGCTGCTTCTGGTGTCTGCCGGCATGAGAACCGAGGATCTGCCTAAGGCCGTGGTGTTCCTGGAACCTCAGTGGTACAGAGTGCTGGAAAAGGACAGCGTGACCCTGAAGTGCCAGGGCGCCTATTCTCCCGAGGACAATAGCACCCAGTGGTTCCACAACGAGAGCCTGATCAGCAGCCAGGCCAGCAGCTACTTTATCGATGCCGCCACCGTGGACGACAGCGGCGAGTACAGATGCCAGACCAATCTGAGCACCCTGAGCGACCCTGTGCAGCTGGAAGTGCACATTGGATGGTTGCTGCTGCAAGCCCCTAGATGGGTGTTCAAAGAAGAGGACCCCATCCACCTGAGATGCCACTCTTGGAAGAACACAGCCCTGCACAAAGTGACCTACCTGCAGAACGGCAAGGGCAGAAAGTACTTCCACCACAACAGCGACTTCTACATCCCCAAGGCCACACTGAAGGACTCCGGCTCCTACTTCTGCAGAGGCCTGGTCGGCAGCAAGAACGTGTCCAGCGAGACAGTGAACATCACCATCACACAGGGCCTCGCCGTGTCTACCATCAGCAGCTTTTTCCCACCTGGCTATCAGGTGTCCTTCTGCCTGGTCATGGTGCTGCTGTTCGCCGTGGATACCGGCCTGTACTTCAGCGTCAAGACCAACATCCGGTCCAGCACCAGAGACTGGAAGGACCACAAGTTCAAGTGGCGGAAGGACCCTCAGGACAAGTAA

SEQ ID NO：166-示例性CD16敲入盒序列

ATGTGGCAGCTGTTGCTGCCGACAGCCCTCCTGTTGCTGGTCTCCGCTGGCATGAGAACCGAGGATCTGCCTAAGGCCGTGGTGTTCCTGGAACCTCAGTGGTACAGAGTGCTGGAAAAGGACAGCGTGACCCTGAAGTGCCAGGGCGCCTATTCTCCCGAGGACAATAGCACCCAGTGGTTCCACAACGAGAGCCTGATCAGCAGCCAGGCCAGCAGCTACTTTATCGATGCCGCCACCGTGGACGACAGCGGCGAGTACAGATGCCAGACCAATCTGAGCACCCTGAGCGACCCTGTGCAGCTGGAAGTGCACATTGGATGGTTGCTGCTGCAAGCCCCTAGATGGGTGTTCAAAGAAGAGGACCCCATCCACCTGAGATGCCACTCTTGGAAGAACACAGCCCTGCACAAAGTGACCTACCTGCAGAACGGCAAGGGCAGAAAGTACTTCCACCACAACAGCGACTTCTACATCCCCAAGGCCACACTGAAGGACTCCGGCTCCTACTTCTGCAGAGGCCTGGTCGGCAGCAAGAACGTGTCCAGCGAGACAGTGAACATCACCATCACACAGGGCCTCGCCGTGTCTACCATCAGCAGCTTTTTCCCACCTGGCTATCAGGTGTCCTTCTGCCTGGTCATGGTGCTGCTGTTCGCCGTGGATACCGGCCTGTACTTCAGCGTCAAGACCAACATCCGGTCCAGCACCAGAGACTGGAAGGACCACAAGTTCAAGTGGCGGAAGGACCCTCAGGACAAG

SEQ ID NO：167-示例性CD47敲入盒序列

ATGTGGCCCCTGGTAGCGGCGCTGTTGCTGGGCTCGGCGTGCTGCGGATCAGCTCAGCTACTATTTAATAAAACAAAATCTGTAGAATTCACGTTTTGTAATGACACTGTCGTCATTCCATGCTTTGTTACTAATATGGAGGCACAAAACACTACTGAAGTATACGTAAAGTGGAAATTTAAAGGAAGAGATATTTACACCTTTGATGGAGCTCTAAACAAGTCCACTGTCCCCACTGACTTTAGTAGTGCAAAAATTGAAGTCTCACAATTACTAAAAGGAGATGCCTCTTTGAAGATGGATAAGAGTGATGCTGTCTCACACACAGGAAACTACACTTGTGAAGTAACAGAATTAACCAGAGAAGGTGAAACGATCATCGAGCTAAAATATCGTGTTGTTTCATGGTTTTCTCCAAATGAAAATATTCTTATTGTTATTTTCCCAATTTTTGCTATACTCCTGTTCTGGGGACAGTTTGGTATTAAAACACTTAAATATAGATCCGGTGGTATGGATGAGAAAACAATTGCTTTACTTGTTGCTGGACTAGTGATCACTGTCATTGTCATTGTTGGAGCCATTCTTTTCGTCCCAGGTGAATATTCATTAAAGAATGCTACTGGCCTTGGTTTAATTGTGACTTCTACAGGGATATTAATATTACTTCACTACTATGTGTTTAGTACAGCGATTGGATTAACCTCCTTCGTCATTGCCATATTGGTTATTCAGGTGATAGCCTATATCCTCGCTGTGGTTGGACTGAGTCTCTGTATTGCGGCGTGTATACCAATGCATGGCCCTCTTCTGATTTCAGGTTTGAGTATCTTAGCTCTAGCACAATTACTTGGACTAGTTTATATGAAATTTGTGGCTTCCAATCAGAAGACTATACAACCTCCTAGGAAAGCTGTAGAGGAACCCCTTAATGCATTCAAAGAATCAAAAGGAATGATGAATGATGAATGA

SEQ ID NO：168-示例性IL15敲入盒序列

AATTGGGTCAACGTGATCAGCGACCTGAAGAAGATCGAGGACCTGATCCAGAGCATGCACATCGACGCCACACTGTACACCGAGTCCGATGTGCACCCTAGCTGCAAAGTGACCGCCATGAAGTGCTTTCTGCTGGAACTGCAAGTGATCAGCCTGGAAAGCGGCGACGCCAGCATCCACGATACCGTGGAAAACCTGATCATCCTGGCCAACAACAGCCTGAGCAGCAACGGCAATGTGACCGAGAGCGGCTGCAAAGAGTGCGAGGAACTGGAAGAGAAGAACATCAAAGAGTTCCTCCAGAGCTTCGTCCACATCGTGCAGATGTTCATCAACACCAGC

SEQ ID NO：169-示例性IgE-IL15敲入盒序列

ATGGATTGGACCTGGATCCTGTTTCTGGTGGCCGCTGCCACAAGAGTGCACAGCAATTGGGTCAACGTGATCAGCGACCTGAAGAAGATCGAGGACCTGATCCAGAGCATGCACATCGACGCCACACTGTACACCGAGTCCGATGTGCACCCTAGCTGCAAAGTGACCGCCATGAAGTGCTTTCTGCTGGAACTGCAAGTGATCAGCCTGGAAAGCGGCGACGCCAGCATCCACGATACCGTGGAAAACCTGATCATCCTGGCCAACAACAGCCTGAGCAGCAACGGCAATGTGACCGAGAGCGGCTGCAAAGAGTGCGAGGAACTGGAAGAGAAGAACATCAAAGAGTTCCTCCAGAGCTTCGTCCACATCGTGCAGATGTTCATCAACACCAGC

SEQ ID NO：170-示例性IgE-IL15前肽货物序列

ATGGACTGGACCTGGATTCTGTTCCTGGTCGCGGCTGCAACGCGAGTCCATAGCGGTATCCATGTTTTTATTCTTGGGTGTTTTTCTGCTGGGCTGCCTAAGACCGAGGCCAACTGGGTAAATGTCATCAGTGACCTCAAGAAAATAGAAGACCTTATACAAAGCATGCACATTGATGCTACTCTCTACACTGAGTCAGATGTACATCCCTCATGCAAAGTGACGGCCATGAAATGTTTCCTCCTCGAACTTCAAGTCATATCTCTGGAAAGTGGCGACGCGTCCATCCACGACACGGTCGAAAACCTGATAATACTCGCTAATAATAGTCTCTCTTCAAATGGTAACGTAACCGAGTCAGGTTGCAAAGAGTGCGAAGAGTTGGAAGAAAAAAACATAAAGGAGTTCCTGCAAAGTTTCGTGCACATTGTGCAGATGTTCATTAATACCTCT

SEQ ID NO：171-示例性IL15Rα货物序列

ATCACCTGTCCTCCACCTATGAGCGTGGAACACGCCGACATCTGGGTCAAGAGCTACAGCCTGTACAGCAGAGAGCGGTACATCTGCAACAGCGGCTTCAAGAGAAAGGCCGGCACAAGCAGCCTGACCGAGTGTGTGCTGAACAAGGCCACAAACGTGGCCCACTGGACCACACCTAGCCTGAAGTGCATCAGAGATCCCGCTCTGGTTCATCAGAGGCCTGCCCCTCCATCTACAGTGACAACAGCTGGCGTGACCCCTCAGCCTGAGTCTCTGTCTCCATCTGGAAAAGAGCCTGCCGCCAGCTCTCCCAGCTCTAACAATACTGCTGCCACCACAGCCGCTATCGTGCCTGGATCTCAGCTGATGCCTAGCAAGAGCCCTAGCACCGGCACAACAGAGATCAGCTCTCACGAGAGCAGCCACGGAACACCTTCTCAGACCACCGCCAAGAATTGGGAGCTGACAGCCTCTGCCTCTCATCAGCCACCTGGCGTGTACCCACAGGGCCACTCTGATACAACAGTGGCCATCAGCACCAGCACCGTTCTGCTGTGTGGCCTGTCTGCTGTTAGCCTGCTGGCCTGCTACCTGAAGTCTAGACAGACACCTCCTCTGGCCAGCGTGGAAATGGAAGCCATGGAAGCTCTGCCTGTCACATGGGGCACCAGCAGCAGAGATGAGGACCTCGAGAATTGCAGCCACCACCTG

SEQ ID NO：172-示例性mbIL-15货物序列

ATGGATTGGACCTGGATCCTGTTTCTGGTGGCCGCTGCCACAAGAGTGCACAGCAATTGGGTCAACGTGATCAGCGACCTGAAGAAGATCGAGGACCTGATCCAGAGCATGCACATCGACGCCACACTGTACACCGAGTCCGATGTGCACCCTAGCTGCAAAGTGACCGCCATGAAGTGCTTTCTGCTGGAACTGCAAGTGATCAGCCTGGAAAGCGGCGACGCCAGCATCCACGATACCGTGGAAAACCTGATCATCCTGGCCAACAACAGCCTGAGCAGCAACGGCAATGTGACCGAGAGCGGCTGCAAAGAGTGCGAGGAACTGGAAGAGAAGAACATCAAAGAGTTCCTCCAGAGCTTCGTCCACATCGTGCAGATGTTCATCAACACCAGCTCTGGCGGAGGAAGCGGAGGCGGAGGATCTGGTGGTGGTGGATCTGGCGGCGGTGGTAGTGGCGGAGGTTCTCTGCAAATCACCTGTCCTCCACCTATGAGCGTGGAACACGCCGACATCTGGGTCAAGAGCTACAGCCTGTACAGCAGAGAGCGGTACATCTGCAACAGCGGCTTCAAGAGAAAGGCCGGCACAAGCAGCCTGACCGAGTGTGTGCTGAACAAGGCCACAAACGTGGCCCACTGGACCACACCTAGCCTGAAGTGCATCAGAGATCCCGCTCTGGTTCATCAGAGGCCTGCCCCTCCATCTACAGTGACAACAGCTGGCGTGACCCCTCAGCCTGAGTCTCTGTCTCCATCTGGAAAAGAGCCTGCCGCCAGCTCTCCCAGCTCTAACAATACTGCTGCCACCACAGCCGCTATCGTGCCTGGATCTCAGCTGATGCCTAGCAAGAGCCCTAGCACCGGCACAACAGAGATCAGCTCTCACGAGAGCAGCCACGGAACACCTTCTCAGACCACCGCCAAGAATTGGGAGCTGACAGCCTCTGCCTCTCATCAGCCACCTGGCGTGTACCCACAGGGCCACTCTGATACAACAGTGGCCATCAGCACCAGCACCGTTCTGCTGTGTGGCCTGTCTGCTGTTAGCCTGCTGGCCTGCTACCTGAAGTCTAGACAGACACCTCCTCTGGCCAGCGTGGAAATGGAAGCCATGGAAGCTCTGCCTGTCACATGGGGCACCAGCAGCAGAGATGAGGACCTCGAGAATTGCAGCCACCACCTG

SEQ ID NO：173-示例性mbIL-15货物序列

ATGGACTGGACCTGGATTCTGTTCCTGGTCGCGGCTGCAACGCGAGTCCATAGCGGTATCCATGTTTTTATTCTTGGGTGTTTTTCTGCTGGGCTGCCTAAGACCGAGGCCAACTGGGTAAATGTCATCAGTGACCTCAAGAAAATAGAAGACCTTATACAAAGCATGCACATTGATGCTACTCTCTACACTGAGTCAGATGTACATCCCTCATGCAAAGTGACGGCCATGAAATGTTTCCTCCTCGAACTTCAAGTCATATCTCTGGAAAGTGGCGACGCGTCCATCCACGACACGGTCGAAAACCTGATAATACTCGCTAATAATAGTCTCTCTTCAAATGGTAACGTAACCGAGTCAGGTTGCAAAGAGTGCGAAGAGTTGGAAGAAAAAAACATAAAGGAGTTCCTGCAAAGTTTCGTGCACATTGTGCAGATGTTCATTAATACCTCTAGCGGCGGAGGATCAGGTGGCGGTGGAAGCGGAGGTGGAGGCTCCGGTGGAGGAGGTAGTGGCGGAGGTTCTCTTCAAATAACTTGTCCTCCACCGATGTCCGTAGAACATGCGGATATTTGGGTAAAATCCTATAGCTTGTACAGCCGAGAGCGGTATATCTGCAACAGCGGCTTCAAGCGGAAGGCCGGCACAAGCAGCCTGACCGAGTGCGTGCTGAACAAGGCCACCAACGTGGCCCACTGGACCACCCCTAGCCTGAAGTGCATCAGAGATCCCGCCCTGGTGCATCAGCGGCCTGCCCCTCCAAGCACAGTGACAACAGCTGGCGTGACCCCCCAGCCTGAGAGCCTGAGCCCTTCTGGAAAAGAGCCTGCCGCCAGCAGCCCCAGCAGCAACAATACTGCCGCCACCACAGCCGCCATCGTGCCTGGATCTCAGCTGATGCCCAGCAAGAGCCCTAGCACCGGCACCACCGAGATCAGCAGCCACGAGTCTAGCCACGGCACCCCATCTCAGACCACCGCCAAGAACTGGGAGCTGACAGCCAGCGCCTCTCACCAGCCTCCAGGCGTGTACCCTCAGGGCCACAGCGATACCACAGTGGCCATCAGCACCTCCACCGTGCTGCTGTGTGGACTGAGCGCCGTGTCACTGCTGGCCTGCTACCTGAAGTCCAGACAGACCCCTCCACTGGCCAGCGTGGAAATGGAAGCCATGGAAGCACTGCCCGTGACCTGGGGCACCAGCTCCAGAGATGAGGATCTGGAAAACTGCTCCCACCACCTG

SEQ ID NO：174-示例性多顺反子CD16，mbIL-15货物序列

ATGTGGCAGCTGTTGCTGCCGACAGCCCTCCTGTTGCTGGTCTCCGCTGGCATGAGAACCGAGGATCTGCCTAAGGCCGTGGTGTTCCTGGAACCTCAGTGGTACAGAGTGCTGGAAAAGGACAGCGTGACCCTGAAGTGCCAGGGCGCCTATTCTCCCGAGGACAATAGCACCCAGTGGTTCCACAACGAGAGCCTGATCAGCAGCCAGGCCAGCAGCTACTTTATCGATGCCGCCACCGTGGACGACAGCGGCGAGTACAGATGCCAGACCAATCTGAGCACCCTGAGCGACCCTGTGCAGCTGGAAGTGCACATTGGATGGTTGCTGCTGCAAGCCCCTAGATGGGTGTTCAAAGAAGAGGACCCCATCCACCTGAGATGCCACTCTTGGAAGAACACAGCCCTGCACAAAGTGACCTACCTGCAGAACGGCAAGGGCAGAAAGTACTTCCACCACAACAGCGACTTCTACATCCCCAAGGCCACACTGAAGGACTCCGGCTCCTACTTCTGCAGAGGCCTGGTCGGCAGCAAGAACGTGTCCAGCGAGACAGTGAACATCACCATCACACAGGGCCTCGCCGTGTCTACCATCAGCAGCTTTTTCCCACCTGGCTATCAGGTGTCCTTCTGCCTGGTCATGGTGCTGCTGTTCGCCGTGGATACCGGCCTGTACTTCAGCGTCAAGACCAACATCCGGTCCAGCACCAGAGACTGGAAGGACCACAAGTTCAAGTGGCGGAAGGACCCTCAGGACAAGGGAAGCGGAGCCACAAACTTCTCTCTGCTGAAGCAGGCAGGAGATGTTGAAGAAAACCCTGGACCTATGGATTGGACCTGGATCCTGTTTCTGGTGGCCGCTGCCACAAGAGTGCACAGCAATTGGGTCAACGTGATCAGCGACCTGAAGAAGATCGAGGACCTGATCCAGAGCATGCACATCGACGCCACACTGTACACCGAGTCCGATGTGCACCCTAGCTGCAAAGTGACCGCCATGAAGTGCTTTCTGCTGGAACTGCAAGTGATCAGCCTGGAAAGCGGCGACGCCAGCATCCACGATACCGTGGAAAACCTGATCATCCTGGCCAACAACAGCCTGAGCAGCAACGGCAATGTGACCGAGAGCGGCTGCAAAGAGTGCGAGGAACTGGAAGAGAAGAACATCAAAGAGTTCCTCCAGAGCTTCGTCCACATCGTGCAGATGTTCATCAACACCAGCTCTGGCGGAGGAAGCGGAGGCGGAGGATCTGGTGGTGGTGGATCTGGCGGCGGTGGTAGTGGCGGAGGTTCTCTGCAAATCACCTGTCCTCCACCTATGAGCGTGGAACACGCCGACATCTGGGTCAAGAGCTACAGCCTGTACAGCAGAGAGCGGTACATCTGCAACAGCGGCTTCAAGAGAAAGGCCGGCACAAGCAGCCTGACCGAGTGTGTGCTGAACAAGGCCACAAACGTGGCCCACTGGACCACACCTAGCCTGAAGTGCATCAGAGATCCCGCTCTGGTTCATCAGAGGCCTGCCCCTCCATCTACAGTGACAACAGCTGGCGTGACCCCTCAGCCTGAGTCTCTGTCTCCATCTGGAAAAGAGCCTGCCGCCAGCTCTCCCAGCTCTAACAATACTGCTGCCACCACAGCCGCTATCGTGCCTGGATCTCAGCTGATGCCTAGCAAGAGCCCTAGCACCGGCACAACAGAGATCAGCTCTCACGAGAGCAGCCACGGAACACCTTCTCAGACCACCGCCAAGAATTGGGAGCTGACAGCCTCTGCCTCTCATCAGCCACCTGGCGTGTACCCACAGGGCCACTCTGATACAACAGTGGCCATCAGCACCAGCACCGTTCTGCTGTGTGGCCTGTCTGCTGTTAGCCTGCTGGCCTGCTACCTGAAGTCTAGACAGACACCTCCTCTGGCCAGCGTGGAAATGGAAGCCATGGAAGCTCTGCCTGTCACATGGGGCACCAGCAGCAGAGATGAGGACCTCGAGAATTGCAGCCACCACCTG

SEQ ID NO：175-示例性CD19 CAR货物序列

ATGCTTCTCCTGGTGACAAGCCTTCTGCTCTGTGAGTTACCACACCCAGCATTCCTCCTGATCCCAGACATCCAGATGACACAGACTACATCCTCCCTGTCTGCCTCTCTGGGAGACAGAGTCACCATCAGTTGCAGGGCAAGTCAGGACATTAGTAAATATTTAAATTGGTATCAGCAGAAACCAGATGGAACTGTTAAACTCCTGATCTACCATACATCAAGATTACACTCAGGAGTCCCATCAAGGTTCAGTGGCAGTGGGTCTGGAACAGATTATTCTCTCACCATTAGCAACCTGGAGCAAGAAGATATTGCCACTTACTTTTGCCAACAGGGTAATACGCTTCCGTACACGTTCGGAGGGGGGACTAAGTTGGAAATAACAGGCTCCACCTCTGGATCCGGCAAGCCCGGATCTGGCGAGGGATCCACCAAGGGCGAGGTGAAACTGCAGGAGTCAGGACCTGGCCTGGTGGCGCCCTCACAGAGCCTGTCCGTCACATGCACTGTCTCAGGGGTCTCATTACCCGACTATGGTGTAAGCTGGATTCGCCAGCCTCCACGAAAGGGTCTGGAGTGGCTGGGAGTAATATGGGGTAGTGAAACCACATACTATAATTCAGCTCTCAAATCCAGACTGACCATCATCAAGGACAACTCCAAGAGCCAAGTTTTCTTAAAAATGAACAGTCTGCAAACTGATGACACAGCCATTTACTACTGTGCCAAACATTATTACTACGGTGGTAGCTATGCTATGGACTACTGGGGTCAAGGAACCTCAGTCACCGTCTCCTCAGCGGCCGCAATTGAAGTTATGTATCCTCCTCCTTACCTAGACAATGAGAAGAGCAATGGAACCATTATCCATGTGAAAGGGAAACACCTTTGTCCAAGTCCCCTATTTCCCGGACCTTCTAAGCCCTTTTGGGTGCTGGTGGTGGTTGGGGGAGTCCTGGCTTGCTATAGCTTGCTAGTAACAGTGGCCTTTATTATTTTCTGGGTGAGGAGTAAGAGGAGCAGGCTCCTGCACAGTGACTACATGAACATGACTCCCCGCCGCCCCGGGCCCACCCGCAAGCATTACCAGCCCTATGCCCCACCACGCGACTTCGCAGCCTATCGCTCCAGAGTGAAGTTCAGCAGGAGCGCAGACGCCCCCGCGTACCAGCAGGGCCAGAACCAGCTCTATAACGAGCTCAATCTAGGACGAAGAGAGGAGTACGATGTTTTGGACAAGAGACGTGGCCGGGACCCTGAGATGGGGGGAAAGCCGAGAAGGAAGAACCCTCAGGAAGGCCTGTACAATGAACTGCAGAAAGATAAGATGGCGGAGGCCTACAGTGAGATTGGGATGAAAGGCGAGCGCCGGAGGGGCAAGGGGCACGATGGCCTTTACCAGGGTCTCAGTACAGCCACCAAGGACACCTACGACGCCCTTCACATGCAGGCCCTGCCCCCTCGCTAA

SEQ ID NO：176-示例性EGFR CAR货物序列

ATGGCACTCCCCGTCACCGCCCTTCTCTTGCCCCTCGCCCTGCTGCTGCATGCTGCCAGGCCCATGGACGAAGTGCAGCTCGTGGAGTCCGGTGGAGGACTCGTCCAACCGGGCGGATCCCTTCGCTTGTCCTGCGCCGCATCAGGCTTCAGCTTCACCAACTATGGCGTCCACTGGGTCAGACAGGCCCCCGGAAAGGGACTGGAATGGGTGTCCGTGATCTGGAGCGGCGGGAACACCGACTACAACACCTCCGTGAAGGGCCGGTTCACTATTAGCCGCGACAACTCCAAGAACACTCTGTACCTCCAAATGAACTCCCTGAGGGCCGAAGATACTGCTGTGTACTATTGCGCGAGAGCCCTGACCTACTACGACTACGAGTTCGCGTACTGGGGCCAGGGGACTCTCGTGACCGTGTCCAGCGGTGGTGGAGGTTCCGGAGGCGGAGGTTCTGGTGGCGGGGGATCAGAAATCGTGCTGACTCAGTCCCCTGCGACCTTGTCCCTGAGCCCTGGAGAACGGGCCACCCTGAGCTGTAGAGCCAGCCAGAGCATCGGGACAAATATTCACTGGTACCAGCAGAAACCCGGACAAGCACCACGGCTGCTGATCTACTACGCCTCCGAGTCGATTTCCGGAATCCCGGCTCGCTTTTCGGGGTCTGGATCGGGAACGGACTTCACTCTGACCATCTCGTCGCTGGAACCCGAGGATTTCGCCGTGTACTACTGCCAACAGAACAACAATTGGCCGACCACGTTCGGCCAGGGCACCAAGCTCGAGATTAAGGGATCACTGGAAGCGGCCGCAACCACAACACCTGCTCCAAGGCCCCCCACACCCGCTCCAACTATAGCCAGCCAACCATTGAGCCTCAGACCTGAAGCTTGCAGGCCCGCAGCAGGAGGCGCCGTCCATACGCGAGGCCTGGACTTCGCGTGTGATATTTATATTTGGGCCCCTTTGGCCGGAACATGTGGGGTGTTGCTTCTCTCCCTTGTGATCACTCTGTATTGTAAGCGCGGGAGAAAGAAGCTCCTGTACATCTTCAAGCAGCCTTTTATGCGACCTGTGCAAACCACTCAGGAAGAAGATGGGTGTTCATGCCGCTTCCCCGAGGAGGAAGAAGGAGGGTGTGAACTGAGGGTGAAATTTTCTAGAAGCGCCGATGCTCCCGCATATCAGCAGGGTCAGAATCAGCTCTACAATGAATTGAATCTCGGCAGGCGAGAAGAGTACGATGTTCTGGACAAGAGACGGGGCAGGGATCCCGAGATGGGGGGAAAGCCCCGGAGAAAAAATCCTCAGGAGGGGTTGTACAATGAGCTGCAGAAGGACAAGATGGCTGAAGCCTATAGCGAGATCGGAATGAAAGGCGAAAGACGCAGAGGCAAGGGGCATGACGGTCTGTACCAGGGTCTCTCTACAGCCACCAAGGACACTTATGATGCGTTGCATATGCAAGCCTTGCCACCCCGCTAASEQ ID NO：177-示例性GFP货物序列

ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGA

SEQ ID NO：178-示例性CXCR1货物序列

ATGTCAAATATTACAGATCCACAGATGTGGGATTTTGATGATCTAAATTTCACTGGCATGCCACCTGCAGATGAAGATTACAGCCCCTGTATGCTAGAAACTGAGACACTCAACAAGTATGTTGTGATCATCGCCTATGCCCTAGTGTTCCTGCTGAGCCTGCTGGGAAACTCCCTGGTGATGCTGGTCATCTTATACAGCAGGGTCGGCCGCTCCGTCACTGATGTCTACCTGCTGAACCTGGCCTTGGCCGACCTACTCTTTGCCCTGACCTTGCCCATCTGGGCCGCCTCCAAGGTGAATGGCTGGATTTTTGGCACATTCCTGTGCAAGGTGGTCTCACTCCTGAAGGAAGTCAACTTCTACAGTGGCATCCTGCTGTTGGCCTGCATCAGTGTGGACCGTTACCTGGCCATTGTCCATGCCACACGCACACTGACCCAGAAGCGTCACTTGGTCAAGTTTGTTTGTCTTGGCTGCTGGGGACTGTCTATGAATCTGTCCCTGCCCTTCTTCCTTTTCCGCCAGGCTTACCATCCAAACAATTCCAGTCCAGTTTGCTATGAGGTCCTGGGAAATGACACAGCAAAATGGCGGATGGTGTTGCGGATCCTGCCTCACACCTTTGGCTTCATCGTGCCGCTGTTTGTCATGCTGTTCTGCTATGGATTCACCCTGCGTACACTGTTTAAGGCCCACATGGGGCAGAAGCACCGAGCCATGAGGGTCATCTTTGCTGTCGTCCTCATCTTCCTGCTTTGCTGGCTGCCCTACAACCTGGTCCTGCTGGCAGACACCCTCATGAGGACCCAGGTGATCCAGGAGAGCTGTGAGCGCCGCAACAACATCGGCCGGGCCCTGGATGCCACTGAGATTCTGGGATTTCTCCATAGCTGCCTCAACCCCATCATCTACGCCTTCATCGGCCAAAATTTTCGCCATGGATTCCTCAAGATCCTGGCTATGCATGGCCTGGTCAGCAAGGAGTTCTTGGCACGTCATCGTGTTACCTCCTACACTTCTTCGTCTGTCAATGTCTCTTCCAACCTCTGA

SEQ ID NO：179-示例性CXCR3B货物序列

ATGGAGTTGAGGAAGTACGGCCCTGGAAGACTGGCGGGGACAGTTATAGGAGGAGCTGCTCAGAGTAAATCACAGACTAAATCAGACTCAATCACAAAAGAGTTCCTGCCAGGCCTTTACACAGCCCCTTCCTCCCCGTTCCCGCCCTCACAGGTGAGTGACCACCAAGTGCTAAATGACGCCGAGGTTGCCGCCCTCCTGGAGAACTTCAGCTCTTCCTATGACTATGGAGAAAACGAGAGTGACTCGTGCTGTACCTCCCCGCCCTGCCCACAGGACTTCAGCCTGAACTTCGACCGGGCCTTCCTGCCAGCCCTCTACAGCCTCCTCTTTCTGCTGGGGCTGCTGGGCAACGGCGCGGTGGCAGCCGTGCTGCTGAGCCGGCGGACAGCCCTGAGCAGCACCGACACCTTCCTGCTCCACCTAGCTGTAGCAGACACGCTGCTGGTGCTGACACTGCCGCTCTGGGCAGTGGACGCTGCCGTCCAGTGGGTCTTTGGCTCTGGCCTCTGCAAAGTGGCAGGTGCCCTCTTCAACATCAACTTCTACGCAGGAGCCCTCCTGCTGGCCTGCATCAGCTTTGACCGCTACCTGAACATAGTTCATGCCACCCAGCTCTACCGCCGGGGGCCCCCGGCCCGCGTGACCCTCACCTGCCTGGCTGTCTGGGGGCTCTGCCTGCTTTTCGCCCTCCCAGACTTCATCTTCCTGTCGGCCCACCACGACGAGCGCCTCAACGCCACCCACTGCCAATACAACTTCCCACAGGTGGGCCGCACGGCTCTGCGGGTGCTGCAGCTGGTGGCTGGCTTTCTGCTGCCCCTGCTGGTCATGGCCTACTGCTATGCCCACATCCTGGCCGTGCTGCTGGTTTCCAGGGGCCAGCGGCGCCTGCGGGCCATGCGGCTGGTGGTGGTGGTCGTGGTGGCCTTTGCCCTCTGCTGGACCCCCTATCACCTGGTGGTGCTGGTGGACATCCTCATGGACCTGGGCGCTTTGGCCCGCAACTGTGGCCGAGAAAGCAGGGTAGACGTGGCCAAGTCGGTCACCTCAGGCCTGGGCTACATGCACTGCTGCCTCAACCCGCTGCTCTATGCCTTTGTAGGGGTCAAGTTCCGGGAGCGGATGTGGATGCTGCTCTTGCGCCTGGGCTGCCCCAACCAGAGAGGGCTCCAGAGGCAGCCATCGTCTTCCCGCCGGGATTCATCCTGGTCTGAGACCTCAGAGGCCTCCTACTCGGGCTTGTGA

SEQ ID NO：180-示例性CXCR3A货物序列

ATGGTCCTTGAGGTGAGTGACCACCAAGTGCTAAATGACGCCGAGGTTGCCGCCCTCCTGGAGAACTTCAGCTCTTCCTATGACTATGGAGAAAACGAGAGTGACTCGTGCTGTACCTCCCCGCCCTGCCCACAGGACTTCAGCCTGAACTTCGACCGGGCCTTCCTGCCAGCCCTCTACAGCCTCCTCTTTCTGCTGGGGCTGCTGGGCAACGGCGCGGTGGCAGCCGTGCTGCTGAGCCGGCGGACAGCCCTGAGCAGCACCGACACCTTCCTGCTCCACCTAGCTGTAGCAGACACGCTGCTGGTGCTGACACTGCCGCTCTGGGCAGTGGACGCTGCCGTCCAGTGGGTCTTTGGCTCTGGCCTCTGCAAAGTGGCAGGTGCCCTCTTCAACATCAACTTCTACGCAGGAGCCCTCCTGCTGGCCTGCATCAGCTTTGACCGCTACCTGAACATAGTTCATGCCACCCAGCTCTACCGCCGGGGGCCCCCGGCCCGCGTGACCCTCACCTGCCTGGCTGTCTGGGGGCTCTGCCTGCTTTTCGCCCTCCCAGACTTCATCTTCCTGTCGGCCCACCACGACGAGCGCCTCAACGCCACCCACTGCCAATACAACTTCCCACAGGTGGGCCGCACGGCTCTGCGGGTGCTGCAGCTGGTGGCTGGCTTTCTGCTGCCCCTGCTGGTCATGGCCTACTGCTATGCCCACATCCTGGCCGTGCTGCTGGTTTCCAGGGGCCAGCGGCGCCTGCGGGCCATGCGGCTGGTGGTGGTGGTCGTGGTGGCCTTTGCCCTCTGCTGGACCCCCTATCACCTGGTGGTGCTGGTGGACATCCTCATGGACCTGGGCGCTTTGGCCCGCAACTGTGGCCGAGAAAGCAGGGTAGACGTGGCCAAGTCGGTCACCTCAGGCCTGGGCTACATGCACTGCTGCCTCAACCCGCTGCTCTATGCCTTTGTAGGGGTCAAGTTCCGGGAGCGGATGTGGATGCTGCTCTTGCGCCTGGGCTGCCCCAACCAGAGAGGGCTCCAGAGGCAGCCATCGTCTTCCCGCCGGGATTCATCCTGGTCTGAGACCTCAGAGGCCTCCTACTCGGGCTTGTGASEQ ID NO：181-示例性CCR5货物序列

ATGGATTATCAAGTGTCAAGTCCAATCTATGACATCAATTATTATACATCGGAGCCCTGCCAAAAAATCAATGTGAAGCAAATCGCAGCCCGCCTCCTGCCTCCGCTCTACTCACTGGTGTTCATCTTTGGTTTTGTGGGCAACATGCTGGTCATCCTCATCCTGATAAACTGCAAAAGGCTGAAGAGCATGACTGACATCTACCTGCTCAACCTGGCCATCTCTGACCTGTTTTTCCTTCTTACTGTCCCCTTCTGGGCTCACTATGCTGCCGCCCAGTGGGACTTTGGAAATACAATGTGTCAACTCTTGACAGGGCTCTATTTTATAGGCTTCTTCTCTGGAATCTTCTTCATCATCCTCCTGACAATCGATAGGTACCTGGCTGTCGTCCATGCTGTGTTTGCTTTAAAAGCCAGGACGGTCACCTTTGGGGTGGTGACAAGTGTGATCACTTGGGTGGTGGCTGTGTTTGCGTCTCTCCCAGGAATCATCTTTACCAGATCTCAAAAAGAAGGTCTTCATTACACCTGCAGCTCTCATTTTCCATACAGTCAGTATCAATTCTGGAAGAATTTCCAGACATTAAAGATAGTCATCTTGGGGCTGGTCCTGCCGCTGCTTGTCATGGTCATCTGCTACTCGGGAATCCTAAAAACTCTGCTTCGGTGTCGAAATGAGAAGAAGAGGCACAGGGCTGTGAGGCTTATCTTCACCATCATGATTGTTTATTTTCTCTTCTGGGCTCCCTACAACATTGTCCTTCTCCTGAACACCTTCCAGGAATTCTTTGGCCTGAATAATTGCAGTAGCTCTAACAGGTTGGACCAAGCTATGCAGGTGACAGAGACTCTTGGGATGACGCACTGCTGCATCAACCCCATCATCTATGCCTTTGTCGGGGAGAAGTTCAGAAACTACCTCTTAGTCTTCTTCCAAAAGCACATTGCCAAACGCTTCTGCAAATGCTGTTCTATTTTCCAGCAAGAGGCTCCCGAGCGAGCAAGCTCAGTTTACACCCGATCCACTGGGGAGCAGGAAATATCTGTGGGCTTGTGA

SEQ ID NO：182-示例性CCR2货物序列

ATGCTGTCCACATCTCGTTCTCGGTTTATCAGAAATACCAACGAGAGCGGTGAAGAAGTCACCACCTTTTTTGATTATGATTACGGTGCTCCCTGTCATAAATTTGACGTGAAGCAAATTGGGGCCCAACTCCTGCCTCCGCTCTACTCGCTGGTGTTCATCTTTGGTTTTGTGGGCAACATGCTGGTCGTCCTCATCTTAATAAACTGCAAAAAGCTGAAGTGCTTGACTGACATTTACCTGCTCAACCTGGCCATCTCTGATCTGCTTTTTCTTATTACTCTCCCATTGTGGGCTCACTCTGCTGCAAATGAGTGGGTCTTTGGGAATGCAATGTGCAAATTATTCACAGGGCTGTATCACATCGGTTATTTTGGCGGAATCTTCTTCATCATCCTCCTGACAATCGATAGATACCTGGCTATTGTCCATGCTGTGTTTGCTTTAAAAGCCAGGACGGTCACCTTTGGGGTGGTGACAAGTGTGATCACCTGGTTGGTGGCTGTGTTTGCTTCTGTCCCAGGAATCATCTTTACTAAATGCCAGAAAGAAGATTCTGTTTATGTCTGTGGCCCTTATTTTCCACGAGGATGGAATAATTTCCACACAATAATGAGGAACATTTTGGGGCTGGTCCTGCCGCTGCTCATCATGGTCATCTGCTACTCGGGAATCCTGAAAACCCTGCTTCGGTGTCGAAACGAGAAGAAGAGGCATAGGGCAGTGAGAGTCATCTTCACCATCATGATTGTTTACTTTCTCTTCTGGACTCCCTATAATATTGTCATTCTCCTGAACACCTTCCAGGAATTCTTCGGCCTGAGTAACTGTGAAAGCACCAGTCAACTGGACCAAGCCACGCAGGTGACAGAGACTCTTGGGATGACTCACTGCTGCATCAATCCCATCATCTATGCCTTCGTTGGGGAGAAGTTCAGAAGCCTTTTTCACATAGCTCTTGGCTGTAGGATTGCCCCACTCCAAAAACCAGTGTGTGGAGGTCCAGGAGTGAGACCAGGAAAGAATGTGAAAGTGACTACACAAGGACTCCTCGATGGTCGTGGAAAAGGAAAGTCAATTGGCAGAGCCCCTGAAGCCAGTCTTCAGGACAAAGAAGGAGCCTAG

在一些实施方式中，所关心的基因产物包含SEQ ID NO：161、164或183-200中任一项所示的氨基酸序列或由其组成。在一些实施方式中，所关心的基因产物包含与SEQ IDNO：161、164或183-200中任一项具有至少85％、90％、95％、96％、97％、98％、99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％或99.9％的同一性的氨基酸序列或者由其组成。在一些实施方式中，所关心的基因产物包含SEQ ID NO：161、164或183-200中任一项所示的功能性变体或由其组成。在一些实施方式中，所关心的基因产物包含相对于SEQ ID NO：161、164或183-200中任一项具有1、2、3、4、5、6、7、8、9或10个突变(例如，替换、插入和/或缺失)的氨基酸序列或由其组成。

SEQ ID NO：183-示例性接头氨基酸序列

SGGGSGGGGSGGGGSGGGGSGGGSLQ

SEQ ID NO：184-示例性CD16氨基酸序列

MWQLLLPTALLLLVSAGMRTEDLPKAVVFLEPQWYRVLEKDSVTLKCQGAYSPEDNSTQWFHNESLISSQASSYFIDAATVDDSGEYRCQTNLSTLSDPVQLEVHIGWLLLQAPRWVFKEEDPIHLRCHSWKNTALHKVTYLQNGKGRKYFHHNSDFYIPKATLKDSGSYFCRGLVGSKNVSSETVNITITQGLAVSTISSFFPPGYQVSFCLVMVLLFAVDTGLYFSVKTNIRSSTRDWKDHKFKWRKDPQDK

SEQ ID NO：185-示例性CD47氨基酸序列

MWPLVAALLLGSACCGSAQLLFNKTKSVEFTFCNDTVVIPCFVTNMEAQNTTEVYVKWKFKGRDIYTFDGALNKSTVPTDFSSAKIEVSQLLKGDASLKMDKSDAVSHTGNYTCEVTELTREGETIIELKYRVVSWFSPNENILIVIFPIFAILLFWGQFGIKTLKYRSGGMDEKTIALLVAGLVITVIVIVGAILFVPGEYSLKNATGLGLIVTSTGILILLHYYVFSTAIGLTSFVIAILVIQVIAYILAVVGLSLCIAACIPMHGPLLISGLSILALAQLLGLVYMKFVASNQKTIQPPRKAVEEPLNAFKESKGMMNDE

SEQ ID NO：186-示例性IL15氨基酸序列

NWVNVISDLKKIEDLIQSMHIDATLYTESDVHPSCKVTAMKCFLLELQVISLESGD ASIHDTVENLIILANNSLSSNGNVTESGCKECEELEEKNIKEFLQSFVHIVQMFINTS

SEQ ID NO：187-示例性IgE-IL15氨基酸序列

MDWTWILFLVAAATRVHSNWVNVISDLKKIEDLIQSMHIDATLYTESDVHPSCKVTAMKCFLLELQVISLESGDASIHDTVENLIILANNSLSSNGNVTESGCKECEELEEKNIKEFLQSFVHIVQMFINTS

SEQ ID NO：188-示例性IgE-IL15前肽氨基酸序列

MDWTWILFLVAAATRVHSGIHVFILGCFSAGLPKTEANWVNVISDLKKIEDLIQSMHIDATLYTESDVHPSCKVTAMKCFLLELQVISLESGDASIHDTVENLIILANNSLSSNGNVTESGCKECEELEEKNIKEFLQSFVHIVQMFINTS

SEQ ID NO：189-示例性IL15Rα氨基酸序列

ITCPPPMSVEHADIWVKSYSLYSRERYICNSGFKRKAGTSSLTECVLNKATNVAHWTTPSLKCIRDPALVHQRPAPPSTVTTAGVTPQPESLSPSGKEPAASSPSSNNTAATTAAIVPGSQLMPSKSPSTGTTEISSHESSHGTPSQTTAKNWELTASASHQPPGVYPQGHSDTTVAISTSTVLLCGLSAVSLLACYLKSRQTPPLASVEMEAMEALPVTWGTSSRDEDLENCSHHL

SEQ ID NO：190-示例性mbIL-15氨基酸序列

MDWTWILFLVAAATRVHSNWVNVISDLKKIEDLIQSMHIDATLYTESDVHPSCKVTAMKCFLLELQVISLESGDASIHDTVENLIILANNSLSSNGNVTESGCKECEELEEKNIKEFLQSFVHIVQMFINTSSGGGSGGGGSGGGGSGGGGSGGGSLQITCPPPMSVEHADIWVKSYSLYSRERYICNSGFKRKAGTSSLTECVLNKATNVAHWTTPSLKCIRDPALVHQRPAPPSTVTTAGVTPQPESLSPSGKEPAASSPSSNNTAATTAAIVPGSQLMPSKSPSTGTTEISSHESSHGTPSQTTAKNWELTASASHQPPGVYPQGHSDTTVAISTSTVLLCGLSAVSLLACYLKSRQTPPLASVEMEAMEALPVTWGTSSRDEDLENCSHHL

SEQ ID NO：191-示例性mbIL-15氨基酸序列

MDWTWILFLVAAATRVHSGIHVFILGCFSAGLPKTEANWVNVISDLKKIEDLIQSMHIDATLYTESDVHPSCKVTAMKCFLLELQVISLESGDASIHDTVENLIILANNSLSSNGNVTESGCKECEELEEKNIKEFLQSFVHIVQMFINTSSGGGSGGGGSGGGGSGGGGSGGGSLQITCPPPMSVEHADIWVKSYSLYSRERYICNSGFKRKAGTSSLTECVLNKATNVAHWTTPSLKCIRDPALVHQRPAPPSTVTTAGVTPQPESLSPSGKEPAASSPSSNNTAATTAAIVPGSQLMPSKSPSTGTTEISSHESSHGTPSQTTAKNWELTASASHQPPGVYPQGHSDTTVAISTSTVLLCGLSAVSLLACYLKSRQTPPLASVEMEAMEALPVTWGTSSRDEDLENCSHHL

SEQ ID NO：192-示例性多顺反子CD16，mbIL-15氨基酸序列

MWQLLLPTALLLLVSAGMRTEDLPKAVVFLEPQWYRVLEKDSVTLKCQGAYSPEDNSTQWFHNESLISSQASSYFIDAATVDDSGEYRCQTNLSTLSDPVQLEVHIGWLLLQAPRWVFKEEDPIHLRCHSWKNTALHKVTYLQNGKGRKYFHHNSDFYIPKATLKDSGSYFCRGLVGSKNVSSETVNITITQGLAVSTISSFFPPGYQVSFCLVMVLLFAVDTGLYFSVKTNIRSSTRDWKDHKFKWRKDPQDKGSGATNFSLLKQAGDVEENPGPMDWTWILFLVAAATRVHSNWVNVISDLKKIEDLIQSMHIDATLYTESDVHPSCKVTAMKCFLLELQVISLESGDASIHDTVENLIILANNSLSSNGNVTESGCKECEELEEKNIKEFLQSFVHIVQMFINTSSGGGSGGGGSGGGGSGGGGSGGGSLQITCPPPMSVEHADIWVKSYSLYSRERYICNSGFKRKAGTSSLTECVLNKATNVAHWTTPSLKCIRDPALVHQRPAPPSTVTTAGVTPQPESLSPSGKEPAASSPSSNNTAATTAAIVPGSQLMPSKSPSTGTTEISSHESSHGTPSQTTAKNWELTASASHQPPGVYPQGHSDTTVAISTSTVLLCGLSAVSLLACYLKSRQTPPLASVEMEAMEALPVTWGTSSRDEDLENCSHHL

SEQ ID NO：193-示例性CD19 CAR氨基酸序列

MLLLVTSLLLCELPHPAFLLIPDIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAIEVMYPPPYLDNEKSNGTIIHVKGKHLCPSPLFPGPSKPFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR

SEQ ID NO：194-示例性EGFR CAR氨基酸序列

MALPVTALLLPLALLLHAARPMDEVQLVESGGGLVQPGGSLRLSCAASGFSFTNYGVHWVRQAPGKGLEWVSVIWSGGNTDYNTSVKGRFTISRDNSKNTLYLQMNSLRAEDTAVYYCARALTYYDYEFAYWGQGTLVTVSSGGGGSGGGGSGGGGSEIVLTQSPATLSLSPGERATLSCRASQSIGTNIHWYQQKPGQAPRLLIYYASESISGIPARFSGSGSGTDFTLTISSLEPEDFAVYYCQQNNNWPTTFGQGTKLEIKGSLEAAATTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACDIYIWAPLAGTCGVLLLSLVITLYCKRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCELRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR

SEQ ID NO：195-示例性GFP氨基酸序列

MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYK

SEQ ID NO：196-示例性CXCR1氨基酸序列

MSNITDPQMWDFDDLNFTGMPPADEDYSPCMLETETLNKYVVIIAYALVFLLSLLGNSLVMLVILYSRVGRSVTDVYLLNLALADLLFALTLPIWAASKVNGWIFGTFLCKVVSLLKEVNFYSGILLLACISVDRYLAIVHATRTLTQKRHLVKFVCLGCWGLSMNLSLPFFLFRQAYHPNNSSPVCYEVLGNDTAKWRMVLRILPHTFGFIVPLFVMLFCYGFTLRTLFKAHMGQKHRAMRVIFAVVLIFLLCWLPYNLVLLADTLMRTQVIQESCERRNNIGRALDATEILGFLHSCLNPIIYAFIGQNFRHGFLKILAMHGLVSKEFLARHRVTSYTSSSVNVSSNL

SEQ ID NO：197-示例性CXCR3B氨基酸序列

MELRKYGPGRLAGTVIGGAAQSKSQTKSDSITKEFLPGLYTAPSSPFPPSQVSDHQVLNDAEVAALLENFSSSYDYGENESDSCCTSPPCPQDFSLNFDRAFLPALYSLLFLLGLLGNGAVAAVLLSRRTALSSTDTFLLHLAVADTLLVLTLPLWAVDAAVQWVFGSGLCKVAGALFNINFYAGALLLACISFDRYLNIVHATQLYRRGPPARVTLTCLAVWGLCLLFALPDFIFLSAHHDERLNATHCQYNFPQVGRTALRVLQLVAGFLLPLLVMAYCYAHILAVLLVSRGQRRLRAMRLVVVVVVAFALCWTPYHLVVLVDILMDLGALARNCGRESRVDVAKSVTSGLGYMHCCLNPLLYAFVGVKFRERMWMLLLRLGCPNQRGLQRQPSSSRRDSSWSETSEASYSGL

SEQ ID NO：198-示例性CXCR3A氨基酸序列

MVLEVSDHQVLNDAEVAALLENFSSSYDYGENESDSCCTSPPCPQDFSLNFDRAFLPALYSLLFLLGLLGNGAVAAVLLSRRTALSSTDTFLLHLAVADTLLVLTLPLWAVDAAVQWVFGSGLCKVAGALFNINFYAGALLLACISFDRYLNIVHATQLYRRGPPARVTLTCLAVWGLCLLFALPDFIFLSAHHDERLNATHCQYNFPQVGRTALRVLQLVAGFLLPLLVMAYCYAHILAVLLVSRGQRRLRAMRLVVVVVVAFALCWTPYHLVVLVDILMDLGALARNCGRESRVDVAKSVTSGLGYMHCCLNPLLYAFVGVKFRERMWMLLLRLGCPNQRGLQRQPSSSRRDSSWSETSEASYSGL

SEQ ID NO：199-示例性CCR5氨基酸序列

MDYQVSSPIYDINYYTSEPCQKINVKQIAARLLPPLYSLVFIFGFVGNMLVILILINCKRLKSMTDIYLLNLAISDLFFLLTVPFWAHYAAAQWDFGNTMCQLLTGLYFIGFFSGIFFIILLTIDRYLAVVHAVFALKARTVTFGVVTSVITWVVAVFASLPGIIFTRSQKEGLHYTCSSHFPYSQYQFWKNFQTLKIVILGLVLPLLVMVICYSGILKTLLRCRNEKKRHRAVRLIFTIMIVYFLFWAPYNIVLLLNTFQEFFGLNNCSSSNRLDQAMQVTETLGMTHCCINPIIYAFVGEKFRNYLLVFFQKHIAKRFCKCCSIFQQEAPERASSVYTRSTGEQEISVGL

SEQ ID NO：200-示例性CCR2货物序列

MLSTSRSRFIRNTNESGEEVTTFFDYDYGAPCHKFDVKQIGAQLLPPLYSLVFIFGFVGNMLVVLILINCKKLKCLTDIYLLNLAISDLLFLITLPLWAHSAANEWVFGNAMCKLFTGLYHIGYFGGIFFIILLTIDRYLAIVHAVFALKARTVTFGVVTSVITWLVAVFASVPGIIFTKCQKEDSVYVCGPYFPRGWNNFHTIMRNILGLVLPLLIMVICYSGILKTLLRCRNEKKRHRAVRVIFTIMIVYFLFWTPYNIVILLNTFQEFFGLSNCESTSQLDQATQVTETLGMTHCCINPIIYAFVGEKFRSLFHIALGCRIAPLQKPVCGGPGVRPGKNVKVTTQGLLDGRGKGKSIGRAPEASLQDKEGA

AAV衣壳

在一些实施方式中，本发明公开提供包装到AAV衣壳中的一个或多个多核苷酸构建体(例如，敲入盒)。在一些实施方式中，AAV衣壳来自或来源于AAV2、3、4、5、6、7、8、9或10血清型的AAV衣壳或其一种或多种杂交体。在一些实施方式中，AAV衣壳来自AAV祖先血清型(ancestral serotype)。在一些实施方式中，AAV衣壳是祖先(Anc)AAV衣壳。从使用进化概率和进化建模构建的构建体序列产生Anc衣壳以确定可能的祖先序列。在一些实施方式中，已通过本领域中已知的方式修饰AAV衣壳(参见，例如，Büning and Srivastava,Capsidmodifications for targeting and improving the efficacy of AAV vectors,MolTher Methods Clin Dev.2019)。

在一些实施方式中，如本文所提供的，可以在本发明公开的重组AAV(rAAV)颗粒中使用AAV衣壳和AAV构建体(例如，包含AAV ITR)的任意组合。在一些实施方式中，AAV ITR来自或来源于AAV2、3、4、5、6、7、8、9或10的AAV ITR。例如，野生型或变体AA6 ITR和AAV6衣壳、野生型或变体AAV2 ITR和AAV6衣壳等。在本发明的一些实施方式中，AAV颗粒完全由AAV6组分组成(例如，衣壳和ITR是AAV6血清型)。在一些实施方式中，AAV颗粒是AAV6/2、AAV6/8或AAV6/9颗粒(例如，AAV2、AAV8或AAV9衣壳，它们具有带有AAV6 ITR的AAV构建体)。

示例性AAV构建体

在一些实施方式中，供体模板包括在AAV构建体内。在一些实施方式中，AAV构建体序列包含SEQ ID NO：201-204中任一项所示的序列或由其组成。在一些实施方式中，通过SEQ ID NO：201表示示例性AAV构建体。在一些实施方式中，通过SEQ ID NO：202表示示例性AAV构建体。在一些实施方式中，通过SEQ ID NO：203表示示例性AAV构建体。在一些实施方式中，通过SEQ ID NO：204表示示例性AAV构建体。在一些实施方式中，示例性AAV构建体与SEQ ID NO：201-204所表示的序列具有至少80％、85％、90％、95％、98％或99％的同一性。

SEQ ID NO：201-用于在GAPDH基因座供体模板插入的示例性AAV构建体

CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGTCGACGAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGTGGCAACTGCTGCTGCCTACAGCTCTGCTGCTTCTGGTGTCTGCCGGCATGAGAACCGAGGATCTGCCTAAGGCCGTGGTGTTCCTGGAACCTCAGTGGTACAGAGTGCTGGAAAAGGACAGCGTGACCCTGAAGTGCCAGGGCGCCTATTCTCCCGAGGACAATAGCACCCAGTGGTTCCACAACGAGAGCCTGATCAGCAGCCAGGCCAGCAGCTACTTTATCGATGCCGCCACCGTGGACGACAGCGGCGAGTACAGATGCCAGACCAATCTGAGCACCCTGAGCGACCCTGTGCAGCTGGAAGTGCACATTGGATGGTTGCTGCTGCAAGCCCCTAGATGGGTGTTCAAAGAAGAGGACCCCATCCACCTGAGATGCCACTCTTGGAAGAACACAGCCCTGCACAAAGTGACCTACCTGCAGAACGGCAAGGGCAGAAAGTACTTCCACCACAACAGCGACTTCTACATCCCCAAGGCCACACTGAAGGACTCCGGCTCCTACTTCTGCAGAGGCCTGGTCGGCAGCAAGAACGTGTCCAGCGAGACAGTGAACATCACCATCACACAGGGCCTCGCCGTGTCTACCATCAGCAGCTTTTTCCCACCTGGCTATCAGGTGTCCTTCTGCCTGGTCATGGTGCTGCTGTTCGCCGTGGATACCGGCCTGTACTTCAGCGTCAAGACCAACATCCGGTCCAGCACCAGAGACTGGAAGGACCACAAGTTCAAGTGGCGGAAGGACCCTCAGGACAAGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGTAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG

SEQ ID NO：202-用于在GAPDH基因座供体模板插入的示例性AAV构建体

CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGTCGACGAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGTAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG

SEQ ID NO：203-用于在GAPDH基因座供体模板插入的示例性AAV构建体

CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGTCGACGAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGCTTCTCCTGGTGACAAGCCTTCTGCTCTGTGAGTTACCACACCCAGCATTCCTCCTGATCCCAGACATCCAGATGACACAGACTACATCCTCCCTGTCTGCCTCTCTGGGAGACAGAGTCACCATCAGTTGCAGGGCAAGTCAGGACATTAGTAAATATTTAAATTGGTATCAGCAGAAACCAGATGGAACTGTTAAACTCCTGATCTACCATACATCAAGATTACACTCAGGAGTCCCATCAAGGTTCAGTGGCAGTGGGTCTGGAACAGATTATTCTCTCACCATTAGCAACCTGGAGCAAGAAGATATTGCCACTTACTTTTGCCAACAGGGTAATACGCTTCCGTACACGTTCGGAGGGGGGACTAAGTTGGAAATAACAGGCTCCACCTCTGGATCCGGCAAGCCCGGATCTGGCGAGGGATCCACCAAGGGCGAGGTGAAACTGCAGGAGTCAGGACCTGGCCTGGTGGCGCCCTCACAGAGCCTGTCCGTCACATGCACTGTCTCAGGGGTCTCATTACCCGACTATGGTGTAAGCTGGATTCGCCAGCCTCCACGAAAGGGTCTGGAGTGGCTGGGAGTAATATGGGGTAGTGAAACCACATACTATAATTCAGCTCTCAAATCCAGACTGACCATCATCAAGGACAACTCCAAGAGCCAAGTTTTCTTAAAAATGAACAGTCTGCAAACTGATGACACAGCCATTTACTACTGTGCCAAACATTATTACTACGGTGGTAGCTATGCTATGGACTACTGGGGTCAAGGAACCTCAGTCACCGTCTCCTCAGCGGCCGCAATTGAAGTTATGTATCCTCCTCCTTACCTAGACAATGAGAAGAGCAATGGAACCATTATCCATGTGAAAGGGAAACACCTTTGTCCAAGTCCCCTATTTCCCGGACCTTCTAAGCCCTTTTGGGTGCTGGTGGTGGTTGGGGGAGTCCTGGCTTGCTATAGCTTGCTAGTAACAGTGGCCTTTATTATTTTCTGGGTGAGGAGTAAGAGGAGCAGGCTCCTGCACAGTGACTACATGAACATGACTCCCCGCCGCCCCGGGCCCACCCGCAAGCATTACCAGCCCTATGCCCCACCACGCGACTTCGCAGCCTATCGCTCCAGAGTGAAGTTCAGCAGGAGCGCAGACGCCCCCGCGTACCAGCAGGGCCAGAACCAGCTCTATAACGAGCTCAATCTAGGACGAAGAGAGGAGTACGATGTTTTGGACAAGAGACGTGGCCGGGACCCTGAGATGGGGGGAAAGCCGAGAAGGAAGAACCCTCAGGAAGGCCTGTACAATGAACTGCAGAAAGATAAGATGGCGGAGGCCTACAGTGAGATTGGGATGAAAGGCGAGCGCCGGAGGGGCAAGGGGCACGATGGCCTTTACCAGGGTCTCAGTACAGCCACCAAGGACACCTACGACGCCCTTCACATGCAGGCCCTGCCCCCTCGCTAAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGTAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG

SEQ ID NO：204-用于在GAPDH基因座供体模板插入的示例性AAV构建体

CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGTCGACGAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGCACTCCCCGTCACCGCCCTTCTCTTGCCCCTCGCCCTGCTGCTGCATGCTGCCAGGCCCATGGACGAAGTGCAGCTCGTGGAGTCCGGTGGAGGACTCGTCCAACCGGGCGGATCCCTTCGCTTGTCCTGCGCCGCATCAGGCTTCAGCTTCACCAACTATGGCGTCCACTGGGTCAGACAGGCCCCCGGAAAGGGACTGGAATGGGTGTCCGTGATCTGGAGCGGCGGGAACACCGACTACAACACCTCCGTGAAGGGCCGGTTCACTATTAGCCGCGACAACTCCAAGAACACTCTGTACCTCCAAATGAACTCCCTGAGGGCCGAAGATACTGCTGTGTACTATTGCGCGAGAGCCCTGACCTACTACGACTACGAGTTCGCGTACTGGGGCCAGGGGACTCTCGTGACCGTGTCCAGCGGTGGTGGAGGTTCCGGAGGCGGAGGTTCTGGTGGCGGGGGATCAGAAATCGTGCTGACTCAGTCCCCTGCGACCTTGTCCCTGAGCCCTGGAGAACGGGCCACCCTGAGCTGTAGAGCCAGCCAGAGCATCGGGACAAATATTCACTGGTACCAGCAGAAACCCGGACAAGCACCACGGCTGCTGATCTACTACGCCTCCGAGTCGATTTCCGGAATCCCGGCTCGCTTTTCGGGGTCTGGATCGGGAACGGACTTCACTCTGACCATCTCGTCGCTGGAACCCGAGGATTTCGCCGTGTACTACTGCCAACAGAACAACAATTGGCCGACCACGTTCGGCCAGGGCACCAAGCTCGAGATTAAGGGATCACTGGAAGCGGCCGCAACCACAACACCTGCTCCAAGGCCCCCCACACCCGCTCCAACTATAGCCAGCCAACCATTGAGCCTCAGACCTGAAGCTTGCAGGCCCGCAGCAGGAGGCGCCGTCCATACGCGAGGCCTGGACTTCGCGTGTGATATTTATATTTGGGCCCCTTTGGCCGGAACATGTGGGGTGTTGCTTCTCTCCCTTGTGATCACTCTGTATTGTAAGCGCGGGAGAAAGAAGCTCCTGTACATCTTCAAGCAGCCTTTTATGCGACCTGTGCAAACCACTCAGGAAGAAGATGGGTGTTCATGCCGCTTCCCCGAGGAGGAAGAAGGAGGGTGTGAACTGAGGGTGAAATTTTCTAGAAGCGCCGATGCTCCCGCATATCAGCAGGGTCAGAATCAGCTCTACAATGAATTGAATCTCGGCAGGCGAGAAGAGTACGATGTTCTGGACAAGAGACGGGGCAGGGATCCCGAGATGGGGGGAAAGCCCCGGAGAAAAAATCCTCAGGAGGGGTTGTACAATGAGCTGCAGAAGGACAAGATGGCTGAAGCCTATAGCGAGATCGGAATGAAAGGCGAAAGACGCAGAGGCAAGGGGCATGACGGTCTGTACCAGGGTCTCTCTACAGCCACCAAGGACACTTATGATGCGTTGCATATGCAAGCCTTGCCACCCCGCTAAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGTAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG

示例性供体模板序列

在一些实施方式中，供体模板以5'至3'顺序包含靶标序列5'同源臂(其任选地包含非野生型序列的优化序列)、使得货物序列能够作为单独翻译产物表达的第二调控元件(例如，IRES序列和/或2A元件)、货物序列(例如，所关心的基因产物)、任选地使得货物序列能够作为单独翻译产物表达的第二调控元件(例如，IRES序列和/或2A元件)、任选地第二货物序列(例如，所关心的基因产物)、任选地3'UTR、多聚腺苷酰化信号(例如，BGHpA信号)和靶标序列3'同源臂(其任选地包含非野生型序列的优化序列)。

在一些实施方式中，供体模板包含SEQ ID NO：38-57和205-218中任一项所示的序列或由其组成。在一些实施方式中，供体模板包含与SEQ ID NO：38-57和205-218中任一项具有至少85％、90％、95％、98％或99％的同一性的序列或由其组成。

SEQ ID NO：38–用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGAGGGCAGAGGAAGTCTTCTAACATGCGGTGACGTGGAGGAGAATCCTGGCCCGATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGGAGGGCAGAGGAAGTCTTCTAACATGCGGTGACGTGGAGGAGAATCCTGGCCCGATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACAATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：39–用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAACCCCTCTCCCTCCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTTATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACAATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：40-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACAATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：41-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGGAGGGCAGAGGAAGTCTTCTAACATGCGGTGACGTGGAGGAGAATCCTGGCCCGATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACAATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：42–用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGAGGGCAGAGGAAGTCTTCTAACATGCGGTGACGTGGAGGAGAATCCTGGCCCGATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACAATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：43–用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGAGGGCAGAGGAAGTCTTCTAACATGCGGTGACGTGGAGGAGAATCCTGGCCCGATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAACCCCTCTCCCTCCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTTATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACAATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：44-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：45-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGATTGGACCTGGATCCTGTTTCTGGTGGCCGCTGCCACAAGAGTGCACAGCAATTGGGTCAACGTGATCAGCGACCTGAAGAAGATCGAGGACCTGATCCAGAGCATGCACATCGACGCCACACTGTACACCGAGTCCGATGTGCACCCTAGCTGCAAAGTGACCGCCATGAAGTGCTTTCTGCTGGAACTGCAAGTGATCAGCCTGGAAAGCGGCGACGCCAGCATCCACGATACCGTGGAAAACCTGATCATCCTGGCCAACAACAGCCTGAGCAGCAACGGCAATGTGACCGAGAGCGGCTGCAAAGAGTGCGAGGAACTGGAAGAGAAGAACATCAAAGAGTTCCTCCAGAGCTTCGTCCACATCGTGCAGATGTTCATCAACACCAGCTCTGGCGGAGGAAGCGGAGGCGGAGGATCTGGTGGTGGTGGATCTGGCGGCGGTGGTAGTGGCGGAGGTTCTCTGCAAATCACCTGTCCTCCACCTATGAGCGTGGAACACGCCGACATCTGGGTCAAGAGCTACAGCCTGTACAGCAGAGAGCGGTACATCTGCAACAGCGGCTTCAAGAGAAAGGCCGGCACAAGCAGCCTGACCGAGTGTGTGCTGAACAAGGCCACAAACGTGGCCCACTGGACCACACCTAGCCTGAAGTGCATCAGAGATCCCGCTCTGGTTCATCAGAGGCCTGCCCCTCCATCTACAGTGACAACAGCTGGCGTGACCCCTCAGCCTGAGTCTCTGTCTCCATCTGGAAAAGAGCCTGCCGCCAGCTCTCCCAGCTCTAACAATACTGCTGCCACCACAGCCGCTATCGTGCCTGGATCTCAGCTGATGCCTAGCAAGAGCCCTAGCACCGGCACAACAGAGATCAGCTCTCACGAGAGCAGCCACGGAACACCTTCTCAGACCACCGCCAAGAATTGGGAGCTGACAGCCTCTGCCTCTCATCAGCCACCTGGCGTGTACCCACAGGGCCACTCTGATACAACAGTGGCCATCAGCACCAGCACCGTTCTGCTGTGTGGCCTGTCTGCTGTTAGCCTGCTGGCCTGCTACCTGAAGTCTAGACAGACACCTCCTCTGGCCAGCGTGGAAATGGAAGCCATGGAAGCTCTGCCTGTCACATGGGGCACCAGCAGCAGAGATGAGGACCTCGAGAATTGCAGCCACCACCTGTAGGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：46–用于在GAPDH基因座插入的示例性供体模板

GGCTTTCCCATAATTTCCTTTCAAGGTGGGGAGGGAGGTAGAGGGGTGATGTGGGGAGTACGCTGCAGGGCCTCACTCCTTTTGCAGACCACAGTCCATGCCATCACTGCCACCCAGAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATCTCTTGGTACGACAATGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTTCATCTTCTAGGTATGACAACGAATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCT

SEQ ID NO：47–用于在TBP基因座插入的示例性供体模板

GCAGACTTCCATTTACAGTGAGGAGGTGAGCATTGCATTGAACAAAAGATGGCGTTTTCACTTGGAATTAGTTATCTGAAGCTTTAGGATTCCTCAGCAATATGATTATGAGACAAGAAAGGAAGATTCAGAAATGAGTCTAGTTGAAGGCAGCAATTCAGAGAAGAAGATTCAGTTGTTATCATTGCCGTCCTGCTTGGTTTATGGCCTGGTTCAGGACCAAGGAGAGAAGTGTGAATACATGCCTCTTGAGCTATAGAATGAGACGCTGGAGTCACTAAGATGATTTTTTAAAAGTATTGTTTTATAAACAAAAATAAGATTGTGACAAGGGATTCCACTATTAATGTTTTCATGCCTGTGCCTTAATCTGACTGGGTATGGTGAGAATTGTGCTTGCAGCTTTAAGGTAAGAATTTTACCATCTTAATATGTTAAGAAGTGCCATTTCAGTCTCTCATCTCTACTCCAACTTGTCTTCTTAGGTGCTAAAGTCAGAGCCGAAATCTACGAGGCCTTCGAGAACATCTACCCCATCCTGAAGGGCTTCAGAAAGACCACCGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCAGAAATTTATGAAGCATTTGAAAACATCTACCCTATTCTAAAGGGATTCAGGAAGACGACGTAATGGCTCTCATGTACCCTTGCCTCCCCCACCCCCTTCTTTTTTTTTTTTTAAACAAATCAGTTTGTTTTGGTACCTTTAAATGGTGGTGTTGTGAGAAGATGGATGTTGAGTTGCAGGGTGTGGCACCAGGTGATGCCCTTCTGTAAGTGCCCACCGCGGGATGCCGGGAAGGGGCATTATTTGTGCACTGAGAACACCGCGCAGCGTGACTGTGAGTTGCTCATACCGTGCTGCTATCTGGGCAGCGCTGCCCATTTATTTATATGTAGATTTTAAACACTGCTGTTGACAAGTTGGTTTGAGGGAGAAAACTTTAAGTGTTAAAGCCACCTCTATAATTGATTGGACTTTTTAATTTTAATGTTTTTCCCCATGAACCACAGTTTTTATATTTCTACCAGAAAAGTAAAAATCTTTTTTAAAAGTGTTGTTTTT

SEQ ID NO：49-用于在TBP基因座插入的示例性供体模板

CTGACCACAGCTCTGCAAGCAGACTTCCATTTACAGTGAGGAGGTGAGCATTGCATTGAACAAAAGATGGCGTTTTCACTTGGAATTAGTTATCTGAAGCTTTAGGATTCCTCAGCAATATGATTATGAGACAAGAAAGGAAGATTCAGAAATGAGTCTAGTTGAAGGCAGCAATTCAGAGAAGAAGATTCAGTTGTTATCATTGCCGTCCTGCTTGGTTTATGGCCTGGTTCAGGACCAAGGAGAGAAGTGTGAATACATGCCTCTTGAGCTATAGAATGAGACGCTGGAGTCACTAAGATGATTTTTTAAAAGTATTGTTTTATAAACAAAAATAAGATTGTGACAAGGGATTCCACTATTAATGTTTTCATGCCTGTGCCTTAATCTGACTGGGTATGGTGAGAATTGTGCTTGCAGCTTTAAGGTAAGAATTTTACCATCTTAATATGTTAAGAAGTGCCATTTCAGTCTCTCATCTCTACTCCAACTTGTCTTCTTAGGGGCTAAAGTGCGGGCCGAGATCTACGAGGCCTTCGAGAATATCTACCCCATCCTGAAGGGCTTCAGAAAGACCACCGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGTAGGTGCTAAAGTCAGAGCAGAAATTTATGAAGCATTTGAAAACATCTACCCTATTCTAAAGGGATTCAGGAAGACGACGTAATGGCTCTCATGTACCCTTGCCTCCCCCACCCCCTTCTTTTTTTTTTTTTAAACAAATCAGTTTGTTTTGGTACCTTTAAATGGTGGTGTTGTGAGAAGATGGATGTTGAGTTGCAGGGTGTGGCACCAGGTGATGCCCTTCTGTAAGTGCCCACCGCGGGATGCCGGGAAGGGGCATTATTTGTGCACTGAGAACACCGCGCAGCGTGACTGTGAGTTGCTCATACCGTGCTGCTATCTGGGCAGCGCTGCCCATTTATTTATATGTAGATTTTAAACACTGCTGTTGACAAGTTGGTTTGAGGGAGAAAACTTTAAGTGTTAAAGCCACCTCTATAATTGATTGGACTTTTTAATTTTAATGTTTTTCCCCATGAACCACAGTTTTTATATTTCTACCAGAAAAGTAAAAATCTTT

SEQ ID NO：50–用于在TBP基因座插入的示例性供体模板

ACAAAAGATGGCGTTTTCACTTGGAATTAGTTATCTGAAGCTTTAGGATTCCTCAGCAATATGATTATGAGACAAGAAAGGAAGATTCAGAAATGAGTCTAGTTGAAGGCAGCAATTCAGAGAAGAAGATTCAGTTGTTATCATTGCCGTCCTGCTTGGTTTATGGCCTGGTTCAGGACCAAGGAGAGAAGTGTGAATACATGCCTCTTGAGCTATAGAATGAGACGCTGGAGTCACTAAGATGATTTTTTAAAAGTATTGTTTTATAAACAAAAATAAGATTGTGACAAGGGATTCCACTATTAATGTTTTCATGCCTGTGCCTTAATCTGACTGGGTATGGTGAGAATTGTGCTTGCAGCTTTAAGGTAAGAATTTTACCATCTTAATATGTTAAGAAGTGCCATTTCAGTCTCTCATCTCTACTCCAACTTGTCTTCTTAGGTGCTAAAGTCAGAGCAGAAATTTATGAAGCATTCGAGAACATCTACCCTATTCTAAAGGGATTCAGGAAGACGACGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGGGATTCAGGAAGACGACGTAATGGCTCTCATGTACCCTTGCCTCCCCCACCCCCTTCTTTTTTTTTTTTTAAACAAATCAGTTTGTTTTGGTACCTTTAAATGGTGGTGTTGTGAGAAGATGGATGTTGAGTTGCAGGGTGTGGCACCAGGTGATGCCCTTCTGTAAGTGCCCACCGCGGGATGCCGGGAAGGGGCATTATTTGTGCACTGAGAACACCGCGCAGCGTGACTGTGAGTTGCTCATACCGTGCTGCTATCTGGGCAGCGCTGCCCATTTATTTATATGTAGATTTTAAACACTGCTGTTGACAAGTTGGTTTGAGGGAGAAAACTTTAAGTGTTAAAGCCACCTCTATAATTGATTGGACTTTTTAATTTTAATGTTTTTCCCCATGAACCACAGTTTTTATATTTCTACCAGAAAAGTAAAAATCTTTTTTAAAAGTGTTGTTTTTCTAATTTATAACTCCTAGGGGTTATTTCTGTGCCAGACACA

SEQ ID NO：51–用于在G6PD基因座插入的示例性供体模板

GGCCCGGGGGACTCCACATGGTGGCAGGCAGTGGCATCAGCAAGACACTCTCTCCCTCACAGAACGTGAAGCTCCCTGACGCCTATGAGCGCCTCATCCTGGACGTCTTCTGCGGGAGCCAGATGCACTTCGTGCGCAGGTGAGGCCCAGCTGCCGGCCCCTGCATACCTGTGGGCTATGGGGTGGCCTTTGCCCTCCCTCCCTGTGTGCCACCGGCCTCCCAAGCCATACCATGTCCCCTCAGCGACGAGCTCCGTGAGGCCTGGCGTATTTTCACCCCACTGCTGCACCAGATTGAGCTGGAGAAGCCCAAGCCCATCCCCTATATTTATGGCAGGTGAGGAAAGGGTGGGGGCTGGGGACAGAGCCCAGCGGGCAGGGGCGGGGTGAGGGTGGAGCTACCTCATGCCTCTCCTCCACCCGTCACTCTCCAGCCGAGGCCCCACGGAGGCAGACGAGCTGATGAAGAGAGTGGGCTTCCAGTACGAGGGAACCTACAAATGGGTCAACCCTCACAAGCTGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGGTGGGTGAACCCCCACAAGCTCTGAGCCCTGGGCACCCACCTCCACCCCCGCCACGGCCACCCTCCTTCCCGCCGCCCGACCCCGAGTCGGGAGGACTCCGGGACCATTGACCTCAGCTGCACATTCCTGGCCCCGGGCTCTGGCCACCCTGGCCCGCCCCTCGCTGCTGCTACTACCCGAGCCCAGCTACATTCCTCAGCTGCCAAGCACTCGAGACCATCCTGGCCCCTCCAGACCCTGCCTGAGCCCAGGAGCTGAGTCACCTCCTCCACTCACTCCAGCCCAACAGAAGGAAGGAGGAGGGCGCCCATTCGTCTGTCCCAGAGCTTATTGGCCACTGGGTCTCACTCCTGAGTGGGGCCAGGGTGGGAGGGAGGGACGAGGGGGAGGAAAGGGGCGAGCACCCACGTGAGAGAATCTGCCTGTGGCCTTGCCCGCCAGCCTCAGTGCCACTTGACATTCCTTGTCACCAGCAACATCTCGAGCCCCCTGGATGTCC

SEQ ID NO：52-用于在E2F4基因座插入的示例性供体模板

CCAGGGGGCTGTAGTGGGGCCAGGCTGGACCTCTGTGCCCTGAGCATGGCTTTCTTGTTTTTCAGTTTTGGAACTCCCCAAAGAGCTGTCAGAAATCTTTGATCCCACACGAGGTAGGCTGCTGCATTCCTCCCTGAGGCTAGGGGTAAGGGACACAGCTCATTGGGTCCTATGGCTGTTTTCTTGCCCTTTTGAGGACCTTGTTGTGGCGCTTATGGTAACTGGGGCAAAGGGTGAAGTTCCTGATGGGCAGGTGGGGTTCCCTTTCCTGGGCTTTGGTGGGTGGAGAGGTGGGAGCTGGAATGTTAGTAACTGAGCTCCCTCCATTCCCAGAGTGCATGAGCTCGGAGCTGCTGGAGGAGTTGATGTCCTCAGAAGGTGGGTGGCCCTGGAAGGTGGGAGTGGGTGTGGGCAGGGGTTGGGCTGCTGCTAGGGGAGCCCTGGCCCAGGGCCTGAGACTAGTGCTCTCTGCAGTGTTCGCCCCTCTGCTGAGACTTTCTCCTCCTCCTGGCGACCACGACTACATCTACAACCTGGACGAGAGCGAGGGCGTGTGCGACCTGTTTGATGTGCCCGTGCTGAACCTGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCCACCCCCGGGAGACCACGATTATATCTACAACCTGGACGAGAGTGAAGGTGTCTGTGACCTCTTTGATGTGCCTGTTCTCAACCTCTGACTGACAGGGACATGCCCTGTGTGGCTGGGACCCAGACTGTCTGACCTGGGGGTTGCCTGGGGACCTCTCCCACCCGACCCCTACAGAGCTTGAGAGCCACAGACGCCTGGCTTCTCCGGCCTCCCCTCACCGCACAGTTCTGGCCACAGCTCCCGCTCCTGTGCTGGCACTTCTGTGCTCGCAGAGCAGGGGAACAGGACTCAGCCCCCATCACCGTGGAGCCAAAGTGTTTGCTTCTCCCTTTCTGCGGCCTTCGCCAGCCCAGGCTCGGCTGCCACCCAGTGGCACAGAACCGAGGAGCTGCCATTACCCCCCATAGGGGGCAGTGTCTTGTTCCTGCCAGCCTCAGTGTCTTGCTTCTGCCAGCTCCTTCCCCTAGGAGGGAAGGGTGGGGTGGAACTGGGCACATG

SEQ ID NO：53-用于在E2F4基因座插入的示例性供体模板

CCAGGCTGGACCTCTGTGCCCTGAGCATGGCTTTCTTGTTTTTCAGTTTTGGAACTCCCCAAAGAGCTGTCAGAAATCTTTGATCCCACACGAGGTAGGCTGCTGCATTCCTCCCTGAGGCTAGGGGTAAGGGACACAGCTCATTGGGTCCTATGGCTGTTTTCTTGCCCTTTTGAGGACCTTGTTGTGGCGCTTATGGTAACTGGGGCAAAGGGTGAAGTTCCTGATGGGCAGGTGGGGTTCCCTTTCCTGGGCTTTGGTGGGTGGAGAGGTGGGAGCTGGAATGTTAGTAACTGAGCTCCCTCCATTCCCAGAGTGCATGAGCTCGGAGCTGCTGGAGGAGTTGATGTCCTCAGAAGGTGGGTGGCCCTGGAAGGTGGGAGTGGGTGTGGGCAGGGGTTGGGCTGCTGCTAGGGGAGCCCTGGCCCAGGGCCTGAGACTAGTGCTCTCTGCAGTGTTTGCCCCTCTGCTTCGTCTTAGTCCTCCTCCGGGCGACCACGACTACATCTACAACCTGGACGAGAGCGAGGGCGTGTGCGACCTGTTTGATGTGCCCGTGCTGAACCTGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTATATCTACAACCTGGACGAGAGTGAAGGTGTCTGTGACCTCTTTGATGTGCCTGTTCTCAACCTCTGACTGACAGGGACATGCCCTGTGTGGCTGGGACCCAGACTGTCTGACCTGGGGGTTGCCTGGGGACCTCTCCCACCCGACCCCTACAGAGCTTGAGAGCCACAGACGCCTGGCTTCTCCGGCCTCCCCTCACCGCACAGTTCTGGCCACAGCTCCCGCTCCTGTGCTGGCACTTCTGTGCTCGCAGAGCAGGGGAACAGGACTCAGCCCCCATCACCGTGGAGCCAAAGTGTTTGCTTCTCCCTTTCTGCGGCCTTCGCCAGCCCAGGCTCGGCTGCCACCCAGTGGCACAGAACCGAGGAGCTGCCATTACCCCCCATAGGGGGCAGTGTCTTGTTCCTGCCAGCCTCAGTGTCTTGCTTCTGCCAGCTCCTTCCCCTAGGAGGGAAGGGTGGGGTGGAACTGGGCACATGCCAGCACCACTTCTAGCTT

SEQ ID NO：54–用于在E2F4基因座插入的示例性供体模板

GTCAGAAATCTTTGATCCCACACGAGGTAGGCTGCTGCATTCCTCCCTGAGGCTAGGGGTAAGGGACACAGCTCATTGGGTCCTATGGCTGTTTTCTTGCCCTTTTGAGGACCTTGTTGTGGCGCTTATGGTAACTGGGGCAAAGGGTGAAGTTCCTGATGGGCAGGTGGGGTTCCCTTTCCTGGGCTTTGGTGGGTGGAGAGGTGGGAGCTGGAATGTTAGTAACTGAGCTCCCTCCATTCCCAGAGTGCATGAGCTCGGAGCTGCTGGAGGAGTTGATGTCCTCAGAAGGTGGGTGGCCCTGGAAGGTGGGAGTGGGTGTGGGCAGGGGTTGGGCTGCTGCTAGGGGAGCCCTGGCCCAGGGCCTGAGACTAGTGCTCTCTGCAGTGTTTGCCCCTCTGCTTCGTCTTTCTCCACCCCCGGGAGACCACGATTATATCTACAACCTGGACGAGAGTGAAGGTGTCTGTGACCTCTTCGACGTGCCCGTGCTCAACCTCGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGTGACTGACAGGGACATGCCCTGTGTGGCTGGGACCCAGACTGTCTGACCTGGGGGTTGCCTGGGGACCTCTCCCACCCGACCCCTACAGAGCTTGAGAGCCACAGACGCCTGGCTTCTCCGGCCTCCCCTCACCGCACAGTTCTGGCCACAGCTCCCGCTCCTGTGCTGGCACTTCTGTGCTCGCAGAGCAGGGGAACAGGACTCAGCCCCCATCACCGTGGAGCCAAAGTGTTTGCTTCTCCCTTTCTGCGGCCTTCGCCAGCCCAGGCTCGGCTGCCACCCAGTGGCACAGAACCGAGGAGCTGCCATTACCCCCCATAGGGGGCAGTGTCTTGTTCCTGCCAGCCTCAGTGTCTTGCTTCTGCCAGCTCCTTCCCCTAGGAGGGAAGGGTGGGGTGGAACTGGGCACATGCCAGCACCACTTCTAGCTTCCTTCGCTATCCCCCACCCCCTGACCCTCCAGCTCCTCCTGGCCCTCTCACGTGCCCACTTCTGCTGG

SEQ ID NO：55–用于在KIF11基因座插入的示例性供体模板

AGAGCAGGGTTTCTTGACAGCAGTGCTATTGGCATTTTAAACTGGATAATTCTTTGTTGTGATGGGCTTTCCTGTGGACTGTACTATGTTGGTACACAAGAAAAACAGTGTACTATGTGAATACTCACTCAAAGCCAGTAGCACTCCCTGATTGTAACACCAAAAAAGTCTCTCAGCATTGCCAAATGTCCCCTGTGGCAGCAGAATCACTCCCTGATGAGAACCACTACCCTGGAGTAAAATCTATAACTATGTCTTAGAAAATAACACAGAAAATTAATATTTCTTTCACTCTACTCCTTCCATTAGTGATCAAATAAAGAAGGCATTTGGCGCTACTTGCCAAATTGTTGGCTCAAACTTGTGCTGAACCTTTTTTGGTTTTCTACACTTAAGTTTTTTTGCCTATAACCCAGAGAACTTTGAAAATAGAGTGTAGTTAATGTGTATCTAATGTTACTTTGTATTGACTTAATTTACCGGCCTTTAATCCACAGCATAAGAAGTCCCACGGCAAGGACAAAGAGAACCGGGGCATCAACACACTGGAACGGTCCAAGGTCGAGGAAACAACCGAGCACCTGGTCACCAAGAGCAGACTGCCTCTGAGAGCCCAGATCAACCTGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAAAAATCACATGGAAAAGACAAAGAAAACAGAGGCATTAACACACTGGAGAGGTCTAAAGTGGAAGAAACTACAGAGCACTTGGTTACAAAGAGCAGATTACCTCTGCGAGCCCAGATCAACCTTTAATTCACTTGGGGGTTGGCAATTTTATTTTTAAAGAAAACTTAAAAATAAAACCTGAAACCCCAGAACTTGAGCCTTGTGTATAGATTTTAAAAGAATATATATATCAGCCGGGCGCGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATTGCTTGAGCCCAGGAGTTTGAGACCAGCCTGGCCAACGTGGCAAAACCTCGTCTCTGTTAAAAATTAGCCGGGCGTGGTGGCACACTCCTGTAATCCCAGCTACTGGGGAGGCTGAGGCACGAGAATCACTTGAACCCAGGAAGCGGGGTTGCAGTGAGCCAAAGGTACACCACTACACTCCAGCCTGGGCAACAGAGCAAGACT

SEQ ID NO：56-用于在KIF11基因座插入的示例性供体模板

TTCCTGTGGACTGTACTATGTTGGTACACAAGAAAAACAGTGTACTATGTGAATACTCACTCAAAGCCAGTAGCACTCCCTGATTGTAACACCAAAAAAGTCTCTCAGCATTGCCAAATGTCCCCTGTGGCAGCAGAATCACTCCCTGATGAGAACCACTACCCTGGAGTAAAATCTATAACTATGTCTTAGAAAATAACACAGAAAATTAATATTTCTTTCACTCTACTCCTTCCATTAGTGATCAAATAAAGAAGGCATTTGGCGCTACTTGCCAAATTGTTGGCTCAAACTTGTGCTGAACCTTTTTTGGTTTTCTACACTTAAGTTTTTTTGCCTATAACCCAGAGAACTTTGAAAATAGAGTGTAGTTAATGTGTATCTAATGTTACTTTGTATTGACTTAATTTTCCCGCCTTAAATCCACAGCATAAAAAATCACATGGAAAAGACAAAGAAAACAGAGGCATTAACACACTGGAGAGGTCTAAAGTGGAAGAAACAACCGAGCACCTGGTCACCAAGAGCAGACTGCCTCTGAGAGCCCAGATCAACCTGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAACTACAGAGCACTTGGCTACATAGAGCAGATTACCTCTGCGAGCCCAGATCAACCTTTAATTCACTTGGGGGTTGGCAATTTTATTTTTAAAGAAAACTTAAAAATAAAACCTGAAACCCCAGAACTTGAGCCTTGTGTATAGATTTTAAAAGAATATATATATCAGCCGGGCGCGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATTGCTTGAGCCCAGGAGTTTGAGACCAGCCTGGCCAACGTGGCAAAACCTCGTCTCTGTTAAAAATTAGCCGGGCGTGGTGGCACACTCCTGTAATCCCAGCTACTGGGGAGGCTGAGGCACGAGAATCACTTGAACCCAGGAAGCGGGGTTGCAGTGAGCCAAAGGTACACCACTACACTCCAGCCTGGGCAACAGAGCAAGACTCGGTCTCAAAAACAAAATTTAAAAAAGATATAAGGCAGTACTGTAAATTCAGTTGAATTTTGATATCT

SEQ ID NO：57-用于在KIF11基因座插入的示例性供体模板

TTAAACTGGATAATTCTTTGTTGTGATGGGCTTTCCTGTGGACTGTACTATGTTGGTACACAAGAAAAACAGTGTACTATGTGAATACTCACTCAAAGCCAGTAGCACTCCCTGATTGTAACACCAAAAAAGTCTCTCAGCATTGCCAAATGTCCCCTGTGGCAGCAGAATCACTCCCTGATGAGAACCACTACCCTGGAGTAAAATCTATAACTATGTCTTAGAAAATAACACAGAAAATTAATATTTCTTTCACTCTACTCCTTCCATTAGTGATCAAATAAAGAAGGCATTTGGCGCTACTTGCCAAATTGTTGGCTCAAACTTGTGCTGAACCTTTTTTGGTTTTCTACACTTAAGTTTTTTTGCCTATAACCCAGAGAACTTTGAAAATAGAGTGTAGTTAATGTGTATCTAATGTTACTTTGTATTGACTTAATTTTCCCGCCTTAAATCCACAGCATAAAAAATCACATGGAAAAGACAAAGAAAACAGAGGCATCAACACACTGGAACGGTCCAAGGTCGAGGAAACAACCGAGCACCTGGTCACCAAGAGCAGACTGCCTCTGAGAGCCCAGATCAACCTGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTAACACACTGGAGAGTTCTGAAGTGGAAGAAACTACAGAGCACTTGGTTACAAAGAGCAGATTACCTCTGCGAGCCCAGATCAACCTTTAATTCACTTGGGGGTTGGCAATTTTATTTTTAAAGAAAACTTAAAAATAAAACCTGAAACCCCAGAACTTGAGCCTTGTGTATAGATTTTAAAAGAATATATATATCAGCCGGGCGCGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATTGCTTGAGCCCAGGAGTTTGAGACCAGCCTGGCCAACGTGGCAAAACCTCGTCTCTGTTAAAAATTAGCCGGGCGTGGTGGCACACTCCTGTAATCCCAGCTACTGGGGAGGCTGAGGCACGAGAATCACTTGAACCCAGGAAGCGGGGTTGCAGTGAGCCAAAGGTACACCACTACACTCCAGCCTGGGCAACAGAGCAAGACTCGGTCTCAAAAACAAAATTTAAAAAAGATATAAGGC

SEQ ID NO：48-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGTGGCCCCTGGTAGCGGCGCTGTTGCTGGGCTCGGCGTGCTGCGGATCAGCTCAGCTACTATTTAATAAAACAAAATCTGTAGAATTCACGTTTTGTAATGACACTGTCGTCATTCCATGCTTTGTTACTAATATGGAGGCACAAAACACTACTGAAGTATACGTAAAGTGGAAATTTAAAGGAAGAGATATTTACACCTTTGATGGAGCTCTAAACAAGTCCACTGTCCCCACTGACTTTAGTAGTGCAAAAATTGAAGTCTCACAATTACTAAAAGGAGATGCCTCTTTGAAGATGGATAAGAGTGATGCTGTCTCACACACAGGAAACTACACTTGTGAAGTAACAGAATTAACCAGAGAAGGTGAAACGATCATCGAGCTAAAATATCGTGTTGTTTCATGGTTTTCTCCAAATGAAAATATTCTTATTGTTATTTTCCCAATTTTTGCTATACTCCTGTTCTGGGGACAGTTTGGTATTAAAACACTTAAATATAGATCCGGTGGTATGGATGAGAAAACAATTGCTTTACTTGTTGCTGGACTAGTGATCACTGTCATTGTCATTGTTGGAGCCATTCTTTTCGTCCCAGGTGAATATTCATTAAAGAATGCTACTGGCCTTGGTTTAATTGTGACTTCTACAGGGATATTAATATTACTTCACTACTATGTGTTTAGTACAGCGATTGGATTAACCTCCTTCGTCATTGCCATATTGGTTATTCAGGTGATAGCCTATATCCTCGCTGTGGTTGGACTGAGTCTCTGTATTGCGGCGTGTATACCAATGCATGGCCCTCTTCTGATTTCAGGTTTGAGTATCTTAGCTCTAGCACAATTACTTGGACTAGTTTATATGAAATTTGTGGCTTCCAATCAGAAGACTATACAACCTCCTAGGAAAGCTGTAGAGGAACCCCTTAATGCATTCAAAGAATCAAAAGGAATGATGAATGATGAATGAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：205-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGTGGCAACTGCTGCTGCCTACAGCTCTGCTGCTTCTGGTGTCTGCCGGCATGAGAACCGAGGATCTGCCTAAGGCCGTGGTGTTCCTGGAACCTCAGTGGTACAGAGTGCTGGAAAAGGACAGCGTGACCCTGAAGTGCCAGGGCGCCTATTCTCCCGAGGACAATAGCACCCAGTGGTTCCACAACGAGAGCCTGATCAGCAGCCAGGCCAGCAGCTACTTTATCGATGCCGCCACCGTGGACGACAGCGGCGAGTACAGATGCCAGACCAATCTGAGCACCCTGAGCGACCCTGTGCAGCTGGAAGTGCACATTGGATGGTTGCTGCTGCAAGCCCCTAGATGGGTGTTCAAAGAAGAGGACCCCATCCACCTGAGATGCCACTCTTGGAAGAACACAGCCCTGCACAAAGTGACCTACCTGCAGAACGGCAAGGGCAGAAAGTACTTCCACCACAACAGCGACTTCTACATCCCCAAGGCCACACTGAAGGACTCCGGCTCCTACTTCTGCAGAGGCCTGGTCGGCAGCAAGAACGTGTCCAGCGAGACAGTGAACATCACCATCACACAGGGCCTCGCCGTGTCTACCATCAGCAGCTTTTTCCCACCTGGCTATCAGGTGTCCTTCTGCCTGGTCATGGTGCTGCTGTTCGCCGTGGATACCGGCCTGTACTTCAGCGTCAAGACCAACATCCGGTCCAGCACCAGAGACTGGAAGGACCACAAGTTCAAGTGGCGGAAGGACCCTCAGGACAAGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：206-用于在GAPDH基因座插入的示例性供体模板

GTCGACGAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGCTTCTCCTGGTGACAAGCCTTCTGCTCTGTGAGTTACCACACCCAGCATTCCTCCTGATCCCAGACATCCAGATGACACAGACTACATCCTCCCTGTCTGCCTCTCTGGGAGACAGAGTCACCATCAGTTGCAGGGCAAGTCAGGACATTAGTAAATATTTAAATTGGTATCAGCAGAAACCAGATGGAACTGTTAAACTCCTGATCTACCATACATCAAGATTACACTCAGGAGTCCCATCAAGGTTCAGTGGCAGTGGGTCTGGAACAGATTATTCTCTCACCATTAGCAACCTGGAGCAAGAAGATATTGCCACTTACTTTTGCCAACAGGGTAATACGCTTCCGTACACGTTCGGAGGGGGGACTAAGTTGGAAATAACAGGCTCCACCTCTGGATCCGGCAAGCCCGGATCTGGCGAGGGATCCACCAAGGGCGAGGTGAAACTGCAGGAGTCAGGACCTGGCCTGGTGGCGCCCTCACAGAGCCTGTCCGTCACATGCACTGTCTCAGGGGTCTCATTACCCGACTATGGTGTAAGCTGGATTCGCCAGCCTCCACGAAAGGGTCTGGAGTGGCTGGGAGTAATATGGGGTAGTGAAACCACATACTATAATTCAGCTCTCAAATCCAGACTGACCATCATCAAGGACAACTCCAAGAGCCAAGTTTTCTTAAAAATGAACAGTCTGCAAACTGATGACACAGCCATTTACTACTGTGCCAAACATTATTACTACGGTGGTAGCTATGCTATGGACTACTGGGGTCAAGGAACCTCAGTCACCGTCTCCTCAGCGGCCGCAATTGAAGTTATGTATCCTCCTCCTTACCTAGACAATGAGAAGAGCAATGGAACCATTATCCATGTGAAAGGGAAACACCTTTGTCCAAGTCCCCTATTTCCCGGACCTTCTAAGCCCTTTTGGGTGCTGGTGGTGGTTGGGGGAGTCCTGGCTTGCTATAGCTTGCTAGTAACAGTGGCCTTTATTATTTTCTGGGTGAGGAGTAAGAGGAGCAGGCTCCTGCACAGTGACTACATGAACATGACTCCCCGCCGCCCCGGGCCCACCCGCAAGCATTACCAGCCCTATGCCCCACCACGCGACTTCGCAGCCTATCGCTCCAGAGTGAAGTTCAGCAGGAGCGCAGACGCCCCCGCGTACCAGCAGGGCCAGAACCAGCTCTATAACGAGCTCAATCTAGGACGAAGAGAGGAGTACGATGTTTTGGACAAGAGACGTGGCCGGGACCCTGAGATGGGGGGAAAGCCGAGAAGGAAGAACCCTCAGGAAGGCCTGTACAATGAACTGCAGAAAGATAAGATGGCGGAGGCCTACAGTGAGATTGGGATGAAAGGCGAGCGCCGGAGGGGCAAGGGGCACGATGGCCTTTACCAGGGTCTCAGTACAGCCACCAAGGACACCTACGACGCCCTTCACATGCAGGCCCTGCCCCCTCGCTAAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：207-用于在GAPDH基因座插入的示例性供体模板

GTCGACGAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGCACTCCCCGTCACCGCCCTTCTCTTGCCCCTCGCCCTGCTGCTGCATGCTGCCAGGCCCATGGACGAAGTGCAGCTCGTGGAGTCCGGTGGAGGACTCGTCCAACCGGGCGGATCCCTTCGCTTGTCCTGCGCCGCATCAGGCTTCAGCTTCACCAACTATGGCGTCCACTGGGTCAGACAGGCCCCCGGAAAGGGACTGGAATGGGTGTCCGTGATCTGGAGCGGCGGGAACACCGACTACAACACCTCCGTGAAGGGCCGGTTCACTATTAGCCGCGACAACTCCAAGAACACTCTGTACCTCCAAATGAACTCCCTGAGGGCCGAAGATACTGCTGTGTACTATTGCGCGAGAGCCCTGACCTACTACGACTACGAGTTCGCGTACTGGGGCCAGGGGACTCTCGTGACCGTGTCCAGCGGTGGTGGAGGTTCCGGAGGCGGAGGTTCTGGTGGCGGGGGATCAGAAATCGTGCTGACTCAGTCCCCTGCGACCTTGTCCCTGAGCCCTGGAGAACGGGCCACCCTGAGCTGTAGAGCCAGCCAGAGCATCGGGACAAATATTCACTGGTACCAGCAGAAACCCGGACAAGCACCACGGCTGCTGATCTACTACGCCTCCGAGTCGATTTCCGGAATCCCGGCTCGCTTTTCGGGGTCTGGATCGGGAACGGACTTCACTCTGACCATCTCGTCGCTGGAACCCGAGGATTTCGCCGTGTACTACTGCCAACAGAACAACAATTGGCCGACCACGTTCGGCCAGGGCACCAAGCTCGAGATTAAGGGATCACTGGAAGCGGCCGCAACCACAACACCTGCTCCAAGGCCCCCCACACCCGCTCCAACTATAGCCAGCCAACCATTGAGCCTCAGACCTGAAGCTTGCAGGCCCGCAGCAGGAGGCGCCGTCCATACGCGAGGCCTGGACTTCGCGTGTGATATTTATATTTGGGCCCCTTTGGCCGGAACATGTGGGGTGTTGCTTCTCTCCCTTGTGATCACTCTGTATTGTAAGCGCGGGAGAAAGAAGCTCCTGTACATCTTCAAGCAGCCTTTTATGCGACCTGTGCAAACCACTCAGGAAGAAGATGGGTGTTCATGCCGCTTCCCCGAGGAGGAAGAAGGAGGGTGTGAACTGAGGGTGAAATTTTCTAGAAGCGCCGATGCTCCCGCATATCAGCAGGGTCAGAATCAGCTCTACAATGAATTGAATCTCGGCAGGCGAGAAGAGTACGATGTTCTGGACAAGAGACGGGGCAGGGATCCCGAGATGGGGGGAAAGCCCCGGAGAAAAAATCCTCAGGAGGGGTTGTACAATGAGCTGCAGAAGGACAAGATGGCTGAAGCCTATAGCGAGATCGGAATGAAAGGCGAAAGACGCAGAGGCAAGGGGCATGACGGTCTGTACCAGGGTCTCTCTACAGCCACCAAGGACACTTATGATGCGTTGCATATGCAAGCCTTGCCACCCCGCTAAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：208-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGAC

AACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAA

AGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGA

GGAGAACCCTGGACCTATGGATTGGACCTGGATCCTGTTTCTGGTGGCCGCTGCCA

CAAGAGTGCACAGCAATTGGGTCAACGTGATCAGCGACCTGAAGAAGATCGAGG

ACCTGATCCAGAGCATGCACATCGACGCCACACTGTACACCGAGTCCGATGTGCA

CCCTAGCTGCAAAGTGACCGCCATGAAGTGCTTTCTGCTGGAACTGCAAGTGATC

AGCCTGGAAAGCGGCGACGCCAGCATCCACGATACCGTGGAAAACCTGATCATCC

TGGCCAACAACAGCCTGAGCAGCAACGGCAATGTGACCGAGAGCGGCTGCAAAG

AGTGCGAGGAACTGGAAGAGAAGAACATCAAAGAGTTCCTCCAGAGCTTCGTCC

ACATCGTGCAGATGTTCATCAACACCAGCGGAAGCGGAGCCACAAACTTCTCTCT

GCTGAAGCAGGCAGGAGATGTTGAAGAAAACCCTGGACCTATCACCTGTCCTCCA

CCTATGAGCGTGGAACACGCCGACATCTGGGTCAAGAGCTACAGCCTGTACAGCA

GAGAGCGGTACATCTGCAACAGCGGCTTCAAGAGAAAGGCCGGCACAAGCAGCC

TGACCGAGTGTGTGCTGAACAAGGCCACAAACGTGGCCCACTGGACCACACCTA

GCCTGAAGTGCATCAGAGATCCCGCTCTGGTTCATCAGAGGCCTGCCCCTCCATCT

ACAGTGACAACAGCTGGCGTGACCCCTCAGCCTGAGTCTCTGTCTCCATCTGGAA

AAGAGCCTGCCGCCAGCTCTCCCAGCTCTAACAATACTGCTGCCACCACAGCCGCT

ATCGTGCCTGGATCTCAGCTGATGCCTAGCAAGAGCCCTAGCACCGGCACAACAG

AGATCAGCTCTCACGAGAGCAGCCACGGAACACCTTCTCAGACCACCGCCAAGAA

TTGGGAGCTGACAGCCTCTGCCTCTCATCAGCCACCTGGCGTGTACCCACAGGGC

CACTCTGATACAACAGTGGCCATCAGCACCAGCACCGTTCTGCTGTGTGGCCTGTC

TGCTGTTAGCCTGCTGGCCTGCTACCTGAAGTCTAGACAGACACCTCCTCTGGCCA

GCGTGGAAATGGAAGCCATGGAAGCTCTGCCTGTCACATGGGGCACCAGCAGCAG

AGATGAGGACCTCGAGAATTGCAGCCACCACCTGGGAAGCGGAGCCACAAACTT

CTCTCTGCTGAAGCAGGCAGGAGATGTTGAAGAAAACCCTGGACCTATGGTGAGC

AAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGC

GACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCT

ACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTG

GCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCC

GACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCC

AGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGT

GAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTC

AAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCAC

AACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGA

TCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGA

ACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCAC

CCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTG

GAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAAG

CGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTG

CCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTG

GAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTG

TCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGG

GAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTT

GGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAG

ACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCAC

TGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCA

CAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGT

CATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCT

AGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCT

TGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACA

GCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAG

GAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：209-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGTGGCAGCTGTTGCTGCCGACAGCCCTCCTGTTGCTGGTCTCCGCTGGCATGAGAACCGAGGATCTGCCTAAGGCCGTGGTGTTCCTGGAACCTCAGTGGTACAGAGTGCTGGAAAAGGACAGCGTGACCCTGAAGTGCCAGGGCGCCTATTCTCCCGAGGACAATAGCACCCAGTGGTTCCACAACGAGAGCCTGATCAGCAGCCAGGCCAGCAGCTACTTTATCGATGCCGCCACCGTGGACGACAGCGGCGAGTACAGATGCCAGACCAATCTGAGCACCCTGAGCGACCCTGTGCAGCTGGAAGTGCACATTGGATGGTTGCTGCTGCAAGCCCCTAGATGGGTGTTCAAAGAAGAGGACCCCATCCACCTGAGATGCCACTCTTGGAAGAACACAGCCCTGCACAAAGTGACCTACCTGCAGAACGGCAAGGGCAGAAAGTACTTCCACCACAACAGCGACTTCTACATCCCCAAGGCCACACTGAAGGACTCCGGCTCCTACTTCTGCAGAGGCCTGGTCGGCAGCAAGAACGTGTCCAGCGAGACAGTGAACATCACCATCACACAGGGCCTCGCCGTGTCTACCATCAGCAGCTTTTTCCCACCTGGCTATCAGGTGTCCTTCTGCCTGGTCATGGTGCTGCTGTTCGCCGTGGATACCGGCCTGTACTTCAGCGTCAAGACCAACATCCGGTCCAGCACCAGAGACTGGAAGGACCACAAGTTCAAGTGGCGGAAGGACCCTCAGGACAAGGGAAGCGGAGCCACAAACTTCTCTCTGCTGAAGCAGGCAGGAGATGTTGAAGAAAACCCTGGACCTATGGATTGGACCTGGATCCTGTTTCTGGTGGCCGCTGCCACAAGAGTGCACAGCAATTGGGTCAACGTGATCAGCGACCTGAAGAAGATCGAGGACCTGATCCAGAGCATGCACATCGACGCCACACTGTACACCGAGTCCGATGTGCACCCTAGCTGCAAAGTGACCGCCATGAAGTGCTTTCTGCTGGAACTGCAAGTGATCAGCCTGGAAAGCGGCGACGCCAGCATCCACGATACCGTGGAAAACCTGATCATCCTGGCCAACAACAGCCTGAGCAGCAACGGCAATGTGACCGAGAGCGGCTGCAAAGAGTGCGAGGAACTGGAAGAGAAGAACATCAAAGAGTTCCTCCAGAGCTTCGTCCACATCGTGCAGATGTTCATCAACACCAGCGGAAGCGGAGCCACAAACTTCTCTCTGCTGAAGCAGGCAGGAGATGTTGAAGAAAACCCTGGACCTATCACCTGTCCTCCACCTATGAGCGTGGAACACGCCGACATCTGGGTCAAGAGCTACAGCCTGTACAGCAGAGAGCGGTACATCTGCAACAGCGGCTTCAAGAGAAAGGCCGGCACAAGCAGCCTGACCGAGTGTGTGCTGAACAAGGCCACAAACGTGGCCCACTGGACCACACCTAGCCTGAAGTGCATCAGAGATCCCGCTCTGGTTCATCAGAGGCCTGCCCCTCCATCTACAGTGACAACAGCTGGCGTGACCCCTCAGCCTGAGTCTCTGTCTCCATCTGGAAAAGAGCCTGCCGCCAGCTCTCCCAGCTCTAACAATACTGCTGCCACCACAGCCGCTATCGTGCCTGGATCTCAGCTGATGCCTAGCAAGAGCCCTAGCACCGGCACAACAGAGATCAGCTCTCACGAGAGCAGCCACGGAACACCTTCTCAGACCACCGCCAAGAATTGGGAGCTGACAGCCTCTGCCTCTCATCAGCCACCTGGCGTGTACCCACAGGGCCACTCTGATACAACAGTGGCCATCAGCACCAGCACCGTTCTGCTGTGTGGCCTGTCTGCTGTTAGCCTGCTGGCCTGCTACCTGAAGTCTAGACAGACACCTCCTCTGGCCAGCGTGGAAATGGAAGCCATGGAAGCTCTGCCTGTCACATGGGGCACCAGCAGCAGAGATGAGGACCTCGAGAATTGCAGCCACCACCTGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：210-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGATTGGACCTGGATCCTGTTTCTGGTGGCCGCTGCCACAAGAGTGCACAGCAATTGGGTCAACGTGATCAGCGACCTGAAGAAGATCGAGGACCTGATCCAGAGCATGCACATCGACGCCACACTGTACACCGAGTCCGATGTGCACCCTAGCTGCAAAGTGACCGCCATGAAGTGCTTTCTGCTGGAACTGCAAGTGATCAGCCTGGAAAGCGGCGACGCCAGCATCCACGATACCGTGGAAAACCTGATCATCCTGGCCAACAACAGCCTGAGCAGCAACGGCAATGTGACCGAGAGCGGCTGCAAAGAGTGCGAGGAACTGGAAGAGAAGAACATCAAAGAGTTCCTCCAGAGCTTCGTCCACATCGTGCAGATGTTCATCAACACCAGCTCTGGCGGAGGAAGCGGAGGCGGAGGATCTGGTGGTGGTGGATCTGGCGGCGGTGGTAGTGGCGGAGGTTCTCTGCAAATCACCTGTCCTCCACCTATGAGCGTGGAACACGCCGACATCTGGGTCAAGAGCTACAGCCTGTACAGCAGAGAGCGGTACATCTGCAACAGCGGCTTCAAGAGAAAGGCCGGCACAAGCAGCCTGACCGAGTGTGTGCTGAACAAGGCCACAAACGTGGCCCACTGGACCACACCTAGCCTGAAGTGCATCAGAGATCCCGCTCTGGTTCATCAGAGGCCTGCCCCTCCATCTACAGTGACAACAGCTGGCGTGACCCCTCAGCCTGAGTCTCTGTCTCCATCTGGAAAAGAGCCTGCCGCCAGCTCTCCCAGCTCTAACAATACTGCTGCCACCACAGCCGCTATCGTGCCTGGATCTCAGCTGATGCCTAGCAAGAGCCCTAGCACCGGCACAACAGAGATCAGCTCTCACGAGAGCAGCCACGGAACACCTTCTCAGACCACCGCCAAGAATTGGGAGCTGACAGCCTCTGCCTCTCATCAGCCACCTGGCGTGTACCCACAGGGCCACTCTGATACAACAGTGGCCATCAGCACCAGCACCGTTCTGCTGTGTGGCCTGTCTGCTGTTAGCCTGCTGGCCTGCTACCTGAAGTCTAGACAGACACCTCCTCTGGCCAGCGTGGAAATGGAAGCCATGGAAGCTCTGCCTGTCACATGGGGCACCAGCAGCAGAGATGAGGACCTCGAGAATTGCAGCCACCACCTGGGAAGCGGAGCCACAAACTTCTCTCTGCTGAAGCAGGCAGGAGATGTTGAAGAAAACCCTGGACCTATGTGGCAGCTGTTGCTGCCGACAGCCCTCCTGTTGCTGGTCTCCGCTGGCATGAGAACCGAGGATCTGCCTAAGGCCGTGGTGTTCCTGGAACCTCAGTGGTACAGAGTGCTGGAAAAGGACAGCGTGACCCTGAAGTGCCAGGGCGCCTATTCTCCCGAGGACAATAGCACCCAGTGGTTCCACAACGAGAGCCTGATCAGCAGCCAGGCCAGCAGCTACTTTATCGATGCCGCCACCGTGGACGACAGCGGCGAGTACAGATGCCAGACCAATCTGAGCACCCTGAGCGACCCTGTGCAGCTGGAAGTGCACATTGGATGGTTGCTGCTGCAAGCCCCTAGATGGGTGTTCAAAGAAGAGGACCCCATCCACCTGAGATGCCACTCTTGGAAGAACACAGCCCTGCACAAAGTGACCTACCTGCAGAACGGCAAGGGCAGAAAGTACTTCCACCACAACAGCGACTTCTACATCCCCAAGGCCACACTGAAGGACTCCGGCTCCTACTTCTGCAGAGGCCTGGTCGGCAGCAAGAACGTGTCCAGCGAGACAGTGAACATCACCATCACACAGGGCCTCGCCGTGTCTACCATCAGCAGCTTTTTCCCACCTGGCTATCAGGTGTCCTTCTGCCTGGTCATGGTGCTGCTGTTCGCCGTGGATACCGGCCTGTACTTCAGCGTCAAGACCAACATCCGGTCCAGCACCAGAGACTGGAAGGACCACAAGTTCAAGTGGCGGAAGGACCCTCAGGACAAGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：211-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGATTGGACCTGGATCCTGTTTCTGGTGGCCGCTGCCACAAGAGTGCACAGCAATTGGGTCAACGTGATCAGCGACCTGAAGAAGATCGAGGACCTGATCCAGAGCATGCACATCGACGCCACACTGTACACCGAGTCCGATGTGCACCCTAGCTGCAAAGTGACCGCCATGAAGTGCTTTCTGCTGGAACTGCAAGTGATCAGCCTGGAAAGCGGCGACGCCAGCATCCACGATACCGTGGAAAACCTGATCATCCTGGCCAACAACAGCCTGAGCAGCAACGGCAATGTGACCGAGAGCGGCTGCAAAGAGTGCGAGGAACTGGAAGAGAAGAACATCAAAGAGTTCCTCCAGAGCTTCGTCCACATCGTGCAGATGTTCATCAACACCAGCGGAAGCGGAGCCACAAACTTCTCTCTGCTGAAGCAGGCAGGAGATGTTGAAGAAAACCCTGGACCTATCACCTGTCCTCCACCTATGAGCGTGGAACACGCCGACATCTGGGTCAAGAGCTACAGCCTGTACAGCAGAGAGCGGTACATCTGCAACAGCGGCTTCAAGAGAAAGGCCGGCACAAGCAGCCTGACCGAGTGTGTGCTGAACAAGGCCACAAACGTGGCCCACTGGACCACACCTAGCCTGAAGTGCATCAGAGATCCCGCTCTGGTTCATCAGAGGCCTGCCCCTCCATCTACAGTGACAACAGCTGGCGTGACCCCTCAGCCTGAGTCTCTGTCTCCATCTGGAAAAGAGCCTGCCGCCAGCTCTCCCAGCTCTAACAATACTGCTGCCACCACAGCCGCTATCGTGCCTGGATCTCAGCTGATGCCTAGCAAGAGCCCTAGCACCGGCACAACAGAGATCAGCTCTCACGAGAGCAGCCACGGAACACCTTCTCAGACCACCGCCAAGAATTGGGAGCTGACAGCCTCTGCCTCTCATCAGCCACCTGGCGTGTACCCACAGGGCCACTCTGATACAACAGTGGCCATCAGCACCAGCACCGTTCTGCTGTGTGGCCTGTCTGCTGTTAGCCTGCTGGCCTGCTACCTGAAGTCTAGACAGACACCTCCTCTGGCCAGCGTGGAAATGGAAGCCATGGAAGCTCTGCCTGTCACATGGGGCACCAGCAGCAGAGATGAGGACCTCGAGAATTGCAGCCACCACCTGGGAAGCGGAGCCACAAACTTCTCTCTGCTGAAGCAGGCAGGAGATGTTGAAGAAAACCCTGGACCTATGTGGCAGCTGTTGCTGCCGACAGCCCTCCTGTTGCTGGTCTCCGCTGGCATGAGAACCGAGGATCTGCCTAAGGCCGTGGTGTTCCTGGAACCTCAGTGGTACAGAGTGCTGGAAAAGGACAGCGTGACCCTGAAGTGCCAGGGCGCCTATTCTCCCGAGGACAATAGCACCCAGTGGTTCCACAACGAGAGCCTGATCAGCAGCCAGGCCAGCAGCTACTTTATCGATGCCGCCACCGTGGACGACAGCGGCGAGTACAGATGCCAGACCAATCTGAGCACCCTGAGCGACCCTGTGCAGCTGGAAGTGCACATTGGATGGTTGCTGCTGCAAGCCCCTAGATGGGTGTTCAAAGAAGAGGACCCCATCCACCTGAGATGCCACTCTTGGAAGAACACAGCCCTGCACAAAGTGACCTACCTGCAGAACGGCAAGGGCAGAAAGTACTTCCACCACAACAGCGACTTCTACATCCCCAAGGCCACACTGAAGGACTCCGGCTCCTACTTCTGCAGAGGCCTGGTCGGCAGCAAGAACGTGTCCAGCGAGACAGTGAACATCACCATCACACAGGGCCTCGCCGTGTCTACCATCAGCAGCTTTTTCCCACCTGGCTATCAGGTGTCCTTCTGCCTGGTCATGGTGCTGCTGTTCGCCGTGGATACCGGCCTGTACTTCAGCGTCAAGACCAACATCCGGTCCAGCACCAGAGACTGGAAGGACCACAAGTTCAAGTGGCGGAAGGACCCTCAGGACAAGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：212-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGTGGCAGCTGTTGCTGCCGACAGCCCTCCTGTTGCTGGTCTCCGCTGGCATGAGAACCGAGGATCTGCCTAAGGCCGTGGTGTTCCTGGAACCTCAGTGGTACAGAGTGCTGGAAAAGGACAGCGTGACCCTGAAGTGCCAGGGCGCCTATTCTCCCGAGGACAATAGCACCCAGTGGTTCCACAACGAGAGCCTGATCAGCAGCCAGGCCAGCAGCTACTTTATCGATGCCGCCACCGTGGACGACAGCGGCGAGTACAGATGCCAGACCAATCTGAGCACCCTGAGCGACCCTGTGCAGCTGGAAGTGCACATTGGATGGTTGCTGCTGCAAGCCCCTAGATGGGTGTTCAAAGAAGAGGACCCCATCCACCTGAGATGCCACTCTTGGAAGAACACAGCCCTGCACAAAGTGACCTACCTGCAGAACGGCAAGGGCAGAAAGTACTTCCACCACAACAGCGACTTCTACATCCCCAAGGCCACACTGAAGGACTCCGGCTCCTACTTCTGCAGAGGCCTGGTCGGCAGCAAGAACGTGTCCAGCGAGACAGTGAACATCACCATCACACAGGGCCTCGCCGTGTCTACCATCAGCAGCTTTTTCCCACCTGGCTATCAGGTGTCCTTCTGCCTGGTCATGGTGCTGCTGTTCGCCGTGGATACCGGCCTGTACTTCAGCGTCAAGACCAACATCCGGTCCAGCACCAGAGACTGGAAGGACCACAAGTTCAAGTGGCGGAAGGACCCTCAGGACAAGGGAAGCGGAGCCACAAACTTCTCTCTGCTGAAGCAGGCAGGAGATGTTGAAGAAAACCCTGGACCTATGGATTGGACCTGGATCCTGTTTCTGGTGGCCGCTGCCACAAGAGTGCACAGCAATTGGGTCAACGTGATCAGCGACCTGAAGAAGATCGAGGACCTGATCCAGAGCATGCACATCGACGCCACACTGTACACCGAGTCCGATGTGCACCCTAGCTGCAAAGTGACCGCCATGAAGTGCTTTCTGCTGGAACTGCAAGTGATCAGCCTGGAAAGCGGCGACGCCAGCATCCACGATACCGTGGAAAACCTGATCATCCTGGCCAACAACAGCCTGAGCAGCAACGGCAATGTGACCGAGAGCGGCTGCAAAGAGTGCGAGGAACTGGAAGAGAAGAACATCAAAGAGTTCCTCCAGAGCTTCGTCCACATCGTGCAGATGTTCATCAACACCAGCTCTGGCGGAGGAAGCGGAGGCGGAGGATCTGGTGGTGGTGGATCTGGCGGCGGTGGTAGTGGCGGAGGTTCTCTGCAAATCACCTGTCCTCCACCTATGAGCGTGGAACACGCCGACATCTGGGTCAAGAGCTACAGCCTGTACAGCAGAGAGCGGTACATCTGCAACAGCGGCTTCAAGAGAAAGGCCGGCACAAGCAGCCTGACCGAGTGTGTGCTGAACAAGGCCACAAACGTGGCCCACTGGACCACACCTAGCCTGAAGTGCATCAGAGATCCCGCTCTGGTTCATCAGAGGCCTGCCCCTCCATCTACAGTGACAACAGCTGGCGTGACCCCTCAGCCTGAGTCTCTGTCTCCATCTGGAAAAGAGCCTGCCGCCAGCTCTCCCAGCTCTAACAATACTGCTGCCACCACAGCCGCTATCGTGCCTGGATCTCAGCTGATGCCTAGCAAGAGCCCTAGCACCGGCACAACAGAGATCAGCTCTCACGAGAGCAGCCACGGAACACCTTCTCAGACCACCGCCAAGAATTGGGAGCTGACAGCCTCTGCCTCTCATCAGCCACCTGGCGTGTACCCACAGGGCCACTCTGATACAACAGTGGCCATCAGCACCAGCACCGTTCTGCTGTGTGGCCTGTCTGCTGTTAGCCTGCTGGCCTGCTACCTGAAGTCTAGACAGACACCTCCTCTGGCCAGCGTGGAAATGGAAGCCATGGAAGCTCTGCCTGTCACATGGGGCACCAGCAGCAGAGATGAGGACCTCGAGAATTGCAGCCACCACCTGTAAGCGGCCGCGTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：213-用于在GAPDH基因座插入的示例性供体模板

SEQ ID NO：214-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGTCAAATATTACAGATCCACAGATGTGGGATTTTGATGATCTAAATTTCACTGGCATGCCACCTGCAGATGAAGATTACAGCCCCTGTATGCTAGAAACTGAGACACTCAACAAGTATGTTGTGATCATCGCCTATGCCCTAGTGTTCCTGCTGAGCCTGCTGGGAAACTCCCTGGTGATGCTGGTCATCTTATACAGCAGGGTCGGCCGCTCCGTCACTGATGTCTACCTGCTGAACCTGGCCTTGGCCGACCTACTCTTTGCCCTGACCTTGCCCATCTGGGCCGCCTCCAAGGTGAATGGCTGGATTTTTGGCACATTCCTGTGCAAGGTGGTCTCACTCCTGAAGGAAGTCAACTTCTACAGTGGCATCCTGCTGTTGGCCTGCATCAGTGTGGACCGTTACCTGGCCATTGTCCATGCCACACGCACACTGACCCAGAAGCGTCACTTGGTCAAGTTTGTTTGTCTTGGCTGCTGGGGACTGTCTATGAATCTGTCCCTGCCCTTCTTCCTTTTCCGCCAGGCTTACCATCCAAACAATTCCAGTCCAGTTTGCTATGAGGTCCTGGGAAATGACACAGCAAAATGGCGGATGGTGTTGCGGATCCTGCCTCACACCTTTGGCTTCATCGTGCCGCTGTTTGTCATGCTGTTCTGCTATGGATTCACCCTGCGTACACTGTTTAAGGCCCACATGGGGCAGAAGCACCGAGCCATGAGGGTCATCTTTGCTGTCGTCCTCATCTTCCTGCTTTGCTGGCTGCCCTACAACCTGGTCCTGCTGGCAGACACCCTCATGAGGACCCAGGTGATCCAGGAGAGCTGTGAGCGCCGCAACAACATCGGCCGGGCCCTGGATGCCACTGAGATTCTGGGATTTCTCCATAGCTGCCTCAACCCCATCATCTACGCCTTCATCGGCCAAAATTTTCGCCATGGATTCCTCAAGATCCTGGCTATGCATGGCCTGGTCAGCAAGGAGTTCTTGGCACGTCATCGTGTTACCTCCTACACTTCTTCGTCTGTCAATGTCTCTTCCAACCTCTGAATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：215-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGAGTTGAGGAAGTACGGCCCTGGAAGACTGGCGGGGACAGTTATAGGAGGAGCTGCTCAGAGTAAATCACAGACTAAATCAGACTCAATCACAAAAGAGTTCCTGCCAGGCCTTTACACAGCCCCTTCCTCCCCGTTCCCGCCCTCACAGGTGAGTGACCACCAAGTGCTAAATGACGCCGAGGTTGCCGCCCTCCTGGAGAACTTCAGCTCTTCCTATGACTATGGAGAAAACGAGAGTGACTCGTGCTGTACCTCCCCGCCCTGCCCACAGGACTTCAGCCTGAACTTCGACCGGGCCTTCCTGCCAGCCCTCTACAGCCTCCTCTTTCTGCTGGGGCTGCTGGGCAACGGCGCGGTGGCAGCCGTGCTGCTGAGCCGGCGGACAGCCCTGAGCAGCACCGACACCTTCCTGCTCCACCTAGCTGTAGCAGACACGCTGCTGGTGCTGACACTGCCGCTCTGGGCAGTGGACGCTGCCGTCCAGTGGGTCTTTGGCTCTGGCCTCTGCAAAGTGGCAGGTGCCCTCTTCAACATCAACTTCTACGCAGGAGCCCTCCTGCTGGCCTGCATCAGCTTTGACCGCTACCTGAACATAGTTCATGCCACCCAGCTCTACCGCCGGGGGCCCCCGGCCCGCGTGACCCTCACCTGCCTGGCTGTCTGGGGGCTCTGCCTGCTTTTCGCCCTCCCAGACTTCATCTTCCTGTCGGCCCACCACGACGAGCGCCTCAACGCCACCCACTGCCAATACAACTTCCCACAGGTGGGCCGCACGGCTCTGCGGGTGCTGCAGCTGGTGGCTGGCTTTCTGCTGCCCCTGCTGGTCATGGCCTACTGCTATGCCCACATCCTGGCCGTGCTGCTGGTTTCCAGGGGCCAGCGGCGCCTGCGGGCCATGCGGCTGGTGGTGGTGGTCGTGGTGGCCTTTGCCCTCTGCTGGACCCCCTATCACCTGGTGGTGCTGGTGGACATCCTCATGGACCTGGGCGCTTTGGCCCGCAACTGTGGCCGAGAAAGCAGGGTAGACGTGGCCAAGTCGGTCACCTCAGGCCTGGGCTACATGCACTGCTGCCTCAACCCGCTGCTCTATGCCTTTGTAGGGGTCAAGTTCCGGGAGCGGATGTGGATGCTGCTCTTGCGCCTGGGCTGCCCCAACCAGAGAGGGCTCCAGAGGCAGCCATCGTCTTCCCGCCGGGATTCATCCTGGTCTGAGACCTCAGAGGCCTCCTACTCGGGCTTGTGAATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：216-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGTCCTTGAGGTGAGTGACCACCAAGTGCTAAATGACGCCGAGGTTGCCGCCCTCCTGGAGAACTTCAGCTCTTCCTATGACTATGGAGAAAACGAGAGTGACTCGTGCTGTACCTCCCCGCCCTGCCCACAGGACTTCAGCCTGAACTTCGACCGGGCCTTCCTGCCAGCCCTCTACAGCCTCCTCTTTCTGCTGGGGCTGCTGGGCAACGGCGCGGTGGCAGCCGTGCTGCTGAGCCGGCGGACAGCCCTGAGCAGCACCGACACCTTCCTGCTCCACCTAGCTGTAGCAGACACGCTGCTGGTGCTGACACTGCCGCTCTGGGCAGTGGACGCTGCCGTCCAGTGGGTCTTTGGCTCTGGCCTCTGCAAAGTGGCAGGTGCCCTCTTCAACATCAACTTCTACGCAGGAGCCCTCCTGCTGGCCTGCATCAGCTTTGACCGCTACCTGAACATAGTTCATGCCACCCAGCTCTACCGCCGGGGGCCCCCGGCCCGCGTGACCCTCACCTGCCTGGCTGTCTGGGGGCTCTGCCTGCTTTTCGCCCTCCCAGACTTCATCTTCCTGTCGGCCCACCACGACGAGCGCCTCAACGCCACCCACTGCCAATACAACTTCCCACAGGTGGGCCGCACGGCTCTGCGGGTGCTGCAGCTGGTGGCTGGCTTTCTGCTGCCCCTGCTGGTCATGGCCTACTGCTATGCCCACATCCTGGCCGTGCTGCTGGTTTCCAGGGGCCAGCGGCGCCTGCGGGCCATGCGGCTGGTGGTGGTGGTCGTGGTGGCCTTTGCCCTCTGCTGGACCCCCTATCACCTGGTGGTGCTGGTGGACATCCTCATGGACCTGGGCGCTTTGGCCCGCAACTGTGGCCGAGAAAGCAGGGTAGACGTGGCCAAGTCGGTCACCTCAGGCCTGGGCTACATGCACTGCTGCCTCAACCCGCTGCTCTATGCCTTTGTAGGGGTCAAGTTCCGGGAGCGGATGTGGATGCTGCTCTTGCGCCTGGGCTGCCCCAACCAGAGAGGGCTCCAGAGGCAGCCATCGTCTTCCCGCCGGGATTCATCCTGGTCTGAGACCTCAGAGGCCTCCTACTCGGGCTTGTGAATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：217-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGGATTATCAAGTGTCAAGTCCAATCTATGACATCAATTATTATACATCGGAGCCCTGCCAAAAAATCAATGTGAAGCAAATCGCAGCCCGCCTCCTGCCTCCGCTCTACTCACTGGTGTTCATCTTTGGTTTTGTGGGCAACATGCTGGTCATCCTCATCCTGATAAACTGCAAAAGGCTGAAGAGCATGACTGACATCTACCTGCTCAACCTGGCCATCTCTGACCTGTTTTTCCTTCTTACTGTCCCCTTCTGGGCTCACTATGCTGCCGCCCAGTGGGACTTTGGAAATACAATGTGTCAACTCTTGACAGGGCTCTATTTTATAGGCTTCTTCTCTGGAATCTTCTTCATCATCCTCCTGACAATCGATAGGTACCTGGCTGTCGTCCATGCTGTGTTTGCTTTAAAAGCCAGGACGGTCACCTTTGGGGTGGTGACAAGTGTGATCACTTGGGTGGTGGCTGTGTTTGCGTCTCTCCCAGGAATCATCTTTACCAGATCTCAAAAAGAAGGTCTTCATTACACCTGCAGCTCTCATTTTCCATACAGTCAGTATCAATTCTGGAAGAATTTCCAGACATTAAAGATAGTCATCTTGGGGCTGGTCCTGCCGCTGCTTGTCATGGTCATCTGCTACTCGGGAATCCTAAAAACTCTGCTTCGGTGTCGAAATGAGAAGAAGAGGCACAGGGCTGTGAGGCTTATCTTCACCATCATGATTGTTTATTTTCTCTTCTGGGCTCCCTACAACATTGTCCTTCTCCTGAACACCTTCCAGGAATTCTTTGGCCTGAATAATTGCAGTAGCTCTAACAGGTTGGACCAAGCTATGCAGGTGACAGAGACTCTTGGGATGACGCACTGCTGCATCAACCCCATCATCTATGCCTTTGTCGGGGAGAAGTTCAGAAACTACCTCTTAGTCTTCTTCCAAAAGCACATTGCCAAACGCTTCTGCAAATGCTGTTCTATTTTCCAGCAAGAGGCTCCCGAGCGAGCAAGCTCAGTTTACACCCGATCCACTGGGGAGCAGGAAATATCTGTGGGCTTGTGAATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

SEQ ID NO：218-用于在GAPDH基因座插入的示例性供体模板

GAAGACTGTGGATGGCCCCTCCGGGAAACTGTGGCGTGATGGCCGCGGGGCTCTCCAGAACATCATCCCTGCCTCTACTGGCGCTGCCAAGGCTGTGGGCAAGGTCATCCCTGAGCTGAACGGGAAGCTCACTGGCATGGCCTTCCGTGTCCCCACTGCCAACGTGTCAGTGGTGGACCTGACCTGCCGTCTAGAAAAACCTGCCAAATATGATGACATCAAGAAGGTGGTGAAGCAGGCGTCGGAGGGCCCCCTCAAGGGCATCCTGGGCTACACTGAGCACCAGGTGGTCTCCTCTGACTTCAACAGCGACACCCACTCCTCCACCTTTGACGCTGGGGCTGGCATTGCCCTCAACGACCACTTTGTCAAGCTCATTTCCTGGTATGTGGCTGGGGCCAGAGACTGGCTCTTAAAAAGTGCAGGGTCTGGCGCCCTCTGGTGGCTGGCTCAGAAAAAGGGCCCTGACAACTCTTTACATCTTCTAGGTATGACAACGAGTTCGGATATAGCAATAGAGTGGTCGATCTGATGGCTCATATGGCTAGCAAAGAGGGAAGCGGAGCTACTAACTTCAGCCTGCTGAAGCAGGCTGGAGACGTGGAGGAGAACCCTGGACCTATGCTGTCCACATCTCGTTCTCGGTTTATCAGAAATACCAACGAGAGCGGTGAAGAAGTCACCACCTTTTTTGATTATGATTACGGTGCTCCCTGTCATAAATTTGACGTGAAGCAAATTGGGGCCCAACTCCTGCCTCCGCTCTACTCGCTGGTGTTCATCTTTGGTTTTGTGGGCAACATGCTGGTCGTCCTCATCTTAATAAACTGCAAAAAGCTGAAGTGCTTGACTGACATTTACCTGCTCAACCTGGCCATCTCTGATCTGCTTTTTCTTATTACTCTCCCATTGTGGGCTCACTCTGCTGCAAATGAGTGGGTCTTTGGGAATGCAATGTGCAAATTATTCACAGGGCTGTATCACATCGGTTATTTTGGCGGAATCTTCTTCATCATCCTCCTGACAATCGATAGATACCTGGCTATTGTCCATGCTGTGTTTGCTTTAAAAGCCAGGACGGTCACCTTTGGGGTGGTGACAAGTGTGATCACCTGGTTGGTGGCTGTGTTTGCTTCTGTCCCAGGAATCATCTTTACTAAATGCCAGAAAGAAGATTCTGTTTATGTCTGTGGCCCTTATTTTCCACGAGGATGGAATAATTTCCACACAATAATGAGGAACATTTTGGGGCTGGTCCTGCCGCTGCTCATCATGGTCATCTGCTACTCGGGAATCCTGAAAACCCTGCTTCGGTGTCGAAACGAGAAGAAGAGGCATAGGGCAGTGAGAGTCATCTTCACCATCATGATTGTTTACTTTCTCTTCTGGACTCCCTATAATATTGTCATTCTCCTGAACACCTTCCAGGAATTCTTCGGCCTGAGTAACTGTGAAAGCACCAGTCAACTGGACCAAGCCACGCAGGTGACAGAGACTCTTGGGATGACTCACTGCTGCATCAATCCCATCATCTATGCCTTCGTTGGGGAGAAGTTCAGAAGCCTTTTTCACATAGCTCTTGGCTGTAGGATTGCCCCACTCCAAAAACCAGTGTGTGGAGGTCCAGGAGTGAGACCAGGAAAGAATGTGAAAGTGACTACACAAGGACTCCTCGATGGTCGTGGAAAAGGAAAGTCAATTGGCAGAGCCCCTGAAGCCAGTCTTCAGGACAAAGAAGGAGCCTAGATTTGGCTACAGCAACAGGGTGGTGGACCTCATGGCCCACATGGCCTCCAAGGAGTAAGACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCAGTTACTTGTCCTGTCTTATTCTAGGGTCTGGGGCAGAGGGGAGGGAAGCTGGGCTTGTGTCAAGGTGAGACATTCTTGCTGGGGAGGGACCTGGTATGTTCTCCTCAGACTGAGGGTAGGGCCTCCAAACAGCCTTGCTTGCTTCGAGAACCATTTGCTTCCCGCTCAGACGTCTTGAGTGCTACAGGAAGCTGGCACCACTACTTCAGAGAACAAGGCCTTTTCCTCTCCTCGCTCCAGT

对于功能获得性修饰编辑细胞基因组的方法

在一个方面，本发明公开提供了编辑细胞基因组的方法。在某些实施方式中，所述方法包括将细胞与在所述细胞中在必需基因的内源编码序列内造成断裂的核酸酶接触，其中所述必需基因编码所述细胞存活和/或增殖所需的至少一种基因产物。所述细胞还与(i)包含含有与所述必需基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')的所关心的基因产物的外源编码序列的敲入盒的供体模板和/或(ii)包含含有与所述必需基因的外源编码序列或部分编码序列位于同一读框且位于其上游(5')的所关心的基因产物的外源编码序列的敲入盒的供体模板接触(图3D)。通过断裂的同源介导修复(HDR)将敲入盒整合到细胞基因组中，从而导致产生表达所关心的基因产物和所述细胞的存活和/或增殖所需的必需基因所编码的基因产物的基因组编辑的细胞或其功能性变体。基因修饰的“敲入”细胞存活并增殖以产生基因组还包括所关心的基因产物的外源编码序列的后代细胞。对于示例性方法，这在图3A中得到显示。

如果敲入盒未正确整合到细胞基因组中，则由断裂所造成的不希望的编辑事件，例如，NHEJ-介导的插缺的产生可以生产必需基因的无功能，例如，框外形式。当核酸酶的编辑效率足够高以破坏两个等位基因时，这产生了“敲除”细胞。在某些实施方式中，当核酸酶的编辑效率足够高以破坏一个等位基因时，这产生了“敲除”细胞。在没有足够的必需基因的功能性拷贝的情况下，这些“敲除”细胞不能存活并且不产生任何子代细胞。

在一些实施方式中，本发明公开提供了编辑细胞基因组的方法。在某些实施方式中，所述方法包括将细胞与在所述细胞中在必需基因的内源非编码序列内造成断裂的核酸酶接触，其中所述必需基因编码所述细胞存活和/或增殖所需的至少一种基因产物。在一些实施方式中，内源非编码序列内的这种断裂改变了影响转录后修饰模式，例如，mRNA剪接、RNA稳定性、RNA编辑、RNA干扰等的必需基因的功能性区域。在一些实施方式中，内源非编码序列内的这种断裂发生在必需基因的功能性区域中，例如，但不限于：剪接体靶标位点(例如，5'剪接供体位点、内含子分支点序列、3'剪接受体位点和/或多聚嘧啶束)、内含子剪接沉默子、内含子剪接增强子、外显子剪接沉默子、外显子剪接增强子、内源RNA干扰结合位点(例如，微小RNA、小干扰RNA等)、内源RNA编辑机器结合位点(例如，腺嘌呤核苷脱氨酶、胞嘧啶核苷脱氨酶等的结合位点)或其组合。在一些实施方式中，核酸酶在必需基因中内含子接界外显子处或附近导致断裂，从而降低或破坏必需基因的功能。

由于“敲入”细胞存活且“敲除”细胞不存活，因此当将其应用于起始细胞群体时，所述方法自动选择“敲入”细胞。显著地，在某些实施方式中，由于这种自动选择方面，所述方法不需要高敲入效率。因此，对于其中供体模板是敲入效率通常低于5％的dsDNA(例如，质粒)的方法，它是特别适合的。如图3C所示的示例性方法中所提及的，在一些实施方式中，起始细胞群体中的一些细胞可以保持未编辑，即不受核酸酶的影响。这些细胞也将存活并产生基因组不包括所关心的基因产物的外源编码序列的子代。当核酸酶编辑效率高时，例如，约60-90％或更高，则与基因修饰的细胞的百分比相比，未编辑的细胞的百分比将相对较低。在一些实施方式中，高核酸酶编辑效率(例如，大于65％、大于70％、大于75％、大于80％、大于85％、大于90％或者大于95％)有助于有效的群体范围的转基因整合，因为与基因修饰的细胞的百分比相比，未编辑的细胞的百分比将相对较低。在本文所公开的方法的一些实施方式中，核酸酶，例如，Cas12a、Cas9、Cas12b、Cas12c、Cas12e、CasX或者CasΦ(Cas12j)或其变体(例如，具有高编辑效率的变体)编辑了至少约65％的细胞(例如，约70％、约75％、约80％、约85％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％或约99％的细胞)。在一些实施方式中，含有CRISPR核酸酶(例如，Cas12a、Cas9、Cas12b、Cas12c、Cas12e、CasX或CasΦ(Cas12j)或其变体(例如，具有高编辑效率的变体))的RNP和向导能够在细胞群体中至少65％的细胞(例如，细胞群体中至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的细胞)中切割必需基因的基因座(例如，表3中提供的任何必需基因的基因座中的末端外显子)。在一些实施方式中，含有CRISPR核酸酶(例如，Cas12a、Cas9、Cas12b、Cas12c、Cas12e、CasX或CasΦ(Cas12j)或其变体(例如，具有高编辑效率的变体))的RNP和向导能够(例如)在细胞群体中的细胞与含有CRISPR核酸酶的RNP接触后4天至10天之间(例如，4天、5天、6天、7天、8天、9天或者10天)在细胞群体中至少65％的细胞(例如，细胞群体中至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的细胞)中诱导在必需基因的基因座(例如，表3中提供的任何必需基因的基因座中的末端外显子)处的敲入盒整合。在一些实施方式中，在靶细胞死亡之前，例如，在转染或转导后第1天和/或第2天确定编辑效率。在一些实施方式中，在转染或转导后第1天和/或第2天所测量的编辑效率可能不能获得发生编辑的细胞的完整比例，因为在一些实施方式中，某些编辑事件可能导致接近立即和/或迅速的细胞死亡。在一些实施方式中，接近立即和/或迅速的细胞死亡可以是转染或转导后小于48小时，例如，转染或转导后小于48小时、小于44小时、小于40小时、小于36小时、小于32小时、小于28小时、小于24小时、小于20小时、小于16小时、小于15小时、小于14小时、小于13小时、小于12小时、小于11小时、小于10小时、小于9小时、小于8小时、小于7小时、小于6小时、小于5小时、小于4小时、小于3小时、小于2小时或小于1小时的任何一段时间。

在一些实施方式中，核酸酶导致双链断裂。在一些实施方式中，核酸酶导致单链断裂，例如，在一些实施方式中，核酸酶是切口酶。在一些实施方式中，核酸酶是先导编辑器(prime editor)，其包含融合至反转录酶结构域的切口酶结构域。在一些实施方式中，核酸酶是RNA-导向的先导编辑器并且gRNA包含供体模板。在一些实施方式中，使用双切口酶系统，其经由双链DNA的相对链，例如，细胞的基因组DNA的相对链上的两个单链断裂导致双链断裂。

在一些实施方式中，本发明公开提供了适合于高效敲入(例如，高比例的细胞群体包含敲入等位基因)的方法，从而克服了主要的生产困难。在一些实施方式中，高效敲入导致细胞群体中至少65％的细胞包含敲入等位基因(例如，细胞群体中至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的细胞包含敲入等位基因)。在历史上，使用质粒载体的所关心的基因敲入导致通常在0.1至5％之间的效率(参见，例如，Zhu等人,CRISPR/Cas-Mediated Selection-free Knockin Strategy in Human Embryonic StemCells.Stem Cell Reports.2015；4(6):1103-1111)，这种低敲入效率可以导致需要大量时间和资源来专门用于筛选潜在编辑的克隆。

在一些实施方式中，敲入细胞的所关心的基因可以在效应功能、特异性、隐蔽性(stealth)、持久性、归巢/趋化性和/或对某些化学品的耐受性中具有作用(参见，例如，Saetersmoen等人,Seminars in Immunopathology,2019)。

在某些实施方式中，本发明公开提供了用于产生敲入细胞的方法，所述敲入细胞不考虑年龄、分化状态和/或外源条件，维持了高表达水平。例如，在一些实施方式中，以最优水平表达整合货物，其中所期望的亚细胞定位与插入位点有关。在一些实施方式中，本发明公开提供了这类细胞。

用于编辑细胞基因组的系统

在一个方面，本发明公开提供了用于编辑细胞基因组的系统。在一些实施方式中，所述系统包含细胞、在细胞的必需基因的内源编码序列内导致断裂的核酸酶，其中所述必需基因编码细胞存活和/或增殖所需的基因产物，和包含含有与必需基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')的所关心的基因产物的外源编码序列的敲入盒的供体模板。

在一个方面，可以使用本发明公开的基因组编辑系统，例如，用于编辑干细胞。在一些实施方式中，本发明公开的基因组编辑系统包括至少两种从天然存在的CRISPR系统改适的组分：向导RNA(gRNA)和RNA导向的核酸酶。这两种组分形成复合物，所述复合物能够与特定核酸序列结合并在所述核酸序列中或其周围编辑DNA，例如，通过制备一条或多条单链断裂(SSB或切口)、双链断裂(DSB)和/或点突变。

天然存在的CRISPR系统进化性地组织化为两个类别和五种类型(Makarova等人Nat Rev Microbiol.2011Jun；9(6):467–477(“Makarova”))，并且尽管本发明公开的基因组编辑系统可改适任一类型或类别的天然存在的CRISPR系统的组分，但本文所提供的实施方式通常是从2类和II型或V型CRISPR系统改适的。2类系统涵盖II型和V型，其特征在于相对较大的多结构域RNA导向的核酸酶蛋白(例如，Cas9或Cpf1)以及一个或多个向导RNA(例如，crRNA和任选地tracrRNA)，它们形成核糖核蛋白(RNP)复合物，所述复合物结合(即靶向)并切割与crRNA的靶向(或间臂)序列互补的特定基因座。根据本发明公开的基因组编辑系统类似地靶向并编辑细胞DNA序列，但与天然存在的CRISPR系统显著不同。例如，本文所述的单分子向导RNA不是天然存在的，并且根据本发明公开的向导RNA和RNA导向的核酸酶二者可并入多种非天然存在的修饰中。

基因组编辑系统可以以多种方式实施(例如，施用或递送至细胞或受试者)，并且不同的实施可适合于不同应用。例如，在某些实施方式中，基因组编辑系统是作为蛋白质/RNA复合物(核糖核蛋白或RNP)来实施的，其可以包括在药物组合物中，所述药物组合物任选地包括药物可用的载体和/或包封剂，如脂质或聚合物微粒或纳米颗粒、胶束、脂质体等。在某些实施方式中，基因组编辑系统是作为一种或多种编码以上所描述的RNA导向的核酸酶和向导RNA组分的核酸(任选地与一种或多种其它组分一起)来实施的；在某些实施方式中，基因组编辑系统是作为一种或多种包含此类核酸的载体来实施的，例如，病毒载体，如腺病毒相关病毒；并且在某些实施方式中，基因组编辑系统是作为任何上述的组合来实施的。根据本文所述原理操作的其它或经修改的实施将对技术人员是显而易见的并且在本发明公开的范围内。

应注意本发明公开的基因组编辑系统可靶向单一特定核苷酸序列，或者可通过使用两个或更多个向导RNA靶向(并且能平行编辑)两个或更多个特定核苷酸序列。在整个本发明公开中，多种gRNA的使用被称为“多重化”，并且可用于靶向多个无关的所关心的靶标序列，或在单一靶标结构域内形成多个SSB或DSB，并且在一些情况下，用于在这种靶标结构域内产生特定编辑。例如，Maeder等人的国际专利公开No.WO 2015/138510(“Maeder”)描述了用于修正人CEP290基因中的点突变(C.2991+1655A至G)的基因组编辑系统，所述点突变导致产生了隐蔽剪接位点，这反过来降低或消除了该基因的功能。Maeder的基因组编辑系统利用两个向导RNA，所述向导RNA靶向该点突变任一侧上的序列(即侧接所述序列)，并且形成侧接该突变的DSB。这反过来促进了包括突变在内的插入序列的缺失，借此消除了隐蔽剪接位点并恢复正常基因功能。

作为另一个实例，Cotta-Ramusino等人的WO 2016/073990(“Cotta-Ramusino”)描述了利用两个gRNA并结合Cas9切口酶(产生单链切口的Cas9，如化脓链球菌(S.pyogenes)D10A)的基因组编辑系统，这种布置被称为“双切口酶系统”。Cotta-Ramusino的双切口酶系统经配置以在所关心的序列的相对链上产生两个偏移一个或多个核苷酸的切口，所述切口组合产生具有悬突(在Cotta-Ramusino的情况下是5'悬突，但3'悬突也是可能的)的双链断裂。在一些情况下，该悬突反过来可以有助于同源介导修复事件。并且作为另一个实例，Palestrant等人的WO 2015/070083(“Palestrant”)描述了靶向编码Cas9的核苷酸序列的gRNA(称为“管理RNA”)，其可以包括在基因组编辑系统中，所述基因组编辑系统包含一个或多个其它gRNA以允许Cas9的瞬时表达，所述Cas9可能另外(例如)在一些经病毒转导的细胞中组成型表达。这些多重化应用旨在是示例性的而不是限制性的，并且技术人员将理解其它多重化应用通常与本文所描述的基因组编辑系统相容。

在一些情况下，基因组编辑系统可以形成双链断裂，这些双链断裂是通过细胞DNA双链断裂机制，如NHEJ或HDR来修复的。这些机制描述于多个文献中，例如，Davis&Maizels,PNAS,111(10):E924-932,March 11,2014(“Davis”)(描述Alt-HDR)；Frit等人DNA Repair17(2014)81-97(“Frit”)(描述Alt-NHEJ)；和Iyama and Wilson III,DNA Repair(Amst.)2013-Aug；12(8):620-636(“Iyama”)(一般地描述经典HDR和NHEJ路径)。

当基因组编辑系统通过形成DSB来操作时，那么这些系统任选地包括促进或有助于特定双链断裂修复模式或特定修复结果的一种或多种组分。例如，Cotta-Ramusino还描述了其中添加单链寡核苷酸“供体模板”的基因组编辑系统；将供体模板并入细胞DNA的靶标区中，该靶标区被所述基因组编辑系统切割，并且可以导致靶标序列中的变化。

在某些实施方式中，基因组编辑系统在不引起单链或双链断裂的情况下修饰靶标序列，或修饰靶标序列中或附近的靶标基因的表达。例如，基因组编辑系统可以包括融合至作用于DNA的功能结构域的RNA导向的核酸酶，借此修饰靶标序列或其表达。作为一个实例，RNA导向的核酸酶可连接至(例如，融合至)胞苷脱氨酶功能结构域，并且可通过产生靶向的C至A的替换来操作。示例性核酸酶/脱氨酶融合体描述于Komor等人Nature 533,420–424(19May 2016)(“Komor”)。作为另外一种选择，基因组编辑系统可以使用切割失活(即“死”)核酸酶，如死Cas9(dCas9)，并且可以通过在细胞DNA的一个或多个靶标区上形成稳定复合物来起作用，借此干扰涉及靶标区的功能，其无限制地包括mRNA转录、染色质重塑等。

核酸酶

可以在本发明公开所述的方法中使用在细胞的内源基因组序列，例如，必需基因的编码序列内导致断裂的任何核酸酶。在一些实施方式中，核酸酶是DNA核酸酶。在一些实施方式中，例如，在“先导编辑”系统中，核酸酶在细胞的必需基因的内源编码序列内导致单链断裂(SSB)。在一些实施方式中，核酸酶在细胞的必需基因的内源编码序列内导致双链断裂(DSB)。在一些实施方式中，双链断裂是由单个核酸酶所造成的。在一些实施方式中，双链断裂是由两个核酸酶所造成的，每个核酸酶在相对链上造成单链断裂，例如，双“切口酶”系统。在一些实施方式中，核酸酶是CRISPR/Cas核酸酶并且所述方法还包括将细胞与CRISPR/Cas核酸酶的一个或多个向导分子接触。在本文中更详细地描述了示例性CRISPR/Cas核酸酶和向导分子。应理解不以任何方式限制核酸酶(包括切口酶)并且核酸酶还可以是锌指核酸酶(ZFN)、转录激活子样效应因子核酸酶(TALEN)、大范围核酸酶或者本领域中已知的其它核酸酶(或其组合)。设计锌指核酸酶(ZFN)的方法在本领域中是熟知的，例如，参见Urnov等人,Nature Reviews Genetics 2010；11:636-640和Paschon等人,Nat.Commun.2019；10(1):1133和其中引用参考文献。设计转录激活子样效应因子核酸酶(TALEN)的方法在本领域中是熟知的，例如，参见Joung and Sander,Nat.Rev.Mol.Cell Biol.2013；14(1):49-55和其中引用参考文献。设计大范围核酸酶的方法在本领域中熟知的，例如，参见Silva等人,Curr.Gene Ther.2011；11(1):11-27和Redel and Prather,Toxicol.Pathol.2016；44(3):428-433。

在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约50％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约55％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约60％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约65％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约70％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约75％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约80％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约85％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约90％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约95％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约96％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约97％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约98％的编辑效率。在一些实施方式中，适合于本文所描述的方法的核酸酶可以具有大于约99％的编辑效率。

通常，可以将核酸酶作为蛋白质或编码蛋白质的核酸，例如，DNA分子或mRNA分子递送到细胞。蛋白质或核酸可以与其它递送剂，例如，脂质或聚合物纳米颗粒中的脂质或聚合物以及靶向剂，如抗体或对细胞具有特异性的其它结合剂组合。DNA分子可以是核酸载体，如病毒基因组或环形双链DNA，例如，质粒。编码核酸酶的核酸载体可以包括其它编码或非编码元件。例如，可以作为包括某些基因组主链元件(例如，就AAV基因组来说，末端反向重复)的病毒基因组的一部分递送核酸酶(例如，在AAV、腺病毒或慢病毒基因组中)。

可以将CRISPR/Cas核酸酶作为蛋白质或编码蛋白质的核酸，例如，DNA分子或mRNA分子递送到细胞。可以作为RNA分子或DNA分子所编码的分子递送向导分子。还可以将CRISPR/Cas核酸酶作为核糖核蛋白(RNP)与向导分子一起递送并经由核转染(电穿孔)引入细胞。

CRISPR/Cas核酸酶

根据本发明公开的CRISPR/Cas核酸酶包括(但不限于)天然存在的2类CRISPR核酸酶，如Cas9和Cpf1(Cas12a)，以及其它Cas12核酸酶和由此衍生或获得的核酸酶。在功能方面，将CRISPR/Cas核酸酶定义为如下的那些核酸酶：(a)与gRNA相互作用(例如，复合)；和(b)与gRNA一起结合或任选地切割或修饰DNA的靶标区，所述靶标区包括(i)与gRNA的靶向结构域互补的序列，以及任选地，(ii)称为“前间隔邻近基序”或者“PAM”的另一序列，其更详细地描述于下文中。如以下实例将说明，CRISPR/Cas核酸酶可以在广义上依据其PAM特异性和切割活性来定义，尽管在共有相同PAM特异性或切割活性的各个CRISPR/Cas核酸酶之间可能存在变化。技术人员将理解本发明公开的一些方面涉及可以使用具有特定PAM特异性和/或切割活性的任何适合的CRISPR/Cas核酸酶实施的系统和方法。出于这种原因，除非另外指明，否则术语CRISPR/Cas核酸酶应被理解为一般术语，并且不限于CRISPR/Cas核酸酶的任何具体类型(例如，Cas9 vs.Cpf1)、物种(例如，化脓链球菌(S.pyogenes)vs.金黄色葡萄球菌(S.aureus))或变体(例如，全长vs.截短或分裂；天然存在的PAM特异性vs.工程化PAM特异性等)。

PAM序列的名称来源于其与“前间隔”序列的顺序关系，所述前间隔序列与gRNA靶向结构域(或“间隔”)互补。与前间隔序列一起，PAM序列定义了特定CRISPR/Cas核酸酶和gRNA组合的靶标区或序列。

多种CRISPR/Cas核酸酶可能需要PAM与前间隔序列之间不同的顺序关系。通常，Cas9识别前间隔序列3'的PAM序列。另一方面，Cpf1(Cas12a)通常识别前间隔序列5'的PAM序列。

除了识别PAM和前间隔序列的特定顺序取向外，CRISPR/Cas核酸酶还可以识别特定PAM序列。例如，金黄色葡萄球菌(S.aureus)Cas9识别NNGRRT或NNGRRV的PAM序列，其中N个残基紧靠由gRNA靶向结构域所识别的区域的3'。化脓链球菌(S.pyogenes)Cas9识别NGGPAM序列。新凶手弗朗西斯菌(F.novicida)Cpf1识别TTN PAM序列。已鉴定多种CRISPR/Cas核酸酶的PAM序列，并且鉴定新型PAM序列的策略已描述于Shmakov等人,Molecular Cell2015；60:385-397。还应注意，工程化CRISPR/Cas核酸酶可具有与参考分子的PAM特异性不同的PAM特异性(例如，在工程化CRISPR/Cas核酸酶的情况中，参考分子可以是衍生出CRISPR/Cas核酸酶的天然存在的变体，或与工程化CRISPR/Cas核酸酶具有最大氨基酸序列同源性的天然存在的变体)。

除了其PAM特异性外，CRISPR/Cas核酸酶的特征可以在于其DNA切割活性：天然存在的CRISPR/Cas核酸酶通常在靶标核酸中形成双链断裂(DSB)，但是已产生仅生成单链断裂(SSB)的工程化变体，例如，Ran等人,Cell 2013；154(6):1380-1389(“Ran”)中所讨论的那些，或者完全不切割的工程化变体。

Cas9

已确定了化脓链球菌(S.pyogenes)Cas9的晶体结构(Jinek等人,Science 2014；343(6176):1247997)(“Jinek 2014”)，以及与单分子向导RNA和靶标DNA复合的金黄色葡萄球菌(S.aureus)Cas9的晶体结构。参见Nishimasu等人,Cell 1024；156:935-949(“Nishimasu 2014”)；Nishimasu等人,Cell 2015；162:1113-1126(“Nishimasu 2015”)；和Anders等人,Nature 2014；513(7519):569-73(“Anders 2014”)。

天然存在的Cas9蛋白包含两个叶：识别(REC)叶和核酸酶(NUC)叶；每个叶包含特定结构和/或功能域。REC叶包含富精氨酸桥螺旋(BH)结构域，以及至少一个REC结构域(例如，REC1结构域和任选地REC2结构域)。REC叶不与其它已知蛋白共有结构相似性，表明其是独特的功能域。不希望受限于任何理论，突变分析表明了BH和REC域的特殊功能作用：BH结构域似乎在gRNA:DNA识别中发挥作用，而REC结构域被认为与gRNA的重复:抗重复双螺旋相互作用并介导Cas9/gRNA复合物的形成。

NUC叶包含RuvC结构域、HNH结构域和PAM相互作用(PI)结构域。RuvC结构域与反转录病毒整合酶超家族成员共有结构相似性，并且切割靶标核酸的非互补(即底部)链。它可从两个或更多个分裂的RuvC基序形成(例如，化脓链球菌(S.pyogenes)和金黄色葡萄球菌(S.aureus)中的RuvC I、RuvCII和RuvCIII)。同时，HNH结构域在结构上与HNN内切核酸酶基序类似，并且切割靶标核酸的互补(即顶部)链。顾名思义，PI结构域有助于PAM特异性。

尽管Cas9的某些功能与以上所述的特定结构域有关(但不必需完全取决于所述结构域)，但这些和其它功能可以受其它Cas9结构域或任一叶上的多个结构域介导或影响。例如，在化脓链球菌(S.pyogenes)Cas9中，如在Nishimasu 2014中所述，gRNA的重复:抗重复双螺旋落在REC叶与NUC叶之间的沟中，并且双螺旋中的核苷酸与BH、PI和REC结构域中的氨基酸相互作用。第一茎环结构中的一些核苷酸也与多个结构域(PI、BH和REC1)中的氨基酸相互作用，第二和第三茎环(RuvC和PI结构域)中的一些核苷酸也是如此。

Cpf1

Yamano等人,Cell.2016；165(4):949-962(“Yamano”)已解析了与crRNA和包括TTTN PAM序列的dsDNA靶标复合的氨基酸球菌属种(Acidaminococcus sp.)Cpf1的晶体结构。像Cas9一样，Cpf1具有两个叶：REC(识别)叶和NUC(核酸酶)叶。REC叶包括REC1和REC2结构域，其缺少与任何已知蛋白质结构的相似性。同时，NUC叶包括三个RuvC结构域(RuvC-I、-II和-III)和BH结构域。然而，与Cas9相反，Cpf1REC叶缺少HNH结构域，并且包括同样缺少与已知蛋白质结构的相似性的其它结构域：结构上独特的PI结构域、3个楔形(WED)结构域(WED-I、-II和-III)和核酸酶(Nuc)结构域。

尽管Cas9和Cpf1共有结构和功能的相似性，但应理解某些Cpf1活性是由与任何Cas9结构域不同的结构域介导的。例如，靶标DNA的互补链的切割似乎是由Nuc结构域介导的，所述Nuc结构域在顺序上和空间上与Cas9的HNH结构域不同。另外，Cpf1gRNA的非靶向部分(把手)采用假结(pseudoknot)结构，而不是Cas9 gRNA中由重复：抗重复双螺旋形成的茎环结构。

核酸酶变体

本文所描述的CRISPR/Cas核酸酶具有可用于多种应用的活性和性质，但技术人员将理解在某些情况下，CRISPR/Cas核酸酶也可以经修饰以改变切割活性、PAM特异性或其它结构或功能特性。

首先参见改变切割活性的修饰，上文已描述降低或消除NUC叶内结构域活性的突变。可在RuvC结构域中、在Cas9 HNH结构域中或在Cpf1 Nuc结构域中做出的示例性突变描述于Ran、Yamano和PCT专利公开No.WO 2016/073990A1，以上每篇文献的全部内容以其全部作为参考并入本文。通常，降低或消除两个核酸酶结构域之一中的活性的突变导致产生了具有切口酶活性的CRISPR/Cas核酸酶，但应注意切口酶活性类型根据哪个结构域失活而变化。作为一个实例，RuvC结构域或Cas9 HNH结构域的失活导致产生了切口酶。示例性切口酶变体包括Cas9 D10A和Cas9 H840A(编号方案根据SpCas9野生型序列)。基于本发明公开和本领域中的知识，其它适合的切口酶变体，包括Cas12a变体将对技术人员是显而易见的。本发明公开不限于这一方面。在一些实施方式中，切口酶可以融合至反转录酶以产生先导编辑器(PE)，例如，如Anzalone等人,Nature 2019；576:149-157中所述，该文献的全部内容作为参考并入本文。

已对于化脓链球菌(S.pyogenes)(Kleinstiver等人,Nature 2015；523(7561):481-5)和金黄色葡萄球菌(S.aureus)(Kleinstiver等人,Nat Biotechnol.2015；33(12):1293-1298)两者描述了相对于天然存在的Cas9参考分子的PAM特异性的修饰。还描述了改善Cas9的靶向保真度的修饰(Kleinstiver等人,Nature 2016；529:490-495)。这些参考文献中的每一篇作为参考并入本文。

还将CRISPR/Cas核酸酶分成两个或更多个部分，如Zetsche等人,NatBiotechnol.2015；33(2):139-42(作为参考并入)和Fine等人,Sci Rep.2015；5:10777(作为参考并入)所描述的。

在某些实施方式中，CRISPR/Cas核酸酶可以是尺寸经优化的或截短的，例如，通过一个或多个缺失来进行，所述缺失减小核酸酶的尺寸，同时仍保留gRNA结合、靶向和PAM识别以及切割活性。在某些实施方式中，RNA导向的核酸酶以共价或非共价方式，任选地通过接头结合至另一多肽、核苷酸或其它结构。示例性结合的核酸酶和接头描述于Guilinger等人,Nature Biotech.2014；32:577-582，该文献作为参考并入本文。

CRISPR/Cas核酸酶还任选地包括标签，如(但不限于)核定位信号，以有助于CRISPR/Cas核酸酶蛋白向核的移动。在某些实施方式中，CRISPR/Cas核酸酶可以引入C末端和/或N末端核定位信号。核定位序列在本领域中是已知的。

前述修饰列表旨在在本质上是示例性的，并且技术人员根据本发明公开将理解在某些应用中，其它修饰可以是可能的或期望的。因此，为简洁起见，参考特定CRISPR/Cas核酸酶呈现本发明公开的示例性系统、方法和组合物，但应理解所使用的CRISPR/Cas核酸酶可以以不改变其操作原理的方式进行修饰。这些修饰在本发明公开的范围内。

示例性的适合的核酸酶变体包括(但不限于)包含M537R替换、H800A替换和/或F870L替换或其任意组合(根据AsCpf1野生型序列的编号方案)的AsCpf1(AsCas12a)变体。在一些实施方式中，核酸酶变体是Cas12a变体，例如，包含1、2或3个选自M537R、F870L和H800A的氨基酸替换的Cas12a变体。在一些实施方式中，Cas12a变体包含与本文所描述的AsCpf1序列具有至少约90％、95％或100％的同一性的氨基酸序列。

AsCpf1氨基酸序列的其它适合的修饰是本领域那些技术人员已知的。下面提供了野生型AsCpf1和AsCpf1变体的一些示例性序列：

SEQ ID NO：58-His-AsCpf1-sNLS-sNLS H800A氨基酸序列

MGHHHHHHGSTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAARLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRNGSPKKKRKVGSPKKKRKV

SEQ ID NO：59-Cpf1变体1氨基酸序列

MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQRPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFLFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRNGRSSDDEATADSQHAAPPKKKRKVGGSGGSGGSGGSGGSGGSGGSGGSLEHHHHHH

SEQ ID NO：60-Cpf1变体2氨基酸序列

MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRNGRSSDDEATADSQHAAPPKKKRKVGGSGGSGGSGGSGGSGGSGGSGGSLEHHHHHH

SEQ ID NO：61-Cpf1变体3氨基酸序列

MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQRPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAARLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFLFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRNGRSSDDEATADSQHAAPPKKKRKVGGSGGSGGSGGSGGSGGSGGSGGSLEHHHHHH

SEQ ID NO：62-Cpf1变体4氨基酸序列

MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQRPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAARLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFLFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRNGRSSDDEATADSQHAAPPKKKRKV

SEQ ID NO：63-Cpf1变体5氨基酸序列

MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQRPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFLFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRNGRSSDDEATADSQHAAPPKKKRKV

SEQ ID NO：64-Cpf1变体6氨基酸序列

SEQ ID NO：65-Cpf1变体7氨基酸序列

MGRDPGKPIPNPLLGLDSTAPKKKRKVGIHGVPAATQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRNPKKKRKVKLAAALEHHHHHH

SEQ ID NO：66-示例性AsCpf1野生型氨基酸序列

MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRN

基于本发明公开，根据本领域的知识，其它适合的核酸酶和核酸酶变体将对技术人员是显而易见的。示例性适合的核酸酶可以包括(但不限于)表5中所提供的那些。

表5：示例性适合的CRISPR/Cas核酸酶

/>

向导RNA(gRNA)分子

本发明公开的向导RNA(gRNA)可以是单分子的(包含单个RNA分子，并且作为另外一种选择被称为嵌合的)，或者模块的(包含不止一个并且通常两个单独的RNA分子，如crRNA和tracrRNA，其通常彼此结合，例如，通过双链化结合)。在整个文献中描述了gRNA和它们的构成部件，例如，在Briner等人,Molecular Cell 2014；56(2):333-339(“Briner”)和在PCT专利公开No.WO2016/073990A1中。

在细菌和古细菌中，II型CRISPR系统通常包含CRISPR/Cas核酸酶蛋白，如Cas9、包括与外源序列互补的5'区的CRISPR RNA(crRNA)和包括与crRNA的3'区互补并形成双螺旋的5'区的反式激活crRNA(tracrRNA)。尽管不意欲受任何理论束缚，但是据认为这种双螺旋有助于Cas9/gRNA复合物的形成并且是Cas9/gRNA复合物活性的所必需的。由于II型CRISPR系统适合于在基因编辑中使用，已发现crRNA和tracrRNA可以结合到单一单分子或嵌合向导RNA中，在一个非限制性实例中，通过桥接crRNA(在其3'端)和tracrRNA(在其5'端)的互补区的4个核苷酸(例如，GAAA)的“四核苷酸环”或者“接头”序列。参见Mali等人,Science2013；339(6121):823–826(“Mali”)；Jiang等人,Nat Biotechnol.2013；31(3):233–239(“Jiang”)；和Jinek等人,Science 2012；337(6096):816-821(“Jinek 2012”)。

向导RNA，无论是单分子还是模块的，包括“靶向结构域”，其与靶标序列，如需要编辑的细胞基因组中的DNA序列内的靶向结构域完全或部分互补。在文献中通过多种名称提及靶向结构域，其无限制地包括“向导序列”(Hsu等人,Nat Biotechnol.2013；31(9):827–832(“Hsu”))、“互补区”(PCT专利公开No.WO2016/073990A1)、“间臂”(Briner)和一般地作为“crRNA”(Jiang)。不管所赋予它们的名称，靶向结构域通常为10-30个核苷酸长，并且在某些实施方式中，16-24个核苷酸长(例如，16、17、18、19、20、21、22、23或24个核苷酸长)，并且在Cas9 gRNA的情况下，处于5'端处或附近，而在Cpf1 gRNA的情况下，处于3'端处或附近。

除靶向结构域外，gRNA通常(但不必需，如以下所讨论的)包括可以影响gRNA/Cas9复合物的形成或活性的多个结构域。例如，如以上所提及的，由gRNA的第一和第二互补结构域形成的双螺旋结构(也称为重复序列：抗重复序列双螺旋)与Cas9的识别(REC)叶片相互作用，并且可以介导Cas9/gRNA复合物的形成。参见Nishimasu 2014和2015。应注意所述第一和/或第二互补结构域可以含有可由RNA聚合酶识别为终止信号的一个或多个多聚-A束。因此，第一和第二互补结构域的序列被任选地修饰(例如，通过使用如Briner中所述的A-G交换或A-U交换)以消除这些段并促进gRNA的完整体外转录。对第一和第二互补结构域的这些及其它类似修饰在本发明公开的范围内。

与第一和第二互补结构域一起，Cas9 gRNA通常包含在体内但不一定在体外参与核酸酶活性的两个或更多个其它双螺旋区域。参见Nishimasu 2015。在第二互补结构域的3'部分附近的第一茎环1被不同地称为“近端结构域”(PCT专利公开No.WO2016/073990A1)、“茎环1”(Nishimasu 2014和2015)和“联结”(Briner)。一个或多个其它茎环结构通常存在于gRNA的3'端附近，其数量随着物种而变化：酿脓链球菌(S.pyogenes)gRNA通常包含两个3'茎环(总计4个茎环结构，包括重复序列：抗重复序列双螺旋)，而金黄色葡萄球菌(S.aureus)及其它物种仅有一个(总计3个茎环结构)。Briner中提供了按物种组织的保守茎环结构(并且更一般地，gRNA结构)的描述。

尽管先前描述已集中在与Cas9一起使用的gRNA，但应理解已(或将来可能会)发现或发明其它CRISPR/Cas核酸酶，所述CRISPR/Cas核酸酶利用了与关于这一点所述的那些在某些方面不同的gRNA。例如，Cpf1(“来自普氏菌属(Prevotella)和弗朗西丝氏菌属1(Franciscella 1)的CRISPR”，其也被称为Cas12a)是不需要tracrRNA起作用的CRISPR/Cas核酸酶(参见Zetsche等人,Cell 2015；163:759–771(“Zetsche I”))。用于Cpf1基因组编辑系统中的gRNA通常包含靶向结构域和互补结构域(替代地，称为“手柄”)。还应注意，在与Cpf1一起使用的gRNA中，靶向结构域通常存在于3'端处或附近，而不是上文关于Cas9 gRNA所描述的5'端(手柄位于Cpf1 gRNA的5'端处或附近)。

然而，本领域技术人员将理解尽管来自不同原核物种的gRNA之间或Cpf1与Cas9gRNA之间可能存在结构差异，但是gRNA的运行原理总体上是一致的。由于这种运行一致性，gRNA可以通过其靶向结构域序列而在广义上被定义，并且技术人员将理解，可以将给定的靶向结构域序列并入任何适合的gRNA中，所述适合的gRNA包括单分子或嵌合gRNA或包含一个或多个化学修饰和/或序列修饰(取代、其它核苷酸、截短等)的gRNA。因此，为了方便在本发明公开中呈现，gRNA可以仅关于其靶向结构域序列来描述。

更一般地，技术人员将理解本发明公开的一些方面涉及可使用多种CRISPR/Cas核酸酶实现的系统、方法和组合物。因此，除非另有说明，否则术语gRNA应被理解为涵盖可与任何CRISPR/Cas核酸酶一起使用的任何适合的gRNA，而不仅为与特定物种的Cas9或Cpf1相容的那些gRNA。举例说明，在某些实施方式中，术语gRNA可以包括与存在于2类CRISPR系统(如II型或V型或CRISPR系统)中的任何CRISPR/Cas核酸酶或者由此来源或改编的CRISPR/Cas核酸酶一起使用的gRNA。

在一些实施方式中，本发明公开的方法或系统可以使用不止一种gRNA。在一些实施方式中，可以使用两种或更多种gRNA在细胞基因组中产生两个或更多个双链断裂。在一些实施方式中，可以使用同时用两个或更多个敲入盒靶向两个或更多个必需基因的多路编辑策略。在一些这些实施方式中，两个或更多个敲入盒可以包含不同的外源货物序列，例如，不同的敲入盒可以编码不同的所关心的基因产物并因此所编辑的细胞将从靶向至不同基因座的不同敲入盒表达多种所关心的基因产物。

在一些实施方式中，使用不止一种gRNA，可以通过双重-gRNA配对的“切口酶”策略产生双链断裂。在一些实施方式中，对于选择gRNA，包括对于哪种gRNA可以用于双重-gRNA配对的“切口酶”策略的确定，gRNA对应定位在DNA上，从而PAM朝外并且被D10ACas9切口酶切割将导致产生5'悬突。

在一些实施方式中，本发明公开的方法或系统可以使用先导编辑gRNA(pegRNA)结合先导编辑器(prime editor)(PE)。如本领域所熟知的，pegRNA显著大于标准gRNA，例如，在一些实施方式中，长50、100、150或250个核苷酸，例如，如Anzalone等人,Nature 2019；576:149-157中所述，该文献的全部内容作为参考并入本文。pegRNA是具有引物结合序列(PBS)和含有在末端之一，例如，3'端添加的所期望的RNA序列的供体模板的gRNA。PE:pegRNA复合物结合至靶标DNA，并且先导编辑器(prime editor)的切口酶结构域仅对一条链产生切口，从而产生片状悬垂(flap)。位于pegRNA上的PBS结合至DNA片状悬垂，并且使用先导编辑器(prime editor)的反转录酶结构域反转录所编辑的RNA序列。将所编辑的链在切口片状悬垂末端引入DNA，并且使用新的反转录DNA修复靶标DNA。通过细胞核酸内切酶除去原始DNA片段。这使得一条链被编辑，一条链未被编辑。在最新的PE系统中，例如，在PE3和PE3b中，可以通过使用其它标准gRNA修正未编辑的链以匹配新编辑的链。在这种情况下，通过切口酶对未编辑的链产生切口并且将新编辑的链用作模板来修复切口，因此完成编辑。

gRNA设计

先前已描述了用于靶标序列的选择和验证以及脱靶分析的方法，例如，Mali；Hsu；Fu等人,Nat Biotechnol 2014；32(3):279-84；Heigwer等人,Nat methods 2014；11(2):122-3；Bae等人,Bioinformatics 2014；30(10):1473-5；和Xiao等人Bioinformatics2014；30(8):1180-1182。作为非限制性实例，gRNA设计可包括使用软件工具来优化对应于用户靶标序列的潜在靶标序列的选择，例如，以使全基因组的总脱靶活性最小化。尽管脱靶活性不局限于切割，但可以(例如)使用实验衍生的加权方案来预测每个脱靶序列处的切割效率。这些及其它向导选择法详细描述于PCT专利公开No.WO2016/073990A1中。

例如，可以使用cas-offinder实施用于靶标序列的选择和验证以及脱靶分析的方法(Bae等人,Bioinformatics 2014；30:1473–5)。Cas-offinder是可以快速识别基因组中所有与向导序列具有多至指定数目的不匹配的序列的工具。

作为另一个实例，可以实施对于给定序列将脱靶(例如，一旦识别候选靶标序列)的可能性进行打分的方法。示例性得分包括切割频率确定(CFD)得分，如通过Doench等人,Nat Biotechnol.2016；34:184–91所描述的。

gRNA修饰

在某些实施方式中，如本文所使用的gRNA可以是经修饰的或未修饰的gRNA。在某些实施方式中，gRNA可以包括一个或多个修饰。在某些实施方式中，所述一个或多个修饰可以包括硫代磷酸酯键修饰、二硫代磷酸酯(PS2)键修饰、2'-O-甲基修饰或其组合。在某些实施方式中，一个或多个修饰可以在gRNA的5'端、在gRNA的3'端或其组合。

在某些实施方式中，gRNA修饰可包含一个或多个二硫代磷酸酯(PS2)键修饰。

在一些实施例中，本文所使用的gRNA包括一个或多个或一段脱氧核糖核酸(DNA)碱基，在本文中也称为“DNA延伸”。在一些实施方式中，本文所使用的gRNA在gRNA的5'端、gRNA的3'端或其组合处包括DNA延伸。在某些实施方式中，所述DNA延伸可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个DNA碱基长。例如，在某些实施方式中，DNA延伸可以是1、2、3、4、5、10、15、20或25个DNA碱基长。在某些实施方式中，DNA延伸可以包括一个或多个选自腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)的DNA碱基。在某些实施方式中，DNA延伸包括相同的DNA碱基。例如，DNA延伸可以包括一段腺嘌呤(A)碱基。在某些实施方式中，DNA延伸可以包括一段胸腺嘧啶(T)碱基。在某些实施方式中，DNA延伸包括不同DNA碱基的组合。

下表6中提供了用于Cpf1向导RNA的示例性的适合的5'延伸：

表6：示例性Cpf1 gRNA 5'延伸

在某些实施方式中，本文所使用的gRNA包括DNA延伸以及化学修饰，例如，一个或多个硫代磷酸酯键修饰、一个或多个二硫代磷酸酯(PS2)键修饰、一个或多个2'-O-甲基修饰或者一个或多个本文所公开的其它适合的化学gRNA修饰或其组合。在某些实施方式中，一个或多个修饰可以在gRNA的5'端、在gRNA的3'端或其组合。

不希望受理论束缚，据考虑任何DNA延伸可以与本文所公开的任何gRNA一起使用，只要它不杂交至所述gRNA所靶向的靶标核酸并且它还相对于不包括这种DNA延伸的gRNA在靶标核酸位点处显示出编辑的增加。

在一些实施方式中，本文所使用的gRNA包括一个或多个或一段核糖核酸(RNA)碱基，在本文中也称为“RNA延伸”。在一些实施方式中，本文所使用的gRNA在gRNA的5'端、gRNA的3'端或其组合处包括RNA延伸。在某些实施方式中，所述RNA延伸可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个RNA碱基长。例如，在某些实施方式中，所述RNA延伸可以是1、2、3、4、5、10、15、20或25个RNA碱基长。在某些实施方式中，RNA延伸可以包括一个或多个选自腺嘌呤(rA)、鸟嘌呤(rG)、胞嘧啶(rC)或尿嘧啶(rU)的RNA碱基，其中“r”代表RNA，2'-羟基。在某些实施方式中，RNA延伸包括相同的RNA碱基。例如，RNA延伸可以包括一段腺嘌呤(rA)碱基。在某些实施方式中，RNA延伸包括不同RNA碱基的组合。在某些实施方式中，本文所使用的gRNA包括RNA延伸以及一个或多个硫代磷酸酯键修饰、一个或多个二硫代磷酸酯(PS2)键修饰、一个或多个2'-O-甲基修饰、一个或多个本文所公开的其它适合的gRNA修饰，例如，化学修饰或其组合。在某些实施方式中，一个或多个修饰可以在gRNA的5'端、在gRNA的3'端或其组合。在某些实施方式中，包括RNA延伸的gRNA可以包括本文所述的序列。

据考虑本文所使用的gRNA还可以包括RNA延伸和DNA延伸。在某些实施方式中，RNA延伸和DNA延伸可以位于gRNA的5'端、gRNA的3'端或其组合处。在某些实施方式中，RNA延伸位于gRNA的5'端并且DNA延伸位于gRNA的3'端。在某些实施方式中，RNA延伸位于gRNA的3'端并且DNA延伸位于gRNA的5'端。

在一些实施方式中，包括修饰，例如，5'端处的DNA延伸和/或如本文所公开的化学修饰的gRNA与CRISPR/Cas核酸酶，例如，AsCpf1核酸酶复合，以形成RNP，其然后用于编辑靶细胞，例如，多潜能干细胞或其子代。

可以在gRNA序列内的任何位置处包括本节中所讨论的某些示例性修饰，所述位置无限制地包括5'端处或附近(例如，5'端的1-10、1-5或1-2个核苷酸内)和/或3'端处或附近(例如，3'端的1-10、1-5或1-2个核苷酸内)。在一些情况下，修饰定位在功能性基序内，如Cas9 gRNA的重复-反向重复双螺旋、Cas9或Cpf1 gRNA的茎环结构和/或gRNA的靶向结构域。

作为一个实例，gRNA的5'端可以包括真核mRNA帽结构或帽类似物(例如，G(5')ppp(5')G帽类似物、m7G(5')ppp(5')G帽类似物或3'-O-Me-m7G(5')ppp(5')G抗反向帽类似物(ARCA))，如下所示：

/>

可以在gRNA的化学或酶促合成期间包括帽或帽类似物。

在类似的方向上，gRNA的5'端可以缺少5'三磷酸酯基。例如，可以对体外转录的gRNA进行磷酸酶处理(例如，使用小牛肠碱性磷酸酶)以除去5'三磷酸酯基。

另一种常见的修饰包括在gRNA的3'端添加多个(例如，1-10、10-20或25-200)腺嘌呤(A)残基，其被称为多聚A束(polyA tract)。可以使用多聚腺苷聚合酶(例如，大肠杆菌(E.coli)多聚(A)聚合酶)在化学或酶促合成期间将多聚A束添加至gRNA。

可以在3'端U核糖处修饰向导RNA。例如，可以使U核糖的两个末端羟基氧化为醛基，并且伴随核糖环打开以提供如下所示的修饰的核苷：

其中“U”可以是未修饰的或修饰的尿嘧啶核苷。

如下所示，可以用2'3'环磷酸酯修饰3'端U核糖：

其中“U”可以是未修饰的或修饰的尿嘧啶核苷。

向导RNA可以含有可以对降解稳定的3'核苷酸，例如，通过引入一个或多个本文所描述的修饰的核苷酸。在某些实施方式中，尿苷可以被修饰的尿苷替换，例如，5-(2-氨基)丙基尿苷和5-溴代尿苷，或者被本文所描述的修饰的尿苷中的任一种替换；腺苷和鸟苷可以被修饰的腺苷和鸟苷替换，例如，被在8-位具有修饰的腺苷和鸟苷，例如，8-溴代鸟苷替换，或者被本文所描述的修饰的腺苷或鸟苷中的任一种替换。

在某些实施方式中，可以将糖-修饰的核糖核苷酸引入gRNA，例如，其中2'OH-基团被选自下列的基团替换：H、-OR、-R(其中R可以是(例如)烷基、环烷基、芳基、芳烷基、杂芳基或糖)、卤代、-SH、-SR(其中R可以是(例如)烷基、环烷基、芳基、芳烷基、杂芳基或糖)、氨基(其中氨基可以是(例如)NH₂、烷基氨基、二烷基氨基、杂环基、芳氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸)；或者氰基(-CN)。在某些实施方式中，如本文所描述的，可以修饰磷酸酯主链，例如，用硫代磷酸酯(PhTx)基团修饰。在某些实施方式中，gRNA的一个或多个核苷酸可以分别独立地为修饰或未修饰的核苷酸，其包括(但不限于)2'-糖修饰的，如2'-O-甲基、2'-O-甲氧基乙基或者2'-氟代修饰的，包括(例如)2'-F或2'-O-甲基腺苷(A)、2'-F或2'-O-甲基胞苷(C)、2'-F或2'-O-甲基尿苷(U)、2'-F或2'-O-甲基胸苷(T)、2'-F或2'-O-甲基鸟苷(G)、2'-O-甲氧基乙基-5-甲基尿苷(Teo)、2'-O-甲氧基乙基腺苷(Aeo)、2'-O-甲氧基乙基-5-甲基胞苷(m5Ceo)及其任意组合。

向导RNA也可以包括“锁”核酸(LNA)，其中可以(例如)通过C1-6亚烷基或C1-6杂亚烷基桥，将2'OH-基团连接至相同核糖的4'碳。任何适合的部分可以用于提供这种桥，其无限制地包括亚甲基、亚丙基、醚或氨基桥；O-氨基(其中氨基可以是(例如)NH₂、烷基氨基、二烷基氨基、杂环基、芳氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或聚氨基)和氨基烷氧基或者O(CH₂)_n-氨基(其中氨基可以是(例如)NH₂、烷基氨基、二烷基氨基、杂环基、芳氨基、二芳基氨基、杂芳基氨基或者二杂芳基氨基、乙二胺或者聚氨基)。

在某些实施方式中，gRNA可以包括修饰的核苷酸，它是多环(例如，三环；和“非锁”形式，如乙二醇核酸(GNA)(例如，R-GNA或S-GNA，其中核糖被连接至磷酸二酯键的乙二醇单元替换)，或者苏糖核酸(TNA，其中核糖被α-L-苏呋喃糖基-(3′→2’)替换)。

通常，gRNA包括糖基核糖，它是具有氧的5元环。示例性的修饰的gRNA可以无限制地包括核糖中氧的替代(例如，经硫(S)、硒(Se)或亚烷基，如(例如)亚甲基或亚乙基)；双键的添加(例如，以用环戊烯基或环己烯基替代核糖)；核糖的环缩(例如，以形成环丁烷或环氧丙烷的4元环)；核糖的环扩(例如，以形成具有另外的碳或杂原子的6元环或7元环，如(例如)脱水己糖醇、阿卓糖醇、甘露糖醇、环己烷基、环己烯基以及吗啉代，其也具有氨基磷酸酯主链)。尽管大多数的糖类似物改变定位至2'位，但其它位点也适于修饰，包括4'位。在某些实施方式中，gRNA包含4'-S、4'-Se或4'-C-氨基甲基-2'-O-Me修饰。

在某些实施方式中，可以将脱氮核苷酸(例如，7-脱氮-腺苷)并入gRNA中。在某些实施方式中，可以将O-烷基化和N-烷基化核苷酸(例如，N6-甲基腺苷)并入gRNA中。在某些实施方式中，gRNA中的一个或多个或全部核苷酸是脱氧核苷酸。

向导RNA也可以在crRNA(在其3'端)和tracrRNA(在其5'端)的互补区之间包括一个或多个交联(例如，在“四环”结构内和/或定位在gRNA内存在的任何茎环结构中)。多种接头适合于使用。例如，向导RNA可以包括常规连接部分，其无限制地包括聚乙烯醚、聚乙烯、聚丙烯、聚乙二醇(PEG)、聚乙烯醇(PVA)、聚乙交酯(PGA)、聚交酯(PLA)、聚己酸内酯(PCL)及其共聚物。

在一些实施方式中，将双官能交联剂用于连接第一gRNA片段的5'端和第二gRNA片段的3'端，并且用与交联剂的反应基团反应的官能团修饰要连接的gRNA片段的3'或5'端。通常，这些修饰包含以下中的一个或多个：胺、巯基、羧基、羟基、烯烃(例如，末端烯烃)、叠氮化物和/或另一种适合的官能团。多官能(例如，双官能)交联剂通常在本领域中也是已知的，并且可以是杂官能或同型双官能的，并且可以包括任何适合的官能团，其无限制地包括异硫氰酸酯、异氰酸酯、酰基叠氮、NHS酯、磺酰氯、甲苯磺酰酯、三氟乙基磺酰酯、醛、胺、环氧化物、碳酸酯(例如，双(p-硝基苯)碳酸酯)、芳基卤、卤代烷、亚氨酯、羧酸酯、磷酸烷基酯、酸酐、氟苯酯、HOBt酯、羟甲基膦、O-甲基异脲、DSC、NHS氨基甲酸酯、戊二醛、激活的双键、环半缩醛、NHS碳酸酯、咪唑氨基甲酸酯、酰基咪唑、甲基吡啶醚、吖内酯、氰酸酯、环亚胺碳酸酯、氯三嗪、二氢氮杂(dehydroazepine)、6-磺基胞嘧啶衍生物、马来酰亚胺、氮丙啶、TNB硫醇、Ellman试剂、过氧化物、乙烯基砜、苯基硫酯、重氮烷、重氮乙酰基、环氧化物、重氮、苯甲酮、蒽醌、重氮基衍生物、双吖丙啶衍生物、补骨脂素衍生物、烯烃、苯基硼酸等。在一些实施方式中，第一gRNA片段包含第一反应基团并且第二gRNA片段包含第二反应基团。例如，第一和第二反应基团可以分别包含胺部分，其与含碳酸酯的双官能交联剂交联以形成脲键。在其它实例中，(a)第一反应基团包含溴乙酰基部分并且第二反应基团包含巯基部分，或者(b)第一反应基团包含巯基部分并且第二反应基团包含溴乙酰基部分，其通过将溴乙酰基部分与巯基部分反应进行交联以形成溴乙酰基-硫醇键。这些及其它交联化学在本领域中是已知的并且在文献中进行了总结，包括Greg T.Hermanson,BioconjugateTechniques,第3版.2013,published by Academic Press。

基于本发明公开，其它适合的gRNA修饰将对于本领域那些技术人员是显而易见的。适合的gRNA修饰包括(例如)以下中所描述的那些：PCT专利公开No.WO2019070762A1，标题为“MODIFIED CPF1 GUIDE RNA”；PCT专利公开No.WO2016089433A1，标题为“GUIDE RNAWITH CHEMICAL MODIFICATIONS”；PCT专利公开No.WO2016164356A1，标题为“CHEMICALLYMODIFIED GUIDE RNAS FOR CRISPR/CAS-MEDIATED GENE REGULATION”；和PCT专利公开No.WO2017053729A1，标题为“NUCLEASE-MEDIATED GENOME EDITING OF PRIMARY CELLSAND ENRICHMENT THEREOF”；以上每篇文献的全部内容以其全部作为参考并入本文。

示例性gRNA

在本文中(例如，在下表中)提供了适合于本发明公开所涵盖的某些实施方式的向导RNA的非限制性实例。本领域那些技术人员将能够从作为DNA或RNA序列的靶向结构域序列的公开内容设想适合于特异性核酸酶(例如，Cas9或Cpf1核酸酶)的向导RNA序列。例如，包含由RNA核苷酸组成的靶标序列的向导RNA将包括对应于作为DNA序列所提供的靶向结构域序列的RNA序列，并且这含有尿嘧啶，而不是胸苷核苷酸。例如，包含由RNA核苷酸组成并由DNA序列TCTGCAGAAATGTTCCCCGT(SEQ ID NO：88)描述的靶向结构域序列的向导RNA将具有相应RNA序列UCUGCAGAAAUGUUCCCCGU(SEQ ID NO：89)的靶向结构域。如对于技术人员将显而易见的，这种靶向序列将与适合的向导RNA骨架(例如，crRNA骨架序列或嵌合crRNA/tracrRNA骨架序列)连接。适合的gRNA骨架序列是本领域那些技术人员已知的。对于AsCpf1，例如，适合的骨架序列包含序列UAAUUUCUACUCUUGUAGAU(SEQ ID NO：90)，其添加至靶向结构域的5'端。在以上实例中，这将导致产生具有序列UAAUUUCUACUCUUGUAGAUUCUGCAGAAAUGUUCCCCGU(SEQ ID NO：91)的Cpf1向导RNA。本领域技术人员将进一步理解如何修饰这种向导RNA，例如，通过添加DNA延伸(例如，在以上实例中，添加如本文所述的25聚体DNA延伸将得到(例如)具有以下序列的向导RNA：ATGTGTTTTTGTCAAAAGACCTTTTrUrArArUrUrUrCrUrArCrUrCrUrUrGrUrArGrArUrUrCrUrGrCrArGrArArArUrGrUrUrCrCrCrCrGrU(SEQ IDNO：92))。将理解本文所提供的示例性靶向序列不是限制性的，并且参考本领域中的常识，基于本发明公开，其它适合的序列，例如，本文所公开的特定序列的变体，将对于技术人员是显而易见的。

在一些实施方式中，用于在本发明公开中使用的gRNA是靶向TGFβRII的gRNA(TGFβRII gRNA)。在一些实施方式中，靶向TGFβRII的gRNA是表7中描述的gRNA中的一种或多种。

表7：示例性TGFβRII gRNA

/>

在一些实施方式中，用于在本发明公开中使用的gRNA是靶向CISH的gRNA(CISHgRNA)。在一些实施方式中，靶向CISH的gRNA是表8中所描述的gRNA中的一个或多个。

表8：示例性CISH gRNA

/>

在一些实施方式中，用于在本发明公开中使用的gRNA是靶向B2M的gRNA(B2MgRNA)。在一些实施方式中，靶向B2M的gRNA是表9中所描述的gRNA中的一个或多个。

表9：示例性B2M gRNA

/>

在一些实施方式中，用于在本发明公开中使用的gRNA是靶向PD1的gRNA。在Welstead等人的WO2015161276和WO2017152015中进一步描述了用于在本发明公开中使用的靶向B2M和PD1的gRNA；以上两专利以其全部内容作为参考并入本文。

在一些实施方式中，用于在本发明公开中使用的gRNA是靶向NKG2A的gRNA(NKG2AgRNA)。在一些实施方式中，靶向NKG2A的gRNA是表10中所描述的gRNA中的一个或多个。

表10：示例性NKG2A gRNA

/>

在一些实施方式中，用于在本发明公开中使用的gRNA是靶向TIGIT的gRNA(TIGITgRNA)。在一些实施方式中，靶向TIGIT的gRNA是表11中所描述的gRNA中的一个或多个。

表11.示例性TIGIT gRNA

/>

在一些实施方式中，用于在本发明公开中使用的gRNA是靶向ADORA2a的gRNA(ADORA2a gRNA)。在一些实施方式中，靶向ADORA2a的gRNA是表12中所描述的gRNA中的一个或多个。

表12.示例性ADORA2a gRNA

/>

将理解提供了本文所公开的示例性gRNA以说明本发明公开所涵盖的非限制性实施方式。基于本发明公开，其它适合的gRNA序列将对技术人员是显而易见的，并且本发明公开不限于该方面。

鉴定方法

鉴定细胞，包括鉴定细胞表型的方法是本领域技术人员已知的。在一些实施方式中，一种或多种这些方法可以包括(但不局限于)，例如，形态分析和流式细胞术。细胞谱系和身份标志物是本领域技术人员已知的。一种或多种这些标志物可以与一种或多种鉴定方法组合以确定一种或多种细胞的细胞群体组成或者表型同一性。例如，在一些实施方式中，将使用流式细胞术鉴定特定群体的细胞(例如，参见，Ye Li等人,Cell Stem Cell.2018Aug 2；23(2):181-192.e5)。在一些这些实施方式中，将对于细胞群体样品评价一种或多种细胞表面标志物和/或一种或多种胞内标志物的存在和比例。如本领域技术人员将理解的，这些细胞表面标志物可以表示不同谱系。例如，可以通过与这些细胞有关的任何多种标志物中的一种或多种，如(例如)CD34识别多潜能细胞。此外，在一些实施方式中，可以通过表示分化程度的标志物识别细胞。这些标志物将是本领域技术人员已知的。例如，在一些实施方式中，分化细胞的标志物可以包括与分化的造血细胞，如(例如)CD43、CD45(分化的造血细胞)有关的那些。在一些实施方式中，分化细胞的标志物可以与NK细胞表型有关，如(例如)CD56、NK细胞受体免疫球蛋白γFc区受体III(FcγRIII，分化簇16(CD16))、自然杀伤组-2成员D(NKG2D)、CD69、自然细胞毒性受体等。在一些实施方式中，标志物可以是T细胞标志物(例如，CD3、CD4、CD8等)。

使用方法

可以通过使用本发明公开所提供的细胞治疗多种疾病、病症和/或病况。例如，在一些实施方式中，可以通过向受试者引入如本文所描述的基因修饰的或工程化细胞(例如，基因修饰的NK或iNK细胞)来治疗疾病、病症和/或病况。可以治疗的疾病的实例包括(但不限于)癌症，例如，实体瘤，例如，脑、前列腺、乳腺、肺、结肠、子宫、皮肤、肝脏、骨、胰腺、卵巢、睾丸、膀胱、肾、头、颈、胃、宫颈、直肠、喉或食道肿瘤；和血液学恶性肿瘤，例如，急性和慢性白血病、淋巴瘤、多发性骨髓瘤和脊髓发育不良综合征。

在一些实施方式中，本发明公开提供了通过向受试者施用包含本文所描述的任何细胞的组合物来治疗对其有需要的受试者的方法。在一些实施方式中，可以在疾病、病症或病况(包括(例如)损伤)发病之前、期间或之后施用治疗剂或组合物。在一些实施方式中，本发明公开提供了用于在药剂制备中使用的本文所描述的任何细胞。在一些实施方式中，本发明公开提供了用于治疗可以通过细胞疗法治疗的疾病、病症或病况的本文所描述的任何细胞。

在具体的实施方式中，受试者患有可以通过细胞疗法治疗的疾病、病症或病况。在一些实施方式中，需要细胞疗法的受试者是患有疾病、病症和/或病况的受试者，其中向所述受试者施用细胞疗法，例如，其中组合物包含本文所描述的细胞的疗法，其中所述细胞疗法治疗与疾病、病症和/或病况有关的至少一种症状。在一些实施方式中，需要细胞疗法的受试者包括(但不限于)骨髓或干细胞移植的候选、接受化疗或放射疗法的受试者、患有癌症(例如，造血系统癌症)或者有患癌风险的受试者、患有肿瘤(例如，实体瘤)或有发生肿瘤风险的受试者、和/或患有病毒感染或与病毒感染有关的疾病或者有患此疾病的风险的受试者。

药物组合物

在一些实施方式中，本发明公开提供了药物组合物，所述药物组合物包含一种或多种本文所描述的基因修饰的或工程化细胞，例如，本文所描述的基因修饰的NK或iNK细胞。在一些实施方式中，药物组合物还包含药物可用的赋形剂。在一些实施方式中，药物组合物包含分离的多潜能干细胞-来源的造血系细胞，其包含至少50％、60％、70％、80％、90％、95％、98％或99％的T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC，例如，基因修饰的(例如，编辑的)T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC。在一些实施方式中，药物组合物包含分离的多潜能干细胞-来源的造血系细胞，其包含约95％至约100％的T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC，例如，基因修饰的(例如，编辑的)T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC。

在一些实施方式中，本发明公开的药物组合物包含多潜能干细胞-来源的造血系细胞的分离群体，其中所述分离群体具有小于约0.1％、0.5％、1％、2％、5％、10％、15％、20％、25％或30％的T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC，例如，基因修饰的(例如，编辑的)T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC。在一些实施方式中，多潜能干细胞-来源的造血系细胞的分离群体具有大于约0.1％、0.5％、1％、2％、5％、10％、15％、20％、25％或30％的T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC，例如，基因修饰的(例如，编辑的)T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC。在一些实施方式中，多潜能干细胞-来源的造血系细胞的分离群体具有约0.1％至约1％、约1％至约3％、约3％至约5％、约10％-15％、约15％-20％、约20％-25％、约25％-30％、约30％-35％、约35％-40％、约40％-45％、约45％-50％、约60％-70％、约70％-80％、约80％-90％、约90％-95％或者约95％至约100％的T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC，例如，基因修饰的(例如，编辑的)T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC。

在一些实施方式中，多潜能干细胞-来源的造血系细胞的分离群体包含约0.1％、约1％、约3％、约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约60％、约70％、约80％、约90％、约95％、约98％、约99％或者约100％的T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC，例如，基因修饰的(例如，编辑的)T细胞、NK细胞、NKT细胞、CD34+HE细胞或HSC。

如本领域技术人员将理解的，自体同源和同种异体细胞两者可以用于过继细胞疗法。相对于其它细胞疗法，自体同源细胞疗法通常具有降低的感染、低GVHD概率和快速免疫重建。相对于其它细胞疗法，同种异体细胞疗法通常具有免疫介导的移植物抗恶性肿瘤(GVM)作用和低复发率。基于需要细胞疗法的受试者的具体状况，本领域的技术人员将能够确定要施用的疗法的具体类型。

在一些实施方式中，药物组合物包含对受试者同种异体的多潜能干细胞-来源的造血系细胞。在一些实施方式中，药物组合物包含对受试者自体同源的多潜能干细胞-来源的造血系细胞。对于自体同源的移植，多潜能干细胞-来源的造血系细胞的分离群体可以与要治疗的受试者完全或部分HLA匹配。在一些实施方式中，多潜能干细胞-来源的造血系细胞与受试者不HLA匹配。

在一些实施方式中，可以在施用前，在不离体或体外扩增的情况下向受试者施用多潜能干细胞-来源的造血系细胞。在具体的实施方式中，使用一种或多种试剂离体调节或处理所来源的造血系细胞的分离群体以获得具有改善的治疗潜力的免疫细胞。在一些实施方式中，可以清洗所来源的造血系细胞的调节的群体以除去处理试剂，并且可以在不进一步体外扩增所述群体的情况下向受试者施用改善的群体。在一些实施方式中，在用一种或多种试剂调节分离群体之前扩增所来源的造血系细胞的分离群体。

在一些实施方式中，可以根据本发明公开所述的方法基因修饰所来源的造血系细胞的分离群体以表达重组TCR、CAR或其它所关心的基因产物。对于表达重组TCR或CAR的基因工程的所来源的造血系细胞，无论是在细胞的基因修饰之前还是之后，可以使用如(例如)美国专利No.6,352,694；6,534,055；6,905,680；6,692,964；5,858,358；6,887,466；6,905,681；7,144,575；7,067,318；7,172,869；7,232,566；7,175,843；5,883,223；6,905,874；6,797,514；6,867,041；和美国专利申请公开No.20060121005中所述的方法激活和扩增细胞。

癌症

可以使用本文所描述的细胞或药物组合物治疗任何癌症。本发明公开的示例性治疗靶标包括来自下列的癌细胞：膀胱、血液、骨、骨髓、脑、乳腺、结肠、食道、眼、胃肠系统、牙龈、头、肾、肝脏、肺、鼻咽、颈、卵巢、前列腺、皮肤、胃、睾丸、舌或子宫。另外，癌症可以具体地具有以下非限制性组织学类型：恶性赘生物；癌瘤；未分化的癌瘤；巨细胞和梭形细胞癌；小细胞癌；乳头状癌；鳞状细胞癌；淋巴上皮癌；基底细胞癌；毛母质癌；移行细胞癌；乳头状移行细胞癌；腺癌；恶性胃泌素瘤；肝胆管型肝癌；肝细胞癌；肝细胞癌和肝胆管型肝癌并存；小梁腺癌；腺样囊性癌；腺瘤性息肉中的腺癌；家族性结肠息肉病的腺癌；实体癌；恶性类癌瘤；细支气管-肺泡腺癌；乳头状腺癌；嫌色细胞癌；嗜酸细胞癌；嗜酸性腺癌；嗜碱细胞癌；透明细胞腺癌；颗粒细胞癌；滤泡状腺癌；乳头状和滤泡状腺癌；非包裹性硬化型癌；肾上腺皮质癌；子宫内膜样癌；皮肤附属器癌；大汗腺腺癌；皮脂腺癌；盯聍腺腺癌；粘液表皮样癌；囊腺癌；乳头状囊腺癌；乳头状浆液性囊腺癌；粘液性囊腺癌；粘液腺癌；印戒细胞癌；浸润性导管癌；髓样癌；小叶癌；炎性癌；乳腺佩吉特病；腺泡细胞癌；腺鳞癌；腺癌鳞化(adenocarcinoma w/squamous metaplasia)；恶性胸腺瘤；恶性卵巢间质瘤；恶性卵泡膜细胞瘤；恶性粒导细胞瘤；恶性塞尔托利氏细胞瘤；支持细胞癌；恶性睾丸非生殖细胞瘤；恶性脂质细胞瘤；恶性副神经节瘤；恶性乳腺外副神经节瘤；嗜铬细胞瘤；血管球肉瘤；恶性黑色素瘤；无黑色素性黑素瘤；浅表扩散性黑素瘤；巨色素痣中的恶性黑素瘤；上皮样细胞黑素瘤；恶性蓝痣；肉瘤；纤维肉瘤；恶性纤维组织细胞瘤；粘液肉瘤；脂肪肉瘤；平滑肌肉瘤；横纹肌肉瘤；胚胎性横纹肌肉瘤；腺泡状横纹肌肉瘤；基质肉瘤；恶性混合瘤；苗勒氏混合瘤；肾胚细胞瘤；肝胚细胞瘤；癌肉瘤；恶性间充质瘤；恶性卵巢布伦纳氏瘤；恶性叶状肿瘤；滑膜肉瘤；恶性间皮瘤；无性细胞瘤；胚胎癌；恶性畸胎瘤；恶性卵巢甲状腺瘤；绒毛膜癌；恶性中肾瘤；血管肉瘤；恶性血管内皮瘤；卡波西肉瘤；恶性血管外皮瘤；淋巴管肉瘤；骨肉瘤；质旁骨肉瘤；软骨肉瘤；恶性成软骨细胞瘤；间胚叶性软骨肉瘤；骨巨细胞瘤；尤因肉瘤；恶性牙原性肿瘤；造釉细胞性牙肉瘤；恶性成釉细胞瘤；造釉细胞性纤维肉瘤；恶性松果体瘤；脊索瘤；恶性神经胶质瘤；室管膜瘤；星形细胞瘤；原浆性星形细胞瘤；纤维型星形细胞瘤；成星形细胞瘤；成胶质细胞瘤；寡枝神经胶质细胞瘤；成少突神经胶质细胞瘤；原始神经外胚层；小脑肉瘤；节细胞神经母细胞瘤；成神经细胞瘤；成视网膜细胞瘤；嗅神经源性肿瘤；恶性脑膜瘤；神经纤维肉瘤；恶性神经鞘瘤；恶性颗粒细胞肿瘤；恶性淋巴瘤；霍奇金氏病；霍奇金氏淋巴瘤；类肉芽肿；小淋巴细胞性恶性淋巴瘤；弥漫性大细胞恶性淋巴瘤；滤泡性恶性淋巴瘤；阿利贝尔氏病；其它特指类型的非霍奇金氏淋巴瘤；恶性组织细胞病；多发性骨髓瘤；肥大细胞肉瘤；免疫增生性小肠病；白血病；淋巴细胞性白血病；浆细胞性白血病；红白血病；淋巴肉瘤细胞性白血病；骨髓性白血病；嗜碱性细胞白血病；嗜酸粒性白血病；单核细胞性白血病；肥大细胞白血病；巨核细胞白血病；髓系肉瘤；和毛细胞白血病。

在一些实施方式中，癌症是乳腺癌。在一些实施方式中，癌症是结肠直肠癌(例如，结肠癌)。在一些实施方式中，癌症是胃癌。在一些实施方式中，癌症是RCC。在一些实施方式中，癌症是非小细胞肺癌(NSCLC)。在一些实施方式中，癌症是头颈癌。

在一些实施方式中，可以单独或与一种或多种其它癌症治疗方式组合使用本文所描述的细胞(例如，使用本发明公开的方法修饰的细胞，例如，基因修饰的iNK细胞)治疗的实体瘤适应症包括：膀胱癌、肝细胞癌、前列腺癌、卵巢/子宫癌、胰腺癌、间皮瘤、黑素瘤、成胶质细胞瘤、HPV-相关和/或HPV-阳性癌症，如宫颈和HPV+头颈癌、口腔癌、咽癌、甲状腺癌、胆囊癌和软组织肉瘤。在一些实施方式中，可以单独或与一种或多种其它癌症治疗方式组合使用本文所描述的细胞(例如，使用本发明公开的方法修饰的细胞，例如，基因修饰的iNK细胞)治疗的血液学癌症适应症包括：ALL、CLL、NHL、DLBCL、AML、CML和多发性骨髓瘤(MM)。

在一些实施方式中，可以用本文所描述的细胞(例如，使用本发明公开的方法修饰的细胞)治疗的肺部细胞增殖和/或分化病症的实例包括(但不限于)肿瘤，如支气管癌，包括肿瘤伴随综合征、细支气管肺泡癌、神经内分泌瘤，如支气管类癌、其它肿瘤、转移性肿瘤和胸膜肿瘤，包括孤立性纤维性肿瘤(胸膜纤维瘤)和恶性间皮瘤。

在一些实施方式中，可以用本文所描述的细胞(例如，使用本发明公开的方修饰的细胞)治疗的乳腺细胞增殖和/或分化病症的实例包括(但不限于)增殖性乳腺疾病，包括(例如)上皮细胞增生、硬化性腺病和小管乳头状瘤(small duct papillomas)；肿瘤，例如间质瘤，如纤维腺瘤、叶状肿瘤和肉瘤，以及上皮细胞瘤，如大导管乳头状瘤；乳腺癌，包括原位(非侵袭性)癌，其包括原位管癌(包括佩吉特氏病)和小叶原位癌，以及侵袭性(浸润性)癌，包括(但不限于)侵袭性导管癌、侵袭性小叶癌、髓样癌、胶样(黏液性)癌、小管癌和侵袭性乳头状癌，以及其它恶性赘生物。雄性乳腺病症包括(但不限于)雄性乳房增大和癌。

在一些实施方式中，可以用本文所描述的细胞(例如，使用本发明公开的方法修饰的细胞)治疗的涉及结肠的细胞增殖和/或分化病症的实例包括(但不限于)结肠肿瘤，如非赘生性息肉、腺瘤、家族性综合征、结直肠癌发生、结直肠癌和类癌瘤。

在一些实施方式中，除可以用本文所描述的细胞(例如，使用本发明公开的方法修饰的细胞)治疗的以上所描述的那些之外，癌症或肿瘤病况的实例包括(但不限于)纤维肉瘤、肌肉瘤、脂肪肉瘤、软骨肉瘤、骨原性肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、淋巴管肉瘤、淋巴管内皮肉瘤、滑膜瘤、间皮瘤、尤因氏瘤、平滑肌肉瘤、横纹肌肉瘤、胃癌、食道癌、直肠癌、胰腺癌、卵巢癌、前列腺癌、子宫癌、头颈癌、皮肤癌、脑癌、鳞状细胞癌、皮脂腺癌、乳头状癌、乳头状腺癌、囊腺癌、髓样癌、支气管癌、肾细胞癌、肝癌、胆管癌、绒毛膜癌、精原细胞瘤、胚胎癌、威尔姆氏瘤、宫颈癌、睾丸癌、小细胞肺癌、非小细胞肺癌、膀胱癌、上皮癌、神经胶质瘤、星形细胞瘤、成神经管细胞瘤、颅咽管瘤、室管膜瘤、松果体瘤、成血管细胞瘤、听神经瘤、寡枝神经胶质细胞瘤、脑膜瘤、黑素瘤、成神经细胞瘤、成视网膜细胞瘤、白血病、淋巴瘤或卡波西肉瘤。

在一些实施方式中，与一种或多种癌症治疗方式组合使用本文所描述的细胞(例如，使用本发明公开的方法修饰的细胞)。在一些实施方式中，其它癌症治疗方式包括(但不限于)：化疗剂包括烷化剂，如塞替派和环磷酰胺；烷基磺酸盐，如白消安、英丙舒凡和哌泊舒凡；氮丙啶，如苯并多巴(benzodopa)、卡波醌、米特多巴(meturedopa)和尤利多巴(uredopa)；氮丙啶和甲基蜜胺类(methylamelamines)，包括六甲蜜胺、曲他胺、三乙烯磷酰胺、三乙烯硫代磷酰胺和三羟甲基蜜胺(trimethyl OKomelamine)；多聚乙酰(尤其是布拉他辛(bullatacin)和布拉他辛酮(bullatacinone))；δ-9-四氢大麻酚(屈大麻酚，)；β-拉帕醌；拉帕醇；秋水仙碱；桦木酸；喜树碱(包括合成类似物拓扑替康CPT-11(伊立替康，/>)、乙酰喜树碱、东莨菪碱和9-氨基喜树碱)；苔藓抑素；卡利斯汀(callystatin)；CC-1065(包括其阿多来新、卡折来新和比折来新合成类似物)；鬼臼毒素；鬼臼酸；替尼泊苷；念珠藻素(cryptophycins)(特别是念珠藻素1和念珠藻素8)；尾海兔素；倍癌毒素(duocarmycin)(包括合成类似物KW-2189和CB1-TM1)；艾榴塞洛素(eleutherobin)；水鬼蕉碱(pancratistatin)；匍枝珊瑚醇(sarcodictyin)；海绵抑制素(spongistatin)；氮芥，如苯丁酸氮芥、萘氮芥、胆磷酰胺(chlorophosphamide)、雌莫司汀、异环磷酰胺、二氯甲基二乙胺、盐酸氧氮芥(mechlorethamine oxidehydrochloride)、美法仑、新恩比兴、胆甾醇对苯乙酸氮芥(phenesterine)、泼尼莫司汀、曲磷胺、乌拉莫司汀；亚硝基脲，如卡莫司汀、吡葡亚硝脲、福莫司汀、洛莫司汀、尼莫司汀和雷莫司汀(ranimnustine)；抗生素，如烯二炔抗生素(例如，卡里奇霉素(calicheamicin)，尤其是卡里奇霉素γ1I和卡里奇霉素ωl1(参见，例如，Agnew,Chem.Intl.Ed.Engl.,1994；33:183-186)；达内霉素，包括达内霉素A；埃斯培拉霉素(esperamicin)；以及新制癌菌素生色团(neocarzinostatin chromophore)和相关的色蛋白烯二炔抗生素生色团)、阿克拉霉素、放射菌素、安曲霉素、偶氮丝氨酸、博来霉素、放线菌素C(cactinomycin)、卡拉比星(carabicin)、洋红霉素、嗜癌菌素、色霉素、更生霉素、柔红霉素、地托比星、6-重氮-5-氧代-L-正亮氨酸、多柔比星(包括/>吗啉代-多柔比星、氰基吗啉代-多柔比星、2-吡咯啉并-多柔比星、多柔比星HCl脂质体注射液/>和脱氧多柔比星)、表柔比星、依索比星、伊达比星、麻西罗霉素、丝裂霉素，如丝裂霉素C、麦考酚酸、诺拉霉素、橄榄霉素、培洛霉素、泊非霉素(potfiromycin)、嘌罗霉素、三铁阿霉素、罗多比星、链黑菌素、链佐星、杀结核菌素、乌苯美司、净司他丁、佐柔比星；抗代谢产物，如甲氨蝶呤、吉西他滨替加氟/>卡培他滨/>埃博霉素和5-氟尿嘧啶(5-FU)；叶酸类似物，如二甲叶酸、甲氨蝶呤、蝶罗呤、三甲曲沙；嘌呤类似物，如氟达拉滨、6-巯基嘌呤、硫唑嘌呤胺、硫鸟嘌呤；嘧啶类似物，如安西他滨、阿扎胞苷、6-氮尿苷、卡莫氟、阿糖胞苷、二脱氧尿苷、去氧氟尿苷、依诺他滨、氮尿苷；雄激素，如卡普睾酮、屈他雄酮丙酸酯、环硫雄醇、美雄烷、睾内酪；抗肾上腺剂，如氨鲁米特、米托坦、曲洛司坦；叶酸补充剂，如亚叶酸；醋葡醛内酯；醛磷酰胺糖苷；氨基乙酰丙酸；恩尿嘧啶；安吖啶；贝斯布西(bestrabucil)；比生群；伊达曲杀(edatraxate)；地磷酰胺(defofamine)；秋水仙胺；地吖醌；依氟鸟氨酸(elformithine)；依利醋铵(elliptinium acetate)；依托格鲁；硝酸镓；羟基脲；香菇多糖；氯尼达明；美登素，如美登素和安丝菌素；米托胍腙；米托蒽醌；莫比达摩(mopidanmol)；二胺硝吖啶(nitraerine)；喷司他丁；蛋氨氮芥；吡柔比星；洛索蒽醌；2-乙肼；丙卡巴肼；/>多糖复合物(JHS Natural Products,Eugene,Oreg.)；雷佐生；根霉素；西索菲兰；锗螺胺；细交链孢菌酮酸(tenuazonic acid)；三亚胺醌；2,2',2”-三氯三乙胺；单端孢霉烯(trichothecene)(尤其是T-2毒素、疣孢菌素A、杆孢菌素A和蛇形菌素(anguidine))；氨基甲酸乙酯；长春地辛/> )；达卡巴嗪；甘露莫司汀；二溴甘露醇；二溴卫矛醇；哌泊溴烷；加西托星(gacytosine)；阿糖胞苷(“Ara-C”)；噻替派；类紫杉醇，例如，紫杉醇/>紫杉醇的白蛋白工程化纳米颗粒制剂(ABRAXANET^TM)和多西他赛/>苯丁酸氮芥；6-硫代鸟嘌呤；巯嘌呤；甲氨蝶呤；铂类似物，如顺铂和卡铂；长春碱/>铂；依托泊苷(VP-16)；异环磷酰胺；米托蒽醌；长春新碱/>奥沙利铂；亚叶酸(leucovovin)；长春瑞滨诺凡特龙(novantrone)；依达曲沙；道诺霉素；氨喋呤；环孢霉素、西罗莫司、雷帕霉素、雷帕罗格、伊班膦酸盐；局部拓扑异构酶抑制剂RFS2000；二氟甲基鸟氨酸(DMFO)；类视黄醇，如视黄酸；CHOP，即环磷酰胺、多柔比星、长春新碱和泼尼松龙组合疗法的缩写，以及FOLFOX，即奥沙利铂(ELOXATIN^TM)与5-FU、亚叶酸组合的治疗方案的缩写；抗雌激素和选择性雌激素受体调节剂(SERM)，包括(例如)他莫昔芬(包括/>他莫昔芬)、雷洛昔芬/>屈洛昔芬、4-羟基他莫昔芬、曲沃昔芬、雷洛昔芬(keoxifene)、LY117018、奥那司酮和托瑞米芬/>抗黄体酮；雌激素受体下调剂(ERD)；雌激素受体拮抗剂，如氟维司群/>发挥作用以抑制或关闭卵巢的试剂，例如，黄体生成素-释放激素(LHRH)激动剂，如醋酸亮脯利特(/>和/>)、醋酸戈舍瑞林、醋酸布舍瑞林和曲普瑞林；其它抗雄激素，如氟他胺、尼鲁米特和比卡鲁胺；和芳香酶抑制剂，其抑制酶芳香酶，该芳香酶调节肾上腺中的雌激素产生，如(例如)4(5)-咪唑、氨鲁米特、醋酸甲地孕酮/>依西美坦/>福美坦、法倔唑、伏氯唑来曲唑/>和阿那曲唑/>二膦酸盐，如氯屈膦酸(例如，/>或/>)、羟乙二磷酸酯/>NE-58095、唑来膦酸/唑来膦酸盐/>阿伦膦酸盐/>帕米膦酸盐/>替鲁膦酸盐/>或利塞膦酸盐/>曲沙他滨(1,3-二氧戊环核苷胞嘧啶类似物)；适体，例如，在美国专利No.6,344,321中所述的适体，该专利以其全部内容作为参考并入本文；抗HGF单克隆抗体(例如，来自Aveo的AV299、来自Amgen的AMG102)；截短的mTOR变体(例如，来自Compugen的CGEN241)；蛋白激酶抑制剂，其阻断mTOR诱导的通路(例如，来自Arqule的ARQ197、来自Exelexis的XL880、来自SGX Pharmaceuticals的SGX523、来自Supergen的MP470、来自Pfizer的PF2341066)；疫苗，如/>疫苗和基因疗法疫苗，例如，/>疫苗、/>疫苗和/>疫苗；拓扑异构酶1抑制剂(例如，/>rmRH(例如，/>)；二甲苯磺酸拉帕替尼(ErbB-2和EGFR双酪氨酸激酶小分子抑制剂，也称为GW572016)；COX-2抑制剂，如塞来昔布(4-(5-(4-甲基苯基)-3-(三氟甲基)-1H-吡唑-1-基)苯磺酰胺；以及上述任一项的药物可用的盐、酸或衍生物。

在一些实施方式中，与有助于诱导抗体依赖性细胞毒性(ADCC)的一种或多种癌症治疗方式组合使用本文所描述的细胞(例如，使用本发明公开的方法修饰的细胞)(参见，例如，K.Murphy and C.weaver的Janeway’s Immunobiology)。在一些实施方式中，这种癌症治疗方式是抗体。在一些实施方式中，这种抗体是曲妥珠单抗。在一些实施方式中，这种抗体是利妥昔单抗。在一些实施方式中，这种抗体是利妥昔单抗、帕利珠单抗、英利昔单抗、曲妥珠单抗、阿仑珠单抗、阿达木单抗、替伊莫单抗替坦(Ibritumomab tiuxetan)、奥马珠单抗、西妥昔单抗、贝伐单抗、那他珠单抗、帕尼单抗、兰尼单抗(ranibizumab)、聚乙二醇结合赛妥珠单抗(Certolizumab pegol)、优特克单抗、卡那津单抗、戈利木单抗、奥法木单抗、托珠单抗、地诺单抗、贝利木单抗、普利木单抗、本妥昔单抗、帕妥珠单抗、曲妥珠单抗厄塔毒素偶联物(Trastuzumab emtansine)、奥比妥珠单抗、司妥昔单抗、雷莫芦单抗、维多珠单抗、博纳吐单抗、纳武单抗、派姆单抗、依达赛珠单抗、耐昔妥珠单抗(Necitumumab)、达妥昔单抗、苏金单抗、美泊利单抗、阿利库单抗、依洛尤单抗、达雷木单抗、埃洛妥珠单抗、艾克司单抗、利昔单抗(Reslizumab)、奥拉木单抗(olaratumab)、贝佐洛单抗(Bezlotoxumab)、阿特珠单抗、奥托昔单抗、伊珠单抗奥佐米星偶联物(Inotuzumab ozogamicin)、布罗达单抗、古塞库单抗、度普利尤单抗、沙利卢单抗(sarilumab)、阿维鲁单抗(Avelumab)、奥瑞组单抗、依米西珠单抗(Emicizumab)、苯那利珠单抗(benralizumab)、吉妥珠单抗奥唑米星、德瓦鲁单抗、布洛苏单抗(Burosumab)、兰纳德单抗(Lanadelumab)、莫加利单抗(Mogamulizumab)、厄恩诺单抗(Erenumab)、加坎珠单抗(Galcanezumab)、替曲吉珠单抗(Tildrakizumab)、西米普利单抗(cemiplimab)、依玛鲁单抗(Emapalumab)、夫瑞珠单抗(Fremanezumab)、伊巴珠单抗(Ibalizumab)、莫昔单抗-帕多毒素偶联物(moxetumomabpasudodox)、雷武珠单抗、诺莫珠单抗、利散珠单抗(Risankizumab)、维波达单抗(Polatuzumab vedotin)、溴化丙单抗(Brolucizumab)或它们的任意组合(参见，例如，Lu等人,Development of therapeutic antibodies for the treatment ofdiseases.Journal of Biomedical Science,2020)。在一些实施方式中，与有助于诱导抗体依赖性细胞毒性(ADCC)的一种或多种癌症治疗方式组合使用本文所描述的细胞(例如，使用本发明公开的方法修饰的细胞)，其中所述癌症治疗方式是靶向下列的抗体或其适当片段：CD20、TNFα、HER2、CD52、IgE、EGFR、VEGF-A、ITGA4、CTLA-4、CD30、VEGFR2、α4β7整合素、CD19、CD3、PD-1、GD2、CD38、SLAMF7、PDGFRα、PD-L1、CD22、CD33、IFNγ、CD79β或它们的任意组合。

在一些实施方式中，与检查点抑制剂组合使用本文所描述的细胞。适合的组合疗法检查点抑制剂的实例包括(但不限于)下列的拮抗剂：PD-l(Pdcdl、CD279)、PDL-l(CD274)、TIM-3(Havcr2)、TIGIT(WUCAM和Vstm3)、LAG-3(Lag3、CD223)、CTLA-4(Ctla4、CD152)、2B4(CD244)、4-1BB(CD137)、4-1BBL(CD137L)、A2aR、BATE、BTLA、CD39(Entpdl)、CD47、CD73(NT5E)、CD94、CD96、CD160、CD200、CD200R、CD274、CEACAM1、CSF-1R、Foxpl、GARP、HVEM、IDO、EDO、TDO、LAIR-l、MICA/B、NR4A2、MAFB、OCT-2(Pou2f2)、视黄酸受体α(Rara)、TLR3、VISTA、NKG2A/HLA-E、抑制性KIR(例如，2DL1、2DL2、2DL3、3DL1、and3DL2)或其任意适当组合。

在一些实施方式中，抑制任何上述检查点分子的拮抗剂是抗体。在一些实施方式中，检查点抑制性抗体可以是鼠科抗体、人抗体、人源化抗体、骆驼Ig、仅鲨鱼重链的抗体(VNAR)、Ig NAR、嵌合抗体、重组抗体或其抗体片段。抗体片段的非限制性实例包括Fab、Fab'、F(ab)'2、F(ab)'3、Fv、单链抗原结合片段(scFv)、(scFv)2、二硫键稳定的Fv(dsFv)、微抗体、双链抗体、三链抗体、四链抗体、单域抗原结合片段(sdAb、纳米抗体)、仅重组重链的抗体(VHH)和维持完整抗体的结合特异性的其它抗体片段，其可以比完整抗体生产成本更有效、更易于使用或更敏感。在一些实施方式中，一个或两个或三个或更多个检查点抑制剂包括以下中的至少一种：阿特珠单抗(抗-PDLl mAb)、阿维鲁单抗(Avelumab)(抗-PDLlmAb)、德瓦鲁单抗(抗-PDLl mAb)、替西木单抗(tremelimumab)(抗-CTLA4 mAb)、普利木单抗(抗-CTLA4 mAb)、IPH4102(抗-KIR)、IPH43(抗-MICA)、IPH33(抗-TLR3)、利瑞木单抗(lirimumab)(抗-KIR)、莫那力单抗(monalizumab)(抗-NKG2A)、纳武单抗(抗-PD1 mAb)、派姆单抗(抗-PD 1mAb)及其任何衍生物、功能等价物或生物类似物。

在一些实施方式中，抑制任何上述检查点分子的拮抗剂是基于微小RNA的，因为作为控制免疫检查点表达的调节剂发现了多种miRNA(Dragomir等人,Cancer BiolMed.2018,15(2):103-115)。在一些实施方式中，检查点拮抗性miRNA包括(但不限于)miR-28、miR-l5/l6、miR-l38、miR-342、miR-20b、miR-2l、miR-l30b、miR-34a、miR-l97、miR-200c、miR-200、miR-l7-5p、miR-570、miR-424、miR-l55、miR-574-3p、miR-5l3、miR-29c和/或其任意适当组合。

在一些实施方式中，与一种或多种癌症治疗方式，如外源白介素(IL)剂量施用组合使用本文所描述的细胞(例如，使用本发明公开的方法修饰的细胞)。在一些实施方式中，向患者提供的外源IL是IL-15。在一些实施方式中，当与本文所描述的细胞组合使用时，当与标准剂量施用浓度相比时，全身性IL-15剂量施用降低(参见，例如，Waldmann等人,IL-15in the Combination Immunotherapy of Cancer.Front.Immunology,2020)。

对于治疗癌症有效的其它化合物在本领域中是已知的并且本文描述了这些化合物，所述化合物适合于作为其它癌症治疗方式与本发明公开所述的组合物和方法一起使用，其描述于(例如)“Physicians'Desk Reference,第62版Oradell,N.J.:MedicalEconomics Co.,2008”,Goodman&Gilman’s“The Pharmacological Basis ofTherapeutics,第11版.McGraw-Hill,2005”,“Remington:The Science and Practice ofPharmacy,第20版.Baltimore,Md.:Lippincott Williams&Wilkins,2000,”和“The MerckIndex,第14版.Whitehouse Station,N.J.:Merck Research Laboratories,2006”，以上文献作为参考并入本文相关部分。

本文引用(无论是上文还是下文)的所有出版物、专利和专利申请都以其全部内容作为参考并入本文。

在整个说明书中，除非上下文另有要求，否则单词“包括(comprise/comprises和comprising)”将被理解为表示包括所述步骤或元素或者步骤或元素组，但不排除任何其它步骤或元素或者步骤或元素组。“由...组成”表示包括并且限于短语“由……组成：”之后的任何。因此，短语“由...组成”表示所列出的元素是必需的或强制性的，并且没有其它元素可以存在。“基本由...组成”意在包括该短语之后列出的任何元素，并且限于不会干扰或有助于本发明公开针对所列元素所指明的活动或动作的其它元素。因此，短语“基本由...组成”表示所列元素是必需的或强制性的，而没有其它元素是可选的，并且根据它们是否影响所列元素的活动或动作而可以存在或可以不存在。

根据上文详细说明，可以对实施方式作出这些和其它改变。总体上，在以下权利要求中，所使用的术语不应解读为将权利要求限制在说明书和权利要求中所公开的具体实施方式，而应解读为包括所有可能的实施方式以及这些权利要求所享有的等效权利的全部范围。因此，权利要求不受本发明公开的限制。

可以将上述多个实施方式组合以提供其它实施方式。将在本说明书中提及的和/或在申请数据表中所列的所有美国专利、美国专利申请公开、美国专利申请、外国专利、外国专利申请和非专利公开以其全部内容作为参考并入本文。数据库条目的内容，例如，本文所提供的NCBI核苷酸或蛋白质数据库条目，以其全部内容并入本文。如果数据库条目会随时间变化，则自本发明申请的申请日期的内容作为参考并入本文。如果必要，可以修改实施方式的方面，以采用不同专利、专利申请和专利公开的概念以提供其它实施方式。

将通过以下实施例进一步说明本发明公开。仅出于说明性目的提供实施例。不应将它们视为以任何方式对本发明公开的范围或内容的限制。

实施例

实施例1：对于GAPDH筛选向导RNA

本实施例描述了靶向管家基因GAPDH的AsCpf1(AsCas12a)向导RNA的筛选。GAPDH编码甘油醛-3-磷酸脱氢酶，它是在存在无机磷酸盐和烟酰胺腺嘌呤二核苷酸(NAD)的情况下催化甘油醛-3-磷酸的氧化磷酸化的必需蛋白质，是碳水化合物代谢中获得能量的重要步骤。在本分析中所使用的向导RNA均为具有以下设计的41聚体RNA分子：5'-UAAUUUCUACUCUUGUAGAU-[21聚体靶向结构域序列]-3'(SEQ ID NO：90)。例如，表示为RSQ22337的向导RNA具有以下序列：5'-UAAUUUCUACUCUUGUAGAUAUCUUCUAGGUAUGACAACGA-3'(SEQ ID NO：93)，其中对21聚体靶向结构域序列加下划线。测试如表13所示的具有靶向结构域序列的向导RNA以确定它们对于编辑GAPDH的有效程度。将含有这些向导RNA中每一个的Cas12a RNP(具有工程化Cas12a(SEQ ID NO：62)的RNP)转染到iPSC中，然后在转染后3天测定编辑水平(参见，例如，Wong,K.G.等人CryoPause:A New Method to ImmediatelyInitiate Experiments after Cryopreservation of Pluripotent Stem Cells.StemCell Reports 9,355-365(2017))。图1和图2中显示了结果。RSQ24570、RSQ24582、RSQ24589、RSQ24585和RSQ22337显示出对所测试的GAPDH向导最大的可测量删除(editingout)水平，其编辑约70％或以上的细胞(分别约92％、89％、88％、87％和70％)。据观察对于分析编辑效率(在转染后第3天)，当与用靶向内含子区域的gRNA转染的细胞相比时，用靶向某些外显子区域的gRNA转染的细胞获得了低得多的量的可分离的基因组DNA(gDNA)，从而表明具有某些靶向外显子的gRNA的RNP对细胞具有细胞毒性。这表明由于在GAPDH内引入插缺，从而导致无功能的GAPDH蛋白或者具有不足功能的蛋白的表达，因此用靶向外显子区域的gRNA编辑的细胞可以导致显著的细胞死亡。据假定可以有可能使用挽救质粒来修复GAPDH中gRNA-介导的切割位点，同时还经由HDR将所关心的基因货物敲入修复的GAPDH框中，借此挽救其中GAPDH被修复并且所关心的货物成功整合的那些细胞(如图1和图2所示)。经编辑(大部分转染的细胞，如果使用高效RNA-导向的核酸酶)但未经历GAPDH的HDR修复且不整合所关心的货物的那些转染的细胞随时间死亡，因为它们不具有有功能的GAPDH基因。携带所关心的货物的那些细胞将由于有完全功能的GAPDH基因(因为这些细胞生长并分裂)而具有优势，并且将随时间选择这些细胞。预期最终结果将是在GAPDH基因座内具有极高货物敲入率的细胞群体。

图2中的数据表明尽管包含RSQ22337的Cas12a RNP在转染后3天导致了约70％的编辑水平，但是它引起了比其它外显子向导(RSQ24570、RSQ24582、RSQ24589和RSQ24585)稍微更高的毒性水平(参见图2，从编辑的细胞中仅分离了约3.9ng/μL的gDNA)。因此，真实编辑效率很可能显著高于70％，因为由于可获得的挽救构建体的缺少和形成NHEJ的毒性插缺，多个细胞在转染后3天已死亡。因此，选择RSQ22337进行进一步测试。

表13：向导RNA序列

/>

实施例2：通过靶向整合对GAPDH敲除的挽救

为了测试图3A、3B和3C中所示的示例性选择系统的可行性，使用包含AsCpf1(SEQID NO：62)的RNP和向导RNA(RSQ22337(SEQ ID NO：95))在iPSC中靶向必需基因GAPDH，从而导致朝向GAPDH的最后一个外显子(外显子9)的5'端的双链断裂。尽管出于本实验的目的测试了iPSC，但是所述方法可以应用于其它细胞类型。确定RSQ22337对GAPDH具有高度特异性并且在基因组中具有最小脱靶位点(数据未显示)。因此，认为GAPDH是本文所描述的货物整合和选择方法的优良示例性候选靶标基因，这至少部分是因为存在至少一种靶向能够介导高效RNA-导向的切割的末端外显子的高特异性gRNA。

根据已知的方法，通过核糖核蛋白(RNP)的核转染(电穿孔)，将CRISPR/Cas核酸酶和向导RNA引入细胞。细胞还与双链DNA供体模板(例如，dsDNA质粒)接触，所述双链DNA供体模板包括敲入盒，所述敲入盒以5'至3'顺序包含约500bp长的5'同源臂(包含外显子8的一部分、内含子8和外显子9的5'密码子-优化的编码部分，其优化以防止向导RNA(RSQ22337)的gRNA靶向结构域序列的进一步结合)、编码P2A自切割肽的框内序列(“P2A”)、CD47的框内编码序列(“货物”)、终止密码子和多聚A信号序列以及约500bp长的3'同源臂(包含外显子9的编码部分(包括终止密码子)、外显子9的3'外显子区和下游基因间序列的一部分)(如图3B所示)。设计侧接敲入盒的5'和3'同源臂以对应于RNP切割位点周围的序列。

如图3C中示意性地显示的，通过DNA核酸酶编辑，但未被DNA供体模板成功靶向的NHEJ-介导的插缺的产生将产生对细胞致死的GAPDH的无功能形式。在通过敲入盒的正确整合被DNA供体模板成功靶向的细胞中“挽救”这种敲除，这恢复了GAPDH编码区，从而产生了有功能的基因产物，并且P2A-货物序列的位置与GAPDH编码序列位于同一读框且位于其下游(3')。这些细胞存活并继续增殖。未被DNA核酸酶编辑的细胞还继续增殖，但是预期占整体细胞群体的极小百分比，如果如在这种情况下，核酸酶结合gRNA的编辑效率较高(参见实施例1)并导致产生无功能的蛋白质。由于编辑的细胞群体内的细胞死亡，RSQ22337的编辑结果可能低估了向导的真实编辑效率。

在不存在双链DNA供体模板的情况下，在不同浓度(4μM、1μM、0.25μM或0.0625μMRNP)下测试了含有RSQ22337的RNP的编辑效率，其首先在iPSC的核转染后48小时(由于GAPDH基因功能缺失所造成的细胞死亡之前的时间点)测量。结果显示4μM的浓度导致了最高的编辑水平(参见图4)。

图5和6显示可以使用本文所描述的选择系统以高效率将蛋白-编码货物基因敲入管家基因，如GAPDH。图5显示了当RNP以4μM的浓度存在且还存在编码CD47的dsDNA质粒(“PLA”)时，在电穿孔后第4天GAPDH中CD47编码“货物”的敲入(KI)效率。使用两个不同的质粒浓度(0.5μg和2.5μg质粒)测量敲入效率，并且认为敲入效率是剂量反应性的。使用靶向敲入“货物”的3'位置的ddPCR测量敲入。使用单独的RNP或者单独的PLA电穿孔的对照细胞显示出比RNP和PLA(以2.5μg的浓度)的电穿孔低得多的敲入率。

图6显示了在使用RNP和编码CD47的dsDNA质粒对细胞电穿孔后9天，GAPDH中CD47编码“货物”的敲入效率。当使用对gRNA靶标位点的5'或多聚A区域中位点的3'特异的引物，通过ddPCR测定货物的5'端或3'端时，敲入百分比类似，这提高了结果的可靠性。与转染后4天相比，在第9天时货物的敲入效率显著更高(比较图5和6)，这与以下预期一致：在由于不成功的货物敲入和GAPDH处的挽救所造成的功能性GAPDH基因缺少的RNP-诱导的GAPDH敲除细胞中存在显著的细胞死亡。

然后，实施实验以通过确认使用靶向GAPDH的蛋白编码外显子部分的gRNA，而不是靶向内含子的gRNA将更有效地选择含有成功敲入的货物基因的编辑的细胞，测试以上所描述的选择系统的机制。图7相对于对外显子特异的gRNA(RSQ22337(SEQ ID NO：95)，其靶向内含子8-外显子9接合点，从而导致外显子9内Cas12a-介导的切割)，比较了当使用介导内含子内切割的gRNA(RSQ24570(SEQ ID NO：108)结合至外显子8-内含子9接合点，从而导致内含子8内Cas12a-介导的切割)时，GAPDH基因座处GFP-编码“货物”敲入盒的敲入效率。使用如以上所描述的靶向GAPDH的RNP(Cas12a和RSQ22337)将包含报告“货物”GFP的挽救dsDNA质粒PLA1593核转染到iPSC中，而用包含Cas12a和RSQ24570的RNP核转染包含如SEQID NO：46中所示的供体模板序列的dsDNA质粒PLA1651。设计每个质粒的同源臂以介导基于每个gRNA的靶标位点的HDR。使用显微镜学使敲入显象(图7A)并且使用流式细胞术测量敲入(图7B)。当与内含子区域(内含子8)相比时，当使用在外显子编码区(外显子9)切割的gRNA和相关敲入盒时，敲入效率显著更高。图7B显示使用RSQ22337和GFP-编码“货物”敲入盒(例如，PLA1593；包含供体模板SEQ ID NO：44)电穿孔的细胞中95.6％表达GFP，相比之下用RSQ24570和GFP-编码“货物”敲入盒(PLA1651；包含供体模板SEQ ID NO：46)电穿孔的细胞仅有2.1％。图7中所示的结果是显著的，因为尽管所测量的RSQ24570的编辑效率(如通过如以上实施例1中所讨论的转染后72小时的插缺产生频率所确定的，参见图2)高于RSQ22337的编辑效率，通过靶向编码外显子区的敲入构建体所挽救的细胞比例显著更高。

在另一组实验中，如以上所描述的，iPS细胞与含有AsCas12a(SEQ ID NO：62)和RSQ22337(SEQ ID NO：95)或者RSQ24570(SEQ ID NO：108)的RNP以及分别与PLA1593(包含供体模板SEQ ID NO：44)或者PLA1651(包含供体模板SEQ ID NO：46)双链DNA供体模板质粒接触。在核转染后7天，实施流式细胞术以检测GFP表达并帮助确定每个质粒介导的供体模板和敲入盒在其各自GAPDH靶标位点处成功整合的程度。图11A中的GAPDH结果显示相对于用RSQ24750核转染的细胞，用含有RSQ22337的RNP核转染的细胞显示出高得多的量的GFP表达，这表明大部分细胞在电穿孔后第7天表达GFP。这表明GFP-编码敲入盒以高水平成功整合到RSQ22337-转染的细胞内。用含有RSQ24750的RNP核转染的细胞显示出低得多的GFP表达，这表明在这些细胞中的大部分中敲入盒未成功整合(图11A)。图11B的GAPDH结果显示如RNP转染后48小时使用基因组DNA所测量的RSQ22337的使用导致约80％的编辑，而如RNP转染后48小时使用基因组DNA所测量的RSQ24570导致约75％的编辑。如图11A所示，RSQ22337的高编辑与高GFP表达水平良好相关；然而，如图11A所示，RSQ24750的高编辑与低GFP表达水平相关性较差。图11C和图11D(表示其中RSQ22337再次用于GAPDH基因座处的编辑的另一实验)显示了编辑的细胞的相对整合“货物”(GFP)表达强度。最终，实施ddPCR测定以确定用含有RSQ22337的RNP和PLA1593供体质粒核转染的细胞中GAPDH等位基因中敲入整合事件的百分比。图13通过ddPCR显示大于60％的等位基因具有成功敲入的GFP-编码盒。

实施例3：通过多个货物的靶向整合的GAPDH敲除的挽救

在一些情况下，期望使用本文所公开的选择和货物敲入策略来有效产生和分离含有整合到单一必需基因的基因座，如(例如)GAPDH基因座的两种或更多种不同的外源编码序列，例如，两种或更多种不同的外源基因的编辑的细胞。图8显示了用于将两种或更多种不同的外源编码区引入必需基因的基因座的两种策略。图8A显示了第一示例性策略，其中将含有通过接头(例如，T2A、P2A和/或IRES；参见SEQ ID NO：29-32和33-37)隔开的两个或更多个编码区(图8A中的GFP和mCherry)的多顺反子敲入盒，例如，双顺反子敲入盒插入必需基因(例如GAPDH)的等位基因之一或两者中。图8B显示了第二示例性策略(双等位基因插入策略)，其中将两种包含不同货物序列(例如，不同外源基因，如图8B中的GFP和mCherry)的敲入盒插入必需基因的基因座，例如，GAPDH的不同的等位基因中。

实施实验以测试图8A中所示的整合策略，并确定在敲入盒中使用不同的接头组合是否可以影响货物序列的表达。用含有包含编码GFP和mCherry的“货物”序列的双顺反子敲入盒的6种不同质粒(PLA)之一(PLA1573、PLA1574、PLA1575、PLA1582、PLA1583和PLA1584，如图9A中所示；包含供体模板SEQ ID NO：38-43)，将含有Cas12a和RSQ22337(靶向GAPDH基因座，如实施例1和2中所述)的RNP核转染到iPSC中。在这些构建体中的每一个中，GFP是第一货物并且mCherry是第二货物。每个所测试的质粒在编码序列之间含有不同的接头组合(接头1和2，如图9A中所示)。PLA1573(包含供体模板SEQ ID NO：38)分别含有T2A和T2A作为接头1和2；PLA1574(包含供体模板SEQ ID NO：39)分别含有P2A和IRES作为接头1和2；PLA1575(包含供体模板SEQ ID NO：40)分别含有P2A和P2A作为接头1和2；PLA1582(包含供体模板SEQ ID NO：41)分别含有P2A和T2A作为接头1和2；PLA1583(包含供体模板SEQ IDNO：42)分别含有T2A和P2A作为接头1和2；和PLA1584(包含供体模板SEQ ID NO：43)分别含有T2A和IRES作为接头1和2。图9B和图9C显示了GAPDH基因座处多种敲入盒整合事件的结果。图9B显示了用示例性质粒PLA1582、PLA1583和PLA1584核转染后9天，编辑的iPSC的示例性显微镜图象(明场和荧光显微镜学，2×，在Keyence显微镜上)，它们中的每一个显示出可检测的GFP和mCherry表达。

图9C定量了用图9A中所描述的含有具有不同所述接头配对的双顺反子敲入盒的多种质粒(PLA1575、PLA1582、PLA1574、PLA1583、PLA1573和PLA1584)核转染的iPSC中GFP和mCherry的荧光水平。在这些双顺反子构建体中的每一个中，GFP始终是第一货物并且mCherry始终是第二货物。还作为对照测试了含有具有mCherry作为唯一“货物”的敲入盒的质粒(如图9C中所示)。数据显示在双顺反子构建体之间作为第一货物的GFP的表达水平类似，并且始终高于作为第二货物的mCherry的表达水平。含有包含mCherry作为唯一货物的对照敲入盒的细胞显示出最高mCherry表达，表明有可能通过将其作为第二货物置于双顺反子盒中来改变(例如，降低)货物的表达。另外，图9C显示当与第二货物编码序列之前的P2A或T2A接头的放置相比时，紧邻第二货物编码序列之前放置IRES接头导致较低的第二货物表达。因此，结果显示有可能通过改变货物在盒中的顺序(将货物作为第一货物放置以用于高表达，或者作为第二货物放置以用于低表达)并且通过在每种货物上游放置特定接头(P2A或T2A用于高表达；IRES用于低表达)来差异调节(即升高或降低)来自多顺反子敲入盒的两种货物编码序列的表达。

实施实验以测试图8B中所示的双等位基因整合策略。使用两种不同的质粒将含有Cas12a和RSQ22337(靶向GAPDH基因座，如实施例1和2中所述)的RNP核转染到iPSC中。一种质粒含有包含GFP编码序列作为货物的敲入盒，并且第二质粒含有包含mCherry编码序列作为货物的敲入盒(如图8B所示)。图10A显示了核转染的iPSC的示例性流式细胞术数据。设门显示高百分百，约15％的核转染的细胞表达GFP和mCherry，表明GFP敲入盒和mCherry敲入盒分别整合到GAPDH的等位基因。约41％的核转染的细胞表达mCherry并且约36％的核转染的细胞表达GFP。

实施另外的实验以测试GFP和mCherry在iPSC群体中的双等位基因插入。如所述的，转化iPSC群体。用0.5μM包含Cas12a和RSQ22337(靶向GAPDH基因座，如实施例1和2中所述)的RNP和2.5μg供体模板(5个试验)或者5μg供体模板(1个试验)核转染细胞，然后在核转染后3天或9天分选。图10B显示了通过流式细胞术分析所分析的编辑的细胞群体的示例性图像。图10C提供了来自这些试验的流式细胞术分析结果。图10C中每个时间点较大的柱(第3天或第9天)表示正表达至少一种货物，例如，GFP的至少一个等位基因和/或mCherry货物的至少一个等位基因的每个群体中细胞的总百分比。每个时间点较小的柱显示了表达GFP和mCherry两者的每个群体中细胞的百分比，并因此表示具有GFP/mCherry双等位基因整合的细胞。这些结果显示每个群体中约8-15％的转化细胞在转化后9天显示出双等位基因GFP/mCherry插入表型。

实施例4：通过靶向整合的B2M敲除的挽救

将实施例2中所描述的方法用于靶向NK细胞中的B2M基因(例如，通过直接靶向NK细胞，如iPS-来源的NK细胞，或者靶向然后分化为NK细胞的iPS细胞)。缺少功能性B2M基因的NK细胞将不能识别彼此表面上的MHC I类并且将彼此攻击，从而以被称为同类杀伤(fratricide)的现象消耗群体。通过敲除B2M基因并敲入还恢复功能性B2M基因的“货物”序列，技术人员自动富集敲入细胞类型。

实施例5：通过靶向整合对TBP敲除的挽救

将实施例2中所描述的敲入整合和选择方法用于靶向iPSC中的TBP基因。尽管出于本实验的目的测试了iPSC，但是所述方法可以应用于其它细胞类型。TBP基因编码TATA-箱结合蛋白，它是在转录起始装置中起关键作用的转录调节剂。下表14中显示了靶向TBP基因的末端外显子的AsCpf1(AsCas12a)向导RNA。向导RNA均为具有以下设计的41聚体RNA分子：5'-UAAUUUCUACUCUUGUAGAU-[21聚体靶向结构域序列]-3'(SEQ ID NO：90)。

表14：向导RNA序列

将表14中所描述的RSQ33502、RSQ33503和RSQ33504(SEQ ID NO：148-150)分别确定为对TBP高度特异并且在基因组中具有最小脱靶位点(数据未显示)。因此，认为TBP基因是本文所描述的货物整合和选择方法的优良候选基因靶标，这至少部分是因为存在可用的能够非常特异性地靶向末端外显子(分别为mRNA同工型1外显子8或者mRNA同工型2外显子7)的gRNA。然而，对于将高度适合于本文所描述的方法的任何这些gRNA，它们需要在将敲除和/或严重降低基因功能的TBP基因座中的位置处引入插缺时是高效的。

然后，测试这些gRNA中的每一个以确定它是否可以在挽救否则将通过将RNP诱导的插缺引入该必需基因的编码区中所造成的致死表型的方法中，用于将包含TBP的一部分以及编码GFP的框内货物序列的盒敲入细胞的TBP基因的末端外显子。如果所测试的gRNA对于在对于功能重要的TBP位置以高频率引入插缺有效，则预期未经历HDR来引入敲入盒的转染的细胞将死亡，从而导致产生大量从TBP基因座表达GFP的细胞。具体地，将iPSC细胞与含有AsCas12a(SEQ ID NO：62)和RSQ33502、RSQ33503或RSQ33504(SEQ ID NO：148-150)的RNP以及设计以在各自相应gRNA靶标结合位点介导HDR的双链DNA供体模板(dsDNA质粒)一起接触。双链DNA供体模板包括敲入盒，其具有与最终TBP外显子编码序列的一部分的密码子优化形式位于同一读框且位于其下游(3')的GFP(“货物”)的编码序列(分别为mRNA同工型1外显子8或者mRNA同工型2外显子7)以及编码P2A自切割肽的序列(“P2A”)，这类似于实施例2中对于GAPDH所描述的dsDNA质粒。将双链DNA供体模板(PLA1615、PLA1616或PLA1617；包含供体模板SEQ ID NO：47、49或50)中的TBP序列密码子优化以防止相伴向导RNA分子(RSQ33502、RSQ33503或RSQ33504)的进一步结合。敲入盒还包括位于货物序列下游的3'UTR和多聚A信号序列。含有RSQ33502的RNP与PLA1615(包含供体模板SEQ ID NO：47)一起施用；RSQ33503与PLA1616(包含供体模板SEQ ID NO：49)一起施用；且RSQ33504与PLA1617(包含供体模板SEQ ID NO：50)一起施用。每种具体的dsDNA质粒(PLA)含有具有同源臂的供体模板和敲入盒，其设计以在敲入盒整合后特异性涵盖特定gRNA靶标位点并使其无效。

在核转染后7天，实施流式细胞术并用于帮助确定每个基于质粒的敲入盒在其各自TBP靶标位点处成功整合的程度。图11A显示相对于用其它RNP核转染的细胞，用含有RSQ33503的RNP核转染的细胞显示出最大的GFP表达量，从而表明GFP编码敲入盒以高水平在这些细胞内成功整合。图12显示约76％的用含有RSQ33503(SEQ ID NO：149)的RNP和PLA1616(包含供体模板SEQ ID NO：49)质粒核转染的细胞表达GFP，相比之下仅约1％的用单独的PLA1616质粒核转染的细胞表达(无RNP对照)。用含有RSQ33504(SEQ ID NO：150)的RNP核转染的细胞还显示出高GFP表达水平，这也表明了更高的敲入盒整合水平(图11A)。用含有RSQ33502(SEQ ID NO：148)的RNP核转染的细胞显示出低得多的GFP表达，从而表明在这些细胞中的大部分中敲入盒未成功整合(图11A)。图11B显示含有RSQ33503(SEQ ID NO：149)的RNP的使用导致约80％的编辑，这与图11A中所示的较高的GFP表达水平相关。在转染后2天测量编辑百分比，并且通过ICE测定确定(如Hsiau等人,Inference of CRISPR Editsfrom Sanger Trace Data.BioRxiv,251082,August 2019中所述)。含有RSQ33502(SEQ IDNO：148)的RNP的使用导致相对低的编辑百分比，这与图11A中低GFP表达相关。图11C和图11D(表示其中RSQ33503再次用于TBP基因座处的编辑的另一实验)显示了编辑的细胞的相对整合“货物”(GFP)表达强度。最终，实施ddPCR测定以确定GFP货物向用含有RSQ33503(SEQID NO：149)的RNP和PLA1616供体质粒(包含供体模板SEQ ID NO：49)核转染的细胞的TBP等位基因中的敲入百分比。图13通过ddPCR显示超过40％的TBP等位基因具有成功敲入的GFP-编码盒。

实施例6：通过靶向整合的E2F4敲除的挽救

将实施例2中所描述的敲入整合和选择方法用于靶向iPSC中的E2F4基因。尽管出于本实验的目的测试了iPSC，但是所述方法可以应用于其它细胞类型。E2F4基因编码E2F转录因子4。这种转录调节剂在细胞周期调控中起关键作用。下表15中显示了靶向E2F4基因的末端外显子的AsCpf1(AsCas12a)向导RNA。向导RNA均为具有以下设计的41聚体RNA分子：5'-UAAUUUCUACUCUUGUAGAU-[21聚体靶向结构域序列]-3'(SEQ ID NO：90)。

表15：向导RNA序列

将RSQ33505、RSQ33506和RSQ33507(SEQ ID NO：151-153)分别确定为对E2F4高度特异并且在基因组中具有最小脱靶位点(数据未显示)。因此，认为E2F4基因是本文所描述的货物整合和选择方法的优良候选基因靶标，这至少部分是因为存在可用的能够非常特异性地靶向末端外显子(外显子10)的gRNA。然而，对于将高度适合于本文所描述的方法的任何这些gRNA，它们需要在将敲除或者严重降低基因功能的E2F4基因座中的位置处引入插缺时是高效的。

然后，测试gRNA RSQ33505、RSQ33506和RSQ33507(SEQ ID NO：151-153)以确定它们是否可以在挽救否则将通过以高频率将RNP诱导的插缺引入该必需基因的编码区中所造成的致死表型的方法中，用于将包含E2F4的一部分和编码GFP的货物序列的盒敲入细胞的E2F4基因座的末端外显子。具体地，将iPSC与含有AsCas12a(SEQ ID NO：62)和RSQ33505、RSQ33506或RSQ33507(SEQ ID NO：151-153)的RNP以及设计以在各自相应gRNA靶标结合位点介导HDR的双链DNA供体模板(dsDNA质粒)一起接触。双链DNA供体模板包括敲入盒，其具有与最终E2F4外显子编码序列(外显子10)的密码子优化形式位于同一读框且位于其下游(3')的GFP(“货物”)的编码序列以及编码P2A自切割肽的序列(“P2A”)，这类似于实施例2中对于GAPDH所描述的dsDNA质粒。将双链DNA供体模板(PLA1626、PLA1627或PLA1628；包含供体模板SEQ ID NO：52-54)中的E2F4序列密码子优化以防止相伴向导RNA分子(RSQ33505、RSQ33506或RSQ33507；SEQ ID NO：151-153)的进一步结合。敲入盒还包括位于货物序列下游的3'UTR和多聚A信号序列。将含有RSQ33505(SEQ ID NO：151)的RNP与PLA1626(包含供体模板SEQ ID NO：52)一起施用；将RSQ33506(SEQ ID NO：152)与PLA1627(包含供体模板SEQID NO：53)一起施用；并将RSQ33507(SEQ ID NO：153)与PLA1628(包含供体模板SEQ ID NO：54)一起施用。每种具体的dsDNA质粒(PLA)含有具有同源臂的供体模板和敲入盒，其设计以在整合后特异性涵盖特定gRNA靶标位点并使其无效。

在核转染后7天，实施流式细胞术并用于帮助确定每个基于质粒的敲入盒在其各自E2F4靶标位点处成功整合的程度。图11A显示相对于用其它靶向E2F4的RNP核转染的细胞，用含有RSQ33505(SEQ ID NO：151)的RNP核转染的细胞显示出最大的GFP表达量，从而表明GFP编码敲入盒在这些细胞中的多个中成功整合。用含有RSQ33506或RSQ33507(SEQ IDNO：152和153)的RNP核转染的细胞显示出低得多的GFP表达，从而表明在这些细胞中的大部分中敲入盒未成功整合(图11A)。图11B显示当在RNP转染后48小时测量时，含有RSQ33505(SEQ ID NO：151)或RSQ33506(SEQ ID NO：152)的RNP的使用分别导致约15％和约20％的编辑率。可以认为RSQ33505(SEQ ID NO：151)的相对较低的所观察到的编辑率与GFP在E2F4中相对高水平的整合意外相关(如图11A中所观察到的)，并且可以部分是由于在48小时，编辑的细胞群体内显著的死亡所造成。在转染后2天测量编辑百分比，并且通过ICE测定确定(如Hsiau等人,August 2019中所述)。图11C显示了编辑的细胞的相对整合的“货物”(GFP)表达强度。

实施例7：通过靶向整合的G6PD敲除的挽救

将实施例2中所描述的敲入整合和选择方法用于靶向iPSC中的G6PD基因。尽管出于本实验的目的测试了iPSC，但是所述方法可以应用于其它细胞类型。G6PD基因编码葡萄糖-6-磷酸脱氢酶。这种代谢酶在糖酵解和NADPH产生中起关键作用。下表16中显示了靶向G6PD基因的末端外显子的AsCpf1(AsCas12a)向导RNA。

表16：向导RNA序列

确定RSQ33508(SEQ ID NO：154)对G6PD具有高度特异性并且在基因组中具有最小脱靶位点(数据未显示)。因此，认为G6PD基因是本文所描述的货物整合和选择方法的优良候选基因靶标，这至少部分是因为存在可用的能够特异性靶向末端外显子(外显子13)的gRNA。

然后，测试gRNARSQ33508(SEQ ID NO：154)以确定它是否可以在挽救否则将通过以高频率将RNP诱导的插缺引入该必需基因的编码区中所造成的致死表型的方法中，用于将包含G6PD的一部分和编码GFP的货物序列的盒敲入细胞的G6PD基因座的末端外显子。具体地，将iPSC与含有AsCas12a(SEQ ID NO：62)和RSQ33508(SEQ ID NO：154)的RNP以及设计以在gRNA靶标结合位点介导HDR的双链DNA供体模板(dsDNA质粒)一起接触。双链DNA供体模板包括敲入盒，其具有与最终G6PD外显子编码序列(外显子13)的密码子优化形式位于同一读框且位于其下游(3')的GFP(“货物”)的编码序列以及编码P2A自切割肽的序列(“P2A”)，这类似于实施例2中对于GAPDH所描述的dsDNA质粒。将双链DNA供体模板(PLA1618；包含供体模板SEQ ID NO：51)中的G6PD序列密码子优化以防止相伴向导RNA分子(RSQ33508)的进一步结合。敲入盒还包括位于货物序列下游的3'UTR和多聚A信号序列。将含有RSQ33508(SEQ ID NO：154)的RNP与PLA1618(包含供体模板SEQ ID NO：51)一起施用。dsDNA质粒(PLA)含有具有同源臂的供体模板和敲入盒，其设计以在整合后特异性涵盖相伴gRNA靶标位点并使其无效。

在核转染后7天，实施流式细胞术并用于帮助确定基于质粒的敲入盒在其G6PD靶标位点处成功整合的程度。图11A显示用含有RSQ33508(SEQ ID NO：154)的RNP核转染的细胞在约10％的测定细胞中显示出GFP表达，表明GFP编码敲入盒在这些细胞内以相对低水平整合。图11C显示了编辑的细胞的相对整合的“货物”(GFP)表达强度。

实施例8：通过靶向整合的KIF11敲除的挽救

将实施例2中所描述的敲入整合和选择方法用于靶向iPSC中的KIF11基因。尽管出于本实验的目的测试了iPSC，但是所述方法可以应用于其它细胞类型。KIF11基因编码驱动蛋白家族成员11。这种酶在小囊沿胞内微管的移动以及染色体在有丝分裂期间的定位中起关键作用。下表17中显示了靶向KIF11基因的末端外显子的AsCpf1(AsCas12a)向导RNA。

表17：向导RNA序列

将RSQ33509、RSQ33510和RSQ33511(SEQ ID NO：155-157)分别确定为对KIF11高度特异并且在基因组中具有最小脱靶位点(数据未显示)。因此，认为KIF11基因是本文所描述的货物整合和选择方法的优良候选基因靶标，这至少部分是因为存在可用的能够非常特异性地靶向可用的末端外显子(外显子22)的gRNA。然而，对于将高度适合于本文所描述的方法的任何这些gRNA，它们需要在将敲除或严重降低基因功能的KIF11基因座中的位置处引入插缺时是高效的。

然后，测试这些gRNA中的每一个以确定它是否可以在挽救否则将通过以高频率将RNP诱导的插缺引入该必需基因的编码区中所造成的致死表型的方法中，用于将包含KIF11的一部分以及编码GFP的货物序列的盒敲入细胞的KIF11基因的末端外显子。具体地，将iPSC细胞与含有AsCas12a(SEQ ID NO：62)和RSQ33509、RSQ33510或RSQ33511(SEQ ID NO：155-157)的RNP以及设计以在各自相应gRNA靶标结合位点介导HDR的双链DNA供体模板(dsDNA质粒)一起接触。双链DNA供体模板包括敲入盒，其具有与最终KIF11外显子编码序列(外显子22)的密码子优化形式位于同一读框且位于其下游(3')的GFP(“货物”)的编码序列以及编码P2A自切割肽的序列(“P2A”)，这类似于实施例2中对于GAPDH所描述的dsDNA质粒。将双链DNA供体模板(PLA1629、PLA1630或PLA1631；包含供体模板SEQ ID NO：55-57)中的KIF11序列密码子优化以防止相伴向导RNA分子(RSQ33509、RSQ33510或RSQ33511；SEQ IDNO：155-157)的进一步结合。敲入盒还包括位于货物序列下游的3'UTR和多聚A信号序列。将含有RSQ33509(SEQ ID NO：155)的RNP与PLA1629质粒(包含供体模板SEQ ID NO：55)一起施用；将RSQ33510(SEQ ID NO：156)与PLA1630(包含供体模板SEQ ID NO：56)一起施用；并将RSQ33511(SEQ ID NO：157)与PLA1631(包含供体模板SEQ ID NO：57)一起施用。每种具体的dsDNA质粒(PLA)含有具有同源臂的供体模板和敲入盒，其设计以在整合后特异性涵盖特定gRNA靶标位点并使其无效。

在核转染后7天，实施流式细胞术并用于帮助确定每个质粒敲入盒在其各自KIF11靶标位点处成功整合的程度。图11A显示相对于用其它靶向KIF11的RNP核转染的细胞，用含有RSQ33505(SEQ ID NO：155)的RNP核转染的细胞显示出最大的GFP表达量，从而表明GFP编码敲入盒在这些细胞中的多个中成功整合。用含有RSQ33510或RSQ33511(SEQ ID NO：156或157)的RNP核转染的细胞也显示出一定的GFP表达(图11A)。图11B显示含有RSQ33509(SEQID NO：155)的RNP的使用导致在转染后48小时约40％的编辑(较低的水平可能是由于此时细胞群体中显著的细胞死亡所造成的)，这与图11A中所示的GFP表达水平相关。有趣地，图11B显示含有RSQ33510(SEQ ID NO：156)的RNP的使用导致约90％的所观察到的编辑率，而含有RSQ33511(SEQ ID NO：157)的RNP导致约65％的所观察到的编辑率，但当与RSQ33509(SEQ ID NO：155)转染的细胞相比时，通过这些向导转染的细胞中GFP的表达相对较低。这些结果表明RSQ33510或RSQ33511(SEQ ID NO：156或157)向导可能未在KIF11中产生足够有害的插缺，从而尽管编辑效率较高，但仍有高比例的活细胞，这使得转染的细胞不会以足够大的数目死亡以允许通过成功的货物敲入来有效选择转染的细胞。因此，尽管RSQ33510和RSQ33511(SEQ ID NO：156或157)gRNA对它们的KIF11靶标位点高度特异(具有最小脱靶)并且显示出高编辑水平，但是它们可能仍不是适合于本文所描述的选择机制的gRNA，因为它们可能不引起导致KIF11充分不起作用的毒性插缺，如果不发生挽救敲入盒的同源重组，则这反过来将导致细胞死亡。在转染后2天测量编辑百分比，并且通过ICE测定确定(如Hsiau等人,August 2019中所述)。图11C和图11D(表示其中RSQ33509再次用于KIF11基因座处的编辑的另一实验)显示了编辑的细胞的相对整合“货物”(GFP)表达强度。

实施例9：使用病毒载体将货物在必需基因的基因座处敲入

本实施例描述了包含细胞群体的病毒载体转导的本文所描述的基因编辑方法的使用。

将本文所描述的靶细胞从供体受试者或者有需要的受试者收集至疗法(例如，患者)。在适当分选、培养和/或分化过程后，用至少一个包含含有gRNA的核苷酸序列的AAV载体、适合的核酸酶和/或适合的挽救构建体转导靶细胞。使用流式细胞术分选细胞以确定成功的转导、编辑、整合和/或表达事件。

用包含靶向GAPDH的RNP(包括SEQ ID NO：62所示的Cas12a和SEQ ID NO：95所示的gRNA RSQ22337)和PLA1593(包含供体模板SEQ ID NO：44)的AAV载体(例如，AAV6)转导造血干细胞群体。如本文所描述的，使用流式细胞术确定成功的转导、编辑、敲入盒整合和/或表达事件。在AAV转导后，通过RNP在GAPDH基因座处编辑大部分细胞并且它们经由HDR已整合了敲入盒。用包含靶向TBP的RNP(包括SEQ ID NO：62所示的Cas12a和SEQ ID NO：149所示的gRNA RSQ33503)和PLA1616(包含供体模板SEQ ID NO：49)的AAV载体(例如，AAV6)转导造血干细胞群体。如本文所描述的，使用流式细胞术确定成功的转导、编辑、整合和/或表达事件。在AAV转导后，通过RNP在TBP基因座处编辑大部分细胞并且它们经由HDR已整合了敲入盒。

用包含靶向GAPDH的RNP(包括SEQ ID NO：62所示的Cas12a和SEQ ID NO：95所示的gRNA RSQ22337)和PLA1593(包含供体模板SEQ ID NO：44)的AAV载体(例如，AAV6)转导T细胞群体。如本文所描述的，使用流式细胞术确定成功的转导、编辑、敲入盒整合和/或表达事件。在AAV转导后，通过RNP在GAPDH基因座处编辑大部分细胞并且它们经由HDR已整合了敲入盒。用包含靶向TBP的RNP(包括SEQ ID NO：62所示的Cas12a和SEQ ID NO：149所示的gRNARSQ33503)和PLA1616(包含供体模板SEQ ID NO：49)的AAV载体(例如，AAV6)转导T细胞群体。如本文所描述的，使用流式细胞术确定成功的转导、编辑、整合和/或表达事件。在AAV转导后，通过RNP在TBP基因座处编辑大部分细胞并且它们经由HDR已整合了敲入盒。

用包含靶向GAPDH的RNP(包括SEQ ID NO：62所示的Cas12a和SEQ ID NO：95所示的gRNA RSQ22337)和PLA1593(包含供体模板SEQ ID NO：44)的AAV载体(例如，AAV6)转导NK细胞群体。如本文所描述的，使用流式细胞术确定成功的转导、编辑、敲入盒整合和/或表达事件。在AAV转导后，通过RNP在GAPDH基因座处编辑大部分细胞并且它们经由HDR已整合了敲入盒。用包含靶向TBP的RNP(包括SEQ ID NO：62所示的Cas12a和SEQ ID NO：149所示的gRNARSQ33503)和PLA1616(包含供体模板SEQ ID NO：49)的AAV载体(例如，AAV6)转导NK细胞群体。如本文所描述的，使用流式细胞术确定成功的转导、编辑、敲入盒整合和/或表达事件。在AAV转导后，通过RNP在TBP基因座处编辑大部分细胞并且它们经由HDR已整合了敲入盒。

用包含靶向GAPDH的RNP(包括SEQ ID NO：62所示的Cas12a和SEQ ID NO：95所示的gRNA RSQ22337)和PLA1593(包含供体模板SEQ ID NO：44)的AAV载体(例如，AAV6)转导肿瘤浸润性淋巴细胞(TIL)群体。如本文所描述的，使用流式细胞术确定成功的转导、编辑、敲入盒整合和/或表达事件。在AAV转导后，通过RNP在GAPDH基因座处编辑大部分细胞并且它们经由HDR已整合了敲入盒。用包含靶向TBP的RNP(包括SEQ ID NO：62所示的Cas12a和SEQ IDNO：149所示的gRNA RSQ33503)和PLA1616(包含供体模板SEQ ID NO：49)的AAV载体(例如，AAV6)转导肿瘤浸润性淋巴细胞(TIL)群体。如本文所描述的，使用流式细胞术确定成功的转导、编辑、敲入盒整合和/或表达事件。在AAV转导后，通过RNP在TBP基因座处编辑大部分细胞并且它们经由HDR已整合了敲入盒。

用包含靶向GAPDH的RNP(包括SEQ ID NO：62所示的Cas12a和SEQ ID NO：95所示的gRNA RSQ22337)和PLA1593(包含供体模板SEQ ID NO：44)的AAV载体(例如，AAV6)转导神经元群体。如本文所描述的，使用流式细胞术确定成功的转导、编辑、敲入盒整合和/或表达事件。在AAV转导后，通过RNP在GAPDH基因座处编辑大部分细胞并且它们经由HDR已整合了敲入盒。用包含靶向TBP的RNP(包括SEQ ID NO：62所示的Cas12a和SEQ ID NO：149所示的gRNARSQ33503)和PLA1616(包含供体模板SEQ ID NO：49)的AAV载体(例如，AAV6)转导神经元群体。如本文所描述的，使用流式细胞术确定成功的转导、编辑、敲入盒整合和/或表达事件。在AAV转导后，通过RNP在TBP基因座处编辑大部分细胞并且它们经由HDR已整合了敲入盒。

实施例10：使用病毒载体将货物在必需基因的基因座处敲入

本实施例描述了使用包含T细胞群体的病毒载体转导的本文所描述的方法对T细胞群体的基因编辑。也可以将本文所描述的方法应用于其它细胞类型，如其它免疫细胞。

如本领域中已知的，将T细胞在珠浴中融化，并在第2天从所述浴中除去。在融化后第4天对细胞电穿孔，简言之，将在Lonza 96-孔比色杯中的每孔250,000个T细胞在缓冲液P2中混悬并使用不同浓度的包含gRNA RSQ22337(SEQ ID NO：95)和靶向GAPDH基因的Cas12a(SEQ ID NO：62)的RNP(4μM RNP、2μM RNP、1μM RNP或0.5μM RNP)，使用脉冲编码CA-137进行电穿孔。在电穿孔后立即将适当的媒介物加入至细胞并使细胞恢复15分钟。然后，以不同感染复数(MOI)浓度(5E4、2.5E4、1.25E4、6.25E3、3.13E3、1.56E3或7.81E2)，将包含含有敲入盒以及GFP货物的供体质粒构建体的AAV6病毒颗粒添加至T细胞。如实施例2所述设计供体质粒，其具有优化以防止向导RNA(RSQ22337)的gRNA靶向结构域序列进一步结合的GAPDH外显子9的5'密码子优化编码部分、编码P2A自切割肽的框内序列(“P2A”)、GFP的框内编码序列(“货物”)、终止密码子和多聚A信号序列。2天后，拆分T细胞，然后每48小时拆分直至通过流式细胞术分析它们。电穿孔后7天，使用流式细胞术分选T细胞以确定成功的转导、转化、编辑、敲入盒整合和/或表达事件(参见图14、图15、图16A和图16B)。如图14所示，以不同的AAV6感染复数(MOI)(5E4、2.5E4、1.25E4、6.25E3、3.13E3、1.56E3或7.81E2)，用4μM RNP、2μM RNP、1μM RNP或0.5μM RNP转导T细胞群体。以5E4 AAV6 MOI，在所有RNP浓度下转导/转化的T细胞群体中观察到，并且当以低至1.25E4的AAV6 MOI转导细胞时，使用大于1μM的RNP浓度观察到GAPDH基因处高比例的GFP整合。无AAV转导的对照实验导致显示出无GFP整合事件的T细胞群体(参见图16B)。在用RNP和不同MOI下的AAV6转化细胞后4天测量T细胞存活力(图15)。

此外，将使用本文所描述的方法的敲入效率与本领域中已知的方法的优化形式相比较。简言之，用如本文所描述的包含适合于GFP在GAPDH基因处敲入的供体模板的AAV6载体转导T细胞群体，并且用如以上所描述的gRNA RSQ22337(SEQ ID NO：95)和Cas12a(SEQID NO：62)转化；作为另外一种选择，使用AAV6载体转导，对T细胞群体进行在TRAC基因座处高度优化的GFP敲入(参见，例如，Vakulskas等人Ahigh-fidelity Cas9 mutant deliveredas a ribonucleoprotein complex enables efficient gene editing in humanhematopoietic stem and progenitor cells.Nat Med.2018；24(8):1216-1224)。使用流式细胞术测量敲入效率(在电穿孔后7天测量，通过表达GFP的T细胞群体百分比确定)。当与对于类似方法公开描述的整合频率相比时，TRAC基因座处的敲入率较高(～50％)，然而，通过AAV6转导辅助的使用本文所描述的方法在GAPDH基因处的敲入效率显著(使用非配对t检验，p＝0.0022)更高(～68％)(参见图17A)。在两个实验中使用了相同的RNP浓度、AAV6 MOI和同源臂长度，显示了来自3个独立生物学重复的平均结果(参见图17A)。因此，本文所描述的方法可以用于分离相对于其它基因敲入方法高度表达所关心的基因的修饰的细胞群体，如免疫细胞样T细胞群体。

实施例11：CD16敲入iPSC产生了功能增强的编辑的iNK

本实施例描述了使用本文所描述的基因编辑方法产生适合于杀伤癌细胞的修饰的免疫细胞。

使用图3A、3B和3C中所示以及实施例2中所描述的示例性系统编辑PSC。简言之，使用AsCpf1(SEQ ID NO：62)和向导RNA(RSQ22337)(SEQ ID NO：95)靶向iPSC中的GAPDH基因，从而导致朝向GAPDH的最后一个外显子(外显子9)的5'端的双链断裂。根据已知的方法，通过核糖核蛋白(RNP)的核转染(电穿孔)，将CRISPR/Cas核酸酶和向导RNA引入细胞。还使细胞接触双链DNA供体模板(dsDNA质粒，包含供体模板SEQ ID NO：205)，其包括供体模板，所述供体模板以5'至3'顺序包含：约500bp长的5'同源臂(包含外显子8的3'部分、内含子8和优化以防止向导RNA(RSQ22337)的gRNA靶向结构域序列进一步结合的外显子9的5'密码子优化的编码部分)、编码P2A自切割肽的框内序列(“P2A”)、CD16的框内编码序列(“货物”)(不可切割的CD 16；SEQ ID NO：165)、终止密码子和多聚A信号序列以及约500bp长的3'同源臂(包含包括终止密码子的外显子9的编码部分、外显子9的3'非编码外显子区和下游基因间序列部分)(如图3B所示)。

使用本文所描述的选择系统，将货物基因CD16高效成功整合到iPSC的GAPDH基因。图18A显示了在用浓度4μM的RNP以及编码CD16的dsDNA质粒在iPSC中或者在未用dsDNA质粒转化的“未编辑的细胞”中，电穿孔后第0天和电穿孔后第19天，GAPDH基因中CD16-编码“货物”整合的效率。使用gRNA靶标位点的5'中的引物或者多聚A区中位点的3'中的引物，使用靶向敲入“货物”的5'或3'位置的ddPCR在整体编辑的CD16 KI细胞中测量敲入，从而提高了结果的可靠性。如图18A所示，稳定敲入CD16并且在电穿孔和敲入盒靶向整合后，CD16在整体编辑的细胞群体中存在超过两周。

从整体编辑的细胞群体，单个细胞增殖以使基因型均一。图18B显示了4种编辑的细胞群体：纯合克隆1、纯合克隆2、杂合克隆3和杂合克隆4。纯合克隆含有包含CD16敲入的GAPDH基因的两个等位基因，而杂合克隆含有包含CD16敲入的GAPDH基因的一个等位基因(使用敲入货物的5'和3'位置的ddPCR测量)。

确认在GAPDH基因处CD16-编码“货物”整合后，使用如本领域中已知的自旋拟胚体法使均一的细胞系分化为自然杀伤(NK)免疫细胞。简言之，以5,000至6,000个细胞每孔将iPSC置于超低吸附96-孔板(ultra-low attachment 96-well plate)中以形成拟胚体(EB)。在第11天，将EB转移至烧瓶，在此它们保持用于剩余实验(参见，Ye Li等人,CellStem Cell.2018Aug 2；23(2):181-192.e5)。在分化过程的第32天，使用本领域中已知的流式细胞法分析细胞。在标准对照设门实验后(参见Ye Li等人,Cell Stem Cell.2018Aug 2；23(2):181-192.e5)，使用标志物CD56和CD45的表达分析分化过程，在此之后，测量标志物CD56和CD16的共表达。如图19A-19D所示，通常，对于CD56表达阳性的细胞对于CD16表达也是阳性(分别为98％、99％、97.8％和99.9％)，表明纯合和杂合TI克隆两者具有稳定且稳健的CD16表达水平。

然后，使包含所关心的基因(CD16)在GAPDH基因处的敲入的这些分化的iNK细胞经受多种癌细胞系的攻毒以确定它们的细胞毒能力。图20中显示了示例性3D实体瘤杀伤测定。简言之，通过在96孔超低吸附板中接种5,000个NucLight Red标记的SK-OV-3细胞形成球形体。在添加效应细胞(以不同的E：T比)和任何任选的试剂(例如，细胞因子、抗体等)之前，在37℃培育球形体，随后使用Incucyte S3系统每2小时对球形体成像长达600小时。在添加效应因子时，将所示数据对红色目标强度进行归一化。球形体曲线的归一化维持了与非归一化数据中所观察到的相同的效力模式。使用这种测定，测量了从在GAPDH基因处包含CD16敲入的iPSC分化的iNK的细胞毒性。

如图21A和21B所示，包含在GAPDH基因处敲入的CD16的纯合编辑的iNK系两者和杂合编辑的iNK系两者能够比未编辑的iNK对照细胞(WT PCS)或者具有敲入GAPDH基因的GFP的对照细胞(WT GFP KI)更有效地降低SK-OV-3球形体的尺寸(来自2次测定的平均数据)。在GAPDH包含CD16的编辑的纯合和杂合iNK细胞还比具有敲入GAPDH基因的GFP的对照细胞更有效地降低SK-OV-3球形体的尺寸(数据未显示)。与对照细胞相比，10μg/mL抗体曲妥珠单抗的引入大大增强了CD16 KI iNK的杀伤能力，这可能与由于提高的FcyRIII(CD16)表达水平所造成的提高的抗体依赖性细胞毒性(ADCC)有关(参见图37A)。将一些实体瘤杀伤测定的结果对CD16 KI编辑的iNK(来源于整体编辑的iPSC或者单一编辑的iPSC)的CD16表达水平作图。以3.16:1的E：T比，在表达CD16的细胞群体的百分比与所发生的细胞杀伤的量之间显示存在相关性(参见图23)。

为了进一步阐明编辑的iNK的功能性，对细胞进行对肿瘤细胞的反复暴露，并且在体外连续杀伤测定中分析在多天的时间段内，编辑的iNK反复杀伤肿瘤靶标的能力。图22中显示了该实验的结果。在测定第0天，在存在或不存在0.1μg/mL抗体利妥昔单抗的情况下，将10×10⁶个Raji肿瘤细胞(造血源成淋巴细胞样细胞系)和2×10⁵个iNK在96-孔板的每个孔中铺板。以约48小时的间隔，加入5×10³个Raji肿瘤细胞的丸剂以再次攻毒iNK群体。如图22所示，编辑的iNK细胞(CD16 KI iNK杂合或纯合)显示出用Raji肿瘤细胞多次攻毒后对Raji细胞的连续杀伤(长达598小时)，然而未编辑的iNK细胞在它们的连续杀伤效果方面受限制。数据显示在GAPDH处包含纯合或杂合CD16 KI的iNK细胞导致延长和增强的肿瘤细胞杀伤。此外，杂合CD16 KI iNK的效力突出显示了两种不同敲入盒的双等位基因插入，例如，在适合的必需基因(例如，GAPDH、TBP、KIF11等)的一个等位基因中包含CD16并且在另一个等位基因中包含不同的所关心的基因的双等位基因插入的潜力。

实施例12：免疫相关序列在适合的必需基因的基因座处的敲入(单顺反子或双顺反子)

如以上实施例2和实施例11中所描述的，GAPDH基因处的阳性靶向整合事件和细胞表型以GFP、CD47或CD16而著称。可以以高整合率将其它或替代货物序列引入GAPDH基因或者如本文所描述的其它适合的必需基因。使用含有AsCpf1(SEQ ID NO：62)和向导RNA(RSQ22337；SEQ ID NO：95)的RNP靶向iPSC细胞中的必需基因GAPDH，从而导致朝向GAPDH的最后一个外显子(外显子9)的5'端的双链断裂，如实施例2中所述。还通过RNP将含有具有所关心的货物的敲入盒的供体质粒电穿孔。如图24A所示，当使用ddPCR测量时，当在两个独立的iPSC克隆系中测定时，货物，如a)CD16，b)适合于在NK细胞中表达的CAR，或者c)双等位基因GFP/mCherry在GAPDH基因的靶向整合(TI)率均大于40％。如图24B所示，CXCR2货物在GAPDH基因处的靶向TI率为整体编辑的iPSC的至少29.2％(使用流式细胞术确定的表达)，而在约8.5％的整体编辑的iPS中观察到了CCXCR2的表面表达(使用流式细胞术确定的表达)。相反，通过流式细胞术，未编辑的iPSC表达很少量的CXCR2(约1％)(数据未显示)。

如下所示，将示例性ddPCR实验用于测量靶向整合(TI)率。简言之，使用捕获GAPDH末端外显子区的5'同源臂和3'多聚A尾两者的通用引物组测量TI，并且可以独立于特定货物的特定序列检测货物。组合制备5'CDN引物和3'多聚A引物以及FAM荧光团探针。合适的参考基因探针是TTC5 HEX探针。对于反应，将探针、基因组DNA、BioRad master mix和2×对照缓冲液以与生产商的建议一致的比例混合在一起。首先，将基因组DNA置于BioRad 96孔板(9.2μl总基因组DNA+水)中，然后，添加具有引物探针组的master mix(13.8μl每孔)。水对照包含在一个孔中的5'引物探针组master mix，并且在不同的孔中包含3'引物探针组master mix。对于空白孔对照，添加2×对照缓冲液和水的50/50混合物(总计25μl)。然后，准备并运行自动化微滴发生器(auto droplet generator)。一旦产生微滴，在180℃密封ddPCR板，然后将其置于热循环仪用于扩增。5′CDN引物：CATCGCATTGTCTGAGTAGGTGTC(SEQID NO：219)，3′多聚A引物：TGCCCACAGAATAGCTTCTTCC(SEQ ID NO：220)，FAM探针：TCCCCTCCTCACAGTTGCCA(SEQ ID NO：221)，TTC5参考基因正向引物：GGAGAAAGTGTCCAGGCATAAG(SEQ ID NO：222)，TTC5参考基因反向引物：CTCCATCCCACTATGACCATTC(SEQ ID NO：223)，TTC5 FAM探针：AGTTTGTGTCAGGATGGGTGGT(SEQID NO：224)。

然后，使用以不同的5'至3'顺序含有CD16和NK适合的CAR(例如，CD16之后是CAR，或者CAR之后是CD16)并通过P2A或IRES序列隔开的一些双顺反子敲入盒测试本文所描述的货物整合和选择方法。使用含有AsCpf1(AsCas12a，(SEQ ID NO：62))和向导RNA(RSQ22337；SEQ ID NO：95)的RNP靶向iPSC细胞中的必需基因GAPDH，从而导致朝向GAPDH的最后一个外显子(外显子9)的5'端的双链断裂，如实施例2中所述。还通过RNP将含有图25中所示的每个敲入盒的供体质粒电穿孔。如图25所示，当在转化后第0天使用ddPCR在整体编辑的细胞中测量时，包含CD16和NK适合的CAR的双顺反子构建体的TI率在20-70％的范围内。另外，还以4μm的浓度使用包含(RSQ22337)和Cas12a的RNP并以5μg使用编码mbIL-15的dsDNA质粒(PLA1632；包含供体模板SEQ ID NO：45)将膜结合的IL-15(mbIL-15)货物基因(包含连接至寿司结构域的IL-15和全长IL-15Rα的融合体，如图26中所示)敲入GAPDH基因座以确定其它所关心的基因是否可以在编辑的细胞群体内以高水平整合到必需基因。图25显示通过ddPCR所测量的(转化后第0天)，mbIL-15货物以大于50％的TI百分比敲入GAPDH基因座。因此，本文所描述的方法可以用于分离具有高水平的敲入必需基因基因座，如GAPDH的所关心的基因的编辑的细胞群体，如iPSC群体。

实施例13：IL-15和/或IL-15/IL15-Rα敲入iPSC产生了功能增强的编辑的iNK。

本实施例描述了使用本文所描述的基因编辑方法产生适合于癌细胞杀伤的修饰的免疫细胞。

使用图3A、3B和3C中所示以及实施例2中所描述的示例性系统编辑PSC。简言之，使用含有AsCpf1(AsCas12a，SEQ ID NO：62)和向导RNA(RSQ22337；SEQ ID NO：95)的RNP靶向iPSC中的GAPDH基因，从而导致朝向GAPDH的最后一个外显子(外显子9)的5'端的双链断裂。根据已知的方法，通过核糖核蛋白(RNP)的核转染(电穿孔)，将CRISPR/Cas核酸酶和向导RNA引入细胞。细胞还与双链DNA供体模板(dsDNA质粒)接触，所述双链DNA供体模板包括供体模板，所述供体模板以5'至3'顺序包含约500bp长的5'同源臂(包含外显子8的3'部分、内含子8和外显子9的5'密码子-优化的编码部分，其优化以防止向导RNA(RSQ22337)的gRNA靶向结构域序列的进一步结合)、编码P2A自切割肽的框内序列(“P2A”)、如图32所示的mbIL-15的框内编码序列(“货物”)(SEQ ID NO：172)、终止密码子和多聚A信号序列以及约500bp长的3'同源臂(包含外显子9的编码部分(包括终止密码子)、外显子9的3'非编码外显子区和下游基因间序列的一部分)(如图3B所示)。设计侧接供体模板的货物编码序列的5'和3'同源臂以对应于位于细胞基因组中的内源终止密码子的两侧的序列。

使用本文所描述的选择系统，将货物基因mbIL-15(如图26所示)高效成功整合到iPSC的GAPDH基因中(参见实施例12)。图25显示在以4μM的浓度使用包含(RSQ22337)和Cas12a的RNP并以5μg使用编码mbIL-15的dsDNA质粒(PLA1632；包含供体模板SEQ ID NO：45)转化的iPSC中，在电穿孔后第0天，mbIL-15编码“货物”在GAPDH中的效率。核转染后约7天，提取基因组DNA。在基因组DNA提取后，实施ddPCR。

然后，将整体编辑的mbIL-15 KI iPSC细胞的两个不同的群体分化为iNK细胞，并且在iNK分化过程的第28天使用ddPCR测量TI率。图27显示这些编辑的iNK细胞群体的TI整合率在10-15％的范围内。尽管当与iPSC电穿孔后第0天时的TI相比时，iNK群体中的TI率降低，但是这些细胞群体内的TI整合水平仍很显著。在分化开始后第32天，实施流式细胞术以确定这些编辑的iNK细胞群体中表达CD56和外源IL-15Rα的细胞比例(参见图28A)。还在这些编辑的iNK细胞群体中确定了CD56和CD16共表达水平(参见图28B)。还在分化开始后的第32天、第39天、第42天和第49天，通过流式细胞术对于分化标志物分析整体编辑的mbIL-15KI细胞群体(参见图28C)。

在从编辑的iPSC向iNK分化开始后的第39天，在如实施例11所述和如图20所示的3D球形体杀伤测定中对细胞攻毒。使用这种测定，测量了从在GAPDH基因处包含mbIL-15敲入的iPSC分化的iNK的细胞毒性(参见图30A)。在存在或不存在5ng/mL外源IL-15的情况下测试细胞。如表18和图30A所示，当与分化为iNK的未编辑的亲代细胞(“WT”PCS，1和2)相比时，mbIL-15 KI iNK细胞(Mb IL-15 S1和Mb IL-15 S2群体)显示出更有效的肿瘤细胞杀伤。值得注意的，相对于在不存在内源IL-15的情况下，处于较低E：T比的WT iNK细胞，mbIL-15 KI iNK细胞在不存在外源IL-15的情况下显示出更好的肿瘤细胞杀伤。当在存在相同浓度的外源IL-15的情况下与未编辑的WT iNK细胞相比时，mbIL-15 KI iNK细胞在存在低浓度的外源IL-15(5ng/mL)的情况下还显示出更好的肿瘤细胞杀伤。另外，以较高的E：T比，不添加外源IL-15时，mbIL-15 KI iNK的表现优于WT iNK(参见图30B)。在分化开始后的第42天和第49天对mbIL-15 KI iNK和对照细胞，并且在第56天和第63天仅对测试细胞重复上述3D球形体杀伤测定，分别在图30C和30D中显示了在存在或不存在5ng/mL IL-15的情况下这些测定的结果。这些结果支持以下结论：在不存在或存在外源IL-15的情况下，mbIL-15 KIiNK持续并辅助肿瘤细胞杀伤。

另外，在分化后期(对于组1(S1)分化开始后第63天并且对于组2(S2)分化开始后第56天)，在如以上所描述的3D球形体杀伤测定中对mbIL-15 KI iNK细胞攻毒。在存在或不存在10μg/ml赫塞汀和/或5ng/mL外源IL-15的情况下测试细胞。如表19和图31A-31D中所示，mbIL-15 KI iNK细胞显示出高肿瘤细胞杀伤效率，特别是当与抗体疗法联合时。在第63天，所有mbIL-15 KI iNK细胞不表达可检测水平的IL-15Ra；在第56天，仅一种mbIL-15 KIiNK细胞系(Mb IL-15 S2 R2)表达可检测水平的IL-15Ra(数据未显示)。

图32中显示了mbIL-15 KI iNK和对照WT iNK细胞的某些3D球形体杀伤测定的累加结果。在GAPDH基因处包含mbIL-15敲入的两个独立的整体编辑的iPSC群体(组1(S1)和组2(S2))分化为iNK细胞(对于组1，iPSC分化的第39和49天，并且对于组2，iPSC分化的第42天)。当在不存在外源IL-15的情况下与分化的WT亲代细胞iNK相比时，这些iNK细胞显著降低肿瘤细胞球形体尺寸(P＝0.034，+/-标准偏差，非配对t检验)。当与在存在5ng/mL外源IL-15的情况下的分化的WT亲代细胞相比时，分化的敲入mbIL-15iNK细胞还倾向于显著降低肿瘤细胞球形体尺寸(P＝0.052，+/-标准偏差，非配对t检验)。这些结果显示与未编辑的iNK细胞群体相比，在不存在外源添加的IL-15的情况下，使用本文所描述的方法在GAPDH基因座处包含mbIL-15敲入的iNK细胞群体在杀伤肿瘤细胞中表现更好。

表18：通过IL-15的mbIL-15 KI iNK 3D球形体杀伤

细胞系	通过0ng/mL IL-15的EC50	通过5ng/mL IL-15的EC50
			Mb IL-15 S1	9.575	1.648
Mb-IL-15 S2	11.05	1.646
			WT iNK(PCS)1	20.71	4.378
WT iNK(PCS)2	20.99	3.213

表19：通过赫塞汀和/或IL-15的mbIL-15 KI iNK 3D球形体杀伤

另外，在分化后期(对于组1(S1)分化开始后第63天并且对于组2(S2)分化开始后第56天)，用血液学癌细胞(例如，Raji细胞)对mbIL-15 KI iNK细胞攻毒。在存在或不存在10μg/ml利妥昔单抗的情况下，测试mbIL-15 KI NK细胞(S1和S2)的两个生物学重复群体。如图29所示，mbIL-15 KI iNK细胞显示出高肿瘤细胞杀伤效率，特别是当与抗体疗法联合时。这些细胞的这种杀伤能力是显著的，如Raji细胞天然耐受NK细胞，但是与抗体联合的mbIL-15 KI iNK细胞能够发现并杀伤这些细胞。

实施例14：多顺反子CD16、IL-15和/或IL-15Rα序列在适合的必需基因的基因座处的敲入

如以上实施例2中所述，可以使用本文所描述的方法作为货物序列将所关心的基因(GOI)整合到适合的必需基因的基因座。在某些实施方式中，可以将多个GOI合并到双顺反子或多顺反子敲入货物序列中。图33A显示了包含用于在GAPDH基因处的包含IL-15肽序列、IL-15Rα肽序列和GFP肽序列(分别如SEQ ID NO：187、189和195)的靶向整合的双顺反子敲入货物序列的PLA1829(包含供体模板SEQ ID NO：208)的一部分。通过P2A序列将这些肽序列中的每一个隔开。图33B中显示了包含用于在GAPDH基因处的包含CD16肽序列、IL-15肽序列和IL-15Rα肽序列(分别如SEQ ID NO：184、187和189)的靶向整合的多顺反子敲入货物序列的PLA1832(包含供体模板SEQ ID NO：209)的一部分。通过P2A序列将这些肽序列中的每一个隔开。图33C中显示了包含用于在GAPDH基因处的包含通过P2A序列隔开的CD16肽序列和mbIL-15肽序列(如图26中所示的融合至IL-15Rα序列的IL-15序列)(分别如SEQ IDNO：184和190)的靶向整合的双顺反子敲入货物序列的PLA1834(包含供体模板SEQ ID NO：212)的一部分。

图33A-33C中所描述的敲入货物序列分别包含在质粒1829、1832和1834内(包含供体模板SEQ ID NO：208、209和212)。使用图3A、3B和3C中所示以及实施例2中所描述的示例性系统编辑PSC。简言之，使用AsCpf1(AsCas12a(SEQ ID NO：62))和向导RNA(RSQ22337)(SEQ ID NO：95)靶向iPSC中的GAPDH基因，从而导致朝向GAPDH的最后一个外显子(外显子9)的5'端的双链断裂。根据已知的方法，通过核糖核蛋白(RNP)的核转染(电穿孔)，引入CRISPR/Cas核酸酶和向导RNA。细胞还与双链DNA供体模板(dsDNA质粒(分别为PLA1829、PLA1832或PLA1834))接触，所述双链DNA供体模板包括供体模板(SEQ ID NO：208、209和212)，其以5'至3'顺序包含：长度约500bp的5'同源臂(包含外显子8的3'部分、内含子8和优化以防止向导RNA(RSQ22337)的gRNA靶向结构域序列的进一步结合的外显子9的5'密码子优化的编码部分)、编码P2A自切割肽的框内序列(“P2A”)、如以上所描述的框内编码序列(“货物”)、终止密码子和多聚A信号序列，和长度约500bp的3'同源臂(包含包括终止密码子的外显子9的编码部分、外显子9的3'非编码外显子区和下游基因间序列的一部分)(如图3B所示)。实施4个独特的核转染事件(对应于RNP和PLA1829、RNP和PLA1832、RNP和PLA1834以及没有质粒对照的RNP)并以克隆密度将细胞铺板。增殖集落以用于使用ddPCR的TI分析。

在TI后，在转化后7天，使用流式细胞术分析具有PLA1829、PLA1832或PLA1834货物序列的KI的转化的iPSC(编辑的克隆)或者用单独的RNP转化的对照WT亲代细胞(参见图34A和34B)。在整体编辑的iPSC群体中测量GFP和IL-15Rα的表达水平。如图34A所示，约57％的用PLA1829转化的细胞表达IL-15Rα和GFP两者，而对照细胞无GFP表达并且具有约14.4％的IL-15Rα表达水平。如图34B所示，约33.1％的用PLA1832转化的细胞和约57.2％的用PLA1834转化的细胞表达IL-15Rα；如所期望的，这些细胞群体无一显示出明显的GFP水平，因为相应供体模板不包含GFP。这些货物蛋白的表达可以用作确定成功转化、编辑和/或整合的代表。

图35A-35C显示了分别用PLA1829、PLA1832或PLA1834(包含供体模板SEQ ID NO：208、209和212)转化的集落中的24个的基因型并与野生型细胞相比较。通过ddPCR测量，将具有～85-100％ TI的细胞分类为纯合的，将40-60％分类为杂合的，而将具有极低或无信号的那些分类为野生型。转化后增殖集落，然后使用本领域中已知的旋转胚状体法将细胞群体分化为iNK细胞。图36A-36D中显示了iNK分化过程第32天时，测量表达IL-15Rα和/或CD16的细胞百分比的示例性流式细胞术结果，以及IL-15Rα和/或CD16的中值荧光强度(MFI)。如图36A所示，用PLA1829、PLA1832或PLA1834的转化使得IL-15Rα能够在杂合或纯合集落中以显著高于从对照WT亲代细胞分化的iNK的比例表面表达。如图36B所示，用PLA1832或PLA1834的转化使得CD16能够在杂合或纯合集落中以显著高于从对照WT亲代细胞分化的iNK的比例表面表达，因为用PLA1829货物序列转化的细胞不包含CD16货物序列。如图36C所示，当与从对照WT亲代细胞分化的iNK或者用PLA1829或PLA1832转化的细胞相比时，用PLA1834的转化使得在杂合或纯合集落中IL-15Rα的MFI更高。如图36D所示，用PLA1832或PLA1834的转化使得CD16能够在杂合或纯合集落中表面表达。这些数据显示本文所描述的方法可以用于将含有多个所关心的基因的多顺反子货物敲入必需基因，如GAPDH，从而导致所关心的基因在编辑的细胞中表达。这些数据还清楚地证实了从GAPDH基因座的货物表达的组成型性质。

还在乳酸脱氢酶(LDH)杀伤测定中使用了分化的iNK细胞，并且在细胞毒性测定前后通过流式细胞术评价了iNK细胞的CD16表面表达(E：T比为1或2.5)。如图36F所示(E：T比为2.5)，在不存在曲妥珠单抗(赫塞汀)的情况下，WT细胞和用PLA1829转化的细胞(无CD16KI)显示在LDH测定中在与SK-OV-3细胞接触后CD16的表面水平表达轻微降低，而用PLA1834转化的细胞(并因此具有CD16 KI)显示最小的减少。在存在曲妥珠单抗的情况下，用PLA1834转化的细胞证实了在LDH测定中在与SK-OV-3细胞接触后，CD16水平类似的最小降低；然而，在LDH测定中在与SK-OV-3细胞接触后，对于WT细胞和用PLA1829转化的细胞(无CD16 KI)观察到CD16表面表达的显著差异(图36G，E：T比为2.5)。进一步的实验重复确认在不存在或存在曲妥珠单抗的情况下，在LDH测定中在与SK-OV-3细胞接触后，用PLA1834转化的细胞的纯合集落基本维持了CD16的表面表达，然而未编辑的(WT)亲代细胞显示在与SK-OV-3细胞接触后，CD16表面表达显著降低(图36H)。整体上，结果显示可切割的CD16构建体在GAPDH的KI可以在KI iNK细胞中导致高水平的CD16表面表达，并且在它们接触肿瘤细胞后，存在来自CD16 KI iNK细胞的最小CD16下降。另外，如图36I所示，在LDH测定中，在存在和不存在曲妥珠单抗的情况下，以1和2.5的E：T比，纯合PLA1834-转化的iNK细胞显示出比未编辑的(WT)iNK细胞更大的细胞毒性。

另外，如实施例11所述并且如图20所示意的，在3D肿瘤球形体杀伤测定中使用了分化的iNK细胞(未编辑的(WT)细胞)和PLA1834-转化的(CD16^+/+/mbIL-15^+/+)细胞的纯合集落。以10的E：T比并且在不存在或存在10μg/ml曲妥珠单抗的情况下，测试细胞100小时。在不使用或使用曲妥珠单抗的情况下，CD16^+/+/mbIL-15^+/+iNK细胞引起了比未编辑的iNK细胞更大的肿瘤球形体尺寸减小(图37B)。如图37C所示，在存在10μg/ml曲妥珠单抗和5ng/ml外源IL-15的情况下，在整个E：T比的范围内，与未编辑的iNK细胞或周围血液NK细胞相比，CD16^+/+/mbIL-15^+/+iNK细胞在3D肿瘤球体测定中显示出增强的细胞毒性。在不存在或存在曲妥珠单抗的情况下，CD16^+/+/mbIL-15^+/+iNK细胞的平均IC50(如经由E：T比所测量的)显著小于未编辑的iNK细胞(图37C)。在存在或不存在曲妥珠单抗的情况下或者在存在曲妥珠单抗和外源IL-15的组合的情况下，与未编辑的(WT)iNK细胞相比，这些3D肿瘤球形体杀伤测定结果进一步确认CD16^+/+/mbIL-15^+/+(纯合PLA1834-转化的)iNK细胞证实了更大的肿瘤细胞的细胞毒性并且在肿瘤细胞杀伤方面更有效。

在无稳态细胞因子(homeostatic cytokines)的支持的情况下，膜结合的IL-15还介导了持续的一段时间的iNK细胞存活。在分化后第43天开始，在不存在IL-2或IL-15的情况下，将iNK细胞维持3周。如图36J所示，与WT细胞相反，用PLA1834转化的iNK细胞的总数(杂合子和纯合子KI细胞)在3周测定内保持稳定。这些数据显示用PLA1834转化的细胞证实了在不存在细胞因子的情况下，与WT细胞相比以及与用PLA1829转化的细胞相比的优良持久性。

实施例15：适合的必需基因的基因座处的双顺反子CD16和mbIL-15序列的体内测定

如实施例14所述，将质粒PLA1834用于产生包含mbIL-15/CD16双敲入(DKI)的iPSC-来源的NK(iNK)细胞。从这些mbIL-15/CD16 DKI iNK细胞，选择3个纯合(CD16^+/+/mbIL-15^+/+)克隆(A2、A4、C4)在体外乳酸脱氢酶(LDH)释放测定中进行测试以评价细胞对于SK-OV-3肿瘤细胞的细胞毒性，如实施例14所述。还测试了未编辑的(WT)iNK细胞对照。在存在和不存在10μg/ml曲妥珠单抗的情况下并且以E：T比为1测试细胞。如图38A所示，mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞证实与不存在曲妥珠单抗的情况下所观察到的平均细胞毒性百分比相比，在存在曲妥珠单抗的情况下，平均细胞毒性百分比显著升高，从而确认实施例14中所描述的这些细胞的有效体外肿瘤杀伤活性。还通过流式细胞术检验了mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞的CD16表达。将未编辑的(WT)或DKI iNK细胞(克隆A2和A4)样品对活hCD45+细胞预设门，然后检验CD56和CD16表达。如图38B所示，WT和DKI iNK细胞是高纯度的CD56+NK细胞。此外，mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞的两个克隆具有约100％的表达高水平CD16的细胞，而约一半的WT iNK细胞表达CD16。

在LDH测定中确认细胞毒性并确认高CD16表达后，在体内小鼠模型中测定了mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞杀伤肿瘤靶标的能力。图38C显示了测定的示意图。对小鼠接种0.25×10⁶个工程化以表达荧光素酶的SK-OV-3细胞(SKOV3-luc)。在允许建立肿瘤的2-6天后，使用体内成像系统(IVIS)对小鼠成像以建立预处理(第-1天)肿瘤负荷，然后随机分为处理组。在另外1天(第0天)后，对小鼠腹膜内注射(IP)2×10⁶(2M)或5×10⁶(5M)个mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞+2.5mpk曲妥珠单抗、单独的2.5mpk曲妥珠单抗、同种型对照或者媒介物对照。如图38C所示，一个处理组(注射5M mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞的小鼠)在第35天接受另外剂量的曲妥珠单抗，并且另一处理组(注射2M mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞的小鼠)在第21、28和35天接受另外剂量的曲妥珠单抗。在第0天后，使用IVIS每周对小鼠成像以评价随时间的肿瘤负荷。跟踪小鼠长达90天。

如通过经由IVIS的生物发光成像(BLI)所测量的，在图38D中显示了随时间的平均肿瘤负荷，并且图38E中显示了随时间的存活百分比。图38F显示了多个时间点处小鼠的代表性生物发光成像。剂量施用2×10⁶个mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞结合曲妥珠单抗(2M DKI iNK+Tras)的小鼠显示出完全肿瘤清除(图38D和38F)和延长的存活(图38E)。相反，用单独的曲妥珠单抗或者用同种型对照处理的小鼠显示出更高的肿瘤负荷和降低的存活。这些数据证实mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞在体内模型中主动杀伤肿瘤细胞并且使用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞和曲妥珠单抗两者处理导致了比单独剂量施用曲妥珠单抗更好的结果(例如，延长的存活，显著更大的肿瘤清除)。

剂量施用5×10⁶个mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞结合曲妥珠单抗(5M DKI iNK+Tras)的小鼠到第14天显示出肿瘤负荷的显著降低，然后是肿瘤负荷增加(图38D和38F)。在第90天处死该小鼠后，发现了位于皮下而非如实验预期的位于腹膜腔中的反弹的肿瘤。因此，腹膜内注射的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞可能不能以与其它处理组中施用于小鼠的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞相同的程度接近肿瘤。通过腹腔灌洗液的流式细胞术分析确认了剂量施用5×10⁶个DKI iNK细胞+曲妥珠单抗的小鼠的腹膜腔中的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞的存在(图38G，顶行)。此外，mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞表达高水平的CD56和CD16，其中在第90天，100％的细胞表达高水平的CD16(图38G，顶部右侧图版)。因此，由于mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞的丧失，该小鼠中反弹的肿瘤的存在是不可能的。在第118天处死剂量施用2×10⁶个mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞+曲妥珠单抗的小鼠，并且通过腹腔灌洗液的流式细胞术分析确认了小鼠腹膜腔中mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞的存在(图38G，底行)。这些细胞表达高水平的CD56和CD16，其中在第118天92％的细胞表达高水平的CD16(图38G，底部右侧图版)。

图38G证实与短寿命的健康供体-来源的WT NK细胞相比，mbIL-15的敲入延长了iNK细胞的体内持久性(数据未显示)。此外，由于CD16的敲入(如实施例14所述)，mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞继续在细胞表面上表达高水平的CD16，从而表明它们保留了在存在治疗性抗体(如曲妥珠单抗)的情况下ADCC介导的肿瘤杀伤能力。

这些数据证实mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞能够体内持续并维持高CD16表达达到至少118天。考虑到据报道未编辑的NK细胞具有有限的持久性，这是值得注意的(参见，例如，Romee等人,Sci.Trans.Med.8:357ra123357ra123(2016))。

如图39A所示，在体内小鼠模型中实施了mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKIiNK细胞的进一步测试。小鼠接种0.25×10⁶个SKOV3-luc细胞。在允许建立肿瘤的2-6天后，使用IVIS对小鼠成像以建立预处理(第-1天)肿瘤负荷，然后随机分为处理组。在另外1天(第0天)后，对小鼠腹膜内注射(IP)5×10⁶个未编辑的(WT)iNK细胞、5×10⁶个mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞(来自克隆A2或A4)或者对于单独的曲妥珠单抗或同种型对照无iNK细胞。一个处理组(“+Tras.×1”、“TRA×1”)在第0天接受2.5mpk曲妥珠单抗的IP注射。另一处理组(“+Tras.×3”、“+TRA×3”)在第0、7和14天接受2.5mpk曲妥珠单抗的IP注射。在第0天后，使用IVIS每周对小鼠成像以评价随时间的肿瘤负荷。

在图39B、39C和39E中显示了如通过经由IVIS的生物发光成像(BLI)所测量的随时间的肿瘤负荷。图39G显示了多个时间点处小鼠的代表性生物发光成像。如图39B所示，用单独的未编辑的(WT)iNK细胞或者mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞处理不导致体内肿瘤减少。然而，用iNK细胞结合曲妥珠单抗处理的小鼠显示出比用单独的曲妥珠单抗处理的小鼠更大的肿瘤减小，无论是作为单剂量(图39C)还是作为多剂量方案(参见图39E)施用曲妥珠单抗。此外，在iNK细胞引入后至少144天观察到肿瘤负荷减少(图39E)。如图39G所示，在第33天测量时，与未编辑的(WT)iNK细胞相比，mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞导致显著更大的体内肿瘤减小。对于两种不同的mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI克隆(A2和A4)结合单剂量的曲妥珠单抗，或者对于克隆A2结合多剂量方案的曲妥珠单抗观察到了这种情况。此外，早至至少第11天或晚至至少第54天，与未编辑的iNK细胞结合单剂量的曲妥珠单抗或者单独的曲妥珠单抗相比，用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞结合单剂量的曲妥珠单抗处理导致了相助更大的体内肿瘤减小。

与用单独的曲妥珠单抗处理的小鼠相比，用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞结合曲妥珠单抗处理的小鼠显示出显著延长的存活(图39D和39F)。另外，与用未编辑的(WT)iNK细胞处理的小鼠相比，用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞处理的小鼠也显示出显著延长的存活(图39F)。如图39I所示，用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞结合曲妥珠单抗处理导致多个动物中肿瘤完全清除，其中50％(4/8)的小鼠在用DKI iNK细胞结合多剂量曲妥珠单抗处理后的第40天无肿瘤。通过BLI的持续监测显示在第144天，75％(6/8)的用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞结合曲妥珠单抗(×3)处理的小鼠显示无可检测的肿瘤(例如，是无肿瘤的)。此外，小鼠肺组织中靶向Her2(SKOV3细胞上表达的肿瘤抗原)的组织学分析显示与未编辑的iNK细胞相比，mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞导致转移降低并且在86％的小鼠中完全抑制肿瘤转移，相比之下未编辑的iNK细胞中仅14％(数据未显示)。这些结果确认mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞易于体内杀伤肿瘤细胞并且证实mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞结合曲妥珠单抗产生了比单独用曲妥珠单抗或用未编辑的(WT)iNK细胞结合曲妥珠单抗的处理更大的体内肿瘤减小。

图39J证实与短寿命的WT NK细胞相比，mbIL-15在必需基因(GAPDH基因座)处的敲入延长了iNK细胞的体内持久性。此外，由于CD16在GAPDH基因座处的敲入，mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞继续在细胞表面上表达高水平的CD16(如实施例14所述；图39J的底部右侧图)，从而表明它们保留了在存在治疗性抗体(如曲妥珠单抗)的情况下ADCC介导的肿瘤杀伤能力。同时，在第144天WT iNK细胞是不可检测的(图39J的顶部左侧图和顶部右侧图)。这些数据证实mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞能够体内持续并维持高CD16表达达到至少144天。考虑到据报道未编辑的NK细胞具有有限的持久性，这是值得注意的(参见，例如，Romee等人,Sci.Trans.Med.8:357ra123357ra123(2016))。

实施例16：通过必需基因敲入对适合于选择的AsCpf1向导RNA的计算筛选

本实施例描述了对于靶向几个必需管家基因的适合于本文所描述的方法的AsCpf1(AsCas12a；例如，如通过SEQ ID NO：62所表示的)向导RNA(gRNA)的计算筛选方法。表20中总结了这种筛选的结果，这些gRNA有助于所列必需基因的DNA编码序列的最后500bp内的Cas12a切割。

在通过合并Eisenberg等人(参见，例如，Eisenberg and Levanon,Humanhousekeeping genes,revisited.Trends Genetics,2014)中所描述的必需基因和Yilmaz等人(参见，例如，Yilmaz等人,Defining essential genes for human pluripotent stemcells by CRISPR-Cas9screening in haploid cells.Nature Cell Biology,2018)中所描述的基因所制备的必需基因混合池中识别了对于该分析所选择的表20中的必需基因。简言之，将Yilmaz等人中所描述的必需基因(CRISPR得分小于0且FDR<0.05)与Eisenberg&Levanon中所描述的必需基因合并以产生总计4,582个基因的列表。然后，通过它们的平均表达水平(不同组织间的平均归一化表达，参见，例如，通过https://www.proteinatlas.org/download/rna_tissue_consensus.tsv.zip所提供的RNA共有组织基因表达数据)对这些基因进行分类，并且选择组织间平均表达水平最高的100个基因进行分析。在该组基因内存在GAPDH。将TBP、E2F4、G6PD和KIF11加入至该组，从而使得基因总计达到104个，以用于进一步分析。

通过用定位至代表性编码区(mRNA-201)的适合的前间隔序列对核酸酶特异的PAM进行搜索，产生了每个所关心的基因的潜在gRNA靶标序列。将其名称后带有“-201”的转录本选择作为每个基因的代表(例如，GAPDH-201)。基因信息(即，编码区)得自GENCODE v.37基因注释GTF文件。首先在人参考基因组(hg38)中在靶标基因的基因组区域内搜索潜在的gRNA，并且将在代表性编码区的终止位点的500bp内具有它们的切割位点的那些所识别的gRNA选择用于进一步分析。然后，用BWA Aln(最大错配容许限度-n 2)将候选gRNA与人参考基因组(例如，hg38)进行比对。过滤掉具有潜在脱靶结合位点的向导(即与多个基因组区域进行比对；图谱定位质量MAPQ<30)。所得的gRNA靶向代表性终止密码子的500个编码碱基对内的高度和/或广泛表达的必需基因并且没有在人基因组中注释的相同的脱靶结合位点。因此，它们是用于本文所描述的选择方法的优良候选gRNA。

/>

实施例17：通过必需基因敲入对用于选择的向导RNA的计算筛选

本实施例描述了在本文中只要RNA-导向的核酸酶显示出高切割效率，使用对于不同的RNA-导向的核酸酶及其变体(例如，Cas12a的变体，如Mad7)相关的选择方法，对于更可能适合于在靶向必需基因中使用的gRNA的计算筛选方法。选择靶向以上实施例所述的必需基因(GAPDH、TBP、E2F4、G6PD和KIF11)的Cas12b、Cas12e、Mad7和SpyCas9 gRNA进行该分析，但是也可以应用类似方法以识别其它必需基因中这些RNA-导向的核酸酶的gRNA。表21-25中总结了这种筛选的结果，这些gRNA有助于所列必需基因的编码序列的最后500bp内的DNA切割。

通过用定位至代表性编码区(mRNA-201)的适合的前间隔序列搜索核酸酶特异的PAM(对于Cas12b、Cas12e、CasΦ、Mad7和SpyCas9，分别为ATTN、TTCN、TTN、TTN和NGG)产生了该分析中每种必需基因(GAPDH、TBP、E2F4、G6PD和KIF11)的潜在靶标序列。将其名称后带有“-201”的转录本选择作为每个基因的代表(例如，GAPDH-201)。基因信息(即，编码区)得自GENCODE v.37基因注释GTF文件。首先在人参考基因组(hg38)中在靶标基因的基因组区域内搜索潜在的gRNA，并且将在代表性编码区的终止位点的500bp内具有它们的切割位点的那些所识别的gRNA选择用于进一步分析。然后，用BWA Aln(最大错配容许限度-n 2)将候选gRNA与人参考基因组(例如，hg38)进行比对。过滤掉具有潜在脱靶结合位点的向导(即与多个基因组区域进行比对；图谱定位质量MAPQ<30)。所得的gRNA靶向代表性终止密码子的500个编码碱基对内的必需基因并且没有在人基因组中注释的相同的脱靶结合位点。因此，表21-25中对应于SEQ ID NO：8890-18850的gRNA表示将本文所描述的选择方法应用于GAPDH、TBP、E2F4、G6PD和KIF11的优良候选gRNA。

/>

实施例18：使用Cas12a产生编辑的iPSC细胞并测试活化素A对多潜能性的影响

为了从多潜能干细胞产生自然杀伤细胞，产生了代表性诱导性多能干细胞(iPSC)并表示为“PCS-201”。通过使用可商购的非修饰的RNA重编程试剂盒(Stemgent/Reprocell,USA)对购自ATCC的成年男性人原代皮肤成纤维细胞(PCS-201-012)重编程产生了该细胞系。该重编程试剂盒含有具有免疫逃避mRNA(E3、K3和B18R)和来自302/367簇的双链微小RNA(miRNA)的非修饰的重编程mRNA(OCT4、SOX2、KLF4、cMYC、NANOG和LIN28)。将成纤维细胞接种到成纤维细胞扩增培养基中(具有10％ FBS的DMEM/F12)。第二天，将培养基转换为Nutristem培养基并且每天进行过夜转染，进行4天(第1天至第4天)。在第7天出现原代iPSC集落并在第10至14天挑取。将挑取的集落克隆扩增以实现足够的细胞数目以建立主细胞库。选自该方法并且用于后续实验的亲代细胞系通过标准质量控制，其包括干性标志物表达、正常染色体组型和多潜能性的确认。

为了产生编辑的iPSC细胞，用设计以在所关心的靶标基因处切割的Cas12a RNP电穿孔PCS-201(PCS)细胞。简要地，在用ROCK抑制剂(Y27632)转染之前处理细胞24小时。在转染当天，使用accutase产生单细胞溶液并将500,000个PCS iPS细胞在适当的电穿孔缓冲液和最终浓度2μM的Cas12a RNP中再混悬。当同时添加两种RNP时，总RNP浓度为4μM(2+2)。使用Lonza 4D电转化仪系统对该溶液电穿孔。电穿孔后，将细胞在6-孔板中在含有CloneR(Stemcell Technologies)的mTESR培养基中铺板。使细胞生长3-5天，每天更换培养基，并在电穿孔后48小时从培养基除去CloneR。为了挑取单个集落，在将它们在单细胞混悬液中再混悬后，将扩增的细胞以低密度在10cm板中铺板。在铺板后，基于板上集落的尺寸，将Rock抑制剂用于在单细胞铺板期间支持细胞3-5天。7-10天后，挑取具有可接受形态的尺寸足够的集落并铺板到24-孔板中。将挑取的集落扩增至足够数目以允许收获基因组DNA用于后续分析和用于细胞系冷冻保存。通过NGS确认编辑并进一步扩增所选的克隆并建库。最终，对所选克隆亚型实施染色体组型分析、干性流(stemness flow)和分化测定。

两种所关心的靶标基因为CISH和TGFβRII，两者均假设增强自然杀伤细胞功能。由于据信TGFβ:TGFβRII通路参与多潜能性的维持，因此假设iPSC中TGFβRII的功能性缺失可以导致分化并防止TGFβRII编辑的iPSC的产生。由于活化素受体信号转导和TGFβRII信号转导在调控SMAD2/3及其它胞内分子中的汇合，因此假设在可商购的多潜能干细胞培养基中，活化素A可以替换TGFβ以产生编辑的细胞系。为了测试这种假设，评价了与活化素A一起生长的未编辑的和TGFβRII编辑的iPSC的多潜能性。使用了一些不同的培养基：“E6”(Essential 6^TM培养基，#A1516401，ThermoFisher)，其缺少TGFβ；“E7”，它是补充有100ng/ml bFGF的E6(Peprotech，#100-18B)；“E8”(Essential 8^TM培养基，#A1517001，ThermoFisher)和“E7+ActA”，它是补充有100ng/ml bFGF和不同浓度的活化素A的E6(Peprotech#120-14P)。通常，E6和E7培养基通常不足以在培养中将PSC的干性和多潜能性维持几次传代。

为了确定活化素A是否可以在不存在外源TGFβ的情况下维持PCS iPSC，将未编辑的PCS iPSC在LaminStem^TM521(Biological Industries)涂覆的6-孔板上铺板并在E6、E7、E8或E7+ActA(具有处于两种不同浓度—1ng/ml和4ng/ml—的活化素A)中培养。2次传代后，评价细胞的形态和干性标志物表达。在倒置显微镜上使用标准相差设置评价形态。将具有iPSC集落典型的明确边缘和非分化的细胞的集落视为干细胞样的。为了确认形态学观察结果，使用胞内流式细胞术测量标准iPS细胞干性标志物的表达。简要地，使用来自Foxp3/转录因子染色缓冲液套装(eBioscience^TM)的试剂和标准规程，将细胞解离，对胞外标志物染色，然后固定过夜并透性化。用抗-人(/>克隆TRA-1-60-R)、抗-人/>(BD Pharmingen^TM；克隆N31-355)和抗-Oct4(Oct3)_PE(克隆3A2A20)对细胞染色以用于流式细胞术分析。在NovoCyte Quanteon流式细胞仪(Agilent)上记录细胞并使用FlowJo(FlowJo,LLC)分析。如图46所示，1ng/mL和4ng/mL的活化素A足以以与E8中生长的细胞相当的干性标志物表达维持多潜能性。如所期望的，E6和E7(缺乏TGFβ)中生长的细胞不能以与E8相同的程度维持干性基因表达，这表明在不存在TGFβ或活化素A的情况下iPSC干性的丧失。这些结果表明活化素A可以在不存在TGFβ信号转导的情况下补充iPSC干性。

考虑到活化素A可以在不存在TGFβ的情况下支持iPSC干性的证实，产生了TGFβRII敲除(“KO”)iPSC、CISH KO iPSC和TGFβRII/CISH双敲除(“DKO”)iPSC细胞系。具体地，使用具有工程化的Cas12a(具有三个氨基酸替换，M537R、F870L和H800A(SEQ ID NO：62))和对CISH或TGFβRII特异的gRNA的RNP编辑iPSC。为了制备CISH/TGFβRII DKO iPSC，同时用靶向CISH的RNP和靶向TGFβRII的RNP处理iPSC。将表26的具体的向导RNA序列用于编辑CISH和TGFβRII。通过由RNA组成的靶向结构域、定位在靶向结构域5'的序列UAAUUUCUACUCUUGUAGAU(SEQ ID NO：1153)的AsCpf1骨架和位于骨架序列5'端的序列ATGTGTTTTTGTCAAAAGACCTTTT(SEQ ID NO：1154)的25-聚体DNA延伸产生了两种向导。

表26：向导RNA序列

如以上所描述的，通过对于用TGFβRII RNP处理的细胞的微小改变，产生了编辑的克隆。简要地，在电穿孔后，在6-孔板阶段，在补充有10ng/ml活化素A的mTESR中将TGFβRII-编辑的PCS iPSC和TGFβRII/CISH编辑的PCS iPSC铺板以支持编辑的克隆的产生。通过细胞集落挑取和早期扩增阶段，用10ng/ml活化素A培养细胞。挑取并扩增(克隆选择)评价为具有正确单KO(CISH KO或者TGFβRII KO)或双KO(CISH/TGFβRII DKO)的集落。

为了确定活化素A用于培养TGFβRII KO和TGFβRII/CISH DKO iPSC的最优浓度，如图41所示，测试了轻微扩大的浓度曲线。与先前进行的评价类似，以1ng/ml、2ng/ml、4ng/ml和10ng/ml活化素A浓度在Matrigel-处理的6-孔板中培养iPSC。如图41所示，在补充有4ng/mL活化素A的E7培养基中培养19天(5代)的TGFβRII KO或者CISH/TGFβRII DKO细胞维持了野生型形态。图42显示了TGFβRII KO PCS-201 hiPSC克隆9的形态。

如图43A所示，同时用CISH和TGFβRII RNP处理的iPSC的初始编辑效率(克隆选择前)较高，其中95％的CISH等位基因被编辑并且78％的TGFβRII等位基因被编辑。未编辑的iPSC对照在任一个基因座不具有插缺。在克隆选择之前，用CISH或TGFβRII RNP处理的iPSC分别显示出93％和82％的编辑率(如图43A所示)。随后，在存在补充性活化素A的情况下培养后，评价了KO细胞系(CISH KO iPSC、TGFβRII KO iPSC和CISH/TGFβRII DKO iPSC)的多潜能性标志物Oct4、SSEA4、Nanog和Tra-1-60的存在。如图43B和44所示，在活化素A中培养KO细胞系维持了这些多潜能性标志物的表达。

然后，如图45中示意性地显示的，使用STEMdiff^TMTrilineage分化试剂盒测定(来自STEMCELL Technologies Inc.,Vancouver,BC,CA)，对在活化素A中培养的KO iPSC细胞系评价了它们的分化能力。如图46A所示，在具有补充性活化素A的培养基中培养单KO(TGFβRII KO iPSC或者CISH KO iPSC)和DKO(TGFβRII/CISH DKO iPSC)细胞系维持了它们分化为具有全部3个胚层的早期祖细胞的能力，如通过外胚层(OTX2)、中胚层(brachyury)和内胚层(GATA4)标志物的表达所示(图46A)。未编辑的PCS对照细胞也能够表达这些标志物中的每一种。

然后，对编辑的iPSC进行染色体组型分析以确定Cas12a编辑是否引起大的遗传异常，如易位。如图46B所示，细胞具有正常的染色体组型，在切割位点之间无易位。

为了进一步支持以上所描述的结果，对未编辑的亲代PSC细胞系、编辑的TGFβRIIKO iPSC克隆(C7)和表示为RUCDR的其它代表性(未编辑的)细胞系(RUCDR InfiniteBiologics group,Piscaway NJ)实施扩大的活化素A浓度曲线。一开始，将iPSC以1e5个细胞每孔接种到1×LaminStem^TM521(Biological Industries)涂覆的12-孔板中。然后，使用0.5mM在1×PBS解离中的EDTA和Y-27632(Biological Industries)，使细胞在～40-50天内传代10次直至孔实现>75％的汇合。对于对照，在Essential 6^TM培养基(Gibco)、TeSR^TM-E7^TM和TeSR^TM-E8^TM(StemCell Technologies)中培养细胞，并使用补充有覆盖4-log浓度剂量(0.001-10ng/mL)的大肠杆菌(E.coli)-来源的重组人/鼠/大鼠活化素A(PeproTech)的TeSR^TM-E7^TM滴定。在5和10代后，使用来自Foxp3/转录因子染色缓冲液套装(eBioscience^TM)的试剂和标准规程，将细胞解离，然后固定过夜并透性化。用抗-人(克隆TRA-1-60-R)、抗Sox2_PerCP-Cy^TM5.5(BD Pharmingen^TM；克隆O30-678)、抗人/>(BD Pharmingen^TM；克隆N31-355)、抗-Oct4(Oct3)_PE(/>克隆3A2A20)和抗-人SSEA-4_PE/Dazzle^TM594(/>克隆MC-813-70)对细胞染色以用于流式细胞术分析。在NovoCyte Quanteon流式细胞仪(Agilent)上记录细胞并使用FlowJo(FlowJo,LLC)分析。图46C显示了测试的iPSC细胞系的滴定曲线。维持每个细胞系所需的活化素A的最小浓度轻微改变，其中与亲代对照相比，TGFβRII KO iPSC需要更高的基线活化素A的量(0.5ng/ml vs 0.1ng/ml)。在全部3个细胞系中，在延长的培养期内，4ng/ml远高于维持干性标志物表达所必需的活化素A的最低量。图46D显示了使用单独的基础培养基(无活化素A)的细胞培养物中的干性标志物表达。如所期望的，在E8中，TGFβRII KO iPSC不能维持表达，而两种未编辑的细胞系能够维持干性标志物表达。

实施例19：编辑的CISH KO、TGFβRII KO和CISH/TGFβRII DKO iPSC向显示出增强的功能的iNK细胞的分化

图47A显示了用于开发用于产生增强的CD56+iNK细胞的CRISPR-Cas12a-编辑的iPSC平台的示例性工作流程的示意图。如图47A所示，在iPSC中经由使用电穿孔的RNP向细胞的递送靶向CISH和TGFβRII基因以产生CISH/TGFβRII DKO iPSC。然后，可以选择在CISH和TGFβRII两基因处具有所期望的编辑的iPSC并扩增以产生主iPSC库。然后，来自iPSC主库的编辑的细胞可以分化为CD56+CISH/TGFβRII DKO iNK细胞。

图47B和47C显示了iPSC向iNK细胞分化的过程的两个示例性示意图。如图47B和47C所示，使用两阶段法分化编辑的细胞(或未编辑的对照细胞)。首先，在“造血分化阶段”，在具有SCF(40ng/mL)、BMP4(20ng/mL)和VEGF(20ng/mL)的StemDiff^TMAPEL2^TM培养基(StemCell Technologies)中从第0-10天培养hiPSC(编辑和未编辑的)以产生旋转拟胚体(SEB)。如图53B所示，然后，在NK细胞分化阶段，从第11-39天，在包含IL-3(5ng/mL，仅在培养的第一周存在)、IL-7(20ng/mL)、IL-15(10ng/mL)、SCF(20ng/mL)和Flt3L(10ng/mL)的StemDiff^TMAPEL2^TM培养基中培养SEB。根据图47B中的示意图，CISH KO iPSC、TGFβRII KOiPSC、CISH/TGFβRII DKO iPSC和未编辑的野生型iPSC细胞系(PCS)分化为iNK，然后鉴定它们以评价它们是否显示出与NK细胞一致的表型(参见图48、49和50A)。使用图47C所示的替代方法，图50B、50C、51B、51C和52中所描述的CISH KO iPSC、TGFβRII KO iPSC、CISH/TGFβRIIDKO iPSC和未编辑的野生型iPSC细胞系也分化为iNK，然后鉴定它们以评价它们是否显示出与NK细胞一致的表型(参见图50B、50C、51B、51C和52)。

具体地，通过流式细胞术评价CISH KO iNK、TGFβRII KO iNK、CISH/TGFβRII DKOiNK的(i)干细胞(CD34)；和(ii)造血细胞(CD43和CD45)的示例性表型标志物。简要地，对于每种基因型，从96-孔板收获两行拟胚体用于染色。一旦使用胰蛋白酶和机械破坏产生单细胞溶液，将细胞对于人标志物CD34、CD45、CD31、CD43、CD235a和CD41进行染色。如图48所示，相对于对照细胞，CISH KO iNK、TGFβRII KO iNK、CISH/TGFβRII DKO iNK和来源于野生型亲代克隆(PCS)的iNK显示出较低水平的CD34，它们是纯化的CD34+HSC。在这些iNK细胞克隆之间，CD34表达水平类似，表明iPSC的编辑不影响向CD34+阶段的分化。图49显示CISH KOiNK、TGFβRII KO iNK、CISH/TGFβRII DKO iNK和来源于野生型亲代克隆(PCS)的iNK对于CD43和CD45显示出类似的表面表达谱。因此，从编辑和未编辑的iPSC分化的iNK对于干细胞和造血细胞显示出类似的标志物水平，并且基于标志物表达谱，分化的编辑和未编辑的细胞两者显示出某些NK细胞表型。

进一步测定CISH KO iNK、TGFβRII KO iNK、CISH/TGFβRII DKO iNK、来源于野生型亲代克隆的iNK(WT)和来源于周围血液的NK细胞(PBNK)以确定NK细胞标志物CD56它们的表面表达。简要地，在分化第39天收获细胞，清洗并在含有识别人CD56、CD16、NKp80、NKG2A、NKG2D、CD335、CD336、CD337、CD94、CD158的抗体的流动染色缓冲液中再混悬。在NovoCyteQuanteon流式细胞仪(Agilent)上记录细胞事件并使用FlowJo(FlowJo,LLC)分析。图50A显示来源于编辑的iPSC的iNK细胞相对于来源于未编辑的iPSC亲代克隆的iNK细胞和PBNK细胞(在培养第39天)显示出类似的CD56+表面表达。图50B显示来源于编辑的iPSC的iNK细胞相对于来源于未编辑的iPSC亲代克隆的iNK(在培养第39天)显示出类似的CD56+和CD16+表面表达。图50C显示来源于编辑的iPSC的iNK细胞相对于来源于未编辑的iPSC亲代克隆的iNK和PBNK细胞(在培养第39天)显示出类似的CD56+、CD54+、KIR+、CD16+、CD94+、NKG2A+、NKG2D+、NCR1+、NCR2+和NCR3+表面表达。

为了确认细胞功能性，在xCelligence平台上使用肿瘤细胞的细胞毒性测定评价细胞。简要地，将肿瘤靶标SK-OV-3肿瘤细胞在96-孔xCelligence板中铺板并生长至最优细胞密度。然后，在存在TGFβ的情况下将iNK以不同的E：T比(1:4、1:2、1:1、2:1、4:1和8:1)添加至肿瘤靶标。图51C显示在存在或不存在TGF-β(以E：T比1:4、1:2、1:1和2:1)的情况下，相对于未编辑的iNK细胞，如通过溶胞百分比所测量的，TGFβRII KO和CISH/TGFβRII DKO细胞更有效地杀死SK-OV-3细胞。

尽管使用图47B中所描述的替代方法所产生的iNK细胞是CD56+并且能够在体外细胞毒性测定中杀伤肿瘤靶标，但是iNK不表达与成熟NK细胞有关的多种典型标志物，如CD16、NKG2A和KIR。K562饲养细胞系通常用于使通过类似分化方法所产生的iNK扩增和成熟。在饲养细胞上扩增后，iNK通常表达指示更成熟表型的CD16、KIR及其它表面标志物。为了识别无饲养细胞方法以实现具有增强功能性的更成熟的iNK，对于第11天至第39天之间的分化阶段测试了替代培养基组成。代替在APEL2中第11天至第39天之间的细胞培养(如图47B所示)，在存在如以上所提及的相同细胞因子的情况下，在具有15％人AB血清的NK培养基(MACS Miltenyi Biotec)中培养旋转拟胚体(SEB)。图47C显示了该规程。为了比较两种培养基组成，将来自WT PCS、TGFβRII KO iPSC、CISH KO iPSC和DKO iPSC的第11天的SEB分成用于分化过程的另一半的两种条件，一种使用APEL2基础培养基，而另一种使用NKMACS+血清基础培养基。在第39天，评价了细胞得率、标志物表达和细胞毒性水平。在所有情况下，NKMACS+血清条件(图47C所示)优于APEL2条件(图47B所示)。图47D显示在39天过程结束时，NKMACS+血清条件获得了更大倍数的扩增(接近300倍扩增vs 100倍扩增)。当通过如以上所描述的流式细胞术分析NK标志物表达时，NKMACS+血清中培养的iNK是34％CD16阳性的并且显示出20％ KIR表达，而APEL2条件获得了对于两种标志物基本为阴性的细胞。对于所有所测试的基因型均为这种情况。为了使标志物相对于时间或条件显像，对流式细胞术数据设门并在FlowJo中分析并构建热图(图47E和47F)。首先，通过对活细胞设门(FSC-H vs.LIVE/DEAD^TMFixable Yellow)，随后对免疫细胞(SSC-A vs.FSC-A)、单细胞(singlets)(FSC-H vs.FSC-A)和自然杀伤细胞群体(CD56 vs.CD45)设门清除样品。对定义为CD45+56+细胞的NK群体设门，并在与柱状图/计数图同义的分析中沿X轴分析每种标志物(CD16+、CD94+、NKG2A+、NKG2D+、CD335+、CD336+、CD337+、NKp80+、panKIR+)。以设置为下列参数的图例：黑色＝0，中等强度30<x<50，最大强度＝100，使用双梯度热图(GraphPadPrism 8)显示上述标志物的统计量。基于该分析，在所有基因型间，通过NKMACS+血清条件改善了表达动力学和幅度。还在如上所述的肿瘤细胞的细胞毒性测定中评价了细胞。在NKMACS+血清条件下所产生的iNK能够以低于APEL2中分化的细胞的E：T比杀伤，这表明改善的NK成熟对细胞功能性具有积极影响(图47G)。

NKMACS+血清中其它分化标志物的分析确认了CD16表达的存在。图50B显示了来源于未编辑的或者DKO iPSC的特定亚群的分析(CD45 vs CD56和CD56 vs CD16)。另外，图50C中未编辑的iNK细胞和CISH/TGFβRII DKO iNK的细胞表面标志物谱确认编辑的iNK细胞的NK细胞标志物谱类似于未编辑的iNK细胞。总体上，这些数据显示如NK细胞标志物所定义的，Cas12a-编辑的单和双KO iPSC克隆以与未编辑的iPSC克隆类似的方式分化为iNK细胞。

另外，在存在1ng/mL或10ng/mL IL-15的情况下培养某些编辑的iNK克隆细胞(CISH单敲除“CISH_C2、C4、C5和C8”、TGFβRII单敲除“TGFβRII-C7”和TGFβRII/CISH双敲除“DKO-C1”)和亲代克隆iNK细胞(“WT”)，并且在hiPSC分化后第25天、第32天和第39天评价分化标志物。如图53所示，10ng/mL IL-15中的表面表达表型(作为群体百分比测量)培养导致了单敲除、双敲除和亲代克隆细胞系中更高比例的表面表达。

使用一定范围的分子和功能分析，对在NK 培养基+血清条件中分化的编辑的iNK细胞体外评价了效应功能。首先，实施蛋白磷酸化流式细胞术测定以确定第39天的iNK细胞中STAT3(pSTAT3)和SMAD2/3(pSMAD2/3)的磷酸化状态。与未编辑的iNK细胞相比，通过IL-15刺激，CISH KO iNK显示出提高的pSTAT3(图50D)，并且通过TGF-β刺激，CISH/TGFβRII DKO iNK显示出降低的pSMAD2/3水平(图50E)。这些数据表明CISH/TGFβRII DKO iNK对IL-15具有提高的敏感性并且对TGF-β介导的免疫抑制具有耐受性。另外，使用佛波醇豆蔻酸酯乙酸酯和离子霉素(PMA/IMN)刺激测定，鉴定了CISH/TGFβRII DKO iNK的IFNγ和TNFα产生。简要地，用2ng/ml PMA和0.125μM离子霉素以及蛋白转运抑制剂处理细胞4小时。收获细胞并使用标准胞内染色规程染色。相对于未编辑的对照iNK，当用PMA/IMN刺激时，CISH/TGFβRII DKO iNK产生了显著更大的量的IFNγ和TFNα，从而提供了刺激后细胞因子产生增强的证据。

为了测试iNK肿瘤细胞杀伤活性，使用了3D实体瘤细胞杀伤测定(图51A中示意性显示)。简要地，通过在96孔超低吸附板中接种5,000个NucLight Red标记的SK-OV-3细胞形成球形体。在添加效应细胞(以不同的E：T比)和10ng/mL TGF-β之前，在37℃培育球形体，随后使用Incucyte S3系统每2小时对球形体成像长达120小时。在添加效应因子时，将所示数据对红色目标强度进行归一化。球形体曲线的归一化维持了与非归一化数据中所观察到的相同的效力模式。使用该测定，将从4种CISH KO iPSC克隆、2种TGFβRII KO iPSC克隆和1种CISH/TGFβRII DKO iPSC克隆分化的iNK的细胞毒性与来源于未编辑的亲代iPSC的对照iNK相比较。如图51B所示，编辑的iNK细胞能够比未编辑的iNK对照细胞更有效地降低SK-OV-3球形体的尺寸(来自6次测定的平均数据)。具体地，在大于0.01的所有E：T比下，CISH/TGFβRII DKO iNK细胞以比未编辑的iNK细胞更大的程度降低SK-OV-3球形体的尺寸，并且在E：T比为1或以上，显著降低。当与未编辑的iNK细胞相比时，TGFβRII KO克隆7iNK也显示出显著增强的杀伤。尽管一些单CISH KO克隆在10:1E：T比未显示出显著的杀伤增强，但是大部分克隆确实显示倾向于提高SK-OV-3球形体细胞杀伤，其中在最高E：T比时差异最大为了进一步阐明编辑的iNK的功能性，在几天的时间段内反复迫使细胞杀伤肿瘤靶标，在本文中将这描述为体外连续杀伤测定。在测定第0天，将10×10⁶个Nalm6肿瘤细胞(B细胞白血病细胞系)和2×10⁵个iNK在存在IL-15(10ng/ml)和TGF-β(10ng/ml)的情况下在96-孔板的每个孔中铺板。以48小时间隔，加入5×10³个Nalm6肿瘤细胞(B细胞白血病细胞系)的丸剂以再次攻毒iNK群体。如图52所示，编辑的iNK细胞(CISH/TGFβRII DKO iNK细胞)显示出用Nalm6肿瘤细胞多次攻毒后对Nalm6细胞的连续杀伤，然而未编辑的iNK细胞在它们的连续杀伤效果方面受限制。数据支持CISH和TGFβRII编辑导致细胞杀伤增强延长的结论。

最终，在体内模型中测定了编辑的iNK细胞(CISH/TGFβRII DKO iNK细胞)杀伤肿瘤靶标的能力。为此，如图54A所示，在测定中使用了所建立的NOD scid gamma(NSG)异种移植模型。简要地，在第0天，腹膜内注射(IP)1×10⁶个工程化以表达荧光素酶的SK-OV-3细胞。在第3天，使用体内成像系统(IVIS)对接种小鼠成像并随机分成3组。第二天(第4天)，通过IP注射施用20×10⁶个未编辑的iNK或CISH/TGFβRIIDKO iNK，而对第三组注射作为对照的媒介物。在用肿瘤细胞接种动物后，每周对动物成像一次以随时间测量肿瘤负荷。图54B显示了3个不同的组(每组中n＝9)：媒介物、未编辑的iNK和CISH/TGFβRII DKO iNK中单个小鼠中肿瘤的生物发光。图54C中显示了这些相同的动物随时间的平均肿瘤负荷。对数据实施双向anova分析，并且当与用未编辑的iNK处理的动物相比时，CISH/TGFβRII DKO iNK处理的动物具有显著较少的肿瘤负荷(p值：0.0004)，如通过生物发光所测量的。到肿瘤植入后的第10天，相对于注射媒介物对照或者未编辑的iNK的小鼠，用CISH/TGFβRII DKO iNK注射的小鼠显示出它们的肿瘤尺寸的显著降低。观察到肿瘤尺寸整体减小数日，并且至少到肿瘤植入后第35天。这些数据显示在该体内模型中编辑的DKO iNK主动杀伤肿瘤细胞。

整体上，这些结果证实未编辑的和CISH/TGFβRII DKO iPSC可以分化为显示出典型NK细胞标志物的iNK细胞。另外，CISH/TGFβRII DKO iNK细胞证实了对来源于实体和血液学恶性肿瘤两者的肿瘤细胞系的增强的抗-肿瘤活性。

实施例20：ADORA2A编辑的iPSC产生了功能增强的编辑的iNK

ADORA2A是另一个所关心的靶标基因，据假设它的失去将影响肿瘤微环境(TME)中的NK细胞功能。ADORA2A基因编码对TME中腺苷起反应的受体，从而导致起作用以驱使对NK细胞的一些抑制作用的cAMP的产生。我们假设ADORA2A功能敲除可以增强iNK细胞功能。使用类似于实施例18和19中所描述的一种方法的方法，使用具有工程化Cas12a(具有三个氨基酸替换，M537R、F870L和H800A(SEQ ID NO：62))和对ADORA2A特异的gRNA的RNP编辑PCSiPSC细胞系(除了将4μM RNP递送至细胞，而不是2μM RNP)。如实施例18所述，通过由RNA组成的靶向结构域、定位在靶向结构域5'的序列UAAUUUCUACUCUUGUAGAU(SEQ ID NO：1153)的AsCpf1骨架和位于骨架序列5'端的序列ATGTGTTTTTGTCAAAAGACCTTTT(SEQ ID NO：1154)的25-聚体DNA延伸产生了gRNA。表27中显示了ADORA2AgRNA序列。

表27：向导RNA序列

如通过下一代测序(NGS)确定的，克隆选择之前通过Cas12a RNP的整体编辑率为49％。尽管如此，识别、扩增并分化了具有两个ADORA2A等位基因编辑的一些克隆。为了确定ADORA2A编辑的iPSC是否可以获得CD45+CD56+iNK，使用如实施例19所述的NKMACS+血清规程分化整体和单一ADORA2AKO克隆(图47C)。如图55A所示，编辑的iPSC分化为与未编辑的对照iPSC相比具有类似的NK细胞标志物表达的iNK。

为了确认Cas12a-介导的ADORA2A编辑导致基因功能性缺失，在编辑和未编辑的对照iNK两者中评价了对用5'-N-乙基酰胺基腺苷(“NECA”，起到ADORA2A激动剂作用的更稳定的腺苷类似物)处理起反应的cAMP积累。相对于具有功能性ADORA2A的细胞，预期具有ADORA2A功能性敲除的编辑的细胞将不会在所述细胞中对NECA起反应积累同样多的cAMP。简要地，用不同浓度的NECA处理iNK细胞15分钟。然后，裂解iNK细胞，然后使用CisBio cAMP试剂盒测量裂解物中的cAMP。如图55B所示，未编辑的iNK将随NECA浓度升高而具有提高的cAMP积累水平(n＝2)。相反，ADORA2A(“A2AKO”)KO iNK显示在逐渐升高的浓度的NECA下最小的cAMP产生，这表明Cas12a-诱导的编辑在功能上敲除了ADORA2A功能。整体iNK(图55B顶部的两个A2AKO iNK细胞系)显示出比所选ADORA2AKO克隆(图55B下方4个A2A KO iNK细胞系)稍微更高的cAMP水平，如根据整体群体中较低的编辑率所期望的。基于该ADORA2A功能性消融的分子证据，将预期iNK在肿瘤微环境中耐受腺苷的抑制作用。

还在如实施例19所述的体外NALM6连续杀伤测定中测试了ADORA2A KO iNK，其中一个主要区别：添加100μM NECA代替TGFβ。在存在NECA的情况下，相对于野生型iNK，ADORA2A KO iNK显示出增强的连续杀伤，这表明ADORA2A KO iNK耐受NECA抑制(图55C)。因此，相对于未编辑的iNK细胞，ADORA2A KO iNK细胞将预期在存在腺苷的情况下对TME中的肿瘤细胞具有改善的细胞毒性。

实施例21：CISH/TGFβRII/ADORA2A三重编辑的(TKO)iPSC的产生和分化的TKO iNK的鉴定

为了产生CISH、TGFβRII和ADORA2A三重编辑的(TKO)iPSC，采取两种方法：1)两步编辑，其中使用ADORA2A靶向RNP(如实施例20所述)经由电穿孔在ADORA2A基因座编辑实施例18和19中所描述的CISH/TGFβRII DKO(CR)iPSC克隆，和2)使用全部3种RNP(一种RNP用于每个靶标基因)同时编辑PCS iPS细胞。两种策略使用了实施例18中简要描述的编辑规程。就同时编辑而言，总RNP浓度为8μM(Cish：2μM+TGFβRII：2μM+ADORA2A：4μM)。不考虑所述方法，如以上所描述的，将细胞铺板，扩增并挑取集落。使用NGS分析从iPSC收获的gDNA，当同时编辑所有靶标基因时，确定对于CISH、TGFβRII和ADORA2A的整体编辑率分别为96.70％、97.17％和90.16％。选择在全部6个等位基因具有插入和/或缺失(插缺)的所挑取的集落用于进一步分析。

类似于实施例18中所描述的分析，使用(图49C中所描述的)NK MACS+血清条件，将未编辑的iPSC和编辑的iPSC分化为iNK，并在不同时间点，包括培养中的第25天、第32天和第39天通过流式细胞术进行评价。如图56A所示，不同NK表面标志物的分析显示通过两步编辑法(CR+A8)或者同时编辑法(CRA6)所产生的克隆之间无大的差异。TKO克隆(CR+A 8和CRA6)两者在每个时间点显示出与未编辑的iNK(Wt)类似的表达谱。当分析TKO iNK细胞它们对NECA的反应性(如实施例20所述)时，两种TKO iNK具有很少至无cAMP积累(图56B)，从而证实功能上敲除了ADORA2A。相反，未编辑的iNK证实了cAMP的NECA剂量依赖性升高(图56B)。这些结果表示TKO iNK将预期在TME中耐受腺苷的抑制作用。最终，在3D肿瘤细胞杀伤测定中与CISH/TGFβRII DKO iNK、ADORA2A单KO(SKO)iNK和未编辑的iNK一起评价了CISH/TGFβRII/ADORA2A TKO iNK。如实施例19所述，使用IL-15和TGFβ，但不使用NECA进行该测定。有趣地，TKO(CRA6)和DKO(CR)iNK两者在肿瘤细胞杀伤中优于未编辑的iNK，这表明两种多路编辑的iNK相对于未编辑的对照细胞具有增强的功能(图56C)。这些结果显示敲除ADORA2A不会不利地影响具有CISH和TGFBRII KO的iNK杀伤肿瘤球形体细胞的能力。

实施例22：靶向CISH、TGFβRII、ADORA2A、TIGIT和NKG2A的gRNA的选择。

进一步测试了CISH、TGFBRII、ADORA2A、TIGIT和NKG2A Cas12a向导RNA的切割效率。通过将商业合成的gRNA与Cas12a体外复合并经由电穿孔将gRNA/Cas12a核糖核蛋白(RNP)递送至iPSC来筛选向导RNA。使用具有工程化Cas12a(具有三个氨基酸替换，M537R、F870L和H800A(SEQ ID NO：62))的RNP编辑iPSC。通过由RNA组成的靶向结构域、定位在靶向结构域5'的序列UAAUUUCUACUCUUGUAGAU(SEQ ID NO：1153)的AsCpf1骨架和位于骨架序列5'端的序列ATGTGTTTTTGTCAAAAGACCTTTT(SEQ ID NO：1154)的25-聚体DNA延伸产生了gRNA。表28提供了测试了编辑活性的向导RNA的靶向结构域。

表28：向导RNA序列

简言之，用所关心的RNP转染100,000个iPSC/孔，将细胞在37℃培育72小时，然后收获用于DNA鉴定。用处于多种浓度的gRNA/Cas12a RNP转染iPSC。对于范围在阴性对照(0mM)至8mM的8个不同的RNP浓度确定百分比编辑事件。

如图57图版1所示，TGFβRII gRNA(SEQ ID NO：1161)显示出～79nM RNP的EC50。如图57图版2所示，CISH gRNA(SEQ ID NO：1162)显示出～50nM RNP的EC50。如图57图版3所示，包括在RNP2960中的ADORA2AgRNA(SEQ ID NO：1163)显示出～63nM RNP的EC50，而包括在RNP3109中的ADORA2A gRNA(SEQ ID NO：1164)或者包括在RNP3108中的gRNA(SEQ ID NO：1165)分别显示出～493nM和～280nM RNP的EC50值。如图57图版4所示，包括在RNP2892中的TIGIT gRNA(SEQ ID NO：1166)显示出～29nM RNP的EC50，而包括在RNP3106中的TIGITgRNA(SEQ ID NO：1167)或者包括在RNP3107中的gRNA(SEQ ID NO：167)分别显示出～1146nM和～40nM RNP的EC50值。如图57图版5所示，包括在RNP19142中的NKG2AgRNA(SEQ IDNO：1169)显示出～8nM RNP的EC50，而包括在RNP3069中的NKG2AgRNA(SEQ ID NO：1170)或者包括在RNP2891中的gRNA(SEQ ID NO：1171)分别显示出～12nM和～13nM RNP的EC50值。

实施例23：使用病毒载体将货物在T细胞中在必需基因的基因座处敲入

本实施例描述了使用病毒载体转导对T细胞群体的基因编辑。编辑后，对细胞进行多种测定，如流式细胞术、ddPCR、下一代测序或功能性肿瘤杀伤测定以确定KO/KI效率和/或效力。

如本领域中已知的，将T细胞在珠浴中融化，并在第2天从所述浴中除去。融化后第4天对细胞电穿孔。简要地，使用多种脉冲码，将Lonza 96-孔比色皿中的250,000个T细胞/孔在缓冲液P2中混悬并且用包含gRNARSQ22337(SEQ ID NO：95)和靶向GAPDH基因的Cas12a(SEQ ID NO：62)的RNP(1μM RNP)或用培养基对照电穿孔。在电穿孔后立即将适当的媒介物加入至细胞并使细胞恢复15分钟。然后，以不同感染复数(MOI)浓度(1E4、1E5或1E6 MOI(vg/细胞))，将包含含有具有GFP、CD19 CAR、B2M-HLA-E货物的敲入盒的供体质粒构建体或载体对照的AAV6病毒颗粒添加至T细胞。如实施例2所述设计供体质粒，其具有优化以防止向导RNA(RSQ22337)的gRNA靶向结构域序列进一步结合的GAPDH外显子9的5'密码子优化编码部分、编码P2A自切割肽的框内序列(“P2A”)、货物序列的框内编码序列(例如，GFP、CD19CAR或B2M-HLA-E)(“货物”)、终止密码子和多聚A信号序列。2天后，拆分T细胞，然后每48小时拆分直至通过流式细胞术分析或另外使用它们。电穿孔后7天使用流式细胞术分选T细胞以确定成功的转导、转化、编辑、敲入盒整合和/或表达事件。极高百分比(94.8％)的细胞表达GFP，从而表明在编辑的T细胞群体中高比例的细胞具有在GAPDH基因处整合的GFP，并且这些编辑的细胞显示出与经历空转化的对照细胞类似的存活力和扩增能力(图17B-17C)。此外，GAPDH基因座处的GFP敲入以显著高于TRAC基因座处的GFP敲入的比率产生了GFP+细胞(图17D)。在一定范围内的AAV6浓度下，观察到了与TRAC基因座处的GFP敲入相比，通过GAPDH基因座处的GFP敲入所产生的GFP+细胞的这种增加(图17E)。这些结果证实必需基因基因座(例如，GAPDH)处的敲入可以实现比在TRAC基因座处的敲入更大的敲入效率，包括在AAV6供体模板的较低浓度下。极高百分比(95.8％)的细胞表达CD19 CAR，从而表明在编辑的T细胞群体中高比例的细胞具有在GAPDH基因处整合的CD19 CAR，并且这些编辑的细胞也显示出与经历空转化的对照细胞类似的存活力和扩增能力(图58A-58C和58H)。另外，极高百分比(大于80％)的细胞表达B2M-HLA-E，这表明在编辑的T细胞群体中高比例的细胞具有在GAPDH基因处整合的B2M-HLA-E。如图58H所示，编辑以包括GFP、CD19 CAR或B2M-HLA-E敲入的T细胞以大于80％的比率表达这些转基因。此外，B2M-HLA-E KI细胞与对照细胞相比表达更高水平的HLA-E并且是活的(参见图59)。

将使用本文所描述的方法所产生的敲入效率与使用本领域中已知的用于将货物敲入靶向非必需基因的本领域中已知的优化方法所产生的敲入效率相比较。简言之，用如本文所描述的包含适合于GFP在GAPDH基因处敲入的供体模板的AAV6载体转导并用如以上所描述的gRNA RSQ22337(SEQ ID NO：95)和Cas12a(SEQ ID NO：62)转化T细胞群体。作为另外一种选择，使用AAV6载体转导对T细胞群体进行在TRAC基因座处高度优化的GFP敲入(参见，例如，Vakulskas等人A high-fidelity Cas9 mutant delivered as aribonucleoprotein complex enables efficient gene editing in humanhematopoietic stem and progenitor cells.Nat Med.2018；24(8):1216-1224)。使用流式细胞术测量敲入效率(在电穿孔后7天测量，通过表达GFP的T细胞群体百分比确定)。当与对于类似方法公开描述的整合频率相比时，TRAC基因座处的敲入率较高(～50％)；然而，使用本文所描述的方法在GAPDH基因处的敲入效率显著(使用非配对t检验，p＝<0.001)更高(～90％)(参见图17D)。在两个实验中使用了相同的RNP浓度、AAV6MOI和同源臂长度，显示了来自3个独立重复的平均结果。因此，本文所描述的方法可以用于分离相对于其它基因敲入方法更高度表达所关心的基因的修饰的细胞群体，如免疫细胞样T细胞群体。

在其它实验中，使用以上所描述的方法编辑T细胞以产生在GAPDH基因座处不具有(参见图58D)或具有(参见图58E)CD19 CAR KI的TRAC敲除细胞。如图58E所示，极高百分比的编辑的细胞表达CD19 CAR(87.6％)，这表明了在GAPDH基因处高水平的CD19 CAR整合。相反，对照TRAC KO细胞不表达CD19 CAR(图58D)。如图58F所示，用靶向TRAC的RNP、靶向GAPDH的RNP转化和/或用包含靶向GAPDH处敲入的CD19货物的AAV6转导的T细胞显示出作为它们各自所期望的编辑的基因型的代表的多种表型。如通过流式细胞术所确定的，当用靶向GAPDH的RNP转化并用包含靶向GAPDH的敲入CD19货物的AAV6转导细胞时，观察到具有CD19CAR KI的T细胞的比率大于90％。当用靶向TRAC的RNP、靶向GAPDH的RNP转化并用包含靶向GAPDH处敲入的CD19货物的AAV6转导细胞时，观察到具有TRAC KO和CD19CAR KI的T细胞的比率大于80％。如图58I中所示，在GAPDH处具有CD19 CAR KI的T细胞能够以显著大于在GAPDH处具有GFP KI的T细胞的比例破坏血液学癌细胞(CD19+Raji细胞)(“仅细胞”是指未编辑的T细胞)。此外，在GAPDH处具有CD19 CAR KI的T细胞证实比在GAPDH处具有GFP KI的T细胞或者未编辑的T细胞显著更大的针对Raji细胞的细胞毒性，如图58J所示。还通过在GAPDH处具有CD19 CAR KI并结合TRAC和/或TGFBR2 KO的T细胞观察到细胞毒性的这种显著升高(图58J)。

在其它实验中，使用以上所描述的方法编辑T细胞群体以产生TRAC的KO、TGFBR2的KO以及在GAPDH基因座处的CD19 CAR KI，借此以高效率产生三重突变体(TRAC KO、TGFBR2KO和CD19 CAR KI)T细胞。高比例的编辑的T细胞(约73.6％)表达CD19 CAR(参见图58G)。

如图60A所示，可以使用一步电穿孔和其中将靶向三个基因座(TRAC、B2M和GAPDH)的三个RNP和包含用于在GAPDH基因座处敲入的GFP货物的AAV应用于T细胞的转化方法(图60A左图)，或者使用连续电穿孔和其中将相同RNP和AAV顺序应用于T细胞的转化方法(图60A右图)产生包含多个编辑的高度限定的工程化T细胞。一步法产生了与顺序法大致相同百分比的含有TRAC和B2M敲除以及GFP表达的细胞。另外，使用一步法编辑T细胞以产生多个敲除，包括在TRAC基因座、B2M基因座、CIITA基因座和TGFBR2基因座处的敲除，以及在GAPDH基因座处的GFP货物敲入，其中一次性将5个Cas12a(SEQ ID NO：62)RNP(对TRAC、B2M、CIITA、TGFBR2和GAPDH特异)和包含设计以在GAPDH基因座内整合的GFP货物的AAV6应用于细胞(参见图60B)。在超过80％的总群体内发生每个单个编辑事件，而以大于80％的比率发生至少包含三个突变(TRAC KO、B2M KO和在GAPDH基因座处GFP货物KI)的细胞。

这些结果显示本文所描述的方法可以以高编辑均一性水平产生用于作为适合于靶向多种肿瘤和/或癌性细胞的自体同源和/或同种异体T细胞疗法的潜在用途的高度工程化的T细胞群体。

实施例24：使用病毒载体将货物在NK细胞中在必需基因的基因座处敲入

本实施例描述了使用病毒载体转导对NK细胞群体的基因编辑。

如本领域中已知的，将NK细胞在珠浴中融化，并在第2天从所述浴中除去。融化后第4天对细胞电穿孔。简要地，使用多种脉冲码，将Lonza 96-孔比色皿中的500,000个NK细胞/孔在缓冲液P2中混悬并且用包含gRNA RSQ22337(SEQ ID NO：95)和靶向GAPDH基因的Cas12a(SEQ ID NO：62)的RNP(1μM RNP)或用培养基对照电穿孔。在电穿孔后立即将适当的媒介物加入至细胞并使细胞恢复15分钟。然后，以不同感染复数(MOI)浓度(1E4、1E5或1E6MOI(vg/细胞))，将包含含有具有GFP、CD19CAR货物的敲入盒的供体质粒构建体或载体对照的AAV6病毒颗粒添加至NK细胞。如实施例2所述设计供体质粒，其具有优化以防止向导RNA(RSQ22337)的gRNA靶向结构域序列进一步结合的GAPDH外显子9的5'密码子优化编码部分、编码P2A自切割肽的框内序列(“P2A”)、货物序列的框内编码序列(例如，GFP或CD19 CAR)(“货物”)、终止密码子和多聚A信号序列。电穿孔后24小时更换培养基并添加IL15。电穿孔后72小时再次更换培养基，拆分细胞并添加10ng/mL IL15。然后，每48小时拆分NK细胞直至通过流式细胞术分析或另外使用它们。电穿孔后7天使用流式细胞术分选NK细胞以确定成功的转导、转化、编辑、敲入盒整合和/或表达事件。极高百分比的细胞表达GFP(86.6％)，这表明当与未用靶向GAPDH的RNP转染的对照NK细胞群体相比时，编辑的NK细胞群体中高比例的编辑的细胞具有在GAPDH基因处整合的GFP(图61A和61B)。另外，极高百分比的细胞表达CD19 CAR，这表明当与未用靶向GAPDH的RNP转染的对照NK细胞群体相比时，编辑的NK细胞群体中高比例的编辑的细胞具有在GAPDH基因处整合的CD19 CAR(图61C-61D)。本文所描述的方法产生了以大于80％的比率具有GFP或CD19 CAR敲入的编辑的NK细胞群体(参见图61E)。如图61F所示，在GAPDH具有CD19 CAR KI的NK细胞能够以显著大于未编辑的NK细胞的比率有效破坏Raji细胞。此外，在GAPDH处具有CD19 CAR KI的NK细胞也证实比在GAPDH处具有GFP KI的NK细胞显著更大的针对Nalm6细胞的细胞毒性(图61G)。这些结果显示本文所描述的方法可以以高编辑均一性水平产生用于作为适合于靶向多种肿瘤和/或癌性细胞的自体同源和/或同种异体NK细胞疗法的潜在用途的工程化的NK细胞群体。

实施例25：与双顺反子CD16和mbIL-15序列在必需基因的基因座处的敲入结合的CISH和TGFβRII的敲除

使用实施例14和19中所描述的方法产生了mbIL-15/CD16双敲入(DKI)/CISH/TGFβRII双敲除(DKO)iPSC。简言之，使用具有工程化Cas12a(SEQ ID NO：62)和具有如表26所示的序列的对CISH或TGFβRII中任一个特异的gRNA的RNP产生CISH/TGFβRII DKO。如实施例14所述，使用质粒PLA1834产生mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI。在使用本领域中已知的标准测序方法确认DKI/DKO基因型后，将DKI/DKO iPSC集落增殖，然后使用旋转胚状体法使细胞群体分化为iNK细胞。如所期望的，与未编辑的(WT)iNK细胞相比，DKI/DKO iNK细胞显示出显著更大的CD16和IL-15Rα表达(图65A)。

在体外持久性测定中，在不存在外源细胞因子支持的情况下，mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO iNK细胞在至少15天内维持了稳定的细胞数目(图62A)。未编辑的(WT)iNK细胞在相同时间段内显示出显著减少的细胞数目。如图65D所示，DKI/DKO iNK细胞在没有外源细胞因子支持的情况下在至少16天内显示出稳定的存活力，而WT iNK细胞在相同时间段内显示出显著降低的培养存活力。另外，与mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI iNK细胞相比，DKI/DKO iNK细胞在至少15天内在没有外源细胞因子的情况下显示出相当的总活细胞计数(图62B)。因此，与未编辑的(WT)iNK细胞相比，mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO iNK细胞在至少15或16天内证实了升高的独立于细胞因子的持久性，以及在该时间段内与mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKIiNK细胞类似的持久性。

在一些体外肿瘤细胞杀伤测定中评价了mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞的肿瘤细胞杀伤能力。将Detroit-562(咽癌)、FaDu(咽癌)、HT-29(结肠直肠腺癌)或HCT116(结肠直肠癌)细胞以10,000个细胞每孔接种到Xcelligence板(ACEA#5232376001)并培育过夜(～20小时)。以多种效应因子：靶标(E:T)比添加DKI/DKO iNK细胞。对于1:1的E:T条件，还包括10μg/mL抗-EGFR抗体西妥昔单抗(CTX)。根据生产商(Xcelligence)的规程测定了如通过电阻抗所测量的溶胞。图63A-D中显示了结果(平均值±标准偏差；N＝3)。如所示的，对于靶标Detroit-562、FaDu、HT-29或HCT116细胞，5:1和10:1的E：T比的DKI/DKO iNK细胞导致显著溶胞。另外，对于靶标HCT117细胞，1:1E：T比的DKI/DKO iNK细胞也导致显著溶胞。此外，对于Detroit-562、FaDu或HCT116细胞，1:1E：T比的DKI/DKO iNK细胞结合西妥昔单抗导致显著溶胞，其中所导致的溶胞大于对于1:1E：T比时单独的DKI/DKO iNK细胞或者单独的西妥昔单抗所观察到综合作用。

使用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞进行进一步的肿瘤细胞杀伤测定。再次，将HT-29(结肠直肠腺癌)细胞以10,000个细胞每孔接种到Xcelligence板(ACEA#5232376001)并培育过夜。然后，以10:1E：T比添加DKI/DKOiNK细胞或者未编辑的(WT)iNK细胞。根据生产商(Xcelligence)的规程测定了如通过电阻抗所测量的溶胞。图64A显示了结果(平均值±标准偏差；N＝3)。如所示的，DKI/DKO和WTiNK细胞两者均导致显著溶胞。还使用HT-29细胞检验了mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞和未编辑的(WT)iNK细胞的体外持久性。将DKI/DKO iNK细胞和WT iNK细胞与HT-29细胞以10:1的E：T比共培养4天。图64B显示了第4天时的存活力和CD16表达，如通过流式细胞术所测量的。如所示的，在杀伤HT-29细胞后WT iNK细胞基本不存活，然而DKI/DKO细胞持续。另外，尽管存活的WT iNK细胞为<1％ CD16+，而存活的DKI/DKO iNK细胞为>80％ CD16+。以1:1E：T比重复这种体外持久性测定。如图64C所示，DKI/DKO细胞再次证实了在对肿瘤(HT-29)细胞暴露后更大的持久性和维持CD16表达。

还与图20中的图示类似地实施了在3D实体瘤杀伤测定中对mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞的测试。简要地，通过在96孔超低吸附板中接种5,000个NucLight Red标记的SK-OV-3细胞形成球形体。在以多种E：T比添加mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞之前，在37℃培育球形体。随后，使用Incucyte S3系统每2小时对球形体成像长达4天。在添加效应因子时，将数据对红色目标强度进行归一化。图65B中显示了结果(N＝1；2个技术重复/细胞系)。如所示的，编辑的DKI/DKO iNK细胞能够比未编辑的(WT)iNK细胞更有效地降低SK-OV-3球形体的尺寸。与上述类似，使用DKI/DKO iNK细胞或WT iNK细胞结合10μg/ml曲妥珠单抗或IgG(作为对照)进一步实施3D肿瘤杀伤测定(图65C)。将效力确定为IC50，这表示杀伤100小时后，将SK-OV-3球形体减少50％所需的E：T比。如图65C所示，在具有或不具有曲妥珠单抗的情况下，编辑的DKI/DKO iNK细胞比未编辑的(WT)iNK细胞更有效地减小SK-OV-3球形体的尺寸。与曲妥珠单抗组合所观察到的结果表明相对于WT iNK细胞，DKI/DKO iNK细胞介导了增强的抗体依赖性的细胞介导的细胞毒作用(ADCC)。

实施蛋白磷酸化流式细胞术测定以确定mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞中SMAD2/3(pSMAD2/3)的磷酸化状态。简要地，在处于细胞因子饥饿条件中的前一天，将DKI/DKO iNK铺板。次日，用10ng/ml TGFβ刺激细胞规定时间长度(例如，0-60分钟)。在时间点结束时立即固定细胞并染色。在NovoCyte Quanteon上处理细胞，并在FlowJo中分析数据。图65E中显示了结果(数据表示1个独立实验)。在存在TGFβ的情况下DKI/DKO iNK细胞中的SMAD2/3磷酸化无变化，而TGFβ提高了未编辑的(WT)iNK细胞中的SMAD2/3磷酸化。另外，与上述类似，以31.6的E：T比使用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞并且在使用或不使用10ng/mLTGFβ的情况下，实施3D实体瘤细胞杀伤测定。如图65F所示，在100小时杀伤后DKI/DKO iNK细胞能够比未编辑的iNK对照细胞更有效地减小SK-OV-3球形体的尺寸(数据表示1个独立实验)。此外，与未编辑的(WT)iNK相反，DKI/DKO iNK细胞活性不受外源TGFβ的存在的影响。在体外连续杀伤测定中，在多天的时间段内，还迫使mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞反复杀伤肿瘤靶标。在测定第0天，在存在TGFβ(10ng/ml)的情况下在96-孔板的每个孔中将10×10³个Nalm6肿瘤细胞(B细胞白血病细胞系)和2×10⁵个DKI/DKO iNK铺板。以48小时间隔，加入5×10³个Nalm6肿瘤细胞的丸剂以再次攻毒DKI/DKO iNK群体。图65G中显示了结果(N＝1；3个技术重复/细胞系；误差线＝标准偏差)。如所示的，即使在存在TGFβ的情况下，在用Nalm6肿瘤细胞多次攻毒后，DKI/DKO iNK细胞显示出Nalm6肿瘤细胞的连续杀伤。相反，未编辑的(WT)iNK细胞受限于它们的连续杀伤作用。总体上，这些数据表明DKI/DKO iNK对TGFβ-介导的免疫抑制具有增强的耐受性。

如图66A所示，在体内小鼠模型中实施了对mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞的测试。对小鼠静脉内(IV)接种0.125×10⁶个SKOV3-luc细胞。在允许建立肿瘤的19天后，使用体内成像系统(IVIS)对小鼠成像以建立预处理(第-2天)肿瘤负荷，然后随机分为处理组。在第0天，对小鼠静脉内注射(i)2.5mpk曲妥珠单抗，或者(ii)20×10⁶个DKI/DKO iNK细胞和2.5mpk曲妥珠单抗。在第0天后，使用IVIS对小鼠成像以评价随时间的肿瘤负荷。在图66B-66C中显示了如通过经由IVIS的生物发光成像(BLI)所测量的随时间的肿瘤负荷。图66B显示了肿瘤负荷，并且图66C显示了在多个时间点的小鼠的代表性生物发光成像。如所示的，用DKI/DKO iNK细胞结合曲妥珠单抗处理的小鼠显示出比单独用曲妥珠单抗处理的小鼠更大的肿瘤减小。在仅5天后，用DKI/DKO iNK细胞结合曲妥珠单抗处理的小鼠显示出显著肿瘤减小。此外，在第5天，在处理组中，在全部动物中用DKI/DKO iNK细胞结合曲妥珠单抗处理导致肿瘤完全清除。

如图67A所示，在体内小鼠模型中实施了mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞的其它测试。对小鼠腹膜内接种0.25×10⁶个SKOV3-luc细胞。在允许建立肿瘤的4天后，使用体内成像系统(IVIS)对小鼠成像以建立预处理(第-1天)肿瘤负荷，然后随机分为处理组。在另外1天(第0天)后，对小鼠腹膜内注射(IP)5×10⁶个未编辑的(WT)iNK细胞、5×10⁶个DKI/DKO iNK细胞或者对于单独的曲妥珠单抗或同种型对照无iNK细胞。在第0、7和14天，一些处理组(“曲妥珠单抗×3”或“+Tras.×3”)接受2.5mpk曲妥珠单抗的IP注射。在第0天后，使用IVIS每周对小鼠成像以评价随时间的肿瘤负荷。在图67B-C中显示了如通过经由IVIS的生物发光成像(BLI)所测量的随时间的肿瘤负荷。图67E显示了多个时间点处小鼠的代表性生物发光成像。如图67B所示，用单独的未编辑的(WT)iNK细胞或DKI/DKO iNK细胞处理不导致体内肿瘤减少。然而，用iNK细胞结合曲妥珠单抗处理的小鼠显示出比单独用曲妥珠单抗处理的小鼠更大的肿瘤减小(图67C)。与剂量施用未编辑的(WT)iNK细胞结合曲妥珠单抗(WT+Tras×3)或者单独的曲妥珠单抗的小鼠相比，剂量施用mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO(DKI/DKO)iNK细胞结合曲妥珠单抗(DKI/DKO+Tras×3)的小鼠还具有显著延长的存活(图67D)。此外，与用未编辑的(WT)iNK细胞处理的小鼠相比，在用DKI/DKO iNK细胞处理的小鼠中，肿瘤负荷减少更大。在仅6天后，用DKI/DKO iNK细胞结合曲妥珠单抗处理的小鼠显示出显著肿瘤减小(图67E)。此外，如图67E所示，在NK细胞引入后第31天，用DKI/DKO iNK细胞结合曲妥珠单抗处理导致在处理组中的2只(40％)动物中肿瘤完全清除。这些结果确认mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO iNK细胞易于体内杀伤肿瘤细胞并且证实与单独的曲妥珠单抗或者未编辑的(WT)iNK细胞结合曲妥珠单抗处理相比，mbIL-15/CD16(CD16^+/+/mbIL-15^+/+)DKI/CISH/TGFβRII DKO iNK细胞结合曲妥珠单抗产生了更大的体内肿瘤减小。

等价形式

应理解尽管已结合其详细说明描述了本发明公开，但是上述描述旨在说明而非限制本发明公开的范围，本发明公开的范围由所附权利要求的范围来限定。其它方面、优势和改变在以下权利要求的范围内。

Claims

1.自然杀伤(NK)细胞，其包含：

(a)导致一个或多个基因功能缺失的一个或多个基因组编辑，其中所述一个或多个基因编码腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLA II类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合；和

(b)基因组，其包含FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列，其中所述第一外源编码序列和第二外源编码序列与必需基因的编码序列位于同一读框且位于其下游(3')，并且其中所述必需基因的至少一部分包含外源编码序列。

2.根据权利要求1所述的NK细胞，其中所述基因组包含：

(i)位于所述必需基因的第一等位基因的第一外源编码序列和第二外源编码序列；和

(ii)位于所述必需基因的第二等位基因的第一外源编码序列和第二外源编码序列。

3.根据权利要求1或2所述的NK细胞，其中所述第一外源编码序列位于所述第二外源编码序列的上游(5')。

4.根据权利要求3所述的NK细胞，其中所述基因组包含：

(i)位于所述必需基因的编码序列和所述第一外源编码序列之间的第一调控元件；和

(ii)位于所述第一外源编码序列和所述第二外源编码序列之间的第二调控元件。

5.根据权利要求4所述的NK细胞，其中所述第一调控元件是IRES或2A元件且所述第二调控元件是IRES或2A元件。

6.根据权利要求3-5中任一项所述的NK细胞，其中所述基因组包含位于所述第二外源编码序列下游(3')的多腺苷酸化序列。

7.根据权利要求6所述的NK细胞，其中所述基因组包含位于所述第二外源编码序列下游(3')和位于所述多腺苷酸化序列上游(5')的3'未翻译区(UTR)序列。

8.根据权利要求1或2所述的NK细胞，其中所述第二外源编码序列位于所述第一外源编码序列的上游(5')。

9.根据权利要求8所述的NK细胞，其中所述基因组包含：

(i)位于所述必需基因的编码序列和所述第二外源编码序列之间的第一调控元件；和

(ii)位于所述第二外源编码序列和所述第一外源编码序列之间的第二调控元件。

10.根据权利要求9所述的NK细胞，其中所述第一调控元件是IRES或2A元件且所述第二调控元件是IRES或2A元件。

11.根据权利要求8-10中任一项所述的NK细胞，其中所述基因组包含位于所述第一外源编码序列下游(3')的多腺苷酸化序列。

12.根据权利要求11所述的NK细胞，其中所述基因组包含位于所述第一外源编码序列下游(3')和位于所述多腺苷酸化序列上游(5')的3'未翻译区(UTR)序列。

13.根据以上权利要求中任一项所述的NK细胞，其中所述第一外源编码序列是或包含SEQ ID NO：166。

14.根据以上权利要求中任一项所述的NK细胞，其中所述第二外源编码序列是或包含SEQ ID NO：172。

15.根据以上权利要求中任一项所述的NK细胞，其中CD16是或包含SEQ ID NO：184所示的氨基酸序列。

16.根据以上权利要求中任一项所述的NK细胞，其中mbIL-15包含IL-15、接头、寿司结构域和IL-15Rα。

17.根据权利要求16所述的NK细胞，其中mbIL-15是或包含SEQ ID NO：190所示的氨基酸序列。

18.根据以上权利要求中任一项所述的NK细胞，其中所述NK细胞是诱导性多能干细胞(iPSC)-来源的NK(iNK)细胞。

19.根据以上权利要求中任一项所述的NK细胞，其中所述必需基因编码所述细胞存活和/或增殖所需的基因产物。

20.根据以上权利要求中任一项所述的NK细胞，其中所述必需基因是管家基因，例如，表3中所列的基因。

21.根据以上权利要求中任一项所述的NK细胞，其中所述必需基因编码3-磷酸甘油醛脱氢酶(GAPDH)。

22.根据以上权利要求中任一项所述的NK细胞，其中所述NK细胞包含：

(i)导致CISH功能缺失的基因组编辑；和

(ii)导致TGFβRII功能缺失的基因组编辑。

23.用作药剂使用的根据以上权利要求中任一项所述的NK细胞。

24.根据以上权利要求中任一项所述的NK细胞，其用于在疾病、病症或病况，例如，肿瘤和/或癌症的治疗中使用。

25.根据权利要求1-24中任一项所述的NK细胞的子代或子代细胞。

26.NK细胞群体，其包含根据权利要求1-24中任一项所述的NK细胞。

27.根据权利要求26所述的NK细胞群体，其特征在于当与肿瘤细胞接触时，相对于参考NK细胞群体对肿瘤细胞的参考杀伤水平，NK细胞对肿瘤细胞的杀伤水平提高。

28.根据权利要求26或27所述的NK细胞群体，其特征在于当与肿瘤细胞和抗体接触时，相对于参考NK细胞群体诱导的抗体依赖性的细胞介导的细胞毒作用(ADCC)的参考水平，NK细胞诱导的ADCC水平提高。

29.根据权利要求26-28中任一项所述的NK细胞群体，其中相对于参考NK细胞群体的参考持久性水平，NK细胞群体的持久性水平提高。

30.根据权利要求29所述的NK细胞群体，其中在与肿瘤细胞接触后测量所述持久性水平。

31.根据权利要求26-30中任一项所述的NK细胞群体，其中所述参考NK细胞群体不包含以下NK细胞，所述NK细胞包含含有所述第一外源编码序列和所述第二外源编码序列的基因组。

32.根据权利要求31所述的NK细胞群体，其中所述参考NK细胞群体不包含以下NK细胞，所述NK细胞包含导致TGFβRII功能缺失的基因组编辑和导致CISH功能缺失的基因组编辑。

33.药物组合物，其包含根据权利要求1-32中任一项所述的NK细胞、子代或子代细胞或者NK细胞群体。

34.根据权利要求33所述的药物组合物，还包含药物可用的载体。

35.治疗病况、病症和/或疾病的方法，其包含向患有所述病况、病症和/或疾病的受试者施用根据权利要求1-32中任一项所述的NK细胞、子代或子代细胞或者NK细胞群体。

36.根据权利要求35所述的方法，其中所述受试者患有肿瘤，例如，实体瘤。

37.根据权利要求35所述的方法，其中所述受试者患有癌症。

38.方法，其包括向受试者施用根据权利要求1-32中任一项所述的NK细胞、子代或子代细胞或者NK细胞群体。

39.治疗病况、病症和/或疾病的方法，其包括向患有所述病况、病症和/或疾病的受试者施用根据权利要求33或34所述的药物组合物。

40.根据权利要求39所述的方法，其中所述受试者患有肿瘤，例如，实体瘤。

41.根据权利要求39所述的方法，其中所述受试者患有癌症。

42.方法，其包括向受试者施用根据权利要求33或34所述的药物组合物。

43.根据权利要求35-42中任一项所述的方法，其中所述NK细胞、子代或子代细胞或者NK细胞群体对所述受试者是同种异体的。

44.根据权利要求35-42中任一项所述的方法，其中所述NK细胞、子代或子代细胞或者NK细胞群体对所述受试者是自体同源的。

45.根据权利要求35-44中任一项所述的方法，还包括向所述受试者施用抗体。

46.根据权利要求45所述的方法，其中所述抗体是曲妥珠单抗、利妥昔单抗或西妥昔单抗。

47.根据权利要求35-46中任一项所述的方法，其中所述受试者是人。

48.提高NK细胞的肿瘤杀伤能力的方法，所述方法包括：

(a)向所述NK细胞基因组敲入FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列，其中将所述第一外源编码序列和所述第二外源编码序列敲入必需基因的读框和下游(3')；和

(b)敲除所述NK细胞的一个或多个基因，其中所述一个或多个基因编码腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLA II类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合；

借此相对于参考NK细胞的肿瘤杀伤活性的参考水平，提高NK细胞的肿瘤杀伤活性水平。

49.提高NK细胞诱导的抗体依赖性的细胞介导的细胞毒作用(ADCC)的方法，所述方法包括：

(b)敲除所述NK细胞的一个或多个基因，其中所述一个或多个基因编码腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLAII类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合；

借此相对于参考NK细胞诱导的ADCC的参考水平提高所述NK细胞诱导的ADCC水平。

50.提高NK细胞持久性的方法，所述方法包括：

借此相对于参考NK细胞的参考持久性水平提高所述NK细胞的持久性水平。

51.根据权利要求50所述的方法，其中在所述NK细胞与肿瘤细胞接触后测量所述持久性水平。

52.根据权利要求48-51中任一项所述的方法，其中所述参考NK细胞不包含含有所述第一外源编码序列和所述第二外源编码序列的基因组。

53.根据权利要求48-52中任一项所述的方法，其中所述参考NK细胞不包含导致TGFβRII功能缺失的基因组编辑和导致CISH功能缺失的基因组编辑。

54.产生基因修饰的NK细胞的方法，所述方法包括：

(a)向NK细胞基因组敲入FcγRIII(CD16)或其变体的第一外源编码序列和膜结合的白介素15(mbIL-15)的第二外源编码序列，其中将所述第一外源编码序列和所述第二外源编码序列敲入必需基因的读框和下游(3')；和

(b)敲除所述NK细胞的一个或多个基因，其中所述一个或多个基因编码腺嘌呤核苷A2a受体(ADORA2A)、β-2微球蛋白(B2M)、II类主要组织相容性复合体反式激活因子(CIITA)、含细胞因子诱导型SH2的蛋白(CISH)、两种或更多种人类白细胞抗原(HLA)II类组织相容性抗原α链基因、两种或更多种HLAII类组织相容性抗原β链基因、自然杀伤组2成员A受体(NKG2A)、细胞程序死亡蛋白1(PD-1)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、TGFβ信号通路的激动剂(例如，转化生长因子β受体II(TGFβRII))或者其两种或更多种的任意组合。

55.根据权利要求48-54中任一项所述的方法，其中敲入包括将所述NK细胞与下列接触：

(i)在所述必需基因的内源编码序列内造成断裂的核酸酶，和

(ii)包含敲入盒的供体模板，所述敲入盒包含与所述必需基因的外源编码序列或部分编码序列位于同一读框且位于其下游(3')的所述第一外源编码序列和所述第二外源编码序列，其中通过所述断裂的同源介导修复(HDR)将所述敲入盒整合到所述细胞的基因组中。

56.根据权利要求55所述的方法，其中所述核酸酶是CRISPR/Cas核酸酶并且敲入还包括将所述NK细胞与CRISPR/Cas核酸酶的向导分子接触。

57.根据权利要求48-56中任一项所述的方法，其中敲除包括将所述NK细胞与在所述一个或多个基因的内源编码序列内造成断裂的一个或多个核酸酶接触。

58.根据权利要求57所述的方法，其中所述一个或多个核酸酶是CRISPR/Cas核酸酶并且敲除还包括将所述NK细胞与CRISPR/Cas核酸酶的一个或多个向导分子接触。

59.根据权利要求48-58中任一项所述的方法，其中所述NK细胞是诱导性多能干细胞(iPSC)-来源的NK(iNK)细胞。

60.根据权利要求48-59中任一项所述的方法，其中所述必需基因编码所述NK细胞存活和/或增殖所需的基因产物。

61.根据权利要求48-59中任一项所述的方法，其中所述必需基因是管家基因，例如，表3中所列的基因。

62.根据权利要求48-60中任一项所述的方法，其中所述必需基因编码3-磷酸甘油醛脱氢酶(GAPDH)。

63.根据权利要求48-62中任一项所述的方法，其包括敲除编码CISH的基因和敲除编码TGFβRII的基因。