CN116234558A

CN116234558A - 条件性地表达重组受体的工程化t细胞、相关多核苷酸和方法

Info

Publication number: CN116234558A
Application number: CN202180051639.0A
Authority: CN
Inventors: M·P·波尔托拉克; C·斯坦伯格; L·杰梅罗斯
Original assignee: Juno Therapeutics GmbH
Current assignee: Juno Therapeutics GmbH
Priority date: 2020-06-26
Filing date: 2021-06-25
Publication date: 2023-06-06
Also published as: WO2021260186A1; KR20230042283A; EP4171616A1; JP2023531531A

Abstract

提供了含有编码重组受体或其一部分的经修饰的T细胞刺激相关基因座的工程化T细胞。在一些方面，编码所述重组受体或其一部分的核酸序列可操作地连接至所述T细胞刺激相关基因座的内源转录调节元件，所述T细胞刺激相关基因座在一些情况下通过靶向整合进行工程化。在一些方面，所述工程化细胞条件性地表达所述重组受体，如在T细胞中刺激或激活信号后。还公开了细胞组合物、用于将细胞工程化的核酸、以及用于产生所述工程化细胞的方法和制品。在一些实施方案中，可以将所述工程化细胞与细胞疗法结合使用，包括与包含所述工程化细胞的过继转移的癌症免疫疗法结合使用。

Description

条件性地表达重组受体的工程化T细胞、相关多核苷酸和方法

相关申请的交叉引用

本申请要求2020年6月26日提交的标题为“条件性地表达重组受体的工程化T细胞、相关多核苷酸和方法”(“ENGINEERED T CELLS CONDITIONALLY EXPRESSING ARECOMBINANT RECEPTOR,RELATED POLYNUCLEOTIDES AND METHODS”)的美国临时申请号63/044,984的优先权，将其内容通过引用以其整体并入。

通过引用并入序列表

本申请连同电子格式的序列列表一起提交。序列表以2021年6月23日创建、大小为220千字节的名为735042013840SeqList.txt的文件提供。将在电子格式的序列表中的信息通过引用以其整体并入。

技术领域

本公开文本涉及含有编码重组受体或其一部分的经修饰的T细胞刺激相关基因座的工程化T细胞。在一些方面，编码所述重组受体或其一部分的核酸序列可操作地连接至所述T细胞刺激相关基因座的内源转录调节元件，其在一些情况下通过靶向整合进行工程化。在一些方面，所述工程化细胞条件性地表达所述重组受体，如在T细胞中刺激或激活信号后。还公开了细胞组合物、用于将细胞工程化的核酸、以及用于产生所述工程化细胞的方法和制品。在一些实施方案中，可以将所述工程化细胞与细胞疗法结合使用，包括与包含所述工程化细胞的过继转移的癌症免疫疗法结合使用。

背景技术

利用重组受体(如嵌合抗原受体(CAR)或重组T细胞受体(TCR))识别与疾病相关的抗原的过继细胞疗法代表了用于治疗癌症和其他疾病的有吸引力的治疗方式。需要改善的策略来工程化T细胞以表达重组受体，如用于在过继免疫疗法中，例如在治疗癌症、感染性疾病和自身免疫性疾病中使用。提供了用于在满足此类需求的方法中使用的方法、细胞、组合物和试剂盒。

发明内容

本文提供了工程化T细胞，其包含含有编码重组受体或其一部分的转基因的经修饰的T细胞刺激相关基因座，其中所述转基因与所述T细胞刺激相关基因座的内源转录调节元件可操作地连接，其中所述内源转录调节元件在T细胞中刺激或激活信号后诱导或上调所述可操作地连接的转基因的表达。

在任何实施方案的一些实施方案中，所述内源转录调节元件是内源T细胞刺激相关基因座的启动子。在任何实施方案的一些实施方案中，编码所述重组受体或其一部分的转基因存在于所述启动子的下游。

在任何实施方案的一些实施方案中，所述可操作地连接的转基因的表达是可诱导的，并且在所述细胞中所述刺激或激活信号之后被诱导。在任何实施方案的一些实施方案中，所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约6小时内被上调或诱导。在一些任何实施方案中，所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约12小时内被上调或诱导。在任何实施方案的一些实施方案中，所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约24小时内被上调或诱导。在一些任何实施方案中，所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约36小时内被上调或诱导。在一些任何实施方案中，所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约48小时内被上调或诱导。

在任何实施方案的一些实施方案中，所述可操作地连接的转基因的表达不是永久性的和/或可以随着时间的推移或在不存在所述T细胞的刺激或激活信号的情况下降低。在任何实施方案的一些实施方案中，在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达被降低或下调。在任何实施方案的一些实施方案中，在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达被降低或下调大于或大于约30％、40％、50％、60％、70％、75％、80％、85％、90％或95％或更多。在任何实施方案的一些实施方案中，在表达的上调或诱导之后，在所述T细胞中的所述刺激或激活信号之后为或约1、2、3、4、5、6、7或8天或更长时间之后，所述可操作地连接的转基因的表达被降低或下调。在任何实施方案的一些实施方案中，在所述T细胞中所述刺激或激活信号降低或不存在之后小于或小于约6、12、18、24、36或48小时内，所述可操作地连接的转基因的表达被降低或下调。

在任何实施方案的一些实施方案中，在所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达能够在所述T细胞中进一步刺激或激活信号之后再次被诱导或上调。在任何实施方案的一些实施方案中，在所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述T细胞中所述进一步刺激或激活信号之后小于或小于约6、12、18、24、36或48小时内被上调或诱导。在任何实施方案的一些实施方案中，所述可操作地连接的转基因的表达是可诱导的，并且在所述细胞中所述刺激或激活信号之后被诱导。在任何实施方案的一些实施方案中，在所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述T细胞中所述进一步刺激或激活信号之后小于或小于约6小时内被上调或诱导。在一些任何实施方案中，在所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述T细胞中所述进一步刺激或激活信号之后小于或小于约12小时内被上调或诱导。在一些任何实施方案中，在所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述T细胞中所述进一步刺激或激活信号之后小于或小于约24小时内被上调或诱导。在一些任何实施方案中，在所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述T细胞中所述进一步刺激或激活信号之后小于或小于约36小时内被上调或诱导。在一些任何实施方案中，在所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述T细胞中所述进一步刺激或激活信号之后小于或小于约48小时内被上调或诱导。

在任何实施方案的一些实施方案中，在所述T细胞中所述刺激或激活信号之后，来自内源T细胞刺激相关基因座的开放阅读框的翻译产物在所述细胞中不表达，或者所述内源T细胞刺激相关基因座的功能性内源基因产物不表达。在任何实施方案的一些实施方案中，所述经修饰的T细胞刺激相关基因座包含所述内源T细胞刺激相关基因座的开放阅读框中的缺失、插入、移码突变或无义突变。

在任何实施方案的一些实施方案中，所述内源T细胞刺激相关基因座选自PDCD1、CD69、Nur77、FoxP3和HLA-DR基因座。在任何实施方案的一些实施方案中，所述内源T细胞刺激相关基因座是PDCD1基因座。在一些任何实施方案中，所述内源T细胞刺激相关基因座是CD69基因座。在一些任何实施方案中，所述内源T细胞刺激相关基因座是Nur77基因座。在任何实施方案的一些实施方案中，所述内源T细胞刺激相关基因座是FoxP3基因座。在任何实施方案的一些实施方案中，所述内源T细胞刺激相关基因座是HLA-DR基因座。在任何实施方案的一些实施方案中，所述内源转录调节元件包括由在所述刺激或激活信号之后被激活的转录因子识别的一个或多个应答元件。

在一些实施方案中，所述重组受体或其部分能够诱导或传递所述T细胞中的所述刺激或激活信号。

在任何实施方案的一些实施方案中，所述重组受体包含细胞内区域，所述细胞内区域含有T细胞受体(TCR)复合物的组分的细胞内信号传导结构域，并且所述T细胞中的所述刺激或激活信号包括通过存在于所述重组受体中的细胞内信号传导结构域的信号。在任何实施方案的一些实施方案中，所述重组受体包含细胞内区域，所述细胞内区域含有细胞内信号传导结构域，所述细胞内信号传导结构域包含免疫受体酪氨酸激活基序(ITAM)，并且所述T细胞中的所述刺激或激活信号包括通过存在于所述重组受体中的细胞内信号传导结构域的信号。在任何实施方案的一些实施方案中，所述重组受体(例如CAR)的细胞内信号传导结构域可以包含CD3ζ信号传导结构域，并且所述T细胞中的所述刺激或激活信号包括通过存在于所述重组受体(例如CAR)中的细胞内信号传导结构域的信号。

在任何实施方案的一些实施方案中，所述重组受体是TCR并且能够募集所述T细胞复合物的组分以诱导或刺激所述T细胞中的激活信号。

在任何实施方案的一些实施方案中，所述重组受体包含胞外区域，所述胞外区域含有能够结合或识别药剂(例如靶抗原)的结合结构域。在任何实施方案的一些实施方案中，在所述重组受体结合或识别所述药剂后，在所述T细胞中诱导了刺激或激活信号。

在任何实施方案的一些实施方案中，所述药剂是靶抗原。在任何实施方案的一些实施方案中，所述靶抗原是重组蛋白或在细胞表面上表达的抗原。在任何实施方案的一些实施方案中，所述靶抗原与疾病、障碍或病症的细胞或组织相关，为疾病、障碍或病症的细胞或组织所特有，或在疾病、障碍或病症的细胞或组织上表达。在任何实施方案的一些实施方案中，所述疾病、障碍或病症是感染性疾病或障碍、自身免疫性疾病、炎性疾病、或肿瘤或癌症。在任何实施方案的一些实施方案中，所述靶抗原是肿瘤抗原。在任何实施方案的一些实施方案中，所述靶抗原选自αvβ6整合素(avb6整合素)、B细胞成熟抗原(BCMA)、B7-H3、B7-H6、碳酸酐酶9(CA9，也称为CAIX或G250)、癌症-睾丸抗原、癌症/睾丸抗原1B(CTAG，也称为NY-ESO-1和LAGE-2)、癌胚抗原(CEA)、细胞周期蛋白、细胞周期蛋白A2、C-C基序趋化因子配体1(CCL-1)、CD19、CD20、CD22、CD23、CD24、CD30、CD33、CD38、CD44、CD44v6、CD44v7/8、CD123、CD133、CD138、CD171、硫酸软骨素蛋白聚糖4(CSPG4)、表皮生长因子蛋白(EGFR)、表皮生长因子受体III型突变体(EGFR vIII)、上皮糖蛋白2(EPG-2)、上皮糖蛋白40(EPG-40)、肝配蛋白B2、肝配蛋白受体A2(EPHa2)、雌激素受体、Fc受体样蛋白5(FCRL5；也称为Fc受体同源物5或FCRH5)、胎儿乙酰胆碱受体(胎儿AchR)、叶酸结合蛋白(FBP)、叶酸受体α、神经节苷脂GD2、O-乙酰化GD2(OGD2)、神经节苷脂GD3、糖蛋白100(gp100)、磷脂酰肌醇蛋白聚糖-3(GPC3)、G蛋白偶联受体C类5族成员D(GPRC5D)、Her2/neu(受体酪氨酸激酶erb-B2)、Her3(erb-B3)、Her4(erb-B4)、erbB二聚体、人高分子量黑色素瘤相关抗原(HMW-MAA)、乙型肝炎表面抗原、人白细胞抗原A1(HLA-A1)、人白细胞抗原A2(HLA-A2)、IL-22受体α(IL-22Rα)、IL-13受体α2(IL-13Rα2)、激酶插入结构域受体(kdr)、κ轻链、L1细胞粘附分子(L1-CAM)、L1-CAM的CE7表位、含有富亮氨酸重复序列的蛋白8家族成员A(LRRC8A)、Lewis Y、黑色素瘤相关抗原(MAGE)-A1、MAGE-A3、MAGE-A6、MAGE-A10、间皮素(MSLN)、c-Met、鼠类巨细胞病毒(CMV)、粘蛋白1(MUC1)、MUC16、自然杀伤细胞2族成员D(NKG2D)配体、黑色素A(MART-1)、神经细胞粘附分子(NCAM)、癌胚胎抗原、黑色素瘤优先表达抗原(PRAME)、孕酮受体、前列腺特异性抗原、前列腺干细胞抗原(PSCA)、前列腺特异性膜抗原(PSMA)、受体酪氨酸激酶样孤儿受体1(ROR1)、存活蛋白、滋养层糖蛋白(TPBG，也称为5T4)、肿瘤相关糖蛋白72(TAG72)、酪氨酸酶相关蛋白1(TRP1，也称为TYRP1或gp75)、酪氨酸酶相关蛋白2(TRP2，也称为多巴色素互变异构酶、多巴色素δ异构酶或DCT)、血管内皮生长因子受体(VEGFR)、血管内皮生长因子受体2(VEGFR2)、肾母细胞瘤1(WT-1)、病原体特有的或病原体表达的抗原、或与通用标签相关的抗原、和/或生物素化分子、和/或由HIV、HCV、HBV或其他病原体表达的分子。

在任何实施方案的一些实施方案中，所述药剂是对所述重组受体的胞外结构域具有特异性的抗独特型抗体。

在任何实施方案的一些实施方案中，所述重组受体是嵌合抗原受体(CAR)。在任何实施方案的一些实施方案中，所述CAR包含含有结合结构域的胞外区域、跨膜结构域和细胞内区域。在任何实施方案的一些实施方案中，所述胞外区域还包含间隔子。在任何实施方案的一些实施方案中，所述间隔子可操作地连接在所述结合结构域与所述跨膜结构域之间。在任何实施方案的一些实施方案中，所述胞外区域包含结合结构域，所述结合结构域是或包含抗体或其抗原结合片段，例如单链可变片段(scFv)。

在任何实施方案的一些实施方案中，所述重组受体(例如CAR)的细胞内区域包含细胞内信号传导结构域。在任何实施方案的一些实施方案中，所述细胞内信号传导结构域是或包含CD3链的细胞内信号传导结构域。在任何实施方案的一些实施方案中，所述细胞内信号传导结构域是或包含CD3-zeta(CD3ζ)链或其信号传导部分。在任何实施方案的一些实施方案中，所述细胞内区域包含一个或多个共刺激信号传导结构域。在任何实施方案的一些实施方案中，所述细胞内区域包含CD3-zeta(CD3ζ)链或其信号传导部分以及一个或多个共刺激信号传导区域。在任何实施方案的一些实施方案中，所述一个或多个共刺激信号传导结构域包含CD28、4-1BB或ICOS或其信号传导部分的细胞内信号传导结构域。在任何实施方案的一些实施方案中，所述共刺激信号传导区域包含4-1BB的细胞内信号传导结构域。

在任何实施方案的一些实施方案中，所述经修饰的T细胞刺激相关基因座编码作为CAR的重组受体，其中所述CAR从其N至C末端按顺序包含：所述胞外结合结构域、所述间隔子、所述跨膜结构域和所述细胞内区域。

在任何实施方案的一些实施方案中，所述转基因按顺序包含编码以下的核苷酸序列：胞外结合结构域，如scFv；间隔子，如包含来自人免疫球蛋白铰链(如来自IgG1、IgG2或IgG4)或其修饰形式的序列，如还包含CH2区和/或CH3区；和跨膜结构域，如来自人CD28；共刺激信号传导结构域，如来自人4-1BB；以及细胞内信号传导结构域，如CD3ζ链或其一部分。在任何实施方案的一些实施方案中，所述经修饰的T细胞刺激相关基因座按顺序包含编码以下的核苷酸序列：胞外结合结构域，如scFv；间隔子，如包含来自人免疫球蛋白铰链(如来自IgG1、IgG2或IgG4)或其修饰形式的序列，如还包含CH2区和/或CH3区；和跨膜结构域，如来自人CD28；共刺激信号传导结构域，如来自人4-1BB；以及细胞内信号传导结构域，如CD3ζ链或其一部分。

在任何实施方案的一些实施方案中，所述转基因编码所述重组受体，如所述重组受体的完整或完全序列。在任何实施方案的一些实施方案中，所述重组受体是单链多肽。例如，所述重组受体可以是嵌合抗原受体(CAR)，并且所述转基因编码所述嵌合抗原受体(CAR)，例如，所述CAR的完整或完全序列。在任何实施方案的一些实施方案中，所述重组受体是多链多肽，如双链多肽。例如，所述重组受体可以是含有α链和β链的T细胞受体(TCR)，并且所述转基因编码所述TCR的α链和β链，如所述TCR的α和β链的全部或完整序列。在这样的例子中，所述TCR的单独的链可以通过多顺反子元件(如核糖体跳跃元件(例如T2A或P2A))或IRES来隔开。

在任何实施方案的一些实施方案中，所述转基因编码所述重组受体的一部分。在实施方案中，由所述转基因编码的重组受体的部分在其部分由所述T细胞表达时能够促进或允许所述全长重组受体的相同或相似(即其保留)的功能活性(例如抗原结合和受体信号传导活性)，如在所述T细胞中所述刺激或激活信号之后。在任何实施方案的一些实施方案中，当由所述T细胞表达时，所述重组受体的所述部分可以形成完整重组受体或其部分序列，所述完整受体或其部分序列保留所述重组受体的全长形式的功能活性(例如抗原结合和受体信号传导活性)。在任何实施方案的一些实施方案中，当由所述T细胞表达时，所述重组受体的所述部分能够促进或允许所述重组受体的全部活性的至少75％、85％、90％或100％。在一些例子中，当由所述T细胞表达时，由所述转基因编码的重组受体的所述部分能够与也由所述工程化T细胞表达的重组受体的另一组分(例如所述重组受体的另一条链)形成完整功能性受体。在其他例子中，重组受体可以是单链多肽(例如CAR)，并且其部分在由所述T细胞表达时可以包含对于所述重组受体的功能活性所需的所述重组受体的连续氨基酸序列。在这样的实施方案中，所述重组受体的其部分可以具有重组受体的连续氨基酸序列，所述重组受体的连续氨基酸序列包含重组受体长度的至少约85％、至少约87％、至少约90％、至少约92％、至少约95％或至少约97％的序列长度，并且编码保留所述重组受体的活性(例如抗原结合和受体信号传导活性)的部分重组受体。

在任何实施方案的一些实施方案中，所述重组受体的其部分是所述重组受体的多肽链，例如，在所述重组受体由多条链组成(例如，含有α链和β链的TCR或多链CAR)的实施方案中。例如，所述重组受体的另一条链由所述工程化T细胞进一步单独表达。在任何实施方案的一些实施方案中，所述重组受体包含两条单独的多肽链，其中由所述转基因编码的所述重组受体的部分是所述重组受体的一条链，并且所述工程化T细胞还表达所述重组受体的另一条链。在任何实施方案的一些实施方案中，所述重组受体的另一条链由第二转基因编码，所述第二转基因单独地包含在所述T细胞中并且能够由所述T细胞表达。

在任何实施方案的一些实施方案中，所述嵌合受体是CAR，所述CAR是多链CAR。在一些例子中，所述转基因编码所述多链CAR，如所述多链CAR的完整或整个序列，例如具有两条链的多链CAR的第一链和第二链。在这样的例子中，所述多链CAR的单独的链可以通过多顺反子元件(如核糖体跳跃元件(例如T2A或P2A))或IRES来隔开。在其他例子中，所述转基因编码所述多链CAR的一条链，并且所述多链CAR的另一条链由所述工程化细胞单独编码，例如通过第二转基因编码。在所提供的任何实施方案的一些实施方案中，所述工程化T细胞能够表达保留或展现抗原结合和受体信号传导活性的完全功能性重组多链CAR，如在所述T细胞中的刺激或激活信号之后。

在任何实施方案的一些实施方案中，所述重组受体是重组T细胞受体(TCR)。在任何实施方案的一些实施方案中，所述重组TCR包含α(TCRα)链和β(TCRβ)链，并且所述转基因包含编码所述TCRα链的核酸序列和/或编码所述TCRβ链的核酸序列。在一些例子中，所述转基因编码所述TCR，如包含所述TCRα和所述TCRβ链的TCR的完整或整个序列。在这样的例子中，所述TCR的单独的链可以通过多顺反子元件(如核糖体跳跃元件(例如T2A或P2A))或IRES来隔开。在任何实施方案的一些实施方案中，所述转基因编码所述TCRα链或所述TCRβ链中的一个，并且所述TCRα链或所述TCRβ链中的另一个由所述工程化细胞单独编码，例如由第二转基因编码。在所提供的任何实施方案的一些实施方案中，所述工程化T细胞能够表达保留或展现抗原结合和受体信号传导活性的完全功能性重组TCR，如在所述T细胞中的刺激或激活信号之后。

在任何实施方案的一些实施方案中，所述重组受体是包含TCRα和TCRβ链的TCR。在任何实施方案的一些实施方案中，所述TCRα链包含含有一个或多个引入的半胱氨酸残基的恒定(Cα)区和/或所述TCRβ链包含含有一个或多个引入的半胱氨酸残基的Cβ区，其中所述一个或多个引入的半胱氨酸残基能够在所述α链与所述β链之间形成一个或多个非天然二硫桥。在任何实施方案的一些实施方案中，所述一个或多个引入的半胱氨酸残基包括用半胱氨酸残基替代非半胱氨酸残基。在任何实施方案的一些实施方案中，所述Cα区包含在对应于位置48的位置处的半胱氨酸，其中编号如SEQ ID NO:92所示；和/或所述Cβ区包含在对应于位置57的位置处的半胱氨酸，其中编号如SEQ ID NO:96所示。

在任何实施方案的一些实施方案中，所述转基因包含编码至少一种另外的蛋白质的核苷酸序列。在任何实施方案的一些实施方案中，所述至少一种另外的蛋白质是替代标记物，如用于监测所述工程化T细胞的重组受体表达或充当对于所述工程化T细胞的重组受体表达的替代物的标记物。在任何实施方案的一些实施方案中，所述替代标记物是截短的受体。在任何实施方案的一些实施方案中，所述截短的受体缺少细胞内信号传导结构域和/或在与其配体结合时不能介导细胞内信号传导。

在任何实施方案的一些实施方案中，所述转基因还包含一个或多个多顺反子元件。在任何实施方案的一些实施方案中，所述一个或多个多顺反子元件包含编码选自T2A、P2A、E2A或F2A的核糖体跳跃元件或内部核糖体进入位点(IRES)的序列。

在任何实施方案的一些实施方案中，所述多顺反子元件定位于编码所述CAR的核苷酸序列与编码所述至少一种另外的蛋白质的核苷酸序列之间。在任何实施方案的一些实施方案中，所述重组受体是重组TCR，并且所述多顺反子元件定位于编码所述TCRα的核苷酸序列与编码所述TCRβ的核苷酸序列之间。在任何实施方案的一些实施方案中，所述重组受体是多链CAR，并且所述多顺反子元件定位于编码所述多链CAR的一条链的核苷酸序列与编码所述多链CAR的另一条链的核苷酸序列之间。在任何实施方案的一些实施方案中，所述一个或多个多顺反子元件在编码所述重组受体的核苷酸序列的上游。

在任何实施方案的一些实施方案中，所述经修饰的T细胞刺激相关基因座是通过将编码所述重组受体的转基因整合至所述内源T细胞刺激相关基因座中产生的，如通过使用同源定向修复的基因编辑来产生。在任何实施方案的一些实施方案中，通过以下方式进行整合：a)在内源T细胞刺激相关基因座处或附近的一个或多个靶位点处诱导基因破坏；以及b)引入多核苷酸以用于同源定向修复(HDR)。

在任何实施方案的一些实施方案中，将编码所述重组受体的转基因整合在所述T细胞刺激相关基因座中的至少一个靶位点处或附近。在任何实施方案的一些实施方案中，所述基因破坏是通过特异性结合至、识别或杂交至所述靶位点的锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)或CRISPR-Cas9组合实现的。在任何实施方案的一些实施方案中，所述基因破坏是通过CRISPR-Cas9组合实现的，并且所述CRISPR-Cas9组合包含具有与所述至少一个靶位点互补的靶向结构域的指导RNA(gRNA)。在任何实施方案的一些实施方案中，所述CRISPR-Cas9组合是包含所述gRNA和Cas9蛋白的核糖核蛋白(RNP)复合物。在任何实施方案的一些实施方案中，所述基因破坏是通过经由电穿孔引入多个T细胞中的RNP实现的。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是PDCD1。在任何实施方案的一些实施方案中，所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与PDCD1基因中的靶位点互补的靶向结构域。在任何实施方案的一些实施方案中，所述gRNA包含SEQ ID NO:75和104-109中任一个所示的序列。在任何实施方案的一些实施方案中，所述gRNA包含SEQ ID NO:75所示的序列。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是CD69。在任何实施方案的一些实施方案中，所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与CD69基因中的靶位点互补的靶向结构域。在任何实施方案的一些实施方案中，所述gRNA包含SEQ ID NO:116-121中任一个所示的序列。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是Nur77。在任何实施方案的一些实施方案中，所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与Nur77基因中的靶位点互补的靶向结构域。在任何实施方案的一些实施方案中，所述gRNA包含SEQ ID NO:122-127和134-136所示的序列。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是FoxP3。在任何实施方案的一些实施方案中，所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与FoxP3基因中的靶位点互补的靶向结构域。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是HLA-DR基因座。在任何实施方案的一些实施方案中，所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与HLA-DR基因中的靶位点互补的靶向结构域。

在任何实施方案的一些实施方案中，所述T细胞还包含内源T细胞受体α恒定区(TRAC)基因和/或内源T细胞受体β恒定区(TRBC)基因处的基因破坏。在任何实施方案的一些实施方案中，所述T细胞还包含内源T细胞受体α恒定区(TRAC)基因处的基因破坏。在任何实施方案的一些实施方案中，所述T细胞还包含内源T细胞受体α恒定区(TRBC)基因处的基因破坏。在任何实施方案的一些实施方案中，所述T细胞还包含内源T细胞受体α恒定区(TRAC)基因和内源T细胞受体β恒定区(TRBC)基因处的基因破坏。在任何实施方案的一些实施方案中，所述基因破坏是通过特异性地结合至、识别或杂交至至少一个靶位点(如所述TRAC基因或TRBC基因(TRBC1或TRBC2基因)内的至少一个靶位点)的锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)或CRISPR-Cas9组合实现的。在任何实施方案的一些实施方案中，所述基因破坏是通过CRISPR-Cas9组合实现的，并且所述CRISPR-Cas9组合包含具有与所述至少一个靶位点互补的靶向结构域的指导RNA(gRNA)。在任何实施方案的一些实施方案中，所述CRISPR-Cas9组合是包含所述gRNA和Cas9蛋白的核糖核蛋白(RNP)复合物。在任何实施方案的一些实施方案中，所述基因破坏是通过经由电穿孔引入多个T细胞中的RNP实现的。

在任何实施方案的一些实施方案中，所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与所述TRAC基因或TRBC基因(TRBC1或TRBC2基因)内的至少一个靶位点互补的靶向结构域。在任何实施方案的一些实施方案中，所述gRNA具有与TRAC基因中的靶位点互补的靶向结构域。在任何实施方案的一些实施方案中，所述gRNA包含SEQ ID NO:77和188-218中任一个所示的序列。在任何实施方案的一些实施方案中，所述gRNA包含SEQ ID NO:77所示的序列。在任何实施方案的一些实施方案中，所述gRNA具有与TRBC基因中的靶位点互补的靶向结构域。在任何实施方案的一些实施方案中，所述gRNA包含SEQ ID NO:219-276中任一个所示的序列。

在任何实施方案的一些实施方案中，与包含存在于所述T细胞的基因组中的不同位置处或存在于所述T细胞的基因组中的随机位置处的编码相同重组受体的转基因的工程化T细胞相比，在所述T细胞中不存在刺激或激活信号的情况下，通过编码的重组受体的细胞内信号传导结构域的信号传导活性降低大于或大于约10％、15％、20％、25％、30％、40％、50％或更多。

在任何实施方案的一些实施方案中，所述T细胞是CD8+T细胞或CD4+T细胞或其亚型。在任何实施方案的一些实施方案中，所述T细胞是源自受试者的原代T细胞。在任何实施方案的一些实施方案中，所述受试者是人。在一些实施方案中，所述T细胞是源自人受试者的原代T细胞。在一些实施方案中，所述T细胞是原代人T细胞。在任何实施方案的一些实施方案中，所述T细胞源自多潜能或多能细胞。在任何实施方案的一些实施方案中，所述T细胞源自iPSC。

还提供了含有多种任何所提供的工程化细胞的组合物。在任何实施方案的一些实施方案中，所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约6、12、18、24、36或48小时内在所述组合物中的一个或多个细胞中被上调或诱导。在任何实施方案的一些中，在所述T细胞中的刺激或激活信号之后，在所述组合物中的细胞中表达所述可操作地连接的转基因的细胞的频率大于或大于约50％、60％、70％、75％、80％、85％、90％或95％或更多。在任何实施方案的一些实施方案中，在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述组合物中的一个或多个细胞中被降低或下调。

在任何实施方案的一些实施方案中，在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，在组合物中的细胞中表达所述可操作地连接的转基因的细胞的频率降低大于或大于约30％、40％、50％、60％、70％、75％、80％、85％、90％或95％或更多。在任何实施方案的一些实施方案中，在表达的上调或诱导之后，在所述T细胞中的所述刺激或激活信号之后为或约1、2、3、4、5、6、7或8天或更长时间之后，所述可操作地连接的转基因的表达在所述组合物中的一个或多个细胞中被降低或下调。

在任何实施方案的一些实施方案中，在所述T细胞中所述刺激或激活信号降低或不存在之后小于或小于约6、12、18、24、36或48小时内，在所述组合物中的一个或多个细胞中所述可操作地连接的转基因的表达被降低或下调。在任何实施方案的一些实施方案中，在所述T细胞中所述刺激或激活信号降低或不存在之后，在所述组合物中的细胞中表达所述重组受体的细胞的频率小于或小于约50％、40％、30％、25％、20％、15％、10％或5％或更少。

在任何实施方案的一些实施方案中，所述组合物包含CD4+T细胞和/或CD8+T细胞。在任何实施方案的一些实施方案中，所述组合物包含CD4+和CD8+T细胞，并且CD4+与CD8+T细胞的比率是从或从约1:3至3:1。在任何实施方案的一些实施方案中，1:1。

还提供了多核苷酸，所述多核苷酸包含(a)编码重组受体或其一部分的转基因，和(b)与所述转基因连接的一个或多个同源臂，其中所述一个或多个同源臂包含与T细胞中的内源T细胞刺激相关基因座的一个或多个区域同源的序列。

在任何实施方案的一些实施方案中，当所述重组受体由引入了所述多核苷酸的细胞表达时，所述重组受体或其一部分由含有编码所述重组受体或其一部分的转基因的经修饰的T细胞刺激相关基因座编码。在任何实施方案的一些实施方案中，所述转基因是对于T细胞的内源T细胞刺激相关基因座的开放阅读框而言外源的或异源的序列。

在任何实施方案的一些实施方案中，所述T细胞是原代人T细胞。在任何实施方案的一些实施方案中，所述T细胞是源自受试者的T细胞。在任何实施方案的一些实施方案中，所述受试者是人。在任何实施方案的一些实施方案中，所述T细胞是人T细胞。

在任何实施方案的一些实施方案中，所述一个或多个同源臂包含5'同源臂和/或3'同源臂。在任何实施方案的一些实施方案中，所述5’同源臂和所述3'同源臂包含与靶位点周围的核酸序列同源的核酸序列，其中所述靶位点在所述T细胞刺激相关基因座内。在任何实施方案的一些实施方案中，所述靶位点位于所述T细胞刺激相关基因座的内源转录调节元件的下游。

在任何实施方案的一些实施方案中，所述多核苷酸包含结构[5'同源臂]-[转基因]-[3'同源臂]。在任何实施方案的一些实施方案中，所述5'同源臂和所述3'同源臂包含与所述至少一个靶位点周围的核酸序列同源的核酸序列。在任何实施方案的一些实施方案中，所述5'同源臂和所述3'同源臂的长度独立地在为或约50与为或约750个核苷酸之间、为或约50与为或约500个核苷酸之间、为或约50与为或约250个核苷酸之间、为或约50与为或约100个核苷酸之间、为或约100与为或约750个核苷酸之间、为或约100与为或约500个核苷酸之间、为或约100与为或约250个核苷酸之间、为或约250与为或约750个核苷酸之间、为或约250与为或约500个核苷酸之间。在任何实施方案的一些实施方案中，所述5'同源臂和所述3'同源臂的长度独立地是为或约50、60、70、80、90、100、150、200、250、300、400或500个核苷酸，或任何前述值之间的任何值。在任何实施方案的一些实施方案中，所述5'同源臂和所述3'同源臂的长度独立地小于或小于约100个核苷酸。在任何实施方案的一些实施方案中，所述5'同源臂和所述3'同源臂的长度独立地是为或约50、60、70、80或90个核苷酸，或任何前述值之间的任何值。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座选自PDCD1、CD69、Nur77、FoxP3和HLA-DR基因座。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是PDCD1。在任何实施方案的一些实施方案中，所述5'同源臂和所述3'同源臂包含与PDCD1的一个或多个区域同源的序列。在任何实施方案的一些实施方案中，所述5'同源臂包含：a)含有与SEQ IDNO:66所示的序列展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列的为或至少为或至少150、200、250、300、350、400、450、500、550或600个连续核苷酸的序列；b)含有SEQ ID NO:66所示的序列的为或至少为或至少150、200、250、300、350、400、450、500、550或600个连续核苷酸的序列；或c)SEQ ID NO:66所示的序列。在任何实施方案的一些实施方案中，所述3'同源臂包含：a)含有与SEQ ID NO:67所示的序列展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列的为或至少为或至少150、200、250、300、350、400、450、500、550或600个连续核苷酸的序列；b)含有SEQ ID NO:67所示的序列的为或至少为或至少150、200、250、300、350、400、450、500、550或600个连续核苷酸的序列；或c)SEQ ID NO:67所示的序列。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是CD69。在任何实施方案的一些实施方案中，所述5'同源臂和所述3'同源臂包含与CD69的一个或多个区域同源的序列。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是Nur77。在任何实施方案的一些实施方案中，所述5'同源臂和所述3'同源臂包含与Nur77的一个或多个区域同源的序列。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是FoxP3。在任何实施方案的一些实施方案中，所述5'同源臂和所述3'同源臂包含与FoxP3的一个或多个区域同源的序列。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是HLA-DR基因座。在任何实施方案的一些实施方案中，所述5'同源臂和所述3'同源臂包含与HLA-DR基因座的一个或多个区域同源的序列。

在任何实施方案的一些实施方案中，所述重组受体包含细胞内区域，所述细胞内区域含有所述T细胞受体(TCR)复合物的组分的细胞内信号传导结构域，并且所述T细胞中的所述刺激或激活信号包含通过所述重组受体中存在的细胞内信号传导结构域的信号，或者所述重组受体包含细胞内区域，所述细胞内区域含有包含免疫受体酪氨酸激活基序(ITAM)的细胞内信号传导结构域，并且所述T细胞中的所述刺激或激活信号包含通过所述重组受体中存在的细胞内信号传导结构域的信号。

在任何实施方案的一些实施方案中，所述重组受体包含胞外区域，所述胞外区域含有能够结合或识别药剂的结合结构域。在任何实施方案的一些实施方案中，在所述药剂结合后，在所述T细胞中诱导了刺激或激活信号。

在任何实施方案的一些实施方案中，所述药剂是靶抗原。在任何实施方案的一些实施方案中，所述靶抗原是重组蛋白或在细胞表面上表达的抗原。在任何实施方案的一些实施方案中，所述靶抗原与疾病、障碍或病症的细胞或组织相关，为疾病、障碍或病症的细胞或组织所特有，或在疾病、障碍或病症的细胞或组织上表达。在任何实施方案的一些实施方案中，所述疾病、障碍或病症是感染性疾病或障碍、自身免疫性疾病、炎性疾病、或肿瘤或癌症。在任何实施方案的一些实施方案中，所述靶抗原是肿瘤抗原。在任何实施方案的一些实施方案中，所述靶抗原选自αvβ6整合素(avb6整合素)、B细胞成熟抗原(BCMA)、B7-H3、B7-H6、碳酸酐酶9(CA9，也称为CAIX或G250)、癌症-睾丸抗原、癌症/睾丸抗原1B(CTAG，也称为NY-ESO-11和LAGE-12)、癌胚抗原(CEA)、细胞周期蛋白、细胞周期蛋白A2、C-C基序趋化因子配体1(CCL-11)、CD19、CD20、CD22、CD23、CD24、CD30、CD33、CD38、CD44、CD44v6、CD44v7/8、CD123、CD133、CD138、CD171、硫酸软骨素蛋白聚糖4(CSPG4)、表皮生长因子蛋白(EGFR)、表皮生长因子受体III型突变体(EGFR vIII)、上皮糖蛋白2(EPG-12)、上皮糖蛋白40(EPG-40)、肝配蛋白B2、肝配蛋白受体A2(EPHa2)、雌激素受体、Fc受体样蛋白5(FCRL5；也称为Fc受体同源物5或FCRH5)、胎儿乙酰胆碱受体(胎儿AchR)、叶酸结合蛋白(FBP)、叶酸受体α、神经节苷脂GD2、O-乙酰化GD2(OGD2)、神经节苷脂GD3、糖蛋白100(gp100)、磷脂酰肌醇蛋白聚糖-3(GPC3)、G蛋白偶联受体C类5族成员D(GPRC5D)、Her2/neu(受体酪氨酸激酶erb-B2)、Her3(erb-B3)、Her4(erb-B4)、erbB二聚体、人高分子量黑色素瘤相关抗原(HMW-MAA)、乙型肝炎表面抗原、人白细胞抗原A1(HLA-A1)、人白细胞抗原A2(HLA-A2)、IL-122受体α(IL-122Rα)、IL-113受体α2(IL-113Rα2)、激酶插入结构域受体(kdr)、κ轻链、L1细胞粘附分子(L1-CAM)、L1-CAM的CE7表位、含有富亮氨酸重复序列的蛋白8家族成员A(LRRC8A)、LewisY、黑色素瘤相关抗原(MAGE)-A1、MAGE-A3、MAGE-A6、MAGE-A10、间皮素(MSLN)、c-Met、鼠类巨细胞病毒(CMV)、粘蛋白1(MUC1)、MUC16、自然杀伤细胞2族成员D(NKG2D)配体、黑色素A(MART-11)、神经细胞粘附分子(NCAM)、癌胚胎抗原、黑色素瘤优先表达抗原(PRAME)、孕酮受体、前列腺特异性抗原、前列腺干细胞抗原(PSCA)、前列腺特异性膜抗原(PSMA)、受体酪氨酸激酶样孤儿受体1(ROR1)、存活蛋白、滋养层糖蛋白(TPBG，也称为5T4)、肿瘤相关糖蛋白72(TAG72)、酪氨酸酶相关蛋白1(TRP1，也称为TYRP1或gp75)、酪氨酸酶相关蛋白2(TRP2，也称为多巴色素互变异构酶、多巴色素δ异构酶或DCT)、血管内皮生长因子受体(VEGFR)、血管内皮生长因子受体2(VEGFR2)、肾母细胞瘤1(WT-11)、病原体特有的或病原体表达的抗原、或与通用标签相关的抗原、和/或生物素化分子、和/或由HIV、HCV、HBV或其他病原体表达的分子。

在任何实施方案的一些实施方案中，所述药剂是抗独特型抗体。

在任何实施方案的一些实施方案中，所述重组受体是嵌合抗原受体(CAR)。在任何实施方案的一些实施方案中，所述CAR包含胞外区域、跨膜结构域和细胞内区域。在任何实施方案的一些实施方案中，所述胞外区域包含间隔子。在任何实施方案的一些实施方案中，所述间隔子可操作地连接在所述结合结构域与所述跨膜结构域之间。在任何实施方案的一些实施方案中，所述胞外区域包含结合结构域，所述结合结构域是或包含抗体或其抗原结合片段。

在任何实施方案的一些实施方案中，所述细胞内区域包含细胞内信号传导结构域。在任何实施方案的一些实施方案中，所述细胞内信号传导结构域是或包含CD3链的细胞内信号传导结构域。在任何实施方案的一些实施方案中，CD3-zeta(CD3ζ)链或其信号传导部分。在任何实施方案的一些实施方案中，所述细胞内区域包含一个或多个共刺激信号传导结构域。在任何实施方案的一些实施方案中，所述一个或多个共刺激信号传导结构域包含CD28、4-1BB或ICOS或其信号传导部分的细胞内信号传导结构域。在任何实施方案的一些实施方案中，所述共刺激信号传导区域包含4-1BB的细胞内信号传导结构域。

在任何实施方案的一些实施方案中，所述经修饰的T细胞刺激相关基因座编码作为CAR的重组受体，其中所述CAR从其N至C末端按顺序包含：所述胞外结合结构域、所述间隔子、所述跨膜结构域和细胞内区域。

在任何实施方案的一些实施方案中，所述转基因按顺序包含编码以下的核苷酸序列：胞外结合结构域，如scFv；间隔子，如包含来自人免疫球蛋白铰链(如来自IgG1、IgG2或IgG4)或其修饰形式的序列，如还包含CH2区和/或CH3区；和跨膜结构域，如来自人CD28；共刺激信号传导结构域，如来自人4-1BB；以及细胞内信号传导结构域，如CD3ζ链或其一部分；和/或所述经修饰的T细胞刺激相关基因座按顺序包含编码以下的核苷酸序列：胞外结合结构域如scFv；间隔子，如包含来自人免疫球蛋白铰链(如来自IgG1、IgG2或IgG4)或其修饰形式的序列，如还包含CH2区和/或CH3区；和跨膜结构域，如来自人CD28；共刺激信号传导结构域，如来自人4-1BB；以及细胞内信号传导结构域，如CD3ζ链或其一部分。

在任何实施方案的一些实施方案中，所述转基因编码所述重组受体。

在任何实施方案的一些实施方案中，所述转基因编码所述重组受体的一部分。在任何实施方案的一些实施方案中，所述重组受体含有两条单独的多肽链，其中由所述转基因编码的重组受体的所述部分是所述重组受体的一条链。在任何实施方案的一些实施方案中，所述重组受体的另一条链由第二转基因编码。

在任何实施方案的一些实施方案中，所述CAR是多链CAR。在任何实施方案中的一些实施方案中，转基因编码所述多链CAR的一条链。

在任何实施方案的一些实施方案中，所述重组受体是重组T细胞受体(TCR)。在任何实施方案的一些实施方案中，重组TCR包含α(TCRα)链和β(TCRβ)链，并且所述转基因包含编码所述TCRα链的核酸序列和/或编码所述TCRβ链的核酸序列。在任何实施方案的一些实施方案中，所述转基因编码所述TCRα链或所述TCRβ链中的一个。

在任何实施方案的一些实施方案中，所述TCRα链包含含有一个或多个引入的半胱氨酸残基的恒定(Cα)区和/或所述TCRβ链包含含有一个或多个引入的半胱氨酸残基的Cβ区，其中所述一个或多个引入的半胱氨酸残基能够在所述α链与所述β链之间形成一个或多个非天然二硫桥。在任何实施方案的一些实施方案中，所述一个或多个引入的半胱氨酸残基包括用半胱氨酸残基替代非半胱氨酸残基。在任何实施方案的一些实施方案中，所述Cα区包含在对应于位置48的位置处的半胱氨酸，其中编号如SEQ ID NO:92所示；和/或所述Cβ区包含在对应于位置57的位置处的半胱氨酸，其中编号如SEQ ID NO:96所示。

在任何实施方案的一些实施方案中，所述转基因包含编码至少一种另外的蛋白质的核苷酸序列。在任何实施方案的一些实施方案中，所述至少一种另外的蛋白质是替代标记物。在任何实施方案的一些实施方案中，所述替代标记物是截短的受体。在任何实施方案的一些实施方案中，所述截短的受体缺少细胞内信号传导结构域和/或在与其配体结合时不能介导细胞内信号传导。

在任何实施方案的一些实施方案中，所述多顺反子元件位于编码所述CAR的核苷酸序列与编码至少一种另外的蛋白质的核苷酸序列之间；所述重组受体是重组TCR，并且所述多顺反子元件位于编码所述TCRα的核苷酸序列与编码所述TCRβ的核苷酸序列之间；所述重组受体是多链CAR，并且所述多顺反子元件位于编码所述多链CAR的一条链的核苷酸序列与编码所述多链CAR的另一条链的核苷酸序列之间；和/或所述一个或多个多顺反子元件位于编码所述重组受体的核苷酸序列的上游。

在任何实施方案的一些实施方案中，所述多核苷酸是线性多核苷酸。在任何实施方案的一些实施方案中，所述多核苷酸是双链多核苷酸。在任何实施方案的一些实施方案中，所述多核苷酸是单链多核苷酸。在任何实施方案的一些实施方案中，所述多核苷酸包含于病毒载体中。在任何实施方案的一些实施方案中，所述病毒载体是AAV载体。在任何实施方案的一些实施方案中，所述病毒载体是逆转录病毒载体。在任何实施方案的一些实施方案中，所述病毒载体是慢病毒载体。

在任何实施方案的一些实施方案中，所述多核苷酸的长度是为或约1000、1250、1500、1750、2000、2250、2500、2750、3000、3250、3500、3750或4000个核苷酸或任何前述值之间的任何值。在任何实施方案的一些实施方案中，所述多核苷酸的长度在为或约1500与为或约2500个核苷酸之间，或者在为或约1750与为或约2250个核苷酸之间。

还提供了产生基因工程化T细胞的方法，所述方法包括：(a)将能够在T细胞的内源T细胞刺激相关基因座内的靶位点处诱导基因破坏的一种或多种药剂引入所述T细胞中；以及(b)将任何所提供的多核苷酸引入包含在T细胞刺激相关基因座处的基因破坏的T细胞中，其中所述方法产生经修饰的T细胞刺激相关基因座，所述经修饰的T细胞刺激相关基因座含有编码所述重组受体或其一部分的转基因。在任何实施方案的一些实施方案中，将编码重组受体或其一部分的所述转基因经由同源定向修复(HDR)整合在所述内源T细胞刺激相关基因座内。

还提供了产生基因工程化T细胞的方法，所述方法包括将包含编码重组受体或其一部分的转基因的多核苷酸引入T细胞中，所述T细胞具有在所述T细胞的T细胞刺激相关基因座内的基因破坏，其中将编码所述重组受体或其一部分的转基因经由同源定向修复(HDR)整合在所述内源T细胞刺激相关基因座内。

在任何实施方案的一些实施方案中，通过以下方式来进行所述基因破坏：向T细胞中引入能够在所述T细胞的内源T细胞刺激相关基因座内的靶位点处诱导基因破坏的一种或多种药剂。在任何实施方案的一些实施方案中，所述方法产生经修饰的T细胞刺激相关基因座，所述经修饰的T细胞刺激相关基因座含有编码重组受体或其一部分的转基因。

在任何实施方案的一些实施方案中，所述多核苷酸还包含与所述核酸序列连接的一个或多个同源臂，其中所述一个或多个同源臂包含与T细胞中的内源T细胞刺激相关基因座的一个或多个区域同源的序列。在任何实施方案的一些实施方案中，所述一个或多个同源臂包含5'同源臂和/或3'同源臂。在任何实施方案的一些实施方案中，所述5’同源臂和所述3'同源臂包含与靶位点周围的核酸序列同源的核酸序列，其中所述靶位点在所述T细胞刺激相关基因座内。

在任何实施方案的一些实施方案中，所述靶位点位于所述T细胞刺激相关基因座的内源转录调节元件的下游。

在任何实施方案的一些实施方案中，所述药剂是靶抗原。在任何实施方案的一些实施方案中，所述靶抗原是重组蛋白或在细胞表面上表达的抗原。在任何实施方案的一些实施方案中，所述靶抗原与疾病、障碍或病症的细胞或组织相关，为疾病、障碍或病症的细胞或组织所特有，或在疾病、障碍或病症的细胞或组织上表达。在任何实施方案的一些实施方案中，所述疾病、障碍或病症是感染性疾病或障碍、自身免疫性疾病、炎性疾病、或肿瘤或癌症。

在任何实施方案的一些实施方案中，所述靶抗原是肿瘤抗原、病原体特异性或病原体表达的抗原、炎性抗原或自身抗原。在任何实施方案的一些实施方案中，所述靶抗原是肿瘤抗原。在任何实施方案的一些实施方案中，所述靶抗原选自αvβ6整合素(avb6整合素)、B细胞成熟抗原(BCMA)、B7-H3、B7-H6、碳酸酐酶9(CA9，也称为CAIX或G250)、癌症-睾丸抗原、癌症/睾丸抗原1B(CTAG，也称为NY-ESO-11和LAGE-12)、癌胚抗原(CEA)、细胞周期蛋白、细胞周期蛋白A2、C-C基序趋化因子配体1(CCL-11)、CD19、CD20、CD22、CD23、CD24、CD30、CD33、CD38、CD44、CD44v6、CD44v7/8、CD123、CD133、CD138、CD171、硫酸软骨素蛋白聚糖4(CSPG4)、表皮生长因子蛋白(EGFR)、表皮生长因子受体III型突变体(EGFR vIII)、上皮糖蛋白2(EPG-12)、上皮糖蛋白40(EPG-40)、肝配蛋白B2、肝配蛋白受体A2(EPHa2)、雌激素受体、Fc受体样蛋白5(FCRL5；也称为Fc受体同源物5或FCRH5)、胎儿乙酰胆碱受体(胎儿AchR)、叶酸结合蛋白(FBP)、叶酸受体α、神经节苷脂GD2、O-乙酰化GD2(OGD2)、神经节苷脂GD3、糖蛋白100(gp100)、磷脂酰肌醇蛋白聚糖-3(GPC3)、G蛋白偶联受体C类5族成员D(GPRC5D)、Her2/neu(受体酪氨酸激酶erb-B2)、Her3(erb-B3)、Her4(erb-B4)、erbB二聚体、人高分子量黑色素瘤相关抗原(HMW-MAA)、乙型肝炎表面抗原、人白细胞抗原A1(HLA-A1)、人白细胞抗原A2(HLA-A2)、IL-122受体α(IL-122Rα)、IL-113受体α2(IL-113Rα2)、激酶插入结构域受体(kdr)、κ轻链、L1细胞粘附分子(L1-CAM)、L1-CAM的CE7表位、含有富亮氨酸重复序列的蛋白8家族成员A(LRRC8A)、Lewis Y、黑色素瘤相关抗原(MAGE)-A1、MAGE-A3、MAGE-A6、MAGE-A10、间皮素(MSLN)、c-Met、鼠类巨细胞病毒(CMV)、粘蛋白1(MUC1)、MUC16、自然杀伤细胞2族成员D(NKG2D)配体、黑色素A(MART-11)、神经细胞粘附分子(NCAM)、癌胚胎抗原、黑色素瘤优先表达抗原(PRAME)、孕酮受体、前列腺特异性抗原、前列腺干细胞抗原(PSCA)、前列腺特异性膜抗原(PSMA)、受体酪氨酸激酶样孤儿受体1(ROR1)、存活蛋白、滋养层糖蛋白(TPBG，也称为5T4)、肿瘤相关糖蛋白72(TAG72)、酪氨酸酶相关蛋白1(TRP1，也称为TYRP1或gp75)、酪氨酸酶相关蛋白2(TRP2，也称为多巴色素互变异构酶、多巴色素δ异构酶或DCT)、血管内皮生长因子受体(VEGFR)、血管内皮生长因子受体2(VEGFR2)、肾母细胞瘤1(WT-11)、病原体特有的或病原体表达的抗原、或与通用标签相关的抗原、和/或生物素化分子、和/或由HIV、HCV、HBV或其他病原体表达的分子。

在任何实施方案的一些实施方案中，所述基因破坏是通过特异性结合至、识别或杂交至所述靶位点的锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)或CRISPR-Cas9组合实现的。在任何实施方案的一些实施方案中，所述基因破坏是通过CRISPR-Cas9组合实现的，并且所述CRISPR-Cas9组合包含具有与所述至少一个靶位点互补的靶向结构域的指导RNA(gRNA)。在任何实施方案的一些实施方案中，所述CRISPR-Cas9组合是包含所述gRNA和Cas9蛋白的核糖核蛋白(RNP)复合物。在任何实施方案的一些实施方案中，所述基因破坏是通过经由电穿孔引入多个T细胞中的RNP实现的。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是FoxP3。

在任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是HLA-DR基因座。

在任何实施方案的一些实施方案中，所述T细胞还包含内源T细胞受体α恒定区(TRAC)基因和/或内源T细胞受体β恒定区(TRBC)基因处的基因破坏。在任何实施方案的一些实施方案中，所述基因破坏是通过特异性结合至、识别或杂交至所述TRAC、TRBC1和/或TRBC2基因内的至少一个靶位点的锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)或CRISPR-Cas9组合实现的。在任何实施方案的一些实施方案中，所述基因破坏是通过CRISPR-Cas9组合实现的，并且所述CRISPR-Cas9组合包含具有与所述至少一个靶位点互补的靶向结构域的指导RNA(gRNA)。在任何实施方案的一些实施方案中，所述CRISPR-Cas9组合是包含所述gRNA和Cas9蛋白的核糖核蛋白(RNP)复合物。在任何实施方案的一些实施方案中，所述基因破坏是通过经由电穿孔引入多个T细胞中的RNP实现的。在任何实施方案的一些实施方案中，所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与所述TRAC、TRBC1和/或TRBC2基因内的至少一个靶位点互补的靶向结构域。

在任何实施方案的一些实施方案中，所述gRNA具有与TRAC基因中的靶位点互补的靶向结构域。在任何实施方案的一些实施方案中，所述gRNA包含SEQ ID NO:77和188-218中任一个所示的序列。在任何实施方案的一些实施方案中，所述gRNA包含SEQ ID NO:77所示的序列。在任何实施方案的一些实施方案中，所述gRNA具有与TRBC基因中的靶位点互补的靶向结构域。在任何实施方案的一些实施方案中，所述gRNA包含SEQ ID NO:219-276中任一个所示的序列。

在任何实施方案的一些实施方案中，所述重组受体是嵌合抗原受体(CAR)。在任何实施方案的一些实施方案中，所编码的重组受体是或包含重组T细胞受体(TCR)。

在任何实施方案的一些实施方案中，所述RNP是经由电穿孔、粒子枪、磷酸钙转染、细胞压缩或挤压引入的。在任何实施方案的一些实施方案中，所述RNP是经由电穿孔引入的。在任何实施方案的一些实施方案中，所述RNP是经由电穿孔引入多个T细胞中的。在任何实施方案的一些实施方案中，所述RNP的浓度是从为或约1μM至为或约5μM。在任何实施方案的一些实施方案中，所述RNP的浓度是为或约2μM。

在任何实施方案的一些实施方案中，T细胞包含CD8+T细胞和/或CD4+T细胞或其亚型。在任何实施方案的一些实施方案中，所述T细胞是对于所述受试者而言自体的。在任何实施方案的一些实施方案中，所述T细胞是源自受试者的原代T细胞。在任何实施方案的一些实施方案中，所述受试者是人。在任何实施方案的一些实施方案中，所述T细胞是对于所述受试者而言同种异体的。在任何实施方案的一些实施方案中，所述T细胞源自多潜能或多能细胞。在任何实施方案的一些实施方案中，所述T细胞源自iPSC。

在任何实施方案的一些实施方案中，所述多核苷酸的长度是为或约1250、1500、1750、2000、2250、2500、2750、3000、3250、3500、3750或4000个核苷酸或任何前述值之间的任何值。在任何实施方案的一些实施方案中，所述多核苷酸的长度在为或约1500与为或约2500个核苷酸之间，或者在为或约1750与为或约2250个核苷酸之间。

在任何实施方案的一些实施方案中，将所述一种或多种药剂和所述多核苷酸同时或按任何顺序依序引入。在任何实施方案的一些实施方案中，将所述一种或多种药剂和所述多核苷酸同时引入。在任何实施方案的一些实施方案中，在引入所述一种或多种药剂之后引入所述多核苷酸。在任何实施方案的一些实施方案中，在引入所述药剂之后立即引入所述多核苷酸，或者在引入所述药剂之后约30秒、1分钟、2分钟、3分钟、4分钟、5分钟、6分钟、6分钟、8分钟、9分钟、10分钟、15分钟、20分钟、30分钟、40分钟、50分钟、60分钟、90分钟、2小时、3小时或4小时内引入所述多核苷酸。

在任何实施方案的一些实施方案中，在引入所述一种或多种药剂和/或所述多核苷酸之前，所述方法包括在刺激或激活一种或多种免疫细胞的条件下将所述细胞在体外与一种或多种刺激剂一起孵育。在任何实施方案的一些实施方案中，所述一种或多种刺激剂包含抗CD3和/或抗CD28抗体。在任何实施方案的一些实施方案中，所述一种或多种刺激剂包含含有抗CD3和/或抗CD28抗体的低聚体颗粒试剂。在任何实施方案的一些实施方案中，所述一种或多种刺激剂包含用抗CD3和/或抗CD28抗体包被的珠。

在任何实施方案的一些实施方案中，所述方法还包括在引入所述一种或多种药剂和/或引入所述多核苷酸之前、期间或之后，将所述细胞与一种或多种重组细胞因子一起孵育。在任何实施方案的一些实施方案中，所述一种或多种重组细胞因子选自IL-2、IL-7和IL-15。在任何实施方案的一些实施方案中，所述一种或多种重组细胞因子是以选自以下的浓度来添加的：从为或约10U/mL至为或约200U/mL的浓度的IL-2。在任何实施方案的一些实施方案中，将所述一种或多种重组细胞因子以为或约50IU/mL至为或约100U/mL的浓度添加；将IL-7以0.5ng/mL至50ng/mL的浓度添加。在任何实施方案的一些实施方案中，将所述一种或多种重组细胞因子以为或约5ng/mL至为或约10ng/mL的浓度添加和/或将IL-15以0.1ng/mL至20ng/mL的浓度添加。在任何实施方案的一些实施方案中，将所述一种或多种重组细胞因子以为或约0.5ng/mL至为或约5ng/mL的浓度添加。

在任何实施方案的一些实施方案中，所述孵育是在引入所述一种或多种药剂和引入所述多核苷酸之后进行的，持续至多或大约24小时、36小时、48小时、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、16天、17天、18天、19天、20天或21天。在任何实施方案的一些实施方案中，所述孵育进行至多或约7天。

还提供了使用任何所提供的方法生成的一个工程化T细胞或多个工程化T细胞。

还提供了一种组合物，所述组合物包含任何所提供的工程化细胞或多个任何所提供的工程化细胞。

还提供了一种组合物，所述组合物包含多个任何所提供的工程化细胞。

在任何实施方案的一些实施方案中，所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约6、12、18、24、36或48小时内在所述组合物中的一个或多个细胞中被上调或诱导。在任何实施方案的一些中，在所述T细胞中的刺激或激活信号之后，在所述组合物中的细胞中表达所述可操作地连接的转基因的细胞的频率大于或大于约50％、60％、70％、75％、80％、85％、90％或95％或更多。在任何实施方案的一些实施方案中，在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述组合物中的一个或多个细胞中被降低或下调。

还提供了治疗方法，所述治疗方法包括向患有疾病或障碍的受试者施用任何所提供的工程化细胞或任何所提供的工程化组合物。

还提供了任何所提供的工程化细胞或任何所提供的工程化组合物用于治疗疾病或障碍的用途。

还提供了任何所提供的工程化细胞或任何所提供的工程化组合物在制造用于治疗疾病或障碍的药物中的用途。

还提供了任何所提供的工程化细胞或任何所提供的工程化组合物，所述工程化细胞或所述工程化组合物用于治疗疾病或障碍。

在任何实施方案的一些实施方案中，所述疾病或障碍是癌症或肿瘤。在任何实施方案的一些实施方案中，所述癌症或所述肿瘤是血液恶性肿瘤。在任何实施方案的一些实施方案中，所述癌症或所述肿瘤是淋巴瘤、白血病或浆细胞恶性肿瘤。在任何实施方案的一些实施方案中，所述癌症是淋巴瘤，并且所述淋巴瘤是伯基特淋巴瘤、非霍奇金淋巴瘤(NHL)、霍奇金淋巴瘤、华氏巨球蛋白血症、滤泡性淋巴瘤、小无裂细胞性淋巴瘤、粘膜相关淋巴组织淋巴瘤(MALT)、边缘区淋巴瘤、脾淋巴瘤、结节单核细胞样B细胞淋巴瘤、免疫母细胞淋巴瘤、大细胞淋巴瘤、弥漫性混合细胞淋巴瘤、肺B细胞血管中心淋巴瘤、小淋巴细胞淋巴瘤、原发性纵隔B细胞淋巴瘤、淋巴浆细胞性淋巴瘤(LPL)或套细胞淋巴瘤(MCL)。在任何实施方案的一些实施方案中，所述癌症是白血病，并且所述白血病是慢性淋巴细胞白血病(CLL)、浆细胞白血病或急性淋巴细胞白血病(ALL)。在任何实施方案的一些实施方案中，所述癌症是浆细胞恶性肿瘤，并且所述浆细胞恶性肿瘤是多发性骨髓瘤(MM)。

在任何实施方案的一些实施方案中，所述肿瘤是实体瘤。在任何实施方案的一些实施方案中，所述实体瘤是非小细胞肺癌(NSCLC)或头颈部鳞状细胞癌(HNSCC)。

还提供了试剂盒，所述试剂盒包含能够在T细胞刺激相关基因座内的靶位点处诱导基因破坏的一种或多种药剂；以及任何所提供的多核苷酸。

还提供试剂盒，所述试剂盒包含能够在T细胞刺激相关基因座内的靶位点处诱导基因破坏的一种或多种药剂；和包含编码嵌合受体或其一部分的核酸序列的多核苷酸，其中编码所述嵌合受体或其抗原结合片段或链的转基因被靶向用于经由同源定向修复(HDR)整合在所述靶位点处或附近；以及用于进行任何所提供的方法的说明书。

附图说明

图1显示了描绘条件性地表达重组受体的工程化T细胞的示意图。在一些情况下，重组受体的表达在T细胞刺激相关基因座的可操作控制下。在本文提供的示例性工程化T细胞中，含有经修饰的T细胞刺激相关基因座，所述经修饰的T细胞刺激相关基因座包含与所述T细胞刺激相关基因座的内源转录调节元件可操作地连接的编码重组受体或其一部分的转基因，所编码的重组受体可以在T细胞中的刺激或激活信号之后表达。在一些情况下，通过在编码内源TCR的组分的基因座(例如内源T细胞受体α恒定区(TRAC)基因和/或内源T细胞受体β恒定区(TRBC)基因)处引入基因破坏降低或抑制内源TCR表达。在一些情况下，如果由于表达靶抗原的靶细胞的消除降低或消除通过重组受体的信号转导，则重组受体的表达降低或消除。

图2显示了在第0天用含有抗CD3和抗CD28抗体的试剂刺激之后，表达包括各种T细胞刺激相关基因座的基因产物在内的各种标记物的细胞的百分比随着时间的变化。通过流式细胞术评估标记物的表达。在初始刺激之后第7天左右，使用相同的试剂再刺激细胞，并随时间评估表达标记物的细胞的百分比。

图3A-图3B描绘了在引入了含有靶向PDCD1的gRNA的核糖核蛋白(RNP)复合物(PD-1KO)、含有靶向TRAC的gRNA的RNP复合物(TRAC KO)、用于靶向PDCD1基因座进行HDR的含有CAR编码序列的多核苷酸(PD-1KI CAR)、用于靶向TRAC基因座进行HDR的含有CAR编码序列的多核苷酸(TRAC KI CAR)或其组合的细胞中，CD3、PD-1和嵌合抗原受体(CAR)的表达的流式细胞术图。

图4A-图4C显示了在初始刺激之后的休息时间之后或在初始刺激和休息之后的再刺激之后，在包含编码CAR的序列的工程化T细胞中在内源PDCD1基因座(PD-1KI CAR)或TRAC转录调节元件(TRAC KI CAR)的可操作控制下CD3、PD-1、CD69和嵌合抗原受体(CAR)的表达的流式细胞术图。

图5A-图5B显示了在初始刺激之后的休息时间之后或在初始刺激和休息之后的再刺激之后，在包含编码CAR的序列的工程化T细胞中在内源PDCD1基因座(PD-1KI CAR)或TRAC转录调节元件(TRAC KI CAR)的可操作控制下在有或没有再刺激的情况下CAR+细胞的百分比随时间的变化。

图6A描绘了在通过与辐照的CD19表达类淋巴母细胞系(LCL)共培养7天进行的第一轮刺激之后以及在通过与辐照的CD19表达LCL共培养进行的第二轮刺激之后，在电穿孔之后7天，在其中示例性抗CD19 CAR在内源PDCD1基因座的可操作控制下表达的细胞(PD1KI CAR)中在PDCD1启动子的控制下示例性抗CD19 CAR(PD1 KI CAR)(如使用抗独特型抗体检测)以及CD8的表达的流式细胞术图。图6B描绘了在PD1KI CAR细胞、PDCD1 KO细胞(仅用靶向PDCD1的RNP复合物电穿孔，而没有编码示例性CAR的多核苷酸；PD1 KO)、模拟处理的细胞(阴性对照)和/或使用慢病毒载体工程化的表达相同示例性CAR的细胞(LV对照)中，在细胞的第一轮和第二轮之后细胞的扩增倍数。

图7A描绘了在通过与辐照的CD19表达LCL共培养进行的第一轮刺激(第1次刺激)之后，在休息且无再刺激(休息)或经受再刺激(第2次刺激)的细胞中在PDCD1启动子的控制下示例性抗CD19 CAR(PD1 KI CAR)(如使用抗独特型抗体检测；aID)以及CD8的表达的流式细胞术图。图7B显示了在PD1 KO细胞、休息且无再刺激的PD1 KI CAR细胞(PD1 KI CAR休息)以及经受再刺激的PD1 KI CAR细胞(PD1 KI CAR再刺激)中，CAR表达的平均荧光强度(MFI)(如使用抗独特型抗体检测；左侧)、CAR表达细胞的百分比(中间)以及CD25+CD69+细胞的百分比(右侧)。图7C显示了在PD1 KO细胞、休息且无再刺激的PD1 KI CAR细胞(PD1 KICAR休息)以及经受再刺激的PD1 KI CAR细胞(PD1 KI CAR再刺激)中CAR表达的平均荧光强度(MFI)。图7D描绘了PD1KO细胞、休息且无再刺激的PD1 KI CAR细胞(PD1 KI CAR休息)以及经受再刺激的PD1KI CAR细胞(PD1 KI CAR再刺激)对于表达CD19的靶细胞的细胞毒性活性。模拟处理的细胞(阴性对照)、LV对照和人胚肾(HEK)细胞用作对照。

图8A描绘了用于评估小鼠模型中的体内抗肿瘤活性的时间线的示意图，所述小鼠模型注射了用萤火虫萤光素酶转染的Raji淋巴瘤肿瘤细胞以及在内源PDCD1基因座的可操作控制下(PD-1KI CAR)或通过慢病毒递送(LV对照)表达示例性抗CD19 CAR的细胞。图8B描绘了如通过生物发光测量平均辐射指示的随时间而变的肿瘤生长。图8C描绘了每组小鼠随时间而变的存活率。图8D描绘了小鼠的生物发光成像的结果，表明在第-1天、第7天、第14天和第28天存在肿瘤。

具体实施方式

本文提供了工程化细胞(如工程化T细胞)，其含有经修饰的基因座，如经修饰的T细胞刺激相关基因座。在一些方面，所述工程化细胞含有编码受体(例如，嵌合抗原受体或重组T细胞受体)或其一部分的异源或外源核酸序列(例如，转基因)，其任选地与T细胞刺激相关基因座的内源转录调节元件可操作地连接。在一些方面中，在T细胞中的刺激或激活信号之后，所述内源转录调节元件诱导或上调所述可操作地连接的核酸序列的表达。

在一些方面，由T细胞刺激相关基因座的转录调节元件的表达是响应于通过重组受体的细胞内信号区域、T细胞受体(TCR)组分的信号传导结构域和/或包含免疫受体酪氨酸激活基序(ITAM)的信号传导结构域的信号，如T细胞中的初级激活信号。在一些实施方案中，示例性T细胞刺激相关基因座包括但不限于PDCD1(编码PD-1)、CD69、Nur77(编码NR4A1)、FoxP3或HLA-DR基因座。

还提供了用于产生基因工程化细胞的方法，所述基因工程化细胞含有表达重组受体或其一部分的经修饰的T细胞刺激相关基因座。所提供的实施方案涉及将编码重组受体或其一部分的核酸序列特异性地靶向至内源T细胞刺激相关基因座。在一些情况下，所提供的实施方案涉及使用基因编辑方法诱导靶向基因破坏(例如DNA断裂的产生)以及用于在内源T细胞刺激相关基因座处靶向整合编码重组受体的核酸序列的同源定向修复(HDR)。还提供了用于在产生本文提供的工程化细胞和/或本文提供的方法中使用的相关细胞组合物、核酸和试剂盒。

基于T细胞的疗法如过继T细胞疗法(包括涉及施用工程化细胞的那些，所述工程化细胞表达对目的疾病或障碍具有特异性的重组、工程化或嵌合受体，如嵌合抗原受体(CAR)、重组T细胞受体(TCR)或者其他重组、工程化或嵌合受体)可以有效地治疗癌症以及其他疾病和障碍。在某些情境下，用于设计和产生用于过继细胞疗法的工程化细胞的其他途径可能并不总是完全令人满意。在一些方面，包含重组受体的工程化细胞可以在一些情况下靶向表达由重组受体识别的抗原的健康细胞。在一些情况下，表达重组受体的细胞不能区分患病细胞(例如，肿瘤细胞)和表达抗原的正常细胞。在一些方面，在所述工程化细胞靶向并去除患病细胞(例如，表达所述靶抗原的肿瘤细胞)之后，表达重组受体的细胞的持续的继续存在可能靶向表达所述抗原的健康细胞，从而导致不期望的效果。例如，在一些情况下，由于CAR表达细胞攻击CD19表达健康B细胞，因此在肿瘤清除后继续存在抗CD19 CAR表达细胞可能导致B细胞发育不全。

在一些方面，所提供的实施方案涉及在内源T细胞刺激相关基因座处诱导靶向基因破坏以及通过HDR整合编码重组受体或其一部分的转基因。在一些方面，编码重组受体或其一部分的转基因与T细胞刺激相关基因座的一个或多个内源转录调节元件可操作地连接。可操作地连接的转基因(例如，编码重组受体或其一部分的转基因)的表达由T细胞刺激相关基因座的内源转录调节元件(如启动子)控制。在一些方面，在T细胞中的刺激或激活信号之后，所述内源转录调节元件诱导或上调所述可操作地连接的转基因(例如，编码重组受体的转基因)的表达。在一些方面，在T细胞中的刺激或激活信号降低或不存在之后，所述内源转录调节元件降低或下调所述可操作地连接的转基因(例如，编码重组受体的转基因)的表达。因此，可以基于T细胞中刺激或激活相关信号的存在来控制重组受体的表达。

在一些方面，所提供的实施方案基于以下观察：在刺激或激活信号后瞬时诱导或上调了包含在T细胞刺激相关基因座(例如，PDCD1)的控制下表达的重组受体(例如，CAR)的T细胞。观察到重组受体在休息一段时间之后响应于再刺激信号而表达。观察到示例性T细胞刺激相关基因产物的表达在初始刺激信号(例如经由抗CD3和抗CD28抗体)后被诱导，其在初始刺激之后的一段时间内降低。在一定时间段之后的再刺激之后，示例性T细胞刺激相关基因产物的表达在降低之后增加。所提供的实施方案还基于以下观察：在再刺激之后，在T细胞刺激相关基因座(例如，PDCD1)的控制下表达的重组受体(例如，CAR)再次被诱导或再次上调，并且表达重组受体的T细胞能够有效杀伤靶细胞。

在一些方面，在T细胞刺激相关基因座的转录调节元件的可操作控制下的基因表达响应于T细胞刺激或激活信号。这种应答性允许调节重组受体的表达，并且有助于最小化对表达靶抗原的健康细胞的不期望的影响或表达重组受体的细胞的不期望的功能，且不会进一步损害表达重组受体的细胞的功能。

在一些情况下，T细胞刺激相关基因座的完全功能性或未修饰的内源基因产物在细胞中表达，使得内源基因产物和重组受体共表达。在一些情况下，所述T细胞刺激相关基因座的内源基因产物不表达或被敲除。

在一些方面，所述工程化细胞还包含对所述细胞中的一个或多个内源T细胞受体编码基因的基因破坏。例如，在T细胞中内源T细胞受体α恒定区(TRAC)基因和/或内源T细胞受体β恒定区(TRBC)基因被破坏。在一些方面，这种破坏还阻止了重组受体表达细胞内的抗原非依赖性强直性信号传导，并使T细胞中内源T细胞受体的未调节的表达最小化。在一些实施方案中，与包含随机整合的编码相同重组受体的转基因的工程化细胞相比，编码的重组受体的抗原非依赖性信号传导降低大于或大于约10％、15％、20％、25％、30％、40％、50％或更多。

在一些方面，所提供的实施方案提供了如下优点：细胞中的一个或多个内源T细胞受体编码基因的破坏以及在T细胞刺激相关基因座的转录调节元件的控制下的重组受体的表达产生了重组受体的表达的反馈回路。在此类情况下，T细胞的刺激或激活由通过重组受体的信号传导区域传递或转导的刺激信号(例如，由于重组受体结合或识别靶抗原所致)控制或依赖于通过重组受体的信号传导区域传递或转导的刺激信号，并且在不存在抗原特异性信号的情况下，刺激或激活信号降低或消除。在一些情况下，所述重组受体和表达所述重组受体的细胞保留其对靶细胞的细胞毒性功能，直到靶细胞被消除或靶细胞不再可用。在一些方面，在去除靶细胞(例如，表达靶抗原的患病细胞)之后，表达重组受体的细胞中的刺激或激活信号被降低，并且细胞变得较少应答或无应答，从而允许健康的正常细胞群体不受表达重组受体的细胞的影响。在一些情况下，所述内源T细胞受体的表达的缺乏阻止重组受体表达细胞的不期望的再激活。在一些实施方案中，所提供的细胞、组合物和方法可以导致改善的细胞疗法，特别是对于靶向或特异于肿瘤微环境中的抗原的细胞疗法。在一些情况下，所提供的细胞、组合物和方法还在控制和调节细胞疗法的细胞上的重组受体(例如，CAR)的表达方面提供了优点。在一些方面，所提供的工程化细胞和方法允许重组受体表达细胞的精细时间调节，并且最小化重组受体表达细胞的不期望的抗原非依赖性作用。在一些情况下，所提供的实施方案允许在施用重组受体表达细胞之后恢复健康细胞。

在一些上下文中，由本文提供的工程化细胞中的经修饰的T细胞刺激相关基因座编码的重组受体可以在T细胞刺激相关基因座的内源调节元件(例如顺式调节元件，如启动子)或内源T细胞刺激相关基因座的5'和/或3'非翻译区(UTR)的控制下编码。在一些方面，此类实施方案允许所述重组受体(例如，CAR)或其一部分被表达和/或将所述表达调节为与所述内源T细胞刺激相关基因座的表达相似的时间、持续时间、水平和相似的表达动力学。

在一些方面，整个重组受体或全长重组受体由工程化细胞中的经修饰的T细胞刺激相关基因座编码。在一些方面，重组受体的一部分(如重组受体的结构域或区域)或包含多条链的重组受体(例如，多链CAR或包含两条或更多条链的重组T细胞受体(TCR))的一条或多条链由工程化细胞中的经修饰的T细胞刺激相关基因座编码。在一些方面，其余部分(例如，重组受体的另一条链或另一个结构域)由存在于工程化细胞中的第二转基因编码。

在一些情境下，工程化细胞的最佳功效可以取决于所施用细胞的以下能力：表达重组受体(包括受体在细胞(如免疫细胞和/或治疗性细胞组合物中的细胞的群体)中具有均匀、同质、一致和/或调节的表达)，以及重组受体识别并结合至受试者、肿瘤及其环境内的靶标(例如，靶抗原)。在一些情况下，用于向细胞中引入重组受体(如CAR)的可用方法是通过随机整合编码重组受体的序列。在某些方面，此类方法并不完全令人满意。在一些方面，随机整合可能导致细胞中一个或多个基因座(包括可能对细胞功能和活性重要的那些)的可能的插入诱变和/或基因破坏。在一些情况下，由于将核酸序列整合至基因组中不期望的位置，例如整合至必需基因或对于调控细胞活性至关重要的基因中，将编码受体的转基因半随机或随机整合至细胞基因组中在一些情况下可能导致不良和/或不需要的影响。

在一些情况下，随机整合可能导致编码重组受体的序列的可变整合，这可能在细胞组合物(如治疗性细胞组合物)的细胞内导致不一致或未调节的表达、核酸的可变拷贝数和/或受体表达的可变性。在一些情况下，编码受体的核酸序列的随机整合可能导致核酸序列的多变的、异质的、不均匀的、未调节的和/或次最佳的表达或抗原结合、致癌转化和转录沉默，这取决于整合位点和/或核酸序列拷贝数。在一些方面，在细胞群中异质且不均匀的表达可能导致重组受体的表达和/或抗原结合的不一致性或不稳定性、工程化细胞的功能的不可预测性或功能的降低和/或不均匀的药物产品，从而降低工程化细胞的功效。在一些方面，特定随机整合载体(如某些慢病毒载体)的使用需要确认工程化细胞不含有有复制能力的病毒。需要改善的策略来实现重组受体的一致表达水平和功能，同时使核酸的随机整合和/或群体中的异质表达最小化。

在一些情境下，所提供的实施方案涉及工程化细胞以具有编码重组受体的核酸，所述核酸通过同源定向修复(HDR)整合至细胞(例如，T细胞)的内源T细胞刺激相关基因座中。在一些方面，HDR可以在靶位点(如内源T细胞刺激相关基因座)处或附近介导转基因(如编码重组受体或其一部分的转基因)的位点特异性整合。在一些实施方案中，基因破坏(例如，在内源T细胞刺激相关基因座的靶位点处)和含有一个或多个同源臂(例如，含有与基因破坏周围的序列同源的核酸序列)的模板多核苷酸的存在可以诱导或指导HDR，其中同源序列充当DNA修复的模板。基于基因破坏周围的内源基因序列与模板多核苷酸中所包括的同源臂之间的同源性，细胞DNA修复机器可以使用模板多核苷酸来修复DNA断裂并重合成基因破坏的位点处的遗传信息，从而将同源臂之间的序列(如编码重组受体或其部分的转基因)有效地插入或整合于基因破坏的位点处或附近。所提供的实施方案可以产生含有编码重组受体或其一部分的经修饰的T细胞刺激相关基因座的细胞，其中将编码重组受体或其一部分的转基因通过HDR整合至内源T细胞刺激相关基因座中。

在一些方面，所提供的实施方案在产生如下工程化细胞方面提供了优点，在所述工程化细胞中将编码所述重组受体的核酸改善地和/或更有效地靶向至所述细胞中；并且可以导致所述工程化细胞的改善的活性和/或功能。在一些情况下，所提供的实施方案使可能的半随机或随机整合和/或异质、未调节或多变的表达最小化，并导致重组受体的表达改善、均匀、同质、一致、调节和/或稳定或者具有降低的、低的或没有插入诱变的可能性。

在一些方面，与产生表达重组或嵌合受体(例如，TCR或CAR)的基因工程免疫细胞的其他方法相比，所提供的实施方案允许重组受体的更稳定、生理性、可控、调节的、均匀、一致和/或同质的表达。在一些情况下，所述方法导致产生更一致且更可预测的药物产品，例如含有工程化细胞的细胞组合物，所述药物产品可以为治疗的患者带来更安全的疗法。在一些方面，所提供的实施方案还允许在单一目的基因座或多个目的基因座处进行可预测且一致的整合。在一些实施方案中，所提供的实施方案还可以导致产生具有一致拷贝数(通常为1或2)的核酸的细胞群，所述核酸整合于所述群体的细胞中，这在一些方面提供细胞群内重组受体表达和内源受体基因表达的一致性。在一些情况下，所提供的实施方案不涉及使用病毒载体进行整合，因此可以减少确认工程化细胞不含有有复制能力的病毒的需要，从而改善细胞组合物的安全性。

还提供了用于工程化、制备和产生工程化细胞的方法，以及用于生成或产生工程化细胞的试剂盒和装置。还提供了通过所述方法产生的细胞和细胞组合物。还提供了含有编码重组受体或其部分的核酸序列的多核苷酸(例如，线性多核苷酸)，以及用于将此类多核苷酸引入细胞中的方法，如通过转导或通过物理递送，如电穿孔。还提供了含有工程化细胞的组合物，以及用于将所述细胞和组合物施用至受试者(如用于过继细胞疗法)的方法、试剂盒和装置。在一些方面，将细胞从受试者分离，工程化，并施用至同一受试者。在其他方面，将细胞从一名受试者分离，工程化，并施用至另一名受试者。在一些实施方案中，所提供的多核苷酸、转基因和/或载体在递送至免疫细胞中时导致可以调节T细胞活性并且(在一些情况下)可以调节T细胞分化或稳态的重组受体(例如，TCR或CAR)的表达。所得基因工程化细胞或细胞组合物可以用于过继细胞疗法方法中。

本申请中提及的所有出版物(包括专利文献、科学文章和数据库)出于所有目的通过引用以其整体并入，在程度上如同每个单独的出版物通过引用单独并入。如果本文所述的定义与通过引用并入本文的专利、申请、公开的申请和其他出版物中所述的定义相反或在其他方面不一致，则本文所述的定义优先于通过引用并入本文的定义。

本文使用的章节标题仅用于组织目的，而不应解释为限制所描述的主题。I.条件性地表达重组受体的细胞

本文提供了工程化免疫细胞(如工程化T细胞)，其含有存在于基因组基因座(如T细胞刺激相关基因座)处的编码重组受体或其一部分的转基因。在一些实施方案中，工程化细胞含有包含转基因(即，异源或外源核酸序列)的经修饰的T细胞刺激相关基因座，例如PDCD1、CD69、Nur77、FoxP3或HLA-DR基因座，所述转基因含有编码重组受体(例如，嵌合抗原受体或重组T细胞受体)或其一部分的核酸序列。在一些方面，编码重组受体或其一部分的核酸序列在T细胞刺激相关基因座的一个或多个内源调节元件的操作性控制下。在一些实施方案中，在T细胞中的刺激或激活信号之后，所述内源转录调节元件诱导或上调(如瞬时诱导或上调)可操作地连接的转基因(例如编码重组受体或其一部分的转基因)的表达。在一些情况下，在所提供的包含经修饰的T细胞刺激相关基因座的细胞中，编码的重组受体或其部分的表达类似于或模拟未修饰的细胞中T细胞刺激相关基因座的内源基因产物的表达。在一些方面，编码的重组受体或其一部分的表达的时间调节和水平以及动力学类似于T细胞刺激相关基因座的内源基因产物的那些。例如，在一些方面，编码的重组受体在T细胞中的刺激或激活信号之后被瞬时诱导或上调，并且在不存在这种信号的情况下被降低或下调。在一些方面，本发明提供的实施方案允许对编码的重组受体的表达进行精细且有条件的调节。

本文提供了工程化T细胞，其包含含有编码重组受体或其一部分的转基因的经修饰的T细胞刺激相关基因座，所述转基因与所述T细胞刺激相关基因座的内源转录调节元件可操作地连接，其中所述内源转录调节元件在T细胞中刺激或激活信号后诱导或上调所述可操作地连接的转基因的表达。在一些实施方案中，所述内源转录调节元件是内源T细胞刺激相关基因座的启动子。在一些方面，编码所述重组受体或其一部分的转基因存在于所述启动子的下游。

还提供了工程化细胞(如工程化T细胞)，其包含与T细胞刺激相关基因座的内源转录调节元件可操作地连接的编码重组受体或其一部分的核酸序列。在一些实施方案中，在T细胞中的刺激或激活信号之后，T细胞刺激相关基因座的内源转录调节元件响应于T细胞中的刺激或激活信号而诱导或上调可操作地连接的核酸序列的表达。在一些方面，所述内源T细胞刺激相关基因座的转录调节元件对T细胞中的刺激或激活信号有反应。

还提供了工程化T细胞，其包含与内源T细胞刺激相关基因座的转录调节元件可操作地连接的编码重组受体或其一部分的核酸，其中在T细胞中的刺激或激活信号之后，T细胞刺激相关基因座的内源转录调节元件响应于T细胞中的刺激或激活信号而诱导或上调可操作地连接的核酸序列的表达。还提供了工程化T细胞，其包含与内源T细胞刺激相关基因座的转录调节元件可操作地连接的编码重组受体或其一部分的核酸，其中内源T细胞刺激相关基因座的转录调节元件对T细胞中的刺激或激活信号有反应。

在一些实施方案中，在所述T细胞中的刺激或激活信号之后，所述可操作地连接的转基因的表达是暂时的。在一些方面，在表达的上调或诱导之后且在不存在进一步刺激或激活的情况下，或者在T细胞中的刺激或激活信号降低或不存在之后，所述表达被降低或下调。在一些实施方案中，在所述信号降低或不存在之后，所述可操作地连接的转基因的表达能够在所述T细胞中进一步刺激或激活信号之后再次被诱导或上调。

A.刺激或激活相关基因座和基因表达

在一些方面，提供了条件性地表达重组受体的工程化细胞。在一些实施方案中，所述工程化细胞含有编码重组受体的核酸序列，如转基因或异源序列。在一些方面，编码重组受体的转基因条件性地表达，例如，在工程化细胞或环境中存在特定条件或信号的情况下表达。在一些方面，在工程化细胞或环境中不存在特定条件或信号的情况下，所述重组受体不表达或所述表达降低。在一些方面，重组受体的表达由T细胞刺激相关基因座(如PDCD1(编码PD-1)、CD69、Nur77(编码NR4A1)、FoxP3或HLA-DR基因座)的一个或多个转录调节元件控制。在一些方面，所述工程化细胞含有经修饰的T细胞刺激相关基因座，所述经修饰的T细胞刺激相关基因座包含编码重组受体或其一部分的转基因。在一些方面，编码重组受体或其一部分的所述转基因与所述T细胞刺激相关基因座的内源转录调节元件可操作地连接，其中所述内源转录调节元件在T细胞中刺激或激活信号后诱导或上调所述可操作地连接的转基因的表达。在任何实施方案的一些实施方案中，所述内源转录调节元件是内源T细胞刺激相关基因座的启动子。

在一些方面，T细胞刺激相关基因座的表达(例如，在T细胞刺激相关基因座的内源转录调节元件的控制下的表达)在工程化细胞(例如工程化T细胞)中存在刺激或激活信号之后被诱导或上调。在一些方面，所述刺激或激活信号包括通过T细胞受体(TCR)组分的信号传导结构域的信号，和/或通过包含免疫受体酪氨酸激活基序(ITAM)的信号传导结构域的信号。例如，在一些方面，来自编码的重组受体(例如，CAR或TCR)的连接的信号可以提供激活或刺激信号，其诱导T细胞刺激相关基因座的表达。在一些方面，来自包含信号传导结构域(包含诸如ITAM之类的基序)的受体的连接的信号可以提供激活或刺激信号，其诱导T细胞刺激相关基因座的表达。

在一些实施方案中，在工程化T细胞中T细胞刺激或激活信号的存在可以诱导编码的重组受体的表达，并且可以导致进一步诱导编码的重组受体的表达或上调。在一些方面，编码的重组受体的表达的这种条件性调节可以导致正反馈回路或前馈回路，其可以允许在工程化T细胞中的刺激或激活信号之后增加或扩大重组受体的表达。在一些实施方案中，药剂与所述重组受体的胞外结合结构域的结合导致在所述细胞中诱导或传递所述刺激或激活信号。在一些实施方案中，在药剂与重组受体的胞外结合结构域结合后，T细胞中的刺激或激活信号通过重组受体的细胞内信号传导区域传递。

在一些方面，可操作地连接的转基因(例如，与T细胞刺激相关基因座的内源转录调节元件可操作地连接的编码重组受体或其一部分的转基因)的表达在T细胞中的刺激或激活信号之后小于或小于约6、12、18、24、36或48小时内被上调或诱导。在一些实施方案中，所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约24小时内被上调或诱导。在一些实施方案中，所述可操作地连接的转基因的表达被上调或诱导大于或大于约30％、40％、50％、60％、70％、75％、80％、85％、90％或95％或更多。在一些方面，所述上调或诱导是与在所述T细胞中的刺激或激活信号之前或不存在所述T细胞中的刺激或激活信号的情况下所述可操作地连接的转基因的表达，或者在所述T细胞中的刺激或激活信号之前所述可操作地连接的转基因的最小表达进行比较。

在一些方面，在存在T细胞中的刺激或激活信号的情况下，表达的诱导或上调是可重复控制的。在一些方面，这种受控制的表达确保了重组受体(例如，CAR)仅在T细胞被激活的环境中(如在存在由CAR识别的抗原的位点中)中高水平表达。在一些方面，一旦激活或刺激信号终止，如由于在肿瘤的细胞溶解性杀伤之后可能发生的抗原的损失，所述CAR的表达被下调或降低。在一些实施方案中，所述转基因的表达的诱导或上调是在刺激或激活信号期间暂时的，然后被降低或下调。

在一些实施方案中，在T细胞中的刺激或激活信号(例如，T细胞中的初始刺激或激活信号(例如，经由重组受体))以及随后的可操作地连接的转基因(例如，编码重组受体或其一部分的转基因)表达的上调或诱导之后，可操作地连接的转基因的表达被降低或下调。在一些实施方案中，在表达的上调或诱导之后，或在T细胞中刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达被降低或下调。

在一些实施方案中，在T细胞中的刺激或激活信号(例如，初始刺激或激活信号)之后表达的上调或诱导一定时间段之后，可操作地连接的转基因的表达被降低或下调。在一些实施方案中，T细胞中的刺激或激活信号是T细胞中的初始刺激或激活信号，并且所述可操作地连接的转基因的表达在T细胞中的初始刺激或激活信号之后为或约1、2、3、4、5、6、7或8天之后被降低或下调。在一些实施方案中，在表达的上调或诱导(在T细胞中的刺激或激活信号之后)之后，在所述T细胞中的初始刺激或激活信号之后为或约1、2、3、4、5、6、7或8天或更长时间之后，所述可操作地连接的转基因的表达被降低或下调。在一些实施方案中，在T细胞中的初始刺激或激活信号之后为或约2、3或4天或更长时间之后，所述可操作地连接的转基因的表达被降低或下调。在一些实施方案中，在T细胞中的初始刺激或激活信号之后为或约2天之后，所述可操作地连接的转基因的表达被降低或下调。

在一些实施方案中，在T细胞中的刺激或激活信号降低或不存在之后，可操作地连接的转基因(例如，编码重组受体或其一部分的转基因)的表达被降低或下调。在一些实施方案中，在所述T细胞中所述刺激或激活信号降低或不存在之后小于或小于约6、12、18、24、36或48小时内，所述可操作地连接的转基因的表达被降低或下调。在一些实施方案中，在所述T细胞中的刺激或激活信号之后或在所述T细胞中的刺激或激活信号降低或不存在之后，所述可操作地连接的转基因(例如，编码重组受体或其一部分的转基因)的表达被降低大于或大于约30％、40％、50％、60％、70％、75％、80％、85％、90％或95％或更多。在一些方面，所述降低是与例如在所述T细胞中的初始刺激或激活信号之后所述可操作地连接的转基因的最大表达进行比较。在一些方面，所述降低是与例如在所述T细胞中的初始刺激或激活信号之后所述可操作地连接的转基因的最大表达进行比较。

在一些方面中，编码的重组受体的表达的这种条件性调节可以导致在不存在刺激或激活信号的情况下(例如，在不存在靶抗原或靶细胞的情况下)可限制或阻止编码的重组受体的表达的反馈回路。这种条件性调节可以降低工程化细胞的非特异性激活或在不存在靶抗原的情况下工程化细胞的激活。在一些方面，在去除靶细胞(例如，表达靶抗原的恶性细胞或肿瘤细胞)之后，工程化T细胞可以表达更少的重组受体并且变得较少应答，从而允许健康细胞群体恢复并降低工程化细胞的非特异性激活或刺激。

在一些实施方案中，在所述信号降低或不存在之后，所述可操作地连接的转基因的表达能够在所述T细胞中进一步刺激或激活信号之后再次被诱导或上调。在一些实施方案中，在所述信号降低或不存在之后，所述可操作地连接的转基因的表达在所述T细胞中所述进一步刺激或激活信号之后小于或小于约6、12、18、24、36或48小时内被上调或诱导。在一些实施方案中，在所述信号降低或不存在之后，所述可操作地连接的转基因的表达在所述T细胞中所述进一步刺激或激活信号之后小于或小于约24小时内被上调或诱导。在一些实施方案中，所述可操作地连接的转基因的表达被上调或诱导大于或大于约30％、40％、50％、60％、70％、75％、80％、85％、90％或95％或更多。在一些方面，所述上调或诱导是与在所述T细胞中的进一步刺激或激活信号之前或不存在所述T细胞中的进一步刺激或激活信号的情况下所述可操作地连接的转基因的表达、在所述T细胞中的进一步刺激或激活信号之前所述可操作地连接的转基因的最小表达进行比较。在一些实施方案中，在所述T细胞中的进一步刺激或激活信号之后，重组受体的平均表达水平增加大于或大于约40％、50％、60％、70％、80％、90％、100％或更多。

在一些实施方案中，所述T细胞刺激相关基因座编码在T细胞上被瞬时上调或诱导的分子。在一些实施方案中，示例性T细胞刺激相关基因座包括PDCD1(编码PD-1)、CD69、Nur77(编码NR4A1)、FoxP3或HLA-DR基因座。在一些方面，所述转基因(例如，编码重组受体或其一部分的转基因)与内源PDCD1(编码PD-1)、CD69、Nur77(编码NR4A1)、FoxP3或HLA-DR基因座的转录调节元件(如启动子)可操作地连接。在一些实施方案中，将所述转基因(例如，编码重组受体或其一部分的转基因)整合在内源PDCD1(编码PD-1)、CD69、Nur77(编码NR4A1)、FoxP3或HLA-DR基因座处或附近。在一些方面，所述转基因与T细胞刺激相关基因座的启动子可操作地连接并被整合在其下游。在一些方面，所述转基因与内源PDCD1启动子可操作地连接并被整合在其下游。在一些方面，所述转基因与内源CD69启动子可操作地连接并被整合在其下游。在一些方面，所述转基因与内源Nur77启动子可操作地连接并被整合在其下游。在一些方面，所述转基因与内源FoxP3启动子可操作地连接并被整合在其下游。在一些方面，所述转基因与内源HLA-DR启动子可操作地连接并被整合在其下游。

在一些实施方案中，所述转基因(例如，编码重组受体或其一部分的转基因)与T细胞刺激相关基因座缔合、在其可操作控制下和/或由其调节。在一些实施方案中，所述重组受体由在内源T细胞刺激相关基因座的可操作控制下的核酸序列编码。在一些方面，转基因(例如，编码重组受体或其一部分的转基因)的表达由调节元件调节，所述调节元件对通过细胞内信号传导区域的信号的特征和/或强度和/或重组受体与靶抗原或表位的结合和/或识别有反应。在一些实施方案中，“T细胞刺激相关基因座”是这样的内源基因基因座，其对通过T细胞的TCR复合物的组分或包含含有TCR复合物的组分或其一部分的细胞内信号传导区域的重组受体转导的信号和/或受体(例如，T细胞受体(TCR)或重组受体)的抗原或表位结合有反应。在一些实施方案中，所述T细胞刺激相关基因座可以由作为T细胞的正常下游信号传导途径的一部分的典型因子调节。在一些实施方案中，抗原或表位结合和/或通过重组受体(例如，CAR或TCR)的细胞内信号传导区域的信号或活性诱导信号传导，所述信号传导诱导T细胞刺激相关基因座表达转基因(例如，编码重组受体的转基因)。然后可以监测内源基因产物和/或转基因的可检测表达作为T细胞激活的指示物。

在一些实施方案中，所述T细胞刺激相关基因座含有一个或多个调节元件(如一个或多个转录控制元件)，其表达依赖于TCR复合物的组分的激活或与之相关，凭借这种激活，调节结构域或元件由转录因子识别以驱动这种基因的表达。在一些实施方案中，所述T细胞刺激相关基因座含有启动子、增强子或其他应答元件或其部分，所述启动子、增强子或其他应答元件或其部分由转录因子识别以驱动基因的表达，所述基因的活性通常通过T细胞刺激或激活而被启动或激活。在一些实施方案中，所述T细胞刺激相关基因座可以含有转录因子的调节结构域或区域(例如，启动子、增强子或其他应答元件)，所述调节结构域或区域的活性通过T细胞刺激或激活而被启动。在一些实施方案中，所述T细胞刺激相关基因座对通过细胞内信号传导区域的信号的特征和/或强度和/或重组受体对靶抗原、配体或表位的结合和/或识别中的一种或多种有反应。在一些实施方案中，所述调节元件对内源TCR与抗原或表位结合的状态、T细胞刺激或激活、通过TCR的信号强度和/或通过内源TCR的细胞内信号传导区域的信号传导的特征中的一种或多种有反应。

在一些实施方案中，所述内源T细胞刺激相关基因座含有一个或多个调节元件(如转录调节元件，如启动子、增强子或应答元件)，所述一个或多个调节元件含有T细胞转录因子的一个或多个结合位点，因此与T细胞转录因子的下游活性有关。在一些实施方案中，所述转录因子是激活的T细胞的核因子(NFAT)、C/EBP、STAT1、STAT2或NF-κB。在一些实施方案中，所述T细胞刺激相关基因座含有由激活的T细胞的核因子(NFAT)、C/EBP、STAT1、STAT2或NF-κB识别的一个或多个应答元件。在一些实施方案中，所述T细胞刺激相关基因座可以含有由一种或两种以及在一些情况下三种或更多种独特的转录因子识别或对其有反应的一个或多个调节元件。

在一些实施方案中，所述T细胞刺激相关基因座包含由转录因子识别的一个或多个应答元件，所述转录因子在通过内源TCR复合物刺激T细胞时被激活。在一些实施方案中，基因的调节区域含有多个调节元件，所述多个调节元件可以对细胞中的多于一个信号传导途径有反应。在一些实施方案中，所述T细胞刺激相关基因座含有一个或多个由NFAT识别的调节元件。在一些实施方案中，所述T细胞刺激相关基因座含有一个或多个由NF-κB识别的调节元件。

在一些实施方案中，所述T细胞刺激相关基因座与NFAT活性和/或NFAT调节的信号转导相关。转录因子的NFAT家族在细胞因子基因和其他参与免疫应答(包括对T细胞激活的应答)的基因的转录调节中起作用。在一些实施方案中，所述T细胞刺激相关基因座含有调节元件(如启动子、增强子或应答元件)，其包含结合位点和/或被NFAT识别并且可以驱动转基因(例如，编码与其可操作地连接的重组受体的转基因)的表达。

在一些实施方案中，所述T细胞刺激相关基因座与NF-κB的活性和/或NF-κB介导的信号转导相关。NF-κB的激活依赖于TCR的刺激(即经由CD3信号传导)和经由CD28的共刺激，并且可以通过CD3和CD28二者的连接来调节。虽然CD28或CD3信号传导可以诱导NF-κB转录，但CD28与TCR信号传导(即CD3信号传导)的共连接可以产生更大的转录活性(Thaker等人(2015)Immunology Letters,163:113-119)。在一些实施方案中，所述T细胞刺激相关基因座可以是转录调节元件(如启动子、增强子或应答元件)，其含有一个或多个结合位点和/或被NF-κB识别并且可以驱动转基因(例如，编码与其可操作地连接的重组受体的转基因)的表达。在一些情况下，含有对NF-κB信号传导有反应的调节元件的T细胞刺激相关基因座可以是T细胞信号传导的特征以及TCR介导的信号传导和共刺激信号传导的存在的指示物。

在一些实施方案中，由T细胞刺激相关基因座的调节元件调节的表达依赖于T细胞信号传导、在T细胞信号传导后被诱导和/或上调。例如，所述调节结构域或元件可以是内源T细胞刺激相关基因座的启动子或其部分。在一些实施方案中，所述启动子或其部分可以含有结合位点和/或由一种或多种转录因子识别。

在一些实施方案中，所述T细胞刺激相关基因座含有转录调节元件(如启动子或增强子或其他应答元件)，其是调节T细胞转录因子的表达的内源基因基因座或其一部分，所述内源基因基因座是其表达可通过T细胞信号传导或激活来诱导的基因。在一些实施方案中，所述转录因子是激活的T细胞的核因子(NFAT)、神经生长因子IB(也称为Nur77、NR4A1)、C/EBP、STAT1、STAT2和NFκB。

在一些实施方案中，所述重组受体由在T细胞刺激相关基因座(如对通过抗原受体(如TCR复合物)的信号的特征和/或强度有反应的调节元件)的可操作控制下的核酸序列编码。在一些方面，所述T细胞刺激相关基因座对通过细胞内信号传导区域的信号的特征和/或强度有反应，和/或对重组受体(如与内源T细胞刺激相关基因座可操作地连接的受体)结合和/或识别靶抗原或表位有反应。

在所提供的任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是PDCD1。在一些实施方案中，所提供的工程化细胞包含经修饰的PDCD1基因座，所述经修饰的PDCD1基因座含有与PDCD1的内源转录调节元件可操作地连接的编码重组受体或其一部分的转基因。PDCD1编码抑制性受体程序性细胞死亡蛋白-1(PD-1；也称为PDCD1；CD279；PD-1；PD1；SLEB2；hPD-1；hPD-l；或hSLE1)，其是中枢和周围免疫耐受和免疫耗竭的介体。在一些方面，CD8 T细胞上的PD-1表达与通过T细胞受体(TCR)的信号的存在和/或强度相关。在一些方面，TCR刺激通过钙调磷酸酶途径启动信号级联，导致转录因子NFATc1(也称为NFAT2)的激活和易位。在一些方面，NFATc1参与CD4和CD8 T细胞中PD-1的初始激活诱导表达，并且其他调节机制也参与维持和增强表达慢性抗原暴露(参见例如，Bally等人,J Immunol(2016)196(6)2431-2437；Simon等人,Oncoimmunology.2018；7(1):e1364828；Arasanz等人,Oncotarget.2017年8月1日；8(31):51936–51945)。

在所提供的任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是CD69。在一些实施方案中，所提供的工程化细胞包含经修饰的CD69基因座，所述经修饰的CD69基因座含有与CD69的内源转录调节元件可操作地连接的编码重组受体或其一部分的转基因。CD69编码跨膜C型凝集素蛋白分化簇69(CD69；也称为AIM；BL-AC/P26；CLEC2C；EA1；GP32/28；或MLR-3)。CD69是在T细胞、造血干细胞、自然杀伤(NK)细胞、树突状细胞(DC)和其他免疫细胞中表达的早期激活标记物。CD69是在淋巴细胞激活过程中获得的早期诱导型细胞表面糖蛋白，参与淋巴细胞增殖，并在淋巴细胞(包括自然杀伤(NK)细胞和血小板)中充当信号传递受体。CD69表达被快速诱导，例如，在激活后早期(30-60min)在TCR/CD3接合后T淋巴细胞的表面上被检测到，从而激活细胞因子和多克隆、有丝分裂刺激。CD69基因的转录表达在4至6小时后迅速下降。可以早在刺激后2至3小时检测到CD69蛋白表达(参见例如，Alari-Pahissa等人,PLoS One.2012；7(10):e48593；Cibrian等人,Eur J Immunol.2017年6月；47(6):946–953)。

在所提供的任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是Nur77。在一些实施方案中，所提供的工程化细胞包含经修饰的Nur77基因座，所述经修饰的Nur77基因座含有与Nur77的内源转录调节元件可操作地连接的编码重组受体或其一部分的转基因。Nur77编码神经生长因子IB(NGFIB；也称为Nr4a1、神经生长因子IB(NGFIB)、GFRP1；Gfrp；HMR；Hbr-1；Hbr1；Hmr；N10；NAK-1；NGFI-B；NGFIB；NP10；Ngfi-b；孤儿核受体HMR；ST-59；TIS1；TR3；TR3孤儿受体；早期反应蛋白NAK1；生长因子诱导型核蛋白N10；激素受体；即刻早期基因转录因子NGFI-B；神经生长因子IB核受体变体1；神经生长因子诱导蛋白I-B；神经生长因子诱导蛋白I-B；神经孤儿核受体NUR77；nhr-6；nr4a1；核激素受体NUR/77；核蛋白N10；核受体亚家族4A族成员1；孤儿核受体NGFI-B；孤儿核受体NR4A1；孤儿核受体TR3；类固醇受体TR3；睾丸受体3；或zgc:92434)，即细胞内转录因子的Nur核受体家族成员。在一些情况下，Nur77表达对T细胞中的初级激活信号、来自T细胞受体(TCR)组分的信号传导结构域的信号和/或包含免疫受体酪氨酸激活基序(ITAM)的信号传导结构域敏感。在一些情况下，Nur77的表达对通过信号传导区域的信号是剂量反应性的。

Nur77是TCR刺激之后数小时内在T细胞中表达的即刻早期应答基因，并且可以由人淋巴细胞中的植物凝集素和对受阻滞的成纤维细胞的血清刺激诱导。Nur77是响应于通过内源TCR复合物的信号传导、来自内源TCR复合物的信号的激活、内源TCR的接合和/或经由参与来自TCR复合物的信号的含有免疫受体酪氨酸激活基序(ITAM)的分子(例如，CD3-ζ信号传导区域)而被诱导。Nur77基因产物本身通常可以结合与用于诱导基因的下游表达的若干个基因的启动子缔合的调节元件。Nur77的表达水平或程度可以用作T细胞信号(例如，TCR信号)的强度的指示物(Moran等人(2011)JEM,208:1279-1289)。因此，在一些实施方案中，与Nur77基因基因座或其部分的一个或多个转录调节元件可操作地连接的报告分子的表达可以提供T细胞信号传导的强度的指示物。此外，Nur77表达通常不受其他信号传导途径(如细胞因子信号传导或toll样受体(TLR)信号传导)的影响或作用(参见例如，Ashouri等人,(2017)J.Immunol.198:657-668)，其可以以细胞外在性方式起作用并且可以不依赖于通过重组受体的信号传导。

在所提供的任何实施方案的一些实施方案中，所述T细胞刺激相关基因座是FOXP3。在一些实施方案中，所提供的工程化细胞包含经修饰的FOXP3基因座，所述经修饰的FOXP3基因座含有与FOXP3的内源转录调节元件可操作地连接的编码重组受体或其一部分的转基因。FOXP3基因编码叉头盒P3(Foxp3；也称为scurfin、AIID、DIETER、IPEX、JM2、PIDX、XPID)，其是一种参与免疫系统应答的蛋白质，在一些情况下被认为是在调节性T细胞的发育和功能中的调节途径的调节物。FoxP3的表达由T细胞诱导，包括在刺激或激活之后在激活的非抑制性T细胞或抑制性T细胞中。所述表达在CD8+CD25+T细胞中是暂时的，但是在一些情况下，如在CD4+CD25+调节性T细胞中所述表达可以更稳定(参见例如，Kmieciak等人,JTransl Med.2009；7:89；Wang等人,Eur J Immunol.2007年1月；37(1):129-38；Yu等人,Oncol Lett.2018年6月；15(6):8187–8194)。

在任何所提供的实施方案的一些实施方案中，所述T细胞刺激相关基因座是HLA-DR基因座。在一些实施方案中，所提供的工程化细胞包含经修饰的HLA-DR基因座，所述经修饰的HLA-DR基因座含有与HLA-DR基因座的内源转录调节元件可操作地连接的编码重组受体或其一部分的转基因。HLA-DR是人II类主要组织相容性复合物(MHC)抗原，其在B淋巴细胞、单核细胞和巨噬细胞的表面上组成性地表达，并在T和NK细胞上出现于激活的晚期。在一些方面，HLA-DR是晚期激活标记物(参见例如，Bajnok等人,Mediators of Inflammation(2017)Article ID 8045161；Revenfeld等人,Int J Mol Sci.2017年7月；18(7):1603；Reddy等人,J.Immun.Methods.2004,293(1-2):127-142)。HLA-DR是由位于第6号染色体6p21.31区域上的人白细胞抗原复合物编码的MHC II类细胞表面受体。HLA-DR由若干个基因座和每个基因座上功能不同的若干个基因编码。DRα链由HLA-DRA基因座编码。DRβ链由若干个不同的基因座(包括HLA-DRB1至HLA-DRB9)编码，其中它们中仅有一些存在于每个个体中。HLA-DRB1基因座是普遍存在的，并且编码非常大量的功能可变的基因产物(HLA-DR1至HLA-DR17)(参见例如，Marsh等人,Tissue Antigens.2010年4月；75(4):291–455)。

在一些方面，可以通过在存在T细胞刺激或激活信号的情况下采用用于评估基因表达的测定来确定T细胞刺激相关基因座和/或转基因(例如，与T细胞刺激相关基因座可操作地连接的转基因)的表达的水平、量、模式和时间。在一些方面，检测T细胞刺激相关基因座和/或转基因(例如，与T细胞刺激相关基因座可操作地连接的转基因)的表达的水平、量、模式和时间包括进行体外测定或体内测定。

在一些实施方案中，所述测定包括检测表达的基因产物(例如，由T细胞刺激相关基因座编码的多肽或蛋白质)的水平的测定(例如，免疫测定、基于适配体的测定、组织学或细胞学测定)或检测表达的核糖核酸(RNA)的水平的测定(如mRNA表达水平测定)。在一些实施方案中，通过如下测定来检测所述T细胞刺激相关基因座和/或转基因(例如，与T细胞刺激相关基因座可操作地连接的转基因)的表达的水平、量、模式和时间，如免疫细胞化学或免疫组织化学、酶联免疫吸附测定(ELISA；包括直接、间接、夹心式、竞争性、多个和便携式ELISA(参见例如，美国专利号7,510,687))、蛋白质印迹(包括一维、二维或更高维度的印迹或其他色谱方法，任选地包括肽测序)、免疫印迹、免疫沉淀、放射免疫测定(RIA)、免疫染色、流式细胞术、表面等离子体共振(SPR)、化学发光测定、侧流免疫测定、抑制测定、亲合力测定、基于核酸或基于蛋白质的适配体技术、高效液相色谱法(HPLC)、肽测序(如Edman降解测序或任选地偶联至HPLC的质谱法(如MS/MS))以及任何前述项的微阵列适应(包括核酸、抗体或蛋白质-蛋白质(即非抗体)阵列)。在一些实施方案中，使用特异性地结合T细胞刺激相关基因座的基因产物或编码的重组受体的结合试剂来确定T细胞刺激相关基因座和/或转基因(例如，与T细胞刺激相关基因座可操作地连接的转基因)的表达的水平、量、模式和时间。在一些情况下，所述结合试剂是抗体或其抗原结合片段、适配体或核酸探针。

在一些实施方案中，使用用于检测核酸(如信使RNA)的量、水平或表达的方法来确定T细胞刺激相关基因座和/或转基因(例如，与T细胞刺激相关基因座可操作地连接的转基因)的表达的水平、量、模式和时间。在某些实施方案中，所述测定包括检测、测量、评估和/或定量多核苷酸(例如来自T细胞刺激相关基因座的mRNA或由所述转基因产生的mRNA)的水平。在一些方面，可以通过如下方法来评估、测量、确定和/或定量多核苷酸的量或水平：聚合酶链式反应(PCR)，包括逆转录酶(rt)PCR、微滴数字PCR、实时和定量PCR方法(包括例如，

分子信标、LIGHTUP^TM、SCORPION^TM、/>

参见，例如美国专利号5,538,848；5,925,517；6,174,670；6,329,144；6,326,145和6,635,427)；RNA印迹法；例如逆转录产物和衍生物的DNA印迹法；基于阵列的方法，包括印迹阵列、微阵列或原位合成阵列；以及测序，例如合成法测序、焦磷酸测序、双脱氧测序或连接法测序；或本领域中已知的任何其他方法，如Shendure等人,Nat.Rev.Genet.5:335-44(2004)或Nowrousian,Eukaryotic Cell 9(9):1300-1310(2010)中所讨论，包括如/>

454、

和/>

测序的特定平台。在任何实施方案的一些实施方案中，通过qRT-PCR测量多核苷酸的水平。在一些实施方案中，qRT-PCR针对每种基因使用三个核酸集，其中三种核酸包含引物对连同在引物结合的靶核酸区域之间结合的探针。

在一些实施方案中，通过对多核苷酸进行测序来确定T细胞刺激相关基因座和/或转基因(例如，与T细胞刺激相关基因座可操作地连接的转基因)的表达的水平、量、模式和时间。在一些实施方案中，通过非Sanger测序方法和/或下一代测序(NGS)技术进行所述测序。下一代测序技术的例子包括但不限于大规模平行标记测序(MPSS)、Polony测序、焦磷酸测序、可逆染料终止子测序、SOLiD测序、离子半导体测序、DNA纳米球测序、Helioscope单分子测序、单分子实时(SMRT)测序、单分子实时(RNAP)测序和纳米孔DNA测序。在一些实施方案中，NGS技术是RNA测序(RNA-Seq)。RNA测序方法已经针对最常见的DNA测序平台(如HiSeq系统(Illumina)、454基因组测序仪FLX系统(Roche)、Applied Biosystems SOLiD(LifeTechnologies)、IonTorrent(Life Technologies))进行适应。这些平台通常需要首先将RNA逆转录为cDNA。相反，单分子测序仪HeliScope(Helicos BioSciences)能够使用RNA作为测序模板。还已经证明了在PacBio RS平台上直接进行RNA测序的原理论证(PacificBioscience)。在一些实施方案中，通过RNAseq对所述一种或多种RNA基因产物进行评估、测量、确定和/或定量。

在一些方面，可以在暴露于刺激或激活信号之后在细胞中确定T细胞刺激相关基因座和/或转基因(例如，与T细胞刺激相关基因座可操作地连接的转基因)的表达的水平、量、模式和时间。在一些方面，通过将细胞与提供刺激或激活信号的药剂一起孵育细胞来确定T细胞刺激相关基因座和/或转基因的表达。在一些方面，可以在暴露于刺激或激活信号之后不同的时间测定T细胞刺激相关基因座和/或转基因(例如，与T细胞刺激相关基因座可操作地连接的转基因)的表达的水平、量和模式。在一些方面，可以在再刺激、重复刺激或系列刺激之后确定T细胞刺激相关基因座和/或转基因(例如，与T细胞刺激相关基因座可操作地连接的转基因)的表达的水平、量和模式。在一些实施方案中，可以在存在或不存在与重组受体的结合结构域结合的药剂和/或诱导或能够诱导通过重组受体的细胞内信号传导区域的信号的药剂的情况下孵育T细胞之后评估转基因的表达。

在一些方面，可提供刺激或激活信号以评估表达的水平、量或模式的示例性药剂包括提供抗原非依赖性刺激的药剂，例如含有抗CD3和/或抗CD28抗体的药剂，如与抗CD3和抗CD28抗体缀合的珠或负载抗CD3/抗CD28抗体或抗体片段的可溶性多聚体或低聚体试剂；或对于重组受体的抗原特异性刺激，例如重组受体结合或识别的纯化或重组抗原，例如，重组受体的抗原或配体结合结构域的靶抗原或配体。可以向T细胞提供刺激或激活信号以评估表达的水平、量或模式的其他示例性药剂包括佛波醇12-肉豆蔻酸13-乙酸酯(PMA)(也称为12-O-十四烷酰佛波醇13-乙酸酯(TPA))、离子霉素和/或伴刀豆球蛋白A(Con A)。

II.用于通过同源定向修复(HDR)产生条件性地表达重组受体的细胞的方法

本文提供了生成或产生包含经修饰的T细胞刺激相关基因座(例如，PDCD1(编码PD-1)、CD69、Nur77(编码NR4A1)、FoxP3或HLA-DR基因座)的基因工程化细胞的方法，其中所述经修饰的T细胞刺激相关基因座包含编码重组受体(如嵌合抗原受体(CAR)或T细胞受体(TCR))的转基因(例如，异源或外源核酸序列)。在一些方面，所述基因工程化细胞中的经修饰的T细胞刺激相关基因座包含整合至内源T细胞刺激相关基因座中的编码重组受体或其一部分的转基因。在一些实施方案中，提供了涉及诱导靶向基因破坏和使用含有编码重组受体或其一部分的转基因的模板多核苷酸的同源依赖性修复(HDR)的方法，从而将转基因靶向整合在T细胞刺激相关基因座处。还提供了通过所述方法产生的细胞和细胞组合物，以及用于在所述方法中使用的多核苷酸(例如，模板多核苷酸)和试剂盒。

在一些方面，所提供的实施方案采用HDR以将重组或异源序列靶向整合至T细胞刺激相关基因座中。在一些情况下，所述方法涉及通过基因编辑技术在内源T细胞刺激相关基因座处引入一个或多个靶向基因破坏(例如，DNA断裂)，加上通过HDR靶向整合编码重组受体或其部分的转基因。在一些方面，所述一个或多个靶向基因破坏通过引入能够引入一个或多个基因破坏的一种或多种药剂来进行。在一些实施方案中，HDR步骤需要靶基因组位置处的DNA中的破坏或断裂(例如，双链断裂)。在一些实施方案中，DNA断裂通过采用基因编辑方法(例如，靶向核酸酶)来诱导。在一些实施方案中，所述方法生成敲除了T细胞刺激相关基因座的表达的工程化细胞。在一些实施方案中，所述方法生成保留了T细胞刺激相关基因座的表达的工程化细胞。在一些方面，在进行所述方法之后，所述工程化T细胞包含与所述T细胞刺激相关基因座的内源转录调节元件可操作地连接的编码重组受体或其一部分的转基因。在一些方面中，在T细胞中的刺激或激活信号之后，所述内源转录调节元件诱导或上调所述可操作地连接的转基因的表达。

在一些方面，所提供的方法涉及向T细胞中引入能够在T细胞刺激相关基因座内的靶位点处诱导基因破坏的一种或多种药剂；以及向所述T细胞中引入包含转基因和一个或多个同源臂的多核苷酸(例如，模板多核苷酸)。在一些方面，转基因含有编码重组受体或其部分的核苷酸序列。在一些实施方案中，将所述核酸序列通过同源定向修复(HDR)靶向整合在T细胞刺激相关基因座内。

在一些方面，所提供的方法涉及向具有T细胞刺激相关基因座内的基因破坏的T细胞中引入包含编码重组受体或其一部分的转基因的多核苷酸，其中基因破坏已由能够诱导T细胞刺激相关基因座内一个或多个靶位点的基因破坏的一种或多种药剂诱导，并且其中所述核酸序列经由HDR被靶向整合在T细胞刺激相关基因座内。在一些实施方案中，还提供了含有细胞群的组合物，所述细胞群已经被工程化以表达重组受体(例如，CAR或TCR)，使得所述细胞群展现更改善的、均匀的、同质的、调节的和/或稳定的重组受体的表达和/或抗原结合，包括通过任何所提供方法产生的基因工程化免疫细胞。在一些方面，所提供的实施方案允许在刺激T细胞后调节表达(如连接的转基因(例如编码重组受体的转基因)的条件性表达)，以及在T细胞中降低或不存在刺激或激活信号之后降低或下调表达。

在一些方面，所述实施方案涉及使用基因编辑方法和/或靶向核酸酶产生如靶向DNA断裂，然后是基于一种或多种模板多核苷酸(例如，含有与内源T细胞刺激相关基因座处的序列同源的同源序列的一种或多种模板多核苷酸)的HDR，所述同源序列与编码重组受体或其一部分的转基因以及在一些情况下编码其他分子的核酸序列连接，以将转基因特异性靶向和整合于DNA断裂处或附近。因此，在一些方面，所述方法涉及诱导靶向基因破坏(例如，基因编辑)和向细胞中引入多核苷酸(例如，包含转基因的模板多核苷酸)(例如，HDR)的步骤。

在一些实施方案中，靶向基因破坏和通过HDR靶向整合转基因发生在内源T细胞刺激相关基因座的一个或多个靶位点处。在一些方面，靶向整合发生在内源T细胞刺激相关基因座的开放阅读框序列内。在一些方面，转基因的靶向整合导致内源T细胞刺激相关基因座基因的敲除，例如，使得内源基因的表达被消除。

在一些方面，转基因已经例如通过同源定向修复(HDR)整合至T细胞刺激相关基因座中，在内源T细胞刺激相关基因座的开放阅读框或其部分序列的外显子内，使得编码嵌合受体或其部分的序列与外显子的序列同框。在一些方面，所述内源T细胞刺激相关基因座的全部或一部分(如在整合的转基因上游的部分)和重组受体或其部分在经修饰的T细胞刺激相关基因座中表达，在一些情况下由多顺反子元件隔开。

在一些实施方案中，在引入能够诱导一个或多个靶向基因破坏的一种或多种药剂之前、同时或之后，将模板多核苷酸引入工程化细胞中。在一个或多个靶向基因破坏(例如，DNA断裂)的存在下，模板多核苷酸可以用作DNA修复模板，以基于基因破坏周围的内源基因序列与模板多核苷酸中所包括的一个或多个同源臂(如5'和/或3'同源臂)之间的同源性，通过HDR将转基因有效地整合于靶向基因破坏的位点处或附近。

在一些方面，将模板多核苷酸和能够诱导一种或多种靶向基因破坏的一种或多种药剂同时引入。在一些方面，将模板多核苷酸和能够诱导一种或多种靶向基因破坏的一种或多种药剂使用本文(例如在第II.A.3和II.B.3节中)所述的任何递送方法引入。在一些方面，将模板多核苷酸和能够诱导一种或多种靶向基因破坏的一种或多种药剂经由物理递送方法(如经由电穿孔、粒子枪、磷酸钙转染、细胞压缩或挤压)引入。在一些方面，将模板多核苷酸和能够诱导一种或多种靶向基因破坏的一种或多种药剂经由电穿孔同时引入。

在一些方面，可以依序进行两个步骤。在一些实施方案中，基因编辑和HDR步骤是同时和/或在一个实验反应中进行的。在一些实施方案中，基因编辑和HDR步骤是在一个或连续的实验反应中连续或依序进行的。在一些实施方案中，基因编辑和HDR步骤是在单独实验反应中同时或在不同时间进行的。

免疫细胞可以包括含有T细胞的细胞群。此类细胞可以是已经从受试者获得的细胞，如从外周血单个核细胞(PBMC)样品、未分级的T细胞样品、淋巴细胞样品、白细胞样品、单采术产物或白细胞单采术产物获得。在一些实施方案中，可以使用阳性或阴性选择和富集方法分离或选择T细胞以在群体中富集T细胞。在一些实施方案中，所述群体含有CD4+T细胞、CD8+T细胞或者CD4+和CD8+T细胞。在一些实施方案中，引入多核苷酸模板的步骤和引入药剂(例如Cas9/gRNA RNP)的步骤可以同时或以任何顺序依序发生。在任何实施方案的一些实施方案中，在通过引入一种或多种药剂(例如，Cas9/gRNA RNP)的步骤诱导基因破坏后，将多核苷酸模板引入免疫细胞中。在一些实施方案中，在引入多核苷酸模板和一种或多种药剂(例如，Cas9/gRNA RNP)之前、期间和/或之后，在刺激细胞扩增和/或增殖的条件下培养或孵育细胞。

在任何实施方案的一些实施方案中，模板多核苷酸的引入是与能够诱导基因破坏的所述一种或多种药剂的引入同时进行的。根据用于诱导基因破坏的一种或多种特定药剂，可以如所述采用用于引入所述一种或多种药剂的任何方法。在一些方面，破坏是通过基因编辑来进行的，如使用对所破坏的T细胞刺激相关基因座具有特异性的RNA指导的核酸酶，如成簇的规律间隔的短回文核酸(CRISPR)-Cas系统，如CRISPR-Cas9系统。在一些实施方案中，将含有Cas9和指导RNA(gRNA)(含有靶向T细胞刺激相关基因座的区域的靶向结构域)的药剂引入细胞中。在一些实施方案中，所述药剂是或包含Cas9和含有靶向T细胞刺激相关基因座的靶向结构域的gRNA的核糖核蛋白(RNP)复合物(Cas9/gRNA RNP)。在一些实施方案中，引入包括使药剂或其部分与细胞在体外接触，这可以包括将细胞与药剂一起培育或孵育至多24、36或48小时或者3、4、5、6、7或8天。在一些实施方案中，所述引入还可以包括实现将所述药剂和/或包含所述转基因的多核苷酸(如用于HDR的模板)递送至所述细胞中。在各个实施方案中，根据本公开文本的方法、组合物和细胞利用例如通过电穿孔将Cas9和gRNA的核糖核蛋白(RNP)复合物和/或模板多核苷酸直接递送至细胞。在一些情况下，对要修饰的细胞的电穿孔包括在将细胞电穿孔之后且在铺板之前，例如在32℃下使细胞冷休克。

根据用于将模板多核苷酸递送至细胞的特定方法，可以如所述采用用于引入模板多核苷酸的任何方法。在一些实施方案中，所述模板多核苷酸是线性多核苷酸。在一些实施方案中，所述模板多核苷酸是单链线性多核苷酸。在一些实施方案中，所述模板多核苷酸是双链线性多核苷酸。在一些方面，将所述模板多核苷酸通过物理递送方法(如电穿孔)单独地或与用于诱导基因组中一个或多个靶位点处的基因破坏的一种或多种药剂一起递送至所述细胞中。

示例性方法包括用于转移编码受体的核酸的那些，包括通过病毒(如逆转录病毒或慢病毒)、转导、转座子和电穿孔来进行。在任何实施方案的一些实施方案中，采用病毒转导方法。在一些实施方案中，可以使用重组感染性病毒颗粒(如例如源自猿猴病毒40(SV40)、腺病毒、腺相关病毒(AAV)的载体)将模板多核苷酸转移至或引入细胞中。在一些实施方案中，使用重组慢病毒载体或逆转录病毒载体(如γ-逆转录病毒载体)将重组核酸转移到T细胞中(参见例如，Koste等人(2014)Gene Therapy 2014年4月3日.doi:10.1038/gt.2014.25；Carlens等人(2000)Exp Hematol 28(10):1137-46；Alonso-Camino等人(2013)Mol Ther Nucl Acids 2,e93；Park等人,Trends Biotechnol.2011年11月29(11):550-557)。在任何实施方案的一些实施方案中，病毒载体是AAV，如AAV2或AAV6。

在所提供方法的此类方面，在引入例如已经经由电穿孔引入的所述一种或多种药剂(如Cas9/gRNA RNP)之后，将模板多核苷酸引入细胞中。在一些实施方案中，在引入能够诱导基因破坏的所述一种或多种药剂之后，立即引入模板多核苷酸。在一些实施方案中，在引入能够诱导基因破坏的一种或多种药剂之后在为或约30秒内、在为或约1分钟内、在为或约2分钟内、在为或约3分钟内、在为或约4分钟内、在为或约5分钟内、在为或约6分钟内、在为或约6分钟内、在为或约8分钟内、在为或约9分钟内、在为或约10分钟内、在为或约15分钟内、在为或约20分钟内、在为或约30分钟内、在为或约40分钟内、在为或约50分钟内、在为或约60分钟内、在为或约90分钟内、在为或约2小时内、在为或约3小时内或在为或约4小时内，将模板多核苷酸引入细胞中。在一些实施方案中，在引入所述一种或多种药剂之后在为或约15分钟与为或约4小时之间的时间，如在为或约15分钟与为或约3小时之间、在为或约15分钟与为或约2小时之间、在为或约15分钟与为或约1小时之间、在为或约15分钟与为或约30分钟之间、在为或约30分钟与为或约4小时之间、在为或约30分钟与为或约3小时之间、在为或约30分钟与为或约2小时之间、在为或约30分钟与为或约1小时之间、在为或约1小时与为或约4小时之间、在为或约1小时与为或约3小时之间、在为或约1小时与为或约2小时之间、在为或约2小时与为或约4小时之间、在为或约2小时与为或约3小时之间或在为或约3小时与为或约4小时之间，将所述模板多核苷酸引入细胞中。在一些实施方案中，在引入例如已经经由电穿孔引入的所述一种或多种药剂(如Cas9/gRNA RNP)之后为或约2小时，将模板多核苷酸引入细胞中。

在一些实施方案中，在使药剂与细胞接触之前、期间或之后，和/或在实现递送(例如，电穿孔)之前、期间或之后，所提供的方法包括在能够诱导免疫细胞(例如，T细胞)的增殖、刺激或激活的细胞因子、刺激剂和/或药剂的存在下孵育细胞。在一些实施方案中，孵育的至少一部分是在刺激剂的存在下进行，所述刺激剂是或包含对CD3具有特异性的抗体、对CD28具有特异性的抗体和/或细胞因子，如抗CD3/抗CD28珠。在一些实施方案中，孵育的至少一部分是在细胞因子的存在下进行，所述细胞因子是如重组IL-2、重组IL-7和/或重组IL-15中的一种或多种。在一些实施方案中，在引入所述一种或多种药剂(如Cas9/gRNARNP，例如经由电穿孔)和模板多核苷酸之前或之后，孵育持续至多8天，如至多24小时、36小时或48小时或者3天、4天、5天、6天、7天或8天。

在一些实施方案中，所述方法包括在引入药剂(例如，Cas9/gRNA RNP)和多核苷酸模板之前，用刺激剂(例如，抗CD3/抗CD28抗体)激活或刺激细胞。在一些实施方案中，在例如经由电穿孔引入所述一种或多种药剂如Cas9/gRNA RNP之前，在刺激剂(例如抗CD3/抗CD28)存在下孵育持续6小时至96小时，如24-48小时或24-36小时。在一些实施方案中，与刺激剂一起孵育还可以包括细胞因子的存在，所述细胞因子是如重组IL-2、重组IL-7和/或重组IL-15中的一种或多种。在一些实施方案中，孵育是在重组细胞因子的存在下进行，所述重组细胞因子是如IL-2(例如1U/mL至500U/mL，如10U/mL至200U/mL，例如至少或约50U/mL或100U/mL)、IL-7(例如0.5ng/mL至50ng/mL，如1ng/mL至20ng/mL，例如至少或约5ng/mL或10ng/mL)或IL-15(例如0.1ng/mL至50ng/mL，如0.5ng/mL至25ng/mL，例如至少或约1ng/mL或5ng/mL)。在一些实施方案中，在向细胞中引入或递送能够诱导基因破坏的一种或多种药剂Cas9/gRNA RNP和/或多核苷酸模板之前，从细胞中洗涤或去除一种或多种刺激剂(例如，抗CD3/抗CD28抗体)。在一些实施方案中，在引入一种或多种药剂之前，例如通过去除任何刺激或激活剂使细胞静息。在一些实施方案中，在引入一种或多种药剂之前，不去除刺激或激活剂和/或细胞因子。

在一些实施方案中，在引入一种或多种药剂(例如，Cas9/gRNA)和/或多核苷酸模板之后，将细胞在重组细胞因子存在下孵育、培育或培养，所述重组细胞因子是如重组IL-2、重组IL-7和/或重组IL-15中的一种或多种。在一些实施方案中，孵育是在重组细胞因子的存在下进行，所述重组细胞因子是如IL-2(例如1U/mL至500U/mL，如10U/mL至200U/mL，例如至少或约50U/mL或100U/mL)、IL-7(例如0.5ng/mL至50ng/mL，如1ng/mL至20ng/mL，例如至少或约5ng/mL或10ng/mL)或IL-15(例如0.1ng/mL至50ng/mL，如0.5ng/mL至25ng/mL，例如至少或约1ng/mL或5ng/mL)。可以将细胞在诱导细胞的增殖或扩增的条件下孵育或培育。在一些实施方案中，可以孵育或培育细胞直至实现用于收获的阈值细胞数量，例如治疗有效剂量。

在一些实施方案中，在所述过程的任何部分或全部所述过程期间的孵育可以在30℃±2℃至39℃±2℃(如至少或约至少30℃±2℃、32℃±2℃、34℃±2℃或37℃±2℃)的温度下进行。在一些实施方案中，孵育的至少一部分是在30℃±2℃下进行，并且孵育的至少一部分是在37℃±2℃下进行。

在一些方面，所提供的实施方案允许重组受体在T细胞刺激相关基因座的内源转录调节元件(例如，T细胞刺激相关基因座的内源启动子)的控制下表达。在一些方面，所提供的实施方案允许编码重组受体的核酸与内源调节或控制元件(例如，内源T细胞刺激相关基因座的顺式调节元件(如启动子)或5'和/或3'非翻译区(UTR))可操作地连接。因此，在一些方面，所提供的实施方案允许重组受体(例如，CAR)表达和/或所述表达类似于内源T细胞刺激相关基因座被条件性地、时间上地和/或定量地调节。在一些方面，在所述T细胞中的刺激或激活信号之后，所述可操作地连接的转基因的表达被上调或诱导。在一些方面，在所述T细胞中的刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达被降低或下调。在一些方面，在所述信号降低或不存在之后，所述可操作地连接的转基因的表达能够在所述T细胞中进一步刺激或激活信号之后再次被诱导或上调。

A.基因破坏

在一些实施方案中，在所述一个或多个内源T细胞刺激相关基因座处诱导一种或多种靶向基因破坏。在一些实施方案中，在所述内源T细胞刺激相关基因座的外显子中或附近诱导靶向基因破坏。在一些实施方案中，在所述内源T细胞刺激相关基因座的内含子中或附近诱导靶向基因破坏。在一些实施方案中，在所述内源T细胞刺激相关基因座的启动子中或附近诱导靶向基因破坏。在一些方面，所述一个或多个靶向基因破坏和多核苷酸(例如，含有编码重组受体或其部分的转基因的模板多核苷酸)的存在可以导致将转基因靶向整合于内源T细胞刺激相关基因座的一个或多个基因破坏(例如，靶位点)处或附近。

在一些实施方案中，基因破坏导致基因组中一个或多个靶位点处的DNA断裂(如双链断裂(DSB))或切割、或切口(如单链断裂(SSB))。在一些实施方案中，在基因破坏(例如，DNA断裂或切口)的位点处，细胞DNA修复机制的作用可以导致基因的全部或一部分的敲除、插入、错义或移码突变(如双等位基因移码突变)、缺失；或者，在修复模板(例如，模板多核苷酸)的存在下，可以基于修复模板改变DNA序列，如整合或插入所述模板多核苷酸中所含有的核酸序列(例如，本文第II.B.2节中所述的任一种)。在一些实施方案中，基因破坏可以被靶向至基因或其部分的一个或多个外显子。在一些实施方案中，基因破坏可以被靶向于外源序列(例如，编码重组受体的外源序列)的靶向整合的期望位点附近。在一些实施方案中，在整合编码重组受体或其一部分的转基因之后，所述经修饰的T细胞刺激相关基因座包含在所述内源T细胞刺激相关基因座的开放阅读框中的缺失、插入、移码突变或无义突变。在一些方面，未产生所述T细胞刺激相关基因座的内源基因产物，或者其被截短或在细胞中不具有功能。在一些方面，T细胞刺激相关基因座的内源基因产物以全长产生或在细胞中具有功能。

在一些实施方案中，使用特异性结合至或杂交至在所述至少一个靶位点中的一个位点附近区域的序列的DNA结合蛋白或DNA结合核酸进行靶向破坏。在一些实施方案中，可以引入模板多核苷酸(例如，包括编码重组受体或其一部分的核酸序列和同源序列的模板多核苷酸)用于通过HDR将重组受体编码序列靶向整合于基因破坏的位点处或附近，如本文例如在第II.A节中所述。

在一些实施方案中，基因破坏是通过引入能够诱导基因破坏的一种或多种药剂来进行的。在一些实施方案中，此类药剂包含特异性结合至或杂交至基因的DNA结合蛋白或DNA结合核酸。在一些实施方案中，药剂包含各种组分，如包含DNA靶向蛋白和核酸酶或RNA指导的核酸酶的融合蛋白。在一些实施方案中，药剂可以靶向一个或多个靶位点或靶位置。在一些方面，可以在靶位点的每一侧上产生一对单链断裂(例如，切口)。

在所提供的实施方案中，术语“引入”涵盖在体外或体内将DNA引入细胞中的多种方法，此类方法包括转化、转导、转染(例如电穿孔)和感染。载体可用于将编码分子的DNA引入细胞中。可能的载体包括质粒载体和病毒载体。病毒载体包括逆转录病毒载体、慢病毒载体或其他载体，如腺病毒载体或腺相关载体。诸如电穿孔等方法也可以用于将蛋白质或核糖核蛋白(RNP)(例如，含有与靶向gRNA复合的Cas9蛋白)引入或递送至目的细胞中。

在一些实施方案中，基因破坏发生于靶位点(也称为“靶位置(targetposition)”、“靶DNA序列”或“靶位置(target location)”)处，例如发生于内源T细胞刺激相关基因座处。在一些实施方案中，靶位点包括靶DNA(例如，基因组DNA)上的位点，其通过能够诱导基因破坏的所述一种或多种药剂修饰，所述药剂例如与指定靶位点的gRNA复合的Cas9分子。例如，靶位点可以包括DNA中在内源T细胞刺激相关基因座处的位置，在此处发生切割或DNA断裂。在一些方面，通过HDR整合核酸序列可以发生在靶位点或靶序列处或附近。在一些实施方案中，靶位点可以是向其中添加一个或多个核苷酸的DNA上的两个核苷酸(例如，相邻核苷酸)之间的位点。靶位点可以包含通过模板多核苷酸改变的一个或多个核苷酸。在一些实施方案中，靶位点在靶序列(例如，与gRNA结合的序列)内。在一些实施方案中，靶位点位于靶序列的上游或下游。

1.示例性内源T细胞刺激相关基因座处的靶位点

在一些实施方案中，基因破坏和/或经由同源定向修复(HDR)整合编码重组受体或其一部分的转基因被靶向在本文所述的内源或基因组T细胞刺激相关基因座处。在一些方面，由于本文所述的靶位点处的基因破坏以及用于在T细胞刺激相关基因座处靶向整合转基因的模板多核苷酸的存在，因此所得工程化T细胞含有与T细胞刺激相关基因座的内源转录调节元件可操作地连接的编码重组受体或其一部分的转基因。在一些方面中，在T细胞中的刺激或激活信号之后，所述内源转录调节元件诱导或上调所述可操作地连接的转基因的表达。

在一些实施方案中，基因破坏被靶向在T细胞刺激相关基因座处、附近或之内。在一些实施方案中，所述T细胞刺激相关基因座编码在T细胞上被瞬时上调或诱导的分子。在一些实施方案中，示例性T细胞刺激相关基因座包括PDCD1(编码PD-1)、CD69、Nur77(编码NR4A1)、FoxP3或HLA-DR基因座。在一些方面，靶位点是在PDCD1(编码PD-1)、CD69、Nur77(编码NR4A1)、FoxP3或HLA-DR基因座处或附近。示例性T细胞刺激相关基因座的表达在本文中(例如，在第I.A节中)进行了描述。

示例性人PD-1前体多肽序列如SEQ ID NO:79所示(成熟多肽包含SEQ ID NO:79的残基24-288；参见Uniprot登录号Q15116-1；SEQ ID NO:80所示的mRNA序列，NCBI参考序列：NM_005018.3)。在人体中，编码PD-1的基因组基因座PDCD1包含含有5个外显子和4个内含子的开放阅读框。根据人基因组形式GRCh38(UCSC Genome Browser on Human 2013年12月(GRCh38/hg38)Assembly)，PDCD1的示例性mRNA转录物跨越对应于第2号染色体：241,849,884-241,858,894反向链的序列。表1列出编码PD-1的示例性转录物中开放阅读框的外显子和内含子和非翻译区的坐标。

表1.人PDCD1基因座的外显子和内含子的坐标(GRCh38，染色体2，反向链)。

	起始(GrCh38)	终止(GrCh38)	长度
				5'UTR和外显子1	241,858,894	241,858,763	132
内含子1-2	241,858,762	241,852,981	5,782
				外显子2	241,852,980	241,852,621	360
内含子2-3	241,852,620	241,852,354	267
				外显子3	241,852,353	241,852,198	156
内含子3-4	241,852,197	241,851,984	214
				外显子4	241,851,983	241,851,949	35
内含子4-5	241,851,948	241,851,298	651
				外显子5和3'UTR	241,851,297	241,849,884	1,414

示例性人CD69多肽序列如SEQ ID NO:81所示(参见Uniprot登录号Q07108-1；SEQID NO:82所示的mRNA序列，NCBI参考序列：NP_001772.1)。在人体中，编码CD69的基因座包含含有5个外显子和4个内含子的开放阅读框。根据人基因组形式GRCh38(UCSC GenomeBrowser on Human 2013年12月(GRCh38/hg38)Assembly)，CD69的示例性mRNA转录物跨越对应于反向链上的染色体12：9,752,486-9,760,901的序列。表2列出编码CD69的示例性转录物中开放阅读框的外显子和内含子和非翻译区的坐标。

表2.人CD69基因座的外显子和内含子的坐标(GRCh38，染色体12，反向链)。

示例性人NR4A1多肽序列如SEQ ID NO:83所示(同种型1；参见Uniprot登录号P22736-1；SEQ ID NO:84所示的mRNA序列，NCBI参考序列：NP_002126.2)。在人中，Nur77存在若干种不同的mRNA和蛋白质同种型。编码NR4A1的示例性基因组基因座Nur77(也称为NR4A1)包含开放阅读框，其含有编码同种型1的转录物变体的8个外显子和7个内含子。参考人类基因组形式GRCh38(UCSC Genome Browser on Human 2013年12月(GRCh38/hg38)Assembly)，编码亚型1的Nur77的示例性mRNA转录物跨越对应于第12号染色体：52,051,402-52,059,506正向链的序列。表3列出编码NR4A1的示例性转录物同种型1中开放阅读框的外显子和内含子和非翻译区的坐标。

表3.人Nur77基因座的外显子和内含子的坐标(GRCh38，第12号染色体，正向链)。

	起始(GrCh38)	终止(GrCh38)	长度
				5'UTR和外显子1	52,051,402	52,051,568	167
内含子1-2	52,051,569	52,052,495	927
				外显子2	52,052,496	52,052,645	150
内含子2-3	52,052,646	52,054,326	1,681
				外显子3	52,054,327	52,055,204	878
内含子3-4	52,055,205	52,056,029	825
				外显子4	52,056,030	52,056,159	130
内含子4-5	52,056,160	52,056,493	334
				外显子5	52,056,494	52,056,645	152
内含子5-6	52,056,646	52,057,056	411
				外显子6	52,057,057	52,057,259	203
内含子6-7	52,057,260	52,057,351	92
				外显子7	52,057,352	52,057,530	179
内含子7-8	52,057,531	52,058,687	1,157
				外显子8和3'UTR	52,058,688	52,059,506	819

示例性人FoxP3多肽序列如SEQ ID NO:85所示(同种型1；参见Uniprot登录号Q9BZS1-1；SEQ ID NO:86所示的mRNA序列，NCBI参考序列：NM_014009.3)。在人中，FoxP3存在若干种不同的mRNA和蛋白质同种型。编码FoxP3的示例性基因组基因座FOXP3包含开放阅读框，其含有编码同种型1的转录物变体的12个外显子和11个内含子。参考人类基因组形式GRCh38(UCSC Genome Browser on Human 2013年12月(GRCh38/hg38)Assembly)，编码亚型1的FOXP3的示例性mRNA转录物可以跨越对应于第X号染色体：49,250,436-49,264,924反向链的序列。表4列出编码FoxP3的示例性转录物同种型1中开放阅读框的外显子和内含子和非翻译区的坐标。

表4.人FOXP3基因座的外显子和内含子的坐标(GRCh38，第X号染色体，反向链)。

HLA-DR是包含alpha(α)链和beta(β)链的异二聚体蛋白质。其每个亚基含有两个胞外结构域、一个跨膜结构域和一个胞质尾。α和β链都锚定在膜中。HLA-DR由若干个基因座和每个基因座上功能不同的若干个基因编码。DRα链由HLA-DRA基因座编码。DRβ链由若干个不同的基因座(包括HLA-DRB1至HLA-DRB9)编码，其中它们中仅有一些存在于每个个体中。HLA-DRB1基因座是普遍存在的，并且编码非常大量的功能可变的基因产物(HLA-DR1至HLA-DR17)(参见例如，Marsh等人,Tissue Antigens.2010年4月；75(4):291–455)。

示例性前体人HLA-DRα链多肽序列如SEQ ID NO:87所示(成熟多肽包含SEQ IDNO:87的残基26-254；参见Uniprot登录号P01903-1；SEQ ID NO:88所示的mRNA序列，NCBI参考序列：NM_019111.4)。在人中，编码HLA-DRα链的基因座HLA-DRA包含含有5个外显子(4个编码外显子)和4个内含子的开放阅读框。根据人基因组形式GRCh38(UCSC Genome Browseron Human 2013年12月(GRCh38/hg38)Assembly)，HLA-DRA的示例性mRNA转录物跨越对应于第6号染色体：32,439,887-32,445,046正向链的序列。表5列出编码HLA-DRα链的示例性转录物中开放阅读框的外显子和内含子和非翻译区的坐标。

表5.人HLA-DRA基因座的外显子和内含子的坐标(GRCh38，第6号染色体，正向链)。

	起始(GrCh38)	终止(GrCh38)	长度
				5'UTR和外显子1	32,439,887	32,440,032	146
内含子1-2	32,440,033	32,442,447	2,415
				外显子2	32,442,448	32,442,693	246
内含子2-3	32,442,694	32,443,184	491
				外显子3	32,443,185	32,443,466	282
内含子3-4	32,443,467	32,443,755	289
				外显子4(包括非编码)和3’UTR	32,443,756	32,443,921	166
内含子4-5	32,443,922	32,444,651	730
				外显子5(非编码)，3'UTR	32,444,652	32,445,046	395

示例性前体人HLA-DRβ链多肽序列如SEQ ID NO:89所示(成熟多肽包含SEQ IDNO:89的残基30-266；参见Uniprot登录号P04229-1；SEQ ID NO:90所示的mRNA序列，GenBank：X03069.1)。在人中，编码HLA-DRβ链的示例性基因座HLA-DRB1包含含有6个外显子和5个内含子的开放阅读框。根据人基因组形式GRCh38(UCSC Genome Browser on Human2013年12月(GRCh38/hg38)Assembly)，HLA-DRB1的示例性mRNA转录物跨越对应于第6号染色体：32,578,769-32,589,848反向链的序列。表6列出编码HLA-DRβ链的示例性转录物中开放阅读框的外显子和内含子和非翻译区的坐标。

表6.人HLA-DRB1基因座的外显子和内含子的坐标(GRCh38，第6号染色体，正向链)。

	起始(GrCh38)	终止(GrCh38)	长度
				5'UTR和外显子1	32,439,887	32,440,032	146
内含子1-2	32,440,033	32,442,447	2,415
				外显子2	32,589,848	32,589,643	206
内含子2-3	32,589,642	32,584,379	5,264
				外显子3	32,584,378	32,584,109	270
内含子3-4	32,584,108	32,581,839	2,270
				外显子4	32,581,838	32,581,557	282
内含子4-5	32,581,556	32,580,857	700
				外显子5	32,580,856	32,580,746	111
内含子5-6	32,580,745	32,580,271	475
				外显子6和3'UTR	32,580,270	32,580,247	24

在一些实施方案中，所述工程化细胞(例如，含有包含与T细胞刺激相关基因座可操作地连接的编码重组受体或其一部分的转基因的经修饰的T细胞刺激相关基因座)还含有在内源T细胞受体α恒定区(TRAC)基因和/或内源T细胞受体β恒定区(TRBC)基因处的基因破坏。在一些方面，在不存在经由重组受体的刺激或激活信号的情况下，内源TRAC和/或TRBC基因座处的另外的基因破坏阻止内源TCR在工程化细胞中的表达，从而阻止转基因(例如，编码重组受体或其一部分的转基因)的表达。在一些方面，在不存在抗原特异性刺激或激活信号的情况下，例如当在消除肿瘤后肿瘤特异性抗原不存在时，内源TRAC和/或TRBC基因座处的另外的基因破坏阻止编码重组受体或其一部分的转基因的重新表达。

在一些实施方案中，内源TCR Cα由TRAC基因编码(IMGT命名法)。示例性人TCR Cα多肽序列如SEQ ID NO:91或92所示(参见UniProtKB登录号P01848或Genbank登录号CAA26636.1；SEQ ID NO:93所示的mRNA序列，GenBank：X02592.1)。在人类中，TRAC的示例性基因组基因座包含含有4个外显子和3个内含子的开放阅读框。参考人类基因组形式GRCh38(UCSC Genome Browser on Human 2013年12月(GRCh38/hg38)Assembly)，TRAC的示例性mRNA转录物可以跨越对应于正向链上的坐标第14号染色体：22,547,506-22,552,154的序列。表7列出了示例性人TRAC基因座的转录物的开放阅读框的外显子和内含子以及非翻译区的坐标。

表7.示例性人TRAC基因座的外显子和内含子的坐标(GRCh38，第14号染色体，正向链)。

	起始(GrCh38)	终止(GrCh38)	长度
				5'UTR和外显子1	22,547,506	22,547,778	273
内含子1-2	22,547,779	22,549,637	1,859
				外显子2	22,549,638	22,549,682	45
内含子2-3	22,549,683	22,550,556	874
				外显子3	22,550,557	22,550,664	108
内含子3-4	22,550,665	22,551,604	940
				外显子4和3'UTR	22,551,605	22,552,154	550

在一些实施方案中，内源TCR Cβ由TRBC1或TRBC2基因编码(IMGT命名法)。示例性人TCR Cβ多肽序列如SEQ ID NO:94、95或96所示(参见UniProtKB登录号P01850、A0A5B9或A0A0G2JNG9；SEQ ID NO:97所示的mRNA序列；GenBank：X00437.1)。

在人类中，TRBC1的示例性基因组基因座包含含有4个外显子和3个内含子的开放阅读框。参考人类基因组形式GRCh38(UCSC Genome Browser on Human 2013年12月(GRCh38/hg38)Assembly)，TRBC1的示例性mRNA转录物可以跨越对应于正向链上的坐标第7号染色体：142,791,694-142,793,368的序列。表8列出了示例性人TRBC1基因座的转录物的开放阅读框的外显子和内含子以及非翻译区的坐标。

表8.示例性人TRBC1基因座的外显子和内含子的坐标(GRCh38，第7号染色体，正向链)。

	起始(GrCh38)	终止(GrCh38)	长度
				5'UTR和外显子1	142,791,694	142,792,080	387
内含子1-2	142,792,081	142,792,521	441
				外显子2	142,792,522	142,792,539	18
内含子2-3	142,792,540	142,792,691	152
				外显子3	142,792,692	142,792,798	107
内含子3-4	142,792,799	142,793,120	322
				外显子4和3'UTR	142,793,121	142,793,368	248

在人体中，TRBC2的示例性基因组基因座包含含有4个外显子和3个内含子的开放阅读框。参考人类基因组形式GRCh38(UCSC Genome Browser on Human 2013年12月(GRCh38/hg38)Assembly)，TRBC2的示例性mRNA转录物可以跨越对应于正向链上的坐标第7号染色体：142,801,041-142,802,748的序列。表9列出示例性人TRBC2基因座的转录物中开放阅读框的外显子和内含子和非翻译区的坐标。

表9.示例性人TRBC2基因座的外显子和内含子的坐标(GRCh38，第7号染色体，正向链)。

	起始(GrCh38)	终止(GrCh38)	长度
				5'UTR和外显子1	142,801,041	142,801,427	387
内含子1-2	142,801,428	142,801,943	516
				外显子2	142,801,944	142,801,961	18
内含子2-3	142,801,962	142,802,104	143
				外显子3	142,802,105	142,802,211	107
内含子3-4	142,802,212	142,802,502	291
				外显子4和3'UTR	142,802,503	142,802,748	246

在任何实施方案的一些实施方案中，所述基因破坏被靶向在T细胞刺激相关基因座、TRAC和/或TRBC(如本文表1-表9中所述)的开放阅读框处、附近或之内。在某些实施方案中，基因破坏被靶向于编码TCRα恒定结构域的开放阅读框处、附近或之内。在一些实施方案中，基因破坏被靶向在T细胞刺激相关基因座、TRAC和/或TRBC(如表1-表9中所述)处、附近或之内，或者被靶向在与T细胞刺激相关基因座、TRAC和/或TRBC(如表1-表9中所述)的全部或一部分(例如，为或至少500、1,000、1,500、2,000、2,500、3,000、3,500或4,000个连续核苷酸)具有为或至少70％、75％、80％、85％、90％、95％、97％、98％、99％、99.5％或99.9％序列同一性的序列处、附近或之内。

在一些方面，所述靶位点在内源T细胞刺激相关基因座、TRAC和/或TRBC的开放阅读框的外显子内。在一些方面，所述靶位点在T细胞刺激相关基因座、TRAC和/或TRBC的开放阅读框的内含子内。在一些方面，所述靶位点在T细胞刺激相关基因座、TRAC和/或TRBC的调节或控制元件(例如，启动子、5'非翻译区(UTR)或3’UTR)内。在一些实施方案中，所述靶位点在本文表1-表9中所述的T细胞刺激相关基因座、TRAC和/或TRBC基因组区域序列内或者在T细胞刺激相关基因座、TRAC和/或TRBC基因组区域序列的其中所含的任何外显子或内含子内。在一些方面，所述靶位点在内源T细胞刺激相关基因座、TRAC和/或TRBC的外显子与内含子或外显子与调节或控制元件(例如启动子、5’非翻译区(UTR)或3’UTR)之间的交界或边界处或附近。在一些方面，所述靶位点在T细胞刺激相关基因座、TRAC和/或TRBC的开放阅读框的内含子内。

在一些实施方案中，选择用于基因破坏的靶位点，使得在整合转基因之后，敲除、降低和/或消除细胞的内源T细胞刺激相关基因座、TRAC和/或TRBC的表达。

在一些实施方案中，基因破坏(例如，DNA断裂)被靶向在T细胞刺激相关基因座、TRAC和/或TRBC或其开放阅读框的外显子内。在某些实施方案中，所述基因破坏在T细胞刺激相关基因座、TRAC和/或TRBC或其开放阅读框的第一外显子、第二外显子、第三外显子或第四外显子内。在任何实施方案的一些实施方案中，所述基因破坏在T细胞刺激相关基因座、TRAC和/或TRBC或其开放阅读框的第一外显子内。在一些实施方案中，所述基因破坏在T细胞刺激相关基因座、TRAC和/或TRBC或其开放阅读框中的第一外显子的5'端下游的500个碱基对(bp)内。在任何实施方案的一些实施方案中，基因破坏在外显子1的5'核苷酸与外显子1的3'核苷酸的上游之间。在某些实施方案中，基因破坏在T细胞刺激相关基因座、TRAC和/或TRBC或其开放阅读框中第一外显子5'端下游的400bp、350bp、300bp、250bp、200bp、150bp、100bp或50bp内。在任何实施方案的一些实施方案中，基因破坏在T细胞刺激相关基因座、TRAC和/或TRBC或其开放阅读框中第一外显子5'端下游的1bp与400bp之间、50bp与300bp之间、100bp与200bp之间或100bp与150bp之间，每个都包含端值。在某些实施方案中，所述基因破坏在T细胞刺激相关基因座、TRAC和/或TRBC或其开放阅读框中的第一外显子的5'端下游100bp与150bp之间。

在一些方面，靶位点在外显子(如对应于早期编码区的外显子)内。在一些实施方案中，靶位点在对应于早期编码区的外显子内或与所述外显子非常靠近，所述外显子例如内源T细胞刺激相关基因座、TRAC和/或TRBC(如本文表1-表9中所述)的开放阅读框的外显子1、2、3、4或5，或者包括紧接转录起始位点之后、在外显子1、2、3、4或5内、或者在外显子1、2、3、4或5的小于500、450、400、350、300、250、200、150、100或50bp内的序列。在一些方面，所述靶位点在T细胞刺激相关基因座、TRAC和/或TRBC的调节或控制元件(例如，启动子)内。

在某些实施方案中，基因破坏被靶向在T细胞刺激相关基因座、TRAC和/或TRBC处、附近或之内。在任何实施方案的一些实施方案中，所述基因破坏被靶向在T细胞刺激相关基因座、TRAC和/或TRBC(如本文表1-表9中所述)的开放阅读框处、附近或之内。在某些实施方案中，所述基因破坏被靶向在编码T细胞刺激相关基因座、TRAC和/或TRBC的开放阅读框处、附近或之内。在一些实施方案中，基因破坏被靶向在T细胞刺激相关基因座、TRAC和/或TRBC(如表1-表9中所述)处、附近或之内，或者被靶向在与T细胞刺激相关基因座、TRAC和/或TRBC(如表1-表9中所述)的全部或一部分(例如，为或至少500、1,000、1,500、2,000、2,500、3,000、3,500或4,000个连续核苷酸)具有为或至少70％、75％、80％、85％、90％、95％、97％、98％、99％、99.5％或99.9％序列同一性的序列处、附近或之内。

在一些方面，模板多核苷酸内的转基因(例如，外源核酸序列)可以用于指导靶位点和/或同源臂的定位。在一些方面，基因破坏的靶位点可以用作设计用于HDR的模板多核苷酸和/或同源臂的指导。在一些实施方案中，基因破坏可以被靶向于转基因(例如，编码重组受体或其部分)的靶向整合的期望位点附近。在一些实施方案中，模板多核苷酸的一个或多个同源臂序列设计为位于基因破坏的位点(靶位点)周围。在一些方面，所述基因破坏被靶向，使得在整合编码重组受体的转基因后，内源T细胞刺激相关基因座、TRAC和/或TRBC的表达被降低或消除。在一些方面，所述基因破坏被靶向，使得在整合编码重组受体的转基因后，表达内源T细胞刺激相关基因座、TRAC和/或TRBC的全部或一部分。在一些方面，所述靶位点被置于内源T细胞刺激相关基因座、TRAC和/或TRBC的外显子内或附近，使得编码重组受体的转基因可以与T细胞刺激相关基因座、TRAC和/或TRBC的编码序列一起整合在框内。

2.基因破坏的方法

在一些方面，用于产生基因工程化细胞的方法涉及在一个或多个靶位点(例如，在T细胞刺激相关基因座、TRAC和/或TRBC处的一个或多个靶位点)处引入基因破坏。用于产生基因破坏的方法(包括本文所述的那些)可以涉及使用能够诱导基因破坏的一种或多种药剂，如使用工程化系统诱导内源或基因组DNA的靶位点或靶位置处的基因破坏、切割和/或双链断裂(DSB)或切口(例如，单链断裂(SSB))，使得通过错误产生过程(如非同源末端连接(NHEJ))进行的断裂修复或通过使用修复模板的HDR进行的修复可以导致将目的序列(例如，编码嵌合受体或其部分的外源核酸序列或转基因)插入在靶位点或位置处或附近。还提供了能够诱导基因破坏的一种或多种药剂，用于在本文所提供的方法中使用。在一些方面，所述一种或多种药剂可以与本文所提供的模板核苷酸组合用于同源定向修复(HDR)介导的转基因的靶向整合。

在一些实施方案中，能够诱导基因破坏的所述一种或多种药剂包含特异性结合至或杂交至基因组中的特定位点或位置(例如，靶位点或靶位置)的DNA结合蛋白或DNA结合核酸。在一些方面，内源T细胞刺激相关基因座、TRAC和/或TRBC处的靶向基因破坏(例如，DNA断裂或切割)是使用如呈嵌合或融合蛋白形式的与基因编辑核酸酶偶联或复合的蛋白质或核酸来实现的。在一些实施方案中，能够诱导基因破坏的所述一种或多种药剂包括RNA指导的核酸酶或包含DNA靶向蛋白和核酸酶的融合蛋白。

在一些实施方案中，药剂包含各种组分，如RNA指导的核酸酶或包含DNA靶向蛋白和核酸酶的融合蛋白。在一些实施方案中，靶向基因破坏是使用与核酸酶(如内切核酸酶)融合的DNA靶向分子来进行的，所述DNA靶向分子包括DNA结合蛋白，如一种或多种锌指蛋白(ZFP)或转录激活因子样效应子(TALE)。在一些实施方案中，靶向基因破坏是使用RNA指导的核酸酶如成簇的规律间隔的短回文核酸(CRISPR)相关核酸酶(Cas)系统(包括Cas和/或Cfp1)来进行的。在一些实施方案中，靶向基因破坏是使用能够诱导基因破坏的药剂来进行的，所述药剂是如序列特异性或靶向核酸酶，包括DNA结合靶向核酸酶和基因编辑核酸酶(如锌指核酸酶(ZFN)和转录激活因子样效应子核酸酶(TALEN))、以及RNA指导的核酸酶如CRISPR相关核酸酶(Cas)系统，所述药剂被专门设计以被靶向至所述至少一个靶位点、基因序列或其部分。示例性ZFN、TALE和TALEN描述于例如Lloyd等人,Frontiers inImmunology,4(221):1-7(2013)中。

锌指蛋白(ZFP)、转录激活因子样效应子(TALE)和CRISPR系统结合结构域可以被“工程化”以与预定的核苷酸序列结合，例如经由工程化(改变一个或多个氨基酸)天然存在的ZFP或TALE蛋白的识别螺旋区。工程化DNA结合蛋白(ZFP或TALE)是非天然存在的蛋白质。设计的合理标准包括应用替代规则和计算机化算法，以处理存储现有ZFP和/或TALE设计和结合数据的信息的数据库中的信息。参见例如，美国专利号6,140,081；6,453,242；和6,534,261；还参见WO 98/53058；WO 98/53059；WO 98/53060；WO 02/016536和WO 03/016496以及美国公开号20110301073。

在一些实施方案中，所述一种或多种药剂特异性地靶向T细胞刺激相关基因座、TRAC和/或TRBC处或附近的至少一个靶位点。在一些实施方案中，药剂包含特异性结合至、识别或杂交至一个或多个靶位点的ZFN、TALEN或CRISPR/Cas9组合。在一些实施方案中，CRISPR/Cas9系统包括工程化crRNA/tracr RNA(“单一指导RNA”)，以指导特异性切割。在一些实施方案中，药剂包含基于Argonaute系统的核酸酶(例如，来自嗜热栖热菌(T.thermophilus)，称为“TtAgo”(Swarts等人(2014)Nature 507(7491):258-261))。使用HDR或NHEJ介导的过程，可以利用使用本文所述的任何核酸酶系统的靶向切割将转基因的序列(例如，编码重组受体或其一部分的核酸序列)插入内源T细胞刺激相关基因座、TRAC和/或TRBC处的特定靶位置。

在一些实施方案中，“锌指DNA结合蛋白”(或结合结构域)是通过一个或多个锌指以序列特异性方式结合DNA的蛋白质或较大蛋白质内的结构域，所述锌指是结合结构域内的氨基酸序列区域，其结构通过锌离子的配位而稳定。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。ZFP包括靶向通常长9-18个核苷酸的特定DNA序列的人工ZFP结构域，其是通过单独指状物的组装产生的。ZFP包括如下那些，其中单一指状物结构域具有大约30个氨基酸的长度，并且包含含有通过锌与单一β转角的两个半胱氨酸配位的两个不变组氨酸残基且具有两个、三个、四个、五个或六个指状物的α螺旋。通常，ZFP的序列特异性可以通过在锌指识别螺旋上的四个螺旋位置(-1、2、3和6)进行氨基酸取代来改变。因此，例如，ZFP或含有ZFP的分子是非天然存在的，例如被工程化以与所选靶位点结合。

在一些情况下，DNA靶向分子是或包含锌指DNA结合结构域，其与DNA切割结构域融合以形成锌指核酸酶(ZFN)。例如，融合蛋白包含来自至少一种IIS型限制性酶的切割结构域(或切割半结构域)和可以被或可以不被工程化的一个或多个锌指结合结构域。在一些情况下，切割结构域来自IIS型限制性内切核酸酶FokI，其通常催化DNA的双链切割，在距其一条链上的识别位点9个核苷酸处和距其另一条链上的识别位点13个核苷酸处。参见例如，美国专利号5,356,802；5,436,150和5,487,994；Li等人(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279；Li等人(1993)Proc.Natl.Acad.Sci.USA 90:2764-2768；Kim等人(1994)Proc.Natl.Acad.Sci.USA 91:883-887；Kim等人(1994)J.Biol.Chem.269:978-982。一些基因特异性的工程化锌指是可商购获得的。例如，用于锌指构建的称为CompoZr的平台是可用的，其提供针对数千靶标的特异性靶向锌指。参见例如，Gaj等人,Trends inBiotechnology,2013,31(7),397-405。在一些情况下，使用或者定制设计可商购获得的锌指。在一些实施方案中，例如在T细胞刺激相关基因座、TRAC和/或TRBC内的一个或多个靶位点可以被靶向用于通过工程化ZFN进行基因破坏。

转录激活因子样效应子(TALE)是来自细菌物种黄单胞菌属(Xanthomonas)的蛋白质，包含多个重复序列，每个重复序列在位置12和13包含对核酸靶向序列的每个核苷酸碱基具有特异性的双残基(RVD)。具有类似的模块化碱基每碱基(base-per-base)核酸结合特性的结合结构域(MBBBD)也可以源自不同的细菌物种。新型模块化蛋白具有展示比TAL重复序列更高的序列变异性的优点。在一些实施方案中，与不同核苷酸的识别相关的RVD是用于识别C的HD、用于识别T的NG、用于识别A的NI、用于识别G或A的NN、用于识别A、C、G或T的NS、用于识别T的HG、用于识别T的IG、用于识别G的NK、用于识别C的HA、用于识别C的ND、用于识别C的HI、用于识别G的HN、用于识别G的NA、用于识别G或A的SN和用于识别T的YG、用于识别A的TL、用于识别A或G的VT以及用于识别A的SW。在一些实施方案中，关键氨基酸12和13可以突变为其他氨基酸残基，以调节其对核苷酸A、T、C和G的特异性，并且具体而言增强该特异性。

在一些实施方案中，“TALE DNA结合结构域”或“TALE”是包含一个或多个TALE重复结构域/单元的多肽。各自包含重复可变双残基(RVD)的重复结构域参与TALE与其同源靶DNA序列的结合。单一“重复单元”(也称为“重复序列”)通常具有33-35个氨基酸的长度，并且展现与天然存在的TALE蛋白内的其他TALE重复序列的至少一定序列同源性。可以使用重复单元内的典型或非典型RVD将TALE蛋白设计为与靶位点结合。参见，例如，美国专利号8,586,526和9,458,205。

在一些实施方案中，“TALE-核酸酶”(TALEN)是一种融合蛋白，其包含通常源自转录激活因子样效应子(TALE)的核酸结合结构域和切割核酸靶序列的核酸酶催化结构域。催化结构域包含核酸酶结构域或具有内切核酸酶活性的结构域，像例如I-TevI、ColE7、NucA和Fok-I。在特定实施方案中，TALE结构域可以与大范围核酸酶(像例如I-CreI和I-OnuI)或其功能性变体融合。在一些实施方案中，TALEN是单体TALEN。单体TALEN是进行特异性识别和切割无需二聚化的TALEN，如WO 2012138927中所述的工程化TAL重复序列与I-TevI的催化结构域的融合物。TALEN已经被描述并用于基因靶向和基因修饰(参见例如，Boch等人(2009)Science 326(5959):1509-12；Moscou和Bogdanove(2009)Science 326(5959):1501；Christian等人(2010)Genetics 186(2):757-61；Li等人(2011)Nucleic Acids Res39(1):359-72)。在一些实施方案中，T细胞刺激相关基因座、TRAC和/或TRBC中的一个或多个位点可以被靶向以通过工程化TALEN进行基因破坏。

在一些实施方案中，“TtAgo”是原核Argonaute蛋白，其被认为参与基因沉默。TtAgo源自细菌嗜热栖热菌(Thermus thermophilus)。参见例如，Swarts等人,(2014)Nature507(7491):258-261；G.Sheng等人,(2013)Proc.Natl.Acad.Sci.U.S.A.111,652。“TtAgo系统”是所需的所有组分，包括例如用于通过TtAgo酶进行切割的指导DNA。

在一些实施方案中，在自然界中未发现工程化锌指蛋白、TALE蛋白或CRISPR/Cas系统，并且其产生主要来自经验过程，如噬菌体展示、相互作用陷阱或杂交选择。参见例如，美国专利号5,789,538；美国专利号5,925,523；美国专利号6,007,988；美国专利号6,013,453；美国专利号6,200,759；WO 95/19431；WO 96/06166；WO 98/53057；WO 98/54311；WO00/27878；WO 01/60970；WO 01/88197and WO 02/099084。

锌指和TALE DNA结合结构域可以被工程化以与预定的核苷酸序列结合，例如经由工程化(改变一个或多个氨基酸)天然存在的锌指蛋白的识别螺旋区，或通过工程化参与DNA结合的氨基酸(重复可变双残基或RVD区)。因此，工程化锌指蛋白或TALE蛋白是非天然存在的蛋白质。用于工程化锌指蛋白和TALE的方法的非限制性例子是设计和选择。所设计的蛋白质是自然界中不存在的蛋白质，其设计/组成主要源自合理标准。设计的合理标准包括应用替代规则和计算机化算法，以处理存储现有ZFP或TALE设计(典型和非典型RVD)和结合数据的信息的数据库中的信息。参见例如，美国专利号9,458,205；8,586,526；6,140,081；6,453,242；和6,534,261；还参见WO 98/53058；WO 98/53059；WO 98/53060；WO 02/016536和WO 03/016496。

已经描述了用于基因组DNA的靶向切割的各种方法和组合物。此类靶向切割事件可以用于例如诱导靶向诱变，诱导细胞DNA序列的靶向缺失，并且促进预定的染色体基因座处的靶向重组。参见例如，美国专利号9,255,250；9,200,266；9,045,763；9,005,973；9,150,847；8,956,828；8,945,868；8,703,489；8,586,526；6,534,261；6,599,692；6,503,717；6,689,558；7,067,317；7,262,054；7,888,121；7,972,854；7,914,796；7,951,925；8,110,379；8,409,861；美国专利公开案20030232410；20050208489；20050026157；20050064474；20060063231；20080159996；201000218264；20120017290；20110265198；20130137104；20130122591；20130177983；20130196373；20140120622；20150056705；20150335708；20160030477和20160024474，将其公开内容通过引用以其整体并入。

a.CRISPR/Cas9

在一些实施方案中，使用规律间隔成簇短回文重复序列(CRISPR)和CRISPR相关(Cas)蛋白进行在人中的内源基因T细胞刺激相关基因座、TRAC和/或TRBC处的靶向基因破坏(例如，DNA断裂)。参见Sander和Joung(2014)Nature Biotechnology,32(4):347-355。

通常，“CRISPR系统”统指涉及CRISPR相关(“Cas”)基因的表达或指导其活性的转录物和其他元件，包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如，tracr RNA或活性部分tracr RNA)、tracr配对序列(涵盖“同向重复序列”和在内源CRISPR系统的情境下的tracr RNA加工的部分同向重复序列)、指导序列(在内源CRISPR系统的情境下也称为“间隔子”)和/或来自CRISPR基因座的其他序列和转录物。

在一些方面，CRISPR/Cas核酸酶或CRISPR/Cas核酸酶系统包括与DNA序列特异性结合的非编码指导RNA(gRNA)和具有核酸酶功能性的Cas蛋白(例如，Cas9)。

还提供了能够引入基因破坏的一种或多种药剂。还提供了编码能够诱导基因破坏的所述一种或多种药剂的一种或多种组分的多核苷酸(例如，核酸分子)。

(i)指导RNA(gRNA)

在一些实施方案中，能够诱导基因破坏的所述一种或多种药剂包含以下中的至少一种：具有与T细胞刺激相关基因座、TRAC和/或TRBC处的靶位点互补的靶向结构域的指导RNA(gRNA)；或编码gRNA的至少一种核酸。

在一些方面，“gRNA分子”是促进gRNA分子/Cas9分子复合物特异性靶向或归巢至靶核酸(如细胞基因组DNA上的基因座)的核酸。gRNA分子可以是单分子的(具有单一RNA分子)，有时在本文中称为“嵌合”gRNA；或者模块化的(包含超过一种(通常两种)单独RNA分子)。通常，指导序列(例如，指导RNA)是至少包含如下序列部分的任何多核苷酸序列，所述序列部分与靶多核苷酸序列(如在人中的T细胞刺激相关基因座、TRAC和/或TRBC处)具有足够的互补性，以与靶位点处的靶序列杂交并引导CRISPR复合物与靶序列的序列特异性结合。在一些实施方案中，在形成CRISPR复合物的情境下，“靶序列”是指导序列被设计为与其具有互补性的序列，其中靶序列与指导RNA的结构域(例如，靶向结构域)之间的杂交促进CRISPR复合物的形成。如果存在足够的互补性以引起杂交并促进CRISPR复合物的形成，则不一定需要完全互补性。通常，选择指导序列以减少指导序列内二级结构的程度。二级结构可以通过任何合适的多核苷酸折叠算法来确定。

在一些实施方案中，将对目的靶基因座(例如，在人中的T细胞刺激相关基因座、TRAC和/或TRBC基因座处)具有特异性的指导RNA(gRNA)用于RNA指导的核酸酶(例如，Cas)，以在靶位点或靶位置处诱导DNA断裂。用于设计gRNA和示例性靶向结构域的方法可以包括例如以下国际PCT公开号中所述的那些：WO 2015/161276、WO 2017/193107和WO 2017/093969。

几种示例性gRNA结构描述于WO 2015/161276中，例如描述于其中的图1A至图1G中，所述结构上指示有结构域。尽管不希望受理论束缚，关于gRNA的活性形式的三维形式或者链内或链间相互作用，在WO 2015/161276中(例如，在其中的图1A至图1G中)和本文提供的其他描绘中，高互补性区域有时显示为双链体。

在一些情况下，gRNA是单分子或嵌合gRNA，其从5'至3'包含：与靶核酸(如来自T细胞刺激相关基因座、TRAC和/或TRBC基因的序列)互补的靶向结构域；第一互补结构域；连接结构域；第二互补结构域(其与第一互补结构域互补)；近端结构域；以及任选的尾结构域。

在一些情况下，gRNA是包含第一链和第二链的模块化gRNA。在这些情况下，第一链从5'至3’优选包含：靶向结构域(其与靶核酸(如来自T细胞刺激相关基因座、TRAC和/或TRBC基因的序列互补)和第一互补结构域。第二链通常从5'至3'包括：任选的5'延伸结构域；第二互补结构域；近端结构域；以及任选的尾结构域。

(a)靶向结构域

靶向结构域包含与靶核酸上的靶序列互补(例如，至少80％、85％、90％、95％、98％或99％互补，例如完全互补)的核苷酸序列。靶核酸的包含靶序列的链在本文中称为靶核酸的“互补链”。关于选择靶向结构域的指导可以在例如Fu等人,Nat Biotechnol2014年3月；32(3):279-284和Sternberg等人,Nature 2014,507:62–67中找到。靶向结构域的放置的例子包括WO2015/161276中(例如，在其中的图1A至图1G中)所述的那些。

靶向结构域是RNA分子的一部分，因此将包含碱基尿嘧啶(U)，而编码gRNA分子的任何DNA都将包含碱基胸腺嘧啶(T)。尽管不希望受理论束缚，在一些实施方案中，认为靶向结构域与靶序列的互补性有助于gRNA分子/Cas9分子复合物与靶核酸的相互作用的特异性。应理解，在靶向结构域和靶序列对中，靶向结构域中的尿嘧啶碱基将与靶序列中的腺嘌呤碱基配对。在一些实施方案中，靶结构域本身在5'至3'方向上包含任选的次级结构域和核心结构域。在一些实施方案中，核心结构域与靶序列完全互补。在一些实施方案中，靶向结构域具有5至50个核苷酸的长度。靶核酸的与靶向结构域互补的链在本文中称为互补链。所述结构域的一些或所有核苷酸可以具有修饰，例如以使其更不易降解、改善生物相容性等。通过非限制性举例的方式，靶结构域的骨架可以用硫代磷酸酯或一个或多个其他修饰来修饰。在一些情况下，靶向结构域的核苷酸可以包含2'修饰(例如，2-乙酰化，例如2'甲基化)或一个或多个其他修饰。

在各个实施方案中，靶向结构域具有16-26个核苷酸的长度(即它具有16个核苷酸的长度，或17个核苷酸的长度，或18、19、20、21、22、23、24、25或26个核苷酸的长度)。

(b)示例性靶向结构域

在一些实施方案中，设计或鉴定了gRNA序列，所述gRNA序列是或包含靶向特定基因(如T细胞刺激相关基因座、TRAC和/或TRBC)中的靶位点的靶向结构域序列。用于CRISPR基因组编辑的全基因组gRNA数据库公众可获得，其含有靶向人基因组或小鼠基因组中基因的组成型外显子的示例性单一指导RNA(sgRNA)序列(参见例如，genescript.com/gRNA-database.html；还参见Sanjana等人(2014)Nat.Methods,11:783-4)。在一些方面，gRNA序列是或包含具有与非靶位点或位置的最小脱靶结合的序列。

在一些实施方案中，所述靶序列(靶结构域)位于T细胞刺激相关基因座、TRAC和/或TRBC处或附近，如T细胞刺激相关基因座、TRAC和/或TRBC的任何部分。在一些实施方案中，与靶向结构域互补的靶核酸位于目的基因(如T细胞刺激相关基因座、TRAC和/或TRBC)的早期编码区处。早期编码区的靶向可以用于目的基因的基因破坏(即，消除其表达)。在一些实施方案中，目的基因的早期编码区包括紧接起始密码子(例如，ATG)之后或者在起始密码子的500bp内(例如，小于500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp)的序列。在特定例子中，靶核酸在起始密码子的200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp内。在一些例子中，gRNA的靶向结构域与靶核酸(如T细胞刺激相关基因座、TRAC和/或TRBC中的靶核酸)上的靶序列互补，例如至少80％、85％、90％、95％、98％或99％互补，例如完全互补。在一些实施方案中，所述靶向结构域定位于内源T细胞刺激相关基因座、TRAC和/或TRBC的内源转录调节元件(例如启动子)的下游和/或附近。

在一些实施方案中，所述gRNA可以靶向在T细胞刺激相关基因座、TRAC和/或TRBC处的位点，在转基因(例如，编码重组受体的转基因)的靶向整合的期望位点附近。在一些方面，所述gRNA可以基于编码T细胞刺激相关基因座、TRAC和/或TRBC的序列的量靶向某个位点，所述量是对于以与内源T细胞刺激相关基因座、TRAC和/或TRBC的调节相似的方式、时间和程度调节重组受体的表达所需的。在一些方面，所述gRNA可以基于编码T细胞刺激相关基因座、TRAC和/或TRBC的序列的量靶向某个位点，所述量是对于在表达重组受体的细胞中表达所需的。在一些方面，所述gRNA可以靶向某个位点，使得在整合转基因(例如，编码重组受体的转基因)后，所得的T细胞刺激相关基因座、TRAC和/或TRBC保留由T细胞刺激相关基因座、TRAC和/或TRBC编码的内源基因产物的表达。在一些方面，所述内源基因产物在通过gRNA靶向和随后的HDR之后不表达(例如，敲除)。在一些方面，所述gRNA可以靶向内源T细胞刺激相关基因座、TRAC和/或TRBC的开放阅读框的外显子内的位点。在一些方面，所述gRNA可以靶向T细胞刺激相关基因座、TRAC和/或TRBC的开放阅读框的内含子内的位点。在一些方面，所述gRNA可以靶向T细胞刺激相关基因座、TRAC和/或TRBC的调节或控制元件(例如，启动子)内或下游的位点。在一些方面，由gRNA靶向的T细胞刺激相关基因座、TRAC和/或TRBC处的靶位点可以是本文(例如，在第II.A.1节中)描述的任何靶位点。在一些实施方案中，gRNA可以靶向对应于早期编码区的外显子内或与所述外显子非常靠近的位点，所述外显子例如内源T细胞刺激相关基因座、TRAC和/或TRBC的开放阅读框的外显子1、2、3、4或5，或者包括紧接转录起始位点之后、在外显子1、2、3、4或5内、或者在外显子1、2、3、4或5的小于500、450、400、350、300、250、200、150、100或50bp内的序列。在一些实施方案中，gRNA可以靶向在内源T细胞刺激相关基因座、TRAC和/或TRBC的外显子2处或附近，或者在外显子2的小于500、450、400、350、300、250、200、150、100或50bp内的位点。

T细胞刺激相关基因座PDCD1的示例性靶序列包括SEQ ID NO:74、78或98-103所示的序列。示例性gRNA可以包括如下核糖核酸序列，其可以结合至或靶向或互补于或可以结合至SEQ ID NO:74、78或98-103所示的靶位点序列的互补链序列。示例性PDCD1gRNA序列包括SEQ ID NO:75或104-109所示的序列。示例性PDCD1 gRNA序列包括SEQ ID NO:75所示的序列。可以使用任何已知方法来靶向和产生内源PDCD1的基因破坏，其可以用于本文提供的实施方案中。包含在gRNA内的用于靶向人PDCD1基因座的基因破坏的示例性靶序列或靶向结构域包括以下文献中描述的那些：例如，WO 2015/161276、WO 2017/093969、Schumann等人,PNAS August 18,2015 112(33)10437-10442以及Xu等人,Sci Rep.2018；8:11649，将其通过引用并入本文。

示例性T细胞刺激相关基因座CD69的示例性靶序列包括SEQ ID NO:110-115所示的序列。示例性gRNA可以包括如下核糖核酸序列，其可以结合至或靶向或互补于或可以结合至SEQ ID NO:110-115中任一个所示的靶位点序列的互补链序列。示例性CD69gRNA序列包括SEQ ID NO:116-121所示的序列。可以使用任何已知方法来靶向和产生内源CD69的基因破坏，其可以用于本文提供的实施方案中。包含在gRNA内的用于靶向人CD69基因座的基因破坏的示例性靶序列或靶向结构域包括Simenov等人,Nature.2017Sep 7；549(7670):111–115中描述的那些，将其通过引用并入本文。

示例性T细胞刺激相关基因座Nur77(NR4A1)的示例性靶序列包括SEQ ID NO:122-127或134-136所示的序列。示例性gRNA可以包括如下核糖核酸序列-可以结合至或靶向或互补于或可以结合至SEQ ID NO:122-127或134-136所示的靶位点序列的互补链序列。示例性Nur77(NR4A1)gRNA序列包括SEQ ID NO:128-133或136-138所示的序列。可以使用任何已知方法来靶向和产生内源Nur77(NR4A1)基因座的基因破坏，其可以用于本文提供的实施方案中。包含在gRNA内的用于靶向人Nur77(NR4A1)基因座的基因破坏的示例性靶序列或靶向结构域包括在以下文献中描述的那些：例如，WO 2019/089982、WO 2019/104245以及Munnur等人,Cell Reports(2019)26,2028–2036，将其通过引用并入本文。

示例性T细胞刺激相关基因座FoxP3的示例性靶序列包括SEQ ID NO:140-147所示的序列。示例性gRNA可以包括如下核糖核酸序列，其可以结合至或靶向或互补于或可以结合至SEQ ID NO:140-147中任一个所示的靶位点序列的互补链序列。示例性FoxP3gRNA序列包括SEQ ID NO:148-155所示的序列。可以使用任何已知方法来靶向和产生内源FoxP3的基因破坏，其可以用于本文提供的实施方案中。包含在gRNA内的用于靶向人FoxP3基因座的基因破坏的示例性靶序列或靶向结构域包括Okada等人,Epigenetics Chromatin.2017；10:24和Holohan等人,bioRxiv 644229中描述的那些，将其通过引用并入本文。

示例性T细胞刺激相关基因座HLA-DRA的示例性靶序列包括SEQ ID NO:156-161所示的序列。示例性gRNA可以包括如下核糖核酸序列，其可以结合至或靶向或互补于或可以结合至SEQ ID NO:156-161中任一个所示的靶位点序列的互补链序列。示例性HLA-DRAgRNA序列包括SEQ ID NO:162-167所示的序列。可以使用任何已知方法来靶向和产生内源HLA-DRA的基因破坏，其可以用于本文提供的实施方案中。包含在gRNA内的用于靶向人HLA-DRA基因座的基因破坏的示例性靶序列或靶向结构域包括WO 2016/021972和WO 2017/093969中描述的那些，将其通过引用并入本文。

示例性T细胞刺激相关基因座HLA-DRB1的示例性靶序列包括SEQ ID NO:168-177所示的序列。示例性gRNA可以包括如下核糖核酸序列，其可以结合至或靶向或互补于或可以结合至SEQ ID NO:168-177中任一个所示的靶位点序列的互补链序列。示例性HLA-DRB1gRNA序列包括SEQ ID NO:178-187所示的序列。可以使用任何已知方法来靶向和产生内源HLA-DRB1的基因破坏，其可以用于本文提供的实施方案中。包含在gRNA内的用于靶向人HLA-DRB1基因座的基因破坏的示例性靶序列或靶向结构域包括WO 2016/021972和WO2017/093969中描述的那些，将其通过引用并入本文。

gRNA内所含的用于靶向人TRAC、TRBC1或TRBC2的基因破坏的示例性靶向结构域包括例如WO 2015/161276、WO 2017/193107、WO 2017/093969、WO 2019/195492、US 2016/272999和US 2015/056705中描述的那些或可以与前述的靶序列结合的靶向结构域。gRNA内所含的用于靶向使用酿脓链球菌(S.pyogenes)或金黄色葡萄球菌(S.aureus)Cas9进行的人TRAC基因座的基因破坏的示例性靶向结构域可以包括SEQ ID NO:77和188-218中所示的那些中的任一种。gRNA内所含的用于靶向使用酿脓链球菌或金黄色葡萄球菌Cas9进行的人TRBC1或TRBC2基因座的基因破坏的示例性靶向结构域可以包括SEQ ID NO:219-276中所示的那些中的任一种。

在一些实施方案中，用于靶向TRAC、TRBC1和/或TRBC2的gRNA包括本文所述或在其他地方(例如，在WO 2015/161276、WO 2017/193107、WO 2017/093969、WO 2019/195492、US2016/272999和US 2015/056705中)描述的任何gRNA，或者可以是可以与前述的靶序列结合的靶向结构域。在一些实施方案中，用于靶向TRAC基因座的gRNA可以通过序列AGCGCTCTCGTACAGAGTTGGCATTATAATACGACTCACTATAGGG

GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT(如SEQ ID NO:277所示；粗体且加下划线的部分与TRAC基因座中的靶位点互补)的体外转录来获得，或者化学合成，其中gRNA具有序列5'-/>

G UUUUAG AGC UAG AAA UAG CAA GUU AAA AUA AGG CUA GUC CGU UAU CAA CUU GAA AAA GUGGCA CCG AGU CGG UGC UUU U-3'(如SEQ ID NO:278所示；参见Osborn等人,Mol Ther.24(3):570-581(2016))。用于产生编码TCR结构域或区域的内源基因(例如，TRAC、TRBC1和/或TRBC2)的基因破坏的其他示例性gRNA序列描述于例如WO 2015/161276、WO 2017/193107、WO 2017/093969、WO 2019/195492、US 2016/272999和US 2015/056705中。

用于内源TCR基因座的基因编辑的示例性方法包括例如美国公开号US 2011/0158957、US 2014/0301990、US 2015/0098954、US 2016/0208243、US 2016/272999和US2015/056705；国际PCT公开号WO 2014/191128、WO 2015/136001、WO 2015/161276、WO2016/069283、WO 2016/016341、WO 2017/193107和WO 2017/093969；以及Osborn等人(2016)Mol.Ther.24(3):570-581中所述的那些。可以使用任何已知方法来产生编码TCR结构域或区域的内源基因的基因破坏，其可以用于本文提供的实施方案中。

在一些实施方案中，靶向结构域包括用于使用酿脓链球菌Cas9或使用脑膜炎奈瑟氏菌(N.meningitidis)Cas9在TRAC、TRBC1和/或TRBC2基因座处引入基因破坏的那些。在一些实施方案中，靶向结构域包括用于使用酿脓链球菌Cas9在TRAC、TRBC1和/或TRBC2基因座处引入基因破坏的那些。任何靶向结构域都可以与产生双链断裂(Cas9核酸酶)或单链断裂(Cas9切口酶)的酿脓链球菌Cas9分子一起使用。

在一些实施方案中，使用双重靶向通过使用具有与相对DNA链互补的两个靶向结构域的酿脓链球菌Cas9切口酶在相对DNA链上产生两个切口，例如，包含任何负链靶向结构域的gRNA可以与包含正链靶向结构域的任何gRNA配对。在一些实施方案中，两种gRNA在DNA上的定向使得PAM朝外，并且gRNA的5'端之间的距离为0-50bp。在一些实施方案中，使用两种gRNA靶向两种Cas9核酸酶或两种Cas9切口酶，例如使用由两种不同gRNA分子指导的一对Cas9分子/gRNA分子复合物来切割靶结构域，在靶结构域的相对链上产生两个单链断裂。在一些实施方案中，两种Cas9切口酶可以包括具有HNH活性的分子，例如RuvC活性失活的Cas9分子，例如在D10处具有突变(例如，D10A突变)的Cas9分子；具有RuvC活性的分子，例如HNH活性失活的Cas9分子，例如在H840处具有突变(例如，H840A)的Cas9分子；或者具有RuvC活性的分子，例如HNH活性失活的Cas9分子，例如在N863处具有突变(例如，N863A)的Cas9分子。在一些实施方案中，两种gRNA中的每一种与D10A Cas9切口酶复合。

在一些实施方案中，所述靶序列(靶结构域)位于T细胞刺激相关基因座、TRAC、TRAC1和/或TRBC2编码序列(例如本文表1-表9中所述)处或附近，如T细胞刺激相关基因座、TRAC、TRAC1和/或TRBC2的任何部分。在一些实施方案中，与靶向结构域互补的靶核酸位于目的基因(如T细胞刺激相关基因座、TRAC、TRBC1和/或TRBC2)的早期编码区处。早期编码区的靶向可以用于目的基因的基因破坏(即，消除其表达)。在一些实施方案中，目的基因的早期编码区包括紧接起始密码子(例如，ATG)之后或者在起始密码子的500bp内(例如，小于500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp)的序列。在特定例子中，靶核酸在起始密码子的200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp内。在一些例子中，gRNA的靶向结构域与靶核酸(如T细胞刺激相关基因座、TRAC、TRBC1和/或TRBC2基因座中的靶核酸)上的靶序列互补，例如至少80％、85％、90％、95％、98％或99％互补，例如完全互补。

在一些方面，gRNA可以靶向内源T细胞刺激相关基因座、TRAC、TRBC1和/或TRBC2的开放阅读框的外显子内的位点。在一些方面，gRNA可以靶向T细胞刺激相关基因座、TRAC、TRBC1和/或TRBC2的开放阅读框的内含子内的位点。在一些方面，gRNA可以靶向T细胞刺激相关基因座、TRAC、TRBC1和/或TRBC2的调节或控制元件(例如，启动子)内的位点。在一些方面，在T细胞刺激相关基因座、TRAC、TRBC1和/或TRBC2处由gRNA靶向的靶位点可以是本文例如在第II.A.1节中所述的任何靶位点。在一些实施方案中，gRNA可以靶向对应于早期编码区的外显子(例如，内源T细胞刺激相关基因座、TRAC、TRBC1和/或TRBC2的开放阅读框的外显子1、2或3)内或与所述外显子非常靠近的位点，或者包括紧接转录起始位点之后、在外显子1、2或3内、或者在外显子1、2或3的小于500、450、400、350、300、250、200、150、100或50bp内的序列。在一些实施方案中，gRNA可以靶向内源T细胞刺激相关基因座、TRAC、TRBC1和/或TRBC2的外显子2处或附近的位点，或者在外显子2的小于500、450、400、350、300、250、200、150、100或50bp内的位点。

在一些实施方案中，靶向结构域包括用于使用酿脓链球菌Cas9或使用脑膜炎奈瑟氏菌(N.meningitidis)Cas9在T细胞刺激相关基因座、TRAC和/或TRBC基因处引入基因破坏的那些。在一些实施方案中，靶向结构域包括用于使用酿脓链球菌Cas9在T细胞刺激相关基因座、TRAC和/或TRBC基因处引入基因破坏的那些。任何靶向结构域都可以与产生双链断裂(Cas9核酸酶)或单链断裂(Cas9切口酶)的酿脓链球菌Cas9分子一起使用。

gRNA的其他结构域(如互补结构域、连接结构域、5'延伸结构域、近端结构域和尾部结构域)以及它们的结构在例如WO 2015/161276中例如在图1A-图1G中进行了描述。

用于设计gRNA的方法描述于本文中，包括用于选择、设计和验证靶向结构域的方法。示例性靶向结构域也提供于本文中。可以将本文所讨论的靶向结构域掺入本文所述的gRNA中。

用于选择和验证靶序列以及脱靶分析的方法描述于以下文献中：例如，Mali等人,2013Science 339(6121):823-826；Hsu等人Nat Biotechnol,31(9):827-32；Fu等人,NatBiotechnol 2014年3月；32(3):279-284；Heigwer等人,2014Nat Methods 11(2):122-3；Bae等人,Bioinformatics.2014年5月15；30(10):1473-5；Xiao A等人,Bioinformatics.2014年4月15；30(8):1180-1182。

在一些实施方案中，可以使用软件工具优化使用者的靶序列内gRNA的选择，例如以使整个基因组中的总脱靶活性降至最低。脱靶活性可以与切割不同。例如，对于使用酿脓链球菌Cas9的每种可能的gRNA选择，软件工具可以鉴定整个基因组中所有潜在的脱靶序列(前述NAG或NGG PAM)，所述脱靶序列含有最多某个数量(例如，1、2、3、4、5、6、7、8、9或10)个错配的碱基对。可以例如使用源自实验的加权方案来预测每个脱靶序列处的切割效率。然后可以将每种可能的gRNA根据其总预测脱靶切割进行评级；最高评级的gRNA表示可能具有最高中靶和最低脱靶切割的那些。工具中还可以包括其他功能，例如用于gRNA载体构建的自动化试剂设计、用于中靶Surveyor测定的引物设计以及用于经由下一代测序进行脱靶切割的高通量检测和定量的引物设计。候选gRNA分子可以通过本领域已知的方法或如本文所述来评价。

在一些实施方案中，使用DNA序列搜索算法(例如，使用基于公共工具cas-offinder的定制gRNA设计软件)来鉴定用于与酿脓链球菌、金黄色葡萄球菌和脑膜炎奈瑟氏菌Cas9一起使用的gRNA(Bae等人Bioinformatics.2014；30(10):1473-1475)。定制gRNA设计软件在计算指导物的全基因组脱靶倾向后对所述指导物进行评分。通常，对于长度范围从17至24的指导物，考虑范围从完全匹配至7个错配的匹配。在一些方面，一旦通过计算确定脱靶位点，计算每种指导物的总得分，并且使用网络界面归纳于表格输出中。除了鉴定与PAM序列相邻的潜在gRNA位点，所述软件还可以鉴定与所选gRNA位点相差1、2、3个或更多个核苷酸的所有PAM相邻序列。在一些实施方案中，每个基因的基因组DNA序列是从UCSC基因组浏览器获得的，并且可以使用公众可获得的RepeatMasker程序针对重复元件筛选序列。RepeatMasker针对重复元件和低复杂度区域搜索输入DNA序列。输出是给定查询序列中存在的重复序列的详细注释。

在鉴定后，可以将gRNA基于以下中的一项或多项评级为多层：其与靶位点的距离、其正交性和5'G的存在(基于对人基因组中含有相关PAM的紧密匹配的鉴定，例如，在酿脓链球菌的情况下为NGG PAM，在金黄色葡萄球菌的情况下为NNGRR(例如，NNGRRT或NNGRRV)PAM，并且在脑膜炎奈瑟氏菌的情况下为NNNNGATT或NNNNGCTT PAM)。正交性是指人基因组中含有与靶序列的最小错配数的序列的数量。“高正交性水平”或“良好正交性”可以例如是指20聚体靶向结构域，其在人基因组中除了预期靶标外不具有相同的序列，也不具有含有靶序列中的一个或两个错配的任何序列。选择具有良好正交性的靶向结构域以使脱靶DNA切割降至最低。应理解，这是非限制性例子，并且可以利用多种策略鉴定用于与酿脓链球菌、金黄色葡萄球菌和脑膜炎奈瑟氏菌或其他Cas9酶一起使用的gRNA。

在一些实施方案中，可以使用公众可获得的基于网络的ZiFiT服务器来鉴定用于与酿脓链球菌Cas9一起使用的gRNA(Fu等人,Nat Biotechnol 2014年3月；32(3):279-284，关于初始参考参见Sander等人,2007,NAR 35:W599-605；Sander等人,2010,NAR 38:W462-8)。除了鉴定与PAM序列相邻的潜在gRNA位点，所述软件还鉴定与所选gRNA位点相差1、2、3个或更多个核苷酸的所有PAM相邻序列。在一些方面，每个基因的基因组DNA序列可以从UCSC基因组浏览器获得，并且可以使用公众可获得的Repeat-Masker程序针对重复元件筛选序列。RepeatMasker针对重复元件和低复杂度区域搜索输入DNA序列。输出是给定查询序列中存在的重复序列的详细注释。

(ii)Cas9

多种物种的Cas9分子可以用于本文所述的方法和组合物中。尽管酿脓链球菌、金黄色葡萄球菌、脑膜炎奈瑟氏菌和嗜热链球菌Cas9分子是本文中大部分公开内容的主题，也可以使用本文所列其他物种的Cas9分子、源自所述其他物种的Cas9蛋白的Cas9分子、或基于所述其他物种的Cas9蛋白的Cas9分子。换句话说，尽管本文中大部分描述使用酿脓链球菌、金黄色葡萄球菌、脑膜炎奈瑟氏菌和嗜热链球菌Cas9分子，来自其他物种的Cas9分子可以替代它们。此类物种包括：燕麦食酸菌(Acidovorax avenae)、胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae)、琥珀酸放线杆菌(Actinobacillussuccinogenes)、猪放线杆菌(Actinobacillus suis)、放线菌属物种(Actinomyces sp.)、Cycliphilusdenitrificans、寡食氨基酸单胞菌(Aminomonas paucivorans)、蜡样芽孢杆菌(Bacillus cereus)、史氏芽孢杆菌(Bacillus smithii)、苏云金芽孢杆菌(Bacillusthuringiensis)、拟杆菌属物种(Bacteroides sp.)、Blastopirellula marina、慢生根瘤菌属物种(Bradyrhizobium sp.)、侧孢短芽孢杆菌(Brevibacillus laterosporus)、结肠弯曲菌(Campylobacter coli)、空肠弯曲菌(Campylobacter jejuni)、红嘴鸥弯曲菌(Campylobacter lari)、Candidatus puniceispirillum、解纤维梭菌(Clostridiumcellulolyticum)、产气荚膜梭菌(Clostridium perfringens)、拥挤棒杆菌(Corynebacterium accolens)、白喉棒杆菌(Corynebacterium diphtheria)、马氏棒杆菌(Corynebacterium matruchotii)、Dinoroseobacter shibae、细长真杆菌(Eubacteriumdolichum)、γ-变形菌(Gammaproteobacterium)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、副流感嗜血杆菌(Haemophilusparainfluenzae)、生痰嗜血杆菌(Haemophilus sputorum)、加拿大螺杆菌(Helicobactercanadensis)、同性恋螺杆菌(Helicobacter cinaedi)、雪貂螺杆菌(Helicobactermustelae)、营养泥杆菌(Ilyobacter polytropus)、金氏金氏菌(Kingella kingae)、卷曲乳杆菌(Lactobacillus crispatus)、伊氏李斯特菌(Listeria ivanovii)、单核细胞增生李斯特菌(Listeria monocytogenes)、李斯特菌(Listeriaceae)细菌、甲基孢囊菌属物种(Methylocystis sp.)、丝孢甲基弯曲菌(Methylosinus trichosporium)、羞怯动弯杆菌(Mobiluncus mulieris)、杆菌状奈瑟氏菌(Neisseria bacilliformis)、灰色奈瑟氏菌(Neisseria cinerea)、金黄奈瑟氏菌(Neisseria flavescens)、乳糖奈瑟氏菌(Neisserialactamica)、脑膜炎奈瑟氏菌(Neisseria meningitidis)、奈瑟氏菌属物种(Neisseriasp.)、瓦茨瓦尔西奈瑟氏菌(Neisseria wadsworthii)、亚硝化单胞菌属物种(Nitrosomonas sp.)、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、多杀巴斯德菌(Pasteurella multocida)、Phascolarctobacterium succinatutens、Ralstoniasyzygii、沼泽红假单胞菌(Rhodopseudomonas palustris)、小红卵菌属物种(Rhodovulumsp.)、米氏西蒙斯菌(Simonsiella muelleri)、鞘氨醇单胞菌属物种(Sphingomonas sp.)、葡萄园芽孢乳杆菌(Sporolactobacillus vineae)、金黄色葡萄球菌、路邓葡萄球菌(Staphylococcus lugdunensis)、链球菌属物种(Streptococcus sp.)、Subdoligranulum物种、运动替斯崔纳菌(Tistrella mobilis)、密螺旋体属物种(Treponema sp.)或艾森氏蚯蚓状肾杆菌(Verminephrobacter eiseniae)。Cas9分子的例子可以包括例如WO 2015/161276、WO 2017/193107、WO 2017/093969、US 2016/272999和US 2015/056705中所述的那些。

如该术语在本文所用，Cas9分子或Cas9多肽是指可以与gRNA分子相互作用并且与gRNA分子一齐归巢或定位至包含靶结构域和PAM序列的位点的分子或多肽。如那些术语在本文中所用，Cas9分子和Cas9多肽是指天然存在的Cas9分子，并且是指与参考序列(例如，最相似的天然存在的Cas9分子)相差例如至少一个氨基酸残基的工程化的、改变的或修饰的Cas9分子或Cas9多肽。

已经确定了两种不同的天然存在的细菌Cas9分子(Jinek等人,Science,343(6176):1247997,2014)和具有指导RNA的酿脓链球菌Cas9(例如，crRNA与tracrRNA的合成融合物)(Nishimasu等人,Cell,156:935-949,2014；和Anders等人,Nature,2014Sep25；513(7519):569-73)的晶体结构。

示例性Cas9分子、它们的结构和变体包括以下文献中描述的那些：例如，WO 2015/161276(例如，其中的图2A-图2G和图8A-图8D)以及WO 2017/193107、WO 2017/093969、US2016/272999和US 2015/056705。

编码Cas9分子或Cas9多肽(例如，eaCas9分子或eaCas9多肽)的核酸可以与本文提供的任何实施方案结合使用。

编码Cas9分子或Cas9多肽的示例性核酸描述于Cong等人,Science 2013,399(6121):819-823；Wang等人,Cell 2013,153(4):910-918；Mali等人,Science 2013,399(6121):823-826；Jinek等人,Science 2012,337(6096):816-821；以及WO 2015/161276，例如在其中的图8中。

在一些实施方案中，编码Cas9分子或Cas9多肽的核酸可以是合成核酸序列。例如，可以对合成核酸分子进行化学修饰。在一些实施方案中，Cas9 mRNA具有以下特性中的一种或多种(例如，所有)：其被加帽，多腺苷酸化，被5-甲基胞苷和/或假尿苷取代。另外或可替代地，可以对合成核酸序列进行密码子优化，例如，至少一个非常见密码子或较不常见密码子已经被常见密码子替代。例如，合成核酸可以引导优化的信使mRNA的合成，例如针对例如本文所述的哺乳动物表达系统中的表达进行优化。另外或可替代地，编码Cas9分子或Cas9多肽的核酸可以包含核定位序列(NLS)。核定位序列是已知的。

在一些实施方案中，所述Cas9分子包含如下序列，所述序列为或含有SEQ ID NO:279-287中任一个；或如下序列，所述序列与SEQ ID NO:112-117中任一个展现出至少85％、86％、87％、88％、89％、90％、91％、92％、92％、94％、95％、96％、97％、98％、99％或更多序列同一性。示例性Cas9分子包括酿脓链球菌、金黄色葡萄球菌或脑膜炎奈瑟氏菌的Cas9分子。在一些实施方案中，Cas9分子或Cas9多肽包含区域1-5，其与足够的另外的Cas9分子序列一起提供生物活性分子，例如具有至少一种本文所述活性的Cas9分子。在一些实施方案中，区域1-6中的每一个独立地与本文所述(例如，SEQ ID NO:279-287所示)的Cas9分子或Cas9多肽或WO 2015/161276中(例如，来自其中的图2A至图2G或来自图7A至图7B)披露的序列的相应残基具有50％、60％、70％或80％同源性。

如果任何前述Cas9序列在C末端与肽或多肽融合，则应理解终止密码子将被去除。

可以使用各种类型的Cas分子或Cas多肽来实践本文公开的发明。在一些实施方案中，使用II型Cas系统的Cas分子。在其他实施方案中，使用其他Cas系统的Cas分子。例如，可以使用I型或III型Cas分子。示例性Cas分子(和Cas系统)描述于例如Haft等人,PLoSComputational Biology 2005,1(6):e60和Makarova等人,Nature Review Microbiology2011,9:467-477中，将两个参考文献的内容通过引用以其整体并入本文。示例性Cas分子(和Cas系统)包括例如WO 2015/161276、WO 2017/193107、WO 2017/093969、US 2016/272999和US 2015/056705中描述的那些。

(iii)Cpf1

在一些实施方案中，指导RNA或gRNA促进RNA指导的核酸酶(如Cas9或Cpf1)与靶序列(如细胞中的基因组或附加型序列)的特异性关联靶向。通常，gRNA可以是单分子的(包含单一RNA分子，并且可替代地称为嵌合的)，或者模块化的(包含超过一种、并且通常两种单独RNA分子(如crRNA和tracrRNA)，其在一些实施方案中通常通过双链化彼此缔合)。gRNA及其组成部分描述于文献中，在一些实施方案中描述于通过引用并入的Briner等人Molecular Cell(2014)56(2),333-339中。

无论是单分子的还是模块化的，指导RNA通常都包括与靶标完全或部分互补的靶向结构域，并且通常具有10-30个核苷酸的长度，并且在某些实施方案中具有16-24个核苷酸的长度(在一些实施方案中，16、17、18、19、20、21、22、23或24个核苷酸的长度)。在一些方面，在Cas9 gRNA的情况下，靶向结构域在gRNA的5'端处或附近，并且在Cpf1 gRNA的情况下，靶向结构域在gRNA的3'端处或附近。尽管前述描述集中于用于与Cas9一起使用的gRNA，应当了解，已经(或在将来可能)发现或发明其他RNA指导的核酸酶，所述核酸酶利用以某些方式与针对这一点所述的那些不同的gRNA。在一些实施方案中，Cpf1(“来自普氏菌属和弗朗西斯菌属的CRISPR 1(CRISPR from Prevotella and Franciscella 1)”)是最近发现的RNA指导的核酸酶，其不需要tracrRNA起作用。(Zetsche等人,2015,Cell 163,759–771，通过引用并入本文)。用于在Cpf1基因组编辑系统中使用的gRNA通常包括靶向结构域和互补结构域(可替代地称为“手柄(handle)”)。还应当注意，在用于与Cpf1一起使用的gRNA中，靶向结构域通常存在于3'端处或附近，而不是如上文结合Cas9 gRNA所述在5'端处或附近(手柄在Cpf1 gRNA的5'端处或附近)。

尽管在来自不同原核物种的gRNA之间或在Cpf1与Cas9 gRNA之间可能存在结构差异，gRNA是作用原理通常是一致的。由于这种作用一致性，在广义上，gRNA可以依据其靶向结构域序列来定义，并且熟练技术人员将了解，可以将给定的靶向结构域序列掺入任何合适的gRNA中，包括单分子或嵌合gRNA，或者包括一种或多种化学修饰和/或序列修饰(取代、另外的核苷酸、截短等)的gRNA。因此，在本公开文本中的一些方面，gRNA可以仅根据其靶向结构域序列来描述。

更通常地，本公开文本的一些方面涉及可以使用多种RNA指导的核酸酶实施的系统、方法和组合物。除非另有说明，否则应当将术语gRNA理解为涵盖可以与任何RNA指导的核酸酶一起使用的任何合适的gRNA，而不仅仅是与特定种类的Cas9或Cpf1相容的那些gRNA。通过说明的方式，在某些实施方案中，术语gRNA可以包括用于与存在于2类CRISPR系统(如II型或V型或CRISPR系统)中的任何RNA指导的核酸酶或者从所述核酸酶来源或修改的RNA指导的核酸酶一起使用的gRNA。

尽管Cas9和Cpf1在结构和功能上共有相似性，但应当了解，某些Cpf1活性是由与任何Cas9结构域都不类似的结构性结构域介导的。在一些实施方案中，靶DNA的互补链的切割似乎是由Nuc结构域介导的，所述Nuc结构域与Cas9的HNH结构域在顺序和空间上有所不同。另外，Cpf1 gRNA的非靶向部分(手柄)采用假结结构，而不是Cas9 gRNA中由重复:抗重复双链体形成的茎环结构。

本文提供了编码RNA指导的核酸酶(例如，Cas9、Cpf1或其功能性片段)的核酸。编码RNA引导的核酸酶的示例性核酸包括描述于以下文献中的那些：例如，Cong等人,Science2013,399(6121):819-823；Wang等人,Cell 2013,153(4):910-918；Mali等人,Science2013,399(6121):823-826；Jinek等人,Science 2012,337(6096):816-821。

b.基因组编辑方法

通常，应理解，根据本文所述方法的任何基因的改变都可以通过任何机制介导，并且任何方法都不限于特定机制。可以与基因改变相关的示例性机制包括但不限于非同源末端连接(例如，经典的或替代的)、微同源介导的末端连接(MMEJ)、同源定向修复(例如，内源供体模板介导的)、合成依赖性链退火(SDSA)、单链退火、单链侵入、单链断裂修复(SSBR)、错配修复(MMR)、碱基切除修复(BER)、链间交联(ICL)跨损伤合成(TLS)或无错复制后修复(PRR)。本文描述了用于靶向敲除T细胞刺激相关基因座、TRAC和/或TRBC的一个或两个等位基因的示例性方法。示例性机制包括例如美国专利公开号US 20170349894、US20180362943和US 20180245079中描述的那些。

在gRNA和Cas9核酸酶产生双链断裂以用于诱导NHEJ介导的插入缺失的目的的一些实施方案中，gRNA(例如，单分子(或嵌合)或模块化gRNA分子)被配置将双链断裂定位地非常靠近靶位置的核苷酸。在一些实施方案中，切割位点在距离靶位置0-30bp之间(例如，距离靶位置小于30、25、20、15、10、9、8、7、6、5、4、3、2或1bp)。

在与Cas9切口酶复合的两种gRNA诱导两个单链断裂以用于诱导NHEJ介导的插入缺失的目的的一些实施方案中，两种gRNA(例如，独立地为单分子(或嵌合)或模块化gRNA)被配置为定位两个单链断裂以提供NHEJ修复靶位置的核苷酸。在一些实施方案中，gRNA被配置为将切割定位于不同链上的相同位置处或彼此的几个核苷酸内，从而本质上模拟双链断裂。在一些实施方案中，较近的切口在距离靶位置0-30bp之间(例如，距离靶位置小于30、25、20、15、10、9、8、7、6、5、4、3、2或1bp)，并且两个切口在彼此25-55bp内(例如，在25至50、25至45、25至40、25至35、25至30、50至55、45至55、40至55、35至55、30至55、30至50、35至50、40至50、45至50、35至45或40至45bp之间)且彼此相距不超过100bp(例如，不超过90、80、70、60、50、40、30、20或10bp)。在一些实施方案中，gRNA被配置为将单链断裂放置在靶位置的核苷酸的任一侧上。

双链切割eaCas9分子和单链或切口酶eaCas9分子均可以用于本文所述的方法和组合物中，以在靶位置的两侧产生断裂。可以在靶位置的两侧上产生双链或成对的单链断裂，以去除两个切割之间的核酸序列(例如，缺失两个断裂之间的区域)。在一些实施方案中，两种gRNA(例如，独立地为单分子(或嵌合)或模块化gRNA)被配置为将双链断裂定位于靶位置的两侧上。在一个替代实施方案中，三种gRNA(例如，独立地为单分子(或嵌合)或模块化gRNA)被配置为将双链断裂(即，一种gRNA与cas9核酸酶复合)和两个单链断裂或成对的单链断裂(即，两种gRNA与Cas9切口酶复合)定位于靶位置的任一侧上。在另一个实施方案中，四种gRNA(例如，独立地为单分子(或嵌合)或模块化gRNA)被配置为在靶位置的任一侧上产生两对单链断裂(即，两对两种gRNA与Cas9切口酶复合)。一个或多个双链断裂或一对中两个单链切口中的较近者将理想地在靶位置的0-500bp内(例如，距离靶位置不超过450、400、350、300、250、200、150、100、50或25bp)。当使用切口酶时，一对中的两个切口在彼此的25-55bp内(例如，在25至50、25至45、25至40、25至35、25至30、50至55、45至55、40至55、35至55、30至55、30至50、35至50、40至50、45至50、35至45或40至45bp之间)且彼此相距不超过100bp(例如，不超过90、80、70、60、50、40、30、20或10bp)。

可以通过本领域已知的方法或如本文所述的评价任何Cas9分子、gRNA分子、Cas9分子/gRNA分子复合物。例如，用于评价Cas9分子的内切核酸酶活性的示例性方法描述于例如Jinek等人,Science 2012,337(6096):816-821、WO 2015/161276、WO 2017/193107、WO2017/093969、US 2016/272999和US 2015/056705中。

3.用于基因破坏的药剂的递送

在一些实施方案中，人体中的内源T细胞刺激相关基因座、TRAC和/或TRBC的靶向基因破坏(例如，DNA断裂)是通过以下方式来进行：使用用于引入或转移至细胞的多种已知递送方法或媒介物中的任一种(例如，使用病毒(例如，慢病毒)递送载体)或者用于递送Cas9分子和gRNA的任何已知方法或媒介物将能够诱导基因破坏的一种或多种药剂(例如，Cas9和/或gRNA组分)递送至或引入细胞中。示例性方法描述于例如以下文献中：Wang等人(2012)J.Immunother.35(9):689-701；Cooper等人(2003)Blood.101:1637–1644；Verhoeyen等人(2009)Methods Mol Biol.506:97-114；以及Cavalieri等人(2003)Blood.102(2):497-505。在一些实施方案中，例如通过本文所述或已知的用于将核酸引入细胞中的任何方法将编码能够诱导基因破坏(例如，DNA断裂)的一种或多种药剂的一种或多种组分的核酸序列引入细胞中。在一些实施方案中，可以将编码能够诱导基因破坏的一种或多种药剂(如CRISPR指导RNA和/或Cas9酶)的组分的载体递送至细胞中。

在一些实施方案中，将能够诱导基因破坏的所述一种或多种药剂(例如，作为Cas9/gRNA的一种或多种药剂)作为核糖核蛋白(RNP)复合物引入细胞中。RNP复合物包括核糖核苷酸序列(如RNA或gRNA分子)和蛋白质(如Cas9蛋白或其变体)。例如，例如使用电穿孔或其他物理递送方法，将Cas9蛋白作为RNP复合物递送，所述复合物包含Cas9蛋白和靶向靶序列的gRNA分子。在一些实施方案中，经由电穿孔或其他物理方式(例如，粒子枪、磷酸钙转染、细胞压缩或挤压)将RNP递送至细胞中。在一些实施方案中，RNP可以穿过细胞的质膜而无需另外的递送剂(例如，小分子药剂、脂质等)。在一些实施方案中，将能够诱导基因破坏的所述一种或多种药剂(例如，CRISPR/Cas9)作为RNP递送提供如下优点：例如在引入RNP的细胞中短暂发生靶向破坏，而不将所述药剂传播到细胞后代。例如，通过RNP进行的递送使被遗传到其后代的药剂最小化，从而减小后代中脱靶基因破坏的可能性。在此类情况下，基因破坏和转基因的整合可以被后代细胞遗传，但是可能会进一步引入脱靶基因破坏的药剂本身不被传递给后代细胞。

在一些实施方案中，RNP复合物包括已经被修饰以包括3'多聚A尾和5'抗反向帽类似物(ARCA)帽的gRNA。

使用多种递送方法和配制品(如表10和表11中所示)或者例如WO 2015/161276；WO2017/193107、WO 2017/093969、US 2015/0056705、US 2016/0272999、US 2017/0211075或US 2017/0016027中所述的方法可以将能够诱导基因破坏的一种或多种药剂和组分(例如，Cas9分子和gRNA分子)以多种形式引入靶细胞中。如本文进一步描述，可以在本文所述方法的先前或随后步骤中使用所述递送方法和配制品将模板多核苷酸和/或其他药剂(如用于工程化细胞所需的那些)递送至细胞。当Cas9或gRNA组分被编码为DNA用于递送时，DNA通常可以但不一定包括控制区，例如包含启动子，以实现表达。Cas9分子序列的有用启动子包括例如CMV、EF-1α、EFS、MSCV、PGK或CAG启动子。gRNA的有用启动子包括例如H1、EF-1α、tRNA或U6启动子。可以选择具有相似或不相似强度的启动子来调整组分的表达。编码Cas9分子的序列可以包含核定位信号(NLS)，例如SV40 NLS。在一些实施方案中，Cas9分子或gRNA分子的启动子可以独立地是可诱导的、组织特异性的或细胞特异性的。在一些实施方案中，能够诱导基因破坏的药剂是引入的RNP复合物。

表10.示例性递送方法

表11.示例性递送方法的比较

在一些实施方案中，可以通过已知或如本文所述的方法将编码Cas9分子和/或gRNA分子的DNA或包含Cas9分子和/或gRNA分子的RNP复合物递送至细胞中。例如，可以例如通过载体(例如，病毒或非病毒载体)、基于非载体的方法(例如，使用裸DNA或DNA复合物)或其组合来递送Cas9编码DNA和/或gRNA编码DNA。在一些实施方案中，通过载体(例如，病毒载体/病毒或质粒)递送含有一种或多种药剂和/或其组分的多核苷酸。载体可以是本文所述的任何载体。

在一些方面，将与指导序列组合(并且任选地与其复合)的CRISPR酶(例如，Cas9核酸酶)递送至细胞中。例如，CRISPR系统的一个或多个元件源自I型、II型或III型CRISPR系统。例如，CRISPR系统的一个或多个元件源自包含内源CRISPR系统的特定生物体，如酿脓链球菌、金黄色葡萄球菌或脑膜炎奈瑟氏菌。

在一些实施方案中，将Cas9核酸酶(例如，其由来自金黄色葡萄球菌或来自化脓性链球菌的mRNA编码，例如，pCW-Cas9，Addgene#50661，Wang等人(2014)Science,3:343-80-4；或可从Applied Biological Materials(ABM；加拿大)作为目录号K002、K003、K005或K006获得的核酸酶或切口酶慢病毒载体)和对靶基因座(例如，T细胞刺激相关基因座、TRAC和/或TRBC)具有特异性的指导RNA引入细胞中。

在一些实施方案中，通过基于非载体的方法(例如，使用裸DNA或DNA复合物)递送含有一种或多种药剂和/或其组分的多核苷酸或RNP复合物。例如，DNA或RNA或蛋白质或其组合(例如，核糖核蛋白(RNP)复合物)可以例如通过以下方式来递送：经有机修饰的二氧化硅或硅酸盐(Ormosil)、电穿孔、瞬时细胞压缩或挤压(如Lee等人(2012)Nano Lett 12:6322-27，Kollmannsperger等人(2016)Nat Comm 7,10372中所述的)、基因枪、声孔效应、磁转染、脂质介导的转染、树状大分子、无机纳米颗粒、磷酸钙或其组合。

在一些实施方案中，经由电穿孔递送包括将细胞与Cas9编码DNA和/或gRNA编码DNA或RNP复合物在筒、室或比色皿中混合，并且施加具有限定的持续时间和幅度的一次或多次电脉冲。在一些实施方案中，经由电穿孔递送是使用如下系统来进行，其中将细胞与Cas9编码DNA和/或gRNA编码DNA在与装置(例如，泵)连接的容器中混合，所述装置将混合物进料至筒、室或比色皿中，其中施加限定持续时间和幅度的一次或多次电脉冲，之后将细胞递送至第二容器。

在一些实施方案中，递送媒介物是非病毒载体。在一些实施方案中，非病毒载体是无机纳米颗粒。示例性无机纳米颗粒包括例如磁性纳米颗粒(例如，Fe₃MnO₂)和二氧化硅。纳米颗粒的外表面可以与带正电荷的聚合物(例如，聚乙烯亚胺、聚赖氨酸、聚丝氨酸)缀合，其允许有效载荷的附着(例如，缀合或截留)。在一些实施方案中，非病毒载体是有机纳米颗粒。示例性有机纳米颗粒包括例如SNALP脂质体，其含有阳离子脂质和被聚乙二醇(PEG)包被的中性辅助脂质；以及被脂质包被的鱼精蛋白-核酸复合物。用于基因转移的示例性脂质包括例如WO 2015/161276、WO 2017/193107、WO 2017/093969、US 2016/272999和US 2015/056705中所述的那些。

在一些实施方案中，媒介物具有靶向修饰以增加纳米颗粒和脂质体(例如，细胞特异性抗原、单克隆抗体、单链抗体、适体、聚合物、糖和细胞穿透肽)的靶细胞更新。在一些实施方案中，媒介物使用促融合且内体去稳定的肽/聚合物。在一些实施方案中，媒介物经历酸触发的构象变化(例如，加快负荷的内体逃逸)。在一些实施方案中，使用刺激物可切割的聚合物，例如用于细胞区室中释放。例如，可以使用在还原性细胞环境中切割的基于二硫化物的阳离子聚合物。

在一些实施方案中，递送媒介物是生物非病毒递送媒介物。在一些实施方案中，媒介物是减毒细菌(例如，被天然或人工工程化已具有侵入性，但进行减毒以防止发病，并且表达转基因(例如，单核细胞增生李斯特菌、某些沙门菌属(Salmonella)菌株、长双歧杆菌(Bifidobacterium longum)和经修饰的大肠杆菌(Escherichia coli))、具有营养和组织特异性向性以靶向特定细胞的细菌、具有经修饰的表面蛋白以改变靶细胞特异性的细菌)。在一些实施方案中，媒介物是基因修饰的噬菌体(例如，具有大包装容量、较低免疫原性、含有哺乳动物质粒维持序列且具有掺入的靶向配体的工程化噬菌体)。在一些实施方案中，媒介物是哺乳动物病毒样颗粒。例如，可以产生经修饰的病毒颗粒(例如，通过纯化“空”颗粒，然后将病毒与所需负荷离体组装)。媒介物还可以被工程化以掺入靶向配体，以改变靶组织特异性。在一些实施方案中，媒介物是生物脂质体。例如，生物脂质体是源自人细胞的基于磷脂的颗粒(例如，红细胞血影，其是源自受试者的分解成球形结构的红细胞(例如，组织靶向可以通过附着各种组织或细胞特异性配体实现))或分泌性外来体——内吞起源的受试者来源的膜结合纳米囊泡(30-100nm)(例如，可以从各种细胞类型产生，因此可以被细胞摄取而不需要靶向配体)。

在一些实施方案中，可以通过已知方法或如本文所述将编码Cas9分子和/或gRNA分子的RNA递送至细胞(例如，本文所述的靶细胞)中。例如，Cas9编码和/或gRNA编码RNA可以例如通过以下方式来递送：显微注射、电穿孔、瞬时细胞压缩或挤压(如Lee等人(2012)Nano Lett 12:6322-27中所述的)、脂质介导的转染、肽介导的递送(例如，细胞穿透肽)或其组合。

在一些实施方案中，经由电穿孔递送包括将细胞与编码Cas9分子和/或gRNA分子的RNA在筒、室或比色皿中混合，并且施加具有限定的持续时间和幅度的一次或多次电脉冲。在一些实施方案中，经由电穿孔递送是使用如下系统来进行，其中将细胞与编码Cas9分子和/或gRNA分子的RNA在与装置(例如，泵)连接的容器中混合，所述装置将混合物进料至筒、室或比色皿中，其中施加限定持续时间和幅度的一次或多次电脉冲，之后将细胞递送至第二容器。

在一些实施方案中，可以通过已知方法或如本文所述将Cas9分子递送至细胞中。例如，Cas9蛋白分子可以例如通过以下方式来递送：显微注射、电穿孔、瞬时细胞压缩或挤压(如Lee等人(2012)Nano Lett 12:6322-27中所述的)、脂质介导的转染、肽介导的递送或其组合。递送可以伴随编码gRNA的DNA或伴随gRNA。

在一些实施方案中，将能够引入切割的所述一种或多种药剂(例如，Cas9/gRNA)作为核糖核蛋白(RNP)复合物引入细胞中。RNP复合物包括核糖核苷酸序列(如RNA或gRNA分子)和蛋白质(如Cas9蛋白或其变体)。例如，例如使用电穿孔或其他物理递送方法，将Cas9蛋白作为RNP复合物递送，所述复合物包含Cas9蛋白和靶向靶序列的gRNA分子。在一些实施方案中，经由电穿孔或其他物理方式(例如，粒子枪、磷酸钙转染、细胞压缩或挤压)将RNP递送至细胞中。

在一些实施方案中，经由电穿孔递送包括将细胞与Cas9分子在具有或不具有gRNA分子的情况下在筒、室或比色皿中混合，并且施加具有限定的持续时间和幅度的一次或多次电脉冲。在一些实施方案中，经由电穿孔递送是使用如下系统来进行，其中将细胞与Cas9分子在具有或不具有gRNA分子的情况下在与装置(例如，泵)连接的容器混合，所述装置将混合物进料至筒、室或比色皿中，其中施加限定持续时间和幅度的一次或多次电脉冲，之后将细胞递送至第二容器。

在一些实施方案中，经由电穿孔进行的递送包括将细胞与Cas9分子(例如，eaCas9分子、eiCas9分子或eiCas9融合蛋白)、与或不与gRNA分子在盒、室或比色皿中混合，并且施加具有限定的持续时间和振幅的一个或多个电脉冲。在一些实施方案中，经由电穿孔递送是使用如下系统来进行，其中将细胞与Cas9分子(例如，eaCas9分子、eiCas9分子或eiCas9融合蛋白)混合。

在一些实施方案中，通过基于载体的方法与基于非载体的方法的组合递送含有一种或多种药剂和/或其组分的多核苷酸。例如，病毒体包含与失活的病毒(例如，HIV或流感病毒)组合的脂质体，其可以导致比单独的病毒或脂质体方法更有效的基因转移。

在一些实施方案中，将超过一种药剂或其组分递送至细胞中。例如，在一些实施方案中，将能够诱导基因组中两个或更多个位置(如在T细胞刺激相关基因座、TRAC和/或TRBC内的两个或更多个位点)的基因破坏的一种或多种药剂递送至所述细胞。在一些实施方案中，使用一种方法递送一种或多种药剂及其组分。例如，在一些实施方案中，将用于诱导T细胞刺激相关基因座、TRAC和/或TRBC的基因破坏的一种或多种药剂作为编码用于基因破坏的组分的多核苷酸来递送。在一些实施方案中，一种多核苷酸可以编码靶向T细胞刺激相关基因座、TRAC和/或TRBC的药剂。在一些实施方案中，两种或更多种不同的多核苷酸可以编码靶向T细胞刺激相关基因座、TRAC和/或TRBC的药剂。在一些实施方案中，能够诱导基因破坏的药剂可以作为核糖核蛋白(RNP)复合物来递送，并且两种或更多种不同的RNP复合物可以作为混合物一起递送或分开递送。

在一些实施方案中，递送除了能够诱导基因破坏的所述一种或多种药剂和/或其组分(例如，Cas9分子组分和/或gRNA分子组分)以外的一种或多种核酸分子，如用于HDR引导的整合的模板多核苷酸(如本文例如在章节II.B.2中所述的任何模板多核苷酸)。在一些实施方案中，在与Cas系统的一种或多种组分相同的时间递送核酸分子(例如，模板多核苷酸)。在一些实施方案中，在递送Cas系统的一种或多种组分之前或之后(例如，小于约1分钟、5分钟、10分钟、15分钟、30分钟、1小时、2小时、3小时、6小时、9小时、12小时、1天、2天、3天、1周、2周或4周)递送核酸分子。在一些实施方案中，通过与Cas系统的一种或多种组分(例如，Cas9分子组分和/或gRNA分子组分)不同的方式来递送核酸分子(例如，模板多核苷酸)。核酸分子(例如，模板多核苷酸)可以通过本文所述的任何递送方法来递送。例如，核酸分子(例如，模板多核苷酸)可以通过病毒载体(例如，逆转录病毒或慢病毒)来递送，并且Cas9分子组分和/或gRNA分子组分可以通过电穿孔来递送。在一些实施方案中，核酸分子(例如，模板多核苷酸)包括一个或多个外源序列，例如编码重组受体或其部分的序列和/或其他外源基因核酸序列。

B.经由同源定向修复(HDR)进行靶向整合

在一些方面，所提供的实施方案涉及多核苷酸的特定部分(如含有编码重组受体或其部分的转基因的模板多核苷酸的部分)在基因组中内源T细胞刺激相关基因座处的特定位置(如靶位点或靶位置)处的靶向整合。在一些方面，同源定向修复(HDR)可以介导转基因在靶位点处的位点特异性整合。在一些实施方案中，基因破坏(例如，DNA断裂，如第II.A节中所述)和含有一个或多个同源臂(例如，含有与基因破坏周围的序列同源的核酸序列)的模板多核苷酸的存在可以诱导或引导HDR，其中同源序列用作DNA修复的模板。基于基因破坏周围的内源基因序列与模板多核苷酸中包括的5'和/或3'同源臂之间的同源性，细胞DNA修复机构可以使用模板多核苷酸来修复DNA断裂并重合成基因破坏的位点处的遗传信息，从而将转基因有效地插入或整合于模板多核苷酸中的基因破坏位点处或附近。在一些实施方案中，内源T细胞刺激相关基因座处的基因破坏可以通过本文所述的用于产生靶向基因破坏的任何方法产生。

还提供了多核苷酸(例如，本文所述的模板多核苷酸)和包括此类多核苷酸的试剂盒。在一些实施方案中，所提供的多核苷酸和/或试剂盒可以用于本文所述的方法(例如，涉及HDR)中，用于将编码重组受体或其部分的转基因靶向于内源T细胞刺激相关基因座处。

在一些实施方案中，模板多核苷酸是或包含如下多核苷酸，其含有编码重组受体或其部分(例如，重组受体的一个或多个区域或结构域)的转基因(如外源或异源核酸序列)以及与内源T细胞刺激相关基因座的内源基因组位点处或附近的序列同源的同源序列(例如，同源臂)。在一些方面，模板多核苷酸中的转基因包含编码重组受体或其部分的核苷酸序列。在一些方面，在转基因的靶向整合后，工程化细胞中的T细胞刺激相关基因座被修饰为使得经修饰的T细胞刺激相关基因座含有编码重组受体(例如，嵌合抗原受体(CAR))的转基因。

在一些方面，模板多核苷酸是作为线性DNA片段引入或包含于载体中。在一些方面，诱导基因破坏的步骤和用于靶向整合的步骤(例如，通过引入模板多核苷酸)是同时或依序进行的。

1.同源定向修复(HDR)

在一些实施方案中，同源定向修复(HDR)可以用于在T细胞刺激相关基因座的一个或多个靶位点处靶向整合或插入一个或多个核酸序列(例如，转基因)。在一些实施方案中，核酸酶诱导的HDR可以用于改变靶序列，将转基因整合于特定靶定位，和/或编辑或修复特定靶基因(例如，T细胞刺激相关基因座)中的突变。

靶位点处核酸序列的改变可以通过HDR用外源提供的模板多核苷酸(也称为“供体多核苷酸”或“模板序列”)来进行。例如，模板多核苷酸提供靶序列的改变，例如含于模板多核苷酸内的转基因的插入。在一些实施方案中，可以使用质粒或载体作为同源重组的模板。在一些实施方案中，可以使用线性DNA片段作为同源重组的模板。在一些实施方案中，可以使用单链模板多核苷酸作为通过靶序列与模板多核苷酸之间的同源定向修复的替代方法(例如，单链退火)来改变靶序列的模板。模板多核苷酸实现的靶序列的改变依赖于通过核酸酶(例如，靶向核酸酶，如CRISPR/Cas9)进行的切割。通过核酸酶进行的切割可以包括双链断裂或两个单链断裂。

在一些实施方案中，“重组”包括两个多核苷酸之间的遗传信息交换的过程。在一些实施方案中，“同源重组(HR)”包括这种交换的特化形式，其在例如经由同源定向修复机制修复细胞中的双链断裂期间进行。这个过程需要核苷酸序列同源性，使用模板多核苷酸对靶DNA(即，经历双链断裂的DNA，如内源基因中的靶位点)进行模板修复，并且因为其导致遗传信息从模板多核苷酸转移至靶标而被不同地称为“非交换型基因转化”或“短束基因转化”。在一些实施方案中，该转移可以涉及在断裂的靶标与模板多核苷酸之间形成的异源双链DNA的错配校正，和/或“合成依赖性链退火”(其中使用模板多核苷酸重合成将成为靶标的一部分的遗传信息)，和/或相关过程。这种特化的HR通常导致靶分子序列的改变，使得模板多核苷酸的部分或全部序列掺入靶多核苷酸中。

在一些实施方案中，经由非同源性依赖性机制将模板多核苷酸(例如含有转基因的多核苷酸)整合至细胞基因组中。所述方法包括在细胞基因组中产生双链断裂(DSB)，并使用核酸酶切割模板多核苷酸分子，使得模板多核苷酸整合于DSB的位点处。在一些实施方案中，模板多核苷酸是经由非同源性依赖性方法(例如，NHEJ)来整合。在体内切割后，模板多核苷酸可以以靶向方式整合至细胞基因组中的DSB位置处。模板多核苷酸可以包括用于产生DSB的一种或多种核酸酶的一个或多个相同靶位点。因此，模板多核苷酸可以通过用于切割期望整合至其中的内源基因的一种或多种相同核酸酶来切割。在一些实施方案中，模板多核苷酸包括与用于诱导DSB的核酸酶不同的核酸酶靶位点。如本文所述，可以通过任何已知方法或本文所述的任何方法(如ZFN、TALEN、CRISPR/Cas9系统或TtAgo核酸酶)来产生靶位点或靶位置的基因破坏。

在一些实施方案中，DNA修复机制可以通过核酸酶在以下之后诱导：(1)单一双链断裂；(2)两个单链断裂；(3)两个双链断裂，在靶位点的每一侧上发生断裂；(4)一个双链断裂和两个单链断裂，在靶位点的每一侧上发生双链断裂和两个单链断裂；(5)四个单链断裂，在靶位点的每一侧上发生一对单链断裂；或者(6)一个单链断裂。在一些实施方案中，使用单链模板多核苷酸，并且可以通过替代性HDR改变靶位点。

模板多核苷酸实现的靶位点的改变依赖于通过核酸酶分子进行的切割。通过核酸酶进行的切割可以包括切口、双链断裂、或两个单链断裂，例如在靶位点处DNA的每条链上一个断裂。在靶位点上引入断裂之后，在断裂末端处进行切除，得到单链突出的DNA区域。

在典型HDR中，引入双链模板多核苷酸，其包含靶位点的同源序列，所述同源序列将被直接掺入所述靶位点中，或者用作模板以插入转基因或校正所述靶位点的序列。在断裂处切除后，修复可以通过不同途径进行，例如通过双霍利迪连接体模型(doubleHolliday junction model)(或双链断裂修复(DSBR)途径)或合成依赖性链退火(SDSA)途径进行。

在双霍利迪连接体模型中，发生靶位点的两个单链突出端链侵入至模板多核苷酸的同源序列中，导致形成具有两个霍利迪结点的中间体。随着从侵入链的末端合成新DNA以填充切除产生的缺口，结点移行。新合成的DNA的末端连接至切除的末端，并且结点被分解，导致在靶位点处的插入，例如在模板多核苷酸中插入转基因。与模板多核苷酸的交换可以在结点分解后进行。

在SDSA途径中，仅一个单链突出端侵入模板多核苷酸，并且从侵入链的末端合成新DNA，以填充切除产生的缺口。然后新合成的DNA与剩余的单链突出端退火，合成新DNA以填充于缺口中，并且连接所述链以产生修饰的DNA双链体。

在替代性HDR中，引入单链模板多核苷酸，例如模板多核苷酸。在靶位点处用于改变所需靶位点的切口、单链断裂或双链断裂是由核酸酶分子介导的，并且进行在断裂处切除以露出单链突出端。掺入模板多核苷酸的序列以校正或改变DNA的靶位点通常是通过SDSA途径进行的，如本文所述。

在一些实施方案中，“替代性HDR”或替代性同源定向修复是指使用同源核酸(例如，内源同源序列，例如姐妹染色单体；或外源核酸，例如模板多核苷酸)修复DNA损伤的过程。替代性HDR与典型HDR的不同之处在于，所述过程利用与典型HDR不同的途径，并且可能被典型HDR介体RAD51和BRCA2抑制。替代性HDR也使用单链或带切口的同源核酸进行断裂的修复。在一些实施方案中，“典型HDR”或典型同源定向修复是指使用同源核酸(例如，内源同源序列，例如姐妹染色单体；或外源核酸，例如模板核酸)修复DNA损伤的过程。典型HDR通常在双链断裂处已经存在显著切除时发挥作用，形成DNA的至少一个单链部分。在正常细胞中，HDR通常涉及一系列步骤，如识别断裂、稳定断裂、切除、稳定单链DNA、形成DNA交换中间体、分解交换中间体以及连接。所述过程需要RAD51和BRCA2，并且同源核酸通常是双链的。除非另有指示，否则术语“HDR”在一些实施方案中涵盖典型HDR和替代性HDR。

在一些实施方案中，双链切割是通过核酸酶来实现的，所述核酸酶是例如具有与HNH样结构域相关的切割活性和与RuvC样结构域(例如，N末端RuvC样结构域)相关的切割活性的Cas9分子，例如野生型Cas9。此类实施方案仅需要单一gRNA。

在一些实施方案中，一个单链断裂或切口是通过具有切口酶活性的核酸酶分子(例如，Cas9切口酶)实现的。在靶位点处带切口的DNA可以是替代性HDR的底物。

在一些实施方案中，两个单链断裂或切口是通过具有切口酶活性(例如，与HNH样结构域相关的切割活性或与N末端RuvC样结构域相关的切割活性)的核酸酶(例如，Cas9分子)实现的。此类实施方案通常需要两种gRNA，每个单链断裂的放置需要一种。在一些实施方案中，具有切口酶活性的Cas9分子切割gRNA所杂交的链，但不切割与gRNA所杂交的链互补的链。在一些实施方案中，具有切口酶活性的Cas9分子不切割gRNA所杂交的链，而是切割与gRNA所杂交的链互补的链。在一些实施方案中，切口酶具有HNH活性，例如RuvC活性失活的Cas9分子，例如具有D10处的突变(例如，D10A突变)的Cas9分子。D10A使RuvC失活；因此，Cas9切口酶(仅)具有HNH活性，并且将在gRNA所杂交的链(例如，互补链，其上不具有NGGPAM)上进行切割。在一些实施方案中，可以使用具有H840(例如，H840A)突变的Cas9分子作为切口酶。H840A使HNH失活；因此，Cas9切口酶(仅)具有RuvC活性，并且在非互补链(例如，具有NGG PAM并且其序列与gRNA相同的链)上进行切割。在一些实施方案中，Cas9分子是N末端RuvC样结构域切口酶，例如，Cas9分子包含N863处的突变，例如N863A。

在使用切口酶和两种gRNA定位两个单链切口的一些实施方案中，一个切口在靶DNA的+链上，并且一个切口在-链上。PAM朝外。可以选择gRNA使得所述gRNA相隔约0-50、0-100或0-200个核苷酸。在一些实施方案中，在与两种gRNA的靶向结构域互补的靶序列之间没有重叠。在一些实施方案中，gRNA不重叠，并且相隔多达50、100或200个核苷酸。在一些实施方案中，使用两种gRNA可以例如通过减少脱靶结合来增加特异性(Ran等人,Cell.2013Sep 12；154(6):1380-9)。

在一些实施方案中，可以使用单一切口来诱导HDR，例如替代性HDR。在本文中考虑，可以使用单一切口增加给定切割位点(如靶位点)处的HR与NHEJ的比率。在一些实施方案中，在靶位点处在与所述gRNA的靶向结构域互补的DNA的链中形成单链断裂。在一些实施方案中，在靶位点处在除了与所述gRNA的靶向结构域互补的链以外的DNA的链中形成单链断裂。

在一些实施方案中，细胞可以采用其他DNA修复途径(如单链退火(SSA)、单链断裂修复(SSBR)、错配修复(MMR)、碱基切除修复(BER)、核苷酸切除修复(NER)、链内交联(ICL)、跨损伤合成(TLS)、无误性复制后修复(PRR))来修复核酸酶产生的双链或单链断裂。

靶向整合导致转基因(例如，同源臂之间的序列)被整合至基因组中的T细胞刺激相关基因座中。转基因可以被整合于基因组中所述至少一个靶位点或位点中的一个位点处或附近的任何位置。在一些实施方案中，转基因被整合于所述至少一个靶位点中的一个位点处或附近，例如在切割位点上游或下游300、250、200、150、100、50、10、5、4、3、2、1个或更少碱基对内，如在靶位点任一侧的100、50、10、5、4、3、2、1个碱基对内，如在靶位点任一侧的50、10、5、4、3、2、1个碱基对内。在一些实施方案中，包含转基因的整合的序列不包括任何载体序列(例如，病毒载体序列)。在一些实施方案中，整合的序列包括载体序列(例如，病毒载体序列)的一部分。

双链断裂或一条链中的单链断裂(如靶位点)应当与靶向整合位点(例如，用于靶向整合的位点)足够接近，使得在所需区域中产生改变，如发生转基因的插入或突变的校正。在一些实施方案中，距离不超过10、25、50、100、200、300、350、400或500个核苷酸。在一些实施方案中，认为断裂应当与靶整合位点足够接近，使得断裂位于在末端切除期间经历外切核酸酶介导的去除的区域内。在一些实施方案中，靶向结构域被配置使得切割事件(例如，双链或单链断裂)定位于期望改变的区域(例如，靶向插入位点)的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、300、350、400或500个核苷酸内。断裂(例如，双链或单链断裂)可以定位于期望改变的区域(例如，靶向插入位点)的上游或下游。在一些实施方案中，断裂定位于期望改变的区域内，例如由至少两个突变体核苷酸限定的区域内。在一些实施方案中，断裂的定位紧邻期望改变的区域，例如紧接靶整合位点的上游或下游。

在一些实施方案中，单链断裂伴随通过第二gRNA分子定位的另外的单链断裂。例如，靶向结构域被配置使得切割事件(例如，两个单链断裂)定位于靶整合位点的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、300、350、400或500个核苷酸内。在一些实施方案中，第一和第二gRNA分子被配置使得，在指导Cas9切口酶时，单链断裂将伴随通过第二gRNA定位的另外的单链断裂，它们彼此足够接近以导致所需区域的改变。在一些实施方案中，第一和第二gRNA分子被配置使得，例如在Cas9是切口酶时，通过第二gRNA定位的单链断裂位于通过第一gRNA分子定位的断裂的10、20、30、40或50个核苷酸内。在一些实施方案中，两种gRNA分子被配置为将切割定位于不同链上的相同位置，或者彼此的几个核苷酸内，例如从而基本上模拟双链断裂。

在出于诱导HDR介导的转基因插入或校正的目的，gRNA(单分子、嵌合或模块化gRNA)和Cas9核酸酶诱导双链断裂的一些实施方案中，切割位点(如靶位点)位于远离靶整合位点的0至200bp之间(例如，0至175、0至150、0至125、0至100、0至75、0至50、0至25、25至200、25至175、25至150、25至125、25至100、25至75、25至50、50至200、50至175、50至150、50至125、50至100、50至75、75至200、75至175、75至150、75至125、75至100bp)。在一些实施方案中，切割位点(如靶位点)位于远离靶向整合位点的0至100bp之间(例如，0至75、0至50、0至25、25至100、25至75、25至50、50至100、50至75或75至100bp)。

在一些实施方案中，可以通过使用切口酶产生具有突出端的断裂来促进HDR。在一些实施方案中，与例如NHEJ相反，突出端的单链性质可以增强细胞通过HDR修复断裂的可能性。

具体而言，在一些实施方案中，通过选择第一gRNA和第二gRNA来促进HDR，第一gRNA将第一切口酶靶向第一靶位点，并且第二gRNA将第二切口酶靶向第二靶位点，所述第二靶位点在与第一靶位点相对的DNA链上并且偏离第一切口。在一些实施方案中，gRNA分子的靶向结构域被配置为将切割事件定位于足够远离预选的核苷酸(例如，编码区的核苷酸)，使得所述核苷酸不发生改变。在一些实施方案中，gRNA分子的靶向结构域被配置为将内含子切割事件定位于足够远离内含子/外显子边界或天然存在的剪接信号，以避免外显子序列的改变或不期望的剪接事件。在一些实施方案中，gRNA分子的靶向结构域被配置为定位于早期外显子中，以允许转基因在所述至少一个靶位点中的一个位点处或附近的框内整合。

在一些实施方案中，双链断裂可以伴随通过第二gRNA分子定位的另外的双链断裂。在一些实施方案中，双链断裂可以伴随通过第二gRNA分子和第三gRNA分子定位的两个另外的单链断裂。在一些实施方案中，两种gRNA(例如，独立地为单分子、嵌合或模块化gRNA)被配置为将双链断裂定位于靶整合位点(例如，靶向整合位点)的两侧上。

2.模板多核苷酸

在一些实施方案中，包括编码重组受体或其一部分的核苷酸序列和与用于靶向整合的内源基因组位点处或附近的序列同源的同源序列(例如，同源臂)的模板多核苷酸(例如，含有转基因的多核苷酸，如外源或异源核酸序列)可以作为修复模板采用细胞DNA修复过程(如同源重组)中涉及的分子和机器。在一些方面，与内源DNA中一个或多个靶位点处或附近的序列具有同源性的模板多核苷酸可以用于改变靶DNA(如内源T细胞刺激相关基因座处的靶位点)的结构，用于转基因或外源序列(例如，编码重组受体或其一部分的外源核酸序列)的靶向插入。还提供了用于在本文提供的方法中使用的多核苷酸，例如模板多核苷酸，例如作为同源定向修复(HDR)介导的转基因靶向整合的模板。在一些实施方案中，所述多核苷酸包括编码重组受体或其部分的核酸序列；以及与所述核酸序列连接的一个或多个同源臂，其中所述一个或多个同源臂包含与T细胞刺激相关基因座的开放阅读框的一个或多个区域同源的序列。

在一些实施方案中，模板多核苷酸含有与转基因(外源或异源核酸序列)连接和/或侧接所述转基因的一个或多个同源序列(例如，同源臂)，所述转基因包括编码重组受体或其一部分的核苷酸序列。在一些实施方案中，使用同源序列来靶向内源T细胞刺激相关基因座处的外源序列。在一些实施方案中，模板多核苷酸包括在同源臂之间的核酸序列(如转基因)，用于插入或整合至细胞的基因组中。模板多核苷酸中的转基因可以包含编码功能性多肽(例如，重组受体或其一部分)的一个或多个序列，其具有或不具有启动子或其他调节元件。

在一些实施方案中，模板多核苷酸是可以与能够引入基因破坏的一种或多种药剂结合用于改变靶位点的结构的核酸序列。在一些实施方案中，模板多核苷酸通过同源定向修复事件改变靶位点的结构，例如插入转基因。

在一些实施方案中，模板多核苷酸改变靶位点的序列，例如导致同源臂之间的转基因插入或整合至细胞的基因组中。在一些方面，靶向整合导致转基因的编码部分与内源T细胞刺激相关基因座的开放阅读框的一个或多个外显子的框内整合，例如与整合基因座处的相邻外显子的框内整合。例如，在一些情况下，框内整合导致内源开放阅读框的一部分和重组受体或其部分被表达，在一些情况下由多顺反子元件(如2A元件)隔开。因此，经修饰的T细胞刺激相关基因座可以表达由内源T细胞刺激相关基因座编码的多肽以及重组受体或其部分，所述多肽以及重组受体或其部分可以凭借多顺反子元件分隔成2种不同的多肽。

在一些实施方案中，模板多核苷酸包括对应于靶序列上的位点或与所述位点同源的序列，所述位点例如被能够引入基因破坏的一种或多种药剂切割。在一些实施方案中，模板多核苷酸包括对应于靶序列上的第一位点和靶序列上的第二位点两者或与所述两者同源的序列，第一位点在能够引入基因破坏的第一药剂中被切割，第二位点在能够引入基因破坏的第二药剂中被切割。

在一些实施方案中，模板多核苷酸包含以下组分：[5'同源臂]-[转基因(例如，编码重组受体或其部分的外源或异源核酸序列)]-[3'同源臂]。同源臂提供用于重组至染色体中，从而有效地将例如编码重组受体或其部分的转基因插入或整合至基因组DNA中的切割位点(如一个或多个靶位点)处或附近。在一些实施方案中，同源臂侧接基因破坏的靶位点处的序列。

在一些实施方案中，模板多核苷酸是双链的。在一些实施方案中，模板多核苷酸是单链的。在一些实施方案中，模板多核苷酸包含单链部分和双链部分。在一些实施方案中，模板多核苷酸包含于载体中。在一些实施方案中，模板多核苷酸是DNA。在一些实施方案中，模板多核苷酸是RNA。在一些实施方案中，模板多核苷酸是双链DNA。在一些实施方案中，模板多核苷酸是单链DNA。在一些实施方案中，模板多核苷酸是双链RNA。在一些实施方案中，模板多核苷酸是单链RNA。在一些实施方案中，模板多核苷酸包含单链部分和双链部分。在一些实施方案中，模板多核苷酸包含于载体中。

在某些实施方案中，多核苷酸(例如，模板多核苷酸)含有和/或包括编码重组受体或其一部分(例如CAR或其一部分)的转基因。在任何实施方案的一些实施方案中，所述转基因被靶向于在编码T细胞刺激相关基因产物的内源基因、基因座或开放阅读框内的一个或多个靶位点处。在一些实施方案中，所述转基因被靶向以用于在所述内源T细胞刺激相关基因座开放阅读框内整合，例如导致所述编码的T细胞刺激相关基因产物的全部或一部分的表达。

用于插入的多核苷酸也可以被称为“转基因”或“外源序列”或“供体”多核苷酸或分子。模板多核苷酸可以是单链和/或双链的DNA，并且可以以线性或环状形式引入细胞中。模板多核苷酸可以是单链和/或双链的DNA，并且可以以线性或环状形式引入细胞中。模板多核苷酸可以是单链和/或双链RNA，并且可以作为RNA分子(例如，RNA病毒的一部分)引入。还参见例如美国专利公开号20100047805和20110207221。模板多核苷酸也可以以DNA形式引入，可以将其以环状或线性形式引入细胞中。如果以线性形式引入，则可以通过已知方法保护模板多核苷酸的末端(例如，防止核酸外切降解)。例如，将一个或多个双脱氧核苷酸残基添加至线性分子的3'端，和/或将自身互补的寡核苷酸连接至一个或两个末端。参见例如，Chang等人(1987)Proc.Natl.Acad.Sci.USA 84:4959-4963；Nehls等人(1996)Science272:886-889。用于保护外源多核苷酸免于降解的另外的方法包括但不限于一个或多个末端氨基的添加以及经修饰的核苷酸间连接(例如，像硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基)的使用。如果以双链形式引入，则模板多核苷酸可以包括一个或多个核酸酶靶位点，例如侧接要整合至细胞基因组中的转基因的核酸酶靶位点。参见例如，美国专利公开号20130326645。

在一些实施方案中，双链模板多核苷酸包括长度大于1kb(例如，在2与200kb之间、在2与10kb之间(或其间的任何值))的序列(也称为转基因)。

在一些实施方案中，模板多核苷酸是单链核酸。在一些实施方案中，模板多核苷酸是双链核酸。在一些实施方案中，模板多核苷酸包含例如一个或多个核苷酸的核苷酸序列，其将被添加至靶DNA或将作为靶DNA中变化的模板。在一些实施方案中，所述模板多核苷酸包含可用于修饰靶位点的核苷酸序列，例如将模板多核苷酸中的转基因复制或插入细胞的基因组中。在一些实施方案中，模板多核苷酸包含例如一个或多个核苷酸的核苷酸序列，其对应于靶DNA(例如，靶位点)的野生型序列。

在一些实施方案中，模板多核苷酸是线性双链DNA。长度可以为例如约200-5000个碱基对，例如约200、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2500、3000、4000或5000个碱基对。长度可以为例如至少200、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2500、3000、4000或5000个碱基对。在一些实施方案中，长度不大于200、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2500、3000、4000或5000个碱基对。在一些实施方案中，双链模板多核苷酸的长度大于或大于约160个碱基对，例如约200-4000、300-3500、400-3000、500-2500、600-2000、700-1900、800-1800、900-1700、1000-1600、1100-1500或1200-1400个碱基对。

在一些实施方案中，所述模板多核苷酸长度是为或约1000、1250、1500、1750、2000、2250、2500、2750、3000、3250、3500、3750或4000个核苷酸或任何前述值之间的任何值。在一些实施方案中，所述多核苷酸的长度在为或约1500与为或约2500个核苷酸之间，或者在为或约1750与为或约2250个核苷酸之间。在一些实施方案中，所述模板多核苷酸的长度为约2000±250、2000±200、2000±150、2000±100或2000±50个核苷酸。

含于本文所述的模板多核苷酸上的转基因可以使用已知的标准技术如PCR从质粒、细胞或其他来源分离。用于使用的模板多核苷酸可以包括各种类型的拓扑学，包括环状超螺旋的、环状松弛的、线性的等。可替代地，它们可以使用标准寡核苷酸合成技术化学合成。另外，模板多核苷酸可以被甲基化或缺乏甲基化。模板多核苷酸可以呈细菌或酵母人工染色体(BAC或YAC)的形式。

模板多核苷酸可以是线性单链DNA。在一些实施方案中，模板多核苷酸是(i)可以与靶DNA的带切口的链退火的线性单链DNA，(ii)可以与靶DNA的完整链退火的线性单链DNA，(iii)可以与靶DNA的转录链退火的线性单链DNA，(iv)可以与靶DNA的非转录链退火的线性单链DNA，或多于一种的前述项。

长度可以为例如约200-5000个核苷酸，例如约200、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2500、3000、4000或5000个核苷酸。长度可以为例如至少200、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2500、3000、4000或5000个核苷酸。在一些实施方案中，长度不大于200、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2500、3000、4000或5000个核苷酸。在一些实施方案中，单链模板多核苷酸的长度为约160个核苷酸，例如约200-4000、300-3500、400-3000、500-2500、600-2000、700-1900、800-1800、900-1700、1000-1600、1100-1500或1200-1400个核苷酸。

在一些实施方案中，模板多核苷酸是环状双链DNA，例如质粒。在一些实施方案中，模板多核苷酸在转基因和/或靶位点的任一侧上包含约500至1000个同源性碱基对。在一些实施方案中，模板多核苷酸在靶位点或转基因的5'、在靶位点或转基因的3'、或同时在靶位点或转基因的5'和3'包含约10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000个同源性碱基对。在一些实施方案中，模板多核苷酸在靶位点或转基因的5'、在靶位点或转基因的3'、或同时在靶位点或转基因的5'和3'包含至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000个同源性碱基对。在一些实施方案中，模板多核苷酸在靶位点或转基因的5'、在靶位点或转基因的3'、或同时在靶位点或转基因的5'和3'包含不超过10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000个同源性碱基对。

a.转基因

在一些实施方案中，模板多核苷酸含有编码重组受体或其一部分的转基因，所述重组受体如本文例如在第IV.B节中所述的任何重组受体，或这种重组受体的一个或多个区域、结构域或链。

在一些方面，转基因编码包括胞外结合结构域、跨膜结构域和/或细胞内区域的重组受体。在一些方面，转基因可以编码重组受体的全部或一部分。在一些实施方案中，转基因编码本文例如在第IV.B节中所述的任何重组受体，或其一个或多个区域、结构域或链。在一些方面，在将转基因整合至内源T细胞刺激相关基因座中后，所得的经修饰的T细胞刺激相关基因座编码重组受体(如本文例如在第IV.B节中所述的任何重组受体)，或其一个或多个区域、结构域或链。例如，转基因可以包括编码胞外区域、跨膜结构域和细胞内区域中的一个或多个的核苷酸序列，所述细胞内区域可以包含共刺激信号传导结构域和其他结构域或其部分。

在一些方面，插入或整合于基因组中的靶位置处的转基因(其是编码重组受体或其部分的目的核酸序列，包括编码和/或非编码序列和/或其部分编码序列)也可以称为“转基因”、“转基因序列”、“外源核酸序列”、“异源序列”或“供体序列”。在一些方面，转基因是对于T细胞(例如，人T细胞)的内源基因组序列(如基因组中特定靶基因座或靶定位处的内源基因组序列)为外源或异源的核酸序列。在一些方面，转基因是与T细胞(例如，人T细胞)的靶基因座或靶定位处的内源基因组序列相比被修饰或不同的序列。在一些方面，转基因是源自不同的基因、物种和/或来源的核酸序列，或者与来自不同基因、物种和/或来源的核酸序列相比被修饰的核酸序列。在一些方面，转基因是源自相同物种的不同基因座(例如，不同基因组区域或不同基因)的序列的序列。在一些方面，示例性重组受体包括本文例如在第IV.B节中所述的任一种。

在一些实施方案中，核酸酶诱导的HDR导致插入转基因(也称为“外源序列”或“转基因序列”)，用于表达用于靶向插入的转基因。模板多核苷酸序列通常与其所在的基因组序列不同。模板多核苷酸序列可以含有侧接有两个同源性区域的非同源序列，以允许在目的位置进行有效HDR。另外，模板多核苷酸序列可以包含载体分子，所述载体分子含有与细胞染色质中的目的区域不同源的序列。模板多核苷酸序列可以含有与细胞染色质具有同源性的几个不连续区域。例如，对于通常在目的区域中不存在的序列的靶向插入，所述序列可以存在于转基因中并且侧接有与目的区域中的序列具有同源性的区域。

在一些方面，所述转基因是对于T细胞、在一些情况下人T细胞的内源基因组T细胞刺激相关基因座的开放阅读框而言外源或异源的序列。在一些方面，在含有与一个或多个同源臂(其与内源T细胞刺激相关基因座处的靶位点附近的序列同源)连接的转基因的模板多核苷酸的存在下，HDR导致编码重组受体或其部分的经修饰的T细胞刺激相关基因座。

在一些实施方案中，所述转基因编码重组受体的各种区域、结构域或链(如本文第IV.B节中所述的重组受体或各种区域、结构域或链)的全部或一部分。

在一些方面，所述转基因是嵌合序列，其包含通过连接来自不同基因、物种和/或来源的不同核酸序列而产生的序列。在一些方面，所述转基因含有被连接(joined或linked)的来自不同基因、编码序列或外显子或其部分的编码不同区域或结构域或其部分的核苷酸序列。在一些方面，用于靶向整合的转基因编码多肽或其片段。

在一些实施方案中，所述转基因可以编码作为嵌合受体(如嵌合抗原受体(CAR))的重组受体或其部分(如其结构域或区域)。在一些实施方案中，所述转基因编码重组受体(如嵌合抗原受体(CAR))的各种区域或结构域。在一些实施方案中，所述转基因编码包含CAR的所有结构域或区域的整个CAR或全长CAR。在一些实施方案中，所述转基因包括编码细胞内区域(如CAR的细胞内区域，例如包含细胞内信号传导结构域)的核苷酸序列。在一些实施方案中，所述转基因还包括编码跨膜区域或膜缔合区域(如CAR的跨膜区域)的核苷酸序列。在一些实施方案中，所述转基因还包括编码胞外区域(如CAR的胞外区域)的核苷酸序列。在一些实施方案中，所述转基因编码CAR的一部分，例如CAR的一个或多个结构域或区域。在一些实施方案中，所述CAR是多链CAR，并且所述转基因编码所述多链CAR的一条或多条链。在一些实施方案中，所述CAR是多链CAR，并且所述转基因编码所述多链CAR的一条链。在一些实施方案中，如果整合在所提供的工程化细胞中的T细胞刺激相关基因座处的转基因编码重组受体(例如，CAR)的一部分，则重组受体的其余部分可以由存在于工程化细胞的基因组中的不同位置(例如，不同的T细胞刺激相关基因座或不同位置)处的第二转基因编码。示例性嵌合受体包括下文在第IV.B.1和IV.B.3节中所述的那些。

在一些实施方案中，所述转基因可以编码重组受体(如重组T细胞受体(TCR))或其部分(如其结构域、区域或链)。在一些实施方案中，所述重组受体是重组TCR。在一些实施方案中，所述重组受体(如重组TCR)包含两条或更多条单独的多肽链，如TCR alpha(TCRα)和TCR beta(TCRβ)链。在一些方面，所述转基因可以编码重组TCR的一条或多条链，如TCRα或TCRβ或两者。在一些方面，所述转基因可以编码整个重组TCR，例如重组TCR的两条链，如TCRα链和TCRβ链。在一些方面，所述转基因可以编码重组TCR的一条链，如TCRα链或TCRβ链。在一些方面，所述转基因可以编码重组TCR的一个或多个区域或结构域，如TCRα或TCRβ或两者的细胞内区域、跨膜区域和/或胞外区域。在一些实施方案中，如果整合在所提供的工程化细胞中的T细胞刺激相关基因座处的转基因编码重组受体的一部分(例如，重组TCR的一条链)，则重组受体的其余部分(例如，重组TCR的另一条链)可以由存在于工程化细胞的基因组中的不同位置(例如，不同的T细胞刺激相关基因座或不同位置)处的第二转基因编码。在一些实施方案中，如果整合在所提供的工程化细胞中的T细胞刺激相关基因座处的转基因编码重组受体的一部分(例如，重组TCR的一个结构域)，则重组受体的其余部分(例如，重组TCR的其他其余结构域)可以由存在于工程化细胞的基因组中的不同位置处的第二转基因编码。在一些方面，编码TCRα和TCRβ的序列在一些情况下由多顺反子元件(如2A元件)隔开。示例性重组TCR包括下文在第III.B.4节中所述的那些。

在一些方面，转基因还含有非编码的调节或控制序列，例如用于允许、调节和/或调控所编码的多肽或其片段的表达所需的序列或修饰多肽所需的序列。在一些实施方案中，如果转基因源自基因组序列，则与基因组中的相应核酸相比，转基因不包含内含子或缺乏一个或多个内含子。在一些实施方案中，转基因不包含内含子。在一些实施方案中，转基因含有编码重组受体或其部分的序列，其中转基因的全部或一部分是密码子优化的，例如用于在人细胞中表达。

在一些实施方案中，转基因(包括编码区和非编码区)的长度在或在约100至约10,000个碱基对之间，如约100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000或10000个碱基对。在一些实施方案中，转基因的长度受可以制备、合成或组装和/或引入细胞中的多核苷酸的最大长度或病毒载体的容量限制。在一些方面，转基因的长度可以根据模板多核苷酸的最大长度和/或所需的所述一个或多个同源臂的长度而变化。

在一些实施方案中，基因破坏诱导的HDR导致将转基因插入或整合于基因组中的靶位置处。模板多核苷酸序列通常与其所靶向的基因组序列不同。模板多核苷酸序列可以含有侧接有两个同源性区域的转基因，以允许在目的位置进行有效HDR。模板多核苷酸序列可以含有与基因组DNA具有同源性的几个不连续区域。例如，对于通常在目的区域中不存在的序列的靶向插入，所述序列可以存在于转基因中并且侧接有与目的区域中的序列具有同源性的区域。在一些实施方案中，转基因编码重组受体或其部分，例如胞外结合结构域、跨膜结构域和/或部分细胞内区域中的一个或多个。

在一些方面，在通过HDR靶向整合转基因后，细胞的基因组含有经修饰的T细胞刺激相关基因座，其包含编码重组受体或其部分的核酸序列。在一些方面，整个重组受体由转基因编码。在一些方面，转基因还含有编码其他分子的核苷酸序列和/或调节或控制元件(例如，外源启动子)和/或一个或多个多顺反子元件。

在一些实施方案中，转基因还包括编码信号肽的信号序列、调节或控制元件(如启动子)和/或一个或多个多顺反子元件(例如，核糖体跳跃元件或内部核糖体进入位点(IRES))。在一些实施方案中，可以将信号序列置于编码重组受体的核苷酸序列的5'。

由转基因编码的示例性区域、结构域或链在下文有描述，并且还可以是本文在第IV.B节中所述的任何区域或结构域。

(i)信号序列

在一些实施方案中，转基因包括编码信号肽的信号序列。在一些方面，信号序列可以编码异源或非天然信号肽，例如来自不同基因或物种的信号肽或不同于内源T细胞刺激相关基因座的信号肽的信号肽。在一些方面，示例性信号序列包括SEQ ID NO:24或288所示的并且编码SEQ ID NO:25所示的信号肽或SEQ ID NO:26所示的CD8α信号肽的GMCSFRα链信号序列。在成熟形式的表达的重组受体中，将信号序列从多肽的剩余部分切割下来。在一些方面，将信号序列置于调节或控制元件(例如，启动子，如异源启动子，例如不是源自T细胞刺激相关基因座的启动子)的3'。在一些方面，将信号序列置于一个或多个多顺反子元件(例如，编码核糖体跳跃序列和/或内部核糖体进入位点(IRES)的核苷酸序列)的3'。在一些方面，可以将信号序列置于转基因中编码胞外区域的一种或多种组分的核苷酸序列的5'。在一些实施方案中，信号序列是存在于转基因中的最5'区，并且与同源臂之一连接。在一些方面，由转基因编码的信号序列包括本文所述的任何信号序列。

(ii)示例性重组受体编码序列

在一些方面，用于靶向整合的转基因包括编码重组受体的序列，所述重组受体是嵌合受体，如嵌合抗原受体(CAR)或嵌合自身抗体受体(CAAR)。在一些方面，转基因含有接合或连接的编码嵌合受体的不同区域或结构域或部分的核苷酸序列，所述区域或结构域或部分可以来自不同基因、编码序列或外显子或其部分。

在一些实施方案中，所编码的重组受体(如CAR)含有一个或多个区域或结构域，如胞外区域(例如，含有一个或多个胞外结合结构域和/或间隔子)、跨膜结构域和/或细胞内区域(例如，含有初级信号传导区域或结构域和/或一个或多个共刺激信号传导结构域)中的一个或多个。在一些方面，所编码的CAR还含有其他结构域(如多聚化结构域)或接头。

在一些方面，在转基因中，将编码胞外区域的核苷酸序列置于信号序列与编码间隔子的核苷酸之间。在一些方面，在转基因中，将编码胞外多聚化结构域的核苷酸序列置于编码结合结构域的核苷酸序列与编码间隔子的核苷酸序列之间。在一些方面，将编码间隔子的核苷酸序列置于编码结合结构域的核苷酸序列与编码跨膜结构域的核苷酸序列之间。在一些实施方案中，转基因按5'至3'顺序包括编码胞外区域的核苷酸序列、编码跨膜结构域(或膜缔合结构域)的核苷酸序列和编码细胞内区域的核苷酸序列。

在一些实施方案中，所编码的重组受体是CAR，并且编码胞外区域的转基因可以按5'至3'顺序包括编码胞外结合结构域的核苷酸序列和编码间隔子的核苷酸序列。在一些实施方案中，转基因还包括编码一个或多个胞外多聚化结构域的核苷酸序列，可以将其置于编码结合结构域和/或间隔子的任何核苷酸序列的5'或3'，和/或编码跨膜结构域的核苷酸序列的5'。在一些方面，转基因还包括通常置于编码胞外区域的核苷酸序列的5'的信号序列。

在一些方面，在转基因中，将编码结合结构域的核苷酸序列置于信号序列与编码间隔子的核苷酸之间。在一些方面，在转基因中，将编码胞外多聚化结构域的核苷酸序列置于编码结合结构域的核苷酸序列与编码间隔子的核苷酸序列之间。在一些方面，将编码间隔子的核苷酸序列置于编码结合结构域的核苷酸序列与编码跨膜结构域的核苷酸序列之间。

在一些实施方案中，转基因含有编码细胞内区域的核苷酸序列，其可以包括编码一个或多个共刺激信号传导结构域、和/或初级信号传导结构域或区域的核苷酸序列。

在一些实施方案中，转基因还包含一个或多个多顺反子元件(例如，核糖体跳跃序列和/或内部核糖体进入位点(IRES))。在一些方面，转基因还包括通常位于转基因的最5'部分(例如，信号序列的5')处的调节或控制元件(如启动子)。在一些方面，编码一种或多种另外的分子或另外的结构域或区域的核苷酸序列可以被包括在多核苷酸的转基因部分中。在一些方面，可以将编码一种或多种另外的分子或另外结构域或区域的核苷酸序列置于编码CAR的一个或多个区域或一个或多个结构域或一条或多条链的核苷酸序列的5'。在一些方面，编码所述一种或多种另外的分子或另外的结构域、区域或链的核苷酸序列在编码CAR的一个或多个区域的核苷酸序列的上游。

由转基因编码的嵌合受体的示例性结构域或区域在下文有描述，并且还可以包括下文在第IV.B.1和IV.B.3节中所述的示例性嵌合受体的任何区域或结构域。

(a)结合结构域

在一些实施方案中，转基因编码对特定抗原(或配体)(如在特定细胞类型的表面上表达的抗原)具有特异性的重组受体(如CAR)的一部分。在一些实施方案中，与正常或非靶向细胞或组织(例如，在健康细胞或组织中)相比，抗原在疾病或病症的细胞(例如，肿瘤细胞或致病细胞)上选择性表达或过表达。

在一些方面，转基因编码重组受体的胞外区域。在一些实施方案中，转基因编码胞外结合结构域，如特异性结合抗原或配体的结合结构域。

在一些实施方案中，结合结构域是或包含多肽、配体、受体、配体结合结构域、受体结合结构域、抗原、表位、抗体、抗原结合结构域、表位结合结构域、抗体结合结构域、标签结合结构域或前述任一种的片段。在其他实施方案中，抗原在正常细胞上表达和/或在工程化细胞上表达。在一些方面，抗原被结合结构域(如配体结合结构域或抗原结合结构域)识别。在一些方面，转基因编码含有一个或多个结合结构域的胞外区域。在一些实施方案中，由转基因编码的示例性结合结构域包括抗体及其抗原结合片段，包括scFv或sdAb。在一些实施方案中，抗原结合片段包含通过柔性接头连接的抗体可变区。

在一些实施方案中，结合结构域是或包含单链可变片段(scFv)。在一些实施方案中，结合结构域是或包含单结构域抗体(sdAb)。在一些实施方案中，结合结构域能够与靶抗原结合，所述靶抗原与疾病、障碍或病症的细胞或组织相关，为所述疾病、障碍或病症的细胞或组织所特有，和/或在所述疾病、障碍或病症的细胞或组织上表达。在一些实施方案中，所述疾病、障碍或病症是感染性疾病或障碍、自身免疫性疾病、炎性疾病、或肿瘤或癌症。在一些实施方案中，所述靶抗原是肿瘤抗原。

由转基因编码的示例性抗原和抗原结合结构域或配体结合结构域包括本文在第IV.B.1节中所述的那些。在一些方面，所编码的重组受体含有结合结构域，所述结合结构域是或包含TCR样抗体或其片段(如scFv)，其特异性识别作为主要组织相容性复合物(MHC)-肽复合物存在于细胞表面上的细胞内抗原(如肿瘤相关抗原)。在一些方面，所述转基因可以编码作为TCR样抗体或其片段的结合结构域。因此，所编码的重组受体是TCR样CAR，如本文在第IV.B节中所述的任一种。在一些实施方案中，结合结构域是多特异性(如双特异性)结合结构域。在一些实施方案中，所编码的重组受体含有结合结构域，其是与自身抗体结合的抗原。在一些实施方案中，重组受体是嵌合自身抗体受体(CAAR)，如本文在第IV.B.3节中所述的任一种。

在一些方面，可以将编码所述一个或多个结合结构域的核苷酸序列置于转基因中的信号序列(如果存在)的3'。在一些方面，可以将编码所述一个或多个结合结构域的核苷酸序列置于转基因中编码一个或多个调节或控制元件的核苷酸序列的3'。在一些方面，可以将编码所述一个或多个结合结构域的核苷酸序列置于转基因中编码间隔子的核苷酸序列(如果存在)的5'。在一些方面，可以将编码所述一个或多个结合结构域的核苷酸序列置于转基因中编码跨膜结构域的核苷酸序列的5'。

(b)间隔子和跨膜结构域

在一些实施方案中，所编码的重组受体是CAR，并且转基因包括编码间隔子的序列和/或编码跨膜结构域或其部分的序列。在一些实施方案中，所编码的重组受体的胞外区域包含间隔子，在一些情况下其中间隔子可操作地连接在结合结构域与跨膜结构域之间。在一些方面，间隔子和/或跨膜结构域可以将含有配体(例如，抗原)结合结构域的胞外部分和重组受体的其他区域或结构域(如细胞内区域(例如，含有一个或多个共刺激信号传导结构域、细胞内多聚化结构域和/或初级信号传导结构域或区域))连接。

在一些实施方案中，转基因还包括编码将抗原结合结构域与跨膜结构域隔开的间隔子和/或铰链区的核苷酸序列。在一些方面，间隔子可以是或包括免疫球蛋白恒定区的至少一部分或其变体或修饰形式，如铰链区(例如，IgG4铰链区)和/或C_H1/C_L和/或Fc区。在一些实施方案中，恒定区或部分是人IgG如IgG4或IgG1的。在一些方面，恒定区的所述部分用作结合结构域(例如，scFv)与跨膜结构域之间的间隔子区。可由转基因编码的示例性间隔子包括单独的IgG4铰链，与C_H2和C_H3结构域连接的IgG4铰链或与C_H3结构域连接的IgG4铰链，以及Hudecek等人(2013)Clin.Cancer Res.,19:3153、Hudecek等人(2015)CancerImmunol Res.3(2):125–135或国际专利申请公开号WO 2014031687中所述的那些，或本文第IV.B.1节中所述的任一种。

在一些方面，可以将编码间隔子的核苷酸序列置于转基因中编码所述一个或多个结合结构域的核苷酸序列的3'。在一些方面，可以将编码间隔子的核苷酸序列置于转基因中编码跨膜结构域的核苷酸序列的5'。在一些实施方案中，将编码间隔子的核苷酸序列置于编码一个或多个结合结构域的核苷酸序列与编码跨膜结构域的核苷酸序列之间。

在一些实施方案中，转基因编码跨膜结构域，其可以将胞外区域(例如，含有一个或多个结合结构域和/或间隔子)与细胞内区域(例如，含有一个或多个共刺激信号传导结构域、细胞内多聚化结构域和/或初级信号传导结构域或区域)连接。在一些实施方案中，所述转基因包含编码跨膜结构域的核苷酸序列，在一些情况下其中跨膜结构域是人的或包含来自人蛋白质的序列。在一些实施方案中，所述跨膜结构域是或包含源自CD4、CD28或CD8，在一些情况下源自人CD4、人CD28或人CD8的跨膜结构域。在一些实施方案中，所述跨膜结构域是或包含源自CD28、在一些情况下源自人CD28的跨膜结构域。

在一些实施方案中，将编码跨膜结构域的核苷酸序列与编码胞外区域的核苷酸序列融合。在一些实施方案中，将编码跨膜结构域的核苷酸序列与编码细胞内区域的核苷酸序列融合。在一些方面，可以将编码跨膜结构域的核苷酸序列置于转基因中编码所述一个或多个结合结构域和/或间隔子的核苷酸序列的3'。在一些方面，可以将编码跨膜结构域的核苷酸序列置于转基因中编码细胞内区域的核苷酸序列的5'，所述细胞内区域例如含有一个或多个共刺激信号传导结构域、细胞内多聚化结构域和/或初级信号传导结构域或区域。在一些方面，由转基因编码的跨膜结构域包括本文例如在第IV.B.1节中所述的任何跨膜结构域。

在一些实施方案中，在所编码的重组受体包含含有初级信号传导结构域或区域的细胞内区域但不包含跨膜结构域和/或胞外区域的情况下，转基因可以包括编码膜缔合结构域(如本文例如在第IV.B节中所述的任一种)的核苷酸序列。

(c)细胞内区域

在一些实施方案中，转基因包括编码细胞内区域的核苷酸序列。在一些实施方案中，转基因编码CAR，并且在一些方面，细胞内区域包含一个或多个次级或共刺激信号传导区域。在一些方面，可以将编码跨膜结构域的核苷酸序列置于转基因中编码所述一个或多个结合结构域和/或间隔子的核苷酸序列的3'。在一些方面，可以将编码所述一个或多个共刺激信号传导结构域的核苷酸序列置于编码初级信号传导结构域或区域的核苷酸序列的5'。在一些方面，可以将编码所述一个或多个共刺激信号传导结构域的核苷酸序列置于编码初级信号传导结构域或区域的核苷酸序列的3'。在一些方面，编码细胞内区域的核苷酸序列是转基因中的最3'区，然后将其连接至同源臂序列之一，例如3'同源臂序列。在一些方面，可以将编码所述一个或多个共刺激信号传导结构域的核苷酸序列置于转基因中编码跨膜结构域的核苷酸序列的3'。在一些方面，由转基因编码的共刺激信号传导区域或初级信号传导结构域或区域包括本文例如在第IV.B.1节中所述的任何共刺激信号传导区域或任何初级信号传导结构域或区域。

(1)共刺激信号传导结构域

在一些实施方案中，转基因包含编码细胞内区域的一部分的核苷酸序列，所述细胞内区域可以包括一个或多个共刺激信号传导结构域。在一些实施方案中，所述一个或多个共刺激信号传导结构域包含T细胞共刺激分子或其信号传导部分的细胞内信号传导结构域，任选地其中T细胞共刺激分子或其信号传导部分是人的。

在一些实施方案中，所述一个或多个共刺激信号传导结构域包含T细胞共刺激分子或其信号传导部分的细胞内信号传导结构域。在一些实施方案中，T细胞共刺激分子或其信号传导部分是人的。在一些实施方案中，由转基因编码的示例性共刺激信号传导结构域包括来自一种或多种共刺激受体的信号传导区域或结构域，所述一种或多种共刺激受体如CD28、CD137(4-1BB)、OX40(CD134)、CD27、DAP10、DAP12、NKG2D、ICOS和/或其他共刺激受体，如本文在本文的第IV.B节中所述的任一种。在一些实施方案中，所述一个或多个共刺激信号传导结构域包含CD28、4-1BB或ICOS或其信号传导部分的细胞内信号传导结构域。在一些实施方案中，所述一个或多个共刺激信号传导结构域包括人CD28、人4-1BB、人ICOS或其信号传导部分的信号传导结构域。在一些实施方案中，所述一个或多个共刺激信号传导结构域包含人4-1BB的细胞内信号传导结构域。

(2)初级信号传导区域或结构域

在一些实施方案中，编码重组受体(例如，CAR)的转基因包括编码初级信号传导区域或结构域(如CD3zeta(CD3ζ)的胞质结构域)的核苷酸序列。在一些实施方案中，初级信号传导区域是或包含能够在T细胞中刺激和/或诱导初级激活信号的信号传导结构域、T细胞受体(TCR)组分的信号传导结构域(例如，CD3-zeta(CD3ζ)链或其功能性变体或信号传导部分的细胞内信号传导结构域或区域)和/或包含免疫受体酪氨酸激活基序(ITAM)的信号传导结构域。在一些实施方案中，所编码的重组受体是本文例如在第IV.B节中所述的任一种。

在一些方面，转基因包括编码调节TCR复合物的初级刺激和/或激活的初级胞质信号传导区域的核苷酸序列。以刺激方式起作用的一个或多个初级胞质信号传导区域可以含有信号传导基序(其被称为免疫受体酪氨酸激活基序或ITAM)。一个或多个含有ITAM的初级胞质信号传导区域的例子包括源自TCR或CD3 zeta(CD3ζ)、Fc受体(FcR)γ或FcRβ的那些。在一些实施方案中，CAR中的胞质信号传导区域或结构域含有源自CD3ζ的胞质信号传导结构域、其部分或序列。在一些实施方案中，所述细胞内(或胞质)信号传导区域包含人CD3链、任选地CD3ζ刺激信号传导结构域或其功能性变体，如人CD3ζ(登录号：P20963.2)的亚型3的112个AA的胞质结构域或如美国专利号7,446,190或美国专利号8,911,993中所述的CD3ζ信号传导结构域。在一些实施方案中，所述细胞内信号传导区域包含SEQ ID NO:13、14或15所示的氨基酸序列或与SEQ ID NO:13、14或15展现出至少或至少约85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。

在一些方面，由转基因编码的初级信号传导结构域或区域包括本文例如在第IV.B.1节中所述的任何初级信号传导结构域或区域。

(d)另外的结构域，例如多聚化结构域

在一些实施方案中，转基因还包括编码一个或多个多聚化结构域(例如，二聚化结构域)的核苷酸序列。在一些方面，所编码的多聚化结构域可以是细胞外或细胞内的。在一些实施方案中，所编码的多聚化结构域是细胞外的。在一些实施方案中，所编码的多聚化结构域是细胞内的。在一些实施方案中，由转基因编码的细胞内区域的部分包含多聚化结构域，任选地二聚化结构域。在一些实施方案中，转基因包含编码胞外区域的核苷酸序列。在一些实施方案中，胞外区域包含多聚化结构域，任选地二聚化结构域。在一些实施方案中，多聚化结构域能够在与诱导物结合后发生二聚化。

在一些方面，重组受体是多链重组受体，如多链CAR。在一些实施方案中，多链重组受体或其部分的一条或多条链由转基因编码。在一些实施方案中，多链重组受体的一条或多条链可以凭借重组受体的每条链中所包括的多聚化结构域的多聚化而一起形成功能性或活性重组受体。

在一些方面，编码多聚化结构域的核苷酸序列在其他结构域的5'或3'。例如，在一些实施方案中，所编码的多聚化结构域是细胞外的，并且编码多聚化结构域的序列在编码间隔子的序列的5'。在一些实施方案中，所编码的多聚化结构域是细胞内的，并且编码多聚化结构域的序列在编码初级信号传导区域或结构域的序列的5'。在一些实施方案中，多聚化结构域是细胞内的，并且编码多聚化结构域的序列在编码一个或多个共刺激信号传导结构域的序列的5'或3'。在一些实施方案中，所编码的多聚化结构域可以在结合诱导物后发生多聚化(例如，二聚化)。示例性的所编码的多聚化结构域包括本文例如在本文的第IV.B节中所述的任何多聚化结构域。

(iii)示例性T细胞受体(TCR)编码序列

在一些实施方案中，由转基因编码的重组受体是重组T细胞受体(TCR)。在一些方面，所述转基因可以编码重组TCR的全部或一部分。在一些实施方案中，所述转基因包含编码重组TCR的一个或多个链、区域或结构域的核苷酸序列。由转基因编码的示例性重组TCR在下文有描述，并且还可以包括下文在第IV.B.4节中所述的示例性重组TCR的任何链、区域或结构域。

在一些实施方案中，TCR包含两条或更多条单独的多肽链，如TCR alpha(TCRα)和TCR beta(TCRβ)链。在一些方面，所述转基因可以编码重组TCR的一条或多条链，如TCRα或TCRβ或两者。在一些方面，所述转基因可以编码TCRα和TCRβ链两者。在一些方面，所述转基因可以编码TCRα链或TCRβ链之一，并且存在于工程化细胞中的第二转基因可以编码TCR的另一条链。在一些方面，编码TCRα和TCRβ的序列任选地由多顺反子元件(如2A元件)隔开。

在某些实施方案中，转基因包括编码作为重组TCR的重组受体或其抗原结合片段的核酸序列。在一些方面，所述转基因可以编码含有可变结构域和恒定结构域的重组TCR链。在一些方面，所述转基因编码含有一个或多个可变结构域和一个或多个恒定结构域的重组TCR链。在一些实施方案中，转基因含有编码TCRα和TCRβ链的序列。

在一些实施方案中，所编码的TCRα链和TCRβ链由接头区隔开。在一些实施方案中，包括接头序列，其将TCRα链与TCRβ链连接以形成单一多肽链。在一些实施方案中，接头具有足够长度以跨越α链C末端与β链N末端之间的距离，或反之亦然，同时还确保接头长度不会长到阻断或减少与靶肽-MHC复合物的结合。在一些实施方案中，接头可以是能够形成单一多肽链同时保留TCR结合特异性的任何接头。在一些实施方案中，所述接头可以含有从或从约10至45个氨基酸，如10至30个氨基酸或26至41个氨基酸残基，例如29、30、31或32个氨基酸。在一些实施方案中，接头具有式-PGGG-(SGGGG)n-P-，其中n是5或6，并且P是脯氨酸，G是甘氨酸，并且S是丝氨酸(SEQ ID NO:22)。在一些实施方案中，接头具有序列GSADDAKKDAAKKDGKS(SEQ ID NO:23)。在一些实施方案中，TCRα链或其部分与TCRβ链或其部分之间的接头由蛋白酶识别和/或能够被蛋白酶切割。在某些实施方案中，编码TCRα链或其部分的核酸序列与编码TCRβ链或其部分的核酸序列之间的接头含有多顺反子元件。

在一些实施方案中，转基因是或包括核苷酸序列，其是或包括结构[TCRβ链]-[接头或多顺反子元件]-[TCRα链]。在任何实施方案的一些实施方案中，所述转基因是或包括核苷酸序列，其是或包括结构[TCRα链]-[接头或多顺反子元件]-[TCRβ链]。在一些方面，多顺反子元件包括核糖体跳跃元件/自我切割元件(例如，2A元件或内部核糖体进入位点(IRES)，如本文所述的任一种)。

(iv)另外的分子，例如标记物

在一些实施方案中，转基因还包括编码一种或多种另外的分子的核苷酸序列，所述一种或多种另外的分子如抗体、抗原、多链重组受体(例如，多链CAR、嵌合共刺激受体、抑制性受体、调控型嵌合抗原受体或本文例如在第IV.B.2节中所述的多链重组受体系统的其他组分，或在第IV.B.3节中所述的重组T细胞受体(TCR))的另外嵌合或另外多肽链、转导标记物或替代标记物(例如，截短的细胞表面标记物)、酶、因子、转录因子、抑制肽、生长因子、核受体、激素、淋巴因子、细胞因子、趋化因子、可溶性受体、可溶性细胞因子受体、可溶性趋化因子受体、报吿物、前述任一种的功能性片段或功能性变体以及前述的组合。在一些方面，可以将此类编码一种或多种另外的分子的核苷酸序列置于编码重组受体的区域或结构域的核苷酸序列的5'。在一些方面，编码一种或多种其他分子的序列和编码重组受体的区域或结构域的核苷酸序列由调节序列(如2A核糖体跳跃元件和/或启动子序列)隔开。

在一些实施方案中，转基因还包括编码一种或多种另外的分子的核苷酸序列。在一些方面，一种或多种另外的分子包括一种或多种标记物。在一些实施方案中，所述一种或多种标记包括转导标记物、替代标记物和/或选择标记物。在一些实施方案中，转基因还包括可以如通过促进活力和/或转移细胞的功能改善疗法的功效的核酸序列；提供用于选择和/或评价细胞的基因标记物如以便在体内评估存活或定位的核酸序列；例如通过使细胞对体内阴性选择易感来改善安全性的核酸序列，如以下文献中所述：Lupton等人,Mol.andCell Biol.,11:6(1991)；和Riddell等人,Human Gene Therapy 3:319-338(1992)；还参见WO 1992008796和WO 1994028143(描述了使用将显性阳性选择标记物与阴性选择标记物融合而获得的双功能选择融合基因)和美国专利号6,040,177。在一些方面，标记物包括本文例如在本节或第II或III节中所述的任何标记物，或本文例如在第IV.B.2节中所述的任何另外的分子和/或受体多肽。在一些实施方案中，另外的分子是替代标记物，任选地截短的受体，任选地其中截短的受体缺乏细胞内信号传导结构域和/或当与其配体结合时不能介导细胞内信号传导。

在一些实施方案中，标记物是转导标记物或替代标记物。转导标记物或替代标记物可用于检测已经引入多核苷酸(例如编码重组受体的多核苷酸)的细胞。在一些实施方案中，转导标记物可以指示或确认对细胞的修饰。在一些实施方案中，替代标记物是被制备为在细胞表面上与重组受体(例如，CAR或TCR)共表达的蛋白质。在任何实施方案的一些实施方案中，这种替代标记物是已经修饰以具有极少或无活性的表面蛋白。在一些实施方案中，替代标记物是由编码重组受体的相同多核苷酸编码。在一些实施方案中，编码重组受体的核酸序列与编码标记物的核酸序列可操作地连接，任选地由内部核糖体进入位点(IRES)或编码自我切割肽或引起核糖体跳跃的肽(如2A序列，如T2A、P2A、E2A或F2A)的核酸隔开。在一些情况下，外在标记基因可以结合工程化细胞用于允许检测或选择细胞，并且在一些情况下还可以用于促进细胞自杀。

示例性替代标记物可以包括截短形式的细胞表面多肽，如是非功能性的并且不转导或不能转导信号或通常被细胞表面多肽的全长形式转导的信号、和/或不内化或不能内化的截短形式。示例性截短的细胞表面多肽包括截短形式的生长因子或其他受体，如截短的人表皮生长因子受体2(tHER2)、截短的表皮生长因子受体(tEGFR，在SEQ ID NO:7或16中列出的示例性tEGFR序列)或前列腺特异性膜抗原(PSMA)或其修饰形式。tEGFR可以含有被抗体西妥昔单抗

或其他治疗性抗EGFR抗体或结合分子识别的表位，其可以被用于鉴定或选择已经用tEGFR构建体和编码的外源蛋白质工程化的细胞，和/或用于消除或分离表达所编码的外源蛋白质的细胞。参见美国专利号8,802,374和Liu等人,NatureBiotech.2016年4月；34(4):430–434。在一些方面，所述标记物(例如替代标记物)包括全部或部分(例如截短形式的)CD34、NGFR、CD19或截短的CD19(例如截短的非人CD19)或表皮生长因子受体(例如tEGFR)。在一些实施方案中，标记物是或包含荧光蛋白，例如绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(EGFP)(例如超折叠GFP(sfGFP))、红色荧光蛋白(RFP)(例如tdTomato、mCherry、mStrawberry、AsRed2、DsRed或DsRed2)、青色荧光蛋白(CFP)、蓝绿色荧光蛋白(BFP)、增强型蓝色荧光蛋白(EBFP)和黄色荧光蛋白(YFP)及其变体，包括荧光蛋白的物种变体、单体变体和密码子优化的和/或增强的变体。在一些实施方案中，标记物是或包含酶(如萤光素酶)、来自大肠杆菌的lacZ基因、碱性磷酸酶、分泌的胚胎碱性磷酸酶(SEAP)、氯霉素乙酰转移酶(CAT)。示例性发光报告基因包括萤光素酶(luc)、β-半乳糖苷酶、氯霉素乙酰转移酶(CAT)、β-葡萄糖醛酸酶(GUS)或其变体。

在一些实施方案中，标记物是选择标记物。在一些实施方案中，选择标记物是或包含赋予对外源药剂或药物的抗性的多肽。在一些实施方案中，选择标记物是抗生素抗性基因。在一些实施方案中，选择标记物是向哺乳动物细胞赋予抗生素抗性的抗生素抗性基因。在一些实施方案中，选择标记物是或包含嘌呤霉素抗性基因、潮霉素抗性基因、杀稻瘟菌素抗性基因、新霉素抗性基因、遗传霉素抗性基因或博莱霉素抗性基因或其修饰形式。

在一些实施方案中，所述分子是非自身分子，例如非自身蛋白，即不被将被过继转移细胞的宿主免疫系统识别为“自身”的分子。

在一些实施方案中，所述标记物不提供任何治疗功能和/或不产生除了用作基因工程化标记物(例如，用于选择成功工程化的细胞)以外的作用。在其他实施方案中，所述标记物可以是治疗性分子或以其他方式发挥一些所需作用的分子，如在体内会遇到的细胞的配体，如用于在过继转移和遇到配体时增强和/或减弱细胞应答的共刺激或免疫检查点分子。

在一些实施方案中，转基因包括编码作为免疫调节剂的一种或多种另外的分子的序列。在一些实施方案中，免疫调节分子选自免疫检查点调节剂、免疫检查点抑制剂、细胞因子或趋化因子。在一些实施方案中，免疫调节剂是免疫检查点抑制剂，所述免疫检查点抑制剂能够抑制或阻断免疫检查点分子的功能或涉及免疫检查点分子的信号传导途径。在一些实施方案中，免疫检查点分子选自PD-1、PD-L1、PD-L2、CTLA-4、LAG-3、TIM3、VISTA、腺苷受体或胞外腺苷，任选地腺苷2A受体(A2AR)或腺苷2B受体(A2BR)、或涉及前述任一种的腺苷或途径。其他示例性的另外的分子包括表位标签、可检测分子如荧光或发光蛋白、或介导增强的细胞生长和/或基因扩增的分子(例如，二氢叶酸还原酶)。表位标签包括例如一个或多个拷贝的FLAG、His、myc、Tap、HA或任何可检测的氨基酸序列。在一些实施方案中，另外的分子可以包括非编码序列、抑制性核酸序列(如反义RNA、RNAi、shRNA和微RNA(miRNA))或核酸酶识别序列。

在一些方面，另外的分子可以包括本文所述的任何另外的受体多肽，如例如如第IV.B.2节中所述多链重组受体的任何另外的多肽链。

(v)多顺反子元件和调节或控制元件

在一些方面，可以插入转基因(包括编码重组受体或其部分的转基因)，使得其表达由整合位点处的内源启动子(即驱动内源T细胞刺激相关基因座基因表达的启动子)驱动。在多肽编码序列无启动子的一些实施方案中，则通过内源启动子或目的区域中的其他控制元件驱动的转录来确保整合的转基因的表达。例如，编码重组受体的一部分的转基因可以在没有启动子，但是与内源T细胞刺激相关基因座的编码序列同框的情况下插入，使得整合的转基因的表达受到整合位点处的内源启动子和/或其他调节元件的转录的控制。在一些实施方案中，将多顺反子元件(如核糖体跳跃元件/自我切割元件(例如，2A元件或内部核糖体进入位点(IRES)))置于编码重组受体的一部分的转基因的上游，使得多顺反子元件与T细胞刺激相关基因座处的内源开放阅读框的一个或多个外显子框内放置，使得编码重组受体的转基因的表达与内源T细胞刺激相关基因座启动子可操作地连接。在一些实施方案中，所述转基因不包含编码3'UTR的序列。在一些实施方案中，在将转基因整合至内源T细胞刺激相关基因座中后，转基因被整合于内源T细胞刺激相关基因座的3'UTR的上游，使得编码重组受体的信息含有内源T细胞刺激相关基因座的3'UTR，其例如来自内源T细胞刺激相关基因座的开放阅读框或其部分序列。在一些实施方案中，编码重组受体的剩余部分的开放阅读框或其部分序列包含内源T细胞刺激相关基因座的3'UTR。

在一些实施方案中，将“串联”盒整合至所选位点中。在一些实施方案中，一个或多个“串联”盒编码一种或多种多肽或因子，它们各自独立地受调节元件控制或全部作为多顺反子表达系统而受控。在一些实施方案中，如多核苷酸含有第一和第二核酸序列的那些实施方案中，编码不同多肽链中的每一种的编码序列可以与相同或不同的启动子可操作地连接。在一些实施方案中，核酸分子可以含有驱动两条或更多条不同多肽链表达的启动子。在一些实施方案中，此类核酸分子可以是多顺反子的(双顺反子的或三顺反子的，参见例如美国专利号6,060,273)。在一些实施方案中，转录单元可以被工程化为含有IRES(内部核糖体进入位点)的双顺反子单元，其允许通过来自单一启动子的信息共表达基因产物。可替代地，在一些情况下，单一启动子可以引导在单一开放阅读框(ORF)中含有两个或三个多肽的RNA的表达，所述多肽通过编码自我切割肽(例如，2A序列)或蛋白酶识别位点(例如，弗林蛋白酶)的序列彼此隔开，如本文所述。因此，ORF编码单一多肽，其在翻译期间(在2A的情况下)或翻译后被处理成单独蛋白质。在一些实施方案中，“串联盒”包括盒的包含无启动子序列的第一组分、之后的转录终止序列、以及编码自主表达盒或多顺反子表达序列的第二序列。在一些实施方案中，串联盒编码两种或更多种不同的多肽或因子，例如重组受体的两个或更多个链或结构域。在一些实施方案中，将编码重组受体的两个或更多个链或结构域的核酸序列作为串联表达盒或者双顺反子或多顺反子盒引入一个靶DNA整合位点中。

在一些实施方案中，转基因(例如，外源核酸序列)还含有不是或不同于内源T细胞刺激相关基因座的调节或控制元件的一个或多个异源或外源调节或控制元件(例如，顺式调节元件)。在一些实施方案中，所述异源或外源调节或控制元件与编码所述转基因的另外的组分的核酸序列可操作地连接，所述核酸序列是例如除编码重组受体的核酸序列之外的编码另外的多肽的核酸序列。

在一些方面，异源调节或控制元件包括如启动子、增强子、内含子、隔离子、多腺苷酸化信号、转录终止序列、Kozak共有序列、多顺反子元件(例如，内部核糖体进入位点(IRES)、2A序列)、对应于信使RNA(mRNA)的非翻译区(UTR)的序列以及剪接受体或供体序列，如不是或不同于T细胞刺激相关基因座处的调节或控制元件的那些。在一些实施方案中，异源调节或控制元件包括启动子、增强子、内含子、多腺苷酸化信号、Kozak共有序列、剪接受体序列和/或剪接供体序列。在一些实施方案中，所述转基因包含启动子，所述启动子是异源的和/或不典型地存在于靶位点处或附近，例如以控制转基因中另外的组分的表达。

在一些情况下，所述多顺反子元件(如T2A)可以引起核糖体跳过2A元件C末端处肽键的合成(核糖体跳跃)，导致在2A序列末端与相邻下游肽之间隔开(参见例如，de Felipe,Genetic Vaccines and Ther.2:13(2004)和de Felipe等人Traffic 5:616-626(2004)；也称为自切割元件)。这允许插入的转基因受整合位点处的内源启动子(如T细胞刺激相关基因座启动子)的转录的控制。示例性多顺反子元件包括来自以下病毒的2A序列：口蹄疫病毒(F2A，例如SEQ ID NO:21)、马鼻炎A病毒(E2A，例如SEQ ID NO:20)、明脉扁刺蛾β四体病毒(T2A，例如SEQ ID NO:6或17)和猪捷申病毒-1(P2A，例如SEQ ID NO:18、19或61)，如美国专利公开号20070116690中所述。在一些实施方案中，模板多核苷酸包括在转基因(例如，编码重组受体或其部分的核酸)上游的P2A核糖体跳跃元件(SEQ ID NO:18、19或61所示的序列)。

在一些实施方案中，编码重组受体或其部分的一条或多条链的转基因和/或编码另外的分子的序列独立地包含一个或多个多顺反子元件。在一些实施方案中，所述一个或多个多顺反子元件在编码重组受体、其部分的转基因和/或编码另外的分子的序列的上游。在一些实施方案中，所述一个或多个多顺反子元件定位于编码重组受体、其部分的转基因和/或编码另外的分子的序列之间。在一些实施方案中，所述一个或多个多顺反子元件定位于编码重组受体的部分或链的核酸序列之间。

在一些实施方案中，编码另外的分子的序列与异源调节或控制元件可操作地连接。在一些方面，所述异源调节或控制元件包含异源启动子。在一些实施方案中，所述异源启动子选自组成型启动子、诱导型启动子、阻抑型启动子和/或组织特异性启动子。在一些实施方案中，调节或控制元件是启动子和/或增强子，例如组成型启动子或诱导型或组织特异性启动子。在一些实施方案中，所述启动子选自RNA pol I、pol II或pol III启动子。在一些实施方案中，所述启动子由RNA聚合酶II识别(例如CMV、SV40早期区域或腺病毒主要晚期启动子)。在一些实施方案中，所述启动子由RNA聚合酶III识别(例如，U6或H1启动子)。在一些实施方案中，所述启动子是或包含组成型启动子。示例性组成型启动子包括例如猿病毒40早期启动子(SV40)、巨细胞病毒立即早期启动子(CMV)、人泛素C启动子(UBC)、人延伸因子1α启动子(EF1α)、小鼠磷酸甘油酸激酶1启动子(PGK)、和与CMV早期增强子偶联的鸡β-肌动蛋白启动子(CAGG)。在一些实施方案中，所述异源启动子是或包含人延伸因子1α(EF1α)启动子或MND启动子或其变体。

在一些实施方案中，所述启动子是受调控的启动子(例如，诱导型启动子)。在一些实施方案中，所述启动子是诱导型启动子或阻抑型启动子。在一些实施方案中，所述启动子包含Lac操纵子序列、四环素操纵子序列、半乳糖操纵子序列或多西环素操纵子序列，或者是其类似物或能够由Lac阻遏因子或其类似物结合或识别。在一些实施方案中，所述启动子是组织特异性启动子。在一些情形中，所述启动子仅在特定细胞类型中表达(例如，T细胞或B细胞或NK细胞特异性启动子)。

在一些实施方案中，所述启动子是或包含组成型启动子。示例性组成型启动子包括例如猿病毒40早期启动子(SV40)、巨细胞病毒立即早期启动子(CMV)、人泛素C启动子(UBC)、人延伸因子1α启动子(EF1α)、小鼠磷酸甘油酸激酶1启动子(PGK)、和与CMV早期增强子偶联的鸡β-肌动蛋白启动子(CAGG)。在一些实施方案中，所述组成型启动子是合成或经修饰的启动子。在一些实施方案中，所述启动子是或包含MND启动子，它是一种含有具有骨髓增生性肉瘤病毒增强子的经修饰的MoMuLV LTR的U3区的合成启动子(参见Challita等人(1995)J.Virol.69(2):748-755)。在一些实施方案中，所述启动子是组织特异性启动子。在一些情形中，所述启动子仅在特定细胞类型中驱动表达(例如，T细胞或B细胞或NK细胞特异性启动子)。

在一些实施方案中，所述启动子是病毒启动子。在一些实施方案中，所述启动子是非病毒启动子。在一些情况下，所述启动子选自人延伸因子1α(EF1α)启动子或其修饰形式(具有HTLV1增强子的EF1α启动子)或MND启动子。在一些实施方案中，所述多核苷酸不包括异源或外源调节元件，例如启动子。在一些实施方案中，所述启动子是双向启动子(参见例如，WO2016/022994)。

在一些实施方案中，所述转基因还可以包括剪接受体序列。示例性的已知剪接受体位点序列包括例如CTGACCTCTTCTCTTCCTCCCACAG(SEQ ID NO:289)(来自人HBB基因)和TTTCTCTCCACAG(SEQ ID NO:290)(来自人IgG基因)。

在一些实施方案中，所述转基因还可以包括转录终止所需的序列和/或多腺苷酸化信号。在一些方面，示例性多腺苷酸化信号选自SV40、hGH、BGH和rbGlob转录终止序列和/或多腺苷酸化信号。在一些实施方案中，所述转基因包括SV40多腺苷酸化信号。在一些实施方案中，如果存在于转基因内，则转录终止序列和/或多腺苷酸化信号通常是转基因内的最3'序列，并且与同源臂之一连接。在一些方面，所述转基因不包含编码3'UTR的序列或转录终止子。在一些实施方案中，在将转基因整合至内源T细胞刺激相关基因座中后，转基因被整合于内源T细胞刺激相关基因座的3'UTR和/或转录终止子的上游，使得编码重组受体的信息含有内源T细胞刺激相关基因座的3'UTR，其例如来自内源T细胞刺激相关基因座的开放阅读框或其部分序列。因此，在一些实施方案中，在整合编码重组受体的一部分的转基因后，编码重组受体的核酸序列可操作地连接为在内源T细胞刺激相关基因座的3'UTR、转录终止子和/或其他调节元件的控制下。

(vi)示例性转基因序列

在一些实施方案中，示例性转基因按5'至3'顺序包含各自编码以下的核苷酸序列：跨膜结构域(或膜缔合结构域)和细胞内区域。在一些实施方案中，示例性转基因按5'至3'顺序包含各自编码以下的核苷酸序列：胞外区域、跨膜结构域和细胞内区域。

在一些实施方案中，所编码的重组受体是CAR，并且示例性转基因在5'至3'方向上包含各自编码以下的核苷酸序列：信号肽、胞外结合结构域、间隔子、跨膜结构域和细胞内区域，所述细胞内区域包含初级信号传导结构域或区域和/或共刺激信号传导结构域。在一些实施方案中，示例性转基因在5'至3'方向上包含各自编码以下的核苷酸序列：信号肽、胞外结合结构域、间隔子、跨膜结构域和一个或多个共刺激信号传导结构域。在一些实施方案中，示例性转基因在5'至3'方向上包含各自编码以下的核苷酸序列：信号肽、胞外结合结构域、间隔子、跨膜结构域以及一个或多个共刺激信号传导结构域和初级信号传导结构域或区域。

在一些实施方案中，示例性转基因在5'至3'方向上包含各自编码以下的核苷酸序列：跨膜结构域(或膜缔合结构域)、细胞内多聚化结构域、任选的一个或多个共刺激信号传导结构域和初级信号传导结构域或区域。在一些实施方案中，示例性转基因在5'至3'方向上包含各自编码以下的核苷酸序列：胞外多聚化结构域、跨膜结构域、任选的一个或多个共刺激信号传导结构域和初级信号传导结构域或区域。

在一些实施方案中，所述转基因按顺序包含编码以下的核苷酸序列：胞外结合结构域，任选地scFv；间隔子，任选地包含来自任选地来自IgG1、IgG2或IgG4的人免疫球蛋白铰链或其修饰形式的序列，任选地还包含C_H2区和/或C_H3区；以及跨膜结构域，任选地来自人CD28；共刺激信号传导结构域，任选地来自人4-1BB；和细胞内信号传导区域，任选地CD3ζ链或其部分。在一些实施方案中，重组受体的所编码的细胞内区域从其N至C末端按顺序包含：一个或多个共刺激信号传导结构域、和初级信号传导结构域或区域，所述初级信号传导结构域或区域如含有CD3ζ链或其片段。

在一些实施方案中，示例性转基因编码TCRα链的全部或一部分。在一些实施方案中，示例性转基因编码TCRβ链的全部或一部分。在一些实施方案中，示例性转基因编码TCRα链和TCRβ链两者的全部或一部分。在一些实施方案中，所编码的重组受体是重组T细胞受体(TCR)，并且示例性转基因按5'至3'顺序包括[TCRβ链]-[接头或多顺反子元件]-[TCRα链]。在一些实施方案中，所编码的重组受体是重组TCR，并且示例性转基因按5'至3'顺序包括[TCRα链]-[接头或多顺反子元件]-[TCRβ链]。

在一些实施方案中，示例性转基因还可以包含多顺反子元件(例如，2A元件或内部核糖体进入位点(IRES))，和/或置于编码信号肽和/或胞外区域的序列的5'的调节或控制元件(例如，启动子)。在一些实施方案中，示例性转基因还可以包含另外的序列，例如编码一种或多种另外的分子的核苷酸序列，所述一种或多种另外的分子如标记物、另外的重组受体、抗体或其抗原结合片段、免疫调节分子、配体、细胞因子或趋化因子。在一些方面，编码一种或多种其他分子的序列和编码重组受体的区域或结构域的核苷酸序列由调节序列(如2A核糖体跳跃元件和/或启动子序列)隔开。在一些方面，在示例性转基因中，将编码一种或多种另外的分子的核苷酸序列置于编码信号肽和/或胞外区域的序列的5'。在一些实施方案中，将编码一种或多种另外的分子的核苷酸序列置于多顺反子元件和/或调节或控制元件与编码重组受体的区域或结构域的核苷酸序列之间。在一些实施方案中，将编码一种或多种另外的分子的核苷酸序列置于两个元件和/或调节或控制元件之间。在一些实施方案中，示例性转基因在5'至3'方向上包含：多顺反子元件和/或调节元件、编码另外的分子的核苷酸序列、多顺反子元件和/或调节元件、信号肽、编码重组受体的区域或结构域(例如，胞外区域、跨膜结构域、细胞内区域)的核酸序列。

b.同源臂

在一些实施方案中，模板多核苷酸在5'和3'端含有一个或多个同源序列(也称为“同源臂”)，其与编码重组受体或其部分的转基因连接或在其周围。同源臂允许DNA修复机制(例如，同源重组机器)识别同源性并使用模板多核苷酸作为修复的模板，并且同源臂之间的核酸序列被拷贝至被修复的DNA中，从而有效地将转基因插入或整合至基因组中同源性位置之间的整合靶位点中。

在一些方面，在整合转基因后，整个重组受体由转基因编码，并且内源T细胞刺激相关基因座的整个编码序列或部分编码序列被缺失。在一些实施方案中，所述转基因包含与所述一个或多个同源臂中所包含的T细胞刺激相关基因座的开放阅读框的一个或多个外显子同框的核苷酸序列。在一些方面，整个重组受体由转基因编码，并且仅T细胞刺激相关基因座的一部分被缺失，而内源T细胞刺激相关基因座的剩余部分被表达。

在一些实施方案中，同源臂序列包括与基因破坏(例如，T细胞刺激相关基因座内的靶位点)周围的基因组序列同源的序列。在一些实施方案中，所述模板多核苷酸包含以下组分：[5'同源臂]-[转基因序列(例如，编码重组受体或其部分的一条或多条链的外源或异源核酸序列)]-[3'同源臂]。在一些实施方案中，5'同源臂序列包括与位于5'侧的基因破坏附近的序列同源的连续序列。在一些实施方案中，3'同源臂序列包括与位于3'侧的基因破坏附近的序列同源的连续序列。在一些方面，靶位点是通过能够引入基因破坏的所述一种或多种药剂(例如，Cas9和靶向T细胞刺激相关基因座内的特定位点的gRNA)的靶向来确定的。

在一些方面，模板多核苷酸内的转基因可以用于指导靶位点和/或同源臂的定位。在一些方面，基因破坏的靶位点可以用作设计用于HDR的模板多核苷酸和/或同源臂的指导。在一些实施方案中，基因破坏可以被靶向于转基因的靶向整合的期望位点附近。在一些方面，同源臂被设计为靶向内源T细胞刺激相关基因座的开放阅读框的外显子内的整合，并且同源臂序列是基于基因破坏周围的期望整合位置(包括基因破坏周围的外显子和内含子序列)确定的。在一些实施方案中，可以根据有效靶向的要求和可以使用的模板多核苷酸或载体的长度来设计靶位点的位置、所述一个或多个同源臂的相对位置和用于插入的转基因(外源核酸序列)。在一些方面，同源臂被设计为靶向T细胞刺激相关基因座的开放阅读框的内含子内的整合。在一些方面，同源臂被设计为靶向T细胞刺激相关基因座的开放阅读框的外显子内的整合。

在一些方面，T细胞刺激相关基因座内的靶整合位点(用于靶向整合的位点)位于内源T细胞刺激相关基因座处的开放阅读框内。在一些实施方案中，靶整合位点在本文例如在第II.A节中所述的任何靶位点处或附近。在一些方面，用于整合的靶位置在用于基因破坏的靶位点处或周围，例如在用于基因破坏的靶位点的小于500、450、400、350、300、250、200、150、100或50bp内。

在一些方面，靶整合位点在内源T细胞刺激相关基因座的开放阅读框的外显子内。在一些方面，靶整合位点在T细胞刺激相关基因座的开放阅读框的内含子内。在一些方面，靶整合位点在T细胞刺激相关基因座的调节或控制元件(例如，启动子)内。在一些实施方案中，靶整合位点在对应于早期编码区的外显子内或与所述外显子非常靠近，所述外显子例如内源T细胞刺激相关基因座的开放阅读框的外显子1、2、3、4或5，或者包括紧接转录起始位点之后、在外显子1、2、3、4或5内(如本文表1-表9中所述)、或者在外显子1、2、3、4或5的小于500、450、400、350、300、250、200、150、100或50bp内的序列。在一些实施方案中，整合被靶向于内源T细胞刺激相关基因座的外显子2处或附近，或者在外显子2的小于500、450、400、350、300、250、200、150、100或50bp内。在一些方面，靶整合位点在内源T细胞刺激相关基因座的外显子1处或附近，例如在外显子1的小于500、450、400、350、300、250、200、150、100或50bp内。在一些实施方案中，所述靶整合位点在内源T细胞刺激相关基因座的外显子2处或附近，或者在外显子2的小于500、450、400、350、300、250、200、150、100或50bp内。在一些方面，所述靶整合位点在内源T细胞刺激相关基因座的外显子3处或附近，例如在外显子3的小于500、450、400、350、300、250、200、150、100或50bp内。在一些方面，所述靶整合位点在内源T细胞刺激相关基因座的外显子4处或附近，例如在外显子4的小于500、450、400、350、300、250、200、150、100或50bp内。在一些方面，所述靶整合位点在内源T细胞刺激相关基因座的外显子5处或附近，例如在外显子5的小于500、450、400、350、300、250、200、150、100或50bp内。在一些方面，靶整合位点在T细胞刺激相关基因座的调节或控制元件(例如，启动子)内。

在一些实施方案中，5'同源臂序列包括在用于基因破坏的靶位点5'的大约10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000或5000个碱基对的连续序列，其从内源T细胞刺激相关基因座的靶位点附近开始。在一些实施方案中，3'同源臂序列包括在用于基因破坏的靶位点3'的大约10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000或5000个碱基对的连续序列，其从内源T细胞刺激相关基因座的靶位点附近开始。因此，在经由HDR整合后，所述转基因被靶向以供整合于用于基因破坏的靶位点(例如，内源T细胞刺激相关基因座的外显子或内含子内的靶位点)处或附近。

在一些方面，同源臂含有与内源T细胞刺激相关基因座处的开放阅读框序列的一部分同源的序列。在一些方面，同源臂序列含有与内源T细胞刺激相关基因座处的开放阅读框序列的连续部分(包括外显子和内含子)同源的序列。在一些方面，同源臂含有与内源T细胞刺激相关基因座处的开放阅读框序列的连续部分(包括外显子和内含子)相同的序列。

在一些实施方案中，所述模板多核苷酸含有用于将转基因靶向整合在内源T细胞刺激相关基因座(本文表1-表9中所述的示例性基因组基因座序列；上文第II.A.1节中描述的示例性人mRNA序列)处的同源臂。在一些实施方案中，使用用于基因破坏的任何药剂(例如，本文所述的靶向核酸酶和/或gRNA)引入基因破坏。在一些实施方案中，模板多核苷酸在通过靶向核酸酶和/或gRNA引入的基因破坏的任一侧上包含约500至1000(例如，500至900或600至700)个同源性碱基对。在一些实施方案中，模板多核苷酸包含5'同源臂序列的约500、600、700、800、900或1000个碱基对，其与T细胞刺激相关基因座处的基因破坏5'序列的500、600、700、800、900或1000个碱基对同源；转基因；以及3'同源臂序列的约500、600、700、800、900或1000个碱基对，其与T细胞刺激相关基因座处的基因破坏3'序列的500、600、700、800、900或1000个碱基对同源。

在一些方面，设计转基因与所述一个或多个同源臂序列之间的边界，使得在HDR和转基因的靶向整合后，转基因内编码一种或多种多肽(例如，重组受体的一条或多条链、一个或多个结构域或一个或多个区域)的序列与内源T细胞刺激相关基因座处的开放阅读框序列的一个或多个外显子框内整合，和/或产生编码多肽的转基因和内源T细胞刺激相关基因座处的开放阅读框序列的一个或多个外显子的框内融合物。在一些实施方案中，T细胞刺激相关基因座的基因产物的全部或一部分由内源开放阅读框的核酸序列编码，并且重组受体或其一部分的多肽由整合的转基因编码，它们任选地由多顺反子元件(如2A元件)隔开。

在一些实施方案中，所述一个或多个同源臂序列包括与围绕或侧接在内源T细胞刺激相关基因座处的开放阅读框序列内的靶位点的序列同源、基本上相同或相同的序列。在一些方面，所述一个或多个同源臂序列含有在内源T细胞刺激相关基因座处的开放阅读框的部分序列的内含子和外显子。在一些方面，5'同源臂序列和转基因的边界使得在不含有异源启动子的转基因的情况下，转基因的编码部分与内源T细胞刺激相关基因座的开放阅读框的上游外显子或其部分(例如，外显子1、2、3、4或5，这取决于靶向整合的位置)框内融合。

在一些方面，5'同源臂序列和转基因的边界使得内源T细胞刺激相关基因座的开放阅读框的上游外显子或其部分(例如，外显子1、2、3、4或5)与转基因的编码部分框内融合。因此，在靶向整合、转录和翻译后，由内源T细胞刺激相关基因座的开放阅读框序列和转基因的融合DNA序列产生作为连续多肽的所编码的重组受体。在一些方面，所述上游外显子或其一部分编码所述T细胞刺激相关基因座的基因产物的全部或一部分。在一些方面，在靶向整合后，多顺反子元件(例如，2A元件或内部核糖体进入位点(IRES))将内源T细胞刺激相关基因座的开放阅读框序列与编码重组受体的转基因隔开。在一些方面，当由经修饰的T细胞刺激相关基因座表达和翻译时，所述多肽被切割以产生由内源T细胞刺激相关基因座编码的多肽的全部或一部分和重组受体。

在一些实施方案中，用于在内源T细胞刺激相关基因座PDCD1处进行靶向整合的示例性5'同源臂包含SEQ ID NO:66所示的序列或者与SEQ ID NO:66展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列或者其部分序列。

在一些实施方案中，用于在内源T细胞刺激相关基因座PDCD1处进行靶向整合的示例性3'同源臂包含SEQ ID NO:67所示的序列或者与SEQ ID NO:67展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列或者其部分序列。

在一些实施方案中，用于在内源TRAC基因座处进行靶向整合的示例性5'同源臂包含SEQ ID NO:68所示的序列或者与SEQ ID NO:68展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列或者其部分序列。

在一些实施方案中，用于在内源TRAC基因座处进行靶向整合的示例性3'同源臂包含SEQ ID NO:69所示的序列或者与SEQ ID NO:69展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列或者其部分序列。

在一些方面，靶位点可以决定同源臂的相对位置和序列。同源臂通常可以延伸至少远至在引入基因破坏(例如，DSB)后可以发生通过DNA修复机制进行的末端切除的区域，例如以允许切除的单链突出端找到模板多核苷酸内的互补区。总长度可以受诸如质粒大小、病毒包装极限或构建体大小极限等参数的限制。

在一些实施方案中，同源臂在内源基因处的靶位点的任一侧上包含约500至1000(例如，600至900或700至800)个同源性碱基对。在一些实施方案中，同源臂在T细胞刺激相关基因座处的靶位点的5'、在靶位点的3’或在靶位点的5'和3'两者包含约至少或少于或约200、300、400、500、600、700、800、900或1000个同源性碱基对。

在一些实施方案中，同源臂在T细胞刺激相关基因座处的靶位点的3'包含为或约10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000或5000个同源性碱基对。在一些实施方案中，同源臂在T细胞刺激相关基因座处的转基因和/或靶位点的3'包含为或约100至500、200至400或250至350个同源性碱基对。在一些实施方案中，同源臂在T细胞刺激相关基因座的靶位点的5'包含少于约100、90、80、70、60、50、40、30、20、15或10个同源性碱基对。

在一些实施方案中，同源臂在T细胞刺激相关基因座处的靶位点的5'包含为或约10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000或5000个同源性碱基对。在一些实施方案中，同源臂在T细胞刺激相关基因座处的转基因和/或靶位点的5'包含为或约100至500、200至400或250至350个同源性碱基对。在一些实施方案中，同源臂在T细胞刺激相关基因座的靶位点的3'包含少于约100、90、80、70、60、50、40、30、20、15或10个同源性碱基对。

在一些实施方案中，5'同源臂的3'端是与转基因的5'端相邻的位置。在一些实施方案中，5'同源臂可以从转基因的5'端向5'延伸至少或至少约10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000或5000个核苷酸。

在一些实施方案中，3'同源臂的5'端是与转基因的3'端相邻的位置。在一些实施方案中，3'同源臂可以从转基因的3'端向3'延伸至少或至少约10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000或5000个核苷酸。

在一些实施方案中，对于靶向插入，同源臂(例如，5'和3'同源臂)可以各自包含侧接最远端靶位点的序列的约1000个碱基对(bp)(例如，突变任一侧上的序列的1000bp)。

示例性同源臂长度包括至少或至少约50、100、200、250、300、400、500、600、700、750、800、900、1000、2000、3000、4000或5000个核苷酸。在一些实施方案中，同源臂长度是为或约50-100、100-250、250-500、500-750、750-1000、1000-2000、2000-3000、3000-4000或4000-5000个核苷酸。示例性同源臂长度包括少于或少于约或为或为约50、100、200、250、300、400、500、600、700、750、800、900、1000、2000、3000、4000或5000个核苷酸。在一些实施方案中，同源臂长度是为或约50-100、100-250、250-500、500-750、750-1000、1000-2000、2000-3000、3000-4000或4000-5000个核苷酸。示例性同源臂长度包括从为或约100至为或约1000个核苷酸、从为或约100至为或约750个核苷酸、从为或约100至为或约600个核苷酸、从为或约100至为或约400个核苷酸、从为或约100至为或约300个核苷酸、从为或约100至为或约200个核苷酸、从为或约200至为或约1000个核苷酸、从为或约200至为或约750个核苷酸、从为或约200至为或约600个核苷酸、从为或约200至为或约400个核苷酸、从为或约200至为或约300个核苷酸、从为或约300至为或约1000个核苷酸、从为或约300至为或约750个核苷酸、从为或约300至为或约600个核苷酸、从为或约300至为或约400个核苷酸、从为或约400至为或约1000个核苷酸、从为或约400至为或约750个核苷酸、从为或约400至为或约600个核苷酸、从为或约600至为或约1000个核苷酸、从为或约600至为或约750个核苷酸或者750至为或约1000个核苷酸。

在一些任何此类实施方案中，转基因是通过引入多个T细胞中的每一个中的模板多核苷酸来整合的。在任何实施方案的一些实施方案中，所述模板多核苷酸包含结构[5'同源臂]-[转基因]-[3'同源臂]。在某些实施方案中，5'同源臂和3'同源臂包含与所述至少或至少约一个靶位点周围的核酸序列同源的核酸序列。在一些实施方案中，5'同源臂包含与靶位点5'的核酸序列同源的核酸序列。在任何实施方案的一些实施方案中，3'同源臂包含与靶位点3'的核酸序列同源的核酸序列。在某些实施方案中，5'同源臂和3'同源臂独立地是至少或至少约或至少或至少约10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸，或者少于或少于约10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸。在一些实施方案中，5'同源臂和3'同源臂独立地是为或约50与为或约100之间、100与为或约250之间、250与为或约500之间、500与为或约750之间、750与为或约1000之间、1000与为或约2000之间的核苷酸。在任何此类实施方案的一些实施方案中，5'同源臂和3'同源臂独立地具有为或约50与为或约100个核苷酸之间的长度、为或约100与为或约250个核苷酸之间的长度、为或约250与为或约500个核苷酸之间的长度、为或约500与为或约750个核苷酸之间的长度、为或约750与为或约1000个核苷酸之间的长度或者为或约1000与为或约2000个核苷酸之间的长度。

在任何实施方案的一些实施方案中，5'同源臂和3'同源臂独立地是从为或约100至为或约1000个核苷酸、从为或约100至为或约750个核苷酸、从为或约100至为或约600个核苷酸、从为或约100至为或约400个核苷酸、从为或约100至为或约300个核苷酸、从为或约100至为或约200个核苷酸、从为或约200至为或约1000个核苷酸、从为或约200至为或约750个核苷酸、从为或约200至为或约600个核苷酸、从为或约200至为或约400个核苷酸、从为或约200至为或约300个核苷酸、从为或约300至为或约1000个核苷酸、从为或约300至为或约750个核苷酸、从为或约300至为或约600个核苷酸、从为或约300至为或约400个核苷酸、从为或约400至为或约1000个核苷酸、从为或约400至为或约750个核苷酸、从为或约400至为或约600个核苷酸、从为或约600至为或约1000个核苷酸、从为或约600至为或约750个核苷酸或者从为或约750至为或约1000个核苷酸。在任何实施方案的一些实施方案中，5'同源臂和3'同源臂独立地具有从为或约100至为或约为或约1000个核苷酸、从为或约100至为或约750个核苷酸、从为或约100至为或约600个核苷酸、从为或约100至为或约400个核苷酸、从为或约100至为或约300个核苷酸、从为或约100至为或约200个核苷酸、从为或约200至为或约1000个核苷酸、从为或约200至为或约750个核苷酸、从为或约200至为或约600个核苷酸、从为或约200至为或约400个核苷酸、从为或约200至为或约300个核苷酸、从为或约300至为或约1000个核苷酸、从为或约300至为或约750个核苷酸、从为或约300至为或约600个核苷酸、从为或约300至为或约400个核苷酸、从为或约400至为或约1000个核苷酸、从为或约400至为或约750个核苷酸、从为或约400至为或约600个核苷酸、从为或约600至为或约1000个核苷酸、从为或约600至为或约750个核苷酸或者从为或约750至为或约1000个核苷酸的长度。在一些实施方案中，5'同源臂和3'同源臂独立地具有为或约200、300、400、500、600、700或800个核苷酸或任何前述值之间的任何值的长度。在一些实施方案中，5'同源臂和3'同源臂独立地具有大于或大于约300个核苷酸的长度，任选地其中5'同源臂和3'同源臂独立地具有为或约400、500或600个核苷酸或任何前述值之间的任何值的长度。在一些实施方案中，5'同源臂和3'同源臂独立地具有大于或大于约300个核苷酸的长度。

在一些实施方案中，一个或多个同源臂含有与编码T细胞刺激相关基因座的基因产物或其片段的序列同源的核苷酸序列。在一些实施方案中，一个或多个同源臂与编码重组受体或其一部分的转基因框内连接(connected或linked)。

在一些实施方案中，采用替代性HDR。在一些实施方案中，在模板多核苷酸与靶位点的5'具有延伸的同源性(即，在靶位点链的5'方向上)时，替代性HDR更有效地继续进行。因此，在一些实施方案中，模板多核苷酸具有更长同源臂和更短同源臂，其中更长同源臂可以与靶位点的5'退火。在一些实施方案中，可以与靶位点的5'退火的臂距靶位点或者转基因的5'或3'端至少25、50、75、100、125、150、175、或200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000或5000个核苷酸。在一些实施方案中，可以与靶位点的5'退火的臂比可以与靶位点的3'退火的臂长至少10％、20％、30％、40％或50％。在一些实施方案中，可以与靶位点的5'退火的臂比可以与靶位点的3'退火的臂长至少2x、3x、4x或5x。根据ssDNA模板是可以与完整链退火还是可以与靶向链退火，与靶位点的5'退火的同源臂分别可以位于ssDNA模板的5'端或ssDNA模板的3'端处。

类似地，在一些实施方案中，模板多核苷酸具有5'同源臂、转基因和3'同源臂，使得模板多核苷酸与靶位点的5'含有延伸的同源性。例如，5'同源臂和3'同源臂可以具有基本上相同的长度，但是转基因向靶位点5'的延伸可以远于向靶位点3'的延伸。在一些实施方案中，同源臂向靶位点5'端的延伸比向靶位点3'端的延伸远至少10％、20％、30％、40％、50％、2x、3x、4x或5x。

在一些实施方案中，在模板多核苷酸以靶位点为中心时，替代性HDR更有效地继续进行。因此，在一些实施方案中，模板多核苷酸具有两个尺寸基本上相同的同源臂。在一些实施方案中，模板多核苷酸的第一同源臂(例如，5'同源臂)的长度可以在模板多核苷酸的第二同源臂(例如，3'同源臂)的10％、9％、8％、7％、6％、5％、4％、3％、2％或1％内。

类似地，在一些实施方案中，模板多核苷酸具有5'同源臂、转基因和3'同源臂，使得模板多核苷酸在靶位点的任一侧上延伸基本上相同的距离。例如，同源臂可以具有不同的长度，但是可以选择转基因以对此进行补偿。例如，转基因向靶位点5'的延伸可以远于其向靶位点3'的延伸，但是靶位点5'的同源臂短于靶位点3'的同源臂以进行补偿。反过来也是可能的，例如，转基因向靶位点3'的延伸可以远于其向靶位点5'的延伸，但是靶位点3'的同源臂短于靶位点5'的同源臂以进行补偿。

在一些实施方案中，包含转基因和所述一个或多个同源臂的模板多核苷酸的长度在或在约1000至约20,000个碱基对之间，如约1000、1500、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000或20000个碱基对。在一些实施方案中，模板多核苷酸长度受可以制备、合成或组装和/或引入细胞中的多核苷酸的最大长度或病毒载体的容量以及多核苷酸或载体的类型限制。在一些方面，模板多核苷酸的有限容量可以决定转基因和/或所述一个或多个同源臂的长度。在一些方面，转基因和所述一个或多个同源臂的组合总长度必须在多核苷酸或载体的最大长度或容量内。例如，在一些方面，模板多核苷酸的转基因部分是约1000、1500、2000、2500、3000、3500或4000个碱基对，并且如果模板多核苷酸的最大长度是约5000个碱基对，则序列的剩余部分可以在所述一个或多个同源臂之间划分，例如，使得3'或5'同源臂可以是大约500、750、1000、1250、1500、1750或2000个碱基对。

3.模板多核苷酸的递送

在一些实施方案中，将多核苷酸(例如，编码重组受体或其一部分的多核苷酸，如模板多核苷酸(例如，本文第II.B.2节中所述))以核苷酸形式(例如，作为多核苷酸或载体)引入细胞中。在任何实施方案的一些实施方案中，所述多核苷酸含有编码重组受体或其一部分的转基因和一个或多个同源臂，并且可以被引入细胞中用于转基因的同源定向修复(HDR)介导的整合。

在一些方面，所提供的实施方案通过以下方式对细胞进行基因工程化：引入能够诱导基因破坏的一种或多种药剂或其组分和模板多核苷酸，以诱导HDR和转基因的靶向整合。在一些方面，将所述一种或多种药剂和模板多核苷酸同时递送。在一些方面，将所述一种或多种药剂和模板多核苷酸依序递送。在一些实施方案中，在递送多核苷酸之前递送所述一种或多种药剂。

在一些实施方案中，除了能够诱导靶向基因破坏的一种或多种药剂(例如，核酸酶和/或gRNA)以外，还将模板多核苷酸引入细胞中用于工程化。在一些实施方案中，可以在将能够诱导靶向基因破坏的一种或多种药剂的一种或多种组分引入细胞中之前、同时或之后递送一种或多种模板多核苷酸。在一些实施方案中，将一种或多种模板多核苷酸与药剂同时递送。在一些实施方案中，将所述一种或多种模板多核苷酸和所述一种或多种药剂使用物理递送方法同时递送，例如在一个反应中递送。在一些实施方案中，将所述一种或多种模板多核苷酸和所述一种或多种药剂经由电穿孔同时递送。

在一些实施方案中，在药剂之前，例如在模板多核苷酸之前数秒至数小时至数天，包括但不限于在药剂之前1至60分钟(或其间的任何时间)、在药剂之前1至24小时(或其间的任何时间)或在药剂之前超过24小时，递送模板多核苷酸。在一些实施方案中，在药剂之后，在模板多核苷酸之后数秒至数小时至数天，包括在递送药剂之后立即，例如在递送药剂之后在约30秒至4小时之间，如约30秒、1分钟、2分钟、3分钟、4分钟、5分钟、6分钟、6分钟、8分钟、9分钟、10分钟、15分钟、20分钟、30分钟、40分钟、50分钟、60分钟、90分钟、2小时、3小时或4小时，和/或优选地在递送药剂的4小时内，递送模板多核苷酸。在一些实施方案中，在递送药剂之后超过4小时递送模板多核苷酸。

在一些实施方案中，可以使用与能够诱导靶向基因破坏的一种或多种药剂(例如，核酸酶和/或gRNA)相同的递送系统来递送模板多核苷酸。在一些实施方案中，可以使用与能够诱导靶向基因破坏的一种或多种药剂(例如，核酸酶和/或gRNA)不同的递送系统来递送模板多核苷酸。在一些实施方案中，与一种或多种药剂同时递送模板多核苷酸。在其他实施方案中，在递送一种或多种药剂之前或之后的不同时间递送模板多核苷酸。可以使用本文在第II.A.3节中(例如，在表10和表11中)所述的用于递送能够诱导靶向基因破坏的一种或多种药剂(例如，核酸酶和/或gRNA)中的核酸的任何递送方法来递送模板多核苷酸。

在一些实施方案中，将所述一种或多种药剂和模板多核苷酸以相同的形式或方法递送。例如，在一些实施方案中，所述一种或多种药剂和模板多核苷酸均包含于载体例如病毒载体中。在一些实施方案中，模板多核苷酸在与Cas9和gRNA相同的载体骨架(例如，AAV基因组、质粒DNA)上编码。在一些方面，所述一种或多种药剂和模板多核苷酸呈不同的形式，例如用于Cas9-gRNA药剂的核糖核酸-蛋白质复合物(RNP)以及用于模板多核苷酸的线性DNA，但它们是使用相同的方法递送。

在一些实施方案中，模板多核苷酸是线性或环状核酸分子，如线性或环状DNA或线性RNA，并且可以使用本文在第II.A.3节(例如，本文的表10和表11)中所述的用于将核酸分子递送至细胞中的任何方法来递送。

在任何实施方案的一些实施方案中，将多核苷酸(例如，模板多核苷酸)以核苷酸形式(例如，作为非病毒载体或在非病毒载体内)引入细胞中。在一些实施方案中，非病毒载体是或包括多核苷酸，例如DNA或RNA多核苷酸，其适合于通过用于基因递送的任何合适的和/或已知的非病毒方法进行转导和/或转染，所述非病毒方法例如但不限于显微注射、电穿孔、瞬时细胞压缩或挤压(如Lee等人(2012)Nano Lett 12:6322-27所述)、脂质介导的转染、肽介导的递送(例如，细胞穿透肽)、或其组合。在一些实施方案中，通过本文所述的非病毒方法，如本文在表11中列出的非病毒方法，将非病毒多核苷酸递送至细胞中。

在一些实施方案中，模板多核苷酸序列可以包含于载体分子中，所述载体分子包含与基因组DNA中的目的区域不同源的序列。在一些实施方案中，病毒是DNA病毒(例如，dsDNA或ssDNA病毒)。在一些实施方案中，病毒是RNA病毒(例如，ssRNA病毒)。示例性病毒载体/病毒包括例如逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒、或本文其他地方所述的任何病毒。可以将多核苷酸作为载体分子的部分引入细胞中，所述载体分子具有另外的序列，如例如复制起点、启动子和编码抗生素抗性的基因。此外，模板多核苷酸可以作为裸核酸来引入，作为与诸如脂质体、纳米颗粒或泊洛沙姆的材料复合的核酸来引入，或者可以通过病毒(例如，腺病毒、AAV、疱疹病毒、逆转录病毒、慢病毒和整合酶缺陷慢病毒(IDLV))来递送。

在一些实施方案中，可以使用重组感染性病毒颗粒(如例如源自猿猴病毒40(SV40)、腺病毒、腺相关病毒(AAV)的载体)将模板多核苷酸转移至细胞中。在一些实施方案中，使用重组慢病毒载体或逆转录病毒载体(如γ-逆转录病毒载体)将模板多核苷酸转移到T细胞中(参见例如，Koste等人(2014)Gene Therapy 2014年4月3日.doi:10.1038/gt.2014.25；Carlens等人(2000)Exp Hematol 28(10):1137-46；Alonso-Camino等人(2013)Mol Ther Nucl Acids 2,e93；Park等人,Trends Biotechnol.2011年11月29日(11):550-557)或HIV-1来源的慢病毒载体。

在其他方面，通过病毒和/或非病毒基因转移方法递送模板多核苷酸。在一些实施方案中，将模板多核苷酸经由腺相关病毒(AAV)递送至细胞。模板多核苷酸可以使用与用于递送核酸酶的相同基因转移系统(包括在相同载体上)来递送，或者可以使用与用于核酸酶不同的递送系统来递送。在一些实施方案中，使用病毒载体(例如，AAV)来递送模板多核苷酸，并且以mRNA形式来递送一种或多种核酸酶。还可以在递送病毒载体(例如，携带一种或多种核酸酶和/或模板多核苷酸)之前、同时和/或之后，用抑制病毒载体与如本文所述的细胞表面受体的结合的一种或多种分子来处理细胞。

在一些实施方案中，逆转录病毒载体具有长末端重复序列(LTR)，例如源自莫洛尼鼠白血病病毒(MoMLV)、骨髓增生性肉瘤病毒(MPSV)、鼠胚胎干细胞病毒(MESV)、鼠干细胞病毒(MSCV)或脾病灶形成病毒(SFFV)的重组逆转录病毒载体。大多数逆转录病毒载体源自鼠逆转录病毒。在一些实施方案中，逆转录病毒包括源自任何禽类或哺乳动物细胞来源的那些。所述逆转录病毒通常是双嗜性的，这意味着它们能够感染包括人在内的若干种物种的宿主细胞。在一个实施方案中，待表达的基因替代逆转录病毒gag、pol和/或env序列。已经描述了许多说明性逆转录病毒系统(例如，美国专利号5,219,740、6,207,453、5,219,740；Miller和Rosman(1989)BioTechniques 7:980-990；Miller,A.D.(1990)Human GeneTherapy 1:5-14；Scarpa等人(1991)Virology 180:849-852；Burns等人(1993)Proc.Natl.Acad.Sci.USA 90:8033-8037；以及Boris-Lawrie和Temin(1993)Cur.Opin.Genet.Develop.3:102-109)。

在一些实施方案中，使用AAV载体递送模板多核苷酸，并且以不同的形式(如以编码核酸酶和/或gRNA的mRNA)递送能够诱导靶向基因破坏的一种或多种药剂(如核酸酶和/或gRNA)。在一些实施方案中，使用相同类型的方法(如病毒载体)但是在分开的载体上递送模板多核苷酸和核酸酶。在一些实施方案中，在与能够诱导基因破坏的药剂(如核酸酶和/或gRNA)不同的递送系统中递送模板多核苷酸。用于递送的核酸和载体的类型包括本文在第II.B或III节中所述的那些类型中的任一种。

在一些实施方案中，模板多核苷酸和核酸酶可以位于相同的载体(例如，AAV载体(如AAV6))上。在一些实施方案中，使用AAV载体递送模板多核苷酸，并且以不同的形式(如以编码核酸酶和/或gRNA的mRNA)递送能够诱导靶向基因破坏的一种或多种药剂(如核酸酶和/或gRNA)。在一些实施方案中，使用相同类型的方法(如病毒载体)但是在分开的载体上递送模板多核苷酸和核酸酶。在一些实施方案中，在与能够诱导基因破坏的药剂(如核酸酶和/或gRNA)不同的递送系统中递送模板多核苷酸。在一些实施方案中，模板多核苷酸在体内被从载体骨架中切除，如它侧接有gRNA识别序列。在一些实施方案中，模板多核苷酸在与Cas9和gRNA分开的多核苷酸分子上。在一些实施方案中，将Cas9和gRNA以核糖核蛋白(RNP)复合物的形式引入，并且将模板多核苷酸作为如在载体或线性核酸分子(如线性DNA)中的多核苷酸分子引入。用于递送的核酸和载体的类型包括本文在第II.B或III节中所述的那些类型中的任一种。

在一些实施方案中，模板多核苷酸包含在腺病毒载体，例如AAV载体中，例如具有允许将其包装于AAV衣壳中的长度和序列的ssDNA分子。载体可以为例如小于5kb，并且可以含有促进包装至衣壳中的ITR序列。载体可以是整合缺陷的。在一些实施方案中，模板多核苷酸在转基因和/或靶位点的任一侧上包含约150至1000个同源性核苷酸。在一些实施方案中，模板多核苷酸在靶位点或转基因的5'、在靶位点或转基因的3'、或同时在靶位点或转基因的5'和3'包含约100、150、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸。在一些实施方案中，模板多核苷酸在靶位点或转基因的5'、在靶位点或转基因的3'、或同时在靶位点或转基因的5'和3'包含至少100、150、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸。在一些实施方案中，模板多核苷酸在靶位点或转基因的5'、在靶位点或转基因的3'、或同时在靶位点或转基因的5'和3'包含至多100、150、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸。

在一些实施方案中，模板多核苷酸是慢病毒载体，例如，IDLV(整合缺陷性慢病毒)。在一些实施方案中，模板多核苷酸在转基因和/或靶位点的任一侧上包含约500至1000个同源性碱基对。在一些实施方案中，模板多核苷酸在靶位点或转基因的5'、在靶位点或转基因的3'、或同时在靶位点或转基因的5'和3'包含约300、400、500、600、700、800、900、1000、1500或2000个同源性碱基对。在一些实施方案中，模板多核苷酸在靶位点或转基因的5'、在靶位点或转基因的3'、或同时在靶位点或转基因的5'和3'包含至少300、400、500、600、700、800、900、1000、1500或2000个同源性碱基对。在一些实施方案中，模板多核苷酸在靶位点或转基因的5'、在靶位点或转基因的3'、或同时在靶位点或转基因的5'和3'包含不超过300、400、500、600、700、800、900、1000、1500或2000个同源性碱基对。在一些实施方案中，模板多核苷酸包含防止Cas9识别并切割模板多核苷酸的一个或多个突变(例如，沉默突变)。相对于要改变的细胞的基因组中的相应序列，模板多核苷酸可以包含例如至少1、2、3、4、5、10、20或30个沉默突变。在一些实施方案中，相对于要改变的细胞的基因组中的相应序列，模板多核苷酸包含至多2、3、4、5、10、20、30或50个沉默突变。在一些实施方案中，cDNA包含防止Cas9识别并切割模板多核苷酸的一个或多个突变(例如，沉默突变)。相对于要改变的细胞的基因组中的相应序列，模板多核苷酸可以包含例如至少1、2、3、4、5、10、20或30个沉默突变。在一些实施方案中，相对于要改变的细胞的基因组中的相应序列，模板多核苷酸包含至多2、3、4、5、10、20、30或50个沉默突变。

本文所述的双链模板多核苷酸可以包括一个或多个非天然碱基和/或骨架。特别地，具有甲基化胞嘧啶的模板多核苷酸的插入可以使用本文所述的方法来进行，以在目的区域中实现转录静止的状态。

III.核酸、载体和递送

在一些实施方案中，将所述多核苷酸(如包含编码重组受体或其一部分的转基因的模板多核苷酸)以核苷酸形式(如多核苷酸或载体)引入细胞中。在任何实施方案的一些实施方案中，多核苷酸含有编码重组受体或其部分的转基因。在某些实施方案中，将用于基因破坏的所述一种或多种药剂或其组分以核酸形式(如多核苷酸和/或载体)引入细胞中。在一些实施方案中，可以使用各种递送方法以各种形式递送用于工程化的组分，所述各种递送方法包括如本文在第II.B.3节以及表10和表11中所述的用于递送一种或多种药剂的任何合适的方法。还提供了编码能够诱导基因破坏的一种或多种药剂的一种或多种组分的一种或多种多核苷酸(如核酸分子)和/或一种或多种含有转基因的模板多核苷酸(例如，本文第II.B.2节中描述的任一种)，以及用于将细胞进行基因工程化以靶向整合转基因(如模板多核苷酸或编码能够诱导基因破坏的一种或多种药剂的一种或多种组分的多核苷酸)的载体。

在一些实施方案中，提供了多核苷酸，如用于将转基因靶向于特定基因组靶位置处(如T细胞刺激相关基因座处)的模板多核苷酸。在一些实施方案中，提供了本文在第II.B.2节中所述的任何模板多核苷酸。在一些实施方案中，模板多核苷酸含有包括编码重组受体或其部分或其他多肽和/或因子的核酸序列的转基因，以及用于靶向整合的同源臂。在一些实施方案中，模板多核苷酸可以含于载体中。

在一些实施方案中，能够诱导基因破坏的药剂可以编码于一种或多种多核苷酸中。在一些实施方案中，药剂的组分(如Cas9分子和/或gRNA分子)可以编码于一种或多种多核苷酸中，并被引入细胞中。在一些实施方案中，编码药剂的一种或多种组分的多核苷酸可以被包括在载体中。

在一些实施方案中，载体可以包含编码Cas9分子和/或gRNA分子的序列和/或模板多核苷酸。载体还可以包含与如Cas9分子序列融合的编码信号肽的序列(如用于核定位、核仁定位、线粒体定位)。例如，载体可以包含与编码Cas9分子的序列融合的核定位序列(如来自SV40)。

在任何实施方案的一些实施方案中，一个或多个调节/控制元件(如启动子、增强子、内含子、多腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、2A序列和剪接受体或供体)可以被包括在载体中。在一些实施方案中，所述启动子选自RNA pol I、pol II或pol III启动子。在一些实施方案中，所述启动子由RNA聚合酶II识别(如CMV、SV40早期区域或腺病毒主要晚期启动子)。在另一个实施方案中，所述启动子由RNA聚合酶III识别(如U6或H1启动子)。

在某些实施方案中，所述启动子是受调控的启动子(如诱导型启动子)。在一些实施方案中，所述启动子是诱导型启动子或阻抑型启动子。在一些实施方案中，所述启动子包含Lac操纵子序列、四环素操纵子序列、半乳糖操纵子序列或多西环素操纵子序列，或者是其类似物或能够由Lac阻遏因子或四环素阻遏因子或其类似物结合或识别。

在一些实施方案中，所述启动子是或包含组成型启动子。示例性组成型启动子包括例如猿病毒40早期启动子(SV40)、巨细胞病毒立即早期启动子(CMV)、人泛素C启动子(UBC)、人延伸因子1α启动子(EF1α)、小鼠磷酸甘油酸激酶1启动子(PGK)、和与CMV早期增强子偶联的鸡β-肌动蛋白启动子(CAGG)。在一些实施方案中，所述组成型启动子是合成或经修饰的启动子。在一些实施方案中，所述启动子是或包含MND启动子，它是一种含有具有骨髓增生性肉瘤病毒增强子的经修饰的MoMuLV LTR的U3区的合成启动子(参见Challita等人(1995)J.Virol.69(2):748-755)。在一些实施方案中，所述启动子是组织特异性启动子。在另一个实施方案中，所述启动子是病毒启动子。在另一个实施方案中，所述启动子是非病毒启动子。在一些实施方案中，示例性启动子可以包括但不限于人延伸因子1α(EF1α)启动子或其修饰形式(例如，具有HTLV1增强子的EF1α启动子)或MND启动子。在一些实施方案中，多核苷酸和/或载体不包括调节元件，例如启动子。

在任何实施方案的一些实施方案中，将多核苷酸(例如，编码重组受体或其部分的多核苷酸)以核苷酸形式(例如，作为非病毒载体或在非病毒载体内)引入细胞中。在一些实施方案中，多核苷酸是DNA或RNA多核苷酸。在一些实施方案中，多核苷酸是双链或单链多核苷酸。在一些实施方案中，非病毒载体是或包括多核苷酸，例如DNA或RNA多核苷酸，其适合于通过用于基因递送的任何合适的和/或已知的非病毒方法进行转导和/或转染，所述非病毒方法例如但不限于显微注射、电穿孔、瞬时细胞压缩或挤压(如Lee等人(2012)Nano Lett12:6322-27所述)、脂质介导的转染、肽介导的递送或其组合。在一些实施方案中，通过本文所述的非病毒方法，如在表11中列出的非病毒方法，将非病毒多核苷酸递送至细胞中。

在一些实施方案中，载体或递送媒介物是病毒载体(例如，用于产生重组病毒)。在一些实施方案中，病毒是DNA病毒(例如，dsDNA或ssDNA病毒)。在一些实施方案中，病毒是RNA病毒(例如，ssRNA病毒)。示例性病毒载体/病毒包括例如逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒、或本文其他地方所述的任何病毒。

在一些实施方案中，病毒感染分裂细胞。在另一个实施方案中，病毒感染非分裂细胞。在另一个实施方案中，病毒感染分裂和非分裂两种细胞。在另一个实施方案中，病毒可以整合至宿主基因组中。在另一个实施方案中，病毒被工程化以具有降低的免疫性，例如在人体内。在另一个实施方案中，病毒有复制能力。在另一个实施方案中，病毒是复制缺陷型的，例如另外几轮病毒体复制和/或包装所需的基因的一个或多个编码区被其他基因替代或缺失。在另一个实施方案中，出于短暂诱导基因破坏的目的，病毒引起Cas9分子和/或gRNA分子的短暂表达。在另一个实施方案中，病毒引起Cas9分子和/或gRNA分子的长期(例如，至少1周、2周、1个月、2个月、3个月、6个月、9个月、1年、2年)或永久表达。病毒的包装容量可以例如从至少约4kb到至少约30kb变化，例如至少约5kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb或50kb。

在一些实施方案中，通过重组逆转录病毒来递送含有一种或多种药剂的多核苷酸和/或模板多核苷酸。在另一个实施方案中，逆转录病毒(例如，莫洛尼鼠白血病病毒)包含例如允许整合至宿主基因组中的逆转录酶。在一些实施方案中，逆转录病毒有复制能力。在另一个实施方案中，逆转录病毒是复制缺陷型的，例如另外几轮病毒体复制和包装所必需的基因的一个或多个编码区被其他基因替代或缺失。

在一些实施方案中，通过重组慢病毒来递送含有一种或多种药剂的多核苷酸和/或模板多核苷酸。例如，慢病毒是复制缺陷型的，例如不包含病毒复制所需的一个或多个基因。

在一些实施方案中，通过重组腺病毒来递送含有一种或多种药剂的多核苷酸和/或模板多核苷酸。在另一个实施方案中，腺病毒被工程化以在人体内具有降低的免疫性。

在一些实施方案中，通过重组AAV来递送含有一种或多种药剂的多核苷酸和/或模板多核苷酸。在一些实施方案中，AAV可以将其基因组掺入宿主细胞(例如，如本文所述的靶细胞)的基因组中。在另一个实施方案中，AAV是自身互补的腺相关病毒(scAAV)，例如包装一起退火以形成双链DNA的两条链的scAAV。可以用于所公开的方法中的AAV血清型包括AAV1、AAV2、修饰的AAV2(例如，在Y444F、Y500F、Y730F和/或S662V处的修饰)、AAV3、修饰的AAV3(例如，在Y705F、Y731F和/或T492V处的修饰)、AAV4、AAV5、AAV6、修饰的AAV6(例如，在S663V和/或T492V处的修饰)、AAV7、AAV8、AAV 8.2、AAV9、AAV.rh10、修饰的AAV.rh10、AAV.rh32/33、修饰的AAV.rh32/33、AAV.rh43、修饰的AAV.rh43、AAV.rh64R1、修饰的AAV.rh64R1，并且假型化AAV(如AAV2/8、AAV2/5和AAV2/6)也可以用于所公开的方法中。

在一些实施方案中，通过杂合病毒(例如，本文所述一种或多种病毒的杂合体)来递送含有一种或多种药剂的多核苷酸和/或模板多核苷酸。

包装细胞用于形成能够感染靶细胞的病毒颗粒。这种细胞包括可以包装腺病毒的293细胞和可以包装逆转录病毒的ψ2细胞或PA317细胞。用于基因疗法中的病毒载体通常由将核酸载体包装到病毒颗粒中的生产细胞系产生。载体通常含有包装和随后整合至宿主或靶细胞中(如果适用)所需的最小病毒序列，并且其他病毒序列被编码要表达的蛋白质(例如，Cas9)的表达盒替代。例如，用于基因疗法中的AAV载体通常仅具有来自AAV基因组的反向末端重复(ITR)序列，所述序列为在宿主或靶细胞中进行包装和基因表达所需。失去的病毒功能由包装细胞系反式提供。此后，将病毒DNA包装在细胞系中，所述细胞系含有编码其他AAV基因(即，rep和cap)但缺乏ITR序列的辅助质粒。细胞系还被作为辅助者的腺病毒感染。辅助病毒促进AAV载体的复制和来自辅助质粒的AAV基因的表达。由于缺少ITR序列，辅助质粒并未被大量包装。腺病毒的污染可以通过例如热处理来减少，腺病毒对热处理比AAV更敏感。

在一些实施方案中，病毒载体具有细胞类型识别的能力。例如，病毒载体可以用不同的/替代的病毒包膜糖蛋白假型化；用细胞类型特异性受体工程化(例如，病毒包膜糖蛋白的基因修饰以掺入靶向配体，如肽配体、单链抗体、生长因子)；和/或工程化以具有分子桥，所述分子桥具有双重特异性，其一端识别病毒糖蛋白，并且另一端识别靶细胞表面的部分(例如，配体-受体、单克隆抗体、亲和素-生物素和化学缀合)。

在一些实施方案中，病毒载体实现细胞类型特异性表达。例如，可以构建组织特异性启动子以将转基因(Cas9和gRNA)的表达仅限于特定靶细胞中。载体的特异性也可以通过转基因表达的微小RNA依赖性控制来介导。在一些实施方案中，病毒载体具有增加的融合病毒载体与靶细胞膜的效率。例如，可以掺入融合蛋白(如有融合能力的血凝素(HA))，以增加病毒摄取到细胞中。在一些实施方案中，病毒载体具有核定位能力。例如，可以改变需要核膜分解(在细胞分裂期间)并因此不感染非分裂细胞的病毒，以在病毒的基质蛋白中掺入核定位肽，从而使得能够转导非增殖细胞。

IV.工程化细胞

本文提供了包含经修饰的T细胞刺激相关基因座的基因工程化细胞，所述经修饰的T细胞刺激相关基因座包含编码重组受体(如嵌合抗原受体(CAR)或其一部分或者重组T细胞受体(TCR)或其一部分或链)的核酸序列(例如，转基因)。在一些方面，所述基因工程化细胞中的经修饰的T细胞刺激相关基因座包含整合到所述内源T细胞刺激相关基因座中的编码重组受体或其部分的外源核酸序列(例如，转基因)。在一些方面，所提供的工程化细胞是使用本文所述的方法来产生，例如，所述方法涉及通过采用用于诱导基因破坏的一种或多种药剂和含有用于修复的转基因的模板多核苷酸进行同源依赖性修复(HDR)。在一些方面，可以靶向所提供的多核苷酸(如章节II.B.2中所述的任何模板多核苷酸)的部分(例如，连续区段)用于整合于内源T细胞刺激相关基因座处，以生成含有包含编码重组受体或其一部分的核酸序列的经修饰的T细胞刺激相关基因座的细胞。在一些实施方案中，通过HDR整合至内源T细胞刺激相关基因座中的模板多核苷酸的部分包括模板多核苷酸的转基因部分，如本文例如在第II.B.2节中所述的任一种。

在一些方面，将细胞工程化以表达重组受体，如CAR或重组T细胞受体(TCR)。在一些方面，重组受体由工程化细胞中经修饰的T细胞刺激相关基因座处存在的核酸序列编码。在一些方面，所述细胞是通过经由HDR整合编码重组受体的全部或一部分的转基因而产生的。在一些实施方案中，重组受体含有结合至或识别配体或抗原(例如，与疾病或障碍相关的抗原)的结合结构域。

在一些方面，工程化细胞是免疫细胞，如T细胞。在一些实施方案中，所述工程化细胞是T细胞。在一些实施方案中，所述工程化细胞是人T细胞。在任何实施方案的一些实施方案中，所述T细胞是源自受试者的T细胞。在任何实施方案的一些实施方案中，所述受试者是人。在一些实施方案中，所述细胞是原代T细胞。在任何实施方案的一些实施方案中，所述工程化细胞是原代人T细胞。在一些方面，将免疫细胞工程化以表达重组受体，例如嵌合抗原受体或经修饰的重组受体，如本文所述的任一种。

在一些实施方案中，本文提供的方法、组合物、制品和/或试剂盒可用于生成、制造或产生具有或含有经修饰的T细胞刺激相关基因座的基因工程化的细胞，例如基因工程化的免疫细胞和/或T细胞。在任何实施方案的一些实施方案中，本文所提供的方法导致具有或含有经修饰的T细胞刺激相关基因座的基因工程化细胞。在一些实施方案中，经修饰的基因座是或含有整合于内源T细胞刺激相关基因座基因的开放阅读框中的转基因，例如第II.B.2节中所述的转基因。在某些实施方案中，将转基因在框内插入到内源T细胞刺激相关基因座基因的开放阅读框中，导致经修饰的T细胞刺激相关基因座，其编码由内源T细胞刺激相关基因座编码的基因产物的全部或一部分。在一些实施方案中，所述重组受体是嵌合抗原受体(CAR)。在一些方面，所述重组受体是重组T细胞受体(TCR)。在一些方面，所述经修饰的T细胞刺激相关基因座包含编码整个重组受体或全长重组受体(如包含两条链的重组TCR的全长CAR或两条链)的转基因。在一些方面，所述经修饰的T细胞刺激相关基因座包含编码所述重组受体的一部分(例如，多链CAR的一条链或包含两条链的重组TCR的一条链，或所述重组受体的结构域或区域)的转基因；并且所述工程化细胞包含存在于所述工程化细胞的基因组中的不同位置处的编码所述重组受体的其余部分(例如，多链CAR的另一条链或所述重组TCR的另一条链)的第二转基因。

在一些情况下，将细胞工程化以表达一种或多种另外的分子，例如另外的因子和/或辅助分子，如本文所述的任何另外的分子(包括治疗性分子)。在一些实施方案中，另外的分子可以包括标记物、另外的重组受体多肽链、抗体或其抗原结合片段、免疫调节分子、配体、细胞因子或趋化因子。在一些实施方案中，另外的因子是可溶性分子。在一些实施方案中，另外的因子是膜结合分子。在一些方面，另外的因子可以用于克服或抵消免疫抑制性环境如肿瘤微环境(TME)的影响。在一些方面，示例性另外的分子包括细胞因子、细胞因子受体、嵌合共刺激受体、共刺激配体和T细胞功能或活性的其他调节剂。在一些实施方案中，工程化细胞表达的另外的分子包括IL-7、IL-12、IL-15、CD40配体(CD40L)和4-1BB配体(4-1BBL)。在一些方面，另外的分子是结合不同分子的另外的受体，例如，膜结合受体。例如，在一些实施方案中，另外的分子是细胞因子受体或趋化因子受体，例如，IL-4受体或CCL2受体。在一些情况下，工程化细胞被称为“装甲CAR”或针对通用细胞因子杀伤重定向的T细胞(TRUCK)。

还提供了含有多种工程化细胞的组合物。在一些方面，与使用其他工程化方法(如重组受体被随机引入细胞的基因组中的方法)产生的细胞或细胞组合物相比，含有工程化细胞的组合物展现改善的、均匀的、同质的和/或稳定的重组受体的表达和/或抗原结合。在一些实施方案中，工程化细胞或包含工程化细胞的组合物可以用于疗法(例如，过继细胞疗法)中。在一些实施方案中，所提供的细胞或细胞组合物可以用于本文所述的任何治疗方法中或用于本文所述的治疗性用途。

A.经修饰的基因座

在一些方面，提供了包含经修饰的T细胞刺激相关基因座的基因工程化细胞(如经修饰的T细胞)。在一些实施方案中，经修饰的T细胞刺激相关基因座包含编码重组受体或其部分的核酸序列。在一些实施方案中，所述核酸序列包含编码重组受体或其一部分的转基因，所述转基因已被任选地经由同源定向修复(HDR)整合在内源T细胞刺激相关基因座处。在一些方面，经修饰的T细胞刺激相关基因座可以编码本文例如在第IV.B节中所述的任何一种或多种重组受体或其部分，如其结构域或区域，或本文所述的多链重组受体的一条或多条链。

在一些实施方案中，提供了含有经修饰的PDCD1基因座的工程化细胞，所述经修饰的PDCD1基因座包含与PDCD1基因座的内源转录调节元件可操作地连接的编码重组受体或其一部分(如嵌合抗原受体(CAR)或重组T细胞受体(TCR))的转基因，其中所述内源转录调节元件PDCD1在T细胞中的刺激或激活信号之后诱导或上调(如瞬时诱导或上调)可操作地连接的转基因的表达。

在一些实施方案中，提供了含有经修饰的CD69基因座的工程化细胞，所述经修饰的CD69基因座包含与CD69基因座的内源转录调节元件可操作地连接的编码重组受体或其一部分(如CAR或TCR)的转基因，其中所述内源转录调节元件CD69在T细胞中的刺激或激活信号之后诱导或上调(如瞬时诱导或上调)可操作地连接的转基因的表达。

在一些实施方案中，提供了含有经修饰的Nur77基因座的工程化细胞，所述经修饰的Nur77基因座包含与Nur77(编码NR4A1)基因座的内源转录调节元件可操作地连接的编码重组受体或其一部分(如CAR或TCR)的转基因，其中所述内源转录调节元件Nur77(编码NR4A1)在T细胞中的刺激或激活信号之后诱导或上调(如瞬时诱导或上调)可操作地连接的转基因的表达。

在一些实施方案中，提供了含有经修饰的FoxP3基因座的工程化细胞，所述经修饰的FoxP3基因座包含与FoxP3基因座的内源转录调节元件可操作地连接的编码重组受体或其一部分(如CAR或TCR)的转基因，其中所述内源转录调节元件FoxP3在T细胞中的刺激或激活信号之后诱导或上调(如瞬时诱导或上调)可操作地连接的转基因的表达。

在一些实施方案中，提供了含有经修饰的HLA-DR基因座的工程化细胞，所述经修饰的HLA-DR基因座包含与HLA-DR基因座的内源转录调节元件可操作地连接的编码重组受体或其一部分(如CAR或TCR)的转基因，其中所述内源转录调节元件HLA-DR在T细胞中的刺激或激活信号之后诱导或上调(如瞬时诱导或上调)可操作地连接的转基因的表达。

在一些方面，经修饰的T细胞刺激相关基因座是由于基因破坏和转基因(例如，外源或异源核酸序列)的整合(如经由HDR方法)而产生的，所述转基因序列包括编码重组受体或其部分的核苷酸序列。在一些方面，在经修饰的T细胞刺激相关基因座处存在的核酸序列包括一个或多个转基因(如外源序列)，其被整合于通常将包含编码T细胞刺激相关基因座的全长基因产物的开放阅读框的内源T细胞刺激相关基因座中的某一区域处。在一些方面，在通过HDR靶向整合转基因后，细胞的基因组含有经修饰的T细胞刺激相关基因座，其包含编码重组受体或其部分的核酸序列。

在一些实施方案中，在整合编码重组受体或其一部分的转基因之后，除了由经修饰的T细胞刺激相关基因座表达的重组受体之外，T细胞刺激相关基因座的内源基因产物也被完全表达。在一些实施方案中，在整合编码重组受体或其一部分的转基因之后，T细胞刺激相关基因座的内源基因产物的全部或一部分不表达。在一些实施方案中，所述经修饰的T细胞刺激相关基因座编码所述T细胞刺激相关基因座的全长内源基因产物的一部分，例如，所述内源基因产物含有缺失。在一些实施方案中，所述经修饰的T细胞刺激相关基因座不编码所述T细胞刺激相关基因座的内源基因产物，即所述内源基因产物被敲除。在一些实施方案中，在靶向整合后，所述经修饰的T细胞刺激相关基因座含有整合到内源T细胞刺激相关基因座的开放阅读框内的位点中的转基因，使得重组受体由工程化细胞表达，并且在一些情况下，工程化细胞还表达T细胞刺激相关基因座的基因产物的一部分(例如T细胞刺激相关基因座的部分或截短的基因产物)。

在一些方面，所述T细胞刺激相关基因座是PDCD1，并且所述基因座的内源基因产物PD-1不表达或不具有功能。在一些方面，所述T细胞刺激相关基因座是PDCD1，并且所述基因座的内源基因产物PD-1以全长表达或具有功能。在一些方面，PD1多肽和重组受体或其一部分在包含经修饰的T细胞刺激相关基因座PDCD1的细胞中共表达。

在一些方面，所述T细胞刺激相关基因座是CD69，并且所述基因座的内源基因产物CD69不表达或不具有功能。在一些方面，所述T细胞刺激相关基因座是CD69，并且所述基因座的内源基因产物CD69以全长表达或具有功能。在一些方面，CD69多肽和重组受体或其一部分在包含经修饰的T细胞刺激相关基因座CD69的细胞中共表达。

在一些方面，所述T细胞刺激相关基因座是Nur77，并且所述基因座的内源基因产物NR4A1不表达或不具有功能。在一些方面，所述T细胞刺激相关基因座是Nur77，并且所述基因座的内源基因产物NR4A1以全长表达或具有功能。在一些方面，Nur77多肽和重组受体或其一部分在包含经修饰的T细胞刺激相关基因座Nur77的细胞中共表达。

在一些方面，所述T细胞刺激相关基因座是FoxP3，并且所述基因座的内源基因产物FoxP3不表达或不具有功能。在一些方面，所述T细胞刺激相关基因座是FoxP3，并且所述基因座的内源基因产物FoxP3以全长表达或具有功能。在一些方面，FoxP3多肽和重组受体或其一部分在包含经修饰的T细胞刺激相关基因座FoxP3的细胞中共表达。

在一些方面，所述T细胞刺激相关基因座是HLA-DRA，并且所述基因座的内源基因产物HLA-DRA不表达或不具有功能。在一些方面，所述T细胞刺激相关基因座是HLA-DRA，并且所述基因座的内源基因产物HLA-DRA以全长表达或具有功能。在一些方面，HLA-DRA多肽和重组受体或其一部分在包含经修饰的T细胞刺激相关基因座HLA-DRA的细胞中共表达。

在一些方面，所述T细胞刺激相关基因座是HLA-DRB1，并且所述基因座的内源基因产物HLA-DRB1不表达或不具有功能。在一些方面，所述T细胞刺激相关基因座是HLA-DRB1，并且所述基因座的内源基因产物HLA-DRB1以全长表达或具有功能。在一些方面，HLA-DRB1多肽和重组受体或其一部分在包含经修饰的T细胞刺激相关基因座HLA-DRB1的细胞中共表达。

在一些实施方案中，在整合转基因后，T细胞刺激相关基因座的内源序列包含基因破坏，如编码一个或多个氨基酸的核酸序列的缺失和/或引入终止密码子的突变。在一些实施方案中，在整合转基因后，T细胞刺激相关基因座的内源序列不编码T细胞刺激相关基因座多肽的功能性基因产物。在一些实施方案中，在整合转基因后，T细胞刺激相关基因座的内源序列编码T细胞刺激相关基因座多肽的部分基因产物或T细胞刺激相关基因座多肽的截短的基因产物。

在某些实施方案中，转基因编码重组受体，并且被框内插入于编码T细胞刺激相关基因座的内源开放阅读框内。在特定实施方案中，经修饰的基因座的转录产生编码重组受体(如CAR)的mRNA。在一些方面，存在于内源T细胞刺激相关基因座的开放阅读框中的核酸序列可以编码T细胞刺激相关基因座多肽的部分或截短的基因产物，如T细胞刺激相关基因座的显性阴性形式的基因产物。在一些实施方案中，转基因被整合于紧接内源T细胞刺激相关基因座的开放阅读框的一个或多个外显子的下游并与其同框的靶位点处。在一些实施方案中，转基因被整合或插入在内源T细胞刺激相关基因座(如本文在表1-表9中所述)的开放阅读框的外显子1、2、3或4的下游且在其外显子6、7或8的上游。在一些实施方案中，转基因被整合或插入在内源T细胞刺激相关基因座(如本文在表1-表9中所述)的开放阅读框的外显子1、2、3或4的下游且在其外显子6的上游。在一些实施方案中，转基因在内源T细胞刺激相关基因座的开放阅读框的外显子1的下游且在其外显子8的上游。在一些实施方案中，转基因在内源T细胞刺激相关基因座的开放阅读框的外显子3的下游且在其外显子5的上游。在一些实施方案中，转基因在内源T细胞刺激相关基因座的开放阅读框的外显子4的下游且在其外显子6的上游。

在一些实施方案中，从经修饰的T细胞刺激相关基因座转录的mRNA含有如下3'UTR，其由内源T细胞刺激相关基因座编码和/或与从内源T细胞刺激相关基因座转录的mRNA的3'UTR相同。在一些实施方案中，转基因含有在编码CAR的所述部分的核酸序列的上游(例如，紧接上游)的核糖体跳跃元件。在一些实施方案中，编码CAR的mRNA含有如下5'UTR，其由内源T细胞刺激相关基因座编码和/或与从内源T细胞刺激相关基因座转录的mRNA的5'UTR相同。

在一些实施方案中，由经修饰的T细胞刺激相关基因座编码的重组受体是CAR。在一些实施方案中，由经修饰的T细胞刺激相关基因座编码的CAR结合至和/或能够结合至靶抗原。在一些实施方案中，靶抗原与和疾病、障碍或病症相关的细胞或组织相关、为所述细胞或组织所特有和/或在所述细胞或组织上表达。在一些实施方案中，CAR能够如经由CD3-zeta(CD3ζ)链或其功能性变体或信号传导部分的细胞内信号传导结构域或区域刺激和/或诱导T细胞、T细胞受体(TCR)组分的信号传导结构域和/或包含免疫受体酪氨酸激活基序(ITAM)的信号传导结构域中的初级激活信号。

在一些实施方案中，由经修饰的T细胞刺激相关基因座编码的重组受体是重组TCR。在一些方面，重组TCR包含两条多肽链，例如TCR alpha(TCRα)和TCR beta(TCRβ)链；或TCR gamma(TCRγ)和TCR delta(TCRδ)链。在一些方面，所述经修饰的T细胞刺激相关基因座编码重组TCR的一条或多条链。在一些实施方案中，所述经修饰的T细胞刺激相关基因座编码TCRα。在一些实施方案中，所述经修饰的T细胞刺激相关基因座编码TCRβ。在一些方面，如果所述经修饰的T细胞刺激相关基因座仅编码所述重组TCR的一条链，则所述TCR的另一条链可以由存在于所述工程化细胞中的第二转基因(例如，在不同基因组位置处)编码。在一些实施方案中，经修饰的T细胞刺激相关基因座编码任选地由多顺反子元件(如2A元件)隔开的TCRα和TCRβ。

B.所编码的重组受体

在一些实施方案中，由本文所提供的工程化细胞或根据本文所提供的方法产生的工程化细胞编码的重组受体包括嵌合抗原受体(CAR)或其部分或者重组T细胞受体(TCR)或其部分。重组受体包括嵌合受体、抗原受体和含有嵌合受体或抗原受体的一种或多种组分的受体。重组受体可以包括含有配体结合结构域或其结合片段和细胞内信号传导结构域或区域的那些。在一些实施方案中，由工程化细胞编码的重组受体包括功能性非TCR抗原受体、嵌合抗原受体(CAR)、嵌合自身抗体受体(CAAR)、重组T细胞受体(TCR)以及前述任一种的一个或多个区域、一条或多条链、一个或多个结构域或一种或多种组分。在一些方面，重组受体或其部分由本文提供的多核苷酸(如上文在第II.B.2节中所述的任何模板多核苷酸)中存在的转基因编码。在一些方面，多核苷酸中所含有的编码重组受体或其部分的转基因被整合于工程化细胞的内源T细胞刺激相关基因座处，以导致编码重组受体或其部分的经修饰的T细胞刺激相关基因座，所述重组受体或其部分如本文所述的任何重组受体，包括多链重组受体的一条或多条多肽链。

在一些实施方案中，由工程化细胞表达的示例性重组受体包括含有两种或更多种受体多肽的多链受体，所述两种或更多种受体多肽在一些情况下含有不同的组分、结构域或区域。在一些方面，重组受体含有两种或更多种多肽，所述两种或更多种多肽共同构成功能性重组受体。在一些方面，多链受体是双链受体，其包含共同构成功能性重组受体的两种多肽。在一些实施方案中，重组受体是包含两种不同受体多肽(例如，TCR alpha(TCRα)和TCR beta(TCRβ)链；或TCR gamma(TCRγ)和TCR delta(TCRδ)链)的TCR。在一些实施方案中，所述重组受体是包含两种或更多种不同受体多肽的CAR，如多链CAR。在一些实施方案中，重组受体是多链受体，其中所述多肽中的一种或多种调控、修饰或控制另一种受体多肽的表达、活性或功能。在一些方面，多链受体允许对受体的特异性、活性、抗原(或配体)结合、功能和/或表达进行空间或时间调控或控制。在一些方面，整个重组受体(如多链重组受体的所有链)可以由存在于经修饰的T细胞刺激相关基因座中的转基因编码。在一些方面，多链重组受体的一条链可以由存在于所述T细胞刺激相关基因座中的转基因编码，并且其他一条或多条链由存在于基因组中不同位置的第二转基因(例如，不同的T细胞刺激相关基因座或不同的位置)编码。

在一些实施方案中，在本文提供的基因工程化细胞中编码的重组受体含有跨膜结构域或膜缔合结构域。在一些方面，重组受体还含有胞外区域。在一些方面，重组受体还含有细胞内区域。在一些实施方案中，在本文提供的基因工程化细胞中编码的重组受体含有各种区域或结构域，如胞外区域(例如，含有一个或多个胞外结合结构域和/或间隔子)、跨膜结构域和细胞内区域(例如，含有细胞内信号传导区域和/或一个或多个共刺激信号传导结构域)中的一个或多个。在一些方面，所编码的重组受体还含有其他结构域(如多聚化结构域)、接头和/或调节元件。

在一些实施方案中，示例性的所编码的重组受体按其N末端至C末端顺序包含：跨膜结构域(或膜缔合结构域)和细胞内区域。在一些实施方案中，示例性的所编码的重组受体按其N末端至C末端顺序包含：胞外区域、跨膜结构域和细胞内区域。在一些实施方案中，胞外区域是或包含胞外结合结构域，并且在一些方面，所编码的重组受体从其N至C末端按顺序包含：胞外结合结构域、跨膜结构域和细胞内区域。在一些情况下，间隔子将胞外区域(例如，胞外结合结构域)和跨膜结构域隔开或者定位于它们之间。在一些实施方案中，所编码的重组受体从其N至C末端按顺序包含：胞外结合结构域、间隔子、跨膜结构域和细胞内区域。在一些实施方案中，存在于重组受体中的细胞内信号传导区域含有免疫受体酪氨酸激活基序(ITAM)和/或一个或多个共刺激信号传导结构域，如一个、两个或三个共刺激信号传导结构域。

在一些实施方案中，重组受体含有多聚化结构域，其在一些方面能够影响所述重组受体的多链多肽的形成。在一些实施方案中，示例性的所编码的重组受体按其N末端至C末端顺序包含：跨膜结构域(或膜缔合结构域)、细胞内多聚化结构域、任选的一个或多个共刺激信号传导结构域、和细胞内信号传导区域。在一些实施方案中，示例性重组受体多肽按其N末端至C末端顺序包含：胞外多聚化结构域、跨膜结构域、任选的一个或多个共刺激信号传导结构域、和细胞内信号传导区域。

在一些实施方案中，所编码的重组受体是嵌合受体，如CAR。示例性的所编码的CAR序列包含：胞外结合结构域、间隔子、跨膜结构域和细胞内区域，所述细胞内区域包含初级信号传导结构域或区域和一个或多个共刺激信号传导结构域。在一些实施方案中，示例性的所编码的CAR序列包含：胞外结合结构域、间隔子、跨膜结构域以及一个或多个共刺激信号传导结构域、和初级信号传导结构域或区域。

在一些实施方案中，示例性的所编码的多肽(如多链CAR的多肽链)序列包含：跨膜结构域(或膜缔合结构域)、细胞内多聚化结构域、任选的一个或多个共刺激信号传导结构域、和初级信号传导结构域或区域。在一些实施方案中，示例性的所编码的多肽(如多链CAR的多肽链)序列包含：胞外多聚化结构域、跨膜结构域、任选的一个或多个共刺激信号传导结构域、和初级信号传导结构域或区域。

在一些实施方案中，示例性的所编码的CAR序列按顺序包含编码以下的核苷酸序列：胞外结合结构域，任选地scFv；间隔子，任选地包含来自任选地来自IgG1、IgG2或IgG4的人免疫球蛋白铰链或其修饰形式的序列，任选地还包含C_H2区和/或C_H3区；以及跨膜结构域，任选地来自人CD28；共刺激信号传导结构域，任选地来自人4-1BB；和细胞内信号传导区域，任选地CD3ζ链或其部分。在一些实施方案中，重组受体的所编码的细胞内区域从其N至C末端按顺序包含：一个或多个共刺激信号传导结构域、和初级信号传导结构域或区域，所述初级信号传导结构域或区域如含有CD3ζ链或其片段。

在一些实施方案中，所编码的重组受体是重组TCR，并且示例性的所编码的TCR包括TCRα链或TCRβ链或两者。在一些实施方案中，示例性的所编码的多肽(如重组受体的多肽)包含TCRα链的全部或一部分。在一些实施方案中，示例性的所编码的多肽(如重组受体的多肽)包含TCRβ链的全部或一部分。在一些方面，示例性的所编码的重组受体是包含TCRα链和TCRβ链的重组TCR。

1.嵌合抗原受体(CAR)

在一些实施方案中，由经修饰的T细胞刺激相关基因座编码的重组受体是嵌合抗原受体(CAR)。在一些实施方案中，工程化细胞(如T细胞)表达对特定抗原(或标记物或配体)(如在特定细胞类型的表面上表达的抗原)具有特异性的重组受体(如CAR)。在一些方面，本文所述的任何CAR(包括多链或调控型CAR)的至少一部分编码于转基因中。在一些方面，编码本文所述的CAR或其部分的转基因可以是第II.B.2节中所述的任一种。在一些方面，在经由HDR整合转基因后，所得的经修饰的T细胞刺激相关基因座含有编码CAR(如本文所述的任何CAR，包括多链或调控型CAR)的核酸序列。

在一些实施方案中，由经修饰的T细胞刺激相关基因座编码的重组受体(例如，CAR)含有胞外区域(例如，含有一个或多个胞外结合结构域和/或间隔子)、跨膜结构域和/或细胞内区域(例如，含有初级信号传导区域或结构域和/或一个或多个共刺激信号传导结构域)中的一个或多个。在一些方面，所编码的重组受体还含有其他结构域，如多聚化结构域。在一些方面，经修饰的T细胞刺激相关基因座含有编码接头的序列和/或调节元件。在一些实施方案中，所编码的重组受体从其N至C末端按顺序包含：胞外结合结构域、跨膜结构域和细胞内区域，所述细胞内区域例如包含初级信号传导区域或结构域或其部分和/或共刺激信号传导结构域。在一些实施方案中，所编码的重组受体从其N至C末端按顺序包含：胞外结合结构域、间隔子、跨膜结构域和细胞内区域，所述细胞内区域例如包含初级信号传导区域或结构域或其部分和/或共刺激信号传导结构域。

a.结合结构域

在一些实施方案中，所编码的重组受体的胞外区域包含结合结构域。在一些实施方案中，结合结构域是胞外结合结构域。在一些实施方案中，结合结构域是或包含多肽、配体、受体、配体结合结构域、受体结合结构域、抗原、表位、抗体、抗原结合结构域、表位结合结构域、抗体结合结构域、标签结合结构域或前述任一种的片段。在一些实施方案中，结合结构域是配体或抗原结合结构域。

在一些方面，胞外结合结构域(如一个或多个配体(例如，抗原)结合区域或结构域)与一个或多个细胞内区域或结构域经由一个或多个接头和/或一个或多个跨膜结构域连接。在一些实施方案中，嵌合抗原受体包括布置在胞外区域与细胞内区域之间的跨膜结构域。

在一些实施方案中，抗原(例如，结合重组受体的结合结构域的抗原)是多肽。在一些实施方案中，抗原是碳水化合物或其他分子。在一些实施方案中，与正常或非靶向细胞或组织(例如，在健康细胞或组织中)相比，抗原在疾病、障碍或病症的细胞(例如，肿瘤细胞或致病细胞)上选择性表达或过表达。在一些实施方案中，所述疾病、障碍或病症是感染性疾病或障碍、自身免疫性疾病、炎性疾病、或肿瘤或癌症。在一些实施方案中，抗原在正常细胞上表达和/或在工程化细胞上表达。在一些方面，重组受体(例如，CAR)包括选自以下的一个或多个区域或结构域：胞外配体(例如，抗原)结合区域或结构域(例如，本文所述的任何抗体或片段)和细胞内区域。在一些实施方案中，配体(例如，抗原)结合区域或结构域是或包括scFv或单结构域V_H抗体，并且细胞内区域包含含有免疫受体酪氨酸激活基序(ITAM)的细胞内信号传导区域或结构域。

示例性编码的重组受体(包括CAR)包括例如以下文献中所述的那些：国际专利申请公开号WO 2000/14257、WO 2013/126726、WO 2012/129514、WO 2014/031687、WO 2013/166321、WO 2013/071154、WO 2013/123061、美国专利申请公开号US 2002131960、US2013287748、US 20130149337、美国专利号6,451,995、7,446,190、8,252,592、8,339,645、8,398,282、7,446,179、6,410,319、7,070,995、7,265,209、7,354,762、7,446,191、8,324,353和8,479,118、and欧洲专利申请号EP2537416；和/或以下文献中描述的那些：Sadelain等人,Cancer Discov.2013年4月；3(4):388–398；Davila等人(2013)PLoS ONE 8(4):e61338；Turtle等人,Curr.Opin.Immunol.,2012October；24(5):633-39；以及Wu等人,Cancer,2012March 18(2):160-75。在一些方面，所述抗原受体包括美国专利号7,446,190中所述的CAR以及国际专利申请公开号2014/055668中所述的那些。CAR的例子包括如在任何上述参考文献中披露的CAR，如WO 2014/031687、US 8,339,645、US 7,446,179、US 2013/0149337、US 7,446,190、US 8,389,282，Kochenderfer等人,2013,Nature ReviewsClinical Oncology,10,267-276(2013)；Wang等人(2012)J.Immunother.35(9):689-701；以及Brentjens等人,Sci Transl Med.2013 5(177)。

在一些实施方案中，所编码的重组受体(例如，抗原受体)含有结合(例如，特异性结合)至抗原、配体和/或标记物的胞外结合结构域，如抗原或配体结合结构域。抗原受体包括功能性非TCR抗原受体，例如嵌合抗原受体(CAR)。在一些实施方案中，抗原受体是含有与抗原特异性结合的胞外抗原识别结构域的CAR。在一些实施方案中，CAR被构建为具有对特定抗原、标记物或配体的特异性，所述特定抗原、标记物或配体是例如在由过继疗法靶向的特定细胞类型中表达的抗原(例如，癌症标记物)和/或旨在诱导衰减反应的抗原(例如，在正常或未患病细胞类型上表达的抗原)。因此，CAR通常在其胞外部分中包括一种或多种配体(例如，抗原)结合分子，例如一种或多种抗原结合片段、结构域或部分，或一种或多种抗体可变结构域，和/或抗体分子。在一些实施方案中，CAR包括抗体分子的一个或多个抗原结合部分，如源自单克隆抗体(mAb)的可变重链(V_H)和可变轻链(V_L)的单链抗体片段(scFv)、或单结构域抗体(sdAb)(如sdFv、纳米抗体、V_HH和V_NAR)。在一些实施方案中，抗原结合片段包含通过柔性接头连接的抗体可变区。

在一些实施方案中，所编码的CAR含有特异性识别在细胞表面上表达的抗原或配体(如完整抗原)的抗体或抗原结合片段(例如，scFv)。在一些实施方案中，抗原或配体是在细胞表面上表达的蛋白质。在一些实施方案中，抗原或配体是多肽。在一些实施方案中，其是碳水化合物或其他分子。在一些实施方案中，与正常或非靶向细胞或组织相比，抗原或配体在疾病或病症的细胞(例如，肿瘤或致病细胞)上选择性表达或过表达。在其他实施方案中，抗原在正常细胞上表达和/或在工程化细胞上表达。

在一些实施方案中，重组受体所靶向的抗原包括在经由过继细胞疗法靶向的疾病、病症或细胞类型的情境下表达的那些。疾病和病症包括增殖性、肿瘤性和恶性疾病和障碍，包括癌症和肿瘤，包括血液恶性肿瘤、免疫系统癌症，如淋巴瘤、白血病和/或骨髓瘤，如B型白血病、T型白血病和髓样白血病、淋巴瘤和多发性骨髓瘤。

在一些实施方案中，抗原或配体是肿瘤抗原或癌症标记物。在一些实施方案中，与疾病或障碍相关的抗原是或包括αvβ6整合素(avb6整合素)、B细胞成熟抗原(BCMA)、B7-H3、B7-H6、碳酸酐酶9(CA9，也称为CAIX或G250)、癌症-睾丸抗原、癌症/睾丸抗原1B(CTAG，也称为NY-ESO-1和LAGE-2)、癌胚抗原(CEA)、细胞周期蛋白、细胞周期蛋白A2、C-C基序趋化因子配体1(CCL-1)、CD19、CD20、CD22、CD23、CD24、CD30、CD33、CD38、CD44、CD44v6、CD44v7/8、CD123、CD133、CD138、CD171、硫酸软骨素蛋白聚糖4(CSPG4)、表皮生长因子蛋白(EGFR)、表皮生长因子受体III型突变体(EGFR vIII)、上皮糖蛋白2(EPG-2)、上皮糖蛋白40(EPG-40)、肝配蛋白B2、肝配蛋白受体A2(EPHa2)、雌激素受体、Fc受体样蛋白5(FCRL5；也称为Fc受体同源物5或FCRH5)、胎儿乙酰胆碱受体(胎儿AchR)、叶酸结合蛋白(FBP)、叶酸受体α、神经节苷脂GD2、O-乙酰化GD2(OGD2)、神经节苷脂GD3、糖蛋白100(gp100)、磷脂酰肌醇蛋白聚糖-3(GPC3)、G蛋白偶联受体C类5族成员D(GPRC5D)、Her2/neu(受体酪氨酸激酶erb-B2)、Her3(erb-B3)、Her4(erb-B4)、erbB二聚体、人高分子量黑色素瘤相关抗原(HMW-MAA)、乙型肝炎表面抗原、人白细胞抗原A1(HLA-A1)、人白细胞抗原A2(HLA-A2)、IL-22受体α(IL-22Rα)、IL-13受体α2(IL-13Rα2)、激酶插入结构域受体(kdr)、κ轻链、L1细胞粘附分子(L1-CAM)、L1-CAM的CE7表位、含有富亮氨酸重复序列的蛋白8家族成员A(LRRC8A)、Lewis Y、黑色素瘤相关抗原(MAGE)-A1、MAGE-A3、MAGE-A6、MAGE-A10、间皮素(MSLN)、c-Met、鼠类巨细胞病毒(CMV)、粘蛋白1(MUC1)、MUC16、自然杀伤细胞2族成员D(NKG2D)配体、黑色素A(MART-1)、神经细胞粘附分子(NCAM)、癌胚胎抗原、黑色素瘤优先表达抗原(PRAME)、孕酮受体、前列腺特异性抗原、前列腺干细胞抗原(PSCA)、前列腺特异性膜抗原(PSMA)、受体酪氨酸激酶样孤儿受体1(ROR1)、存活蛋白、滋养层糖蛋白(TPBG，也称为5T4)、肿瘤相关糖蛋白72(TAG72)、酪氨酸酶相关蛋白1(TRP1，也称为TYRP1或gp75)、酪氨酸酶相关蛋白2(TRP2，也称为多巴色素互变异构酶、多巴色素δ异构酶或DCT)、血管内皮生长因子受体(VEGFR)、血管内皮生长因子受体2(VEGFR2)、肾母细胞瘤1(WT-1)、病原体特有的或病原体表达的抗原、或与通用标签相关的抗原、和/或生物素化分子、和/或由HIV、HCV、HBV或其他病原体表达的分子。在一些实施方案中，受体靶向的抗原包括与B细胞恶性肿瘤相关的抗原，如许多已知B细胞标记物中的任何一种。在一些实施方案中，所述抗原是或包括CD20、CD19、CD22、ROR1、CD45、CD21、CD5、CD33、Igκ、Igλ、CD79a、CD79b或CD30。

在一些实施方案中，抗原是或包括病原体特异性抗原或病原体表达的抗原。在一些实施方案中，抗原是病毒抗原(如来自HIV、HCV、HBV等的病毒抗原)、细菌抗原和/或寄生虫抗原。

在一些实施方案中，抗体或抗原结合片段(例如scFv或V_H结构域)特异性地识别抗原，如CD19。在一些实施方案中，抗体或抗原结合片段源自与CD19特异性结合的抗体或抗原结合片段或者是其变体。

在一些实施方案中，所述抗原是CD19。在一些实施方案中，scFv含有源自对CD19具有特异性的抗体或抗体片段的V_H和V_L。在一些实施方案中，结合CD19的抗体或抗体片段是小鼠来源的抗体，如FMC63和SJ25C1。在一些实施方案中，抗体或抗体片段是人抗体，例如如美国专利公开号US 2016/0152723中所述。

在一些实施方案中，scFv源自FMC63。FMC63通常是指针对表达人源CD19的Nalm-1和-16细胞产生的小鼠单克隆IgG1抗体(Ling,N.R.,等人(1987).Leucocyte typingIII.302)。在一些实施方案中，FMC63抗体包含分别在SEQ ID NO:38和39中所示的CDR-H1和CDR-H2，和SEQ ID NO:40或54中所示的CDR-H3；以及SEQ ID NO:35所示的CDR-L1和SEQ IDNO:36或55所示的CDR-L2和SEQ ID NO:37或34所示的CDR-L3。在一些实施方案中，FMC63抗体包含含有SEQ ID NO:41的氨基酸序列的重链可变区(V_H)和含有SEQ ID NO:42的氨基酸序列的轻链可变区(V_L)。

在一些实施方案中，scFv包含含有SEQ ID NO:35的CDR-L1序列、SEQ ID NO:36的CDR-L2序列和SEQ ID NO:37的CDR-L3序列的可变轻链和/或含有SEQ ID NO:38的CDR-H1序列、SEQ ID NO:39的CDR-H2序列和SEQ ID NO:40的CDR-H3序列的可变重链。在一些实施方案中，scFv包含如SEQ ID NO:41所示的可变重链区和如SEQ ID NO:42所示的可变轻链区。在一些实施方案中，可变重链和可变轻链通过接头连接。在一些实施方案中，接头如SEQ IDNO:56所示。在一些实施方案中，scFv依次包含V_H、接头和V_L。在一些实施方案中，scFv依次包含V_L、接头和V_H。在一些实施方案中，scFv由SEQ ID NO:57所示的核苷酸序列或与SEQ IDNO:57展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列编码。在一些实施方案中，scFv包含SEQ ID NO:43所示的氨基酸序列或与SEQ ID NO:43展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。

在一些实施方案中，scFv源自SJ25C1。SJ25C1是针对表达人源CD19的Nalm-1和-16细胞产生的小鼠单克隆IgG1抗体(Ling,N.R.,等人(1987).Leucocyte typing III.302)。在一些实施方案中，SJ25C1抗体包含分别在SEQ ID NO:47-49所示的CDR-H1、CDR-H2和CDR-H3，以及分别在SEQ ID NO:44-46所示的CDR-L1、CDR-L2和CDR-L3序列。在一些实施方案中，SJ25C1抗体包含含有SEQ ID NO:50的氨基酸序列的重链可变区(V_H)和含有SEQ ID NO:51的氨基酸序列的轻链可变区(V_L)。

在一些实施方案中，scFv包含含有SEQ ID NO:44的CDR-L1序列、SEQ ID NO:45的CDR-L2序列和SEQ ID NO:46的CDR-L3序列的可变轻链和/或含有SEQ ID NO:47的CDR-H1序列、SEQ ID NO:48的CDR-H2序列和SEQ ID NO:49的CDR-H3序列的可变重链。在一些实施方案中，scFv包含如SEQ ID NO:50所示的可变重链区和如SEQ ID NO:51所示的可变轻链区。在一些实施方案中，可变重链和可变轻链通过接头连接。在一些实施方案中，接头如SEQ IDNO:52所示。在一些实施方案中，scFv依次包含V_H、接头和V_L。在一些实施方案中，scFv依次包含V_L、接头和V_H。在一些实施方案中，scFv包含SEQ ID NO:53所示的氨基酸序列或与SEQ IDNO:53展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。

在一些实施方案中，所述抗原是CD20。在一些实施方案中，scFv含有源自对CD20具有特异性的抗体或抗体片段的V_H和V_L。在一些实施方案中，结合CD20的抗体或抗体片段是或源自利妥昔单抗的抗体，如是利妥昔单抗scFv。

在一些实施方案中，所述抗原是CD22。在一些实施方案中，scFv含有源自对CD22具有特异性的抗体或抗体片段的V_H和V_L。在一些实施方案中，结合CD22的抗体或抗体片段是或源自m971的抗体，如是m971 scFv。

在一些实施方案中，抗原或抗原结合结构域是BCMA。在一些实施方案中，scFv含有源自对BCMA具有特异性的抗体或抗体片段的V_H和V_L。在一些实施方案中，结合BCMA的抗体或抗体片段是或含有来自国际专利申请公开号WO 2016/090327和WO 2016/090320所示的抗体或抗体片段的V_H和V_L。

在一些实施方案中，抗原或抗原结合结构域是GPRC5D。在一些实施方案中，scFv含有源自对GPRC5D具有特异性的抗体或抗体片段的V_H和V_L。在一些实施方案中，结合GPRC5D的抗体或抗体片段是或含有来自国际专利申请公开号WO 2016/090329和WO 2016/090312所示的抗体或抗体片段的V_H和V_L。

在一些方面，所编码的CAR含有结合或识别(例如，特异性结合)通用标签或通用表位的配体(例如，抗原)结合结构域。在一些方面，结合结构域可以结合分子、标签、多肽和/或表位，所述分子、标签、多肽和/或表位可以连接至识别与疾病或障碍相关的抗原的不同结合分子(例如，抗体或抗原结合片段)。示例性标签或表位包括染料(例如，异硫氰酸荧光素)或生物素。在一些方面，结合分子(例如，抗体或抗原结合片段)与标签连接，所述标签识别与疾病或障碍相关的抗原(例如，肿瘤抗原)，且工程化细胞表达对所述标签具有特异性的CAR，以实现工程化细胞的细胞毒性或其他效应子功能。在一些方面，CAR对与疾病或障碍相关的抗原的特异性由带标签的结合分子(例如，抗体)提供，并且不同的带标签的结合分子可以用于靶向不同抗原。对通用标签或通用表位具有特异性的示例性CAR包括例如以下文献中所述的那些：U.S.9,233,125；WO 2016/030414；Urbanska等人,(2012)Cancer Res72:1844-1852；和Tamada等人,(2012).Clin Cancer Res 18:6436-6445。

在一些实施方案中，所编码的CAR含有TCR样抗体，如抗体或抗原结合片段(例如，scFv)，其特异性识别作为主要组织相容性复合物(MHC)-肽复合物存在于细胞表面上的细胞内抗原(如肿瘤相关抗原)。在一些实施方案中，识别MHC-肽复合物的抗体或其抗原结合部分可以作为重组受体(如抗原受体)的部分在细胞上表达。抗原受体包括功能性非T细胞受体(TCR)抗原受体，如嵌合抗原受体(CAR)。在一些实施方案中，含有展现针对肽-MHC复合物的TCR样特异性的抗体或抗原结合片段的CAR也可以称为TCR样CAR。在一些实施方案中，CAR是TCR样CAR，并且抗原是加工过的肽抗原，如细胞内蛋白的肽抗原，其与TCR一样在MHC分子的情境下在细胞表面上被识别。在一些实施方案中，在一些方面，对TCR样CAR的MHC-肽复合物具有特异性的胞外抗原结合结构域经由接头和/或一个或多个跨膜结构域与一种或多种细胞内信号传导组分连接。在一些实施方案中，此类分子通常可以模拟或接近通过天然抗原受体(如TCR)的信号，并且任选地模拟或接近通过这种受体与共刺激受体的组合的信号。

在一些实施方案中，主要组织相容性复合物(MHC)包括含有多态性肽结合位点或结合沟的蛋白质，通常是糖蛋白，在一些情况下，所述蛋白质可以与多肽的肽抗原(包括由细胞机器加工的肽抗原)复合。在一些情况下，MHC分子可以在细胞表面上展示或表达，包括作为与肽的复合物，即MHC-肽复合物，用于呈递具有T细胞上的抗原受体(如TCR或TCR样抗体)可识别的构象的抗原。通常，MHC I类分子是具有跨膜α链(在一些情况下具有三个α结构域)和非共价缔合的β2微球蛋白的异二聚体。通常，MHC II类分子由两种跨膜糖蛋白α和β构成，两者通常都跨越膜。MHC分子可以包括MHC的有效部分，其含有抗原结合位点或用于结合肽的位点以及由适当抗原受体识别所需的序列。在一些实施方案中，MHC I类分子将源自胞质溶胶的肽递送至细胞表面，在此处MHC-肽复合物被T细胞(如通常是CD8⁺T细胞，但是在一些情况下是CD4⁺T细胞)识别。在一些实施方案中，MHC II类分子将源自囊泡系统的肽递送至细胞表面，其中肽通常被CD4⁺T细胞识别。通常，MHC分子由一组连锁基因座编码，它们在小鼠中统称为H-2，并且在人中统称为人白细胞抗原(HLA)。因此，通常人MHC也可以称为人白细胞抗原(HLA)。

术语“MHC-肽复合物”或“肽-MHC复合物”或其变体是指肽抗原与MHC分子的复合物或缔合物，例如通常通过所述肽在MHC分子的结合沟或裂缝中的非共价相互作用来形成。在一些实施方案中，MHC-肽复合物存在或展示于细胞表面上。在一些实施方案中，MHC-肽复合物可以由抗原受体(如TCR、TCR样CAR或其抗原结合部分)特异性识别。

在一些实施方案中，多肽的肽(如肽抗原或表位)可以与MHC分子缔合，如用于由抗原受体识别。通常，肽源自或基于较长生物分子(如多肽或蛋白质)的片段。在一些实施方案中，肽通常具有约8至约24个氨基酸的长度。在一些实施方案中，对于MHC II类复合物中的识别，肽的长度为从或从约9至22个氨基酸。在一些实施方案中，对于MHC I类复合物中的识别，肽的长度为从或从约8至13个氨基酸。在一些实施方案中，在识别MHC分子(如MHC-肽复合物)背景下的肽后，抗原受体(如TCR或TCR样CAR)产生或触发激活信号至T细胞，诱导T细胞反应，如T细胞增殖、细胞因子产生、细胞毒性T细胞反应或其他反应。

在一些实施方案中，TCR样抗体或抗原结合部分是已知的或可以通过已知方法产生(参见例如，美国专利申请公开号US 2002/0150914；US 2003/0223994；US 2004/0191260；US 2006/0034850；US 2007/00992530；US 20090226474；US 20090304679；以及国际申请公开号WO 03/068201)。

在一些实施方案中，与MHC-肽复合物特异性结合的抗体或其抗原结合部分可以通过用有效量的含有特定MHC-肽复合物的免疫原对宿主进行免疫来产生。在一些情况下，MHC-肽复合物的肽是能够与MHC结合的抗原的表位，所述抗原如肿瘤抗原，例如通用肿瘤抗原、骨髓瘤抗原或如本文所述的其他抗原。在一些实施方案中，然后向宿主施用有效量的免疫原以用于引发免疫反应，其中免疫原保持其三维形式持续一段足以引发针对所述肽在MHC分子的结合沟中的三维呈递的免疫反应的时间。然后测定从宿主中收集的血清以确定是否产生了识别MHC分子结合沟中的肽的三维呈递的所需抗体。在一些实施方案中，可以评估所产生的抗体以确认所述抗体可以区分MHC-肽复合物与单独的MHC分子、单独的目的肽以及MHC与无关肽的复合物。然后可以分离所需抗体。

在一些实施方案中，与MHC-肽复合物特异性结合的抗体或其抗原结合部分可以通过采用抗体文库展示方法(如噬菌体抗体文库)来产生。在一些实施方案中，可以产生突变体Fab、scFv或其他抗体形式的噬菌体展示文库，例如，其中文库的成员在一个或多个CDR的一个或多个残基处发生突变。参见例如美国专利申请公开号US 20020150914、US20140294841；以及Cohen CJ.等人(2003)J Mol.Recogn.16:324-332。

本文中的术语“抗体”在最广泛的意义上使用，并且包括多克隆和单克隆抗体，包括完整抗体和功能性(抗原结合)抗体片段，包括片段抗原结合(Fab)片段、F(ab')₂片段、Fab'片段、Fv片段、重组IgG(rIgG)片段、能够特异性结合抗原的可变重链(V_H)区、单链抗体片段(包括单链可变片段(scFv))以及单结构域抗体(例如，sdAb、sdFv、纳米抗体、V_HH或V_NAR)或片段。所述术语涵盖免疫球蛋白的基因工程化的和/或以其他方式修饰的形式，如胞内抗体、肽体、嵌合抗体、完全人抗体、人源化抗体和异缀合抗体、多特异性(例如，双特异性)抗体、双抗体、三抗体和四抗体、串联二-scFv、串联三-scFv。除非另有说明，否则术语“抗体”应当理解为涵盖其功能性抗体片段。所述术语还涵盖完整或全长抗体，包括任何类别或亚类(包括IgG及其亚类、IgM、IgE、IgA和IgD)的抗体。在一些方面，CAR是双特异性CAR，例如含有两个具有不同特异性的抗原结合结构域。

在一些实施方案中，抗原结合蛋白、抗体及其抗原结合片段特异性地识别全长抗体的抗原。在一些实施方案中，抗体的重链和轻链可以是全长的或者可以是抗原结合部分(Fab、F(ab')2、Fv或单链Fv片段(scFv))。在其他实施方案中，所述抗体重链恒定区选自例如IgG1、IgG2、IgG3、IgG4、IgM、IgA1、IgA2、IgD和IgE，特别是选自例如IgG1、IgG2、IgG3和IgG4，更特别是IgG1(例如，人IgG1)。在一些实施方案中，抗体轻链恒定区选自例如κ或λ，特别是κ。

所编码的重组受体的结合结构域包括抗体片段。“抗体片段”是指不同于完整抗体的分子，其包含完整抗体中结合完整抗体所结合抗原的一部分。抗体片段的例子包括但不限于Fv、Fab、Fab'、Fab'-SH、F(ab')₂；双抗体；线性抗体；可变重链(V_H)区、单链抗体分子(如scFv)和单结构域V_H单一抗体；以及由抗体片段形成的多特异性抗体。在任何实施方案的一些实施方案中，抗体是包含可变重链区和/或可变轻链区的单链抗体片段，如scFv。

术语“可变区”或“可变结构域”是指抗体重链或轻链中参与抗体与抗原的结合的结构域。天然抗体的重链和轻链的可变结构域(分别为V_H和V_L)通常具有相似的结构，每个结构域包含四个保守的框架区(FR)和三个CDR。(参见例如Kindt等人Kuby Immunology,第6版,W.H.Freeman and Co.,第91页(2007)。单一V_H或V_L结构域可能足以赋予抗原结合特异性。此外，可以使用来自结合抗原的抗体的V_H或V_L结构域分离结合所述特定抗原的抗体，以分别筛选互补的V_L或V_H结构域的文库。参见例如，Portolano等人,J.Immunol.150:880-887(1993)；Clarkson等人,Nature 352:624-628(1991)。

单结构域抗体(sdAb)是包含抗体的重链可变结构域的全部或一部分或轻链可变结构域的全部或一部分的抗体片段。在某些实施方案中，单结构域抗体是人单结构域抗体。在一些实施方案中，CAR包含特异性地结合抗原的抗体重链结构域，所述抗原例如癌症标记物或待靶向的细胞或疾病(例如肿瘤细胞或癌细胞)的细胞表面抗原，例如本文所述或已知的任何靶抗原。示例性的单结构域抗体包括sdFv、纳米抗体、V_HH或V_NAR。

抗体片段可以通过各种技术制备，包括但不限于完整抗体的蛋白水解消化以及通过重组宿主细胞产生。在一些实施方案中，所述抗体是重组产生的片段，如包含天然不存在的排列的片段(如具有通过合成接头(例如，肽接头)连接的两个或更多个抗体区域或链的那些)，和/或可能并非通过对天然存在的完整抗体进行酶消化产生的片段。在一些实施方案中，所述抗体片段是scFv。

“人源化”抗体是如下抗体，其中所有或基本上所有CDR氨基酸残基都衍生自非人CDR并且所有或基本上所有FR氨基酸残基都衍生自人FR。人源化抗体任选地可以包括源自人抗体的抗体恒定区的至少一部分。非人抗体的“人源化形式”是指非人抗体的变体，其已经经历人源化以通常降低对人的免疫原性，同时保留亲代非人抗体的特异性和亲和力。在一些实施方案中，人源化抗体中的一些FR残基被来自非人抗体(例如，CDR残基所来源的抗体)的相应残基取代，例如以恢复或改善抗体特异性或亲和力。

因此，在一些实施方案中，所编码的嵌合抗原受体(包括TCR样CAR)包括含有抗体或抗体片段的胞外部分。在一些实施方案中，所述抗体或片段包括scFv。在一些方面，抗体或抗原结合片段可以通过筛选多个(如文库)抗原结合片段或分子，例如通过筛选scFv文库以结合特定抗原或配体来获得。

在一些实施方案中，所编码的CAR是多特异性CAR，例如，含有可以结合和/或识别(例如，特异性结合)多种不同抗原的多个配体(例如，抗原)结合结构域。在一些方面，所编码的CAR是双特异性CAR，例如，其如通过含有具有不同特异性的两个抗原结合结构域来靶向两种抗原。在一些实施方案中，CAR含有双特异性结合结构域，例如，双特异性抗体或其片段，其含有与靶细胞上的不同表面抗原(例如，选自如本文所述任何列示抗原，例如，CD19和CD22或CD19和CD20)结合的至少一个抗原结合结构域。在一些实施方案中，双特异性结合结构域与其每一表位或抗原的结合可以导致刺激T细胞的功能、活性和/或反应，例如，细胞毒性活性和随后对靶细胞的裂解。这种示例性双特异性结合结构域可以包括：在一些情况下经由例如柔性接头彼此融合的串联scFv分子；双抗体及其衍生物，包括串联双抗体(Holliger等人,Prot Eng 9,299-305(1996)；Kipriyanov等人,J Mol Biol 293,41-66(1999))；双重亲和力重靶向(DART)分子，其可以包括具有C末端二硫桥的双抗体形式；双特异性T细胞接合器(BiTE)分子，其含有通过柔性接头融合的串联scFv分子(参见例如，Nagorsen和Bauerle,Exp Cell Res 317,1255-1260(2011)；或者三功能抗体(triomab)，其包括完整杂合小鼠/大鼠IgG分子(Seimetz等人,Cancer Treat Rev 36,458-467(2010))。本文所述的任何CAR中可以含有此类结合结构域中的任一种。

b.间隔子和跨膜结构域

在一些方面，所编码的重组受体(例如嵌合抗原受体)包括胞外部分，其含有一个或多个配体(例如抗原)结合结构域(如抗体或其片段)；和一个或多个细胞内信号传导区域或结构域(也可互换地称为胞质信号传导结构域或区域)。在一些方面，重组受体(例如CAR)还包括间隔子和/或跨膜结构域或部分。在一些方面，间隔子和/或跨膜结构域可以连接含有配体(例如，抗原)结合结构域的胞外部分和一个或多个细胞内信号传导区域或结构域。

在一些实施方案中，所编码的重组受体(如CAR)还包括间隔子，所述间隔子可以是或包括免疫球蛋白恒定区的至少一部分或其变体或修饰形式，如铰链区(例如，IgG4铰链区)和/或C_H1/C_L和/或Fc区。在一些实施方案中，重组受体还包含间隔子和/或铰链区。在一些实施方案中，恒定区或部分是人IgG(如IgG4、IgG2或IgG1)的。在一些方面，恒定区的所述部分用作抗原识别组分(例如，scFv)与跨膜结构域之间的间隔子区。与不存在间隔子的情况下相比，间隔子的长度可以提供抗原结合后增强的细胞反应性。在一些例子中，间隔子具有为或约12个氨基酸的长度或者具有不超过12个氨基酸的长度。示例性间隔子包括具有至少约10至229个氨基酸、约10至200个氨基酸、约10至175个氨基酸、约10至150个氨基酸、约10至125个氨基酸、约10至100个氨基酸、约10至75个氨基酸、约10至50个氨基酸，约10至40个氨基酸、约10至30个氨基酸、约10至20个氨基酸或约10至15个氨基酸(并且包括任何列出的范围的端点之间的任何整数)的那些。在一些实施方案中，间隔子区具有约12个或更少的氨基酸、约119个或更少的氨基酸或约229个或更少的氨基酸。在一些实施方案中，间隔子具有少于250个氨基酸的长度、少于200个氨基酸的长度、少于150个氨基酸的长度、少于100个氨基酸的长度、少于75个氨基酸的长度、少于50个氨基酸的长度、少于25个氨基酸的长度、少于20个氨基酸的长度、少于15个氨基酸的长度、少于12个氨基酸的长度或少于10个氨基酸的长度。在一些实施方案中，间隔子具有从或从约10至250个氨基酸的长度、10至150个氨基酸的长度、10至100个氨基酸的长度、10至50个氨基酸的长度、10至25个氨基酸的长度、10至15个氨基酸的长度、15至250个氨基酸的长度、15至150个氨基酸的长度、15至100个氨基酸的长度、15至50个氨基酸的长度、15至25个氨基酸的长度、25至250个氨基酸的长度、25至100个氨基酸的长度、25至50个氨基酸的长度、50至250个氨基酸的长度、50至150个氨基酸的长度、50至100个氨基酸的长度、100至250个氨基酸的长度、100至150个氨基酸的长度或150至250个氨基酸的长度。示例性间隔子包括单独的IgG4铰链、与C_H2和C_H3结构域连接的IgG4铰链或与C_H3结构域连接的IgG4铰链。示例性间隔子包括但不限于以下文献中所述的那些：Hudecek等人(2013)Clin.Cancer Res.,19:3153；Hudecek等人(2015)CancerImmunol Res.3(2):125–135或国际专利申请公开号WO 2014031687。

在一些实施方案中，间隔子可以全部或部分地源自IgG4和/或IgG2。在一些实施方案中，所述间隔子可以是含有源自IgG4、IgG2和/或IgG2和IgG4的铰链、C_H2和/或C_H3序列中的一种或多种的嵌合多肽。在一些实施方案中，间隔子可以含有突变，如在一个或多个结构域中的一个或多个单氨基酸突变。在一些例子中，氨基酸修饰是在IgG4的铰链区中脯氨酸(P)对丝氨酸(S)的取代。在一些实施方案中，氨基酸修饰是天冬酰胺(N)被谷氨酰胺(Q)取代以降低糖基化异质性，如在对应于SEQ ID NO:60所示的IgG4重链恒定区序列的C_H2区中的位置177的位置(Uniprot登录号P01861；对应于依据EU编号的位置297和SEQ ID NO:4所示的铰链-C_H2-C_H3间隔子序列的位置79的位置)处的N至Q取代，或在对应于SEQ ID NO:59所示的IgG2重链恒定区序列的C_H2区中的位置176的位置(Uniprot登录号P01859；对应于依据EU编号的位置297的位置)处的N至Q取代。

在一些方面，间隔子仅含有IgG的铰链区，如仅IgG4、IgG2或IgG1的铰链，如SEQ IDNO:1所示的仅铰链间隔子，且由SEQ ID NO:2所示的序列编码。在其他实施方案中，间隔子是与C_H2和/或C_H3结构域连接的Ig铰链，例如IgG4铰链。在一些实施方案中，间隔子是与C_H2和C_H3结构域连接的Ig铰链，例如IgG4铰链，如SEQ ID NO:3所示。在一些实施方案中，间隔子是仅与C_H3结构域连接的Ig铰链，例如IgG4铰链，如SEQ ID NO:4所示。在一些实施方案中，间隔子是或包含富甘氨酸-丝氨酸的序列或其他柔性接头，如已知的柔性接头。在一些实施方案中，恒定区或部分是IgD的。在一些实施方案中，间隔子具有SEQ ID NO:5中所示的序列。在一些实施方案中，所述间隔子具有与SEQ ID NO:1、3、4和5中的任何一个展现出至少或至少约85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。

在一些方面，间隔子是多肽间隔子，如选自以下的一种或多种：(a)包含全部或部分免疫球蛋白铰链或其修饰形式或由其组成或包含约15个氨基酸或更少，并且不包含CD28胞外区域或CD8胞外区域，(b)包含全部或部分免疫球蛋白铰链(任选地IgG4铰链)或其修饰形式或由其组成和/或包含约15个氨基酸或更少，并且不包含CD28胞外区域或CD8胞外区域，或(c)具有为或约12个氨基酸的长度和/或包含全部或部分免疫球蛋白铰链(任选地IgG4铰链)或其修饰形式或由其组成；或(d)由以下项组成或包含以下项：SEQ ID NO:1、35或27-34所示的氨基酸序列或与其具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的前述任一项的变体；或(e)包含式X₁PPX₂P(其中X₁是甘氨酸、半胱氨酸或精氨酸并且X₂是半胱氨酸或苏氨酸)或由其组成。

示例性间隔子包括含有免疫球蛋白恒定区的一个或多个部分的那些，如含有Ig铰链(如IgG铰链结构域)的那些。在一些方面，所述间隔子包括单独的IgG铰链、与C_H2和C_H3结构域中的一个或多个连接的IgG铰链或者与C_H3结构域连接的IgG铰链。在一些实施方案中，IgG铰链、C_H2和/或C_H3可以全部或部分源自IgG4或IgG2。在一些实施方案中，所述间隔子可以是含有源自IgG4、IgG2和/或IgG2和IgG4的铰链、C_H2和/或C_H3序列中的一种或多种的嵌合多肽。在一些实施方案中，所述铰链区包含IgG4铰链区和/或IgG2铰链区的全部或一部分，其中IgG4铰链区任选地是人IgG4铰链区，并且IgG2铰链区任选地是人IgG2铰链区；C_H2区包含IgG4 C_H2区和/或IgG2 C_H2区的全部或一部分，其中IgG4 C_H2区任选地是人IgG4 C_H2区，并且IgG2 C_H2区任选地是人IgG2 C_H2区；和/或C_H3区包含IgG4C_H3区和/或IgG2 C_H3区的全部或一部分，其中IgG4 C_H3区任选地是人IgG4 C_H3区，并且IgG2 C_H3区任选地是人IgG2 C_H3区。在一些实施方案中，所述铰链C_H2和C_H3包含来自IgG4的铰链区C_H2和C_H3中的每一个的全部或一部分。在一些实施方案中，铰链区是嵌合的并且包含来自人IgG4和人IgG2的铰链区；C_H2区是嵌合的并且包含来自人IgG4和人IgG2的C_H2区；和/或C_H3区是嵌合的并且包含来自人IgG4和人IgG2的C_H3区。在一些实施方案中，所述间隔子包含IgG4/2嵌合铰链或含有与人IgG4铰链区相比的至少一个氨基酸替代的经修饰的IgG4铰链；人IgG2/4嵌合C_H2区；和人IgG4 C_H3区。

在一些实施方案中，间隔子可以全部或部分源自IgG4和/或IgG2，并且可以含有突变，例如在一个或多个结构域中的一个或多个单氨基酸突变。在一些例子中，氨基酸修饰是在IgG4的铰链区中脯氨酸(P)对丝氨酸(S)的取代。在一些实施方案中，氨基酸修饰是用谷氨酰胺(Q)取代天冬酰胺(N)以降低糖基化异质性，如SEQ ID NO:60所示全长IgG4 Fc序列的C_H2区中的位置177处的N177Q突变，或者SEQ ID NO:59所示全长IgG2 Fc序列的C_H2区中的位置176处的N176Q。在一些实施方案中，间隔子是或包含IgG4/2嵌合铰链或经修饰的IgG4铰链；IgG2/4嵌合C_H2区；和IgG4 C_H3区，并且任选地具有约228个氨基酸的长度；或SEQ IDNO:291中所示的间隔子。在一些实施方案中，CAR的配体(例如，抗原)结合或识别结构域与细胞内区域连接，所述细胞内区域例如含有一种或多种细胞内信号传导组分，如细胞内信号传导区域或结构域，和/或模拟通过抗原受体复合物(如TCR复合物)进行激活和/或经由另一种细胞表面受体传导信号的信号传导组分。因此，在一些实施方案中，例如含有结合结构域(如抗原结合组分(例如，抗体))的胞外区域与一个或多个跨膜和细胞内区域或结构域连接。在一些实施方案中，跨膜结构域与胞外区域融合。在一些实施方案中，使用与受体(例如，CAR)中的一个结构域天然缔合的跨膜结构域。在一些情形中，通过氨基酸取代选择或修饰所述跨膜结构域以避免此类结构域与相同或不同表面膜蛋白的跨膜结构域结合，以最小化与所述受体复合物的其他成员的相互作用。

在一些实施方案中，跨膜结构域源自天然或合成来源。当来源是天然的时，在一些方面，所述结构域可以源自任何膜结合蛋白或跨膜蛋白。跨膜区域包括源自以下(即，至少包含其一个或多个跨膜区域)的那些：T细胞受体的α、β或ζ链、CD28、CD3ε、CD45、CD4、CD5、CD8、CD9、CD16、CD22、CD33、CD37、CD64、CD80、CD86、CD134、CD137(4-1BB)或CD154。可替代地，在一些实施方案中，跨膜结构域是合成的。在一些方面，合成跨膜结构域主要包含疏水性残基，例如亮氨酸和缬氨酸。在一些方面，将在合成跨膜结构域的每个末端发现苯丙氨酸、色氨酸和缬氨酸的三联体。在一些实施方案中，所述连接是通过接头、间隔子和/或一个或多个跨膜结构域来实现。在一些方面，所述跨膜结构域含有CD28的跨膜部分或其变体。胞外区域和跨膜可以直接或间接连接。在一些实施方案中，胞外区域和跨膜通过间隔子(如本文所述的任一种)连接。

在一些实施方案中，受体(例如CAR)的跨膜结构域是人CD28的跨膜结构域或其变体，例如人CD28(登录号：P10747.1)的27个氨基酸的跨膜结构域，或者是包含SEQ ID NO:8中所示氨基酸序列或与SEQ ID NO:8展现出至少或至少约85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列的跨膜结构域；在一些实施方案中，含有重组受体的部分的跨膜结构域包含SEQ ID NO:9中所示的氨基酸序列或具有与SEQ ID NO:9的至少或至少约85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。

c.细胞内区域

在一些方面，在经修饰的T细胞刺激相关基因座中编码的重组受体(例如，CAR)包括包含信号传导区域或结构域的细胞内区域(也称为胞质区域)。在一些实施方案中，细胞内区域包含细胞内信号传导区域或结构域。在一些实施方案中，细胞内信号传导区域或结构域是或包含初级信号传导区域、能够在T细胞中刺激和/或诱导初级激活信号的信号传导结构域、T细胞受体(TCR)组分的信号传导结构域(例如，CD3-zeta(CD3ζ)链或其功能性变体或信号传导部分的细胞内信号传导结构域或区域)和/或包含免疫受体酪氨酸激活基序(ITAM)的信号传导结构域。

在一些实施方案中，重组受体(例如，CAR)包括至少一种或多种细胞内信号传导组分，如细胞内信号传导区域或结构域。细胞内信号传导区域包括模拟或类似以下的那些：经由天然抗原受体的信号、经由这种受体与共刺激受体的组合的信号和/或仅经由共刺激受体的信号。在一些实施方案中，存在短的寡肽或多肽接头，例如长度在2与10个氨基酸之间的接头(如含有甘氨酸和丝氨酸的接头，例如甘氨酸-丝氨酸双联体)，并且在CAR的跨膜结构域与胞质信号传导结构域之间形成连接。

在一些实施方案中，在连接CAR后，CAR的胞质(或细胞内)结构域或区域(例如，细胞内信号传导区域)刺激和/或激活免疫细胞(例如，工程化以表达CAR的T细胞)的正常效应子功能或反应中的至少一种。例如，在一些情境下，CAR诱导T细胞的功能,如细胞溶解活性或T辅助活性，如细胞因子或其他因子的分泌。在一些实施方案中，使用抗原受体组分或共刺激分子的细胞内信号传导区域或结构域的截短部分(例如，如果其转导效应子功能信号)代替完整的免疫刺激链。在一些实施方案中，所述细胞内信号传导区域(例如包含一个或多个细胞内信号传导结构域)包括T细胞受体(TCR)的胞质序列，并且在一些方面还包括共受体(其在天然背景下与这种受体并行起作用以在抗原受体接合后启动信号转导)和/或此类分子的任何衍生物或变体的那些，和/或具有相同功能能力的任何合成序列。在一些实施方案中，例如包含一个或多个细胞内结构域的细胞内信号传导区域包括参与提供共刺激信号的区域或结构域的胞质序列。

(i)共刺激信号传导结构域

在一些实施方案中，为了促进完全刺激和/或激活，用于产生次级或共刺激信号的一种或多种组分被包括在所编码的CAR中。在其他实施方案中，所编码的CAR不包括用于产生共刺激信号的组分。在一些方面，另外的受体多肽或其部分在同一细胞中表达，并且提供用于产生次级或共刺激信号的组分。

在一些实施方案中，所编码的CAR包括共刺激受体(例如，CD28、4-1BB、OX40(CD134)、CD27、DAP10、DAP12、ICOS和/或其他共刺激受体)的信号传导区域和/或跨膜部分。在一些方面，相同的CAR包括初级胞质信号传导区域和共刺激信号传导组分。

在一些实施方案中，一种或多种不同的重组受体可以含有一个或多个不同的细胞内信号传导区域或结构域。在一些实施方案中，初级胞质信号传导区域被包括在一种所编码的CAR内，而共刺激组分由另一种受体(例如，识别另一种抗原的另一种CAR)提供。在一些实施方案中，所编码的CAR包括在同一细胞上表达的激活或刺激CAR和共刺激CAR(参见WO2014/055668)。

在某些实施方案中，细胞内信号传导区域包含与CD3(例如，CD3ζ)细胞内区域或结构域连接的CD28跨膜和信号传导结构域。在一些实施方案中，细胞内区域包含与CD3ζ细胞内区域或结构域连接的嵌合CD28和CD137(4-1BB，TNFRSF9)共刺激结构域。

在一些实施方案中，所编码的CAR在胞质部分中包含一个或多个(例如，两个或更多个)共刺激结构域和初级胞质信号传导区域。示例性CAR包括CD3ζ、CD28、CD137(4-1BB)、OX40(CD134)、CD27、DAP10、DAP12、NKG2D和/或ICOS的细胞内组分，如一个或多个细胞内信号传导区域或结构域。在一些实施方案中，嵌合抗原受体含有T细胞共刺激分子的细胞内信号传导区域或结构域，例如来自CD28、CD137(4-1BB)、OX40(CD134)、CD27、DAP10、DAP12、NKG2D和/或ICOS，在一些情况下，在跨膜结构域与细胞内信号传导区域或结构域之间。在一些方面，T细胞共刺激分子是CD28、CD137(4-1BB)、OX40(CD134)、CD27、DAP10、DAP12、NKG2D和/或ICOS中的一种或多种。在一些实施方案中，共刺激分子是人共刺激分子。

在一些实施方案中，细胞内信号传导区或结构域包含人CD28的细胞内共刺激信号传导结构域或其功能性变体或部分，如其41个氨基酸的结构域和/或在天然CD28蛋白的位置186-187处具有LL至GG取代的这种结构域。在一些实施方案中，所述细胞内信号传导区域和/或结构域可以包含SEQ ID NO:10或11所示的氨基酸序列，或与SEQ ID NO:10或11展现出至少或至少约85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方案中，细胞内区域包含CD137(4-1BB)或其功能性变体或部分的细胞内共刺激信号传导结构域或区域，例如人4-1BB(登录号Q07011.1)或其功能性变体或部分的42个氨基酸的胞质结构域，如SEQ ID NO:12所示的氨基酸序列或者与SEQ ID NO:12展现出至少或至少约85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。

在一些情况下，所编码的CAR被称为第一代、第二代、第三代或第四代CAR。在一些方面，第一代CAR是在抗原结合后例如经由CD3链诱导的信号单独地提供初级刺激或激活信号的CAR；在一些方面，第二代CAR是提供这种信号和共刺激信号的CAR，如包括来自一种或多种共刺激受体如CD28、CD137(4-1BB)、OX40(CD134)、CD27、DAP10、DAP12、NKG2D、ICOS和/或其他共刺激受体的一个或多个细胞内信号传导区域或结构域的CAR；在一些方面，第三代CAR是包括不同共刺激受体(例如，选自CD28、CD137(4-1BB)、OX40(CD134)、CD27、DAP10、DAP12、NKG2D、ICOS和/或其他共刺激受体)的多个共刺激结构域的CAR；在一些方面，第四代CAR是包括不同共刺激受体(例如，选自CD28、CD137(4-1BB)、OX40(CD134)、CD27、DAP10、DAP12、NKG2D、ICOS和/或其他共刺激受体)的三个或更多个共刺激结构域的CAR。

(ii)初级信号传导区域，例如CD3ζ链

在一些实施方案中，所编码的重组受体包括TCR复合物的细胞内组分，如介导T细胞激活和细胞毒性的TCR CD3链，例如CD3ζ链。因此，在一些方面，抗原结合或抗原识别结构域与一个或多个细胞信号传导模块连接。在一些实施方案中，细胞信号传导模块包括CD3跨膜结构域、CD3细胞内信号传导结构域和/或其他CD跨膜结构域。在一些实施方案中，所编码的重组受体(例如，CAR)还包括一种或多种另外的分子(如Fc受体γ(FcRγ)、CD8α、CD8β、CD4、CD25或CD16)。例如，在一些方面，CAR包括CD3zeta(CD3ζ)与CD8α、CD8β、CD4、CD25或CD16中的一种或多种之间的嵌合分子。

在天然TCR的情境下，完全刺激通常不仅需要通过TCR进行信号传导，还需要共刺激信号。在一些方面，T细胞刺激可以由两类胞质信号传导序列介导：启动经由TCR的抗原依赖性初级激活的那些(初级胞质信号传导区域或结构域)，以及以非抗原依赖性方式作用以提供次级或共刺激信号的那些(次级胞质信号传导区域或结构域)。在一些方面，CAR包括此类信号传导组分中的一种或两种。

在一些方面，所编码的CAR包括细胞内区域，其包含调控TCR复合物的初级刺激和/或激活的初级胞质信号传导区域。以刺激方式起作用的一个或多个初级胞质信号传导区域可以含有信号传导基序(其被称为免疫受体酪氨酸激活基序或ITAM)，所述信号传导基序例如源自CD3 zeta(CD3ζ)。在一些实施方案中，CAR含有源自CD3ζ的胞质信号传导结构域、其片段或部分或序列。在一些实施方案中，细胞内(或胞质)信号传导区域包含人CD3ζ链或其片段或部分，包括CD3ζ或其功能性变体的细胞内或胞质刺激信号传导结构域，如人CD3ζ(登录号：P20963.2)的亚型3的112个AA的胞质结构域或如美国专利号7,446,190或美国专利号8,911,993中所述的CD3ζ信号传导结构域。在一些实施方案中，编码的重组受体的胞内区域包含SEQ ID NO:13、14或15所示的氨基酸序列或者与SEQ ID NO:13、14或15展现出至少或至少约85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方案中，由经修饰的T细胞刺激相关基因座编码的示例性CD3ζ链或其片段包括CD3ζ链的ITAM结构域，例如SEQ ID NO:292所示的人CD3ζ链前体序列的氨基酸残基61-89、100-128或131-159，或者含有来自CD3ζ链的一个或多个ITAM结构域并与SEQ ID NO:292展现出至少或至少约85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。

在一些实施方案中，将细胞工程化以表达一种或多种另外的分子(例如，多肽，如另外的重组受体多肽或其部分)，所述一种或多种另外的分子用于调控、控制或调节所编码的CAR的功能和/或活性。示例性多链重组受体(如多链CAR)在本文例如第IV.B.2节中有描述。

在一些实施方案中，所编码的CAR含有抗体(例如，抗体片段)、跨膜结构域(其是或含有CD28或其功能性变体的跨膜部分)以及细胞内信号传导区域(含有CD28或其功能性变体的信号传导部分和CD3ζ或其功能性变体的信号传导部分)。在一些实施方案中，CAR含有抗体(例如，抗体片段)、跨膜结构域(其是或含有CD28的跨膜部分或其功能性变体)以及细胞内信号传导结构域(含有4-1BB的信号传导部分或其功能性变体和CD3ζ的信号传导部分或其功能性变体)。在一些此类实施方案中，受体进一步包括含有Ig分子(如人Ig分子)的一部分(如Ig铰链，例如IgG4铰链)的间隔子，如仅铰链间隔子。在一些实施方案中，重组受体在受体的C末端包含CD3 zeta(CD3ζ)。

2.多链CAR

在一些实施方案中，由经修饰的T细胞刺激相关基因座的核酸序列编码的重组受体可以是多链CAR。在一些实施方案中，如果包含两条或更多条多肽链的多链CAR在细胞中表达，则至少一条多肽链由经修饰的T细胞刺激相关基因座编码。在一些方面，用于引入编码多链CAR的一条或多条链的核酸序列的多核苷酸可以包括本文在第II.B节中所述的任一种。在一些方面，多核苷酸(例如，模板多核苷酸)含有编码多链CAR或其部分的至少一条链(如多链CAR的至少一种多肽的至少一部分)的转基因。在一些方面，转基因还包括编码不同或另外的多肽(例如，多链CAR的另一条或另外的链)或另外的分子(如本文在第IV.B.2中所述的那些)的序列。在一些方面，可以引入另外的多核苷酸(例如，另外的模板多核苷酸)，其编码多链CAR的另外的组分。在一些方面，另外的多核苷酸可以是本文例如在第II.B.2节中所述的任何多核苷酸或其修饰形式，如包含不同的同源臂用于靶向核酸以供整合于不同的基因组基因座处的多核苷酸。

在一些实施方案中，所提供的工程化细胞包括表达多链受体(如多链CAR)的细胞。在一些实施方案中，在所述细胞上示例性多链CAR可以含有两种或更多种基因工程化的受体，它们可以一起构成功能性重组受体。在一些方面，组合中的各种多肽链可以执行CAR的功能或活性，和/或调控、控制或调节CAR的功能和/或活性。在一些方面，多链CAR可以含有两条或更多条多肽链，每条多肽链识别相同或不同的抗原，并且通常每条多肽链包括不同的区域或结构域，如不同的细胞内信号传导组分。在一些方面，经修饰的T细胞刺激相关基因座可以包括编码多链受体(如多链CAR)的至少一条链的核酸序列。

在一些实施方案中，嵌合受体是包含两条或更多条多肽链的多链CAR或双链CAR。在一些实施方案中，多链受体是调控型CAR、条件活性型CAR或诱导型CAR。在一些方面，重组受体(如双链CAR)的两种或更多种多肽允许对重组受体的特异性、活性、抗原(或配体)结合、功能和/或表达进行空间或时间调控或控制。在此类实施方案的一些实施方案中，由经修饰的T细胞刺激相关基因座处的核酸序列编码的重组受体可以包括双链或多链受体的一条或多条链。在一些方面，在双链CAR中仅一条由经修饰的T细胞刺激相关基因座编码的情况下，另一条链可以由在不同基因组位置整合或为附加型的单独核酸分子编码。

在一些实施方案中，多链CAR可以包括激活和共刺激CAR的组合。例如，在一些实施方案中，多链CAR可以包括编码CAR的两种多肽，所述CAR靶向单独存在于非靶细胞(例如，正常细胞)上，但是仅一起存在于要治疗的疾病或病症的细胞上的两种不同抗原。在一些实施方案中，多链CAR可以包括激活和抑制性CAR，如如下的那些：其中激活CAR与在正常或未患病细胞和要治疗的疾病或病症的细胞两者上表达的一种抗原结合，并且抑制性CAR与仅在正常细胞或不期望治疗的细胞上表达的另一种抗原结合。在一些方面，多链CAR可以包括编码能够被调控、调节或控制的CAR的一种或多种多肽。

在一些实施方案中，多链CAR包括编码CAR的一个或多个结构域或区域的一条或多条多肽链。在一些方面，组合中的各种多肽链可以包含CAR。在一些实施方案中，在CAR中存在一个或多个另外的结构域或区域。在一些实施方案中，使用存在于多链CAR的一条或多条多肽链中的各个结构域或区域来调控、控制或调节CAR的功能和/或活性。在一些实施方案中，工程化细胞表达含有不同组分、结构域或区域的两条或更多条多肽链。在一些方面，两条或更多条多肽链允许对重组受体的特异性、活性、抗原(或配体)结合、功能和/或表达进行空间或时间调控或控制。在涉及多于一种多肽(例如，2种或更多种多肽)的多链CAR的一些实施方案中，编码至少一种多肽的核酸序列被靶向以供整合于内源T细胞刺激相关基因座处。在一些实施方案中，编码另外的分子或多肽(例如，多链CAR的另外的多肽链或另外的分子)的核酸序列可以例如凭借放置在用于靶向的同一多核苷酸上被靶向于相同的基因座处。在一些实施方案中，编码另外的分子或多肽的核酸序列被靶向于不同的基因座处或通过不同的方法递送。

在一些方面，编码CAR的结构域或区域的一条或多条多肽链可以靶向一种或多种抗原或分子。示例性多链CAR包括例如以下文献中所述的那些：国际专利申请公开号WO2014055668或Fedorov等人,Sci.Transl.Medicine,Sci Transl Med.(2013)5(215):215ra172；Sadelain,Curr Opin Immunol.(2016)41:68–76；Wang等人(2017)Front.Immunol.8:1934；Mirzaei等人(2017)Front.Immunol.8:1850；Marin-Acevedo等人(2018)Journal of Hematology&Oncology 11:8；Fesnak等人(2016)Nat Rev Cancer.16(9):566–581；以及Abate-Daga和Davila,(2016)Molecular Therapy-Oncolytics 3,16014。

在一些实施方案中，工程化细胞可以表达重组受体(例如，CAR)的第一多肽链，其通常在与第一受体识别的抗原(例如，第一抗原)特异性结合后，能够将激活或刺激信号诱导至细胞。在一些实施方案中，细胞还可以表达重组受体(例如，CAR，在一些情况下称为嵌合共刺激受体)的第二多肽链，其通常在与第二多肽链识别的第二抗原特异性结合后，能够将共刺激信号诱导至免疫细胞。在一些实施方案中，第一抗原与第二抗原是相同的。在一些实施方案中，第一抗原与第二抗原是不同的。

在一些实施方案中，第一和/或第二多肽链能够将激活或刺激信号诱导至细胞。在一些实施方案中，受体包括含有ITAM或ITAM样基序的细胞内信号传导组分。在一些实施方案中，由第一多肽链诱导的激活涉及信号转导或细胞中蛋白质表达的变化，导致启动免疫反应(如ITAM磷酸化)和/或启动ITAM介导的信号转导级联、形成免疫突触和/或所结合受体(例如，CD4或CD8等)附近的分子的聚簇、激活一种或多种转录因子(如NF-κB和/或AP-1)、和/或诱导因子(如细胞因子)的基因表达、增殖和/或存活。在一些实施方案中，激活结构域被包括在多链CAR中的至少一种(如由经修饰的T细胞刺激相关基因座编码的多肽链)内，而共刺激组分由识别另一种抗原的另一种多肽提供。在一些实施方案中，工程化细胞可以包括多链CAR，包括均在同一细胞上表达的激活或刺激CAR、共刺激CAR(参见WO 2014/055668)。在一些方面，细胞表达一种或多种刺激或激活CAR(如由如本文例如在第IV.A节中所述的经修饰的T细胞刺激相关基因座编码的那些)、和/或共刺激CAR。

在一些实施方案中，第一和/或第二多肽链包括共刺激受体(如CD28、CD137(4-1BB)、OX40(CD134)、CD27、DAP10、DAP12、NKG2D、ICOS和/或其他共刺激受体)的细胞内信号传导区域或结构域。在一些实施方案中，第一和第二多肽链可以含有不同共刺激受体的一个或多个细胞内信号传导结构域。在一个实施方案中，第一多肽链含有CD28共刺激信号传导结构域，并且第二多肽链含有4-1BB共刺激信号传导区域，或反之亦然。

在一些实施方案中，第一和/或第二多肽链包括含有ITAM或ITAM样基序(如来自CD3zeta(CD3ζ)链或其片段或部分的那些)的细胞内信号传导结构域(如CD3ζ细胞内信号传导结构域)和共刺激受体的细胞内信号传导结构域两者。在一些实施方案中，第一多肽链含有包含ITAM或ITAM样基序的细胞内信号传导结构域，并且第二多肽链含有共刺激受体的细胞内信号传导结构域。与在同一细胞中诱导的激活或刺激信号组合的共刺激信号是导致免疫反应的共刺激信号，所述免疫反应如稳健且持续的免疫反应，如增加的基因表达，细胞因子和其他因子的分泌，以及T细胞介导的效应子功能(如细胞杀伤)。

在一些实施方案中，单独的第一多肽链的连接和单独的第二多肽链的连接都不会诱导稳健的免疫反应。在一些方面，如果仅连接一个受体，则细胞变得耐受抗原或对抗原无反应，或被抑制，和/或不被诱导增殖或分泌因子或实现效应子功能。然而，在一些此类实施方案中，在连接多条多肽链时，如在遇到表达第一和第二抗原的细胞时，实现所需反应，如完全免疫激活或刺激，例如如通过一种或多种细胞因子的分泌、增殖、持久性和/或执行免疫效应子功能(如靶细胞的细胞毒性杀伤)所指示的。

在一些实施方案中，多链CAR的一条或多条链可以包括抑制性CAR(iCAR，参见Fedorov等人,Sci.Transl.Medicine,5(215)(2013))，如识别除了与疾病或病症相关和/或对所述疾病或病症具特异性的抗原以外的抗原的CAR，由此通过靶向疾病的CAR递送的激活信号由于抑制性CAR与其配体的结合而有所减小或被抑制，例如以减小脱靶效应。在一些实施方案中，抑制性CAR可以由与刺激或激活CAR(例如，含有CD3zeta(CD3ζ)链或其片段或部分)相同的多核苷酸或由不同的多核苷酸编码。

在一些实施方案中，多链CAR的两条多肽链分别将激活和抑制性信号诱导至细胞，使得一条多肽链与其抗原的连接激活细胞或诱导反应，但是第二多肽链(例如，抑制性受体)与其抗原的连接诱导抑制或减弱该反应的信号。例子是激活CAR与抑制性CAR(iCAR)的组合。例如，这种策略可以用于例如降低在如下背景中的脱靶效应的可能性，在所述背景中激活CAR结合在疾病或病症中表达但也在正常细胞上表达的抗原，并且抑制性受体结合在正常细胞上表达但不在所述疾病或病症的细胞上表达的单独抗原。

在一些方面，在细胞中表达的另外的受体多肽还包括抑制性CAR(例如，iCAR)，并且包括减弱或抑制免疫反应(如细胞中ITAM和/或共同刺激促进的反应)的细胞内组分。此类细胞内信号传导组分的示例是在免疫检查点分子(包括PDCD1、CTLA4、LAG3、BTLA、OX2R、TIM-3、TIGIT、LAIR-1、PGE2受体、EP2/4腺苷受体(包括A2AR))上发现的那些组分。在一些方面，工程化细胞包括抑制性CAR，所述抑制性CAR包含这样的抑制性分子的信号传导结构域或源自这样的抑制性分子的信号传导结构域，使得其起到减弱细胞的应答(例如，由激活和/或共刺激性CAR诱导)的作用。

在一些实施方案中，多链CAR可以用于如下情况：其中与特定疾病或病症相关的抗原在未患病细胞上表达和/或在工程化细胞本身上表达，所述表达为瞬时表达(例如，在与基因工程化相关的刺激后)或永久表达。在此类情况下，通过需要连接两种分开的和单独特异性多肽，可以改善特异性、选择性和/或功效。

在一些实施方案中，多种抗原(例如，第一和第二抗原)在所靶向的细胞、组织或疾病或病症上(如在癌细胞上)表达。在一些方面，细胞、组织、疾病或病症是多发性骨髓瘤或多发性骨髓瘤细胞。在一些实施方案中，多种抗原中的一种或多种通常也在不需要用细胞疗法靶向的细胞(例如正常或未患病细胞或组织，和/或工程化细胞本身)上表达。在此类实施方案中，通过需要连接多个受体以实现细胞的反应，实现特异性和/或功效。

在一些实施方案中，第一和/或第二多肽链中的一条可以调控另一条多肽链的表达、抗原结合和/或活性。

在一些方面，可以使用两条多肽链的系统来调控至少一条多肽链的表达。在一些实施方案中，第一多肽链含有与调节分子(如转录因子)连接的第一配体(例如，抗原)结合结构域，其经由调控型切割元件来连接。在一些方面，调控型切割元件源自经修饰的Notch受体(例如，synNotch)，它能够在接合第一配体(例如，抗原)结合结构域后切割并释放细胞内结构域。在一些方面，第二多肽链含有与细胞内信号传导组分连接的第二配体(例如，抗原)结合结构域，所述细胞内信号传导组分能够将激活或刺激信号诱导至细胞，如含有ITAM的细胞内信号传导结构域。在一些方面，编码第二多肽链的核酸序列与能够由特定转录因子(例如，第一多肽链编码的转录因子)调节的转录调节元件(例如，启动子)可操作地连接。在一些方面，配体或抗原与第一配体(例如，抗原)结合结构域的接合导致转录因子的蛋白水解释放，这又可以诱导第二多肽链的表达(参见Roybal等人(2016)Cell164:770–779；Morsut等人(2016)Cell 164:780–791)。在一些实施方案中，第一抗原与第二抗原是不同的。

在一些情形中，重组受体(例如，CAR)能够被调控、控制、诱导或抑制，可能期望优化使用重组受体的疗法的安全性和功效。在一些实施方案中，多链CAR是调控型CAR。在一些方面，本文提供了工程化细胞，其包含能够被调控的CAR。能够被调控的重组受体(本文中也称为“调控型重组受体”或“调控型CAR”)是指多种多肽，如一组至少两条多肽链，其在工程化细胞(例如，工程化T细胞)中表达时为所述工程化细胞提供在诱导物的控制下产生细胞内信号的能力。

在一些实施方案中，调控型CAR的多肽含有多聚化结构域，所述多聚化结构域能够与另一个多聚化结构域发生多聚化。在一些实施方案中，多聚化结构域能够在与诱导物结合后发生多聚化。例如，多聚化结构域可以结合诱导物，如化学诱导物，从而导致调控型CAR的多肽凭借多聚化结构域的多聚化而发生多聚化，从而产生调控型CAR。

在一些实施方案中，调控型CAR的一种多肽包含配体(例如，抗原)结合结构域，并且调控型CAR中不同的多肽包含细胞内信号传导区域，其中两种多肽凭借多聚化结构域的多聚化而发生的多聚化产生包含配体结合结构域和细胞内信号传导区域的调控型CAR。在一些实施方案中，多聚化可以诱导、调节、激活、介导和/或促进含有调控型CAR的工程化细胞中的信号。在一些实施方案中，诱导物与调控型CAR中至少一种多肽的多聚化结构域结合并诱导调控型CAR的构象变化，其中构象变化激活信号传导。在一些实施方案中，配体与此类嵌合受体的结合诱导多肽链中的构象变化，在一些情况下，所述构象变化包括多肽链寡聚化，从而可以使受体胜任细胞内信号传导。

在一些实施方案中，诱导物发挥功能以偶联或多聚化(例如，二聚化)工程化细胞中表达的调控型CAR的一组至少两条多肽链，以使调控型CAR产生所需细胞内信号，如在调控型CAR与靶抗原的相互作用期间。调控型CAR的至少两种多肽通过诱导物进行的偶联或多聚化在诱导物与多聚化结构域结合后实现。例如，在一些实施方案中，工程化细胞中的第一多肽和第二多肽可以各自包含能够结合诱导物的多聚化结构域。在多聚化结构域与诱导物结合后，第一多肽和第二多肽偶联在一起以产生所需的细胞内信号。在一些实施方案中，多聚化结构域位于多肽的细胞内部分上。在一些实施方案中，多聚化结构域位于多肽的胞外部分上。

在一些实施方案中，调控型CAR的一组至少两种多肽包含两种、三种、四种或五种或更多种多肽。在一些实施方案中，所述组中的至少两种多肽是相同多肽，例如，包含细胞内信号传导区域和多聚化结构域的两种、三种或更多种相同多肽。在一些实施方案中，所述组中的至少两种多肽是不同多肽，例如，包含配体(例如，抗原)结合结构域和多聚化结构域的第一多肽以及包含细胞内信号传导区域和多聚化结构域的第二多肽。在一些实施方案中，细胞内信号在诱导物的存在下产生。在一些实施方案中，细胞内信号在不存在诱导物的情况下产生，例如，诱导物干扰调控型CAR中至少两种多肽的多聚化，从而阻止通过调控型CAR进行细胞内信号传导。

在一些实施方案中，将多链CAR即编码至少一条多肽链的核酸序列例如通过HDR整合至内源T细胞刺激相关基因座中。在一些实施方案中，编码两条或更多条单独多肽链中的另一条的核酸序列可以被靶向于同一基因座内(例如，同一转基因内，并且可以置于编码另一条多肽链的核酸序列的5'或3')，或不同的基因座处。在一些方面，编码两条或更多条单独多肽链中的另一条的核酸序列的引入可以经由不同的递送方法，例如通过瞬时递送方法或作为附加型核酸分子。

在一些实施方案中，多链CAR的一条或多条多肽链可以包括多聚化结构域。在一些实施方案中，多聚化结构域可以在结合诱导物后发生多聚化(例如，二聚化)。本文考虑的诱导物包括但不限于化学诱导物或蛋白质(例如，半胱天冬酶)。在一些实施方案中，诱导物选自雌激素、糖皮质激素、维生素D、类固醇、四环素、环孢菌素、雷帕霉素、香豆霉素、赤霉素、FK1012、FK506、FKCsA、rimiducid或HaXS或其类似物或衍生物。在一些实施方案中，诱导物是AP20187或AP20187类似物，如AP1510。

在一些实施方案中，多聚化结构域可以在结合诱导物(如本文提供的诱导物)后发生多聚化(例如，二聚化)。在一些实施方案中，多聚化结构域可以来自FKBP、亲环蛋白受体、类固醇受体、四环素受体、雌激素受体、糖皮质激素受体、维生素D受体、钙神经素A、CyP-Fas、mTOR的FRB结构域、GyrB、GAI、GID1、Snap-tag和/或HaloTag或其部分或衍生物。在一些实施方案中，多聚化结构域是FK506结合蛋白(FKBP)或其衍生物、或其片段和/或多聚体，如FKBP12v36。在一些实施方案中，FKBP包含氨基酸序列GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKMDSSRDRNKPFKFMLGKQEVIR GWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE(SEQ ID NO:293)。在一些实施方案中，FKBP12v36包含氨基酸序列GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIR GWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE(SEQ ID NO:294)。

示例性诱导物和相应的多聚化结构域是已知的，例如如以下文献中所述：美国专利申请公开号2016/0046700、Clackson等人(1998)Proc Natl Acad Sci U S A.95(18):10437-42；Spencer等人(1993)Science 262(5136):1019-24；Farrar等人(1996)Nature383(6596):178-81；Miyamoto等人(2012)Nature Chemical Biology 8(5):465-70；Erhart等人(2013)Chemistry and Biology 20(4):549-57。在一些实施方案中，诱导物是rimiducid(也称为AP1903；CAS索引名：2-哌啶甲酸1-[(2S)-1-氧代-2-(3,4,5-三甲氧基苯基)丁基]-,1,2-乙二基双[亚氨基(2-氧代-2,1-乙二基)氧基-3,1-亚苯基[(1R)-3-(3,4-二甲氧基苯基)亚丙基]]酯，[2S-[1(R*),2R*[S*[S*[1(R*),2R]]]]]-(9Cl)；CAS登记号：195514-63-7；分子式：C₇₈H₉₈N₄O₂₀；分子量：1411.65)，并且多聚化结构域是FK506结合蛋白(FKBP)。

在一些实施方案中，工程化细胞的细胞膜对于诱导物是不可渗透的。在一些实施方案中，工程化细胞的细胞膜对于诱导物是可渗透的。

在一些实施方案中，在不存在诱导物的情况下，调控型CAR并非多聚体或二聚体的一部分。在结合诱导物后，多聚化结构域可以发生多聚化，例如，二聚化。在一些方面，多聚化结构域的多聚化导致调控型CAR的多肽与调控型CAR的另一种多肽的多聚化，例如调控型CAR的至少两种多肽的多聚复合物。在一些实施方案中，多聚化结构域的多聚化可以凭借诱导信号传导组分的物理靠近或者多聚体或二聚体的形成来诱导、调节、激活、介导和/或促进信号转导。在一些实施方案中，在结合诱导物后，多聚化结构域的多聚化还诱导与多聚化结构域直接或间接连接的信号传导结构域的多聚化。在一些实施方案中，多聚化诱导、调节、激活、介导和/或促进经由信号传导结构域或区域的信号传导。在一些实施方案中，与多聚化结构域连接的信号传导结构域或区域是细胞内信号传导区域。

在一些实施方案中，多聚化结构域在细胞内或者与工程化细胞(例如，工程化T细胞)的细胞内或胞质侧上的细胞膜缔合。在一些方面，细胞内多聚化结构域与膜缔合结构域(例如，脂质连接结构域，如豆蔻酰化结构域、棕榈酰化结构域、异戊烯化结构域或跨膜结构域)直接或间接连接。在一些实施方案中，多聚化结构域在细胞内，并且经由跨膜结构域与胞外配体(例如，抗原)结合结构域连接。在一些实施方案中，细胞内多聚化结构域与细胞内信号传导区域直接或间接连接。在一些方面，诱导的多聚化结构域的多聚化也使细胞内信号传导区域彼此靠近，从而允许多聚化(例如，二聚化)，并刺激细胞内信号传导。在一些实施方案中，调控型CAR的多肽包含跨膜结构域、一个或多个细胞内信号传导区域以及一个或多个多聚化结构域，它们各自直接或间接连接。

在一些实施方案中，多聚化结构域在细胞外或者与工程化细胞(例如，工程化T细胞)的细胞外侧上的细胞膜缔合。在一些方面，胞外多聚化结构域与膜缔合结构域(例如，脂质连接结构域，如豆蔻酰化结构域、棕榈酰化结构域、异戊烯化结构域或跨膜结构域)直接或间接连接。在一些实施方案中，胞外多聚化结构域与配体结合结构域(例如，抗原结合结构域)直接或间接连接，如用于结合至与疾病相关的抗原。在一些实施方案中，多聚化结构域在细胞外，并且经由跨膜结构域与细胞内信号传导区域连接。

在一些方面，膜缔合结构域是现有跨膜蛋白的跨膜结构域。在一些例子中，膜缔合结构域是本文所述的任何跨膜结构域。在一些方面，膜缔合结构域含有蛋白质-蛋白质相互作用基序或跨膜序列。

在一些方面，膜缔合结构域是酰化结构域，如豆蔻酰化结构域、棕榈酰化结构域、异戊烯化结构域(即，法尼基化、牻牛儿基-牻牛儿基化、CAAX盒)。例如，膜缔合结构域可以是存在于蛋白质的N末端或C末端的酰化序列基序。此类结构域含有可以由酰基转移酶识别的特定序列基序，所述酰基转移酶将酰基部分转移至含有所述结构域的多肽。例如，酰化基序可以被单一酰基部分修饰(在一些情况下，所述酰基部分之后有几个带正电的残基(例如，人c-Src：MGSNKSKPKDASQRRR(SEQ ID NO:295)，以改善与阴离子脂质头基的缔合)。在其他方面，乙酰化基序能够被多个酰基部分修饰。例如，双酰化区域位于某些蛋白激酶的N末端区域内，所述蛋白激酶如Src家族成员的子集(例如，Yes、Fyn、Lck)和G蛋白α亚基。示例性双酰化区域含有序列基序Met-Gly-Cys-Xaa-Cys(SEQ ID NO:296)，其中Met被切割，Gly发生N-酰化，并且一个Cys残基发生S-酰化。Gly通常发生豆蔻酰化，并且Cys可以发生棕榈酰化。

其他示例性酰化区域包括可以用C15或O10异戊二烯基部分修饰的序列基序Cys-Ala-Xaa(所谓的“CAAX盒”；SEQ ID NO:297)，并且是已知的(参见例如，Gauthier-Campbell等人(2004)Molecular Biology of the Cell 15:2205-2217；Glabati等人(1994)Biochem.J.303:697-700和Zlakine等人(1997)J.Cell Science 110:673-679；tenKlooster等人(2007)Biology of the Cell 99:1-12；Vincent等人(2003)NatureBiotechnology21:936-40)。在一些实施方案中，酰基部分是C1-C20烷基、C2-C20烯基、C2-C20炔基、C3-C6环烷基、C1-C4卤代烷基、C4-C12环烷基烷基、芳基、取代的芳基或芳基(C1-C4)烷基。在一些实施方案中，含有酰基的部分是脂肪酸，并且脂肪酸部分的例子是丙基(C3)、丁基(C4)、戊基(C5)、己基(C6)、庚基(C7)、辛基(C8)、壬基(C9)、癸基(C10)、十一烷基(C11)、月桂基(C12)、肉豆蔻基(C14)、棕榈基(C16)、硬脂酰基(C18)、二十烷基(C20)、山嵛基(C22)和木蜡基部分(C24)，并且每部分可以含有0、1、2、3、4、5、6、7或8个不饱和键(即，双键)。在一些例子中，酰基部分是脂质分子，如磷脂酰基脂质(例如，磷脂酰丝氨酸、磷脂酰肌醇、磷脂酰乙醇胺、磷脂酰胆碱)、鞘酯(例如，鞘磷脂、鞘氨醇、神经酰胺、神经节苷脂、脑苷脂)或其修饰的形式。在某些实施方案中，一个、两个、三个、四个或五个或更多个酰基部分与膜缔合结构域连接。

在一些方面，膜缔合结构域是促进糖脂(也称为糖基磷脂酰肌醇或GPI)的添加的结构域。在一些方面，GPI分子通过转酰胺化反应在翻译后附接至蛋白质靶标，这导致羧基末端GPI信号序列的切割(参见例如，White等人(2000)J.Cell Sci.113:721)和已合成的GPI锚分子同时转移到新形成的羧基末端氨基酸(参见例如，Varki A等人,编辑.Essentials of Glycobiology.Cold Spring Harbor(NY):Cold Spring HarborLaboratory Press；1999.第10章,Glycophospholipid Anchors.可从https://www.ncbi.nlm.nih.gov/books/NBK20711/获得)。在某些实施方案中，膜缔合结构域是GPI信号序列。

在一些实施方案中，如本文提供的多聚化结构域连接至细胞内信号传导区域，例如初级信号传导区域和/或共刺激信号传导结构域。在一些实施方案中，多聚化结构域在细胞外，并且经由跨膜结构域与细胞内信号传导区域连接。在一些实施方案中，多聚化结构域在细胞内，并且经由跨膜结构域与配体(例如，抗原)结合结构域连接。配体结合结构域和跨膜结构域可以直接或间接连接。在一些实施方案中，配体结合结构域与跨膜通过间隔子(如本文所述的任一种)连接。在一些实施方案中，多聚化结构域是FK506结合蛋白(FKBP)或其衍生物或片段，如FKBP12v36。在一些例子中，在引入诱导物(如rimiducid)后，调控型CAR的多肽发生多聚化(例如，二聚化)，从而刺激与多聚化结构域缔合的信号传导结构域并形成多聚复合物。多聚复合物的形成导致诱导、调节、刺激、激活、介导和/或促进经由细胞内信号传导区域的信号。

在一些实施方案中，经由调控型CAR的信号传导可以以条件方式经由条件多聚化来调节。例如，调控型CAR的多肽的多聚化结构域可以结合诱导物以进行多聚化，并且诱导物可以从外源提供。在一些方面，在结合诱导物后，多聚化结构域发生多聚化并诱导、调节、激活、介导和/或促进经由信号传导结构域的信号传导。例如，可以从外源施用诱导物，从而控制提供至含有调控型CAR的工程化细胞的信号的位置和持续时间。在一些实施方案中，调控型CAR的多肽的多聚化结构域可以结合诱导物以进行多聚化，并且诱导物可以内源提供。例如，诱导物可以由工程化细胞(例如，工程化T细胞)在诱导型或条件型启动子的控制下从重组表达载体或从工程化细胞的基因组内源产生，从而控制提供至含有调控型CAR的工程化细胞的信号的位置和持续时间。

在一些实施方案中，使用自杀开关控制调控型CAR。示例性嵌合受体利用诱导型胱天蛋白酶-9(iCasp9)系统，包含人胱天蛋白酶-9与经修饰的FKBP二聚化结构域的融合物，从而允许与诱导物(例如，AP1903)结合后的条件二聚化。在通过结合诱导物进行二聚化后，胱天蛋白酶-9被激活并导致表达嵌合受体的细胞的细胞凋亡和细胞死亡(参见例如，DiStasi等人(2011)N.Engl.J.Med.365:1673–1683)。

在一些实施方案中，示例性调控型CAR包括：(1)调控型CAR的第一多肽，其包含：(i)细胞内信号传导区域；和(ii)能够结合诱导物的至少一个多聚化结构域；以及(2)调控型CAR的第二多肽，其包含：(i)配体(例如，抗原)结合结构域；(ii)跨膜结构域；和(iii)能结合诱导物的至少一个多聚化结构域。在一些实施方案中，示例性调控型CAR包括：(1)调控型CAR的第一多肽，其包含：(i)跨膜结构域或酰化结构域；(ii)细胞内信号传导区域；和(iii)能结合诱导物的至少一个多聚化结构域；以及(2)调控型CAR的第二多肽，其包含：(i)配体(例如，抗原)结合结构域；(ii)跨膜结构域；和(iii)能结合诱导物的至少一个多聚化结构域。在一些实施方案中，细胞内信号传导区域还包含共刺激信号传导结构域。在一些实施方案中，第二多肽还包含共刺激信号传导结构域。在一些实施方案中，两个多肽上的至少一个多聚化结构域在细胞内。在一些实施方案中，两个多肽上的至少一个多聚化结构域在细胞外。

在一些实施方案中，示例性调控型CAR包括：(1)调控型CAR的第一多肽，其包含：(i)能结合诱导物的至少一个胞外多聚化结构域；(ii)跨膜结构域；和(iii)细胞内信号传导区域；以及(2)调控型CAR的第二多肽，其包含：(i)配体(例如，抗原)结合结构域；(ii)能结合诱导物的至少一个胞外多聚化结构域；和(iii)跨膜结构域、酰化结构域或GPI信号序列。在一些实施方案中，细胞内信号传导区域还包含共刺激信号传导结构域。在一些实施方案中，第二多肽还包含共刺激信号传导结构域。

在一些实施方案中，示例性调控型CAR包括：(1)调控型CAR的第一多肽，其包含：(i)跨膜结构域或酰化结构域；(ii)至少一个共刺激结构域；(iii)能够结合诱导物的多聚化结构域，和(iv)细胞内信号传导区域；和(iii)至少一个共刺激结构域；以及(2)调控型CAR的第二多肽，其包含：(i)配体(例如，抗原)结合结构域；(ii)跨膜结构域；(iii)至少一个共刺激结构域；和(iv)能结合诱导物的至少一个胞外多聚化结构域。

在一些方面，示例性调控型CAR中所述的任何区域和/或结构域可以按多种不同顺序排序。在一些方面，一种或多种调控型CAR的各种多肽含有在细胞膜同一侧上的多聚化结构域，例如，两种或更多种多肽中的多聚化结构域都在细胞内或都在细胞外。

可调节CAR的变化是已知的，例如，描述于以下文献中：美国专利申请公开号2014/0286987、美国专利申请公开号2015/0266973、国际专利申请公开号WO 2014/127261以及国际专利申请公开号WO 2015/142675。

3.嵌合自身抗体受体(CAAR)

在一些实施方案中，由经修饰的T细胞刺激相关基因座编码的重组受体是嵌合自身抗体受体(CAAR)。在一些实施方案中，CAAR结合(例如特异性结合)或识别自身抗体。在一些实施方案中，表达CAAR的细胞(如工程化以表达CAAR的T细胞)可以用于结合至并杀伤自身抗体表达细胞，而不是表达正常抗体的细胞。在一些实施方案中，CAAR表达细胞可以用于治疗与自身抗原的表达相关的自身免疫性疾病，例如自身免疫性疾病。在一些实施方案中，CAAR表达细胞可以靶向最终产生自身抗体并在其细胞表面上展示自身抗体的B细胞，将这些B细胞标记为用于治疗性干预的疾病特异性靶标。在一些实施方案中，CAAR表达细胞可以用于通过使用抗原特异性嵌合自身抗体受体靶向引起疾病的B细胞，有效靶向和杀伤自身免疫性疾病中的致病性B细胞。在一些实施方案中，重组受体是CAAR，例如美国专利申请公开号US 2017/0051035中所述的任何一种。

在一些实施方案中，CAAR包含自身抗体结合结构域、跨膜结构域和一个或多个细胞内信号传导区域或结构域(也可互换地称为胞质信号传导结构域或区域)。在一些实施方案中，细胞内信号传导区域包含细胞内信号传导结构域。在一些实施方案中，细胞内信号传导结构域是或包含初级信号传导区域、能够在T细胞中刺激和/或诱导初级激活信号的信号传导结构域、T细胞受体(TCR)组分的信号传导结构域(例如，CD3-zeta(CD3ζ)链或其功能性变体或信号传导部分的细胞内信号传导结构域或区域)和/或包含免疫受体酪氨酸激活基序(ITAM)的信号传导结构域。

在一些实施方案中，所述自身抗体结合结构域包含自身抗原或其片段。自身抗原的选择可以取决于所靶向的自身抗体的类型。例如，所述自身抗原的选择可能是由于其识别与特定疾病状态(例如自身免疫性疾病，例如自身抗体介导的自身免疫性疾病)相关的靶细胞(例如B细胞)上的自身抗体。在一些实施方案中，自身免疫性疾病包括寻常型天疱疮(PV)。示例性自身抗原包括桥粒芯糖蛋白1(Dsg1)和Dsg3。

4.T细胞受体(TCR)

在一些实施方案中，所编码的重组受体是识别靶多肽(如肿瘤、病毒或自身免疫蛋白的抗原)的细胞内和/或肽表位或T细胞表位的T细胞受体(TCR)或其抗原结合部分(如重组TCR)。在一些方面，所编码的受体是或包括重组TCR。在一些方面，重组TCR是单链TCR或多链TCR(如双链TCR)。

在一些实施方案中，“T细胞受体”或“TCR”是如下分子，所述分子含有可变α和β链(也分别称为TCRα和TCRβ)或可变γ和δ链(也分别称为TCRγ和TCRδ)或其抗原结合部分，并且能够特异性结合至与MHC分子结合的肽。在一些实施方案中，所述TCR呈αβ形式。在一些实施方案中，以αβ和γδ形式存在的TCR一般在结构上相似，但是表达它们的T细胞可以具有不同的解剖位置或功能。TCR可以在细胞的表面上发现或以可溶形式发现。在一些实施方案中，TCR是双链TCR，其包含TCRα和TCRβ；或TCRγ和TCRδ链。在一些方面，发现TCR在T细胞(或T淋巴细胞)的表面上，在此处它通常负责识别与主要组织相容性复合物(MHC)分子结合的抗原。

在一些实施方案中，TCR涵盖全长TCR或其抗原结合部分或抗原结合片段。在一些实施方案中，TCR是完整或全长TCR，包括呈αβ形式或γδ形式的TCR。在一些实施方案中，TCR是这样的抗原结合部分，其少于全长TCR但与在MHC分子中结合的特定肽结合(如与MHC-肽复合物结合)。在一些情况下，TCR的抗原结合部分或片段可以仅含有全长或完整TCR的结构性结构域的一部分，但是仍能够结合与完整TCR结合的肽表位(如MHC-肽复合物)。在一些情况下，抗原结合部分含有TCR或其抗原结合片段的可变结构域(如TCR的可变α(Vα)链和可变β(Vβ)链)，足以形成用于与特定MHC-肽复合物结合的结合位点。

在一些实施方案中，所述编码的重组受体是TCR，并且所述经修饰的基因座编码所述TCR的链。在一些实施方案中，所述编码的重组受体是双链TCR，并且所述经修饰的基因座编码所述双链TCR的一条链。在一些实施方案中，所述编码的重组受体是双链TCR，并且所述经修饰的基因座编码所述双链TCR的两条链。在一些实施方案中，所述编码的重组受体是包含α链和β链的TCR，并且所述经修饰的基因座编码TCR的α链和β链。在一些实施方案中，编码TCR的α链和TCR的β链的核酸序列由多顺顺子元件隔开。

在一些实施方案中，所编码的TCR的可变结构域含有超变环或互补决定区(CDR)，其通常是抗原识别和结合能力和特异性的主要贡献者。在一些实施方案中，TCR的CDR或其组合形成给定TCR分子的全部或基本上全部的抗原结合位点。TCR链的可变区内的各个CDR通常由框架区(FR)隔开，与CDR相比，所述框架区通常在TCR分子之间展示较低可变性(参见例如Jores等人,Proc.Nat'l Acad.Sci.U.S.A.87:9138,1990；Chothia等人,EMBO J.7:3745,1988；还参见Lefranc等人,Dev.Comp.Immunol.27:55,2003)。在一些实施方案中，CDR3是负责抗原结合或特异性的主要CDR，或者是在给定TCR可变区的用于肽-MHC复合物的加工肽部分的抗原识别和/或用于与其相互作用的三个CDR中最重要的CDR。在一些情境下，α链的CDR1可以与某些抗原肽的N末端部分相互作用。在一些情境下，β链的CDR1可以与肽的C末端部分相互作用。在一些情境下，CDR2对与MHC-肽复合物的MHC部分的相互作用或识别具有最强的作用或者是主要的负责CDR。在一些实施方案中，β链的可变区可以含有另外的高变区(CDR4或HVR4)，其通常参与超抗原结合而非抗原识别(Kotb(1995)ClinicalMicrobiology Reviews,8:411-426)。

在一些实施方案中，所编码的TCR还可以含有恒定结构域、跨膜结构域和/或短胞质尾(参见例如，Janeway等人,Immunobiology:The Immune System in Health andDisease,第3版,Current Biology Publications,第4页:33,1997)。在一些方面，TCR的每条链可以具有一个N末端免疫球蛋白可变结构域、一个免疫球蛋白恒定结构域、跨膜区域和位于C末端的短胞质尾。在一些实施方案中，TCR与参与介导信号转导的CD3复合物的不变蛋白质缔合。

在一些实施方案中，所编码的TCR链含有一个或多个恒定结构域。例如，给定TCR链(例如，α链或β链)的胞外部分可以含有与细胞膜相邻的两个免疫球蛋白样结构域，如可变结构域(例如，Vα或Vβ；通常为基于Kabat编号的氨基酸1至116，Kabat等人,“Sequences ofProteins of Immunological Interest”,US Dept.Health and Human Services,PublicHealth Service National Institutes of Health,1991,第5版)和恒定结构域(例如，α链恒定结构域或Cα，通常为基于Kabat编号的链的位置117至259；或β链恒定结构域或C_β，通常为基于Kabat的链的位置117至295)。例如，在一些情况下，由两条链形成的TCR的胞外部分部分含有两个膜近端恒定结构域和两个膜远端可变结构域，其中可变结构域各自含有CDR。TCR的恒定结构域可含有短连接序列，其中半胱氨酸残基形成二硫键，由此连接TCR的两条链。在一些实施方案中，TCR可在每条α和β链中具有另外的半胱氨酸残基，使得TCR在恒定结构域中含有两个二硫键。

在一些实施方案中，所编码的TCR链含有跨膜结构域。在一些实施方案中，所述跨膜结构域带正电荷。在一些情况下，所述TCR链含有胞质尾。在一些情况下，结构允许TCR与其他分子(如CD3和其亚基)缔合。例如，含有恒定结构域与跨膜区域的TCR可以将蛋白质锚定在细胞膜中并与CD3信号传导设备或复合物的不变亚基缔合。CD3信号传导亚基(例如，CD3γ、CD3δ、CD3ε和CD3ζ链)的细胞内尾含有TCR复合物的信号传导能力中所涉及的一个或多个免疫受体酪氨酸激活基序或ITAM。

在一些实施方案中，所编码的TCR含有各种结构域或区域。在一些情况下，确切的结构域或区域可以根据特定结构或同源性建模或者用于描述特定结构域的其他特征而变化。应理解，提及氨基酸(包括提及用于描述重组受体(例如，TCR)的结构域组织的作为SEQID NO所示的特定序列)是出于说明性目的，并且不意图限制所提供的实施方案的范围。在一些情况下，特定结构域(例如，可变或恒定)可以长或短几个氨基酸(如一个、两个、三个或四个)。在一些方面，TCR的残基是已知的或者可以根据国际免疫遗传学信息系统(IMGT)编号系统来鉴定(参见例如，www.imgt.org；还参见，Lefranc等人(2003)Developmental andComparative Immunology,27；55-77；以及The T Cell Factsbook第2版,Lefranc andLeFranc Academic Press 2001)。使用此系统，TCR Vα链和/或Vβ链内的CDR1序列对应于残基编号27-38(包含端值)之间存在的氨基酸，TCR Vα链和/或Vβ链内的CDR2序列对应于残基编号56-65(包含端值)之间存在的氨基酸，并且TCR Vα链和/或Vβ链内的CDR3序列对应于残基编号105-117(包含端值)之间存在的氨基酸。

在一些实施方案中，TCR的α链和β链各自还含有恒定结构域。在一些实施方案中，α链恒定结构域(Cα)和β链恒定结构域(Cβ)单独地是哺乳动物(如人或鼠)恒定结构域。在一些实施方案中，恒定结构域与细胞膜相邻。例如，在一些情况下，由两条链形成的所编码的TCR的胞外部分含有两个膜近端恒定结构域和两个膜远端可变结构域，其中可变结构域各自含有CDR。

在一些实施方案中，Cα和Cβ结构域中的每一个是人的。在一些实施方案中，Cα是由TRAC基因编码(IMGT命名法)，或者是其变体。在一些实施方案中，Cα具有或包含SEQ ID NO:91或92所示的氨基酸序列或者与SEQ ID NO:91或92展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方案中，Cα具有或包含SEQ ID NO:91或92中任一个所示的氨基酸序列。在一些实施方案中，Cα具有或包含由SEQ ID NO:93所示的核酸序列编码的氨基酸序列(例如，成熟多肽)或者与由SEQ ID NO:93所示的核酸序列编码的氨基酸序列(例如，成熟多肽)展现至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方案中，Cβ是由TRBC1或TRBC2基因编码(IMGT命名法)，或者是其变体。在一些实施方案中，Cβ具有或包含SEQ ID NO:94、95或96所示的氨基酸序列或者与SEQ ID NO:94、95或96展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方案中，Cβ具有或包含SEQ ID NO:94、95或96所示的氨基酸序列。在一些实施方案中，Cβ具有或包含由SEQ ID NO:97所示的核酸序列编码的氨基酸序列(例如，成熟多肽)或者与由SEQ ID NO:97所示的核酸序列编码的氨基酸序列(例如，成熟多肽)展现至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。

在一些实施方案中，任何所提供的TCR或其抗原结合片段可以是人/小鼠嵌合TCR。在一些情况下，TCR或其抗原结合片段具有包含小鼠恒定区的α链和/或β链。在一些方面，Cα和/或Cβ区是小鼠恒定区。

在一些任何此类实施方案中，TCR或其抗原结合片段在α链和/或β链中含有一个或多个修饰，使得当TCR或其抗原结合片段在细胞中表达时，TCRα链和β链与内源TCRα链和β链之间的错配频率下降，TCRα链和β链的表达增加，和/或TCRα链和β链的稳定性增加。在一些实施方案中，所述一个或多个修饰是在Cα区和/或Cβ区中的一个或多个氨基酸的替代、缺失或插入。在一些方面，所述一个或多个修饰含有一个或多个替代，以引入能够在α链与β链之间形成一个或多个非天然二硫桥的一个或多个半胱氨酸残基。

在一些任何此类实施方案中，TCR或其抗原结合片段含有Cα区，所述Cα区含有在对应于位置48的位置处的半胱氨酸，其中编号如SEQ ID NO:92所示；和/或Cβ区，所述Cβ区含有在对应于位置57的位置处的半胱氨酸，其中编号如SEQ ID NO:96所示。在一些实施方案中，所述Cα区含有SEQ ID NO:91或92中任一个中所示的氨基酸序列或者与其具有至少90％序列同一性的含有能够与β链形成非天然二硫键的一个或多个半胱氨酸残基的氨基酸序列；和/或所述Cβ区含有SEQ ID NO:94、95或96中任一个所示的氨基酸序列或者与其具有至少90％序列同一性的含有能够与α链形成非天然二硫键的一个或多个半胱氨酸残基的氨基酸序列。

在任何此类实施方案的一些实施方案中，所编码的TCR或其抗原结合片段是由已经进行密码子优化的核苷酸序列编码。

在任何此类实施方案的一些实施方案中，结合分子或TCR或其抗原结合片段是分离的或纯化的或者是重组的。在一些任何此类实施方案中，结合分子或TCR或其抗原结合片段是人的。

在一些实施方案中，所编码的TCR可以是如通过一个或多个二硫键连接的两条链α和β的异二聚体。在一些实施方案中，所编码的TCR的恒定结构域可以含有短连接序列，其中半胱氨酸残基形成二硫键，从而连接所编码的TCR的两条链。在一些实施方案中，TCR可以在α和β链中的每一个中具有另外的半胱氨酸残基，使得所编码的TCR在恒定结构域中含有两个二硫键。在一些实施方案中，恒定和可变结构域中的每一个含有由半胱氨酸残基形成的二硫键。

在一些实施方案中，所编码的TCR可以是两条链α和β或γ和δ的异二聚体，如双链TCR，或者其可以是单链TCR构建体。在一些实施方案中，TCR是含有如通过一个或多个二硫键连接的两条单独链的异二聚体(双链TCR，α和β链或γ和δ链)。

在一些实施方案中，所编码的TCR可以从一个或多个已知的TCR序列(如Vα,β链的序列)产生，所述一个或多个已知的TCR序列的基本上全长的编码序列是易于获得的。用于从细胞来源获得全长TCR序列(包括V链序列)的方法是熟知的。在一些实施方案中，编码TCR的核酸可以从多种来源获得，如通过一种或多种给定细胞内的或从所述一种或多种给定细胞分离的编码TCR的核酸的聚合酶链式反应(PCR)扩增获得，或者通过公众可获得的TCRDNA序列的合成获得。

在一些实施方案中，所编码的重组受体包括重组TCR和/或从天然存在的T细胞克隆的TCR。在一些实施方案中，从患者鉴定、分离靶抗原(例如，癌抗原)的高亲和力T细胞克隆，并将其引入细胞中。在一些实施方案中，已经在用人免疫系统基因(例如，人白细胞抗原系统或HLA)工程化的转基因小鼠中产生针对靶抗原的TCR克隆。参见例如，肿瘤抗原(参见例如，Parkhurst等人(2009)Clin Cancer Res.15:169–180和Cohen等人(2005)JImmunol.175:5799–5808)。在一些实施方案中，使用噬菌体展示来分离针对靶抗原的TCR(参见例如，Varela-Rohena等人(2008)Nat Med.14:1390–1395和Li(2005)NatBiotechnol.23:349–354)。

在一些实施方案中，所编码的TCR是从生物来源获得，如来自细胞，如来自T细胞(例如，细胞毒性T细胞)、T细胞杂交瘤或其他公众可获得的来源。在一些实施方案中，T细胞可以从体内分离的细胞获得。在一些实施方案中，TCR是胸腺选择的TCR。在一些实施方案中，TCR是新表位限制性TCR。在一些实施方案中，T细胞可以是培养的T细胞杂交瘤或克隆。在一些实施方案中，TCR或其抗原结合部分或其抗原结合片段可以根据对TCR序列的知识以合成方式产生。

在一些实施方案中，所编码的TCR是从通过针对靶多肽抗原或其靶T细胞表位筛选候选TCR文库而鉴定或选择的TCR产生的。TCR文库可以通过扩增来自T细胞的Vα和Vβ库来产生，所述T细胞是从受试者分离，包括存在于PBMC、脾或其他淋巴器官中的细胞。在一些情况下，T细胞可以从肿瘤浸润性淋巴细胞(TIL)扩增。在一些实施方案中，TCR文库可以从CD4+或CD8+细胞产生。在一些实施方案中，所述TCR可以从正常或健康受试者的T细胞来源扩增，即正常TCR文库。在一些实施方案中，TCR可以从患病受试者的T细胞来源扩增，即患病TCR文库。在一些实施方案中，使用简并引物扩增Vα和Vβ的基因库，如通过在从人获得的样品(如T细胞)中进行RT-PCR。在一些实施方案中，文库如单链TCR(scTv)文库可以从幼稚Vα和Vβ文库组装，其中扩增产物被克隆或组装以由接头隔开。取决于受试者和细胞的来源，文库可以是HLA等位基因特异性的。可替代地，在一些实施方案中，TCR文库可以通过亲本或支架TCR分子的诱变或多样化产生。

在一些方面，使所编码的TCR经历例如α或β链的定向进化，如通过诱变来进行。在一些方面，TCR的CDR内的特定残基被改变。在一些实施方案中，可以通过亲和力成熟来修饰经选择的TCR。在一些实施方案中，可以选择抗原特异性T细胞，如通过筛选以评估针对肽的CTL活性。在一些方面，可以选择例如存在于抗原特异性T细胞上的所编码的TCR，如通过对抗原的结合活性(例如，特定亲和力或亲合力)来选择。

在一些实施方案中，所编码的TCR或其抗原结合部分是已经修饰或工程化的TCR或其抗原结合部分。在一些实施方案中，使用定向进化方法来产生具有改变的特性如具有较高的对特定MHC-肽复合物的亲和力的TCR。在一些实施方案中，通过展示方法实现定向进化，所述展示方法包括但不限于酵母展示(Holler等人(2003)Nat Immunol,4,55-62；Holler等人(2000)Proc Natl Acad Sci U S A,97,5387-92)；噬菌体展示(Li等人(2005)Nat Biotechnol,23,349-54)或T细胞展示(Chervin等人(2008)J Immunol Methods,339,175-84)。在一些实施方案中，展示途径涉及工程化或修饰已知的亲本或参考TCR。例如，在一些情况下，野生型TCR可以用作模板以用于产生诱变的TCR，其中CDR的一个或多个残基被突变，并且选择具有所需改变的特性(如对所需靶抗原具有更高的亲和力)的突变体。

在一些实施方案中，抗原是肿瘤抗原，其可以是神经胶质瘤相关抗原、β-人绒毛膜促性腺激素、甲胎蛋白(AFP)、B细胞成熟抗原(BCMA、BCM)、B细胞激活因子受体(BAFFR、BR3)、和/或跨膜激活剂和CAML相互作用子(TACI)、Fc受体样5(FCRL5、FcRH5)、凝集素反应性AFP、甲状腺球蛋白、RAGE-1、MN-CA IX、人端粒酶逆转录酶、RU1、RU2(AS)、肠道羧酸酯酶、mut hsp70-2、M-CSF、黑色素-A/MART-1、WT-1、S-100、MBP、CD63、MUC1(例如，MUC1-8)、p53、Ras、细胞周期蛋白B1、HER-2/neu、癌胚抗原(CEA)、gp100、MAGE-A1、MAGE-A2、MAGE-A3、MAGE-A4、MAGE-A5、MAGE-A6、MAGE-A7、MAGE-A8、MAGE-A9、MAGE-A10、MAGE-A11、MAGE-A11、MAGE-B1、MAGE-B2、MAGE-B3、MAGE-B4、MAGE-C1、BAGE、GAGE-1、GAGE-2、pl5、酪氨酸酶、酪氨酸酶相关蛋白1(TRP-1)、酪氨酸酶相关蛋白2(TRP-2)、β-连环蛋白、NY-ESO-1、LAGE-1a、PP1、MDM2、MDM4、EGVFvIII、Tax、SSX2、端粒酶、TARP、pp65、CDK4、波形蛋白、S100、eIF-4A1、IFN诱导型p78、和黑素转铁蛋白(p97)、尿路斑块蛋白II、前列腺特异性抗原(PSA)、人激肽释放酶(huK2)、前列腺特异性膜抗原(PSM)、和前列腺酸性磷酸酶(PAP)、嗜中性粒细胞弹性蛋白酶、肝配蛋白B2、BA-46、β-连环蛋白、Bcr-abl、E2A-PRL、H4-RET、IGH-IGK、MYL-RAR、半胱天冬酶8或B-Raf抗原。其他肿瘤抗原可以包括源自以下的任何抗原：FRa、CD24、CD44、CD133、CD 166、epCAM、CA-125、HE4、Oval、雌激素受体、孕酮受体、uPA、PAI-1、CD19、CD20、CD22、ROR1、间皮素、CD33/IL3Ra、c-Met、PSMA、糖脂F77、GD-2、胰岛素生长因子(IGF)-I、IGF-II和IGF-I受体。特定的肿瘤相关抗原或T细胞表位是已知的(参见例如van derBruggen等人(2013)Cancer Immun，可在www.cancerimmunity.org/peptide/上获得；Cheever等人(2009)Clin Cancer Res,15,5323-37)。

在一些实施方案中，抗原是病毒抗原。许多病毒抗原靶标已经被鉴定并且是已知的，包括源自HIV、HTLV和其他病毒中的病毒基因组的肽(参见例如，Addo等人(2007)PLoSONE,2,e321；Tsomides等人(1994)J Exp Med,180,1283-93；Utz等人(1996)J Virol,70,843-51)。示例性病毒抗原包括但不限于选自以下病毒的抗原：甲型肝炎病毒、乙型肝炎病毒(例如，HBV核心和表面抗原(HBVc、HBVs))、丙型肝炎病毒(HCV)、EB病毒(例如，EBVA)、人乳头瘤病毒(HPV；例如，E6和E7)、人免疫缺陷1型病毒(HIV1)、卡波西肉瘤疱疹病毒(KSHV)、人乳头瘤病毒(HPV)、流感病毒、拉沙病毒、HTLN-1、HIN-1、HIN-II、CMN、EBN或HPN。在一些实施方案中，靶蛋白是细菌抗原或其他致病性抗原，如结核分枝杆菌(Mycobacteriumtuberculosis，MT)抗原、锥虫(例如，克氏锥虫(Tiypansoma cruzi，T.cruzi))抗原如表面抗原(TSA)、或疟疾抗原。特定的病毒抗原或表位或其他致病抗原或T细胞表位是已知的(参见例如，Addo等人(2007)PLoS ONE,2:e321；Anikeeva等人(2009)Clin Immunol,130:98-109)。

在一些实施方案中，抗原是源自与癌症相关的病毒(如致癌病毒)的抗原。例如，致癌病毒是如下病毒，其中已知某些病毒的感染会导致发生不同类型的癌症，例如甲型肝炎、乙型肝炎(例如，HBV核心和表面抗原(HBVc、HBVs))、丙型肝炎(HCV)、人乳头瘤病毒(HPV)、肝炎病毒感染、EB病毒(EBV)、人疱疹病毒8(HHV-8)、人T细胞白血病病毒-1(HTLV-1)、人T细胞白血病病毒-2(HTLV-2)或巨细胞病毒(CMV)抗原。

在一些实施方案中，病毒抗原是HPV抗原，其在一些情况下可以导致患宫颈癌的风险更大。在一些实施方案中，抗原可以是HPV-16抗原、和HPV-18抗原、和HPV-31抗原、HPV-33抗原或HPV-35抗原。在一些实施方案中，病毒抗原是HPV-16抗原(例如，HPV-16的E1、E2、E6和/或E7蛋白的血清反应性区域，参见例如美国专利号6,531,127)或HPV-18抗原(例如，HPV-18的L1和/或L2蛋白的血清反应性区域，如美国专利号5,840,306中所述)。在一些实施方案中，病毒抗原是来自HPV-16的E6和/或E7蛋白的HPV-16抗原。在一些实施方案中，TCR是针对HPV-16E6或HPV-16E7的TCR。在一些实施方案中，TCR是例如WO 2015/184228、WO 2015/009604和WO 2015/009606中所述的TCR。

在一些实施方案中，病毒抗原是HBV或HCV抗原，其在一些情况下可以导致比HBV或HCV阴性受试者患肝癌的风险更大。例如，在一些实施方案中，异源抗原是HBV抗原，如乙型肝炎核心抗原或乙型肝炎包膜抗原(US2012/0308580)。

在一些实施方案中，病毒抗原是EBV抗原，其在一些情况下可以导致比EBV阴性受试者患伯基特淋巴瘤、鼻咽癌和霍奇金病的风险更大。例如，EBV是人疱疹病毒，在一些情况下，发现其与不同组织来源的多种人肿瘤相关。虽然主要发现为无症状感染，但是EBV阳性肿瘤的特征可以是病毒基因产物，例如EBNA-1、LMP-1和LMP-2A的活跃表达。在一些方面，异源抗原是EBV抗原，其可以包括EB核抗原(EBNA)-1、EBNA-2、EBNA-3A、EBNA-3B、EBNA-3C、EBNA-前导蛋白(EBNA-LP)、潜伏膜蛋白(LMP)-1、LMP-2A和LMP-2B、EBV-EA、EBV-MA或EBV-VCA。

在一些实施方案中，病毒抗原是HTLV-1或HTLV-2抗原，其在一些情况下可以导致比HTLV-1或HTLV-2阴性受试者患T细胞白血病的风险更大。例如，在一些实施方案中，异源抗原是HTLV抗原，如TAX。

在一些实施方案中，病毒抗原是HHV-8抗原，其在一些情况下可以导致比HHV-8阴性受试者患卡波西肉瘤的风险更大。在一些实施方案中，异源抗原是CMV抗原，如pp65或pp64(参见美国专利号8361473)。

在一些实施方案中，抗原是自身抗原，如与自身免疫性疾病或障碍相关的多肽的抗原。在一些实施方案中，自身免疫性疾病或障碍可以是多发性硬化症(MS)、类风湿性关节炎(RA)、舍格伦综合征、硬皮病、多发性肌炎、皮肌炎、系统性红斑狼疮、幼年型类风湿性关节炎、强直性脊柱炎、重症肌无力(MG)、大疱性类天疱疮(针对真皮-表皮接合部的基膜的抗体)、天疱疮(针对粘多糖蛋白复合物或细胞内粘合质的抗体)、肾小球肾炎(针对肾小球基膜的抗体)、肺出血肾炎综合征、自身免疫溶血性贫血(针对红细胞的抗体)、桥本病(针对甲状腺的抗体)、恶性贫血(针对内因子的抗体)、特发性血小板减少性紫癜(针对血小板的抗体)、格雷夫斯病或艾迪生病(针对甲状腺球蛋白的抗体)。在一些实施方案中，自身抗原(如与前述自身免疫性疾病中的一种相关的自身抗原)可以是胶原蛋白(如II型胶原蛋白)、分枝杆菌热激蛋白、甲状腺球蛋白、乙酰胆碱受体(AcHR)、髓磷脂碱性蛋白(MBP)或蛋白脂质蛋白(PLP)。特定的自身免疫相关表位或抗原是已知的(参见例如，Bulek等人(2012)NatImmunol,13:283-9；Harkiolaki等人(2009)Immunity,30:348-57；Skowera等人(2008)JClin Invest,1(18):3390-402)。

在一些实施方案中，用于产生或产生目的TCR的靶多肽的肽是已知的或者可以容易地鉴定。在一些实施方案中，适用于在产生TCR或抗原结合部分中使用的肽可以基于目的靶多肽(如下文所述的靶多肽)中HLA限制性基序的存在来确定。在一些实施方案中，使用可用的计算机预测模型来鉴定肽。在一些例子中，使用计算机预测模型的HLA-A0201结合基序以及蛋白酶体和免疫蛋白酶体的切割位点是已知的。在一些实施方案中，对于预测MHC I类结合位点，此类模型包括但不限于ProPred1(Singh和Raghava(2001)Bioinformatics 17(12):1236-1237)和SYFPEITHI(参见Schuler等人(2007)Immunoinformatics Methods inMolecular Biology,409(1):75-93 2007)。在一些实施方案中，MHC限制性表位是HLA-A0201，其在所有高加索人的大约39％-46％中表达，并且因此代表用于制备TCR或其他MHC-肽结合分子的MHC抗原的合适选择。

在一些实施方案中，TCR或其抗原结合部分可以是重组产生的天然蛋白质或其突变形式(其中一种或多种特性(如结合特征)已经被改变)。在一些实施方案中，TCR可以源自各种动物物种之一，如人、小鼠、大鼠或其他哺乳动物。TCR可以是细胞结合的或呈可溶形式。在一些实施方案中，出于所提供的方法的目的，TCR呈在细胞的表面上表达的细胞结合形式。

在一些实施方案中，所编码的重组TCR是全长TCR。在一些实施方案中，重组TCR是抗原结合部分。在一些实施方案中，所述TCR是二聚体TCR(dTCR)。在一些实施方案中，TCR是单链TCR(scTCR)。在一些实施方案中，dTCR或scTCR具有如例如国际专利申请公开号WO 03/020763、WO 04/033685和WO 2011/044186中所述的结构。

在一些实施方案中，所编码的重组TCR含有对应于跨膜序列的序列。在一些实施方案中，TCR确实含有对应于胞质序列的序列。在一些实施方案中，TCR能够与CD3形成TCR复合物。在一些实施方案中，任何重组TCR(包括dTCR或scTCR)可以与信号传导结构域连接，从而在T细胞表面上产生活性TCR。在一些实施方案中，重组TCR在细胞表面上表达。在dTCR或scTCR含有引入或工程化的链间二硫键的一些实施方案中，不存在天然二硫键。

在某些实施方案中，所编码的TCR含有一个或多个修饰，以引入能够在TCRα链与TCRβ链之间形成一个或多个非天然二硫桥的一个或多个半胱氨酸残基。在一些实施方案中，所编码的TCR包含含有TCRα恒定结构域的TCRα链或其一部分，所述TCRα恒定结构域含有能够与TCRβ链形成非天然二硫键的一个或多个半胱氨酸残基。在一些实施方案中，转基因编码含有TCRβ恒定结构域的TCRβ链或其部分，所述TCRβ恒定结构域含有能够与TCRα链形成非天然二硫键的一个或多个半胱氨酸残基。在一些实施方案中，所编码的TCR包含TCRα和/或TCRβ链和/或TCRα和/或TCRβ链恒定结构域，其含有一个或多个修饰以引入一个或多个二硫键。在一些实施方案中，所述转基因编码TCRα和/或TCRβ链和/或TCRα和/或TCRβ，其具有一个或多个修饰以例如在由所述转基因编码的TCRα与内源TCRβ链之间，或在由所述转基因编码的TCRβ与内源TCRα链之间去除或防止天然二硫键。在一些实施方案中，形成和/或能够形成天然链间二硫键的一个或多个天然半胱氨酸被取代为另一残基，例如丝氨酸或丙氨酸。在一些实施方案中，参考TCRα恒定结构域的编号，在残基Thr48、Thr45、Tyr10、Thr45和Ser15中的一个或多个处引入半胱氨酸。在某些实施方案中，可以在TCRβ链恒定结构域的残基Ser57、Ser77、Ser17、Asp59或Glu15处引入半胱氨酸。TCR的示例性非天然二硫键描述于已公开的国际PCT号WO2006/000830、WO 2006/037960和Kuball等人(2007)Blood,109:2331-2338中。在一些实施方案中，可以在对应于Cα链的Thr48和Cβ链的Ser57的残基处、在Cα链的残基Thr45和Cβ链的残基Ser77处、在Cα链的残基Tyr10和Cβ链的残基Ser17处、在Cα链的残基Thr45和Cβ链的残基Asp59处和/或在Cα链的残基Ser15和Cβ链的残基Glu15处引入或取代半胱氨酸。在一些实施方案中，任何半胱氨酸突变都可以在另一个序列中(例如，在上述人或小鼠Cα和Cβ序列中)的相应位置进行。关于蛋白质位置的术语“相应”，如氨基酸位置“对应于”示例性Cα和Cβ中的氨基酸位置的陈述，是指在基于结构序列比对或使用标准比对算法(如GAP算法)与所公开序列比对后鉴定的氨基酸位置。

在一些实施方案中，形成天然链间二硫键的一个或多个天然半胱氨酸被取代为另一种残基，如丝氨酸或丙氨酸。在一些实施方案中，引入或工程化的二硫键可以通过使第一和第二区段上的非半胱氨酸残基突变为半胱氨酸来形成。TCR的示例性非天然二硫键描述于公开的国际PCT号WO 2006/000830中。

在一些实施方案中，所编码的重组TCR是二聚体TCR(dTCR)。在一些实施方案中，dTCR含有第一多肽(其中对应于TCRα链可变区序列的序列与对应于TCRα链恒定区胞外序列的序列的N末端融合)和第二多肽(其中对应于TCRβ链可变区序列的序列与对应于TCRβ链恒定区胞外序列的序列的N末端融合)，所述第一和第二多肽通过二硫键连接。在一些实施方案中，键可以对应于天然二聚αβTCR中存在的天然链间二硫键。在一些实施方案中，链间二硫键不存在于天然TCR中。例如，在一些实施方案中，可以将一个或多个半胱氨酸掺入dTCR多肽对的恒定区胞外序列中。在一些情况下，可能需要天然和非天然二硫键两者。在一些实施方案中，TCR含有跨膜序列以锚定至膜。

在一些实施方案中，dTCR含有TCRα链，所述TCRα链含有可变α结构域、恒定α结构域和附着至恒定α结构域C末端的第一二聚化基序；以及TCRβ链，所述TCRβ链包含可变β结构域、恒定β结构域和附着至恒定β结构域C末端的第一二聚化基序，其中所述第一和第二二聚化基序相互作用以在第一二聚化基序的氨基酸与第二二聚化基序的氨基酸之间形成共价键，从而将TCRα链与TCRβ链连接在一起。

在一些实施方案中，所编码的重组TCR是单链TCR(scTCR或scTv)。通常，可以使用已知的方法产生scTCR，参见例如Soo Hoo,W.F.等人PNAS(USA)89,4759(1992)；Wülfing,C.和Plückthun,A.,J.Mol.Biol.242,655(1994)；Kurucz,I.等人PNAS(USA)90 3830(1993)；国际专利申请公开号WO 96/13593、WO 96/18105、WO 99/60120、WO 99/18129、WO 03/020763、WO 2011/044186；以及Schlueter,C.J.等人J.Mol.Biol.256,859(1996)。在一些实施方案中，scTCR含有引入的非天然二硫键链间键以促进TCR链的结合(参见例如，国际专利申请公开号WO 03/020763)。在一些实施方案中，scTCR是非二硫键连接的截短的TCR，其中与其C末端融合的异源亮氨酸拉链促进链缔合(参见例如，国际专利申请公开号WO 99/60120)。在一些实施方案中，scTCR含有经由肽接头与TCRβ可变结构域共价连接的TCRα可变结构域(参见例如，国际专利申请公开号WO 99/18129)。

在一些实施方案中，scTCR含有第一区段(其由对应于TCRα链可变区的氨基酸序列构成)、第二区段(其由与对应于TCRβ链恒定结构域胞外序列序列的氨基酸序列的N末端融合的对应于TCRβ链可变区序列的氨基酸序列构成)和接头序列(其将第一区段的C末端连接至第二区段的N末端)。在一些实施方案中，scTCR含有第一区段(由与α链胞外恒定结构域序列的N末端融合的α链可变区序列构成)和第二区段(由与序列β链胞外恒定和跨膜序列的N末端融合的β链可变区序列构成)以及任选的接头序列(将第一区段的C末端连接至第二区段的N末端)。在一些实施方案中，scTCR含有第一区段(其由与β链胞外恒定结构域序列的N末端融合的TCRβ链可变区序列构成)和第二区段(其由与序列α链胞外恒定和跨膜序列的N末端融合的α链可变区序列构成)以及任选地接头序列(其将第一区段的C末端连接至第二区段的N末端)。

在一些实施方案中，scTCR的连接第一和第二TCR区段的接头可以是能够形成单一多肽链同时保留TCR结合特异性的任何接头。在一些实施方案中，接头序列可以例如具有式-P-AA-P-，其中P是脯氨酸，并且AA表示氨基酸序列，其中氨基酸是甘氨酸和丝氨酸。在一些实施方案中，第一和第二区段配对，使得其可变区序列定向用于这种结合。因此，在一些情况下，接头具有足够的长度以跨越第一区段的C末端与第二区段的N末端之间的距离，或反之亦然，但是不能太长以阻断或减少scTCR与靶配体的结合。在一些实施方案中，所述接头可以含有从或从约10至45个氨基酸，如10至30个氨基酸或26至41个氨基酸残基，例如29、30、31或32个氨基酸。在一些实施方案中，所述接头具有式-PGGG-(SGGGG)₅-P-，其中P是脯氨酸，G是甘氨酸，并且S是丝氨酸(SEQ ID NO:22)。在一些实施方案中，接头具有序列GSADDAKKDAAKKDGKS(SEQ ID NO:23)。

在一些实施方案中，scTCR含有共价二硫键，其将α链的恒定结构域的免疫球蛋白区域的残基连接至β链的恒定结构域的免疫球蛋白区域的残基。在一些实施方案中，天然TCR中不存在链间二硫键。例如，在一些实施方案中，可以将一个或多个半胱氨酸掺入scTCR多肽的第一和第二区段的恒定区胞外序列中。在一些情况下，可能需要天然和非天然二硫键两者。

在一些实施方案中，所编码的TCR或其抗原结合片段展现对靶抗原具有如下平衡解离常数(K_D)的亲和力：在或在约10^-5与10^-12M之间以及其中的所有单独值和范围。在一些实施方案中，靶抗原是MHC-肽复合物或配体。

C.用于基因工程化的细胞和细胞的制备

在一些实施方案中，提供工程化细胞，例如，基因工程化的或修饰的细胞，以及工程化细胞的方法。在一些实施方案中，将多核苷酸(例如，含有编码重组受体或其一部分和/或一种或多种另外的分子的核酸序列的模板多核苷酸)引入一个细胞中以用于例如根据本文所述的工程化方法进行工程化。在一些方面，多核苷酸和/或其部分中的转基因(外源或异源核酸序列)是异源的，即，通常不存于细胞或从细胞获得的样品中，如从另一种生物体或细胞获得的转基因序列，所述转基因序列例如通常不在进行工程化的细胞和/或这种细胞所来源的生物体中发现。在一些实施方案中，所述核酸序列不是天然存在的，如在自然界中没有发现的核酸序列，或者从在自然界中发现的核酸序列进行修饰，包括包含编码来自多种不同细胞类型的各种结构域的核酸的嵌合组合的核酸序列。

细胞通常是真核细胞，例如哺乳动物细胞，并且通常是人细胞。在一些实施方案中，所述细胞源自血液、骨髓、淋巴或淋巴器官，是免疫系统的细胞，如先天或适应性免疫的细胞，例如骨髓或淋巴细胞，包括淋巴细胞，通常为T细胞和/或NK细胞。其他示例性细胞包括干细胞，如多潜能干细胞和多能干细胞，包括诱导多能干细胞(iPSC)。细胞通常是原代细胞如直接从受试者分离和/或从受试者分离并冷冻的那些原代细胞。在一些实施方案中，细胞包括T细胞或其他细胞类型的一个或多个子集，如整个T细胞群、CD4+细胞、CD8+细胞及其亚群，如由以下各项所定义的那些亚群：功能、激活状态、成熟度、分化的可能性、扩增、再循环、定位和/或持久能力、抗原特异性、抗原受体类型、在特定器官或区室中的存在、标记物或细胞因子分泌特征和/或分化程度。关于待治疗的受试者，所述细胞可以是同种异体的和/或自体的。所述方法包括现成的方法。在一些方面，如对于现成的技术，细胞是多能的和/或多潜能的，如干细胞，如iPSC。在一些实施方案中，所述方法包括从受试者分离细胞、制备、加工、培养和/或将它们工程化，并在冷冻保存之前或之后将它们重新引入同一受试者中。

T细胞和/或CD4+和/或CD8+T细胞的亚型和亚群包括幼稚T(T_N)细胞、效应T细胞(T_EFF)、记忆T细胞及其亚型(如干细胞记忆T(T_SCM)、中枢记忆T(T_CM)、效应记忆T(T_EM)或终末分化效应记忆T细胞)、肿瘤浸润性淋巴细胞(TIL)、未成熟T细胞、成熟T细胞、辅助T细胞、细胞毒性T细胞、黏膜相关恒定T(MAIT)细胞、天然存在和适应性调节T(Treg)细胞、辅助T细胞(如TH1细胞、TH2细胞、TH3细胞、TH17细胞、TH9细胞、TH22细胞、滤泡辅助T细胞)、α/βT细胞和δ/γT细胞。

在一些实施方案中，所述细胞是自然杀伤(NK)细胞。在一些实施方案中，所述细胞是单核细胞或粒细胞，例如骨髓细胞、巨噬细胞、嗜中性粒细胞、树突状细胞、肥大细胞、嗜酸性粒细胞和/或嗜碱性粒细胞。在一些实施方案中，所述细胞包括经由基因工程引入的一种或多种核酸，从而表达此类核酸的重组或基因工程化产物。在一些实施方案中，核酸是异源的，即通常不存在于细胞或从细胞获得的样品中，如从另一种生物或细胞获得的核酸，例如，所述核酸通常不在被工程化的细胞和/或这种细胞所来源的生物中发现。在一些实施方案中，核酸不是天然存在的如自然界中未发现的核酸，包括包含编码来自多种不同细胞类型的各种结构域的核酸的嵌合组合的核酸。

在一些实施方案中，工程化细胞的制备包括一个或多个培养和/或制备步骤。用于引入编码转基因受体(如CAR)的核酸的细胞可以从样品(如生物样品，例如，从受试者获得或源自受试者的生物样品)分离。在一些实施方案中，分离出细胞的受试者是患有疾病或病症或需要细胞疗法或将对其施用细胞疗法的受试者。在一些实施方案中，所述受试者是需要特定治疗性干预(如过继细胞疗法，其中细胞被分离、加工和/或工程化)的人。

因此，在一些实施方案中，细胞是原代细胞，例如原代人细胞。在一些实施方案中，所述细胞是人T细胞。样品包括直接取自受试者的组织、流体和其他样品，以及来自一个或多个处理步骤(如分离、离心、基因工程化(例如用病毒载体转导)、洗涤和/或孵育)的样品。所述生物样品可以是直接从生物来源获得的样品或经过加工的样品。生物样品包括但不限于体液(如血液、血浆、血清、脑脊液、滑液、尿液和汗液)、组织和器官样品，包括由其衍生的加工样品。

在一些方面，细胞从其中衍生或分离的样品是血液或血液衍生的样品，或者是或源自单采术或白细胞单采术产物。示例性样品包括全血、外周血单个核细胞(PBMC)、白细胞、骨髓、胸腺、组织活检物、肿瘤、白血病、淋巴瘤、淋巴结、肠相关淋巴组织、粘膜相关淋巴组织、脾、其他淋巴组织、肝、肺、胃、肠、结肠、肾、胰腺、乳房、骨、前列腺、子宫颈、睾丸、卵巢、扁桃体或其他器官和/或由其衍生的细胞。在细胞疗法(例如，过继细胞疗法)的情境下，样品包括来自自体和同种异体来源的样品。

在一些实施方案中，细胞源自细胞系，例如T细胞系。在一些实施方案中，细胞获得自异种来源，例如获得自小鼠、大鼠、非人灵长类动物和猪。

在一些实施方案中，细胞的分离包括一个或多个制备和/或基于非亲和力的细胞分离步骤。在一些例子中，将细胞在一种或多种试剂的存在下洗涤、离心和/或孵育，例如以去除不需要的组分、针对所需组分进行富集、裂解或去除对特定试剂敏感的细胞。在一些例子中，基于一种或多种特性(如密度、粘附特性、尺寸、对特定组分的敏感性和/或抗性)分离细胞。

在一些例子中，例如通过单采术或白细胞单采术获得来自受试者的循环血液的细胞。在一些方面，样品含有淋巴细胞(包括T细胞、单核细胞、粒细胞、B细胞)、其他有核白细胞、红细胞和/或血小板，并且在一些方面含有除红细胞和血小板之外的细胞。

在一些实施方案中，洗涤从受试者收集的血细胞以例如去除血浆级分，并将所述细胞置于适当缓冲液或介质中以用于后续的处理步骤。在一些实施方案中，用磷酸盐缓冲盐水(PBS)洗涤所述细胞。在一些实施方案中，所述洗涤溶液缺乏钙和/或镁和/或许多或所有二价阳离子。在一些方面，根据制造商的说明书，通过半自动“流通”离心机(例如，Cobe2991细胞加工器，Baxter)完成洗涤步骤。在一些方面，根据制造商的说明书，通过切向流过滤(TFF)完成洗涤步骤。在一些实施方案中，洗涤后将细胞重悬于多种生物相容性缓冲液(例如不含Ca⁺⁺/Mg⁺⁺的PBS)中。在某些实施方案中，去除血细胞样品的组分并将所述细胞直接重悬于培养基中。

在一些实施方案中，所述方法包括基于密度的细胞分离方法，如通过裂解红细胞并通过Percoll或Ficoll梯度离心而从外周血制备白细胞。

在一些实施方案中，分离方法包括基于一种或多种特定分子(如表面标记物(例如，表面蛋白)、细胞内标记物或核酸)在细胞中的表达或存在来分离不同的细胞类型。在一些实施方案中，可以使用任何已知的基于此类标记物的用于分离的方法。在一些实施方案中，分开是基于亲和力或基于免疫亲和力的分开。例如，在一些方面，所述分离包括基于所述细胞的一种或多种标记物(通常为细胞表面标记物)的表达或表达水平来分离细胞和细胞群，例如通过和与此类标记物特异性结合的抗体或结合配偶体一起孵育，然后通常是洗涤步骤和从那些未与所述抗体或结合配偶体结合的细胞中分离已结合所述抗体或结合配偶体的细胞。

此类分离步骤可以基于阳性选择(其中保留已经结合所述试剂的细胞以供进一步使用)和/或阴性选择(其中保留未与所述抗体或结合配偶体结合的细胞)。在一些例子中，保留两种级分以供进一步使用。在一些方面，在没有可用于特异性鉴定异质群体中的细胞类型的抗体的情况下，阴性选择可能特别有用，使得最好基于由除所需群体之外的细胞表达的标记物进行分离。

所述分离不需要导致100％富集或去除特定细胞群或表达特定标记物的细胞。例如，针对特定类型的细胞(如表达标记物的那些)的阳性选择或富集是指增加此类细胞的数量或百分比，但不需要导致不表达所述标记物的细胞的完全不存在。同样地，特定类型的细胞(如表达标记物的那些)的阴性选择、去除或耗尽是指减少此类细胞的数量或百分比，但不需要导致所有此类细胞的完全去除。

在一些例子中，进行多轮分离步骤，其中来自一个步骤的阳性或阴性选择的级分经受另一个分离步骤，如随后的阳性或阴性选择。在一些例子中，单个分离步骤可以同时耗竭表达多种标记物的细胞，如通过将细胞与多种抗体或结合配偶体(每种抗体或结合配偶体对被靶向用于阴性选择的标记物具特异性)一起孵育。同样地，通过将细胞与在各种细胞类型上表达的多种抗体或结合配偶体一起孵育，可以同时阳性选择多种细胞类型。

例如，在一些方面，T细胞的特定亚群(如对一种或多种表面标记物呈阳性或高水平表达的细胞(例如，CD28⁺、CD62L⁺、CCR7⁺、CD27⁺、CD127⁺、CD4⁺、CD8⁺、CD45RA⁺和/或CD45RO⁺T细胞))通过阳性或阴性选择技术来分离。

例如，可以使用抗CD3/抗CD28缀合的磁珠(例如，

M-450CD3/CD28T Cell Expander)阳性选择CD3⁺、CD28⁺T细胞。

在一些实施方案中，通过经由阳性选择富集特定细胞群，或经由阴性选择耗尽特定细胞群来进行分离。在一些实施方案中，通过将细胞与一种或多种抗体或其他结合剂一起孵育来完成阳性或阴性选择，所述一种或多种抗体或其他结合剂与分别在阳性或阴性选择的细胞上表达或以相对较高水平(标记物^高)(标记物⁺)的一种或多种表面标记物特异性结合。

在一些实施方案中，通过阴性选择在非T细胞(如B细胞、单核细胞或其他白细胞，如CD14)上表达的标记物，将T细胞与PBMC样品分离。在一些方面，CD4⁺或CD8⁺选择步骤用于分离CD4⁺辅助T细胞和CD8⁺细胞毒性T细胞。通过对在一种或多种幼稚、记忆和/或效应T细胞亚群上表达或以相对较高程度表达的标记物的阳性或阴性选择，可以将此类CD4⁺和CD8⁺群体还分类成亚群。

在一些实施方案中，如通过基于与相应子群体相关的表面抗原进行阳性或阴性选择，将CD8⁺细胞针对幼稚、中枢记忆、效应子记忆和/或中枢记忆干细胞进一步富集或耗尽。在一些实施方案中，针对中枢记忆T(T_CM)细胞进行富集以增加功效，如以改善施用后的长期存活、扩增和/或植入，这在一些方面在此类亚群中特别稳健。参见Terakura等人(2012)Blood.1:72–82；Wang等人(2012)J Immunother.35(9):689-701。在一些实施方案中，组合富含T_CM的CD8⁺T细胞与CD4⁺T细胞进一步增强功效。

在实施方案中，记忆T细胞存在于CD8⁺外周血淋巴细胞的CD62L⁺和CD62L^-两个子集中。可以例如使用抗CD8和抗CD62L抗体将PBMC针对CD62L^-CD8⁺和/或CD62L⁺CD8⁺级分进行富集或耗尽。

在一些实施方案中，对中枢记忆T(T_CM)细胞的富集是基于CD45RO、CD62L、CCR7、CD28、CD3和/或CD127的阳性或高表面表达；在一些方面，它是基于表达或高表达CD45RA和/或颗粒酶B的细胞的阴性选择。在一些方面，富含T_CM细胞的CD8⁺群体的分离是通过耗尽表达CD4、CD14、CD45RA的细胞以及对表达CD62L的细胞的阳性选择或富集来进行的。在一个方面，中枢记忆T(T_CM)细胞的富集从基于CD4表达所选择的阴性细胞级分开始进行，所述阴性细胞级分基于CD14和CD45RA的表达进行阴性选择且基于CD62L进行阳性选择。在一些方面这种选择是同时进行的，而在其他方面以任何顺序依序进行。在一些方面，用于制备CD8⁺细胞群或亚群的相同的基于CD4表达的选择步骤也用于生成CD4⁺细胞群或亚群，使得来自基于CD4的分离的阳性和阴性级分被保留并用于所述方法的后续步骤中，任选地在一个或多个其他阳性或阴性选择步骤之后。

在特定例子中，PBMC样品或其他白细胞样品进行CD4+细胞的选择，其中保留了阴性和阳性级分。然后所述阴性级分基于CD14和CD45RA或CD19的表达进行阴性选择，并基于中枢记忆T细胞(如CD62L或CCR7)的标记物特征进行阳性选择，其中以任何顺序进行所述阳性和阴性选择。

通过鉴定具有细胞表面抗原的细胞群，将CD4+T辅助细胞分类为幼稚、中枢记忆和效应细胞。CD4⁺淋巴细胞可以通过标准方法获得。在一些实施方案中，幼稚CD4⁺T淋巴细胞是CD45RO^-、CD45RA⁺、CD62L^-、CD4⁺T细胞。在一些实施方案中，中枢记忆CD4⁺细胞是CD62L⁺且CD45RO⁺。在一些实施方案中，效应CD4⁺细胞是CD62L^-且CD45RO^-。

在一个例子中，为了通过阴性选择富集CD4⁺细胞，单克隆抗体混合剂通常包括针对CD14、CD20、CD11b、CD16、HLA-DR和CD8的抗体。在一些实施方案中，所述抗体或结合配偶体与固体支持物或基质(如磁珠或顺磁珠)结合，以允许细胞分离以用于阳性和/或阴性选择。例如，在一些实施方案中，使用免疫磁性(或亲和磁性)分离技术来分开或分离细胞和细胞群(综述于以下中：Methods in Molecular Medicine,第58卷:Metastasis ResearchProtocols,第2卷:Cell Behavior In Vitro and In Vivo,第17-25页S.A.Brooks和U.Schumacher编辑

Humana Press Inc.,新泽西州托托瓦)。

在一些方面，将待分离的细胞的样品或组合物与小的可磁化或磁响应材料(如磁响应颗粒或微粒，如顺磁珠(例如像Dynalbeads或MACS珠))一起孵育。磁响应材料(例如，颗粒)通常直接或间接地附着于结合配偶体(例如，抗体)，所述结合配偶体与希望分离(例如，希望阴性地或阳性地选择)的一个细胞、多个细胞或细胞群上存在的分子(例如，表面标记物)特异性结合。

在一些实施方案中，所述磁性颗粒或珠包含与特异性结合成员(如抗体或其他结合配偶体)结合的磁响应材料。有许多在磁分离方法中使用的熟知的磁响应材料。合适的磁性颗粒包括在Molday的美国专利号4,452,773和欧洲专利说明书EP 452342B中所述的那些，将所述专利通过引用特此并入。胶体大小的颗粒(例如在Owen美国专利号4,795,698；和Liberti等人的美国专利号5,200,084中所述的那些)是其他的例子。

孵育通常在这样的条件下进行，由此抗体或结合配偶体或者与附着于磁性颗粒或珠的此类抗体或结合配偶体特异性结合的分子(如二抗或其他试剂)与细胞表面分子(如果存在于所述样品内的细胞上的话)特异性结合。

在一些方面，将样品置于磁场中，并且具有附着于其上的磁响应或可磁化颗粒的那些细胞将被吸引到磁体并与未标记的细胞分离。对于阳性选择，保留被磁铁吸引的细胞；对于阴性选择，保留未被吸引的细胞(未标记的细胞)。在一些方面，在同一选择步骤期间进行阳性和阴性选择的组合，其中保留阳性和阴性级分并进一步处理或经受另外的分离步骤。

在某些实施方案中，磁响应颗粒被包被在一抗或其他结合伴侣、二抗、凝集素、酶或链霉亲和素中。在某些实施方案中，所述磁性颗粒通过对一种或多种标记物具特异性的一抗的包被而附着于细胞。在某些实施方案中，用一抗或结合配偶体标记所述细胞而不是珠，并且然后添加细胞类型特异性二抗或其他结合配偶体(例如链霉亲和素)包被的磁性颗粒。在某些实施方案中，将链霉亲和素包被的磁性颗粒与生物素化的一抗或二抗结合使用。

在一些实施方案中，磁响应颗粒保持附着于所述细胞，所述细胞随后被孵育，培养和/或工程化；在一些方面，所述颗粒保持附着于所述细胞以用于施用于患者。在一些实施方案中，从所述细胞中去除可磁化或磁响应颗粒。从细胞中去除可磁化颗粒的方法是已知的，并且包括例如使用竞争性非标记抗体和与可切割接头缀合的可磁化颗粒或抗体。在一些实施方案中，所述可磁化颗粒是可生物降解的。

在一些实施方案中，基于亲和力的选择是经由磁激活细胞分选(MACS)(MiltenyiBiotec，加利福尼亚州奥本)。磁激活细胞分选(MACS)系统能够高纯度选择附着有磁化颗粒的细胞。在某些实施方案中，MACS以这样的模式操作，其中在施加外部磁场之后依序洗脱非靶标和靶标种类。也就是说，附着于磁化颗粒的细胞保持在适当的位置，而未附着的种类被洗脱。然后，在完成第一次洗脱步骤之后，以某种方式释放被捕获在磁场中并被阻止洗脱的种类，使得它们可以被洗脱和回收。在某些实施方案中，所述非靶细胞被标记并从异质细胞群中耗尽。

在某些实施方案中，使用这样的系统、装置或设备进行分离或分开，所述系统、装置或设备进行所述方法的分离、细胞制备、分开、加工、孵育、培养和/或制备步骤中的一种或多种。在一些方面，所述系统用于在封闭或无菌环境中进行这些步骤中的每一个，例如以最小化错误、用户操作和/或污染。在一个例子中，所述系统是如国际专利申请公开号WO2009/072003或US 20110003380中所述的系统。

在一些实施方案中，所述系统或设备在集成或独立系统中和/或以自动化或可编程方式进行分离、处理、工程化和配制步骤中的一个或多个(例如，全部)。在一些方面，所述系统或设备包括与所述系统或设备通信的计算机和/或计算机程序，其允许用户对加工、分离、工程化和配制步骤的各个方面进行编程、控制、评估其结局和/或调整。

在一些方面，使用CliniMACS系统(Miltenyi Biotec)进行所述分离和/或其他步骤，例如以用于在封闭和无菌系统中在临床规模水平上自动分离细胞。部件可以包括集成微计算机、磁分离单元、蠕动泵和各种夹管阀。在一些方面，所述集成计算机控制所述仪器的所有部件并指示所述系统以标准化顺序执行重复程序。在一些方面，所述磁分离单元包括可移动的永磁体和用于选择柱的支架。所述蠕动泵控制整个管组的流速，并与夹管阀一起确保缓冲液通过所述系统的受控流动和细胞的连续悬浮。

在一些方面，所述CliniMACS系统使用抗体偶联的可磁化颗粒，其在无菌，无热原的溶液中提供。在一些实施方案中，在用磁性颗粒标记细胞后，洗涤所述细胞以去除过量的颗粒。然后将细胞制备袋连接到管组，所述管组又连接到含有缓冲液的袋和细胞收集袋。所述管组由预装配的无菌管(包括预柱和分离柱)组成，并且仅供一次性使用。在启动分离程序后，所述系统自动将细胞样品施加到分离柱。标记的细胞保留在柱内，而未标记的细胞通过一系列洗涤步骤去除。在一些实施方案中，用于与本文描述的方法一起使用的细胞群是未标记的并且不保留在柱中。在一些实施方案中，用于与本文描述的方法一起使用的细胞群被标记并保留在柱中。在一些实施方案中，用于与本文所述的方法一起使用的细胞群在去除磁场后从柱中洗脱，并且收集在细胞收集袋内。

在某些实施方案中，使用CliniMACS Prodigy系统(Miltenyi Biotec)进行分离和/或其他步骤。在一些方面，CliniMACS Prodigy系统配备有细胞加工联合体，其允许通过离心自动化洗涤和分级分离细胞。CliniMACS Prodigy系统还可以包括机载相机和图像识别软件，其通过辨别源细胞产物的宏观层来确定最佳的细胞分级分离终点。例如，外周血自动分离成红细胞、白细胞和血浆层。CliniMACS Prodigy系统还可以包括集成细胞培育室，其实现细胞培养方案，例如像细胞分化和扩增、抗原负载和长期细胞培养。输入端口可允许无菌移除和补充培养基，并且可以使用集成显微镜监测细胞。参见例如，Klebanoff等人(2012)J Immunother.35(9):651–660，Terakura等人(2012)Blood.1:72–82以及Wang等人(2012)J Immunother.35(9):689-701。

在一些实施方案中，通过流式细胞术收集和富集(或耗尽)本文描述的细胞群，其中针对多种细胞表面标记物染色的细胞在流体流中载携。在一些实施方案中，通过制备规模(FACS)分类收集和富集(或耗尽)本文描述的细胞群。在某些实施方案中，通过使用微机电系统(MEMS)芯片结合基于FACS的检测系统来收集和富集(或耗尽)本文所述的细胞群体(参见例如，WO 2010/033140，Cho等人(2010)Lab Chip 10,1567-1573；以及Godin等人(2008)J Biophoton.1(5):355–376)。在两种情况下，细胞可以用多种标记物来标记，允许以高纯度分离明确定义的T细胞子集。

在一些实施方案中，用一种或多种可检测标记物来标记抗体或结合配偶体，以促进分离供阳性和/或阴性选择。例如，分离可以基于与荧光标记的抗体的结合。在一些例子中，基于对一种或多种细胞表面标记物具特异性的抗体或其他结合配偶体的结合来分离细胞携载于流体流中，如通过荧光激活细胞分选(FACS)(包括制备规模FACS)和/或微机电系统(MEMS)芯片，例如与流式细胞检测系统组合。此类方法允许基于多种标记物同时进行阳性和阴性选择。

在一些实施方案中，制备方法包括在分离、孵育和/或工程化之前或之后冷冻(例如，冷冻保存)细胞的步骤。在一些实施方案中，所述冷冻和后续解冻步骤去除所述细胞群中的粒细胞，并且在一定程度上去除单核细胞。在一些实施方案中，例如在洗涤步骤之后将所述细胞悬浮在冷冻溶液中以去除血浆和血小板。在一些方面，可以使用多种已知的冷冻溶液和参数中的任何一种。一个例子包括使用含有20％ DMSO和8％人血清白蛋白(HSA)的PBS，或其他合适的细胞冷冻培养基。然后用培养基将其1:1稀释，使得DMSO和HSA的最终浓度分别为10％和4％。然后通常将所述细胞以1℃/分钟的速率冷冻至-80℃并储存在液氮储罐的气相中。

在一些实施方案中，在基因工程化之前或与其相连地孵育和/或培养细胞。所述孵育步骤可以包括培养、培育、刺激、激活和/或繁殖。孵育和/或工程化可以在培养容器中进行，所述培养容器是如单元、室、孔、柱、管、管组、阀、小瓶、培养皿、袋或其他用于培养或培育细胞的容器。在一些实施方案中，在刺激条件或刺激剂的存在下孵育所述组合物或细胞。此类条件包括设计为诱导群体中细胞的增殖、扩增、激活和/或存活，模拟抗原暴露和/或引发细胞用于基因工程化(如用于引入重组抗原受体)的那些。

条件可以包括以下中的一种或多种：特定培养基、温度、氧含量、二氧化碳含量、时间、药剂(例如，营养素、氨基酸、抗生素、离子和/或刺激因子(如细胞因子、趋化因子、抗原、结合配偶体、融合蛋白、重组可溶性受体和任何其他旨在激活细胞的药剂))。

在一些实施方案中，刺激条件或刺激剂包括能够刺激或激活TCR复合物的细胞内信号传导结构域的一种或多种药剂(例如，配体)。在一些方面，所述药剂在T细胞中开启或启动TCR/CD3细胞内信号传导级联。此类药剂可包括抗体如对于TCR具有特异性的抗体，例如抗CD3。在一些实施方案中，刺激条件包括一种或多种药剂例如配体，其能够刺激共刺激受体，例如抗CD28。在一些实施方案中，这种药剂和/或配体可结合至固体支撑物如珠和/或一种或多种细胞因子。任选地，扩增方法可以还包括向培养基中添加抗CD3和/或抗CD28抗体(例如，以至少约0.5ng/mL的浓度)的步骤。在一些实施方案中，所述刺激剂包括IL-2、IL-15和/或IL-7。在一些方面，IL-2浓度为至少约10单位/mL。

在一些方面，根据如以下文献中所述的那些的技术进行孵育：US 6,040,177、Klebanoff等人(2012)J Immunother.35(9):651–660、Terakura等人(2012)Blood.1:72–82和/或Wang等人(2012)J Immunother.35(9):689-701。

在一些实施方案中，通过以下方式扩增T细胞：向培养起始组合物中添加饲养细胞(如非分裂外周血单核细胞(PBMC))(例如，使得对于要扩增的初始群体中的每个T淋巴细胞，所得细胞群含有至少约5、10、20或40个或更多个PBMC饲养细胞)；以及孵育培养物(例如，持续足以扩增所述T细胞数量的时间)。在一些方面，非分裂饲养细胞可以包含γ辐射的PBMC饲养细胞。在一些实施方案中，用约3000至3600拉德范围内的γ射线辐射PBMC以防止细胞分裂。在一些方面中，在添加该T细胞群之前将该饲养细胞添加到培养基中。

在一些实施方案中，刺激条件包括适合于人T淋巴细胞生长的温度，例如至少约25摄氏度，通常为至少约30摄氏度，并且通常在或在约37摄氏度。任选地，孵育还可以包括加入非分裂的EBV转化的类淋巴母细胞(LCL)作为饲养细胞。可以用约6000至10,000拉德范围内的γ射线照射LCL。在一些方面，所述LCL饲养细胞以任何合适的量(如LCL饲养细胞与初始T淋巴细胞的比率为至少约10:1)提供。

在实施方案中，通过用抗原刺激幼稚或抗原特异性T淋巴细胞获得抗原特异性T细胞，如抗原特异性CD4+和/或CD8+T细胞。例如，可以通过从受感染的受试者中分离T细胞并用相同的抗原在体外刺激细胞，针对巨细胞病毒抗原产生抗原特异性T细胞系或克隆。

用于引入基因工程化组分(例如，用于诱导基因破坏的药剂和/或编码重组受体(例如，CAR或TCR)的核酸)的各种方法是已知的，并且可以与所提供的方法和组合物一起使用。示例性方法包括用于转移编码所述多肽或受体的核酸的那些，包括经由病毒载体，例如逆转录病毒或慢病毒、非病毒载体或转座子(例如，睡美人转座子系统)。基因转移方法可以包括转导、电穿孔或导致将基因转移至细胞中的其他方法，或者本文在第II.A.3或II.B.3节中所述的任何递送方法。用于转移编码重组产物的核酸的其他途径和载体是描述于例如WO 2014055668和美国专利号7,446,190中的那些。

在一些实施方案中，通过电穿孔将重组核酸转移到T细胞中(参见例如Chicaybam等人,(2013)PLoS ONE 8(3):e60298；和Van Tedeloo等人(2000)Gene Therapy7(16):1431-1437)。在一些实施方案中，经由转座将重组核酸转移到T细胞中(参见例如，Manuri等人(2010)Hum Gene Ther 21(4):427-437；Sharma等人(2013)Molec Ther Nucl Acids 2,e74；以及Huang等人(2009)Methods Mol Biol 506:115-126)。在免疫细胞中引入和表达遗传物质的其他方法包括磷酸钙转染(如在Current Protocols in Molecular Biology,John Wiley&Sons,New York.N.Y.中所述)、原生质体融合、阳离子脂质体介导的转染；钨粒子促进的微粒轰击(Johnston,Nature,346:776-777(1990))；以及磷酸锶DNA共沉淀(Brash等人,Mol.Cell Biol.,7:2031-2034(1987))。

在一些实施方案中，通过以下方式完成基因转移：首先刺激细胞，如通过将其与诱导反应(如增殖、存活和/或激活)的刺激物进行组合，例如如通过细胞因子或激活标记物的表达测量的，然后转导激活的细胞，并且在培养中扩增至足以用于临床应用的数量。

在一些情境下，可能需要防止刺激因子(例如，淋巴因子或细胞因子)的过表达可能潜在地导致受试者中不希望的结果或较低的功效(如受试者中与毒性相关的因素)的可能性。因此，在一些情境下，工程化细胞包括导致细胞在体内(如在过继免疫疗法中施用时)对阴性选择易感的基因区段。例如，在一些方面，将细胞工程化，使得它们可以由于施用它们的患者的体内条件的变化而被消除。阴性选择性表型可以由赋予对所施用的药剂(例如，化合物)的敏感性的基因的插入而产生。阴性选择性基因包括单纯疱疹病毒I型胸苷激酶(HSV-I TK)基因(Wigler等人,Cell 11:223,1977)，其赋予更昔洛韦敏感性；细胞次黄嘌呤磷酸核糖基转移酶(HPRT)基因；细胞腺嘌呤磷酸核糖基转移酶(APRT)基因；细菌胞嘧啶脱氨酶(Mullen等人,Proc.Natl.Acad.Sci.USA.89:33(1992))。

在一些实施方案中，细胞(例如，T细胞)可以在扩增期间或之后进行工程化。例如，用于引入所需多肽或受体的基因的这种工程化可以用任何合适的逆转录病毒载体来进行。然后可以使基因修饰的细胞群摆脱初始刺激物(例如，CD3/CD28刺激物)，并随后用第二种类型的刺激物(例如，经由从头引入的受体)进行刺激。这第二种类型的刺激物可以包括呈肽/MHC分子形式的抗原刺激物、基因引入的受体的同源(交联)配体(例如，CAR的天然配体)或在新受体的框架内直接结合(例如，通过识别受体内的恒定区)的任何配体(如抗体)。参见例如，Cheadle等人,“Chimeric antigen receptors for T-cell based therapy”Methods Mol Biol.2012；907:645-66或Barrett等人,Chimeric Antigen ReceptorTherapy for Cancer Annual Review of Medicine第65卷:333-347(2014)。

另外的核酸(例如，用于引入的基因)包括用于改善治疗功效的那些，如通过促进转移细胞的活力和/或功能；用于提供选择和/或评估细胞的基因标记物的基因，如以评估体内存活或定位；改善安全性的基因，例如通过使细胞在体内对阴性选择易感，如LuptonS.D.等人,Mol.and Cell Biol.,11:6(1991)；和Riddell等人,Human Gene Therapy3:319-338(1992)所述；还参见Lupton等人的PCT/US91/08442和PCT/US94/05601的出版物，其描述了使用由将显性阳性选择性标记物与阴性选择性标记物融合而得到的双功能选择性融合基因。参见例如，Riddell等人,美国专利号6,040,177，第14-17栏。

如本文所述，在一些实施方案中，在基因工程化之前或结合基因工程化来孵育和/或培养细胞。孵育步骤可以包括培养、培育、刺激、激活、繁殖和/或冷冻以保存(例如，冷冻保存)。

D.表达重组受体的细胞的组合物

还提供多个工程化细胞或工程化细胞的群体、含有此类细胞和/或富含此类细胞的组合物。在一些方面，通过本文所述的方法产生所提供的工程化细胞和/或工程化细胞的组合物。

在一些实施方案中，与使用其他方法产生的细胞群和/或组合物的表达和/或抗原结合相比，含有工程化细胞的所提供的细胞群和/或组合物包括展现更加改善的、均匀的、同质的和/或稳定的重组受体的表达和/或抗原结合(例如，展现减小的变异系数)的细胞群。在一些实施方案中，与使用其他方法(例如，编码重组受体的序列的随机整合)产生的相应群体相比，所述细胞群和/或组合物展现降低至少100％、95％、90％、80％、70％、60％、50％、40％、30％、20％或10％的重组受体表达和/或重组受体的抗原结合的变异系数。变异系数被定义为目的核酸(例如，编码重组受体或其部分的转基因)在细胞(例如，CD4+和/或CD8+T细胞)群内的表达的标准差除以相应目的核酸在相应细胞群中的表达的平均值。在一些实施方案中，当在已经使用本文所提供的方法工程化的CD4+和/或CD8+T细胞中测量时，所述细胞群和/或组合物展现低于0.70、0.65、0.60、0.55、0.50、0.45、0.40、0.35或0.30或更低的变异系数。

在一些实施方案中，所提供的含有工程化细胞的细胞群和/或组合物包括展现最小或降低的编码重组受体或其部分的转基因的随机整合的细胞群。在一些方面，转基因随机整合至细胞基因组中可以导致不利影响或细胞死亡(由于转基因整合至基因组中不期望的位置中，例如整合至必需基因或对调控细胞活性至关重要的基因中)，和/或受体的不受调控或不受控制的表达。在一些方面，与使用其他方法产生的细胞群体相比，转基因的随机整合降低至少或大于50％、60％、70％、80％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多。

在一些实施方案中，提供了包括多种表达重组受体的工程化免疫细胞的细胞群和/或组合物，其中编码重组受体的核酸序列存在于T细胞刺激相关基因座处，例如通过经由同源定向修复(HDR)将编码重组受体或其部分的转基因整合于T细胞刺激相关基因座处。在一些实施方案中，组合物中的细胞和/或组合物中在T细胞刺激相关基因座处含有基因破坏的细胞的至少或大于30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％或90％包含编码重组受体或其一部分的转基因在T细胞刺激相关基因座处的整合。

在一些实施方案中，所提供的组合物含有细胞，如其中表达重组受体的细胞构成组合物中的总细胞或某一类型的细胞(如T细胞或CD8+或CD4+细胞)的至少30％、40％、50％、60％、70％、80％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多。在一些实施方案中，所提供的组合物含有细胞，如其中表达重组受体的细胞构成组合物中在T细胞刺激相关基因座处含有基因破坏的总细胞的至少30％、40％、50％、60％、70％、80％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多。

V.治疗方法和在过继细胞疗法中的用途

本文提供了治疗方法，例如包括施用本文所述的任何工程化细胞或含有工程化细胞的组合物。在一些方面，还提供了将本文所述的任何工程化细胞或含有工程化细胞的组合物施用至受试者(如患有疾病或障碍的受试者)的方法。本文所述的表达重组受体(如嵌合抗原受体(CAR)或T细胞受体(TCR))的工程化细胞或包含所述工程化细胞的组合物可用于多种治疗性、诊断性和预防性情形。例如，所述工程化细胞或包含所述工程化细胞的组合物可用于治疗受试者的多种疾病和障碍。此类方法和用途包括治疗性方法和用途，例如涉及将工程化细胞或含有所述工程化细胞的组合物施用于患有疾病、病症或障碍(如肿瘤或癌症)的受试者。在一些实施方案中，以有效量施用工程化细胞或包含所述工程化细胞的组合物以实现疾病或障碍的治疗。用途包括工程化细胞或组合物在此类方法和治疗中以及在制备药物以实施此类治疗方法中的用途。在一些实施方案中，通过向患有或怀疑患有所述疾病或病症的受试者施用工程化细胞或包含所述工程化细胞的组合物来进行所述方法。在一些实施方案中，所述方法从而治疗所述受试者的所述疾病或病症或障碍。还提供了用于向受试者(例如，患者)施用细胞和组合物的治疗方法。

用于过继细胞疗法的细胞的施用方法是已知的，并且可以与所提供的方法和组合物结合使用。例如，过继T细胞疗法方法描述于例如以下文献中：授予Gruenberg等人的美国专利申请公开号2003/0170238；授予Rosenberg的美国专利号4,690,915；Rosenberg(2011)Nat Rev Clin Oncol.8(10):577-85。参见例如，Themeli等人(2013)Nat Biotechnol.31(10):928-933；Tsukahara等人(2013)Biochem Biophys Res Commun 438(1):84-9；Davila等人(2013)PLoS ONE 8(4):e61338。

所治疗的疾病或病症可以是任何疾病或病症，其中抗原的表达与疾病、病症或障碍的病因相关和/或参与所述病因，例如引起、加重或以其他方式参与这种疾病、病症或障碍。示例性疾病和病症可以包括与恶性肿瘤或细胞转化(例如，癌症)、自身免疫性疾病或炎性疾病或者例如由细菌、病毒或其他病原体引起的感染性疾病相关的疾病或病症。本文描述了示例性抗原，其包括与可以治疗的各种疾病和病症相关的抗原。在任何实施方案的一些实施方案中，嵌合抗原受体或转基因TCR与和疾病或病症相关的抗原特异性结合。

疾病、病症和障碍包括肿瘤，包括实体瘤、血液恶性肿瘤和黑色素瘤，并且包括局部和转移性肿瘤；感染性疾病，如病毒或其他病原体的感染，例如HIV、HCV、HBV、CMV、HPV和寄生虫病；以及自身免疫性和炎性疾病。在一些实施方案中，疾病、障碍或病症是肿瘤、癌症、恶性肿瘤、肿疡或其他增殖性疾病或障碍。此类疾病包括但不限于白血病、淋巴瘤，例如，急性髓样(或髓性)白血病(AML)、慢性髓样(或髓性)白血病(CML)、急性淋巴细胞(或成淋巴细胞)白血病(ALL)、慢性淋巴细胞白血病(CLL)、毛细胞白血病(HCL)、小淋巴细胞淋巴瘤(SLL)、套细胞淋巴瘤(MCL)、边缘区淋巴瘤、伯基特淋巴瘤、霍奇金淋巴瘤(HL)、非霍奇金淋巴瘤(NHL)、间变性大细胞淋巴瘤(ALCL)、滤泡性淋巴瘤、难治性滤泡性淋巴瘤、弥漫性大B细胞淋巴瘤(DLBCL)和多发性骨髓瘤(MM)。在一些实施方案中，疾病或病症是选自以下的B细胞恶性肿瘤：急性成淋巴细胞性白血病(ALL)、成人ALL、慢性成淋巴细胞性白血病(CLL)、非霍奇金淋巴瘤(NHL)和弥漫性大B细胞淋巴瘤(DLBCL)。在一些实施方案中，疾病或病症是NHL，并且NHL选自侵袭性NHL、弥漫性大B细胞淋巴瘤(DLBCL)NOS型(从头的和从惰性转化的)、原发性纵隔大B细胞淋巴瘤(PMBCL)、富含T细胞/组织细胞的大B细胞淋巴瘤(TCHRBCL)、伯基特淋巴瘤、套细胞淋巴瘤(MCL)和/或滤泡性淋巴瘤(FL)(任选地，3B级滤泡性淋巴瘤(FL3B))。

在一些实施方案中，所述疾病或障碍是多发性骨髓瘤(MM)。在一些实施方案中，所提供的细胞(例如，具有经修饰的T细胞刺激相关基因座的工程化细胞)的施用可以导致治疗和/或改善受试者的疾病或病症(如MM)。在一些实施方案中，受试者患有或怀疑患有与肿瘤相关抗原(如B细胞成熟抗原(BCMA))的表达相关的MM。

在一些实施方案中，疾病或障碍是慢性淋巴细胞白血病(CLL)。在一些实施方案中，所提供的细胞(例如，具有经修饰的T细胞刺激相关基因座的工程化细胞)的施用可以导致治疗和/或改善受试者的疾病或病症(如CLL)。在一些实施方案中，受试者患有或怀疑患有与肿瘤相关抗原(如受体酪氨酸激酶样孤儿受体1(ROR1))的表达相关的CLL。

在一些实施方案中，疾病或障碍是实体瘤或与非血液肿瘤相关的癌症。在一些实施方案中，疾病或障碍是实体瘤或与实体瘤相关的癌症。在一些实施方案中，疾病或障碍是胰腺癌、膀胱癌、结直肠癌、乳腺癌、前列腺癌、肾癌、肝细胞癌、肺癌、卵巢癌、宫颈癌、胰腺癌、直肠癌、甲状腺癌、子宫癌、胃癌、食管癌、头颈癌、黑色素瘤、神经内分泌癌、CNS癌、脑肿瘤、骨癌或软组织肉瘤。在一些实施方案中，疾病或障碍是膀胱癌、肺癌、脑癌、黑色素瘤(例如，小细胞肺癌、黑色素瘤)、乳腺癌、宫颈癌、卵巢癌、结直肠癌、胰腺癌、子宫内膜癌、食管癌、肾癌、肝癌、前列腺癌、皮肤癌、甲状腺癌或子宫癌。在一些实施方案中，疾病或障碍是胰腺癌、膀胱癌、结直肠癌、乳腺癌、前列腺癌、肾癌、肝细胞癌、肺癌、卵巢癌、宫颈癌、胰腺癌、直肠癌、甲状腺癌、子宫癌、胃癌、食管癌、头颈癌、黑色素瘤、神经内分泌癌、CNS癌、脑肿瘤、骨癌或软组织肉瘤。

在一些实施方案中，疾病或障碍是非小细胞肺癌(NSCLC)。在一些实施方案中，所提供的细胞(例如，具有经修饰的T细胞刺激相关基因座的工程化细胞)的施用可以导致治疗和/或改善受试者的疾病或病症(如NSCLC)。在一些实施方案中，受试者患有或怀疑患有与肿瘤相关抗原(如受体酪氨酸激酶样孤儿受体1(ROR1))的表达相关的NSCLC。

在一些实施方案中，疾病或障碍是头颈部鳞状细胞癌(HNSCC)。在一些实施方案中，所提供的细胞(例如，具有经修饰的T细胞刺激相关基因座的工程化细胞)的施用可以导致治疗和/或改善受试者的疾病或病症(如HNSCC)。在一些实施方案中，受试者患有或怀疑患有与肿瘤相关抗原(如人乳头瘤病毒(HPV)16E6或E7)的表达相关的HNSCC。在一些实施方案中，疾病或病症是感染性疾病或病症，例如但不限于病毒、逆转录病毒、细菌和原生动物感染、免疫缺陷、巨细胞病毒(CMV)、埃-巴二氏病毒(Epstein-Barr virus，EBV)、腺病毒、BK多瘤病毒。在一些实施方案中，疾病或病症是自身免疫性或炎性疾病或病症，如关节炎(例如，类风湿性关节炎(RA))、I型糖尿病、系统性红斑狼疮(SLE)、炎性肠病、银屑病、硬皮病、自身免疫性甲状腺疾病、格雷夫斯病、克罗恩病、多发性硬化症、哮喘和/或与移植相关的疾病或病症。

在一些实施方案中，与疾病或障碍相关的抗原是或包括αvβ6整合素(avb6整合素)、B细胞成熟抗原(BCMA)、B7-H3、B7-H6、碳酸酐酶9(CA9，也称为CAIX或G250)、癌症-睾丸抗原、癌症/睾丸抗原1B(CTAG，也称为NY-ESO-1和LAGE-2)、癌胚抗原(CEA)、细胞周期蛋白、细胞周期蛋白A2、C-C基序趋化因子配体1(CCL-1)、CD19、CD20、CD22、CD23、CD24、CD30、CD33、CD38、CD44、CD44v6、CD44v7/8、CD123、CD133、CD138、CD171、硫酸软骨素蛋白聚糖4(CSPG4)、表皮生长因子蛋白(EGFR)、表皮生长因子受体III型突变体(EGFR vIII)、上皮糖蛋白2(EPG-2)、上皮糖蛋白40(EPG-40)、肝配蛋白B2、肝配蛋白受体A2(EPHa2)、雌激素受体、Fc受体样蛋白5(FCRL5；也称为Fc受体同源物5或FCRH5)、胎儿乙酰胆碱受体(胎儿AchR)、叶酸结合蛋白(FBP)、叶酸受体α、神经节苷脂GD2、O-乙酰化GD2(OGD2)、神经节苷脂GD3、糖蛋白100(gp100)、磷脂酰肌醇蛋白聚糖-3(GPC3)、G蛋白偶联受体C类5族成员D(GPRC5D)、Her2/neu(受体酪氨酸激酶erb-B2)、Her3(erb-B3)、Her4(erb-B4)、erbB二聚体、人高分子量黑色素瘤相关抗原(HMW-MAA)、乙型肝炎表面抗原、人白细胞抗原A1(HLA-A1)、人白细胞抗原A2(HLA-A2)、IL-22受体α(IL-22Rα)、IL-13受体α2(IL-13Rα2)、激酶插入结构域受体(kdr)、κ轻链、L1细胞粘附分子(L1-CAM)、L1-CAM的CE7表位、含有富亮氨酸重复序列的蛋白8家族成员A(LRRC8A)、Lewis Y、黑色素瘤相关抗原(MAGE)-A1、MAGE-A3、MAGE-A6、MAGE-A10、间皮素(MSLN)、c-Met、鼠类巨细胞病毒(CMV)、粘蛋白1(MUC1)、MUC16、自然杀伤细胞2族成员D(NKG2D)配体、黑色素A(MART-1)、神经细胞粘附分子(NCAM)、癌胚胎抗原、黑色素瘤优先表达抗原(PRAME)、孕酮受体、前列腺特异性抗原、前列腺干细胞抗原(PSCA)、前列腺特异性膜抗原(PSMA)、受体酪氨酸激酶样孤儿受体1(ROR1)、存活蛋白、滋养层糖蛋白(TPBG，也称为5T4)、肿瘤相关糖蛋白72(TAG72)、酪氨酸酶相关蛋白1(TRP1，也称为TYRP1或gp75)、酪氨酸酶相关蛋白2(TRP2，也称为多巴色素互变异构酶、多巴色素δ异构酶或DCT)、血管内皮生长因子受体(VEGFR)、血管内皮生长因子受体2(VEGFR2)、肾母细胞瘤1(WT-1)、病原体特有的或病原体表达的抗原、或与通用标签相关的抗原、和/或生物素化分子、和/或由HIV、HCV、HBV或其他病原体表达的分子。在一些实施方案中，受体靶向的抗原包括与B细胞恶性肿瘤相关的抗原，如许多已知B细胞标记物中的任何一种。在一些实施方案中，所述抗原是或包括CD20、CD19、CD22、ROR1、CD45、CD21、CD5、CD33、Igκ、Igλ、CD79a、CD79b或CD30。

在一些方面，重组受体(如CAR)特异性结合至与疾病或病症相关的抗原或在与B细胞恶性肿瘤相关的病灶环境的细胞中表达的抗原。在一些实施方案中，受体靶向的抗原包括与B细胞恶性肿瘤相关的抗原，如许多已知B细胞标记物中的任何一种。在一些实施方案中，受体靶向的抗原是CD20、CD19、CD22、ROR1、CD45、CD21、CD5、CD33、Igκ、Igλ、CD79a、CD79b或CD30、或其组合。

在一些实施方案中，疾病或病症是骨髓瘤，如多发性骨髓瘤。在一些方面，重组受体(如CAR)特异性结合至与疾病或病症相关的抗原或在与多发性骨髓瘤相关的病灶环境的细胞中表达的抗原。在一些实施方案中，受体靶向的抗原包括与多发性骨髓瘤相关的抗原。在一些方面，在多发性骨髓瘤上表达抗原，例如第二或另外抗原，如疾病特有抗原和/或相关抗原，如B细胞成熟抗原(BCMA)、G蛋白偶联受体C类5族成员D(GPRC5D)、CD38(环状ADP核糖水解酶)、CD138(多配体聚糖-1、多配体聚糖、SYN-1)、CS-1(CS1、CD2子集1、CRACC、SLAMF7、CD319和19A24)、BAFF-R、TACI和/或FcRH5。其他示例性多发性骨髓瘤抗原包括CD56、TIM-3、CD33、CD123、CD44、CD20、CD40、CD74、CD200、EGFR、β2-微球蛋白、HM1.24、IGF-1R、IL-6R、TRAIL-R1和IIA型激活素受体(ActRIIA)。参见Benson和Byrd,J.Clin.Oncol.(2012)30(16):2013-15；Tao和Anderson,Bone Marrow Research(2011):924058；Chu等人,Leukemia(2013)28(4):917-27；Garfall等人,Discov Med.(2014)17(91):37-46。在一些实施方案中，抗原包括存在于淋巴肿瘤、骨髓瘤、AIDS相关的淋巴瘤和/或移植后淋巴组织增生上的那些，如CD38。针对此类抗原的抗体或抗原结合片段是已知的并且包括例如以下文献中所述的那些：美国专利号8,153,765、8,603477、8,008,450；美国公开号US20120189622或US 20100260748；和/或国际PCT公开号WO 2006099875、WO 2009080829或WO2012092612或WO 2014210064。在一些实施方案中，此类抗体或其抗原结合片段(例如，scFv)包含在多特异性抗体、多特异性嵌合受体(如多特异性CAR)和/或多特异性细胞中。

在一些实施方案中，疾病或障碍与G蛋白偶联受体C类5族成员D(GPRC5D)的表达和/或B细胞成熟抗原(BCMA)的表达相关。

在一些实施方案中，疾病或障碍是B细胞相关障碍。在所提供方法的任何所提供实施方案的一些实施方案中，与BCMA相关的疾病或障碍是自身免疫性疾病或障碍。在所提供方法的任何所提供实施方案的一些实施方案中，自身免疫性疾病或障碍是系统性红斑狼疮(SLE)、狼疮性肾炎、炎性肠病、类风湿性关节炎、ANCA相关性血管炎、特发性血小板减少性紫癜(ITP)、血栓性血小板减少性紫癜(TTP)、自身免疫性血小板减少症、查加斯病(Chagas'disease)、格雷夫斯病(Grave's disease)、韦格纳氏肉芽肿病(Wegener'sgranulomatosis)、结节性多动脉炎、舍格伦综合征(Sjogren's syndrome)、寻常型天疱疮、硬皮病、多发性硬化症、银屑病、IgA肾病、IgM多发性神经病、血管炎、糖尿病、雷诺综合征(Reynaud's syndrome)、抗磷脂综合征、古德帕斯丘病(Goodpasture's disease)、川崎病、自身免疫性溶血性贫血、重症肌无力或进行性肾小球肾炎。

在一些实施方案中，疾病或障碍是癌症。在一些实施方案中，癌症是表达GPRC5D的癌症。在一些实施方案中，癌症是浆细胞恶性肿瘤，并且浆细胞恶性肿瘤是多发性骨髓瘤(MM)或浆细胞瘤。在一些实施方案中，癌症是多发性骨髓瘤(MM)。在一些实施方案中，癌症是复发性/难治性多发性骨髓瘤。

在一些实施方案中，抗原与病毒(如人乳头瘤病毒(HPV))相关，并且疾病或障碍是癌症，如HNSCC。在一些实施方案中，抗原是ROR1，并且疾病或障碍是CLL。在一些实施方案中，抗原是ROR1，并且疾病或障碍是NSCLC。

在一些实施方案中，抗体或抗原结合片段(例如，scFv或V_H结构域)特异性识别抗原，如CD19、BCMA、GPRC5D或ROR1。在一些实施方案中，抗体或抗原结合片段源自与CD19、BCMA、GPRC5D或ROR1特异性结合的抗体或抗原结合片段，或者是所述抗体或抗原结合片段的变体。

在一些实施方案中，细胞疗法(例如，过继T细胞疗法)通过自体转移进行，其中从接受细胞疗法的受试者或从源自这种受试者的样品中分离和/或以其他方式制备细胞。因此，在一些方面，细胞源自需要治疗的受试者(例如，患者)，并且在分离和处理后将细胞施用于同一受试者。

在一些实施方案中，细胞疗法(例如，过继T细胞疗法)通过同种异体转移进行，其中从将要接受或最终接受细胞疗法的受试者以外的受试者(例如，第一受试者)分离和/或以其他方式制备细胞。在此类实施方案中，然后将细胞施用于相同物种的不同受试者，例如第二受试者。在一些实施方案中，所述第一和第二受试者在遗传上是相同的。在一些实施方案中，所述第一和第二受试者在遗传上是相似的。在一些实施方案中，所述第二受试者与所述第一受试者表达相同的HLA类别或超类型。

细胞可以通过任何合适的方式施用，例如通过推注输注，通过注射例如静脉内或皮下注射、眼内注射、眼周注射、视网膜下注射、玻璃体内注射、经中隔注射、巩膜下注射、脉络膜内注射、前房注射、结膜下(subconjectval)注射、结膜下(subconjuntival)注射、眼球筋膜囊下注射、眼球后注射、眼球周注射或后近巩膜递送。在一些实施方案中，将它们通过肠胃外、肺内和鼻内以及(如果需要用于局部治疗的话)病灶内施用来施用。肠胃外输注包括肌内、静脉内、动脉内、腹膜内或皮下施用。在一些实施方案中，给定剂量是通过所述细胞的单次推注施用来施用。在一些实施方案中，给定剂量通过例如在不超过3天的时间段内细胞的多次推注施用，或通过细胞的连续输注施用来施用。在一些实施方案中，细胞剂量或任何另外的疗法(例如，淋巴细胞清除疗法、干预疗法和/或组合疗法)的施用是经由门诊递送进行的。

对于疾病的预防或治疗，适当的剂量可取决于待治疗的疾病类型、细胞或重组受体的类型、疾病的严重程度和病程、是针对预防目的还是针对治疗目的而施用细胞、先前治疗、受试者的临床病史和对细胞的反应以及主治医师的决断。在一些实施方案中，适合将组合物和细胞一次或在一系列治疗中施用于受试者。

在一些实施方案中，将细胞作为组合治疗的一部分施用，如与另一种治疗性干预如抗体或工程化细胞或受体或药剂(如细胞毒性剂或治疗剂)同时施用或以任何顺序依序施用。在一些实施方案中，将细胞与一种或多种另外的治疗剂共同施用或与另一种治疗性干预联合施用(同时或以任何顺序依序施用)。在一些情境下，将细胞与另一种疗法在时间上足够接近地共同施用，使得细胞群增强一种或多种另外的治疗剂的效果，或反之亦然。在一些实施方案中，将所述细胞在一种或多种另外的治疗剂之前施用。在一些实施方案中，将所述细胞在一种或多种另外的治疗剂之后施用。在一些实施方案中，所述一种或多种另外的药剂包括细胞因子(如IL-2)，例如以增强持久性。在一些实施方案中，所述方法包括施用化学治疗剂。

在一些实施方案中，所述方法包括在施用之前施用化学治疗剂(例如，调理性化学治疗剂)，例如以减小肿瘤负荷。

在一些方面，用免疫清除(例如，淋巴细胞清除)疗法预调理受试者可以改善过继细胞疗法(ACT)的效果。

因此，在一些实施方案中，所述方法包括在开始所述细胞疗法之前将预调理剂施用于受试者，所述预调理剂如淋巴细胞清除剂或化学治疗剂，如环磷酰胺、氟达拉滨或其组合。例如，可以在开始所述细胞疗法之前至少2天(如之前至少3、4、5、6或7天)，向所述受试者施用预调理剂。在一些实施方案中，在开始所述细胞疗法之前不超过7天(如之前不超过6、5、4、3或2天)，向所述受试者施用预调理剂。

在一些实施方案中，用环磷酰胺以在或在约20mg/kg与100mg/kg之间，如在或在约40mg/kg与80mg/kg之间的剂量对所述受试者进行预调理。在一些方面，用或用约60mg/kg的环磷酰胺对受试者进行预调理。在一些实施方案中，可以将环磷酰胺按单剂量施用或者可以按多个剂量施用，如每日施用、每隔一天施用或每三天施用。在一些实施方案中，将环磷酰胺每日施用一次，持续一天或两天。在一些实施方案中，在淋巴细胞清除剂包含环磷酰胺的情况下，按如下剂量向受试者施用环磷酰胺：在或在约100mg/m²与500mg/m²之间，如在或在约200mg/m²与400mg/m²之间或者250mg/m²与350mg/m²之间，包含端值。在一些情形中，向受试者施用约300mg/m²的环磷酰胺。在一些实施方案中，可以将环磷酰胺按单剂量施用或者可以按多个剂量施用，如每日施用、每隔一天施用或每三天施用。在一些实施方案中，每日施用环磷酰胺，如持续1-5天，例如持续3至5天。在一些情形中，在开始细胞疗法之前每日向受试者施用约300mg/m²的环磷酰胺，持续3天。

在一些实施方案中，当淋巴细胞清除剂包含氟达拉滨时，向受试者施用剂量在或在约1mg/m²与100mg/m²之间、如在或在约10mg/m²与75mg/m²之间、15mg/m²与50mg/m²之间、20mg/m²与40mg/m²之间或24mg/m²与35mg/m²之间的氟达拉滨(包含端值)。在一些情形中，向受试者施用约30mg/m²的氟达拉滨。在一些实施方案中，可以将氟达拉滨按单一剂量施用或者可以按多个剂量施用，如每日施用、每隔一天施用或每三天施用。在一些实施方案中，每日施用氟达拉滨，如持续1-5天，例如持续3至5天。在一些情形中，在开始细胞疗法之前每日向受试者施用约30mg/m²的氟达拉滨，持续3天。

在一些实施方案中，淋巴细胞清除剂包含药剂的组合，如环磷酰胺和氟达拉滨的组合。因此，药剂的组合可以包括任何剂量或施用时间表(如本文所述的那些)下的环磷酰胺以及任何剂量或施用时间表(如本文所述的那些)下的氟达拉滨。例如，在一些方面，在第一剂量或后续剂量之前，向受试者施用60mg/kg(约2g/m²)的环磷酰胺和3至5次剂量的25mg/m²氟达拉滨。

在一些实施方案中，在施用细胞后，例如通过许多已知方法中的任一种测量工程化细胞群的生物学活性。待评估的参数包括工程化或天然T细胞或其他免疫细胞与抗原的特异性结合，其在体内例如通过成像进行评估，或离体例如通过ELISA或流式细胞术进行评估。在某些实施方案中，工程化细胞破坏靶细胞的能力可以使用任何合适的已知方法来测量，所述方法例如描述于例如以下文献中的细胞毒性测定：Kochenderfer等人,J.Immunotherapy,32(7):689-702(2009)和Herman等人J.Immunological Methods,285(1):25-40(2004)。在一些实施方案中，通过测定一种或多种细胞因子(如CD107a、IFNγ、IL-2和TNF)的表达和/或分泌来测量细胞的生物学活性。在一些方面，通过评估临床结局(如肿瘤负荷或负担的减少)来测量生物活性。

在某些实施方案中，将工程化细胞以任何数量的方式进一步修饰，使得其治疗或预防功效增加。例如，可以将群体表达的工程化CAR直接或通过接头间接缀合至靶向部分。将化合物(例如，CAR)与靶向部分缀合的实践在本领域是已知的。参见例如，Wadwa等人,J.Drug Targeting 3:1 1 1(1995)；和美国专利5,087,616。

在一些实施方案中，将细胞作为组合治疗的一部分施用，如与另一种治疗性干预如抗体或工程化细胞或受体或药剂(如细胞毒性剂或治疗剂)同时施用或以任何顺序依序施用。在一些实施方案中，将细胞与一种或多种另外的治疗剂共同施用或与另一种治疗性干预联合施用(同时或以任何顺序依序施用)。在一些情境下，将细胞与另一种疗法在时间上足够接近地共同施用，使得细胞群增强一种或多种另外的治疗剂的效果，或反之亦然。在一些实施方案中，将所述细胞在一种或多种另外的治疗剂之前施用。在一些实施方案中，将所述细胞在一种或多种另外的治疗剂之后施用。在一些实施方案中，所述一种或多种另外的药剂包括细胞因子(如IL-2)例如以增强持久性。

在一些实施方案中，根据所提供方法和/或用所提供制品或组合物将一定剂量的细胞施用于受试者。在一些实施方案中，剂量的大小或时间安排根据受试者的特定疾病或病症确定。在一些情况下，可以根据所提供的描述凭经验确定用于特定疾病的剂量的大小或时间安排。

在一些实施方案中，细胞剂量包含在为或约2x10⁵个细胞/kg与为或约2x10⁶个细胞/kg之间，如在为或约4x10⁵个细胞/kg与为或约1x10⁶个细胞/kg之间或在为或约6x10⁵个细胞/kg与为或约8x10⁵个细胞/kg之间。在一些实施方案中，细胞的剂量包含不超过2x10⁵个细胞(例如，抗原表达细胞，如CAR表达细胞)/公斤受试者体重(细胞/kg)，如不超过或不超过约3x10⁵个细胞/kg、不超过或不超过约4x10⁵个细胞/kg、不超过或不超过约5x10⁵个细胞/kg、不超过或不超过约6x10⁵个细胞/kg、不超过或不超过约7x10⁵个细胞/kg、不超过或不超过约8x10⁵个细胞/kg、不超过或不超过约9x10⁵个细胞/kg、不超过或不超过约1x10⁶个细胞/kg或者不超过或不超过约2x10⁶个细胞/kg。在一些实施方案中，细胞的剂量包含至少或至少约或为或约2x10⁵个细胞(例如，抗原表达细胞，如CAR表达细胞)/公斤受试者体重(细胞/kg)，如至少或至少约或为或约3x10⁵个细胞/kg、至少或至少约或为或约4x10⁵个细胞/kg、至少或至少约或为或约5x10⁵个细胞/kg、至少或至少约或为或约6x10⁵个细胞/kg、至少或至少约或为或约7x10⁵个细胞/kg、至少或至少约或为或约8x10⁵个细胞/kg、至少或至少约或为或约9x10⁵个细胞/kg、至少或至少约或为或约1x10⁶个细胞/kg或者至少或至少约或为或约2x10⁶个细胞/kg。

在某些实施方案中，将细胞或细胞亚型的单独群体按以下施用于受试者：在为或约10万至为或约1000亿个细胞的范围和/或每公斤受试者体重该量的细胞，如例如为或约10万至为或约500亿个细胞(例如，为或约500万个细胞、为或约2500万个细胞、为或约5亿个细胞、为或约10亿个细胞、为或约50亿个细胞、为或约200亿个细胞、为或约300亿个细胞、为或约400亿个细胞或由任两个前述值限定的范围)、为或约100万至为或约500亿个细胞(例如，为或约500万个细胞、为或约2500万个细胞、为或约5亿个细胞、为或约10亿个细胞、为或约50亿个细胞、为或约200亿个细胞、为或约300亿个细胞、为或约400亿个细胞或由任两个前述值限定的范围)，如为或约1000万至为或约1000亿个细胞(例如，为或约2000万个细胞、为或约3000万个细胞、为或约4000万个细胞、为或约6000万个细胞、为或约7000万个细胞、为或约8000万个细胞、为或约9000万个细胞、为或约100亿个细胞、为或约250亿个细胞、为或约500亿个细胞、为或约750亿个细胞、为或约900亿个细胞或由任两个前述值限定的范围)，并且在一些情况下，为或约1亿个细胞至为或约500亿个细胞(例如，为或约1.2亿个细胞、为或约2.5亿个细胞、为或约3.5亿个细胞、为或约6.5亿个细胞、为或约8亿个细胞、为或约9亿个细胞、为或约30亿个细胞、为或约300亿个细胞、为或约450亿个细胞)或在这些范围和/或每公斤受试者体重的这些范围之间的任何值。剂量可以根据疾病或障碍和/或患者和/或其他治疗特有的属性而变化。在一些实施方案中，这些值是指重组受体表达细胞的数量；在其他实施方案中，它们是指施用的T细胞或PBMC或总细胞的数量。

在一些实施方案中，例如，在受试者是人的情况下，所述剂量包含少于约5x10⁸个总重组受体(例如，CAR)表达细胞、T细胞或外周血单个核细胞(PBMC)，例如，在为或约1x10⁶至为或约5x10⁸个此类细胞的范围内，如为或约2x10⁶、5x10⁶、1x10⁷、5x10⁷、1x10⁸、1.5x10⁸或5x10⁸个总此类细胞，或者在任两个前述值之间的范围。在一些实施方案中，例如，在受试者是人的情况下，所述剂量包括多于或多于约1x10⁶个总重组受体(例如，CAR)表达细胞、T细胞或外周血单个核细胞(PBMC)并且少于或少于约2x10⁹个总重组受体(例如，CAR)表达细胞、T细胞或外周血单个核细胞(PBMC)，例如在为或约2.5x10⁷至为或约1.2x10⁹个此类细胞的范围内，如为或约2.5x10⁷、5x10⁷、1x10⁸、1.5x10⁸、8x10⁸或1.2x10⁹个总此类细胞，或任两个前述值之间的范围内。

在一些实施方案中，基因工程化细胞的剂量包含从为或约1x10⁵至为或约5x10⁸个总CAR表达(CAR⁺)T细胞、从为或约1x10⁵至为或约2.5x10⁸个总CAR⁺T细胞、从为或约1x10⁵至为或约1x10⁸个总CAR⁺T细胞、从为或约1x10⁵至为或约5x10⁷个总CAR⁺T细胞、从为或约1x10⁵至为或约2.5x10⁷个总CAR⁺T细胞、从为或约1x10⁵至为或约1x10⁷个总CAR⁺T细胞、从为或约1x10⁵至为或约5x10⁶个总CAR⁺T细胞、从为或约1x10⁵至为或约2.5x10⁶个总CAR⁺T细胞、从为或约1x10⁵至为或约1x10⁶个总CAR⁺T细胞、从为或约1x10⁶至为或约5x10⁸个总CAR⁺T细胞、从为或约1x10⁶至为或约2.5x10⁸个总CAR⁺T细胞、从为或约1x10⁶至为或约1x10⁸个总CAR⁺T细胞、从为或约1x10⁶至为或约5x10⁷个总CAR⁺T细胞、从为或约1x10⁶至为或约2.5x10⁷个总CAR⁺T细胞、从为或约1x10⁶至为或约1x10⁷个总CAR⁺T细胞、从为或约1x10⁶至为或约5x10⁶个总CAR⁺T细胞、从为或约1x10⁶至为或约2.5x10⁶个总CAR⁺T细胞、从为或约2.5x10⁶至为或约5x10⁸个总CAR⁺T细胞、从为或约2.5x10⁶至为或约2.5x10⁸个总CAR⁺T细胞、从为或约2.5x10⁶至为或约1x10⁸个总CAR⁺T细胞、从为或约2.5x10⁶至为或约5x10⁷个总CAR⁺T细胞、从为或约2.5x10⁶至为或约2.5x10⁷个总CAR⁺T细胞、从为或约2.5x10⁶至为或约1x10⁷个总CAR⁺T细胞、从为或约2.5x10⁶至为或约5x10⁶个总CAR⁺T细胞、从为或约5x10⁶至为或约5x10⁸个总CAR⁺T细胞、从为或约5x10⁶至为或约2.5x10⁸个总CAR⁺T细胞、从为或约5x10⁶至为或约1x10⁸个总CAR⁺T细胞、从为或约5x10⁶至为或约5x10⁷个总CAR⁺T细胞、从为或约5x10⁶至为或约2.5x10⁷个总CAR⁺T细胞、从为或约5x10⁶至为或约1x10⁷个总CAR⁺T细胞、从为或约1x10⁷至为或约5x10⁸个总CAR⁺T细胞、从为或约1x10⁷至为或约2.5x10⁸个总CAR⁺T细胞、从为或约1x10⁷至为或约1x10⁸个总CAR⁺T细胞、从为或约1x10⁷至为或约5x10⁷个总CAR⁺T细胞、从为或约1x10⁷至为或约2.5x10⁷个总CAR⁺T细胞、从为或约2.5x10⁷至为或约5x10⁸个总CAR⁺T细胞、从为或约2.5x10⁷至为或约2.5x10⁸个总CAR⁺T细胞、从为或约2.5x10⁷至为或约1x10⁸个总CAR⁺T细胞、从为或约2.5x10⁷至为或约5x10⁷个总CAR⁺T细胞、从为或约5x10⁷至为或约5x10⁸个总CAR⁺T细胞、从为或约5x10⁷至为或约2.5x10⁸个总CAR⁺T细胞、从为或约5x10⁷至为或约1x10⁸个总CAR⁺T细胞、从为或约1x10⁸至为或约5x10⁸个总CAR⁺T细胞、从为或约1x10⁸至为或约2.5x10⁸个总CAR⁺T细胞、从为或约2.5x10⁸至为或约5x10⁸个总CAR⁺T细胞。在一些实施方案中，基因工程化细胞的剂量包含从或从约2.5x10⁷至或至约1.5x10⁸个总CAR⁺T细胞，如从或从约5x10⁷至或至约1x10⁸个总CAR⁺T细胞。

在一些实施方案中，基因工程化细胞的剂量包含至少或至少约1x10⁵个CAR⁺细胞、至少或至少约2.5x10⁵个CAR⁺细胞、至少或至少约5x10⁵个CAR⁺细胞、至少或至少约1x10⁶个CAR⁺细胞、至少或至少约2.5x10⁶个CAR⁺细胞、至少或至少约5x10⁶个CAR⁺细胞、至少或至少约1x10⁷个CAR⁺细胞、至少或至少约2.5x10⁷个CAR⁺细胞、至少或至少约5x10⁷个CAR⁺细胞、至少或至少约1x10⁸个CAR⁺细胞、至少或至少约1.5x10⁸个CAR⁺细胞、至少或至少约2.5x10⁸个CAR⁺细胞或者至少或至少约5x10⁸个CAR⁺细胞。

在一些实施方案中，细胞疗法包括施用一定剂量，所述剂量包含如下数量的细胞：从或从约1x10⁵至或至约5x10⁸个总重组受体表达细胞、总T细胞或总外周血单个核细胞(PBMC)，从或从约5x10⁵至或至约1x10⁷个总重组受体表达细胞、总T细胞或总外周血单个核细胞(PBMC)或者从或从约1x10⁶至或至约1x10⁷个总重组受体表达细胞、总T细胞或总外周血单个核细胞(PBMC)，每个都包含端值。在一些实施方案中，细胞疗法包括施用一定剂量的细胞，所述剂量包含如下细胞数量：至少或至少约1x10⁵个总重组受体表达细胞、总T细胞或总外周血单个核细胞(PBMC)，如至少或至少1x10⁶、至少或至少约1x10⁷、至少或至少约1x10⁸个此类细胞。在一些实施方案中，所述数量是关于CD3⁺或CD8⁺的总数，在一些情况下也是关于重组受体表达(例如，CAR⁺)细胞。在一些实施方案中，细胞疗法包括施用一定剂量，所述剂量包含如下数量的细胞：从或从约1x10⁵至或至约5x10⁸个CD3⁺或CD8⁺总T细胞或CD3⁺或CD8⁺重组受体表达细胞、从或从约5x10⁵至或至约1x10⁷个CD3⁺或CD8⁺总T细胞或CD3⁺或CD8⁺重组受体表达细胞、或从或从约1x10⁶至或至约1x10⁷个CD3⁺或CD8⁺总T细胞或CD3⁺或CD8⁺重组受体表达细胞，每个都包含端值。在一些实施方案中，细胞疗法包括施用一定剂量，所述剂量包含如下数量的细胞：从或从约1x10⁵至或至约5x10⁸个总CD3⁺/CAR⁺或CD8⁺/CAR⁺细胞、从或从约5x10⁵至或至约1x10⁷个总CD3⁺/CAR⁺或CD8⁺/CAR⁺细胞或者从或从约1x10⁶至或至约1x10⁷个总CD3⁺/CAR⁺或CD8⁺/CAR⁺细胞，每个都包含端值。

在一些实施方案中，所述剂量的所述T细胞包括CD4⁺T细胞、CD8⁺T细胞或CD4⁺和CD8⁺T细胞。在一些实施方案中，所述剂量的T细胞包括CD4⁺T细胞、人CD8⁺T细胞或人CD4⁺T细胞和人CD8⁺T细胞。

例如，在一些实施方案中，如果受试者是人，则所述剂量的CD8⁺T细胞(包括在包括CD4⁺和CD8⁺T细胞的剂量中)包括在为或约1x10⁶与为或约5x10⁸个之间的总重组受体(例如，CAR)表达CD8⁺细胞，例如在以下范围内：从为或约5x10⁶至为或约1x10⁸个此类细胞，如1x10⁷、2.5x10⁷、5x10⁷、7.5x10⁷、1x10⁸、1.5x10⁸或5x10⁸个总此类细胞，或任两个前述值之间的范围。在一些实施方案中，向患者施用多个剂量，并且每个剂量或总剂量可以在任何前述值内。在一些实施方案中，细胞的剂量包括施用从或从约1x10⁷至或至约0.75x10⁸个总重组受体表达CD8⁺T细胞、从或从约1x10⁷至或至约5x10⁷个总重组受体表达CD8⁺T细胞、从或从约1x10⁷至或至约0.25x10⁸个总重组受体表达CD8⁺T细胞，每个都包含端值。在一些实施方案中，细胞的剂量包括施用为或约1x10⁷、2.5x10⁷、5x10⁷、7.5x10⁷、1x10⁸、1.5x10⁸、2.5x10⁸或5x10⁸个总重组受体表达CD8⁺T细胞。

在一些实施方案中，细胞(例如，重组受体表达T细胞)的剂量作为单一剂量施用于受试者，或者在两周、一个月、三个月、六个月、1年或更长的时间段内仅施用一次。在过继细胞疗法的情况下，施用给定“剂量”涵盖施用作为单一组合物和/或单次不间断施用(例如，作为单次注射或连续输注)的给定量或数量的细胞，并且还涵盖在指定时间段中(如在不超过3天中)施用在多种单独组合物或输注中提供的作为分割剂量或作为多种组合物的给定量或数量的细胞。因此，在一些情境下，剂量是指定数量的细胞的单次或连续施用，在单个时间点给予或开始。然而，在一些情境下，剂量在不超过三天的时间段内以多次注射或输注的方式施用，例如每天一次持续三天或两天或者通过在一天的时间内多次输注。

因此，在一些方面，所述剂量的细胞以单一药物组合物施用。在一些实施方案中，所述剂量的细胞以共同含有所述剂量的细胞的多种组合物施用。

在一些实施方案中，术语“分割剂量”是指这样分割的剂量，使其在超过一天的时间内施用。这种类型的给药包括在本方法中并且被认为是单一剂量。

因此，所述细胞剂量可以作为分割剂量施用，例如随时间施用的分割剂量。例如，在一些实施方案中，剂量可以在2天或3天内施用受试者。用于分割给药的示例性方法包括在第一天施用25％的剂量并在第二天施用剩余的75％的剂量。在其他实施方案中，可以在第一天施用33％的剂量，并且在第二天施用剩余的67％。在一些方面，在第一天施用10％的剂量，在第二天施用30％的剂量，并且在第三天施用60％的剂量。在一些实施方案中，分割剂量不超过3天。

在一些实施方案中，所述剂量的细胞可以通过施用多种组合物或溶液(如第一和第二，任选地更多)来施用，每种组合物或溶液含有所述剂量的一些细胞。在一些方面，任选地在某一时间段内，分开地或独立地施用各自含有不同细胞群和/或细胞亚型的多个组合物。例如，细胞群或细胞亚型可以分别包括CD8⁺和CD4⁺T细胞，和/或分别包含富集CD8+和CD4+的群体，例如CD4+和/或CD8+T细胞，其各自单独地包括基因工程化以表达重组受体的细胞。在一些实施方案中，所述剂量的施用包括施用第一组合物，其包含一定剂量的CD8+T细胞或一定剂量的CD4+T细胞；以及施用第二组合物，其包含另一剂量的CD4+T细胞和CD8+T细胞。

在一些实施方案中，所述组合物或剂量的施用(例如，所述多种细胞组合物的施用)涉及分开施用所述细胞组合物。在一些方面，分开施用同时或按任何顺序依序进行。在一些实施方案中，所述剂量包含第一组合物和第二组合物，并且将第一组合物和第二组合物相隔从为或约0至为或约12小时、相隔从为或约0至为或约6小时或相隔从为或约0至为或约2小时施用。在一些实施方案中，开始施用第一组合物和开始施用第二组合物是相隔不超过或不超过约2小时、不超过或不超过约1小时或不超过或不超过约30分钟，相隔不超过或不超过约15分钟、不超过或不超过约10分钟或不超过或不超过约5分钟进行的。在一些实施方案中，开始和/或完成施用第一组合物和完成和/或开始施用第二组合物是相隔不超过或不超过约2小时、不超过或不超过约1小时或不超过或不超过约30分钟，相隔不超过或不超过约15分钟、不超过或不超过约10分钟或不超过或不超过约5分钟进行的。

在一些组合物中，所述第一组合物(例如，所述剂量的第一组合物)包含CD4⁺T细胞。在一些组合物中，所述第一组合物(例如，所述剂量的第一组合物)包含CD8⁺T细胞。在一些实施方案中，第一组合物是在第二组合物之前施用。

在一些实施方案中，细胞的所述剂量或组合物包括限定或目标比率的表达重组受体的CD4⁺细胞与表达重组受体的CD8⁺细胞和/或限定或目标比率的CD4⁺细胞与CD8⁺细胞，所述比率任选地为大约1:1或者在大约1:3与大约3:1之间，如大约1:1。在一些方面，具有不同细胞群的目标或所需比率(如CD4⁺:CD8⁺比率或CAR⁺CD4⁺:CAR⁺CD8⁺比率，例如，1:1)的组合物或剂量的施用涉及施用含有所述群体中的一种的细胞组合物，然后施用包含所述群体中的另一种的单独细胞组合物，其中所述施用是以或大约以所述目标或所需比率来进行。在一些方面，定义比率的细胞的剂量或组合物的施用导致改善T细胞疗法的扩增、持久性和/或抗肿瘤活性。

在一些实施方案中，受试者接受细胞的多个剂量，例如，两个或更多个剂量或多个连续剂量。在一些实施方案中，向受试者施用两个剂量。在一些实施方案中，受试者接受连续剂量，例如，第二剂量是在第一剂量后约4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、16天、17天、18天、19天、20天或21天施用。在一些实施方案中，在第一剂量后施用多个连续剂量，使得在施用所述连续剂量后施用另外一个或多个剂量。在一些方面，在另外的剂量中施用于受试者的细胞数量与第一剂量和/或连续剂量相同或相似。在一些实施方案中，另外一个或多个剂量大于先前剂量。

在一些方面，第一和/或连续剂量的大小基于一个或多个标准来确定，如受试者对先前治疗(例如，化学疗法)的反应、受试者的疾病负荷(如肿瘤负担、体积、大小或程度)、转移的范围或类型、分期和/或受试者发生毒性结局(例如，CRS、巨噬细胞激活综合征、肿瘤溶解综合征、神经毒性和/或针对所施用的细胞和/或重组受体的宿主免疫反应)的可能性或发生率。

在一些方面，第一剂量的施用与连续剂量的施用之间的时间为约9至约35天、约14至约28天或15至27天。在一些实施方案中，施用连续剂量是在施用第一剂量后大于约14天且在施用第一剂量后小于约28天的某个时间点进行。在一些方面，第一剂量与连续剂量之间的时间为约21天。在一些实施方案中，在施用连续剂量后施用另外一个或多个剂量(例如连续剂量)。在一些方面，在施用先前剂量后至少约14天且小于约28天施用另外一个或多个连续剂量。在一些方面，在先前剂量后小于约14天(例如，在先前剂量后4、5、6、7、8、9、10、11、12或13天)施用另外的剂量。在一些实施方案中，在先前剂量后小于约14天不施用剂量，和/或在先前剂量后超过约28天不施用剂量。

在一些实施方案中，细胞(例如，重组受体表达细胞)的剂量包含两个剂量(例如，双剂量)，包含第一剂量的T细胞和连续剂量的T细胞，其中第一剂量和第二剂量中之一或两者包括施用分割剂量的T细胞。

在一些实施方案中，细胞的所述剂量通常足够大以有效减少疾病负荷。

在一些实施方案中，细胞以所需剂量施用，所述所需剂量在一些方面包括所需剂量或数量的细胞或一种或多种细胞类型和/或所需比率的细胞类型。因此，在一些实施方案中，细胞剂量基于细胞总数(或每kg体重的细胞数量)和所需的单独群体或亚型的比率，如CD4+与CD8+的比率。在一些实施方案中，细胞剂量基于所需的单独群体中的细胞或单独细胞类型的总数(或每kg体重的细胞数量)。在一些实施方案中，剂量基于这种特征的组合，如所需的总细胞数量、所需比率和所需的单独群体中的细胞总数。

在一些实施方案中，以所需剂量的总细胞(如所需剂量的T细胞)的耐受差异或在所述耐受差异之内施用细胞的群体或亚型如CD8⁺和CD4⁺T细胞。在一些方面，所需剂量是所需细胞数量或被施用细胞的受试者的每单位体重的所需细胞数量，例如细胞/kg。在一些方面，所需剂量等于或高于最小细胞数量或每单位体重的最小细胞数量。在一些方面，在以所需剂量施用的总细胞中，单独群体或亚型以等于或接近所需输出比率(如CD4⁺与CD8⁺比率)存在，例如在这种比率的一定容忍差异或误差内。

在一些实施方案中，细胞以所需剂量的一种或多种单独细胞群或亚型的耐受差异或在所述耐受差异之内施用，如所需剂量的CD4+细胞和/或所需剂量的CD8+细胞。在一些方面，所需剂量是亚型或群体的细胞的所需数量或被施用细胞的受试者的每单位体重的此类细胞的所需数量，例如细胞/kg。在一些方面，所需剂量等于或高于最小的群体或亚型的细胞数量或每单位体重的最小的群体或亚型的细胞数量。

因此，在一些实施方案中，剂量基于所需的总细胞的固定剂量和所需比率，和/或基于所需的一种或多种单独亚型或亚群(例如，各自)的固定剂量。因此，在一些实施方案中，剂量基于所需的T细胞的固定或最小剂量和所需的CD4⁺与CD8⁺细胞的比率，和/或基于所需的CD4⁺和/或CD8⁺细胞的固定或最小剂量。

在一些实施方案中，细胞在多种细胞群或亚型(如CD4+和CD8+细胞或亚型)的所需输出比率的耐受范围下或耐受范围内施用。在一些方面，所需比率可以是特定比率或可以是一系列比率。例如，在一些实施方案中，所需比率(例如，CD4⁺与CD8⁺细胞的比率)是在为或约1:5与为或约5:1之间(或大于约1:5且小于约5:1)或在为或约1:3与为或约3:1之间(或大于约1:3且小于约3:1)，如在为或约2:1与为或约1:5之间(或大于约1:5且小于约2:1，如为或约5:1、4.5:1、4:1、3.5:1、3:1、2.5:1、2:1、1.9:1、1.8:1、1.7:1、1.6:1、1.5:1、1.4:1、1.3:1、1.2:1、1.1:1、1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.5、1:3、1:3.5、1:4、1:4.5或1:5。在一些方面，耐受差异在所需比率的约1％、约2％、约3％、约4％、约5％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％内，包括这些范围之间的任何值。

在任何实施方案的一些实施方案中，细胞的数量和/或浓度是指重组受体(例如，CAR)表达细胞的数量。在其他实施方案中，细胞的数量和/或浓度是指施用的所有细胞、T细胞或外周血单个核细胞(PBMC)的数量或浓度。

在一些方面，剂量的大小基于一个或多个标准来确定，如受试者对先前治疗(例如，化学疗法)的反应、受试者的疾病负荷(如肿瘤负担、体积、尺寸或程度)、转移的程度或类型、分期和/或受试者发生毒性结局(例如，CRS、巨噬细胞激活综合征、肿瘤溶解综合征、神经毒性和/或针对所施用的细胞和/或重组受体的宿主免疫反应)的可能性或发生率。

在一些实施方案中，所述方法还包括施用一个或多个另外的剂量的表达嵌合抗原受体(CAR)的细胞和/或淋巴细胞清除疗法，和/或重复所述方法的一个或多个步骤。在一些实施方案中，所述一个或多个另外的剂量与初始剂量相同。在一些实施方案中，所述一个或多个另外的剂量不同于初始剂量，例如更高如比初始剂量高2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍或10倍或更多倍，或者更低如比初始剂量低2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍或10倍或更多倍。在一些实施方案中，一个或多个另外的剂量的施用基于以下来确定：受试者对初始治疗或任何先前治疗的反应、受试者的疾病负荷(如肿瘤负担、体积、大小或程度)、转移的程度或类型、分期和/或受试者发生毒性结果(例如，CRS、巨噬细胞激活综合征、肿瘤溶解综合征、神经毒性和/或针对所施用的细胞和/或重组受体的宿主免疫反应)的可能性或发生率。

在一些实施方案中，与未施用所述工程化细胞或所述组合物的受试者相比，在施用了本文提供的工程化细胞或组合物的受试者中，所述癌症或所述肿瘤的体积或大小减小。在一些实施方案中，与未施用所述工程化细胞或所述组合物的受试者相比，在施用了本文提供的工程化细胞或组合物的受试者中，所述受试者的存活期延长。

VI.药物组合物和配制品

所述组合物包括用于施用(如用于过继细胞疗法)的药物组合物和配制品。在一些实施方案中，提供包含用重组抗原受体(例如，CAR)工程化的细胞的细胞剂量作为组合物或配制品，如药物组合物或配制品。此类组合物可以根据所提供的方法来使用和/或与所提供的制品或组合物一起使用，如用于预防或治疗疾病、病症和障碍，或者用于检测、诊断和预后方法中。

术语“药物配制品”是指这样的制剂，其处于使得其中所含活性成分的生物活性有效的形式，并且不含对施用配制品的受试者具有不可接受的毒性的另外的组分。

“药学上可接受的载体”是指药物配制品中除了活性成分之外对受试者无毒的成分。药学上可接受的载体包括但不限于缓冲剂、赋形剂、稳定剂或防腐剂。

在一些方面，载体的选择部分地由特定细胞或药剂和/或通过施用方法确定。因此，存在多种合适的配制品。例如，药物组合物可以含有防腐剂。合适的防腐剂可以包括例如对羟基苯甲酸甲酯、对羟基苯甲酸丙酯、苯甲酸钠和苯扎氯铵。在一些方面中，使用两种或更多种防腐剂的混合物。防腐剂或其混合物通常以按总组合物的重量计约0.0001％至约2％的量存在。载体描述于例如Remington’s Pharmaceutical Sciences 16th edition,Osol,A.编辑(1980)。药学上可接受的载体在所用剂量和浓度下通常对接受者无毒，并且包括但不限于：缓冲液，如磷酸盐、柠檬酸盐和其他有机酸；抗氧化剂，包括抗坏血酸和甲硫氨酸；防腐剂(如十八烷基二甲基苄基氯化铵；六甲氯铵；苯扎氯铵；苄索氯铵；苯酚、丁醇或苄醇；烷基对羟基苯甲酸酯，如对羟基苯甲酸甲酯或对羟基苯甲酸丙酯；儿茶酚；间苯二酚；环己醇；3-戊醇；和间甲酚)；低分子量(少于约10个残基)多肽；蛋白质，如血清白蛋白、明胶或免疫球蛋白；亲水性聚合物，如聚乙烯吡咯烷酮；氨基酸，如甘氨酸、谷氨酰胺、天冬酰胺、组氨酸、精氨酸或赖氨酸；单糖、二糖和其他碳水化合物，包括葡萄糖、甘露糖或糊精；螯合剂，如EDTA；糖类，如蔗糖、甘露醇、海藻糖或山梨醇；成盐抗衡离子，如钠；金属络合物(例如锌-蛋白质络合物)；和/或非离子表面活性剂，如聚乙二醇(PEG)。

在一些方面，在所述组合物中包括缓冲剂。合适的缓冲剂包括例如柠檬酸、柠檬酸钠、磷酸、磷酸钾和各种其他酸和盐。在一些方面，使用两种或更多种缓冲剂的混合物。所述缓冲剂或其混合物通常以按总组合物的重量计约0.001％至约4％的量存在。用于制备可施用的药物组合物的方法是已知的。示例性方法更详细地描述于例如Remington:TheScience and Practice of Pharmacy,Lippincott Williams&Wilkins；21st ed.(2005年5月1日)中。

配制品或组合物还可含有多于一种活性成分，其可用于用细胞或药剂预防或治疗的特定适应证、疾病或病症，其中各自的活性不会相互产生不利影响。此类活性成分以有效用于既定目的的量以合适的方式组合存在。因此，在一些实施方案中，药物组合物进一步包含其他药物活性剂或药物如化学治疗剂，例如天冬酰胺酶、白消安、卡铂、顺铂、柔红霉素、多柔比星、氟尿嘧啶、吉西他滨、羟基脲、甲氨蝶呤、紫杉醇、利妥昔单抗、长春碱、长春新碱等。在一些实施方案中，所述药剂或细胞以盐(例如药学上可接受的盐)的形式施用。合适的药学上可接受的酸加成盐包括源自无机酸(如盐酸、氢溴酸、磷酸、偏磷酸，硝酸和硫酸)和有机酸(如酒石酸、乙酸、柠檬酸、苹果酸、乳酸、富马酸、苯甲酸、乙醇酸、葡萄糖酸、琥珀酸和芳基磺酸，例如对甲苯磺酸)的那些盐。

在一些实施方案中，药物组合物含有有效治疗或预防疾病或病症的量(如治疗有效量或预防有效量)的药剂或细胞。在一些实施方案中，通过定期评估所治疗的受试者来监测治疗或预防功效。对于数天或更长时间的重复施用，取决于病症，重复所述治疗直至出现所需疾病症状的抑制。然而，其他剂量方案可能是有用的并且可以被确定。所需剂量可以通过单次推注施用所述组合物、通过多次推注施用所述组合物或通过连续输注施用所述组合物来递送。

所述药剂或细胞可以通过任何合适的方式施用，例如通过推注输注，通过注射例如静脉内或皮下注射、眼内注射、眼周注射、视网膜下注射、玻璃体内注射、经中隔注射、巩膜下注射、脉络膜内注射、前房注射、结膜下(subconjectval)注射、结膜下(subconjuntival)注射、眼球筋膜囊下(sub-Tenon)注射、球后注射、球周注射或后近巩膜(posterior juxtascleral)递送。在一些实施方案中，将它们通过肠胃外、肺内和鼻内以及(如果需要用于局部治疗的话)病灶内施用来施用。肠胃外输注包括肌内、静脉内、动脉内、腹膜内或皮下施用。在一些实施方案中，给定剂量通过细胞或药剂的单次推注施用来施用。在一些实施方案中，其是通过例如在不超过3天的时间段内对细胞或药剂的多次推注施用或通过细胞或药剂的连续输注施用来施用。

对于疾病的预防或治疗，适当的剂量可以取决于待治疗的疾病类型、一种或多种药剂的类型、细胞或重组受体的类型、疾病的严重程度和病程、施用药剂或细胞是用于预防目的还是治疗目的、先前疗法、受试者的临床病史和对药剂或细胞的反应以及主治医师的决断。在一些实施方案中，所述组合物适合一次或在一系列治疗中施用于受试者。

可以使用标准施用技术、配制品和/或设备施用细胞或药剂。提供了用于储存和施用所述组合物的配制品和装置(如注射器和小瓶)。关于细胞，施用可以是自体的或异源的。在一些方面，将细胞从受试者分离，工程化，并施用至同一受试者。在其他方面，将细胞从一名受试者分离，工程化，并施用至另一名受试者。例如，免疫应答细胞或祖细胞可以获得自一名受试者，并且施用于同一受试者或不同的相容受试者。外周血衍生的免疫应答细胞或其后代(例如，体内、离体或体外衍生的)可以经由局部注射施用，包括导管施用、全身注射、局部注射、静脉内注射或肠胃外施用。当施用治疗性组合物(例如，含有基因修饰的免疫反应性细胞或治疗或改善神经毒性症状的药剂的药物组合物)时，通常将其配制成单位剂量可注射形式(溶液、悬浮液、乳液)。

配制品包括用于口服、静脉内、腹膜内、皮下、经肺、透皮、肌内、鼻内、经颊、舌下或栓剂施用的那些。在一些实施方案中，肠胃外施用药剂或细胞群。如本文所用术语“肠胃外”包括静脉内、肌内、皮下、直肠、阴道和腹膜内施用。在一些实施方案中，使用通过静脉内、腹膜内或皮下注射的外周全身递送向受试者施用药剂或细胞群。

在一些实施方案中，组合物作为无菌液体制剂提供，例如等渗水溶液、悬浮液、乳液、分散体或粘性组合物，其在一些方面可以缓冲至选择的pH。液体制剂一般比凝胶、其他粘性组合物和固体组合物制备起来更容易。另外地，液体组合物稍微更方便施用，特别是通过注射。在另一方面，粘性组合物可以配制在适当的粘度范围内，以提供与特定组织的更长的接触时间。液体或粘性组合物可以包含载体，其可以是溶剂或分散介质，其含有例如水、盐水、磷酸盐缓冲盐水、多元醇(例如，甘油、丙二醇、液体聚乙二醇)及其合适的混合物。

无菌可注射溶液可以通过以下方式来制备：将所述药剂或细胞掺入溶剂中，如掺入与合适的载体、稀释剂或赋形剂(如无菌水、生理盐水、葡萄糖、右旋糖等)的混合物中。

用于体内施用的配制品通常是无菌的。可以例如通过经无菌滤膜过滤容易地实现无菌。

VII.试剂盒和制品

还提供了可用于进行所提供的实施方案的制品、系统、设备和试剂盒。在一些实施方案中，所提供的制品或试剂盒含有能够诱导基因破坏的所述一种或多种药剂的一种或多种组分和/或一种或多种模板多核苷酸(例如，含有编码重组受体或其部分的转基因的模板多核苷酸)。在一些实施方案中，所述制品或试剂盒可以用于将T细胞工程化以表达重组受体和/或其他分子的方法中。

在一些实施方案中，制品或试剂盒包括可用于进行所提供的方法的多肽、核酸、载体和/或多核苷酸。在一些实施方案中，制品或试剂盒包括一种或多种核酸分子(例如，质粒或DNA片段)，其编码能够诱导基因破坏的所述一种或多种药剂的一种或多种组分和/或包含例如用于在经由HDR将转基因靶向至细胞中使用的一种或多种模板多核苷酸。在一些实施方案中，本文提供的制品或试剂盒含有对照载体。

在一些实施方案中，本文提供的制品或试剂盒含有一种或多种药剂，其中所述一种或多种药剂中的每一种独立地能够诱导T细胞刺激相关基因座内的靶位点的基因破坏；以及模板多核苷酸，所述模板多核苷酸包含编码重组受体或其部分的转基因，其中转基因被靶向以供经由同源定向修复(HDR)整合于靶位点处或附近。在一些方面，能够诱导基因破坏的所述一种或多种药剂是本文所述的任一种。在一些方面，所述一种或多种药剂是包含Cas9/gRNA复合物的核糖核蛋白(RNP)复合物。在一些方面，RNP中所包括的gRNA靶向T细胞刺激相关基因座中的靶位点，如本文所述的任何靶位点。在一些方面，模板多核苷酸是本文所述的任何模板多核苷酸。

在一些实施方案中，制品或试剂盒包括一个或多个容器(通常是多个容器)、包装材料和位于所述一个或多个容器和/或包装上或与所述容器和/或包装关联的标签或包装说明书，所述标签或包装说明书通常包括使用说明书，例如用于将组分引入细胞中以供工程化的说明书。

本文提供的制品含有包装材料。用于在包装所提供材料中使用的包装材料是熟知的。参见例如，美国专利号5,323,907、5,052,558和5,033,252，将其中的每一个以其整体并入本文。包装材料的例子包括但不限于泡罩包装、瓶子、管、吸入器、泵、袋、小瓶、容器、注射器、一次性实验室用品(例如，移液管尖端和/或塑料板)或瓶子。制品或试剂盒可以包括装置，以便有助于分配材料或有助于以高通量或大规模方式使用，例如以有助于在机器人设备中使用。通常，包装不与其中所含的组合物反应。

在一些实施方案中，能够诱导基因破坏的所述一种或多种药剂和/或一种或多种模板多核苷酸是分开包装的。在一些实施方案中，每个容器可以具有单一区室。在一些实施方案中，制品或试剂盒的其他组分是分开包装的，或者一起包装于单一区室中。

还提供了可用于施用所提供的细胞和/或细胞组合物以例如用于在疗法或治疗中使用的制品、系统、设备和试剂盒。在一些实施方案中，本文提供的制品或试剂盒含有T细胞和/或T细胞组合物，如本文所述的任何T细胞和/或T细胞组合物。在一些方面，本文提供的制品或试剂盒可以用于施用T细胞或T细胞组合物，并且可以包括使用说明书。

在一些实施方案中，本文提供的制品或试剂盒含有T细胞和/或T细胞组合物，如本文所述的任何T细胞和/或T细胞组合物。在一些实施方案中，T细胞和/或T细胞组合物任何修饰的T细胞使用本文所述的筛选方法。在一些实施方案中，本文提供的制品或试剂盒含有对照或未经修饰的T细胞和/或T细胞组合物。在一些实施方案中，制品或试剂盒包括用于施用工程化细胞和/或细胞组合物以用于疗法的一个或多个说明书。

含有用于疗法的细胞或细胞组合物的制品和/或试剂盒可以包括容器以及在所述容器上或与所述容器关联的标签或包装说明书。合适的容器包括例如瓶子、小瓶、注射器、IV溶液袋等。容器可以由各种材料(例如玻璃或塑料)形成。在一些实施方案中，容器容纳组合物自身或组合物与有效治疗、预防和/或诊断病症的另一种组合物的组合。在一些实施方案中，容器具有无菌入口。示例性容器包括静脉内溶液袋、小瓶(包括具有可被注射针刺穿的塞子的那些溶液袋、小瓶)或用于口服施用剂的瓶子或小瓶。标签或包装说明书可以指示将组合物用于治疗疾病或病症。所述制品可以包括(a)其中含有组合物的第一容器，其中所述组合物包括表达重组受体的工程化细胞；和(b)其中含有组合物的第二容器，其中所述组合物包括第二药剂。在一些实施方案中，所述制品可以包括(a)其中含有第一组合物的第一容器，其中所述组合物包括表达重组受体的工程化细胞的亚型；和(b)其中含有组合物的第二容器，其中所述组合物包括表达重组受体的工程化细胞的不同亚型。制品还可以包括包装说明书，其指示组合物可以用于治疗特定病症。可替代地或另外，所述制品还可以包括另一种或相同的容器，所述容器包含药学上可接受的缓冲剂。它还可以包括其他材料，如其他缓冲剂、稀释剂、过滤器、针头和/或注射器。

VIII.定义

除非另外定义，否则本文使用的所有领域术语、符号和其他技术和科学术语或命名旨在具有与所要求保护的主题所属领域的普通技术人员通常理解的含义相同的含义。在一些情况下，为了清楚和/或为了便于参考而在本文中定义具有通常理解的含义的术语，并且本文中包含的此类定义不应被解释为表示与本领域通常理解的实质性差异。

除非上下文明确指示其他含义，否则如本文所用的单数形式“一个”、“一种”和“所述”包括复数指示物。例如，“一种/个(a或an)”意指“至少一种/个”或“一种/个或多种/个”。应理解，本文描述的方面和变化包括“由方面和变化组成”和/或“基本上由方面和变化组成”。

贯穿本公开文本，所要求保护的主题的各个方面以范围形式呈现。应理解的是，范围形式的描述仅仅是为了方便和简洁，并且不应该被解释为对所要求保护的主题的范围的不能转变的限制。因此，应该认为范围的描述具体公开了所有可能的子范围以及该范围内的单个数值。例如，在提供了值的范围的情况下，应理解，在该范围的上限和下限之间的每个中间值以及在所陈述范围内的任何其他所述或中间值涵盖在所要求保护的主题内。这些较小范围的上限和下限可以独立地被包括在该较小范围内，并且也涵盖在所要求保护的主题内，受制于在所陈述范围内任何确切排除的限制。在所陈述范围包括限制中的一者或两者的情况下，排除了那些包括的限制中的任一者或两者的范围也包括在所要求保护的主题内。无论范围的广度如何，这都适用。

如本文所用的术语“约”是指容易知道的相应值的通常误差范围。本文对“约”某一值或参数的提及包括(并描述)针对所述值或参数本身的实施方案。例如，涉及“约X”的描述包括“X”的描述。在一些实施方案中，“约”可以指代±25％、±20％、±15％、±10％、±5％或±1％。

如本文所用，叙述核苷酸或氨基酸位置“对应于”所公开序列中的核苷酸或氨基酸位置(如序列表所示)是指，在使用标准比对算法(例如，GAP算法)与所公开序列比对以使同一性最大化之后，所鉴定的核苷酸或氨基酸位置。通过比对序列，可以例如使用保守且相同的氨基酸残基作为指导来鉴定相应残基。通常，为了鉴定对应位置，比对氨基酸序列使得获得最高阶匹配(参见例如：Computational Molecular Biology,Lesk,A.M.编辑,OxfordUniversity Press,纽约,1988；Biocomputing:Informatics and Genome Projects,Smith,D.W.编辑,Academic Press,纽约,1993；Computer Analysis of Sequence Data,Part I,Griffin,A.M.和Griffin,H.G.编辑,Humana Press,新泽西州,1994；SequenceAnalysis in Molecular Biology,von Heinje,G.,Academic Press,1987；和SequenceAnalysis Primer,Gribskov,M.和Devereux,J.编辑,M Stockton Press,纽约,1991；Carrillo等人(1988)SIAM J Applied Math 48:1073)。

如本文所用，术语“载体”是指能传播其所连接的另一核酸分子的核酸分子。所述术语包括作为自我复制核酸结构的载体以及掺入已引入其的宿主细胞基因组中的载体。某些载体能够指导它们可操作地连接的核酸的表达。此类载体在本文中称为“表达载体”。载体包括病毒载体，如逆转录病毒(例如，γ逆转录病毒)和慢病毒载体。

术语“宿主细胞”、“宿主细胞系”和“宿主细胞培养物”可互换使用，并且是指已引入外源核酸的细胞，包括此类细胞的后代。宿主细胞包括“转化体”和“转化细胞”，其包括原代转化细胞和源自其的后代，不考虑传代次数。后代的核酸含量可能与亲代细胞不完全相同，但可能含有突变。本文包括如在初始转化细胞中所筛选或选择，具有相同功能或生物活性的突变体后代。

在一些情况下，“T细胞刺激相关基因座”是指其表达在T细胞中的刺激或激活信号之后被诱导、增加或上调的基因座。在一些方面，T细胞刺激相关基因座是这样的内源基因基因座，其对通过T细胞的TCR复合物的组分或包含含有TCR复合物的组分或其一部分的细胞内信号传导区域的重组受体转导的信号和/或受体(例如，T细胞受体(TCR)或重组受体)的抗原或表位结合有反应。在一些方面，所述T细胞刺激相关基因座可以由作为T细胞的正常下游信号传导途径的一部分的典型因子调节。在一些方面，抗原或表位结合和/或通过编码的重组受体(例如，CAR或TCR)的细胞内信号传导区域的信号或活性诱导信号传导，所述信号传导诱导T细胞刺激相关基因座表达转基因(例如，编码重组受体的转基因)。然后可以监测内源基因产物和/或转基因的可检测表达作为T细胞激活的指示物。

如本文所用，细胞或细胞群对特定标记物呈“阳性”的陈述是指特定标记物(通常为表面标记物)在细胞上或细胞中的可检测的存在。当提及表面标记物时，所述术语是指如通过流式细胞术检测到的，表面表达的存在，例如通过用与所述标记物特异性结合的抗体进行染色并检测所述抗体，其中所述染色通过流式细胞术以如下水平是可检测的，所述水平基本上高于在其他方面相同的条件下用同种型匹配对照进行相同程序检测到的染色，和/或所述水平基本上与已知对所述标记物呈阳性的细胞的水平相似，和/或所述水平基本上高于已知对所述标记物呈阴性的细胞的水平。

如本文所用，细胞或细胞群对特定标记物呈“阴性”的陈述是指特定标记物(通常为表面标记物)在细胞上或细胞中不存在实质上可检测的存在。当提及表面标记物时，所述术语是指如通过流式细胞术检测到的，表面表达的不存在，例如通过用与所述标记物特异性结合的抗体进行染色并检测所述抗体，其中所述染色通过流式细胞术以如下水平没有检测到，所述水平基本上高于在其他方面相同的条件下用同种型匹配对照进行相同程序检测到的染色，和/或所述水平基本上低于已知对所述标记物呈阳性的细胞的水平，和/或所述水平与已知对所述标记物呈阴性的细胞的水平相比是基本上相似的。

如本文所用，在关于氨基酸序列(参考多肽序列)使用时，“氨基酸序列同一性百分比(％)”和“同一性百分比”定义为，在比对序列并在必要时引入空位以实现最大序列同一性百分比并且不将任何保守取代视作序列同一性的一部分之后，候选序列(例如，主题抗体或片段)中与参考多肽序列中的氨基酸残基相同的氨基酸残基的百分比。用于确定氨基酸序列同一性百分比的目的的比对可以以各种已知方式来实现，在一些实施方案中，使用公众可获得的计算机软件，如BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)软件。可以确定用于比对序列的适当参数，包括在所比较的序列的全长上实现最大比对所需的任何算法。

在一些实施方案中，“可操作地连接”可以包括组分(如DNA序列，例如异源核酸)与一个或多个调节序列的缔合，所述缔合的方式允许在适当分子(例如，转录激活蛋白)与所述调节序列结合时进行基因表达。因此，它意味着，所述组分所处的关系允许它们以其预期方式起作用。

氨基酸取代可以包括用另一种氨基酸替代多肽中的一个氨基酸。所述取代可以是保守氨基酸取代或非保守氨基酸取代。可以将氨基酸取代引入感兴趣的结合分子(例如抗体)、和针对所希望的活性(例如保留/改进的抗原结合、降低的免疫原性或改进的ADCC或CDC)筛选的产物中。

通常可以根据以下常见的侧链特性将氨基酸进行分组：

(1)疏水性：正亮氨酸、Met、Ala、Val、Leu、Ile；

(2)中性亲水性：Cys、Ser、Thr、Asn、Gln；

(3)酸性：Asp、Glu；

(4)碱性：His、Lys、Arg；

(5)影响链取向的残基：Gly、Pro；

(6)芳香族的：Trp、Tyr、Phe。

在一些实施方案中，保守取代可能涉及将这些类别之一的成员交换为同一类别的另一个成员。在一些实施方案中，非保守氨基酸取代可能涉及将这些类别之一的成员交换为另一个类别。

如本文所用，组合物是指两种或更多种产物、物质或化合物(包括细胞)的任何混合物。其可以是溶液、悬浮液、液体、粉末、糊剂、水性、非水性或其任何组合。

如本文所用，“受试者”是哺乳动物，如人或其他动物，并且通常是人。

IX.示例性实施方案

所提供的实施方案包括：

1.一种工程化T细胞，所述工程化T细胞包含含有编码重组受体或其一部分的转基因的经修饰的T细胞刺激相关基因座，其中所述转基因与所述T细胞刺激相关基因座的内源转录调节元件可操作地连接，其中所述内源转录调节元件在T细胞中刺激或激活信号后诱导或上调所述可操作地连接的转基因的表达。

2.根据实施方案1所述的工程化T细胞，其中所述内源转录调节元件是内源T细胞刺激相关基因座的启动子。

3.根据实施方案1或2所述的工程化T细胞，其中编码所述重组受体或其一部分的转基因存在于所述启动子的下游。

4.根据实施方案1-3中任一项所述的工程化T细胞，其中所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约6、12、18、24、36或48小时内被上调或诱导。

5.根据实施方案1-4中任一项所述的工程化T细胞，其中在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达被降低或下调。

6.根据实施方案1-5中任一项所述的工程化T细胞，其中在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达被降低或下调大于或大于约30％、40％、50％、60％、70％、75％、80％、85％、90％或95％或更多。

7.根据实施方案5或6所述的工程化T细胞，其中在表达的上调或诱导之后，在所述T细胞中的所述刺激或激活信号之后为或约1、2、3、4、5、6、7或8天或更长时间之后，所述可操作地连接的转基因的表达被降低或下调。

8.根据实施方案5-7中任一项所述的工程化T细胞，其中在所述T细胞中所述刺激或激活信号降低或不存在之后小于或小于约6、12、18、24、36或48小时内，所述可操作地连接的转基因的表达被降低或下调。

9.根据实施方案5-8中任一项所述的工程化T细胞，其中在所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达能够在所述T细胞中进一步刺激或激活信号之后再次被诱导或上调。

10.根据实施方案9所述的工程化T细胞，其中在所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述T细胞中所述进一步刺激或激活信号之后小于或小于约6、12、18、24、36或48小时内被上调或诱导。

11.根据实施方案1-10所述的工程化T细胞，其中在所述T细胞中所述刺激或激活信号之后，来自内源T细胞刺激相关基因座的开放阅读框的翻译产物在所述细胞中不表达，或者所述内源T细胞刺激相关基因座的功能性内源基因产物不表达。

12.根据实施方案11所述的工程化T细胞，其中所述经修饰的T细胞刺激相关基因座包含所述内源T细胞刺激相关基因座的开放阅读框中的缺失、插入、移码突变或无义突变。

13.根据实施方案1-12中任一项所述的工程化T细胞，其中所述内源T细胞刺激相关基因座选自PDCD1、CD69、Nur77、FoxP3和HLA-DR基因座。

14.根据实施方案1-13中任一项所述的工程化细胞，其中：

所述内源转录调节元件包含由在所述刺激或激活信号之后被激活的转录因子识别的一个或多个应答元件。

15.根据实施方案1-14中任一项所述的工程化T细胞，其中所述重组受体或其部分能够诱导或传递所述T细胞中的所述刺激或激活信号。

16.根据实施方案1-15中任一项所述的工程化细胞，其中：

所述重组受体包含含有所述T细胞受体(TCR)复合物的组分的细胞内信号传导结构域的细胞内区域，并且所述T细胞中的所述刺激或激活信号包含通过存在于所述重组受体中的细胞内信号传导结构域的信号或

所述重组受体包含含有细胞内信号传导结构域的细胞内区域，所述细胞内信号传导结构域包含免疫受体酪氨酸激活基序(ITAM)，并且所述T细胞中的所述刺激或激活信号包含通过存在于所述重组受体中的细胞内信号传导结构域的信号。

17.根据实施方案1-16中任一项所述的工程化T细胞，其中所述重组受体包含胞外区域，所述胞外区域含有能够结合或识别药剂的结合结构域。

18.根据实施方案17所述的工程化T细胞，其中在所述药剂结合后在所述T细胞中诱导了刺激或激活信号。

19.根据实施方案17或18所述的工程化T细胞，其中所述药剂是靶抗原，任选地其中所述靶抗原是重组蛋白或在细胞的表面上表达的抗原。

20.根据实施方案19所述的工程化T细胞，其中所述靶抗原与疾病、障碍或病症的细胞或组织相关，对疾病、障碍或病症的细胞或组织是特异性的，和/或在疾病、障碍或病症的细胞或组织上表达。

21.根据实施方案20所述的工程化T细胞，其中所述疾病、障碍或病症是感染性疾病或障碍、自身免疫性疾病、炎性疾病或肿瘤或癌症，任选地其中所述靶抗原是肿瘤抗原。

22.根据实施方案17-21中任一项所述的工程化T细胞，其中所述靶抗原选自αvβ6整合素(avb6整合素)、B细胞成熟抗原(BCMA)、B7-H3、B7-H6、碳酸酐酶9(CA9，也称为CAIX或G250)、癌症-睾丸抗原、癌症/睾丸抗原1B(CTAG，也称为NY-ESO-1和LAGE-2)、癌胚抗原(CEA)、细胞周期蛋白、细胞周期蛋白A2、C-C基序趋化因子配体1(CCL-1)、CD19、CD20、CD22、CD23、CD24、CD30、CD33、CD38、CD44、CD44v6、CD44v7/8、CD123、CD133、CD138、CD171、硫酸软骨素蛋白聚糖4(CSPG4)、表皮生长因子蛋白(EGFR)、表皮生长因子受体III型突变体(EGFRvIII)、上皮糖蛋白2(EPG-2)、上皮糖蛋白40(EPG-40)、肝配蛋白B2、肝配蛋白受体A2(EPHa2)、雌激素受体、Fc受体样蛋白5(FCRL5；也称为Fc受体同源物5或FCRH5)、胎儿乙酰胆碱受体(胎儿AchR)、叶酸结合蛋白(FBP)、叶酸受体α、神经节苷脂GD2、O-乙酰化GD2(OGD2)、神经节苷脂GD3、糖蛋白100(gp100)、磷脂酰肌醇蛋白聚糖-3(GPC3)、G蛋白偶联受体C类5族成员D(GPRC5D)、Her2/neu(受体酪氨酸激酶erb-B2)、Her3(erb-B3)、Her4(erb-B4)、erbB二聚体、人高分子量黑色素瘤相关抗原(HMW-MAA)、乙型肝炎表面抗原、人白细胞抗原A1(HLA-A1)、人白细胞抗原A2(HLA-A2)、IL-22受体α(IL-22Rα)、IL-13受体α2(IL-13Rα2)、激酶插入结构域受体(kdr)、κ轻链、L1细胞粘附分子(L1-CAM)、L1-CAM的CE7表位、含有富亮氨酸重复序列的蛋白8家族成员A(LRRC8A)、Lewis Y、黑色素瘤相关抗原(MAGE)-A1、MAGE-A3、MAGE-A6、MAGE-A10、间皮素(MSLN)、c-Met、鼠类巨细胞病毒(CMV)、粘蛋白1(MUC1)、MUC16、自然杀伤细胞2族成员D(NKG2D)配体、黑色素A(MART-1)、神经细胞粘附分子(NCAM)、癌胚胎抗原、黑色素瘤优先表达抗原(PRAME)、孕酮受体、前列腺特异性抗原、前列腺干细胞抗原(PSCA)、前列腺特异性膜抗原(PSMA)、受体酪氨酸激酶样孤儿受体1(ROR1)、存活蛋白、滋养层糖蛋白(TPBG，也称为5T4)、肿瘤相关糖蛋白72(TAG72)、酪氨酸酶相关蛋白1(TRP1，也称为TYRP1或gp75)、酪氨酸酶相关蛋白2(TRP2，也称为多巴色素互变异构酶、多巴色素δ异构酶或DCT)、血管内皮生长因子受体(VEGFR)、血管内皮生长因子受体2(VEGFR2)、肾母细胞瘤1(WT-1)、病原体特有的或病原体表达的抗原、或与通用标签相关的抗原、和/或生物素化分子、和/或由HIV、HCV、HBV或其他病原体表达的分子。

23.根据实施方案17所述的工程化T细胞，其中所述药剂是抗独特型抗体。

24.根据实施方案1-23中任一项所述的工程化T细胞，其中所述重组受体是嵌合抗原受体(CAR)。

25.根据实施方案24所述的工程化T细胞，其中所述CAR包含胞外区域、跨膜结构域和细胞内区域。

26.根据实施方案25所述的工程化T细胞，其中所述胞外区域包含间隔子，任选地其中所述间隔子可操作地连接在所述结合结构域与所述跨膜结构域之间。

27.根据实施方案25或26所述的工程化T细胞，其中所述胞外区域包含结合结构域，所述结合结构域是或包含抗体或其抗原结合片段。

28.根据实施方案25-27中任一项所述的工程化T细胞，其中所述细胞内区域包含细胞内信号传导结构域。

29.根据实施方案28所述的工程化T细胞，其中所述细胞内信号传导结构域是或包含CD3链、任选CD3-zeta(CD3ζ)链的细胞内信号传导结构域或其信号传导部分。

30.根据实施方案28或29所述的工程化T细胞，其中所述细胞内区域包含一个或多个共刺激信号传导结构域。

31.根据实施方案30所述的工程化T细胞，其中所述一个或多个共刺激信号传导结构域包含CD28、4-1BB或ICOS或其信号传导部分的细胞内信号传导结构域。

32.根据实施方案30或31所述的工程化T细胞，其中所述共刺激信号传导区域包含4-1BB的细胞内信号传导结构域。

33.根据实施方案1-32中任一项所述的工程化T细胞，其中所述经修饰的T细胞刺激相关基因座编码作为CAR的重组受体，其中所述CAR从其N至C末端按顺序包含：所述胞外结合结构域、所述间隔子、所述跨膜结构域和细胞内区域。

34.根据实施方案1-33中任一项所述的工程化T细胞，其中

所述转基因按顺序包含编码以下的核苷酸序列：胞外结合结构域，任选地scFv；间隔子，任选地包含来自任选地来自IgG1、IgG2或IgG4的人免疫球蛋白铰链或其修饰形式的序列，任选地还包含CH2区和/或CH3区；和跨膜结构域，任选地来自人CD28；共刺激信号传导结构域，任选地来自人4-1BB；以及细胞内信号传导结构域，任选地CD3ζ链或其一部分；和/或

所述经修饰的T细胞刺激相关基因座按顺序包含编码以下的核苷酸序列：胞外结合结构域，任选地scFv；间隔子，任选地包含来自任选地来自IgG1、IgG2或IgG4的人免疫球蛋白铰链或其修饰形式的序列，任选地还包含CH2区和/或CH3区；和跨膜结构域，任选地来自人CD28；共刺激信号传导结构域，任选地来自人4-1BB；以及细胞内信号传导结构域，任选地CD3ζ链或其一部分。

35.根据实施方案1-34中任一项所述的工程化T细胞，其中所述转基因编码所述重组受体。

36.根据实施方案1-34中任一项所述的工程化T细胞，其中所述转基因编码所述重组受体的一部分。

37.根据实施方案36所述的工程化T细胞，其中所述重组受体包含两条单独的多肽链，其中由所述转基因编码的所述重组受体的部分是所述重组受体的一条链，并且所述工程化T细胞还表达所述重组受体的另一条链。

38.根据实施方案37所述的工程化T细胞，其中所述重组受体的另一条链由第二转基因编码。

39.根据实施方案24-38中任一项所述的工程化T细胞，其中所述CAR是多链CAR。

40.根据实施方案39所述的工程化T细胞，其中转基因编码所述多链CAR的一条链。

41.根据实施方案1-23和35-38中任一项所述的工程化T细胞，其中所述重组受体是重组T细胞受体(TCR)。

42.根据实施方案41所述的工程化T细胞，其中重组TCR包含α(TCRα)链和β(TCRβ)链，并且所述转基因包含编码所述TCRα链的核酸序列和/或编码所述TCRβ链的核酸序列。

43.根据实施方案42所述的工程化T细胞，其中所述转基因编码TCRα链或所述TCRβ链中的一个。

44.根据实施方案42或43所述的工程化T细胞，其中所述TCRα链包含含有一个或多个引入的半胱氨酸残基的恒定(Cα)区和/或所述TCRβ链包含含有一个或多个引入的半胱氨酸残基的Cβ区，其中所述一个或多个引入的半胱氨酸残基能够在所述α链与所述β链之间形成一个或多个非天然二硫桥，任选地其中所述一个或多个引入的半胱氨酸残基包括用半胱氨酸残基替代非半胱氨酸残基。

45.根据实施方案44所述的工程化T细胞，其中所述Cα区包含在对应于位置48的位置处的半胱氨酸，其中编号如SEQ ID NO:92中任一个所示；和/或所述Cβ区包含在对应于位置57的位置处的半胱氨酸，其中编号如SEQ ID NO:96所示。

46.根据实施方案1-45中任一项所述的工程化T细胞，其中所述转基因包含编码至少一种另外的蛋白质的核苷酸序列。

47.根据实施方案46所述的工程化T细胞，其中所述至少一种另外的蛋白质是替代标记物，任选地其中所述替代标记物是截短的受体，任选地其中所述截短的受体缺乏细胞内信号传导结构域和/或当与其配体结合时不能介导细胞内信号传导。

48.根据实施方案1-47中任一项所述的工程化T细胞，其中所述转基因还包含一个或多个多顺反子元件。

49.根据实施方案48所述的工程化T细胞，其中所述一个或多个多顺反子元件包含编码选自T2A、P2A、E2A或F2A的核糖体跳跃元件的序列或内部核糖体进入位点(IRES)。

50.根据实施方案48或49所述的工程化T细胞，其中：

所述多顺反子元件定位于编码所述CAR的核苷酸序列与编码所述至少一种另外的蛋白质的核苷酸序列之间；

所述重组受体是重组TCR，并且所述多顺反子元件定位于编码所述TCRα的核苷酸序列与编码所述TCRβ的核苷酸序列之间；

所述重组受体是多链CAR，并且所述多顺反子元件定位于编码所述多链CAR的一条链的核苷酸序列与编码所述多链CAR的另一条链的核苷酸序列之间；和/或

所述一个或多个多顺反子元件在编码所述重组受体的核苷酸序列的上游。

51.根据实施方案1-50中任一项所述的工程化T细胞，其中所述经修饰的T细胞刺激相关基因座是通过经由以下方式将编码所述重组受体的转基因整合至所述内源T细胞刺激相关基因座中产生的：

a)在所述内源T细胞刺激相关基因座处或附近的一个或多个靶位点处诱导基因破坏；以及

b)引入用于同源定向修复(HDR)的多核苷酸。

52.根据实施方案51所述的工程化T细胞，其中将编码所述重组受体的转基因整合在所述T细胞刺激相关基因座中的至少一个靶位点处或附近。

53.根据实施方案51或52所述的工程化T细胞，其中所述基因破坏是通过特异性结合至、识别或杂交至所述靶位点的锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)或CRISPR-Cas9组合实现的。

54.根据实施方案51-53中任一项所述的工程化T细胞，其中所述基因破坏是通过CRISPR-Cas9组合实现的，并且所述CRISPR-Cas9组合包含具有与所述至少一个靶位点互补的靶向结构域的指导RNA(gRNA)。

55.根据实施方案54所述的工程化T细胞，其中所述CRISPR-Cas9组合是包含所述gRNA和Cas9蛋白的核糖核蛋白(RNP)复合物。

56.根据实施方案55所述的工程化T细胞，其中所述基因破坏是通过经由电穿孔引入多个T细胞中的RNP实现的。

57.根据实施方案1-56中任一项所述的工程化T细胞，其中所述T细胞刺激相关基因座是PDCD1。

58.根据实施方案57所述的工程化T细胞，其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与PDCD1基因中的靶位点互补的靶向结构域。

59.根据实施方案58所述的工程化T细胞，其中所述gRNA包含SEQ ID NO:75和104-109中任一个所示的序列。

60.根据实施方案58或59所述的方法，其中所述gRNA包含SEQ ID NO:75所示的序列。

61.根据实施方案1-56中任一项所述的工程化T细胞，其中所述T细胞刺激相关基因座是CD69。

62.根据实施方案61所述的工程化T细胞，其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与CD69基因中的靶位点互补的靶向结构域。

63.根据实施方案62所述的工程化T细胞，其中所述gRNA包含SEQ ID NO:116-121中任一个所示的序列。

64.根据实施方案1-56中任一项所述的工程化T细胞，其中所述T细胞刺激相关基因座是Nur77。

65.根据实施方案64所述的工程化T细胞，其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与Nur77基因中的靶位点互补的靶向结构域。

66.根据实施方案65所述的工程化T细胞，其中所述gRNA包含SEQ ID NO:122-127和134-136所示的序列。

67.根据实施方案1-56中任一项所述的工程化T细胞，其中所述T细胞刺激相关基因座是FoxP3。

68.根据实施方案1-56中任一项所述的工程化T细胞，其中所述T细胞刺激相关基因座是HLA-DR基因座。

69.根据实施方案1-68中任一项所述的工程化T细胞，其中所述T细胞还包含内源T细胞受体α恒定区(TRAC)基因和/或内源T细胞受体β恒定区(TRBC)基因处的基因破坏。

70.根据实施方案69所述的工程化T细胞，其中所述基因破坏是通过特异性结合至、识别或杂交至所述TRAC、TRBC1和/或TRBC2基因内的至少一个靶位点的锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)或CRISPR-Cas9组合实现的。

71.根据实施方案69或70所述的工程化T细胞，其中所述基因破坏是通过CRISPR-Cas9组合实现的，并且所述CRISPR-Cas9组合包含具有与至少一个靶位点互补的靶向结构域的指导RNA(gRNA)，任选地其中所述CRISPR-Cas9组合是包含所述gRNA和Cas9蛋白的核糖核蛋白(RNP)复合物，任选地其中所述基因破坏是通过经由电穿孔引入多个T细胞中的RNP实现的。

72.根据实施方案69-71中任一项所述的工程化T细胞，其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与所述TRAC、TRBC1和/或TRBC2基因内的至少一个靶位点互补的靶向结构域。

73.根据实施方案72所述的工程化T细胞，其中所述gRNA具有与TRAC基因中的靶位点互补的靶向结构域。

74.根据实施方案73所述的工程化T细胞，其中所述gRNA包含SEQ ID NO:77和188-218中任一个所示的序列。

75.根据实施方案73或74所述的方法，其中所述gRNA包含SEQ ID NO:77所示的序列。

76.根据实施方案72所述的工程化T细胞，其中所述gRNA具有与TRBC基因中的靶位点互补的靶向结构域。

77.根据实施方案76所述的工程化T细胞，其中所述gRNA包含SEQ ID NO:219-276中任一个所示的序列。

78.根据实施方案1-77中任一项所述的工程化T细胞，其中与包含存在于所述T细胞的基因组中的不同位置处或存在于所述T细胞的基因组中的随机位置处的编码相同重组受体的转基因的工程化T细胞相比，在所述T细胞中不存在刺激或激活信号的情况下，通过编码的重组受体的细胞内信号传导结构域的信号传导活性降低大于或大于约10％、15％、20％、25％、30％、40％、50％或更多。

79.根据实施方案1-78中任一项所述的工程化T细胞，其中所述T细胞是CD8+T细胞或CD4+T细胞或其亚型。

80.根据实施方案1-79中任一项所述的工程化T细胞，其中所述T细胞是源自受试者的原代T细胞，任选地其中所述受试者是人。

81.根据实施方案1-79中任一项所述的工程化T细胞，其中所述T细胞源自任选地作为iPSC的多潜能或多能细胞。

82.一种组合物，所述组合物包含多个根据实施方案1-81中任一项所述的基因工程化T细胞。

83.根据实施方案82所述的组合物，其中所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约6、12、18、24、36或48小时内在所述组合物中的一个或多个细胞中被上调或诱导。

84.根据实施方案82或83所述的组合物，其中在所述T细胞中的刺激或激活信号之后，在所述组合物中的细胞中表达所述可操作地连接的转基因的细胞的频率大于或大于约50％、60％、70％、75％、80％、85％、90％或95％或更多。

85.根据实施方案82-84中任一项所述的组合物，其中在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述组合物中的一个或多个细胞中被降低或下调。

86.根据实施方案82-84中任一项所述的组合物，其中在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，在组合物中的细胞中表达所述可操作地连接的转基因的细胞的频率降低大于或大于约30％、40％、50％、60％、70％、75％、80％、85％、90％或95％或更多。

87.根据实施方案82-86中任一项所述的组合物，其中在表达的上调或诱导之后，在所述T细胞中的所述刺激或激活信号之后为或约1、2、3、4、5、6、7或8天或更长时间之后，所述可操作地连接的转基因的表达在所述组合物中的一个或多个细胞中被降低或下调。

88.根据实施方案82-87中任一项所述的组合物，其中在所述T细胞中所述刺激或激活信号降低或不存在之后小于或小于约6、12、18、24、36或48小时内，在所述组合物中的一个或多个细胞中所述可操作地连接的转基因的表达被降低或下调。

89.根据实施方案88所述的组合物，其中在所述T细胞中所述刺激或激活信号降低或不存在之后，在所述组合物中的细胞中表达所述重组受体的细胞的频率小于或小于约50％、40％、30％、25％、20％、15％、10％或5％或更少。

90.根据实施方案82-89中任一项所述的组合物，其中所述组合物包含CD4+T细胞和/或CD8+T细胞。

91.根据实施方案82-90中任一项所述的组合物，其中所述组合物包含CD4+和CD8+T细胞，并且CD4+与CD8+T细胞的比率是从或从约1:3至3:1，任选地1:1。

92.一种多核苷酸，所述多核苷酸包含：

(a)编码重组受体或其一部分的转基因，以及

(b)与所述转基因连接的一个或多个同源臂，其中所述一个或多个同源臂包含与T细胞中的内源T细胞刺激相关基因座的一个或多个区域同源的序列。

93.根据实施方案92所述的多核苷酸，其中当所述重组受体由引入了所述多核苷酸的细胞表达时，所述重组受体或其一部分由含有编码所述重组受体或其一部分的转基因的经修饰的T细胞刺激相关基因座编码。

94.根据实施方案92或93所述的多核苷酸，其中所述转基因是对于T细胞、任选人T细胞的内源T细胞刺激相关基因座的开放阅读框而言外源或异源的序列。

95.根据实施方案92-94中任一项所述的多核苷酸，其中所述一个或多个同源臂包含5'同源臂和/或3'同源臂，任选地其中所述5'同源臂和所述3'同源臂包含与靶位点周围的核酸序列同源的核酸序列，其中所述靶位点位于所述T细胞刺激相关基因座内。

96.根据实施方案95所述的多核苷酸，其中所述靶位点位于所述T细胞刺激相关基因座的内源转录调节元件的下游。

97.根据实施方案95或96所述的多核苷酸，其中所述多核苷酸包含结构[5'同源臂]-[转基因]-[3'同源臂]。

98.根据实施方案97所述的多核苷酸，其中所述5'同源臂和所述3'同源臂包含与所述至少一个靶位点周围的核酸序列同源的核酸序列。

99.根据实施方案95-98中任一项所述的多核苷酸，其中所述5'同源臂和所述3'同源臂的长度独立地在为或约50与为或约750个核苷酸之间、为或约50与为或约500个核苷酸之间、为或约50与为或约250个核苷酸之间、为或约50与为或约100个核苷酸之间、为或约100与为或约750个核苷酸之间、为或约100与为或约500个核苷酸之间、为或约100与为或约250个核苷酸之间、为或约250与为或约750个核苷酸之间、为或约250与为或约500个核苷酸之间。

100.根据实施方案95-99中任一项所述的多核苷酸，其中所述5'同源臂和所述3'同源臂独立地具有为或约50、60、70、80、200、250或400个核苷酸或任何前述值之间的任何值的长度。

101.根据实施方案95-100中任一项所述的多核苷酸，其中所述5'同源臂和所述3'同源臂的长度独立地小于或小于约100个核苷酸，任选地为或约50、60、70、80或90个核苷酸，或任何前述值之间的任何值。

102.根据实施方案95-101中任一项所述的多核苷酸，其中所述T细胞刺激相关基因座选自PDCD1、CD69、Nur77、FoxP3和HLA-DR基因座。

103.根据实施方案102所述的多核苷酸，其中所述T细胞刺激相关基因座是PDCD1。

104.根据实施方案103所述的多核苷酸，其中所述5’同源臂和所述3'同源臂包含与PDCD1的一个或多个区域同源的序列。

105.根据实施方案104所述的多核苷酸，其中所述5'同源臂包含：

a)含有与SEQ ID NO:66所示的序列展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列的为或至少为或至少150、200、250、300、350、400、450、500、550或600个连续核苷酸的序列；

b)含有SEQ ID NO:66所示的序列的为或至少为或至少150、200、250、300、350、400、450、500、550或600个连续核苷酸的序列；或者

c)SEQ ID NO:66所示的序列。

106.根据实施方案104或105所述的多核苷酸，其中所述3’同源臂包含：

a)含有与SEQ ID NO:67所示的序列展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列的为或至少为或至少150、200、250、300、350、400、450、500、550或600个连续核苷酸的序列；

b)包含SEQ ID NO:67所示的序列的为或至少为或至少150、200、250、300、350、400、450、500、550或600个连续核苷酸的序列；或者

c)SEQ ID NO:67所示的序列。

107.根据实施方案102所述的多核苷酸，其中所述T细胞刺激相关基因座是CD69。

108.根据实施方案107所述的多核苷酸，其中所述5’同源臂和所述3'同源臂包含与CD69的一个或多个区域同源的序列。

109.根据实施方案102所述的多核苷酸，其中所述T细胞刺激相关基因座是Nur77。

110.根据实施方案109所述的多核苷酸，其中所述5’同源臂和所述3'同源臂包含与Nur77的一个或多个区域同源的序列。

111.根据实施方案102所述的多核苷酸，其中所述T细胞刺激相关基因座是FoxP3。

112.根据实施方案111所述的多核苷酸，其中所述5’同源臂和所述3'同源臂包含与FoxP3的一个或多个区域同源的序列。

113.根据实施方案102所述的多核苷酸，其中所述T细胞刺激相关基因座是HLA-DR基因座。

114.根据实施方案113所述的多核苷酸，其中所述5’同源臂和所述3'同源臂包含与HLA-DR基因座的一个或多个区域同源的序列。

115.根据实施方案92-114中任一项所述的多核苷酸，其中所述重组受体或其部分能够诱导或传递所述T细胞中的所述刺激或激活信号。

116.根据实施方案92-115中任一项所述的多核苷酸，其中：

117.根据实施方案92-116中任一项所述的多核苷酸，其中所述重组受体包含胞外区域，所述胞外区域含有能够结合或识别药剂的结合结构域。

118.根据实施方案117所述的多核苷酸，其中在所述药剂结合后在所述T细胞中诱导了刺激或激活信号。

119.根据实施方案117或118所述的多核苷酸，其中所述药剂是靶抗原，任选地其中所述靶抗原是重组蛋白或在细胞的表面上表达的抗原。

120.根据实施方案119所述的多核苷酸，其中所述靶抗原与疾病、障碍或病症的细胞或组织相关，对疾病、障碍或病症的细胞或组织是特异性的，和/或在疾病、障碍或病症的细胞或组织上表达。

121.根据实施方案120所述的多核苷酸，其中所述疾病、障碍或病症是感染性疾病或障碍、自身免疫性疾病、炎性疾病或肿瘤或癌症，任选地其中所述靶抗原是肿瘤抗原。

122.根据实施方案117-121中任一项所述的多核苷酸，其中所述靶抗原选自αvβ6整合素(avb6整合素)、B细胞成熟抗原(BCMA)、B7-H3、B7-H6、碳酸酐酶9(CA9，也称为CAIX或G250)、癌症-睾丸抗原、癌症/睾丸抗原1B(CTAG，也称为NY-ESO-11和LAGE-12)、癌胚抗原(CEA)、细胞周期蛋白、细胞周期蛋白A2、C-C基序趋化因子配体1(CCL-11)、CD19、CD20、CD22、CD23、CD24、CD30、CD33、CD38、CD44、CD44v6、CD44v7/8、CD123、CD133、CD138、CD171、硫酸软骨素蛋白聚糖4(CSPG4)、表皮生长因子蛋白(EGFR)、表皮生长因子受体III型突变体(EGFR vIII)、上皮糖蛋白2(EPG-12)、上皮糖蛋白40(EPG-40)、肝配蛋白B2、肝配蛋白受体A2(EPHa2)、雌激素受体、Fc受体样蛋白5(FCRL5；也称为Fc受体同源物5或FCRH5)、胎儿乙酰胆碱受体(胎儿AchR)、叶酸结合蛋白(FBP)、叶酸受体α、神经节苷脂GD2、O-乙酰化GD2(OGD2)、神经节苷脂GD3、糖蛋白100(gp100)、磷脂酰肌醇蛋白聚糖-3(GPC3)、G蛋白偶联受体C类5族成员D(GPRC5D)、Her2/neu(受体酪氨酸激酶erb-B2)、Her3(erb-B3)、Her4(erb-B4)、erbB二聚体、人高分子量黑色素瘤相关抗原(HMW-MAA)、乙型肝炎表面抗原、人白细胞抗原A1(HLA-A1)、人白细胞抗原A2(HLA-A2)、IL-122受体α(IL-122Rα)、IL-113受体α2(IL-113Rα2)、激酶插入结构域受体(kdr)、κ轻链、L1细胞粘附分子(L1-CAM)、L1-CAM的CE7表位、含有富亮氨酸重复序列的蛋白8家族成员A(LRRC8A)、Lewis Y、黑色素瘤相关抗原(MAGE)-A1、MAGE-A3、MAGE-A6、MAGE-A10、间皮素(MSLN)、c-Met、鼠类巨细胞病毒(CMV)、粘蛋白1(MUC1)、MUC16、自然杀伤细胞2族成员D(NKG2D)配体、黑色素A(MART-11)、神经细胞粘附分子(NCAM)、癌胚胎抗原、黑色素瘤优先表达抗原(PRAME)、孕酮受体、前列腺特异性抗原、前列腺干细胞抗原(PSCA)、前列腺特异性膜抗原(PSMA)、受体酪氨酸激酶样孤儿受体1(ROR1)、存活蛋白、滋养层糖蛋白(TPBG，也称为5T4)、肿瘤相关糖蛋白72(TAG72)、酪氨酸酶相关蛋白1(TRP1，也称为TYRP1或gp75)、酪氨酸酶相关蛋白2(TRP2，也称为多巴色素互变异构酶、多巴色素δ异构酶或DCT)、血管内皮生长因子受体(VEGFR)、血管内皮生长因子受体2(VEGFR2)、肾母细胞瘤1(WT-11)、病原体特有的或病原体表达的抗原、或与通用标签相关的抗原、和/或生物素化分子、和/或由HIV、HCV、HBV或其他病原体表达的分子。

123.根据实施方案117所述的多核苷酸，其中所述试剂是抗独特型抗体。

124.根据实施方案92-123中任一项所述的多核苷酸，其中所述重组受体是嵌合抗原受体(CAR)。

125.根据实施方案124所述的多核苷酸，其中所述CAR包含胞外区域、跨膜结构域和细胞内区域。

126.根据实施方案125中任一项的多核苷酸，其中所述胞外区域包含间隔子，任选地其中所述间隔子可操作地连接在所述结合结构域与所述跨膜结构域之间。

127.根据实施方案125或126所述的多核苷酸，其中所述胞外区域包含结合结构域，所述结合结构域是或包含抗体或其抗原结合片段。

128.根据实施方案125-127中任一项所述的多核苷酸，其中所述细胞内区域包含细胞内信号传导结构域。

129.根据实施方案128所述的多核苷酸，其中所述细胞内信号传导结构域是或包含CD3链、任选地CD3-zeta(CD3ζ)链的细胞内信号传导结构域或其信号传导部分。

130.根据实施方案128或129中任一项所述的多核苷酸，其中所述细胞内区域包含一个或多个共刺激信号传导结构域。

131.根据实施方案130所述的多核苷酸，其中所述一个或多个共刺激信号传导结构域包含CD28、4-1BB或ICOS或其信号传导部分的细胞内信号传导结构域。

132.根据实施方案130或131所述的多核苷酸，其中所述共刺激信号传导区域包含4-1BB的细胞内信号传导结构域。

133.根据实施方案92-132中任一项所述的多核苷酸，其中所述经修饰的T细胞刺激相关基因座编码作为CAR的重组受体，其中所述CAR从其N至C末端按顺序包含：所述胞外结合结构域、所述间隔子、所述跨膜结构域和细胞内区域。

134.根据实施方案92-133中任一项所述的多核苷酸，其中

135.根据实施方案92-134中任一项所述的多核苷酸，其中所述转基因编码所述重组受体。

136.根据实施方案92-134中任一项所述的多核苷酸，其中所述转基因编码所述重组受体的一部分。

137.根据实施方案136所述的多核苷酸，其中所述重组受体含有两条单独的多肽链，其中由所述转基因编码的重组受体的所述部分是所述重组受体的一条链。

138.根据实施方案137所述的多核苷酸，其中所述重组受体的另一条链由第二转基因编码。

139.根据实施方案124-138中任一项所述的多核苷酸，其中所述CAR是多链CAR。

140.根据实施方案139所述的多核苷酸，其中转基因编码所述多链CAR的一条链。

141.根据实施方案92-123和135-138中任一项所述的多核苷酸，其中所述重组受体是重组T细胞受体(TCR)。

142.根据实施方案141所述的多核苷酸，其中重组TCR包含α(TCRα)链和β(TCRβ)链，并且所述转基因包含编码所述TCRα链的核酸序列和/或编码所述TCRβ链的核酸序列。

143.根据实施方案142所述的多核苷酸，其中所述转基因编码TCRα链或所述TCRβ链中的一个。

144.根据实施方案142或143所述的多核苷酸，其中所述TCRα链包含含有一个或多个引入的半胱氨酸残基的恒定(Cα)区和/或所述TCRβ链包含含有一个或多个引入的半胱氨酸残基的Cβ区，其中所述一个或多个引入的半胱氨酸残基能够在所述α链与所述β链之间形成一个或多个非天然二硫桥，任选地其中所述一个或多个引入的半胱氨酸残基包括用半胱氨酸残基替代非半胱氨酸残基。

145.根据实施方案144所述的多核苷酸，其中所述Cα区包含在对应于位置48的位置处的半胱氨酸，其中编号如SEQ ID NO:92中任一个所示；和/或所述Cβ区包含在对应于位置57的位置处的半胱氨酸，其中编号如SEQ ID NO:96所示。

146.根据实施方案92-145中任一项所述的多核苷酸，其中所述转基因包含编码至少一种另外的蛋白质的核苷酸序列。

147.根据实施方案146所述的多核苷酸，其中所述至少一种另外的蛋白质是替代标记物，任选地其中所述替代标记物是截短的受体，任选地其中所述截短的受体缺乏细胞内信号传导结构域和/或当与其配体结合时不能介导细胞内信号传导。

148.根据实施方案92-147中任一项所述的多核苷酸，其中所述转基因还包含一个或多个多顺反子元件。

149.根据实施方案148所述的多核苷酸，其中所述一个或多个多顺反子元件包含编码选自T2A、P2A、E2A或F2A的核糖体跳跃元件的序列或内部核糖体进入位点(IRES)。

150.根据实施方案148或149所述的多核苷酸，其中：

151.根据实施方案92-150中任一项所述的多核苷酸，所述多核苷酸是线性多核苷酸。

152.根据实施方案151所述的多核苷酸，所述多核苷酸是双链多核苷酸。

153.根据实施方案151所述的多核苷酸，所述多核苷酸是单链多核苷酸。

154.根据实施方案92-150中任一项所述的多核苷酸，其中所述多核苷酸包含于病毒载体中。

155.根据实施方案154所述的多核苷酸，其中所述病毒载体是AAV载体。

156.根据实施方案154所述的多核苷酸，其中所述病毒载体是逆转录病毒载体，任选地慢病毒载体。

157.根据实施方案92-156中任一项所述的多核苷酸，其中所述多核苷酸具有至少或至少约1000、1250、1500、1750、2000、2250、2500、2750、3000、3250、3500、3750或4000个核苷酸或任何前述值之间的任何值的长度。

158.根据实施方案92-157中任一项所述的多核苷酸，其中所述多核苷酸的长度在为或约1500与为或约2500个核苷酸之间，或者在为或约1750与为或约2250个核苷酸之间。

159.一种产生基因工程化T细胞的方法，所述方法包括：

(a)向T细胞中引入能够在所述T细胞的内源T细胞刺激相关基因座内的靶位点处诱导基因破坏的一种或多种药剂；以及

(b)将根据实施方案92-158中任一项所述的多核苷酸引入T细胞中，所述T细胞包含在T细胞刺激相关基因座处的基因破坏，其中所述方法产生经修饰的T细胞刺激相关基因座，所述经修饰的T细胞刺激相关基因座包含编码所述重组受体或其一部分的转基因。

160.根据实施方案159所述的方法，其中将编码重组受体或其一部分的所述转基因经由同源定向修复(HDR)整合在所述内源T细胞刺激相关基因座内。

161.一种产生基因工程化T细胞的方法，所述方法包括将包含编码重组受体或其一部分的转基因的多核苷酸引入T细胞中，所述T细胞具有在所述T细胞的T细胞刺激相关基因座内的基因破坏，其中将编码所述重组受体或其一部分的转基因经由同源定向修复(HDR)整合在所述内源T细胞刺激相关基因座内。

162.根据实施方案159或161所述的方法，其中通过以下方式来进行所述基因破坏：向T细胞中引入能够在所述T细胞的内源T细胞刺激相关基因座内的靶位点处诱导基因破坏的一种或多种药剂。

163.根据实施方案159-162中任一项所述的方法，其中所述方法产生经修饰的T细胞刺激相关基因座，所述经修饰的T细胞刺激相关基因座含有编码重组受体或其一部分的转基因。

164.根据实施方案159-163中任一项所述的方法，其中所述多核苷酸还包含与所述核酸序列连接的一个或多个同源臂，其中所述一个或多个同源臂包含与T细胞中的内源T细胞刺激相关基因座的一个或多个区域同源的序列。

165.根据实施方案164所述的方法，其中所述一个或多个同源臂包含5'同源臂和/或3'同源臂，任选地其中所述5'同源臂和所述3'同源臂包含与靶位点周围的核酸序列同源的核酸序列，其中所述靶位点位于所述T细胞刺激相关基因座内。

166.根据实施方案165所述的方法，其中所述靶位点位于所述T细胞刺激相关基因座的内源转录调节元件的下游。

167.根据实施方案165或166所述的方法，其中所述多核苷酸包含结构[5'同源臂]-[转基因]-[3'同源臂]。

168.根据实施方案167所述的方法，其中所述5'同源臂和3'同源臂包含与所述至少一个靶位点周围的核酸序列同源的核酸序列。

169.根据实施方案165-168中任一项所述的方法，其中所述5'同源臂和所述3'同源臂的长度独立地在为或约50与为或约750个核苷酸之间、为或约50与为或约500个核苷酸之间、为或约50与为或约250个核苷酸之间、为或约50与为或约100个核苷酸之间、为或约100与为或约750个核苷酸之间、为或约100与为或约500个核苷酸之间、为或约100与为或约250个核苷酸之间、为或约250与为或约750个核苷酸之间、为或约250与为或约500个核苷酸之间。

170.根据实施方案165-169中任一项所述的方法，其中所述5'同源臂和所述3'同源臂独立地具有为或约50、60、70、80、90、100、150、200、250、300、400或500个核苷酸或任何前述值之间的任何值的长度。

171.根据实施方案165-170中任一项所述的方法，其中所述5'同源臂和所述3'同源臂的长度独立地小于或小于约100个核苷酸，任选地为或约50、60、70、80或90个核苷酸，或任何前述值之间的任何值。

172.根据实施方案165-171中任一项所述的方法，其中所述T细胞刺激相关基因座选自PDCD1、CD69、Nur77、FoxP3和HLA-DR基因座。

173.根据实施方案172所述的方法，其中所述T细胞刺激相关基因座是PDCD1。

174.根据实施方案173所述的方法，其中所述5’同源臂和所述3'同源臂包含与PDCD1的一个或多个区域同源的序列。

175.根据实施方案174所述的方法，其中所述5'同源臂包含：

c)SEQ ID NO:66所示的序列。

176.根据实施方案174或175所述的方法，其中所述3’同源臂包含：

c)SEQ ID NO:67所示的序列。

177.根据实施方案172所述的方法，其中所述T细胞刺激相关基因座是CD69。

178.根据实施方案177所述的方法，其中所述5’同源臂和所述3'同源臂包含与CD69的一个或多个区域同源的序列。

179.根据实施方案172所述的方法，其中所述T细胞刺激相关基因座是Nur77。

180.根据实施方案179所述的方法，其中所述5’同源臂和所述3'同源臂包含与Nur77的一个或多个区域同源的序列。

181.根据实施方案172所述的方法，其中所述T细胞刺激相关基因座是FoxP3。

182.根据实施方案181所述的方法，其中所述5’同源臂和所述3'同源臂包含与FoxP3的一个或多个区域同源的序列。

183.根据实施方案172所述的方法，其中所述T细胞刺激相关基因座是HLA-DR基因座。

184.根据实施方案183所述的方法，其中所述5’同源臂和所述3'同源臂包含与HLA-DR基因座的一个或多个区域同源的序列。

185.根据实施方案159-184中任一项所述的方法，其中所述重组受体或其部分能够诱导或传递所述T细胞中的所述刺激或激活信号。

186.根据实施方案159-185中任一项所述的方法，其中

187.根据实施方案159-186中任一项所述的方法，其中所述重组受体包含胞外区域，所述胞外区域含有能够结合或识别药剂的结合结构域。

188.根据实施方案187所述的方法，其中在所述药剂结合后在所述T细胞中诱导了刺激或激活信号。

189.根据实施方案187或188所述的方法，其中所述药剂是靶抗原，任选地其中所述靶抗原是重组蛋白或在细胞的表面上表达的抗原。

190.根据实施方案189所述的方法，其中所述靶抗原与疾病、障碍或病症的细胞或组织相关，对疾病、障碍或病症的细胞或组织是特异性的，和/或在疾病、障碍或病症的细胞或组织上表达。

191.根据实施方案190所述的方法，其中所述疾病、障碍或病症是感染性疾病或障碍、自身免疫性疾病、炎性疾病或肿瘤或癌症，任选地其中所述靶抗原是肿瘤抗原。

192.根据实施方案187-191中任一项所述的方法，其中所述靶抗原选自αvβ6整合素(avb6整合素)、B细胞成熟抗原(BCMA)、B7-H3、B7-H6、碳酸酐酶9(CA9，也称为CAIX或G250)、癌症-睾丸抗原、癌症/睾丸抗原1B(CTAG，也称为NY-ESO-11和LAGE-12)、癌胚抗原(CEA)、细胞周期蛋白、细胞周期蛋白A2、C-C基序趋化因子配体1(CCL-11)、CD19、CD20、CD22、CD23、CD24、CD30、CD33、CD38、CD44、CD44v6、CD44v7/8、CD123、CD133、CD138、CD171、硫酸软骨素蛋白聚糖4(CSPG4)、表皮生长因子蛋白(EGFR)、表皮生长因子受体III型突变体(EGFR vIII)、上皮糖蛋白2(EPG-12)、上皮糖蛋白40(EPG-40)、肝配蛋白B2、肝配蛋白受体A2(EPHa2)、雌激素受体、Fc受体样蛋白5(FCRL5；也称为Fc受体同源物5或FCRH5)、胎儿乙酰胆碱受体(胎儿AchR)、叶酸结合蛋白(FBP)、叶酸受体α、神经节苷脂GD2、O-乙酰化GD2(OGD2)、神经节苷脂GD3、糖蛋白100(gp100)、磷脂酰肌醇蛋白聚糖-3(GPC3)、G蛋白偶联受体C类5族成员D(GPRC5D)、Her2/neu(受体酪氨酸激酶erb-B2)、Her3(erb-B3)、Her4(erb-B4)、erbB二聚体、人高分子量黑色素瘤相关抗原(HMW-MAA)、乙型肝炎表面抗原、人白细胞抗原A1(HLA-A1)、人白细胞抗原A2(HLA-A2)、IL-122受体α(IL-122Rα)、IL-113受体α2(IL-113Rα2)、激酶插入结构域受体(kdr)、κ轻链、L1细胞粘附分子(L1-CAM)、L1-CAM的CE7表位、含有富亮氨酸重复序列的蛋白8家族成员A(LRRC8A)、Lewis Y、黑色素瘤相关抗原(MAGE)-A1、MAGE-A3、MAGE-A6、MAGE-A10、间皮素(MSLN)、c-Met、鼠类巨细胞病毒(CMV)、粘蛋白1(MUC1)、MUC16、自然杀伤细胞2族成员D(NKG2D)配体、黑色素A(MART-11)、神经细胞粘附分子(NCAM)、癌胚胎抗原、黑色素瘤优先表达抗原(PRAME)、孕酮受体、前列腺特异性抗原、前列腺干细胞抗原(PSCA)、前列腺特异性膜抗原(PSMA)、受体酪氨酸激酶样孤儿受体1(ROR1)、存活蛋白、滋养层糖蛋白(TPBG，也称为5T4)、肿瘤相关糖蛋白72(TAG72)、酪氨酸酶相关蛋白1(TRP1，也称为TYRP1或gp75)、酪氨酸酶相关蛋白2(TRP2，也称为多巴色素互变异构酶、多巴色素δ异构酶或DCT)、血管内皮生长因子受体(VEGFR)、血管内皮生长因子受体2(VEGFR2)、肾母细胞瘤1(WT-11)、病原体特有的或病原体表达的抗原、或与通用标签相关的抗原、和/或生物素化分子、和/或由HIV、HCV、HBV或其他病原体表达的分子。

193.根据实施方案191或192所述的方法，其中所述基因破坏是通过特异性结合至、识别或杂交至所述靶位点的锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)或CRISPR-Cas9组合实现的。

194.根据实施方案159-193中任一项所述的方法，其中所述基因破坏是通过CRISPR-Cas9组合实现的，并且所述CRISPR-Cas9组合包含具有与所述至少一个靶位点互补的靶向结构域的指导RNA(gRNA)。

195.根据实施方案194所述的方法，其中所述CRISPR-Cas9组合是包含所述gRNA和Cas9蛋白的核糖核蛋白(RNP)复合物。

196.根据实施方案195所述的方法，其中所述基因破坏是通过经由电穿孔引入多个T细胞中的RNP实现的。

197.根据实施方案159-196中任一项所述的方法，其中所述T细胞刺激相关基因座是PDCD1。

198.根据实施方案197所述的方法，其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与PDCD1基因中的靶位点互补的靶向结构域。

199.根据实施方案198所述的方法，其中所述gRNA包含SEQ ID NO:75和104-109中任一个所示的序列。

200.根据实施方案198或199所述的方法，其中所述gRNA包含SEQ ID NO:75所示的序列。

201.根据实施方案159-196中任一项所述的方法，其中所述T细胞刺激相关基因座是CD69。

202.根据实施方案201所述的方法，其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与CD69基因中的靶位点互补的靶向结构域。

203.根据实施方案202所述的方法，其中所述gRNA包含SEQ ID NO:116-121中任一个所示的序列。

204.根据实施方案159-196中任一项所述的方法，其中所述T细胞刺激相关基因座是Nur77。

205.根据实施方案204所述的方法，其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与Nur77基因中的靶位点互补的靶向结构域。

206.根据实施方案205所述的方法，其中所述gRNA包含SEQ ID NO:122-127和134-136所示的序列。

207.根据实施方案159-196中任一项所述的方法，其中所述T细胞刺激相关基因座是FoxP3。

208.根据实施方案159-196中任一项所述的方法，其中所述T细胞刺激相关基因座是HLA-DR基因座。

209.根据实施方案159-208中任一项所述的方法，其中所述T细胞还包含内源T细胞受体α恒定区(TRAC)基因和/或内源T细胞受体β恒定区(TRBC)基因处的基因破坏。

210.根据实施方案209所述的方法，其中所述基因破坏是通过特异性结合至、识别或杂交至所述TRAC、TRBC1和/或TRBC2基因内的至少一个靶位点的锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)或CRISPR-Cas9组合实现的。

211.根据实施方案209或210所述的方法，其中所述基因破坏是通过CRISPR-Cas9组合实现的，并且所述CRISPR-Cas9组合包含具有与至少一个靶位点互补的靶向结构域的指导RNA(gRNA)，任选地其中所述CRISPR-Cas9组合是包含所述gRNA和Cas9蛋白的核糖核蛋白(RNP)复合物，任选地其中所述基因破坏是通过经由电穿孔引入多个T细胞中的RNP实现的。

212.根据实施方案209-211中任一项所述的方法，其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现的，并且所述gRNA具有与所述TRAC、TRBC1和/或TRBC2基因内的至少一个靶位点互补的靶向结构域。

213.根据实施方案212所述的方法，其中所述gRNA具有与TRAC基因中的靶位点互补的靶向结构域。

214.根据实施方案213所述的方法，其中所述gRNA包含SEQ ID NO:77和188-218中任一个所示的序列。

215.根据实施方案213或214所述的方法，其中所述gRNA包含SEQ ID NO:77所示的序列。

216.根据实施方案212所述的方法，其中所述gRNA具有与TRBC基因中的靶位点互补的靶向结构域。

217.根据实施方案216所述的方法，其中所述gRNA包含SEQ ID NO:219-276中任一个所示的序列。

218.根据实施方案159-217中任一项所述的方法，其中所述重组受体是嵌合抗原受体(CAR)。

219.根据实施方案159-217中任一项所述的方法，其中所编码的重组受体是或包含重组T细胞受体(TCR)。

220.根据实施方案211-219中任一项所述的方法，其中所述RNP是经由电穿孔、粒子枪、磷酸钙转染、细胞压缩或挤压，任选地经由电穿孔来引入的。

221.根据实施方案220所述的方法，其中所述RNP是经由电穿孔引入多个T细胞中的。

222.根据实施方案220或221所述的方法，其中所述RNP的浓度是从为或约1μM至为或约5μM，任选地其中所述RNP的浓度是为或约2μM。

223.根据实施方案159-222中任一项所述的方法，其中T细胞包含CD8+T细胞和/或CD4+T细胞或其亚型。

224.根据实施方案159-223中任一项所述的方法，其中所述T细胞是对于所述受试者而言自体的。

225.根据实施方案159-224中任一项所述的方法，其中所述T细胞是源自受试者的原代T细胞，任选地其中所述受试者是人。

226.根据实施方案159-225中任一项所述的方法，其中所述T细胞是对于所述受试者而言同种异体的。

227.根据实施方案159-224中任一项所述的方法，其中所述T细胞源自任选地作为iPSC的多潜能或多能细胞。

228.根据实施方案159-227中任一项所述的方法，其中所述多核苷酸是线性多核苷酸。

229.根据实施方案228所述的方法，其中所述多核苷酸是双链多核苷酸。

230.根据实施方案228所述的方法，其中所述多核苷酸是单链多核苷酸。

231.根据实施方案159-227中任一项所述的方法，其中所述多核苷酸包含于病毒载体中。

232.根据实施方案231所述的方法，其中所述病毒载体是AAV载体。

233.根据实施方案231所述的方法，其中所述病毒载体是逆转录病毒载体，任选地慢病毒载体。

234.根据实施方案159-233中任一项所述的方法，其中所述多核苷酸具有至少或至少约1000、1250、1500、1750、2000、2250、2500、2750、3000、3250、3500、3750或4000个核苷酸或任何前述值之间的任何值的长度。

235.根据实施方案159-234中任一项所述的方法，其中所述多核苷酸的长度在为或约1500与为或约2500个核苷酸之间，或者在为或约1750与为或约2250个核苷酸之间。

236.根据实施方案159、160和162-235中任一项所述的方法，其中将所述一种或多种药剂和所述多核苷酸同时或按任何顺序依序引入。

237.根据实施方案159、160和162-236中任一项所述的方法，其中将所述一种或多种药剂和所述多核苷酸同时引入。

238.根据实施方案159、160和162-236中任一项所述的方法，其中在引入所述一种或多种药剂之后引入所述多核苷酸。

239.根据实施方案238所述的方法，其中在引入所述药剂之后立即引入所述多核苷酸，或者在引入所述药剂之后约30秒、1分钟、2分钟、3分钟、4分钟、5分钟、6分钟、6分钟、8分钟、9分钟、10分钟、15分钟、20分钟、30分钟、40分钟、50分钟、60分钟、90分钟、2小时、3小时或4小时内引入所述多核苷酸。

240.根据实施方案159、160和162-239中任一项所述的方法，其中在引入所述一种或多种药剂和/或所述多核苷酸之前，所述方法包括在刺激或激活一种或多种免疫细胞的条件下将所述细胞在体外与一种或多种刺激剂一起孵育。

241.根据实施方案240所述的方法，其中所述一种或多种刺激剂包含抗CD3和/或抗CD28抗体。

242.根据实施方案240和241所述的方法，其中所述一种或多种刺激剂包含含有抗CD3和/或抗CD28抗体的低聚体颗粒试剂。

243.根据实施方案240-242中任一项所述的方法，其中所述一种或多种刺激剂包含用抗CD3和/或抗CD28抗体包被的珠。

244.根据实施方案159、160和162-243中任一项所述的方法，其中所述方法还包括在引入所述一种或多种药剂和/或引入所述多核苷酸之前、期间或之后，将所述细胞与一种或多种重组细胞因子一起孵育，任选地其中所述一种或多种重组细胞因子选自IL-2、IL-7和IL-15。

245.根据实施方案244所述的方法，其中所述一种或多种重组细胞因子是以选自以下的浓度来添加的：从为或约10U/mL至为或约200U/mL、任选地为或约50IU/mL至为或约100U/mL的浓度的IL-2；0.5ng/mL至50ng/mL、任选地为或约5ng/mL至为或约10ng/mL的浓度的IL-7；和/或0.1ng/mL至20ng/mL、任选地为或约0.5ng/mL至为或约5ng/mL的浓度的IL-15。

246.根据实施方案244或245所述的方法，其中所述孵育是在引入所述一种或多种药剂和引入所述多核苷酸之后进行至多或大约24小时、36小时、48小时、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或21天，任选地至多或约7天。

247.一种工程化T细胞或多种工程化T细胞，其使用根据实施方案159-246中任一项所述的方法来产生。

248.一种组合物，所述组合物包含根据实施方案247所述的工程化T细胞或多个根据实施方案247所述的工程化T细胞。

249.根据实施方案248所述的组合物，其中所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约6、12、18、24、36或48小时内在所述组合物中的一个或多个细胞中被上调或诱导。

250.根据实施方案248或249所述的组合物，其中在所述T细胞中的刺激或激活信号之后，在所述组合物中的细胞中表达所述可操作地连接的转基因的细胞的频率大于或大于约50％、60％、70％、75％、80％、85％、90％或95％或更多。

251.根据实施方案248-250中任一项所述的组合物，其中在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述组合物中的一个或多个细胞中被降低或下调。

252.根据实施方案248-251中任一项所述的组合物，其中在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，在组合物中的细胞中表达所述可操作地连接的转基因的细胞的频率降低大于或大于约30％、40％、50％、60％、70％、75％、80％、85％、90％或95％或更多。

253.根据实施方案248-252中任一项所述的组合物，其中在表达的上调或诱导之后，在所述T细胞中的所述刺激或激活信号之后为或约1、2、3、4、5、6、7或8天或更长时间之后，所述可操作地连接的转基因的表达在所述组合物中的一个或多个细胞中被降低或下调。

254.根据实施方案248-253中任一项所述的组合物，其中在所述T细胞中所述刺激或激活信号降低或不存在之后小于或小于约6、12、18、24、36或48小时内，在所述组合物中的一个或多个细胞中所述可操作地连接的转基因的表达被降低或下调。

255.根据实施方案254所述的组合物，其中在所述T细胞中所述刺激或激活信号降低或不存在之后，在所述组合物中的细胞中表达所述重组受体的细胞的频率小于或小于约50％、40％、30％、25％、20％、15％、10％或5％或更少。

256.根据实施方案248-255中任一项所述的组合物，其中所述组合物包含CD4+T细胞和/或CD8+T细胞。

257.根据实施方案248-256中任一项所述的组合物，其中所述组合物包含CD4+和CD8+T细胞，并且CD4+与CD8+T细胞的比率是从或从约1:3至3:1，任选地1:1。

258.一种治疗方法，所述治疗方法包括将根据实施方案1-81和247中任一项所述的工程化细胞或根据实施方案82-91和248-257中任一项所述的组合物施用至患有疾病或障碍的受试者。

259.根据实施方案1-81和247中任一项所述的工程化细胞、根据实施方案82-91和248-257中任一项所述的组合物用于治疗疾病或障碍的用途。

260.根据实施方案1-81和247中任一项所述的工程化细胞或根据实施方案82-91和248-257中任一项所述的组合物在制造用于治疗疾病或障碍的药物中的用途。

261.根据实施方案1-81和247中任一项所述的工程化细胞或根据实施方案82-91和248-257中任一项所述的组合物，所述工程化细胞或所述组合物用于治疗疾病或障碍。

262.根据实施方案258-261中任一项所述的方法、用途或用于所述用途的工程化细胞、多种工程化细胞或组合物，其中所述疾病或障碍是癌症或肿瘤。

263.根据实施方案262所述的方法、用途或者用于所述用途的工程化细胞、多个工程化细胞或组合物，其中所述癌症或所述肿瘤是血液恶性肿瘤，任选地淋巴瘤、白血病或浆细胞恶性肿瘤。

264.根据实施方案262或263所述的方法、用途或用于所述用途的工程化细胞、多种工程化细胞或组合物，其中所述癌症是淋巴瘤，并且所述淋巴瘤是伯基特淋巴瘤、非霍奇金淋巴瘤(NHL)、霍奇金淋巴瘤、华氏巨球蛋白血症、滤泡性淋巴瘤、小无裂细胞性淋巴瘤、粘膜相关淋巴组织淋巴瘤(MALT)、边缘区淋巴瘤、脾淋巴瘤、结节单核细胞样B细胞淋巴瘤、免疫母细胞淋巴瘤、大细胞淋巴瘤、弥漫性混合细胞淋巴瘤、肺B细胞血管中心淋巴瘤、小淋巴细胞淋巴瘤、原发性纵隔B细胞淋巴瘤、淋巴浆细胞性淋巴瘤(LPL)或套细胞淋巴瘤(MCL)。

265.根据实施方案262-264中任一项所述的方法、用途或用于所述用途的工程化细胞、多种工程化细胞或组合物，其中所述癌症是白血病，并且所述白血病是慢性淋巴细胞白血病(CLL)、浆细胞白血病或急性淋巴细胞白血病(ALL)。

266.根据实施方案262-265中任一项所述的方法、用途或用于所述用途的工程化细胞、多种工程化细胞或组合物，其中所述癌症是浆细胞恶性肿瘤，并且所述浆细胞恶性肿瘤是多发性骨髓瘤(MM)。

267.根据实施方案262所述的方法、用途或者用于所述用途的工程化细胞、多个工程化细胞或组合物，其中所述肿瘤是实体瘤。

269.根据实施方案267所述的方法、用途或用于所述用途的工程化细胞、多种工程化细胞或组合物，其中所述实体瘤是非小细胞肺癌(NSCLC)或头颈部鳞状细胞癌(HNSCC)。

270.一种试剂盒，所述试剂盒包含：

能够在T细胞刺激相关基因座内的靶位点处诱导基因破坏的一种或多种药剂；以及

根据实施方案92-158中任一项所述的多核苷酸。

271.一种试剂盒，所述试剂盒包含：

包含编码重组受体或其部分的核酸序列的多核苷酸，其中编码所述重组受体或其抗原结合片段或链的所述转基因被靶向以供经由同源定向修复(HDR)整合于所述靶位点处或附近；以及

用于进行根据实施方案159-246中任一项所述的方法的说明书。

X.实施例

以下实施例仅出于说明性目的而被包括，并且不意图限制本发明的范围。实施例 1：T细胞刺激相关分子的表达动力学

随着时间的推移，评估了各种T细胞刺激信号相关标记物的表达以鉴定用于靶向整合编码嵌合抗原受体(CAR)的核酸序列的候选基因座。编码CAR的核酸序列被整合到编码刺激相关标记物的细胞基因组中的靶基因座中，使得CAR的表达在编码刺激相关标记物的基因的启动子的可操作控制下。在一些情况下，编码的CAR包含例如来自CD3-zeta(CD3ζ)链的含有免疫受体酪氨酸激活基序(ITAM)的信号传导结构域或其信号传导部分。如图1所示，在一些情况下，CAR的表达可以通过反馈回路来调节，例如，在经由CAR中存在的ITAM结构域在工程化T细胞中传递T细胞刺激信号之后表达。如果T细胞刺激信号不存在，例如，在不存在来自靶抗原与CAR的结合的刺激信号的情况下，所述表达可能降低或关闭。

在第0天将从人供体获得的原代T细胞通过与负载有抗CD3/抗CD28 Fab抗体片段或抗CD3/抗CD28抗体缀合的珠的可溶性多聚体试剂一起孵育进行刺激，并培养7天，然后在7天后使用相同试剂进行再刺激。通过流式细胞术随时间监测分化簇25(CD25)、CD69、CD45RA和程序性细胞死亡蛋白1(PD-1)(候选刺激相关标记物)的表达。

如图2所示，刺激后CD25、CD69和PD-1的表达增加。在初始刺激后大约第7天，CD69和PD-1的表达降低，这与刺激相关标记物的下调一致。CD29和PD-1的表达降低后，使用相同的试剂再刺激细胞。再刺激后，观察到CD69和PD-1的表达再次迅速增加。CD25的表达在大约第7天和再刺激后仍然很高。CD45RA的表达在大约第3天后降低，并且在再刺激后并未增加。选择PD-1作为靶向整合编码CAR的核酸序列的位置之一。

实施例2：示例性嵌合抗原受体(CAR)在刺激相关标记物程序性细胞死亡蛋白1 (PD-1)的启动子控制下的表达

通过CRISPR/Cas9介导的基因编辑和经由同源依赖性修复(HDR)在基因破坏的位点处的靶向整合，将编码示例性嵌合抗原受体(CAR)的核酸序列引入T细胞中，所述T细胞在编码T细胞受体α(TCRα)链和/或程序性细胞死亡蛋白1(PD-1)的内源基因座处具有基因破坏。

A.工程化T细胞的产生

产生含有编码示例性抗CD19 CAR的核酸序列的线性双链模板多核苷酸以用于HDR介导的靶向，所述线性双链模板多核苷酸侧接用于靶向整合在人TCRα恒定区(TRAC)基因或编码PD-1的基因(PDCD1)处的5’和3’同源序列。所编码的抗CD19 CAR含有源自鼠类抗体的scFv(源自FMC63的可变区，V_L-接头-V_H定向)、三(3)个Strep-tag II序列、源自CD28的跨膜结构域、源自4-1BB的共刺激区和CD3-ζ细胞内信号传导结构域。所述多核苷酸还含有CAR编码序列的上游的P2A核糖体跳跃序列，以允许插入的核酸序列在插入位点处的内源启动子的控制下表达以及允许多腺苷酸化信号以用于转录终止和mRNA成熟。编码抗CD19 CAR的示例性核酸序列如SEQ ID NO:64所示。为了靶向PDCD1基因座，核酸序列侧接大约100至200个碱基对的5'和3'同源臂(分别如SEQ ID NO:66和67所示)，并使用SEQ ID NO:68和69所示的引物扩增。为了靶向TRAC基因座，核酸序列侧接大约50至70个碱基对的5'和3'同源臂(分别如SEQ ID NO:68和69所示)，并使用SEQ ID NO:72和73所示的引物扩增。

对原代人CD4+和CD8+T细胞进行刺激，培养并用含有靶向PDCD1的gRNA(如SEQ IDNO:75所示)或靶向TRAC的gRNA(如SEQ ID NO:77所示)的核糖核蛋白(RNP)复合物以及用于在PDCD1或TRAC基因座处HDR介导的CAR编码核酸靶向的线性多核苷酸对其进行一步式电穿孔。通过与负载有抗CD3/抗CD28 Fab抗体片段的可溶性多聚体试剂一起孵育来刺激T细胞或在没有试剂的情况下使T细胞休息约48小时。将细胞洗涤并悬浮在电穿孔混合物中。将含有TRAC靶向gRNA和Cas9蛋白的预组装RNP复合物与线性多核苷酸混合，然后添加到细胞悬浮液中。将细胞电穿孔，然后在培养基中孵育5天。作为对照，仅用RNP复合物(无模板多核苷酸)将细胞电穿孔或在没有RNP复合物的情况下将细胞电穿孔。电穿孔后五(5)天(初始刺激后7天)，使用相同的试剂对细胞进行再刺激，或在没有再刺激的情况下休息。在使用抗CD3抗体、用于评估CAR的表达的抗Strep-tag试剂、抗PD1抗体和抗CD69抗体染色之后通过流式细胞术评估细胞，以随时间监测CAR和标记物的表达。

B.示例性CAR的表达

如图3A-图3B所示，在初始刺激后7天，引入了靶向PDCD1的RNAP复合物和靶向PDCD1的模板多核苷酸的细胞导致具有PD-1敲除的CAR表达细胞(如通过在PD-1KO PD-1CAR组中存在PD1^-CAR⁺细胞观察到的)；图3B)；并且引入了靶向TRAC的RNP复合物和靶向TRAC的模板多核苷酸的细胞导致具有内源CD3敲除的CAR表达细胞(如通过在TRAC KO TRAC KICAR组中存在CD3^-CAR⁺细胞观察到的)；图3B)。

C.刺激相关的CAR表达控制

通过在内源TRAC基因座处整合编码CAR的核酸序列(TRAC KI CAR；在内源TRAC启动子的控制下)而工程化的CAR表达细胞的百分比在再刺激的细胞和休息的细胞中相似；并且在再刺激后表达PD-1和CD69的细胞的百分比增加(参见图4A)。相比之下，与休息的细胞相比，通过在内源PDCD1基因座处整合编码CAR的核酸序列(PD1 KI CAR；在内源PDCD1启动子的控制下)而工程化的CAR表达细胞的百分比在再刺激的细胞中更高；并且在再刺激后表达CD69的细胞的百分比增加(参见图4B)。对照细胞在再刺激后显示出PD-1和CD69表达的增加(参见图4C)。

通过在内源TRAC基因座处整合核酸而工程化的细胞群体中的CAR+细胞的百分比随时间增加，并且在再刺激的细胞与休息的细胞之间是相似的(参见图5A)。相比之下，通过在内源PDCD1基因座处整合核酸而工程化的细胞群体中的CAR+细胞的百分比随时间增加，并且在再刺激后在受到再刺激的细胞中显著更高(参见图5B)。

D.结论

观察到在示例性刺激相关的内源基因座(例如内源PDCD1基因座)的启动子控制下的示例性CAR的表达也依赖于T细胞的刺激信号。与休息的细胞相比，在再刺激细胞后，表达显著增加。结果支持使用CAR编码序列的靶向整合以基于T细胞刺激或激活信号来调节CAR的表达。

实施例3：在刺激相关标记物程序性细胞死亡蛋白1(PD-1)的启动子的控制下表达示例性嵌合抗原受体(CAR)的工程化T的活性评估

评估了如以上实施例2中所述产生的由编码程序性细胞死亡蛋白1(PD-1)的内源基因座表达示例性嵌合抗原受体(CAR)的T细胞的活性。

A.工程化T细胞

通常如实施例2中所述通过将编码CAR的核酸序列整合在内源PDCD1基因座(在内源PDCD1启动子的控制下：PD1 KI CAR)处，将原代人CD4+和CD8+T细胞工程化以表达示例性抗CD19 CAR。使用PDCD1 KO细胞(仅用靶向PDCD1的RNP复合物且在没有模板多核苷酸的情况下电穿孔；PD1 KO)、模拟处理的细胞(阴性对照)和/或使用慢病毒载体工程化的表达相同示例性CAR的细胞(LV对照)作为对照。

B.扩增

为了评估工程化T细胞的抗原特异性扩增，将如上所述的PD1 KI CAR(由经修饰的PDCD1基因座表达抗CD19 CAR)、PD1 KO、阴性对照和LV对照细胞在电穿孔之后培养7天。然后通过与辐照的表达CD19的淋巴母细胞系(LCL)共培养，将细胞以7天的间隔在两轮共培养中扩增。通过流式细胞术，用抗CD8抗体和用于检测示例性抗CD19CAR的表达的抗独特型抗体染色来评估抗原特异性刺激后细胞的扩增。

如图6A-图6B所示，在第一次和第二次刺激之后，在PDCD1启动子的控制下表达CAR的细胞(PD1 KI CAR)的百分比显著增加。使用慢病毒载体和随机整合工程化的表达CAR的细胞(LV对照)在抗原特异性刺激后也显示出扩增，但与PD1 KI CAR细胞相比，其扩增程度较小。结果表明，在刺激相关的PDCD1启动子的控制下表达CAR的细胞在抗原特异性刺激后有效地扩增。

C.再刺激后的表达

在从经修饰的PDCD1基因座表达抗CD19 CAR的工程化T细胞的再刺激之后评估CAR表达。使PD1 KI CAR和PD1 KO细胞在初始刺激和扩增后通过与辐照的CD19表达LCL共培养经受再刺激，或在没有再刺激的情况下休息。通过流式细胞术，针对刺激相关标记物(CD25、CD69)和用于检测示例性抗CD19 CAR的表达的抗独特型抗体染色来评估细胞。

如图7A-图7C所示，与未受到再刺激的细胞(PD1 KI CAR休息)相比，在再刺激(PD1KI CAR再刺激)之后，在PD1 KI CAR细胞中CAR表达细胞的百分比(图7A和图7B)和抗CD19CAR的平均表达水平(如由平均荧光强度MFI确定；图7B和图7C)增加。再刺激后细胞中CD25+CD69+细胞的百分比也更高(图7B)。

D.再刺激后的细胞溶解活性

在从经修饰的PDCD1基因座表达抗CD19靶向物-细胞溶解活性工程化T细胞的再刺激之后评估靶标特异性细胞溶解活性。使PD1 KI CAR和PD1 KO细胞在初始刺激和扩增后通过与辐照的CD19表达LCL共培养经受再刺激，或在没有再刺激的情况下休息。通过对培养的抗CD19 CAR表达效应细胞与表达CD19的靶细胞以10:1的效应物与靶标(E:T)比率的阻抗测量来评估细胞溶解活性。通过在共培养后最多24小时内测量靶细胞的分离来评估T细胞抗原特异性裂解靶细胞的能力。模拟处理的细胞(阴性对照)、LV对照和人胚肾(HEK)细胞用作对照。

如图7D所示，再刺激的PD1 KI CAR细胞比未受到再刺激的PD1 KI CAR细胞或LV对照更有效地杀伤靶细胞。

E.结论

经工程化以在示例性刺激相关内源基因座PDCD1的控制下表达CAR的T细胞(PD1KI CAR)展现出CAR的刺激依赖性表达以及在刺激后有效的靶细胞杀伤。结果支持使用CAR编码序列的靶向整合以基于T细胞刺激或激活信号来调节CAR的表达和功能。

实施例4：在小鼠中在PD1的控制下表达示例性CAR的工程化T的体内抗肿瘤作用的评估

通过在肿瘤小鼠模型中施用工程化细胞，评估了如以上实施例2中所述产生的由编码程序性细胞死亡蛋白1(PD1)的内源基因座表达示例性嵌合抗原受体(CAR)的工程化T细胞的抗肿瘤活性。

向NOD.Cg.Prkdc^scidIL2rg^tm1Wjl/SzJ(NSG)小鼠静脉内(i.v.)注射0.5x10⁶个用萤火虫萤光素酶转染的Raji淋巴瘤肿瘤细胞(表达CD19的永生化人B淋巴细胞肿瘤细胞系)(Raji-ffluc)。允许肿瘤植入发生持续6天，并使用生物发光成像进行验证。在肿瘤细胞注射后7天，小鼠不接受治疗，或接受单次静脉内(i.v.)注射1×10⁶个如上文实施例2中所述的经工程化以表达示例性抗CD19 CAR的原代人T细胞(PD1 KI CAR)或通过慢病毒载体递送和随机整合而工程化以表达相同抗CD19 CAR的原代人T细胞(LV对照)。在施用工程化T细胞后至多35天中每周通过生物发光评估肿瘤负荷。对于生物发光成像，小鼠接受了重悬于PBS(15μg/g体重)的萤光素底物(CaliperLife Sciences,霍普金顿，马萨诸塞州)的腹膜内(i.p.)注射。确定平均辐射(p/s/cm²/sr)。实验的时间线的示意图如图8A所示。

如图8B-图8D所示，施用了PD1 KI CAR或LV对照的小鼠导致肿瘤细胞生长减少和存活期增加。这些结果证明了经工程化以在示例性刺激相关的内源基因座PDCD1的控制下表达CAR的T细胞(PD1 KI CAR)的体内抗肿瘤活性。

本发明并不旨在限于具体公开的实施方案的范围，所提供的实施例例如是为了说明本发明的各个方面。根据本文的描述和传授，对组合物和方法的各种修改将变得清楚。可以在不脱离本公开文本的真实范围和精神的情况下实践这些变化，并且这些变化旨在落入本公开文本的范围内。

序列

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

序列表

<110> 朱诺治疗学有限公司

<120> 条件性地表达重组受体的工程化T细胞、相关多核苷酸和方法

<130> 73504-20138.40

<140> 尚未分配

<141> 2021-06-25

<150> 63/044,984

<151> 2020-06-26

<160> 297

<170> 用于Windows的FastSEQ 4.0版

<210> 1

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 间隔子 (IgG4铰链)

<400> 1

Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro

1 5 10

<210> 2

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 间隔子 (IgG4铰链)

<400> 2

gaatctaagt acggaccgcc ctgcccccct tgccct 36

<210> 3

<211> 119

<212> PRT

<213> 人工序列

<220>

<223> 铰链-CH3 间隔子

<400> 3

Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Gly Gln Pro Arg

1 5 10 15

Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys

20 25 30

Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp

35 40 45

Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys

50 55 60

Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser

65 70 75 80

Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser

85 90 95

Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser

100 105 110

Leu Ser Leu Ser Leu Gly Lys

115

<210> 4

<211> 229

<212> PRT

<213> 人工序列

<220>

<223> 铰链-CH2-CH3 间隔子

<400> 4

Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe

1 5 10 15

Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr

20 25 30

Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val

35 40 45

Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val

50 55 60

Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser

65 70 75 80

Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu

85 90 95

Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser

100 105 110

Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro

115 120 125

Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln

130 135 140

Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala

145 150 155 160

Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr

165 170 175

Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu

180 185 190

Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser

195 200 205

Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser

210 215 220

Leu Ser Leu Gly Lys

225

<210> 5

<211> 282

<212> PRT

<213> 人工序列

<220>

<223> IgD-铰链-Fc

<400> 5

Arg Trp Pro Glu Ser Pro Lys Ala Gln Ala Ser Ser Val Pro Thr Ala

1 5 10 15

Gln Pro Gln Ala Glu Gly Ser Leu Ala Lys Ala Thr Thr Ala Pro Ala

20 25 30

Thr Thr Arg Asn Thr Gly Arg Gly Gly Glu Glu Lys Lys Lys Glu Lys

35 40 45

Glu Lys Glu Glu Gln Glu Glu Arg Glu Thr Lys Thr Pro Glu Cys Pro

50 55 60

Ser His Thr Gln Pro Leu Gly Val Tyr Leu Leu Thr Pro Ala Val Gln

65 70 75 80

Asp Leu Trp Leu Arg Asp Lys Ala Thr Phe Thr Cys Phe Val Val Gly

85 90 95

Ser Asp Leu Lys Asp Ala His Leu Thr Trp Glu Val Ala Gly Lys Val

100 105 110

Pro Thr Gly Gly Val Glu Glu Gly Leu Leu Glu Arg His Ser Asn Gly

115 120 125

Ser Gln Ser Gln His Ser Arg Leu Thr Leu Pro Arg Ser Leu Trp Asn

130 135 140

Ala Gly Thr Ser Val Thr Cys Thr Leu Asn His Pro Ser Leu Pro Pro

145 150 155 160

Gln Arg Leu Met Ala Leu Arg Glu Pro Ala Ala Gln Ala Pro Val Lys

165 170 175

Leu Ser Leu Asn Leu Leu Ala Ser Ser Asp Pro Pro Glu Ala Ala Ser

180 185 190

Trp Leu Leu Cys Glu Val Ser Gly Phe Ser Pro Pro Asn Ile Leu Leu

195 200 205

Met Trp Leu Glu Asp Gln Arg Glu Val Asn Thr Ser Gly Phe Ala Pro

210 215 220

Ala Arg Pro Pro Pro Gln Pro Gly Ser Thr Thr Phe Trp Ala Trp Ser

225 230 235 240

Val Leu Arg Val Pro Ala Pro Pro Ser Pro Gln Pro Ala Thr Tyr Thr

245 250 255

Cys Val Val Ser His Glu Asp Ser Arg Thr Leu Leu Asn Ala Ser Arg

260 265 270

Ser Leu Glu Val Ser Tyr Val Thr Asp His

275 280

<210> 6

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> T2A

<400> 6

Leu Glu Gly Gly Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp

1 5 10 15

Val Glu Glu Asn Pro Gly Pro Arg

20

<210> 7

<211> 357

<212> PRT

<213> 人工序列

<220>

<223> tEGFR

<400> 7

Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro

1 5 10 15

Ala Phe Leu Leu Ile Pro Arg Lys Val Cys Asn Gly Ile Gly Ile Gly

20 25 30

Glu Phe Lys Asp Ser Leu Ser Ile Asn Ala Thr Asn Ile Lys His Phe

35 40 45

Lys Asn Cys Thr Ser Ile Ser Gly Asp Leu His Ile Leu Pro Val Ala

50 55 60

Phe Arg Gly Asp Ser Phe Thr His Thr Pro Pro Leu Asp Pro Gln Glu

65 70 75 80

Leu Asp Ile Leu Lys Thr Val Lys Glu Ile Thr Gly Phe Leu Leu Ile

85 90 95

Gln Ala Trp Pro Glu Asn Arg Thr Asp Leu His Ala Phe Glu Asn Leu

100 105 110

Glu Ile Ile Arg Gly Arg Thr Lys Gln His Gly Gln Phe Ser Leu Ala

115 120 125

Val Val Ser Leu Asn Ile Thr Ser Leu Gly Leu Arg Ser Leu Lys Glu

130 135 140

Ile Ser Asp Gly Asp Val Ile Ile Ser Gly Asn Lys Asn Leu Cys Tyr

145 150 155 160

Ala Asn Thr Ile Asn Trp Lys Lys Leu Phe Gly Thr Ser Gly Gln Lys

165 170 175

Thr Lys Ile Ile Ser Asn Arg Gly Glu Asn Ser Cys Lys Ala Thr Gly

180 185 190

Gln Val Cys His Ala Leu Cys Ser Pro Glu Gly Cys Trp Gly Pro Glu

195 200 205

Pro Arg Asp Cys Val Ser Cys Arg Asn Val Ser Arg Gly Arg Glu Cys

210 215 220

Val Asp Lys Cys Asn Leu Leu Glu Gly Glu Pro Arg Glu Phe Val Glu

225 230 235 240

Asn Ser Glu Cys Ile Gln Cys His Pro Glu Cys Leu Pro Gln Ala Met

245 250 255

Asn Ile Thr Cys Thr Gly Arg Gly Pro Asp Asn Cys Ile Gln Cys Ala

260 265 270

His Tyr Ile Asp Gly Pro His Cys Val Lys Thr Cys Pro Ala Gly Val

275 280 285

Met Gly Glu Asn Asn Thr Leu Val Trp Lys Tyr Ala Asp Ala Gly His

290 295 300

Val Cys His Leu Cys His Pro Asn Cys Thr Tyr Gly Cys Thr Gly Pro

305 310 315 320

Gly Leu Glu Gly Cys Pro Thr Asn Gly Pro Lys Ile Pro Ser Ile Ala

325 330 335

Thr Gly Met Val Gly Ala Leu Leu Leu Leu Leu Val Val Ala Leu Gly

340 345 350

Ile Gly Leu Phe Met

355

<210> 8

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> CD28 (氨基酸 153-179)

<400> 8

Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu

1 5 10 15

Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val

20 25

<210> 9

<211> 66

<212> PRT

<213> 人工序列

<220>

<223> CD28 (氨基酸 114-179)

<400> 9

Ile Glu Val Met Tyr Pro Pro Pro Tyr Leu Asp Asn Glu Lys Ser Asn

1 5 10 15

Gly Thr Ile Ile His Val Lys Gly Lys His Leu Cys Pro Ser Pro Leu

20 25 30

Phe Pro Gly Pro Ser Lys Pro Phe Trp Val Leu Val Val Val Gly Gly

35 40 45

Val Leu Ala Cys Tyr Ser Leu Leu Val Thr Val Ala Phe Ile Ile Phe

50 55 60

Trp Val

65

<210> 10

<211> 41

<212> PRT

<213> 人工序列

<220>

<223> CD28 (氨基酸 180-220)

<400> 10

Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr

1 5 10 15

Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro

20 25 30

Pro Arg Asp Phe Ala Ala Tyr Arg Ser

35 40

<210> 11

<211> 41

<212> PRT

<213> 人工序列

<220>

<223> CD28 (LL至GG)

<400> 11

Arg Ser Lys Arg Ser Arg Gly Gly His Ser Asp Tyr Met Asn Met Thr

1 5 10 15

Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro

20 25 30

Pro Arg Asp Phe Ala Ala Tyr Arg Ser

35 40

<210> 12

<211> 42

<212> PRT

<213> 人工序列

<220>

<223> 4-1BB (氨基酸 214-255)

<400> 12

Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met

1 5 10 15

Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe

20 25 30

Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu

35 40

<210> 13

<211> 112

<212> PRT

<213> 人工序列

<220>

<223> CD3 ζ

<400> 13

Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Gln Gln Gly

1 5 10 15

Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr

20 25 30

Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys

35 40 45

Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys

50 55 60

Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg

65 70 75 80

Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala

85 90 95

Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg

100 105 110

<210> 14

<211> 112

<212> PRT

<213> 人工序列

<220>

<223> CD3 ζ

<400> 14

Arg Val Lys Phe Ser Arg Ser Ala Glu Pro Pro Ala Tyr Gln Gln Gly

1 5 10 15

Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr

20 25 30

Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys

35 40 45

Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys

50 55 60

Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg

65 70 75 80

Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala

85 90 95

Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg

100 105 110

<210> 15

<211> 112

<212> PRT

<213> 人工序列

<220>

<223> CD3 ζ

<400> 15

Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly

1 5 10 15

Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr

20 25 30

Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys

35 40 45

Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys

50 55 60

Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg

65 70 75 80

Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala

85 90 95

Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg

100 105 110

<210> 16

<211> 335

<212> PRT

<213> 人工序列

<220>

<223> tEGFR

<400> 16

Arg Lys Val Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu

1 5 10 15

Ser Ile Asn Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile

20 25 30

Ser Gly Asp Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe

35 40 45

Thr His Thr Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr

50 55 60

Val Lys Glu Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn

65 70 75 80

Arg Thr Asp Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg

85 90 95

Thr Lys Gln His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile

100 105 110

Thr Ser Leu Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val

115 120 125

Ile Ile Ser Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp

130 135 140

Lys Lys Leu Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn

145 150 155 160

Arg Gly Glu Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu

165 170 175

Cys Ser Pro Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser

180 185 190

Cys Arg Asn Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu

195 200 205

Leu Glu Gly Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln

210 215 220

Cys His Pro Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly

225 230 235 240

Arg Gly Pro Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro

245 250 255

His Cys Val Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr

260 265 270

Leu Val Trp Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His

275 280 285

Pro Asn Cys Thr Tyr Gly Cys Thr Gly Pro Gly Leu Glu Gly Cys Pro

290 295 300

Thr Asn Gly Pro Lys Ile Pro Ser Ile Ala Thr Gly Met Val Gly Ala

305 310 315 320

Leu Leu Leu Leu Leu Val Val Ala Leu Gly Ile Gly Leu Phe Met

325 330 335

<210> 17

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> T2A

<400> 17

Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro

1 5 10 15

Gly Pro

<210> 18

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> P2A

<400> 18

Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val

1 5 10 15

Glu Glu Asn Pro Gly Pro

20

<210> 19

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> P2A

<400> 19

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

1 5 10 15

Pro Gly Pro

<210> 20

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> E2A

<400> 20

Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 21

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> F2A

<400> 21

Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val

1 5 10 15

Glu Ser Asn Pro Gly Pro

20

<210> 22

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 接头

<220>

<221> 重复序列

<222> (5)...(9)

<223> 重复5或6次

<400> 22

Pro Gly Gly Gly Ser Gly Gly Gly Gly Pro

1 5 10

<210> 23

<211> 17

<212> PRT

<213> 人工序列

<220>

<223> 接头

<400> 23

Gly Ser Ala Asp Asp Ala Lys Lys Asp Ala Ala Lys Lys Asp Gly Lys

1 5 10 15

Ser

<210> 24

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> GMCSFR α链信号序列

<400> 24

atgcttctcc tggtgacaag ccttctgctc tgtgagttac cacacccagc attcctcctg 60

atccca 66

<210> 25

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> GMCSFR α链信号序列

<400> 25

Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro

1 5 10 15

Ala Phe Leu Leu Ile Pro

20

<210> 26

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> CD8 α单肽

<400> 26

Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu

1 5 10 15

His Ala

<210> 27

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> 铰链

<400> 27

Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro

1 5 10 15

<210> 28

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 铰链

<400> 28

Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro

1 5 10

<210> 29

<211> 61

<212> PRT

<213> 人工序列

<220>

<223> 铰链

<400> 29

Glu Leu Lys Thr Pro Leu Gly Asp Thr His Thr Cys Pro Arg Cys Pro

1 5 10 15

Glu Pro Lys Ser Cys Asp Thr Pro Pro Pro Cys Pro Arg Cys Pro Glu

20 25 30

Pro Lys Ser Cys Asp Thr Pro Pro Pro Cys Pro Arg Cys Pro Glu Pro

35 40 45

Lys Ser Cys Asp Thr Pro Pro Pro Cys Pro Arg Cys Pro

50 55 60

<210> 30

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 铰链

<400> 30

Glu Ser Lys Tyr Gly Pro Pro Cys Pro Ser Cys Pro

1 5 10

<210> 31

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 铰链

<220>

<221> 变体

<222> (1)...(1)

<223> Xaa是gly, cys或arg

<220>

<221> 变体

<222> (4)...(4)

<223> Xaa是cys或thr

<400> 31

Xaa Pro Pro Xaa Pro

1 5

<210> 32

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> 铰链

<400> 32

Tyr Gly Pro Pro Cys Pro Pro Cys Pro

1 5

<210> 33

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 铰链

<400> 33

Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro

1 5 10

<210> 34

<211> 14

<212> PRT

<213> 人工序列

<220>

<223> 铰链

<400> 34

Glu Val Val Val Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro

1 5 10

<210> 35

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> CDR L1

<400> 35

Arg Ala Ser Gln Asp Ile Ser Lys Tyr Leu Asn

1 5 10

<210> 36

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> CDR L2

<400> 36

Ser Arg Leu His Ser Gly Val

1 5

<210> 37

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> CDR L3

<400> 37

Gly Asn Thr Leu Pro Tyr Thr Phe Gly

1 5

<210> 38

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> CDR H1

<400> 38

Asp Tyr Gly Val Ser

1 5

<210> 39

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> CDR H2

<400> 39

Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser

1 5 10 15

<210> 40

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> CDR H3

<400> 40

Tyr Ala Met Asp Tyr Trp Gly

1 5

<210> 41

<211> 120

<212> PRT

<213> 人工序列

<220>

<223> VH

<400> 41

Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln

1 5 10 15

Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr

20 25 30

Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu

35 40 45

Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys

50 55 60

Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu

65 70 75 80

Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala

85 90 95

Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln

100 105 110

Gly Thr Ser Val Thr Val Ser Ser

115 120

<210> 42

<211> 107

<212> PRT

<213> 人工序列

<220>

<223> VL

<400> 42

Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly

1 5 10 15

Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr

20 25 30

Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile

35 40 45

Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly

50 55 60

Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln

65 70 75 80

Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr

85 90 95

Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr

100 105

<210> 43

<211> 245

<212> PRT

<213> 人工序列

<220>

<223> scFv

<400> 43

Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly

1 5 10 15

Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr

20 25 30

Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile

35 40 45

Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly

50 55 60

Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln

65 70 75 80

Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr

85 90 95

Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly

100 105 110

Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys

115 120 125

Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser

130 135 140

Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser

145 150 155 160

Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile

165 170 175

Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu

180 185 190

Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn

195 200 205

Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr

210 215 220

Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser

225 230 235 240

Val Thr Val Ser Ser

245

<210> 44

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> CDR L1

<400> 44

Lys Ala Ser Gln Asn Val Gly Thr Asn Val Ala

1 5 10

<210> 45

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> CDR L2

<400> 45

Ser Ala Thr Tyr Arg Asn Ser

1 5

<210> 46

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> CDR L3

<400> 46

Gln Gln Tyr Asn Arg Tyr Pro Tyr Thr

1 5

<210> 47

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> CDR H1

<400> 47

Ser Tyr Trp Met Asn

1 5

<210> 48

<211> 17

<212> PRT

<213> 人工序列

<220>

<223> CDR H2

<400> 48

Gln Ile Tyr Pro Gly Asp Gly Asp Thr Asn Tyr Asn Gly Lys Phe Lys

1 5 10 15

Gly

<210> 49

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> CDR H3

<400> 49

Lys Thr Ile Ser Ser Val Val Asp Phe Tyr Phe Asp Tyr

1 5 10

<210> 50

<211> 122

<212> PRT

<213> 人工序列

<220>

<223> VH

<400> 50

Glu Val Lys Leu Gln Gln Ser Gly Ala Glu Leu Val Arg Pro Gly Ser

1 5 10 15

Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr Ala Phe Ser Ser Tyr

20 25 30

Trp Met Asn Trp Val Lys Gln Arg Pro Gly Gln Gly Leu Glu Trp Ile

35 40 45

Gly Gln Ile Tyr Pro Gly Asp Gly Asp Thr Asn Tyr Asn Gly Lys Phe

50 55 60

Lys Gly Gln Ala Thr Leu Thr Ala Asp Lys Ser Ser Ser Thr Ala Tyr

65 70 75 80

Met Gln Leu Ser Gly Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys

85 90 95

Ala Arg Lys Thr Ile Ser Ser Val Val Asp Phe Tyr Phe Asp Tyr Trp

100 105 110

Gly Gln Gly Thr Thr Val Thr Val Ser Ser

115 120

<210> 51

<211> 108

<212> PRT

<213> 人工序列

<220>

<223> VL

<400> 51

Asp Ile Glu Leu Thr Gln Ser Pro Lys Phe Met Ser Thr Ser Val Gly

1 5 10 15

Asp Arg Val Ser Val Thr Cys Lys Ala Ser Gln Asn Val Gly Thr Asn

20 25 30

Val Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ser Pro Lys Pro Leu Ile

35 40 45

Tyr Ser Ala Thr Tyr Arg Asn Ser Gly Val Pro Asp Arg Phe Thr Gly

50 55 60

Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Thr Asn Val Gln Ser

65 70 75 80

Lys Asp Leu Ala Asp Tyr Phe Cys Gln Gln Tyr Asn Arg Tyr Pro Tyr

85 90 95

Thr Ser Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg

100 105

<210> 52

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> 接头

<400> 52

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 53

<211> 245

<212> PRT

<213> 人工序列

<220>

<223> scFv

<400> 53

Glu Val Lys Leu Gln Gln Ser Gly Ala Glu Leu Val Arg Pro Gly Ser

1 5 10 15

Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr Ala Phe Ser Ser Tyr

20 25 30

Trp Met Asn Trp Val Lys Gln Arg Pro Gly Gln Gly Leu Glu Trp Ile

35 40 45

Gly Gln Ile Tyr Pro Gly Asp Gly Asp Thr Asn Tyr Asn Gly Lys Phe

50 55 60

Lys Gly Gln Ala Thr Leu Thr Ala Asp Lys Ser Ser Ser Thr Ala Tyr

65 70 75 80

Met Gln Leu Ser Gly Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys

85 90 95

Ala Arg Lys Thr Ile Ser Ser Val Val Asp Phe Tyr Phe Asp Tyr Trp

100 105 110

Gly Gln Gly Thr Thr Val Thr Val Ser Ser Gly Gly Gly Gly Ser Gly

115 120 125

Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser

130 135 140

Pro Lys Phe Met Ser Thr Ser Val Gly Asp Arg Val Ser Val Thr Cys

145 150 155 160

Lys Ala Ser Gln Asn Val Gly Thr Asn Val Ala Trp Tyr Gln Gln Lys

165 170 175

Pro Gly Gln Ser Pro Lys Pro Leu Ile Tyr Ser Ala Thr Tyr Arg Asn

180 185 190

Ser Gly Val Pro Asp Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe

195 200 205

Thr Leu Thr Ile Thr Asn Val Gln Ser Lys Asp Leu Ala Asp Tyr Phe

210 215 220

Cys Gln Gln Tyr Asn Arg Tyr Pro Tyr Thr Ser Gly Gly Gly Thr Lys

225 230 235 240

Leu Glu Ile Lys Arg

245

<210> 54

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> HC-CDR3

<400> 54

His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr

1 5 10

<210> 55

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> LC-CDR2

<400> 55

His Thr Ser Arg Leu His Ser

1 5

<210> 56

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> LC-CDR3

<400> 56

Gln Gln Gly Asn Thr Leu Pro Tyr Thr

1 5

<210> 57

<211> 735

<212> DNA

<213> 人工序列

<220>

<223> 编码scFv的序列

<400> 57

gacatccaga tgacccagac cacctccagc ctgagcgcca gcctgggcga ccgggtgacc 60

atcagctgcc gggccagcca ggacatcagc aagtacctga actggtatca gcagaagccc 120

gacggcaccg tcaagctgct gatctaccac accagccggc tgcacagcgg cgtgcccagc 180

cggtttagcg gcagcggctc cggcaccgac tacagcctga ccatctccaa cctggaacag 240

gaagatatcg ccacctactt ttgccagcag ggcaacacac tgccctacac ctttggcggc 300

ggaacaaagc tggaaatcac cggcagcacc tccggcagcg gcaagcctgg cagcggcgag 360

ggcagcacca agggcgaggt gaagctgcag gaaagcggcc ctggcctggt ggcccccagc 420

cagagcctga gcgtgacctg caccgtgagc ggcgtgagcc tgcccgacta cggcgtgagc 480

tggatccggc agccccccag gaagggcctg gaatggctgg gcgtgatctg gggcagcgag 540

accacctact acaacagcgc cctgaagagc cggctgacca tcatcaagga caacagcaag 600

agccaggtgt tcctgaagat gaacagcctg cagaccgacg acaccgccat ctactactgc 660

gccaagcact actactacgg cggcagctac gccatggact actggggcca gggcaccagc 720

gtgaccgtga gcagc 735

<210> 58

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> 接头

<400> 58

Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr

1 5 10 15

Lys Gly

<210> 59

<211> 326

<212> PRT

<213> 智人 (Homo sapiens)

<220>

<223> 人 IgG2 Fc

<400> 59

Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg

1 5 10 15

Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr

20 25 30

Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser

35 40 45

Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser

50 55 60

Leu Ser Ser Val Val Thr Val Pro Ser Ser Asn Phe Gly Thr Gln Thr

65 70 75 80

Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys

85 90 95

Thr Val Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro

100 105 110

Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp

115 120 125

Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp

130 135 140

Val Ser His Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly

145 150 155 160

Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn

165 170 175

Ser Thr Phe Arg Val Val Ser Val Leu Thr Val Val His Gln Asp Trp

180 185 190

Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro

195 200 205

Ala Pro Ile Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg Glu

210 215 220

Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn

225 230 235 240

Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile

245 250 255

Ser Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr

260 265 270

Thr Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys

275 280 285

Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys

290 295 300

Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu

305 310 315 320

Ser Leu Ser Pro Gly Lys

325

<210> 60

<211> 327

<212> PRT

<213> 智人 (Homo sapiens)

<220>

<223> 人 IgG4 Fc

<400> 60

Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg

1 5 10 15

Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr

20 25 30

Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser

35 40 45

Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser

50 55 60

Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr

65 70 75 80

Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys

85 90 95

Arg Val Glu Ser Lys Tyr Gly Pro Pro Cys Pro Ser Cys Pro Ala Pro

100 105 110

Glu Phe Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys

115 120 125

Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val

130 135 140

Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp

145 150 155 160

Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe

165 170 175

Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp

180 185 190

Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu

195 200 205

Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg

210 215 220

Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys

225 230 235 240

Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp

245 250 255

Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys

260 265 270

Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser

275 280 285

Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser

290 295 300

Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser

305 310 315 320

Leu Ser Leu Ser Leu Gly Lys

325

<210> 61

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> P2A

<400> 61

ggaagcggag agggcagagg aagtcttcta acatgcggtg acgtggagga gaatcccggc 60

cca 63

<210> 62

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> P2A

<400> 62

Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu

1 5 10 15

Glu Asn Pro Gly Pro

20

<210> 63

<211> 215

<212> DNA

<213> 人工序列

<220>

<223> 聚A信号

<400> 63

gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 60

ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 120

cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 180

gaggattggg aagacaatag caggcatgct gggga 215

<210> 64

<211> 1566

<212> DNA

<213> 人工序列

<220>

<223> 抗CD19 CAR

<400> 64

atgctgctgc tggtgaccag cctgctgctg tgcgagctgc cccaccccgc ctttctgctg 60

atccccgaca tccagatgac ccagaccacc tccagcctga gcgccagcct gggcgaccgg 120

gtgaccatca gctgccgggc cagccaggac atcagcaagt acctgaactg gtatcagcag 180

aagcccgacg gcaccgtcaa gctgctgatc taccacacca gccggctgca cagcggcgtg 240

cccagccggt ttagcggcag cggctccggc accgactaca gcctgaccat ctccaacctg 300

gaacaggaag atatcgccac ctacttttgc cagcagggca acacactgcc ctacaccttt 360

ggcggcggaa caaagctgga aatcaccggc agcacctccg gcagcggcaa gcctggcagc 420

ggcgagggca gcaccaaggg cgaggtgaag ctgcaggaaa gcggccctgg cctggtggcc 480

cccagccaga gcctgagcgt gacctgcacc gtgagcggcg tgagcctgcc cgactacggc 540

gtgagctgga tcaggcagcc ccccaggaag ggcctggaat ggctgggcgt gatctggggc 600

agcgagacca cctactacaa cagcgccctg aagagccggc tgaccatcat caaggacaac 660

agcaagagcc aggtgttcct gaagatgaac agcctgcaga ccgacgacac cgccatctac 720

tactgcgcca agcactacta ctacggcggc agctacgcca tggactactg gggccagggc 780

accagcgtga ccgtgagcag cgagagcaag aattggagcc acccgcagtt cgaaaaagga 840

ggtggaggtt caggtggtgg aggctcttac ggaccgaatt ggtctcatcc tcagttcgag 900

aaaggaggcg gttctggagg tggaagcggt ggctcttgga gccacccaca gtttgaaaag 960

ggaggcgggg gctccggtgg cggaggctct tccggatctc cctgtccacc ttgccctatg 1020

ttctgggtgc tggtagtggt aggtggagtg ctggcctgct acagcctgct ggtgacagtg 1080

gccttcatca tcttttgggt gaaacggggc agaaagaaac tcctgtatat attcaaacaa 1140

ccatttatga gaccagtaca aactactcaa gaggaagatg gctgtagctg ccgatttcca 1200

gaagaagaag aaggaggatg tgaactgcgg gtgaagttca gcagaagcgc cgacgcacct 1260

gcctaccagc agggccagaa tcagctgtac aacgagctga acctgggacg aagggaagag 1320

tacgacgtcc tggataagcg gagaggccgg gaccctgaga tgggcggcaa gcctcggcgg 1380

aagaaccccc aggaaggcct gtataacgaa ctgcagaaag acaagatggc cgaggcctac 1440

agcgagatcg gcatgaaggg cgagcggagg cggggcaagg gccacgacgg cctgtatcag 1500

ggcctgtcca ccgccaccaa ggatacctac gacgccctgc acatgcaggc cctgccccca 1560

aggtga 1566

<210> 65

<211> 499

<212> PRT

<213> 人工序列

<220>

<223> 抗CD19 CAR

<400> 65

Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly

1 5 10 15

Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr

20 25 30

Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile

35 40 45

Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly

50 55 60

Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln

65 70 75 80

Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr

85 90 95

Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly

100 105 110

Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys

115 120 125

Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser

130 135 140

Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser

145 150 155 160

Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile

165 170 175

Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu

180 185 190

Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn

195 200 205

Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr

210 215 220

Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser

225 230 235 240

Val Thr Val Ser Ser Glu Ser Lys Asn Trp Ser His Pro Gln Phe Glu

245 250 255

Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Tyr Gly Pro Asn Trp

260 265 270

Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly Gly Gly Ser Gly

275 280 285

Gly Ser Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Gly Ser Gly

290 295 300

Gly Gly Gly Ser Ser Gly Ser Pro Cys Pro Pro Cys Pro Met Phe Trp

305 310 315 320

Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu Leu Val

325 330 335

Thr Val Ala Phe Ile Ile Phe Trp Val Lys Arg Gly Arg Lys Lys Leu

340 345 350

Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln

355 360 365

Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly

370 375 380

Cys Glu Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr

385 390 395 400

Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg

405 410 415

Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met

420 425 430

Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu

435 440 445

Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys

450 455 460

Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu

465 470 475 480

Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu

485 490 495

Pro Pro Arg

<210> 66

<211> 102

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 5' 同源臂

<400> 66

taattacctc cgcctgagca gtggagaagg cggcactctg gtggggctgc tccaggcatg 60

cagatcccac aggcgccctg gccagtcgtc tgggcggtgc ta 102

<210> 67

<211> 187

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 3' 同源臂

<400> 67

caactgggct ggcggccagg atggttctta ggtaggtggg gtcggcggtc aggtgtccca 60

gagccagggg tctggaggga ccttccaccc tcagtccctg gcaggtcggg gggtgctgag 120

gcgggcctgg ccctggcagc ccaggggtcc cggagcgagg ggtctggagg gacctttcac 180

tctcagt 187

<210> 68

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> TRAC 5' 同源臂

<400> 68

gggaaatgag atcatgtcct aaccctgatc ctcttgtccc acagatatcc agaaccctga 60

ccctgccgtg 70

<210> 69

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> TRAC 3' 同源臂

<400> 69

taccagctga gagactctaa atccagtgac aagtctgtct gcctattcac cgattttg 58

<210> 70

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 5' 引物

<400> 70

taattacctc cgcctgagca 20

<210> 71

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 3' 引物

<400> 71

actgagagtg aaaggtccct 20

<210> 72

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> TRAC 5' 引物

<400> 72

caaaatcggt gaataggcag 20

<210> 73

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> TRAC 3' 引物

<400> 73

gggaaatgag atcatgtcct 20

<210> 74

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 靶向序列

<400> 74

cgtctgggcg gtgctacaac 20

<210> 75

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> PDCD1 gRNA

<400> 75

cgucugggcg gugcuacaac 20

<210> 76

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> TRAC gRNA 靶向序列

<400> 76

agagtctctc agctggtaca 20

<210> 77

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC gRNA

<400> 77

agagucucuc agcugguaca 20

<210> 78

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 靶向序列

<400> 78

cgtctgggcg gtgctacaac gttttagagc tatgct 36

<210> 79

<211> 288

<212> PRT

<213> 人工序列

<220>

<223> PD-1

<400> 79

Met Gln Ile Pro Gln Ala Pro Trp Pro Val Val Trp Ala Val Leu Gln

1 5 10 15

Leu Gly Trp Arg Pro Gly Trp Phe Leu Asp Ser Pro Asp Arg Pro Trp

20 25 30

Asn Pro Pro Thr Phe Ser Pro Ala Leu Leu Val Val Thr Glu Gly Asp

35 40 45

Asn Ala Thr Phe Thr Cys Ser Phe Ser Asn Thr Ser Glu Ser Phe Val

50 55 60

Leu Asn Trp Tyr Arg Met Ser Pro Ser Asn Gln Thr Asp Lys Leu Ala

65 70 75 80

Ala Phe Pro Glu Asp Arg Ser Gln Pro Gly Gln Asp Cys Arg Phe Arg

85 90 95

Val Thr Gln Leu Pro Asn Gly Arg Asp Phe His Met Ser Val Val Arg

100 105 110

Ala Arg Arg Asn Asp Ser Gly Thr Tyr Leu Cys Gly Ala Ile Ser Leu

115 120 125

Ala Pro Lys Ala Gln Ile Lys Glu Ser Leu Arg Ala Glu Leu Arg Val

130 135 140

Thr Glu Arg Arg Ala Glu Val Pro Thr Ala His Pro Ser Pro Ser Pro

145 150 155 160

Arg Pro Ala Gly Gln Phe Gln Thr Leu Val Val Gly Val Val Gly Gly

165 170 175

Leu Leu Gly Ser Leu Val Leu Leu Val Trp Val Leu Ala Val Ile Cys

180 185 190

Ser Arg Ala Ala Arg Gly Thr Ile Gly Ala Arg Arg Thr Gly Gln Pro

195 200 205

Leu Lys Glu Asp Pro Ser Ala Val Pro Val Phe Ser Val Asp Tyr Gly

210 215 220

Glu Leu Asp Phe Gln Trp Arg Glu Lys Thr Pro Glu Pro Pro Val Pro

225 230 235 240

Cys Val Pro Glu Gln Thr Glu Tyr Ala Thr Ile Val Phe Pro Ser Gly

245 250 255

Met Gly Thr Ser Ser Pro Ala Arg Arg Gly Ser Ala Asp Gly Pro Arg

260 265 270

Ser Ala Gln Pro Leu Arg Pro Glu Asp Gly His Cys Ser Trp Pro Leu

275 280 285

<210> 80

<211> 2097

<212> DNA

<213> 人工序列

<220>

<223> PDCD1

<400> 80

gctcacctcc gcctgagcag tggagaaggc ggcactctgg tggggctgct ccaggcatgc 60

agatcccaca ggcgccctgg ccagtcgtct gggcggtgct acaactgggc tggcggccag 120

gatggttctt agactcccca gacaggccct ggaacccccc caccttctcc ccagccctgc 180

tcgtggtgac cgaaggggac aacgccacct tcacctgcag cttctccaac acatcggaga 240

gcttcgtgct aaactggtac cgcatgagcc ccagcaacca gacggacaag ctggccgcct 300

tccccgagga ccgcagccag cccggccagg actgccgctt ccgtgtcaca caactgccca 360

acgggcgtga cttccacatg agcgtggtca gggcccggcg caatgacagc ggcacctacc 420

tctgtggggc catctccctg gcccccaagg cgcagatcaa agagagcctg cgggcagagc 480

tcagggtgac agagagaagg gcagaagtgc ccacagccca ccccagcccc tcacccaggc 540

cagccggcca gttccaaacc ctggtggttg gtgtcgtggg cggcctgctg ggcagcctgg 600

tgctgctagt ctgggtcctg gccgtcatct gctcccgggc cgcacgaggg acaataggag 660

ccaggcgcac cggccagccc ctgaaggagg acccctcagc cgtgcctgtg ttctctgtgg 720

actatgggga gctggatttc cagtggcgag agaagacccc ggagcccccc gtgccctgtg 780

tccctgagca gacggagtat gccaccattg tctttcctag cggaatgggc acctcatccc 840

ccgcccgcag gggctcagct gacggccctc ggagtgccca gccactgagg cctgaggatg 900

gacactgctc ttggcccctc tgaccggctt ccttggccac cagtgttctg cagaccctcc 960

accatgagcc cgggtcagcg catttcctca ggagaagcag gcagggtgca ggccattgca 1020

ggccgtccag gggctgagct gcctgggggc gaccggggct ccagcctgca cctgcaccag 1080

gcacagcccc accacaggac tcatgtctca atgcccacag tgagcccagg cagcaggtgt 1140

caccgtcccc tacagggagg gccagatgca gtcactgctt caggtcctgc cagcacagag 1200

ctgcctgcgt ccagctccct gaatctctgc tgctgctgct gctgctgctg ctgctgcctg 1260

cggcccgggg ctgaaggcgc cgtggccctg cctgacgccc cggagcctcc tgcctgaact 1320

tgggggctgg ttggagatgg ccttggagca gccaaggtgc ccctggcagt ggcatcccga 1380

aacgccctgg acgcagggcc caagactggg cacaggagtg ggaggtacat ggggctgggg 1440

actccccagg agttatctgc tccctgcagg cctagagaag tttcagggaa ggtcagaaga 1500

gctcctggct gtggtgggca gggcaggaaa cccctccacc tttacacatg cccaggcagc 1560

acctcaggcc ctttgtgggg cagggaagct gaggcagtaa gcgggcaggc agagctggag 1620

gcctttcagg cccagccagc actctggcct cctgccgccg cattccaccc cagcccctca 1680

caccactcgg gagagggaca tcctacggtc ccaaggtcag gagggcaggg ctggggttga 1740

ctcaggcccc tcccagctgt ggccacctgg gtgttgggag ggcagaagtg caggcaccta 1800

gggcccccca tgtgcccacc ctgggagctc tccttggaac ccattcctga aattatttaa 1860

aggggttggc cgggctccca ccagggcctg ggtgggaagg tacaggcgtt cccccggggc 1920

ctagtacccc cgccgtggcc tatccactcc tcacatccac acactgcacc cccactcctg 1980

gggcagggcc accagcatcc aggcggccag caggcacctg agtggctggg acaagggatc 2040

ccccttccct gtggttctat tatattataa ttataattaa atatgagagc atgctaa 2097

<210> 81

<211> 199

<212> PRT

<213> 人工序列

<220>

<223> CD69

<400> 81

Met Ser Ser Glu Asn Cys Phe Val Ala Glu Asn Ser Ser Leu His Pro

1 5 10 15

Glu Ser Gly Gln Glu Asn Asp Ala Thr Ser Pro His Phe Ser Thr Arg

20 25 30

His Glu Gly Ser Phe Gln Val Pro Val Leu Cys Ala Val Met Asn Val

35 40 45

Val Phe Ile Thr Ile Leu Ile Ile Ala Leu Ile Ala Leu Ser Val Gly

50 55 60

Gln Tyr Asn Cys Pro Gly Gln Tyr Thr Phe Ser Met Pro Ser Asp Ser

65 70 75 80

His Val Ser Ser Cys Ser Glu Asp Trp Val Gly Tyr Gln Arg Lys Cys

85 90 95

Tyr Phe Ile Ser Thr Val Lys Arg Ser Trp Thr Ser Ala Gln Asn Ala

100 105 110

Cys Ser Glu His Gly Ala Thr Leu Ala Val Ile Asp Ser Glu Lys Asp

115 120 125

Met Asn Phe Leu Lys Arg Tyr Ala Gly Arg Glu Glu His Trp Val Gly

130 135 140

Leu Lys Lys Glu Pro Gly His Pro Trp Lys Trp Ser Asn Gly Lys Glu

145 150 155 160

Phe Asn Asn Trp Phe Asn Val Thr Gly Ser Asp Lys Cys Val Phe Leu

165 170 175

Lys Asn Thr Glu Val Ser Ser Met Glu Cys Glu Lys Asn Leu Tyr Trp

180 185 190

Ile Cys Asn Lys Pro Tyr Lys

195

<210> 82

<211> 1676

<212> DNA

<213> 人工序列

<220>

<223> CD69

<400> 82

agactcaaca agagctccag caaagacttt cactgtagct tgacttgacc tgagattaac 60

tagggaatct tgagaataaa gatgagctct gaaaattgtt tcgtagcaga gaacagctct 120

ttgcatccgg agagtggaca agaaaatgat gccaccagtc cccatttctc aacacgtcat 180

gaagggtcct tccaagttcc tgtcctgtgt gctgtaatga atgtggtctt catcaccatt 240

ttaatcatag ctctcattgc cttatcagtg ggccaataca attgtccagg ccaatacaca 300

ttctcaatgc catcagacag ccatgtttct tcatgctctg aggactgggt tggctaccag 360

aggaaatgct actttatttc tactgtgaag aggagctgga cttcagccca aaatgcttgt 420

tctgaacatg gtgctactct tgctgtcatt gattctgaaa aggacatgaa ctttctaaaa 480

cgatacgcag gtagagagga acactgggtt ggactgaaaa aggaacctgg tcacccatgg 540

aagtggtcaa atggcaaaga atttaacaac tggttcaacg ttacagggtc tgacaagtgt 600

gtttttctga aaaacacaga ggtcagcagc atggaatgtg agaagaattt atactggata 660

tgtaacaaac cttacaaata ataaggaaac atgttcactt attgactatt atagaatgga 720

actcaaggaa atctgtgtca gtggatgctg ctctgtggtc cgaagtcttc catagagact 780

ttgtgaaaaa aaattttata gtgtcttggg aattttcttc caaacagaac tatggaaaaa 840

aaggaagaaa ttccaggaaa atctgcactg tgggctttta ttgccatgag ctagaagcat 900

cacaggttga ccaataacca tgcccaagaa tgagaagaat gactatgcaa cctttggatg 960

cactttatat tattttgaat ccagaaataa tgaaataact aggcgtggac ttactattta 1020

ttgctgaatg actaccaaca gtgagagccc ttcatgcatt tgcactattg gaaggagtta 1080

gatgttggta ctagatactg aatgtaaaca aaggaattat ggctggtaac ataggttttt 1140

agtctaattg aatcccttaa actcagggag catttataaa tggacaaatg cttatgaaac 1200

taagatttgt aatatttctc tctttttaga gaaatttgcc aatttacttt gttatttttc 1260

cccaaaaaga atgggatgat catgtattta tttttttact tcctcagctg tagacaggtc 1320

cttttcgatg gtacatattt ctttgccttt ataatctttt atacagtgtc ttacagagaa 1380

aagacataag caaagactat gaggaatatt tgcaagacat agaatagtgt tggaaaatgt 1440

gcaatatgtg atgtggcaaa tctctattag gaaatattct gtaatcttca gacctagaat 1500

aatactagtc ttataatagg tttgtgactt tcctaaatca attctattac gtgcaatact 1560

tcaatacttc atttaaaata tttttatgtg caataaaatg tatttgtttg tattttgtgt 1620

tcagtacaat tataagctgt ttttatatat gtgaaataaa agtagaataa acacaa 1676

<210> 83

<211> 598

<212> PRT

<213> 人工序列

<220>

<223> NR4A1 (Nur77)

<400> 83

Met Pro Cys Ile Gln Ala Gln Tyr Gly Thr Pro Ala Pro Ser Pro Gly

1 5 10 15

Pro Arg Asp His Leu Ala Ser Asp Pro Leu Thr Pro Glu Phe Ile Lys

20 25 30

Pro Thr Met Asp Leu Ala Ser Pro Glu Ala Ala Pro Ala Ala Pro Thr

35 40 45

Ala Leu Pro Ser Phe Ser Thr Phe Met Asp Gly Tyr Thr Gly Glu Phe

50 55 60

Asp Thr Phe Leu Tyr Gln Leu Pro Gly Thr Val Gln Pro Cys Ser Ser

65 70 75 80

Ala Ser Ser Ser Ala Ser Ser Thr Ser Ser Ser Ser Ala Thr Ser Pro

85 90 95

Ala Ser Ala Ser Phe Lys Phe Glu Asp Phe Gln Val Tyr Gly Cys Tyr

100 105 110

Pro Gly Pro Leu Ser Gly Pro Val Asp Glu Ala Leu Ser Ser Ser Gly

115 120 125

Ser Asp Tyr Tyr Gly Ser Pro Cys Ser Ala Pro Ser Pro Ser Thr Pro

130 135 140

Ser Phe Gln Pro Pro Gln Leu Ser Pro Trp Asp Gly Ser Phe Gly His

145 150 155 160

Phe Ser Pro Ser Gln Thr Tyr Glu Gly Leu Arg Ala Trp Thr Glu Gln

165 170 175

Leu Pro Lys Ala Ser Gly Pro Pro Gln Pro Pro Ala Phe Phe Ser Phe

180 185 190

Ser Pro Pro Thr Gly Pro Ser Pro Ser Leu Ala Gln Ser Pro Leu Lys

195 200 205

Leu Phe Pro Ser Gln Ala Thr His Gln Leu Gly Glu Gly Glu Ser Tyr

210 215 220

Ser Met Pro Thr Ala Phe Pro Gly Leu Ala Pro Thr Ser Pro His Leu

225 230 235 240

Glu Gly Ser Gly Ile Leu Asp Thr Pro Val Thr Ser Thr Lys Ala Arg

245 250 255

Ser Gly Ala Pro Gly Gly Ser Glu Gly Arg Cys Ala Val Cys Gly Asp

260 265 270

Asn Ala Ser Cys Gln His Tyr Gly Val Arg Thr Cys Glu Gly Cys Lys

275 280 285

Gly Phe Phe Lys Arg Thr Val Gln Lys Asn Ala Lys Tyr Ile Cys Leu

290 295 300

Ala Asn Lys Asp Cys Pro Val Asp Lys Arg Arg Arg Asn Arg Cys Gln

305 310 315 320

Phe Cys Arg Phe Gln Lys Cys Leu Ala Val Gly Met Val Lys Glu Val

325 330 335

Val Arg Thr Asp Ser Leu Lys Gly Arg Arg Gly Arg Leu Pro Ser Lys

340 345 350

Pro Lys Gln Pro Pro Asp Ala Ser Pro Ala Asn Leu Leu Thr Ser Leu

355 360 365

Val Arg Ala His Leu Asp Ser Gly Pro Ser Thr Ala Lys Leu Asp Tyr

370 375 380

Ser Lys Phe Gln Glu Leu Val Leu Pro His Phe Gly Lys Glu Asp Ala

385 390 395 400

Gly Asp Val Gln Gln Phe Tyr Asp Leu Leu Ser Gly Ser Leu Glu Val

405 410 415

Ile Arg Lys Trp Ala Glu Lys Ile Pro Gly Phe Ala Glu Leu Ser Pro

420 425 430

Ala Asp Gln Asp Leu Leu Leu Glu Ser Ala Phe Leu Glu Leu Phe Ile

435 440 445

Leu Arg Leu Ala Tyr Arg Ser Lys Pro Gly Glu Gly Lys Leu Ile Phe

450 455 460

Cys Ser Gly Leu Val Leu His Arg Leu Gln Cys Ala Arg Gly Phe Gly

465 470 475 480

Asp Trp Ile Asp Ser Ile Leu Ala Phe Ser Arg Ser Leu His Ser Leu

485 490 495

Leu Val Asp Val Pro Ala Phe Ala Cys Leu Ser Ala Leu Val Leu Ile

500 505 510

Thr Asp Arg His Gly Leu Gln Glu Pro Arg Arg Val Glu Glu Leu Gln

515 520 525

Asn Arg Ile Ala Ser Cys Leu Lys Glu His Val Ala Ala Val Ala Gly

530 535 540

Glu Pro Gln Pro Ala Ser Cys Leu Ser Arg Leu Leu Gly Lys Leu Pro

545 550 555 560

Glu Leu Arg Thr Leu Cys Thr Gln Gly Leu Gln Arg Ile Phe Tyr Leu

565 570 575

Lys Leu Glu Asp Leu Val Pro Pro Pro Pro Ile Ile Asp Lys Ile Phe

580 585 590

Met Asp Thr Leu Pro Phe

595

<210> 84

<211> 2692

<212> DNA

<213> 人工序列

<220>

<223> NR4A1 (Nur77)

<400> 84

gtcacggagc gcttaagagg agggtcgggc tcggccgggg agtcccagtg gcggaggcta 60

cgaaacttgg gggagtgcac agaagaactt cgggagcgca cgcgggacca gggaccaggc 120

tgagactcgg ggcgccagtc cgggcagggg cagcgggagc cggccgggta gggtgcagcc 180

tgaggcttgt tcagcagaac aggtgcaagc cacattgttg ccaagacctg cctgaagccg 240

gattctcccc actgcctcct tcaaccccgc ctcttcctcc tcctgtggga ctgctccccc 300

ctcctgtgag gctagataga tgccctgtat ccaagcccaa tatgggacac cagcaccgag 360

tccgggaccc cgtgaccacc tggcaagcga ccccctgacc cctgagttca tcaagcccac 420

catggacctg gccagccccg aggcagcccc cgctgccccc actgccctgc ccagcttcag 480

caccttcatg gacggctaca caggagagtt tgacaccttc ctctaccagc tgccaggaac 540

agtccagcca tgctcctcag cctcctcctc ggcctcctcc acatcctcgt cctcagccac 600

ctcccctgcc tctgcctcct tcaagttcga ggacttccag gtgtacggct gctaccccgg 660

ccccctgagc ggcccagtgg atgaggccct gtcctccagt ggctctgact actatggcag 720

cccctgctcg gccccgtcgc cctccacgcc cagcttccag ccgccccagc tctctccctg 780

ggatggctcc ttcggccact tctcgcccag ccagacttac gaaggcctgc gggcatggac 840

agagcagctg cccaaagcct ctgggccccc acagcctcca gccttctttt ccttcagtcc 900

tcccaccggc cccagcccca gcctggccca gagccccctg aagttgttcc cctcacaggc 960

cacccaccag ctgggggagg gagagagcta ttccatgcct acggccttcc caggtttggc 1020

acccacttct ccacaccttg agggctcggg gatactggat acacccgtga cctcaaccaa 1080

ggcccggagc ggggccccag gtggaagtga aggccgctgt gctgtgtgtg gggacaacgc 1140

ttcatgccag cattatggtg tccgcacatg tgagggctgc aagggcttct tcaagcgcac 1200

agtgcagaaa aacgccaagt acatctgcct ggctaacaag gactgccctg tggacaagag 1260

gcggcgaaac cgctgccagt tctgccgctt ccagaagtgc ctggcggtgg gcatggtgaa 1320

ggaagttgtc cgaacagaca gcctgaaggg gcggcggggc cggctacctt caaaacccaa 1380

gcagccccca gatgcctccc ctgccaatct cctcacttcc ctggtccgtg cacacctgga 1440

ctcagggccc agcactgcca aactggacta ctccaagttc caggagctgg tgctgcccca 1500

ctttgggaag gaagatgctg gggatgtaca gcagttctac gacctgctct ccggttctct 1560

ggaggtcatc cgcaagtggg cggagaagat ccctggcttt gctgagctgt caccggctga 1620

ccaggacctg ttgctggagt cggccttcct ggagctcttc atcctccgcc tggcgtacag 1680

gtctaagcca ggcgagggca agctcatctt ctgctcaggc ctggtgctac accggctgca 1740

gtgtgcccgt ggcttcgggg actggattga cagtatcctg gccttctcaa ggtccctgca 1800

cagcttgctt gtcgatgtcc ctgccttcgc ctgcctctct gcccttgtcc tcatcaccga 1860

ccggcatggg ctgcaggagc cgcggcgggt ggaggagctg cagaaccgca tcgccagctg 1920

cctgaaggag cacgtggcag ctgtggcggg cgagccccag ccagccagct gcctgtcacg 1980

tctgttgggc aaactgcccg agctgcggac cctgtgcacc cagggcctgc agcgcatctt 2040

ctacctcaag ctggaggact tggtgccccc tccacccatc attgacaaga tcttcatgga 2100

cacgctgccc ttctgacccc tgcctgggaa cacgtgtgca catgcgcact ctcatatgcc 2160

accccatgtg cctttagtcc acggaccccc agagcacccc caagcctggg cttgagctgc 2220

agaatgactc caccttctca cctgctccag gaggtttgca gggagctcaa gcccttgggg 2280

agggggatgc cttcatgggg gtgaccccac gatttgtctt atccccccca gcctggcccc 2340

ggcctttatg ttttttgtaa gataaaccgt ttttaacaca tagcgccgtg ctgtaaataa 2400

gcccagtgct gctgtaaata caggaagaaa gagcttgagg tgggagcggg gctgggagga 2460

agggatgggc cccgccttcc tgggcagcct ttccagcctc ctgctggctc tctcttccta 2520

ccctccttcc acatgtacat aaactgtcac tctaggaaga agacaaatga cagattctga 2580

catttatatt tgtgtatttt cctggattta tagtatgtga cttttctgat taatatattt 2640

aatatattga ataaaaaata gacatgtagt tggaactgaa aaaaaaaaaa aa 2692

<210> 85

<211> 431

<212> PRT

<213> 人工序列

<220>

<223> FoxP3

<400> 85

Met Pro Asn Pro Arg Pro Gly Lys Pro Ser Ala Pro Ser Leu Ala Leu

1 5 10 15

Gly Pro Ser Pro Gly Ala Ser Pro Ser Trp Arg Ala Ala Pro Lys Ala

20 25 30

Ser Asp Leu Leu Gly Ala Arg Gly Pro Gly Gly Thr Phe Gln Gly Arg

35 40 45

Asp Leu Arg Gly Gly Ala His Ala Ser Ser Ser Ser Leu Asn Pro Met

50 55 60

Pro Pro Ser Gln Leu Gln Leu Pro Thr Leu Pro Leu Val Met Val Ala

65 70 75 80

Pro Ser Gly Ala Arg Leu Gly Pro Leu Pro His Leu Gln Ala Leu Leu

85 90 95

Gln Asp Arg Pro His Phe Met His Gln Leu Ser Thr Val Asp Ala His

100 105 110

Ala Arg Thr Pro Val Leu Gln Val His Pro Leu Glu Ser Pro Ala Met

115 120 125

Ile Ser Leu Thr Pro Pro Thr Thr Ala Thr Gly Val Phe Ser Leu Lys

130 135 140

Ala Arg Pro Gly Leu Pro Pro Gly Ile Asn Val Ala Ser Leu Glu Trp

145 150 155 160

Val Ser Arg Glu Pro Ala Leu Leu Cys Thr Phe Pro Asn Pro Ser Ala

165 170 175

Pro Arg Lys Asp Ser Thr Leu Ser Ala Val Pro Gln Ser Ser Tyr Pro

180 185 190

Leu Leu Ala Asn Gly Val Cys Lys Trp Pro Gly Cys Glu Lys Val Phe

195 200 205

Glu Glu Pro Glu Asp Phe Leu Lys His Cys Gln Ala Asp His Leu Leu

210 215 220

Asp Glu Lys Gly Arg Ala Gln Cys Leu Leu Gln Arg Glu Met Val Gln

225 230 235 240

Ser Leu Glu Gln Gln Leu Val Leu Glu Lys Glu Lys Leu Ser Ala Met

245 250 255

Gln Ala His Leu Ala Gly Lys Met Ala Leu Thr Lys Ala Ser Ser Val

260 265 270

Ala Ser Ser Asp Lys Gly Ser Cys Cys Ile Val Ala Ala Gly Ser Gln

275 280 285

Gly Pro Val Val Pro Ala Trp Ser Gly Pro Arg Glu Ala Pro Asp Ser

290 295 300

Leu Phe Ala Val Arg Arg His Leu Trp Gly Ser His Gly Asn Ser Thr

305 310 315 320

Phe Pro Glu Phe Leu His Asn Met Asp Tyr Phe Lys Phe His Asn Met

325 330 335

Arg Pro Pro Phe Thr Tyr Ala Thr Leu Ile Arg Trp Ala Ile Leu Glu

340 345 350

Ala Pro Glu Lys Gln Arg Thr Leu Asn Glu Ile Tyr His Trp Phe Thr

355 360 365

Arg Met Phe Ala Phe Phe Arg Asn His Pro Ala Thr Trp Lys Asn Ala

370 375 380

Ile Arg His Asn Leu Ser Leu His Lys Cys Phe Val Arg Val Glu Ser

385 390 395 400

Glu Lys Gly Ala Val Trp Thr Val Asp Glu Leu Glu Phe Arg Lys Lys

405 410 415

Arg Ser Gln Arg Pro Ser Arg Cys Ser Asn Pro Thr Pro Gly Pro

420 425 430

<210> 86

<211> 2397

<212> DNA

<213> 人工序列

<220>

<223> FoxP3

<400> 86

gcacacactc atcgaaaaaa atttggatta ttagaagaga gaggtctgcg gcttccacac 60

cgtacagcgt ggtttttctt ctcggtataa aagcaaagtt gtttttgata cgtgacagtt 120

tcccacaagc caggctgatc cttttctgtc agtccacttc accaagcctg cccttggaca 180

aggacccgat gcccaacccc aggcctggca agccctcggc cccttccttg gcccttggcc 240

catccccagg agcctcgccc agctggaggg ctgcacccaa agcctcagac ctgctggggg 300

cccggggccc agggggaacc ttccagggcc gagatcttcg aggcggggcc catgcctcct 360

cttcttcctt gaaccccatg ccaccatcgc agctgcagct gcccacactg cccctagtca 420

tggtggcacc ctccggggca cggctgggcc ccttgcccca cttacaggca ctcctccagg 480

acaggccaca tttcatgcac cagctctcaa cggtggatgc ccacgcccgg acccctgtgc 540

tgcaggtgca ccccctggag agcccagcca tgatcagcct cacaccaccc accaccgcca 600

ctggggtctt ctccctcaag gcccggcctg gcctcccacc tgggatcaac gtggccagcc 660

tggaatgggt gtccagggag ccggcactgc tctgcacctt cccaaatccc agtgcaccca 720

ggaaggacag caccctttcg gctgtgcccc agagctccta cccactgctg gcaaatggtg 780

tctgcaagtg gcccggatgt gagaaggtct tcgaagagcc agaggacttc ctcaagcact 840

gccaggcgga ccatcttctg gatgagaagg gcagggcaca atgtctcctc cagagagaga 900

tggtacagtc tctggagcag cagctggtgc tggagaagga gaagctgagt gccatgcagg 960

cccacctggc tgggaaaatg gcactgacca aggcttcatc tgtggcatca tccgacaagg 1020

gctcctgctg catcgtagct gctggcagcc aaggccctgt cgtcccagcc tggtctggcc 1080

cccgggaggc ccctgacagc ctgtttgctg tccggaggca cctgtggggt agccatggaa 1140

acagcacatt cccagagttc ctccacaaca tggactactt caagttccac aacatgcgac 1200

cccctttcac ctacgccacg ctcatccgct gggccatcct ggaggctcca gagaagcagc 1260

ggacactcaa tgagatctac cactggttca cacgcatgtt tgccttcttc agaaaccatc 1320

ctgccacctg gaagaacgcc atccgccaca acctgagtct gcacaagtgc tttgtgcggg 1380

tggagagcga gaagggggct gtgtggaccg tggatgagct ggagttccgc aagaaacgga 1440

gccagaggcc cagcaggtgt tccaacccta cacctggccc ctgacctcaa gatcaaggaa 1500

aggaggatgg acgaacaggg gccaaactgg tgggaggcag aggtggtggg ggcagggatg 1560

ataggccctg gatgtgccca cagggaccaa gaagtgaggt ttccactgtc ttgcctgcca 1620

gggcccctgt tcccccgctg gcagccaccc cctcccccat catatccttt gccccaaggc 1680

tgctcagagg ggccccggtc ctggccccag cccccacctc cgccccagac acacccccca 1740

gtcgagccct gcagccaaac agagccttca caaccagcca cacagagcct gcctcagctg 1800

ctcgcacaga ttacttcagg gctggaaaag tcacacagac acacaaaatg tcacaatcct 1860

gtccctcact caacacaaac cccaaaacac agagagcctg cctcagtaca ctcaaacaac 1920

ctcaaagctg catcatcaca caatcacaca caagcacagc cctgacaacc cacacacccc 1980

aaggcacgca cccacagcca gcctcagggc ccacaggggc actgtcaaca caggggtgtg 2040

cccagaggcc tacacagaag cagcgtcagt accctcagga tctgaggtcc caacacgtgc 2100

tcgctcacac acacggcctg ttagaattca cctgtgtatc tcacgcatat gcacacgcac 2160

agccccccag tgggtctctt gagtcccgtg cagacacaca cagccacaca cactgccttg 2220

ccaaaaatac cccgtgtctc ccctgccact cacctcactc ccattccctg agccctgatc 2280

catgcctcag cttagactgc agaggaacta ctcatttatt tgggatccaa ggcccccaac 2340

ccacagtacc gtccccaata aactgcagcc gagctcccca caaaaaaaaa aaaaaaa 2397

<210> 87

<211> 254

<212> PRT

<213> 人工序列

<220>

<223> HLA-DRA

<400> 87

Met Ala Ile Ser Gly Val Pro Val Leu Gly Phe Phe Ile Ile Ala Val

1 5 10 15

Leu Met Ser Ala Gln Glu Ser Trp Ala Ile Lys Glu Glu His Val Ile

20 25 30

Ile Gln Ala Glu Phe Tyr Leu Asn Pro Asp Gln Ser Gly Glu Phe Met

35 40 45

Phe Asp Phe Asp Gly Asp Glu Ile Phe His Val Asp Met Ala Lys Lys

50 55 60

Glu Thr Val Trp Arg Leu Glu Glu Phe Gly Arg Phe Ala Ser Phe Glu

65 70 75 80

Ala Gln Gly Ala Leu Ala Asn Ile Ala Val Asp Lys Ala Asn Leu Glu

85 90 95

Ile Met Thr Lys Arg Ser Asn Tyr Thr Pro Ile Thr Asn Val Pro Pro

100 105 110

Glu Val Thr Val Leu Thr Asn Ser Pro Val Glu Leu Arg Glu Pro Asn

115 120 125

Val Leu Ile Cys Phe Ile Asp Lys Phe Thr Pro Pro Val Val Asn Val

130 135 140

Thr Trp Leu Arg Asn Gly Lys Pro Val Thr Thr Gly Val Ser Glu Thr

145 150 155 160

Val Phe Leu Pro Arg Glu Asp His Leu Phe Arg Lys Phe His Tyr Leu

165 170 175

Pro Phe Leu Pro Ser Thr Glu Asp Val Tyr Asp Cys Arg Val Glu His

180 185 190

Trp Gly Leu Asp Glu Pro Leu Leu Lys His Trp Glu Phe Asp Ala Pro

195 200 205

Ser Pro Leu Pro Glu Thr Thr Glu Asn Val Val Cys Ala Leu Gly Leu

210 215 220

Thr Val Gly Leu Val Gly Ile Ile Ile Gly Thr Ile Phe Ile Ile Lys

225 230 235 240

Gly Val Arg Lys Ser Asn Ala Ala Glu Arg Arg Gly Pro Leu

245 250

<210> 88

<211> 1312

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRA

<400> 88

ttttaatggt cagactctat tacaccccac attctctttt cttttattct tgtctgttct 60

gcctcactcc cgagctctac tgactcccaa cagagcgccc aagaagaaaa tggccataag 120

tggagtccct gtgctaggat ttttcatcat agctgtgctg atgagcgctc aggaatcatg 180

ggctatcaaa gaagaacatg tgatcatcca ggccgagttc tatctgaatc ctgaccaatc 240

aggcgagttt atgtttgact ttgatggtga tgagattttc catgtggata tggcaaagaa 300

ggagacggtc tggcggcttg aagaatttgg acgatttgcc agctttgagg ctcaaggtgc 360

attggccaac atagctgtgg acaaagccaa cctggaaatc atgacaaagc gctccaacta 420

tactccgatc accaatgtac ctccagaggt aactgtgctc acaaacagcc ctgtggaact 480

gagagagccc aacgtcctca tctgtttcat agacaagttc accccaccag tggtcaatgt 540

cacgtggctt cgaaatggaa aacctgtcac cacaggagtg tcagagacag tcttcctgcc 600

cagggaagac caccttttcc gcaagttcca ctatctcccc ttcctgccct caactgagga 660

cgtttacgac tgcagggtgg agcactgggg cttggatgag cctcttctca agcactggga 720

gtttgatgct ccaagccctc tcccagagac tacagagaac gtggtgtgtg ccctgggcct 780

gactgtgggt ctggtgggca tcattattgg gaccatcttc atcatcaagg gattgcgcaa 840

aagcaatgca gcagaacgca gggggcctct gtaaggcaca tggaggtgat ggtgtttctt 900

agagagaaga tcactgaaga aacttctgct ttaatggctt tacaaagctg gcaatattac 960

aatccttgac ctcagtgaaa gcagtcatct tcagcatttt ccagccctat agccacccca 1020

agtgtggata tgcctcttcg attgctccgt actctaacat ctagctggct tccctgtcta 1080

ttgccttttc ctgtatctat tttcctctat ttcctatcat tttattatca ccatgcaatg 1140

cctctggaat aaaacataca ggagtctgtc tctgctatgg aatgccccat ggggcatctc 1200

ttgtgtactt attgtttaag gtttcctcaa actgtgattt ttctgaacac aataaactat 1260

tttgatgatc ttgggtggaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 1312

<210> 89

<211> 266

<212> PRT

<213> 人工序列

<220>

<223> HLA-DRB1

<400> 89

Met Val Cys Leu Lys Leu Pro Gly Gly Ser Cys Met Thr Ala Leu Thr

1 5 10 15

Val Thr Leu Met Val Leu Ser Ser Pro Leu Ala Leu Ala Gly Asp Thr

20 25 30

Arg Pro Arg Phe Leu Trp Gln Leu Lys Phe Glu Cys His Phe Phe Asn

35 40 45

Gly Thr Glu Arg Val Arg Leu Leu Glu Arg Cys Ile Tyr Asn Gln Glu

50 55 60

Glu Ser Val Arg Phe Asp Ser Asp Val Gly Glu Tyr Arg Ala Val Thr

65 70 75 80

Glu Leu Gly Arg Pro Asp Ala Glu Tyr Trp Asn Ser Gln Lys Asp Leu

85 90 95

Leu Glu Gln Arg Arg Ala Ala Val Asp Thr Tyr Cys Arg His Asn Tyr

100 105 110

Gly Val Gly Glu Ser Phe Thr Val Gln Arg Arg Val Glu Pro Lys Val

115 120 125

Thr Val Tyr Pro Ser Lys Thr Gln Pro Leu Gln His His Asn Leu Leu

130 135 140

Val Cys Ser Val Ser Gly Phe Tyr Pro Gly Ser Ile Glu Val Arg Trp

145 150 155 160

Phe Arg Asn Gly Gln Glu Glu Lys Ala Gly Val Val Ser Thr Gly Leu

165 170 175

Ile Gln Asn Gly Asp Trp Thr Phe Gln Thr Leu Val Met Leu Glu Thr

180 185 190

Val Pro Arg Ser Gly Glu Val Tyr Thr Cys Gln Val Glu His Pro Ser

195 200 205

Val Thr Ser Pro Leu Thr Val Glu Trp Arg Ala Arg Ser Glu Ser Ala

210 215 220

Gln Ser Lys Met Leu Ser Gly Val Gly Gly Phe Val Leu Gly Leu Leu

225 230 235 240

Phe Leu Gly Ala Gly Leu Phe Ile Tyr Phe Arg Asn Gln Lys Gly His

245 250 255

Ser Gly Leu Gln Pro Thr Gly Phe Leu Ser

260 265

<210> 90

<211> 1182

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRB1

<400> 90

tagttctccc tgagtgagac ttgcctgctt ctctggcccc tggtcctgtc ctgttctcca 60

gcatggtgtg tctgaagctc cctggaggct cctgcatgac agcgctgaca gtgacactga 120

tggtgctgag ctccccactg gctttggctg gggacacccg accacgtttc ttgtggcagc 180

ttaagtttga atgtcatttc ttcaatggga cggagcgggt gcggttgctg gaaagatgca 240

tctataacca agaggagtcc gtgcgcttcg acagcgacgt gggggagtac cgggcggtga 300

cggagctggg gcggcctgat gccgagtact ggaacagcca gaaggacctc ctggagcaga 360

ggcgggccgc ggtggacacc tactgcagac acaactacgg ggttggtgag agcttcacag 420

tgcagcggcg agttgagcct aaggtgactg tgtatccttc aaagacccag cccctgcagc 480

accacaacct cctggtctgc tctgtgagtg gtttctatcc aggcagcatt gaagtcaggt 540

ggttccggaa cggccaggaa gagaaggctg gggtggtgtc cacaggcctg atccagaatg 600

gagattggac cttccagacc ctggtgatgc tggaaacagt tcctcggagt ggagaggttt 660

acacctgcca agtggagcac ccaagtgtga cgagccctct cacagtggaa tggagagcac 720

ggtctgaatc tgcacagagc aagatgctga gtggagtcgg gggcttcgtg ctgggcctgc 780

tcttccttgg ggccgggctg ttcatctact tcaggaatca gaaaggacac tctggacttc 840

agccaacagg attcctgagc tgaaatgcag atgaccacat tcaaggaaga accttctgtc 900

ccagctttgc agaatgaaaa gctttcctgc ttggcagtta ttcttccaca agagagggct 960

ttctcaggac ctggttgcta ctggttcggc aactgcagaa aatgtcctcc cttgtggctt 1020

cctcagctcc tgcccttggc ctgaagtccc agcattgatg acagcgcctc atcttcaact 1080

tttgtgctcc cctttgccta aaccgtatgg cctcccgtgc atctgtactc accctgtacg 1140

acaaacacat tacattatta aatgtttctc aaagatggag tt 1182

<210> 91

<211> 142

<212> PRT

<213> 人工序列

<220>

<223> 人 TCR α恒定区

<400> 91

Pro Asn Ile Gln Asn Pro Asp Pro Ala Val Tyr Gln Leu Arg Asp Ser

1 5 10 15

Lys Ser Ser Asp Lys Ser Val Cys Leu Phe Thr Asp Phe Asp Ser Gln

20 25 30

Thr Asn Val Ser Gln Ser Lys Asp Ser Asp Val Tyr Ile Thr Asp Lys

35 40 45

Thr Val Leu Asp Met Arg Ser Met Asp Phe Lys Ser Asn Ser Ala Val

50 55 60

Ala Trp Ser Asn Lys Ser Asp Phe Ala Cys Ala Asn Ala Phe Asn Asn

65 70 75 80

Ser Ile Ile Pro Glu Asp Thr Phe Phe Pro Ser Pro Glu Ser Ser Cys

85 90 95

Asp Val Lys Leu Val Glu Lys Ser Phe Glu Thr Asp Thr Asn Leu Asn

100 105 110

Phe Gln Asn Leu Ser Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val

115 120 125

Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser

130 135 140

<210> 92

<211> 141

<212> PRT

<213> 人工序列

<220>

<223> 人 TCR α恒定区

<400> 92

Asn Ile Gln Asn Pro Asp Pro Ala Val Tyr Gln Leu Arg Asp Ser Lys

1 5 10 15

Ser Ser Asp Lys Ser Val Cys Leu Phe Thr Asp Phe Asp Ser Gln Thr

20 25 30

Asn Val Ser Gln Ser Lys Asp Ser Asp Val Tyr Ile Thr Asp Lys Thr

35 40 45

Val Leu Asp Met Arg Ser Met Asp Phe Lys Ser Asn Ser Ala Val Ala

50 55 60

Trp Ser Asn Lys Ser Asp Phe Ala Cys Ala Asn Ala Phe Asn Asn Ser

65 70 75 80

Ile Ile Pro Glu Asp Thr Phe Phe Pro Ser Pro Glu Ser Ser Cys Asp

85 90 95

Val Lys Leu Val Glu Lys Ser Phe Glu Thr Asp Thr Asn Leu Asn Phe

100 105 110

Gln Asn Leu Ser Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala

115 120 125

Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser

130 135 140

<210> 93

<211> 1508

<212> DNA

<213> 人工序列

<220>

<223> 人 TCR α恒定区

<400> 93

ttttgaaacc cttcaaaggc agagacttgt ccagcctaac ctgcctgctg ctcctagctc 60

ctgaggctca gggcccttgg cttctgtccg ctctgctcag ggccctccag cgtggccact 120

gctcagccat gctcctgctg ctcgtcccag tgctcgaggt gatttttacc ctgggaggaa 180

ccagagccca gtcggtgacc cagcttggca gccacgtctc tgtctctgaa ggagccctgg 240

ttctgctgag gtgcaactac tcatcgtctg ttccaccata tctcttctgg tatgtgcaat 300

accccaacca aggactccag cttctcctga agtacacatc agcggccacc ctggttaaag 360

gcatcaacgg ttttgaggct gaatttaaga agagtgaaac ctccttccac ctgacgaaac 420

cctcagccca tatgagcgac gcggctgagt acttctgtgc tgtgagtgat ctcgaaccga 480

acagcagtgc ttccaagata atctttggat cagggaccag actcagcatc cggccaaata 540

tccagaaccc tgaccctgcc gtgtaccagc tgagagactc taaatccagt gacaagtctg 600

tctgcctatt caccgatttt gattctcaaa caaatgtgtc acaaagtaag gattctgatg 660

tgtatatcac agacaaaact gtgctagaca tgaggtctat ggacttcaag agcaacagtg 720

ctgtggcctg gagcaacaaa tctgactttg catgtgcaaa cgccttcaac aacagcatta 780

ttccagaaga caccttcttc cccagcccag aaagttcctg tgatgtcaag ctggtcgaga 840

aaagctttga aacagatacg aacctaaact ttcaaaacct gtcagtgatt gggttccgaa 900

tcctcctcct gaaagtggcc gggtttaatc tgctcatgac gctgcggctg tggtccagct 960

gagatctgca agattgtaag acagcctgtg ctccctcgct ccttcctctg cattgcccct 1020

cttctccctc tccaaacaga gggaactctc ctacccccaa ggaggtgaaa gctgctacca 1080

cctctgtgcc cccccggtaa tgccaccaac tggatcctac ccgaatttat gattaagatt 1140

gctgaagagc tgccaaacac tgctgccacc ccctctgttc ccttattgct gcttgtcact 1200

gcctgacatt cacggcagag gcaaggctgc tgcagcctcc cctggctgtg cacattccct 1260

cctgctcccc agagactgcc tccgccatcc cacagatgat ggatcttcag tgggttctct 1320

tgggctctag gtcctggaga atgttgtgag gggtttattt ttttttaata gtgttcataa 1380

agaaatacat agtattcttc ttctcaagac gtggggggaa attatctcat tatcgaggcc 1440

ctgctatgct gtgtgtctgg gcgtgttgta tgtcctgctg ccgatgcctt cattaaaatg 1500

atttggaa 1508

<210> 94

<211> 177

<212> PRT

<213> 人工序列

<220>

<223> 人 TCR β恒定区 1

<400> 94

Glu Asp Leu Asn Lys Val Phe Pro Pro Glu Val Ala Val Phe Glu Pro

1 5 10 15

Ser Glu Ala Glu Ile Ser His Thr Gln Lys Ala Thr Leu Val Cys Leu

20 25 30

Ala Thr Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp Val Asn

35 40 45

Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Pro Leu Lys

50 55 60

Glu Gln Pro Ala Leu Asn Asp Ser Arg Tyr Cys Leu Ser Ser Arg Leu

65 70 75 80

Arg Val Ser Ala Thr Phe Trp Gln Asn Pro Arg Asn His Phe Arg Cys

85 90 95

Gln Val Gln Phe Tyr Gly Leu Ser Glu Asn Asp Glu Trp Thr Gln Asp

100 105 110

Arg Ala Lys Pro Val Thr Gln Ile Val Ser Ala Glu Ala Trp Gly Arg

115 120 125

Ala Asp Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu Ser

130 135 140

Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala

145 150 155 160

Val Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp

165 170 175

Phe

<210> 95

<211> 178

<212> PRT

<213> 人工序列

<220>

<223> 人 TCR β恒定区 2

<400> 95

Asp Leu Lys Asn Val Phe Pro Pro Glu Val Ala Val Phe Glu Pro Ser

1 5 10 15

Glu Ala Glu Ile Ser His Thr Gln Lys Ala Thr Leu Val Cys Leu Ala

20 25 30

Thr Gly Phe Tyr Pro Asp His Val Glu Leu Ser Trp Trp Val Asn Gly

35 40 45

Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Pro Leu Lys Glu

50 55 60

Gln Pro Ala Leu Asn Asp Ser Arg Tyr Cys Leu Ser Ser Arg Leu Arg

65 70 75 80

Val Ser Ala Thr Phe Trp Gln Asn Pro Arg Asn His Phe Arg Cys Gln

85 90 95

Val Gln Phe Tyr Gly Leu Ser Glu Asn Asp Glu Trp Thr Gln Asp Arg

100 105 110

Ala Lys Pro Val Thr Gln Ile Val Ser Ala Glu Ala Trp Gly Arg Ala

115 120 125

Asp Cys Gly Phe Thr Ser Glu Ser Tyr Gln Gln Gly Val Leu Ser Ala

130 135 140

Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val

145 150 155 160

Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp Ser

165 170 175

Arg Gly

<210> 96

<211> 179

<212> PRT

<213> 人工序列

<220>

<223> 人 TCR β恒定区

<400> 96

Glu Asp Leu Lys Asn Val Phe Pro Pro Glu Val Ala Val Phe Glu Pro

1 5 10 15

Ser Glu Ala Glu Ile Ser His Thr Gln Lys Ala Thr Leu Val Cys Leu

20 25 30

Ala Thr Gly Phe Tyr Pro Asp His Val Glu Leu Ser Trp Trp Val Asn

35 40 45

Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Pro Leu Lys

50 55 60

Glu Gln Pro Ala Leu Asn Asp Ser Arg Tyr Cys Leu Ser Ser Arg Leu

65 70 75 80

Arg Val Ser Ala Thr Phe Trp Gln Asn Pro Arg Asn His Phe Arg Cys

85 90 95

Gln Val Gln Phe Tyr Gly Leu Ser Glu Asn Asp Glu Trp Thr Gln Asp

100 105 110

Arg Ala Lys Pro Val Thr Gln Ile Val Ser Ala Glu Ala Trp Gly Arg

115 120 125

Ala Asp Cys Gly Phe Thr Ser Glu Ser Tyr Gln Gln Gly Val Leu Ser

130 135 140

Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala

145 150 155 160

Val Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp

165 170 175

Ser Arg Gly

<210> 97

<211> 1151

<212> DNA

<213> 人工序列

<220>

<223> 人 TCR β恒定区

<400> 97

ctggtctaga atattccaca tctgctctca ctctgccatg gactcctgga ccttctgctg 60

tgtgtccctt tgcatcctgg tagcgaagca tacagatgct ggagttatcc agtcaccccg 120

ccatgaggtg acagagatgg gacaagaagt gactctgaga tgtaaaccaa tttcaggcca 180

caactccctt ttctggtaca gacagaccat gatgcgggga ctggagttgc tcatttactt 240

taacaacaac gttccgatag atgattcagg gatgcccgag gatcgattct cagctaagat 300

gcctaatgca tcattctcca ctctgaagat ccagccctca gaacccaggg actcagctgt 360

gtacttctgt gccagcagtt tctcgacctg ttcggctaac tatggctaca ccttcggttc 420

ggggaccagg ttaaccgttg tagaggacct gaacaaggtg ttcccacccg aggtcgctgt 480

gtttgagcca tcagaagcag agatctccca cacccaaaag gccacactgg tgtgcctggc 540

cacaggcttc ttccccgacc acgtggagct gagctggtgg gtgaatggga aggaggtgca 600

cagtggggtc agcacagacc cgcagcccct caaggagcag cccgccctca atgactccag 660

atactgcctg agcagccgcc tgagggtctc ggccaccttc tggcagaacc cccgcaacca 720

cttccgctgt caagtccagt tctacgggct ctcggagaat gacgagtgga cccaggatag 780

ggccaaaccc gtcacccaga tcgtcagcgc cgaggcctgg ggtagagcag actgtggctt 840

tacctcggtg tcctaccagc aaggggtcct gtctgccacc atcctctatg agatcctgct 900

agggaaggcc accctgtatg ctgtgctggt cagcgccctt gtgttgatgg ccatggtcaa 960

gagaaaggat ttctgaaggc agccctggaa gtggagttag gagcttctaa cccgtcatgg 1020

ttcaatacac attcttcttt tgccagcgct tctgaagagc tgctctcacc tctctgcatc 1080

ccaatagata tccccctatg tgcatgcaca cctgcacact cacggctgaa atctccctaa 1140

cccaggggga c 1151

<210> 98

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 靶序列 1

<400> 98

tgacgttacc tcgtgcggcc 20

<210> 99

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 靶序列 2

<400> 99

cacgaagctc tccgatgtgt 20

<210> 100

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 靶序列 3

<400> 100

gcgtgacttc cacatgagcg 20

<210> 101

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 靶序列 4

<400> 101

ttggaactgg ccggctggcc 20

<210> 102

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 靶序列 5

<400> 102

gtggcatact ccgtctgctc 20

<210> 103

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 靶序列 6

<400> 103

gatgaggtgc ccattccgct 20

<210> 104

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 序列 1

<400> 104

ugacguuacc ucgugcggcc 20

<210> 105

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 序列 2

<400> 105

cacgaagcuc uccgaugugu 20

<210> 106

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 序列 3

<400> 106

gcgugacuuc cacaugagcg 20

<210> 107

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 序列 4

<400> 107

uuggaacugg ccggcuggcc 20

<210> 108

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 序列 5

<400> 108

guggcauacu ccgucugcuc 20

<210> 109

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> PDCD1 gRNA 序列 6

<400> 109

gaugaggugc ccauuccgcu 20

<210> 110

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> CD69 gRNA 靶序列 1

<400> 110

aactttctaa aacgatacgc 20

<210> 111

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> CD69 gRNA 靶序列 2

<400> 111

tttgacaggt tcaacgttac 20

<210> 112

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> CD69 gRNA 靶序列 3

<400> 112

catttctcaa cacgtcatga 20

<210> 113

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> CD69 gRNA 靶序列 4

<400> 113

cttcatgacg tgttgagaaa 20

<210> 114

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> CD69 gRNA 靶序列 5

<400> 114

gtgggccaat acaattgtcc 20

<210> 115

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> CD69 gRNA 靶序列 6

<400> 115

atggcattga gaatgtgtat 20

<210> 116

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> CD69 gRNA 序列 1

<400> 116

aacuuucuaa aacgauacgc 20

<210> 117

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> CD69 gRNA 序列 2

<400> 117

uuugacaggu ucaacguuac 20

<210> 118

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> CD69 gRNA 序列 3

<400> 118

cauuucucaa cacgucauga 20

<210> 119

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> CD69 gRNA 序列 4

<400> 119

cuucaugacg uguugagaaa 20

<210> 120

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> CD69 gRNA 序列 5

<400> 120

gugggccaau acaauugucc 20

<210> 121

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> CD69 gRNA 序列 6

<400> 121

auggcauuga gaauguguau 20

<210> 122

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 靶序列 1

<400> 122

cggggtagca gccgtacacc 20

<210> 123

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 靶序列 2

<400> 123

ccctgtatcc aagcccaata 20

<210> 124

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 靶序列 3

<400> 124

tgtccgaaca gacagcctga 20

<210> 125

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 靶序列 4

<400> 125

aaacgccaag tacatctgcc 20

<210> 126

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 靶序列 5

<400> 126

caccttggag tagtccagtt 20

<210> 127

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 靶序列 6

<400> 127

tttcgccgcc tcttgtccac 20

<210> 128

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 序列 1

<400> 128

cgggguagca gccguacacc 20

<210> 129

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 序列 2

<400> 129

cccuguaucc aagcccaaua 20

<210> 130

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 序列 3

<400> 130

uguccgaaca gacagccuga 20

<210> 131

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 序列 4

<400> 131

aaacgccaag uacaucugcc 20

<210> 132

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 序列 5

<400> 132

caccuuggag uaguccaguu 20

<210> 133

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 序列 6

<400> 133

uuucgccgcc ucuuguccac 20

<210> 134

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 靶序列 7

<400> 134

tcattgacaa gatcttcatg 20

<210> 135

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 靶序列 8

<400> 135

gcctgggaac acgtgtgca 19

<210> 136

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 靶序列 9

<400> 136

ccatattggg cttggataca 20

<210> 137

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 序列 7

<400> 137

caugaagauc uugucaauga 20

<210> 138

<211> 19

<212> RNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 序列 8

<400> 138

ugcacacgug uucccaggc 19

<210> 139

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> Nur77 (NR4A1) gRNA 序列 9

<400> 139

ccauauuggg cuuggauaca 20

<210> 140

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 靶序列1

<400> 140

cccacccaca gggatcaacg 20

<210> 141

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 靶序列 2

<400> 141

ttcgaagacc ttctcacatc 20

<210> 142

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 靶序列 3

<400> 142

agctctgggg cacagccgaa 20

<210> 143

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 靶序列 4

<400> 143

ccacttacag gcactcctcc 20

<210> 144

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 靶序列 5

<400> 144

cctggacacc cattccaggc 20

<210> 145

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 靶序列 6

<400> 145

tgccccccag ctctcaacgg 20

<210> 146

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 靶序列 7

<400> 146

tccagctggg cgaggctcct 20

<210> 147

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 靶序列 8

<400> 147

tttgggtgca gccctccagc 20

<210> 148

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 序列 1

<400> 148

cccacccaca gggaucaacg 20

<210> 149

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 序列 2

<400> 149

uucgaagacc uucucacauc 20

<210> 150

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 序列 3

<400> 150

agcucugggg cacagccgaa 20

<210> 151

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 序列 4

<400> 151

ccacuuacag gcacuccucc 20

<210> 152

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 序列 5

<400> 152

ccuggacacc cauuccaggc 20

<210> 153

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 序列 6

<400> 153

ugccccccag cucucaacgg 20

<210> 154

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 序列 7

<400> 154

uccagcuggg cgaggcuccu 20

<210> 155

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> FoxP3 gRNA 序列 8

<400> 155

uuugggugca gcccuccagc 20

<210> 156

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 靶序列 1

<400> 156

gtcgtaaacg tcctcagttg 20

<210> 157

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 靶序列 2

<400> 157

caaacataaa ctcgcctgat 20

<210> 158

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 靶序列 3

<400> 158

gattcagata gaactcggcc 20

<210> 159

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 靶序列 4

<400> 159

agacaagttc accccaccag 20

<210> 160

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 靶序列 5

<400> 160

agctgtgctg atgagcgctc 20

<210> 161

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 靶序列 6

<400> 161

aaagcaatgc agcagaacgc 20

<210> 162

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 序列 1

<400> 162

gucguaaacg uccucaguug 20

<210> 163

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 序列 2

<400> 163

caaacauaaa cucgccugau 20

<210> 164

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 序列 3

<400> 164

gauucagaua gaacucggcc 20

<210> 165

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 序列 4

<400> 165

agacaaguuc accccaccag 20

<210> 166

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 序列 5

<400> 166

agcugugcug augagcgcuc 20

<210> 167

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRA gRNA 序列 6

<400> 167

aaagcaaugc agcagaacgc 20

<210> 168

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 靶序列 1

<400> 168

gacggagcgg gtgcggttcc 20

<210> 169

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 靶序列 2

<400> 169

cacgtcgctg tcgaagcgca 20

<210> 170

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 靶序列 3

<400> 170

cactgtcagc gctgtcatgc 20

<210> 171

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 靶序列 4

<400> 171

cctgaagtag atgaacagcc 20

<210> 172

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 靶序列 5

<400> 172

gaaggatata cagtcacctt 20

<210> 173

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 靶序列 6

<400> 173

agctccccac tggctttgtc 20

<210> 174

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 靶序列 7

<400> 174

atccaggcag cattgaagtc agg 23

<210> 175

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 靶序列 8

<400> 175

ccaggcagca ttgaagtcag gtg 23

<210> 176

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 靶序列 9

<400> 176

ccttccagac cctggtgatg ctg 23

<210> 177

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 靶序列 10

<400> 177

ccagaccctg gtgatgctgg aaa 23

<210> 178

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 序列 1

<400> 178

gacggagcgg gugcgguucc 20

<210> 179

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 序列 2

<400> 179

cacgucgcug ucgaagcgca 20

<210> 180

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 序列 3

<400> 180

cacugucagc gcugucaugc 20

<210> 181

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 序列 4

<400> 181

ccugaaguag augaacagcc 20

<210> 182

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 序列 5

<400> 182

gaaggauaua cagucaccuu 20

<210> 183

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 序列 6

<400> 183

agcuccccac uggcuuuguc 20

<210> 184

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 序列 7

<400> 184

auccaggcag cauugaaguc agg 23

<210> 185

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 序列 8

<400> 185

ccaggcagca uugaagucag gug 23

<210> 186

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 序列 9

<400> 186

ccuuccagac ccuggugaug cug 23

<210> 187

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> HLA-DRB1 gRNA 序列 10

<400> 187

ccagacccug gugaugcugg aaa 23

<210> 188

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-10

<400> 188

ucucucagcu gguacacggc 20

<210> 189

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-110

<400> 189

uggauuuaga gucucucagc 20

<210> 190

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-116

<400> 190

acacggcagg gucaggguuc 20

<210> 191

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-16

<400> 191

gagaaucaaa aucggugaau 20

<210> 192

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-4

<400> 192

gcugguacac ggcaggguca 20

<210> 193

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRAC-49

<400> 193

cucagcuggu acacggc 17

<210> 194

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRAC-2

<400> 194

ugguacacgg caggguc 17

<210> 195

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRAC-30

<400> 195

gcuagacaug aggucua 17

<210> 196

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRAC-43

<400> 196

gucagauuug uugcucc 17

<210> 197

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRAC-23

<400> 197

ucagcuggua cacggca 17

<210> 198

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRAC-34

<400> 198

gcagacagac uugucac 17

<210> 199

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRAC-25

<400> 199

gguacacggc aggguca 17

<210> 200

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-128

<400> 200

cuucaagagc aacagugcug 20

<210> 201

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-105

<400> 201

agagcaacag ugcuguggcc 20

<210> 202

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-106

<400> 202

aaagucagau uuguugcucc 20

<210> 203

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-123

<400> 203

acaaaacugu gcuagacaug 20

<210> 204

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRAC-64

<400> 204

aaacugugcu agacaug 17

<210> 205

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-97

<400> 205

ugugcuagac augaggucua 20

<210> 206

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> TRAC-148

<400> 206

ggcuggggaa gaaggugucu uc 22

<210> 207

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> TRAC-147

<400> 207

gcuggggaag aaggugucuu c 21

<210> 208

<211> 18

<212> RNA

<213> 人工序列

<220>

<223> TRAC-234

<400> 208

ggggaagaag gugucuuc 18

<210> 209

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> TRAC-167

<400> 209

guuuugucug ugauauacac au 22

<210> 210

<211> 24

<212> RNA

<213> 人工序列

<220>

<223> TRAC-177

<400> 210

ggcagacaga cuugucacug gauu 24

<210> 211

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> TRAC-176

<400> 211

gcagacagac uugucacugg auu 23

<210> 212

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-257

<400> 212

gacagacuug ucacuggauu 20

<210> 213

<211> 24

<212> RNA

<213> 人工序列

<220>

<223> TRAC-233

<400> 213

gugaauaggc agacagacuu guca 24

<210> 214

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> TRAC-231

<400> 214

gaauaggcag acagacuugu ca 22

<210> 215

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> TRAC-163

<400> 215

gagucucuca gcugguacac gg 22

<210> 216

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRAC-241

<400> 216

gucucucagc ugguacacgg 20

<210> 217

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> TRAC-179

<400> 217

gguacacggc agggucaggg uu 22

<210> 218

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> TRAC-178

<400> 218

guacacggca gggucagggu u 21

<210> 219

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-40

<400> 219

cacccagauc gucagcgccg 20

<210> 220

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-52

<400> 220

caaacacagc gaccucgggu 20

<210> 221

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-25

<400> 221

ugacgagugg acccaggaua 20

<210> 222

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-35

<400> 222

ggcucucgga gaaugacgag 20

<210> 223

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-50

<400> 223

ggccucggcg cugacgaucu 20

<210> 224

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-39

<400> 224

gaaaaacgug uucccacccg 20

<210> 225

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-49

<400> 225

augacgagug gacccaggau 20

<210> 226

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-51

<400> 226

aguccaguuc uacgggcucu 20

<210> 227

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-26

<400> 227

cgcugucaag uccaguucua 20

<210> 228

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-47

<400> 228

aucgucagcg ccgaggccug 20

<210> 229

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-45

<400> 229

ucaaacacag cgaccucggg 20

<210> 230

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-34

<400> 230

cguagaacug gacuugacag 20

<210> 231

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-227

<400> 231

aggccucggc gcugacgauc 20

<210> 232

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-41

<400> 232

ugacagcgga agugguugcg 20

<210> 233

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-30

<400> 233

uugacagcgg aagugguugc 20

<210> 234

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-206

<400> 234

ucuccgagag cccguagaac 20

<210> 235

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-32

<400> 235

cgggugggaa cacguuuuuc 20

<210> 236

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-276

<400> 236

gacagguuug gcccuauccu 20

<210> 237

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-274

<400> 237

gaucgucagc gccgaggccu 20

<210> 238

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-230

<400> 238

ggcucaaaca cagcgaccuc 20

<210> 239

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-235

<400> 239

ugagggucuc ggccaccuuc 20

<210> 240

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-38

<400> 240

aggcuucuac cccgaccacg 20

<210> 241

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-223

<400> 241

ccgaccacgu ggagcugagc 20

<210> 242

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-221

<400> 242

ugacagguuu ggcccuaucc 20

<210> 243

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-48

<400> 243

cuugacagcg gaagugguug 20

<210> 244

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-216

<400> 244

agaucgucag cgccgaggcc 20

<210> 245

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-210

<400> 245

gcgcugacga ucugggugac 20

<210> 246

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-268

<400> 246

ugagggcggg cugcuccuug 20

<210> 247

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-193

<400> 247

guugcggggg uucugccaga 20

<210> 248

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-246

<400> 248

agcucagcuc cacguggucg 20

<210> 249

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-228

<400> 249

gcggcugcuc aggcaguauc 20

<210> 250

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-43

<400> 250

gcggggguuc ugccagaagg 20

<210> 251

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-272

<400> 251

uggcucaaac acagcgaccu 20

<210> 252

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-33

<400> 252

acuggacuug acagcggaag 20

<210> 253

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-44

<400> 253

gacagcggaa gugguugcgg 20

<210> 254

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-211

<400> 254

gcugucaagu ccaguucuac 20

<210> 255

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-253

<400> 255

guaucuggag ucauugaggg 20

<210> 256

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRBC-18

<400> 256

cucggcgcug acgaucu 17

<210> 257

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRBC-6

<400> 257

ccucggcgcu gacgauc 17

<210> 258

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRBC-85

<400> 258

ccgagagccc guagaac 17

<210> 259

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRBC-129

<400> 259

ccagaucguc agcgccg 17

<210> 260

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> TRBC-93

<400> 260

gaaugacgag uggaccc 17

<210> 261

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> TRBC-415

<400> 261

gggugacagg uuuggcccua uc 22

<210> 262

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> TRBC-414

<400> 262

ggugacaggu uuggcccuau c 21

<210> 263

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-310

<400> 263

gugacagguu uggcccuauc 20

<210> 264

<211> 18

<212> RNA

<213> 人工序列

<220>

<223> TRBC-308

<400> 264

gacagguuug gcccuauc 18

<210> 265

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> TRBC-401

<400> 265

gauacugccu gagcagccgc cu 22

<210> 266

<211> 24

<212> RNA

<213> 人工序列

<220>

<223> TRBC-468

<400> 266

gaccacgugg agcugagcug gugg 24

<210> 267

<211> 18

<212> RNA

<213> 人工序列

<220>

<223> TRBC-462

<400> 267

guggagcuga gcuggugg 18

<210> 268

<211> 24

<212> RNA

<213> 人工序列

<220>

<223> TRBC-424

<400> 268

gggcgggcug cuccuugagg ggcu 24

<210> 269

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> TRBC-423

<400> 269

ggcgggcugc uccuugaggg gcu 23

<210> 270

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> TRBC-422

<400> 270

gcgggcugcu ccuugagggg cu 22

<210> 271

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> TRBC-420

<400> 271

gggcugcucc uugaggggcu 20

<210> 272

<211> 19

<212> RNA

<213> 人工序列

<220>

<223> TRBC-419

<400> 272

ggcugcuccu ugaggggcu 19

<210> 273

<211> 18

<212> RNA

<213> 人工序列

<220>

<223> TRBC-418

<400> 273

gcugcuccuu gaggggcu 18

<210> 274

<211> 24

<212> RNA

<213> 人工序列

<220>

<223> TRBC-445

<400> 274

ggugaauggg aaggaggugc acag 24

<210> 275

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> TRBC-444

<400> 275

gugaauggga aggaggugca cag 23

<210> 276

<211> 21

<212> RNA

<213> 人工序列

<220>

<223> TRBC-442

<400> 276

gaaugggaag gaggugcaca g 21

<210> 277

<211> 149

<212> DNA

<213> 人工序列

<220>

<223> TRAC gRNA

<400> 277

agcgctctcg tacagagttg gcattataat acgactcact ataggggaga atcaaaatcg 60

gtgaatgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt atcaacttga 120

aaaagtggca ccgagtcggt gcttttttt 149

<210> 278

<211> 100

<212> RNA

<213> 人工序列

<220>

<223> TRAC gRNA

<400> 278

gagaaucaaa aucggugaau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 279

<211> 1344

<212> PRT

<213> 变形链球菌 (Streptococcus mutans)

<220>

<223> Cas9

<400> 279

Lys Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly

1 5 10 15

Trp Ala Val Val Thr Asp Asp Tyr Lys Val Pro Ala Lys Lys Met Lys

20 25 30

Val Leu Gly Asn Thr Asp Lys Ser His Ile Glu Lys Asn Leu Leu Gly

35 40 45

Ala Leu Leu Phe Asp Ser Gly Asn Thr Ala Glu Asp Arg Arg Leu Lys

50 55 60

Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu Tyr

65 70 75 80

Leu Gln Glu Ile Phe Ser Glu Glu Met Gly Lys Val Asp Asp Ser Phe

85 90 95

Phe His Arg Leu Glu Asp Ser Phe Leu Val Thr Glu Asp Lys Arg Gly

100 105 110

Glu Arg His Pro Ile Phe Gly Asn Leu Glu Glu Glu Val Lys Tyr His

115 120 125

Glu Asn Phe Pro Thr Ile Tyr His Leu Arg Gln Tyr Leu Ala Asp Asn

130 135 140

Pro Glu Lys Val Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His Ile

145 150 155 160

Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Lys Phe Asp Thr Arg

165 170 175

Asn Asn Asp Val Gln Arg Leu Phe Gln Glu Phe Leu Ala Val Tyr Asp

180 185 190

Asn Thr Phe Glu Asn Ser Ser Leu Gln Glu Gln Asn Val Gln Val Glu

195 200 205

Glu Ile Leu Thr Asp Lys Ile Ser Lys Ser Ala Lys Lys Asp Arg Val

210 215 220

Leu Lys Leu Phe Pro Asn Glu Lys Ser Asn Gly Arg Phe Ala Glu Phe

225 230 235 240

Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Lys Lys His Phe Glu

245 250 255

Leu Glu Glu Lys Ala Pro Leu Gln Phe Ser Lys Asp Thr Tyr Glu Glu

260 265 270

Glu Leu Glu Val Leu Leu Ala Gln Ile Gly Asp Asn Tyr Ala Glu Leu

275 280 285

Phe Leu Ser Ala Lys Lys Leu Tyr Asp Ser Ile Leu Leu Ser Gly Ile

290 295 300

Leu Thr Val Thr Asp Val Gly Thr Lys Ala Pro Leu Ser Ala Ser Met

305 310 315 320

Ile Gln Arg Tyr Asn Glu His Gln Met Asp Leu Ala Gln Leu Lys Gln

325 330 335

Phe Ile Arg Gln Lys Leu Ser Asp Lys Tyr Asn Glu Val Phe Ser Asp

340 345 350

Val Ser Lys Asp Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn Gln

355 360 365

Glu Ala Phe Tyr Lys Tyr Leu Lys Gly Leu Leu Asn Lys Ile Glu Gly

370 375 380

Ser Gly Tyr Phe Leu Asp Lys Ile Glu Arg Glu Asp Phe Leu Arg Lys

385 390 395 400

Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gln

405 410 415

Glu Met Arg Ala Ile Ile Arg Arg Gln Ala Glu Phe Tyr Pro Phe Leu

420 425 430

Ala Asp Asn Gln Asp Arg Ile Glu Lys Leu Leu Thr Phe Arg Ile Pro

435 440 445

Tyr Tyr Val Gly Pro Leu Ala Arg Gly Lys Ser Asp Phe Ala Trp Leu

450 455 460

Ser Arg Lys Ser Ala Asp Lys Ile Thr Pro Trp Asn Phe Asp Glu Ile

465 470 475 480

Val Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr Asn

485 490 495

Tyr Asp Leu Tyr Leu Pro Asn Gln Lys Val Leu Pro Lys His Ser Leu

500 505 510

Leu Tyr Glu Lys Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr

515 520 525

Lys Thr Glu Gln Gly Lys Thr Ala Phe Phe Asp Ala Asn Met Lys Gln

530 535 540

Glu Ile Phe Asp Gly Val Phe Lys Val Tyr Arg Lys Val Thr Lys Asp

545 550 555 560

Lys Leu Met Asp Phe Leu Glu Lys Glu Phe Asp Glu Phe Arg Ile Val

565 570 575

Asp Leu Thr Gly Leu Asp Lys Glu Asn Lys Val Phe Asn Ala Ser Tyr

580 585 590

Gly Thr Tyr His Asp Leu Cys Lys Ile Leu Asp Lys Asp Phe Leu Asp

595 600 605

Asn Ser Lys Asn Glu Lys Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Arg Lys Arg Leu Glu Asn Tyr Ser

625 630 635 640

Asp Leu Leu Thr Lys Glu Gln Val Lys Lys Leu Glu Arg Arg His Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Ala Glu Leu Ile His Gly Ile Arg Asn

660 665 670

Lys Glu Ser Arg Lys Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Asn

675 680 685

Ser Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Asp Ala Leu Ser Phe

690 695 700

Lys Glu Glu Ile Ala Lys Ala Gln Val Ile Gly Glu Thr Asp Asn Leu

705 710 715 720

Asn Gln Val Val Ser Asp Ile Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val Lys Ile Met Gly

740 745 750

His Gln Pro Glu Asn Ile Val Val Glu Met Ala Arg Glu Asn Gln Phe

755 760 765

Thr Asn Gln Gly Arg Arg Asn Ser Gln Gln Arg Leu Lys Gly Leu Thr

770 775 780

Asp Ser Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys Glu His Pro Val

785 790 795 800

Glu Asn Ser Gln Leu Gln Asn Asp Arg Leu Phe Leu Tyr Tyr Leu Gln

805 810 815

Asn Gly Arg Asp Met Tyr Thr Gly Glu Glu Leu Asp Ile Asp Tyr Leu

820 825 830

Ser Gln Tyr Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys Asp

835 840 845

Asn Ser Ile Asp Asn Arg Val Leu Thr Ser Ser Lys Glu Asn Arg Gly

850 855 860

Lys Ser Asp Asp Val Pro Ser Lys Asp Val Val Arg Lys Met Lys Ser

865 870 875 880

Tyr Trp Ser Lys Leu Leu Ser Ala Lys Leu Ile Thr Gln Arg Lys Phe

885 890 895

Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr Asp Asp Asp Lys

900 905 910

Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys

915 920 925

His Val Ala Arg Ile Leu Asp Glu Arg Phe Asn Thr Glu Thr Asp Glu

930 935 940

Asn Asn Lys Lys Ile Arg Gln Val Lys Ile Val Thr Leu Lys Ser Asn

945 950 955 960

Leu Val Ser Asn Phe Arg Lys Glu Phe Glu Leu Tyr Lys Val Arg Glu

965 970 975

Ile Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Ile

980 985 990

Gly Lys Ala Leu Leu Gly Val Tyr Pro Gln Leu Glu Pro Glu Phe Val

995 1000 1005

Tyr Gly Asp Tyr Pro His Phe His Gly His Lys Glu Asn Lys Ala Thr

1010 1015 1020

Ala Lys Lys Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Lys Asp

1025 1030 1035 1040

Asp Val Arg Thr Asp Lys Asn Gly Glu Ile Ile Trp Lys Lys Asp Glu

1045 1050 1055

His Ile Ser Asn Ile Lys Lys Val Leu Ser Tyr Pro Gln Val Asn Ile

1060 1065 1070

Val Lys Lys Val Glu Glu Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile

1075 1080 1085

Leu Pro Lys Gly Asn Ser Asp Lys Leu Ile Pro Arg Lys Thr Lys Lys

1090 1095 1100

Phe Tyr Trp Asp Thr Lys Lys Tyr Gly Gly Phe Asp Ser Pro Ile Val

1105 1110 1115 1120

Ala Tyr Ser Ile Leu Val Ile Ala Asp Ile Glu Lys Gly Lys Ser Lys

1125 1130 1135

Lys Leu Lys Thr Val Lys Ala Leu Val Gly Val Thr Ile Met Glu Lys

1140 1145 1150

Met Thr Phe Glu Arg Asp Pro Val Ala Phe Leu Glu Arg Lys Gly Tyr

1155 1160 1165

Arg Asn Val Gln Glu Glu Asn Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1170 1175 1180

Phe Lys Leu Glu Asn Gly Arg Lys Arg Leu Leu Ala Ser Ala Arg Glu

1185 1190 1195 1200

Leu Gln Lys Gly Asn Glu Ile Val Leu Pro Asn His Leu Gly Thr Leu

1205 1210 1215

Leu Tyr His Ala Lys Asn Ile His Lys Val Asp Glu Pro Lys His Leu

1220 1225 1230

Asp Tyr Val Asp Lys His Lys Asp Glu Phe Lys Glu Leu Leu Asp Val

1235 1240 1245

Val Ser Asn Phe Ser Lys Lys Tyr Thr Leu Ala Glu Gly Asn Leu Glu

1250 1255 1260

Lys Ile Lys Glu Leu Tyr Ala Gln Asn Asn Gly Glu Asp Leu Lys Glu

1265 1270 1275 1280

Leu Ala Ser Ser Phe Ile Asn Leu Leu Thr Phe Thr Ala Ile Gly Ala

1285 1290 1295

Pro Ala Thr Phe Lys Phe Phe Asp Lys Asn Ile Asp Arg Lys Arg Tyr

1300 1305 1310

Thr Ser Thr Thr Glu Ile Leu Asn Ala Thr Leu Ile His Gln Ser Ile

1315 1320 1325

Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Asn Lys Leu Gly Gly Asp

1330 1335 1340

<210> 280

<211> 1367

<212> PRT

<213> 酿脓链球菌 (Streptococcus pyogenes)

<220>

<223> Cas9

<400> 280

Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly

1 5 10 15

Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys

20 25 30

Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly

35 40 45

Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys

50 55 60

Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr

65 70 75 80

Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe

85 90 95

Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His

100 105 110

Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His

115 120 125

Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser

130 135 140

Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met

145 150 155 160

Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp

165 170 175

Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn

180 185 190

Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys

195 200 205

Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu

210 215 220

Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu

225 230 235 240

Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp

245 250 255

Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp

260 265 270

Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu

275 280 285

Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile

290 295 300

Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met

305 310 315 320

Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala

325 330 335

Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp

340 345 350

Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln

355 360 365

Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly

370 375 380

Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys

385 390 395 400

Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly

405 410 415

Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu

420 425 430

Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro

435 440 445

Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met

450 455 460

Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val

465 470 475 480

Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn

485 490 495

Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu

500 505 510

Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr

515 520 525

Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys

530 535 540

Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val

545 550 555 560

Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser

565 570 575

Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr

580 585 590

Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn

595 600 605

Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu

610 615 620

Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His

625 630 635 640

Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr

645 650 655

Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys

660 665 670

Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala

675 680 685

Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys

690 695 700

Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His

705 710 715 720

Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile

725 730 735

Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg

740 745 750

His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr

755 760 765

Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu

770 775 780

Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val

785 790 795 800

Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln

805 810 815

Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu

820 825 830

Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp

835 840 845

Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly

850 855 860

Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn

865 870 875 880

Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe

885 890 895

Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys

900 905 910

Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys

915 920 925

His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

930 935 940

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys

945 950 955 960

Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu

965 970 975

Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val

980 985 990

Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val

995 1000 1005

Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser

1010 1015 1020

Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn

1025 1030 1035 1040

Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile

1045 1050 1055

Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val

1060 1065 1070

Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met

1075 1080 1085

Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe

1090 1095 1100

Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala

1105 1110 1115 1120

Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro

1125 1130 1135

Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys

1140 1145 1150

Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met

1155 1160 1165

Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys

1170 1175 1180

Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr

1185 1190 1195 1200

Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala

1205 1210 1215

Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro

1235 1240 1245

Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr

1250 1255 1260

Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile

1265 1270 1275 1280

Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His

1285 1290 1295

Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe

1300 1305 1310

Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr

1315 1320 1325

Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala

1330 1335 1340

Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp

1345 1350 1355 1360

Leu Ser Gln Leu Gly Gly Asp

1365

<210> 281

<211> 1387

<212> PRT

<213> 嗜热链球菌 (Streptococcus thermophilus)

<220>

<223> Cas9

<400> 281

Thr Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly

1 5 10 15

Trp Ala Val Thr Thr Asp Asn Tyr Lys Val Pro Ser Lys Lys Met Lys

20 25 30

Val Leu Gly Asn Thr Ser Lys Lys Tyr Ile Lys Lys Asn Leu Leu Gly

35 40 45

Val Leu Leu Phe Asp Ser Gly Ile Thr Ala Glu Gly Arg Arg Leu Lys

50 55 60

Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu Tyr

65 70 75 80

Leu Gln Glu Ile Phe Ser Thr Glu Met Ala Thr Leu Asp Asp Ala Phe

85 90 95

Phe Gln Arg Leu Asp Asp Ser Phe Leu Val Pro Asp Asp Lys Arg Asp

100 105 110

Ser Lys Tyr Pro Ile Phe Gly Asn Leu Val Glu Glu Lys Ala Tyr His

115 120 125

Asp Glu Phe Pro Thr Ile Tyr His Leu Arg Lys Tyr Leu Ala Asp Ser

130 135 140

Thr Lys Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His Met

145 150 155 160

Ile Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Glu Phe Asn Ser Lys

165 170 175

Asn Asn Asp Ile Gln Lys Asn Phe Gln Asp Phe Leu Asp Thr Tyr Asn

180 185 190

Ala Ile Phe Glu Ser Asp Leu Ser Leu Glu Asn Ser Lys Gln Leu Glu

195 200 205

Glu Ile Val Lys Asp Lys Ile Ser Lys Leu Glu Lys Lys Asp Arg Ile

210 215 220

Leu Lys Leu Phe Pro Gly Glu Lys Asn Ser Gly Ile Phe Ser Glu Phe

225 230 235 240

Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Arg Lys Cys Phe Asn

245 250 255

Leu Asp Glu Lys Ala Ser Leu His Phe Ser Lys Glu Ser Tyr Asp Glu

260 265 270

Asp Leu Glu Thr Leu Leu Gly Tyr Ile Gly Asp Asp Tyr Ser Asp Val

275 280 285

Phe Leu Lys Ala Lys Lys Leu Tyr Asp Ala Ile Leu Leu Ser Gly Phe

290 295 300

Leu Thr Val Thr Asp Asn Glu Thr Glu Ala Pro Leu Ser Ser Ala Met

305 310 315 320

Ile Lys Arg Tyr Asn Glu His Lys Glu Asp Leu Ala Leu Leu Lys Glu

325 330 335

Tyr Ile Arg Asn Ile Ser Leu Lys Thr Tyr Asn Glu Val Phe Lys Asp

340 345 350

Asp Thr Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn Gln

355 360 365

Glu Asp Phe Tyr Val Tyr Leu Lys Lys Leu Leu Ala Glu Phe Glu Gly

370 375 380

Ala Asp Tyr Phe Leu Glu Lys Ile Asp Arg Glu Asp Phe Leu Arg Lys

385 390 395 400

Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro Tyr Gln Ile His Leu Gln

405 410 415

Glu Met Arg Ala Ile Leu Asp Lys Gln Ala Lys Phe Tyr Pro Phe Leu

420 425 430

Ala Lys Asn Lys Glu Arg Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro

435 440 445

Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Asp Phe Ala Trp Ser

450 455 460

Ile Arg Lys Arg Asn Glu Lys Ile Thr Pro Trp Asn Phe Glu Asp Val

465 470 475 480

Ile Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr Ser

485 490 495

Phe Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser Leu

500 505 510

Leu Tyr Glu Thr Phe Asn Val Tyr Asn Glu Leu Thr Lys Val Arg Phe

515 520 525

Ile Ala Glu Ser Met Arg Asp Tyr Gln Phe Leu Asp Ser Lys Gln Lys

530 535 540

Lys Asp Ile Val Arg Leu Tyr Phe Lys Asp Lys Arg Lys Val Thr Asp

545 550 555 560

Lys Asp Ile Ile Glu Tyr Leu His Ala Ile Tyr Gly Tyr Asp Gly Ile

565 570 575

Glu Leu Lys Gly Ile Glu Lys Gln Phe Asn Ser Ser Leu Ser Thr Tyr

580 585 590

His Asp Leu Leu Asn Ile Ile Asn Asp Lys Glu Phe Leu Asp Asp Ser

595 600 605

Ser Asn Glu Ala Ile Ile Glu Glu Ile Ile His Thr Leu Thr Ile Phe

610 615 620

Glu Asp Arg Glu Met Ile Lys Gln Arg Leu Ser Lys Phe Glu Asn Ile

625 630 635 640

Phe Asp Lys Ser Val Leu Lys Lys Leu Ser Arg Arg His Tyr Thr Gly

645 650 655

Trp Gly Lys Leu Ser Ala Lys Leu Ile Asn Gly Ile Arg Asp Glu Lys

660 665 670

Ser Gly Asn Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Ile Ser Asn

675 680 685

Arg Asn Phe Met Gln Leu Ile His Asp Asp Ala Leu Ser Phe Lys Lys

690 695 700

Lys Ile Gln Lys Ala Gln Ile Ile Gly Asp Glu Asp Lys Gly Asn Ile

705 710 715 720

Lys Glu Val Val Lys Ser Leu Pro Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Ser Ile Lys Ile Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Gly Arg Lys Pro Glu Ser Ile Val Val Glu Met Ala Arg Glu Asn Gln

755 760 765

Tyr Thr Asn Gln Gly Lys Ser Asn Ser Gln Gln Arg Leu Lys Arg Leu

770 775 780

Glu Lys Ser Leu Lys Glu Leu Gly Ser Lys Ile Leu Lys Glu Asn Ile

785 790 795 800

Pro Ala Lys Leu Ser Lys Ile Asp Asn Asn Ala Leu Gln Asn Asp Arg

805 810 815

Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly Asp

820 825 830

Asp Leu Asp Ile Asp Arg Leu Ser Asn Tyr Asp Ile Asp His Ile Ile

835 840 845

Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile Asp Asn Lys Val Leu Val

850 855 860

Ser Ser Ala Ser Asn Arg Gly Lys Ser Asp Asp Val Pro Ser Leu Glu

865 870 875 880

Val Val Lys Lys Arg Lys Thr Phe Trp Tyr Gln Leu Leu Lys Ser Lys

885 890 895

Leu Ile Ser Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly

900 905 910

Gly Leu Ser Pro Glu Asp Lys Ala Gly Phe Ile Gln Arg Gln Leu Val

915 920 925

Glu Thr Arg Gln Ile Thr Lys His Val Ala Arg Leu Leu Asp Glu Lys

930 935 940

Phe Asn Asn Lys Lys Asp Glu Asn Asn Arg Ala Val Arg Thr Val Lys

945 950 955 960

Ile Ile Thr Leu Lys Ser Thr Leu Val Ser Gln Phe Arg Lys Asp Phe

965 970 975

Glu Leu Tyr Lys Val Arg Glu Ile Asn Asp Phe His His Ala His Asp

980 985 990

Ala Tyr Leu Asn Ala Val Val Ala Ser Ala Leu Leu Lys Lys Tyr Pro

995 1000 1005

Lys Leu Glu Pro Glu Phe Val Tyr Gly Asp Tyr Pro Lys Tyr Asn Ser

1010 1015 1020

Phe Arg Glu Arg Lys Ser Ala Thr Glu Lys Val Tyr Phe Tyr Ser Asn

1025 1030 1035 1040

Ile Met Asn Ile Phe Lys Lys Ser Ile Ser Leu Ala Asp Gly Arg Val

1045 1050 1055

Ile Glu Arg Pro Leu Ile Glu Val Asn Glu Glu Thr Gly Glu Ser Val

1060 1065 1070

Trp Asn Lys Glu Ser Asp Leu Ala Thr Val Arg Arg Val Leu Ser Tyr

1075 1080 1085

Pro Gln Val Asn Val Val Lys Lys Val Glu Glu Gln Asn His Gly Leu

1090 1095 1100

Asp Arg Gly Lys Pro Lys Gly Leu Phe Asn Ala Asn Leu Ser Ser Lys

1105 1110 1115 1120

Pro Lys Pro Asn Ser Asn Glu Asn Leu Val Gly Ala Lys Glu Tyr Leu

1125 1130 1135

Asp Pro Lys Lys Tyr Gly Gly Tyr Ala Gly Ile Ser Asn Ser Phe Thr

1140 1145 1150

Val Leu Val Lys Gly Thr Ile Glu Lys Gly Ala Lys Lys Lys Ile Thr

1155 1160 1165

Asn Val Leu Glu Phe Gln Gly Ile Ser Ile Leu Asp Arg Ile Asn Tyr

1170 1175 1180

Arg Lys Asp Lys Leu Asn Phe Leu Leu Glu Lys Gly Tyr Lys Asp Ile

1185 1190 1195 1200

Glu Leu Ile Ile Glu Leu Pro Lys Tyr Ser Leu Phe Glu Leu Ser Asp

1205 1210 1215

Gly Ser Arg Arg Met Leu Ala Ser Ile Leu Ser Thr Asn Asn Lys Arg

1220 1225 1230

Gly Glu Ile His Lys Gly Asn Gln Ile Phe Leu Ser Gln Lys Phe Val

1235 1240 1245

Lys Leu Leu Tyr His Ala Lys Arg Ile Ser Asn Thr Ile Asn Glu Asn

1250 1255 1260

His Arg Lys Tyr Val Glu Asn His Lys Lys Glu Phe Glu Glu Leu Phe

1265 1270 1275 1280

Tyr Tyr Ile Leu Glu Phe Asn Glu Asn Tyr Val Gly Ala Lys Lys Asn

1285 1290 1295

Gly Lys Leu Leu Asn Ser Ala Phe Gln Ser Trp Gln Asn His Ser Ile

1300 1305 1310

Asp Glu Leu Cys Ser Ser Phe Ile Gly Pro Thr Gly Ser Glu Arg Lys

1315 1320 1325

Gly Leu Phe Glu Leu Thr Ser Arg Gly Ser Ala Ala Asp Phe Glu Phe

1330 1335 1340

Leu Gly Val Lys Ile Pro Arg Tyr Arg Asp Tyr Thr Pro Ser Ser Leu

1345 1350 1355 1360

Leu Lys Asp Ala Thr Leu Ile His Gln Ser Val Thr Gly Leu Tyr Glu

1365 1370 1375

Thr Arg Ile Asp Leu Ala Lys Leu Gly Glu Gly

1380 1385

<210> 282

<211> 1333

<212> PRT

<213> 无害李斯特菌 (Listeria innocua)

<220>

<223> Cas9

<400> 282

Lys Lys Pro Tyr Thr Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly

1 5 10 15

Trp Ala Val Leu Thr Asp Gln Tyr Asp Leu Val Lys Arg Lys Met Lys

20 25 30

Ile Ala Gly Asp Ser Glu Lys Lys Gln Ile Lys Lys Asn Phe Trp Gly

35 40 45

Val Arg Leu Phe Asp Glu Gly Gln Thr Ala Ala Asp Arg Arg Met Ala

50 55 60

Arg Thr Ala Arg Arg Arg Ile Glu Arg Arg Arg Asn Arg Ile Ser Tyr

65 70 75 80

Leu Gln Gly Ile Phe Ala Glu Glu Met Ser Lys Thr Asp Ala Asn Phe

85 90 95

Phe Cys Arg Leu Ser Asp Ser Phe Tyr Val Asp Asn Glu Lys Arg Asn

100 105 110

Ser Arg His Pro Phe Phe Ala Thr Ile Glu Glu Glu Val Glu Tyr His

115 120 125

Lys Asn Tyr Pro Thr Ile Tyr His Leu Arg Glu Glu Leu Val Asn Ser

130 135 140

Ser Glu Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His Ile

145 150 155 160

Ile Lys Tyr Arg Gly Asn Phe Leu Ile Glu Gly Ala Leu Asp Thr Gln

165 170 175

Asn Thr Ser Val Asp Gly Ile Tyr Lys Gln Phe Ile Gln Thr Tyr Asn

180 185 190

Gln Val Phe Ala Ser Gly Ile Glu Asp Gly Ser Leu Lys Lys Leu Glu

195 200 205

Asp Asn Lys Asp Val Ala Lys Ile Leu Val Glu Lys Val Thr Arg Lys

210 215 220

Glu Lys Leu Glu Arg Ile Leu Lys Leu Tyr Pro Gly Glu Lys Ser Ala

225 230 235 240

Gly Met Phe Ala Gln Phe Ile Ser Leu Ile Val Gly Ser Lys Gly Asn

245 250 255

Phe Gln Lys Pro Phe Asp Leu Ile Glu Lys Ser Asp Ile Glu Cys Ala

260 265 270

Lys Asp Ser Tyr Glu Glu Asp Leu Glu Ser Leu Leu Ala Leu Ile Gly

275 280 285

Asp Glu Tyr Ala Glu Leu Phe Val Ala Ala Lys Asn Ala Tyr Ser Ala

290 295 300

Val Val Leu Ser Ser Ile Ile Thr Val Ala Glu Thr Glu Thr Asn Ala

305 310 315 320

Lys Leu Ser Ala Ser Met Ile Glu Arg Phe Asp Thr His Glu Glu Asp

325 330 335

Leu Gly Glu Leu Lys Ala Phe Ile Lys Leu His Leu Pro Lys His Tyr

340 345 350

Glu Glu Ile Phe Ser Asn Thr Glu Lys His Gly Tyr Ala Gly Tyr Ile

355 360 365

Asp Gly Lys Thr Lys Gln Ala Asp Phe Tyr Lys Tyr Met Lys Met Thr

370 375 380

Leu Glu Asn Ile Glu Gly Ala Asp Tyr Phe Ile Ala Lys Ile Glu Lys

385 390 395 400

Glu Asn Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ala Ile Pro

405 410 415

His Gln Leu His Leu Glu Glu Leu Glu Ala Ile Leu His Gln Gln Ala

420 425 430

Lys Tyr Tyr Pro Phe Leu Lys Glu Asn Tyr Asp Lys Ile Lys Ser Leu

435 440 445

Val Thr Phe Arg Ile Pro Tyr Phe Val Gly Pro Leu Ala Asn Gly Gln

450 455 460

Ser Glu Phe Ala Trp Leu Thr Arg Lys Ala Asp Gly Glu Ile Arg Pro

465 470 475 480

Trp Asn Ile Glu Glu Lys Val Asp Phe Gly Lys Ser Ala Val Asp Phe

485 490 495

Ile Glu Lys Met Thr Asn Lys Asp Thr Tyr Leu Pro Lys Glu Asn Val

500 505 510

Leu Pro Lys His Ser Leu Cys Tyr Gln Lys Tyr Leu Val Tyr Asn Glu

515 520 525

Leu Thr Lys Val Arg Tyr Ile Asn Asp Gln Gly Lys Thr Ser Tyr Phe

530 535 540

Ser Gly Gln Glu Lys Glu Gln Ile Phe Asn Asp Leu Phe Lys Gln Lys

545 550 555 560

Arg Lys Val Lys Lys Lys Asp Leu Glu Leu Phe Leu Arg Asn Met Ser

565 570 575

His Val Glu Ser Pro Thr Ile Glu Gly Leu Glu Asp Ser Phe Asn Ser

580 585 590

Ser Tyr Ser Thr Tyr His Asp Leu Leu Lys Val Gly Ile Lys Gln Glu

595 600 605

Ile Leu Asp Asn Pro Val Asn Thr Glu Met Leu Glu Asn Ile Val Lys

610 615 620

Ile Leu Thr Val Phe Glu Asp Lys Arg Met Ile Lys Glu Gln Leu Gln

625 630 635 640

Gln Phe Ser Asp Val Leu Asp Gly Val Val Leu Lys Lys Leu Glu Arg

645 650 655

Arg His Tyr Thr Gly Trp Gly Arg Leu Ser Ala Lys Leu Leu Met Gly

660 665 670

Ile Arg Asp Lys Gln Ser His Leu Thr Ile Leu Asp Tyr Leu Met Asn

675 680 685

Asp Asp Gly Leu Asn Arg Asn Leu Met Gln Leu Ile Asn Asp Ser Asn

690 695 700

Leu Ser Phe Lys Ser Ile Ile Glu Lys Glu Gln Val Thr Thr Ala Asp

705 710 715 720

Lys Asp Ile Gln Ser Ile Val Ala Asp Leu Ala Gly Ser Pro Ala Ile

725 730 735

Lys Lys Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val Ser

740 745 750

Val Met Gly Tyr Pro Pro Gln Thr Ile Val Val Glu Met Ala Arg Glu

755 760 765

Asn Gln Thr Thr Gly Lys Gly Lys Asn Asn Ser Arg Pro Arg Tyr Lys

770 775 780

Ser Leu Glu Lys Ala Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys Glu

785 790 795 800

His Pro Thr Asp Asn Gln Glu Leu Arg Asn Asn Arg Leu Tyr Leu Tyr

805 810 815

Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly Gln Asp Leu Asp Ile

820 825 830

His Asn Leu Ser Asn Tyr Asp Ile Asp His Ile Val Pro Gln Ser Phe

835 840 845

Ile Thr Asp Asn Ser Ile Asp Asn Leu Val Leu Thr Ser Ser Ala Gly

850 855 860

Asn Arg Glu Lys Gly Asp Asp Val Pro Pro Leu Glu Ile Val Arg Lys

865 870 875 880

Arg Lys Val Phe Trp Glu Lys Leu Tyr Gln Gly Asn Leu Met Ser Lys

885 890 895

Arg Lys Phe Asp Tyr Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr Glu

900 905 910

Ala Asp Lys Ala Arg Phe Ile His Arg Gln Leu Val Glu Thr Arg Gln

915 920 925

Ile Thr Lys Asn Val Ala Asn Ile Leu His Gln Arg Phe Asn Tyr Glu

930 935 940

Lys Asp Asp His Gly Asn Thr Met Lys Gln Val Arg Ile Val Thr Leu

945 950 955 960

Lys Ser Ala Leu Val Ser Gln Phe Arg Lys Gln Phe Gln Leu Tyr Lys

965 970 975

Val Arg Asp Val Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn

980 985 990

Gly Val Val Ala Asn Thr Leu Leu Lys Val Tyr Pro Gln Leu Glu Pro

995 1000 1005

Glu Phe Val Tyr Gly Asp Tyr His Gln Phe Asp Trp Phe Lys Ala Asn

1010 1015 1020

Lys Ala Thr Ala Lys Lys Gln Phe Tyr Thr Asn Ile Met Leu Phe Phe

1025 1030 1035 1040

Ala Gln Lys Asp Arg Ile Ile Asp Glu Asn Gly Glu Ile Leu Trp Asp

1045 1050 1055

Lys Lys Tyr Leu Asp Thr Val Lys Lys Val Met Ser Tyr Arg Gln Met

1060 1065 1070

Asn Ile Val Lys Lys Thr Glu Ile Gln Lys Gly Glu Phe Ser Lys Ala

1075 1080 1085

Thr Ile Lys Pro Lys Gly Asn Ser Ser Lys Leu Ile Pro Arg Lys Thr

1090 1095 1100

Asn Trp Asp Pro Met Lys Tyr Gly Gly Leu Asp Ser Pro Asn Met Ala

1105 1110 1115 1120

Tyr Ala Val Val Ile Glu Tyr Ala Lys Gly Lys Asn Lys Leu Val Phe

1125 1130 1135

Glu Lys Lys Ile Ile Arg Val Thr Ile Met Glu Arg Lys Ala Phe Glu

1140 1145 1150

Lys Asp Glu Lys Ala Phe Leu Glu Glu Gln Gly Tyr Arg Gln Pro Lys

1155 1160 1165

Val Leu Ala Lys Leu Pro Lys Tyr Thr Leu Tyr Glu Cys Glu Glu Gly

1170 1175 1180

Arg Arg Arg Met Leu Ala Ser Ala Asn Glu Ala Gln Lys Gly Asn Gln

1185 1190 1195 1200

Gln Val Leu Pro Asn His Leu Val Thr Leu Leu His His Ala Ala Asn

1205 1210 1215

Cys Glu Val Ser Asp Gly Lys Ser Leu Asp Tyr Ile Glu Ser Asn Arg

1220 1225 1230

Glu Met Phe Ala Glu Leu Leu Ala His Val Ser Glu Phe Ala Lys Arg

1235 1240 1245

Tyr Thr Leu Ala Glu Ala Asn Leu Asn Lys Ile Asn Gln Leu Phe Glu

1250 1255 1260

Gln Asn Lys Glu Gly Asp Ile Lys Ala Ile Ala Gln Ser Phe Val Asp

1265 1270 1275 1280

Leu Met Ala Phe Asn Ala Met Gly Ala Pro Ala Ser Phe Lys Phe Phe

1285 1290 1295

Glu Thr Thr Ile Glu Arg Lys Arg Tyr Asn Asn Leu Lys Glu Leu Leu

1300 1305 1310

Asn Ser Thr Ile Ile Tyr Gln Ser Ile Thr Gly Leu Tyr Glu Ser Arg

1315 1320 1325

Lys Arg Leu Asp Asp

1330

<210> 283

<211> 1082

<212> PRT

<213> 脑膜炎奈瑟氏菌 (Neisseria meningitidis)

<220>

<223> Cas9

<400> 283

Met Ala Ala Phe Lys Pro Asn Ser Ile Asn Tyr Ile Leu Gly Leu Asp

1 5 10 15

Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Glu

20 25 30

Glu Asn Pro Ile Arg Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg

35 40 45

Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu

50 55 60

Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu

65 70 75 80

Arg Thr Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asn

85 90 95

Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln

100 105 110

Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser

115 120 125

Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg

130 135 140

Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys

145 150 155 160

Gly Val Ala Gly Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr

165 170 175

Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile

180 185 190

Arg Asn Gln Arg Ser Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu

195 200 205

Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn

210 215 220

Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met

225 230 235 240

Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly

245 250 255

His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr

260 265 270

Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile

275 280 285

Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr

290 295 300

Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala

305 310 315 320

Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg

325 330 335

Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala

340 345 350

Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys

355 360 365

Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr

370 375 380

Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys

385 390 395 400

Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser

405 410 415

Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val

420 425 430

Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile

435 440 445

Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu

450 455 460

Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala

465 470 475 480

Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly

485 490 495

Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser

500 505 510

Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys

515 520 525

Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe

530 535 540

Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu

545 550 555 560

Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly

565 570 575

Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe

580 585 590

Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly

595 600 605

Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn

610 615 620

Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu

625 630 635 640

Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys

645 650 655

Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr

660 665 670

Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr

675 680 685

Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn

690 695 700

Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp

705 710 715 720

Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala

725 730 735

Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala

740 745 750

Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln

755 760 765

Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met

770 775 780

Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala

785 790 795 800

Asp Thr Leu Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser

805 810 815

Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg

820 825 830

Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys

835 840 845

Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu

850 855 860

Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg

865 870 875 880

Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys

885 890 895

Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys

900 905 910

Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val

915 920 925

Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn

930 935 940

Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr

945 950 955 960

Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp

965 970 975

Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp

980 985 990

Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu

995 1000 1005

Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys His

1010 1015 1020

Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp His Lys

1025 1030 1035 1040

Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys Thr Ala Leu

1045 1050 1055

Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys Glu Ile Arg Pro

1060 1065 1070

Cys Arg Leu Lys Lys Arg Pro Pro Val Arg

1075 1080

<210> 284

<211> 1368

<212> PRT

<213> 酿脓链球菌 (Streptococcus pyogenes)

<220>

<223> Cas9

<400> 284

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys

1010 1015 1020

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser

1025 1030 1035 1040

Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1045 1050 1055

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile

1060 1065 1070

Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser

1075 1080 1085

Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1090 1095 1100

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile

1105 1110 1115 1120

Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser

1125 1130 1135

Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly

1140 1145 1150

Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile

1155 1160 1165

Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala

1170 1175 1180

Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1185 1190 1195 1200

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser

1205 1210 1215

Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr

1220 1225 1230

Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1250 1255 1260

Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val

1265 1270 1275 1280

Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys

1285 1290 1295

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu

1300 1305 1310

Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp

1315 1320 1325

Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1330 1335 1340

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile

1345 1350 1355 1360

Asp Leu Ser Gln Leu Gly Gly Asp

1365

<210> 285

<211> 1368

<212> PRT

<213> 酿脓链球菌 (S. pyogenes)

<220>

<223> Cas9

<400> 285

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys

1010 1015 1020

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser

1025 1030 1035 1040

Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1045 1050 1055

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile

1060 1065 1070

Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser

1075 1080 1085

Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1090 1095 1100

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile

1105 1110 1115 1120

Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser

1125 1130 1135

Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly

1140 1145 1150

Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile

1155 1160 1165

Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala

1170 1175 1180

Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1185 1190 1195 1200

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser

1205 1210 1215

Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr

1220 1225 1230

Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1250 1255 1260

Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val

1265 1270 1275 1280

Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys

1285 1290 1295

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu

1300 1305 1310

Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp

1315 1320 1325

Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1330 1335 1340

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile

1345 1350 1355 1360

Asp Leu Ser Gln Leu Gly Gly Asp

1365

<210> 286

<211> 1082

<212> PRT

<213> 脑膜炎奈瑟氏菌 (N. meningitidis)

<220>

<223> Cas9

<400> 286

Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp

1 5 10 15

Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp

20 25 30

Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg

35 40 45

Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu

50 55 60

Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu

65 70 75 80

Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp

85 90 95

Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln

100 105 110

Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser

115 120 125

Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg

130 135 140

Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys

145 150 155 160

Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr

165 170 175

Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile

180 185 190

Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu

195 200 205

Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn

210 215 220

Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met

225 230 235 240

Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly

245 250 255

His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr

260 265 270

Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile

275 280 285

Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr

290 295 300

Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala

305 310 315 320

Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg

325 330 335

Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala

340 345 350

Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys

355 360 365

Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr

370 375 380

Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys

385 390 395 400

Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser

405 410 415

Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val

420 425 430

Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile

435 440 445

Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu

450 455 460

Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala

465 470 475 480

Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly

485 490 495

Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser

500 505 510

Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys

515 520 525

Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe

530 535 540

Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu

545 550 555 560

Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly

565 570 575

Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe

580 585 590

Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly

595 600 605

Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn

610 615 620

Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu

625 630 635 640

Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys

645 650 655

Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr

660 665 670

Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr

675 680 685

Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn

690 695 700

Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp

705 710 715 720

Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala

725 730 735

Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala

740 745 750

Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln

755 760 765

Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met

770 775 780

Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala

785 790 795 800

Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser

805 810 815

Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg

820 825 830

Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys

835 840 845

Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu

850 855 860

Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg

865 870 875 880

Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys

885 890 895

Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys

900 905 910

Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val

915 920 925

Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn

930 935 940

Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr

945 950 955 960

Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp

965 970 975

Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp

980 985 990

Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu

995 1000 1005

Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys His

1010 1015 1020

Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp His Lys

1025 1030 1035 1040

Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys Thr Ala Leu

1045 1050 1055

Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys Glu Ile Arg Pro

1060 1065 1070

Cys Arg Leu Lys Lys Arg Pro Pro Val Arg

1075 1080

<210> 287

<211> 1053

<212> PRT

<213> 金黄色葡萄球菌 (S. aureus)

<220>

<223> Cas9

<400> 287

Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val

1 5 10 15

Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly

20 25 30

Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg

35 40 45

Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile

50 55 60

Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His

65 70 75 80

Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu

85 90 95

Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu

100 105 110

Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr

115 120 125

Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala

130 135 140

Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys

145 150 155 160

Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr

165 170 175

Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln

180 185 190

Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg

195 200 205

Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys

210 215 220

Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe

225 230 235 240

Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr

245 250 255

Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn

260 265 270

Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe

275 280 285

Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu

290 295 300

Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys

305 310 315 320

Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr

325 330 335

Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala

340 345 350

Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu

355 360 365

Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser

370 375 380

Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile

385 390 395 400

Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala

405 410 415

Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln

420 425 430

Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro

435 440 445

Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile

450 455 460

Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg

465 470 475 480

Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys

485 490 495

Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr

500 505 510

Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp

515 520 525

Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu

530 535 540

Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro

545 550 555 560

Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys

565 570 575

Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu

580 585 590

Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile

595 600 605

Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu

610 615 620

Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp

625 630 635 640

Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu

645 650 655

Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys

660 665 670

Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp

675 680 685

Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp

690 695 700

Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys

705 710 715 720

Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys

725 730 735

Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu

740 745 750

Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp

755 760 765

Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile

770 775 780

Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu

785 790 795 800

Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu

805 810 815

Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His

820 825 830

Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly

835 840 845

Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr

850 855 860

Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile

865 870 875 880

Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp

885 890 895

Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr

900 905 910

Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val

915 920 925

Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser

930 935 940

Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala

945 950 955 960

Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly

965 970 975

Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile

980 985 990

Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met

995 1000 1005

Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr

1010 1015 1020

Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu

1025 1030 1035 1040

Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly

1045 1050

<210> 288

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> GMCSFR α链信号序列

<400> 288

atgctgctgc tggtgaccag cctgctgctg tgcgagctgc cccaccccgc ctttctgctg 60

atccccga 68

<210> 289

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人 HBB 基因剪接受体

<400> 289

ctgacctctt ctcttcctcc cacag 25

<210> 290

<211> 13

<212> DNA

<213> 人工序列

<220>

<223> 人 IgG 基因剪接受体

<400> 290

tttctctcca cag 13

<210> 291

<211> 228

<212> PRT

<213> 人工序列

<220>

<223> 间隔子

<400> 291

Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Pro Val

1 5 10 15

Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu

20 25 30

Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser

35 40 45

Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu

50 55 60

Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Gln Ser Thr

65 70 75 80

Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn

85 90 95

Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser

100 105 110

Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln

115 120 125

Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val

130 135 140

Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val

145 150 155 160

Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro

165 170 175

Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr

180 185 190

Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val

195 200 205

Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu

210 215 220

Ser Leu Gly Lys

225

<210> 292

<211> 164

<212> PRT

<213> 人工序列

<220>

<223> CD3 ζ 前体

<400> 292

Met Lys Trp Lys Ala Leu Phe Thr Ala Ala Ile Leu Gln Ala Gln Leu

1 5 10 15

Pro Ile Thr Glu Ala Gln Ser Phe Gly Leu Leu Asp Pro Lys Leu Cys

20 25 30

Tyr Leu Leu Asp Gly Ile Leu Phe Ile Tyr Gly Val Ile Leu Thr Ala

35 40 45

Leu Phe Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr

50 55 60

Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg

65 70 75 80

Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met

85 90 95

Gly Gly Lys Pro Gln Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn

100 105 110

Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met

115 120 125

Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly

130 135 140

Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala

145 150 155 160

Leu Pro Pro Arg

<210> 293

<211> 107

<212> PRT

<213> 人工序列

<220>

<223> FKBP

<400> 293

Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro

1 5 10 15

Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp

20 25 30

Gly Lys Lys Met Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe

35 40 45

Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala

50 55 60

Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr

65 70 75 80

Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr

85 90 95

Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu

100 105

<210> 294

<211> 107

<212> PRT

<213> 人工序列

<220>

<223> FKBP12v36

<400> 294

Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro

1 5 10 15

Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp

20 25 30

Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe

35 40 45

Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala

50 55 60

Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr

65 70 75 80

Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr

85 90 95

Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu

100 105

<210> 295

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> 人 C-Src 酰化基序

<400> 295

Met Gly Ser Asn Lys Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg

1 5 10 15

<210> 296

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 双酰化基序

<220>

<221> 变体

<222> (4)...(4)

<223> Xaa是任何氨基酸

<400> 296

Met Gly Cys Xaa Cys

1 5

<210> 297

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> CAAX 基序

<220>

<221> 变体

<222> (4)...(4)

<223> Xaa是任何氨基酸

<400> 297

Cys Ala Ala Xaa

1

Claims

1.一种包含经修饰的T细胞刺激相关基因座的工程化T细胞，所述经修饰的T细胞刺激相关基因座包含整合至所述T细胞的内源T细胞刺激相关基因座中的编码重组受体的转基因，其中所述转基因与所述内源T细胞刺激相关基因座的内源转录调节元件可操作地连接，其中所述内源转录调节元件在T所述细胞中的刺激或激活信号之后诱导或上调所述可操作地连接的转基因的表达。

2.根据权利要求1所述的工程化T细胞，其中：

所述内源转录调节元件是所述内源T细胞刺激相关基因座的启动子，并且编码所述重组受体或其一部分的所述转基因存在于所述启动子的下游。

3.根据权利要求1或2所述的工程化T细胞，其中所述内源转录调节元件包含由在所述刺激或激活信号之后被激活的转录因子识别的一个或多个应答元件。

4.根据权利要求1-3中任一项所述的工程化T细胞，其中所述可操作地连接的转基因的表达在所述T细胞中所述刺激或激活信号之后小于或小于约6、12、18、24、36或48小时内被诱导或上调；任选地其中所述可操作地连接的转基因的表达被上调或诱导大于或大于约30％、40％、50％、60％、70％、75％、80％、85％、90％或95％或更多。

5.根据权利要求1-4中任一项所述的工程化T细胞，其中所述转基因的表达的诱导或上调是在刺激或激活信号期间暂时的，然后被降低或下调。

6.根据权利要求1-5中任一项所述的工程化T细胞，其中，在表达的所述诱导或上调之后，任选地在所述T细胞中所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达被降低或下调。

7.根据权利要求6所述的工程化T细胞，其中在所述刺激或激活信号降低或不存在之后，在所述T细胞中的进一步刺激或激活信号之后，所述可操作地连接的转基因的表达被诱导或上调。

8.根据权利要求1-7中任一项所述的工程化T细胞，其中所述内源T细胞刺激相关基因座选自PDCD1、CD69、Nur77、FoxP3和HLA-DR基因座。

9.根据权利要求1-8中任一项所述的工程化T细胞，其中所述重组受体包含胞外结合结构域，并且药剂与所述重组受体的胞外结合结构域的结合导致在所述细胞中诱导或传递所述刺激或激活信号。

10.根据权利要求1-9中任一项所述的工程化T细胞，其中：

所述重组受体包含含有所述T细胞受体(TCR)复合物的组分的细胞内信号传导结构域的细胞内区域，并且所述T细胞中的所述刺激或激活信号包含通过存在于所述重组受体中的细胞内信号传导结构域的信号，和/或

11.根据权利要求10所述的工程化T细胞，其中所述细胞内信号传导区域包含CD3链、任选CD3-zeta(CD3ζ)链的细胞内信号传导结构域或其信号传导部分。

12.根据权利要求9-11中任一项所述的工程化T细胞，其中所述药剂是靶抗原，任选地其中所述靶抗原是重组蛋白或在细胞的表面上表达的抗原。

13.根据权利要求12所述的工程化T细胞，其中所述靶抗原是肿瘤抗原、病原体特异性或病原体表达的抗原、炎性抗原或自身抗原。

14.根据权利要求9-11中任一项所述的工程化T细胞，其中所述药剂是抗独特型抗体。

15.根据权利要求1-14中任一项所述的工程化T细胞，其中所述重组受体是嵌合抗原受体(CAR)。

16.根据权利要求1-15中任一项所述的工程化T细胞，其中所述转基因编码所述重组受体或所述重组受体的一部分。

17.根据权利要求16所述的工程化T细胞，其中所述重组受体包含两条单独的多肽链，其中由所述转基因编码的所述重组受体的部分是所述重组受体的一条链，并且所述工程化T细胞还包含所述重组受体的另一条链，任选地其中所述重组受体的另一条链由第二转基因编码。

18.根据权利要求1-14、16和17中任一项所述的工程化T细胞，其中所述重组受体是重组T细胞受体(TCR)，任选地其中所述重组TCR包含α(TCRα)链和β(TCRβ)链，并且所述转基因包含编码所述TCRα链的核酸序列和编码所述TCRβ链的核酸序列。

19.根据权利要求1-18中任一项所述的工程化T细胞，其中所述转基因还包含一个或多个多顺反子元件，任选地其中所述一个或多个多顺反子元件包含编码选自T2A、P2A、E2A或F2A的核糖体跳跃元件或内部核糖体进入位点(IRES)的序列。

20.根据权利要求19所述的工程化T细胞，其中：

21.根据权利要求1-20中任一项所述的工程化T细胞，其中所述经修饰的T细胞刺激相关基因座是通过经由以下方式将编码所述重组受体的转基因整合至所述内源T细胞刺激相关基因座中产生的：

a)在所述内源T细胞刺激相关基因座处或附近的一个或多个靶位点处诱导基因破坏，任选地其中所述基因破坏是通过特异性结合至、识别或杂交至所述靶位点的锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)或CRISPR-Cas9组合实现的；以及

b)引入用于同源定向修复(HDR)的多核苷酸。

22.根据权利要求21所述的工程化T细胞，其中将编码所述重组受体的转基因整合在所述T细胞刺激相关基因座中的至少一个靶位点处或附近。

23.根据权利要求1-22中任一项所述的工程化T细胞，其中所述T细胞刺激相关基因座是PDCD1，并且其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现，并且所述gRNA具有与PDCD1基因中的靶位点互补的靶向结构域，任选地其中所述gRNA包含SEQ ID NO:75和104-109中任一个、任选SEQ ID NO:75所示的序列。

24.根据权利要求1-22中任一项所述的工程化T细胞，其中所述T细胞刺激相关基因座是CD69，并且其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现，并且所述gRNA具有与CD69基因中的靶位点互补的靶向结构域，任选地其中所述gRNA包含SEQ ID NO:116-121中任一个所示的序列。

25.根据权利要求1-22中任一项所述的工程化T细胞，其中所述T细胞刺激相关基因座是Nur77，并且其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现，并且所述gRNA具有与Nur77基因中的靶位点互补的靶向结构域，任选地其中所述gRNA包含SEQ ID NO:122-127和134-136所示的序列。

26.根据权利要求1-22中任一项所述的工程化T细胞，其中所述T细胞刺激相关基因座是FoxP3。

27.根据权利要求1-22中任一项所述的工程化T细胞，其中所述T细胞刺激相关基因座是HLA-DR基因座。

28.根据权利要求1-27中任一项所述的工程化T细胞，其中所述T细胞还包含内源T细胞受体α恒定区(TRAC)基因和/或内源T细胞受体β恒定区(TRBC)基因处的基因破坏，任选地其中所述基因破坏是通过CRISPR-Cas9组合实现的，并且所述CRISPR-Cas9组合包含具有与所述TRAC、TRBC1和/或TRBC2基因内的至少一个靶位点互补的靶向结构域的指导RNA(gRNA)，任选地其中所述CRISPR-Cas9组合是包含所述gRNA和Cas9蛋白的核糖核蛋白(RNP)复合物，任选地其中所述基因破坏是通过经由电穿孔引入多个T细胞中的RNP实现的。

29.根据权利要求28所述的工程化T细胞，其中：

所述gRNA具有与TRAC基因中的靶位点互补的靶向结构域，任选地其中所述gRNA包含SEQ ID NO:77和188-218中任一个、任选SEQ ID NO:77所示的序列；和/或

所述gRNA具有与TRBC基因中的靶位点互补的靶向结构域，任选地其中所述gRNA包含SEQ ID NO:219-276中任一个所示的序列。

30.根据权利要求1-29中任一项所述的工程化T细胞，其中与包含存在于所述T细胞的基因组中的不同位置处或存在于所述T细胞的基因组中的随机位置处的编码相同重组受体的转基因的工程化T细胞相比，在所述T细胞中不存在刺激或激活信号的情况下，通过所述编码的重组受体的细胞内信号传导结构域的信号传导活性降低大于或大于约10％、15％、20％、25％、30％、40％、50％或更多。

31.根据权利要求1-30中任一项所述的工程化T细胞，其中所述T细胞是CD8+T细胞或CD4+T细胞或其亚型。

32.根据权利要求1-31中任一项所述的工程化T细胞，其中所述T细胞是源自受试者的T细胞，任选地其中所述受试者是人。

33.一种多核苷酸，所述多核苷酸包含：

(a)编码重组受体或其一部分的转基因，以及

34.根据权利要求33所述的多核苷酸，其中：

当所述重组受体由引入了所述多核苷酸的细胞表达时，所述重组受体或其一部分由包含编码所述重组受体或其一部分的转基因的经修饰的T细胞刺激相关基因座编码；和/或所述转基因是对于T细胞、任选人T细胞的内源T细胞刺激相关基因座的开放阅读框而言外源或异源的序列。

35.根据权利要求33或34所述的多核苷酸，其中所述一个或多个同源臂包含5'同源臂和/或3'同源臂，任选地其中所述5'同源臂和/或3'同源臂包含与靶位点周围的核酸序列同源的核酸序列，其中所述靶位点位于所述T细胞刺激相关基因座内。

36.根据权利要求35所述的多核苷酸，其中所述靶位点位于所述T细胞刺激相关基因座的内源转录调节元件的下游。

37.根据权利要求35或36所述的多核苷酸，其中所述多核苷酸包含结构[5'同源臂]-[转基因]-[3'同源臂]。

38.根据权利要求33-37中任一项所述的多核苷酸，其中所述5'同源臂和所述3'同源臂的长度独立地在为或约50与为或约750个核苷酸之间、为或约50与为或约500个核苷酸之间、为或约50与为或约250个核苷酸之间、为或约50与为或约100个核苷酸之间、为或约100与为或约750个核苷酸之间、为或约100与为或约500个核苷酸之间、为或约100与为或约250个核苷酸之间、为或约250与为或约750个核苷酸、为或约250与为或约500个核苷酸之间；独立地是为或约50、60、70、80、90、100、150、200、250、300、400或500个核苷酸，或任何前述值之间的任何值；或独立地小于或小于约100个核苷酸，任选地是为或约50、60、70、80或90个核苷酸，或任何前述值之间的任何值。

39.根据权利要求33-38中任一项所述的多核苷酸，其中所述T细胞刺激相关基因座选自PDCD1、CD69、Nur77、FoxP3和HLA-DR基因座。

40.根据权利要求39所述的多核苷酸，其中所述T细胞刺激相关基因座是PDCD1，任选地其中所述5’同源臂和所述3'同源臂包含与PDCD1的一个或多个区域同源的序列。

41.根据权利要求40所述的多核苷酸，其中：

所述5'同源臂包含：

c)SEQ ID NO:66所示的序列；和/或

所述3'同源臂包含：

d)含有与SEQ ID NO:67所示的序列展现出至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列的为或至少为或至少150、200、250、300、350、400、450、500、550或600个连续核苷酸的序列；

e)含有SEQ ID NO:67所示的序列的为或至少为或至少150、200、250、300、350、400、450、500、550或600个连续核苷酸的序列；或

f)SEQ ID NO:67所示的序列。

42.根据权利要求39所述的多核苷酸，其中所述T细胞刺激相关基因座是CD69，任选地其中所述5’同源臂和所述3'同源臂包含与CD69的一个或多个区域同源的序列。

43.根据权利要求39所述的多核苷酸，其中所述T细胞刺激相关基因座是Nur77，任选地其中所述5’同源臂和所述3'同源臂包含与Nur77的一个或多个区域同源的序列。

44.根据权利要求39所述的多核苷酸，其中所述T细胞刺激相关基因座是FoxP3，任选地其中所述5’同源臂和所述3'同源臂包含与FoxP3的一个或多个区域同源的序列。

45.根据权利要求39所述的多核苷酸，其中所述T细胞刺激相关基因座是HLA-DR基因座，任选地其中所述5'同源臂和所述3'同源臂包含与HLA-DR基因座的一个或多个区域同源的序列。

46.根据权利要求33-45中任一项所述的多核苷酸，其中所述重组受体包含胞外结合结构域，并且药剂与所述重组受体的胞外结合结构域的结合导致在所述细胞中诱导或传递所述刺激或激活信号。

47.根据权利要求33-46中任一项所述的多核苷酸，其中：

48.根据权利要求47所述的多核苷酸，其中所述细胞内信号传导区域包含CD3链、任选CD3-zeta(CD3ζ)链的细胞内信号传导结构域或其信号传导部分。

49.根据权利要求46-48中任一项所述的多核苷酸，其中所述药剂是靶抗原，任选地其中所述靶抗原是重组蛋白或在细胞的表面上表达的抗原。

50.根据权利要求49所述的多核苷酸，其中所述靶抗原是肿瘤抗原、病原体特异性或病原体表达的抗原、炎性抗原或自身抗原。

51.根据权利要求46-48中任一项所述的多核苷酸，其中所述药剂是抗独特型抗体。

52.根据权利要求33-51中任一项所述的多核苷酸，其中所述重组受体是嵌合抗原受体(CAR)。

53.根据权利要求33-52中任一项所述的多核苷酸，其中所述转基因编码所述重组受体或所述重组受体的一部分。

54.根据权利要求53所述的多核苷酸，其中所述重组受体包含两条单独的多肽链，其中由所述转基因编码的所述重组受体的部分是所述重组受体的一条链，任选地其中所述重组受体的另一条链由第二转基因编码。

55.根据权利要求33-51、53和54中任一项所述的多核苷酸，其中所述重组受体是重组T细胞受体(TCR)，任选地其中重组TCR包含α(TCRα)链和β(TCRβ)链，并且所述转基因包含编码所述TCRα链的核酸序列和编码所述TCRβ链的核酸序列。

56.根据权利要求33-55中任一项所述的多核苷酸，其中所述转基因还包含一个或多个多顺反子元件，任选地其中所述一个或多个多顺反子元件包含编码选自T2A、P2A、E2A或F2A的核糖体跳跃元件或内部核糖体进入位点(IRES)的序列。

57.根据权利要求56所述的多核苷酸，其中：

58.根据权利要求33-57中任一项所述的多核苷酸，所述多核苷酸是线性多核苷酸。

59.根据权利要求33-57中任一项所述的多核苷酸，其中所述多核苷酸包含于病毒载体中。

60.根据权利要求59所述的多核苷酸，其中所述病毒载体是AAV载体。

61.根据权利要求33-60中任一项所述的多核苷酸，其中所述多核苷酸的长度是为或约1000、1250、1500、1750、2000、2250、2500、2750、3000、3250、3500、3750或4000个核苷酸，或任何前述值之间的任何值；或者在为或约1500与为或约2500个核苷酸之间或在为或约1750与为或约2250个核苷酸之间。

62.一种产生基因工程化T细胞的方法，所述方法包括：

(b)将根据权利要求33-61中任一项所述的多核苷酸引入所述T细胞中，其中所述方法产生经修饰的T细胞刺激相关基因座，所述经修饰的T细胞刺激相关基因座包含编码所述重组受体或其一部分的转基因，其中将编码重组受体或其一部分的所述转基因经由同源定向修复(HDR)整合在所述内源T细胞刺激相关基因座内。

63.一种产生基因工程化T细胞的方法，所述方法包括将根据权利要求33-61中任一项所述的多核苷酸引入T细胞中，所述T细胞具有在所述T细胞的T细胞刺激相关基因座内的基因破坏，其中将编码所述重组受体或其一部分的所述转基因经由同源定向修复(HDR)整合在所述内源T细胞刺激相关基因座内。

64.根据权利要求63所述的方法，其中通过以下方式来进行所述基因破坏：向T细胞中引入能够在所述T细胞的内源T细胞刺激相关基因座内的靶位点处诱导基因破坏的一种或多种药剂。

65.根据权利要求62-64中任一项所述的方法，其中所述方法产生经修饰的T细胞刺激相关基因座，所述经修饰的T细胞刺激相关基因座包含编码重组受体或其一部分的转基因。

66.根据权利要求62-65中任一项所述的方法，其中所述靶位点位于所述内源T细胞刺激相关基因座的内源转录调节元件的下游。

67.根据权利要求62-66中任一项所述的方法，其中所述T细胞刺激相关基因座选自PDCD1、CD69、Nur77、FoxP3和HLA-DR基因座。

68.根据权利要求62-67中任一项所述的方法，其中所述基因破坏是通过特异性结合至、识别或杂交至所述靶位点的锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)或CRISPR-Cas9组合实现的。

69.根据权利要求62-68中任一项所述的方法，其中所述基因破坏是通过CRISPR-Cas9组合实现的，并且所述CRISPR-Cas9组合包含具有与至少一个靶位点互补的靶向结构域的指导RNA(gRNA)，任选地其中所述CRISPR-Cas9组合是包含所述gRNA和Cas9蛋白的核糖核蛋白(RNP)复合物，任选地其中所述基因破坏是通过经由电穿孔引入多个T细胞中的RNP实现的。

70.根据权利要求62-69中任一项所述的方法，其中所述T细胞刺激相关基因座是PDCD1，并且其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现，并且所述gRNA具有与PDCD1基因中的靶位点互补的靶向结构域，任选地其中所述gRNA包含SEQ ID NO:75和104-109中任一个、任选SEQ ID NO:75所示的序列。

71.根据权利要求62-69中任一项所述的方法，其中所述T细胞刺激相关基因座是CD69，并且其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现，并且所述gRNA具有与CD69基因中的靶位点互补的靶向结构域，任选地其中所述gRNA包含SEQ ID NO:116-121中任一个所示的序列。

72.根据权利要求62-69中任一项所述的方法，其中所述T细胞刺激相关基因座是Nur77，并且其中所述基因破坏是通过包含gRNA的CRISPR-Cas9组合实现，并且所述gRNA具有与Nur77基因中的靶位点互补的靶向结构域，任选地其中所述gRNA包含SEQ ID NO:122-127和134-136所示的序列。

73.根据权利要求62-69中任一项所述的方法，其中所述T细胞刺激相关基因座是FoxP3。

74.根据权利要求62-69中任一项所述的方法，其中所述T细胞刺激相关基因座是HLA-DR基因座。

75.根据权利要求62-74中任一项所述的方法，其中所述T细胞还包含内源T细胞受体α恒定区(TRAC)基因和/或内源T细胞受体β恒定区(TRBC)基因处的基因破坏，任选地其中所述基因破坏是通过CRISPR-Cas9组合实现的，并且所述CRISPR-Cas9组合包含具有与所述TRAC、TRBC1和/或TRBC2基因内的至少一个靶位点互补的靶向结构域的指导RNA(gRNA)，任选地其中所述CRISPR-Cas9组合是包含所述gRNA和Cas9蛋白的核糖核蛋白(RNP)复合物，任选地其中所述基因破坏是通过经由电穿孔引入多个T细胞中的RNP实现的。

76.根据权利要求75所述的方法，其中：

77.根据权利要求69-76中任一项所述的方法，其中所述RNP是经由电穿孔、粒子枪、磷酸钙转染、细胞压缩或挤压引入的，任选地经由电穿孔引入，任选地其中所述RNP是经由电穿孔引入多个T细胞中的。

78.根据权利要求69-77中任一项所述的方法，其中所述RNP的浓度是从为或约1μM至为或约5μM，任选地其中所述RNP的浓度是为或约2μM。

79.根据权利要求62-78中任一项所述的方法，其中T细胞包含CD8+T细胞和/或CD4+T细胞或其亚型。

80.根据权利要求62-79中任一项所述的方法，其中所述T细胞是人T细胞，任选源自人受试者的原代T细胞。

81.根据权利要求62和64-80中任一项所述的方法，其中将所述一种或多种药剂和所述多核苷酸同时引入。

82.根据权利要求62和64-80中任一项所述的方法，其中在引入所述一种或多种药剂之后引入所述多核苷酸。

83.根据权利要求82所述的方法，其中在引入所述药剂之后立即引入所述多核苷酸，或者在引入所述药剂之后约30秒、1分钟、2分钟、3分钟、4分钟、5分钟、6分钟、6分钟、8分钟、9分钟、10分钟、15分钟、20分钟、30分钟、40分钟、50分钟、60分钟、90分钟、2小时、3小时或4小时内引入所述多核苷酸。

84.根据权利要求62和64-83中任一项所述的方法，其中在引入所述一种或多种药剂和/或所述多核苷酸之前，所述方法包括在用于刺激或激活所述一种或多种免疫细胞的条件下，将所述细胞在体外与一种或多种刺激剂一起孵育，任选地其中所述一种或多种刺激剂包含抗CD3和/或抗CD28抗体，任选地其中所述一种或多种刺激剂包含含有抗CD3和/或抗CD28抗体或用抗CD3和/或抗CD28抗体包被的珠的低聚体颗粒试剂。

85.根据权利要求62和64-84中任一项所述的方法，其中所述方法还包括在引入所述一种或多种药剂和/或引入所述多核苷酸之前、期间或之后，将所述细胞与一种或多种重组细胞因子一起孵育，任选地其中所述一种或多种重组细胞因子选自IL-2、IL-7和IL-15，任选地其中将所述一种或多种重组细胞因子以选自以下的浓度添加：从为或约10U/mL至为或约200U/mL、任选地为或约50IU/mL至为或约100U/mL的浓度的IL-2；0.5ng/mL至50ng/mL、任选地为或约5ng/mL至为或约10ng/mL的浓度的IL-7；和/或0.1ng/mL至20ng/mL、任选地为或约0.5ng/mL至为或约5ng/mL的浓度的IL-15。

86.根据权利要求84或85所述的方法，其中所述孵育是在引入所述一种或多种药剂和引入所述多核苷酸之后进行的，持续至多或大约24小时、36小时、48小时、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、16天、17天、18天、19天、20天或21天，任选地至多或约7天。

87.一种使用根据权利要求62-86中任一项所述的方法生成的工程化T细胞。

88.一种种组合物，所述组合物包含根据权利要求1-32中任一项所述的工程化细胞或多个根据权利要求1-32中任一项所述的工程化细胞。

89.一种组合物，所述组合物包含根据权利要求87所述的工程化T细胞或多个根据权利要求87所述的工程化T细胞。

90.根据权利要求88或89所述的组合物，其中在所述T细胞中所述刺激或激活信号之后小于或小于约6、12、18、24、36或48小时内，所述可操作地连接的转基因的表达在所述组合物中的一个或多个细胞中被诱导或上调，任选地其中在所述T细胞中的刺激或激活信号之后，在所述组合物中的细胞中表达所述可操作地连接的转基因的细胞的频率大于或大于约50％、60％、70％、75％、80％、85％、90％或95％或更多。

91.根据权利要求88-90中任一项所述的组合物，其中在表达的上调或诱导之后或在所述T细胞中所述刺激或激活信号降低或不存在之后，所述可操作地连接的转基因的表达在所述组合物中的一个或多个细胞中被降低或下调。

92.根据权利要求88-91中任一项所述的组合物，其中：

在表达的上调或诱导之后，在所述T细胞中的刺激或激活信号之后为或约1、2、3、4、5、6、7或8天或更长时间，所述可操作地连接的转基因的表达在所述组合物中的一个或多个细胞中被降低或下调；或

在所述T细胞中的所述刺激或激活信号降低或不存在之后小于或小于约6、12、18、24、36或48小时内，所述组合物中的一个或多个细胞中的所述可操作地连接的转基因的表达被降低或下调，任选地其中在所述组合物中的细胞中表达所述可操作地连接的转基因的细胞的频率降低大于或约30％、40％、50％、60％、70％、75％、80％、85％、90％或95％或更多；和/或

在所述T细胞中所述刺激或激活信号降低或不存在之后，在所述组合物中的细胞中表达所述重组受体的细胞的频率小于或小于约50％、40％、30％、25％、20％、15％、10％或5％或更少。

93.根据权利要求88-92中任一项所述的组合物，其中所述组合物包含CD4+T细胞和/或CD8+T细胞。

94.根据权利要求88-93中任一项所述的组合物，其中所述组合物包含CD4+和CD8+T细胞，并且CD4+与CD8+T细胞的比率为从或从约1:3至3:1，任选地1:1。

95.一种治疗方法，所述治疗方法包括将根据权利要求1-32和87中任一项所述的工程化细胞或根据权利要求88-94中任一项所述的组合物施用至患有疾病或障碍的受试者。

96.根据权利要求95所述的方法，其中所述疾病或障碍是癌症或肿瘤。

97.根据权利要求96所述的方法，其中所述癌症或所述肿瘤是血液恶性肿瘤，任选淋巴瘤、白血病或浆细胞恶性肿瘤，任选地其中所述癌症是淋巴瘤，并且所述淋巴瘤是伯基特淋巴瘤、非霍奇金淋巴瘤(NHL)、霍奇金淋巴瘤、华氏巨球蛋白血症、滤泡性淋巴瘤、小无裂细胞性淋巴瘤、黏膜相关淋巴组织淋巴瘤(MALT)、边缘区淋巴瘤、脾淋巴瘤、结节单核细胞样B细胞淋巴瘤、免疫母细胞淋巴瘤、大细胞淋巴瘤、弥漫性混合细胞淋巴瘤、肺B细胞血管中心淋巴瘤、小淋巴细胞淋巴瘤、原发性纵隔B细胞淋巴瘤、淋巴浆细胞性淋巴瘤(LPL)或套细胞淋巴瘤(MCL)。

98.根据权利要求96或97所述的方法，其中所述癌症是白血病，并且所述白血病是慢性淋巴细胞白血病(CLL)、浆细胞白血病或急性淋巴细胞白血病(ALL)。

99.根据权利要求96或97所述的方法，其中所述癌症是浆细胞恶性肿瘤，并且所述浆细胞恶性肿瘤是多发性骨髓瘤(MM)。

100.根据权利要求96所述的方法，其中所述肿瘤是实体瘤，任选地其中所述实体瘤是非小细胞肺癌(NSCLC)或头颈部鳞状细胞癌(HNSCC)。

101.根据权利要求96-100中任一项所述的方法，其中与未施用所述工程化细胞或所述组合物的受试者相比，所述癌症或所述肿瘤的体积或大小降低和/或所述受试者的存活期延长。

102.一种试剂盒，所述试剂盒包含：

能够在T细胞刺激相关基因座内的靶位点处诱导基因破坏的一种或多种药剂；以及根据权利要求33-61中任一项所述的多核苷酸。

103.一种试剂盒，所述试剂盒包含：

用于进行根据权利要求62-86中任一项所述的方法的说明书。