CN112512594A

CN112512594A - 经由基因调节多肽的条件性核定位的基因调节

Info

Publication number: CN112512594A
Application number: CN201980034737.6A
Authority: CN
Inventors: 刘佩琪; 汪建斌
Original assignee: Ruifei Biotechnology Co ltd
Current assignee: Fundacao D Anna Sommer Champalimaud e Dr Carlos Montez Champalimaud
Priority date: 2018-03-23
Filing date: 2019-03-22
Publication date: 2021-03-16
Also published as: WO2019183572A1; EP3768328A1; US20210070830A1; EP3768328A4

Abstract

本公开提供了用于调节靶多核苷酸在细胞中的表达的系统。该系统可包含嵌合多肽，该嵌合多肽包含与异源核定位域框内融合的基因调节多肽。该异源核定位域可以是可操作的，以在被活性细胞信号传导途径激活后将嵌合多肽移位至细胞核。该细胞信号传导途径可以是响应于细胞外信号可诱导的。响应于细胞外信号，所述嵌合多肽可定位于细胞核，并且所述基因调节多肽可调节靶多核苷酸在细胞核中的表达。

Description

经由基因调节多肽的条件性核定位的基因调节

交叉引用

本申请要求2018年3月23日提交的第62/647,543号美国临时申请和2018年5月22日提交的第62/675,134号美国临时申请的权益，所述临时申请中的每一个均通过引用整体并入本文。

序列表

本申请含有序列表，该序列表已经以ASCII格式电子提交，并且通过引用整体并入本文。创建于2019年3月22日的所述ASCII副本被命名为50489-711_601_SL.txt，大小为137,422个字节。

背景技术

细胞活性的调节可涉及配体与包含细胞外配体结合域和细胞内(例如细胞质)信号传导域的膜结合受体的结合。配体与配体结合域之间的复合物的形成可导致受体的构象改变和/或化学修饰，这可导致在细胞内转导的信号。在一些情况下，在细胞内转导的信号导致下游靶标的磷酸化，从而导致其活性发生变化。这些下游靶标可以被激活，然后在细胞内执行各种功能。

在一些情况下，一种蛋白质的胞外域(例如，配体结合域)可以附接至参与信号转导的另一种蛋白质的胞内域(例如，信号传导域)，以产生嵌合分子(例如，嵌合受体)，该嵌合分子将前者的配体识别与后者的信号转导结合起来。

细胞活性的调节可涉及对光有响应的多肽(例如，跨膜或细胞内蛋白质)。光对一些光响应性蛋白质的激活可导致多肽的构象变化，这可以导致在细胞内转导的信号。在一些情况下，多肽可与一种或多种另外的物质相互作用，以在细胞内转导信号。

这类调节细胞活性(例如，经由配体和/或光激活)的方法可用于多种目的，例如用于在免疫疗法中调节免疫细胞。免疫疗法可涉及修饰患者自身的免疫细胞以表达嵌合受体，其中任意配体特异性被移植到免疫细胞信号传导域上。免疫细胞信号传导域可以参与激活和/或灭活免疫细胞，以响应于诸如癌症等疾病。

常规的免疫治疗方法存在多种缺陷。这类缺陷包括来自共刺激受体的信号不足以产生持续的和/或足够的免疫应答以达到治疗效果，修饰的免疫细胞对病变细胞如癌细胞的特异性不足(例如，靶上、肿瘤外效应和毒性)，以及副作用，如细胞因子释放综合征(CRS)。免疫细胞中的信号传导可涉及各种受体，包括共刺激受体。来自共刺激受体的信号不足可能导致免疫细胞应答降低和免疫疗法的有效性降低。脱靶效应和副作用，如细胞因子释放综合征，可导致进一步的医学并发症，包括炎症反应、器官衰竭，甚至在极端情况下会导致死亡。

发明内容

本文公开了用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，其中所述核定位域是可操作的，以在被活性细胞信号传导途径激活后将所述嵌合多肽移位至细胞核，所述细胞信号传导途径是响应于细胞外信号可诱导的，其中响应于所述细胞外信号，所述嵌合多肽定位于细胞核，并且所述基因调节多肽调节靶多核苷酸在所述细胞核中的表达。

本文公开了用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：a)在结合配体时激活细胞信号传导途径的嵌合受体多肽；和b)嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，所述异源核定位域是可操作的，以在被细胞信号传导途径激活后将所述嵌合多肽移位至细胞核，其中在所述配体与所述嵌合受体多肽结合后，所述嵌合多肽经由所述诱导的异源核定位域定位于所述细胞核，并且所述基因调节多肽调节靶多核苷酸在所述细胞核中的表达。

本文公开了用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：a)包含化学化合物的细胞信号传导途径激活剂；和b)嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，所述异源核定位域是可操作的，以在被细胞信号传导途径诱导后将所述嵌合多肽移位至细胞核，其中在将所述激活剂施用于细胞后，所述嵌合多肽经由激活的异源核定位域定位于细胞核，并且所述基因调节多肽调节靶多核苷酸在所述细胞核中的表达。

在一些实施方案中，所述核定位域包含至少一个核定位序列。在任何本发明系统的一些实施方案中，所述核定位域的激活包括所述核定位序列的化学修饰。在任何本发明系统的一些实施方案中，所述化学修饰是对所述核定位序列的至少一个氨基酸的化学修饰。在一些实施方案中，所述化学修饰导致所述核定位序列的构象变化和暴露。在一些实施方案中，所述化学修饰包括脱磷酸化。在一些实施方案中，所述化学修饰包括磷酸化。在一些实施方案中，所述化学修饰包括乙酰化。在一些实施方案中，所述化学修饰包括甲基化。在一些实施方案中，所述化学修饰包括泛素化。在一些实施方案中，所述化学修饰包括蛋白水解加工。在任何本发明系统的一些实施方案中，所述核定位域的激活包括第二信使或信号传导途径蛋白质的结合。在一些实施方案中，所述激活的信号传导途径激活钙依赖磷酸酶。在一些实施方案中，所述核定位域包含活化T细胞核因子(NFAT)转录因子家族的成员或其片段。在一些实施方案中，所述基因调节多肽包含致动部分。在任何本发明系统的一些实施方案中，所述致动部分包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、重组酶、翻转酶、转座酶或Argonaute(Ago)蛋白(例如，原核Argonaute(pAgo)、古菌Argonaute(aAgo)和真核Argonaute(eAgo))。在一些实施方案中，所述致动部分包含Cas蛋白。在一些实施方案中，所述Cas蛋白与指导RNA复合。在一些实施方案中，所述Cas蛋白是Cas9、Cpf1、C2c1、C2c3。在一些实施方案中，所述Cas蛋白是C2c2、Cas13b、Cas13c或Cas13d。在一些实施方案中，所述Cas蛋白基本上缺乏DNA切割活性。在一些实施方案中，所述基因调节多肽进一步包含异源功能域。在任何本发明系统的一些实施方案中，所述异源功能域包含转录激活物。在一些实施方案中，所述转录激活物包括VP16、VP32、VP64、VPR、p65或P65HSF1。在任何本发明系统的一些实施方案中，所述功能域包含转录阻抑物。在任何本发明系统的一些实施方案中，所述转录阻抑物包含KRAB结构域。在任何本发明系统的一些实施方案中，所述功能域包含染色体修饰酶。在任何本发明系统的一些实施方案中，所述染色体修饰酶包括泛素化(ubiquitinase)、蛋白酶、甲基化酶、脱甲基酶、乙酰基酶、脱乙酰酶、脱氨酶、磷酸化酶或脱磷酸化酶。在任何本发明系统的一些实施方案中，所述染色体修饰酶修饰一个或多个核苷酸。在任何本发明系统的一些实施方案中，所述染色体修饰酶修饰一种或多种组蛋白。在任何本发明系统的一些实施方案中，所述靶多核苷酸是基因组DNA。在任何本发明系统的一些实施方案中，所述靶多核苷酸是RNA。在一些实施方案中，所述细胞外信号包括配体，并且其中所述配体与跨膜受体的结合激活所述细胞信号传导途径。在一些实施方案中，所述嵌合受体多肽包括Notch受体、G蛋白偶联受体(GPCR)、整联蛋白受体、钙粘着蛋白受体、酪氨酸激酶受体、死亡受体、免疫受体或嵌合抗原受体。在一些实施方案中，所述化学化合物相对于基础水平升高细胞内钙浓度。

本文公开了调节靶多核苷酸在细胞中的表达的方法，其包括：响应于细胞信号传导途径的激活，将基因调节多肽从细胞质移位至细胞核，其中所述细胞信号传导途径的激活将与所述基因调节多肽偶联的核定位域激活。

本文公开了调节靶多核苷酸在细胞中的表达的方法，其包括：a)激活细胞的细胞信号传导途径，其中激活所述细胞的细胞信号传导途径激活与基因调节多肽连接的核定位域；b)经由激活的核定位域将所述基因调节多肽定位于细胞核，其中在将所述基因调节多肽定位于细胞核后，所述基因调节多肽调节所述靶多核苷酸在所述细胞中的表达。

本文公开了调节靶多核苷酸在细胞中的表达的方法，其包括：a)使配体与跨膜受体接触，其中细胞信号传导途径在所述接触时被激活，并且其中所激活的细胞信号传导途径激活与基因调节多肽偶联的核定位域；b)通过所激活的核定位域，将所述基因调节多肽从细胞质移位至细胞核，其中所述基因调节多肽在移位至细胞核后调节靶多核苷酸的表达。

在任何本发明方法的一些实施方案中，所述核定位域包含至少一个核定位序列。在任何本发明方法的一些实施方案中，所述核定位域的激活包括所述核定位序列的化学修饰。在任何本发明方法的一些实施方案中，所述化学修饰是对所述核定位序列的至少一个氨基酸的化学修饰。在任何本发明方法的一些实施方案中，所述化学修饰导致所述核定位序列的构象变化和暴露。在任何本发明方法的一些实施方案中，所述化学修饰包括脱磷酸化。在任何本发明方法的一些实施方案中，所述化学修饰包括磷酸化。在任何本发明方法的一些实施方案中，所述化学修饰包括乙酰化。在任何本发明方法的一些实施方案中，所述化学修饰包括甲基化。在任何本发明方法的一些实施方案中，所述化学修饰包括泛素化。在任何本发明方法的一些实施方案中，所述化学修饰包括蛋白水解加工。在任何本发明方法的一些实施方案中，所述核定位域的激活包括第二信使或信号传导途径蛋白质的结合。在任何本发明方法的一些实施方案中，所述激活的信号传导途径激活钙依赖磷酸酶。在任何本发明方法的一些实施方案中，所述核定位域包含活化T细胞核因子(NFAT)的成员或其片段。在任何本发明方法的一些实施方案中，所述基因调节多肽包含致动部分。在任何本发明方法的一些实施方案中，所述致动部分包括Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、重组酶、翻转酶、转座酶或Argonaute(Ago)蛋白(例如，原核Argonaute(pAgo)、古菌Argonaute(aAgo)和真核Argonaute(eAgo))。在任何本发明方法的一些实施方案中，所述基因调节多肽包含Cas蛋白。在任何本发明方法的一些实施方案中，所述Cas蛋白与指导RNA复合。在任何本发明方法的一些实施方案中，所述Cas蛋白是Cas9、Cpf1、C2c1或C2c3。在任何本发明方法的一些实施方案中，所述Cas蛋白是C2c2、Cas13a、Cas13b、Cas13c或Cas13d。在任何本发明方法的一些实施方案中，所述Cas蛋白基本上缺乏DNA切割活性。在任何本发明方法的一些实施方案中，所述基因调节多肽包含异源功能域。在任何本发明方法的一些实施方案中，所述异源功能域包含转录激活物。在任何本发明方法的一些实施方案中，所述转录激活物包括VP16、VP32、VP64、VPR或P65HSF1。在任何本发明方法的一些实施方案中，所述功能域包含转录阻抑物。在任何本发明方法的一些实施方案中，所述转录阻抑物包含KRAB结构域。在任何本发明方法的一些实施方案中，所述功能域包含染色体修饰酶。在任何本发明方法的一些实施方案中，所述染色体修饰酶包括甲基化酶、脱甲基酶、乙酰基酶、脱乙酰酶、脱氨酶、磷酸化酶或脱磷酸化酶。在任何本发明方法的一些实施方案中，所述染色体修饰酶修饰一个或多个核苷酸。在任何本发明方法的一些实施方案中，所述染色体修饰酶修饰一种或多种组蛋白。在任何本发明方法的一些实施方案中，所述靶多核苷酸是基因组DNA。在任何本发明方法的一些实施方案中，所述靶多核苷酸是RNA。在任何本发明方法的一些实施方案中，激活所述细胞的所述细胞信号传导途径包括向所述细胞施用细胞信号传导途径激活剂，其中所述激活剂包括化学化合物。在任何本发明方法的一些实施方案中，所述化学化合物相对于基础水平升高细胞内钙浓度。在任何本发明方法的一些实施方案中，所述跨膜受体包括Notch受体、G蛋白偶联受体(GPCR)、整联蛋白受体、钙粘着蛋白受体、酪氨酸激酶受体、死亡受体、免疫受体或嵌合抗原受体。

本文公开了一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，其中所述核定位域是可操作的，以在可被细胞外信号诱导的细胞信号传导途径激活后，将所述嵌合多肽移位至细胞核，其中所述细胞外信号是电磁辐射，并且其中响应于所述细胞外信号，所述嵌合多肽定位于所述细胞核，并且所述基因调节多肽调节靶多核苷酸在所述细胞核中的表达。

在一些实施方案中，所述电磁辐射包括X射线、紫外(UV)线、可见光、红外线、微波或其任意组合。在一些实施方案中，本发明的系统包含在施用所述细胞外信号后激活所述细胞信号传导途径的信号传导单元。

在一些实施方案中，所述信号传导单元包含跨膜蛋白质，其中在施用所述细胞外信号后，所述跨膜蛋白质诱导所述细胞信号传导途径。在一些实施方案中，所述信号传导单元包含细胞内蛋白质，其中在施用所述细胞外信号后，所述细胞内蛋白质诱导所述细胞信号传导途径。

在一些实施方案中，所述信号传导单元包含跨膜蛋白质和细胞内蛋白质。在一些实施方案中，所述细胞外信号的施用激活所述跨膜蛋白质，所述跨膜蛋白质继而激活所述细胞内蛋白质，以诱导所述细胞信号传导途径。在一些实施方案中，所述细胞外信号的施用激活所述细胞内蛋白质，所述细胞内蛋白质继而激活所述跨膜蛋白质，以诱导所述细胞信号传导途径。在一些实施方案中，所述细胞内蛋白质包含第一部分和第二部分，并且其中所述细胞外信号的施用诱导所述细胞内蛋白质的构象变化，从而暴露所述第一部分和所述第二部分中至少一个的活性位点。在一些实施方案中，所述暴露的活性位点激活所述跨膜蛋白质，以诱导所述细胞信号传导途径。在一些实施方案中，所述暴露的活性位点结合所述跨膜蛋白质，以激活所述跨膜蛋白质。

在一些实施方案中，所述细胞信号传导途径包含钙。在一些实施方案中，所述细胞内蛋白质的所述第一部分和所述第二部分中的至少一个包含LOV结构域。在一些实施方案中，所述信号传导单元进一步包含位于所述细胞内蛋白质的所述第一部分和所述第二部分之间的α-螺旋肽结构域，其中所述细胞外信号的施用诱导所述α-螺旋结构域的至少一部分的构象变化。在一些实施方案中，所述细胞内蛋白质的所述第一部分和所述第二部分中的至少一个包含SOAR结构域。在一些实施方案中，所述跨膜蛋白质包含钙通道。在一些实施方案中，所述跨膜蛋白质包含ORAI1结构域。

在一些实施方案中，所述细胞不是肾细胞或肾细胞系。在一些实施方案中，所述细胞不是宫颈癌细胞或宫颈癌细胞系。

在一些实施方案中，所述细胞外信号相对于基础水平升高细胞内钙浓度。在一些实施方案中，所述核定位域包含至少一个核定位序列。在一些实施方案中，所述核定位域的激活包括所述核定位序列的化学修饰。在一些实施方案中，所述化学修饰是对所述核定位序列的至少一个氨基酸的化学修饰。在一些实施方案中，所述化学修饰导致所述核定位序列的构象变化和暴露。在一些实施方案中，所述化学修饰包括脱磷酸化。在一些实施方案中，所述化学修饰包括磷酸化。在一些实施方案中，所述化学修饰包括乙酰化。在一些实施方案中，所述化学修饰包括甲基化。在一些实施方案中，所述化学修饰包括泛素化。在一些实施方案中，所述化学修饰包括蛋白水解加工。在一些实施方案中，所述核定位域的激活包括第二信使或信号传导途径蛋白质的结合。在一些实施方案中，所述激活的信号传导途径激活钙依赖磷酸酶。在一些实施方案中，所述核定位域包含活化T细胞核因子(NFAT)转录因子家族的成员或其片段。在一些实施方案中，所述基因调节多肽包含致动部分。在一些实施方案中，所述致动部分包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、重组酶、翻转酶、转座酶或Argonaute(Ago)蛋白(例如，原核Argonaute(pAgo)、古菌Argonaute(aAgo)和真核Argonaute(eAgo))。在一些实施方案中，所述致动部分包含Cas蛋白。在一些实施方案中，所述Cas蛋白与指导RNA复合。在一些实施方案中，所述Cas蛋白是Cas9、Cpf1、C2c1、C2c3。在一些实施方案中，所述Cas蛋白是C2c2、Cas13b、Cas13c或Cas13d。在一些实施方案中，所述Cas蛋白基本上缺乏DNA切割活性。在一些实施方案中，所述基因调节多肽进一步包含异源功能域。在一些实施方案中，所述异源功能域包含转录激活物。在一些实施方案中，所述转录激活物包括VP16、VP32、VP64、VPR、p65或P65HSF1。在一些实施方案中，所述功能域包含转录阻抑物。在一些实施方案中，所述转录阻抑物包含KRAB结构域。在一些实施方案中，所述功能域包含染色体修饰酶。在一些实施方案中，所述染色体修饰酶包括甲基化酶、脱甲基酶、乙酰基酶、脱乙酰酶、脱氨酶、磷酸化酶或脱磷酸化酶。在一些实施方案中，所述染色体修饰酶修饰一个或多个核苷酸。在一些实施方案中，所述染色体修饰酶修饰一种或多种组蛋白。在一些实施方案中，所述靶多核苷酸是基因组DNA。在一些实施方案中，所述靶多核苷酸是RNA。

本文公开了一种调节靶多核苷酸在细胞中的表达的方法，其包括：(a)向所述细胞施用电磁辐射，其中细胞信号传导途径被所述电磁辐射激活，并且其中所激活的细胞信号传导途径激活与基因调节多肽偶联的核定位域；以及(b)通过所激活的核定位域，将所述基因调节多肽从细胞质移位至细胞核，其中所述基因调节多肽在移位至所述细胞核后调节靶多核苷酸的表达。

在一些实施方案中，所述电磁辐射包括X射线、紫外(UV)线、可见光、红外线、微波或其任意组合。在一些实施方案中，本发明的方法进一步包括施用所述电磁辐射以激活信号传导单元，其中激活所述信号传导单元激活所述细胞信号传导途径。在一些实施方案中，所述电磁辐射相对于基础水平升高细胞内钙浓度。

在一些实施方案中，所述信号传导单元包含跨膜蛋白质，其中在施用所述电磁辐射后，所述跨膜蛋白质诱导所述细胞信号传导途径。在一些实施方案中，所述信号传导单元包含细胞内蛋白质，其中在施用所述电磁辐射后，所述细胞内蛋白质诱导所述细胞信号传导途径。

在一些实施方案中，所述信号传导单元包含跨膜蛋白质和细胞内蛋白质。在一些实施方案中，所述电磁辐射的施用激活所述跨膜蛋白质，所述跨膜蛋白质继而激活所述细胞内蛋白质，以诱导所述细胞信号传导途径。在一些实施方案中，所述电磁辐射的施用激活所述细胞内蛋白质，所述细胞内蛋白质继而激活所述跨膜蛋白质，以诱导所述细胞信号传导途径。在一些实施方案中，细胞内蛋白质包含第一部分和第二部分，并且其中所述电磁辐射的施用诱导所述细胞内蛋白质的构象变化，从而暴露所述第一部分和所述第二部分中的至少一个的活性位点。在一些实施方案中，所暴露的活性位点激活所述跨膜蛋白质，以诱导所述细胞信号传导途径。在一些实施方案中，所暴露的活性位点结合所述跨膜蛋白质，以激活所述跨膜蛋白质。

在一些实施方案中，所述细胞信号传导途径包含钙。在一些实施方案中，所述细胞内蛋白质的所述第一部分和所述第二部分中的至少一个包含LOV结构域。在一些实施方案中，所述细胞内蛋白质进一步包括位于所述细胞内蛋白质的所述第一部分和所述第二部分之间的α-螺旋肽结构域，其中所述电磁辐射的施用诱导所述α-螺旋结构域的至少一部分的构象变化。在一些实施方案中，所述细胞内蛋白质的所述第一部分和所述第二部分中的至少一个包含SOAR结构域。在一些实施方案中，所述跨膜蛋白质包含钙通道。在一些实施方案中，所述跨膜蛋白质包含ORAI1结构域。

在一些实施方案中，本发明的方法进一步包括向所述细胞施用所述电磁辐射一段时间，从而提供对激活所述细胞信号传导途径的时间和/或空间控制。在一些实施方案中，所述方法进一步包括：(a)将所述细胞输注到个体中；以及(b)引导电磁辐射源以向所述个体的至少一部分施用所述电磁辐射，从而以空间控制的方式激活所述细胞信号传导途径。在一些实施方案中，所述电磁辐射源被植入所述个体中具有治疗意义的部位。在一些实施方案中，所述方法进一步包括：(a)在不存在所述电磁辐射的情况下培养所述细胞；(b)向所述细胞施用所述电磁辐射一段时间，以激活靶多核苷酸的表达的调节；以及(c)将所述激活的细胞输注到个体中。

在一些实施方案中，所述细胞不是肾细胞。在一些实施方案中，所述细胞不是宫颈癌细胞。

在一些实施方案中，所述电磁辐射相对于基础水平升高细胞内钙浓度。在一些实施方案中，所述核定位域包含至少一个核定位序列施方案中，所述核定位域的激活包括所述核定位序列的化学修饰。在一些实施方案中，所述化学修饰是对所述核定位序列的至少一个氨基酸的化学修饰。在一些实施方案中，所述化学修饰导致所述核定位序列的构象变化和暴露。在一些实施方案中，所述化学修饰包括脱磷酸化。在一些实施方案中，所述化学修饰包括磷酸化。在一些实施方案中，所述化学修饰包括乙酰化。在一些实施方案中，所述化学修饰包括甲基化。在一些实施方案中，所述化学修饰包括泛素化。在一些实施方案中，所述化学修饰包括蛋白水解加工。在一些实施方案中，所述核定位域的激活包括第二信使或信号传导途径蛋白质的结合。在一些实施方案中，所述激活的信号传导途径激活钙依赖磷酸酶。在一些实施方案中，所述核定位域包含活化T细胞核因子(NFAT)的成员或其片段。在一些实施方案中，所述基因调节多肽包含致动部分。在一些实施方案中，所述致动部分包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、重组酶、翻转酶、转座酶或Argonaute(Ago)蛋白(例如，原核Argonaute(pAgo)、古菌Argonaute(aAgo)和真核Argonaute(eAgo))。在一些实施方案中，所述基因调节多肽包含Cas蛋白。在一些实施方案中，所述Cas蛋白与指导RNA复合。在一些实施方案中，所述Cas蛋白是Cas9、Cpf1、C2c1或C2c3。在一些实施方案中，所述Cas蛋白是C2c2、Cas13a、Cas13b、Cas13c或Cas13d。在一些实施方案中，所述Cas蛋白基本上缺乏DNA切割活性。在一些实施方案中，所述基因调节多肽包含异源功能域。在一些实施方案中，所述异源功能域包含转录激活物。在一些实施方案中，所述转录激活物包括VP16、VP32、VP64、VPR或P65HSF1。在一些实施方案中，所述功能域包含转录阻抑物。在一些实施方案中，所述转录阻抑物包含KRAB结构域。在一些实施方案中，所述功能域包含染色体修饰酶。在一些实施方案中，所述染色体修饰酶包括甲基化酶、脱甲基酶、乙酰基酶、脱乙酰酶、脱氨酶、磷酸化酶或脱磷酸化酶。在一些实施方案中，所述染色体修饰酶修饰一个或多个核苷酸。在一些实施方案中，所述染色体修饰酶修饰一种或多种组蛋白。在一些实施方案中，所述靶多核苷酸是基因组DNA。在一些实施方案中，所述靶多核苷酸是RNA。

援引并入

本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文，其程度犹如具体地且单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。

附图说明

本发明的新颖特征在所附权利要求书中具体阐述。通过参考以下对利用本发明原理的说明性实施方案加以阐述的详细描述以及附图，将会对本发明的特征和优点获得更好的理解，在这些附图中：

图1描绘了由受体激活控制的诱导型基因调节的实例。在所描绘的实例中，配体与其相应受体的相互作用激活了固有的信号转导途径，所述受体由胞外域(ECD)、跨膜域(TMD)和胞内域(ICD)组成。信号级联导致融合蛋白的生化或结构变化，该融合蛋白由基因调节多肽(GMP)和异源核定位域组成，以使该融合蛋白移位到细胞核中以调节靶基因的表达。在该实例中，异源核定位域移位到细胞核中的能力可通过存在或不存在配体-受体相互作用来控制。

图2描绘了由受体激活控制的诱导型基因调节的实例。在所描绘的实例中，抗原与其相应CAR的相互作用激活了固有的TCR信号转导途径，所述CAR由细胞外单链抗体可变片段(scFv)、间隔区、跨膜(TM)域以及细胞内信号域1和2组成。信号级联导致NFAT-dCas9-VP64融合蛋白的NFAT组分的脱磷酸化，从而诱导抑制性结合配偶体的构象变化或其从NFAT部分上的解离。因此，核定位信号(NLS)肽成为暴露的，以使融合蛋白移位到细胞核中。随后，融合蛋白的dCas9-VP64部分与靶标特异性单指导RNA(sgRNA)组合，以调节靶基因的表达。在该实例中，NFAT蛋白结构域移位到细胞核中的能力由CAR激活信号控制。

图3A和图3B描绘了使用图2中描绘的系统生成的示例数据。

图4A描绘了NFATc2蛋白的功能域的图示。NFATc2蛋白包含以下4个功能域：N末端反式激活域(TAD-N)、NFAT同源性区域(NHR)、DNA结合域(DBD)和C末端反式激活域(TAD-C)。NFATc2的N末端部分(nNFATc2)在本文公开的一些实施方案中用作组分。

图4B描绘了示例性nNFATc2-dCas9-VP64构建体的氨基酸序列(SEQ ID NO:1)。在该实例中，与dCas9蛋白融合的NFATc2的N末端部分以下划线标出。

图5描绘了使用图2中描绘的用于基因下调的示例系统生成的示例数据，其中KRAB用作效应域，而不是VP64。

图6A和图6B描绘了使用与较小的NFATc2变体或其他NFAT家族蛋白质融合的dCas9生成的示例数据。

图7描绘了使用与RelA蛋白而非NFATc2融合的dCas9生成的示例数据。

图8描绘了由电磁辐射控制的诱导型基因调节的实例。在所描绘的实例中，电磁辐射激活了信号传导单元，该信号传导单元由跨膜蛋白质(ORAI1)和细胞内嵌合蛋白(LOV2-Jα-SOAR/CAD)组成。电磁辐射的施用诱导细胞内嵌合蛋白的构象变化，以暴露活性位点。活性位点激活跨膜蛋白质，该跨膜蛋白质继而诱导细胞信号传导途径(例如，钙依赖磷酸酶的钙依赖性激活)。诱导的细胞信号传导途径导致NFAT-dCas9-阻抑物/激活物融合蛋白的NFAT组分的脱磷酸化。NFAT组分的核定位信号(NLS)域可变成暴露的，以使该融合蛋白移位到细胞核中。随后，该融合蛋白的dCas9-阻抑物/激活物部分与靶标特异性单指导RNA(sgRNA)组合，以调节靶基因的表达。

具体实施方式

除非另有说明，否则本文公开的一些方法的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术，它们在本领域技术范围内。参见例如Sambrook和Green,Molecular Cloning:A Laboratory Manual,第4版(2012)；系列丛书Current Protocols in Molecular Biology(F.M.Ausubel等人编著)；系列丛书Methods In Enzymology(Academic Press,Inc.),PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames和G.R.Taylor编著(1995)),Harlow和Lane编著(1988)Antibodies,A Laboratory Manual,and Culture of Animal Cells:A Manual of BasicTechnique and Specialized Applications,第6版(R.I.Freshney编著(2010))。

定义

除非上下文另有明确说明，否则如说明书和权利要求书中所用的，单数形式“一个”、“一种”和“该”包括复数指代物。例如，术语“一嵌合跨膜受体多肽”包括多个嵌合跨膜受体多肽。

术语“约”或“大约”是指在本领域普通技术人员确定的特定值的可接受误差范围内，该误差范围将部分取决于该值是如何测得或确定的，即测量系统的局限性。例如，按照本领域的实践，“约”可指在一个或多于一个标准偏差内。或者，“约”可指给定值的至多20％、至多10％、至多5％或至多1％的范围。或者，特别是对于生物系统或过程，该术语可指在一个数量级内，优选在值的5倍以内，更优选在2倍以内。在本申请和权利要求书中描述了特定值的情况下，除非另有说明，否则应假定术语“约”是指在特定值的可接受误差范围内。

如本文所用的，“细胞”通常可指生物细胞。细胞可以是活生物体的基本的结构、功能和/或生物单元。细胞可以起源于任何具有一个或多个细胞的生物体。一些非限制性实例包括：原核细胞、真核细胞、细菌细胞、古菌细胞、单细胞真核生物体的细胞、原生动物细胞、来自植物的细胞(例如，来自植物作物、水果、蔬菜、谷物、大豆、玉米、玉蜀黍、小麦、种子、番茄、水稻、木薯、甘蔗、南瓜、干草、土豆、棉花、大麻、烟草、开花植物、针叶树、裸子植物、蕨类植物、石松类植物、角苔类植物、苔类植物、苔藓植物的细胞)、藻类细胞(例如，布朗葡萄藻(Botryococcus braunii)、莱茵衣藻(Chlamydomonas reinhardtii)、微拟球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、展枝马尾藻圆干变种(Sargassum patens C.Agardh)等)、海藻(例如，海带)、真菌细胞(例如，酵母细胞、来自蘑菇的细胞)、动物细胞、来自无脊椎动物(例如，果蝇、刺胞动物、棘皮动物、线虫等)的细胞、来自脊椎动物(例如，鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、来自哺乳动物(例如，猪、牛、山羊、绵羊、啮齿动物、大鼠、小鼠、非人灵长类动物、人类等)的细胞等。有时，细胞不起源于天然生物体(例如，细胞可以是合成制成的，有时称为人造细胞)。

如本文所用的术语“抗原”是指能够被选择性结合剂结合的分子或其片段。作为实例，抗原可以是可被选择性结合剂如受体结合的配体。作为另一个实例，抗原可以是抗原分子，其可以被诸如免疫蛋白(例如，抗体)等选择性结合剂结合。抗原还可以指能够在动物体内使用以产生能够与该抗原结合的抗体的分子或其片段。

如本文所用的术语“抗体”是指具有免疫球蛋白样功能的蛋白质结合分子。术语抗体包括抗体(例如，单克隆和多克隆抗体)及其衍生物、变体和片段。抗体包括但不限于不同类别(即IgA、IgG、IgM、IgD和IgE)和亚类(如IgG1、IgG2等)的免疫球蛋白(Ig)。其衍生物、变体或片段可指保留相应抗体的结合特异性(例如，完整和/或部分)的功能衍生物或片段。抗原结合片段包括Fab、Fab'、F(ab')₂、可变片段(Fv)、单链可变片段(scFv)、微抗体、双抗体和单域抗体(“sdAb”或“纳米抗体”或“骆驼科抗体”)。术语抗体包括已被优化、工程化或化学缀合的抗体和抗体的抗原结合片段。已被优化的抗体的实例包括亲和力成熟的抗体。已被工程化的抗体的实例包括Fc优化的抗体(例如，在片段可结晶区域优化的抗体)和多特异性抗体(例如，双特异性抗体)。

如本文所用的术语“Fc受体”或“FcR”通常是指可与抗体的Fc区域结合的受体或其任何衍生物、变体或片段。在某些实施方案中，FcR是与IgG抗体结合的受体(γ受体、FcγR)，并包括FcγRI(CD64)、FcγRII(CD32)和FcγRIII(CD16)亚类的受体，包括这些受体的等位基因变体和可变剪接形式。FcγRII受体包括FcγRIIA(“激活受体”)和FcγRIIB(“抑制受体”)，它们具有相似的氨基酸序列，主要不同之处在于其细胞质结构域。术语“FcR”还包括新生儿受体FcRn，其负责将母体IgG转移给胎儿。

如本文所用的术语“核苷酸”通常是指碱基-糖-磷酸组合。核苷酸可包括合成核苷酸。核苷酸可包括合成核苷酸类似物。核苷酸可以是核酸序列的单体单元(例如，脱氧核糖核酸(DNA)和核糖核酸(RNA))。术语核苷酸可包括核糖核苷三磷酸——三磷酸腺苷(ATP)、三磷酸尿苷(UTP)、三磷酸胞苷(CTP)、三磷酸鸟苷(GTP)以及脱氧核糖核苷三磷酸如dATP、dCTP、dITP、dUTP、dGTP、dTTP或其衍生物。这类衍生物可包括例如[αS]dATP、7-脱氮-dGTP和7-脱氮-dATP，以及在含有它们的核酸分子上赋予核酸酶抗性的核苷酸衍生物。如本文所用的术语核苷酸可指双脱氧核苷三磷酸(ddNTP)及其衍生物。双脱氧核苷三磷酸的说明性实例可包括但不限于ddATP、ddCTP、ddGTP、ddITP和ddTTP。核苷酸可以是未标记的或通过公知技术可检测地标记的。还可以用量子点进行标记。可检测标记可包括例如放射性同位素、荧光标记、化学发光标记、生物发光标记和酶标记。核苷酸的荧光标记可包括但不限于荧光素、5-羧基荧光素(FAM)、2′7′-二甲氧基-4′5-二氯-6-羧基荧光素(JOE)、罗丹明、6-羧基罗丹明(R6G)、N,N,N′,N′-四甲基-6-羧基罗丹明(TAMRA)、6-羧基-X-罗丹明(ROX)、4-(4′-二甲基氨基苯基偶氮)苯甲酸(DABCYL)、瀑布蓝(Cascade Blue)、俄勒冈绿、德克萨斯红、花菁和5-(2′-氨基乙基)氨基萘-1-磺酸(EDANS)。荧光标记的核苷酸的具体实例可包括可从Perkin Elmer，Foster City，Calif获得的[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP和[dROX]ddTTP；可从Amersham，Arlington Heights，Ill.获得的FluoroLink DeoxyNucleotides、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink Fluor X-dCTP、FluoroLink Cy3-dUTP和FluoroLinkCy5-dUTP；可从Boehringer Mannheim，Indianapolis，Ind.获得的荧光素-15-dATP、荧光素-12-dUTP、四甲基-罗丹明-6-dUTP、IR770-9-dATP、荧光素-12-ddUTP、荧光素-12-UTP和荧光素-15-2'-dATP；以及可从Molecular Probes，Eugene，Oreg获得的染色体标记的核苷酸、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、瀑布蓝-7-UTP、瀑布蓝-7-dUTP、荧光素-12-UTP、荧光素-12-dUTP、俄勒冈绿488-5-dUTP、罗丹明绿-5-UTP、罗丹明绿-5-dUTP、四甲基罗丹明-6-UTP、四甲基罗丹明-6-dUTP、德克萨斯红-5-UTP、德克萨斯红-5-dUTP和德克萨斯红-12-dUTP。核苷酸还可以通过化学修饰进行标记或标示。化学修饰的单个核苷酸可以是生物素-dNTP。生物素化dNTP的一些非限制性实例可包括生物素-dATP(例如，bio-N6-ddATP、生物素-14-dATP)、生物素-dCTP(例如，生物素-11-dCTP、生物素-14-dCTP)和生物素-dUTP(例如，生物素-11-dUTP、生物素-16-dUTP、生物素-20-dUTP)。

术语“多核苷酸”、“寡核苷酸”和“核酸”可互换使用，以指代任何长度的核苷酸的聚合形式，无论是脱氧核糖核苷酸还是核糖核苷酸，还是其类似物，无论是单链、双链还是多链形式。多核苷酸对于细胞而言可以是外源的或内源的。多核苷酸可以存在于无细胞环境中。多核苷酸可以是基因或其片段。多核苷酸可以是DNA。多核苷酸可以是RNA。多核苷酸可以具有任何三维结构，并且可以执行任何已知或未知的功能。多核苷酸可包括一种或多种类似物(例如，改变的骨架、糖或核碱基)。在存在修饰的情况下，可以在聚合物组装之前或之后对核苷酸结构进行修饰。类似物的一些非限制性实例包括：5-溴尿嘧啶、肽核酸、异种核酸、吗啉代核酸、锁定核酸、二醇核酸、苏糖核酸、双脱氧核苷酸、蛹虫草菌素、7-脱氮-GTP、荧光团(例如，与糖连接的罗丹明或荧光素)、含巯基核苷酸、生物素连接的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化核苷酸、肌苷、硫尿苷、假尿苷、二氢尿苷、辫苷和怀俄苷。多核苷酸的非限制性实例包括基因或基因片段的编码或非编码区、由连锁分析定义的一个或多个基因座、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、支化多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、无细胞多核苷酸(包括无细胞DNA(cfDNA)和无细胞RNA(cfRNA))、核酸探针和引物。核苷酸的序列可被非核苷酸组分所间断。

如本文所用的术语“基因”是指参与编码RNA转录物的核酸(例如DNA，如基因组DNA和cDNA)及其相应的核苷酸序列。如本文关于基因组DNA使用的该术语包括间插的非编码区以及调节区，并且可包括5’和3’端。在一些使用中，该术语包括转录的序列，包括5’和3’非翻译区(5’-UTR和3’-UTR)、外显子和内含子。在一些基因中，转录的区域将包含编码多肽的“开放阅读框”。在该术语的一些使用中，“基因”仅包含编码多肽所必需的编码序列(例如，“开放阅读框”或“编码区”)。在一些情况下，基因不编码多肽，例如，核糖体RNA(rRNA)基因和转移RNA(tRNA)基因。在一些情况下，术语“基因”不仅包括转录的序列，而且还包括非转录的区域，包括上游和下游调节区、增强子和启动子。基因可指在生物体基因组中其天然位置处的“内源基因”或天然基因。基因可指“外源基因”或非天然基因。非天然基因可指在宿主生物体中通常无法找到，而是通过基因转移引入宿主生物体中的基因。非天然基因还可指不在生物体基因组中其天然位置处的基因。非天然基因还可指包含突变、插入和/或缺失的天然存在的核酸或多肽序列(例如，非天然序列)。

如本文所用的术语“靶多核苷酸”和“靶核酸”是指由本公开的致动部分所靶向的核酸或多核苷酸。靶多核苷酸可以是DNA(例如，内源的或外源的)。DNA可指生成mRNA转录物的模板和/或调节从DNA模板转录mRNA的各种调节区。靶多核苷酸可以是较大多核苷酸如染色体或染色体区域的一部分。靶多核苷酸可指染色体外序列(例如，附加型序列、微环序列、线粒体序列、叶绿体序列等)或染色体外序列的区域。靶多核苷酸可以是RNA。RNA可以是例如可充当编码蛋白质的模板的mRNA。包含RNA的靶多核苷酸可包含各种调节区，这些调节区调节从mRNA模板翻译蛋白质。靶多核苷酸可编码基因产物(例如，编码RNA转录物的DNA或编码蛋白质产物的RNA)或包含调节基因产物表达的调节序列。通常，术语“靶序列”是指靶核酸的单链上的核酸序列。靶序列可以是基因的一部分、调节序列、基因组DNA、无细胞核酸(包括cfDNA和/或cfRNA)、cDNA、融合基因和RNA(包括mRNA、miRNA、rRNA)等。当被致动部分靶向时，靶多核苷酸可导致改变的基因表达和/或活性。当被致动部分靶向时，靶多核苷酸可导致编辑的核酸序列。靶核酸可包含通过单核苷酸置换而可能不与核酸样品中的其他任何序列相关的核酸序列。靶核酸可包含通过2、3、4、5、6、7、8、9或10个核苷酸置换而可能不与核酸样品中的其他任何序列相关的核酸序列。在一些实施方案中，该置换可能不在靶核酸的5’端的5、10、15、20、25、30或35个核苷酸内发生。在一些实施方案中，该置换可能不在靶核酸的3’端的5、10、15、20、25、30、35个核苷酸内发生。

术语“表达”是指借此从DNA模板转录多核苷酸(如转录成mRNA或其他RNA转录物)的一个或多个过程和/或借此将转录的mRNA随后翻译成肽、多肽或蛋白质的过程。转录物和编码多肽可统称为“基因产物”。如果多核苷酸衍生自基因组DNA，则表达可包括mRNA在真核细胞中的剪接。关于表达，“上调”通常是指相对于其在野生型状态下的表达水平，多核苷酸(例如，RNA，如mRNA)和/或多肽序列的表达水平升高，而“下调”通常是指相对于其在野生型状态下的表达，多核苷酸(例如，RNA，如mRNA)和/或多肽序列的表达水平降低。

如本文所用的术语“互补”、“互补体”、“互补的”和“互补性”通常是指与给定序列完全互补且可杂交的序列。在一些情况下，与给定核酸杂交的序列被称为给定分子的“互补体”或“反向互补体”，前提是其在给定区域上的碱基序列能够与其结合配偶体的碱基序列互补地结合，使得例如形成A-T、A-U、G-C和G-U碱基对。通常，可与第二序列杂交的第一序列可与第二序列特异性地或选择性地杂交，使得在杂交反应期间，相对于与非靶序列杂交，优选与第二序列或一组第二序列杂交(例如，在给定的一组条件(例如本领域常用的严格性条件)下在热力学上更稳定)。一般而言，可杂交序列在其各自的全部或部分长度上共享一定程度的序列互补性，如25％-100％的互补性，包括至少25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％和100％的序列互补性。例如出于评估互补性百分比的目的，可以通过任何合适的比对算法来测量序列同一性，该算法包括但不限于Needleman-Wunsch算法(参见例如在www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html上可以获得的EMBOSSNeedle比对器，任选地使用默认设置)、BLAST算法(参见例如在blast.ncbi.nlm.nih.gov/Blast.cgi上可以获得的BLAST比对工具，任选地使用默认设置)或Smith-Waterman算法(参见例如在www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html上可以获得的EMBOSS Water比对器，任选地使用默认设置)。可以使用所选算法的任何合适的参数，包括默认参数，来评估最佳比对。

互补性可以是完全互补性或基本互补性/足够的互补性。两个核酸之间的完全互补性可意指这两个核酸可以形成双链体，其中该双链体中的每个碱基都通过Watson-Crick配对与互补碱基键合。基本互补性或足够的互补性可意指一条链中的序列与相对链中的序列不完全互补和/或不完美互补，但是在一组杂交条件(例如，盐浓度和温度)下，两条链上的碱基之间发生足够的键合以形成稳定的杂合复合物。这样的条件可以如下预测：使用序列和标准数学计算来预测杂交链的Tm，或通过使用常规方法凭经验确定Tm。

如本文所用的，关于表达或活性的术语“调节”是指改变表达或活性的水平。调节可以在转录水平、转录后水平、翻译水平和/或翻译后水平上发生。

术语“肽”、“多肽”和“蛋白质”在本文可互换使用，是指通过肽键连接的至少两个氨基酸残基的聚合物。该术语不表示聚合物的特定长度，也并非旨在暗示或区分该肽是使用重组技术、化学或酶合成产生的，还是天然存在的。该术语适用于天然存在的氨基酸聚合物以及包含至少一个修饰氨基酸的氨基酸聚合物。在一些情况下，该聚合物可被非氨基酸间断。该术语包括任何长度的氨基酸链，包括全长蛋白质，以及具有或不具有二级和/或三级结构(例如，结构域)的蛋白质。该术语还包括已经例如通过二硫键形成、糖基化、脂化、乙酰化、磷酸化、氧化以及其他任何操作如与标记组分缀合而修饰的氨基酸聚合物。如本文所用的术语“氨基酸”通常是指天然和非天然氨基酸，包括但不限于修饰的氨基酸和氨基酸类似物。修饰的氨基酸可包括天然氨基酸和非天然氨基酸，它们已被化学修饰以包含非天然存在于氨基酸上的基团或化学部分。氨基酸类似物可指氨基酸衍生物。术语“氨基酸”包括D-氨基酸和L-氨基酸。

当在本文中关于多肽使用时，术语“变体”是指与野生型多肽相关但不相同的多肽，例如在氨基酸序列、结构(例如，二级和/或三级)、活性(例如，酶活性)和/或功能方面。变体包括与野生型多肽相比包含一个或多个氨基酸变异(例如，突变、插入和缺失)、截短、修饰或其组合的多肽。变体还包括野生型多肽的衍生物和野生型多肽的片段。

如本文所用的术语“同一性百分比(％)”是指在比对序列并在必要时引入空位以实现最大同一性百分比(即，可以在候选序列和参考序列之一或两者中引入空位以实现最佳比对，并且出于比较目的可以忽略非同源序列)之后，候选序列中与参考序列的氨基酸(或核酸)残基相同的氨基酸(或核酸)残基的百分比。为了确定同一性百分比的目的，可以通过本领域技术范围内的各种方式来实现比对，例如，使用可公开获得的计算机软件，如BLAST、ALIGN或Megalign(DNASTAR)软件。可以通过使用BLAST将测试序列与比较序列进行比对，确定比对的测试序列中与比较序列相同位置处的氨基酸或核苷酸相同的氨基酸或核苷酸的数目，并且将相同氨基酸或核苷酸的数目除以比较序列中氨基酸或核苷酸的数目，从而计算两个序列的同一性百分比。

如本文所用的术语“基因调节多肽”或“GMP”是指至少包含能够调节基因的表达或活性以及/或者编辑核酸序列的致动部分的多肽。GMP可包含不直接参与调节基因表达的另外的肽序列，例如连接体序列、靶向序列等。

如本文所用的术语“致动部分”是指可以调节基因的表达或活性以及/或者编辑核酸序列的部分，无论是外源的还是内源的。致动部分可以在转录水平、转录后水平、翻译水平和/或翻译后水平上调节基因的表达。致动部分可以在转录水平上调节基因表达，例如通过调节由DNA如染色体DNA或cDNA产生mRNA。在一些实施方案中，致动部分募集至少一种与特定DNA序列结合的转录因子，从而控制遗传信息从DNA到mRNA的转录速率。致动部分本身可以与DNA结合并通过物理阻碍调节转录，例如阻止蛋白质如RNA聚合酶和其他相关蛋白质在DNA模板上装配。致动部分可以在翻译水平上调节基因表达，例如通过调节从mRNA模板产生蛋白质。在一些实施方案中，致动部分通过影响mRNA转录物的稳定性在转录后水平上调节基因表达。在一些实施方案中，致动部分通过改变多肽修饰如新合成的蛋白质的糖基化在翻译后水平上调节基因表达。在一些实施方案中，致动部分通过编辑核酸序列(例如，基因组的区域)来调节基因的表达。在一些实施方案中，致动部分通过编辑mRNA模板来调节基因的表达。在一些情况下，编辑核酸序列可以改变基因表达的潜在模板。

本文提及的Cas蛋白可以是一种类型的蛋白质或多肽。Cas蛋白可指核酸酶。Cas蛋白可指内切核糖核酸酶。Cas蛋白可指Cas蛋白的任何修饰的(例如，缩短的、突变的、延长的)多肽序列或同源物。Cas蛋白可以是密码子优化的。Cas蛋白可以是Cas蛋白的密码子优化的同源物。Cas蛋白可以是酶促失活的、部分活性的、组成型活性的、完全活性的、诱导型活性的和/或更具活性的(例如，比该蛋白质或多肽的野生型同源物更具活性)。Cas蛋白可以是II型Cas蛋白。Cas蛋白可以是Cas9。Cas蛋白可以是V型Cas蛋白。Cas蛋白可以是Cpf1或Cas12a。Cas蛋白可以是C2c1。Cas蛋白可以是C2c3。Cas蛋白可以是VI型Cas蛋白。Cas蛋白可以是C2c2或Cas13a。Cas蛋白可以是Cas13b。Cas蛋白可以是Cas13c。Cas蛋白可以是Cas13d。Cas蛋白(例如，变体、突变的、酶促失活的和/或条件性酶促失活的位点定向多肽)可以与靶核酸结合。Cas蛋白(例如，变体、突变的、酶促失活的和/或条件性酶促失活的内切核糖核酸酶)可以与靶RNA或DNA结合。

如本文所用的术语“crRNA”通常可指与野生型示例性crRNA(例如，来自酿脓链球菌(S.pyogenes)的crRNA)具有至少约5％、10％、20％、30％、40％、50％、60％、70％、80％、90％或100％序列同一性和/或序列相似性的核酸。crRNA通常可指与野生型示例性crRNA(例如，来自酿脓链球菌、金黄色葡萄球菌(S.aureus)等的crRNA)具有至多约5％、10％、20％、30％、40％、50％、60％、70％、80％、90％或100％序列同一性和/或序列相似性的核酸。crRNA可指crRNA的修饰形式，其可以包含核苷酸变化如缺失、插入或置换、变体、突变或嵌合体。crRNA可以是在一段至少6个连续核苷酸上与野生型示例性crRNA(例如，来自酿脓链球菌、金黄色葡萄球菌等的crRNA)序列具有至少约60％序列同一性的核酸。例如，在一段至少6个连续核苷酸上，crRNA序列可以与野生型示例性crRNA序列(例如，来自酿脓链球菌、金黄色葡萄球菌等的crRNA)至少约60％相同、至少约65％相同、至少约70％相同、至少约75％相同、至少约80％相同、至少约85％相同、至少约90％相同、至少约95％相同、至少约98％相同、至少约99％相同或100％相同。

如本文所用的术语“tracrRNA”通常可指与野生型示例性tracrRNA序列(例如，来自酿脓链球菌的tracrRNA)具有至少约5％、10％、20％、30％、40％、50％、60％、70％、80％、90％或100％序列同一性和/或序列相似性的核酸。tracrRNA可指与野生型示例性tracrRNA序列(例如，来自酿脓链球菌、金黄色葡萄球菌等的tracrRNA)具有至多约5％、10％、20％、30％、40％、50％、60％、70％、80％、90％或100％序列同一性和/或序列相似性的核酸。tracrRNA可指tracrRNA的修饰形式，其可以包含核苷酸变化如缺失、插入或置换、变体、突变或嵌合体。tracrRNA可指在一段至少6个连续核苷酸上与野生型示例性tracrRNA(例如，来自酿脓链球菌、金黄色葡萄球菌等的tracrRNA)序列至少约60％相同的核酸。例如，在一段至少6个连续核苷酸上，tracrRNA序列可以与野生型示例性tracrRNA序列(例如，来自酿脓链球菌、金黄色葡萄球菌等的tracrRNA)序列至少约60％相同、至少约65％相同、至少约70％相同、至少约75％相同、至少约80％相同、至少约85％相同、至少约90％相同、至少约95％相同、至少约98％相同、至少约99％相同或100％相同。

如本文所用的，“指导核酸”可指可与另一核酸杂交的核酸。指导核酸可以是RNA。指导核酸可以是DNA。指导核酸可以被程序化以位点特异性地与核酸序列结合。待靶向的核酸或靶核酸可包含核苷酸。指导核酸可包含核苷酸。靶核酸的一部分可以与指导核酸的一部分互补。与指导核酸互补并杂交的双链靶多核苷酸的链可被称为互补链。与互补链互补并且因此可能不与指导核酸互补的双链靶多核苷酸的链可被称为非互补链。指导核酸可包含一条多核苷酸链，并且可被称为“单指导核酸”。单指导核酸可包含crRNA。单指导核酸可包含crRNA和tracrRNA。指导核酸可包含两条多核苷酸链，并且可被称为“双指导核酸”。双指导核酸可包含crRNA和tracrRNA。如果没有另外说明，则术语“指导核酸”可以是包括性的，即指单指导核酸和双指导核酸两者。

指导核酸可包含可被称为“核酸靶向区段”或“核酸靶向序列”的区段。核酸靶向区段可包含可被称为“蛋白质结合区段”或“蛋白质结合序列”或“Cas蛋白结合区段”的子区段。

如本文所用的术语“靶向序列”是指编码靶向多肽的核苷酸序列和相应的氨基酸序列，该靶向多肽介导蛋白质向亚细胞位置的定位(或保留)，该亚细胞位置例如是质膜或给定细胞器的膜、细胞核、胞质溶胶、线粒体、内质网(ER)、高尔基体、叶绿体、质外体、过氧化物酶体或其他细胞器。例如，靶向序列可以利用核定位信号(NLS)将蛋白质(例如，受体多肽或衔接子多肽)引导至细胞核；利用核输出信号(NES)将蛋白质引导出细胞的细胞核，例如引导至细胞质；利用线粒体靶向信号将蛋白质引导至线粒体；利用ER保留信号将蛋白质引导至内质网(ER)；利用过氧化物酶体靶向信号将蛋白质引导至过氧化物酶体；利用膜定位信号将蛋白质引导至质膜；或其组合。

如本文所用的，“核定位域”可指核定位信号或其他能够穿过核膜从而进入细胞核的序列或结构域。核定位域可以与多肽框内融合，在这种情况下，核定位域可被称为“异源核定位域”。核定位域可以具有非活性状态，在该状态下它无法穿过核膜，因此无法进入细胞核。核定位域可以具有活性状态，在该状态下它能够穿过核膜，因此能够进入细胞核。当异源核结构域为活性并进入细胞核时，与异源核结构域融合的多肽也进入细胞核。响应于细胞外或细胞内信号，核定位域可在非活性状态与活性状态之间切换。

如本文所用的，“融合”可指包含一个或多个非天然序列(例如，部分)的蛋白质和/或核酸。融合可包含一个或多个相同的非天然序列。融合可包含一个或多个不同的非天然序列。融合可以是嵌合体。融合可包含核酸亲和标签。融合可包含条形码。融合可包含肽亲和标签。融合可以提供位点定向多肽的亚细胞定位(例如，用于靶向至细胞核的核定位信号(NLS)、用于靶向至线粒体的线粒体定位信号、用于靶向至叶绿体的叶绿体定位信号、内质网(ER)保留信号等)。融合可以提供可用于追踪或纯化的非天然序列(例如，亲和标签)。融合可以是小分子，如生物素或染料，如Alexa fluor染料、Cyanine3染料、Cyanine5染料。

融合可指具有功能作用的任何蛋白质。例如，融合蛋白可包含甲基转移酶活性、脱甲基酶活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂合酶活性或糖基化酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性、重塑活性、蛋白酶活性、氧化还原酶活性、转移酶活性、水解酶活性、裂合酶活性、异构酶活性、合酶活性、合成酶活性或脱豆蔻酰化活性。效应蛋白可以修饰基因组基因座。融合蛋白可以是Cas蛋白和异源功能域的融合体。融合蛋白可以是与Cas蛋白融合的非天然序列。

如本文所用的，“异源功能域”可指融合蛋白内的结构域，所述结构域包含功能活性。异源功能域可以是转录激活物。异源功能域可以是转录阻抑物。异源功能域可以包括甲基转移酶活性、脱甲基酶活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂合酶活性或糖基化酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性、重塑活性、蛋白酶活性、氧化还原酶活性、转移酶活性、水解酶活性、裂合酶活性、异构酶活性、合酶活性、合成酶活性或脱豆蔻酰化活性。异源功能域可以是染色体修饰酶，如甲基化酶、脱甲基酶、乙酰基酶、脱乙酰酶、脱氨酶、磷酸化酶、脱磷酸化酶、组蛋白修饰酶或核苷酸修饰酶。异源功能域可以是组蛋白修饰酶。异源功能域可以是核苷酸修饰酶。

如本文所用的，“非天然的”可指在天然核酸或蛋白质中未发现的核酸或多肽序列。非天然的可指亲和标签。非天然的可指融合。非天然的可指包含突变、插入和/或缺失的天然存在的核酸或多肽序列。非天然序列可以表现出并且/或者编码活性(例如，酶活性、甲基转移酶活性、乙酰转移酶活性、激酶活性、泛素化活性等)，该活性也可以由非天然序列与之融合的核酸和/或多肽序列表现。非天然核酸或多肽序列可以通过遗传工程与天然存在的核酸或多肽序列(或其变体)连接，以生成编码嵌合核酸和/或多肽的嵌合核酸和/或多肽序列。

术语“受试者”、“个体”和“患者”在本文可互换使用，是指脊椎动物，优选哺乳动物，如人类。哺乳动物包括但不限于鼠、猿、人类、农场动物、竞技动物和宠物。还包括在体内获得或在体外培养的生物实体的组织、细胞及其后代。

如本文所用的，术语“治疗”和“处理”是指用于获得有益或期望的结果的方法，该结果包括但不限于治疗益处和/或预防益处。例如，治疗可以包括施用本文公开的系统或细胞群体。治疗益处是指对一种或多种治疗中的疾病、病况或症状的任何治疗相关的改善或作用。对于预防益处，可将组合物施用于有发生特定疾病、病况或症状的风险的受试者，或报告了疾病的一种或多种生理症状的受试者，即使尚未表现出该疾病、病况或症状。

术语“有效量”或“治疗有效量”是指组合物的量，例如包含免疫细胞的组合物的量，该免疫细胞例如是构成本公开的系统的淋巴细胞(例如，T淋巴细胞和/或NK细胞)，该量在施用于有需要的受试者后足以产生期望的活性。在本公开的上下文中，术语“治疗有效的”是指足以延迟通过本公开的方法治疗的病症的至少一种症状的表现、阻滞其进展、使其发生减轻或缓和的组合物的量。

如本文所用的，术语“电磁辐射”是指来自电磁谱的一个或多个波长，包括但不限于x射线(约0.1纳米(nm)至约10.0nm；或约10¹⁸赫兹(Hz)至约10¹⁶Hz)、紫外(UV)线(约10.0nm至约380nm；或约8×10¹⁶Hz至约10¹⁵Hz)、可见光(约380nm至约750nm；或约8×10¹⁴Hz至约4×10¹⁴Hz)、红外线(约750nm至约0.1厘米(cm)；或约4×10¹⁴Hz至约5×10¹¹Hz)和微波(约0.1cm至约100cm；或约10⁸Hz至约5×10¹¹Hz)。在一些情况下，在紫外线的波长范围内，约300nm至约380nm的波长可被称为“近”紫外，约200nm至约300nm的波长可被称为“远”紫外，而约10至约200nm被称为“极”紫外。在一些情况下，在可见光的波长范围内，约380nm至约490nm的波长可被称为“蓝”光。

如本文所用的术语“电磁辐射源”是指发射电磁辐射的源。电磁辐射源可以发射来自电磁谱的一个或多个波长。

细胞外信号介导的基因调节

在一方面，本公开提供了一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，其中该核定位域是可操作的，以在被活性细胞信号传导途径激活后将所述嵌合多肽移位至细胞核，该细胞信号传导途径是响应于细胞外信号可激活的，其中响应于细胞外信号，所述嵌合多肽定位于细胞核，并且所述基因调节多肽调节靶多核苷酸在细胞核中的表达。

在一方面，本公开提供了一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：a)在结合配体时激活细胞信号传导途径的嵌合受体多肽；和b)嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，该异源核定位域是可操作的，以在被细胞信号传导途径激活后将所述嵌合多肽移位至细胞核，其中在所述配体与所述嵌合受体多肽结合后，所述嵌合多肽经由所激活的异源核定位域定位于细胞核，并且所述基因调节多肽调节靶多核苷酸在细胞核中的表达。

在一方面，本公开提供了一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：a)包含化学化合物的细胞信号传导途径激活剂；和b)嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，该异源核定位域是可操作的，以在被激活的细胞信号传导途径激活后将所述嵌合多肽移位至细胞核，其中在将所述激活剂施用于细胞后，所述嵌合多肽经由激活的异源核定位域定位于细胞核，并且所述基因调节多肽调节靶多核苷酸在细胞核中的表达。

在一方面，本公开提供了一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，其中该核定位域是可操作的，以在被活性细胞信号传导途径激活后，将所述嵌合多肽移位至细胞核，所述细胞信号传导途径是响应于细胞外信号可诱导的，其中响应于所述细胞外信号，所述嵌合多肽定位于细胞核，并且所述基因调节多肽调节靶多核苷酸在细胞核中的表达。

在一方面，本公开提供了一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：a)在结合配体时激活细胞信号传导途径的嵌合受体多肽；和b)嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，所述异源核定位域是可操作的，以在被细胞信号传导途径诱导后将所述嵌合多肽移位至细胞核，其中在所述配体与所述嵌合受体多肽结合后，所述嵌合多肽经由所诱导的异源核定位域定位于细胞核，并且所述基因调节多肽调节靶多核苷酸在细胞核中的表达。

在一方面，本公开提供了一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：a)包含化学化合物的细胞信号传导途径激活剂；和b)嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，所述异源核定位域是可操作的，以在被细胞信号传导途径诱导后将所述嵌合多肽移位至细胞核，其中在将所述激活剂施用于细胞后，所述嵌合多肽经由激活的异源核定位域定位于细胞核，并且所述基因调节多肽调节靶多核苷酸在细胞核中的表达。

在一些实施方案中，基因调节多肽与可调节的定位域(例如，核定位域)框内融合。在一些实施方案中，基因调节多肽包含致动部分，并且该致动部分与可调节的定位域框内融合。可调节的定位域可包括能够被诱导或激活的定位域，由此所述诱导或激活允许定位域定位于预期的位置。

可调节的定位域可包含异源核定位域。异源核定位域可包含核定位信号。

异源核定位域可具有活性和非活性状态。在非活性状态下，异源核定位域可能无法进入细胞核。在活性状态下，异源核定位域可能能够进入细胞核。

异源核定位域可来源于转录因子。该转录因子可以是可调节的转录因子，其仅仅响应于信号或信号传导途径是活性的并且能够移位到细胞核中。该转录因子可以是可调节的转录因子，其主要是活性的并且能够响应于信号或信号传导途径而移位到细胞核中。该转录因子可以是可调节的转录因子，其通常是活性的并且能够响应于信号或信号传导途径而移位到细胞核中。

在本文的一些实施方案中，异源核定位域可以来源于活化T细胞核因子(NFAT)家族成员。例如，异源核定位域可以来源于NFATp、NFAT1、NFATc1、NFATc2、NFATc3、NFAT4、NFATx、NFATc4、NFAT3或NFAT5。

在本文的一些实施方案中，异源核定位域可以来源于核因子κB((NF-κB)、NFKB1p50、激活蛋白1(AP-1)、信号转导及转录激活物1(STAT1)、STAT2、STAT3、STAT4、STAT5(STAT5A和STAT5B)和STAT6、甾醇响应元件结合蛋白(SREBP；例如，SREBP-1或SREBF1)或其他转录因子或信号转导物。

在本文的一些实施方案中，异源核定位域可以来源于细胞内受体。细胞内受体可以是激素激活的受体。激素激活的受体可以是雌激素受体、甲状腺激素受体、类固醇激素受体、第二信使受体、三磷酸肌醇(IP3)受体、内在分泌肽激素受体或神经类固醇受体。

在本文的一些实施方案中，异源核定位域可以来源于光或昼夜节律或电磁感应蛋白质，如隐花色素(例如，CRY1、CRY2)、Timeless(TIM)、PER蛋白的PAS域(例如，PER1、PER2和PER3)。

可调节的定位域或异源核定位域可以响应于信号而在非活性状态与活性状态之间切换。活性状态与非活性状态之间的切换可以是化学修饰的结果。化学修饰可以是脱磷酸化、磷酸化、脱甲基化、甲基化、乙酰化、脱乙酰基、脱氨基、泛素化、脱泛素化、蛋白水解加工或其他合适的化学修饰。在一些情况下，化学修饰导致从非活性状态切换至活性状态。在一些情况下，化学修饰导致结构变化或构象变化，从而导致从非活性状态切换至活性状态。在一些情况下，该结构或构象变化使在非活性状态下不会暴露的定位域的一部分得到暴露，从而产生活性状态。

可调节的定位域或异源核定位域可以响应于信号而在非活性状态与活性状态之间切换。该信号可以是诱导信号或激活信号。该信号可以是信号或信号传导途径的结果。在一些实例中，信号传导途径在细胞中被激活或诱导。信号或信号传导途径可引起可调节的定位域或异源核定位域的化学修饰。化学修饰可以是脱磷酸化、磷酸化、脱甲基化、甲基化、乙酰化、脱乙酰基、脱氨基、泛素化、脱泛素化、蛋白水解加工或其他合适的化学修饰。在一些情况下，化学修饰导致从非活性状态切换至活性状态。在一些情况下，化学修饰导致结构变化或构象变化，从而导致从非活性状态切换至活性状态。在一些情况下，该结构或构象变化使在非活性状态下不会暴露的定位域的一部分得到暴露，从而产生活性状态。

在一些实施方案中，相对于在不存在细胞外信号的情况下细胞中细胞内离子的基础水平，如上提及的细胞外信号(例如，配体、化学化合物等)可以升高细胞中的细胞内离子(例如，钠、钾、氯、碳酸氢根、钙、磷酸根等)浓度。在一些情况下，细胞外离子可包含钙。在一些情况下，细胞外离子可以是钙。对于某些定位域或部分(例如核定位域，例如NFAT)，细胞的细胞内离子信号传导的调节对于定位域的激活可能至关重要。例如，在NFAT蛋白的情况下，钙调蛋白(CaM)(其可以是钙传感器蛋白)可以通过细胞中的细胞内钙水平的升高而激活。在一个或多个钙离子与CaM结合后，CaM继而激活丝氨酸/苏氨酸磷酸酶钙依赖磷酸酶(CN)。随后，被激活的CN快速修饰NFAT蛋白的一个或多个区域(例如，使NFAT蛋白的氨基末端的富含丝氨酸的区域(SRR)和SP重复序列磷酸化)，从而导致构象变化，该构象变化暴露出核定位信号，从而导致NFAT核输入。

在一些实施方案中，信号传导途径被信号或信号传导途径激活或诱导。在一些实施方案中，信号传导途径被受试者的嵌合受体或受试者的跨膜受体激活或诱导。在一些实施方案中，信号传导途径被信号传导级联激活或诱导，该信号传导级联又被受试者的嵌合受体或受试者的跨膜受体激活。

在一些实施方案中，可在非活性与活性状态之间切换异源核定位域的在细胞中激活或诱导的信号传导途径是PI3K/AKT途径。在一些实施方案中，该途径中的跨膜受体包括酪氨酸激酶受体、整联蛋白、B细胞受体、T细胞受体、细胞因子受体或G蛋白偶联受体，并且该信号传导途径进一步涉及PRKCE、ITGAM、ITGA5、IRAK1、PRKAA2、EIF2AK2、PTEN、EIF4E、PRKCZ、GRK6、MAPK1、TSC1、PLK1、AKT2、IKBKB、PIK3CA、CDK8、CDKN1B、NFKB2、BCL2、PIK3CB、PPP2R1A、MAPK8、BCL2L1、MAPK3、TSC2、ITGA1、KRAS、EIF4EBP1、RELA、PRKCD、NOS3、PRKAA1、MAPK9、CDK2、PPP2CA、PIM1、ITGB7、YWHAZ、ILK、TP53、RAF1、IKBKG、RELB、DYRK1A、CDKN1A、ITGB1、MAP2K2、JAK1、AKT1、JAK2、PIK3R1、CHUK、PDPK1、PPP2R5C、CTNNB1、MAP2K1、NFKB1、PAK3、ITGB3、CCND1、GSK3A、FRAP1、SFN、ITGA2、TTK、CSNK1A1、BRAF、GSK3B、AKT3、FOXO1、SGK、HSP90AA1或RPS6KB1。

在一些实施方案中，可在非活性与活性状态之间切换异源核定位域的在细胞中激活或诱导的信号传导途径是ERK/MAPK途径。在一些实施方案中，该途径中的跨膜受体包括EGFR、Trk A/B、成纤维细胞生长因子受体(FGFR)或血小板衍生生长因子受体(PDGFR)，并且该信号传导途径进一步涉及PRKCE、ITGAM、ITGA5、HSPB1、IRAK1、PRKAA2、EIF2AK2、RAC1、RAP1A、TLN1、EIF4E、ELK1、GRK6、MAPK1、RAC2、PLK1、AKT2、PIK3CA、CDK8、CREB1、PRKCI、PTK2、FOS、RPS6KA4、PIK3CB、PPP2R1A、PIK3C3、MAPK8、MAPK3、ITGA1、ETS1、KRAS、MYCN、EIF4EBP1、PPARG、PRKCD、PRKAA1、MAPK9、SRC、CDK2、PPP2CA、PIM1、PIK3C2A、ITGB7、YWHAZ、PPP1CC、KSR1、PXN、RAF1、FYN、DYRK1A、ITGB1、MAP2K2、PAK4、PIK3R1、STAT3、PPP2R5C、MAP2K1、PAK3、ITGB3、ESR1、ITGA2、MYC、TTK、CSNK1A1、CRKL、BRAF、ATF4、PRKCA、SRF、STAT1或SGK。

在一些实施方案中，可在非活性与活性状态之间切换异源核定位域的在细胞中激活或诱导的信号传导途径是糖皮质激素受体信号传导途径。在一些实施方案中，该途径中的跨膜受体包括糖皮质激素受体，并且该信号传导途径进一步涉及RAC1、TAF4B、EP300、SMAD2、TRAF6、PCAF、ELK1、MAPK1、SMAD3、AKT2、IKBKB、NCOR2、UBE2I、PIK3CA、CREB1、FOS、HSPA5、NFKB2、BCL2、MAP3K14、STAT5B、PIK3CB、PIK3C3、MAPK8、BCL2L1、MAPK3、TSC22D3、MAPK10、NRIP1、KRAS、MAPK13、RELA、STAT5A、MAPK9、NOS2A、PBX1、NR3C1、PIK3C2A、CDKN1C、TRAF2、SERPINE1、NCOA3、MAPK14、TNF、RAF1、IKBKG、MAP3K7、CREBBP、CDKN1A、MAP2K2、JAK1、IL8、NCOA2、AKT1、JAK2、PIK3R1、CHUK、STAT3、MAP2K1、NFKB1、TGFBR1、ESR1、SMAD4、CEBPB、JUN、AR、AKT3、CCL2、MMP1、STAT1、IL6或HSP90AA1。

在一些实施方案中，可在非活性与活性状态之间切换异源核定位域的在细胞中激活或诱导的信号传导途径是B细胞受体信号传导途径。在一些实施方案中，该途径中的跨膜受体包括B细胞受体，并且该信号传导途径进一步涉及RAC1、PTEN、LYN、ELK1、MAPK1、RAC2、PTPN11、AKT2、IKBKB、PIK3CA、CREB1、SYK、NFKB2、CAMK2A、MAP3K14、PIK3CB、PIK3C3、MAPK8、BCL2L1、ABL1、MAPK3、ETS1、KRAS、MAPK13、RELA、PTPN6、MAPK9、EGR1、PIK3C2A、BTK、MAPK14、RAF1、IKBKG、RELB、MAP3K7、MAP2K2、AKT1、PIK3R1、CHUK、MAP2K1、NFKB1、CDC42、GSK3A、FRAP1、BCL6、BCL10、JUN、GSK3B、ATF4、AKT3、VAV3或RPS6KB1。

在一些实施方案中，可在非活性与活性状态之间切换异源核定位域的在细胞中激活或诱导的信号传导途径是整联蛋白信号传导途径。在一些实施方案中，该途径中的跨膜受体包括整联蛋白或整联蛋白亚单位，并且该信号传导途径进一步涉及ACTN4、ITGAM、ROCK1、ITGA5、RAC1、PTEN、RAP1A、TLN1、ARHGEF7、MAPK1、RAC2、CAPNS1、AKT2、CAPN2、PIK3CA、PTK2、PIK3CB、PIK3C3、MAPK8、CAV1、CAPN1、ABL1、MAPK3、ITGA1、KRAS、RHOA、SRC、PIK3C2A、ITGB7、PPP1CC、ILK、PXN、VASP、RAF1、FYN、ITGB1、MAP2K2、PAK4、AKT1、PIK3R1、TNK2、MAP2K1、PAK3、ITGB3、CDC42、RND3、ITGA2、CRKL、BRAF、GSK3B或AKT3。

在一些实施方案中，可在非活性与活性状态之间切换异源核定位域的在细胞中激活或诱导的信号传导途径是胰岛素受体信号传导途径。在一些实施方案中，该途径中的跨膜受体包括胰岛素受体，并且该信号传导途径进一步涉及PTEN、INS、EIF4E、PTPN1、PRKCZ、MAPK1、TSC1、PTPN11、AKT2、CBL、PIK3CA、PRKCI、PIK3CB、PIK3C3、MAPK8、IRS1、MAPK3、TSC2、KRAS、EIF4、EBP1,SLC2A4、PIK3C2A、PPP1CC、INSR、RAF1、FYN、MAP2K2、JAK1、AKT1、JAK2、PIK3R1、PDPK1、MAP2K1、GSK3A、FRAP1、CRKL、GSK3B、AKT3、FOXO1、SGK或RPS6KB1。

在一些实施方案中，可在非活性与活性状态之间切换异源核定位域的在细胞中激活或诱导的信号传导途径是T细胞受体信号传导途径。在一些实施方案中，该途径中的跨膜受体包括T细胞受体，并且该信号传导途径进一步涉及RAC1、ELK1、MAPK1、IKBKB、CBL、PIK3CA、FOS、NFKB2、PIK3CB、PIK3C3、MAPK8、MAPK3、KRAS、RELA、PIK3C2A、BTK、LCK、RAF1、IKBKG、RELB、FYN、MAP2K2、PIK3R1、CHUK、MAP2K1、NFKB1、ITK、BCL10、JUN或VAV3。

在一些实施方案中，可在非活性与活性状态之间切换异源核定位域的在细胞中激活或诱导的信号传导途径是G蛋白偶联受体(GPCR)信号传导途径。在一些实施方案中，该途径中的跨膜受体包括GPCR，并且该信号传导途径进一步涉及PRKCE、RAP1A、RGS16、MAPK1、GNAS、AKT2、IKBKB、PIK3CA、CREB1、GNAQ、NFKB2、CAMK2A、PIK3CB、PIK3C3、MAPK3、KRAS、RELA、SRC、PIK3C2A、RAF1、IKBKG、RELB、FYN、MAP2K2、AKT1、PIK3R1、CHUK、PDPK1、STAT3、MAP2K1、NFKB1、BRAF、ATF4、AKT3或PRKCA。

由来自不同分子的各个区域或结构域的接合产生的嵌合跨膜受体可以与结构域所源自的分子不同，例如在结构上和功能上。然而，在一些情况下，各个结构域可保留天然结构和/或活性。例如，各个结构域可保留天然结构和/或活性的至少5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％或95％。例如，包含配体结合域的胞外区可以保留胞外区所源自的分子的结合亲和力的至少5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％或95％。再例如，与胞内区所源自的分子相比，包含信号传导域的胞内区可保留激活细胞信号传导途径的能力的至少5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％或95％。

示例性构型的嵌合跨膜受体多肽可包含(a)胞外区，(b)跨膜区，和(c)胞内区。在一些实施方案中，胞外区可包含结合配体如抗原的配体相互作用域。在一些实施方案中，胞内区包含细胞信号传导域。在一些实施方案中，胞内区包含免疫细胞信号传导域。

嵌合跨膜受体多肽的配体相互作用域可包含能够与配体例如抗原结合的任何蛋白质或分子。本文公开的嵌合跨膜受体多肽的配体相互作用域可以是单克隆抗体、多克隆抗体、重组抗体、人抗体、人源化抗体或其功能衍生物、变体或片段，包括但不限于Fab、Fab'、F(ab')₂、Fv、单链Fv(scFv)、微抗体、双抗体以及单域抗体如重链可变域(VH)、轻链可变域(VL)和骆驼科来源的纳米抗体的可变域(VHH)。在一些实施方案中，配体相互作用域包含Fab、Fab'、F(ab')₂、Fv和scFv中的至少一种。在一些实施方案中，配体F(ab')₂包含抗体模拟物。抗体模拟物是指能够以与抗体相当的亲和力与靶分子结合的分子，并且包括单链结合分子、基于细胞色素b562的结合分子、纤连蛋白或纤连蛋白样蛋白支架(例如，adnectin)、脂质运载蛋白支架、杯芳烃支架、A结构域和其他支架。在一些实施方案中，配体相互作用域包含跨膜受体或其任何衍生物、变体或片段。例如，相互作用域可包括跨膜受体的至少配体结合域。

在一些实施方案中，配体相互作用域包含人源化抗体。人源化抗体可使用多种技术产生，包括但不限于CDR移植、镶饰(veneering)或表面重塑(resurfacing)、链改组和其他技术。可选择包括轻链和重链的人可变域以降低人源化抗体的免疫原性。在一些实施方案中，嵌合跨膜受体多肽的配体相互作用域包含以高亲和力与抗原结合并且具有其他有利的生物性质(如降低和/或最小的免疫原性)的人源化抗体片段。人源化抗体或抗体片段可保留与对应的非人源化抗体相似的抗原特异性。

在一些实施方案中，配体相互作用域包含单链可变片段(scFv)。scFv分子可通过使用柔性连接体如多肽连接体将免疫球蛋白的重链(V_H)和轻链(V_L)区连接在一起而产生。可根据各种方法制备scFv。

在一些实施方案中，对配体相互作用域进行工程改造，以使之与特定靶抗原结合。例如，配体相互作用域可以是工程化的scFv。包含scFv的配体相互作用域可以使用多种方法进行工程改造，包括但不限于展示文库，如噬菌体展示文库、酵母展示文库、基于细胞的展示文库(例如，哺乳动物细胞)、蛋白质-核酸融合、核糖体展示文库和/或大肠杆菌(E.coli)周质展示文库。在一些实施方案中，工程化的配体相互作用域可以以比类似抗体或未经工程改造的抗体更高的亲和力与抗原结合。

在一些实施方案中，配体相互作用域结合多种抗原，例如至少2、3、4、5、6、7、8、9或10种抗原。配体相互作用域可以结合两种相关抗原，如肉毒杆菌毒素的两种亚型(例如，肉毒杆菌神经毒素亚型A1和亚型A2)。配体相互作用域可以结合两种不相关的蛋白质，如受体酪氨酸激酶erbB-2(也称为Neu、ERBB2和HER2)和血管内皮生长因子(VEGF)。能够与两种抗原结合的抗原相互作用域可包括被工程改造以在抗体的不同但重叠的位点与两种不相关的蛋白质靶标结合的抗体。在一些实施方案中，与多种抗原结合的抗原相互作用域包括双特异性抗体分子。双特异性抗体分子可具有对第一表位具有结合特异性的第一免疫球蛋白可变域序列和对第二表位具有结合特异性的第二免疫球蛋白可变域序列。在一些实施方案中，第一和第二表位在相同的抗原例如相同的蛋白质(或多聚蛋白质的亚单位)上。第一和第二表位可以重叠。在一些实施方案中，第一和第二表位不重叠。在一些实施方案中，第一和第二表位在不同的抗原例如不同的蛋白质(或多聚蛋白质的不同亚单位)上。在一些实施方案中，双特异性抗体分子包含对第一表位具有结合特异性的重链可变域序列和轻链可变域序列以及对第二表位具有结合特异性的重链可变域序列和轻链可变域序列。在一些实施方案中，双特异性抗体分子包含对第一表位具有结合特异性的半抗体和对第二表位具有结合特异性的半抗体。在一些实施方案中，双特异性抗体分子包含对第一表位具有结合特异性的半抗体或其片段以及对第二表位具有结合特异性的半抗体或其片段。

在一些实施方案中，嵌合跨膜受体多肽的胞外区包含多个配体相互作用域，例如至少2个配体相互作用域(例如，至少3、4、5、6、7、8、9或10个配体相互作用域)。多个配体相互作用域可表现出与相同或不同的配体的结合。在一些实施方案中，胞外区包含至少两个配体相互作用域，例如至少两个串联连接的scFv。在一些实施方案中，两个scFv片段通过肽连接体连接。

嵌合跨膜受体多肽的胞外区的配体相互作用域可以与膜结合的抗原例如细胞(例如，靶细胞)的细胞外表面上的抗原结合。在一些实施方案中，配体相互作用域与未与膜结合的抗原(例如，非膜结合的抗原)例如细胞(例如，靶细胞)分泌的细胞外抗原或位于细胞(例如，靶细胞)的细胞质中的抗原结合。抗原(例如，膜结合的和非膜结合的抗原)可与疾病相关，该疾病例如是病毒、细菌和/或寄生虫感染；炎性疾病和/或自身免疫病；或者瘤如癌症和/或肿瘤。可被本发明系统的嵌合跨膜受体多肽的配体相互作用域结合的抗原的非限制性实例包括但不限于1-40-β-淀粉状蛋白、4-1BB、5AC、5T4、707-AP、激酶锚定蛋白4(AKAP-4)、激活素受体2B型(ACVR2B)、激活素受体样激酶1(ALK1)、腺癌抗原、脂肪分化相关蛋白(adipophilin)、肾上腺素受体β3(ADRB3)、AGS-22M6、α叶酸受体、甲胎蛋白(AFP)、AIM-2、间变性淋巴瘤激酶(ALK)、雄激素受体、血管生成素2、血管生成素3、血管生成素结合细胞表面受体2(Tie 2)、炭疽毒素、AOC3(VAP-1)、B细胞成熟抗原(BCMA)、B7-H3(CD276)、炭疽杆菌、B细胞活化因子(BAFF)、B淋巴瘤细胞、骨髓基质细胞抗原2(BST2)、印迹位点调节物兄弟因子(BORIS)、C242抗原、C5、CA-125、癌抗原125(CA-125或称MUC16)、癌/睾丸抗原1(NY-ESO-1)、癌/睾丸抗原2(LAGE-1a)、碳酸酐酶9(CA-IX)、癌胚抗原(CEA)、心肌肌球蛋白、CCCTC-结合因子(CTCF)、CCL11(嗜酸性粒细胞趋化因子-1)、CCR4、CCR5、CD11、CD123、CD125、CD140a、CD147(basigin)、CD15、CD152、CD154(CD40L)、CD171、CD179a、CD18、CD19、CD2、CD20、CD200、CD22、CD221、CD23(IgE受体)、CD24、CD25(IL-2受体的α链)、CD27、CD274、CD28、CD3、CD3ε、CD30、CD300分子样家族成员f(CD300LF)、CD319(SLAMF7)、CD33、CD37、CD38、CD4、CD40、CD40配体、CD41、CD44 v7、CD44 v8、CD44 v6、CD5、CD51、CD52、CD56、CD6、CD70、CD72、CD74、CD79A、CD79B、CD80、CD97、CEA相关抗原、CFD、ch4D5、X染色体开放阅读框61(CXORF61)、紧密连接蛋白18.2(CLDN18.2)、紧密连接蛋白6(CLDN6)、艰难梭菌(Clostridium difficile)、聚集因子A、CLCA2、集落刺激因子1受体(CSF1R)、CSF2、CTLA-4、C型凝集素结构域家族12成员A(CLEC12A)、C型凝集素样分子-1(CLL-1或称CLECL1)、C-X-C趋化因子受体4型、细胞周期蛋白B1、细胞色素P4501B1(CYP1B1)、cyp-B、巨细胞病毒、巨细胞病毒糖蛋白B、达比加群、DLL4、DPP4、DR5、大肠杆菌志贺毒素1型、大肠杆菌志贺毒素2型、胞外ADP-核糖基转移酶4(ART4)、含EGF样模体粘液样激素受体样2(EMR2)、EGF样结构域蛋白7(EGFL7)、突变型延伸因子2(ELF2M)、内毒素、肝配蛋白A2、肝配蛋白B2、肝配蛋白A型受体2、表皮生长因子受体(EGFR)、表皮生长因子受体变体Ⅲ(EGFRvIII)、上皮唾液蛋白、上皮细胞粘附分子(EpCAM)、上皮糖蛋白2(EGP-2)、上皮糖蛋白40(EGP-40)、ERBB2、ERBB3、ERBB4、ERG(跨膜丝氨酸蛋白酶2(TMPRSS2)ETS融合基因)、大肠杆菌、位于12p染色体上的ETS易位变体基因6(ETV6-AML)、呼吸道合胞病毒F蛋白、FAP、IgA受体的Fc片段(FCAR或称CD89)、Fc受体样5(FCRL5)、胎儿乙酰胆碱受体、纤维蛋白IIβ链、成纤维细胞活化蛋白α(FAP)、纤连蛋白胞外域B、FGF-5、Fms样酪氨酸激酶3(FLT3)、叶酸结合蛋白(FBP)、叶酸水解酶、叶酸受体1、叶酸受体α、叶酸受体β、Fos相关抗原1、卷曲受体、岩藻糖基GM1、G250、G蛋白偶联受体20(GPR20)、G蛋白偶联受体C类5组成员D(GPRC5D)、神经节苷脂G2(GD2)、GD3神经节苷脂、糖蛋白100(gp100)、磷脂酰肌醇蛋白聚糖3(GPC3)、GMCSF受体α链、GPNMB、GnT-V、生长分化因子8、GUCY2C、突变型热休克蛋白70-2(mut hsp70-2)、血凝素、甲型肝炎病毒细胞受体1(HAVCR1)、乙型肝炎表面抗原、乙型肝炎病毒、HER1、HER2/neu、HER3、globoH糖神经酰胺的己糖部分(GloboH)、HGF、HHGFR、高分子量黑素瘤相关抗原(HMW-MAA)、组蛋白复合物、HIV-1、HLA-DR、HNGF、Hsp90、HST-2(FGF6)、人乳头瘤病毒E6(HPV E6)、人乳头瘤病毒E7(HPVE7)、人分散因子受体激酶、人端粒酶逆转录酶(hTERT)、人TNF、ICAM-1(CD54)、iCE、IFN-α、IFN-β、IFN-γ、IgE、IgE Fc区、IGF-1、IGF-1受体、IGHE、IL-12、IL-13、IL-17、IL-17A、IL-17F、IL-1β、IL-20、IL-22、IL-23、IL-31、IL-31RA、IL-4、IL-5、IL-6、IL-6受体、IL-9、免疫球蛋白λ样多肽1(IGLL1)、甲型流感血凝素、胰岛素样生长因子1受体(IGF-I受体)、胰岛素样生长因子2(ILGF2)、整联蛋白α4β7、整联蛋白β2、整联蛋白α2、整联蛋白α4、整联蛋白α5β1、整联蛋白α7β7、整联蛋白αIIbβ3、整联蛋白αvβ3、干扰素α/β受体、干扰素γ诱导蛋白、白介素11受体α(IL-11Rα)、白介素13受体亚单位α-2(IL-13Ra2或称CD213A2)、肠道羧基酯酶、激酶结构域(KDR)、KIR2D、KIT(CD117)、L1细胞粘附分子(L1-CAM)、豆荚蛋白、白细胞免疫球蛋白样受体亚家族A成员2(LILRA2)、白细胞相关免疫球蛋白样受体1(LAIR1)、Lewis-Y抗原、LFA-1(CD11a)、LINGO-1、磷脂壁酸质、LOXL2、L-选择蛋白(CD62L)、淋巴细胞抗原6复合物、基因座K9(LY6K)、淋巴细胞抗原75(LY75)、淋巴细胞特异性蛋白质酪氨酸激酶(LCK)、淋巴毒素-α(LT-α)或肿瘤坏死因子-β(TNF-β)、巨噬细胞移动抑制因子(MIF或MMIF)、M-CSF、乳腺分化抗原(NY-BR-1)、MCP-1、黑素瘤癌睾丸抗原-1(MAD-CT-1)、黑素瘤癌睾丸抗原-2(MAD-CT-2)、黑素瘤凋亡抑制剂(ML-IAP)、黑素瘤相关抗原1(MAGE-A1)、间皮素、粘蛋白1、细胞表面相关(MUC1)、MUC-2、粘蛋白CanAg、髓鞘相关糖蛋白、肌肉生长抑制素、N-乙酰葡糖胺转移酶V(NA17)、NCA-90(粒细胞抗原)、神经生长因子(NGF)、神经凋亡调节蛋白水解酶1、神经细胞粘附分子(NCAM)、神经突增生抑制剂(例如，NOGO-A、NOGO-B、NOGO-C)、神经毡蛋白-1(NRP1)、N-羟乙酰神经氨酸、NKG2D、Notch受体、o-乙酰-GD2神经节苷脂(OAcGD2)、嗅觉受体51E2(OR51E2)、癌胚抗原(h5T4)、由断裂点簇区(BCR)和Abelson鼠白血病病毒癌基因同源物1(Abl)组成的癌基因融合蛋白(bcr-abl)、穴兔(Oryctolagus cuniculus)、OX-40、oxLDL、p53突变体、配对盒蛋白Pax-3(PAX3)、配对盒蛋白PAX-5(PAX5)、泛连接蛋白(pannexin)3(PANX3)、磷酸-钠共转运蛋白、磷脂酰丝氨酸、胎盘特异性1(Pal1)、血小板衍生生长因子受体α(PDGF-Rα)、血小板衍生生长因子受体β(PDGFR-β)、多聚唾液酸、前顶体素结合蛋白sp32(OY-TES1)、程序性细胞死亡蛋白1(PD-1)、蛋白原转变酶枯草杆菌蛋白酶/kexin 9型(PCSK9)、前列腺酶(prostase)、前列腺癌肿瘤抗原-1(PCTA-1或称半乳凝素8)、T细胞识别的黑素瘤抗原1(MelanA或称MART1)、P15、p53、PRAME、前列腺干细胞抗原(PSCA)、前列腺特异性膜抗原(PSMA)、前列腺酸性磷酸酶(PAP)、前列腺癌细胞、前列腺特异性蛋白(prostein)、蛋白酶丝氨酸21(Testisin或PRSS21)、蛋白酶体(前体，巨蛋白因子)β亚单位9型(LMP2)、铜绿假单胞菌(Pseudomonas aeruginosa)、狂犬病病毒糖蛋白、RAGE、Ras同源家族成员C(RhoC)、核因子κ-B配体的受体激活剂(RANKL)、晚期糖基化终产物受体(RAGE-1)、受体酪氨酸激酶样孤儿受体1(ROR1)、肾泛素1(RU1)、肾泛素2(RU2)、呼吸道合胞病毒、Rh血型D抗原、恒河猴因子、肉瘤易位断裂点、骨硬化蛋白(SOST)、选择蛋白P、唾液酸Lewis粘附分子(sLe)、精子蛋白17(SPA17)、鞘氨醇-1-磷酸、T细胞1、2和3识别的鳞状细胞癌抗原(SART1、SART2和SART3)、阶段特异性胚抗原-4(SSEA-4)、金黄色葡萄球菌、STEAP1、存活素(surviving)、粘结蛋白聚糖1(SDC1)+A314、SOX10、存活蛋白、存活素2B、滑膜肉瘤、X断裂点2(SSX2)、T细胞受体、TCRΓ交替阅读框蛋白(TARP)、端粒酶、TEM1、生腱蛋白C、TGF-β(如TGF-β1、TGF-β2、TGF-β3)、促甲状腺激素受体(TSHR)、组织因子途径抑制剂(TFPI)、Tn抗原((Tn Ag)或(GalNAcα-Ser/Thr))、TNF受体家族成员B细胞成熟(BCMA)、TNF-α、TRAIL-R1、TRAIL-R2、TRG、转谷氨酰胺酶5(TGS5)、肿瘤抗原CTAA16.88、肿瘤内皮标志物1(TEM1/CD248)、肿瘤内皮标志物7-相关(TEM7R)、肿瘤蛋白p53(p53)、MUC1的肿瘤特异性糖基化、肿瘤相关钙信号转导蛋白2、肿瘤相关糖蛋白72(TAG72)、肿瘤相关糖蛋白72(TAG-72)+A327、TWEAK受体、酪氨酸酶、酪氨酸酶相关蛋白1(TYRP1或称糖蛋白75)、酪氨酸酶相关蛋白2(TYRP2)、尿路血小板溶素2(UPK2)、血管内皮生长因子(例如，VEGF-A、VEGF-B、VEGF-C、VEGF-D、PIGF)、血管内皮生长因子受体1(VEGFR1)、血管内皮生长因子受体2(VEGFR2)、波形蛋白、v-myc禽骨髓细胞瘤病毒癌基因成神经细胞瘤衍生的同源物(MYCN)、von Willebrand因子(VWF)、Wilms肿瘤蛋白(WT1)、X抗原家族成员1A(XAGE1)、β-淀粉状蛋白和κ-轻链。

在一些实施方案中，配体相互作用域与抗原结合，该抗原选自：707-AP、生物素化分子、a-辅肌动蛋白-4、abl-bcr alb-b3(b2a2)、abl-bcr alb-b4(b3a2)、脂肪分化相关蛋白、AFP、AIM-2、膜联蛋白II、ART-4、BAGE、b-联蛋白、bcr-abl、bcr-abl p190(e1a2)、bcr-abl p210(b2a2)、bcr-abl p210(b3a2)、BING-4、CAG-3、CAIX、CAMEL、Caspase-8、CD171、CD19、CD20、CD22、CD23、CD24、CD30、CD33、CD38、CD44v7/8、CDC27、CDK-4、CEA、CLCA2、Cyp-B、DAM-10、DAM-6、DEK-CAN、EGFRvIII、EGP-2、EGP-40、ELF2、Ep-CAM、EphA2、EphA3、erb-B2、erb-B3、erb-B4、ES-ESO-1a、ETV6/AML、FBP、胎儿乙酰胆碱受体、FGF-5、FN、G250、GAGE-1、GAGE-2、GAGE-3、GAGE-4、GAGE-5、GAGE-6、GAGE-7B、GAGE-8、GD2、GD3、GnT-V、Gp100、gp75、Her-2、HLA-A*0201-R170I、HMW-MAA、HSP70-2 M、HST-2(FGF6)、HST-2/neu、hTERT、iCE、IL-11Rα、IL-13Rα2、KDR、KIAA0205、K-RAS、L1-细胞粘附分子、LAGE-1、LDLR/FUT、Lewis Y、MAGE-1、MAGE-10、MAGE-12、MAGE-2、MAGE-3、MAGE-4、MAGE-6、MAGE-A1、MAGE-A2、MAGE-A3、MAGE-A6、MAGE-B1、MAGE-B2、苹果酸酶、乳腺珠蛋白-A、MART-1/Melan-A、MART-2、MC1R、M-CSF、间皮素、MUC1、MUC16、MUC2、MUM-1、MUM-2、MUM-3、肌球蛋白、NA88-A、Neo-PAP、NKG2D、NPM/ALK、N-RAS、NY-ESO-1、OA1、OGT、癌胚抗原(h5T4)、OS-9、P多肽、P15、P53、PRAME、PSA、PSCA、PSMA、PTPRK、RAGE、ROR1、RU1、RU2、SART-1、SART-2、SART-3、SOX10、SSX-2、存活蛋白、存活蛋白-2B、SYT/SSX、TAG-72、TEL/AML1、TGFaRII、TGFbRII、TP1、TRAG-3、TRG、TRP-1、TRP-2、TRP-2/INT2、TRP-2-6b、酪氨酸酶、VEGF-R2、WT1、α-叶酸受体和κ-轻链。在一些实施方案中，配体相互作用域与肿瘤相关抗原结合。

在一些实施方案中，跨膜受体包括内源受体。任何合适的内源受体均可以在本发明系统中使用。跨膜受体可包括Notch受体；G蛋白偶联受体(GPCR)；整联蛋白受体；钙粘着蛋白受体；催化受体，包括具有酶促活性的受体，以及不具有内在酶促活性而是通过刺激非共价结合的酶(例如，激酶)起作用的受体；死亡受体，如肿瘤坏死因子受体(TNFR)超家族成员；免疫受体；或其任何变体。在一些实施方案中，所述系统的跨膜受体包括GPCR。在一些实施方案中，所述系统的跨膜受体包括整联蛋白亚单位。

在一些实施方案中，本发明系统的跨膜受体包括外源受体。在一些实施方案中，该外源受体是合成受体。在一些实施方案中，该合成受体是嵌合受体。跨膜受体可包括嵌合抗原受体(CAR)、合成整联蛋白受体、合成Notch受体或合成GPCR受体。

在一些实施方案中，跨膜受体包括嵌合抗原受体(CAR)。CAR的配体结合域(例如，胞外区)可包含Fab、单链可变片段(scFv)、内源受体(例如，GPCR、整联蛋白受体、T细胞受体、B细胞受体等)的胞外区、或Fc结合域。CAR可包含跨膜结构域，其使受体位于细胞膜(例如，质膜、细胞器膜等)中。在一些实施方案中，CAR的信号传导域(例如，胞内区)包含至少一个基于免疫受体酪氨酸的活化基序(ITAM)。在一些实施方案中，CAR的信号传导域(例如，胞内区)包含至少一个基于免疫受体酪氨酸的抑制基序(ITIM)。在一些实施方案中，CAR包含ITAM基序和ITIM基序两者。在一些实施方案中，CAR包含至少一个共刺激域。

在配体与跨膜受体的配体结合域结合后，无论是内源跨膜受体还是外源跨膜受体(例如，合成受体，例如嵌合受体)，该受体的信号传导域都可以激活细胞的至少一个信号传导途径。通过翻译调节；转录调节；以及表观遗传修饰，包括甲基化、乙酰化、磷酸化、泛素化、SUMO化、核糖基化和瓜氨酸化的调节，信号传导途径及其相关蛋白质可以参与调节(例如，激活和/或去激活)细胞应答，如基因表达的程序化改变。

在一些情况下，由信号传导途径的激活引起的细胞应答包括核定位域的激活。由信号传导途径的激活引起的细胞应答可以去除或释放抑制物，否则该抑制物将使核定位域保持非活性状态。或者，由信号传导途径的激活引起的细胞应答可以使核定位域失活。由信号传导途径的激活引起的细胞应答可以激活或募集抑制物，该抑制物将核定位域切换至非活性状态或使核定位域保持非活性状态。

在一些情况下，响应于信号传导途径激活的转录调节可在本文提供的系统中使用，以表达基因调节多肽(GMP)。可以将编码GMP的核酸序列或称为GMP编码序列置于对响应于配体-受体结合在细胞中激活的信号传导途径有响应的启动子的控制下。

在本文各方面的各个实施方案中，跨膜受体包括内源受体。内源受体的非限制性实例包括Notch受体；G蛋白偶联受体(GPCR)；整联蛋白受体；钙粘着蛋白受体；催化受体，包括具有酶促活性的受体，以及不具有内在酶促活性而是通过刺激非共价结合的酶(例如，激酶)起作用的受体；死亡受体，如肿瘤坏死因子受体(TNFR)超家族成员；以及免疫受体。

在本文各方面的各个实施方案中，跨膜受体包括外源受体。在一些情况下，外源受体是不同生物体或物种的受体。在一些情况下，外源受体可包括在细胞中非天然发现的合成受体。在一些实施方案中，合成跨膜受体是通过连接来自不同分子(例如，不同的蛋白质、同源蛋白质、直向同源蛋白质等)的多个结构域(例如，胞外域、跨膜域、胞内域等)而构建的嵌合受体。

本发明系统的嵌合跨膜受体可包括内源受体或其任何变体。嵌合跨膜受体可以例如通过配体结合域与至少一个配体特异性结合。配体结合域通常形成跨膜受体的胞外区的一部分，并且可以感测细胞外配体。响应于配体结合，嵌合跨膜受体的胞内区可以激活细胞的信号传导途径。在一些情况下，受体的信号传导域激活细胞的信号传导途径。

在一些实施方案中，跨膜受体包括Notch受体或其任何变体(例如，合成或嵌合受体)。Notch受体是跨膜蛋白质，其介导细胞-细胞接触信号传导，并在细胞-细胞通信(例如，两个接触细胞(接收细胞和发送细胞)间的通信)的发展和其他方面起重要作用。在接收细胞上表达的Notch受体识别在发送细胞上表达的其配体(蛋白质的δ家族)。Notch和δ在这些接触细胞上的接合导致Notch受体的两步蛋白水解，最终导致受体的细胞内部分从膜释放到细胞质中。

在一些实施方案中，跨膜受体包括Notch受体，其选自Notch1、Notch2、Notch3和Notch4、其任何同源物及其任何变体。在一些实施方案中，嵌合受体至少包含Notch受体或其任何变体的胞外区(例如，配体结合域)。在一些实施方案中，嵌合受体至少包含Notch或其任何变体的跨膜区。在一些实施方案中，嵌合受体至少包含Notch或其任何变体的胞内区(例如，细胞质结构域)。包含Notch或其任何变体的嵌合受体多肽可以与Notch配体结合。在一些实施方案中，配体与包含Notch或其任何变体的嵌合受体结合，导致Notch信号传导途径的激活。

在一些实施方案中，跨膜受体包括G蛋白偶联受体(GPCR)或其任何变体(例如，合成或嵌合受体)。GPCR通常以七跨膜的α螺旋为特征，并且可以以类似于桶的三级结构排列，七跨膜螺旋在质膜内形成腔，用作配体结合域。配体还可以在其他地方与GPCR结合，例如与细胞外环和/或N末端尾结合。配体结合可以激活相关的G蛋白，后者随后在各种信号传导途径中起作用。为了使该信号传导去激活，可以首先通过磷酸化对GPCR进行化学修饰。然后，磷酸化可以募集共衔接蛋白(例如，抑制蛋白)以用于另外的信号传导。

在一些实施方案中，跨膜受体包括GPCR，其选自A类孤儿受体；B类孤儿受体；C类孤儿受体；1型味觉受体；2型味觉受体；5-羟色胺受体；乙酰胆碱受体(毒蕈碱性)；腺苷受体；粘附类GPCR；肾上腺素受体；血管紧张素受体；apelin受体；胆汁酸受体；铃蟾肽受体；缓激肽受体；降钙素受体；钙感知受体；大麻素受体；chemerin受体；趋化因子受体；胆囊收缩素受体；卷曲(Frizzled)类GPCR(例如，Wnt受体)；补体肽受体；促肾上腺皮质激素释放因子受体；多巴胺受体；内皮素受体；G蛋白偶联雌激素受体；甲酰肽受体；游离脂肪酸受体；GABAB受体；甘丙肽受体；生长素释放肽受体；胰高血糖素受体家族；糖蛋白激素受体；促性腺激素释放激素受体；GPR18、GPR55和GPR119；组胺受体；羟基羧酸受体；kisspeptin受体；白三烯受体；溶血磷脂(LPA)受体；溶血磷脂(S1P)受体；黑色素浓集激素受体；黑皮质素受体；褪黑素受体；代谢型谷氨酸受体；促胃动素受体；神经调节肽U受体；神经肽FF/神经肽AF受体；神经肽S受体；神经肽W/神经肽B受体；神经肽Y受体；神经降压肽受体；阿片样物质受体；食欲肽受体；氧化戊二酸受体；P2Y受体；甲状旁腺素受体；血小板活化因子受体；前动力蛋白(prokineticin)受体；催乳素释放肽受体；前列腺素类受体；蛋白水解酶激活受体；QRFP受体；松弛素家族肽受体；促生长素抑制素受体；琥珀酸受体；速激肽受体；促甲状腺素释放激素受体；痕量胺受体；硬骨鱼紧张肽受体；加压素和催产素受体；VIP和PACAP受体。

在一些实施方案中，跨膜受体包括GPCR，其选自：5-羟色胺(血清素)受体1A(HTR1A)、5-羟色胺(血清素)受体1B(HTR1B)、5-羟色胺(血清素)受体1D(HTR1D)、5-羟色胺(血清素)受体1E(HTR1E)、5-羟色胺(血清素)受体1F(HTR1F)、5-羟色胺(血清素)受体2A(HTR2A)、5-羟色胺(血清素)受体2B(HTR2B)、5-羟色胺(血清素)受体2C(HTR2C)、5-羟色胺(血清素)受体4(HTR4)、5-羟色胺(血清素)受体5A(HTR5A)、5-羟色胺(血清素)受体5B(HTR5BP)、5-羟色胺(血清素)受体6(HTR6)、腺苷酸环化酶偶联的5-羟色胺(血清素)受体7(HTR7)、毒蕈碱性胆碱能受体1(CHRM1)、毒蕈碱性胆碱能受体2(CHRM2)、毒蕈碱性胆碱能受体3(CHRM3)、毒蕈碱性胆碱能受体4(CHRM4)、毒蕈碱性胆碱能受体5(CHRM5)、腺苷A1受体(ADORA1)、腺苷A2a受体(ADORA2A)、腺苷A2b受体(ADORA2B)、腺苷A3受体(ADORA3)、粘附G蛋白偶联受体A1(ADGRA1)、粘附G蛋白偶联受体A2(ADGRA2)、粘附G蛋白偶联受体A3(ADGRA3)、粘附G蛋白偶联受体B1(ADGRB1)、粘附G蛋白偶联受体B2(ADGRB2)、粘附G蛋白偶联受体B3(ADGRB3)、钙粘着蛋白EGF LAG七经G-型受体1(CELSR1)、钙粘着蛋白EGF LAG七经G型受体2(CELSR2)、钙粘着蛋白EGF LAG七经G型受体3(CELSR3)、粘附G蛋白偶联受体D1(ADGRD1)、粘附G蛋白偶联受体D2(ADGRD2)、粘附G蛋白偶联受体E1(ADGRE1)、粘附G蛋白偶联受体E2(ADGRE2)、粘附G蛋白偶联受体E3(ADGRE3)、粘附G蛋白偶联受体E4(ADGRE4P)、粘附G蛋白偶联受体E5(ADGRE5)、粘附G蛋白偶联受体F1(ADGRF1)、粘附G蛋白偶联受体F2(ADGRF2)、粘附G蛋白偶联受体F3(ADGRF3)、粘附G蛋白偶联受体F4(ADGRF4)、粘附G蛋白偶联受体F5(ADGRF5)、粘附G蛋白偶联受体G1(ADGRG1)、粘附G蛋白偶联受体G2(ADGRG2)、粘附G蛋白偶联受体G3(ADGRG3)、粘附G蛋白偶联受体G4(ADGRG4)、粘附G蛋白偶联受体G5(ADGRG5)、粘附G蛋白偶联受体G6(ADGRG6)、粘附G蛋白偶联受体G7(ADGRG7)、粘附G蛋白偶联受体L1(ADGRL1)、粘附G蛋白偶联受体L2(ADGRL2)、粘附G蛋白偶联受体L3(ADGRL3)、粘附G蛋白偶联受体L4(ADGRL4)、粘附G蛋白偶联受体V1(ADGRV1)、肾上腺素受体α1A(ADRA1A)、肾上腺素受体α1B(ADRA1B)、肾上腺素受体α1D(ADRA1D)、肾上腺素受体α2A(ADRA2A)、肾上腺素受体α2B(ADRA2B)、肾上腺素受体α2C(ADRA2C)、肾上腺素受体β1(ADRB1)、肾上腺素受体β2(ADRB2)、肾上腺素受体β3(ADRB3)、血管紧张素Ⅱ1型受体(AGTR1)、血管紧张素Ⅱ2型受体(AGTR2)、apelin受体(APLNR)、G蛋白偶联胆汁酸受体1(GPBAR1)、神经调节肽B受体(NMBR)、胃泌素释放肽受体(GRPR)、铃蟾肽样受体3(BRS3)、缓激肽受体B1(BDKRB1)、缓激肽受体B2(BDKRB2)、降钙素受体(CALCR)、降钙素受体样受体(CALCRL)、钙感知受体(CASR)、G蛋白偶联受体C类(GPRC6A)、大麻素受体1(脑)(CNR1)、大麻素受体2(CNR2)、chemerin趋化因子样受体1(CMKLR1)、趋化因子(C-C基序)受体1(CCR1)、趋化因子(C-C基序)受体2(CCR2)、趋化因子(C-C基序)受体3(CCR3)、趋化因子(C-C基序)受体4(CCR4)、趋化因子(C-C基序)受体5(基因/假基因)(CCR5)、趋化因子(C-C基序)受体6(CCR6)、趋化因子(C-C基序)受体7(CCR7)、趋化因子(C-C基序)受体8(CCR8)、趋化因子(C-C基序)受体9(CCR9)、趋化因子(C-C基序)受体10(CCR10)、趋化因子(C-X-C基序)受体1(CXCR1)、趋化因子(C-X-C基序)受体2(CXCR2)、趋化因子(C-X-C基序)受体3(CXCR3)、趋化因子(C-X-C基序)受体4(CXCR4)、趋化因子(C-X-C基序)受体5(CXCR5)、趋化因子(C-X-C基序)受体6(CXCR6)、趋化因子(C-X3-C基序)受体1(CX3CR1)、趋化因子(C基序)受体1(XCR1)、非典型趋化因子受体1(Duffy血型)(ACKR1)、非典型趋化因子受体2(ACKR2)、非典型趋化因子受体3(ACKR3)、非典型趋化因子受体4(ACKR4)、趋化因子(C-C基序)受体样2(CCRL2)、胆囊收缩素A受体(CCKAR)、胆囊收缩素B受体(CCKBR)、G蛋白偶联受体1(GPR1)、铃蟾肽样受体3(BRS3)、G蛋白偶联受体3(GPR3)、G蛋白偶联受体4(GPR4)、G蛋白偶联受体6(GPR6)、G蛋白偶联受体12(GPR12)、G蛋白偶联受体15(GPR15)、G蛋白偶联受体17(GPR17)、G蛋白偶联受体18(GPR18)、G蛋白偶联受体19(GPR19)、G蛋白偶联受体20(GPR20)、G蛋白偶联受体21(GPR21)、G蛋白偶联受体22(GPR22)、G蛋白偶联受体25(GPR25)、G蛋白偶联受体26(GPR26)、G蛋白偶联受体27(GPR27)、G蛋白偶联受体31(GPR31)、G蛋白偶联受体32(GPR32)、G蛋白偶联受体33(基因/假基因)(GPR33)、G蛋白偶联受体34(GPR34)、G蛋白偶联受体35(GPR35)、G蛋白偶联受体37(内皮素受体B型样)(GPR37)、G蛋白偶联受体37样1(GPR37L1)、G蛋白偶联受体39(GPR39)、G蛋白偶联受体42(基因/假基因)(GPR42)、G蛋白偶联受体45(GPR45)、G蛋白偶联受体50(GPR50)、G蛋白偶联受体52(GPR52)、G蛋白偶联受体55(GPR55)、G蛋白偶联受体61(GPR61)、G蛋白偶联受体62(GPR62)、G蛋白偶联受体63(GPR63)、G蛋白偶联受体65(GPR65)、G蛋白偶联受体68(GPR68)、G蛋白偶联受体75(GPR75)、G蛋白偶联受体78(GPR78)、G蛋白偶联受体79(GPR79)、G蛋白偶联受体82(GPR82)、G蛋白偶联受体83(GPR83)、G蛋白偶联受体84(GPR84)、G蛋白偶联受体85(GPR85)、G蛋白偶联受体87(GPR87)、G蛋白偶联受体88(GPR88)、G蛋白偶联受体101(GPR101)、G蛋白偶联受体119(GPR119)、G蛋白偶联受体132(GPR132)、G蛋白偶联受体135(GPR135)、G蛋白偶联受体139(GPR139)、G蛋白偶联受体141(GPR141)、G蛋白偶联受体142(GPR142)、G蛋白偶联受体146(GPR146)、G蛋白偶联受体148(GPR148)、G蛋白偶联受体149(GPR149)、G蛋白偶联受体150(GPR150)、G蛋白偶联受体151(GPR151)、G蛋白偶联受体152(GPR152)、G蛋白偶联受体153(GPR153)、G蛋白偶联受体160(GPR160)、G蛋白偶联受体161(GPR161)、G蛋白偶联受体162(GPR162)、G蛋白偶联受体171(GPR171)、G蛋白偶联受体173(GPR173)、G蛋白偶联受体174(GPR174)、G蛋白偶联受体176(GPR176)、G蛋白偶联受体182(GPR182)、G蛋白偶联受体183(GPR183)、富含亮氨酸重复的G蛋白偶联受体4(LGR4)、富含亮氨酸重复的G蛋白偶联受体5(LGR5)、富含亮氨酸重复G的蛋白偶联受体6(LGR6)、MAS1原癌基因(MAS1)、MAS1原癌基因样(MAS1L)、MAS相关GPR家族成员D(MRGPRD)、MAS相关GPR家族成员E(MRGPRE)、MAS相关GPR家族成员F(MRGPRF)、MAS相关GPR家族成员G(MRGPRG)、MAS相关GPR家族成员X1(MRGPRX1)、MAS相关GPR家族成员X2(MRGPRX2)、MAS相关GPR家族成员X3(MRGPRX3)、MAS相关GPR家族成员X4(MRGPRX4)、视蛋白3(OPN3)、视蛋白4(OPN4)、视蛋白5(OPN5)、嘌呤能受体P2Y(P2RY8)、嘌呤能受体P2Y(P2RY10)、痕量胺关联受体2(TAAR2)、痕量胺关联受体3(基因/假基因)(TAAR3)、痕量胺关联受体4(TAAR4P)、痕量胺关联受体5(TAAR5)、痕量胺关联受体6(TAAR6)、痕量胺关联受体8(TAAR8)、痕量胺关联受体9(基因/假基因)(TAAR9)、G蛋白偶联受体156(GPR156)、G蛋白偶联受体158(GPR158)、G蛋白偶联受体179(GPR179)、G蛋白偶联受体C类(GPRC5A)、G蛋白偶联受体C类(GPRC5B)、G蛋白偶联受体C类(GPRC5C)、G蛋白偶联受体C类(GPRC5D)、卷曲类受体1(FZD1)、卷曲类受体2(FZD2)、卷曲类受体3(FZD3)、卷曲类受体4(FZD4)、卷曲类受体5(FZD5)、卷曲类受体6(FZD6)、卷曲类受体7(FZD7)、卷曲类受体8(FZD8)、卷曲类受体9(FZD9)、卷曲类受体10(FZD10)、平滑卷曲类受体(SMO)、补体成分3a受体1(C3AR1)、补体成分5a受体1(C5AR1)、补体成分5a受体2(C5AR2)、促肾上腺皮质激素释放激素受体1(CRHR1)、促肾上腺皮质激素释放激素受体2(CRHR2)、多巴胺受体D1(DRD1)、多巴胺受体D2(DRD2)、多巴胺受体D3(DRD3)、多巴胺受体D4(DRD4)、多巴胺受体D5(DRD5)、内皮素受体A型(EDNRA)、内皮素受体B型(EDNRB)、甲酰肽受体1(FPR1)、甲酰肽受体2(FPR2)、甲酰肽受体3(FPR3)、游离脂肪酸受体1(FFAR1)、游离脂肪酸受体2(FFAR2)、游离脂肪酸受体3(FFAR3)、游离脂肪酸受体4(FFAR4)、G蛋白偶联受体42(基因/假基因)(GPR42)、γ-氨基丁酸(GABA)B受体1(GABBR1)、γ-氨基丁酸(GABA)B受体2(GABBR2)、甘丙肽受体1(GALR1)、甘丙肽受体2(GALR2)、甘丙肽受体3(GALR3)、生长激素促分泌素受体(GHSR)、生长激素释放激素受体(GHRHR)、肠抑胃肽受体(GIPR)、胰高血糖素样肽1受体(GLP1R)、胰高血糖素样肽2受体(GLP2R)、胰高血糖素受体(GCGR)、促胰液素受体(SCTR)、促卵泡激素受体(FSHR)、黄体生成激素/绒毛膜促性腺激素受体(LHCGR)、促甲状腺激素受体(TSHR)、促性腺激素释放激素受体(GNRHR)、促性腺激素释放激素受体2(假基因)(GNRHR2)、G蛋白偶联受体18(GPR18)、G蛋白偶联受体55(GPR55)、G蛋白偶联受体119(GPR119)、G蛋白偶联雌激素受体1(GPER1)、组胺受体H1(HRH1)、组胺受体H2(HRH2)、组胺受体H3(HRH3)、组胺受体H4(HRH4)、羟基羧酸受体1(HCAR1)、羟基羧酸受体2(HCAR2)、羟基羧酸受体3(HCAR3)、KISS1受体(KISS1R)、白三烯B4受体(LTB4R)、白三烯B4受体2(LTB4R2)、半胱氨酰白三烯受体1(CYSLTR1)、半胱氨酰白三烯受体2(CYSLTR2)、氧桥二十烷类(oxoeicosanoid)(OXE)受体1(OXER1)、甲酰肽受体2(FPR2)、溶血磷脂酸受体1(LPAR1)、溶血磷脂酸受体2(LPAR2)、溶血磷脂酸受体3(LPAR3)、溶血磷脂酸受体4(LPAR4)、溶血磷脂酸受体5(LPAR5)、溶血磷脂酸受体6(LPAR6)、鞘氨醇-1-磷酸受体1(S1PR1)、鞘氨醇-1-磷酸受体2(S1PR2)、鞘氨醇-1-磷酸受体3(S1PR3)、鞘氨醇-1-磷酸受体4(S1PR4)、鞘氨醇-1-磷酸受体5(S1PR5)、黑色素浓集激素受体1(MCHR1)、黑色素浓集激素受体2(MCHR2)、黑皮质素1受体(α促黑素细胞激素受体)(MC1R)、黑皮质素2受体(促肾上腺皮质激素)(MC2R)、黑皮质素3受体(MC3R)、黑皮质素4受体(MC4R)、黑皮质素5受体(MC5R)、褪黑素受体1A(MTNR1A)、褪黑素受体1B(MTNR1B)、代谢型谷氨酸受体1(GRM1)、代谢型谷氨酸受体2(GRM2)、代谢型谷氨酸受体3(GRM3)、代谢型谷氨酸受体4(GRM4)、代谢型谷氨酸受体5(GRM5)、代谢型谷氨酸受体6(GRM6)、代谢型谷氨酸受体7(GRM7)、代谢型谷氨酸受体8(GRM8)、促胃动素受体(MLNR)、神经调节肽U受体1(NMUR1)、神经调节肽U受体2(NMUR2)、神经肽FF受体1(NPFFR1)、神经肽FF受体2(NPFFR2)、神经肽S受体1(NPSR1)、神经肽B/W受体1(NPBWR1)、神经肽B/W受体2(NPBWR2)、神经肽Y受体Y1(NPY1R)、神经肽Y受体Y2(NPY2R)、神经肽Y受体Y4(NPY4R)、神经肽Y受体Y5(NPY5R)、神经肽Y受体Y6(假基因)(NPY6R)、神经降压肽受体1(高亲和力)(NTSR1)、神经降压肽受体2(NTSR2)、阿片样物质受体δ1(OPRD1)、阿片样物质受体κ1(OPRK1)、阿片样物质受体μ1(OPRM1)、阿片剂受体样1(OPRL1)、下丘泌素(食欲肽)受体1(HCRTR1)、下丘泌素(食欲肽)受体2(HCRTR2)、G蛋白偶联受体107(GPR107)、G蛋白偶联受体137(GPR137)、嗅觉受体家族51亚家族E成员1(OR51E1)、脂肪细胞相关跨膜蛋白质1(TPRA1)、G蛋白偶联受体143(GPR143)、G蛋白偶联受体157(GPR157)、氧化戊二酸(α-酮戊二酸)受体1(OXGR1)、嘌呤能受体P2Y(P2RY1)、嘌呤能受体P2Y(P2RY2)、嘧啶能受体P2Y(P2RY4)、嘧啶能受体P2Y(P2RY6)、嘌呤能受体P2Y(P2RY11)、嘌呤能受体P2Y(P2RY12)、嘌呤能受体P2Y(P2RY13)、嘌呤能受体P2Y(P2RY14)、甲状旁腺激素1受体(PTH1R)、甲状旁腺激素2受体(PTH2R)、血小板活化因子受体(PTAFR)、前动力蛋白受体1(PROKR1)、前动力蛋白受体2(PROKR2)、催乳素释放激素受体(PRLHR)、前列腺素D2受体(DP)(PTGDR)、前列腺素D2受体2(PTGDR2)、前列腺素E受体1(PTGER1)、前列腺素E受体2(PTGER2)、前列腺素E受体3(PTGER3)、前列腺素E受体4(PTGER4)、前列腺素F受体(PTGFR)、前列腺素I2(前列环素)受体(IP)(PTGIR)、血栓烷A2受体(TBXA2R)、凝血因子II凝血酶受体(F2R)、F2R样胰蛋白酶受体1(F2RL1)、凝血因子II凝血酶受体样2(F2RL2)、F2R样凝血酶/胰蛋白酶受体3(F2RL3)、焦谷氨酰化RF酰胺肽受体(QRFPR)、松弛素/胰岛素样家族肽受体1(RXFP1)、松弛素/胰岛素样家族肽受体2(RXFP2)、松弛素/胰岛素样家族肽受体3(RXFP3)、松弛素/胰岛素样家族肽受体4(RXFP4)、促生长素抑制素受体1(SSTR1)、促生长素抑制素受体2(SSTR2)、促生长素抑制素受体3(SSTR3)、促生长素抑制素受体4(SSTR4)、促生长素抑制素受体5(SSTR5)、琥珀酸受体1(SUCNR1)、速激肽受体1(TACR1)、速激肽受体2(TACR2)、速激肽受体3(TACR3)、味觉1受体成员1(TAS1R1)、味觉1受体成员2(TAS1R2)、味觉1受体成员3(TAS1R3)、味觉2受体成员1(TAS2R1)、味觉2受体成员3(TAS2R3)、味觉2受体成员4(TAS2R4)、味觉2受体成员5(TAS2R5)、味觉2受体成员7(TAS2R7)、味觉2受体成员8(TAS2R8)、味觉2受体成员9(TAS2R9)、味觉2受体成员10(TAS2R10)、味觉2受体成员13(TAS2R13)、味觉2受体成员14(TAS2R14)、味觉2受体成员16(TAS2R16)、味觉2受体成员19(TAS2R19)、味觉2受体成员20(TAS2R20)、味觉2受体成员30(TAS2R30)、味觉2受体成员31(TAS2R31)、味觉2受体成员38(TAS2R38)、味觉2受体成员39(TAS2R39)、味觉2受体成员40(TAS2R40)、味觉2受体成员41(TAS2R41)、味觉2受体成员42(TAS2R42)、味觉2受体成员43(TAS2R43)、味觉2受体成员45(TAS2R45)、味觉2受体成员46(TAS2R46)、味觉2受体成员50(TAS2R50)、味觉2受体成员60(TAS2R60)、促甲状腺素释放激素受体(TRHR)、痕量胺关联受体1(TAAR1)、硬骨鱼紧张肽2受体(UTS2R)、精氨酸加压素受体1A(AVPR1A)、精氨酸加压素受体1B(AVPR1B)、精氨酸加压素受体2(AVPR2)、催产素受体(OXTR)、腺苷酸环化酶激活肽1(垂体)受体I型(ADCYAP1R1)、血管活性肠肽受体1(VIPR1)、血管活性肠肽受体2(VIPR2)及其任何变体。

在一些实施方案中，嵌合受体包括G蛋白偶联受体(GPCR)或其任何变体。在一些实施方案中，嵌合受体至少包含GPCR或其任何变体的胞外区(例如，配体结合域)。在一些实施方案中，嵌合受体至少包含GPCR或其任何变体的跨膜区。在一些实施方案中，嵌合受体至少包含GPCR或其任何变体的胞内区(例如，细胞质结构域)。包含GPCR或其任何变体的嵌合受体可以与GPCR配体结合。在一些实施方案中，配体与包含GPCR或其任何变体的嵌合受体结合，导致GPCR信号传导途径的激活。

在一些实施方案中，跨膜受体包括整联蛋白受体、整联蛋白受体亚单位或其任何变体(例如，合成或嵌合受体)。整联蛋白受体是跨膜受体，其可以充当细胞-细胞和细胞-细胞外基质(ECM)相互作用的桥梁。整联蛋白受体通常形成为由非共价结合的α亚单位和β亚单位组成的异二聚体。存在至少18个α亚单位和至少8个β亚单位。每个亚单位通常包含胞外区(例如，配体结合域)、跨膜的区域和胞内区(例如，胞质域)。

在一些实施方案中，跨膜受体包括整联蛋白受体α亚单位或其任何变体，选自：α1、α2、α3、α4、α5、α6、α7、α8、α9、α10、α11、αV、αL、αM、αX、αD、αE和αIIb。在一些实施方案中，跨膜受体包括整联蛋白受体β亚单位或其任何变体，选自：β1、β2、β3、β4、β5、β6、β7和β8。包括α亚单位、β亚单位或其任何变体的本发明系统的跨膜受体可以异二聚化(例如，α亚单位与β亚单位二聚化)以形成整联蛋白受体或其任何变体。整联蛋白受体的非限制性实例包括α1β1、α2β1、α3β1、α4β1、α5β1、α6β1、α7β1、α8β1、α9β1、α10β1、αVβ1、αLβ1、αMβ1、αXβ1、αDβ1、αIIbβ1、αEβ1、α1β2、α2β2、α3β2、α4β2、α5β2、α6β2、α7β2、α8β2、α9β2、α10β2、αVβ2、αLβ2、αMβ2、αXβ2、αDβ2、αIIbβ2、αEβ2、α1β3、α2β3、α3β3、α4β3、α5β3、α6β3、α7β3、α8β3、α9β3、α10β3、αVβ3、αLβ3、αMβ3、αXβ3、αDβ3、αIIbβ3、αEβ3、α1β4、α2β4、α3β4、α4β4、α5β4、α6β4、α7β4、α8β4、α9β4、α10β4、αVβ4、αLβ4、αMβ4、αXβ4、αDβ4、αIIbβ4、αEβ4、α1β5、α2β5、α3β5、α4β5、α5β5、α6β5、α7β5、α8β5、α9β5、α10β5、αVβ5、αLβ5、αMβ5、αXβ5、αDβ5、αIIbβ5、αEβ5、α1β6、α2β6、α3β6、α4β6、α5β6、α6β6、α7β6、α8β6、α9β6、α10β6、αVβ6、αLβ6、αMβ6、αXβ6、αDβ6、αIIbβ6、αEβ6、α1β7、α2β7、α3β7、α4β7、α5β7、α6β7、α7β7、α8β7、α9β7、α10β7、αVβ7、αLβ7、αMβ7、αXβ7、αDβ7、αIIbβ7、αEβ7、α1β8、α2β8、α3β8、α4β8、α5β8、α6β8、α7β8、α8β8、α9β8、α10β8、αVβ8、αLβ8、αMβ8、αXβ8、αDβ8、αIIbβ8和αEβ8受体。

在一些实施方案中，嵌合受体至少包含整联蛋白亚单位(例如，α亚单位或β亚单位)或其任何变体的胞外区(例如，配体结合域)。在一些实施方案中，嵌合受体至少包含整联蛋白亚单位(例如，α亚单位或β亚单位)或其任何变体的跨膜区。在一些实施方案中，嵌合受体至少包含整联蛋白亚单位(例如，α亚单位或β亚单位)或其任何变体的胞内区(例如，细胞质结构域)。包含整联蛋白亚单位或其任何变体的嵌合受体可以与整联蛋白配体结合。在一些实施方案中，配体与包含整联蛋白亚单位或其任何变体的嵌合受体结合，导致整联蛋白信号传导途径的激活。

在一些实施方案中，跨膜受体包括钙粘着蛋白分子或其任何变体(例如，合成或嵌合受体)。钙粘着蛋白分子既可以充当配体又可以充当受体，是指某些涉及介导细胞粘附的蛋白质。钙粘着蛋白分子通常由五个串联重复的胞外域、单跨膜区段和胞质区组成。例如，E-钙粘着蛋白或称为CDH1由胞外域中的5个重复、一个跨膜域和胞内域组成。当E-钙粘着蛋白在胞内域的区域被磷酸化时，衔接蛋白如β-联蛋白和p120-联蛋白可与受体结合。

在一些实施方案中，跨膜受体包括钙粘着蛋白或其任何变体，其选自经典钙粘着蛋白、桥粒钙粘着蛋白、原钙粘着蛋白和非常规钙粘着蛋白。在一些实施方案中，跨膜受体包含经典钙粘着蛋白或其任何变体，其选自CDH1(E-钙粘着蛋白，上皮)、CDH2(N-钙粘着蛋白，神经)、CDH12(钙粘着蛋白12，类型2，N-钙粘着蛋白2)和CDH3(P-钙粘着蛋白，胎盘)。在一些实施方案中，跨膜受体包括桥粒钙粘着蛋白或其任何变体，其选自桥粒芯糖蛋白(DSG1、DSG2、DSG3、DSG4)和桥粒胶蛋白(DSC1、DSC2、DSC3)。在一些实施方案中，跨膜受体包括原钙粘着蛋白或其任何变体，其选自PCDH1、PCDH10、PCDH11X、PCDH11Y、PCDH12、PCDH15、PCDH17、PCDH18、PCDH19、PCDH20、PCDH7、PCDH8、PCDH9、PCDHA1、PCDHA10、PCDHA11、PCDHA12、PCDHA13、PCDHA2、PCDHA3、PCDHA4、PCDHA5、PCDHA6、PCDHA7、PCDHA8、PCDHA9、PCDHAC1、PCDHAC2、PCDHB1、PCDHB10、PCDHB11、PCDHB12、PCDHB13、PCDHB14、PCDHB15、PCDHB16、PCDHB17、PCDHB18、PCDHB2、PCDHB3、PCDHB4、PCDHB5、PCDHB6、PCDHB7、PCDHB8、PCDHB9、PCDHGA1、PCDHGA10、PCDHGA11、PCDHGA12、PCDHGA2、PCDHGA3、PCDHGA4、PCDHGA5、PCDHGA6、PCDHGA7、PCDHGA8、PCDHGA9、PCDHGB1、PCDHGB2、PCDHGB3、PCDHGB4、PCDHGB5、PCDHGB6、PCDHGB7、PCDHGC3、PCDHGC4、PCDHGC5、FAT、FAT2和FAT。在一些实施方案中，跨膜受体包括非常规钙粘着蛋白，其选自CDH4(R-钙粘着蛋白，视网膜)、CDH5(VE-钙粘着蛋白，血管内皮)、CDH6(K-钙粘着蛋白，肾)、CDH7(钙粘着蛋白7，类型2)、CDH8(钙粘着蛋白8，类型2)、CDH9(钙粘着蛋白9，类型2，T1-钙粘着蛋白)、CDH10(钙粘着蛋白10，类型2，T2-钙粘着蛋白)、CDH11(OB-钙粘着蛋白，成骨细胞)、CDH13(T-钙粘着蛋白、H-钙粘着蛋白，心脏)、CDH15(M-钙粘着蛋白，肌管)、CDH16(KSP钙粘着蛋白)、CDH17(LI钙粘着蛋白，肝-肠)、CDH18(钙粘着蛋白18，类型2)、CDH19(钙粘着蛋白19，类型2)、CDH20(钙粘着蛋白20，类型2)、CDH23(钙粘着蛋白23，神经感受上皮)、CDH24、CDH26、CDH28、CELSR1、CELSR2、CELSR3、CLSTN1、CLSTN2、CLSTN3、DCHS1、DCHS2、LOC389118、PCLKC、RESDA1和RET。

在一些实施方案中，嵌合受体包含钙粘着蛋白分子或其任何变体。在一些实施方案中，嵌合受体至少包含钙粘着蛋白或其任何变体的胞外区。在一些实施方案中，嵌合受体至少包含钙粘着蛋白或其任何变体的跨膜区。在一些实施方案中，嵌合受体至少包含钙粘着蛋白或其任何变体的胞内区(例如，细胞质结构域)。包含钙粘着蛋白或其任何变体的嵌合受体多肽可以与钙粘着蛋白配体结合。在一些实施方案中，配体与包含钙粘着蛋白或其任何变体的嵌合受体结合，导致钙粘着蛋白信号传导途径的激活。

在一些实施方案中，跨膜受体包括催化受体或其任何变体(例如，合成或嵌合受体)。催化受体的实例包括但不限于受体酪氨酸激酶(RTK)和受体苏氨酸/丝氨酸激酶(RTSK)。催化受体如RTK和RTSK具有一定的酶活性。例如，RTK可以使酪氨酸残基上的底物蛋白质磷酸化，该蛋白质随后可作为衔接蛋白的结合位点。RTK通常包含N末端胞外配体结合域、单个跨膜α螺旋和具有蛋白酪氨酸激酶活性的细胞溶质C末端结构域。一些RTK由单个多肽组成，而一些则是由两对多肽链例如胰岛素受体和一些相关受体组成的二聚体。配体与这些受体的胞外域的结合可以激活胞质激酶结构域，导致受体本身和细胞内靶蛋白的磷酸化，从而传播由配体结合引发的信号。在一些RTK中，配体结合诱导受体二聚化。一些配体(例如，生长因子，如PDGF和NGF)本身是由两个相同的多肽链组成的二聚体。这些生长因子可以通过同时与两个不同的受体分子结合而直接诱导二聚化。其他生长因子(例如，EGF)是单体，但具有两个可以交联受体的不同受体结合位点。配体诱导的二聚化可以导致受体的自体磷酸化，其中二聚的多肽链相互交叉磷酸化。一些受体可以多聚化。

在一些实施方案中，跨膜受体包括I类RTK(例如，表皮生长因子(EGF)受体家族，包括EGFR；ErbB家族，包括ErbB-2、ErbB-3和ErbB-4)、II类RTK(例如，胰岛素受体家族，包括INSR、IGF-1R和IRR)、III类RTK(例如，血小板衍生生长因子(PDGF)受体家族，包括PDGFR-α、PDGFR-β、CSF-1R、KIT/SCFR和FLK2/FLT3)、IV类RTK(例如，成纤维细胞生长因子(FGF)受体家族，包括FGFR-1、FGFR-2、FGFR-3和FGFR-4)、V类RTK(例如，血管内皮生长因子(VEGF)受体家族，包括VEGFR1、VEGFR2和VEGFR3)、VI类RTK(例如，肝细胞生长因子(HGF)受体家族，包括肝细胞生长因子受体(HGFR/MET)和RON)、VII类RTK(例如，原肌球蛋白受体激酶(Trk)受体家族，包括TRKA、TRKB和TRKC)、VIII类RTK(例如，肝配蛋白(Eph)受体家族，包括EPHA1、EPHA2、EPHA3、EPHA4、EPHA5、EPHA6、EPHA7、EPHA8、EPHB1、EPHB2、EPHB3、EPHB4、EPHB5和EPHB6)、IX类RTK(例如，AXL受体家族，如AXL、MER和TRYO3)、X类RTK(例如，LTK受体家族，如LTK和ALK)、XI类RTK(例如，TIE受体家族，如TIE和TEK)、XII类RTK(例如，ROR受体家族ROR1和ROR2)、XIII类RTK(例如，盘菌素结构域受体(DDR)家族，如DDR1和DDR2)、XIV类RTK(例如，RET受体家族，如RET)、XV类RTK(例如，KLG受体家族，包括PTK7)、XVI类RTK(例如，RYK受体家族，包括Ryk)、XVII类RTK(例如，MuSK受体家族，如MuSK)或其任何变体。

在一些实施方案中，嵌合受体至少包含催化受体如RTK或其任何变体的胞外区(例如，配体结合域)。在一些实施方案中，嵌合受体至少包含催化受体如RTK或其任何变体的跨膜区。在一些实施方案中，嵌合受体至少包含催化受体如RTK或其任何变体的胞内区(例如，胞质结构域)。包含RTK或其任何变体的嵌合受体可以与RTK配体结合。在一些实施方案中，配体与包含RTK或其任何变体的嵌合受体结合，导致RTK信号传导途径的激活。

在一些实施方案中，嵌合受体至少包含催化受体如RTSK或其任何变体的胞外区(例如，配体结合域)。在一些实施方案中，嵌合受体至少包含催化受体如RTSK或其任何变体的跨膜区。在一些实施方案中，嵌合受体至少包含催化受体如RTSK或其任何变体的胞内区(例如，胞质结构域)。包含RTSK或其任何变体的嵌合受体可以与RTSK配体结合。在一些实施方案中，配体与包含RTSK或其任何变体的嵌合受体结合，导致RTSK信号传导途径的激活。

在一些实施方案中，包括RTSK或其任何变体的跨膜受体可以在丝氨酸和/或苏氨酸残基处使底物磷酸化，并且可以基于共有序列选择特定的残基。跨膜受体可包括I型RTSK、II型RTSK或其任何变体。在一些实施方案中，除非与II型受体复合，否则包括I型受体丝氨酸/苏氨酸激酶的跨膜受体是失活的。在一些实施方案中，包括II型受体丝氨酸/苏氨酸的跨膜受体包含组成型活性激酶结构域，其当与I型受体复合时可以使I型受体磷酸化并激活。Ⅱ型受体丝氨酸/苏氨酸激酶可使Ⅰ型配偶体的激酶结构域磷酸化，导致蛋白质配偶体替换。

蛋白质配偶体的替换可以允许其他蛋白质(例如，SMAD家族的某些成员)结合和磷酸化。跨膜受体可包括I型受体或其任何变体，选自：ALK1(ACVRL1)、ALK2(ACVR1A)、ALK3(BMPR1A)、ALK4(ACVR1B)、ALK5(TGFβR1)、ALK6(BMPR1B)和ALK7(ACVR1C)。跨膜受体可包括II型受体或其任何变体，选自：TGFβR2、BMPR2、ACVR2A、ACVR2B和AMHR2(AMHR)。

在一些实施方案中，跨膜受体包括刺激非共价相关的细胞内激酶如Src激酶(例如，c-Src、Yes、Fyn、Fgr、Lck、Hck、Blk、Lyn和Frk)或JAK激酶(例如，JAK1、JAK2、JAK3和TYK2)，而不具有内在酶活性的受体或其任何变体。这些包括细胞因子受体超家族，如细胞因子受体和多肽激素受体。细胞因子受体通常包含N末端胞外配体结合域、跨膜α螺旋和C末端胞质结构域。细胞因子受体的胞质结构域通常缺乏任何已知的催化活性。相反，细胞因子受体可与非受体激酶(例如，酪氨酸激酶或苏氨酸/丝氨酸激酶)联合作用，该非受体激酶可由于配体与受体结合而被激活。

在一些实施方案中，嵌合受体至少包含与细胞内激酶(例如，细胞因子受体)非共价相关的催化受体或其任何变体的胞外区(例如，配体结合域)。在一些实施方案中，嵌合受体至少包含与细胞内激酶(例如，细胞因子受体)非共价相关的催化受体或其任何变体的跨膜区。在一些实施方案中，嵌合受体至少包含与细胞内激酶(例如，细胞因子受体)非共价相关的催化受体或其任何变体的胞内区(例如，胞质结构域)。包含与细胞内激酶非共价相关的催化受体或其任何变体的嵌合受体可与配体结合。在一些实施方案中，配体与包含与细胞内激酶非共价相关的催化受体或其任何变体的嵌合受体结合，导致信号传导途径的激活。

细胞因子受体通常包含N末端胞外配体结合域、跨膜α螺旋和C末端胞质结构域。细胞因子受体的胞质结构域通常缺乏任何已知的催化活性。相反，细胞因子受体可与非受体激酶(例如，酪氨酸激酶或苏氨酸/丝氨酸激酶)组合作用，该非受体激酶可由于配体与受体结合而被激活。

在一些实施方案中，跨膜受体包括细胞因子受体，例如，I型细胞因子受体或II型细胞因子受体或其任何变体。在一些实施方案中，跨膜受体包括白介素受体(例如，IL-2R、IL-3R、IL-4R、IL-5R、IL-6R、IL-7R、IL-9R、IL-11R、IL-12R、IL-13R、IL-15R、IL-21R、IL-23R、IL-27R和IL-31R)、集落刺激因子受体(例如，红细胞生成素受体、CSF-1R、CSF-2R、GM-CSFR和G-CSFR)、激素受体/神经肽受体(例如，生长激素受体、催乳素受体和瘦素受体)或其任何变体。在一些实施方案中，跨膜受体包括II型细胞因子受体或其任何变体。在一些实施方案中，跨膜受体包括干扰素受体(例如，IFNAR1、IFNAR2和IFNGR)、白介素受体(例如，IL-10R、IL-20R、IL-22R和IL-28R)、组织因子受体(也称为血小板组织因子)或其任何变体。

在一些实施方案中，跨膜受体包括死亡受体、包含死亡结构域的受体或其任何变体。死亡受体常常参与调节细胞凋亡和炎症。死亡受体包括TNF受体家族的成员如TNFR1、Fas受体、DR4(也称为TRAIL受体1或TRAILR1)和DR5(也称为TRAIL受体2或TRAILR2)。

在一些实施方案中，嵌合受体至少包含死亡受体或其任何变体的胞外区(例如，配体结合域)。在一些实施方案中，嵌合受体至少包含死亡受体或其任何变体的跨膜区。在一些实施方案中，嵌合受体至少包含死亡受体或其任何变体的胞内区(例如，胞质结构域)。包含死亡受体或其任何变体的嵌合受体可响应于配体结合而进行受体寡聚化，这继而可导致特化衔接蛋白的募集和信号级联如胱天蛋白酶级联的激活。

在一些实施方案中，跨膜受体包括免疫受体或其任何变体。免疫受体包括与免疫球蛋白共享结构特征的免疫球蛋白超家族(IgSF)的成员，例如，被称为免疫球蛋白结构域或折叠的结构域。IgSF成员包括但不限于细胞表面抗原受体、免疫系统的共受体和共刺激分子、以及参与将抗原呈递给淋巴细胞的分子。

在一些实施方案中，配体相互作用域与包含抗体的抗原，该抗体例如是与细胞表面蛋白质或多肽结合的抗体结合。由抗体结合的细胞表面上的蛋白质或多肽可包括与疾病相关的抗原，该疾病例如是病毒、细菌和/或寄生虫感染；炎性疾病和/或自身免疫病；或者赘生物，如癌症和/或肿瘤。在一些实施方案中，抗体与肿瘤相关抗原(例如，蛋白质或多肽)结合。在一些实施方案中，本文公开的嵌合跨膜受体多肽的配体相互作用域可以结合单克隆抗体、多克隆抗体、重组抗体、人抗体、人源化抗体或其功能衍生物、变体或片段，包括但不限于Fab、Fab'、F(ab')₂、Fc、Fv、scFv、微抗体、双抗体以及单域抗体如重链可变域(VH)、轻链可变域(VL)和骆驼科来源的纳米抗体的可变域(VHH)。在一些实施方案中，配体相互作用域可与Fab、Fab'、F(ab')₂、Fc、Fv和scFv中的至少一种结合。在一些实施方案中，配体相互作用域与抗体的Fc结构域结合。

在一些实施方案中，配体相互作用域与抗体结合，该抗体选自：20-(74)-(74)(米拉珠单抗；维妥珠单抗)、20-2b-2b、3F8、74-(20)-(20)(米拉珠单抗；维妥珠单抗)、8H9、A33、AB-16B5、阿巴伏单抗、阿昔单抗、阿比珠单抗(abituzumab)、ABP 494(西妥昔单抗生物仿制药)、阿布里单抗(abrilumab)、ABT-700、ABT-806、阿克提单抗-A(锕Ac-225林妥珠单抗)、actoxumab、阿达木单抗、ADC-1013、ADCT-301、ADCT-402、阿德木单抗、aducanumab、阿非莫单抗、AFM13、阿夫土珠单抗、AGEN1884、AGS15E、AGS-16C3F、AGS67E、培化阿珠单抗、ALD518、阿仑单抗、阿利库单抗、阿妥莫单抗-喷替酸、amatuximab、AMG 228、AMG 820、麻安莫单抗、anetumab ravtansine、anifrolumab、安芦珠单抗、APN301、APN311、阿泊珠单抗、APX003/SIM-BD0801(sevacizumab)、APX005M、阿西莫单抗、ARX788、ascrinvacumab、阿塞珠单抗、ASG-15ME、阿特珠单抗、atinumab、ATL101、atlizumab(也称为托珠单抗)、阿托木单抗、Avelumab、B-701、巴匹珠单抗、巴利昔单抗、巴维昔单抗、BAY1129980、BAY1187982、贝妥莫单抗、begelomab、贝利木单抗、benralizumab、柏替木单抗、贝索单抗、Betalutin(177Lu-tetraxetan-tetulomab)、贝伐单抗、BEVZ92(贝伐单抗生物仿制药)、bezlotoxumab、BGB-A317、BHQ880、BI 836880、BI-505、比西单抗、bimagrumab、bimekizumab、bivatuzumabmertansine、BIW-8962、博纳吐单抗、blosozumab、BMS-936559、BMS-986012、BMS-986016、BMS-986148、BMS-986178、BNC101、bococizumab、本妥昔单抗、BrevaRex、布雷奴单抗、brodalumab、brolucizumab、brontictuzumab、C2-2b-2b、康纳单抗、美坎珠单抗、cantuzumab ravtansine、caplacizumab、卡罗单抗喷地肽、carlumab、卡妥索单抗、CBR96-多柔比星免疫偶联物、CBT124(贝伐单抗)、CC-90002、CDX-014、CDX-1401、西地珠单抗、培化塞妥珠单抗、西妥昔单抗、CGEN-15001T、CGEN-15022、CGEN-15029、CGEN-15049、CGEN-15052、CGEN-15092、Ch.14.18、泊西他珠单抗、西妥木单抗、clazakizumab、克立昔单抗、clivatuzumab tetraxetan、CM-24、codrituzumab、coltuximab ravtansine、conatumumab、concizumab、Cotara(碘I-131derlotuximab生物素)、cR6261、crenezumab、DA-3111(曲妥珠单抗生物仿制药)、达西珠单抗、达利珠单抗、dalotuzumab、培化dapirolizumab、达雷木单抗、Daratumumab Enhanze(达雷木单抗)、Darleukin、dectrekumab、demcizumab、denintuzumab mafodotin、地诺单抗、Depatuxizumab、Depatuxizumab mafodotin、derlotuximab生物素、地莫单抗、DI-B4、达妥昔单抗、diridavumab、DKN-01、DMOT4039A、阿托度单抗、drozitumab、DS-1123、DS-8895、duligotumab、dupilumab、度伐鲁单抗、dusigitumab、依美昔单抗、依库珠单抗、埃巴单抗、依决洛单抗、依法利珠单抗、依芬古单抗、eldelumab、elgemtumab、埃罗妥珠单抗、艾西莫单抗、emactuzumab、emibetuzumab、enavatuzumab、enfortumab vedotin、培化恩莫单抗、enoblituzumab、依诺凯珠单抗、enoticumab、ensituximab、epitumomab cituxetan、依帕珠单抗、厄利珠单抗、厄妥索单抗、伊瑞西珠、etrolizumab、evinacumab、依洛尤单抗、艾韦单抗、fanolesomab、法拉莫单抗、法利珠单抗、fasinumab、FBTA05、泛维珠单抗、非扎奴单抗、FF-21101、FGFR2抗体-药物偶联物、Fibromun、ficlatuzumab、芬妥木单抗、firivumab、flanvotumab、fletikumab、芳妥珠单抗、foralumab、夫瑞韦如、FPA144、fresolimumab、FS102、fulranumab、futuximab、加利昔单抗、盖尼塔单抗、gantenerumab、加维莫单抗、吉妥珠单抗-奥佐米星、Gerilimzumab、gevokizumab、吉伦妥昔单抗、glembatumumab vedotin、GNR-006、GNR-011、戈利木单抗、gomiliximab、GSK2849330、GSK2857916、GSK3174998、GSK3359609、古塞库单抗、Hu14.18K322A MAb、hu3S193、Hu8F4、HuL2G7、HuMab-5B1、伊巴珠单抗、伊立莫单抗、icrucumab、idarucizumab、IGN002、IGN523、伊戈伏单抗、IMAB362、IMAB362(claudiximab)、伊马单抗、IMC-CS4、IMC-D11、英西单抗、imgatuzumab、IMGN529、IMMU-102(钇Y-90依帕珠单抗-tetraxetan)、IMMU-114、ImmuTune MP701拮抗抗体、INCAGN1876、inclacumab、INCSHR1210、indatuximab ravtansine、indusatumab vedotin、英夫利昔单抗、伊诺莫单抗、奥英妥珠单抗、英妥木单抗、Ipafricept、IPH4102、伊匹木单抗、伊妥木单抗、伊沙妥昔单抗、Istiratumab、itolizumab、ixekizumab、JNJ-56022473、JNJ-61610588、凯利昔单抗、KTN3379、L19IL2/L19TNF、拉贝珠单抗、Labetuzumab Govitecan、LAG525、lambrolizumab、lampalizumab、L-DOS47、lebrikizumab、来马索单抗、lenzilumab、乐德木单抗、Leukotuximab、来沙木单抗、利韦单抗、维利伐妥单抗、利格珠单抗、lifastuzumabvedotin、林妥珠单抗、lilotomab satetraxetan、LKZ145、洛赛珠单抗、lokivetmab、lorvotuzumab mertansine、鲁卡木单抗、lulizumab pegol、鲁昔单抗、lumretuzumab、LY3164530、马帕木单抗、margetuximab、马司莫单抗、马妥珠单抗、马夫利列单抗、MB311、MCS-110、MEDI0562、MEDI-0639、MEDI0680、MEDI-3617、MEDI-551(inebilizumab)、MEDI-565、MEDI6469、美泊利单抗、美替木单抗、MGB453、MGD006/S80880、MGD007、MGD009、MGD011、milatuzumab、milatuzumab-SN-38、明瑞莫单抗、mirvetuximab soravtansine、米妥莫单抗、MK-4166、MM-111、MM-151、MM-302、mogamulizumab、MOR202、MOR208、MORAb-066、莫罗木单抗、莫维珠单抗、moxetumomab pasudotox、莫罗单抗-CD3、他那可单抗、namilumab、伊那莫单抗、narnatumab、那他珠单抗、奈巴库单抗、耐昔妥珠单抗、nemolizumab、奈瑞莫单抗、nesvacumab、尼妥珠单抗、纳武单抗、巯诺莫单抗、NOV-10、obiltoxaximab、奥滨尤妥珠单抗、ocaratuzumab、ocrelizumab、奥度莫单抗、奥法木单抗、奥拉单抗、olokizumab、奥马珠单抗、OMP-131R10、OMP-305B83、阿那妥单抗、ontuxizumab、opicinumab、oportuzumabmonatox、奥戈伏单抗、orticumab、奥昔珠单抗、otlertuzumab、0X002/MEN1309、欧西鲁单抗、ozanezumab、ozoralizumab、pagibaximab、帕利珠单抗、帕尼单抗、pankomab、PankoMab-GEX、panobacumab、parsatuzumab、pascolizumab、pasotuxizumab、pateclizumab、patritumab、PAT-SC1、PAT-SM6、派姆单抗、pemtumomab、perakizumab、帕妥珠单抗、培克珠单抗、PF-05082566(utomilumab)、PF-06647263、PF-06671008、PF-06801591、pidilizumab、pinatuzumab vedotin、平妥单抗、placulumab、polatuzumab vedotin、ponezumab、普立昔单抗、pritoxaximab、普托木单抗、PRO 140、Proxinium、PSMA ADC、quilizumab、雷妥莫单抗、radretumab、瑞非韦鲁、ralpancizumab、雷莫芦单抗、雷珠单抗、瑞西巴库、refanezumab、瑞加韦单抗、REGN1400、REGN2810/SAR439684、瑞利珠单抗、RFM-203、RG7356、RG7386、RG7802、RG7813、RG7841、RG7876、RG7888、RG7986、rilotumumab、rinucumab、利妥昔单抗、RM-1929、RO7009789、罗妥木单抗、roledumab、romosozumab、rontalizumab、罗维珠单抗、鲁利单抗、sacituzumab govitecan、samalizumab、SAR408701、SAR566658、sarilumab、SAT 012、沙妥莫单抗喷地肽、SCT200、SCT400、SEA-CD40、苏金单抗、seribantumab、setoxaximab、司韦单抗、SGN-CD19A、SGN-CD19B、SGN-CD33A、SGN-CD70A、SGN-LIV1A、西罗珠单抗、西法木单抗、司妥昔单抗、simtuzumab、西利珠单抗、西鲁库单抗、sofituzumabvedotin、solanezumab、solitomab、sonepcizumab、索土珠单抗、司他莫鲁、硫索单抗、suvizumab、SYD985、SYM004(futuximab和modotuximab)、Sym015、TAB08、tabalumab、tacatuzumab tetraxetan、他度珠单抗、他利珠单抗、他尼珠单抗、Tanibirumab、帕他普莫单抗、他瑞妥单抗、TB-403、tefibazumab、Teleukin、阿替莫单抗、tenatumomab、替奈昔单抗、teplizumab、teprotumumab、tesidolumabtetulomab、TG-1303、TGN1412、钍-227-依帕珠单抗、ticilimumab、替加珠单抗、tildrakizumab、Tisotumab vedotin、TNX-650、托珠单抗、托利珠单抗、tosatoxumab、托西莫单抗、tovetumab、tralokinumab、曲妥珠单抗、曲妥珠单抗-美坦新、TRBS07、TRC105、tregalizumab、替西木单抗、trevogrumab、TRPH 011、TRX518、TSR-042、TTI-200.7、tucotuzumab celmoleukin、妥韦单抗、U3-1565、U3-1784、ublituximab、ulocuplumab、urelumab、乌珠单抗、乌司奴单抗、Vadastuximab Talirine、vandortuzumab vedotin、vantictumab、vanucizumab、vapaliximab、varlilumab、vatelizumab、VB6-845、维多珠单抗、维妥珠单抗、维帕莫单抗、维森库单抗、维西珠单抗、伏罗昔单抗、vorsetuzumab mafodotin、伏妥莫单抗、YYB-101、扎鲁木单抗、zanolimumab、扎妥昔单抗、ziralimumab和阿佐莫单抗。在一些实施方案中，配体相互作用域与上述抗体的Fc结构域结合。

在一些实施方案中，配体相互作用域与抗体结合，该抗体又与选自下组的抗原结合：1-40-β淀粉状蛋白、4-1BB、5AC、5T4、激活素受体样激酶1、ACVR2B、腺癌抗原、AGS-22M6、甲胎蛋白、血管生成素2、血管生成素3、炭疽毒素、AOC3(VAP-1)、B7-H3、炭疽杆菌、BAFF、β-淀粉状蛋白、B-淋巴瘤细胞、C242抗原、C5、CA-125、家犬IL31、碳酸酐酶9(CA-IX)、心肌肌球蛋白、CCL11(嗜酸性粒细胞趋化因子-1)、CCR4、CCR5、CD11、CD18、CD125、CD140a、CD147(basigin)、CD15、CD152、CD154(CD40L)、CD19、CD2、CD20、CD200、CD22、CD221、CD23(IgE受体)、CD25(IL-2受体的α链)、CD27、CD274、CD28、CD3、CD3ε、CD30、CD33、CD37、CD38、CD4、CD40、CD40配体、CD41、CD44 v6、CD5、CD51、CD52、CD56、CD6、CD70、CD74、CD79B、CD80、CEA、CEA相关抗原、CFD、ch4D5、CLDN18.2、艰难梭菌、聚集因子A、CSF1R、CSF2、CTLA-4、C-X-C趋化因子受体4型、巨细胞病毒、巨细胞病毒糖蛋白B、达比加群、DLL4、DPP4、DR5、大肠杆菌志贺毒素1型、大肠杆菌志贺毒素2型、EGFL7、EGFR、内毒素、EpCAM、上皮唾液蛋白、ERBB3、大肠杆菌、呼吸道合胞病毒F蛋白、FAP、纤维蛋白IIβ链、纤连蛋白胞外域B、叶酸水解酶、叶酸受体1、叶酸受体α、卷曲受体、神经节苷脂GD2、GD2、GD3神经节苷脂、磷脂酰肌醇蛋白聚糖3、GMCSF受体α链、GPNMB、生长分化因子8、GUCY2C、血凝素、乙型肝炎表面抗原、乙型肝炎病毒、HER1、HER2/neu、HER3、HGF、HHGFR、组蛋白复合物、HIV-1、HLA-DR、HNGF、Hsp90、人分散因子受体激酶、人TNF、人β淀粉状蛋白、ICAM-1(CD54)、IFN-α、IFN-γ、IgE、IgE Fc区、IGF-1受体、IGF-1、IGHE、IL17A、IL 17F、IL 20、IL-12、IL-13、IL-17、IL-1β、IL-22、IL-23、IL-31RA、IL-4、IL-5、IL-6、IL-6受体、IL-9、ILGF2、甲型流感血凝素、甲型流感病毒血凝素、胰岛素样生长因子I受体、整联蛋白α4β7、整联蛋白α4、整联蛋白α5β1、整联蛋白α7β7、整联蛋白αIIbβ3、整联蛋白αvβ3、干扰素α/β受体、干扰素γ诱导蛋白、ITGA2、ITGB2(CD18)、KIR2D、Lewis-Y抗原、LFA-1(CD11a)、LINGO-1、磷脂壁酸质、LOXL2、L-选择蛋白(CD62L)、LTA、MCP-1、间皮素、MIF、MS4A1、MSLN、MUC1、粘蛋白CanAg、髓鞘相关糖蛋白、肌肉生长抑制素、NCA-90(粒细胞抗原)、神经凋亡调节蛋白水解酶1、NGF、N-羟乙酰神经氨酸、NOGO-A、Notch受体、NRP1、穴兔、OX-40、oxLDL、PCSK9、PD-1、PDCD1、PDGF-Rα、磷酸-钠共转运蛋白、磷脂酰丝氨酸、血小板衍生生长因子受体β、前列腺癌细胞、铜绿假单胞菌、狂犬病病毒糖蛋白、RANKL、呼吸道合胞病毒、RHD、恒河猴因子、RON、RTN4、骨硬化蛋白、SDC1、选择蛋白P、SLAMF7、SOST、鞘氨醇-1-磷酸、金黄色葡萄球菌、STEAP1、TAG-72、T细胞受体、TEM1、生腱蛋白C、TFPI、TGF-β1、TGF-β2、TGF-β、TNF-α、TRAIL-R1、TRAIL-R2、肿瘤抗原CTAA16.88、MUC1的肿瘤特异性糖基化、肿瘤相关钙信号转导蛋白2、TWEAK受体、TYRP1(糖蛋白75)、VEGFA、VEGFR1、VEGFR2、波形蛋白和VWF。

在一些实施方案中，配体相互作用域可与抗体模拟物结合。如本文其他地方所述，抗体模拟物可以以与抗体相当的亲和力与靶分子结合。在一些实施方案中，配体相互作用域可与本文其他地方所述的人源化抗体结合。在一些实施方案中，嵌合体跨膜受体多肽的配体相互作用域可与人源化抗体的片段结合。在一些实施方案中，配体相互作用域可与单链可变片段(scFv)结合。

在一些实施方案中，配体相互作用域与合适的哺乳动物(例如，人、小鼠、大鼠、山羊、绵羊或猴)的免疫球蛋白(例如，IgG、IgA、IgM或IgE)的Fc部分结合。合适的Fc结合域可以衍生自天然存在的蛋白质，如哺乳动物Fc受体或某些细菌蛋白质(例如，A蛋白和G蛋白)。另外，Fc结合域可以是合成多肽，其被特别地工程改造，从而以期望的亲和力和特异性与本文所述的任何Ig分子的Fc部分结合。例如，这样的Fc结合域可以是与免疫球蛋白的Fc部分特异性结合的抗体或其抗原结合片段。实例包括但不限于单链可变片段(scFv)、结构域抗体和纳米抗体。或者，Fc结合域可以是与Fc部分特异性结合的合成肽，如Kunitz结构域、小模块免疫药物(SMIP)、adnectin、avimer、亲和体(affibody)、DARPin或anticalin，其可以通过筛查在肽文库中筛查对Fc的结合活性来鉴别。

在一些实施方案中，配体相互作用域包括Fc结合域，该Fc结合域包括哺乳动物Fc受体的胞外配体结合域。Fc受体通常是在许多免疫细胞(包括B细胞、树突细胞、自然杀伤(NK)细胞、巨噬细胞、嗜中性粒细胞、肥大细胞和嗜酸性粒细胞)表面表达的细胞表面受体，并且表现出对抗体的Fc结构域的结合特异性。在一些情况下，Fc受体与抗体的Fc部分的结合可触发抗体依赖性细胞介导的细胞毒性(ADCC)效应。用于构建本文所述嵌合跨膜受体多肽的Fc受体可以是天然存在的多态性变体，诸如与野生型对应物相比可具有改变的(例如，增加的或减少的)对Fc结构域的亲和力的变体。或者，Fc受体可以是野生型对应物的功能变体，其携带一个或多个改变对Ig分子的Fc部分的结合亲和力的突变(例如，至多10个氨基酸残基置换)。在一些实施方案中，突变可改变Fc受体的糖基化模式，因此改变对Fc结构域的结合亲和力。

表1列出了Fc受体胞外域中的一些示例性多态性(参见例如，Kim等人,J.Mol.Evol.53:1-9,2001)。

表1.Fc受体中的示例性多态性

氨基酸序号

19

48

65

89

105

130

134

141

142

158

FCR10

R

S

D

I

D

G

F

Y

T

V

P08637

R

S

D

I

D

G

F

Y

I

F

S76824

R

S

D

I

D

G

F

Y

I

V

J04162

R

N

D

V

D

F

H

I

V

M31936

S

N

I

D

F

H

I

V

M24854

S

N

I

E

D

S

H

I

V

X07934

R

S

N

I

D

F

H

I

V

X14356(FcγRII)

N

S

E

S

I

M31932(FcγRI)

S

T

N

R

E

A

F

T

I

G

X06948(FcαεI)

R

S

E

S

Q

S

E

S

I

V

Fc受体通常可以基于其能够结合的抗体的同种型来分类。例如，Fc-γ受体(FcγR)通常与IgG抗体(例如，IgG1、IgG2、IgG3和IgG4)结合；Fc-α受体(FcαR)通常与IgA抗体结合；并且Fc-ε受体(FcεR)通常与IgE抗体结合。在一些实施方案中，配体相互作用域包含Fcγ受体或其任何衍生物、变体或片段。在一些实施方案中，配体相互作用域包括包含FcR的Fc结合域，该FcR选自FcγRI(CD64)、FcγRIa、FcγRIb、FcγRIc、包括同种异型H131和R131的FcγRIIA(CD32)、包括FcγRIIB-1和FcγRIIB-2的FcγRIIB(CD32)、包括同种异型V158和F158的FcγRIIIA(CD16a)、包括同种异型FcγRIIIb-NAl和FcγRIIIb-NA2的FcγRIIIB(CD16b)、其任何衍生物、其任何变体及其任何片段。FcγR可来自任何生物体，包括但不限于人类、小鼠、大鼠、兔和猴。小鼠FcγR包括但不限于FcγRI(CD64)、FcγRII(CD32)、FcγRIII(CD16)和FcγRIII-2(CD16-2)。在一些实施方案中，配体相互作用域包含Fcε受体或其任何衍生物、变体或片段。在一些实施方案中，配体相互作用域包含选自FcεRI、FcεRII(CD23)、其任何衍生物、其任何变体及其任何片段的FcR。在一些实施方案中，配体相互作用域包含Fcα受体或其任何衍生物、变体或片段。在一些实施方案中，配体相互作用域包含选自FcαRI(CD89)、Fcα/μR、其任何衍生物、其任何变体及其任何片段的FcR。在一些实施方案中，配体相互作用域包含选自FcRn、其任何衍生物、其任何变体及其任何片段的FcR。用于嵌合体跨膜受体多肽的Fc受体的配体结合域的选择可能取决于各种因素，诸如期望Fc结合域与之结合的抗体的同种型以及结合相互作用的期望的亲和力。

在一些实施方案中，配体相互作用域包括CD16的胞外配体结合域，其可并入可调节对Fc结构域的亲和力的天然存在的多态性。在一些实施方案中，配体相互作用域包括CD16的胞外配体结合域，其在位置158处并入多态性(例如，缬氨酸或苯丙氨酸)。在一些实施方案中，配体相互作用域改变其糖基化状态及其对Fc结构域的亲和力的条件下产生。在一些实施方案中，配体相互作用域包含并入修饰的CD16的胞外配体结合域，该修饰使并入其的嵌合跨膜受体多肽对IgG抗体的子集具有特异性。

例如，可以并入增加或减少对IgG亚型(例如，IgG1)的亲和力的突变。在一些实施方案中，配体相互作用域包括CD32的胞外配体结合域，其可并入可调节对Fc结构域的亲和力的天然存在的多态性。在一些实施方案中，配体相互作用域包括并入修饰的CD32的胞外配体结合域，该修饰使并入其的嵌合跨膜受体多肽对IgG抗体的子集具有特异性。例如，可以并入增加或减少对IgG亚型(例如，IgG1)的亲和力的突变。

在一些实施方案中，配体相互作用域包括CD64的胞外配体结合域，其可并入可调节对Fc结构域的亲和力的天然存在的多态性。在一些实施方案中，配体相互作用域在改变其糖基化状态及其对Fc结构域的亲和力的条件下产生。在一些实施方案中，配体相互作用域包括并入修饰的CD64的胞外配体结合域，该修饰使并入其的嵌合跨膜受体多肽对IgG抗体的子集具有特异性。例如，可以并入增加或减少对IgG亚型(例如，IgG1)的亲和力的突变。

在其他实施方案中，配体相互作用域包括能够与IgG分子的Fc部分或其任何衍生物、变体或片段结合的天然存在的细菌蛋白质(例如，蛋白A、蛋白G)。在一些实施方案中，配体相互作用域包括蛋白A或其任何衍生物、变体或片段。蛋白A是指最初在细菌金黄色葡萄球菌的细胞壁中发现的42kDa表面蛋白。它由五个结构域组成，每个结构域折叠成三螺旋束，并能够通过与大多数抗体的Fc区域以及人VH3家族抗体的Fab区域相互作用而与IgG结合。在一些实施方案中，配体相互作用域包括蛋白G或其任何衍生物、变体或片段。蛋白G是指在C组和G组链球菌细菌中表达的约60-kDa的蛋白质，其与哺乳动物IgG的Fab和Fc区域结合。尽管天然蛋白G也与白蛋白结合，但重组变体经过了消除白蛋白结合的工程改造。

配体相互作用域也可以使用组合生物学或定向进化方法从头创建。从蛋白质支架(例如，衍生自IgG的scFv、衍生自Kunitz型蛋白酶抑制剂的Kunitz结构域、锚蛋白重复序列、来自蛋白A的Z结构域、脂质运载蛋白、纤连蛋白III型结构域、来自Fyn的SH3结构域或其他结构域)开始，表面上一组残基的氨基酸侧链可以被随机取代以创建大型的变体支架文库。从大型文库中，可以通过首先对结合进行选择来分离对于靶标如Fc结构域具有亲和力的变体，随后通过噬菌体、核糖体或细胞展示进行扩增。重复轮次的选择和扩增可以用来分离那些对靶标具有最高亲和力的蛋白质。示例性的Fc结合肽可包含氨基酸序列ETQRCTWHMGELVWCEREHN(SEQ ID NO:19)、KEASCSYWLGELVWCVAGVE(SEQ ID NO:20)或DCAWHLGELVWCT(SEQ ID NO:21)。

本文所述的任何Fc结合物可具有与抗体的Fc结构域的合适的结合亲和力。结合亲和力是指表观缔合常数或称KA。KA是解离常数KD的倒数。本文所述嵌合体跨膜受体多肽的Fc受体结构域的胞外配体结合域对于抗体的Fc部分可具有至少10^-5、10^-6、10^-7、10^-8、10^-9、10^-10M或更低的结合亲和力KD。在一些实施方案中，与配体相互作用域与另一抗体、抗体的同种型或其亚型的结合亲和力相比，与抗体的Fc部分结合的配体相互作用域对抗体、抗体的同种型或其亚型具有较高的结合亲和力。

在一些实施方案中，与Fc受体的胞外配体结合域与另一抗体、抗体的同型或其亚型的结合相比，Fc受体的胞外配体结合域对抗体、抗体的同型或其亚型具有特异性。具有相对较高的亲和力结合的Fcγ受体包括CD64A、CD64B和CD64C。具有相对较低的结合亲和力的Fcγ受体包括CD32A、CD32B、CD16A和CD16B。具有相对较高的结合亲和力的Fcε受体包括FcεRI，具有相对较低的结合亲和力的Fcε受体包括FcεRII/CD23。

Fc受体或其任何衍生物、变体或片段或包含Fc结合域的嵌合跨膜受体多肽的结合亲和力或结合特异性可通过多种方法确定，该方法包括平衡透析、平衡结合、凝胶过滤、ELISA、表面等离子体共振和光谱学。

在一些实施方案中，包括Fc受体的胞外配体结合域的配体相互作用域包含与天然存在的Fcγ受体、Fcα受体、Fcε受体或FcRn的胞外配体结合区的氨基酸序列至少90％(例如，91％、92％、93％、94％、95％、96％、97％、98％、99％或更高)相同的氨基酸序列。两个氨基酸序列的“同一性百分比”或“％同一性”可以使用Karlin和AltschulProc.Natl.Acad.Sci.USA 87:2264-68,1990的算法来确定，并根据Karlin和AltschulProc.Natl.Acad.Sci.USA 90:5873-77,1993进行修正。这样的算法被纳入Altschul等人,J.Mol.Biol.215:403-10,1990的NBLAST和XBLAST程序(版本2.0)中。BLAST蛋白质搜索可使用XBLAST程序执行，得分＝50，字长＝3，以获得与本公开的蛋白质分子同源的氨基酸序列。在两个序列之间存在空位的情况下，可以使用缺口BLAST，如Altsurl等人,Nucleic AcidsRes.25(17):3389-3402,1997所述。在使用BLAST和缺口BLAST程序时，可以使用各个程序(例如，XBLAST和NBLAST)的默认参数。

在一些实施方案中，配体相互作用域包括Fc结合域，该Fc结合域包含Fc受体的胞外配体结合域的变体。在一些实施方案中，Fc受体的变体胞外配体结合域可包含相对于参考胞外配体结合域的氨基酸序列至多10个氨基酸残基变化(例如，1、2、3、4、5、6、7、8、9或10个)。在一些实施方案中，变体可以是由于基因多态性而天然存在的变体。在其他实施方案中，变体可以是非天然存在的修饰分子。例如，可以将突变引入Fc受体的胞外配体结合域，以改变其糖基化模式，从而改变其与相应Fc结构域的结合亲和力。

在一些实例中，配体相互作用域包括Fc结合，该Fc结合包括选自如本文所述的CD16A、CD16B、CD32A、CD32B、CD32C、CD64A、CD64B、CD64C或其变体、片段或衍生物的Fc受体。相对于本文所述的CD16A、CD16B、CD32A、CD32B、CD32C、CD64A、CD64B、CD64C的胞外配体结合域的氨基酸序列，Fc受体的胞外配体结合域可包含至多10个氨基酸残基变化(例如，1、2、3、4、5、6、7、8、9或10个)。相对于不包含突变的Fc受体结构域，Fc受体的胞外配体结合域的氨基酸残基的突变可导致Fc受体结构域与抗体、抗体的同种型或其亚型的结合亲和力的增加。例如，Fcγ受体CD16A的残基158的突变可导致Fc受体与抗体的Fc部分的结合亲和力增加。在一些实施方案中，该突变是在Fcγ受体CD16A的158残基处将苯丙氨酸置换为缬氨酸。在Fc受体的胞外配体结合域中可产生各种合适的替代或另外的突变，其可增强或降低与诸如抗体等分子的Fc部分的结合亲和力。

包括配体相互作用域的胞外区可以例如通过跨膜区段与胞内区连接。在一些实施方案中，跨膜区段包括多肽。连接嵌合跨膜受体的胞外区和胞内区的跨膜多肽可以具有任何合适的多肽序列。在一些情况下，跨膜多肽包含内源或野生型跨膜蛋白质的跨膜部分的多肽序列。在一些实施方案中，相比于内源或野生型跨膜蛋白质的跨膜部分，跨膜多肽包含至少具有1个(例如，至少2、3、4、5、6、7、8、9、10个或更多个)氨基酸置换、缺失和插入的多肽序列。在一些实施方案中，跨膜多肽包含非天然多肽序列，诸如多肽连接体序列。多肽连接体可以是柔性的或刚性的。多肽连接体可以是结构化的或非结构化的。在一些实施方案中，跨膜多肽将信号从受体的胞外区传递到胞内区，该信号例如指示配体结合的信号。

本发明系统的嵌合跨膜受体多肽的胞内区的免疫细胞信号传导域可包括初级信号传导域。初级信号传导域可以是参与免疫细胞信号传导的任何信号传导域或其衍生物、变体或片段。例如，信号传导域以刺激性方式或抑制性方式参与调节TCR复合物的初级激活。初级信号传导域可包括Fcγ受体(FcγR)、Fcε受体(FcεR)、Fcα受体(FcαR)、新生儿Fc受体(FcRn)、CD3、CD3ζ、CD3γ、CD3δ、CD3ε、CD4、CD5、CD8、CD21、CD22、CD28、CD32、CD40L(CD154)、CD45、CD66d、CD79a、CD79b、CD80、CD86、CD278(也称ICOS)、CD247ζ、CD247η、DAP10、DAP12、FYN、LAT、Lck、MAPK、MHC复合物、NFAT、NF-κB、PLC-γ、iC3b、C3dg、C3d和Zap70的信号传导域。在一些实施方案中，初级信号传导域包含基于免疫受体酪氨酸的活化基序或称ITAM。包含ITAM的初级信号结构域可包含由6-8个氨基酸间隔开的氨基酸序列YxxL/I的两个重复，其中每个x独立地为任何氨基酸，产生保守基序YxxL/Ix_(6-8)YxxL/I。当配体相互作用域与抗原结合时，可通过例如磷酸化来修饰包含ITAM的初级信号传导域。磷酸化的ITAM可以作为其他蛋白质例如参与各种信号传导途径的蛋白质的停靠位点。在一些实施方案中，初级信号传导域包含修饰的ITAM结构域，例如突变的、截短的和/或优化的ITAM结构域，其与天然ITAM结构域相比，具有改变的(例如，增加的或减少的)活性。

在一些实施方案中，初级信号传导域包含FcγR信号传导域(例如，ITAM)。FcγR信号传导域可选自FcγRI(CD64)、FcγRIIA(CD32)、FcγRIIB(CD32)、FcγRIIIA(CD16a)和FcγRIIIB(CD16b)。在一些实施方案中，初级信号传导域包含FcεR信号传导域(例如，ITAM)。FcεR信号传导域可选自FcεRI和FcεRII(CD23)。在一些实施方案中，初级信号传导域包含FcαγR信号传导域(例如，ITAM)。FcαR信号传导域可选自FcαRI(CD89)和Fcα/μR。在一些实施方案中，初级信号传导域包含CD3ζ信号传导域。在一些实施方案中，初级信号传导域包含CD3ζ的ITAM。

在一些实施方案中，初级信号传导域包含基于免疫受体酪氨酸的抑制基序或称ITIM。包含ITIM的初级信号传导域可包含在免疫系统的一些抑制性受体的细胞质尾部中发现的保守氨基酸序列(S/I/V/LxYxxI/V/L)。包含ITIM的初级信号传导域可以通过酶如Src激酶家族成员(例如，Lck)进行修饰，例如磷酸化。在磷酸化之后，包括酶在内的其他蛋白质可以被募集到ITIM中。这些其他蛋白质包括但不限于酶如磷酸酪氨酸磷酸酶SHP-1和SHP-2、被称为SHIP的肌醇磷酸酶，以及具有一个或多个SH2结构域的蛋白质(例如，ZAP70)。初级信号传导域可包含以下的信号传导域(例如，ITIM)：BTLA、CD5、CD31、CD66a、CD72、CMRF35H、DCIR、EPO-R、FcγRIIB(CD32)、Fc受体样蛋白2(FCRL2)、Fc受体样蛋白3(FCRL3)、Fc受体样蛋白4(FCRL4)、Fc受体样蛋白5(FCRL5)、Fc受体样蛋白6(FCRL6)、蛋白质G6b(G6B)、白介素4受体(IL4R)、易位相关免疫球蛋白超家族受体1(IRTA1)、易位相关免疫球蛋白超家族受体2(IRTA2)、杀伤细胞免疫球蛋白样受体2DL1(KIR2DL1)、杀伤细胞免疫球蛋白样受体2DL2(KIR2DL2)、杀伤细胞免疫球蛋白样受体2DL3(KIR2DL3)、杀伤细胞免疫球蛋白样受体2DL4(KIR2DL4)、杀伤细胞免疫球蛋白样受体2DL5(KIR2DL5)、杀伤细胞免疫球蛋白样受体3DL1(KIR3DL1)、杀伤细胞免疫球蛋白样受体3DL2(KIR3DL2)、白细胞免疫球蛋白样受体亚家族B成员1(LIR1)、白细胞免疫球蛋白样受体亚家族B成员2(LIR2)、白细胞免疫球蛋白样受体亚家族B成员3(LIR3)、白细胞免疫球蛋白样受体亚家族B成员5(LIR5)、白细胞免疫球蛋白样受体亚家族B成员8(LIR8)、白细胞相关免疫球蛋白样受体1(LAIR-1)、肥大细胞功能相关抗原(MAFA)、NKG2A、天然细胞毒性触发受体2(NKp44)、NTB-A、程序性细胞死亡蛋白1(PD-1)、PILR、SIGLECL1、唾液酸结合性Ig样凝集素2(SIGLEC2或CD22)、唾液酸结合性Ig样凝集素3(SIGLEC3或CD33)、唾液酸结合性Ig样凝集素5(SIGLEC5或CD170)、唾液酸结合性Ig样凝集素6(SIGLEC6)、唾液酸结合性Ig样凝集素7(SIGLEC7)、唾液酸结合性Ig样凝集素10(SIGLEC10)、唾液酸结合性Ig样凝集素11(SIGLEC11)、唾液酸结合性Ig样凝集素4(SIGLEC4)、唾液酸结合性Ig样凝集素8(SIGLEC8)、唾液酸结合性Ig样凝集素9(SIGLEC9)、血小板和内皮细胞粘附分子1(PECAM-1)、信号调节蛋白(SIRP 2)和信号阈值调节跨膜衔接子1(SIT)。在一些实施方案中，初级信号传导域包含修饰的ITIM结构域，例如突变的、截短的和/或优化的ITIM结构域，其与天然ITIM结构域相比，具有改变的(例如，增加的或减少的)活性。

在一些实施方案中，免疫细胞信号传导域包含多个初级信号传导域。例如，免疫细胞信号传导域可包含至少2个初级信号传导域，例如，至少2、3、4、5、7、8、9或10个初级信号传导域。在一些实施方案中，免疫细胞信号传导域包含至少2个ITAM结构域(例如，至少3、4、5、6、7、8、9或10个ITAM结构域)。在一些实施方案中，免疫细胞信号传导域包含至少2个ITIM结构域(例如，至少3、4、5、6、7、8、9或10个ITIM结构域)(例如，至少2个初级信号传导域)。在一些实施方案中，免疫细胞信号传导域包含ITAM和ITIM结构域。

嵌合跨膜受体多肽的胞内区的免疫细胞信号传导域可包括共刺激域。在一些实施方案中，例如来自共刺激分子的共刺激域可以为免疫细胞信号传导如来自ITAM和/或ITIM结构域的信号传导提供共刺激信号，例如用于免疫细胞的激活和/或失活。在嵌合跨膜受体的示例性构型中可包含免疫细胞信号传导域，其包含初级信号传导域(信号域1)和至少一个共刺激域(信号域2等)。在一些实施方案中，共刺激域是可操作的，以调节免疫细胞中的增殖和/或存活信号。在一些实施方案中，共刺激信号传导域包含MHCⅠ类蛋白、MHCⅡ类蛋白、TNF受体蛋白、免疫球蛋白样蛋白、细胞因子受体、整联蛋白、信号传导淋巴细胞激活分子(SLAM蛋白)、激活NK细胞受体、BTLA或Toll配体受体的信号传导域。在一些实施方案中，共刺激域包含选自下组的分子的信号传导域：2B4/CD244/SLAMF4、4-1BB/TNFSF9/CD137、B7-1/CD80、B7-2/CD86、B7-H1/PD-L1、B7-H2、B7-H3、B7-H4、B7-H6、B7-H7、BAFF R/TNFRSF13C、BAFF/BLyS/TNFSF13B、BLAME/SLAMF8、BTLA/CD272、CD100(SEMA4D)、CD103、CD11a、CD11b、CD11c、CD11d、CD150、CD160(BY55)、CD18、CD19、CD2、CD200、CD229/SLAMF3、CD27配体/TNFSF7、CD27/TNFRSF7、CD28、CD29、CD2F-10/SLAMF9、CD30配体/TNFSF8、CD30/TNFRSF8、CD300a/LMIR1、CD4、CD40配体/TNFSF5、CD40/TNFRSF5、CD48/SLAMF2、CD49a、CD49D、CD49f、CD53、CD58/LFA-3、CD69、CD7、CD8α、CD8β、CD82/Kai-1、CD84/SLAMF5、CD90/Thy1、CD96、CDS、CEACAM1、CRACC/SLAMF7、CRTAM、CTLA-4、DAP12、Dectin-1/CLEC7A、DNAM1(CD226)、DPPIV/CD26、DR3/TNFRSF25、EphB6、GADS、Gi24/VISTA/B7-H5、GITR配体/TNFSF18、GITR/TNFRSF18、HLAI类、HLA-DR、HVEM/TNFRSF14、IA4、ICAM-1、ICOS/CD278、Ikaros、IL2Rβ、IL2Rγ、IL7Rα、整联蛋白α4/CD49d、整联蛋白α4β1、整联蛋白α4β7/LPAM-1、IPO-3、ITGA4、ITGA6、ITGAD、ITGAE、ITGAL、ITGAM、ITGAX、ITGB1、ITGB2、ITGB7、KIRDS2、LAG-3、LAT、LIGHT/TNFSF14、LTBR、Ly108、Ly9(Cd229)、淋巴细胞功能相关抗原-1(LFA-1)、淋巴毒素-α/TNF-β、NKG2C、NKG2D、NKp30、NKp44、NKp46、NKp80(KLRF1)、NTB-A/SLAMF6、OX40配体/TNFSF4、OX40/TNFRSF4、PAG/Cbp、PD-1、PDCD6、PD-L2/B7-DC、PSGL1、RELT/TNFRSF19L、SELPLG(CD162)、SLAM(SLAMF1)、SLAM/CD150、SLAMF4(CD244)、SLAMF6(NTB-A)、SLAMF7、SLP-76、TACI/TNFRSF13B、TCL1A、TCL1B、TIM-1/KIM-1/HAVCR、TIM-4、TL1A/TNFSF15、TNF RII/TNFRSF1B、TNF-α、TRANCE/RANKL、TSLP、TSLPR、VLA1和VLA-6。在一些实施方案中，信号传导域包含多个共刺激域，例如至少两个，例如至少3、4或5个共刺激域。

包括GPCR或其任何变体的跨膜受体(例如，包括GPCR细胞外、跨膜和胞内域中至少一个的合成或嵌合受体)可与包括任何合适GPCR配体或其任何变体的配体结合。可以被GPCR结合的配体的非限制性实例包括(-)-肾上腺素、(-)-去甲肾上腺素、(溶血)磷脂介质、[des-Arg10]胰激肽、[des-Arg9]缓激肽、[des-Gln14]生长素释放肽、[Hyp3]缓激肽、[Leu]脑啡肽、[Met]脑啡肽、12-羟基十七碳三烯酸、12R-HETE、12S-HETE、12S-HPETE、15S-HETE、17β-雌二醇、20-羟基-LTB4、2-花生四烯酰基甘油、2-油酰基-LPA、3-羟基辛酸、5-羟基色胺、5-氧代-15-HETE、5-氧代-ETE、5-氧代-ETrE、5-氧代-ODE、5S-HETE、5S-HPETE、7α,25-二羟基胆固醇、乙酰胆碱、ACTH、腺苷二磷酸、腺苷、肾上腺髓质素2/垂体中间叶激素、肾上腺髓质素、胰淀素(amylin)、花生四烯酸乙醇酰胺(anandamide)、血管紧张素II、血管紧张素III、膜联蛋白I、apelin受体早期内源性配体、apelin-13、apelin-17、apelin-36、阿司匹林触发的脂氧素A4、阿司匹林触发的消退素(resolvin)D1、ATP、β-防御素4A、大强啡肽、牛肾上腺髓质肽8-22、缓激肽、C3a、C5a、Ca2+、降钙素基因相关肽、降钙素、组织蛋白酶G、CCK-33、CCK-4、CCK-8、CCL1、CCL11、CCL13、CCL14、CCL15、CCL16、CCL17、CCL19、CCL2、CCL20、CCL21、CCL22、CCL23、CCL24、CCL25、CCL26、CCL27、CCL28、CCL3、CCL4、CCL5、CCL7、CCL8、趋化素(chemerin)、鹅去氧胆酸、胆酸、促肾上腺皮质激素释放激素、CST-17、CX3CL1、CXCL1、CXCL10、CXCL11、CXCL12α、CXCL12β、CXCL13、CXCL16、CXCL2、CXCL3、CXCL5、CXCL6、CXCL7、CXCL8、CXCL9、半胱氨酸-白三烯(CysLT)、尿嘧啶核苷酸、脱氧胆酸、二氢鞘氨醇-1-磷酸、二油酰基磷脂酸、多巴胺、强啡肽A、强啡肽A-(1-13)、强啡肽A-(1-8)、强啡肽B、内啡肽-1、内皮素-1、内皮素-2、内皮素-3、F2L、游离脂肪酸、FSH、GABA、甘丙肽、甘丙肽样肽、肠抑胃肽、胃泌素-17、胃泌素释放肽、生长素释放肽、GHRH、胰高血糖素、胰高血糖素样肽1-(7-36)酰胺、胰高血糖素样肽1-(7-37)、胰高血糖素样肽2、胰高血糖素样肽2-(3-33)、GnRH I、GnRHII、GRP-(18-27)、hCG、组胺、humanin、INSL3、INSL5、胰激肽、亲吻素(kisseptin)-10、亲吻素-13、亲吻素-14、亲吻素-54、犬尿喹啉酸、大神经调节肽N、大神经降压肽、L-谷氨酸、LH、石胆酸、L-乳酸、长链羧酸、LPA、LTB4、LTC4、LTD4、LTE4、LXA4、Lys-[Hyp3]-缓激肽、溶血磷脂酰肌醇、溶血磷脂酰丝氨酸、中链脂肪酸、黑色素浓缩激素、褪黑素、甲基氨基甲酰基PAF、Mg2+、促胃动素、N-花生四烯酰甘氨酸、神经激肽A、神经激肽B、神经调节肽B、神经调节肽N、神经调节肽S-33、神经调节肽U-25、神经抑素(neuronostatin)、神经肽AF、神经肽B-23、神经肽B-29、神经肽FF、神经肽S、神经肽SF、神经肽W-23、神经肽W-30、神经肽Y、神经肽Y-(3-36)、神经降压肽、痛敏肽/孤肽FQ、N-油酰乙醇酰胺、肥胖抑制素(obestatin)、章鱼胺、食欲肽A、食欲肽B、羟固醇、催产素、PACAP-27、PACAP-38、PAF、胰腺多肽、YY肽、PGD2、PGE2、PGF2α、PGI2、PGJ2、PHM、磷脂酰丝氨酸、PHV、前动力蛋白-1、前动力蛋白-2、前动力蛋白-2β、前列腺血清酸性磷酸酶(prosaposin)、PrRP-20、PrRP-31、PTH、PTHrP、PTHrP-(1-36)、QRFP43、松弛素、松弛素-1、松弛素-3、消退素D1、消退素E1、RFRP-1、RFRP-3、R-spondins、分泌素、丝氨酸蛋白酶、鞘氨醇1-磷酸、鞘氨醇基磷酸胆碱、SRIF-14、SRIF-28、物质P、琥珀酸、凝血酶、血栓烷A2、TIP39、T-激肽、TRH、TSH、酪胺、UDP-葡萄糖、尿苷二磷酸、尿皮质素1、尿皮质素2、尿皮质素3、硬骨鱼紧张肽II相关肽、硬骨鱼紧张肽II、血管加压素、VIP、Wnt、Wnt-1、Wnt-10a、Wnt-10b、Wnt-11、Wnt-16、Wnt-2、Wnt-2b、Wnt-3、Wnt-3a、Wnt-4、Wnt-5a、Wnt-5b、Wnt-6、Wnt-7a、Wnt-7b、Wnt-8a、Wnt-8b、Wnt-9a、Wnt-9b、XCL1、XCL2、Zn2+、α-CGRP、α-酮戊二酸、α-MSH、α-新内啡肽、β-丙氨酸、β-CGRP、β-D-羟基丁酸、β-内啡肽、β-MSH、β-新内啡肽、β-苯乙胺和γ-MSH。

包括整联蛋白亚单位或其任何变体的跨膜受体(例如，包括整联蛋白细胞外、跨膜和胞内域中至少一个的合成或嵌合受体)可与包括任何合适的整联蛋白配体或其任何变体的配体结合。可以被整联蛋白受体结合的配体的非限制性实例包括基于腺病毒五邻体的蛋白、β-葡聚糖、骨唾液酸蛋白(BSP)、布氏疏螺旋体(Borrelia burgdorferi)、白色念珠菌(Candida albicans)、胶原蛋白(CN，例如CNI-IV)、腱生蛋白/生腱蛋白-C、抗栓肽(decorsin)、变性胶原蛋白、解联蛋白、E-钙粘着蛋白、埃可病毒(echovirus)1受体、表皮整联配体蛋白、X因子、FcεRII(CD23)、纤维蛋白(Fb)、纤维蛋白原(Fg)、纤连蛋白(Fn)、肝素、HIV Tat蛋白、iC3b、细胞间粘附分子(例如，ICAM-1、2、3、4、5)、侵袭素、L1细胞粘附分子(L1-CAM)、层粘连蛋白、脂多糖(LPS)、MAdCAM-1、基质金属蛋白酶-2(MMPe)、嗜中性粒细胞抑制因子(NIF)、骨桥蛋白(OP或OPN)、纤溶酶原、凝血酶原、精子致育蛋白、血小板反应蛋白(TSP)、血管细胞粘附分子1(VCAM-1)、玻连蛋白(VN或VTN)和von Willebrand因子(vWF)。

包括钙粘着蛋白或其任何变体的跨膜受体(例如，包括钙粘着蛋白细胞外、跨膜和胞内域中至少一个的合成或嵌合受体)可与包括任何合适钙粘着蛋白配体或其任何变体的配体结合。例如，钙粘着蛋白配体可包括另一钙粘着蛋白受体(例如，细胞的钙粘着蛋白受体)。

包括RTK或其任何变体的跨膜受体(例如，包括RTK细胞外、跨膜和胞内域中至少一个的合成或嵌合受体)可与包括任何合适RTK配体或其任何变体的配体结合。RTK配体的非限制性实例包括生长因子、细胞因子和激素。生长因子包括例如，表皮生长因子家族成员(例如，表皮生长因子或称EGF、肝素结合性EGF样生长因子或称HB-EGF、转化生长因子-α或称TGF-α、双调蛋白称或AR、上皮调节蛋白或称EPR、epigen、β细胞素(betacellulin)或称BTC、神经调节蛋白-1或称NRG1、神经调节蛋白-2或称NRG2、神经调节蛋白-3或称NRG3以及神经调节蛋白-4或称NRG4)、成纤维细胞生长因子家族(例如，FGF1、FGF2、FGF3、FGF4、FGF5、FGF6、FGF7、FGF8、FGF9、FGF10、FGF11、FGF12、FGF13、FGF14、FGF15/19、FGF16、FGF17、FGF18、FGF20、FGF21和FGF23)、血管内皮生长因子家族(例如，VEGF-A、VEGF-B、VEGF-C、VEGF-D和PIGF)以及血小板衍生生长因子家族(例如，PDGFA、PDGFB、PDGFC和PDGFD)。激素包括例如胰岛素/IGF/松弛素家族成员(例如，胰岛素、胰岛素样生长因子、松弛素家族肽(包括松弛素1、松弛素2、松弛素3)、莱迪希细胞特异性胰岛素样肽(基因INSL3)、早期胎盘胰岛素样肽(ELIP)(基因INSL4)、胰岛素样肽5(基因INSL5)和胰岛素样肽6)。

包括细胞因子受体或其任何变体的跨膜受体(例如，包括细胞因子受体细胞外、跨膜和胞内域中至少一个的合成或嵌合受体)可与包括任何合适细胞因子受体配体或其任何变体的配体结合。细胞因子受体配体的非限制性实例包括白介素(例如，IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-9、IL-10、IL-11、IL-12、IL-13、IL-15、IL-20、IL-21、IL-22、IL-23、IL-27、IL-28和IL-31)、干扰素(例如，IFN-α、IFN-β、IFN-γ)、集落刺激因子(例如，红细胞生成素、巨噬细胞集落刺激因子、粒细胞巨噬细胞集落刺激因子或称GM-CSF和粒细胞集落刺激因子或称G-CSF)以及激素(例如，催乳素和瘦素)。

包括死亡受体或其任何变体的跨膜受体(例如，包括死亡受体细胞外、跨膜和胞内域中至少一个的合成或嵌合受体)可与包括任何合适死亡受体配体或其任何变体的配体结合。通过死亡受体结合的配体的非限制性实例包括TNFα、Fas配体和TNF相关凋亡诱导配体(TRAIL)。

包括嵌合抗原受体的跨膜受体可与包括膜结合配体(例如，抗原)的配体结合，该膜结合配体例如与细胞(例如，靶细胞)的细胞外表面结合的配体。在一些实施方案中，该配体是非膜结合的，例如是由细胞(例如，靶细胞)分泌的细胞外配体。配体(例如，膜结合的和非膜结合的)可以是抗原性的(例如，引起免疫反应)，并且与疾病相关，该疾病诸如病毒、细菌和/或寄生虫感染；炎性疾病和/或自身免疫病；或瘤(例如，癌症和/或肿瘤)。例如，癌抗原是由肿瘤细胞产生的蛋白质，可以引起免疫反应，特别是T细胞介导的免疫反应。嵌合受体多肽的抗原结合部分的选择可以取决于要靶向的癌抗原的特定类型。在一些实施方案中，肿瘤抗原包含一个或多个与恶性肿瘤相关的抗原性癌表位。恶性肿瘤可以表达可用作免疫攻击的靶抗原的多种蛋白质。抗原相互作用域可与细胞表面信号、细胞外基质(ECM)、旁分泌信号、近分泌信号、内分泌信号、自分泌信号、可触发或控制细胞中遗传程序的信号或其任何组合结合。在一些实施方案中，与重组嵌合受体多肽结合的细胞信号之间的相互作用涉及细胞-细胞相互作用、细胞-可溶性化学物质相互作用以及细胞-基质或微环境相互作用。

GMP可包含与异源核定位域框内融合的致动部分。该致动部分可包含核酸酶(例如，DNA核酸酶和/或RNA核酸酶)、与野生型核酸酶相比是核酸酶缺陷的或具有降低的核酸酶活性的修饰的核酸酶(例如，DNA核酸酶和/或RNA核酸酶)、其衍生物、其变体或其片段。致动部分可以调节基因的表达和/或活性，或者编辑核酸(例如，基因和/或基因产物)的序列。在一些实施方案中，致动部分包含DNA核酸酶，如工程化的(例如，可编程的或可靶向的)DNA核酸酶，以诱导靶DNA序列的基因组编辑。在一些实施方案中，致动部分包含RNA核酸酶，例如工程化的(例如，可编程的或可靶向的)RNA核酸酶，以诱导靶RNA序列的编辑。在一些实施方案中，致动部分具有降低的或最小的核酸酶活性。具有降低的或最小的核酸酶活性的致动部分可通过物理阻碍靶多核苷酸或者募集有效抑制或增强靶多核苷酸表达的其他因子来调节基因的表达和/或活性。在一些实施方案中，致动部分包含衍生自DNA核酸酶的无核酸酶DNA结合蛋白，其可以诱导靶DNA序列的转录激活或抑制。在一些实施方案中，致动部分包含衍生自RNA核酸酶的无核酸酶RNA结合蛋白，其可以诱导靶RNA序列的转录激活或抑制。在一些实施方案中，致动部分是核酸指导的致动部分。致动部分可以调节基因的表达或活性以及/或者编辑核酸序列，无论是外源的还是内源的。

致动部分中可以使用任何合适的核酸酶。合适的核酸酶包括但不限于CRISPR相关(Cas)蛋白或Cas核酸酶，包括I型CRISPR相关(Cas)多肽、II型CRISPR相关(Cas)多肽、III型CRISPR相关(Cas)多肽、IV型CRISPR相关(Cas)多肽、V型CRISPR相关(Cas)多肽(例如，Cpf1/Cas12a、C2c1或c2c3)和VI型CRISPR相关(Cas)多肽(例如，C2c2/Cas13a,Cas13b,Cas13c,Cas13d)；锌指核酸酶(ZFN)；转录激活物样效应核酸酶(TALEN)；大范围核酸酶；RNA结合蛋白(RBP)；CRISPR相关RNA结合蛋白；重组酶；翻转酶；转座酶；Argonaute(Ago)蛋白(例如，原核Argonaute(pAgo)、古菌Argonaute(aAgo)和真核Argonaute(eAgo))；其任何衍生物；其任何变体；及其任何片段。

在一些实施方案中，致动部分包含CRISPR相关(Cas)蛋白或Cas核酸酶，其在非天然存在的CRISPR(成簇的规律间隔短回文重复序列)/Cas(CRISPR相关)系统中起作用。在细菌中，该系统可提供针对外来DNA的适应性免疫(Barrangou,R.等人,“CRISPR providesacquired resistance against viruses in prokaryotes,”Science(2007)315:1709-1712；Makarova,K.S.等人,“Evolution and classification of the CRISPR-Cassystems,”Nat Rev Microbiol(2011)9:467-477；Garneau,J.E.等人,“The CRISPR/Casbacterial immune system cleaves bacteriophage and plasmid DNA,”Nature(2010)468:67-71；Sapranauskas,R.等人,“The Streptococcus thermophilus CRISPR/Cassystem provides immunity in Escherichia coli,”Nucleic Acids Res(2011)39:9275-9282)。

在包括多种哺乳动物、动物、植物和酵母在内的多种生物中，CRISPR/Cas系统(例如，修饰的和/或未修饰的)可以用作基因组工程化工具。CRISPR/Cas系统可包含与Cas蛋白复合的指导核酸，例如指导RNA(gRNA)，用于靶向调节基因表达和/或活性或核酸编辑。RNA指导的Cas蛋白(例如，Cas核酸酶，如Cas9核酸酶)可以以序列依赖性方式与靶多核苷酸(例如，DNA)特异性结合。如果Cas蛋白具有核酸酶活性，则可以切割DNA(Gasiunas,G.等人,“Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage foradaptive immunity in bacteria,”Proc Natl Acad Sci USA(2012)109:E2579-E2 86；Jinek,M.等人,“A programmable dual-RNA-guided DNA endonuclease in adaptivebacterial immunity,”Science(2012)337:816-821；Sternberg,S.H.等人,“DNAinterrogation by the CRISPR RNA-guided endonuclease Cas9,”Nature(2014)507:62；Deltcheva,E.等人,“CRISPR RNA maturation by trans-encoded small RNA and hostfactor RNase III,”Nature(201 1)471:602-607)，并已被广泛用于各种生物体和模型系统中的可编程基因组编辑(Cong,L.等人,“Multiplex genome engineering using CRISPRCas systems,”Science(2013)339:819-823；Jiang,W.等人,“RNA-guided editing ofbacterial genomes using CRISPR-Cas systems,”Nat.Biotechnol.(2013)31:233-239；Sander,J.D.和Joung,J.K,“CRISPR-Cas systems for editing,regulating andtargeting genomes,”Nature Biotechnol.(2014)32:347-355)。

在一些情况下，Cas蛋白被突变和/或修饰以产生核酸酶缺陷蛋白或相对于野生型Cas蛋白具有降低的核酸酶活性的蛋白质。核酸酶缺陷蛋白可以保留与DNA的结合能力，但可能缺乏核酸切割活性或具有降低的核酸切割活性。包含Cas核酸酶(例如，保留野生型核酸酶活性、具有降低的核酸酶活性和/或缺乏核酸酶活性)的致动部分可以在CRISPR/Cas系统中起作用，以调节靶基因或蛋白质的水平和/或活性(例如，减少、增加或消除)。Cas蛋白可以与靶多核苷酸结合并通过物理阻碍阻止转录或者编辑核酸序列以产生非功能性基因产物。

在一些实施方案中，致动部分包含Cas蛋白，其与指导核酸如指导RNA(gRNA)形成复合物。在一些实施方案中，致动部分包含Cas蛋白，其与单指导核酸如单指导RNA(sgRNA)形成复合物。在一些实施方案中，致动部分包含RNA结合蛋白(RBP)，其任选地与指导核酸如指导RNA(例如，sgRNA)复合，该指导核酸能够与Cas蛋白形成复合物。

可以使用任何合适的CRISPR/Cas系统。CRISPR/Cas系统可以使用多种命名系统来引用。示例性的命名系统提供于Makarova,K.S.等人,“An updated evolutionaryclassification of CRISPR-Cas systems,”Nat Rev Microbiol(2015)13:722-736和Shmakov,S.等人,“Discovery and Functional Characterization of Diverse Class2CRISPR-Cas Systems,”Mol Cell(2015)60:1-13。CRISPR/Cas系统可以是I型、II型、III型、IV型、V型、VI型系统或其他任何合适的CRISPR/Cas系统。本文使用的CRISPR/Cas系统可以是1类、2类或其他任何适当分类的CRISPR/Cas系统。1类或2类的确定可以基于编码效应物模块的基因。1类系统通常具有多亚单位crRNA效应物复合物，而2类系统通常具有单个蛋白，如Cas9、Cpf1、C2c1、C2c2、C2c3或crRNA效应物复合物。1类CRISPR/Cas系统可以使用多种Cas蛋白的复合物来进行调节。1类CRISPR/Cas系统可包括例如I型(例如，I、IA、IB、IC、ID、IE、IF、IU)、III型(例如，III、IIIA、IIIB、IIIC、IIID)以及IV型(例如，IV、IVA、IVB)CRISPR/Cas类型。2类CRISPR/Cas系统可以使用单个大Cas蛋白来进行调节。2类CRISPR/Cas系统可包括例如II型(例如，II、IIA、IIB)和V型CRISPR/Cas类型。CRISPR系统可以彼此互补，和/或可以借出反式功能单元以便于CRISPR位点靶向。

包含Cas蛋白的致动部分可以是1类或2类Cas蛋白。Cas蛋白可以是I型、II型、III型、IV型、V型或VI型Cas蛋白。Cas蛋白可包含一个或多个结构域。结构域的非限制性实例包括：指导核酸识别和/或结合域、核酸酶域(例如，DNA酶或RNA酶域、RuvC、HNH)、DNA结合域、RNA结合域、解旋酶域、蛋白质-蛋白质相互作用域和二聚化域。指导核酸识别和/或结合域可以与指导核酸相互作用。核酸酶域可包含用于核酸切割的催化活性。核酸酶域可能缺乏催化活性以阻止核酸切割。Cas蛋白可以是与其他蛋白质或多肽融合的嵌合Cas蛋白。Cas蛋白可以是各种Cas蛋白的嵌合体，例如，包含来自不同Cas蛋白的结构域。

Cas蛋白的非限制性实例包括c2c1、Cas13a(以前称为C2c2)、Cas13b、Cas13c、Cas13d、c2c3、Casl、CaslB、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a、Cas8al、Cas8a2、Cas8b、Cas8c、Cas9(Csnl或Csxl2)、Cas10、Cas10d、CaslO、CaslOd、CasF、CasG、CasH、Cas12a(以前称为Cpf1)、Csyl、Csy2、Csy3、Csel(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、CsxlO、Csxl6、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4和Cul966及其同源物或修饰形式。

Cas蛋白可以来自任何合适的生物体。非限制性实例包括酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌属的种(Streptococcus sp.)、金黄色葡萄球菌(Staphylococcus aureus)、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinae spiralis)、产绿色链霉菌(Streptomyces viridochromo genes)、产绿色链霉菌(Streptomycesviridochromogenes)、玫瑰链孢囊菌(Streptosporangium roseum)、玫瑰链孢囊菌(Streptosporangium roseum)、酸热脂环酸芽孢杆菌(AlicyclobacHlusacidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、硒还原芽孢杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacterium sibiricum)、德氏乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、海洋微颤菌(Microscilla marina)、伯克霍尔德氏菌目细菌(Burkholderiales bacterium)、食萘极地单胞菌(Polaromonas naphthalenivorans)、极地单胞菌属的种(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、蓝丝菌属的种(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、铜绿假单胞菌(Pseudomonas aeruginosa)、聚球藻属的种(Synechococcus sp.)、阿拉伯糖醋盐杆菌(Acetohalobium arabaticum)、极端制氨菌(Ammonifex degensii)、热解纤维素菌(Caldicelulosiruptor becscii)、CandidatusDesulforudis、肉毒梭菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、嗜热丙酸降解菌(Pelotomaculum thermopropionicum)、嗜酸性喜温硫杆菌(Acidithiobacillus caldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillusferrooxidans)、酒色别样着色菌(Allochromatium vinosum)、海杆菌属的种(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、Nitrosococcuswatsoni、盐浮游假交替单胞菌(Pseudoalteromonas haloplanktis)、消旋纤线杆菌(Ktedonobacter racemifer)、调查甲烷盐菌(Methanohalobium evestigatum)、多变鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻属的种(Nostocsp.)、极大节螺藻(Arthrospira maxima)、钝顶节螺藻(Arthrospira platensis)、节螺藻属的种(Arthrospira sp.)、鞘丝藻属的种(Lyngbya sp.)、原型微鞘藻(Microcoleuschthonoplastes)、颤藻属的种(Oscillatoria sp.)、运动石袍菌(Petrotoga mobilis)、非洲栖热腔菌(Thermosipho africanus)、深海单细胞蓝藻(Acaryochloris marina)、沙氏纤毛菌(Leptotrichia shahii)、韦德纤毛菌(Leptotrichia wadeii)、韦德纤毛菌F0279、荚膜红细菌(Rhodobacter capsulatus)SB1003、荚膜红细菌R121、荚膜红细菌DE442、毛螺菌科细菌(Lachnospiraceae bacterium)NK4A179、毛螺菌科细菌MA2020)、嗜胺梭菌(Clostridium aminophilum)DSM 10710、Paludibacter propionicigenes WB)、鸡肉杆菌(Carnobacterium gallinarum)DMS4847、鸡肉杆菌DSM4847和新凶手弗朗西丝氏菌(Francisella novicida)。在一些方面，所述生物体是酿脓链球菌(S.pyogenes)。在一些方面，所述生物体是金黄色葡萄球菌(S.aureus)。在一些方面，所述生物体是嗜热链球菌(S.thermophilus)。

Cas蛋白可来源于多种细菌物种，包括但不限于非典型韦荣氏球菌(Veillonellaatypical)、具核梭杆菌(Fusobacterium nucleatum)、龈沟产线菌(Filifactor alocis)、Solobacterium moorei、灵巧粪球菌(Coprococcus catus)、齿垢密螺旋体(Treponemadenticola)、Peptoniphilus duerdenii、Catenibacterium mitsuokai、变异链球菌(Streptococcus mutans)、无害李斯特菌(Listeria innocua)、斯氏李斯特菌(Listeriaseeligeri)、玟氏李斯特菌(Listeria weihenstephanensis)FSL R90317、玟氏李斯特菌FSL M60635、伪中间型葡萄球菌(Staphylococcus pseudintermedius)、肠氨基酸球菌(Acidaminococcus intestine)、齿龈欧氏菌(Olsenella uli)、北原酒球菌(Oenococcuskitaharae)、两歧双歧杆菌(Bifidobacterium bifidum)、鼠李糖乳杆菌(Lactobacillusrhamnosus)、格氏乳杆菌(Lactobacillus gasseri)、大芬戈尔德菌(Finegoldia magna)、运动支原体(Mycoplasma mobile)、鸡毒支原体(Mycoplasma gallisepticum)、绵羊肺炎支原体(Mycoplasma ovipneumoniae)、犬支原体(Mycoplasma canis)、滑液囊支原体(Mycoplasma synoviae)、直肠真杆菌(Eubacterium rectale)、嗜热链球菌(Streptococcus thermophilus)、细长真杆菌(Eubacterium dolichum)、棒状乳杆菌扭曲亚种(Lactobacillus coryniformis subsp.Torquens)、多养型泥杆菌(Ilyobacterpolytropus)、白色瘤胃球菌(Ruminococcus albus)、嗜黏蛋白艾克曼菌(Akkermansiamuciniphila)、解纤维热酸菌(Acidothermus cellulolyticus)、长双歧杆菌(Bifidobacterium longum)、齿双歧杆菌(Bifidobacterium dentium)、白喉棒状杆菌(Corynebacterium diphtheria)、Elusimicrobium minutum、Nitratifractorsalsuginis、Sphaerochaeta globus、产琥珀酸丝状杆菌产琥珀酸亚种(Fibrobactersuccinogenes subsp.Succinogenes)、脆弱类杆菌(Bacteroides fragilis)、黄褐二氧化碳嗜纤维菌(Capnocytophaga ochracea)、沼泽红假单胞菌(Rhodopseudomonaspalustris)、彩虹普雷沃菌(Prevotella micans)、栖瘤胃普雷沃菌(Prevotellaruminicola)、柱状黄杆菌(Flavobacterium columnare)、少食氨基单胞菌(Aminomonaspaucivorans)、深红红螺菌(Rhodospirillum rubrum)、Candidatus Puniceispirillummarinum、Verminephrobacter eiseniae、蒲桃雷尔氏菌(Ralstonia syzygii)、Dinoroseobacter shibae、固氮螺菌(Azospirillum)、汉氏硝化细菌(Nitrobacterhamburgensis)、慢生根瘤菌(Bradyrhizobium)、产琥珀酸沃廉菌(Wolinellasuccinogenes)、空肠弯曲菌空肠亚种(Campylobacter jejuni subsp.Jejuni)、雪貂螺杆菌(Helicobacter mustelae)、蜡状芽孢杆菌(Bacillus cereus)、Acidovorax ebreus、产气荚膜梭菌(Clostridium perfringens)、食清洁剂细小棒菌(Parvibaculumlavamentivorans)、肠道罗斯氏菌(Roseburia intestinalis)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)、多杀巴斯德氏菌多杀亚种(Pasteurella multocidasubsp.Multocida)、华德萨特氏菌(Sutterella wadsworthensis)、变形菌(proteobacterium)、嗜肺军团菌(Legionella pneumophila)、Parassutterellaexrementihominis、产琥珀酸沃林氏菌(Wolinella succinogenes)和新凶手弗朗西丝氏菌(Francisella novicida)。

本文使用的Cas蛋白可以是Cas蛋白的野生型或修饰形式。Cas蛋白可以是野生型或修饰的Cas蛋白的活性变体、非活性变体或片段。相对于Cas蛋白的野生型形式，Cas蛋白可包含氨基酸变化，如缺失、插入、置换、变体、突变、融合、嵌合体或其任何组合。Cas蛋白可以是与野生型示例性Cas蛋白具有至少约5％、10％、20％、30％、40％、50％、60％、70％、80％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性或序列相似性的多肽。Cas蛋白可以是与野生型示例性Cas蛋白具有至多约5％、10％、20％、30％、40％、50％、60％、70％、80％、90％、100％序列同一性或序列相似性的多肽。变体或片段可与野生型或修饰的Cas蛋白或其部分包含至少约5％、10％、20％、30％、40％、50％、60％、70％、80％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性或序列相似性。变体或片段可以与指导核酸复合地靶向核酸位点，而缺乏核酸切割活性。

Cas蛋白可包含一个或多个核酸酶域，例如DNA酶域。例如，Cas9蛋白可包含RuvC样核酸酶域和/或HNH样核酸酶域。RuvC和HNH域可以各自切割双链DNA的不同链，从而在DNA中形成双链断裂。Cas蛋白可以仅包含一个核酸酶域(例如，Cpf1包含RuvC域，但缺乏HNH域)。

Cas蛋白可包含与野生型Cas蛋白的核酸酶域(例如，RuvC域、HNH域)具有至少约5％、10％、20％、30％、40％、50％、60％、70％、80％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性或序列相似性的氨基酸序列。

Cas蛋白可以被修饰以优化基因表达的调节。可以修饰Cas蛋白以增加或减少核酸结合亲和力、核酸结合特异性和/或酶促活性。还可以修饰Cas蛋白来改变所述蛋白质的其他任何活性或性质，诸如稳定性。例如，Cas蛋白的一个或多个核酸酶域可以是修饰的、缺失的或失活的，或者Cas蛋白可以被截短以去除对于蛋白质功能不是必需的域，或者优化(例如，增强或降低)Cas蛋白调节基因表达的活性。

在一些实施方案中，致动部分包含衍生自DNA核酸酶的无核酸酶DNA结合蛋白，其可以诱导靶DNA序列的转录激活或阻抑。在一些实施方案中，致动部分包含衍生自RNA核酸酶的无核酸酶RNA结合蛋白，其可以诱导靶RNA序列的转录激活或阻抑。例如，致动部分可包含缺乏切割活性的Cas蛋白。

Cas蛋白可以是融合蛋白。例如，Cas蛋白可以与异源功能域融合。异源功能域可包括切割域、表观遗传修饰域、转录激活域或转录阻抑域融合。Cas蛋白还可与提供增加或减少的稳定性的异源多肽融合。融合域或异源多肽可位于Cas蛋白的N末端、C末端或内部。

基因的调节可以是任何感兴趣的基因的调节。考虑涵盖本文所述基因的遗传同源物。例如，基因可以表现出与本文公开的基因一定的同一性和/或同源性。因此，考虑到可以修饰表现或表现出约50％、55％、60％、65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同源性(在核酸或蛋白质水平上)的基因。还考虑到可以修饰表现或表现出约50％、55％、60％、65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性(在核酸或蛋白质水平上)的基因。

Cas蛋白可以以任何形式提供。例如，Cas蛋白可以以蛋白质的形式提供，如单独的或与指导核酸复合的Cas蛋白。Cas蛋白可以以编码Cas蛋白的核酸的形式提供，如RNA(例如，信使RNA(mRNA))或DNA。

可以对编码Cas蛋白的核酸进行密码子优化，以在特定细胞或生物体中有效翻译成蛋白质。

编码Cas蛋白的核酸可以稳定地整合到细胞的基因组中。编码Cas蛋白的核酸可以可操作地连接至在细胞中有活性的启动子。编码Cas蛋白的核酸可以可操作地连接至表达构建体中的启动子。表达构建体可以包括能够指导基因或其他目的核酸序列(例如，Cas基因)的表达并且可以将这样的目的核酸序列转移至靶细胞的任何核酸构建体。

在一些实施方案中，Cas蛋白是死亡Cas蛋白。死亡Cas蛋白可以是缺乏核酸切割活性的蛋白质。

Cas蛋白可包括野生型Cas蛋白的修饰形式。野生型Cas蛋白的修饰形式可包含降低Cas蛋白的核酸切割活性的氨基酸变化(例如，缺失、插入或置换)。例如，Cas蛋白的修饰形式可以具有野生型Cas蛋白(例如，来自酿脓链球菌的Cas9)的核酸切割活性的小于90％、小于80％、小于70％、小于60％、小于50％、小于40％、小于30％、小于20％、小于10％、小于5％或小于1％。Cas蛋白的修饰形式可以没有实质的核酸切割活性。当Cas蛋白是没有实质的核酸切割活性的修饰形式时，其可以被称为无酶促活性的和/或“死亡的”(缩写为“d”)。死亡Cas蛋白(例如，dCas、dCas9)可以与靶多核苷酸结合，但可能不切割靶多核苷酸。在一些方面，死亡Cas蛋白是死亡Cas9蛋白。

dCas9多肽可与单指导RNA(sgRNA)缔合以激活或抑制靶DNA的转录。可以将sgRNA引入表达工程化嵌合受体多肽的细胞中。在一些情况下，此类细胞含有一种或多种靶向同一核酸的不同sgRNA。在其他情况下，sgRNA靶向细胞中的不同核酸。指导RNA靶向的核酸可以是在细胞如免疫细胞中表达的任何核酸。靶向的核酸可以是参与免疫细胞调节的基因。在一些实施方案中，核酸与癌症相关。与癌症相关的核酸可以是细胞周期基因、细胞应答基因、凋亡基因或吞噬作用基因。重组指导RNA可以被CRISPR蛋白、无核酸酶的CRISPR蛋白、其变体、其衍生物或其片段识别。

无酶促活性是指可以以序列特异性方式与多核苷酸中的核酸序列结合，但是可不切割靶多核苷酸的多肽。无酶促活性的位点定向多肽可包含无酶促活性的域(例如，核酸酶域)。无酶促活性可指无活性。无酶促活性可指基本上无活性。无酶促活性可指基本上无活性。无酶促活性可指与野生型示例性活性(例如，核酸切割活性、野生型Cas9活性)相比，小于1％、小于2％、小于3％、小于4％、小于5％、小于6％、小于7％、小于8％、小于9％或小于10％的活性。

Cas蛋白的一个或多个核酸酶域(例如，RuvC、HNH)可以缺失或突变，使得它们不再起作用或包含降低的核酸酶活性(例如，失活的或死亡Cas，即“dCas”)。例如，在包含至少两个核酸酶域的Cas蛋白(例如，Cas9)中，如果其中一个核酸酶域缺失或突变，则所得Cas蛋白(称为切口酶)可以在双链DNA中的CRISPR RNA(crRNA)识别序列处生成单链断裂而不是双链断裂。这样的切口酶可以切割互补链或非互补链，但可能不同时切割两者。如果Cas蛋白的所有核酸酶域(例如，Cas9蛋白中的RuvC和HNH核酸酶域；Cpf1蛋白中的RuvC核酸酶域)都缺失或突变，则所得Cas蛋白可能具有降低的切割能力或没有能力切割双链DNA的两条链。可以将Cas9蛋白转化成切口酶的突变的实例是来自酿脓链球菌的Cas9的RuvC域中的D10A(在Cas9的10位处天冬氨酸变为丙氨酸)突变。来自酿脓链球菌的Cas9的HNH域中的H939A(在氨基酸839位处组氨酸变为丙氨酸)或H840A(在氨基酸840位处组氨酸变为丙氨酸)可将Cas9转化为切口酶。可以将Cas9蛋白转化为死亡Cas9的突变的实例是来自酿脓链球菌的Cas9的RuvC域中的D10A(在Cas9的10位处天冬氨酸变为丙氨酸)突变和HNH域中的H939A(在氨基酸839位处组氨酸变为丙氨酸)或H840A(在氨基酸840位处组氨酸变为丙氨酸)。

相对于所述蛋白质的野生型形式，死亡Cas蛋白可包含一个或多个突变。突变可导致在野生型Cas蛋白的多个核酸切割域的一个或多个中小于90％、小于80％、小于70％、小于60％、小于50％、小于40％、小于30％、小于20％、小于10％、小于5％或小于1％的核酸切割活性。突变可导致多个核酸切割域中的一个或多个保留切割靶核酸的互补链的能力，但降低其切割靶核酸的非互补链的能力。突变可导致多个核酸切割域中的一个或多个保留切割靶核酸的非互补链的能力，但降低其切割靶核酸的互补链的能力。突变可导致多个核酸切割域中的一个或多个缺乏切割靶核酸的互补链和非互补链的能力。核酸酶域中待突变的残基可以对应于核酸酶的一个或多个催化残基。例如，野生型示例性酿脓链球菌Cas9多肽中的残基如Asp10、His840、Asn854和Asn856可以突变以使多个核酸切割域(例如，核酸酶域)中的一个或多个失活。Cas蛋白的核酸酶域中待突变的残基可以对应于野生型酿脓链球菌Cas9多肽中的残基Asp10、His840、Asn854和Asn856，例如通过序列和/或结构比对所确定的。

作为非限制性实例，残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986和/或A987(或Cas蛋白的任何相应突变)可以进行突变。例如，D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A和/或D986A。除丙氨酸置换以外的突变可能是合适的。

D10A突变可以与H840A、N854A或N856A突变中的一个或多个结合，以产生基本缺乏DNA切割活性的Cas9蛋白(例如，死亡Cas9蛋白)。H840A突变可与D10A、N854A或N856A突变中的一种或多种结合，以产生基本缺乏DNA切割活性的位点定向多肽。N854A突变可以与H840A、D10A或N856A突变中的一种或多种结合，以产生基本缺乏DNA切割活性的位点定向多肽。N856A突变可以与H840A、N854A或D10A突变中的一个或多个结合，以产生基本缺乏DNA切割活性的位点定向多肽。

在一些实施方案中，Cas蛋白是2类Cas蛋白。在一些实施方案中，Cas蛋白是II型Cas蛋白。在一些实施方案中，Cas蛋白是Cas9蛋白、Cas9蛋白的修饰形式或衍生自Cas9蛋白。例如，缺乏切割活性的Cas9蛋白。在一些实施方案中，Cas9蛋白是来自酿脓链球菌的Cas9蛋白(例如，SwissProt登录号Q99ZW2)。在一些实施方案中，Cas9蛋白是来自金黄色葡萄球菌的Cas9(例如，SwissProt登录号J7RUA5)。在一些实施方案中，Cas9蛋白是来自酿脓链球菌或金黄色葡萄球菌的Cas9蛋白的修饰形式。在一些实施方案中，Cas9蛋白衍生自来自酿脓链球菌或金黄色葡萄球菌的Cas9蛋白。例如，缺乏切割活性的酿脓链球菌或金黄色葡萄球菌Cas9蛋白。

Cas9通常可指与野生型示例性Cas9多肽(例如，来自酿脓链球菌的Cas9)具有至少约5％、10％、20％、30％、40％、50％、60％、70％、80％、90％、100％序列同一性和/或序列相似性的多肽。Cas9可指与野生型示例性Cas9多肽(例如，来自酿脓链球菌)具有至多约5％、10％、20％、30％、40％、50％、60％、70％、80％、90％、100％序列同一性和/或序列相似性的多肽。Cas9可指Cas9蛋白的野生型或修饰形式，其可包含如缺失、插入、置换、变体、突变、融合、嵌合体或其任何组合等氨基酸变化。

在一些实施方案中，致动部分包含“锌指核酸酶”或称“ZFN”。ZFN是指切割域(诸如FokI的切割域)与至少一个锌指基序(例如，至少2、3、4或5个锌指基序)的融合体，所述锌指基序可以与多核苷酸如DNA和RNA结合。在两个单独的ZFN的多核苷酸中的一些位置以一定的方向和间隔进行异二聚化可导致多核苷酸的切割。例如，ZFN与DNA结合可以诱导DNA中的双链断裂。为了允许两个切割域二聚化并切割DNA，两个单独的ZFN可以与DNA的相反链结合，其C末端间隔一定距离。在一些情况下，锌指域和切割域之间的连接体序列可要求每个结合位点的5’边缘间隔约5-7个碱基对。在一些情况下，切割域与每个锌指域的C末端融合。示例性的ZFN包括但不限于Urnov等人,Nature Reviews Genetics,2010,11:636-646；Gaj等人,Nat Methods,2012,9(8):805-7；美国专利6,534,261；6,607,882；6,746,838；6,794,136；6,824,978；6,866,997；6,933,113；6,979,539；7,013,219；7,030,215；7,220,719；7,241,573；7,241,574；7,585,849；7,595,376；6,903,185；6,479,626；以及美国申请公开号2003/0232410和2009/0203140中描述的那些。

在一些实施方案中，包含ZFN的致动部分可以在靶多核苷酸如DNA中生成双链断裂。DNA中的双链断裂可导致DNA断裂修复，这允许引入基因修饰(例如，核酸编辑)。DNA断裂修复可通过非同源末端连接(NHEJ)或同源介导修复(HDR)进行。在HDR中，可以提供一个含有侧接靶DNA位点的同源臂的供体DNA修复模板。在一些实施方案中，ZFN是锌指切口酶，其诱导位点特异性单链DNA断裂或切口，从而导致HDR。锌指切口酶的描述见于例如，Ramirez等人,Nucl Acids Res,2012,40(12):5560-8；Kim等人,Genome Res,2012,22(7):1327-33.。在一些实施方案中，ZFN与多核苷酸(例如，DNA和/或RNA)结合，但是无法切割多核苷酸。

在一些实施方案中，包含ZFN的致动部分的切割域包括野生型切割域的修饰形式。切割域的修饰形式可包含降低切割域的核酸切割活性的氨基酸变化(例如，缺失、插入或置换)。例如，切割域的修饰形式可以具有野生型切割域的核酸切割活性的小于90％、小于80％、小于70％、小于60％、小于50％、小于40％、小于30％、小于20％、小于10％、小于5％或小于1％。切割域的修饰形式可以没有实质的核酸切割活性。在一些实施方案中，切割域是无酶促活性的。

在一些实施方案中，致动部分包含“TALEN”或“TAL效应核酸酶”。TALEN是指工程化的转录激活物样效应核酸酶，其通常含有DNA结合串联重复序列的中央域以及切割域。可以通过将TAL效应物DNA结合域与DNA切割域融合来产生TALEN。在一些情况下，DNA结合串联重复序列包含33-35个氨基酸的长度，并在12和13位含有两个高变氨基酸残基，其可以识别至少一个特异性的DNA碱基对。转录激活物样效应物(TALE)蛋白可以与核酸酶融合，诸如野生型或突变的FokI内切核酸酶或FokI的催化域。FokI的几种突变已在TALEN中被用于例如提高切割特异性或活性。可以将这样的TALENs工程化以结合任何期望的DNA序列。通过在靶DNA序列中产生双链断裂，该双链断裂又经历NHEJ或HDR，TALEN可用于生成基因修饰(例如，核酸序列编辑)。在一些情况下，提供了单链供体DNA修复模板来促进HDR。TALEN及其在基因编辑中的用途的详细描述见于例如，美国专利8,440,431；8,440,432；8,450,471；8,586,363；和8,697,853；Scharenberg等人,Curr Gene Ther,2013,13(4):291-303；Gaj等人,NatMethods,2012,9(8):805-7；Beurdeley等人,Nat Commun,2013,4:1762；以及Joung和Sander,Nat Rev Mol Cell Biol,2013,14(1):49-55。

在一些实施方案中，对TALEN进行工程化以降低核酸酶活性。在一些实施方案中，TALEN的核酸酶域包括野生型核酸酶域的修饰形式。核酸酶域的修饰形式可包含降低核酸酶域的核酸切割活性的氨基酸变化(例如，缺失、插入或置换)。例如，核酸酶域的修饰形式可以具有野生型核酸酶域的核酸切割活性的小于90％、小于80％、小于70％、小于60％、小于50％、小于40％、小于30％、小于20％、小于10％、小于5％或小于1％。核酸酶域的修饰形式可以没有实质的核酸切割活性。在一些实施方案中，核酸酶域是无酶促活性的。

在一些实施方案中，转录激活物样效应物(TALE)蛋白与可调节转录且不包含核酸酶的域融合。在一些实施方案中，转录激活物样效应物(TALE)蛋白被设计为用作转录激活物。在一些实施方案中，转录激活物样效应物(TALE)蛋白被设计为用作转录阻抑物。例如，可以将转录激活物样效应物(TALE)蛋白的DNA结合域与一个或多个转录激活域或者一个或多个转录抑制域融合(例如，连接)。转录激活域的非限制性实例包括单纯疱疹VP16激活域和VP16激活域的四聚体重复，例如，VP64激活域。其他实例包括VP16、VP32、VP64、VPR、p65或P65HSF1。转录抑制域的非限制性实例包括Krüppel相关的框结构域。

在一些实施方案中，致动部分包括大范围核酸酶。大范围核酸酶通常是指可以是高度特异性的切点罕见内切核酸酶或归巢内切核酸酶。大范围核酸酶可以识别长度至少为12个碱基对，例如长度为12至40个碱基对、12至50个碱基对或12至60个碱基对的DNA靶位点。大范围核酸酶可以是模块化DNA结合核酸酶，如包含内切核酸酶的至少一个催化域和指定核酸靶序列的至少一个DNA结合域或蛋白质的任何融合蛋白。DNA结合域可含有至少一个能够识别单链或双链DNA的基序。大范围核酸酶可以是单体或二聚体。在一些实施方案中，大范围核酸酶是天然存在的(发现于自然界中)或野生型的，而在其他情况下，大范围核酸酶是非天然的、人工的、工程化的、合成的、合理设计的或人造的。在一些实施方案中，本公开的大范围核酸酶包括I-CreI大范围核酸酶、I-CeuI大范围核酸酶、I-MsoI大范围核酸酶、I-SceI大范围核酸酶、其变体、其衍生物及其片段。有用的大范围核酸酶及其在基因编辑中的应用的详细描述见于例如，Silva等人,Curr Gene Ther,2011,11(1):11-27；Zaslavoskiy等人,BMC Bioinformatics,2014,15:191；Takeuchi等人,Proc Natl AcadSci USA,2014,111(11):4061-4066，以及美国专利7,842,489；7,897,372；8,021,867；8,163,514；8,133,697；8,021,867；8,119,361；8,119,381；8,124,36；和8,129,134。

在一些实施方案中，大范围核酸酶的核酸酶域包括野生型核酸酶域的修饰形式。核酸酶域的修饰形式可包含降低核酸酶域的核酸切割活性的氨基酸变化(例如，缺失、插入或置换)。例如，核酸酶域的修饰形式可以具有野生型核酸酶域的核酸切割活性的小于90％、小于80％、小于70％、小于60％、小于50％、小于40％、小于30％、小于20％、小于10％、小于5％或小于1％。核酸酶域的修饰形式可以没有实质的核酸切割活性。在一些实施方案中，核酸酶域是无酶促活性的。在一些实施方案中，大范围核酸酶可以与DNA结合但无法切割DNA。

在一些实施方案中，致动部分与异源功能域融合。异源功能域可包括一个或多个转录阻抑域、激活域、表观遗传域、重组酶域、转座酶域、翻转酶域、切口酶域或其任何组合。激活域可包括位于酶的羧基末端的一个或多个串联激活域。在其他情况下，致动部分包括位于蛋白质的羧基末端的一个或多个串联阻抑域。非限制性的示例性激活域包括GAL4、单纯疱疹激活域VP16、VP64(单纯疱疹激活域VP16的四聚体)、VP32、VPR、p65、P65HSF1、NF-κBp65亚单位、EB病毒R反式激活物(Rta)，并且描述于Chavez等人,Nat Methods,2015,12(4):326-328和美国专利申请公开号20140068797中。非限制性的示例性阻抑域包括Kox1的KRAB(Krüppel相关盒)域、Mad mSIN3相互作用域(SID)、ERF阻抑域(ERD)，并且描述于Chavez等人,Nat Methods,2015,12(4):326-328和公开号为20140068797的美国专利申请中。在一些实施方案中，异源功能域包括位于致动部分的氨基末端的一个或多个串联阻抑域。

致动部分还可以与提供增加或减少的稳定性的异源多肽融合。融合域或异源多肽可以位于致动部分的N末端、C末端或内部。

致动部分可包含用于易于追踪或纯化的异源多肽，如荧光蛋白、纯化标签或表位标签。荧光蛋白的实例包括绿色荧光蛋白(例如，GFP、GFP-2、tagGFP、turboGFP、eGFP、Emerald、Azami Green、单体Azami Green、CopGFP、AceGFP、ZsGreenl)、黄色荧光蛋白(例如，YFP、eYFP、Citrine、Venus、YPet、PhiYFP、ZsYellowl)、蓝色荧光蛋白(例如，eBFP、eBFP2、Azurite、mKalamal、GFPuv、Sapphire、T-sapphire)、蓝绿色荧光蛋白(例如，eCFP、Cerulean、CyPet、AmCyanl、Midoriishi-Cyan)、红色荧光蛋白(mKate、mKate2、mPlum、DsRed单体、mCherry、mRFPl、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry、Jred)、橙色荧光蛋白(mOrange、mKO、Kusabira-Orange、单体Kusabira-Orange、mTangerine、tdTomato)和其他任何合适的荧光蛋白。标签的实例包括谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、血凝素(HA)、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、SI、T7、V5、VSV-G、组氨酸(His)、生物素羧基载体蛋白(BCCP)和钙调蛋白。

在一些实施方案中，跨膜嵌合受体多肽包含具有配体相互作用域的胞外域、跨膜域和包含细胞信号传导域的胞内域(图1)。响应于配体结合，胞外域可通过胞内域发信号以激活细胞信号传导途径。在一个实例中，配体结合可导致胞内域的修饰(例如，磷酸化)，从而激活细胞信号传导途径。激活的细胞信号传导途径最终导致异源核定位域的激活。在激活融合的异源核定位域后，致动部分可进入细胞核以调节靶基因的表达和/或活性或者编辑核酸序列。在一些实施方案中，致动部分也与异源功能域(例如，转录激活或阻抑域)融合。在一些实施方案中，跨膜嵌合受体多肽包含具有配体相互作用域的胞外区和包含免疫细胞信号传导域的胞内区。GMP可包含与非活性状态的异源核定位域融合的致动部分。响应于抗原结合，可以在受体的胞内区中修饰该受体(图2)。在受体修饰(例如，磷酸化)后，内在的信号级联被触发，其最终导致异源核定位域的激活。在激活融合的异源核定位域后，致动部分可进入细胞核以调节靶基因的表达和/或活性或者编辑核酸序列。在一些实施方案中，致动部分还与异源功能域(例如，转录激活或阻抑域)融合。

在一些实施方案中，基因调节多肽包含至少一个靶向序列，其将受体的转运引导至细胞的特定区域。靶向序列可用于引导靶向序列与之连接的多肽向细胞的特定区域的转运。例如，靶向序列可利用核定位信号(NLS)将受体引导至细胞核，利用核输出信号(NES)将致动部分引导出细胞核(例如，细胞质)，引导至线粒体、内质网(ER)、高尔基体、叶绿体、质外体、过氧化物酶体、质膜或细胞的各种细胞器的膜。在一些实施方案中，靶向序列包含核输出信号(NES)，并将多肽引导出细胞核，例如引导至细胞的细胞质。靶向序列可以利用各种核输出信号将多肽引导至细胞质。核输出信号通常是疏水残基(例如，至少约2、3、4或5个疏水残基)的短氨基酸序列，其靶向蛋白质以使用核转运通过核孔复合物从细胞核输出至细胞质。并非所有的NES底物都可以从核中组成性地输出。在一些实施方案中，靶向序列包含核定位信号(NLS，例如，SV40 NLS)，并将多肽引导至细胞核。靶向序列可以利用各种核定位信号(NLS)将多肽引导至细胞核。NLS可以是单部分序列或双部分序列。

NLS的非限制性实例包括NLS序列，其衍生自：SV40病毒大T抗原的NLS，其具有氨基酸序列PKKKRKV(SEQ ID NO:2)；来自核质蛋白的NLS(例如，核质蛋白双部分NLS，其具有序列KRPAATKKAGQAKKKK(SEQ ID NO:3))；c-myc NLS，其具有氨基酸序列PAAKRVKLD(SEQ IDNO:4)或RQRRNELKRSP(SEQ ID NO:5)；hRNPA1 M9 NLS，其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:6)；来自输入蛋白α的IBB域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:7)；肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:8)和PPKKARED(SEQ ID NO:9)；人p53的序列PQPKKKPL(SEQ ID NO:10)；小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:11)；流感病毒NS1的序列DRLRR(SEQ ID NO:12)和PKQKKRK(SEQID NO:13)；肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:14)；小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:15)；人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK (SEQID NO:16)；以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:17)。

在一些实施方案中，靶向序列包含膜靶向肽并将多肽引导至质膜或细胞器的膜。膜靶向序列可以提供嵌合跨膜受体多肽向细胞表面膜或其他细胞膜的转运。与细胞膜相关的分子含有促进膜缔合的某些区域，并且这样的区域可以被并入膜靶向序列中。例如，一些蛋白质在N末端或C末端含有被酰化的序列，并且这些酰基部分促进膜缔合。这样的序列可以被酰基转移酶识别并且通常符合特定的序列基序。某些酰化基序能够被单个酰基部分修饰(通常随后是几个带正电荷的残基(例如，人c-Src)以改善与阴离子脂质头基的缔合)，而另一些能够被多个酰基部分修饰。例如，蛋白酪氨酸激酶Src的N末端序列可包含单个豆蔻酰基部分。双酰化区域位于某些蛋白激酶如Src家族成员(例如，Yes、Fyn、Lck)的子集和G蛋白α亚单位的N末端区域。此类双酰化区域通常位于此类蛋白质的前18个氨基酸内，并符合序列基序Met-Gly-Cys-Xaa-Cys(SEQ ID NO：18)，其中Met被切割，Gly为N-酰化的，并且Cys残基之一是S-酰化的。Gly经常被豆蔻酰化，而Cys可以被棕榈酰化。还可以利用来自G蛋白γ亚单位和其他蛋白质的C末端的可被C15或C10异戊二烯基部分修饰的符合序列基序Cys-Ala-Ala-Xaa(所谓的“CAAX盒”)的酰化区域。这些和其他酰化基序包括例如，在Gauthier-Campbell等人,Molecular Biology of the Cell 15:2205-2217(2004)；Glabati等人,Biochem.J.303:697-700(1994)和Zlakine等人,J.Cell Science 110:673-679(1997)中讨论的那些，并且可以并入靶向序列中以诱导膜定位。

在一些实施方案中，将来自含有酰化基序的蛋白质的天然序列并入靶向序列中。例如，在一些实施方案中，Lck、Fyn或Yes或G蛋白α亚单位的N末端部分，诸如来自此类蛋白质的前25个N末端氨基酸或更少(例如，具有任选突变的天然序列的约5至约20个氨基酸、约10至约19个氨基酸或约15至约19个氨基酸)可被并入嵌合多肽的N末端。在某些实施方案中，来自含有CAAX盒基序序列的G蛋白γ亚单位的约25个氨基酸或更少的C末端序列(例如，具有任选突变的天然序列的约5至约20个氨基酸、约10至约18个氨基酸或约15至约18个氨基酸)可与嵌合多肽的C末端连接。

可以采用任何膜靶向性序列。在一些实施方案中，此类序列包括但不限于豆蔻酰化靶向性序列、棕榈酰化靶向性序列、异戊二烯化序列(即法尼基化(famesylation)、香叶基-香叶基化、CAAX盒)、蛋白质-蛋白质相互作用基序或来自受体的跨膜序列(利用信号肽)。实例包括例如在ten Klooster，J.P.等人,Biology of the Cell(2007)99,1-12；Vincent,S.等人,Nature Biotechnology 21:936-40,1098(2003)中讨论的那些。

存在能够增加蛋白在各种膜上的保留的额外的蛋白质域。例如，在通常与细胞内信号传导有关的超过200种人蛋白中发现了约120个氨基酸的普列克底物蛋白同源(PH)域。PH域可以与膜内的各种磷脂酰肌醇(PI)脂质(例如，PI(3,4,5)-P3、PI(3,4)-P2、PI(4,5)-P2)结合，因此可以在将蛋白募集到不同的膜或细胞区室中发挥关键作用。通常，PI脂质的磷酸化状态受到如PI-3激酶或PTEN的调节，因此，膜与PH域的相互作用可能不如酰基脂质稳定。

在一些实施方案中，将多肽引导至细胞膜的靶向序列可以利用膜锚定信号序列。可以获得各种膜锚定序列。例如，可以使用各种膜结合蛋白的膜锚定信号序列。序列可包括来自以下的序列：1)I类整合膜蛋白，如IL-2受体β链和胰岛素受体β链；2)II类整合膜蛋白，如中性内肽酶；3)III型蛋白，如人细胞色素P450 NF25；4)IV型蛋白，如人P-糖蛋白。

在一些实施方案中，嵌合受体多肽与能够帮助蛋白质折叠的多肽折叠域连接。在一些实施方案中，致动部分与细胞穿透域连接。例如，细胞穿透域可以衍生自HIV-1TAT蛋白、来自人乙型肝炎病毒的TLM细胞穿透基序、MPG、Pep-1、VP22、来自单纯疱疹病毒的细胞穿透肽、或聚精氨酸肽序列。细胞穿透域可以位于致动部分内的N末端、C末端或任何位置。

在一些实施方案中，至少两个靶向序列连接至致动部分。当致动部分与多个靶向序列融合时，例如与针对细胞的不同位置的靶向序列融合时，致动部分的最终定位可以由靶向序列的相对强度来确定。例如，如果NES比NLS更强，则既具有包含NES的靶向序列又具有包含NLS的靶向序列的受体可以定位于细胞质。或者，如果NLS比NES更强，则即使受体上同时存在核定位信号和核输出信号，受体也可以定位于细胞核。靶向序列可包含例如每个NLS和NES的多个拷贝，以微调细胞定位的程度。

如本文其他地方所述的GMP可包含致动部分。致动部分可包括如本文其他地方所述的核酸酶(例如，DNA核酸酶和/或RNA核酸酶)、与野生型核酸酶相比是核酸酶缺陷的或具有降低的核酸酶活性的修饰的核酸酶(例如，DNA核酸酶和/或RNA核酸酶)、其变体、其衍生物或其片段。致动部分可以调节基因的表达和/或活性或者编辑核酸(例如，基因和/或基因产物)的序列。致动部分可以调节基因的表达或活性以及/或者编辑核酸序列，无论是外源的还是内源的。在一些实施方案中，致动部分包括DNA核酸酶，如工程化(例如，可编程或可靶向的)DNA核酸酶，以诱导靶DNA序列的基因组编辑。在一些实施方案中，致动部分包括RNA核酸酶，如工程化(例如，可编程或可靶向的)RNA核酸酶，以诱导靶RNA序列的编辑。在一些实施方案中，致动部分具有降低的或最小的核酸酶活性。具有降低的或最小的核酸酶活性的致动部分可通过物理阻碍靶多核苷酸或募集有效抑制或增强靶多核苷酸的表达的附加因子来调节基因的表达和/或活性。在一些实施方案中，致动部分包括衍生自DNA核酸酶的无核酸酶DNA结合蛋白，其可以诱导靶DNA序列的转录激活或阻抑。在一些实施方案中，致动部分包括衍生自RNA核酸酶的无核酸酶的RNA结合蛋白，其可以诱导靶RNA序列的转录激活或阻抑。在一些实施方案中，致动部分包含缺乏切割活性的Cas蛋白。

致动部分中可以使用任何合适的核酸酶。合适的核酸酶包括但不限于CRISPR相关(Cas)蛋白或Cas核酸酶，包括I型CRISPR相关(Cas)多肽、II型CRISPR相关(Cas)多肽、III型CRISPR相关(Cas)多肽、IV型CRISPR相关(Cas)多肽、V型CRISPR相关(Cas)多肽和VI型CRISPR相关(Cas)多肽；锌指核酸酶(ZFN)；转录激活物样效应核酸酶(TALEN)；大范围核酸酶；RNA结合蛋白(RBP)；CRISPR相关RNA结合蛋白；重组酶；翻转酶；转座酶；Argonaute蛋白；其任何衍生物；其任何变体；及其任何片段。

本发明系统的致动部分在进入细胞核后可以与靶多核苷酸结合，通过物理阻碍靶多核苷酸或募集有效抑制或增强靶多核苷酸的表达的其他因子而调节靶多核苷酸的表达和/或活性。在一些实施方案中，致动部分包含有效增加靶多核苷酸的表达的转录激活物。致动部分可包含有效降低靶多核苷酸的表达的转录阻抑物。在一些实施方案中，致动部分对于编辑核酸序列是可操作的。

在一些实施方案中，靶多核苷酸包含基因组DNA。在一些实施方案中，靶多核苷酸包括质粒的区域，例如携带外源基因的质粒。在一些实施方案中，靶多核苷酸包括RNA，例如mRNA。在一些实施方案中，靶多核苷酸包含内源基因或基因产物。致动部分可包括核定位信号的一个或多个拷贝，该核定位信号允许在核定位信号激活后或在释放核定位信号的抑制物后使致动物移位至细胞核中。

在一些方面，公开了调节靶多核苷酸在细胞中的表达的方法，其包括：响应于细胞信号传导途径的激活，将基因调节多肽从细胞质移位至细胞核，其中细胞信号传导途径的激活使与基因调节多肽偶联的核定位域得到激活。

在一些方面，公开了调节靶多核苷酸在细胞中的表达的方法，其包括：a)激活细胞的细胞信号传导途径，其中激活细胞的细胞信号传导途径激活与基因调节多肽连接的核定位域；b)经由激活的核定位域将基因调节多肽定位至细胞核，其中在将基因调节多肽定位至细胞核后，该基因调节多肽调节靶多核苷酸在细胞中的表达。

在一些方面，公开了调节靶多核苷酸在细胞中的表达的方法，其包括：a)使配体与跨膜受体接触，其中细胞信号传导途径在接触后得到激活，并且其中激活的细胞信号传导途径激活与基因调节多肽偶联的核定位域；b)通过激活的核定位域，将基因调节多肽从细胞质移位至细胞核，其中该基因调节多肽在移位至细胞核后调节靶多核苷酸的表达。

在一些方面，公开了调节靶多核苷酸在细胞中的表达的方法，其包括：响应于细胞信号传导途径的诱导，将基因调节多肽从细胞质移位至细胞核，其中所述细胞信号传导途径的诱导使与基因调节多肽偶联的核定位域得到诱导。

在一些方面，公开了调节靶多核苷酸在细胞中的表达的方法，其包括：a)诱导细胞的细胞信号传导途径，其中诱导所述细胞的所述细胞信号传导途径诱导与基因调节多肽连接的核定位域；b)经由所述诱导的核定位域，将所述基因调节多肽定位至细胞核，其中在将所述基因调节多肽定位至所述细胞核后，所述基因调节多肽调节所述靶多核苷酸在所述细胞中的表达。

在一些方面，公开了调节靶多核苷酸在细胞中的表达的方法，其包括：a)使配体与跨膜受体接触，其中细胞信号传导途径在所述接触后得到诱导，并且其中所述诱导的细胞信号传导途径诱导与基因调节多肽偶联的核定位域；b)通过所述诱导的核定位域，将所述基因调节多肽从细胞质移位至细胞核，其中所述基因调节多肽在移位至所述细胞核后调节靶多核苷酸的表达。

本公开的系统和组合物可用于多种应用。例如，本公开的系统和方法可用于调节基因表达和/或细胞活性的方法中。在一方面，本文公开的系统和组合物在调节免疫细胞中的基因表达和/或细胞活性的方法中使用。使用本发明系统调节的免疫细胞可用于多种应用，包括但不限于用来治疗疾病和病症的免疫疗法。可以使用本公开的修饰的免疫细胞治疗的疾病和病症包括炎性病况、癌症和感染性疾病。在一些实施方案中，免疫疗法用来治疗癌症。

可以将本发明系统引入多种免疫细胞，包括参与免疫应答的任何细胞中。在一些实施方案中，免疫细胞包括粒细胞，如嗜碱性粒细胞、嗜酸性粒细胞和嗜中性粒细胞；肥大细胞；可以发育成巨噬细胞的单核细胞；抗原呈递细胞，如树突细胞；和淋巴细胞，如自然杀伤细胞(NK细胞)、B细胞和T细胞。在一些实施方案中，免疫细胞是免疫效应细胞。免疫效应细胞是指可以响应于刺激而执行特定功能的免疫细胞。在一些实施方案中，免疫细胞是可以诱导细胞死亡的免疫效应细胞。在一些实施方案中，免疫细胞是淋巴细胞。在一些实施方案中，该淋巴细胞是NK细胞。在一些实施方案中，该淋巴细胞是T细胞。在一些实施方案中，该T细胞是活化的T细胞。T细胞包括幼稚和记忆细胞(例如中央记忆或T_CM、效应记忆或T_EM和效应记忆RA或T_EMRA)、效应细胞(例如细胞毒性T细胞或CTL或Tc细胞)、辅助细胞(例如Th1、Th2、Th3、Th9、Th7、TFH)、调节细胞(例如Treg和Trl细胞)、自然杀伤性T细胞(NKT细胞)、肿瘤浸润淋巴细胞(TIL)、淋巴细胞激活的杀伤细胞(LAK)、αβΤ细胞、γδΤ细胞和类似的独特类别的T细胞谱系。T细胞可以分为两大类：CD8+T细胞和CD4+T细胞，基于哪种蛋白质存在于细胞表面。表达本发明系统的T细胞可以执行多种功能，包括杀死感染的细胞以及激活或募集其他免疫细胞。CD8+T细胞被称为细胞毒性T细胞或细胞毒性T淋巴细胞(CTL)。表达本发明系统的CTL可以参与识别和去除病毒感染的细胞和癌细胞。CTL具有专门的区室或颗粒，其中含有导致凋亡(例如，程序性细胞死亡)的细胞毒素。CD4+T细胞可被细分为四个子集——Th1、Th2、Th17和Treg，其中“Th”是指“T辅助细胞”，但是也可以存在其他子集。Th1细胞可以协调针对细胞内微生物(尤其是细菌)的免疫应答。它们可以产生并分泌能够警告并激活其他免疫细胞(例如吞噬细菌的巨噬细胞)的分子。Th2细胞通过警告B细胞、粒细胞和肥大细胞来参与协调针对细胞外病原体如蠕虫(寄生性蠕虫)的免疫应答。Th17细胞可以产生白介素17(IL-17)，这是一种激活免疫和非免疫细胞的信号分子。Th17细胞对于募集嗜中性粒细胞至关重要。

在一些实施方案中，本公开提供了表达本发明系统(例如，如本文所述的受体多肽和基因调节多肽GMP中的至少一种)的免疫细胞。在一些实施方案中，该免疫细胞是淋巴细胞。当在免疫细胞中表达时，本发明系统可用于条件性地调节免疫细胞的某些活性。表达本发明系统的免疫细胞如淋巴细胞可参与细胞介导的免疫，以消除病变细胞和/或病原体。

在一些实施方案中，本公开的淋巴细胞的特征在于，当融合的异源核定位域为活性时，致动部分进入细胞核，这在受体多肽与抗原结合并由此触发细胞内信号传导级联之后发生。当异源核定位域为活性时，致动部分移位到细胞核中，然后可操作地与淋巴细胞中的靶多核苷酸复合。致动部分与淋巴细胞中的靶多核苷酸的复合可导致淋巴细胞中靶多核苷酸(例如基因)的表达上调或增加。在一些实施方案中，致动部分或与致动部分融合的异源功能域调节包含内源基因或基因产物的靶多核苷酸的表达和/或活性。内源基因或基因产物可参与免疫应答。例如，致动部分或与致动部分融合的异源功能域可导致内源基因如细胞因子的表达增加。细胞因子表达的增加可有助于有效的免疫应答并且/或者减少与免疫应答相关的负面治疗效应。

在一些实施方案中，致动部分调节细胞因子的表达和/或活性。改变细胞因子表达的方法可用于调节免疫细胞和/或调节免疫应答，例如改变T细胞的活化、改变NK细胞活化的水平以及免疫疗法中的各种其他免疫细胞活性。细胞因子表达的调节可以通过多种机制来完成。在一些实施方案中，致动部分调节从靶多核苷酸表达细胞因子和/或该细胞因子的活性，或者编辑核酸序列，例如编码细胞因子的基因组DNA的核酸序列。在一些实施方案中，致动部分或与致动部分融合的异源功能域调节从靶多核苷酸表达细胞因子受体和/或该细胞因子受体的活性，或者编辑核酸序列，例如编码细胞因子受体的基因组DNA的核酸序列。由致动部分调节和/或编辑的靶多核苷酸可包含内源基因或基因产物，例如内源细胞因子或细胞因子受体基因(例如DNA)或基因产物(例如RNA)。在一些实施方案中，致动部分或与致动部分融合的异源功能域改变细胞因子或细胞因子受体的表达(例如，上调和/或下调)。在一些实施方案中，致动部分编辑编码细胞因子或细胞因子受体的核酸序列。编辑核酸序列可以产生非功能性基因产物，例如截短的和/或不符合阅读框的蛋白质产物。

细胞因子是指由细胞释放的、可影响细胞行为的蛋白质(例如，趋化因子、干扰素、淋巴因子、白介素和肿瘤坏死因子)。细胞因子由范围广泛的细胞产生，包括免疫细胞，如巨噬细胞、B淋巴细胞、T淋巴细胞和肥大细胞，以及内皮细胞、成纤维细胞和各种基质细胞。给定的细胞因子可以由超过一种类型的细胞产生。细胞因子可参与产生全身或局部免疫调节作用。

某些细胞因子可以充当促炎性细胞因子。促炎性细胞因子是指参与诱导或放大炎症反应的细胞因子。促炎性细胞因子可以与免疫系统的各种细胞如嗜中性粒细胞和白细胞协同工作，以产生免疫应答。某些细胞因子可以充当抗炎性细胞因子。抗炎性细胞因子是指参与减少炎症反应的细胞因子。在一些情况下，抗炎性细胞因子可以调节促炎性细胞因子应答。一些细胞因子可以既充当促炎性细胞因子又充当抗炎性细胞因子。

在一些实施方案中，可以在免疫细胞中上调具有促炎性功能的细胞因子的表达。上调具有促炎性功能的细胞因子的表达可用来例如在免疫疗法中刺激针对靶细胞的免疫应答。然而，在一些情况下，过量的促炎性细胞因子可导致有害作用，如体内慢性全身性升高。在一些实施方案中，具有促炎性功能的细胞因子的表达得到下调。这样的下调可以减少和/或最小化有害作用。

在一些实施方案中，具有抗炎性功能的细胞因子的表达可以得到上调。如果炎症应答正引起有害作用，上调具有抗炎性功能的细胞因子的表达可用来例如减少和/或最小化炎症应答。在一些实施方案中，具有抗炎性功能的细胞因子的表达可以得到下调。如果需要，这样的下调可以增加和/或增强炎症应答。

可通过本公开的系统和组合物调节的细胞因子的实例包括但不限于淋巴因子、单核因子和传统的多肽激素。细胞因子中包括生长激素，如人类生长激素，N-甲硫氨酰基人类生长激素和牛生长激素；甲状旁腺素；甲状腺素；胰岛素；胰岛素原；松弛素；松弛素原；糖蛋白激素，如促卵泡激素(FSH)、促甲状腺素(TSH)和黄体生成素(LH)；肝生长因子；成纤维细胞生长因子；催乳素；胎盘催乳素；肿瘤坏死因子-α；缪氏抑制物质；小鼠促性腺激素相关肽；抑制素；激活素；血管内皮生长因子；整联蛋白；血小板生成素(TPO)；神经生长因子，如NGF-α；血小板生长因子；转化生长因子(TGF)，如TGF-α、TGF-β、TGF-β1、TGF-β2和TGF-β3；胰岛素样生长因子-I和-II；促红细胞生成素(EPO)；Flt-3L；干细胞因子(SCF)；骨诱导因子；干扰素(IFN)，如IFN-α、IFN-β、IFN-γ；集落刺激因子(CSF)，如巨噬细胞-CSF(M-CSF)；粒细胞-巨噬细胞-CSF(GM-CSF)；粒细胞-CSF(G-CSF)；巨噬细胞刺激因子(MSP)；白介素(IL)，如IL-1、IL-1a、IL-1b、IL-1RA、IL-18、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-20；肿瘤坏死因子，如CD154、LT-β、TNF-α、TNF-β、4-1BBL、APRIL、CD70、CD153、CD178、GITRL、LIGHT、OX40L、TALL-1、TRAIL、TWEAK、TRANCE；和其他多肽因子，包括LIF、制癌蛋白M(OSM)和kit配体(KL)。细胞因子受体是指结合细胞因子的受体蛋白质。细胞因子受体可以是膜结合的和可溶的。

在一些实施方案中，致动部分或与致动部分融合的异源功能域调节白介素(IL-1)家族成员(例如，配体)、IL-1受体家族成员、白介素-6(IL-6)家族成员(例如，配体)、IL-6受体、白介素-10(IL-10)家族成员(例如，配体)、IL-10受体，白介素-12(IL-12)家族成员(例如，配体)、IL-12受体、白介素-17(IL-17)家族成员(例如，配体)或IL-17受体的表达和/或活性。

在一些实施方案中，致动部分或与致动部分融合的异源功能域调节细胞因子的表达和/或活性，该细胞因子包括但不限于白介素-1(IL-1)家族成员或相关蛋白质；肿瘤坏死因子(TNF)家族成员或相关蛋白质；干扰素(IFN)家族成员或相关蛋白质；白介素-6(IL-6)家族成员或相关蛋白质；以及趋化因子或相关蛋白质。在一些实施方案中，致动部分调节选自以下的细胞因子的表达和/或活性：IL18、IL18BP、IL1A、IL1B、IL1F10、IL1F3/IL1RA、IL1F5、IL1F6、IL1F7、IL1F8、IL1RL2、IL1F9、IL33、BAFF/BLyS/TNFSF138、4-1BBL、CD153/CD30L/TNFSF8、CD40LG、CD70、Fas配体/FASLG/CD95L/CD178、EDA-A1、TNFSF14/LIGHT/CD258、TNFA、LTA/TNFB/TNFSF1、LTB/TNFC、CD70/CD27L/TNFSF7、TNFSF10/TRAIL/APO-2L(CD253)、RANKL/OPGL/TNFSF11(CD254)、TNFSF12、TNF-alpha/TNFA,TNFSF13、TL1A/TNFSF15、OX-40L/TNFSF4/CD252、CD40L/CD154/TNFSF5、IFNA1、IFNA10、IFNA13、IFNA14、IFNA2、IFNA4、IFNA7、IFNB1、IFNE、IFNG、IFNZ、IFNA8、IFNA5/IFNaG、IFNω/IFNW1、CLCF1、CNTF、IL11、IL31、IL6、Leptin、LIF、OSM、CCL1/TCA3、CCL11、CCL12/MCP-5,CCL13/MCP-4、CCL14、CCL15、CCL16、CCL17/TARC、CCL18、CCL19、CCL2/MCP-1、CCL20、CCL21、CCL22/MDC、CCL23、CCL24、CCL25、CCL26、CCL27、CCL28、CCL3、CCL3L3、CCL4、CCL4L1/LAG-1、CCL5、CCL6、CCL7、CCL8、CCL9、CX3CL1、CXCL1、CXCL10、CXCL11、CXCL12、CXCL13、CXCL14、CXCL15、CXCL16、CXCL17、CXCL2/MIP-2、CXCL3、CXCL4、CXCL5、CXCL6、CXCL7/Ppbp、CXCL9、IL8/CXCL8、XCL1、XCL2、FAM19A1、FAM19A2、FAM19A3、FAM19A4和FAM19A5。

在一些实施方案中，致动部分或与致动部分融合的异源功能域调节细胞因子受体的表达和/或活性，该细胞因子受体包括但不限于白介素-1(IL-1)受体家族成员或相关蛋白质；肿瘤坏死因子(TNF)受体家族成员或相关蛋白质；干扰素(IFN)受体家族成员或相关蛋白质；白介素-6(IL-6)受体家族成员或相关蛋白质；以及趋化因子受体或相关蛋白质。在一些实施方案中，致动部分调节细胞因子受体的表达和/或活性，该细胞因子受体选自IL18R1、IL18RAP、IL1R1、IL1R2、IL1R3、IL1R8、IL1R9、IL1RL1、SIGIRR、4-1BB、BAFFR、TNFRSF7、CD40、CD95、DcR3、TNFRSF21、EDA2R、EDAR、PGLYRP1、TNFRSF19L、TNFR1、TNFR2、TNFRSF11A、TNFRSF11B、TNFRSF12A、TNFRSF13B、TNFRSF14、TNFRSF17、TNFRSF18、TNFRSF19、TNFRSF25、LTBR、TNFRSF4、TNFRSF8、TRAILR1、TRAILR2、TRAILR3、TRAILR4、IFNAR1、IFNAR2、IFNGR1、IFNGR2、CNTFR、IL11RA、IL6R、LEPR、LIFR、OSMR、IL31RA、CCR1、CCR2、CCR3、CCR4、CCR5、CCR6、CCR7、CCR8、CCRL1、CXCR3、CXCR4、CXCR5、CXCR6、CXCR7、CXCR1、CXCR2、ARMCX、BCA-1/CXCL1、CCL1、CCL12/MCP-、CCL13/MCP-、CCL15/MIP-5/MIP-1delt、CCL16/HCC-4/NCC、CCL17/TAR、CCL18/PARC/MIP-、CCL19/MIP-3、CCL2/MCP-、CCL20/MIP-3alpha/MIP3、CCL21/6Ckin、CCL22/MD、CCL23/MIP、CCL24/Eotaxin-2/MPIF-、CCL25、CCL26/Eotaxin-、CCL27、CCL3、CCL4、CCL4L1/LAG、CCL5,CCL6,CCL8/MCP-、CXCL10/Crg、CXCL12/SDF-1、CXCL14、CXCL15、CXCL16/SR-、CXCL2/MIP-、CXCL3/GRO、CXCL4、CXCL6/GCP-、CXCL9、FAM19A4、Fractalkine、I-309/CCL1/TCA-、IL-8、MCP-3、NAP-2/PPBP、XCL2、CCR1、CCR2、CCR3、CCR4、CCR5、CCR6、CCR7、CCR8、CCRL1、CXCR3、CXCR4、CXCR5、CXCR6、CXCR7/RDC-1、IL8Ra/CXCR1和IL8Rb/CXCR2。

在一些实施方案中，致动部分或与致动部分融合的异源功能域调节以下因子的表达和/或活性：激活素(例如，激活素βA、激活素βB、激活素βC和激活素βE)；抑制素(例如，抑制素-A和抑制素-B)；激活素受体(例如，激活素1型受体、激活素2型受体)；骨形态发生蛋白(例如，BMP1、BMP2、BMP3、BMP4、BMP5、BMP6、BMP7、BMP8a、BMP8b、BMP10和BMP15)；BMP受体；生长分化因子(例如，GDF1、GDF2、GDF3、GDF4、GDF5、GDF6、GDF7、GDF8、GDF9、GDF10、GDF11和GDF15)；神经胶质细胞来源的神经营养因子家族配体(例如，神经胶质细胞系来源的神经营养因子(GDNF)、神经秩蛋白(NRTN)、artemin(ARTN)和persephin(PSPN))；GDNF家族受体；和c-MPL/CD110/TPOR。

细胞因子的产生可以使用多种方法来评价。细胞因子的产生可通过分析修饰的免疫细胞在其中生长的细胞培养基(例如，体外产生)或从具有修饰的免疫细胞的受试者获得的血清(例如，体内产生)中是否存在一种或多种细胞因子来评价。可以使用任何合适的测定，以各种合适的单位(包括浓度)对细胞因子水平进行定量。在一些实施方案中，检测细胞因子蛋白质。在一些实施方案中，检测细胞因子的mRNA转录物。细胞因子测定的实例包括酶联免疫吸附测定(ELISA)、免疫印迹、免疫荧光测定、放射免疫测定、允许平行检测样品中各种细胞因子的抗体阵列、基于珠子的阵列、定量PCR、微阵列等。其他合适的方法可包括蛋白质组学方法(2-D凝胶、MS分析等)。

在一些实施方案中，内源基因或基因产物编码免疫调节蛋白。免疫调节蛋白包括诸如免疫检查点受体的蛋白质，当与它们的同源配体结合时，它们可以增强和/或抑制免疫细胞信号，包括但不限于免疫细胞的激活信号和抑制信号。在一些情况下，致动物可以改变调节蛋白的表达(例如，上调和/或下调)。在一些实施方案中，致动物编辑编码调节蛋白的核酸序列。在一些实施方案中，内源基因或基因产物编码诸如以下的分子：A2AR、B7.1、B7-H3/CD276、B7-H4/B7S1/B7x/Vtcn1、B7-H6、BTLA/CD272、CCR4、CD122、4-1BB/CD137、CD27、CD28、CD40、CD47、CD70、CISH、CTLA-4/CD152、DR3、GITR、ICOS/CD278、IDO、KIR、LAG-3、OX40/CD134、PD-1/CD279、PD2、PD-L1、PD-L2、TIM-3和VISTA/Dies1/Gi24/PD-1H(C10orf54)。

在一些实施方案中，靶多核苷酸包含异源基因或基因产物。异源基因或基因产物可以编码蛋白质，如另外的嵌合跨膜受体多肽。在一些实施方案中，所述另外的嵌合跨膜受体多肽包含(a)胞外区，其包含特异性结合另外的抗原的另外的配体相互作用域；和(b)共刺激域。所述另外的配体相互作用域可以结合任何合适的抗原。所述另外的配体相互作用域可以结合先前描述的抗原。所述另外的配体相互作用域可以与嵌合受体多肽结合相同的抗原或不同的抗原。所述另外的配体相互作用域可包含任何合适的配体相互作用域。所述另外的配体相互作用域可以是本文其他地方描述的任何配体相互作用域。例如，所述另外的配体相互作用域可包含单克隆抗体、多克隆抗体、重组抗体、人抗体、人源化抗体、Fab、Fab'、F(ab')₂、Fv、单链抗体(例如，scFv)、微抗体、双抗体、单域抗体(“sdAb”或“纳米抗体”或“骆驼科抗体”)或Fc结合域。在一些实施方案中，所述另外的配体相互作用域包含抗体模拟物。

所述另外的嵌合跨膜受体多肽可包含共刺激域。共刺激域可以是先前描述的任何共刺激域。共刺激域可以提供共刺激信号。在一些情况下，这类共刺激信号在表达本发明系统的免疫细胞中提供增殖和/或存活信号。在一些实施方案中，嵌合跨膜受体多肽的免疫细胞信号传导域和所述另外的嵌合跨膜受体多肽包含至少一个共刺激域。包含共刺激域的另外的嵌合跨膜受体的表达可以提供足够的细胞信号转导，以产生持久和/或充分的免疫应答。

电磁辐射介导的基因调节

本文提供了用于细胞外信号介导的基因调节的上述系统和方法的实施方案和/或修改。本文的此类实施方案和/或修改或其任何进一步的修改可以利用上述系统和方法的一种或多种组分进行细胞外信号介导的基因调节。

在一方面，本公开提供了用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，其中该核定位域是可操作的，以在被细胞外信号诱导的细胞信号传导途径激活后，将所述嵌合多肽移位至细胞核，其中该细胞外信号是电磁辐射，并且其中响应于细胞外信号，所述嵌合多肽定位于细胞核，并且所述基因调节多肽调节靶多核苷酸在细胞核中的表达。

在一方面，本公开提供了一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：a)在结合配体时激活细胞信号传导途径的嵌合受体多肽；和b)嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，该异源核定位域是可操作的，以在需要时被电磁辐射激活后将所述嵌合多肽移位至细胞核，其中所述配体与所述嵌合受体多肽的结合可以进一步使嵌合多肽经由激活的异源核定位域移位到细胞核，并且所述基因调节多肽调节靶多核苷酸在细胞核中的表达。

在一方面，本公开提供了一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：a)包含电磁辐射源的细胞信号传导途径激活剂；和b)嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，该异源核定位域是可操作的，以在激活细胞信号传导途径后将所述嵌合多肽移位至细胞核，其中在向细胞施用电磁辐射后，所述嵌合多肽经由激活的异源核定位域定位至细胞核，并且所述基因调节多肽调节靶多核苷酸在细胞核中的表达。

在一些实施方案中，所述系统中使用的电磁辐射可以包括来自电磁谱的一个或多个波长，包括X射线、紫外(UV)线、可见光、红外线、微波或其任意组合。

在一些实施方案中，本文公开的电磁辐射源离体或在体外与所述系统结合使用。在其他一些实施方案中，将电磁辐射源植入、附接至或施用于受试者，包括但不限于哺乳动物和植物。在使用中，电磁辐射源可以将电磁谱的至少一部分发射到受试者体内的一个或多个特定区域，以在激活细胞信号传导途径方面提供空间和/或时间控制，从而在调节靶多核苷酸在受试者体内的表达方面提供空间和/或时间控制。

在一些实施方案中，电磁辐射源可以在一段时间内向细胞或包含细胞的受试者发射电磁谱的至少一部分。在一些情况下，在多段时间内发射电磁谱的至少一部分可以在激活细胞信号传导途径方面提供时间控制，从而在调节靶多核苷酸在细胞中的表达方面提供时间控制。在一些情况下，电磁辐射源可以发射电磁谱的至少一部分，持续时间为约0.1毫秒(ms)至约120分钟(min)。电磁辐射源可以发射电磁谱的至少一部分，持续时间为至少0.1ms、0.2ms、0.3ms、0.4ms、0.5ms、0.6ms、0.7ms、0.8ms、0.9ms、1ms、2ms、3ms、4ms、5ms、6ms、7ms、8ms、9ms、10ms、20ms、30ms、40ms、50ms、60ms、70ms、80ms、90ms、100ms、200ms、300ms、400ms、500ms、600ms、700ms、800ms、900ms、1s、2s、3s、4s、5s、6s、7s、8s、9s、10s、20s、30s、40s、50s、60s、70s、80s、90s、100s、200s、300s、400s、500s、600s、700s、800s、900s、1000s、2000s、3000s、4000s、5000s、6000s、7000s、7200s或更长。电磁辐射源可以发射电磁谱的至少一部分，持续时间最多为7200s、7000s、6000s、5000s、4000s、3000s、2000s、1000s、900s、800s、700s、600s、500s、400s、300s、200s、100s、90s、80s、70s、60s、50s、40s、30s、20s、10s、9s、8s、7s、6s、5s、4s、3s、2s、1s、900ms、800ms、700ms、600ms、500ms、400ms、300ms、200ms、100ms、90ms、80ms、70ms、60ms、50ms、40ms、30ms、20ms、10ms、9ms、8ms、7ms、6ms、5ms、4ms、3ms、2ms、1ms、0.9ms、0.8ms、0.7ms、0.6ms、0.5ms、0.4ms、0.3ms、0.2ms、0.1ms或更短。

在一些实施方案中，电磁辐射源可以发射可见光内的蓝光的至少一部分，以诱导细胞信号传导途径。蓝光可以包括约380nm至约490nm的波长。蓝光可以包括至少约380nm的波长。蓝光可以包括至多约490nm的波长。蓝光可以包括以下波长：约380nm至约390nm、约380nm至约400nm、约380nm至约410nm、约380nm至约420nm、约380nm至约430nm、约380nm至约440nm、约380nm至约450nm、约380nm至约460nm、约380nm至约470nm、约380nm至约480nm、约380nm至约490nm、约390nm至约400nm、约390nm至约410nm、约390nm至约420nm、约390nm至约430nm、约390nm至约440nm、约390nm至约450nm、约390nm至约460nm、约390nm至约470nm、约390nm至约480nm、约390nm至约490nm、约400nm至约410nm、约400nm至约420nm、约400nm至约430nm、约400nm至约440nm、约400nm至约450nm、约400nm至约460nm、约400nm至约470nm、约400nm至约480nm、约400nm至约490nm、约410nm至约420nm、约410nm至约430nm、约410nm至约440nm、约410nm至约450nm、约410nm至约460nm、约410nm至约470nm、约410nm至约480nm、约410nm至约490nm、约420nm至约430nm、约420nm至约440nm、约420nm至约450nm、约420nm至约460nm、约420nm至约470nm、约420nm至约480nm、约420nm至约490nm、约430nm至约440nm、约430nm至约450nm、约430nm至约460nm、约430nm至约470nm、约430nm至约480nm、约430nm至约490nm、约440nm至约450nm、约440nm至约460nm、约440nm至约470nm、约440nm至约480nm、约440nm至约490nm、约450nm至约460nm、约450nm至约470nm、约450nm至约480nm、约450nm至约490nm、约460nm至约470nm、约460nm至约480nm、约460nm至约490nm、约470nm至约480nm、约470nm至约490nm或约480nm至约490nm。蓝光可以包括约380nm、约390nm、约400nm、约410nm、约420nm、约430nm、约440nm、约450nm、约460nm、约470nm、约480nm或约490nm的波长。

在一些实施方案中，电磁辐射源可以发射紫外线的至少一部分。紫外线可包括约10nm至约380nm的波长。紫外线可包括至少约10nm的波长。紫外线可包括至多约380nm的波长。紫外线可包括以下波长：约10nm至约50nm、约10nm至约100nm、约10nm至约150nm、约10nm至约200nm、约10nm至约250nm、约10nm至约300nm、约10nm至约350nm、约10nm至约380nm、约50nm至约100nm、约50nm至约150nm、约50nm至约200nm、约50nm至约250nm、约50nm至约300nm、约50nm至约350nm、约50nm至约380nm、约100nm至约150nm、约100nm至约200nm、约100nm至约250nm、约100nm至约300nm、约100nm至约350nm、约100nm至约380nm、约150nm至约200nm、约150nm至约250nm、约150nm至约300nm、约150nm至约350nm、约150nm至约380nm、约200nm至约250nm、约200nm至约300nm、约200nm至约350nm、约200nm至约380nm、约250nm至约300nm、约250nm至约350nm、约250nm至约380nm、约300nm至约350nm、约300nm至约380nm或约350nm至约380nm。紫外线可包括约10nm、约50nm、约100nm、约150nm、约200nm、约250nm、约300nm、约350nm或约380nm的波长。

在一些实施方案中，用于调节靶多核苷酸在细胞中的表达的系统可进一步包含信号传导单元，该单元在施用细胞外信号后激活细胞信号传导途径，该细胞外信号是电磁辐射。

在一些情况下，所述信号传导单元可包含跨膜蛋白质。在施用电磁辐射后，跨膜蛋白质可诱导细胞信号传导途径。跨膜蛋白质可以是亚视黄基(retinylidene)蛋白质。亚视黄基蛋白质的实例包括光门控离子通道(例如光敏感通道蛋白(Channelrhodopsin)-1(ChR1)、光敏感通道蛋白-2(ChR2)、菌紫红质、盐细菌视紫红质、proteorhodopsin等)、一些G蛋白偶联受体(GPCR)(例如，视觉视蛋白、黑素蛋白、peropsin、encephalopsin等)及其修饰。在一个实例中，跨膜蛋白质可以是光敏感通道蛋白-2(ChR2)。ChR2蛋白可具有L132C突变，以提高其对钙的通透性。当被蓝光(例如，波长为470nm)照射时，ChR2蛋白可以激活并允许钙离子流入细胞质。增加的细胞内钙离子浓度继而可以激活钙和钙调蛋白依赖性丝氨酸/苏氨酸蛋白磷酸酶(例如，钙依赖磷酸酶)作为细胞信号传导途径。或者，在一些情况下，所述信号传导单元可包含细胞内蛋白质。在施用电磁辐射后，细胞内蛋白质可诱导细胞信号传导途径。

在一些情况下，所述信号传导单元可包含跨膜蛋白质和细胞内蛋白质。在一些实例中，细胞外信号(例如电磁辐射)的施用可激活信号传导单元的跨膜蛋白质，其继而激活信号传导单元的细胞内蛋白质，以诱导细胞信号传导途径(例如，钙依赖磷酸酶)。在一些实例中，细胞外信号的施用可激活信号传导单元的细胞内蛋白质，其继而激活信号传导单元的跨膜蛋白质，以诱导细胞信号传导途径。在一个实例中，跨膜蛋白质可以是离子通道蛋白(例如，钙释放激活的钙通道蛋白1(ORAI1))。细胞内蛋白质可包含第一部分和第二部分。电磁辐射的施用可诱导细胞内蛋白质的构象变化，从而暴露第一部分和第二部分中的至少一个的活性位点。该活性位点可以在细胞内蛋白质的第一部分上。该活性位点可以在细胞内蛋白质的第二部分上。该活性位点可以在细胞内蛋白质的第一部分和第二部分上。一旦暴露，细胞内蛋白质的活性位点就可激活跨膜蛋白质以诱导细胞信号传导途径。在一些情况下，细胞内蛋白质的活性位点可以结合(例如，形成氢键)跨膜蛋白质以激活跨膜蛋白质。在一些情况下，细胞内蛋白质的暴露的活性位点可以激活第二信使(例如，另外的细胞内或跨膜蛋白质)，其继而激活跨膜蛋白质。在一些情况下，激活的跨膜蛋白质可以是离子通道蛋白，并且细胞信号传导途径可包含离子，如钙。

在一个实例中(图8)，细胞包含嵌合多肽，该嵌合多肽包含与活化T细胞核因子(NFAT)蛋白的异源核定位信号(NLS)结构域框内融合的基因调节多肽(dCas9)。该嵌合多肽还符合阅读框地包含转录激活物(例如，VP64)或转录阻抑物(例如，KRAB结构域)。该细胞还包含血浆跨膜钙离子通道ORAI1，一旦被激活，ORAI1就促进钙离子向细胞质中的流入。作为电磁辐射诱导的ORAI1激活剂，该细胞包含信号传导单元，该信号传导单元包含(i)具有来自燕麦(Avena sativa)向光蛋白的C末端Jα螺旋的光-氧-电压(LOV2)结构域，和(ii)来自斑马鱼(Danio rerio)的SOAR(基质相互作用分子1(STIM1)ORAI1激活区)/CAD(钙释放激活通道(CRAC)激活蛋白)的胞质域的ORAI1激活片段。在信号传导单元中，Jα螺旋可以充当LOV2结构域与SOAR/CAD结构域之间的连接体。在一些情况下，信号传导单元可以包含与SOAR/CAD结构域相邻的符合阅读框的光依赖性LOV2结合多肽(例如，Zdark(Zdk))。光依赖性LOV2结合多肽可以充当额外的“锁”，以将信号传导单元进一步锁定在静止构型，从而减少背景激活。在黑暗中，Jα螺旋可以保持其螺旋构象，而SOAR/CAD可以被LOV2锁定，以防止ORAI1激活。在蓝光(例如，波长为470nm)暴露后，LOV2-Jα螺旋的构象变化(解折叠)可以暴露SOAR/CAD结构域的活性位点。被激活的信号传导单元随后可以定位至质膜，以接合和/或激活ORAI1钙离子通道。钙离子通道的激活可导致钙离子流入细胞质中。钙离子的流入可以诱导包含钙离子依赖性丝氨酸/苏氨酸蛋白磷酸酶(例如，钙依赖磷酸酶)的细胞信号传导途径，以激活(例如，脱磷酸化)所述嵌合多肽中NFAT的NLS结构域。激活的NLS结构域可在蓝光辐射后将包含基因调节多肽和转录激活物或阻抑物的嵌合多肽移位至细胞核中。在细胞核中，基因调节多肽可以调节细胞中的基因表达。

在一些实施方案中，本发明细胞可具有两种调节靶多核苷酸表达的机制。本发明细胞可以具有嵌合多肽，该嵌合多肽包含与NLS结构域框内融合的基因调节多肽(例如，dCas9)，其中该NLS结构域是可操作的，以在激活细胞信号传导途径后将所述嵌合多肽移位至细胞核。嵌合多肽的激活可以通过两种机制来实现。第一种机制可以利用由电磁辐射诱导的光响应性信号传导单元来激活细胞信号传导途径。第二种机制可以采用包含细胞外受体的另一种嵌合多肽，当被配体结合时，该嵌合多肽可以激活细胞信号传导途径。

LOV2-Jα螺旋多肽的非限制性实例可包含以下氨基酸序列：LATTLERIEKNFVITDPRLPDNPIIFASDSFLQLTEYSREEILGRNCRFLQGPETDRATVRKIRDAIDNQTEVTVQLINYTKSGKKFWNLFHLQPMRDQKGDVQYFIGVQLDGTEHVRDAAEREGVMLIKKTAENIDEAAKE(SEQ ID NO:22)，MLATTLERIEKNFVITDPRLPDNPIIFASDSFLQLTEYSREEILGRNCRFLQGPETDRATVRKIRDAIDNQTEVTVQLINYTKSGKKFWNLFHLQPMRDQKGDVQYFIGVQLDGTEHVRDAAEREGVMLIKKTAENIDEAA(SEQ ID NO:23)，或LATTLERIEKNFVITDPRLPDNPIIFASDSFLQLTEYSREEILGRNCRFLQGPETDRATVRKIRDAIDNQTEVTVQLINYTKSGKKFWNLFHLQPMRDQKGDVQYFIGVQLDGTEHVRDAAEREGVMLIKKTAENIDEAA(SEQ ID NO:24)。

SOAR/CAD多肽的非限制性实例可包含以下氨基酸序列：MLQKWLQLTHEVEVQYYNIKKQNAERQLQVAKEGAEKIKKKRNTLFGTFHVAHSSSLDDVDHKILAAKQALGEVTAALRERLHRWQQIELLTGFTLVHNPGLP(SEQ ID NO:25)。

治疗用途

在一方面，本公开提供了一种用于淋巴细胞的条件性调节的方法。在一些实施方案中，该方法包括使本文公开的淋巴细胞与特异性结合受体的配体相互作用域的抗原接触或暴露。该接触实现免疫细胞活性的激活或失活，从而条件性地调节淋巴细胞。在一些实施方案中，免疫细胞活性选自：淋巴细胞的克隆扩充；淋巴细胞释放细胞因子；淋巴细胞的细胞毒性；淋巴细胞的增殖；淋巴细胞的分化、去分化或转分化；淋巴细胞的运动和/或运输；淋巴细胞的衰竭和/或重新激活；以及淋巴细胞释放其他细胞间分子、代谢物、化学化合物或其组合。

在一些实例中，当在免疫中表达时，本公开的系统和组合物可用于杀死靶细胞。在一方面，表达本发明系统的免疫细胞或免疫细胞群体可以诱导靶细胞的死亡。杀死靶细胞可用于多种应用，包括但不限于治疗希望消除细胞群体或希望抑制其增殖的疾病或病症。在一些实施方案中，诱导靶细胞死亡的方法包括将靶细胞暴露于表达本文公开的系统的免疫细胞或免疫细胞群体。在一些实施方案中，该免疫细胞是淋巴细胞，如T细胞或NK细胞。当靶细胞暴露于淋巴细胞时，由淋巴细胞表达的受体可以结合靶细胞的膜结合抗原或靶细胞的非膜结合抗原，并且该暴露实现淋巴细胞的细胞毒性的激活，从而诱导靶细胞的死亡。

表达本发明系统的淋巴细胞如细胞毒性T细胞可以诱导靶细胞的凋亡。当在免疫细胞如T细胞中表达时，本发明系统可以用来调节T细胞的克隆扩充、活化标记在细胞表面上的表达、向效应细胞的分化、细胞毒性的诱导或细胞因子分泌、凋亡的诱导及其组合。在细胞毒性T细胞中表达的本发明系统可以改变(i)诸如穿孔蛋白、颗粒酶和颗粒溶素等细胞毒素的释放，和/或(ii)通过T细胞与靶细胞之间的Fas-Fas配体相互作用对凋亡的诱导，从而触发靶细胞的破坏。当在自然杀伤(NK)细胞中表达时，本发明系统可以介导NK细胞对靶细胞的杀伤。自然杀伤(NK)细胞在激活时可以靶向并杀死异常细胞，如病毒感染的和致瘤的细胞。本发明系统可以调节储存在NK细胞分泌性溶酶体内的细胞毒性分子的产生和/或释放，这可导致靶细胞的特异性杀伤。在一些实施方案中，(i)表达本发明系统的抗原特异性细胞毒性T细胞(例如，淋巴细胞)可诱导以下细胞的凋亡：在其表面上展示外来抗原的表位的细胞，如病毒感染的细胞、细胞内细菌的细胞、展示肿瘤抗原的癌细胞；(ii)表达本发明系统的巨噬细胞和自然杀伤细胞(NK细胞)可以破坏病原体；和/或(iii)表达本发明系统的其他免疫细胞可以分泌多种细胞因子，以促进另外的免疫应答。

诸如T细胞和NK细胞等免疫细胞的细胞毒性的激活是指诱导的生物状态的变化，通过这种变化，细胞变为细胞毒性的。此类变化包括活化标记的表达改变、细胞因子的产生以及增殖。这些变化可以由初级刺激信号产生。共刺激信号可以放大初级信号的强度，并抑制初始刺激后的细胞死亡，从而导致更持久的激活状态，因此更高的细胞毒性能力。细胞毒性可指抗体依赖性细胞的细胞毒性。

在表达本文公开的系统的免疫细胞中，受体可以响应于抗原结合而经历受体修饰。受体修饰可包括构象变化和/或化学修饰。化学修饰可包括例如在受体的至少一个氨基酸残基处的磷酸化或脱磷酸化。化学修饰的其他实例包括乙酰化、脱乙酰基、甲基化、脱甲基、脱氨基和其他任何合适的化学修饰。在一些实施方案中，受体修饰包括在多个修饰位点处的修饰，并且每个修饰都有效结合衔接蛋白。免疫细胞上的嵌合跨膜受体多肽的配体相互作用域与靶细胞的抗原(膜结合的或非膜结合的)结合后，触发信号传导级联，从而导致与致动部分融合的核定位域的激活，致动部分然后移位到细胞核中，以实现免疫细胞活性例如淋巴细胞的细胞毒性的激活或失活。

致动部分移位到细胞核中可以通过调节靶多核苷酸如DNA(例如，基因组DNA和/或cDNA)和RNA(例如，mRNA)的表达而实现淋巴细胞的细胞毒性的激活。在一些实施方案中，致动部分通过物理阻碍靶多核苷酸或募集有效抑制或增强从靶多核苷酸的基因表达的其他因子来调节靶多核苷酸的表达。在一些实施方案中，致动部分包含有效增加靶多核苷酸的表达的转录激活物。在一些实施方案中，致动部分包含有效降低靶多核苷酸的表达的转录阻抑物。

在一些实施方案中，靶多核苷酸包含基因组DNA，如基因组的区域。在一些实施方案中，靶多核苷酸包含质粒的区域，例如携带外源基因的质粒。在一些实施方案中，靶多核苷酸包含RNA。致动部分可包括核定位信号序列的一个或多个拷贝，其允许结构域在激活核定位域后移位到细胞核中。

使用本公开的系统和方法可以杀死多种靶细胞。可以应用该方法的靶细胞包括多种细胞类型。靶细胞可以是体外的。靶细胞可以是体内的。靶细胞可以是离体的。靶细胞可以是分离的细胞。靶细胞可以是生物体内的细胞。靶细胞可以是生物体。靶细胞可以是细胞培养中的细胞。靶细胞可以是细胞集合之一。靶细胞可以是哺乳动物细胞或衍生自哺乳动物细胞。靶细胞可以是啮齿动物细胞或衍生自啮齿动物细胞。靶细胞可以是人细胞或衍生自人细胞。靶细胞可以是原核细胞或衍生自原核细胞。靶细胞可以是细菌细胞或可以衍生自细菌细胞。靶细胞可以是古菌细胞或衍生自古菌细胞。靶细胞可以是真核细胞或衍生自真核细胞。靶细胞可以是多能干细胞。靶细胞可以是植物细胞或衍生自植物细胞。靶细胞可以是动物细胞或衍生自动物细胞。细胞可以是无脊椎动物细胞或衍生自无脊椎动物细胞。靶细胞可以是脊椎动物细胞或衍生自脊椎动物细胞。靶细胞可以是微生物细胞或衍生自微生物细胞。靶细胞可以是真菌细胞或衍生自真菌细胞。靶细胞可以来自特定器官或组织。

靶细胞可以是干细胞或祖细胞。靶细胞可包括干细胞(例如，成年干细胞、胚胎干细胞、诱导多能干(iPS)细胞)和祖细胞(例如，心脏祖细胞、神经祖细胞等)。靶细胞可包括哺乳动物干细胞和祖细胞，包括啮齿动物干细胞、啮齿动物祖细胞、人干细胞、人祖细胞等。克隆细胞可包括细胞的子代。靶细胞可包括靶核酸。细胞可以在活生物体内。靶细胞可以是基因修饰的细胞。靶细胞可以是宿主细胞。

靶细胞可以是全能干细胞，但是，在本公开的一些实施方案中，可以使用术语“细胞”，但是可以不指全能干细胞。靶细胞可以是植物细胞，但是在本公开的一些实施方案中，可以使用术语“细胞”，但是可以不指植物细胞。靶细胞可以是多能细胞。例如，靶细胞可以是多能造血细胞，其可以分化为造血细胞谱系中的其他细胞，但是可能无法分化为其他任何非造血细胞。靶细胞可以能够发育成整个生物。靶细胞可能发育成完整的生物或可能无法发育成完整的生物。靶细胞可以是整个生物。

靶细胞可以是原代细胞。例如，原代细胞的培养物可以传代0次、1次、2次、4次、5次、10次、15次或更多次。细胞可以是单细胞生物。细胞可以在培养物中生长。

靶细胞可以是病变细胞。病变细胞可以具有改变的代谢、基因表达和/或形态学特征。病变细胞可以是癌细胞、糖尿病细胞和凋亡细胞。病变细胞可以是来自患病受试者的细胞。示例性的疾病可包括血液病症、癌症、代谢紊乱、眼部病症、器官病症、肌肉骨骼病症、心脏病等。

如果靶细胞是原代细胞，则可以通过任何方法从个体收获它们。例如，白细胞可以通过单采血液成分术、白细胞单采术、密度梯度分离等来收获。来自组织如皮肤、肌肉、骨髓、脾、肝、胰腺、肺、肠、胃等的细胞可以通过活检来收获。可以使用适当的溶液来分散或悬浮收获的细胞。这样的溶液通常可以是平衡盐溶液(例如，生理盐水、磷酸盐缓冲盐水(PBS)、Hank’s平衡盐溶液等)，其方便地补充有胎牛血清或其他天然存在的因子，并且与可接受的低浓度缓冲液结合。缓冲液可包括HEPES、磷酸盐缓冲液、乳酸盐缓冲液等。细胞可以立即使用，或者可以储存(例如，冷冻)。冷冻的细胞可以解冻，并且可以能够重复使用。可以将细胞冷冻在DMSO、血清、培养基缓冲液(例如，10％DMSO、50％血清、40％缓冲的培养基)和/或用于在冷冻温度下保存细胞的一些其他此类常见溶液中。

可以是靶细胞的细胞的非限制性实例包括但不限于淋巴样细胞，如B细胞、T细胞(细胞毒性T细胞、自然杀伤T细胞、调节T细胞、T辅助细胞)、自然杀伤细胞、细胞因子诱导的杀伤(CIK)细胞(参见例如US20080241194)；髓样细胞，如粒细胞(嗜碱性粒细胞、嗜酸性粒细胞、嗜中性粒细胞/多叶核嗜中性粒细胞)、单核细胞/巨噬细胞、红细胞(网织红细胞)、肥大细胞、血小板/巨核细胞、树突细胞；来自内分泌系统的细胞，包括甲状腺(甲状腺上皮细胞、滤泡旁细胞)、甲状旁腺(甲状旁腺主细胞、嗜酸性细胞)、肾上腺(嗜铬细胞)、松果体(松果体细胞)的细胞；神经系统的细胞，包括神经胶质细胞(星形胶质细胞、小胶质细胞)、大细胞神经分泌细胞、星状细胞、Boettcher细胞和垂体细胞(促性腺激素细胞、促肾上腺皮质素细胞、促甲状腺素细胞、生长激素细胞、催乳激素细胞)；呼吸系统的细胞，包括肺细胞(I型肺细胞、II型肺细胞)、克拉拉细胞、杯状细胞、尘细胞；循环系统的细胞，包括心肌细胞、周细胞；消化系统的细胞，包括胃(胃主细胞、壁细胞)、杯状细胞、帕内特细胞、G细胞、D细胞、ECL细胞、I细胞、K细胞、S细胞；肠内分泌细胞，包括肠嗜铬细胞、APUD细胞、肝脏(肝细胞、库普弗细胞)、软骨/骨/肌肉；骨细胞，包括成骨细胞、骨细胞、破骨细胞、牙齿(成牙骨质细胞、成釉质细胞)；软骨细胞，包括成软骨细胞、软骨细胞；皮肤细胞，包括毛囊细胞、角质形成细胞、黑素细胞(痣细胞)；肌肉细胞，包括肌细胞；泌尿系统细胞，包括足细胞、肾小球旁细胞、肾小球内系膜细胞/肾小球外系膜细胞、肾近端肾小管刷状缘细胞、致密斑细胞；生殖系统细胞，包括精子、塞托利细胞、莱迪希细胞、卵子；以及其他细胞，包括脂肪细胞、成纤维细胞、腱细胞、表皮角质形成细胞(进行分化的表皮细胞)、表皮基底细胞(干细胞)、指甲和脚趾甲的角质形成细胞、甲床基底细胞(干细胞)、髓质毛干细胞、皮质毛干细胞、表皮毛干细胞、表皮毛根鞘细胞、赫胥黎层的毛根鞘细胞、亨勒层的毛根鞘细胞、外毛根鞘细胞、毛基质细胞(干细胞)、湿分层屏障上皮细胞、角膜、舌、口腔、食管、肛管、远侧尿道和阴道的复层鳞状上皮的表面上皮细胞、角膜、舌、口腔、食管、肛管、尿道和阴道的上皮的基底细胞(干细胞)、尿道上皮细胞(内衬在膀胱和尿道内)、外分泌分泌上皮细胞、唾液腺粘液细胞(富含多糖的分泌)、唾液腺浆液细胞(富含糖蛋白酶的分泌)、舌中的Von Ebner腺细胞(洗涤味蕾)、乳腺细胞(乳汁分泌)、泪腺细胞(泪液分泌)、耳中的耵聍腺细胞(蜡分泌)、外泌汗腺暗细胞(糖蛋白分泌)、外泌汗腺透明细胞(小分子分泌)、顶泌汗腺细胞(有气味的分泌，对性激素敏感)、眼睑的莫尔氏腺细胞(特化的汗腺)、皮脂腺细胞(富含脂质的皮脂分泌)、鼻的鲍曼氏腺细胞(洗涤嗅上皮)、十二指肠的布伦纳腺细胞(酶和碱性粘液)、精囊细胞(分泌精液组分，用于游动精子的果糖)、前列腺细胞(分泌精液组分)、尿道球腺细胞(粘液分泌)、巴多林腺细胞(阴道润滑剂分泌物)、利特雷腺细胞(粘液分泌物)、子宫内膜细胞(碳水化合物分泌)、呼吸道和消化道的分离杯状细胞(粘液分泌)、胃内衬粘液细胞(粘液分泌)、胃腺产酶细胞(胃蛋白酶原分泌)、胃腺泌酸细胞(盐酸分泌)、胰腺腺泡细胞(碳酸氢盐和消化酶分泌)、小肠的帕内特细胞(溶菌酶分泌)、肺的II型肺细胞(表面活性剂分泌)、肺的克拉拉细胞、激素分泌细胞、垂体前叶细胞、生长激素细胞、垂体催乳素细胞、促甲状腺素细胞、促性腺激素细胞、促肾上腺皮质素细胞、中间垂体细胞、大细胞神经分泌细胞、肠和呼吸道细胞、甲状腺细胞、甲状腺上皮细胞、滤泡旁细胞、甲状旁腺细胞、甲状旁腺主细胞、嗜酸性细胞、肾上腺细胞、嗜铬细胞、睾丸莱迪希细胞、卵泡的卵泡膜内层细胞、破裂卵泡的黄体细胞、颗粒黄体细胞、膜黄体细胞、肾小球旁细胞(肾素分泌)、肾脏致密斑细胞、代谢和贮藏细胞、屏障功能细胞(肺、肠、外分泌腺和泌尿生殖道)、肾脏、I型肺细胞(肺部内衬的气室)、胰腺导管细胞(泡心细胞)、非复层导管细胞(属于汗腺、唾液腺、乳腺等)、导管细胞(属于精囊、前列腺等)、封闭内部体腔内衬的上皮细胞、具有推进功能的纤毛细胞、细胞外基质分泌细胞、收缩细胞；骨骼肌细胞、干细胞、心肌细胞、血液和免疫系统细胞、红细胞(红血球)、巨核细胞(血小板前体)、单核细胞、结缔组织巨噬细胞(各种类型)、表皮朗格汉斯细胞、破骨细胞(骨中)、树突细胞(淋巴组织中)、小胶质细胞(中枢神经系统中)、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、肥大细胞、辅助T细胞、抑制T细胞、细胞毒性T细胞、自然杀伤T细胞、B细胞、自然杀伤细胞、网织红细胞、血液和免疫系统的干细胞和定型祖细胞(各种类型)、多能干细胞、全能干细胞、诱导多能干细胞、成年干细胞、感觉传感器细胞、自主神经元细胞、感觉器官和周围神经元支持细胞、中枢神经系统神经元和神经胶质细胞、晶状体细胞、色素细胞、黑素细胞、视网膜色素上皮细胞、生殖细胞、卵原细胞/卵母细胞、精子细胞、精母细胞、精原细胞(精母细胞的干细胞)、精子、抚育细胞、卵泡细胞、塞托利细胞(睾丸中)、胸腺上皮细胞、间质细胞和肾间质细胞。

特别感兴趣的是癌细胞。在一些实施方案中，靶细胞是癌细胞。癌细胞的非限制性实例包括癌症的细胞，所述癌症包括棘皮瘤、腺泡细胞癌、听神经瘤、肢端雀斑样黑色素瘤、顶端螺旋瘤、急性嗜酸性粒细胞白血病、急性淋巴母细胞白血病、急性巨核细胞白血病、急性单核细胞白血病、急性成髓细胞白血病伴成熟、急性髓样树突状细胞白血病、急性髓样白血病、急性早幼粒细胞白血病、成釉细胞瘤(Adamantinoma)、腺癌、腺样囊性癌、腺瘤、牙源性腺瘤样瘤、肾上腺皮质癌、成人T细胞白血病、侵袭性NK细胞白血病、艾滋病相关癌症、艾滋病相关淋巴瘤、腺泡状软组织肉瘤、成釉细胞纤维瘤、肛门癌、间变性大细胞淋巴瘤、未分化甲状腺癌、血管免疫母细胞性T细胞淋巴瘤、血管肌脂瘤、血管肉瘤、阑尾癌、星形细胞瘤、非典型畸胎样横纹肌样瘤、基底细胞癌、基底细胞样癌、B细胞白血病、B细胞淋巴瘤、比里尼导管癌(Bellini duct carcinoma)、胆道癌、膀胱癌、母细胞瘤、骨癌、骨肿瘤、脑干胶质瘤、脑瘤、乳腺癌、Brenner瘤、支气管肿瘤、细支气管肺泡癌、棕色瘤、伯基特淋巴瘤、原发部位不明的癌症、类癌瘤、癌、原位癌、阴茎癌、原发部位不明的癌、癌肉瘤、卡斯尔曼病(Castleman's Disease)、中枢神经系统胚胎瘤、小脑星形细胞瘤、大脑星形细胞瘤、宫颈癌、胆管癌、软骨瘤、软骨肉瘤、脊索瘤、绒毛膜癌、脉络丛乳头状瘤、慢性淋巴细胞白血病、慢性单核细胞白血病、慢性骨髓性白血病、慢性骨髓增生性疾病、慢性中性粒细胞白血病、透明细胞瘤、结肠癌、结直肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、德戈斯病(Degos disease)、隆凸性皮肤纤维肉瘤、皮样囊肿、促结缔组织增生性小圆细胞肿瘤、弥漫性大B细胞淋巴瘤、胚胎发育不良性神经上皮瘤、胚胎性癌、内胚窦瘤、子宫内膜癌、子宫内膜子宫癌、子宫内膜样肿瘤、肠病相关T细胞淋巴瘤、室管膜母细胞瘤(Ependymoblastoma)、室管膜瘤、上皮样肉瘤、红白血病、食管癌、鼻腔神经胶质瘤、尤因家族肿瘤、尤因家族肉瘤、尤因肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、乳腺外佩吉特病、输卵管癌、胎中胎、纤维瘤、纤维肉瘤、滤泡性淋巴瘤、滤泡性甲状腺癌、胆囊癌、胆囊癌、神经节神经胶质瘤、神经节瘤、胃癌、胃淋巴瘤、胃肠癌、胃肠道类癌肿瘤、胃肠道间质瘤、胃肠道间质瘤、生殖细胞肿瘤、生殖细胞瘤、妊娠性绒毛膜癌、妊娠滋养细胞肿瘤、骨巨细胞瘤、多形性胶质母细胞瘤、胶质瘤、大脑胶质瘤病、血管球瘤、胰高血糖素瘤、性腺母细胞瘤、粒层细胞瘤、毛细胞白血病、毛细胞白血病、头颈癌、头颈癌、心脏癌症、血管母细胞瘤、血管外皮细胞瘤、血管肉瘤、恶性血液病、肝细胞癌、肝脾T细胞淋巴瘤、遗传性乳腺-卵巢癌综合征、霍奇金淋巴瘤、霍奇金氏淋巴瘤、下咽癌、下丘脑胶质瘤、炎性乳腺癌、眼内黑色素瘤、胰岛细胞癌、胰岛细胞瘤、幼年型粒单核细胞白血病、肉瘤、卡波西肉瘤、肾癌、Klatskin瘤、Krukenberg瘤、喉癌、喉癌、恶性雀斑样痣黑色素瘤、白血病、白血病、唇和口腔癌、脂肪肉瘤、肺癌、黄体瘤、淋巴管瘤、淋巴管肉瘤、淋巴上皮瘤、淋巴样白血病、淋巴瘤、巨球蛋白血症、恶性纤维性组织细胞瘤、恶性纤维性组织细胞瘤、骨恶性纤维性组织细胞瘤、恶性胶质瘤、恶性间皮瘤、恶性周围神经鞘肿瘤、恶性横纹肌样瘤、恶性蝾螈瘤、MALT淋巴瘤、套细胞淋巴瘤、肥大细胞白血病、纵隔生殖细胞肿瘤、纵隔肿瘤、甲状腺髓样癌、髓母细胞瘤、髓母细胞瘤、髓上皮瘤、黑色素瘤、黑色素瘤、脑膜瘤、Merkel细胞癌、间皮瘤、间皮瘤、隐匿性原发性转移性鳞状颈癌、转移性尿路上皮癌、米勒混合瘤(Mixed Mullerian tumor)、单核细胞白血病、口腔癌、粘液性肿瘤、多发性内分泌肿瘤综合征、多发性骨髓瘤、多发性骨髓瘤、蕈样真菌病、蕈样真菌病、骨髓增生异常疾病、骨髓增生异常综合征、骨髓性白血病、髓样肉瘤、骨髓增殖性疾病、粘液瘤、鼻腔癌、鼻咽癌、鼻咽癌、赘生物(Neoplasm)、神经鞘瘤、神经母细胞瘤、神经母细胞瘤、神经纤维瘤、神经瘤、结节性黑色素瘤、非霍奇金淋巴瘤、非霍奇金淋巴瘤、非黑色素瘤皮肤癌、非小细胞肺癌、眼部肿瘤、少突星形细胞瘤、少突胶质细胞瘤、嗜酸粒细胞腺瘤(Oncocytoma)、视神经鞘脑膜瘤、口腔癌、口腔癌、口咽癌、骨肉瘤、骨肉瘤、卵巢癌、卵巢癌、卵巢上皮癌、卵巢生殖细胞肿瘤、卵巢低恶性潜在肿瘤(Ovarian Low Malignant Potential Tumor)、乳腺佩吉特病、肺上沟瘤、胰腺癌、胰腺癌、甲状腺乳头状癌、乳头状瘤、副神经节瘤、鼻窦癌、甲状旁腺癌、阴茎癌、血管周上皮样细胞瘤、咽癌、嗜铬细胞瘤、中度分化的松果体实质瘤、松果体母细胞瘤、垂体细胞瘤、垂体腺瘤、垂体瘤、浆细胞肿瘤、胸膜肺母细胞瘤、多胚瘤、前体T淋巴母细胞性淋巴瘤、原发性中枢神经系统淋巴瘤、原发性渗出性淋巴瘤、原发性肝细胞癌、原发性肝癌、原发性腹膜癌、原始神经外胚层肿瘤、前列腺癌、腹膜假粘液瘤、直肠癌、肾细胞癌、涉及15号染色体上的NUT基因的呼吸道癌、视网膜母细胞瘤、横纹肌瘤、横纹肌肉瘤、Richter转化、骶尾部畸胎瘤、唾液腺癌、肉瘤、神经鞘瘤病(Schwannomatosis)、皮脂腺癌、继发性肿瘤、精原细胞瘤、浆液性肿瘤、Sertoli-Leydig细胞瘤、性索间质瘤、塞扎里综合征、印戒细胞癌、皮肤癌、小蓝圆细胞肿瘤、小细胞癌、小细胞肺癌、小细胞淋巴瘤、小肠癌、软组织肉瘤、生长抑素瘤、煤烟疣、脊髓瘤、脊髓肿瘤、脾边缘区淋巴瘤、鳞状细胞癌、胃癌、浅表扩散性黑色素瘤、幕上原始神经外胚层肿瘤、表面上皮间质瘤、滑膜肉瘤、T细胞急性淋巴母细胞白血病、T细胞大颗粒淋巴细胞白血病、T细胞白血病、T细胞淋巴瘤、T细胞幼淋巴细胞白血病、畸胎瘤、晚期淋巴癌、睾丸癌、卵泡膜细胞瘤、喉癌、胸腺癌、胸腺瘤、甲状腺癌、肾盂和输尿管移行细胞癌、移行细胞癌、脐尿管癌、尿道癌、泌尿生殖系统肿瘤、子宫肉瘤、葡萄膜黑色素瘤、阴道癌、弗纳-莫里森综合征、疣状癌、视通路胶质瘤、外阴癌、瓦尔登斯特伦(Waldenstrom)巨球蛋白血症、沃辛(Warthin)瘤、维尔姆斯(Wilms)瘤及其组合。在一些实施方案中，靶向的癌细胞代表癌细胞群体内的亚群，如癌症干细胞。在一些实施方案中，所述癌症是造血谱系的癌症，如淋巴瘤。所述抗原可以是肿瘤相关抗原。

在一些实施方案中，靶细胞形成肿瘤。用本文的方法治疗的肿瘤可导致稳定的肿瘤生长(例如，一个或多个肿瘤的大小增加不超过1％、5％、10％、15％或20％，并且/或者不转移)。在一些实施方案中，肿瘤稳定至少约1、2、3、4、5、6、7、8、9、10、11、12周或更多周。在一些实施方案中，肿瘤稳定至少约1、2、3、4、5、6、7、8、9、10、11、12个月或更多个月。在一些实施方案中，肿瘤稳定至少约1、2、3、4、5、6、7、8、9、10年或更多年。在一些实施方案中，肿瘤的大小或肿瘤细胞的数目减少至少约5％、10％、15％、20％、25、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多。在一些实施方案中，肿瘤被完全消除，或减少到检测水平以下。在一些实施方案中，受试者在治疗后保持无肿瘤(例如处于缓解期)至少约1、2、3、4、5、6、7、8、9、10、11、12周或更多周。在一些实施方案中，受试者在治疗后保持无肿瘤至少约1、2、3、4、5、6、7、8、9、10、11、12个月或更多个月。在一些实施方案中，受试者在治疗后保持无肿瘤至少约1、2、3、4、5、6、7、8、9、10年或更多年。

靶细胞的死亡可以通过任何合适的方法来确定，包括但不限于在处理之前和之后对细胞进行计数，或者测量与活细胞或死细胞(例如活靶细胞或死靶细胞)相关的标志物的水平。细胞死亡的程度可以通过任何合适的方法来确定。在一些实施方案中，相对于起始条件确定细胞死亡的程度。例如，个体可以具有靶细胞的已知起始量，如已知大小的起始细胞团或以已知浓度循环靶细胞。在这样的情况下，细胞死亡的程度可以被表示为处理后存活细胞与起始细胞群体的比例。在一些实施方案中，可以通过合适的细胞死亡测定确定细胞死亡的程度。多种细胞死亡测定是可获得的，并且可以利用多种检测方法。检测方法的实例包括但不限于使用细胞染色、显微镜检查、流式细胞术、细胞分选及其组合。

当在治疗期结束后对肿瘤进行手术切除时，可以通过测量切除的坏死组织(即死亡组织)的百分比来确定在减小肿瘤大小方面的治疗效果。在一些实施方案中，如果切除的组织的坏死百分比大于约20％(例如，至少约30％、40％、50％、60％、70％、80％、90％或100％)，则治疗是治疗有效的。在一些实施方案中，切除的组织的坏死百分比为100％，即，不存在或检测不到活的肿瘤组织。

将靶细胞暴露于本文公开的免疫细胞或免疫细胞群体可以在体外或体内进行。将靶细胞暴露于免疫细胞或免疫细胞群体通常是指使靶细胞与免疫细胞接触和/或足够接近，以使靶细胞的抗原(例如，膜结合的或非膜结合的)可以与在免疫细胞中表达的嵌合跨膜受体多肽的配体相互作用域结合。通过将靶细胞和免疫细胞共培养，可以在体外将靶细胞暴露于免疫细胞或免疫细胞群体。靶细胞和免疫细胞可以共培养，例如，作为贴壁细胞或悬浮培养。靶细胞和免疫细胞可以在各种合适类型的细胞培养基中共培养，例如含有补充剂、生长因子、离子等。在一些情况下，可以通过将免疫细胞施用于受试者(例如人类受试者)并允许免疫细胞经由循环系统定位于靶细胞，而实现在体内将靶细胞暴露于免疫细胞或免疫细胞群体。在一些情况下，例如通过直接注射，可以将免疫细胞递送至靶细胞所定位的直接区域。

暴露可以进行任何合适的时间长度，例如至少1分钟、至少5分钟、至少10分钟、至少30分钟、至少1小时、至少2小时、至少3小时、至少4小时、至少5小时、至少6小时、至少7小时、至少8小时、至少12小时、至少16小时、至少20小时、至少24小时、至少2天、至少3天、至少4天、至少5天、至少6天、至少1周、至少2周、至少3周、至少1个月或更长时间。

在一些实施方案中，表达本文提供的系统的细胞在体外细胞死亡测定中诱导靶细胞的死亡。与不表达本公开的系统的对照细胞相比，表达本文提供的系统的细胞可表现出增强的诱导靶细胞死亡的能力。在一些情况下，诱导靶细胞死亡的增强的能力至少是诱导的细胞死亡增加到1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.5倍、3.0倍、3.5倍、4.0倍、5倍、10倍、100倍或1000倍。可以在任何合适的时间点确定诱导的细胞死亡的程度，例如，在细胞与靶细胞接触后至少4小时、6小时、8小时、12小时、16小时、24小时、36小时、48小时或52小时。

在本文各方面的各个实施方案中，在同一细胞中同时使用多个致动部分。在一些实施方案中，包含Cas蛋白的致动部分可以与包含锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、RNA结合蛋白(RBP)、CRISPR相关RNA结合蛋白、重组酶、翻转酶、转座酶或Argonaute蛋白的第二致动部分同时使用。在一些实施方案中，包含ZFN的致动部分可以与包含Cas蛋白、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、RNA结合蛋白(RBP)、CRISPR相关RNA结合蛋白、重组酶、翻转酶、转座酶或Argonaute蛋白的第二致动部分同时使用。在一些实施方案中，包含TALEN的致动部分可以与包含Cas蛋白、锌指核酸酶(ZFN)、大范围核酸酶、RNA结合蛋白(RBP)、CRISPR相关RNA结合蛋白、重组酶、翻转酶、转座酶或Argonaute蛋白的第二致动部分同时使用。在一些实施方案中，包含大范围核酸酶的致动部分可以与包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、RNA结合蛋白(RBP)、CRISPR相关RNA结合蛋白、重组酶、翻转酶、转座酶或Argonaute蛋白的第二致动部分同时使用。在一些实施方案中，包含RNA结合蛋白(RBP)的致动部分可以与包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、CRISPR相关RNA结合蛋白、重组酶、翻转酶、转座酶或Argonaute蛋白的第二致动部分同时使用。在一些实施方案中，包含CRISPR相关RNA结合蛋白的致动部分可以与包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、RNA结合蛋白(RBP)、重组酶、翻转酶、转座酶或Argonaute蛋白的第二致动部分同时使用。在一些实施方案中，包含重组酶的致动部分可以与包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、RNA结合蛋白(RBP)、CRISPR相关RNA结合蛋白、翻转酶、转座酶或Argonaute蛋白的第二致动部分同时使用。在一些实施方案中，包含翻转酶的致动部分可以与包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、RNA结合蛋白(RBP)、CRISPR相关RNA结合蛋白、重组酶、转座酶或Argonaute蛋白的第二致动部分同时使用。在一些实施方案中，包含转座酶的致动部分可以与包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、RNA结合蛋白(RBP)、CRISPR相关RNA结合蛋白、重组酶、翻转酶或Argonaute蛋白的第二致动部分同时使用。在一些实施方案中，包含Argonaute蛋白的致动部分可以与包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、RNA结合蛋白(RBP)、CRISPR相关RNA结合蛋白、重组酶、翻转酶或转座酶的第二致动部分同时使用。

在一些实施方案中，在同一细胞中同时使用多个致动部分，以同时调节相同靶DNA或不同靶DNA上不同位置处的转录。在一些实施方案中，致动部分包含Cas核酸酶。多个CRISPR/Cas复合物可以使用具有多个指导核酸的单一来源或类型的Cas蛋白来靶向不同的核酸。或者，多个CRISPR/Cas复合物可以使用直向同源Cas蛋白(例如，来自不同生物体如酿脓链球菌、金黄色葡萄球菌、嗜热链球菌、无害李斯特菌、脑膜炎奈瑟氏菌(N.meningitides)的死亡Cas9蛋白)来靶向多个核酸。

在一些实施方案中，使用多个致动部分调节至少两个靶多核苷酸的表达和/或活性或者编辑至少两个靶多核苷酸的核酸序列。所述至少两个靶多核苷酸可包含相同或不同的基因或基因产物。在一些实施方案中，至少两种细胞因子的表达被上调、下调或其组合。在一些实施方案中，至少两种免疫调节蛋白的表达被上调、下调或其组合。在一些实施方案中，细胞因子和免疫调节蛋白的表达被改变。例如，细胞因子和免疫调节蛋白的表达均增加。细胞因子和免疫调节蛋白的表达均可降低。细胞因子的表达可以增加，而免疫调节蛋白的表达可以降低，反之亦然。

在一些实施方案中，内源基因和外源基因的表达被改变。例如，除了改变包含另外的嵌合受体的外源基因的表达之外，还可以改变内源基因如细胞因子或免疫调节蛋白的表达。可以以任何所需的多种组合多路进行对本文讨论的靶多核苷酸表达的调节。

在一些实施方案中，可以在同一细胞中同时使用多个指导核酸，以同时调节相同靶DNA或不同靶DNA上不同位置处的转录。在一些实施方案中，两个或更多个指导核酸靶向相同的基因或转录物或基因座。在一些实施方案中，两个或更多个指导核酸靶向不同的不相关基因座。在一些实施方案中，两个或更多个指导核酸靶向不同但相关的基因座。

所述两个或更多个指导核酸可以同时存在于同一表达载体上。所述两个或更多个指导核酸可以在相同的转录控制下。在一些实施方案中，两个或更多个(例如，3个或更多个，4个或更多个，5个或更多个，10个或更多个，15个或更多个，20个或更多个，25个或更多个，30个或更多个，35个或更多个，40个或更多个，45个或更多个，或50个或更多个)指导核酸在靶细胞中(从相同或不同的载体)同时表达。死亡Cas蛋白(例如，来自诸如酿脓链球菌、金黄色葡萄球菌、嗜热链球菌、无害李斯特菌和脑膜炎奈瑟氏菌等不同细菌的dCas9蛋白)可以不同地识别表达的指导核酸。

为了表达多个指导核酸，可以采用由内切核酸酶介导的人工指导核酸加工系统(例如，Csy4内切核糖核酸酶可以用于加工指导RNA)。例如，多个指导RNA可以在前体转录物(例如，从U6启动子表达)上串联成串联阵列，并被Csy4特异性RNA序列隔开。共表达的Csy4蛋白可以将前体转录物切割成多个指导RNA。由于所有指导RNA均从前体转录物加工，因此对于相似的dCas9结合可以对其浓度进行归一化。

可与本公开的方法和组合物一起使用的启动子包括例如在真核细胞、哺乳动物细胞、非人哺乳动物细胞或人细胞中有活性的启动子。启动子可以是诱导型或组成型活性启动子。备选地或另外地，启动子可以是组织或细胞特异性的。启动子可以是天然启动子或复合启动子。

合适的真核启动子(即在真核细胞中有功能的启动子)的非限制性实例可包括来自以下的启动子：巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶、早期和晚期SV40、来自逆转录病毒的长末端重复序列(LTR)、人延伸因子1启动子(EF1)、泛素B启动子(UB)、包含与鸡β活性启动子(CAG)的融合的巨细胞病毒(CMV)增强子的杂合构建体、鼠干细胞病毒启动子(MSCV)、磷酸甘油酸激酶1基因座启动子(PGK)和小鼠金属硫蛋白-I。该启动子可以是细胞、组织或肿瘤特异性的，如CD45启动子、AFP启动子、人白蛋白启动子(Alb)、MUC1启动子、COX2启动子。该启动子可以是真菌启动子。该启动子可以是植物启动子。可以找到植物启动子的数据库(例如，PlantProm)。表达载体还可以含有用于翻译起始的核糖体结合位点和转录终止子。表达载体还可包括用于扩增表达的合适序列。

在一些实施方案中，靶多核苷酸可包括一个或多个疾病相关的基因和多核苷酸，以及与信号传导生化途径相关的基因和多核苷酸。靶多核苷酸的实例包括信号传导生化途径相关的序列，例如，信号传导生化途径相关的基因或多核苷酸。靶多核苷酸的实例包括疾病相关的基因或多核苷酸。“疾病相关的”基因或多核苷酸是指与非疾病对照的组织或细胞相比，在衍生自受疾病影响的组织的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因或多核苷酸。在一些实施方案中，其为变得以异常高水平表达的基因。在一些实施方案中，其为变得以异常低水平表达的基因。改变的表达可以与疾病的发生和/或进展相关。疾病相关的基因还指具有突变或遗传变异的基因，其对疾病的病因负有直接责任或与对疾病的病因有反应的基因连锁不平衡。转录或翻译的产物可能是已知的或未知的，并且可处于正常或异常水平。

疾病相关的基因和多核苷酸的实例可获自可在万维网上获得的约翰霍普金斯大学的McKusick-Nathans遗传医学研究所(Baltimore,Md.)和国家医学图书馆的国家生物技术信息中心(Bethesda,Md.)。表4和表5提供了与某些疾病和病症相关的示例性基因。信号传导生化途径相关基因和多核苷酸的实例在表6中列出。

这些基因和途径中的突变可导致产生影响功能的不适当的蛋白质或不适当量的蛋白质。

表4

表5

表6

本文各方面的各个实施方案的靶多核苷酸可以是DNA或RNA(例如，mRNA)。靶多核苷酸可以是单链或双链的。靶多核苷酸可以是基因组DNA。靶多核苷酸可以是细胞内源或外源的任何多核苷酸。例如，靶多核苷酸可以是驻留在真核细胞的细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例如，蛋白质)的序列或非编码序列(例如，调节性多核苷酸)。

靶多核苷酸序列可包含靶核酸或长度为20个核苷酸的前间隔区序列(即，被指导核酸的间隔区识别的序列)。前间隔区的长度可以小于20个核苷酸。前间隔区的长度可以是至少5、10、15、16、17、18、19、20、21、22、23、24、25、30或更多个核苷酸。前间隔区序列的长度可以是至多5、10、15、16、17、18、19、20、21、22、23、24、25、30或更多个核苷酸。前间隔区序列可以是PAM的第一个核苷酸的5’紧邻的16、17、18、19、20、21、22或23个碱基。前间隔区序列可以是PAM序列的最后一个核苷酸的3’紧邻的16、17、18、19、20、21、22或23个碱基。前间隔区序列可以是PAM序列的第一个核苷酸的5’紧邻的20个碱基。前间隔区序列可以是PAM的最后一个核苷酸的3’紧邻的20个碱基。靶核酸序列可以在PAM的5’或3’。

前间隔区序列可包括存在于靶多核苷酸中的核酸序列，指导核酸的核酸靶向区段可以与之结合。例如，前间隔区序列可包括指导核酸被设计成与其具有互补性的序列。前间隔区序列可包含任何多核苷酸，其可以位于例如细胞的细胞核或细胞质中或者细胞的细胞器如线粒体或叶绿体内。前间隔区序列可包括Cas蛋白的切割位点。前间隔区序列可以与Cas蛋白的切割位点相邻。

Cas蛋白可以在指导核酸的核酸靶向序列可以与之结合的序列内部或外部的位点与靶多核苷酸结合。结合位点可包括Cas蛋白可产生单链断裂或双链断裂的核酸的位置。

Cas蛋白对靶核酸的位点特异性结合可发生在由指导核酸与靶核酸之间的碱基配对互补性所确定的位置。Cas蛋白对靶核酸的位点特异性结合可以发生在靶核酸中由称为前间隔区邻近基序(PAM)的短基序所确定的位置。PAM可以在前间隔区的侧翼，例如在前间隔区序列的3’端。例如，Cas9的结合位点可以是PAM序列上游或下游的约1至约25、或约2至约5、或约19至约23个碱基对(例如，3个碱基对)。Cas(例如，Cas9)的结合位点可以是PAM序列上游的3个碱基对。Cas(例如Cpf1)的结合位点可以是(+)链上的19个碱基和(-)链上的23个碱基。

不同的生物体可包含不同的PAM序列。不同的Cas蛋白可以识别不同的PAM序列。例如，在酿脓链球菌中，PAM可包含序列5’-XRR-3’，其中R可以是A或G，其中X是任何核苷酸，并且X在由间隔区序列靶向的靶核酸序列的紧邻的3’。酿脓链球菌Cas9(SpyCas9)的PAM序列可以是5’-XGG-3’，其中X是任何DNA核苷酸，并且在靶DNA非互补链的前间隔区序列的紧邻的3’。Cpf1的PAM可以是5’-TTX-3’，其中X是任何DNA核苷酸，并且在CRISPR识别序列的紧邻的5’。

指导核酸的靶序列可以通过生物信息学方法来鉴别，例如，将靶序列内的序列定位在与PAM序列相邻的位置。可以通过实验方法来鉴别用于指导核酸的最佳靶序列，例如，测试许多指导核酸序列以鉴别具有最高中靶活性和最低脱靶活性的序列。靶序列的位置可以通过期望的实验结果来确定。例如，靶前间隔区可位于启动子中以激活或抑制靶基因。靶前间隔区可以在编码序列内，诸如5’组成型表达的外显子或编码已知域的序列内。靶前间隔区可以是基因组内的唯一序列，以减轻脱靶效应。用于确定和排序潜在靶前间隔区的许多可公开获得的算法是本领域已知的，并且可以使用。

在一些方面，本文公开的系统可以调节与遗传性疾病或医学状况相关的至少一种基因的表达。国立卫生研究院网站上在Genetic Disorders主题小节(网址为health.nih.gov/topic/GeneticDisorders)下进一步介绍了多种遗传性疾病。

显然，可以设想本发明系统可以用来靶向任何目的多核苷酸序列。然而，示例的基因不是穷举的。

在本文各方面的各个实施方案中，本发明系统可以用于选择性地调节宿主细胞(例如，免疫细胞)中靶核酸的转录(例如，减少或增加)。靶核酸转录的选择性调节可以减少或增加靶核酸的转录，但是可以基本上不调节非靶核酸或脱靶核酸的转录，例如，与在缺少致动部分(如指导核酸/无酶促活性的或酶促减弱的Cas蛋白复合物)时非靶核酸的转录水平相比，非靶核酸的转录可以受到小于1％、小于5％、小于10％、小于20％、小于30％、小于40％或小于50％的调节。例如，与在缺少致动部分(如指导核酸/无酶促活性的或酶促减弱的Cas蛋白复合物)时靶核酸的转录水平相比，靶核酸转录的选择性调节(例如，减少或增加)可以使靶核酸的转录减少或增加至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％或大于90％。

在一些实施方案中，本公开提供了用于增加靶核酸的转录的方法。与在缺少致动部分(如指导核酸/无酶促活性的或酶促减弱的Cas蛋白复合物)时靶DNA的转录水平相比，靶核酸的转录可以增加至少约1.1倍、至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约2.5倍、至少约3倍、至少约3.5倍、至少约4倍、至少约4.5倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约12倍、至少约15倍、至少约20倍、至少约50倍、至少约70倍或至少约100倍。靶核酸转录的选择性增加会增加靶核酸的转录，但可能不会实质上增加非靶DNA的转录，例如，与在缺少致动部分(如指导核酸/无酶促活性的或酶促减弱的Cas蛋白复合物)时非靶DNA的转录水平相比，非靶核酸的转录增加(若存在)小于约5倍、小于约4倍、小于约3倍、小于约2倍、小于约1.8倍、小于约1.6倍、小于约1.4倍、小于约1.2倍或小于约1.1倍。

在一些实施方案中，本公开提供了用于减少靶核酸的转录的方法。与在缺少致动部分(如指导核酸/无酶促活性的或酶促减弱的Cas蛋白复合物)时靶DNA的转录水平相比，靶核酸的转录可以减少至少约1.1倍、至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约2.5倍、至少约3倍、至少约3.5倍、至少约4倍、至少约4.5倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约12倍、至少约15倍、至少约20倍、至少约50倍、至少约70倍或至少约100倍。靶核酸转录的选择性减少会减少靶核酸的转录，但可能不会实质上减少非靶DNA的转录，例如，与在缺少致动部分(如指导核酸/无酶促活性的或酶促减弱的Cas蛋白复合物)时非靶DNA的转录水平相比，非靶核酸的转录减少(若存在)小于约5倍、小于约4倍、小于约3倍、小于约2倍、小于约1.8倍、小于约1.6倍、小于约1.4倍、小于约1.2倍或小于约1.1倍。

转录调节可以通过将致动部分(如无酶促活性的Cas蛋白)与异源功能域融合来实现。异源功能域可以是合适的融合配偶体，例如，通过直接作用于靶核酸或与靶核酸相关的多肽(例如，组蛋白或其他DNA结合蛋白)而提供间接增加、减少或以其他方式调节转录的活性的多肽。合适的融合配偶体的非限制性实例包括提供甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性或脱豆蔻酰化活性的多肽。

合适的融合配偶体可包括直接提供靶核酸增加的转录的多肽。例如，转录激活物或其片段、募集转录激活物的蛋白质或其片段或者小分子/药物反应性转录调节因子。合适的融合配偶体可包括直接提供靶核酸减少的转录的多肽。例如，转录阻抑物或其片段，募集转录阻抑物的蛋白质或其片段或者小分子/药物反应性转录调节因子。

异源功能域或融合配偶体可以与致动部分的C末端、N末端或内部部分(即除N末端或C末端之外的部分)融合，例如死亡Cas蛋白。融合配偶体的非限制性实例包括转录激活物、转录阻抑物、组蛋白赖氨酸甲基转移酶(KMT)、组蛋白赖氨酸脱甲基化物、组蛋白赖氨酸乙酰转移酶(KAT)、组蛋白赖氨酸脱乙酰酶、DNA甲基化酶(腺苷或胞嘧啶修饰)、CTCF、外围募集元件(例如，核纤层蛋白A、核纤层蛋白B)和蛋白质停靠元件(例如，FKBP/FRB)。

转录激活物的非限制性实例包括GAL4、VP16、VP64、p65亚域(NFκB)、VP32、VPR和P65HSF1。

转录阻抑物的非限制性实例包括Kruippel相关盒(KRAB或SKD)、Mad mSIN3相互作用域(SID)和ERF阻抑域(ERD)。

组蛋白赖氨酸甲基转移酶(KMT)的非限制性实例包括来自KMT1家族(例如，SUV39H1、SUV39H2、G9A、ESET/SETDB1、Clr4、Su(var)3-9)、KMT2家族成员(例如，hSET1A、hSET1B、MLL 1至5、ASH1和同系物(Trx、Trr、Ash1))、KMT3家族(SYMD2、NSD1)、KMT4(DOT1L和同系物)、KMT5家族(Pr-SET7/8、SUV4-20H1和同系物)、KMT6(EZH2)和KMT8(例如，RIZ1)的成员。

组蛋白赖氨酸脱甲基化物(KDM)的非限制性实例包括来自KDM1家族(LSD1/BHC110、Splsd1/Swm1/Saf11 0、Su(var)3-3)、KDM3家族(JHDM2a/b)、KDM4家族(JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D和同系物(Rph1))、KDM5家族(JARID1A/RBP2、JARID1B/PLU-1、JARIDIC/SMCX、JARID1D/SMCY和同系物(Lid、Jhn2、Jmj2))和KDM6家族(例如，UTX、JMJD3)的成员。

KAT的非限制性实例包括KAT2家族(hGCN5、PCAF和同系物(dGCN5/PCAF、Gcn5)、KAT3家族(CBP、p300和同系物(dCBP/NEJ))、KAT4、KAT5、KAT6、KAT7、KAT8和KAT13的成员。

在一些实施方案中，包含死亡Cas蛋白或死亡Cas融合蛋白的致动部分被指导核酸靶向至靶核酸中的特定位置(即序列)，并发挥位点特异性调节，诸如阻断RNA聚合酶与启动子结合(例如，可以选择性地抑制转录激活物功能)，和/或修饰局部染色质状态(例如，当使用可以修饰靶核酸或修饰与靶核酸相关的多肽的融合序列时)。在一些情况下，这些变化是暂时的(例如，转录抑制或激活)。在一些情况下，这些变化是可遗传的(例如，当对靶DNA或与靶DNA相关的蛋白质例如核小体组蛋白进行表观遗传修饰时)。

在一些实施方案中，指导核酸可包含蛋白结合区段以将异源多肽募集至靶核酸以调节靶核酸的转录。异源多肽的非限制性实例包括提供甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性或脱豆蔻酰化活性的多肽。指导核酸可包含蛋白结合区段以募集转录激活物、转录阻抑物或其片段。

在一些实施方案中，通过使用被设计为靶向靶核酸的调节元件(例如，转录应答元件(例如，启动子、增强子)、上游激活序列(UAS)和/或疑能够控制靶DNA的表达的功能未知或已知的序列)的指导核酸来实现基因表达调节。

在本文各方面的各个实施方案中，本公开提供了指导核酸。指导核酸(例如，指导RNA)可以与Cas蛋白结合并将Cas蛋白靶向至靶多核苷酸内的特定位置。指导核酸可包含核酸靶向区段和Cas蛋白结合区段。

指导核酸可指可与另一核酸例如细胞基因组中的靶多核苷酸杂交的核酸。指导核酸可以是RNA，例如，指导RNA。指导核酸可以是DNA。指导核酸可包含DNA和RNA。指导核酸可以是单链的。指导核酸可以是双链的。指导核酸可包含核苷酸类似物。指导核酸可包含修饰的核苷酸。指导核酸可以被编程或设计用于位点特异性地与核酸序列结合。

指导核酸可包含一个或多个修饰，以向核酸提供新的或增强的特征。指导核酸可包含核酸亲和标签。指导核酸可包含合成核苷酸、合成核苷酸类似物、核苷酸衍生物和/或修饰的核苷酸。

指导核酸可以在例如5’端或3’端或处附近包含与靶多核苷酸中的前间隔区序列互补的核酸靶向区域(例如，间隔区)。指导核酸的间隔区可以通过杂交(即碱基配对)以序列特异性方式与前间隔区相互作用。前间隔区序列可以位于靶多核苷酸中的前间隔区邻近基序(PAM)的5’或3’。间隔区的核苷酸序列可以有所变化，并决定了指导核酸可以与之相互作用的靶核酸中的位置。指导核酸的间隔区可以被设计或修饰用于与靶核酸内的任何期望的序列杂交。

指导核酸可包含两个分开的核酸分子，其可以被称为双指导核酸。指导核酸可包含单个核酸分子，其可以被称为单指导核酸(例如，sgRNA)。在一些实施方案中，指导核酸是包含融合的CRISPR RNA(crRNA)和反式激活crRNA(tracrRNA)的单指导核酸。在一些实施方案中，指导核酸是包含crRNA的单指导核酸。在一些实施方案中，指导核酸是包含crRNA但缺乏tracrRNA的单指导核酸。在一些实施方案中，指导核酸是包含非融合的crRNA和tracrRNA的双指导核酸。示例性的双指导核酸可包含crRNA样分子和tracrRNA样分子。示例性的单指导核酸可包含crRNA样分子。示例性的单指导核酸可包含融合的crRNA样和tracrRNA样分子。

crRNA可包含指导核酸的核酸靶向区段(例如，间隔区)和一段核苷酸，其可形成指导核酸的Cas蛋白结合区段的双链的双链体的一半。

tracrRNA可包含一段核苷酸，其形成gRNA的Cas蛋白结合区段的双链的双链体的另一半。crRNA的一段核苷酸可以与tracrRNA的一段核苷酸互补并杂交，以形成指导核酸的Cas蛋白结合域的双链的双链体。

crRNA和tracrRNA可以杂交以形成指导核酸。crRNA还可以提供与靶核酸识别序列(例如，前间隔区)杂交的单链核酸靶向区段(例如，间隔区)。可以将包括间隔区的crRNA的序列或tracrRNA分子设计为对要将指导核酸用于其中的物种具有特异性。

在一些实施方案中，指导核酸的核酸靶向区域的长度可以在18至72个核苷酸之间。指导核酸的核酸靶向区域(例如，间隔区)可具有约12个核苷酸至约100个核苷酸的长度。例如，指导核酸的核酸靶向区域(例如，间隔区)可具有约12个核苷酸(nt)至约80nt、约12nt至约50nt、约12nt至约40nt、约12nt至约30nt、约12nt至约25nt、约12nt至约20nt、约12nt至约19nt、约12nt至约18nt、约12nt至约17nt、约12nt至约16nt或约12nt至约15nt的长度。或者，DNA靶向区段可具有约18nt至约20nt、约18nt至约25nt、约18nt至约30nt、约18nt至约35nt、约18nt至约40nt、约18nt至约45nt、约18nt至约50nt、约18nt至约60nt、约18nt至约70nt、约18nt至约80nt、约18nt至约90nt、约18nt至约100nt、约20nt至约25nt、约20nt至约30nt、约20nt至约35nt、约20nt至约40nt、约20nt至约45nt、约20nt至约50nt、约20nt至约60nt、约20nt至约70nt、约20nt至约80nt、约20nt至约90nt或约20nt至约100nt的长度。核酸靶向区域的长度可以是至少5、10、15、16、17、18、19、20、21、22、23、24、25、30个或更多个核苷酸。核酸靶向区域(例如，间隔区序列)的长度可以是至多5、10、15、16、17、18、19、20、21、22、23、24、25、30个或更多个核苷酸。

在一些实施方案中，指导核酸的核酸靶向区域(例如，间隔区)的长度是20个核苷酸。在一些实施方案中，指导核酸的核酸靶向区域的长度是19个核苷酸。在一些实施方案中，指导核酸的核酸靶向区域的长度是18个核苷酸。在一些实施方案中，指导核酸的核酸靶向区域的长度是17个核苷酸。在一些实施方案中，指导核酸的核酸靶向区域的长度是16个核苷酸。在一些实施方案中，指导核酸的核酸靶向区域的长度是21个核苷酸。在一些实施方案中，指导核酸的核酸靶向区域的长度是22个核苷酸。

与靶核酸的核苷酸序列(靶序列)互补的指导核酸的核苷酸序列可具有例如至少约12nt、至少约15nt、至少约18nt、至少约19nt、至少约20nt、至少约25nt、至少约30nt、至少约35nt或至少约40nt的长度。与靶核酸的核苷酸序列(靶序列)互补的指导核酸的核苷酸序列可具有约12个核苷酸(nt)至约80nt、约12nt至约50nt、约12nt至约45nt、约12nt至约40nt、约12nt至约35nt、约12nt至约30nt、约12nt至约25nt、约12nt至约20nt、约12nt至约19nt、约19nt至约20nt、约19nt至约25nt、约19nt至约30nt、约19nt至约35nt、约19nt至约40nt、约19nt至约45nt、约19nt至约50nt、约19nt至约60nt、约20nt至约25nt、约20nt至约30nt、约20nt至约35nt、约20nt至约40nt、约20nt至约45nt、约20nt至约50nt、或约20nt至约60nt的长度。

可以通过鉴别感兴趣的区域内的PAM并选择PAM上游或下游期望大小的区域作为前间隔区来鉴别前间隔区序列。可以通过确定前间隔区区域的互补序列来设计相对应的间隔区序列。

间隔区序列可以使用计算机程序(例如，机器可读代码)来鉴别。所述计算机程序可以使用这样的变量，诸如预测的熔解温度、二级结构形成和预测的退火温度、序列同一性、基因组背景、染色质可及性、％GC、基因组出现的频率、甲基化状态、SNP的存在等。

核酸靶向序列(例如，间隔区序列)与靶核酸(例如，前间隔区)之间的互补性百分比可以为至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少98％、至少99％或100％。在约20个连续核苷酸上，核酸靶向序列与靶核酸之间的互补性百分比可以是至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少98％、至少99％或100％。

指导核酸的Cas蛋白结合区段可包含彼此互补的两段核苷酸(例如，crRNA和tracrRNA)。彼此互补的两段核苷酸(例如，crRNA和tracrRNA)可以通过间插核苷酸(例如，在单指导核酸的情况下为连接体)共价连接。彼此互补的两段核苷酸(例如，crRNA和tracrRNA)可以杂交以形成双链RNA双链体或Cas蛋白结合区段的发夹，从而产生茎环结构。crRNA与tracrRNA可以通过crRNA的3’端和tracrRNA的5’端共价连接。或者，tracrRNA和crRNA可以通过tracrRNA的5’端和crRNA的3’端共价连接。

指导核酸的Cas蛋白结合区段可具有约10个核苷酸至约100个核苷酸的长度，例如，约10个核苷酸(nt)至约20nt、约20nt至约30nt、约30nt至约40nt、约40nt至约50nt、约50nt至约60nt、约60nt至约70nt、约70nt至约80nt、约80nt至约90nt或约90nt至约100nt。例如，指导核酸的Cas蛋白结合区段可具有约15个核苷酸(nt)至约80nt、约15nt至约50nt、约15nt至约40nt、约15nt至约30nt或约15nt至约25nt的长度。

指导核酸的Cas蛋白结合区段的dsRNA双链体可具有约6个碱基对(bp)至约50bp的长度。例如，蛋白结合区段的dsRNA双链体可具有约6bp至约40bp、约6bp至约30bp、约6bp至约25bp、约6bp至约20bp、约6bp至约15bp、约8bp至约40bp、约8bp至约30bp、约8bp至约25bp、约8bp至约20bp或约8bp至约15bp的长度。例如，Cas蛋白结合区段的dsRNA双链体可具有约8bp至约10bp、约10bp至约15bp、约15bp至约18bp、约18bp至约20bp、约20bp至约25bp、约25bp至约30bp、约30bp至约35bp、约35bp至约40bp或约40bp至约50bp的长度。在一些实施方案中，Cas蛋白结合区段的dsRNA双链体可以具有36个碱基对的长度。杂交以形成蛋白质结合区段的dsRNA双链体的核苷酸序列之间的互补性百分比可以为至少约60％。例如，杂交以形成蛋白质结合区段的dsRNA双链体的核苷酸序列之间的互补性百分比可以为至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或至少约99％。在一些情况下，杂交以形成蛋白质结合区段的dsRNA双链体的核苷酸序列之间的互补性百分比为100％。

连接体(例如，在单指导核酸中连接crRNA与tracrRNA的连接体)可以具有约3个核苷酸至约100个核苷酸的长度。例如，连接体可具有约3个核苷酸(nt)至约90nt、约3个核苷酸(nt)至约80nt、约3个核苷酸(nt)至约70nt、约3个核苷酸(nt)至约60nt、约3个核苷酸(nt)至约50nt、约3个核苷酸(nt)至约40nt、约3个核苷酸(nt)至约30nt、约3个核苷酸(nt)至约20nt或约3个核苷酸(nt)至约10nt的长度。例如，连接体可具有约3nt至约5nt、约5nt至约10nt、约10nt至约15nt、约15nt至约20nt、约20nt至约25nt、约25nt至约30nt、约30nt至约35nt、约35nt至约40nt、约40nt至约50nt、约50nt至约60nt、约60nt至约70nt、约70nt至约80nt、约80nt至约90nt、或约90nt至约100nt的长度。在一些实施方案中，DNA靶向性RNA的连接体是4nt。

指导核酸可包括提供其他期望的特征(例如，修饰或调节的稳定性；亚细胞靶向；用荧光标记追踪；蛋白或蛋白复合物的结合位点；等等)的修饰或序列。此类修饰的实例包括例如5’帽(例如，7-甲基鸟苷酸帽(m7G))；3’聚腺苷酸化尾巴(即3’多聚(A)尾巴)；核糖开关序列(例如，以允许蛋白质和/或蛋白质复合物的调节的稳定性和/或调节的可及性)；稳定性控制序列；形成dsRNA双链体(即发夹)的序列)；将RNA靶向到亚细胞位置的修饰或序列(例如，核、线粒体、叶绿体等)；提供追踪的修饰或序列(例如，与荧光分子直接缀合、与促进荧光检测的部分缀合、允许荧光检测的序列等)；提供蛋白质(例如，作用于DNA的蛋白质，包括转录激活物、转录阻抑物、DNA甲基转移酶、DNA脱甲基酶、组蛋白乙酰转移酶、组蛋白脱乙酰酶及其组合)的结合位点的修饰或序列。

指导核酸可包含一个或多个修饰(例如，碱基修饰、骨架修饰)，以提供具有新的或增强的特征(例如，改善的稳定性)的核酸。指导核酸可包含核酸亲和标签。核苷可以是碱基-糖的组合。核苷的碱基部分可以是杂环碱基。这种杂环碱基的最常见的两个类别是嘌呤和嘧啶。核苷酸可以是进一步包括与核苷的糖部分共价连接的磷酸基团的核苷。对于包括戊呋喃糖基糖的那些核苷，磷酸基团可以与糖的2’、3’或5’羟基部分连接。在形成指导核酸时，磷酸基团可以将相邻的核苷彼此共价连接以形成线性聚合化合物。进而，该线性聚合化合物的各个末端可以进一步连接以形成环状化合物；然而，线性化合物通常是合适的。另外，线性化合物可以具有内部核苷酸碱基互补性，因此可以以产生完全或部分双链化合物的方式折叠。在指导核酸内，磷酸基团通常可被称为形成指导核酸的核苷间骨架。指导核酸的键或骨架可以是3’至5’磷酸二酯键。

指导核酸可包含修饰的骨架和/或修饰的核苷间键。修饰的骨架可包括在骨架中保留磷原子的那些和在骨架中不具有磷原子的那些。

在其中含有磷原子的合适的修饰的指导核酸骨架可包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(如3’-亚烷基膦酸酯、5’-亚烷基膦酸酯)、手性膦酸酯、次膦酸酯氨基磷酸酯(包括3’-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、二氨基磷酸酯、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基磷酸三酯、硒磷酸酯和硼烷磷酸酯，其具有正常的3’-5’键，2’-5’连接的类似物，以及其中一个或多个核苷酸间键是3’至3’、5’至5’或2’至2’键的具有反向极性的那些。合适的具有反向极性的指导核酸可以在最3’的核苷酸间键处包含单个3’至3’键(即其中核碱基缺失或具有代替其的羟基集团的单个反向核苷残基)。还可包括各种盐(例如，氯化钾或氯化钠)、混合盐和游离酸形式。

指导核酸可包含一个或多个硫代磷酸酯和/或杂原子核苷间键、特别是-CH2-NH-O-CH2-、-CH2-N(CH3)-O-CH2-(即亚甲基(甲基亚氨基)或称MMI骨架)、-CH2-O-N(CH3)-CH2-、-CH2-N(CH3)-N(CH3)-CH2-和-O-N(CH3)-CH2-CH2-(其中天然磷酸二酯核苷酸间键表示为-O-P(＝O)(OH)-O-CH2-)。

指导核酸可包含吗啉代骨架结构。例如，核酸可包含6元吗啉代环来代替核糖环。在这些实施方案的一些中，二氨基磷酸酯或其他非磷酸二酯核苷间键取代了磷酸二酯键。

指导核酸可包含由短链烷基或环烷基核苷间键、混合的杂原子和烷基或环烷基核苷间键、或者一个或多个短链杂原子或杂环核苷间键形成的多核苷酸骨架。这些可包括具有吗啉代键(部分由核苷的糖部分形成)；硅氧烷骨架；硫化物、亚砜和砜骨架；甲酰基和硫代甲酰基骨架；亚甲基甲酰基和硫代甲酰基骨架；核糖乙酰骨架；含烯烃骨架；氨基磺酸骨架；亚甲基亚氨基和亚甲基肼基骨架；磺酸和磺酰胺骨架；酰胺骨架；以及其他具有混合的N、O、S和CH2组分部分的那些。

指导核酸可包含核酸模拟物。术语“模拟物”可以旨在包括其中仅呋喃糖环或者呋喃糖环和核苷酸间键都被非呋喃糖基团取代的多核苷酸，仅呋喃糖环的取代也可以称为糖替代物。可以维持杂环碱基部分或修饰的杂环碱基部分，以与适当的靶核酸杂交。一种这样的核酸可以是肽核酸(PNA)。在PNA中，多核苷酸的糖骨架可以被含有酰胺的骨架，特别是氨基乙基甘氨酸骨架取代。核苷酸可以保留并且与骨架的酰胺部分的氮杂氮原子直接或间接地结合。PNA化合物中的骨架可包含两个或多个连接的氨基乙基甘氨酸单元，这给予了PNA含酰胺的骨架。杂环碱基部分可与骨架的酰胺部分的氮杂氮原子直接或间接地结合。

指导核酸可包含具有连接到吗啉代环上的杂环碱基的连接的吗啉代单元(即吗啉代核酸)。连接基团可以连接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化合物可与细胞蛋白具有更少的不期望的相互作用。基于吗啉代的多核苷酸可以是指导核酸的非离子模拟物。可以使用不同的连接基团连接吗啉代类别中的各种化合物。另一类多核苷酸模拟物可以被称为环己烯核酸(CeNA)。通常存在于核酸分子中的呋喃糖环可以被环己烯环取代。可以制备CeNA DMT保护的亚磷酰胺单体并将其用于使用亚磷酰胺化学方法的寡聚化合物合成。将CeNA单体并入核酸链可提高DNA/RNA杂交物的稳定性。CeNA寡腺苷酸可以与核酸补体形成复合物，其稳定性与天然复合物相似。进一步的修饰可包括锁定核酸(LNA)，其中2’-羟基基团与糖环的4’碳原子连接，从而形成2’-C,4’-C-氧亚甲基连接，从而形成双环糖部分。键可以是亚甲基(-CH2-)，即桥接2’氧原子和4’碳原子的基团，其中n为1或2。LNA和LNA类似物可以与互补核酸显示非常高的双链体热稳定性(Tm＝+3至+10℃)、对3’-核酸外切降解的稳定性和良好的溶解性性质。

指导核酸可包含一个或多个取代的糖部分。合适的多核苷酸可包含选自以下的糖取代基团：OH；F；O-、S-或N-烷基；O-、S-或N-烯基；O-、S-或N-炔基；或者O-烷基-O-烷基，其中烷基、烯基和炔基可以是取代或未取代的C1至C10烷基或者C2至C10烯基和炔基。特别合适的是O((CH2)nO)mCH3、O(CH2)nOCH3、O(CH2)nNH2、O(CH2)nCH3、O(CH2)nONH2和O(CH2)nON((CH2)nCH3)2，其中n和m为1至约10。糖取代基团可选自：C1至C10低级烷基、取代的低级烷基、烯基、炔基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改善指导核酸的药代动力学性质的基团，或用于改善指导核酸的药效学性质的基团，以及具有类似性质的其他取代基。合适的修饰可包括2’-甲氧基乙氧基(2’-O-CH2CH2OCH3，也称为2’-O-(2-甲氧基乙基)或2’-MOE，即烷氧基烷氧基基团)。其他合适的修饰可包括2’-二甲基氨基氧基乙氧基(即O(CH2)2ON(CH3)2基团，也称为2’-DMAOE)和2’-二甲基氨基乙氧基乙氧基(也称为2’-O-二甲基-氨基-乙氧基-乙基或2’-DMAEOE)，即2’-O-CH2-O-CH2-N(CH3)2。

其他合适的糖取代基基团可包括甲氧基(-O-CH3)、氨基丙氧基(-OCH2CH2CH2NH2)、烯丙基(-CH2-CH＝CH2)、-O-烯丙基(--O--CH2-CH＝CH2)和氟(F)。2’-糖取代基基团可位于阿拉伯糖(上)位置或核糖(下)位置。合适的2’-阿拉伯糖修饰是2’-F。还可以在寡聚化合物的其他位置进行类似的修饰，特别是在3’末端核苷上的糖的3’位置或者5’末端核苷酸的2’-5’连接的核苷酸中以及5’位置。寡聚化合物还可以具有糖模拟物，如环丁基部分取代戊呋喃糖基糖。

指导核酸还可包含核碱基(通常简称为“碱基”)修饰或取代。如本文所用的，“未修饰的”或“天然的”核碱基可包括嘌呤碱基(例如，腺嘌呤(A)和鸟嘌呤(G))和嘧啶碱基(例如，胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U))。修饰的核碱基可包括其他合成的和天然的核碱基，如5-甲基胞嘧啶(5-me-C)；5-羟甲基胞嘧啶；黄嘌呤；次黄嘌呤；2-氨基腺嘌呤；腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物；腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物；2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶；5-卤代尿嘧啶和胞嘧啶；5-丙炔基(-C＝C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物；6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶；5-尿嘧啶(假尿嘧啶)；4-硫尿嘧啶；8-卤代、8-氨基、8-巯基、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤；5-卤代特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶；7-甲基鸟嘌呤和7-甲基腺嘌呤；2-F-腺嘌呤；2-氨基腺嘌呤；8-氮杂鸟嘌呤和8-氮杂腺嘌呤；7-脱氮鸟嘌呤和7-脱氮腺嘌呤；以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。修饰的核碱基可包括三环嘧啶，如吩噁嗪胞苷(1H-嘧啶(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)；G夹，如取代的吩噁嗪胞苷(例如，9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶(4,5-b)吲哚-2-酮)、吡啶吲哚胞苷(H-吡啶(3’,2’:4,5)吡咯(2,3-d)嘧啶-2-酮)。

杂环碱基部分可包括其中嘌呤或嘧啶碱基被其他杂环取代的那些，例如7-脱氮-腺嘌呤、7-脱氮鸟嘌呤、2-氨基吡啶和2-吡啶酮。核碱基可用于增加多核苷酸化合物的结合亲和力。这些可包括5-取代的嘧啶、6-氮杂嘧啶和N-2、N-6和O-6取代的嘌呤，包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶取代可以使核酸双链体稳定性提高0.6-1.2℃，并且可以是合适的碱基取代(例如，当与2’-O-甲氧基乙基糖修饰结合时)。

指导核酸的修饰可包括将能够增强指导核酸的活性、细胞分布或细胞摄取的一个或多个部分或缀合物化学连接至指导核酸。这些部分或缀合物可包括与官能团如伯羟基或仲羟基基团共价结合的缀合物基团。缀合物基团可包括但不限于嵌入剂、报道分子、聚胺、聚酰胺、聚乙二醇、聚醚、增强寡聚物的药效学性质的基团和可增强寡聚物的药代动力学性质的基团。缀合物基团可包括但不限于胆固醇、脂质、磷脂、生物素、吩嗪、叶酸、菲啶、蒽醌、吖啶、荧光素、罗丹明、香豆素和染料。增强药效学性质的基团包括改善摄取、增强对降解的抗性和/或增强与靶核酸的序列特异性杂交的基团。可以增强药代动力学性质的基团包括改善核酸的摄取、分布、代谢或排泄的基团。缀合物部分可包括但不限于脂质部分，诸如胆固醇部分、胆酸、硫醚(例如，己基-S-三苯甲基硫醇)、巯基胆固醇、脂肪链(例如，十二烷二醇或十一烷基残基)、磷脂(例如，二-十六烷基-外消旋甘油或三乙铵1,2-二-O-十六烷基-外消旋甘油-3-H-膦酸酯)、聚胺或聚乙二醇链、或金刚烷乙酸、棕榈基部分、或十八烷基胺或己基氨基-羰基-羟胆固醇部分。

修饰可包括“蛋白质转导域”或称PTD(即细胞穿透肽(CPP))。PTD可指促进穿过脂双层、胶束、细胞膜、细胞器膜或囊泡膜的多肽、多核苷酸、碳水化合物或者有机或无机化合物。PTD可以连接到另一分子，所述分子的范围可以从小型极性分子到大型高分子和/或纳米颗粒，并且可以促进分子穿过膜，例如从细胞外空间到细胞内空间，或从胞质溶胶到细胞器内。PTD可以共价连接至多肽的氨基末端。PTD可以共价连接至多肽的羧基末端。PTD可以共价连接至核酸。示例性的PTD可包括但不限于最小肽蛋白转导域；包含足以直接进入细胞的精氨酸数目(例如，3、4、5、6、7、8、9、10或10-50个精氨酸)的聚精氨酸序列；VP22域；果蝇触角蛋白转导域；截短的人降钙素肽；聚赖氨酸；和转运蛋白；从3个精氨酸残基到50个精氨酸残基的精氨酸同聚物(SEQ ID NO:26)。PTD可以是可激活的CPP(ACPP)。ACPP可包括通过可切割连接体连接至匹配的聚阴离子(例如，Glu9(SEQ ID NO:28)或“E9”(SEQ ID NO:28))的聚阳离子CPP(例如，Arg9(SEQ ID NO:27)或“R9”(SEQ ID NO:27))，其可以将净电荷降低至几乎为零，从而抑制粘附和摄取进入细胞。在连接体被切割后，聚阴离子可以被释放，从而局部暴露聚精氨酸及其固有的粘附性，从而“激活”ACPP穿过膜。

指导核酸可以以任何形式提供。例如，指导核酸可以以RNA的形式作为两个分子(例如，分开的crRNA和tracrRNA)或作为一个分子(例如，sgRNA)提供。指导核酸可以以与Cas蛋白的复合物的形式提供。指导核酸还可以以编码RNA的DNA的形式提供。编码指导核酸的DNA可以编码单指导核酸(例如，sgRNA)或分开的RNA分子(例如，分开的crRNA和tracrRNA)。在后一种情况下，编码指导核酸的DNA可以作为分别编码crRNA和tracrRNA的分开的DNA分子提供。

编码指导核酸的DNA可以稳定地整合在细胞的基因组中，并且任选地与在细胞中有活性的启动子可操作地连接。编码指导核酸的DNA可以与表达构建体中的启动子可操作地连接。

指导核酸可以通过任何合适的方法制备。例如，可以使用例如T7 RNA聚合酶通过体外转录来制备指导核酸。指导核酸还可以是通过化学合成制备的合成产生的分子。

指导核酸可包含用于增加稳定性的序列。例如，指导核酸可包含转录终止子区段(即转录终止序列)。转录终止子区段可具有约10个核苷酸至约100个核苷酸的总长度，例如，约10个核苷酸(nt)至约20nt、约20nt至约30nt、约30nt至约40nt、约40nt至约50nt、约50nt至约60nt、约60nt至约70nt、约70nt至约80nt、约80nt至约90nt或约90nt至约100nt。例如，转录终止子区段可具有约15个核苷酸(nt)至约80nt、约15nt至约50nt、约15nt至约40nt、约15nt至约30nt或约15nt至约25nt的长度。转录终止序列可以在真核细胞或原核细胞中起作用。

本文公开的嵌合受体多肽和衔接子多肽的各种结构域(例如，抗原相互作用域、免疫细胞信号传导域(例如，初级信号传导域和共刺激域)、受体结合部分、致动部分等)可以通过以下方式连接：化学键，例如酰胺键或二硫键；有机小分子(例如，烃链)；氨基酸序列，如肽连接体(例如，长度约为3-200个氨基酸的氨基酸序列)，或有机小分子与肽连接体的组合。肽连接体可提供所需的柔性，以允许嵌合多肽的所需表达、活性和/或构象定位。肽连接体可以具有任何合适的长度，以连接至少两个目的结构域，并且优选地被设计为具有足够的柔性，以允许其连接的一个或两个结构域的正确折叠和/或功能和/或活性。肽连接体的长度可以是至少3、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个氨基酸。在一些实施方案中，肽连接体的长度为约0至200个氨基酸、约10至190个氨基酸、约20至180个氨基酸、约30至170个氨基酸、约40至160个氨基酸、约50至150个氨基酸、约60至140个氨基酸、约70至130个氨基酸、约80至120个氨基酸、约90至110个氨基酸。在一些实施方案中，连接体序列可包含内源蛋白质序列。在一些实施方案中，连接体序列包含甘氨酸、丙氨酸和/或丝氨酸氨基酸残基。在一些实施方案中，连接体可包含GS、GGS、GGGGS(SEQID NO:29)、GGSG(SEQ ID NO:30)或SGGG(SEQ ID NO:31)的基序，例如多个或重复的基序。连接体序列可包括任何天然存在的氨基酸、非天然存在的氨基酸或其组合。

在本文各方面的各个实施方案中，本发明系统在细胞或细胞群体中表达。可以从受试者获得细胞，例如免疫细胞(例如，包括T细胞和NK细胞的淋巴细胞)。受试者的非限制性实例包括人、犬、猫、小鼠、大鼠及其转基因物种。来自细胞可衍生自的受试者的样品的实例包括但不限于皮肤、心脏、肺、肾、骨髓、乳房、胰腺、肝、肌肉、平滑肌、膀胱、胆囊、结肠、肠、脑、前列腺、食管、甲状腺、血清、唾液、尿液、胃和消化液、泪液、粪便、精液、阴道液、来源于肿瘤组织的间隙液、眼内液、汗液、粘液、耳垢、油、腺分泌物、脊髓液、毛发、指甲、血浆、鼻拭子或鼻咽洗液、脊髓液、脑脊髓液、组织、咽喉拭子、活检、胎盘液、羊水、脐带血、重点流体(emphatic fluid)、腔液、痰、脓、微生物区(microbiota)、胎粪、乳汁和/或其他排泄物或身体组织。

在本文各方面的各个实施方案中，免疫细胞包括淋巴细胞。在一些实施方案中，淋巴细胞是自然杀伤细胞(NK细胞)。在一些实施方案中，淋巴细胞是T细胞。T细胞可从多种来源获得，该来源包括外周血单核细胞、骨髓、淋巴结组织、脾组织、脐带和肿瘤。在一些实施方案中，可以使用任何数目的可用T细胞系。免疫细胞如淋巴细胞(例如，细胞毒性淋巴细胞)可以优选是自体细胞，然而也可以使用异源细胞。可以使用多种技术(如Ficoll分离)从采集自受试者的单位血液中获取T细胞。来自个体循环血液的细胞可以通过单采血液成分术或白细胞单采术获得。单采产物通常含有淋巴细胞，包括T细胞、单核细胞、粒细胞、B细胞，其他具核白细胞、红细胞和血小板。可以清洗通过单采血液成分术收集的细胞，以去除血浆部分，并将细胞置于适当的缓冲液或培养基如磷酸盐缓冲盐水(PBS)中，以用于后续的处理步骤。洗涤后，可将细胞重悬于多种生物相容的缓冲液如无Ca无Mg的PBS中。或者，可以去除单采血液成分术样品的不需要的组分，并将细胞直接重悬浮在培养基中。样品可以由受试者直接提供，或者通过一个或多个中间人，如样品收集服务提供者或医疗提供者(例如，医师或护士)间接提供。在一些实施方案中，从外周血白细胞分离T细胞可包括裂解红细胞，并通过例如离心，例如通过PERCOL^TM梯度的离心，从单核细胞中分离外周血白细胞。

可以通过正选择或负选择技术进一步分离T细胞的特定亚群，如CD4+或CD8+T细胞。例如，可以用针对负选择的细胞所特有的表面标志物的抗体组合来完成T细胞群体的负选择。一种合适的技术包括通过负磁免疫黏附的细胞分选，其利用针对存在于负选择的细胞上的细胞表面标志物的单克隆抗体的混合物。例如，为了分离CD4+细胞，单克隆抗体混合物可包含CD14、CD20、CD11b、CD16、HLA-DR和CD8的抗体。负选择过程可用于产生期望的T细胞群体，所述群体主要是同质的。在一些实施方案中，组合物包含两种或更多种(例如，2、3、4、5或更多种)不同类型的T细胞的混合物。

在一些实施方案中，免疫细胞是富集的细胞群体的成员。一种或多种期望的细胞类型可通过任何合适的方法富集，其非限制性实例包括处理细胞群体以触发扩充和/或分化成期望的细胞类型、停止不期望的细胞类型生长的处理、杀死或溶解不期望的细胞类型的处理、期望细胞类型的纯化(例如，在亲和柱上纯化，以基于一种或多种细胞表面标志物保留期望或不期望的细胞类型)。在一些实施方案中，富集的细胞群体是富集了细胞毒性淋巴细胞的细胞群体，该细胞毒性淋巴细胞选自细胞毒性T细胞(也不同地称为细胞毒性T淋巴细胞、CTL、T杀伤细胞、细胞溶解性T细胞、CD8+T细胞和杀伤T细胞)、自然杀伤(NK)细胞和淋巴因子激活的杀伤(LAK)细胞。

为了通过正选择或负选择分离期望的细胞群体，可以改变细胞浓度和表面(例如，颗粒如珠子)。在一些实施方案中，可能需要显著降低珠子和细胞混合在一起的体积(即，增加细胞的浓度)，以确保细胞和珠子的最大接触。例如，可以使用20亿个细胞/mL的浓度。在一些实施方案中，使用10亿个细胞/mL的浓度。在一些实施方案中，使用大于1亿个细胞/mL。可以使用1000万、1500万、2000万、2500万、3000万、3500万、4000万、4500万或5000万个细胞/mL的细胞浓度。在另一个实施方案中，可以使用7500万、8000万、8500万、9000万、9500万或1亿个细胞/mL的细胞浓度。在进一步的实施方案中，可以使用1.25亿或1.50亿个细胞/mL的浓度。使用高浓度可导致细胞产量增加、细胞激活和细胞扩充。

细胞，例如，免疫细胞，可以用本文所述的一种或多种载体瞬时或非瞬时转染。细胞转染可以自然发生在受试者体内。细胞可以取自或衍生自受试者并被转染。细胞可以衍生自取自受试者的细胞，诸如细胞系。在一些实施方案中，使用本文所述的一种或多种载体转染的细胞建立包含一个或多个载体衍生的序列的新细胞系。在一些实施方案中，用本发明系统的各种组分瞬时转染(例如通过一种或多种载体的瞬时转染，或用RNA转染)并通过CRISPR复合物的活性进行修饰的细胞被用于建立新的细胞系，其包含含有修饰但缺乏其他任何外源序列的细胞。

引入细胞中的本发明系统可用于调节靶多核苷酸的表达(例如，基因表达)。本文各方面的各个实施方案的GMP可用于调节靶基因的表达。在一方面，本公开提供了诱导基因调节多肽(GMP)向细胞核内的移位的方法。所述方法包括：(a)提供表达具有配体结合域和信号传导域的跨膜受体的细胞；(b)使配体与跨膜受体的配体结合域结合，其中所述结合激活细胞的信号传导途径，使得GMP的异源核定位域继而被激活；从而允许GMP向细胞核内的移位。

配体与跨膜受体的结合可以在体外和/或体内发生。配体与跨膜受体的结合可包括使受体与配体接触。配体可以是膜结合蛋白或非膜结合蛋白。在一些情况下，配体与细胞膜结合。

在一些实施方案中，GMP向细胞核内的移位优先在配体结合跨膜受体时发生。在一些实施方案中，主要在配体结合跨膜受体时GMP向细胞核内移位。在一些实施方案中，仅在配体结合跨膜受体时GMP向细胞核内移位。

配体与跨膜受体的接触可以在体外和/或体内进行。配体与跨膜受体的接触可包括使受体与配体接触。配体可以是膜结合蛋白或非膜结合蛋白。在一些情况下，配体与细胞膜结合。在一些情况下，配体不与细胞膜结合。使细胞与配体接触可以通过在配体存在下培养表达本发明系统的细胞来体外进行。例如，可以将表达本发明系统的细胞培养成贴壁细胞或悬浮培养，并且可以将配体添加到细胞培养基中。在一些情况下，配体由靶细胞表达，并且暴露可包括共培养表达本发明系统的细胞和表达配体的靶细胞。可将细胞在各种合适类型的细胞培养基中共培养，例如与补充剂、生长因子、离子等一起。在一些情况下，将表达本发明系统的细胞暴露于靶细胞(例如，表达抗原的靶细胞)是通过将细胞施用于受试者(例如，人类受试者)并使细胞通过循环系统定位于靶细胞来完成的。

接触可以进行任何合适的时间长度，例如至少1分钟、至少5分钟、至少10分钟、至少30分钟、至少1小时、至少2小时、至少3小时、至少4小时、至少5小时、至少6小时、至少7小时、至少8小时、至少12小时、至少16小时、至少20小时、至少24小时、至少2天、至少3天、至少4天、至少5天、至少6天、至少1周、至少2周、至少3周、至少1个月或更长时间。

可以使用任何合适的递送方法将本公开的组合物和分子(例如，系统的多肽和/或编码多肽的核酸)引入宿主细胞，如免疫细胞。本发明系统的各个组分可以同时或在时间上分开递送。在一些实施方案中，将包含与指导序列组合并任选地与指导序列复合的Cas蛋白和/或嵌合受体和/或衔接子的致动部分递送至细胞，例如免疫细胞。递送方法的选择可以取决于被转化的细胞的类型和/或在其下发生转化的环境(例如，体外、离体或体内)。

递送方法可包括使靶多核苷酸接触一种或多种包含编码本公开的组合物的核苷酸序列(例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、指导核酸等)的核酸，或者将该一种或多种核酸引入细胞(或细胞如免疫细胞群体)。包含编码本公开的组合物的核苷酸序列的合适的核酸可包括表达载体，其中包含编码本公开的一种或多种组合物的核苷酸序列(例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、指导核酸等)的表达载体是重组表达载体。

递送方法或转化的非限制性实例包括例如，病毒或噬菌体感染、转染、缀合、原生质体融合、脂质转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接显微注射以及纳米颗粒介导的核酸递送。

在一些方面，本公开提供了这样的方法，其包括向宿主细胞递送一种或多种多核苷酸、或一种或多种如本文所述的载体、或其一种或多种转录物、以及/或者从其转录的一种或多种蛋白。在一些方面，本公开进一步提供了通过这样的方法产生的细胞，以及包含或由这样的细胞产生的生物体(如动物、植物或真菌)。在一些实施方案中，将与指导序列组合并且任选地与指导序列复合的Cas蛋白和/或嵌合受体递送至细胞。

可以对编码本文公开的任何多肽的多核苷酸进行密码子优化、截短或诱变。密码子优化可能需要异源衍生的(例如，重组的)DNA进行突变以模仿意在的宿主生物或细胞的密码子偏好，同时编码相同的蛋白质。因此，密码子可以被改变，但是编码的蛋白质保持不变。例如，如果意在的靶细胞是人细胞，则可以将人密码子优化的多核苷酸用于产生合适的Cas蛋白。作为另一个非限制性实例，如果意在的宿主细胞是小鼠细胞，则小鼠密码子优化的编码Cas蛋白的多核苷酸可以是合适的Cas蛋白。可以为许多感兴趣的宿主细胞进行编码多肽如致动部分(例如，Cas蛋白)的多核苷酸的密码子优化。宿主细胞可以是来自任何生物体的细胞(例如细菌细胞、古菌细胞、单细胞真核生物的细胞、植物细胞、藻类细胞(例如，布朗葡萄藻、莱茵衣藻、微拟球藻、蛋白核小球藻、展枝马尾藻圆干变种等)、真菌细胞(例如，酵母细胞)、动物细胞、来自无脊椎动物(例如，果蝇、刺胞动物、棘皮动物、线虫等)的细胞、来自脊椎动物(例如，鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、来自哺乳动物(例如，猪、牛、山羊、绵羊、啮齿动物、大鼠、小鼠、非人类灵长类动物、人类等)的细胞等，在一些情况下，可以不需要密码子优化。在一些情况下，密码子优化可以是优选的。

常规的基于病毒和非病毒的基因转移方法可用于将核酸引入哺乳动物细胞或靶组织。此类方法可用于将编码本公开的组合物的核酸施用于培养中或宿主生物体中的细胞。非病毒载体递送系统可包括DNA质粒、RNA(例如，本文所述载体的转录物)、裸核酸以及与递送媒介物如脂质体复合的核酸。病毒载体递送系统可包括DNA和RNA病毒，其在递送至细胞后可以具有游离的或整合的基因组。

核酸的非病毒递送的方法可包括脂质转染、核转染、显微注射、生物射弹、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、RNA、人工病毒粒子和试剂增强的DNA或RNA摄取。可以使用适合于多核苷酸的有效受体识别脂质转染的阳离子脂质和中性脂质。可以递送至细胞(例如，体外或离体施用)或靶组织(例如，体内施用)。可以使用脂质:核酸复合物(包括如免疫脂质复合物等靶向脂质体)的制备。

基于RNA或DNA病毒的系统可用于靶向体内的特定细胞，并将病毒有效载荷运输到细胞的细胞核。病毒载体可以直接(体内)施用，或者它们可以用于体外处理细胞，并且修饰的细胞可以任选地施用(离体)。基于病毒的系统可包括逆转录病毒、慢病毒、腺病毒、腺伴随病毒和单纯疱疹病毒载体，用于基因转移。使用逆转录病毒、慢病毒、腺病毒和腺伴随病毒基因转移方法可发生向宿主基因组中的整合，从而导致插入的转基因的长期表达。可以在许多不同的细胞类型和靶组织中观察到高转导效率。

逆转录病毒的向性可以通过并入外来包膜蛋白，扩大靶细胞的潜在靶群体来改变。慢病毒载体是可转导或感染非分裂细胞并产生高病毒滴度的逆转录病毒载体。逆转录病毒基因转移系统的选择可以取决于靶组织。逆转录病毒载体可包含顺式作用的长末端重复，其包装能力为多达6-10kb的外来序列。最小的顺式作用LTR可足以复制和包装载体，其可用于将治疗性基因整合到靶细胞中以提供永久性转基因表达。逆转录病毒载体可包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的那些。

可以使用基于腺病毒的系统。基于腺病毒的系统可以导致转基因的瞬时表达。基于腺病毒的载体可在细胞中具有高转导效率，并且可能不需要细胞分裂。可以使用基于腺病毒的载体获得高滴度和表达水平。腺伴随病毒(“AAV”)载体可用于用靶核酸转导细胞，例如，在核酸和肽的体外产生中以及在体内和离体基因治疗程序中。

包装细胞可用于形成能够感染宿主细胞的病毒颗粒。这样的细胞可包括293细胞(例如，用于包装腺病毒)和Psi2细胞或PA317细胞(例如，用于包装逆转录病毒)。可以通过产生将核酸载体包装入病毒颗粒的细胞系来产生病毒载体。载体可包含包装和随后整合入宿主所需的最小病毒序列。载体可包含被表达盒替代为待表达的多核苷酸的其他病毒序列。缺失的病毒功能可以通过包装细胞系反式提供。例如，AAV载体可包含来自AAV基因组的ITR序列，其是包装和整合到宿主基因组中所需要的。病毒DNA可以包装在细胞系中，该细胞系可包含编码其他AAV基因(即rep和cap)而缺少ITR序列的辅助质粒。细胞系也可以被腺病毒作为辅助感染。辅助病毒可以促进AAV载体的复制和AAV基因从辅助质粒的表达。腺病毒的污染可以通过例如腺病毒比AAV更敏感的热处理来减少。可以使用用于将核酸递送至细胞的其他方法，例如，如US20030087817中所述，其通过引用并入本文。

可以用本文所述的一种或多种载体来瞬时或非瞬时转染宿主细胞。细胞的转染可以自然发生在受试者体内。细胞可以取自或衍生自受试者并被转染。细胞可以衍生自取自受试者的细胞，诸如细胞系。在一些实施方案中，用本文所述的一种或多种载体转染的细胞被用于建立包含一个或多个载体衍生的序列的新细胞系。在一些实施方案中，用本公开的组合物瞬时转染(诸如通过一种或多种载体的瞬时转染，或用RNA转染)，并通过致动部分如CRISPR复合物的活性进行修饰的细胞被用于建立新的细胞系，其包含含有修饰但缺乏其他任何外源序列的细胞。

与宿主细胞相容的任何合适的载体可以与本公开的方法一起使用。用于真核宿主细胞的载体的非限制性实例包括pXT1、pSG5(StratageneTM)、pSVK3、pBPV、pMSG和pSVLSV40(PharmaciaTM)。

在一些实施方案中，编码指导核酸和/或Cas蛋白或嵌合体的核苷酸序列可操作地连接至控制元件，例如，转录控制元件，如启动子。转录控制元件可以在真核细胞(例如，哺乳动物细胞)或原核细胞(例如，细菌或古菌细胞)中起作用。在一些实施方案中，将编码指导核酸和/或Cas蛋白或嵌合体的核苷酸序列可操作地连接至多个控制元件，所述多个控制元件允许编码指导核酸和/或Cas蛋白或嵌合体的核苷酸序列在原核和/或真核细胞中表达。

取决于所使用的宿主/载体系统，可以在表达载体(例如，U6启动子、H1启动子等；参见上文)中使用许多合适的转录和翻译控制元件中的任何一种，包括组成型和诱导型启动子、转录增强子元件、转录终止子等(参见例如，Bitter等人(1987)Methods inEnzymology，153:516-544)。

在一些实施方案中，本公开的组合物(例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、嵌合衔接子、指导核酸等)可以作为RNA提供。在这样的情况下，本公开的组合物(例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、衔接子、指导核酸等)可以通过直接化学合成来产生，或者可以从DNA体外转录。本公开的组合物(例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、衔接子、指导核酸等)可以使用RNA聚合酶(例如，T7聚合酶、T3聚合酶、SP6聚合酶等)体外合成。一旦合成，RNA可以直接接触靶DNA，或者可以使用用于将核酸引入细胞的任何合适的技术(例如，显微注射、电穿孔、转染等)被引入细胞。

可以使用合适的转染技术将编码指导核酸(作为DNA或RNA引入)以及/或者Cas蛋白或嵌合体(作为DNA或RNA或蛋白质引入)的核苷酸提供给细胞；参见，例如，Angel和Yanik(2010)PLoS ONE 5(7):e11756，以及使用可商购的来自Qiagen的TransMessenger.RTM.试剂、来自Stemgent的StemfectTMRNA转染试剂盒、以及来自Mirus Bio LLC的TransIT.RTM.-mRNA转染试剂盒。另请参见Beumer等人(2008)Efficient gene targeting in Drosophilaby direct embryo injection with zinc-finger nucleases.PNAS 105(50):19821-19826。可以在DNA或RNA载体上提供编码本公开的组合物(例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、衔接子、指导核酸等)的核酸。可以使用可用于将核酸转移到靶细胞中的许多载体，例如质粒、DNA、RNA、粘粒、小环、噬菌体、病毒等。包含核酸的载体可以保持游离，例如作为质粒、小环DNA、病毒如巨细胞病毒、腺病毒等，或者它们可以通过同源重组或随机整合而整合到靶细胞基因组中，例如逆转录病毒衍生的载体，如MMLV、HIV-1和ALV。

本公开的组合物(例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、指导核酸等)可以与多肽渗透域融合，以促进细胞的摄取。许多渗透域可以在本公开的非整合多肽中使用，包括肽、拟肽和非肽载体。例如，渗透肽可以衍生自黑腹果蝇(Drosophilamelanogaster)转录因子Antennapaedia的第三α螺旋，被称为penetratin，其包含氨基酸序列RQIKIWFQNRRMKWKK(SEQ ID NO:32)。作为另一个实例，渗透肽可包含HIV-1tat碱性区氨基酸序列，其可包括例如天然存在的tat蛋白的氨基酸49-57。其他渗透域包括聚精氨酸基序，例如，HIV-1rev蛋白的氨基酸34-56、九精氨酸(SEQ ID NO:27)、八精氨酸(SEQ ID NO:33)等区域。(例如，参见Futaki等人(2003)Curr Protein Pept Sci.2003年4月；4(2):87-9和446；和Wender等人(2000)Proc.Natl.Acad.Sci.U.S.A2000年11月21日；97(24):13003-8；已公布的美国专利申请20030220334、20030083256、20030032593和20030022831，特别通过引用移位肽和类肽的教导而并入本文。可以使用九精氨酸(R9)序列(SEQ ID NO:27)。(Wender等人.2000；Uemura等人.2002)。可以选择进行融合的位点，以优化多肽的生物活性、分泌或结合特性。

本公开的组合物(例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、指导核酸等)可以在体外产生或通过真核细胞或通过原核细胞产生，并且可以通过解折叠，例如热变性、DTT还原等进一步加工，并且可以进一步重新折叠。

本公开的组合物(例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、指导核酸等)可以通过体外合成来制备。可以使用各种商业合成设备，例如，Applied Biosystems,Inc.、Beckman等的自动合成仪。通过使用合成仪，可以用非天然氨基酸置换天然存在的氨基酸。具体的制备顺序和方式可以取决于方便性、经济性、所需的纯度等。

本公开的组合物(例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、指导核酸等)还可以根据重组合成的常规方法来分离并纯化。可以制备表达宿主的裂解物，并使用HPLC、排阻色谱法、凝胶电泳、亲和色谱法或其他纯化技术纯化该裂解物。相对于与产品制备及其纯化方法有关的污染物，所述组合物可包含例如至少20重量％、至少约75重量％、至少约95重量％的所需产物，并且出于治疗目的，例如，至少约99.5重量％。所述百分比可以基于总蛋白质。

可以将作为核酸或多肽并入的本公开的组合物(例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、指导核酸等)向细胞提供约30分钟至约24小时，例如，1小时、1.5小时、2小时、2.5小时、3小时、3.5小时、4小时、5小时、6小时、7小时、8小时、12小时、16小时、18小时、20小时，或者约30分钟至约24小时的其他任何时间段，其可以以约每天至约每4天的频率重复，例如，每1.5天、每2天、每3天或者约每天至约每四天的其他任何频率。可以将组合物向受试者细胞提供一次或多次，例如一次、两次、三次或多于三次，并且在每次接触事件之后，允许细胞与试剂一起温育一定量的时间，例如16-24小时，此后可用新鲜培养基替换培养基，并可进一步培养细胞。

在向细胞提供两种或更多种不同的靶向复合物(例如，与相同或不同的靶DNA内的不同序列互补的两种不同的指导核酸)的情况下，可以同时提供(例如，作为两个多肽和/或核酸)或同时递送复合物。或者，它们可以被相继提供，例如，首先提供靶向复合物，然后提供第二靶向复合物，等等，反之亦然。

可以向靶DNA或细胞提供有效量的本公开的组合物(例如，GMP，例如，致动部分，如Cas蛋白或Cas嵌合体、嵌合受体、指导核酸等)。有效量可以是相对于阴性对照，例如与空载体或无关多肽接触的细胞，在两个同源序列之间观察到的靶调节的量方面诱导例如至少约2倍或更多的变化(增加或减少)的量。有效量或剂量可以诱导靶基因调节的例如约2倍的变化、约3倍的变化、约4倍的变化、约7倍、约8倍的增加、约10倍、约50倍、约100倍、约200倍、约500倍、约700倍、约1000倍、约5000倍或约10.000倍的变化。靶基因调节的量可以通过任何合适的方法来测量。

使细胞与组合物接触可以在任何培养基中并且在任何促进细胞存活的培养条件下进行。例如，可以将细胞悬浮在方便的任何合适的营养培养基中，诸如，补充有胎牛血清或热灭活的山羊血清(约5-10％)、L-谷氨酰胺、硫醇(特别是2-巯基乙醇)和抗生素(例如青霉素和链霉素)的Iscove改良DMEM或RPMI 1640。培养物可包含细胞对其有反应的生长因子。如本文所定义，生长因子是能够通过对跨膜受体的特定作用而在培养物中或在完整组织中促进细胞的存活、生长和/或分化的分子。生长因子可包括多肽和非多肽因子。

在许多实施方案中，所选的递送系统靶向特定的组织或细胞类型。在一些情况下，通过将递送系统与组织或细胞特异性标志物如细胞表面蛋白结合来实现递送系统的组织或细胞靶向。可以定制病毒和非病毒递送系统，以靶向感兴趣的组织或细胞类型。

可以施用含有本文所述的分子(例如，多肽和/或编码多肽的核酸)或免疫细胞的药物组合物以进行预防性和/或治疗性处理。在治疗性应用中，可以以足以治愈或至少部分阻止疾病或状况的症状或者治愈、治疗、改善或缓解该状况的量将该组合物施用于已经患有该疾病或状况的受试者。对于这种用途有效的量可基于疾病或状况的严重程度和病程，既往治疗，受试者的健康状态、体重和对药物的反应以及主治医师的判断而变化。

多种治疗剂可以以任意顺序或同时地施用。如果同时施用，则可以以单一、统一的形式或以多种形式，例如作为多个独立的丸剂来提供多种治疗剂。所述分子可以一起包装在一个包装中或独立地包装在多个包装中。可以以多个剂量来给予一种或全部治疗剂。如果并非同时施用，则多个剂量之间的时间可以变化长达约一个月。

本文所述的化合物可以在疾病或病状出现之前、期间或之后施用，并且施用含有化合物的组合物的时间选择可以改变。例如，该微生物组合物可用作预防剂并且可连续施用于具有状况或疾病倾向的受试者，以便减少发生该疾病或状况的可能性。该化合物和组合物可在症状发作期间施用于受试者或发作之后尽可能快地施用于受试者。可在症状发作的前48小时内、症状发作的前24小时内、症状发作的前6小时内或症状发作的3小时内开始该微生物组合物的施用。可使用本文所述的任何制剂，经由任何实用的途径，如通过本文所述的任何途径进行初始施用。可在检测到或怀疑疾病或状况发作之后尽可能快地施用微生物组合物，并持续治疗该疾病所需的时间长度，例如约1个月至约3个月。治疗的长度可因每个受试者而异。

分子可以包装到生物区室中。可以将包含该分子的生物区室施用于受试者。生物区室可包括但不限于病毒(慢病毒、逆转录病毒、腺病毒、腺伴随病毒、疱疹病毒)、纳米球、脂质体、量子点、纳米颗粒、微粒、纳米胶囊、囊泡、聚乙二醇颗粒、水凝胶和胶束。

例如，生物区室可包括脂质体。脂质体可以是包含一个或多个脂双层的自组装结构，每个脂双层可包含两个含有取向相反的两亲性脂质分子的单层。两亲性脂质可包含共价连接至一个或两个或更多个非极性(疏水)酰基或烷基链的极性(亲水)头基。疏水酰基链与周围的水性介质之间在能量上不利的接触引起两亲性脂质分子自行排列，使得极性头基可以朝向双层表面取向，而酰基链则朝向双层内部取向，从而有效地防止酰基链接触水性环境。

在脂质体中使用的优选两亲性化合物的实例可包括磷酸甘油酯和鞘脂，其代表性的实例包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷脂酸、磷脂酰甘油、棕榈酰油酰磷脂酰胆碱、溶血磷脂酰胆碱、溶血磷脂酰乙醇胺、二豆蔻酰磷脂酰胆碱(DMPC)、二棕榈酰磷脂酰胆碱(DPPC)、二油酰磷脂酰胆碱、二硬脂酰磷脂酰胆碱(DSPC)、二亚油酰磷脂酰胆碱和卵鞘磷脂或其任何组合。

生物区室可包括纳米颗粒。纳米颗粒可包含约40纳米至约1.5微米、约50纳米至约1.2微米、约60纳米至约1微米、约70纳米至约800纳米、约80纳米至约600纳米、约90纳米至约400纳米、约100纳米至约200纳米的直径。

在一些情况下，随着纳米颗粒的大小增加，释放率可以减慢或延长，并且随着纳米颗粒的大小减小，释放速率可以增加。

纳米颗粒中白蛋白的量可以在约5％至约85％白蛋白(v/v)、约10％至约80％、约15％至约80％、约20％至约70％白蛋白(v/v)、约25％至约60％、约30％至约50％、或约35％至约40％。药物组合物可包含至多30％、40％、50％、60％、70％或80％或更多的纳米颗粒。在一些情况下，本公开的核酸分子可以结合至纳米颗粒的表面。

生物区室可包括病毒。病毒可以是用于本公开的药物组合物的递送系统。示例性的病毒可包括慢病毒、逆转录病毒、腺病毒、单纯疱疹病毒I或II、细小病毒、网状内皮组织增殖病毒和腺伴随病毒(AAV)。本公开的药物组合物可以使用病毒递送至细胞。病毒可以在体内、离体或体外感染并转导细胞。在离体和体外递送中，可以将转导的细胞施用于需要治疗的受试者。

可以将药物组合物包装到病毒递送系统中。例如，可以通过无辅助病毒HSV-1包装系统将组合物包装到病毒粒子中。

病毒递送系统(例如，包含本公开的药物组合物的病毒)可以通过直接注射、立体定位注射、脑室内、通过微型泵输注系统、通过对流、导管、静脉内、肠胃外、腹膜内和/或皮下注射施用于有需要的受试者的细胞、组织或器官。在一些情况下，可用病毒递送系统体外或离体转导细胞。可以将转导的细胞施用于患有疾病的受试者。例如，可以用包含药物组合物的病毒递送系统来转导干细胞，并且可以将干细胞植入患者体内以治疗疾病。在一些情况下，给予受试者的转导细胞的剂量可以是一个单剂量中约1×10⁵个细胞/kg、约5×10⁵个细胞/kg、约1×10⁶个细胞/kg、约2×10⁶个细胞/kg、约3×10⁶个细胞/kg、约4×10⁶个细胞/kg、约5×10⁶个细胞/kg、约6×10⁶个细胞/kg、约7×10⁶个细胞/kg、约8×10⁶个细胞/kg、约9×10⁶个细胞/kg、约1×10⁷个细胞/kg、约5×10⁷个细胞/kg、约1×10⁸个细胞/kg或更多。

将生物区室引入细胞可以通过病毒或噬菌体感染、转染、缀合、原生质体融合、脂质转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接显微注射、纳米颗粒介导的核酸递送等发生。

在一些实施方案中，施用表达本发明系统的免疫细胞。表达本发明系统的免疫细胞可以在疾病或病况发生之前、期间或之后施用，并且施用免疫细胞的时机可以不同。例如，表达本发明系统的免疫细胞可以用作预防剂，并且可以连续施用于易患病况或疾病的受试者，以防止疾病或病况的发生。可以在症状发作期间或之后尽快将免疫细胞施用于受试者。可以在症状发作的前48小时内、症状发作的前24小时内、症状发作的前6小时内或症状发作的3小时内开始给药。初始给药可以通过任何合适的途径，如使用本文所述的任何制剂通过本文所述的任何途径进行。在检测到或怀疑疾病或病况发作后，可以在可行的情况下尽快施用免疫细胞，并持续治疗该疾病所必需的时间长度，例如约1个月至约3个月。每个受试者的治疗时间长度可能有所不同。

本文所述的分子(例如，多肽和/或核酸)可以以约1mg至约2000mg；约5mg至约1000mg、约10mg至约25mg至500mg、约50mg至约250mg、约100mg至约200mg、约1mg至约50mg、约50mg至约100mg、约100mg至约150mg、约150mg至约200mg、约200mg至约250mg、约250mg至约300mg、约300mg至约350mg、约350mg至约400mg、约400mg至约450mg、约450mg至约500mg、约500mg至约550mg、约550mg至约600mg、约600mg至约650mg、约650mg至约700mg、约700mg至约750mg、约750mg至约800mg、约800mg至约850mg、约850mg至约900mg、约900mg至约950mg或约950mg至约1000mg存在于组合物中。

本文所述的分子(例如，多肽和/或核酸)可以以约1mg、约2mg、约3mg、约4mg、约5mg、约10mg、约15mg、约20mg、约25mg、约30mg、约35mg、约40mg、约45mg、约50mg、约55mg、约60mg、约65mg、约70mg、约75mg、约80mg、约85mg、约90mg、约95mg、约100mg、约125mg、约150mg、约175mg、约200mg、约250mg、约300mg、约350mg、约400mg、约450mg、约500mg、约550mg、约600mg、约650mg、约700mg、约750mg、约800mg、约850mg、约900mg、约950mg、约1000mg、约1050mg、约1100mg、约1150mg、约1200mg、约1250mg、约1300mg、约1350mg、约1400mg、约1450mg、约1500mg、约1550mg、约1600mg、约1650mg、约1700mg、约1750mg、约1800mg、约1850mg、约1900mg、约1950mg或约2000mg的量存在于组合物中。

本文所述的分子(例如，多肽和/或核酸)可以存在于组合物中，该组合物提供至少0.1、0.5、1、1.5、2、2.5 3、3.5、4、4.5、5、5.5、6、6.5、10或更多单位的活性/mg分子。该活性可以是基因表达的调节。在一些实施方案中，递送至受试者的分子的活性单位总数为至少至少25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、110,000、120,000、130,000、140,000、150,000、160,000、170,000、180,000、190,000、200,000、210,000、220,000、230,000或250,000或更多单位。在一些实施方案中，递送至受试者的分子的活性单位总数为至多25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、110,000、120,000、130,000、140,000、150,000、160,000、170,000、180,000、190,000、200,000、210,000、220,000、230,000或250,000或更多单位。

在一些实施方案中，将至少约10,000单位的活性递送至受试者，按50kg体重标准化。在一些实施方案中，将至少约10,000、15,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、110,000、120,000、130,000、140,000、150,000、160,000、170,000、180,000、190,000、200,000、210,000、220,000、230,000或250,000单位或更多的分子活性递送至受试者，按50kg体重标准化。在一些实施方案中，治疗有效剂量包含至少5x 10⁵、1x 10⁶、2x 10⁶、3x 10⁶、4x 10⁶、5x 10⁶、6x 10⁶、7x 10⁶、8x 10⁶、9x 10⁶、1x10⁷、1.1x 10⁷、1.2x 10⁷、1.5x 10⁷、1.6x 10⁷、1.7x 10⁷、1.8x 10⁷、1.9x 10⁷、2x 10⁷、2.1x10⁷或3x 10⁷或更多单位的分子活性。在一些实施方案中，治疗有效剂量包含至多5x 10⁵、1x10⁶、2x 10⁶、3x 10⁶、4x 10⁶、5x 10⁶、6x 10⁶、7x 10⁶、8x 10⁶、9x 10⁶、1x 10⁷、1.1x 10⁷、1.2x10⁷、1.5x 10⁷、1.6x 10⁷、1.7x 10⁷、1.8x 10⁷、1.9x 10⁷、2x 10⁷、2.1x 10⁷或3x 10⁷或更多单位的分子活性。

在一些实施方案中，治疗有效剂量是至少约10,000、15,000、20,000、22,000、24,000、25,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、125,000、150,000、200,000或500,000单位/kg体重。在一些实施方案中，治疗有效剂量是至多约10,000、15,000、20,000、22,000、24,000、25,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、125,000、150,000、200,000或500,000单位/kg体重。

在一些实施方案中，递送至受试者的分子的活性为至少10,000、11,000、12,000、13,000、14,000、20,000、21,000、22,000、23,000、24,000、25,000、26,000、27,000、28,000、30,000、32,000、34,000、35,000、36,000、37,000、40,000、45,000或50,000或更多U/mg分子。在一些实施方案中，递送至受试者的分子的活性为至多10,000、11,000、12,000、13,000、14,000、20,000、21,000、22,000、23,000、24,000、25,000、26,000、27,000、28,000、30,000、32,000、34,000、35,000、36,000、37,000、40,000、45,000或50,000或更多U/mg分子。

在本文各方面的各个实施方案中，可以获得药代动力学和药效学数据。获得这些数据的各种实验技术是可以获得的。描述特定组合物的适当药代动力学和药效学概况组分可能会由于药物在人类受试者中的代谢的变化而不同。药代动力学和药效学概况可以基于一组受试者的平均参数的确定。受试者组包括适合于确定代表性平均值的任意合理数目的受试者，例如5个受试者、10个受试者、15个受试者、20个受试者、25个受试者、30个受试者、35个受试者或更多。平均值可以通过对所测量的每个参数计算所有受试者的测量值的平均值来确定。如本文所述，可以调节剂量以达到所需的药代动力学或药效学概况，如所需或有效的血液概况。

药代动力学参数可以是适合于描述分子的任何参数。例如，Cmax可以例如不低于约25ng/mL；不低于约50ng/mL；不低于约75ng/mL；不低于约100ng/mL；不低于约200ng/mL；不低于约300ng/mL；不低于约400ng/mL；不低于约500ng/mL；不低于约600ng/mL；不低于约700ng/mL；不低于约800ng/mL；不低于约900ng/mL；不低于约1000ng/mL；不低于约1250ng/mL；不低于约1500ng/mL；不低于约1750ng/mL；不低于约2000ng/mL；或适合于描述本文所述分子的药代动力学概况的其他任何Cmax。

本文所述分子的Tmax可以例如不大于约0.5小时、不大于约1小时、不大于约1.5小时、不大于约2小时、不大于约2.5小时、不大于约3小时、不大于约3.5小时、不大于约4小时、不大于约4.5小时、不大于约5小时，或适合于描述本文所述分子的药代动力学概况的其他任何Tmax。

本文所述分子的AUC(0-inf)可以例如不低于约50ng·hr/mL、不低于约100ng/hr/mL、不低于约150ng/hr/mL、不低于约200ng·hr/mL、不低于约250ng/hr/mL、不低于约300ng/hr/mL、不低于约350ng/hr/mL、不低于约400ng/hr/mL、不低于约450ng/hr/mL、不低于约500ng/hr/mL、不低于约600ng/hr/mL、不低于约700ng/hr/mL、不低于约800ng/hr/mL、不低于约900ng/hr/mL、不低于约1000ng·hr/mL、不低于约1250ng/hr/mL、不低于约1500ng/hr/mL、不低于约1750ng/hr/mL、不低于约2000ng/hr/mL、不低于约2500ng/hr/mL、不低于约3000ng/hr/mL、不低于约3500ng/hr/mL、不低于约4000ng/hr/mL、不低于约5000ng/hr/mL、不低于约6000ng/hr/mL、不低于约7000ng/hr/mL、不低于约8000ng/hr/mL、不低于约9000ng/hr/mL、不低于约10,000ng/hr/mL，或适合于描述本文所述分子的药代动力学概况的其他任何AUC(0-inf)。

施用后约一小时，本文所述分子的血浆浓度可以例如不低于约25ng/mL、不低于约50ng/mL、不低于约75ng/mL、不低于约100ng/mL、不低于约150ng/mL、不低于约200ng/mL、不低于约300ng/mL、不低于约400ng/mL、不低于约500ng/mL、不低于约600ng/mL、不低于约700ng/mL、不低于约800ng/mL、不低于约900ng/mL、不低于约1000ng/mL、不低于约1200ng/mL，或本文所述分子的其他任何血浆浓度。

药效学参数可以是适合于描述本公开的药物组合物的任何参数。例如，药效学概况可以在例如约2小时、约4小时、约8小时、约12小时或约24小时后表现出与炎症相关的因子的减少。

在本文各方面的各个实施方案中，本公开的方法在受试者中进行。受试者可以是人类。受试者可以是哺乳动物(例如，大鼠、小鼠、牛、犬、猪、绵羊、马)。受试者可以是脊椎动物或无脊椎动物。受试者可以是实验动物。受试者可以是患者。受试者可以患有疾病。受试者可以表现出疾病的症状。受试者可能没有表现出疾病的症状，但仍然患有疾病。受试者可以在看护者的医疗护理下(例如，该受试者住院并且由医师治疗)。受试者可以是植物或农作物。

在另一方面，本公开提供了一种调节靶多核苷酸在细胞中的表达的方法，其包括：向所述细胞施用电磁辐射，其中细胞信号传导途径被所述电磁辐射激活，并且其中所激活的细胞信号传导途径激活与基因调节多肽偶联的核定位域；以及(b)通过激活的核定位域将所述基因调节多肽从细胞质移位至细胞核，其中所述基因调节多肽在移位至细胞核后调节靶多核苷酸的表达。

在一些实施方案中，所述方法可以进一步包括施用电磁辐射以激活信号传导单元，该单元继而激活细胞信号传导途径。该方法中使用的信号传导单元可以是本文提供的系统中描述的用于调节靶多核苷酸在细胞中的表达的相同信号传导单元。

在一些实施方案中，所述方法可以进一步包括：(a)将细胞输注到个体中；以及(b)引导电磁辐射源以向所述个体的至少一部分施用电磁辐射，从而激活细胞信号传导途径。在一些情况下，该个体可以是患有癌症的患者。在一些情况下，可以静脉内(IV)施用表达本发明系统的细胞。如上所述，细胞施用的时机可以不同。使用电磁辐射源向个体的至少一部分施用电磁辐射一段时间可以提供用于调节靶多核苷酸在个体中的表达的空间和时间控制。

在一些实施方案中，电磁辐射源可以是外部电磁辐射源，并且可以在感兴趣的特定部位(例如，肿瘤部位)或在覆盖血管(例如，动脉)的开放皮肤处施用电磁辐射(例如，蓝光)。在一些实施方案中，电磁辐射源可以被植入个体中具有治疗意义的部位。具有治疗意义的部位的实例可包括已有的肿瘤部位、已去除肿瘤的部位或与血管(例如动脉)相邻的部位。在一些情况下，植入的电磁辐射源可以由电池供电。在一些情况下，植入的电磁辐射源可以经由用户设备(例如，医疗控制单元、智能电话、智能手表等)无线地控制。

在一些实施方案中，所述方法可以进一步包括(a)在不存在电磁辐射的情况下培养细胞；(b)向所述细胞施用电磁辐射一段时间，以激活对靶多核苷酸的表达的调节；以及(c)将激活的细胞输注到个体中。在一个实例中，可以用嵌合蛋白转染免疫细胞，该嵌合蛋白包含与NFAT的异源NLS结构域和转录阻抑物(例如，KRAB结构域)框内融合的基因调节多肽(dCas9)。免疫细胞还可以包含靶向程序性细胞死亡蛋白1(PD-1)基因的一个或多个gRNA。另外，可以用电磁辐射可激活的信号传导单元(例如，ORAI1跨膜钙通道和LOV2-Jα-SOAR细胞内蛋白质)转染免疫细胞，其最终触发嵌合蛋白的NLS结构域的激活。临在将这类工程化免疫细胞输注到个体之前，可以用电磁辐射(例如，蓝光)辐照该工程化免疫细胞，以激活细胞信号传导途径，从而激活包含基因调节多肽的嵌合蛋白，从而抑制PD-1在工程化免疫细胞中的表达。与没有PD-1抑制的工程化免疫细胞相比，一旦输注到个体的血流中，电磁辐射介导的PD-1表达的时间抑制就可以提高免疫细胞的存活率。在另一个实例中，可以用嵌合蛋白转染免疫细胞，该嵌合蛋白包含与NFAT的异源NLS结构域和转录激活物(例如，VP64)框内融合的基因调节多肽(dCas9)。该免疫细胞还可以包含一个或多个靶向目的基因的gRNA。一旦将这类工程化免疫细胞输注到个体中，基因调节的对电磁辐射介导的暂时激活就可以动态控制体内靶基因的一系列表达水平。

本公开的系统和组合物可用于其他种类的应用。例如，本公开的系统和方法可用于在组织(例如，器官)生长、修复、再生、再生医学和/或工程改造期间调节对细胞增殖、分化、转分化和/或去分化至关重要的基因表达和/或细胞活性的方法中。组织的实例包括上皮、结缔组织、神经、肌肉、器官和其他组织。其他示例性组织包括动脉、韧带、皮肤、肌腱、肾脏、神经、肝脏、胰腺、膀胱、骨骼、肺、血管、心脏瓣膜、软骨、眼睛等。

实施例

通过以下非限制性实施例进一步阐述本公开的各个方面。

实施例1：

活化T细胞核因子(NFAT)是T淋巴细胞活化特异性转录因子的家族，其由五个成员组成：NFATc1、NFATc2、NFATc3、NFATc4和NFAT5。NFAT响应元素(识别序列)是IL-2增强子中的转录元件，其在不存在通过抗原受体或通过用离子霉素和PMA组合处理T细胞而对T淋巴细胞的生理激活的情况下，通常对转录没有刺激作用。

在静息T细胞中，NFAT可以以磷酸化状态存在于细胞质中。在这种状态下，核定位信号(NLS)可以被磷酸化的丝氨酸残基或其他抑制性NFAT结合蛋白掩盖。细胞活化后，钙依赖磷酸酶(CN)可以直接使NFAT脱磷酸，并且由于构象变化或抑制性结合配偶体的解离，NFAT NLS继而可以得到暴露，从而允许NFAT核移位(Shibasaki,F.等人,1996,Nature 382:370；Luo,C.等人,1996,J.Exp.Med.184:141；Timmerman,L.A.等人,1996,Nature 383:837；Beals,C.R.等人,1997,Genes Dev.11:824；Rao,A.等人,1997,Annu.Rev.Immunol.15:707；Masuda,E.S.等人,1999,Cell.Signaling 10:599)。NFAT1-4蛋白通常受钙和钙依赖磷酸酶信号传导途径的调节，而NFAT5可以响应渗透应激而被激活。调节域通常位于NFAT1-4蛋白的N末端区域，而DNA结合域通常位于NFAT1-4蛋白质的c末端区域(图4A和图4B)。NFATc2蛋白包含以下4个功能域：N末端反式激活域(TAD-N)，NFAT同源性区域(NHR)，DNA结合域(DBD)，和C末端反式激活域(TAD-C)(Mognol GP,Carneiro FR,Robbs BK,Faget DV,ViolaJP.2016.Cell Death Dis.7:e2199)。如所示的NFATc2的N末端部分(nNFATc2)用作构成nNFATc2-dCas9-VP64融合蛋白的组分。

实施例2：由N-NFATc2-dCas9-VP64融合蛋白介导的CAR活化依赖性GFP蛋白表达

使用无催化活性的(dCas9)系统上调GFP报告基因。当dCas9与NFATc2 N末端结构域融合，并转染到含有靶向GFP的sgRNA和GFP报告基因的Jurkat T细胞时，观察到T细胞活化诱导的活性(图3A和图3B)。

将两个稳定的Jurkat衍生细胞系(2sg和2sg-CAR)分别用所示的DNA构建体和BFP表达构建体转染，然后用CD19+Raji细胞刺激。两天后，收集细胞以进行流式细胞术分析。在流式细胞仪中采集样品之前，用抗CD3-APC780和CD22-PE对Raji刺激的细胞进行染色。将CD3+CD22-细胞门控为Jurkat衍生的细胞。使用BFP表达来门控转染的细胞以进行数据分析。2sg细胞系既包含GFP报告基因，又包含靶向GFP启动子区域的sgRNA。2sg-CAR细胞系包含另外一个靶向CD19的CAR。N-NFATc2：NFATc2的N末端区域。FL-NFAT：全长NFATc2。没有额外的核定位信号(NLS)被添加到dCas9构建体。结果以条形图(图3A)或直方图(图3B)示出。

通过用编码以下3种组分的慢病毒载体转导产生稳定的Jurkat报告细胞系(2sg)：(1)TRE3G启动子驱动的GFP表达盒(该启动子具有7个sgRNA结合位点)；(2)靶向TRE3G启动子的sgRNA；和(3)靶向CXCR4启动子的sgRNA。通过用另一种编码抗CD19 CAR表达盒的慢病毒载体转导2sg细胞系，生成另一种稳定的Jurkat报告细胞系(2sg-CAR)。

如图3A(条形图)和图3B(直方图)所示，在添加或不添加Raji细胞的情况下，dCas9-VP64(SEQ ID NO:34)能够激活2sg细胞系中的GFP表达。与不存在Raji的情况相比，在Raji的存在下，在2sg-CAR细胞系中观察到更多GFP表达，这可能是由于与Raji混合时的非特异性Jurkat细胞活化。将全长NFATc2多肽附接到dCas9-VP64的N末端(FL-NFATc2-VP64)(SEQ ID NO:35)使dCas9失活。在2sg或2sg-CAR细胞系中均未观察到GFP激活。将NFATc2的N末端区域附接到dCas9-VP64的N末端(N-NFATc2-VP64)(SEQ ID NO:1)会在不存在或存在Raji细胞的情况下在2sg细胞系中，以及在不存在Raji细胞的情况下在2sg-CAR细胞系中，降低dCas9激活GFP表达的活性。相反，在添加Raji细胞的2sg-CAR细胞系中观察到更高水平的GFP激活。结果提示，灭活的N-NFATc2具有与核输出信号(NES)肽相似的功能，并且可以将融合多肽隔离在胞质溶胶中，从而使其在静息T细胞中保持无功能。一旦激活，N-NFATc2在激活的T细胞中具有类似于NLS的功能，以促进dCas9移位到细胞核中。N-NFATc2既包含NLS功能又包含NES功能，这取决于细胞信号传导。NFATc2、进而dCas9-VP64向细胞核中的移位可通过T细胞激活来调节。

实施例3：靶基因的下调

如实施例2所述的无催化活性(dCas9)系统用来下调靶基因。在该实施例中，dCas9与转录阻抑物(例如，KRAB)融合而不是与转录激活物(例如，VP64)融合。当dCas9-KRAB与NFATc2 N末端结构域融合(N-NFATc2-dCas9-KRAB)(SEQ ID NO:36)，并与靶向PD1基因的sgRNA一起转染至表达CD19 CAR的Jurkat T细胞系时，在激活的T细胞中观察到PD1下调(图5)。

组成型表达CD19 CAR的Jurkat细胞和Jurkat衍生的细胞系用N-NFATc2-dCas9-KRAB构建体和Gal4对照或PD1 sgRNA构建体转染，然后在一天后用CD19+Raji细胞刺激。三天后，收集细胞以进行流式细胞术分析。在流式细胞仪中采集样品之前，用抗CD22-APC和PD1-PE对Raji刺激的细胞进行染色。将CD22细胞门控为Jurkat衍生的细胞。使用BFP表达门控转染的细胞以供数据分析。

无催化活性的dCas9-KRAB能够抑制靶基因表达。在用N-NFATc2-dCas9-KRAB和Gal4对照sgRNA转染的细胞中，即使在Raji刺激后，Jurkat细胞上的PD1表达水平也非常低。然而，在Raji刺激的CD19 CAR+Jurkat细胞中检测到高水平的PD1表达，提示CD19 CAR介导的T细胞激活对于PD1表达至关重要，这与之前其他人的研究一致。但是，当用N-NFATc2-dCas9-KRAB和PD1 sgRNA转染CD19 CAR+Jurkat细胞时，与用Gal4对照sgRNA处理的细胞相比，PD1+％细胞显著减少(图5)。在静息T细胞中，N-NFATc2将融合多肽隔离在胞质溶胶中，从而使dCas9保持无法操作。一旦T细胞激活，处于激活状态的N-NFATc2就具有类似于NLS的功能，从而促进dCas9-KRAB融合多肽向细胞核内移位，在其中与指导RNA一起抑制PD1基因表达。

实施例4：靶基因的表观基因组修饰

如实施例2和实施例3所述的无催化活性(dCas9)系统用来下调靶基因。在这个实施例中，dCas9与表观基因组修饰酶，如组蛋白脱乙酰酶结构域(例如，HDAC)融合，而不是与转录激活物或阻抑物融合。

无催化活性的dCas9-HDAC能够通过使目标组蛋白脱乙酰基来促进表观基因组修饰。与不存在Raji的情况相比，在Raji的存在下在2sg-CAR细胞系中观察到更多的组蛋白脱乙酰基作用。在2sg或2sg-CAR细胞系中观察到最小的激活。将NFATc2的N末端区域附接至dCas9-HDAC的N末端(N-NFATc2-dCas9-HDAC)将dCas9隔离在胞质溶胶中，因此在不存在或存在Raji的情况下在2sg细胞系中，以及在不存在Raji细胞的情况下在2sg-CAR细胞系中，阻止dCas9激活靶基因表达。相反，在添加Raji细胞的2sg-CAR细胞系中观察到更高水平的目标组蛋白脱乙酰基作用。一旦激活，N-NFATc2在激活的T细胞中具有类似于NLS的功能，以促进dCas9融合体向核中的移位。通过调节的NFATc2移位，可以通过T细胞激活来调节dCas9-HDAC融合多肽的核移位，因而调节其功能。

实施例5：使用活性Cas9的基因编辑

具有催化活性的Cas9系统用来响应于刺激控制所需的基因编辑。该系统类似于无催化活性的dCas9(例如，实施例2中所述)，不同之处在于具有包含一个或两个功能性核酸酶结构域的活性Cas9。在这种情况下，当Cas9或切口酶Cas9与全长NFATc2或N-NFATc2融合时，则当NFATc2处于非活性状态时，Cas9或切口酶Cas9无法进入细胞核。一旦激活，例如通过如实施例2-4所述添加Raji细胞，则NFATc2能够移位到细胞核中，从而将Cas9或切口酶Cas9移位到核酸酶中。一旦处于细胞核中，Cas9或切口酶Cas9便能够结合并切割或切刻由提供的sgRNA确定的靶标。如果提供的修复模板在5’和3’端均包含足够的同源性区域，则该修复模板通过修复机制(例如同源性指导的修复)并入切割或切口位点中。

实施例6：其他融合蛋白、其他CRISPR酶和非CRISPR系统

如实施例2-5所述生成并应用所述系统执行靶基因激活、抑制、编辑或表观基因组修饰。在该实施例中，NFATc2被包含可调节的核定位域或可调节的降解结构域的不同蛋白质结构域替换。这些替代的可调节结构域包括较小或较大的NFATc2变体、来自其他NFAT家族蛋白质的区域、核因子κB(NF-KB)、激活蛋白1(AP-1)、信号转导及转录激活物1(STAT1)以及其他转录因子或信号转导物。在每种情况下，Cas9(例如，dCas9、切口酶Cas9或完全活性Cas9)都与所选的可调节结构域融合。在可调节结构域的非活性状态下，Cas9无法移位到细胞核中。一旦被适当的信号或信号传导途径激活，Cas9便能够移位到细胞核中并与伴随的sgRNA所靶向的靶序列结合。

如图6A(较小的NFATc2变体)和图6B(其他NFAT家族蛋白质)所示，将稳定的Jurkat衍生的2sg-CAR细胞系用所示DNA构建体和BFP表达构建体转染，然后用CD19⁺Raji细胞刺激，该细胞系含有3个转基因((1)GFP报告基因，(2)靶向GFP的启动子区的sgRNA，和(3)靶向CD19的CAR)。两天后，收集细胞以进行流式细胞术分析。在流式细胞仪中采集样品之前，用抗CD3-APC780和CD22-PE对Raji刺激的细胞进行染色。将CD3⁺CD22^-细胞门控为Jurkat衍生的细胞。使用BFP表达来门控转染的细胞以供数据分析。含有核定位信号(NLS)的VP64-NLS-dCas9(SEQ ID NO:37)构建体能够在添加或不添加Raji细胞的情况下激活2sg-CAR细胞系中的GFP表达。去除NLS并将NFATc2氨基酸(aa)1-391附接至dCas9-VP64的N末端[NFATc2(aa1-391)-dCas9(SEQ ID NO:1)]可在不存在Raji细胞刺激的情况下降低dCas9激活GFP表达的活性(低GFP+％细胞)。仅在Raji刺激后，dCas9活性才恢复(大部分细胞变为GFP⁺)。利用跨越氨基酸(aa)1-286、aa1-253、aa 22-286、aa 22-253和aa 98-253的一些较短NFATc2变体的dCas9融合蛋白也能够在用Raji细胞刺激后激活GFP表达。相反，具有跨越氨基酸98-286的NFATc2变体的dCas9融合蛋白在所测试的实验条件下未显示出可诱导性(图6A)。类似地，NFATc4(aa1-400)-dCas9-VP64融合蛋白(SEQ ID NO:38)以依赖于Raji刺激的方式激活GFP表达，而NFAT5(aa1-263)-dCas9-VP64(SEQ ID NO:39)无法做到这一点(图6B)。结果提示，NFATc2以及其他NFAT家族蛋白质如NFATc4的较小变体也可以在图1和图2所述的系统中使用，以进行条件性基因调节。

如图7所示，以与图6A和图6B相同的方式建立实验，以测试衍生自RelA的替代可调节结构域，RelA是核因子κB(NF-κB)的p65组分。含NLS的NLS-dCas9(SEQ ID NO:37)构建体能够在添加或不添加Raji细胞的情况下激活2sg-CAR细胞系中的GFP表达。利用跨越氨基酸1-306(SEQ ID NO:40)的RelA变体的第一dCas9融合蛋白、利用跨越aa 19-306的RelA变体的一部分的第二dCas9融合蛋白和利用跨越aa 186-306的RelA变体的不同部分的第三dCas9融合蛋白都能够以依赖于Raji刺激的方式激活GFP表达(如较高的GFP⁺％细胞所示)，提示RelA也可以在如图1和图2所示的系统中使用，以供条件性基因调节。图7中使用的构建体包含VP64。

在进一步的实验中，Cas9被包括Cas12a(以前称为Cpf1)、C2c1、C2c3、Cas13a(以前称为C2c2)、Cas13b、Cas13c和Cas13d在内的其他CRISPR酶替代。

在进一步的实验中，使用非CRISPR酶代替Cas9。非CRISPR酶包括TALE核酸酶(TALEN)、锌指核酸酶(ZFN)或其他可靶向的DNA或RNA结合蛋白。

实施例7：核激素或配体感测CRISPR的创建

将无催化活性的dCas9与各种核激素受体的配体结合域融合，以创建由特定激素或配体控制的dCas9。在一个实验中，将dCas9与雌激素受体配体结合域融合，使得dCas9在雌激素结合后变为有活性的。

实施例8：甾醇感测CRISPR的创建

将无催化活性的dCas9与甾醇响应元件结合蛋白(SREBP)融合，以创建由甾醇剥夺控制的dCas9。

SREBP是胆固醇、甘油三酯和脂肪酸稳态的主要调节物。通过SREBP裂解激活蛋白(SCAP)感测的甾醇剥夺诱导细胞裂解SREBP，释放出氨基端结构域(nSREBP)，该结构域移位至细胞核。(Horton J D,Goldstein J L,Brown M S.SREBPs:activators of thecomplete program of cholesterol and fatty acid synthesis in the liver.TheJournal of clinical investigation.2002；109(9):1125-31.Epub 2002年5月8日.doi:10.1172/JCI15593.PubMed PMID:11994399；PubMed Central PMCID:PMC150968)。

在一个实验中，将dCas9与SREBP的氨基末端结构域融合，使得当释放氨基末端SREBP结构域并将其移位至细胞核中时，在甾醇剥夺时，dCas9移位至细胞核中。

实施例9：笼锁CRISPR的创建

将Cas9(例如，dCas9、切口酶Cas9或催化活性Cas9)与笼分子融合，以在特异性信号转导时实现CRISPR的受控释放。在其他实验中，将Cas9替换为Cas12a(以前称为Cpf1)、C2c1、C2c3、Cas13a(以前称为C2c2)、Cas13b、Cas13c、Cas13d、TALEN、ZFN或其他可靶向的DNA结合蛋白。

实施例10：响应于不同信号而在不同细胞类型中具有不同敏感性和特异性的其他可调节结构域

产生如实施例2-6中任一个所述的无催化活性(dCas9)系统，但是NFATc2被不同的可调节核定位域替代。

在一些实验中，可调节核定位域包含NF-ATc1蛋白的N末端区域。

在一些实验中，可调节核定位域包含NF-ATc2蛋白的N末端区域(也称为NFATp或NFAT1)。

在其他实验中，可调节核定位域包含NF-ATc3蛋白的N末端区域(也称为NFAT4或NFATx)。

在其他实验中，可调节核定位域包含NF-ATc4蛋白的N末端区域(也称为NFAT3)。

在其他实验中，可调节核定位域包含NF-AT5蛋白的N末端区域。

在其他实验中，可调节结构域包含RelA的一部分(也称为NF65，p65)。

在其他实验中，可调节结构域包含NFKB1 p50的一部分。在这样的情况下，融合蛋白可以响应于NFkB信号传导而被激活并移位至细胞核中。

在其他实验中，可调节结构域包含STAT的一部分(包含N末端和SH2结构域以及部分用作核定位信号(NLS)的卷曲螺旋结构域，其可以是STAT1、STAT2、STAT3、STAT4、STAT5(STAT5A和STAT5B)和STAT6。在这样的情况下，融合蛋白可以响应于干扰素信号传导、细胞因子的细胞外结合或生长因子而被激活。

在其他实验中，可调节结构域包含光或昼夜节律或电磁感应蛋白质的一部分，例如隐花色素(CRY1、CRY2)、Timeless(TIM)、PER蛋白的PAS域(PER1、PER2和PER3)。

实施例11：可调节系统作为治疗剂的用途和其他用途

当疾病中存在异常信号传导时，本文所述的任何实施例中描述的任何系统都可以用作治疗剂。在一个实例中，该系统用来激活肿瘤阻抑基因或细胞死亡相关基因，并诱导细胞死亡并杀死白血病或淋巴瘤中异常激活的T细胞或B细胞，而不杀死正常细胞。

在其他实例中，所选系统用来关闭癌基因(Ras、ROR、WT1等细胞内肿瘤抗原或癌基因)的激活、肿瘤抗原或细胞因子产生(CAR或癌症、EGFR、PD1、Her2、BRCA等，或任何这些的多种组合)或异常激活的细胞中的抗体产生(自身免疫病)。

在其他实例中，所选系统用来在异常激活的白血病或淋巴瘤或其他癌细胞/肿瘤细胞中产生特定的细胞因子、酶或抗体或其他外源添加的基因。

在其他实例中，所选系统用来激活将诱导T细胞免疫的基因或关闭在异常激活的白血病或淋巴瘤细胞或其他癌细胞/肿瘤细胞中参与肿瘤逃避免疫监视的基因。

实施例12：通过电磁辐射对基因表达的时间和空间控制

本文所述的本发明系统(图8)和方法可以应用于多种应用，包括组织修复，如肌肉再生。从患有外伤性肌肉损伤的患者中分离出肌肉干细胞(MuSC)。用嵌合蛋白转染MuSC，该嵌合蛋白包含与NFAT的NLS结构域以及KRAB转录阻抑物框内融合的无催化活性的dCas9。MuSC也被转染以表达靶向成肌蛋白启动子区域的一个或多个gRNA。在肌发生过程中，成肌蛋白部分地负责将MuSC从增殖状态转变为分化状态。MuSC还被电磁辐射可激活的信号传导单元(ORAI1跨膜钙通道和LOV2-Jα-SOAR细胞内蛋白质)转染，该单元最终通过钙依赖磷酸酶触发嵌合蛋白的NLS结构域的激活。一旦将工程化MuSC植入患者的损伤部位，便使用电磁辐射源对损伤部位(即治疗部位)持续施加电磁辐射。电磁辐射连续激活每个植入的工程化MuSC中的信号传导单元，从而连续引导嵌合蛋白的dCas9-KRAB结构域抑制成肌蛋白的表达。成肌蛋白的延长抑制促进了工程化MuSC的增殖增加，并产生大量的MuSC用于肌肉再生。在定义的时间段后，移除电磁辐射，以使大量的MuSC至少表达成肌蛋白，从而触发成肌分化和肌肉再生。

实施例13：通过电磁辐射和受体激活对靶基因的下调

如实施例3所述，能够进行CD19 CAR介导的PD1下调的Jurkat T细胞系进一步包括电磁辐射介导的下调PD1表达的机制。如实施例2所述，用可被电磁辐射激活的信号传导单元(ORAI1跨膜钙通道和LOV2-Jα-SOAR细胞内蛋白质)转染Jurkat T细胞系。在一些情况下，T细胞表面上的CD19 CAR可被胞外酶(例如蛋白酶)降解，这可降低下调PD1的能力。在这样的情况下，可以通过施加电磁辐射利用电磁辐射介导的机制来进一步下调PD1。

虽然本文已经显示并描述了本发明的优选实施方案，但是对于本领域技术人员显而易见的是，这些实施方案仅以示例的方式提供。在不脱离本发明的情况下，本领域技术人员现将想到许多变化、改变和替换。应当理解，在实施本发明的过程中可以采用本文所述的本发明实施方案的各种替代方案。旨在用以下权利要求书限定本发明的范围，并由此涵盖在这些权利要求范围内的方法和结构及其等同物。

序列表

<110> 瑞非生物科技有限公司

<120> 经由基因调节多肽的条件性核定位的基因调节

<130> 50489-711.601

<140>

<141>

<150> 62/675,134

<151> 2018-05-22

<150> 62/647,543

<151> 2018-03-23

<160> 40

<170> PatentIn version 3.5

<210> 1

<211> 1839

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 1

Met Asn Ala Pro Glu Arg Gln Pro Gln Pro Asp Gly Gly Asp Ala Pro

1 5 10 15

Gly His Glu Pro Gly Gly Ser Pro Gln Asp Glu Leu Asp Phe Ser Ile

20 25 30

Leu Phe Asp Tyr Glu Tyr Leu Asn Pro Asn Glu Glu Glu Pro Asn Ala

35 40 45

His Lys Val Ala Ser Pro Pro Ser Gly Pro Ala Tyr Pro Asp Asp Val

50 55 60

Leu Asp Tyr Gly Leu Lys Pro Tyr Ser Pro Leu Ala Ser Leu Ser Gly

65 70 75 80

Glu Pro Pro Gly Arg Phe Gly Glu Pro Asp Arg Val Gly Pro Gln Lys

85 90 95

Phe Leu Ser Ala Ala Lys Pro Ala Gly Ala Ser Gly Leu Ser Pro Arg

100 105 110

Ile Glu Ile Thr Pro Ser His Glu Leu Ile Gln Ala Val Gly Pro Leu

115 120 125

Arg Met Arg Asp Ala Gly Leu Leu Val Glu Gln Pro Pro Leu Ala Gly

130 135 140

Val Ala Ala Ser Pro Arg Phe Thr Leu Pro Val Pro Gly Phe Glu Gly

145 150 155 160

Tyr Arg Glu Pro Leu Cys Leu Ser Pro Ala Ser Ser Gly Ser Ser Ala

165 170 175

Ser Phe Ile Ser Asp Thr Phe Ser Pro Tyr Thr Ser Pro Cys Val Ser

180 185 190

Pro Asn Asn Gly Gly Pro Asp Asp Leu Cys Pro Gln Phe Gln Asn Ile

195 200 205

Pro Ala His Tyr Ser Pro Arg Thr Ser Pro Ile Met Ser Pro Arg Thr

210 215 220

Ser Leu Ala Glu Asp Ser Cys Leu Gly Arg His Ser Pro Val Pro Arg

225 230 235 240

Pro Ala Ser Arg Ser Ser Ser Pro Gly Ala Lys Arg Arg His Ser Cys

245 250 255

Ala Glu Ala Leu Val Ala Leu Pro Pro Gly Ala Ser Pro Gln Arg Ser

260 265 270

Arg Ser Pro Ser Pro Gln Pro Ser Ser His Val Ala Pro Gln Asp His

275 280 285

Gly Ser Pro Ala Gly Tyr Pro Pro Val Ala Gly Ser Ala Val Ile Met

290 295 300

Asp Ala Leu Asn Ser Leu Ala Thr Asp Ser Pro Cys Gly Ile Pro Pro

305 310 315 320

Lys Met Trp Lys Thr Ser Pro Asp Pro Ser Pro Val Ser Ala Ala Pro

325 330 335

Ser Lys Ala Gly Leu Pro Arg His Ile Tyr Pro Ala Val Glu Phe Leu

340 345 350

Gly Pro Cys Glu Gln Gly Glu Arg Arg Asn Ser Ala Pro Glu Ser Ile

355 360 365

Leu Leu Val Pro Pro Thr Trp Pro Lys Pro Leu Val Pro Ala Ile Pro

370 375 380

Ile Cys Ser Ile Pro Val Thr Thr Ser Asp Lys Lys Tyr Ser Ile Gly

385 390 395 400

Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu

405 410 415

Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg

420 425 430

His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly

435 440 445

Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr

450 455 460

Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn

465 470 475 480

Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser

485 490 495

Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly

500 505 510

Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr

515 520 525

His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg

530 535 540

Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe

545 550 555 560

Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu

565 570 575

Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro

580 585 590

Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu

595 600 605

Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu

610 615 620

Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu

625 630 635 640

Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu

645 650 655

Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala

660 665 670

Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu

675 680 685

Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile

690 695 700

Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His

705 710 715 720

His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro

725 730 735

Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala

740 745 750

Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile

755 760 765

Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys

770 775 780

Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly

785 790 795 800

Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg

805 810 815

Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile

820 825 830

Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala

835 840 845

Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr

850 855 860

Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala

865 870 875 880

Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn

885 890 895

Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val

900 905 910

Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys

915 920 925

Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu

930 935 940

Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr

945 950 955 960

Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu

965 970 975

Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile

980 985 990

Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu

995 1000 1005

Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met

1010 1015 1020

Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys

1025 1030 1035

Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg

1040 1045 1050

Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly

1055 1060 1065

Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg

1070 1075 1080

Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu

1085 1090 1095

Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His

1100 1105 1110

Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

1115 1120 1125

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met

1130 1135 1140

Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu

1145 1150 1155

Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met

1160 1165 1170

Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu

1175 1180 1185

Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu

1190 1195 1200

Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln

1205 1210 1215

Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile

1220 1225 1230

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val

1235 1240 1245

Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro

1250 1255 1260

Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu

1265 1270 1275

Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr

1280 1285 1290

Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe

1295 1300 1305

Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val

1310 1315 1320

Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn

1325 1330 1335

Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys

1340 1345 1350

Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

1355 1360 1365

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala

1370 1375 1380

Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser

1385 1390 1395

Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met

1400 1405 1410

Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr

1415 1420 1425

Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr

1430 1435 1440

Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn

1445 1450 1455

Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala

1460 1465 1470

Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys

1475 1480 1485

Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu

1490 1495 1500

Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp

1505 1510 1515

Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr

1520 1525 1530

Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys

1535 1540 1545

Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg

1550 1555 1560

Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly

1565 1570 1575

Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr

1580 1585 1590

Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser

1595 1600 1605

Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys

1610 1615 1620

Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys

1625 1630 1635

Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln

1640 1645 1650

His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe

1655 1660 1665

Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu

1670 1675 1680

Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala

1685 1690 1695

Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro

1700 1705 1710

Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr

1715 1720 1725

Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser

1730 1735 1740

Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly

1745 1750 1755

Gly Asp Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Gly

1760 1765 1770

Ser Gly Asp Gly Ile Gly Ser Gly Ser Asn Gly Ser Ser Leu Asp

1775 1780 1785

Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu

1790 1795 1800

Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp

1805 1810 1815

Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp

1820 1825 1830

Leu Asp Met Leu Gly Ser

1835

<210> 2

<211> 7

<212> PRT

<213> 猿猴病毒40

<400> 2

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 3

<211> 16

<212> PRT

<213> 未知

<220>

<223> “未知”的描述：

核质蛋白二分NLS序列

<400> 3

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1 5 10 15

<210> 4

<211> 9

<212> PRT

<213> 未知

<220>

<223> “未知”的描述：

C-myc NLS序列

<400> 4

Pro Ala Ala Lys Arg Val Lys Leu Asp

1 5

<210> 5

<211> 11

<212> PRT

<213> 未知

<220>

<223> “未知”的描述：

C-myc NLS序列

<400> 5

Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro

1 5 10

<210> 6

<211> 38

<212> PRT

<213> 智人（Homo sapiens）

<400> 6

Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly

1 5 10 15

Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro

20 25 30

Arg Asn Gln Gly Gly Tyr

35

<210> 7

<211> 42

<212> PRT

<213> 未知

<220>

<223> “未知”的描述：

来自输入蛋白-alpha序列的IBB结构域

<400> 7

Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu

1 5 10 15

Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys

20 25 30

Asp Glu Gln Ile Leu Lys Arg Arg Asn Val

35 40

<210> 8

<211> 8

<212> PRT

<213> 未知

<220>

<223> “未知”的描述：

肌瘤T蛋白质序列

<400> 8

Val Ser Arg Lys Arg Pro Arg Pro

1 5

<210> 9

<211> 8

<212> PRT

<213> 未知

<220>

<223> “未知”的描述：

肌瘤T蛋白质序列

<400> 9

Pro Pro Lys Lys Ala Arg Glu Asp

1 5

<210> 10

<211> 8

<212> PRT

<213> 智人（Homo sapiens）

<400> 10

Pro Gln Pro Lys Lys Lys Pro Leu

1 5

<210> 11

<211> 12

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 11

Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro

1 5 10

<210> 12

<211> 5

<212> PRT

<213> 流感病毒

<400> 12

Asp Arg Leu Arg Arg

1 5

<210> 13

<211> 7

<212> PRT

<213> 流感病毒

<400> 13

Pro Lys Gln Lys Lys Arg Lys

1 5

<210> 14

<211> 10

<212> PRT

<213> 丁型肝炎病毒

<400> 14

Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu

1 5 10

<210> 15

<211> 10

<212> PRT

<213> 小家鼠（Mus musculus）

<400> 15

Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg

1 5 10

<210> 16

<211> 20

<212> PRT

<213> 智人（Homo sapiens）

<400> 16

Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys

1 5 10 15

Lys Ser Lys Lys

20

<210> 17

<211> 17

<212> PRT

<213> 智人（Homo sapiens）

<400> 17

Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys

1 5 10 15

Lys

<210> 18

<211> 5

<212> PRT

<213> 未知

<220>

<223> “未知”的描述：

双重酰化区域序列

<220>

<221> MOD_RES

<222> (4)..(4)

<223> 任何氨基酸

<400> 18

Met Gly Cys Xaa Cys

1 5

<210> 19

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

肽

<400> 19

Glu Thr Gln Arg Cys Thr Trp His Met Gly Glu Leu Val Trp Cys Glu

1 5 10 15

Arg Glu His Asn

20

<210> 20

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

肽

<400> 20

Lys Glu Ala Ser Cys Ser Tyr Trp Leu Gly Glu Leu Val Trp Cys Val

1 5 10 15

Ala Gly Val Glu

20

<210> 21

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

肽

<400> 21

Asp Cys Ala Trp His Leu Gly Glu Leu Val Trp Cys Thr

1 5 10

<210> 22

<211> 142

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 22

Leu Ala Thr Thr Leu Glu Arg Ile Glu Lys Asn Phe Val Ile Thr Asp

1 5 10 15

Pro Arg Leu Pro Asp Asn Pro Ile Ile Phe Ala Ser Asp Ser Phe Leu

20 25 30

Gln Leu Thr Glu Tyr Ser Arg Glu Glu Ile Leu Gly Arg Asn Cys Arg

35 40 45

Phe Leu Gln Gly Pro Glu Thr Asp Arg Ala Thr Val Arg Lys Ile Arg

50 55 60

Asp Ala Ile Asp Asn Gln Thr Glu Val Thr Val Gln Leu Ile Asn Tyr

65 70 75 80

Thr Lys Ser Gly Lys Lys Phe Trp Asn Leu Phe His Leu Gln Pro Met

85 90 95

Arg Asp Gln Lys Gly Asp Val Gln Tyr Phe Ile Gly Val Gln Leu Asp

100 105 110

Gly Thr Glu His Val Arg Asp Ala Ala Glu Arg Glu Gly Val Met Leu

115 120 125

Ile Lys Lys Thr Ala Glu Asn Ile Asp Glu Ala Ala Lys Glu

130 135 140

<210> 23

<211> 141

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 23

Met Leu Ala Thr Thr Leu Glu Arg Ile Glu Lys Asn Phe Val Ile Thr

1 5 10 15

Asp Pro Arg Leu Pro Asp Asn Pro Ile Ile Phe Ala Ser Asp Ser Phe

20 25 30

Leu Gln Leu Thr Glu Tyr Ser Arg Glu Glu Ile Leu Gly Arg Asn Cys

35 40 45

Arg Phe Leu Gln Gly Pro Glu Thr Asp Arg Ala Thr Val Arg Lys Ile

50 55 60

Arg Asp Ala Ile Asp Asn Gln Thr Glu Val Thr Val Gln Leu Ile Asn

65 70 75 80

Tyr Thr Lys Ser Gly Lys Lys Phe Trp Asn Leu Phe His Leu Gln Pro

85 90 95

Met Arg Asp Gln Lys Gly Asp Val Gln Tyr Phe Ile Gly Val Gln Leu

100 105 110

Asp Gly Thr Glu His Val Arg Asp Ala Ala Glu Arg Glu Gly Val Met

115 120 125

Leu Ile Lys Lys Thr Ala Glu Asn Ile Asp Glu Ala Ala

130 135 140

<210> 24

<211> 140

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 24

Leu Ala Thr Thr Leu Glu Arg Ile Glu Lys Asn Phe Val Ile Thr Asp

1 5 10 15

Pro Arg Leu Pro Asp Asn Pro Ile Ile Phe Ala Ser Asp Ser Phe Leu

20 25 30

Gln Leu Thr Glu Tyr Ser Arg Glu Glu Ile Leu Gly Arg Asn Cys Arg

35 40 45

Phe Leu Gln Gly Pro Glu Thr Asp Arg Ala Thr Val Arg Lys Ile Arg

50 55 60

Asp Ala Ile Asp Asn Gln Thr Glu Val Thr Val Gln Leu Ile Asn Tyr

65 70 75 80

Thr Lys Ser Gly Lys Lys Phe Trp Asn Leu Phe His Leu Gln Pro Met

85 90 95

Arg Asp Gln Lys Gly Asp Val Gln Tyr Phe Ile Gly Val Gln Leu Asp

100 105 110

Gly Thr Glu His Val Arg Asp Ala Ala Glu Arg Glu Gly Val Met Leu

115 120 125

Ile Lys Lys Thr Ala Glu Asn Ile Asp Glu Ala Ala

130 135 140

<210> 25

<211> 103

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 25

Met Leu Gln Lys Trp Leu Gln Leu Thr His Glu Val Glu Val Gln Tyr

1 5 10 15

Tyr Asn Ile Lys Lys Gln Asn Ala Glu Arg Gln Leu Gln Val Ala Lys

20 25 30

Glu Gly Ala Glu Lys Ile Lys Lys Lys Arg Asn Thr Leu Phe Gly Thr

35 40 45

Phe His Val Ala His Ser Ser Ser Leu Asp Asp Val Asp His Lys Ile

50 55 60

Leu Ala Ala Lys Gln Ala Leu Gly Glu Val Thr Ala Ala Leu Arg Glu

65 70 75 80

Arg Leu His Arg Trp Gln Gln Ile Glu Leu Leu Thr Gly Phe Thr Leu

85 90 95

Val His Asn Pro Gly Leu Pro

100

<210> 26

<211> 50

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<220>

<221> MISC_FEATURE

<222> (1)..(50)

<223> 该序列可包含3-50个残基

<400> 26

Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg

1 5 10 15

Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg

20 25 30

Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg

35 40 45

Arg Arg

50

<210> 27

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

肽

<400> 27

Arg Arg Arg Arg Arg Arg Arg Arg Arg

1 5

<210> 28

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

肽

<400> 28

Glu Glu Glu Glu Glu Glu Glu Glu Glu

1 5

<210> 29

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

肽

<400> 29

Gly Gly Gly Gly Ser

1 5

<210> 30

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

肽

<400> 30

Gly Gly Ser Gly

1

<210> 31

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

肽

<400> 31

Ser Gly Gly Gly

1

<210> 32

<211> 16

<212> PRT

<213> 黑腹果蝇（Drosophila melanogaster）

<400> 32

Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys

1 5 10 15

<210> 33

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

肽

<400> 33

Arg Arg Arg Arg Arg Arg Arg Arg

1 5

<210> 34

<211> 1447

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 34

Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Gly Ser Gly

1370 1375 1380

Asp Gly Ile Gly Ser Gly Ser Asn Gly Ser Ser Leu Asp Ala Leu

1385 1390 1395

Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp

1400 1405 1410

Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp

1415 1420 1425

Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp

1430 1435 1440

Met Leu Gly Ser

1445

<210> 35

<211> 2340

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 35

Met Asn Ala Pro Glu Arg Gln Pro Gln Pro Asp Gly Gly Asp Ala Pro

1 5 10 15

Gly His Glu Pro Gly Gly Ser Pro Gln Asp Glu Leu Asp Phe Ser Ile

20 25 30

Leu Phe Asp Tyr Glu Tyr Leu Asn Pro Asn Glu Glu Glu Pro Asn Ala

35 40 45

His Lys Val Ala Ser Pro Pro Ser Gly Pro Ala Tyr Pro Asp Asp Val

50 55 60

Leu Asp Tyr Gly Leu Lys Pro Tyr Ser Pro Leu Ala Ser Leu Ser Gly

65 70 75 80

Glu Pro Pro Gly Arg Phe Gly Glu Pro Asp Arg Val Gly Pro Gln Lys

85 90 95

Phe Leu Ser Ala Ala Lys Pro Ala Gly Ala Ser Gly Leu Ser Pro Arg

100 105 110

Ile Glu Ile Thr Pro Ser His Glu Leu Ile Gln Ala Val Gly Pro Leu

115 120 125

Arg Met Arg Asp Ala Gly Leu Leu Val Glu Gln Pro Pro Leu Ala Gly

130 135 140

Val Ala Ala Ser Pro Arg Phe Thr Leu Pro Val Pro Gly Phe Glu Gly

145 150 155 160

Tyr Arg Glu Pro Leu Cys Leu Ser Pro Ala Ser Ser Gly Ser Ser Ala

165 170 175

Ser Phe Ile Ser Asp Thr Phe Ser Pro Tyr Thr Ser Pro Cys Val Ser

180 185 190

Pro Asn Asn Gly Gly Pro Asp Asp Leu Cys Pro Gln Phe Gln Asn Ile

195 200 205

Pro Ala His Tyr Ser Pro Arg Thr Ser Pro Ile Met Ser Pro Arg Thr

210 215 220

Ser Leu Ala Glu Asp Ser Cys Leu Gly Arg His Ser Pro Val Pro Arg

225 230 235 240

Pro Ala Ser Arg Ser Ser Ser Pro Gly Ala Lys Arg Arg His Ser Cys

245 250 255

Ala Glu Ala Leu Val Ala Leu Pro Pro Gly Ala Ser Pro Gln Arg Ser

260 265 270

Arg Ser Pro Ser Pro Gln Pro Ser Ser His Val Ala Pro Gln Asp His

275 280 285

Gly Ser Pro Ala Gly Tyr Pro Pro Val Ala Gly Ser Ala Val Ile Met

290 295 300

Asp Ala Leu Asn Ser Leu Ala Thr Asp Ser Pro Cys Gly Ile Pro Pro

305 310 315 320

Lys Met Trp Lys Thr Ser Pro Asp Pro Ser Pro Val Ser Ala Ala Pro

325 330 335

Ser Lys Ala Gly Leu Pro Arg His Ile Tyr Pro Ala Val Glu Phe Leu

340 345 350

Gly Pro Cys Glu Gln Gly Glu Arg Arg Asn Ser Ala Pro Glu Ser Ile

355 360 365

Leu Leu Val Pro Pro Thr Trp Pro Lys Pro Leu Val Pro Ala Ile Pro

370 375 380

Ile Cys Ser Ile Pro Val Thr Ala Ser Leu Pro Pro Leu Glu Trp Pro

385 390 395 400

Leu Ser Ser Gln Ser Gly Ser Tyr Glu Leu Arg Ile Glu Val Gln Pro

405 410 415

Lys Pro His His Arg Ala His Tyr Glu Thr Glu Gly Ser Arg Gly Ala

420 425 430

Val Lys Ala Pro Thr Gly Gly His Pro Val Val Gln Leu His Gly Tyr

435 440 445

Met Glu Asn Lys Pro Leu Gly Leu Gln Ile Phe Ile Gly Thr Ala Asp

450 455 460

Glu Arg Ile Leu Lys Pro His Ala Phe Tyr Gln Val His Arg Ile Thr

465 470 475 480

Gly Lys Thr Val Thr Thr Thr Ser Tyr Glu Lys Ile Val Gly Asn Thr

485 490 495

Lys Val Leu Glu Ile Pro Leu Glu Pro Lys Asn Asn Met Arg Ala Thr

500 505 510

Ile Asp Cys Ala Gly Ile Leu Lys Leu Arg Asn Ala Asp Ile Glu Leu

515 520 525

Arg Lys Gly Glu Thr Asp Ile Gly Arg Lys Asn Thr Arg Val Arg Leu

530 535 540

Val Phe Arg Val His Ile Pro Glu Ser Ser Gly Arg Ile Val Ser Leu

545 550 555 560

Gln Thr Ala Ser Asn Pro Ile Glu Cys Ser Gln Arg Ser Ala His Glu

565 570 575

Leu Pro Met Val Glu Arg Gln Asp Thr Asp Ser Cys Leu Val Tyr Gly

580 585 590

Gly Gln Gln Met Ile Leu Thr Gly Gln Asn Phe Thr Ser Glu Ser Lys

595 600 605

Val Val Phe Thr Glu Lys Thr Thr Asp Gly Gln Gln Ile Trp Glu Met

610 615 620

Glu Ala Thr Val Asp Lys Asp Lys Ser Gln Pro Asn Met Leu Phe Val

625 630 635 640

Glu Ile Pro Glu Tyr Arg Asn Lys His Ile Arg Thr Pro Val Lys Val

645 650 655

Asn Phe Tyr Val Ile Asn Gly Lys Arg Lys Arg Ser Gln Pro Gln His

660 665 670

Phe Thr Tyr His Pro Val Pro Ala Ile Lys Thr Glu Pro Thr Asp Glu

675 680 685

Tyr Asp Pro Thr Leu Ile Cys Ser Pro Thr His Gly Gly Leu Gly Ser

690 695 700

Gln Pro Tyr Tyr Pro Gln His Pro Met Val Ala Glu Ser Pro Ser Cys

705 710 715 720

Leu Val Ala Thr Met Ala Pro Cys Gln Gln Phe Arg Thr Gly Leu Ser

725 730 735

Ser Pro Asp Ala Arg Tyr Gln Gln Gln Asn Pro Ala Ala Val Leu Tyr

740 745 750

Gln Arg Ser Lys Ser Leu Ser Pro Ser Leu Leu Gly Tyr Gln Gln Pro

755 760 765

Ala Leu Met Ala Ala Pro Leu Ser Leu Ala Asp Ala His Arg Ser Val

770 775 780

Leu Val His Ala Gly Ser Gln Gly Gln Ser Ser Ala Leu Leu His Pro

785 790 795 800

Ser Pro Thr Asn Gln Gln Ala Ser Pro Val Ile His Tyr Ser Pro Thr

805 810 815

Asn Gln Gln Leu Arg Cys Gly Ser His Gln Glu Phe Gln His Ile Met

820 825 830

Tyr Cys Glu Asn Phe Ala Pro Gly Thr Thr Arg Pro Gly Pro Pro Pro

835 840 845

Val Ser Gln Gly Gln Arg Leu Ser Pro Gly Ser Tyr Pro Thr Val Ile

850 855 860

Gln Gln Gln Asn Ala Thr Ser Gln Arg Ala Ala Lys Asn Gly Pro Pro

865 870 875 880

Val Ser Asp Gln Lys Glu Val Leu Pro Ala Gly Val Thr Ile Lys Gln

885 890 895

Glu Gln Asn Leu Asp Gln Thr Tyr Leu Asp Asp Val Asn Glu Ile Ile

900 905 910

Arg Lys Glu Phe Ser Gly Pro Pro Ala Arg Asn Gln Thr Thr Ser Asp

915 920 925

Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp

930 935 940

Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val

945 950 955 960

Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala

965 970 975

Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg

980 985 990

Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu

995 1000 1005

Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe

1010 1015 1020

Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

1025 1030 1035

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala

1040 1045 1050

Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu

1055 1060 1065

Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala

1070 1075 1080

Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly

1085 1090 1095

Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln

1100 1105 1110

Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn

1115 1120 1125

Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

1130 1135 1140

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu

1145 1150 1155

Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly

1160 1165 1170

Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala

1175 1180 1185

Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn

1190 1195 1200

Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala

1205 1210 1215

Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg

1220 1225 1230

Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile

1235 1240 1245

Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala

1250 1255 1260

Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

1265 1270 1275

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala

1280 1285 1290

Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys

1295 1300 1305

Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp

1310 1315 1320

Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His

1325 1330 1335

Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu

1340 1345 1350

Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys

1355 1360 1365

Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

1370 1375 1380

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr

1385 1390 1395

Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser

1400 1405 1410

Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu

1415 1420 1425

Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr

1430 1435 1440

Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu

1445 1450 1455

Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala

1460 1465 1470

Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys

1475 1480 1485

Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser

1490 1495 1500

Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

1505 1510 1515

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu

1520 1525 1530

Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr

1535 1540 1545

Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys

1550 1555 1560

Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys

1565 1570 1575

Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile

1580 1585 1590

Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe

1595 1600 1605

Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

1610 1615 1620

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln

1625 1630 1635

Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu

1640 1645 1650

Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys

1655 1660 1665

Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu

1670 1675 1680

Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys

1685 1690 1695

Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly

1700 1705 1710

Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu

1715 1720 1725

Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln

1730 1735 1740

Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

1745 1750 1755

Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu

1760 1765 1770

Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys

1775 1780 1785

Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys

1790 1795 1800

Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile

1805 1810 1815

Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly

1820 1825 1830

Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val

1835 1840 1845

Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

1850 1855 1860

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu

1865 1870 1875

Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg

1880 1885 1890

Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His

1895 1900 1905

His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu

1910 1915 1920

Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp

1925 1930 1935

Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln

1940 1945 1950

Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile

1955 1960 1965

Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile

1970 1975 1980

Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile

1985 1990 1995

Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu

2000 2005 2010

Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr

2015 2020 2025

Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp

2030 2035 2040

Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly

2045 2050 2055

Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala

2060 2065 2070

Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu

2075 2080 2085

Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn

2090 2095 2100

Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys

2105 2110 2115

Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu

2120 2125 2130

Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys

2135 2140 2145

Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr

2150 2155 2160

Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn

2165 2170 2175

Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp

2180 2185 2190

Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu

2195 2200 2205

Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His

2210 2215 2220

Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu

2225 2230 2235

Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe

2240 2245 2250

Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val

2255 2260 2265

Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu

2270 2275 2280

Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ala Tyr Pro Tyr

2285 2290 2295

Asp Val Pro Asp Tyr Ala Pro Arg Lys Asn Ser Ser Leu Glu Gly

2300 2305 2310

Pro Phe Lys Pro Ala Asp Gln Pro Arg Leu Cys Leu Leu Val Ala

2315 2320 2325

Ser His Leu Leu Phe Ala Pro Pro Pro Cys Leu Pro

2330 2335 2340

<210> 36

<211> 1857

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 36

Met Asn Ala Pro Glu Arg Gln Pro Gln Pro Asp Gly Gly Asp Ala Pro

1 5 10 15

Gly His Glu Pro Gly Gly Ser Pro Gln Asp Glu Leu Asp Phe Ser Ile

20 25 30

Leu Phe Asp Tyr Glu Tyr Leu Asn Pro Asn Glu Glu Glu Pro Asn Ala

35 40 45

His Lys Val Ala Ser Pro Pro Ser Gly Pro Ala Tyr Pro Asp Asp Val

50 55 60

Leu Asp Tyr Gly Leu Lys Pro Tyr Ser Pro Leu Ala Ser Leu Ser Gly

65 70 75 80

Glu Pro Pro Gly Arg Phe Gly Glu Pro Asp Arg Val Gly Pro Gln Lys

85 90 95

Phe Leu Ser Ala Ala Lys Pro Ala Gly Ala Ser Gly Leu Ser Pro Arg

100 105 110

Ile Glu Ile Thr Pro Ser His Glu Leu Ile Gln Ala Val Gly Pro Leu

115 120 125

Arg Met Arg Asp Ala Gly Leu Leu Val Glu Gln Pro Pro Leu Ala Gly

130 135 140

Val Ala Ala Ser Pro Arg Phe Thr Leu Pro Val Pro Gly Phe Glu Gly

145 150 155 160

Tyr Arg Glu Pro Leu Cys Leu Ser Pro Ala Ser Ser Gly Ser Ser Ala

165 170 175

Ser Phe Ile Ser Asp Thr Phe Ser Pro Tyr Thr Ser Pro Cys Val Ser

180 185 190

Pro Asn Asn Gly Gly Pro Asp Asp Leu Cys Pro Gln Phe Gln Asn Ile

195 200 205

Pro Ala His Tyr Ser Pro Arg Thr Ser Pro Ile Met Ser Pro Arg Thr

210 215 220

Ser Leu Ala Glu Asp Ser Cys Leu Gly Arg His Ser Pro Val Pro Arg

225 230 235 240

Pro Ala Ser Arg Ser Ser Ser Pro Gly Ala Lys Arg Arg His Ser Cys

245 250 255

Ala Glu Ala Leu Val Ala Leu Pro Pro Gly Ala Ser Pro Gln Arg Ser

260 265 270

Arg Ser Pro Ser Pro Gln Pro Ser Ser His Val Ala Pro Gln Asp His

275 280 285

Gly Ser Pro Ala Gly Tyr Pro Pro Val Ala Gly Ser Ala Val Ile Met

290 295 300

Asp Ala Leu Asn Ser Leu Ala Thr Asp Ser Pro Cys Gly Ile Pro Pro

305 310 315 320

Lys Met Trp Lys Thr Ser Pro Asp Pro Ser Pro Val Ser Ala Ala Pro

325 330 335

Ser Lys Ala Gly Leu Pro Arg His Ile Tyr Pro Ala Val Glu Phe Leu

340 345 350

Gly Pro Cys Glu Gln Gly Glu Arg Arg Asn Ser Ala Pro Glu Ser Ile

355 360 365

Leu Leu Val Pro Pro Thr Trp Pro Lys Pro Leu Val Pro Ala Ile Pro

370 375 380

Ile Cys Ser Ile Pro Val Thr Thr Ser Asp Lys Lys Tyr Ser Ile Gly

385 390 395 400

Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu

405 410 415

Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg

420 425 430

His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly

435 440 445

Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr

450 455 460

Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn

465 470 475 480

Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser

485 490 495

Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly

500 505 510

Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr

515 520 525

His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg

530 535 540

Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe

545 550 555 560

Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu

565 570 575

Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro

580 585 590

Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu

595 600 605

Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu

610 615 620

Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu

625 630 635 640

Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu

645 650 655

Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala

660 665 670

Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu

675 680 685

Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile

690 695 700

Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His

705 710 715 720

His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro

725 730 735

Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala

740 745 750

Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile

755 760 765

Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys

770 775 780

Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly

785 790 795 800

Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg

805 810 815

Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile

820 825 830

Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala

835 840 845

Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr

850 855 860

Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala

865 870 875 880

Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn

885 890 895

Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val

900 905 910

Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys

915 920 925

Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu

930 935 940

Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr

945 950 955 960

Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu

965 970 975

Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile

980 985 990

Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu

995 1000 1005

Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met

1010 1015 1020

Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys

1025 1030 1035

Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg

1040 1045 1050

Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly

1055 1060 1065

Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg

1070 1075 1080

Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu

1085 1090 1095

Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His

1100 1105 1110

Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

1115 1120 1125

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met

1130 1135 1140

Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu

1145 1150 1155

Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met

1160 1165 1170

Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu

1175 1180 1185

Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu

1190 1195 1200

Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln

1205 1210 1215

Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile

1220 1225 1230

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val

1235 1240 1245

Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro

1250 1255 1260

Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu

1265 1270 1275

Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr

1280 1285 1290

Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe

1295 1300 1305

Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val

1310 1315 1320

Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn

1325 1330 1335

Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys

1340 1345 1350

Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

1355 1360 1365

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala

1370 1375 1380

Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser

1385 1390 1395

Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met

1400 1405 1410

Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr

1415 1420 1425

Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr

1430 1435 1440

Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn

1445 1450 1455

Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala

1460 1465 1470

Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys

1475 1480 1485

Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu

1490 1495 1500

Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp

1505 1510 1515

Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr

1520 1525 1530

Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys

1535 1540 1545

Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg

1550 1555 1560

Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly

1565 1570 1575

Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr

1580 1585 1590

Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser

1595 1600 1605

Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys

1610 1615 1620

Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys

1625 1630 1635

Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln

1640 1645 1650

His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe

1655 1660 1665

Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu

1670 1675 1680

Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala

1685 1690 1695

Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro

1700 1705 1710

Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr

1715 1720 1725

Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser

1730 1735 1740

Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly

1745 1750 1755

Gly Asp Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Gly

1760 1765 1770

Ser Gly Ser Gly Gly Ser Gly Gly Gly Ser Met Asp Ala Lys Ser

1775 1780 1785

Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe

1790 1795 1800

Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln

1805 1810 1815

Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu

1820 1825 1830

Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

1835 1840 1845

Leu Glu Lys Gly Glu Glu Pro Leu Glu

1850 1855

<210> 37

<211> 1475

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 37

Met Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala

1 5 10 15

Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp

20 25 30

Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu

35 40 45

Asp Met Leu Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ser Asp Lys

50 55 60

Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala

65 70 75 80

Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu

85 90 95

Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu

100 105 110

Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr

115 120 125

Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln

130 135 140

Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His

145 150 155 160

Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg

165 170 175

His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys

180 185 190

Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp

195 200 205

Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys

210 215 220

Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser

225 230 235 240

Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu

245 250 255

Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile

260 265 270

Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala

275 280 285

Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala

290 295 300

Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala

305 310 315 320

Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu

325 330 335

Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu

340 345 350

Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg

355 360 365

Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys

370 375 380

Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val

385 390 395 400

Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser

405 410 415

Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu

420 425 430

Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu

435 440 445

Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg

450 455 460

Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu

465 470 475 480

His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp

485 490 495

Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr

500 505 510

Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg

515 520 525

Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp

530 535 540

Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp

545 550 555 560

Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr

565 570 575

Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr

580 585 590

Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala

595 600 605

Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln

610 615 620

Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu

625 630 635 640

Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His

645 650 655

Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu

660 665 670

Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu

675 680 685

Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe

690 695 700

Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp

705 710 715 720

Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser

725 730 735

Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg

740 745 750

Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp

755 760 765

Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His

770 775 780

Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln

785 790 795 800

Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys

805 810 815

Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln

820 825 830

Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly

835 840 845

Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn

850 855 860

Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly

865 870 875 880

Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp

885 890 895

Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser

900 905 910

Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser

915 920 925

Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp

930 935 940

Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn

945 950 955 960

Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly

965 970 975

Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val

980 985 990

Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp

995 1000 1005

Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu

1010 1015 1020

Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu

1025 1030 1035

Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

1040 1045 1050

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu

1055 1060 1065

Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile

1070 1075 1080

Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe

1085 1090 1095

Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu

1100 1105 1110

Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly

1115 1120 1125

Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr

1130 1135 1140

Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys

1145 1150 1155

Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro

1160 1165 1170

Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp

1175 1180 1185

Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser

1190 1195 1200

Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu

1205 1210 1215

Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser

1220 1225 1230

Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr

1235 1240 1245

Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser

1250 1255 1260

Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala

1265 1270 1275

Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr

1280 1285 1290

Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly

1295 1300 1305

Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His

1310 1315 1320

Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser

1325 1330 1335

Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser

1340 1345 1350

Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu

1355 1360 1365

Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala

1370 1375 1380

Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr

1385 1390 1395

Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile

1400 1405 1410

Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly

1415 1420 1425

Asp Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Pro Arg Lys Asn

1430 1435 1440

Ser Ser Leu Glu Gly Pro Phe Lys Pro Ala Asp Gln Pro Arg Leu

1445 1450 1455

Cys Leu Leu Val Ala Ser His Leu Leu Phe Ala Pro Pro Pro Cys

1460 1465 1470

Leu Pro

1475

<210> 38

<211> 1848

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 38

Met Gly Ala Ala Ser Cys Glu Asp Glu Glu Leu Glu Phe Lys Leu Val

1 5 10 15

Phe Gly Glu Glu Lys Glu Ala Pro Pro Leu Gly Ala Gly Gly Leu Gly

20 25 30

Glu Glu Leu Asp Ser Glu Asp Ala Pro Pro Cys Cys Arg Leu Ala Leu

35 40 45

Gly Glu Pro Pro Pro Tyr Gly Ala Ala Pro Ile Gly Ile Pro Arg Pro

50 55 60

Pro Pro Pro Arg Pro Gly Met His Ser Pro Pro Pro Arg Pro Ala Pro

65 70 75 80

Ser Pro Gly Thr Trp Glu Ser Gln Pro Ala Arg Ser Val Arg Leu Gly

85 90 95

Gly Pro Gly Gly Gly Ala Gly Gly Ala Gly Gly Gly Arg Val Leu Glu

100 105 110

Cys Pro Ser Ile Arg Ile Thr Ser Ile Ser Pro Thr Pro Glu Pro Pro

115 120 125

Ala Ala Leu Glu Asp Asn Pro Asp Ala Trp Gly Asp Gly Ser Pro Arg

130 135 140

Asp Tyr Pro Pro Pro Glu Gly Phe Gly Gly Tyr Arg Glu Ala Gly Gly

145 150 155 160

Gln Gly Gly Gly Ala Phe Phe Ser Pro Ser Pro Gly Ser Ser Ser Leu

165 170 175

Ser Ser Trp Ser Phe Phe Ser Asp Ala Ser Asp Glu Ala Ala Leu Tyr

180 185 190

Ala Ala Cys Asp Glu Val Glu Ser Glu Leu Asn Glu Ala Ala Ser Arg

195 200 205

Phe Gly Leu Gly Ser Pro Leu Pro Ser Pro Arg Ala Ser Pro Arg Pro

210 215 220

Trp Thr Pro Glu Asp Pro Trp Ser Leu Tyr Gly Pro Ser Pro Gly Gly

225 230 235 240

Arg Gly Pro Glu Asp Ser Trp Leu Leu Leu Ser Ala Pro Gly Pro Thr

245 250 255

Pro Ala Ser Pro Arg Pro Ala Ser Pro Cys Gly Lys Arg Arg Tyr Ser

260 265 270

Ser Ser Gly Thr Pro Ser Ser Ala Ser Pro Ala Leu Ser Arg Arg Gly

275 280 285

Ser Leu Gly Glu Glu Gly Ser Glu Pro Pro Pro Pro Pro Pro Leu Pro

290 295 300

Leu Ala Arg Asp Pro Gly Ser Pro Gly Pro Phe Asp Tyr Val Gly Ala

305 310 315 320

Pro Pro Ala Glu Ser Ile Pro Gln Lys Thr Arg Arg Thr Ser Ser Glu

325 330 335

Gln Ala Val Ala Leu Pro Arg Ser Glu Glu Pro Ala Ser Cys Asn Gly

340 345 350

Lys Leu Pro Leu Gly Ala Glu Glu Ser Val Ala Pro Pro Gly Gly Ser

355 360 365

Arg Lys Glu Val Ala Gly Met Asp Tyr Leu Ala Val Pro Ser Pro Leu

370 375 380

Ala Trp Ser Lys Ala Arg Ile Gly Gly His Ser Pro Ile Phe Arg Thr

385 390 395 400

Thr Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser

405 410 415

Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys

420 425 430

Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu

435 440 445

Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg

450 455 460

Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile

465 470 475 480

Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp

485 490 495

Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys

500 505 510

Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala

515 520 525

Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val

530 535 540

Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala

545 550 555 560

His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn

565 570 575

Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr

580 585 590

Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp

595 600 605

Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu

610 615 620

Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly

625 630 635 640

Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn

645 650 655

Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr

660 665 670

Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala

675 680 685

Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser

690 695 700

Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala

705 710 715 720

Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu

725 730 735

Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe

740 745 750

Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala

755 760 765

Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met

770 775 780

Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu

785 790 795 800

Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His

805 810 815

Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro

820 825 830

Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg

835 840 845

Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala

850 855 860

Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu

865 870 875 880

Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met

885 890 895

Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His

900 905 910

Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val

915 920 925

Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu

930 935 940

Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val

945 950 955 960

Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe

965 970 975

Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu

980 985 990

Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu

995 1000 1005

Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr

1010 1015 1020

Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys

1025 1030 1035

Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys

1040 1045 1050

Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile

1055 1060 1065

Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe

1070 1075 1080

Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

1085 1090 1095

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln

1100 1105 1110

Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu

1115 1120 1125

Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys

1130 1135 1140

Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu

1145 1150 1155

Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys

1160 1165 1170

Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly

1175 1180 1185

Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu

1190 1195 1200

Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln

1205 1210 1215

Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

1220 1225 1230

Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu

1235 1240 1245

Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys

1250 1255 1260

Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys

1265 1270 1275

Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile

1280 1285 1290

Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly

1295 1300 1305

Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val

1310 1315 1320

Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

1325 1330 1335

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu

1340 1345 1350

Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg

1355 1360 1365

Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His

1370 1375 1380

His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu

1385 1390 1395

Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp

1400 1405 1410

Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln

1415 1420 1425

Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile

1430 1435 1440

Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile

1445 1450 1455

Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile

1460 1465 1470

Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu

1475 1480 1485

Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr

1490 1495 1500

Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp

1505 1510 1515

Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly

1520 1525 1530

Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala

1535 1540 1545

Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu

1550 1555 1560

Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn

1565 1570 1575

Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys

1580 1585 1590

Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu

1595 1600 1605

Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys

1610 1615 1620

Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr

1625 1630 1635

Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn

1640 1645 1650

Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp

1655 1660 1665

Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu

1670 1675 1680

Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His

1685 1690 1695

Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu

1700 1705 1710

Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe

1715 1720 1725

Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val

1730 1735 1740

Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu

1745 1750 1755

Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ala Tyr Pro Tyr

1760 1765 1770

Asp Val Pro Asp Tyr Ala Ser Leu Gly Ser Gly Asp Gly Ile Gly

1775 1780 1785

Ser Gly Ser Asn Gly Ser Ser Leu Asp Ala Leu Asp Asp Phe Asp

1790 1795 1800

Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp

1805 1810 1815

Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu

1820 1825 1830

Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser

1835 1840 1845

<210> 39

<211> 1711

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 39

Met Pro Ser Asp Phe Ile Ser Leu Leu Ser Ala Asp Leu Asp Leu Glu

1 5 10 15

Ser Pro Lys Ser Leu Tyr Ser Arg Glu Ser Val Tyr Asp Leu Leu Pro

20 25 30

Lys Glu Leu Gln Leu Pro Pro Ser Arg Glu Thr Ser Val Ala Ser Met

35 40 45

Ser Gln Thr Ser Gly Gly Glu Ala Gly Ser Pro Pro Pro Ala Val Val

50 55 60

Ala Ala Asp Ala Ser Ser Ala Pro Ser Ser Ser Ser Met Gly Gly Ala

65 70 75 80

Cys Ser Ser Phe Thr Thr Ser Ser Ser Pro Thr Ile Tyr Ser Thr Ser

85 90 95

Val Thr Asp Ser Lys Ala Met Gln Val Glu Ser Cys Ser Ser Ala Val

100 105 110

Gly Val Ser Asn Arg Gly Val Ser Glu Lys Gln Leu Thr Ser Asn Thr

115 120 125

Val Gln Gln His Pro Ser Thr Pro Lys Arg His Thr Val Leu Tyr Ile

130 135 140

Ser Pro Pro Pro Glu Asp Leu Leu Asp Asn Ser Arg Met Ser Cys Gln

145 150 155 160

Asp Glu Gly Cys Gly Leu Glu Ser Glu Gln Ser Cys Ser Met Trp Met

165 170 175

Glu Asp Ser Pro Ser Asn Phe Ser Asn Met Ser Thr Ser Ser Tyr Asn

180 185 190

Asp Asn Thr Glu Val Pro Arg Lys Ser Arg Lys Arg Asn Pro Lys Gln

195 200 205

Arg Pro Gly Val Lys Arg Arg Asp Cys Glu Glu Ser Asn Met Asp Ile

210 215 220

Phe Asp Ala Asp Ser Ala Lys Ala Pro His Tyr Val Leu Ser Gln Leu

225 230 235 240

Thr Thr Asp Asn Lys Gly Asn Ser Lys Ala Gly Asn Gly Thr Leu Glu

245 250 255

Asn Gln Lys Gly Thr Gly Val Thr Ser Asp Lys Lys Tyr Ser Ile Gly

260 265 270

Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu

275 280 285

Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg

290 295 300

His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly

305 310 315 320

Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr

325 330 335

Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn

340 345 350

Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser

355 360 365

Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly

370 375 380

Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr

385 390 395 400

His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg

405 410 415

Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe

420 425 430

Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu

435 440 445

Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro

450 455 460

Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu

465 470 475 480

Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu

485 490 495

Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu

500 505 510

Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu

515 520 525

Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala

530 535 540

Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu

545 550 555 560

Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile

565 570 575

Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His

580 585 590

His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro

595 600 605

Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala

610 615 620

Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile

625 630 635 640

Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys

645 650 655

Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly

660 665 670

Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg

675 680 685

Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile

690 695 700

Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala

705 710 715 720

Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr

725 730 735

Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala

740 745 750

Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn

755 760 765

Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val

770 775 780

Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys

785 790 795 800

Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu

805 810 815

Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr

820 825 830

Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu

835 840 845

Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile

850 855 860

Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu

865 870 875 880

Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile

885 890 895

Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met

900 905 910

Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg

915 920 925

Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu

930 935 940

Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu

945 950 955 960

Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln

965 970 975

Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala

980 985 990

Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val

995 1000 1005

Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile

1010 1015 1020

Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln

1025 1030 1035

Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys

1040 1045 1050

Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr

1055 1060 1065

Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly

1070 1075 1080

Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser

1085 1090 1095

Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp

1100 1105 1110

Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

1115 1120 1125

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met

1130 1135 1140

Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln

1145 1150 1155

Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser

1160 1165 1170

Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr

1175 1180 1185

Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met

1190 1195 1200

Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys

1205 1210 1215

Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

1220 1225 1230

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala

1235 1240 1245

His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys

1250 1255 1260

Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys

1265 1270 1275

Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile

1280 1285 1290

Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn

1295 1300 1305

Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys

1310 1315 1320

Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp

1325 1330 1335

Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met

1340 1345 1350

Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1355 1360 1365

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu

1370 1375 1380

Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe

1385 1390 1395

Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val

1400 1405 1410

Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu

1415 1420 1425

Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile

1430 1435 1440

Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu

1445 1450 1455

Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly

1460 1465 1470

Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn

1475 1480 1485

Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala

1490 1495 1500

Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln

1505 1510 1515

Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile

1520 1525 1530

Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp

1535 1540 1545

Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp

1550 1555 1560

Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr

1565 1570 1575

Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr

1580 1585 1590

Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1595 1600 1605

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg

1610 1615 1620

Ile Asp Leu Ser Gln Leu Gly Gly Asp Ala Tyr Pro Tyr Asp Val

1625 1630 1635

Pro Asp Tyr Ala Ser Leu Gly Ser Gly Asp Gly Ile Gly Ser Gly

1640 1645 1650

Ser Asn Gly Ser Ser Leu Asp Ala Leu Asp Asp Phe Asp Leu Asp

1655 1660 1665

Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu

1670 1675 1680

Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser

1685 1690 1695

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser

1700 1705 1710

<210> 40

<211> 1754

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成

多肽

<400> 40

Met Asp Glu Leu Phe Pro Leu Ile Phe Pro Ala Glu Pro Ala Gln Ala

1 5 10 15

Ser Gly Pro Tyr Val Glu Ile Ile Glu Gln Pro Lys Gln Arg Gly Met

20 25 30

Arg Phe Arg Tyr Lys Cys Glu Gly Arg Ser Ala Gly Ser Ile Pro Gly

35 40 45

Glu Arg Ser Thr Asp Thr Thr Lys Thr His Pro Thr Ile Lys Ile Asn

50 55 60

Gly Tyr Thr Gly Pro Gly Thr Val Arg Ile Ser Leu Val Thr Lys Asp

65 70 75 80

Pro Pro His Arg Pro His Pro His Glu Leu Val Gly Lys Asp Cys Arg

85 90 95

Asp Gly Phe Tyr Glu Ala Glu Leu Cys Pro Asp Arg Cys Ile His Ser

100 105 110

Phe Gln Asn Leu Gly Ile Gln Cys Val Lys Lys Arg Asp Leu Glu Gln

115 120 125

Ala Ile Ser Gln Arg Ile Gln Thr Asn Asn Asn Pro Phe Gln Val Pro

130 135 140

Ile Glu Glu Gln Arg Gly Asp Tyr Asp Leu Asn Ala Val Arg Leu Cys

145 150 155 160

Phe Gln Val Thr Val Arg Asp Pro Ser Gly Arg Pro Leu Arg Leu Pro

165 170 175

Pro Val Leu Ser His Pro Ile Phe Asp Asn Arg Ala Pro Asn Thr Ala

180 185 190

Glu Leu Lys Ile Cys Arg Val Asn Arg Asn Ser Gly Ser Cys Leu Gly

195 200 205

Gly Asp Glu Ile Phe Leu Leu Cys Asp Lys Val Gln Lys Glu Asp Ile

210 215 220

Glu Val Tyr Phe Thr Gly Pro Gly Trp Glu Ala Arg Gly Ser Phe Ser

225 230 235 240

Gln Ala Asp Val His Arg Gln Val Ala Ile Val Phe Arg Thr Pro Pro

245 250 255

Tyr Ala Asp Pro Ser Leu Gln Ala Pro Val Arg Val Ser Met Gln Leu

260 265 270

Arg Arg Pro Ser Asp Arg Glu Leu Ser Glu Pro Met Glu Phe Gln Tyr

275 280 285

Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg

290 295 300

Thr Tyr Thr Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr

305 310 315 320

Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser

325 330 335

Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys

340 345 350

Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala

355 360 365

Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn

370 375 380

Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val

385 390 395 400

Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu

405 410 415

Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu

420 425 430

Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys

435 440 445

Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala

450 455 460

Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp

465 470 475 480

Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val

485 490 495

Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly

500 505 510

Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg

515 520 525

Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu

530 535 540

Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys

545 550 555 560

Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp

565 570 575

Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln

580 585 590

Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu

595 600 605

Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu

610 615 620

Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr

625 630 635 640

Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu

645 650 655

Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly

660 665 670

Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu

675 680 685

Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp

690 695 700

Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln

705 710 715 720

Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe

725 730 735

Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr

740 745 750

Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg

755 760 765

Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn

770 775 780

Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu

785 790 795 800

Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro

805 810 815

Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr

820 825 830

Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser

835 840 845

Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg

850 855 860

Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu

865 870 875 880

Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala

885 890 895

Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp

900 905 910

Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu

915 920 925

Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys

930 935 940

Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg

945 950 955 960

Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly

965 970 975

Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser

980 985 990

Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser

995 1000 1005

Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln

1010 1015 1020

Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro

1025 1030 1035

Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu

1040 1045 1050

Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

1055 1060 1065

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn

1070 1075 1080

Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu

1085 1090 1095

Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu

1100 1105 1110

Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp

1115 1120 1125

Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr

1130 1135 1140

Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser

1145 1150 1155

Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys

1160 1165 1170

Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn

1175 1180 1185

Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

1190 1195 1200

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu

1205 1210 1215

Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln

1220 1225 1230

Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr

1235 1240 1245

Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile

1250 1255 1260

Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln

1265 1270 1275

Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp

1280 1285 1290

Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr

1295 1300 1305

Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr

1310 1315 1320

Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys

1325 1330 1335

Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe

1340 1345 1350

Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro

1355 1360 1365

Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys

1370 1375 1380

Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln

1385 1390 1395

Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser

1400 1405 1410

Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala

1415 1420 1425

Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser

1430 1435 1440

Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys

1445 1450 1455

Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile

1460 1465 1470

Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe

1475 1480 1485

Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile

1490 1495 1500

Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys

1505 1510 1515

Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu

1520 1525 1530

Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His

1535 1540 1545

Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln

1550 1555 1560

Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu

1565 1570 1575

Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn

1580 1585 1590

Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro

1595 1600 1605

Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr

1610 1615 1620

Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile

1625 1630 1635

Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr

1640 1645 1650

Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp

1655 1660 1665

Leu Ser Gln Leu Gly Gly Asp Ala Tyr Pro Tyr Asp Val Pro Asp

1670 1675 1680

Tyr Ala Ser Leu Gly Ser Gly Asp Gly Ile Gly Ser Gly Ser Asn

1685 1690 1695

Gly Ser Ser Leu Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu

1700 1705 1710

Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser

1715 1720 1725

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala

1730 1735 1740

Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser

1745 1750

Claims

1.一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：

嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，其中所述核定位域是可操作的，以在被活性细胞信号传导途径激活后将所述嵌合多肽移位至细胞核，所述细胞信号传导途径是响应于细胞外信号可诱导的，

其中响应于所述细胞外信号，所述嵌合多肽定位于细胞核，并且所述基因调节多肽调节靶多核苷酸在所述细胞核中的表达。

2.一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：

(a)在结合配体时激活细胞信号传导途径的嵌合受体多肽；和

(b)嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，所述异源核定位域是可操作的，以在被细胞信号传导途径激活后将所述嵌合多肽移位至细胞核，

其中在所述配体与所述嵌合受体多肽结合后，所述嵌合多肽经由所述诱导的异源核定位域定位于所述细胞核，并且所述基因调节多肽调节靶多核苷酸在所述细胞核中的表达。

3.一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：

(a)包含化学化合物的细胞信号传导途径激活剂；和

(b)嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，所述异源核定位域是可操作的，以在被细胞信号传导途径诱导后将所述嵌合多肽移位至细胞核，

其中在将所述激活剂施用于细胞后，所述嵌合多肽经由激活的异源核定位域定位于细胞核，并且所述基因调节多肽调节靶多核苷酸在所述细胞核中的表达。

4.根据权利要求1-3中任一项所述的系统，其中所述核定位域包含至少一个核定位序列。

5.根据权利要求4所述的系统，其中所述核定位域的激活包括所述核定位序列的化学修饰。

6.根据权利要求5所述的系统，其中所述化学修饰是对所述核定位序列的至少一个氨基酸的化学修饰。

7.根据权利要求5所述的系统，其中所述化学修饰导致所述核定位序列的构象变化和暴露。

8.根据权利要求5所述的系统，其中所述化学修饰包括脱磷酸化。

9.根据权利要求5所述的系统，其中所述化学修饰包括磷酸化。

10.根据权利要求5所述的系统，其中所述化学修饰包括乙酰化。

11.根据权利要求5所述的系统，其中所述化学修饰包括甲基化。

12.根据权利要求5所述的系统，其中所述化学修饰包括泛素化。

13.根据权利要求5所述的系统，其中所述化学修饰包括蛋白水解加工。

14.根据权利要求4所述的系统，其中所述核定位域的激活包括第二信使或信号传导途径蛋白质的结合。

15.根据权利要求4所述的系统，其中所述激活的信号传导途径激活钙依赖磷酸酶。

16.根据前述权利要求中任一项所述的系统，其中所述核定位域包含所述活化T细胞核因子(NFAT)转录因子家族的成员或其片段。

17.根据前述权利要求中任一项所述的系统，其中所述基因调节多肽包含致动部分。

18.根据权利要求17所述的系统，其中所述致动部分包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、重组酶、翻转酶、转座酶或Argonaute(Ago)蛋白(例如，原核Argonaute(pAgo)、古菌Argonaute(aAgo)和真核Argonaute(eAgo))。

19.根据权利要求17所述的系统，其中所述致动部分包含Cas蛋白。

20.根据权利要求19所述的系统，其中所述Cas蛋白与指导RNA复合。

21.根据权利要求19所述的系统，其中所述Cas蛋白是Cas9、Cpf1、C2c1、C2c3。

22.根据权利要求19所述的系统，其中所述Cas蛋白是C2c2、Cas13b、Cas13c或Cas13d。

23.根据权利要求19所述的系统，其中所述Cas蛋白基本上缺乏DNA切割活性。

24.根据前述权利要求中任一项所述的系统，其中所述基因调节多肽进一步包含异源功能域。

25.根据权利要求24所述的系统，其中所述异源功能域包含转录激活物。

26.根据权利要求25所述的系统，其中所述转录激活物包括VP16、VP32、VP64、VPR、p65或P65HSF1。

27.根据权利要求24所述的系统，其中所述功能域包含转录阻抑物。

28.根据权利要求27所述的系统，其中所述转录阻抑物包含KRAB结构域。

29.根据权利要求24所述的系统，其中所述功能域包含染色体修饰酶。

30.根据权利要求29所述的系统，其中所述染色体修饰酶包括甲基化酶、脱甲基酶、乙酰基酶、脱乙酰酶、脱氨酶、磷酸化酶或脱磷酸化酶。

31.根据权利要求29所述的系统，其中所述染色体修饰酶修饰一个或多个核苷酸。

32.根据权利要求29所述的系统，其中所述染色体修饰酶修饰一种或多种组蛋白。

33.根据权利要求1-32中任一项所述的系统，其中所述靶多核苷酸是基因组DNA。

34.根据权利要求1-32中任一项所述的系统，其中所述靶多核苷酸是RNA。

35.根据前述权利要求中任一项所述的系统，其中所述细胞外信号包括配体，并且其中所述配体与跨膜受体的结合激活所述细胞信号传导途径。

36.根据权利要求2所述的系统，其中所述嵌合受体多肽包括Notch受体、G蛋白偶联受体(GPCR)、整联蛋白受体、钙粘着蛋白受体、酪氨酸激酶受体、死亡受体、免疫受体或嵌合抗原受体。

37.根据权利要求3所述的系统，其中所述化学化合物相对于基础水平升高细胞内钙浓度。

38.一种调节靶多核苷酸在细胞中的表达的方法，其包括：

(a)响应于细胞信号传导途径的激活，将基因调节多肽从细胞质移位至细胞核，其中所述细胞信号传导途径的激活将与所述基因调节多肽偶联的核定位域激活。

39.一种调节靶多核苷酸在细胞中的表达的方法，其包括：

(a)激活细胞的细胞信号传导途径，其中激活所述细胞的所述细胞信号传导途径激活与基因调节多肽连接的核定位域；

(b)经由所述激活的核定位域将所述基因调节多肽定位于细胞核，其中在将所述基因调节多肽定位于所述细胞核后，所述基因调节多肽调节所述靶多核苷酸在所述细胞中的表达。

40.一种调节靶多核苷酸在细胞中的表达的方法，其包括：

(a)使配体与跨膜受体接触，其中细胞信号传导途径在所述接触时被激活，并且其中所述激活的细胞信号传导途径激活与基因调节多肽偶联的核定位域；

(b)通过所述激活的核定位域，将所述基因调节多肽从细胞质移位至细胞核，其中所述基因调节多肽在移位至所述细胞核后调节靶多核苷酸的表达。

41.根据权利要求38-40中任一项所述的方法，其中所述核定位域包含至少一个核定位序列。

42.根据权利要求41所述的方法，其中所述核定位域的激活包括所述核定位序列的化学修饰。

43.根据权利要求41所述的方法，其中所述化学修饰是对所述核定位序列的至少一个氨基酸的化学修饰。

44.根据权利要求41所述的方法，其中所述化学修饰导致所述核定位序列的构象变化和暴露。

45.根据权利要求44所述的方法，其中所述化学修饰包括脱磷酸化。

46.根据权利要求44所述的方法，其中所述化学修饰包括磷酸化。

47.根据权利要求44所述的方法，其中所述化学修饰包括乙酰化。

48.根据权利要求44所述的方法，其中所述化学修饰包括甲基化。

49.根据权利要求44所述的方法，其中所述化学修饰包括泛素化。

50.根据权利要求44所述的方法，其中所述化学修饰包括蛋白水解加工。

51.根据权利要求38-40中任一项所述的方法，其中所述核定位域的激活包括第二信使或信号传导途径蛋白质的结合。

52.根据权利要求51所述的方法，其中所述激活的信号传导途径激活钙依赖磷酸酶。

53.根据权利要求38-40中任一项所述的方法，其中所述核定位域包含所述活化T细胞核因子(NFAT)的成员或其片段。

54.根据权利要求38-40中任一项所述的方法，其中所述基因调节多肽包含致动部分。

55.根据权利要求54所述的方法，其中所述致动部分包括Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、重组酶、翻转酶、转座酶或Argonaute(Ago)蛋白(例如，原核Argonaute(pAgo)、古菌Argonaute(aAgo)和真核Argonaute(eAgo))。

56.根据权利要求55所述的方法，其中所述基因调节多肽包含Cas蛋白。

57.根据权利要求56所述的方法，其中所述Cas蛋白与指导RNA复合。

58.根据权利要求56所述的方法，其中所述Cas蛋白是Cas9、Cpf1、C2c1或C2c3。

59.根据权利要求56所述的方法，其中所述Cas蛋白是C2c2、Cas13a、Cas13b、Cas13c或Cas13d。

60.根据权利要求56所述的方法，其中所述Cas蛋白基本上缺乏DNA切割活性。

61.根据权利要求38-40中任一项所述的方法，其中所述基因调节多肽包含异源功能域。

62.根据权利要求61所述的方法，其中所述异源功能域包含转录激活物。

63.根据权利要求62所述的方法，其中所述转录激活物包括VP16、VP32、VP64、VPR或P65HSF1。

64.根据权利要求61所述的方法，其中所述功能域包含转录阻抑物。

65.根据权利要求64所述的方法，其中所述转录阻抑物包含KRAB结构域。

66.根据权利要求61所述的方法，其中所述功能域包含染色体修饰酶。

67.根据权利要求66所述的方法，其中所述染色体修饰酶包括甲基化酶、脱甲基酶、乙酰基酶、脱乙酰酶、脱氨酶、磷酸化酶或脱磷酸化酶。

68.根据权利要求66所述的方法，其中所述染色体修饰酶修饰一个或多个核苷酸。

69.根据权利要求66所述的方法，其中所述染色体修饰酶修饰一种或多种组蛋白。

70.根据权利要求38-69中任一项所述的方法，其中所述靶多核苷酸是基因组DNA。

71.根据权利要求38-69中任一项所述的方法，其中所述靶多核苷酸是RNA。

72.根据权利要求39所述的方法，其中激活所述细胞的所述细胞信号传导途径包括向所述细胞施用细胞信号传导途径激活剂，其中所述激活剂包括化学化合物。

73.根据权利要求72所述的方法，其中所述化学化合物相对于基础水平升高细胞内钙浓度。

74.根据权利要求40所述的方法，其中所述跨膜受体包括Notch受体、G蛋白偶联受体(GPCR)、整联蛋白受体、钙粘着蛋白受体、酪氨酸激酶受体、死亡受体、免疫受体或嵌合抗原受体。

75.一种用于调节靶多核苷酸在细胞中的表达的系统，该系统包含：

嵌合多肽，其包含与异源核定位域框内融合的基因调节多肽，其中所述核定位域是可操作的，以在可被细胞外信号诱导的细胞信号传导途径激活后，将所述嵌合多肽移位至细胞核，其中所述细胞外信号是电磁辐射，

其中响应于所述细胞外信号，所述嵌合多肽定位于所述细胞核，并且所述基因调节多肽调节靶多核苷酸在所述细胞核中的表达。

76.根据权利要求75所述的系统，其中所述电磁辐射包括X射线、紫外(UV)线、可见光、红外线、微波或其任意组合。

77.根据权利要求75所述的系统，其进一步包含在施用所述细胞外信号后激活所述细胞信号传导途径的信号传导单元。

78.根据权利要求77所述的系统，其中所述信号传导单元包含跨膜蛋白质，其中在施用所述细胞外信号后，所述跨膜蛋白质诱导所述细胞信号传导途径。

79.根据权利要求77所述的系统，其中所述信号传导单元包含细胞内蛋白质，其中在施用所述细胞外信号后，所述细胞内蛋白质诱导所述细胞信号传导途径。

80.根据权利要求77所述的系统，其中所述信号传导单元包含跨膜蛋白质和细胞内蛋白质。

81.根据权利要求80所述的系统，其中所述细胞外信号的施用激活所述跨膜蛋白质，所述跨膜蛋白质继而激活所述细胞内蛋白质，以诱导所述细胞信号传导途径。

82.根据权利要求80所述的系统，其中所述细胞外信号的施用激活所述细胞内蛋白质，所述细胞内蛋白质继而激活所述跨膜蛋白质，以诱导所述细胞信号传导途径。

83.根据权利要求82所述的系统，其中所述细胞内蛋白质包含第一部分和第二部分，并且其中所述细胞外信号的施用诱导所述细胞内蛋白质的构象变化，从而暴露所述第一部分和所述第二部分中至少一个的活性位点。

84.根据权利要求82所述的系统，其中所述细胞信号传导途径包含钙。

85.根据权利要求83所述的系统，其中所述暴露的活性位点激活所述跨膜蛋白质，以诱导所述细胞信号传导途径。

86.根据权利要求85所述的系统，其中所述暴露的活性位点结合所述跨膜蛋白质，以激活所述跨膜蛋白质。

87.根据权利要求83所述的系统，其中所述细胞内蛋白质的所述第一部分和所述第二部分中的至少一个包含LOV结构域。

88.根据权利要求83所述的系统，其进一步包含在所述细胞内蛋白质的所述第一部分和所述第二部分之间布置的α-螺旋肽结构域，其中所述细胞外信号的施用诱导所述α-螺旋结构域的至少一部分的构象变化。

89.根据权利要求83所述的系统，其中所述细胞内蛋白质的所述第一部分和所述第二部分中的至少一个包含SOAR结构域。

90.根据权利要求83所述的系统，其中所述跨膜蛋白质包含钙通道。

91.根据权利要求83所述的系统，其中所述跨膜蛋白质包含ORAI1结构域。

92.根据权利要求75所述的系统，其中所述细胞不是肾细胞。

93.根据权利要求75所述的系统，其中所述细胞不是宫颈癌细胞。

94.根据权利要求75所述的系统，其中所述细胞外信号相对于基础水平升高细胞内钙浓度。

95.根据权利要求75所述的系统，其中所述核定位域包含至少一个核定位序列。

96.根据权利要求95所述的系统，其中所述核定位域的激活包括所述核定位序列的化学修饰。

97.根据权利要求96所述的系统，其中所述化学修饰是对所述核定位序列的至少一个氨基酸的化学修饰。

98.根据权利要求96所述的系统，其中所述化学修饰导致所述核定位序列的构象变化和暴露。

99.根据权利要求96所述的系统，其中所述化学修饰包括脱磷酸化。

100.根据权利要求96所述的系统，其中所述化学修饰包括磷酸化。

101.根据权利要求96所述的系统，其中所述化学修饰包括乙酰化。

102.根据权利要求96所述的系统，其中所述化学修饰包括甲基化。

103.根据权利要求96所述的系统，其中所述化学修饰包括泛素化。

104.根据权利要求96所述的系统，其中所述化学修饰包括蛋白水解加工。

105.根据权利要求95所述的系统，其中所述核定位域的激活包括第二信使或信号传导途径蛋白质的结合。

106.根据权利要求95所述的系统，其中所述激活的信号传导途径激活钙依赖磷酸酶。

107.根据前述权利要求中任一项所述的系统，其中所述核定位域包含所述活化T细胞核因子(NFAT)转录因子家族的成员或其片段。

108.根据前述权利要求中任一项所述的系统，其中所述基因调节多肽包含致动部分。

109.根据权利要求108所述的系统，其中所述致动部分包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、重组酶、翻转酶、转座酶或Argonaute(Ago)蛋白(例如，原核Argonaute(pAgo)、古菌Argonaute(aAgo)和真核Argonaute(eAgo))。

110.根据权利要求108所述的系统，其中所述致动部分包含Cas蛋白。

111.根据权利要求110所述的系统，其中所述Cas蛋白与指导RNA复合。

112.根据权利要求110所述的系统，其中所述Cas蛋白是Cas9、Cpf1、C2c1、C2c3。

113.根据权利要求110所述的系统，其中所述Cas蛋白是C2c2、Cas13b、Cas13c或Cas13d。

114.根据权利要求110所述的系统，其中所述Cas蛋白基本上缺乏DNA切割活性。

115.根据前述权利要求中任一项所述的系统，其中所述基因调节多肽进一步包含异源功能域。

116.根据权利要求115所述的系统，其中所述异源功能域包含转录激活物。

117.根据权利要求116所述的系统，其中所述转录激活物包括VP16、VP32、VP64、VPR、p65或P65HSF1。

118.根据权利要求115所述的系统，其中所述功能域包含转录阻抑物。

119.根据权利要求118所述的系统，其中所述转录阻抑物包含KRAB结构域。

120.根据权利要求115所述的系统，其中所述功能域包含染色体修饰酶。

121.根据权利要求120所述的系统，其中所述染色体修饰酶包括甲基化酶、脱甲基酶、乙酰基酶、脱乙酰酶、脱氨酶、磷酸化酶或脱磷酸化酶。

122.根据权利要求120所述的系统，其中所述染色体修饰酶修饰一个或多个核苷酸。

123.根据权利要求120所述的系统，其中所述染色体修饰酶修饰一种或多种组蛋白。

124.根据权利要求75-123中任一项所述的系统，其中所述靶多核苷酸是基因组DNA。

125.根据权利要求75-123中任一项所述的系统，其中所述靶多核苷酸是RNA。

126.一种调节靶多核苷酸在细胞中的表达的方法，其包括：

(c)向所述细胞施用电磁辐射，其中细胞信号传导途径被所述电磁辐射激活，并且其中所述激活的细胞信号传导途径激活与基因调节多肽偶联的核定位域；以及

(d)通过所述激活的核定位域，将所述基因调节多肽从细胞质移位至细胞核，其中所述基因调节多肽在移位至所述细胞核后调节靶多核苷酸的表达。

127.根据权利要求126所述的方法，其中所述电磁辐射包括X射线、紫外(UV)线、可见光、红外线、微波或其任意组合。

128.根据权利要求127所述的方法，其进一步包括施用所述电磁辐射以激活信号传导单元，其中激活所述信号传导单元激活所述细胞信号传导途径。

129.根据权利要求128所述的方法，其中所述信号传导单元包含跨膜蛋白质，其中在施用所述电磁辐射后，所述跨膜蛋白质诱导所述细胞信号传导途径。

130.根据权利要求128所述的方法，其中所述信号传导单元包含细胞内蛋白质，其中在施用所述电磁辐射后，所述细胞内蛋白质诱导所述细胞信号传导途径。

131.根据权利要求128所述的方法，其中所述信号传导单元包含跨膜蛋白质和细胞内蛋白质。

132.根据权利要求131所述的方法，其中所述电磁辐射的施用激活所述跨膜蛋白质，所述跨膜蛋白质继而激活所述细胞内蛋白质，以诱导所述细胞信号传导途径。

133.根据权利要求131所述的方法，其中所述电磁辐射的施用激活所述细胞内蛋白质，所述细胞内蛋白质继而激活所述跨膜蛋白质，以诱导所述细胞信号传导途径。

134.根据权利要求133所述的方法，其中所述细胞内蛋白质包含第一部分和第二部分，并且其中所述电磁辐射的施用诱导所述细胞内蛋白质的构象变化，从而暴露所述第一部分和所述第二部分中的至少一个的活性位点。

135.根据权利要求133所述的方法，其中所述细胞信号传导途径包含钙。

136.根据权利要求134所述的方法，其中所述暴露的活性位点激活所述跨膜蛋白质，以诱导所述细胞信号传导途径。

137.根据权利要求136所述的方法，其中所述暴露的活性位点结合所述跨膜蛋白质，以激活所述跨膜蛋白质。

138.根据权利要求134所述的方法，其中所述细胞内蛋白质的所述第一部分和所述第二部分中的至少一个包含LOV结构域。

139.根据权利要求134所述的方法，其进一步包括在所述细胞内蛋白质的所述第一部分和所述第二部分之间布置的α-螺旋肽结构域，其中所述电磁辐射的施用诱导所述α-螺旋结构域的至少一部分的构象变化。

140.根据权利要求134所述的方法，其中所述细胞内蛋白质的所述第一部分和所述第二部分中的至少一个包含SOAR结构域。

141.根据权利要求134所述的方法，其中所述跨膜蛋白质包含钙通道。

142.根据权利要求134所述的方法，其中所述跨膜蛋白质包含ORAI1结构域。

143.根据权利要求126所述的方法，其进一步包括向所述细胞施用所述电磁辐射一段时间，从而提供激活所述细胞信号传导途径的时间控制。

144.根据权利要求126所述的方法，其进一步包括：

(a)将所述细胞输注到个体中；以及

(b)引导电磁辐射源以向所述个体的至少一部分施用所述电磁辐射，从而以空间控制的方式激活所述细胞信号传导途径。

145.根据权利要求144所述的方法，其中所述电磁辐射源被植入所述个体中具有治疗意义的部位。

146.根据权利要求126所述的方法，其进一步包括：

(a)在不存在所述电磁辐射的情况下培养所述细胞；

(b)向所述细胞施用所述电磁辐射一段时间，以激活所述靶多核苷酸的表达的调节；以及

(c)将所述激活的细胞输注到个体中。

147.根据权利要求126所述的方法，其中所述细胞不是肾细胞。

148.根据权利要求126所述的方法，其中所述细胞不是宫颈癌细胞。

149.根据权利要求126所述的方法，其中所述电磁辐射的施用相对于基础水平升高细胞内钙浓度。

150.根据权利要求126所述的方法，其中所述核定位域包含至少一个核定位序列。

151.根据权利要求150所述的方法，其中所述核定位域的激活包括所述核定位序列的化学修饰。

152.根据权利要求151所述的方法，其中所述化学修饰是对所述核定位序列的至少一个氨基酸的化学修饰。

153.根据权利要求151所述的方法，其中所述化学修饰导致所述核定位序列的构象变化和暴露。

154.根据权利要求151所述的方法，其中所述化学修饰包括脱磷酸化。

155.根据权利要求151所述的方法，其中所述化学修饰包括磷酸化。

156.根据权利要求151所述的方法，其中所述化学修饰包括乙酰化。

157.根据权利要求151所述的方法，其中所述化学修饰包括甲基化。

158.根据权利要求151所述的方法，其中所述化学修饰包括泛素化。

159.根据权利要求151所述的方法，其中所述化学修饰包括蛋白水解加工。

160.根据权利要求126所述的方法，其中所述核定位域的激活包括第二信使或信号传导途径蛋白质的结合。

161.根据权利要求160所述的方法，其中所述激活的信号传导途径激活钙依赖磷酸酶。

162.根据权利要求126所述的方法，其中所述核定位域包含活化T细胞核因子(NFAT)的成员或其片段。

163.根据权利要求126所述的方法，其中所述基因调节多肽包含致动部分。

164.根据权利要求163所述的方法，其中所述致动部分包含Cas蛋白、锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)、大范围核酸酶、重组酶、翻转酶、转座酶或Argonaute(Ago)蛋白(例如，原核Argonaute(pAgo)、古菌Argonaute(aAgo)和真核Argonaute(eAgo))。

165.根据权利要求164所述的方法，其中所述基因调节多肽包含Cas蛋白。

166.根据权利要求165所述的方法，其中所述Cas蛋白与指导RNA复合。

167.根据权利要求165所述的方法，其中所述Cas蛋白是Cas9、Cpf1、C2c1或C2c3。

168.根据权利要求165所述的方法，其中所述Cas蛋白是C2c2、Cas13a、Cas13b、Cas13c或Cas13d。

169.根据权利要求165所述的方法，其中所述Cas蛋白基本上缺乏DNA切割活性。

170.根据权利要求126所述的方法，其中所述基因调节多肽包含异源功能域。

171.根据权利要求170所述的方法，其中所述异源功能域包含转录激活物。

172.根据权利要求171所述的方法，其中所述转录激活物包括VP16、VP32、VP64、VPR或P65HSF1。

173.根据权利要求170所述的方法，其中所述功能域包含转录阻抑物。

174.根据权利要求173所述的方法，其中所述转录阻抑物包含KRAB结构域。

175.根据权利要求170所述的方法，其中所述功能域包含染色体修饰酶。

176.根据权利要求175所述的方法，其中所述染色体修饰酶包括甲基化酶、脱甲基酶、乙酰基酶、脱乙酰酶、脱氨酶、磷酸化酶或脱磷酸化酶。

177.根据权利要求175所述的方法，其中所述染色体修饰酶修饰一个或多个核苷酸。

178.根据权利要求175所述的方法，其中所述染色体修饰酶修饰一种或多种组蛋白。

179.根据权利要求126-178中任一项所述的方法，其中所述靶多核苷酸是基因组DNA。

180.根据权利要求126-178中任一项所述的方法，其中所述靶多核苷酸是RNA。