CN115210250A

CN115210250A - 用于可调节性调控转录的组合物和方法

Info

Publication number: CN115210250A
Application number: CN202180019535.1A
Authority: CN
Inventors: V·苏里; M·C·因尼斯; S·弗罗伊里
Original assignee: Obsidian Therapeutics Inc
Current assignee: Obsidian Therapeutics Inc
Priority date: 2020-01-08
Filing date: 2021-01-08
Publication date: 2022-10-18
Also published as: AU2021205416A1; CO2022010606A2; KR20220139319A; WO2021142376A1; BR112022013355A2; JP2023509770A; EP4087861A1; US20230056856A1; CA3163838A1; MX2022008415A

Abstract

本公开提供了与转录因子系统相关的组合物和方法。此类系统提供了由受调控的转录活性驱动的模块化和可调节的蛋白质表达。

Description

用于可调节性调控转录的组合物和方法

相关申请的交叉参考

本申请要求2020年1月8日提出申请的美国临时申请号62/958,693和2020年1月10日提出申请的美国临时申请号62/959,859的优先权益。上述申请的完整内容以引用的方式整体并入本文。

关于序列表的参考

本申请含有序列表，该序列表以ASCII格式通过电子方式提交并特此以引用的方式整体并入。所述ASCII副本创建于2021年1月8日，命名为268052_483267_SL.txt，大小是241,815字节。

技术领域

本公开涉及用于由受调控的转录活性驱动的可调节蛋白质表达的系统、组合物和方法。本公开提供了用于调控转录和由受调控的转录活性驱动的受调控的蛋白质表达的模块化转录因子系统、转录因子系统的多核苷酸、多肽、载体、细胞、组合物和方法。

背景技术

基因和细胞疗法正在彻底改变医学，并为以前难以治疗的疾患的治疗提供了新的希望。然而，当前的大多数技术都不允许对靶标蛋白质诱导的时间选择或水平进行调定。这使得许多潜在的基因和细胞治疗应用很难或无法安全且有效地部署。

外源性和/或内源性基因控制不当是许多基因和细胞疗法环境中的关键问题。这种可调节性的缺乏也使得难以安全地表达治疗窗口狭窄或不确定的蛋白质或者需要更多调定或瞬时表达的蛋白质。

受调控蛋白质表达或功能的一种方法是使用药物反应性结构域(drugresponsive domain，DRD)。药物反应性结构域是可以附加到感兴趣靶标蛋白质上的小蛋白质结构域。在没有DRD结合配体的情况下，DRD会使连接的感兴趣蛋白质不稳定，并且感兴趣蛋白质会被细胞中的泛素-蛋白酶体系统迅速降解。然而，当特定的小分子DRD结合配体与DRD结合时，所连接的感兴趣蛋白质就会变稳定，并实现蛋白质功能。

DRD技术形成了一类新的细胞和基因疗法的基础，可以提供对基因表达和功能的可调节和时间上的控制，由此扩大可以安全有效地并入细胞和基因疗法模式中的蛋白质治疗剂的范围。然而，在当前DRD技术产生的融合蛋白中，感兴趣蛋白质与DRD接合，这可能不适合于某些适应症。因此，仍然需要开发能够以受调控的方式表达感兴趣的天然蛋白质的细胞和基因疗法。

发明内容

本发明提供了能够通过施用口服小分子药物调控天然治疗性蛋白质的时间选择或水平的经过修饰的细胞、核酸分子、载体以及细胞和基因疗法。

此外，本公开还提供了用于可调节地调控转录的组合物、系统和方法。所述组合物涉及转录因子系统和诱导编码感兴趣蛋白质的多核苷酸的转录活性的试剂。本公开所提供的组合物包括与转录因子系统相关的核酸分子、多肽和细胞。与本公开所提供的转录因子系统相关的方法包括产生经过修饰的细胞的方法以及治疗或预防疾病的方法。

本文提供了转录因子系统。本公开的转录因子系统是一个或多个多核苷酸的组合，该一个或多个多核苷酸包含：(1)一个或多个编码转录因子的核酸序列，该转录因子能够结合至特定多核苷酸结合位点并激活转录；(2)编码药物反应性结构域(DRD)的核酸序列，其中所述转录因子或其部分可操作地连接至DRD；以及(3)编码有效负载并且可操作地连接至包含所述特定多核苷酸结合位点的诱导型启动子的核酸序列。

本公开提供了与转录因子系统相关的经过修饰的细胞。

在一些方面，本公开提供了可以调控有效负载的表达或转录的经过修饰的细胞。所述经过修饰的细胞包含：第一多核苷酸，该第一多核苷酸包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列。转录因子激活结构域、转录因子DNA结合结构域或转录因子激活结构域和转录因子DNA结合结构域的组合中的至少一者可操作地连接至DRD。转录因子激活结构域与转录因子DNA结合结构域相互作用以形成转录因子，该转录因子在与特定多核苷酸结合位点结合后能够激活第四核酸序列的转录，该第四核酸序列编码感兴趣蛋白质并且可操作地连接至特定多核苷酸结合位点、包含该特定多核苷酸结合位点的外源诱导型启动子或两者。在一些实施方案中，感兴趣蛋白质是异源蛋白。在一些实施方案中，第四核酸序列位于第一多核苷酸上。在一些实施方案中，经过修饰的细胞还包含第二多核苷酸，该第二多核苷酸包含第四核酸序列。

在一些方面，本公开提供了一种经过修饰的细胞，该细胞包含多核苷酸，该多核苷酸包含编码药物反应性结构域(DRD)的第一核酸序列和编码转录因子的第二核酸序列。转录因子可操作地连接至DRD，并且能够结合至特定多核苷酸结合位点并激活编码感兴趣蛋白质的第三核酸序列的转录，该第三核酸序列可操作地连接至特定多核苷酸结合位点、包含该特定多核苷酸结合位点的外源诱导型启动子或两者。在一些实施方案中，感兴趣蛋白质是异源蛋白。在一些实施方案中，第三核酸序列位于包含第一核酸序列和第二核酸序列的多核苷酸上。在一些实施方案中，经过修饰的细胞还包含第二多核苷酸，该第二多核苷酸包含第三核酸序列。

在另一个方面，本公开提供了一种经过修饰的细胞，该细胞包含(a)第一多核苷酸，该第一多核苷酸包含：编码转录因子的第一核酸序列，该转录因子能够结合至特定多核苷酸结合位点并激活转录；以及编码药物反应性结构域(DRD)的第二核酸序列；其中该转录因子或其部分可操作地连接至该DRD；以及(b)第二多核苷酸，该第二多核苷酸包含编码感兴趣蛋白质的第三核酸序列，所述第三核酸序列可操作地连接至包含该特定多核苷酸结合位点的外源诱导型启动子。

在另一个方面，本公开提供了一种经过修饰的细胞，该细胞包含(a)第一多核苷酸，该第一多核苷酸包含编码转录因子的第一核酸序列，该转录因子能够结合至特定多核苷酸结合位点并激活编码感兴趣蛋白质的第二核酸序列的转录；其中该第二核酸序列可操作地连接至包含该特定多核苷酸结合位点的外源诱导型启动子；以及(b)第三核酸序列，该第三核酸序列编码药物反应性结构域(DRD)；其中转录因子可操作地连接至DRD。

在另一个方面，本公开提供了一种经过修饰的细胞，该细胞包含(a)第一多核苷酸，该第一多核苷酸包含：编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列；其中该转录因子激活结构域、该转录因子DNA结合结构域或该转录因子激活结构域和该转录因子DNA结合结构域的组合中的至少一者可操作地连接至该DRD；及(b)第二多核苷酸，该第二多核苷酸包含编码感兴趣蛋白质的第四核酸序列，所述第四核酸序列可操作地连接至包含该特定多核苷酸结合位点的外源诱导型启动子；其中该转录因子激活结构域与该转录因子DNA结合结构域相互作用以形成转录因子，该转录因子在与该特定多核苷酸结合位点结合后能够激活转录。

在另一个方面，本公开提供了一种经过修饰的细胞，该细胞包含(a)第一多核苷酸，该第一多核苷酸包含编码转录因子激活结构域的核酸序列；(b)第二多核苷酸，该第二多核苷酸包含编码转录因子DNA结合结构域的核酸序列，该转录因子DNA结合结构域与位于外源诱导型启动子上的特定多核苷酸结合位点结合；以及(c)第三多核苷酸，该第三多核苷酸包含编码药物反应性结构域(DRD)的核酸序列；其中该转录因子激活结构域、该转录因子DNA结合结构域或该转录因子激活结构域和该转录因子DNA结合结构域的组合中的至少一者可操作地连接至该DRD。在一方面，转录因子激活结构域与转录因子DNA结合结构域相互作用以形成转录因子，该转录因子能够结合至特定多核苷酸结合位点并激活编码感兴趣蛋白质的核酸序列的转录，所述核酸序列可操作地连接至外源诱导型启动子。

在各个实施方案中，转录因子DNA结合结构域、转录因子激活结构域和DRD中的一者或多者来源于亲本蛋白质。在一些实施方案中，转录因子DNA结合结构域来源于选自由以下组成的组的亲本蛋白质：ZFHD1、Cas9、Cas12和TAL。在一些实施方案中，转录因子激活结构域来源于亲本蛋白质，其中该亲本蛋白质是p65。在一些实施方案中，DRD来源于选自包含以下各物的组的亲本蛋白质：人碳酸酐酶2(CA2)、人DHFR、大肠杆菌(E.coli)DHFR(ecDHFR)、人雌激素受体(ER)、FKBP、人蛋白质FKBP和人PDE5。

在一些实施方案中，DRD在配体存在下稳定，该配体选自包含以下各物的组：乙酰唑胺(ACZ)、甲氨蝶呤(Methotrexate，MTX)和甲氧苄氨嘧啶(Trimethoprim，TMP)。在一些实施方案中，DRD对选自包含以下各物的组的配体有反应或相互作用：乙酰唑胺(ACZ)、甲氨蝶呤(MTX)和甲氧苄氨嘧啶(TMP)。

在一些实施方案中，感兴趣蛋白质是野生型蛋白质。

在一些实施方案中，感兴趣蛋白质是治疗性蛋白质。

在一些实施方案中，感兴趣蛋白质选自由以下组成的组：细胞因子、抗体或其抗原结合片段、凝血因子、酶、基因编辑蛋白、T细胞受体(TCR)和嵌合抗原受体(CAR)。

在一些实施方案中，感兴趣蛋白质选自由以下组成的组：IL2、IL12、IL15、Cas9、ZFN和Cre。

在一些实施方案中，感兴趣蛋白质是分泌蛋白。

在一些实施方案中，细胞是T细胞、自然杀伤细胞(NK细胞)或肿瘤浸润淋巴细胞(TIL)。

在一些实施方案中，细胞是干细胞、肝细胞、血细胞、胰腺细胞、神经元细胞、眼细胞、肌肉细胞或骨细胞。

本公开还提供了与转录因子系统相关的核酸分子。

在一方面，本公开提供了一种核酸分子，该核酸分子包含(a)编码转录因子DNA结合结构域的第一核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点的；和(b)编码药物反应性结构域(DRD)的第二核酸序列。在一些实施方案中，所述核酸分子还包含(c)编码转录因子激活结构域的第三核酸序列；其中(i)转录因子DNA结合结构域可操作地连接至DRD；(ii)转录因子激活结构域可操作地连接至DRD；或(iii)转录因子DNA结合结构域和转录因子激活结构域的组合可操作地连接至DRD。在一些实施方案中，转录因子DNA结合结构域来源于选自由以下组成的组的亲本蛋白质：ZFHD1、Cas9、Cas12和TAL。在一些实施方案中，转录因子激活结构域来源于亲本蛋白质，其中所述亲本蛋白质是p65。

在一方面，本公开提供了一种核酸分子，该核酸分子包含(a)编码转录因子的第一核酸序列，该转录因子能够结合至特定多核苷酸结合位点并激活转录；和(b)编码药物反应性结构域(DRD)的第二核酸序列；其中所述转录因子可操作地连接至DRD。在一些实施方案中，所述核酸分子还包含(c)编码感兴趣蛋白质的第三核酸序列，该第三核酸序列可操作地连接至特定多核苷酸结合位点、包含该特定多核苷酸结合位点的外源诱导型启动子或两者。

在一些实施方案中，所述特定多核苷酸结合位点位于外源诱导型启动子上。

在一些实施方案中，DRD来源于选自包含以下各物的组的亲本蛋白质：人碳酸酐酶2(CA2)、人DHFR、ecDHFR、人雌激素受体(ER)、FKBP、人蛋白质FKBP和人PDE5。

在一些实施方案中，DRD在配体存在下稳定，该配体选自包含以下各物的组：乙酰唑胺(ACZ)、甲氨蝶呤(MTX)和甲氧苄氨嘧啶(TMP)。在一些实施方案中，DRD对选自包含以下各物的组的配体有反应或相互作用：乙酰唑胺(ACZ)、甲氨蝶呤(MTX)和甲氧苄氨嘧啶(TMP)。

在一些实施方案中，感兴趣蛋白质是野生型蛋白质。

在一些实施方案中，感兴趣蛋白质是治疗性蛋白质。

在一些实施方案中，感兴趣蛋白质选自由以下组成的组：细胞因子、抗体、凝血因子、酶、基因编辑蛋白、T细胞受体(TCR)和嵌合抗原受体(CAR)。

在一些实施方案中，感兴趣蛋白质是分泌蛋白。

本文还提供了包含本文所描述的核酸分子的载体。本公开所提供的载体包括质粒或病毒载体。在一些方面，病毒载体来源于腺病毒、腺相关病毒(AAV)、甲病毒、黄病毒、疱疹病毒、麻疹病毒、弹状病毒、逆转录病毒、慢病毒、新城疫病毒(Newcastle disease virus，NDV)、痘病毒和小核糖核酸病毒。在一些方面，病毒载体选自由以下组成的组：慢病毒载体、γ逆转录病毒载体、腺相关病毒(AAV)载体、腺病毒载体和疱疹病毒载体。

本公开还提供了第一多核苷酸和第二多核苷酸，该第一多核苷酸和第二多核苷酸包含编码转录因子系统的一个或多个组分的核酸序列。

在一方面，本公开提供了一种第一多核苷酸和第二多核苷酸，该第一多核苷酸包含：编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列；其中该转录因子激活结构域、该转录因子DNA结合结构域或该转录因子激活结构域和该转录因子DNA结合结构域的组合中的至少一者可操作地连接至该DRD；并且该第二多核苷酸包含：编码感兴趣蛋白质的第四核酸序列，该第四核酸序列可操作地连接至包含该特定多核苷酸结合位点的诱导型启动子；其中该转录因子激活结构域与该转录因子DNA结合结构域相互作用以形成转录因子，该转录因子在与该特定多核苷酸结合位点结合后能够激活转录，并且其中该第一多核苷酸和该第二多核苷酸各自携带于单个载体中，或该第一多核苷酸和该第二多核苷酸携带于独立的载体中。

在一方面，本公开提供了第一多核苷酸和第二多核苷酸，该第一多核苷酸包含：编码转录因子的第一核酸序列和编码药物反应性结构域(DRD)的第二核酸序列，其中该转录因子可操作地连接至DRD，并且其中该转录因子在与特定多核苷酸结合位点结合后能够激活转录；并且该第二多核苷酸包含：编码感兴趣蛋白质的第三核酸序列，该第三核酸序列可操作地连接至包含特定多核苷酸结合位点的诱导型启动子；其中该第一多核苷酸和该第二多核苷酸各自携带于单个载体中，或该第一多核苷酸和该第二多核苷酸被携带于独立的载体中。

在一些实施方案中，DRD来源于选自包含以下各物的组的亲本蛋白质：人碳酸酐酶2(CA2)、人DHFR、ecDHFR、人雌激素受体(ER)、FKBP、人蛋白质FKBP和人PDE5。在一些实施方案中，DRD在配体存在下稳定，该配体选自包含以下各物的组：乙酰唑胺(ACZ)、甲氨蝶呤(MTX)和甲氧苄氨嘧啶(TMP)。

在一些实施方案中，感兴趣蛋白质是野生型蛋白质。在一些实施方案中，感兴趣蛋白质是治疗性蛋白质。在一些实施方案中，感兴趣蛋白质选自由以下组成的组：细胞因子、抗体、凝血因子、酶、基因编辑蛋白、T细胞受体(TCR)和嵌合抗原受体(CAR)。在一些实施方案中，感兴趣蛋白质选自由以下组成的组：IL2、IL12、IL15、Cas9、ZFN和Cre。在一些实施方案中，感兴趣蛋白质是分泌蛋白。

本公开还提供了与转录因子系统相关的方法。

在一方面，本公开提供了一种产生经过修饰的细胞的方法，所述方法包括将核酸分子引入细胞中，该核酸分子包含：(a)编码转录因子DNA结合结构域的第一核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及(b)编码药物反应性结构域(DRD)的第二核酸序列。在一个实施方案中，核酸分子还包含编码转录因子激活结构域的第三核酸序列。在一些实施方案中，(i)转录因子DNA结合结构域可操作地连接至DRD；(ii)转录因子激活结构域可操作地连接至DRD；或(iii)转录因子DNA结合结构域和转录因子激活结构域的组合可操作地连接至DRD。

在一些实施方案中，所述方法还包括向细胞中引入：编码感兴趣蛋白质的第四核酸序列，所述第四核酸序列可操作地连接至包含特定多核苷酸结合位点的诱导型启动子。在一些实施方案中，感兴趣蛋白质是异源蛋白。在一个实施方案中，第四核酸序列与第一核酸序列、第二核酸序列和第三核酸序列在同一核酸分子上。在一个实施方案中，第四核酸序列与第一核酸序列、第二核酸序列和第三核酸序列在不同的核酸分子上。

在一些实施方案中，感兴趣蛋白质是分泌蛋白。

在一些实施方案中，核酸分子是通过质粒或病毒载体引入细胞中。在一个实施方案中，病毒载体来源于腺病毒、腺相关病毒(AAV)、甲病毒、黄病毒、疱疹病毒、麻疹病毒、弹状病毒、逆转录病毒、慢病毒、新城疫病毒(NDV)、痘病毒和小核糖核酸病毒。在一个实施方案中，病毒载体选自由以下组成的组：慢病毒载体、γ逆转录病毒载体、腺相关病毒(AAV)载体、腺病毒载体和疱疹病毒载体。

在一些实施方案中，核酸分子是通过非病毒递送方法引入细胞中。

在一些实施方案中，细胞是T细胞、自然杀伤细胞(NK细胞)或肿瘤浸润淋巴细胞(TIL)。在一些实施方案中，细胞是干细胞、肝细胞、血细胞、胰腺细胞、神经元细胞、眼细胞、肌肉细胞或骨细胞。

本公开还提供了与治疗或预防疾病相关的方法。

在一方面，本公开提供了一种用于治疗或预防有需要的受试者的疾病的方法，该方法包括：(a)提供细胞群；(b)将至少一个核酸分子引入该细胞群中的至少一个细胞中，其中该至少一个核酸分子包含：(i)第一多核苷酸，该第一多核苷酸包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；和编码药物反应性结构域(DRD)的第三核酸序列，其中该转录因子激活结构域和该转录因子DNA结合结构域中的至少一者可操作地连接至DRD；以及(ii)第二多核苷酸，该第二多核苷酸包含编码感兴趣蛋白质的第四核酸序列，该感兴趣蛋白质预防或治疗疾病或其症状，所述第四核酸序列可操作地连接至包含特定多核苷酸结合位点的外源诱导型启动子；(c)将该细胞递送至受试者体内；并且(d)向该受试者施用配体，该配体使DRD足够稳定以便能表达足以形成转录因子的量的转录因子激活结构域和转录因子DNA结合结构域中的至少一者，该转录因子结合至特定多核苷酸结合位点并且能够使感兴趣蛋白质在所述细胞中表达；其中该感兴趣蛋白质的表达受该受试者体内配体的存在调控，并且配体施用的量和/或持续时间足以产生治疗有效量的感兴趣蛋白质。

在一方面，本公开提供了一种用于将经过修饰的细胞引入需要疾病治疗或预防的受试者体内的方法，该方法包括：(a)提供细胞群；(b)将至少一个核酸分子引入该细胞群中的至少一个细胞中，其中该至少一个核酸分子包含：(i)第一多核苷酸，该第一多核苷酸包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；和编码药物反应性结构域(DRD)的第三核酸序列，其中该转录因子激活结构域和该转录因子DNA结合结构域中的至少一者可操作地连接至DRD；以及(ii)第二多核苷酸，该第二多核苷酸包含编码感兴趣蛋白质的第四核酸序列，该感兴趣蛋白质治疗疾病，该第四核酸序列可操作地连接至包含特定多核苷酸结合位点的外源诱导型启动子；并且(c)将该细胞递送至受试者体内。

在一方面，本公开提供了一种用于将经过修饰的细胞引入需要疾病治疗或预防的受试者体内的方法，该方法包括：(a)提供细胞群；(b)将以上所列方面中任一者的至少一个核酸分子或第一多核苷酸和第二多核苷酸引入该细胞群中的至少一个细胞中；并将该细胞递送至受试者体内。

在一个实施方案中，本公开提供了一种用于对需要疾病治疗或预防的受试者体内的一个或多个细胞进行基因修饰的方法，该方法包括：(a)将至少一个核酸分子引入该受试者的至少一个细胞中，其中该至少一个核酸分子包含：(i)第一多核苷酸，该第一多核苷酸包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；和编码药物反应性结构域(DRD)的第三核酸序列，其中该转录因子激活结构域和该转录因子DNA结合结构域中的至少一者可操作地连接至DRD；以及(ii)第二多核苷酸，该第二多核苷酸包含编码感兴趣蛋白质的第四核酸序列，该感兴趣蛋白质治疗疾病，该第四核酸序列可操作地连接至包含特定多核苷酸结合位点的外源诱导型启动子。

在一方面，本公开提供了一种用于对需要疾病治疗或预防的受试者体内的一个或多个细胞进行基因修饰的方法，该方法包括：(a)将至少一个核酸分子引入该受试者的至少一个细胞中，其中该至少一个核酸分子包含：(i)第一多核苷酸，该第一多核苷酸包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；和编码药物反应性结构域(DRD)的第三核酸序列，其中该转录因子激活结构域和该转录因子DNA结合结构域中的至少一者在细胞中表达后可操作地连接至DRD；以及(ii)第二多核苷酸，该第二多核苷酸包含编码感兴趣蛋白质的第四核酸序列，该感兴趣蛋白质治疗疾病，该第四核酸序列可操作地连接至包含特定多核苷酸结合位点的外源诱导型启动子；并且(b)向该受试者施用配体，该配体使DRD足够稳定以便能表达足以形成转录因子的量的转录因子激活结构域和转录因子DNA结合结构域中的至少一者，该转录因子结合至特定多核苷酸结合位点并且能够使感兴趣蛋白质在该细胞中表达；其中该感兴趣蛋白质的表达受该受试者体内配体的存在调控，并且配体施用的量和/或持续时间足以产生治疗有效量的感兴趣蛋白质。

在一方面，本公开提供了一种用于治疗有需要的受试者的疾病的方法，该方法包括：(a)提供细胞群；(b)将至少一个第一核酸分子和至少一个第二核酸分子引入该细胞群中的至少一个细胞中，其中：(i)该第一核酸分子包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列，其中该转录因子激活结构域和该转录因子DNA结合结构域中的至少一者在细胞中表达后，可操作地连接至DRD；并且(ii)该第二核酸分子包含编码感兴趣蛋白质的第四核酸序列，该感兴趣蛋白质治疗疾病，该第四核酸序列可操作地连接至包含特定多核苷酸结合位点的外源诱导型启动子；(c)将该细胞递送至受试者体内；并且(d)向该受试者施用配体，该配体使DRD足够稳定以便能表达足以形成转录因子的量的转录因子激活结构域和转录因子DNA结合结构域，该转录因子结合至特定多核苷酸结合位点并且能够使感兴趣蛋白质在所述细胞中表达；其中该感兴趣蛋白质的表达受该受试者体内配体的存在调控，并且配体施用的量和/或持续时间足以产生治疗有效量的感兴趣蛋白质。

在一方面，本公开提供了一种用于治疗有需要的受试者的疾病的方法，该方法包括：(a)提供细胞群；(b)将至少一个第一核酸分子和至少一个第二核酸分子引入该细胞群中的至少一个细胞中，其中：(i)该第一核酸分子包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列，其中该转录因子激活结构域和该转录因子DNA结合结构域中的至少一者在细胞中表达后，可操作地连接至DRD；并且(ii)该第二核酸分子包含编码感兴趣蛋白质的第四核酸序列，该感兴趣蛋白质预防和/或治疗疾病，该第四核酸序列可操作地连接至包含特定多核苷酸结合位点的外源诱导型启动子；并且(c)将该细胞递送至受试者体内。

在一个相关实施方案中，本公开提供了一种用于预防和/或治疗有需要的受试者的疾病的方法。该方法包括：(a)提供细胞群；(b)将至少一个第一核酸分子和至少一个第二核酸分子引入该细胞群中的至少一个细胞中。在这一方法实例中，所述第一核酸分子包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列。转录因子激活结构域和转录因子DNA结合结构域中的至少一者在细胞中表达后，可操作地连接至DRD；并且第二核酸分子包含编码感兴趣蛋白质的第四核酸序列，该感兴趣蛋白质预防和/或治疗有需要的受试者的疾病。第四核酸序列可操作地连接至包含特定多核苷酸结合位点的外源诱导型启动子。所述方法还包括以下步骤：(c)将细胞递送至受试者体内；并且(d)向受试者施用配体，该配体使DRD足够稳定以便能表达足以形成转录因子的量的转录因子激活结构域和转录因子DNA结合结构域，该转录因子结合至特定多核苷酸结合位点并且能够使感兴趣蛋白质在细胞中表达。在这一方法实例中，感兴趣蛋白质的表达受到受试者体内配体的存在的调控，并且配体施用的量和/或持续时间足以产生治疗有效量的感兴趣蛋白质。

在相关实施方案中，本公开的治疗和预防方法可以通过将单一载体引入细胞中来实现，其中该载体携带第一核酸分子和第二核酸分子，其中：(i)该第一核酸分子包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列，其中该转录因子激活结构域和/或该转录因子DNA结合结构域在细胞中表达后，可操作地连接至DRD；并且该第二核酸分子包含编码感兴趣蛋白质的第四核酸序列，该感兴趣蛋白质治疗或预防疾病，该第四核酸序列可操作地连接至包含特定多核苷酸结合位点的外源诱导型启动子。

在一些替代性实施方案中，本公开的治疗和预防方法可以通过将第一载体和第二载体引入细胞中来实现，其中该第一载体包含：编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列，其中该转录因子激活结构域和/或该转录因子DNA结合结构域在细胞中表达后，可操作地连接至DRD；并且该第二载体包含编码感兴趣蛋白质的第四核酸序列，该感兴趣蛋白质预防和/或治疗疾病，该第四核酸序列可操作地连接至包含特定多核苷酸结合位点的外源诱导型启动子。

在一些实施方案中，核酸分子是通过质粒或病毒载体引入细胞中。在一些方面，病毒载体来源于腺病毒、腺相关病毒(AAV)、甲病毒、黄病毒、疱疹病毒、麻疹病毒、弹状病毒、逆转录病毒、慢病毒、新城疫病毒(NDV)、痘病毒和小核糖核酸病毒。在一些方面，病毒载体选自由以下组成的组：慢病毒载体、γ逆转录病毒载体、腺相关病毒(AAV)载体、腺病毒载体和疱疹病毒载体。

本公开还提供了一种用于在细胞中可调节地表达感兴趣蛋白质的系统，该系统包含：(a)编码与药物反应结构域(DRD)连接的转录因子的第一多核苷酸，该转录因子选择性转录编码感兴趣蛋白质的多核苷酸序列；(b)包含外源转录因子结合位点的第二多核苷酸，该外源转录因子结合位点位于编码感兴趣蛋白质的核酸序列的上游并邻近该核酸序列；(c)在将第一多核苷酸和第二多核苷酸稳定整合至细胞基因组中的条件下，将第一多核苷酸和第二多核苷酸引入细胞中；(d)通过添加使DRD稳定的配体来调节转录因子的表达；其中转录因子特异性结合转录因子结合位点，该转录因子结合位点位于编码感兴趣蛋白质的多核苷酸序列的上游并邻近该多核苷酸序列，并且其中该感兴趣蛋白质的表达受细胞中存在的转录因子的量调控。

本公开还提供了药物组合物，该药物组合物包括本文所描述的组合物和药学上可接受的赋形剂。

附图说明

图1A-图1B描绘了转录因子系统设计方案的示意图。图1A显示转录因子构建体的示意图，该构建体称为“DRD-TF构建体”，包含编码转录因子DNA结合结构域、转录因子激活结构域和药物反应性结构域(DRD)的核酸序列。图1B显示了有效负载构建体的示意图，该构建体包含诱导型启动子，该诱导型启动子包含转录因子DNA结合结构域的结合位点。

图2A-图2B显示了转录因子系统的配体依赖性活性，该转录因子系统包含具有不同DRD的DRD调控的转录因子。图2A显示来自未转染(“模拟”)HEK293T细胞和用编码组成型转录因子的构建体(构建体ZFHD-055；“Cons.”)或编码可操作地连接至DRD的转录因子的构建体转染的HEK293T细胞的溶解产物的蛋白质印迹，该DRD来源于CA2、ecDHFR、ER或hDHFR亲本蛋白质。有关每个构建体和配体处理条件的详细信息提供于表4和表6中。蛋白质印迹的上图显示了内源性p65、由各DRD-TF构建体编码的转录因子和DRD多肽以及由组成型构建体ZFHD-055编码的转录因子多肽的谱带。图2B显示了图2A中蛋白质印迹的定量，在将组成型条件设置成1.0的情况下归一化。

图3A-图3E显示了包含ecDHFR DRD调控的转录因子的转录因子系统的配体依赖性活性。图3A显示转录因子构建体ZFHD-005的示意图。图3B显示有效负载构建体ZFHD-007的示意图。图3C显示组成型转录因子构建体ZFHD-004的示意图。图3D显示来自稳定整合指定构建体并用10μM TMP或0.1％DMSO处理的U2OS细胞的溶解产物的蛋白质印迹。出现在大约60kDa处的谱带代表内源性p65。出现在大约44.3kDa处的谱带代表由转录因子构建体ZFHD-005编码的转录因子和DRD多肽。出现在大约26.5kDa处的谱带代表由构建体ZFHD-004编码的转录因子多肽。图3E显示通过流式细胞术评估的稳定整合指定构建体并用10μM TMP或0.1％DMSO处理的U2OS细胞的GFP中值荧光强度(MFI)。

图4A-图4C显示了关于包含ecDHFR DRD调控的转录因子的转录因子系统的配体的剂量反应。图4A显示来自稳定整合有构建体ZFHD-005和ZFHD-007并用DMSO或指定浓度的TMP处理的U2OS细胞的溶解产物的蛋白质印迹。标有“U2OS”的泳道代表用TMP处理的未转导的U2OS细胞。出现在大约60kDa处的谱带代表内源性p65。出现在大约44.3kDa处的谱带代表由转录因子构建体ZFHD-005编码的转录因子和DRD多肽。图4B显示图4A的蛋白质印迹中指定“ZFHD-005多肽”谱带的定量。荧光针对内源性p65归一化。图4C显示了通过流式细胞术评估的稳定整合有构建体ZFHD-005和ZFHD-007并用指定浓度的TMP处理的U2OS细胞的GFP中值荧光强度(MFI)。图4C中使用的TMP的最高浓度是33μM。显示的数据是3次重复实验的数据。误差条表示标准偏差。

图5A-图5B显示包含ecDHFR DRD调控的转录因子的转录因子系统在T细胞中的配体依赖性活性。图5A显示来自未转导的T细胞或用病毒(OTLV-ZFHD-005或OTLV-ZFHD-007)转导并用TMP或DMSO处理的T细胞的溶解产物的蛋白质印迹。出现在大约60kDa处的谱带代表内源性p65。出现在大约44.3kDa处的谱带(以箭头指示)代表由转录因子构建体ZFHD-005编码的转录因子和DRD多肽。图5B显示通过流式细胞术评估的未转导的T细胞或用指定构建体制成的病毒转导并用TMP或DMSO处的T细胞的GFP中值荧光强度(MFI)。显示的数据是3次重复实验的数据。误差条表示与平均值的标准偏差。

图6A-图6D显示了包含CA2 DRD调控的转录因子的转录因子系统在ARPE-19细胞中的配体依赖性活性。图6A显示了转录因子构建体ZFHD-019的示意图。图6B显示来自未转导的ARPE-19细胞或稳定整合构建体ZFHD-019和ZFHD-007并用10μM ACZ或1％DMSO处理的ARPE-19细胞的溶解产物的蛋白质印迹。出现在大约60kDa处的谱带代表内源性p65。出现在大约55.8kDa处的谱带代表由转录因子构建体ZFHD-019编码的转录因子和DRD多肽。图6C显示图6B的蛋白质印迹中指定“ZFHD-019多肽”谱带的定量。荧光针对内源性p65归一化。图6D显示了通过流式细胞术所评估的未转导的ARPE-19细胞或稳定整合指定构建体并且未处理或用10μM ACZ或1％DMSO处理的ARPE-19细胞的GFP平均荧光强度(MFI)。显示的数据是3次重复实验的数据。误差条表示与平均值的标准偏差。图中显示的未转导的ARPE-19细胞和稳定整合构建体ZFHD-007的ARPE-19细胞经过DMSO处理。

图7A-图7B显示了关于包含CA2 DRD调控的转录因子的转录因子系统的配体的剂量反应。图7A显示来自稳定整合有构建体ZFHD-007和ZFHD-019并用指定浓度的ACZ处理的ARPE-19细胞的溶解产物的蛋白质印迹。出现在大约60kDa处的谱带代表内源性p65。出现在大约55.8kDa处的谱带代表由转录因子构建体ZFHD-019编码的转录因子和DRD多肽。图7B显示图7A的蛋白质印迹中指定“ZFHD-019多肽”谱带的定量。荧光针对内源性P65谱带归一化。

图8显示了关于包含CA2 DRD调节的转录因子的转录因子系统的配体的剂量反应。该图显示通过流式细胞术评估的稳定整合构建体ZFHD-007和ZFHD-019并用指定浓度的ACZ处理的U2OS细胞的GFP中值荧光强度(MFI)。显示的数据是2次重复实验的数据。误差条表示标准偏差。

图9A-图9C显示了包含CA2 DRD调控的转录因子的转录因子系统在Jurkat细胞中的配体依赖性活性。图9A显示转录因子构建体ZFHD-048的示意图。图9B显示了有效负载构建体ZFHD-022的示意图。图9C显示了通过流式细胞术所评估的稳定整合构建体ZFHD-048和ZFHD-022并用DMSO(0.1％)或ACZ(10μM最终浓度)处理的Jurkat细胞的GFP中值荧光强度(MFI)。呈现的数据是对转导标记物呈阳性的细胞的数据。

图10A-图10F显示了包含ecDHFR DRD调控的转录因子的单载体转录因子系统的配体依赖性活性。图10A显示了构建体ZFHD-012的示意图。图10B显示了构建体ZFHD-018的示意图。图10C和图10D显示了来自用慢病毒转导并用10μM TMP或0.1％DMSO处理的U2OS细胞的溶解产物的蛋白质印迹，所述慢病毒是由指定构建体制成。出现在大约44.3kDa处的谱带代表由指定构建体编码的转录因子和DRD多肽。在单载体构建体中，在EGFP序列的末端有一个终止密码子，并且在转录因子-DRD序列的末端有一个终止密码子，由此产生了代表转录因子和DRD多肽的大约44.3kDa的谱带。图10E和图10F显示了通过流式细胞术评估的用慢病毒转导并用10μM TMP或0.1％DMSO处理的U2OS细胞的GFP中值荧光强度(MFI)，所述慢病毒是由指定构建体制成的。

图11A-图11B显示了包含CA2 DRD调控的转录因子的单载体转录因子系统的配体依赖性活性。图11A显示了单载体系统的示意图，描绘为构建体ZFHD-036。图11B显示了通过流式细胞术评估的用慢病毒转导并用10μM ACZ或0.1％DMSO处理的Jurkat细胞的GFP中值荧光强度(MFI)，所述慢病毒是由指定构建体制成的。图上的ZFHD-036.1和ZFHD-036.2代表两个细胞系，每个细胞系都用由构建体ZFHD-036制成的慢病毒转导。

图12A-图12B显示了包含转录因子构建体变体的转录因子系统的配体依赖性活性。图12A显示了转录因子构建体变体的示意图。

图12B显示了通过流式细胞术评估的稳定整合指定构建体并用0.1％DMSO或10μMTMP处理的U2OS细胞的GFP中值荧光强度(MFI)。

图13显示了包含转录因子构建体变体的转录因子系统的配体反应时间进程分析。该图显示了通过流式细胞术评估的稳定整合指定构建体并用0.1％DMSO或10μM TMP处理指定时间段的U2OS细胞的GFP中值荧光强度(MFI)。

图14A-图14D显示了包含有效负载构建体变体的转录因子系统的配体依赖性活性。图14A显示了有效负载构建体ZFHD-007的示意图。图14B显示了有效负载构建体ZFHD-017的示意图。图14C-图14D显示了通过流式细胞术评估的稳定整合指定构建体并用0.1％DMSO或10μM TMP处理的U2OS细胞的GFP中值荧光强度(MFI)。

图15显示了转录因子系统的配体依赖性活性，该转录因子系统包含编码分泌IL12有效负载的有效负载构建体。该图显示了从稳定整合指定构建体并用0.1％DMSO或10μMTMP处理的U2OS细胞收集的上清液中分泌IL12的浓度。

图16A-图16D显示了可操作地连接至来源于亲本CA2蛋白的DRD的不同转录因子的配体依赖性调控作用。图16A显示了来自未转染(“模拟”)的HEK293T细胞和用以下构建体转染的HEK293T细胞的溶解产物的蛋白质印迹：(1)cjun-001(“001”)、(2)cjun-002(“002”)或(3)cjun-003(“003”)。显示了在用DMSO或ACZ处理后各构建体转染的细胞群(以“+”符号指示)。标记的谱带“c-Jun-001和-002多肽”标识由cjun-001和cjun-002构建体编码的CA2-接头-C-jun多肽。标记的谱带“c-Jun-003多肽”标识由构建体cjun-003编码的c-Jun多肽。图16B显示了图16A中蛋白质印迹的定量。图16C显示了来自未转染(“模拟”)的HEK293T细胞和用以下构建体转染的HEK293T细胞的溶解产物的蛋白质印迹：(1)FOXP3-013(“013”)、(2)FOXP3-014(“014”)或(3)FOXP3-015(“015”)。显示了在用DMSO或ACZ处理后各构建体转染的细胞群(以“+”符号指示)。标记的谱带“FOXP3-013和-014多肽”标识由FOXP3-013和FOXP3-014构建体编码的CA2-FOXP3多肽。标记的谱带“FOXP3-015多肽”标识由构建体FOXP3-015编码的FOXP3多肽。图16D显示了图16C中蛋白质印迹的定量。

图17A-图17B显示了稳定整合于Jurkat细胞中的c-Jun转录因子构建体的配体依赖性调控作用。图17A显示了来自未转导(“模拟”)的Jurkat细胞和用慢病毒转导的Jurkat细胞的溶解产物的蛋白质印迹，所述慢病毒是由构建体cjun-001(“001”)和cjun-002(“002”)制成的。显示了在用DMSO或ACZ处理后各构建体转染的细胞系(以“+”符号指示)。显示了c-Jun多肽和磷酸化c-Jun多肽的谱带。图17B显示了图17A中的蛋白质印迹的定量。

图18显示了pELDS-puro转移载体的核苷酸序列(SEQ ID NO：68)。

图19显示了pELNS-puro转移载体的核苷酸序列(SEQ ID NO：69)。

具体实施方式

转录因子系统

根据本公开，转录因子系统是一种或多种多核苷酸的组合，该一种或多种多核苷酸包含(1)一个或多个编码转录因子的核酸序列，该转录因子能够结合至特定多核苷酸结合位点并激活转录；(2)编码药物反应性结构域(DRD)的核酸序列，其中所述转录因子可操作地连接至DRD；及(3)编码有效负载的核酸序列，该核酸序列可操作地连接至包含所述特定多核苷酸结合位点的诱导型启动子。

在一些实施方案中，转录因子系统的一种或多种多核苷酸的组合可用于修饰细胞，例如可用于治疗疾病的免疫细胞，并产生可通过调控转录因子的存在来调控感兴趣蛋白质的表达的系统，该转录因子作用于编码有效负载或感兴趣蛋白质的多核苷酸。

在一些实施方案中，转录因子系统的一种或多种多核苷酸的组合包括含编码转录因子的第一核酸序列和编码DRD的第二核酸序列的多核苷酸。

本公开还提供了一种第一多核苷酸和第二多核苷酸，其中该第一多核苷酸包含：编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列。在这一实例中，转录因子激活结构域、转录因子DNA结合结构域或转录因子激活结构域和转录因子DNA结合结构域的组合中的至少一者可操作地连接至本文所例示的DRD。第二多核苷酸包含编码感兴趣蛋白质的第四核酸序列，该第四核酸序列可操作地连接至包含特定多核苷酸结合位点的诱导型启动子。在这一实例中，转录因子激活结构域和转录因子DNA结合结构域相互作用以形成转录因子，该转录因子在与特定多核苷酸结合位点结合后能够激活转录，并且第一多核苷酸和第二多核苷酸各自携带于单个载体中，或第一多核苷酸和第二多核苷酸携带于独立的载体中。

在一个相关实例中，本公开提供了可操作用于调控转录的组合物和核酸。例如，本公开提供了可调控的转录因子系统的第一多核苷酸和第二多核苷酸。第一多核苷酸包含编码转录因子的第一核酸序列和编码药物反应性结构域(DRD)的第二核酸序列，其中该转录因子可操作地连接至DRD，并且其中转录因子在与特定多核苷酸结合位点结合后能够激活转录。第二多核苷酸包含编码感兴趣蛋白质的第三核酸序列，该第三核酸序列可操作地连接至包含特定多核苷酸结合位点的诱导型启动子；由此使得第一多核苷酸和第二多核苷酸各自携带于单个载体中，或第一多核苷酸和第二多核苷酸被携带于独立的载体中。

在一些实施方案中，转录因子系统的一种或多种多核苷酸的组合包含：编码转录因子DNA结合结构域的第一核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；编码转录因子激活结构域的第二核酸序列；以及编码DRD的第三核酸序列。在一些方面，转录因子系统的一种或多种多核苷酸的组合包括含第一核酸序列、第二核酸序列和第三核酸序列的多核苷酸。在一些方面，转录因子系统的一种或多种多核苷酸的组合包括含第一核酸序列、第二核酸序列和第三核酸序列中的两者的多核苷酸。在一些方面，转录因子系统的一种或多种多核苷酸的组合包含：含第一核酸序列的第一多核苷酸；含第二核酸序列的第二多核苷酸；和含第三核酸序列的第三多核苷酸。一方面，转录因子DNA结合结构域可操作地连接至DRD。在另一个方面，转录因子激活结构域可操作地连接至DRD。在另一个方面，转录因子DNA结合结构域和转录因子激活结构域均可操作地连接至DRD。在一些方面，转录因子DNA结合结构域和转录因子激活结构域被表达为转录因子融合蛋白形式。

根据本公开，转录因子系统编码能够驱动有效负载表达的转录因子。在一些实施方案中，转录因子是由编码转录因子激活结构域的第一核酸序列和编码转录因子DNA结合结构域的第二核酸序列编码，该转录因子DNA结合结构域结合至特定多核苷酸结合位点。转录因子激活结构域和转录因子DNA结合结构域相互作用而形成转录因子，该转录因子在与特定多核苷酸结合位点结合后激活编码有效负载的核酸序列的转录。

在一些实施方案中，所述特定多核苷酸结合位点包含至少一个具有被转录因子DNA结合结构域识别和结合的特定序列的核酸位点。在一些实施方案中，所述特定多核苷酸结合位点包含至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个被本公开的DNA结合结构域识别的核酸位点。在一些实施方案中，所述特定多核苷酸结合位点包含八个被DNA结合结构域识别的核酸位点。在一些实施方案中，所述特定多核苷酸结合位点包含两个或更多个串联核酸位点，每个都具有被转录因子DNA结合结构域识别和结合的特定序列。在一些方面，所述串联核酸位点包含相同的核酸序列。在一些实施方案中，所述特定多核苷酸结合位点包含被本公开的DNA结合结构域识别的串联重复核酸位点。

如本文所描述，转录因子或其部分可操作地连接至本公开的转录因子系统中的DRD。与DRD结合或相互作用的配体的存在、不存在或量可以在这种结合或相互作用后调节转录因子的稳定性并因此调节转录因子的功能。因此，转录因子系统可以展现出配体依赖性活性。

在一些实施方案中，转录因子系统存在于细胞或细胞群中。在一些实施方案中，将转录因子系统的一种或多种多核苷酸引入细胞或细胞群中。

转录因子系统构建体

转录因子系统的一种或多种多核苷酸的组合在本文中也可称为一种或多种核酸构建体的组合。多核苷酸或核酸构建体可以包含呈不同布置的核酸序列，和/或可以独特地组合作为转录因子系统的一部分，只要所得到的多核苷酸或核酸构建体的组合包含(1)一个或多个编码转录因子的核酸序列，该转录因子能够结合至特定多核苷酸结合位点并激活转录；(2)编码药物反应性结构域(DRD)的核酸序列，其中该转录因子可操作地连接至DRD；以及(3)编码有效负载的核酸序列，该核酸序列可操作地连接至包含特定多核苷酸结合位点的诱导型启动子。

在一些实施方案中，转录因子系统包含多个构建体。在一些实施方案中，转录因子系统包含转录因子构建体和有效负载构建体。一方面，转录因子构建体包含编码转录因子的核酸序列。一方面，转录因子构建体包含编码转录因子激活结构域的核酸序列和编码转录因子DNA结合结构域的核酸序列。

在一些实施方案中，转录因子系统包含单一构建体。所述单一构建体包含编码转录因子系统的转录因子、DRD和有效负载的核酸序列。在一些实施方案中，可以将这种单一构建体转录因子系统以单一核酸分子，例如质粒或载体引入细胞中。包含单一构建体的转录因子系统在本文中可以称为单载体转录因子系统。

除了包含本文所描述的用于转录因子系统的核酸序列之外，本公开的核酸构建体还可以包含额外的核酸序列。构建体的额外核酸序列包括但不限于调控元件、聚腺苷酸化序列、接头和切割位点。

在一些实施方案中，转录因子构建体可以包含编码以下的核酸序列：启动子、转录因子DNA结合结构域、转录因子激活结构域和DRD。在一些实施方案中，编码DRD的核酸序列与编码至少一个转录因子结构域的核酸序列相邻。在一些实施方案中，编码DRD的核酸序列位于编码转录因子DNA结合结构域与转录因子激活结构域的核酸序列之间。

在一些实施方案中，转录因子构建体可以包含编码以下的核酸序列：启动子、转录因子DNA结合结构域、转录因子激活结构域、接头和DRD。在一些方面，接头位于编码转录因子结构域的核酸序列与编码DRD的核酸序列之间。

在一些实施方案中，转录因子构建体中的启动子是EF1a。在一些实施方案中，转录因子构建体中编码的转录因子DNA结合结构域是ZFHD1。在一些实施方案中，转录因子构建体中编码的转录因子激活结构域是p65。

在一些实施方案中，有效负载构建体可以包含编码以下的核酸序列：包含至少一个核酸位点的特定多核苷酸结合位点，该核酸位点具有被转录因子DNA结合结构域识别和结合的特定序列；启动子；和有效负载。示例性结合位点包含被ZFHD1DNA结合结构域识别的八(8)个核酸位点。

在一些实施方案中，本公开的构建体，如转录因子构建体或有效负载构建体，被整合至质粒或病毒载体中。在一些实施方案中，质粒或病毒载体包含一个或多个调控元件，所述调控元件变得可操作地连接到被整合至质粒或病毒载体中的构建体的一种或多种组分。在一些实施方案中，质粒或病毒载体包含本领域众所周知的调控元件，包括例如启动子、内含子、间隔子、填充序列等。在一些实施方案中，将转录因子构建体整合到质粒或病毒载体中，使得转录因子构建体的组分可操作地连接至质粒或病毒载体的调节元件。在一些实施方案中，这种转录因子构建体包含编码转录因子DNA结合结构域、转录因子激活结构域和DRD的核酸序列，并且被整合至质粒或病毒载体中，使得质粒或病毒载体中的启动子序列驱动转录因子DNA结合结构域、转录因子激活结构域和DRD的表达。这种启动子可以选自组成型启动子、组织特异性启动子、细胞特异性启动子、细胞分化特异性启动子和/或疾病特异性启动子。任选地，启动子可以选自EF1a、CMV、EFS、RSV、SFFV、PGK、CAG和SV40。

转录因子系统的组分

如上文所述，转录因子系统的多核苷酸或核酸构建体可以包含呈不同布置的核酸序列，和/或可以独特地组合作为转录因子系统的一部分，只要所得到的多核苷酸或核酸构建体的组合包含(1)一个或多个编码转录因子的核酸序列，该转录因子能够结合至特定多核苷酸结合位点并激活转录；(2)编码药物反应性结构域(DRD)的核酸序列，其中该转录因子可操作地连接至DRD；以及(3)编码有效负载的核酸序列，该核酸序列可操作地连接至包含特定多核苷酸结合位点的诱导型启动子。这样，转录因子系统是一个模块化系统，并且转录因子系统的每个组分可以分开地选择。

编码药物反应性结构域(DRD)的核酸序列可以选自以下“药物反应性结构域(DRD)”部分中更详细描述的DRD序列。

所述一个或多个编码转录因子的核酸序列可以选自编码现有转录因子、来源于现有转录因子的工程改造的转录因子或包含DNA结合结构域和激活结构域的工程改造的转录因子的一个或多个序列。如本文所使用，“来源于现有转录因子的工程改造的转录因子”是指至少部分源自亲本(天然)转录因子分子或序列并保留结合至特定多核苷酸结合位点并激活转录的能力的工程改造的转录因子。例如，工程改造的转录因子可以来源于包含一个或多个能够与DNA序列特异性接触的锌指结构域的亲本转录因子。工程改造的TAL效应子转录因子可以设计成包含识别特定DNA结合位点的TAL效应子重复区、哺乳动物核定位信号(NLS)和合成的转录激活结构域。如果转录因子是包含DNA结合结构域和激活结构域的工程改造的转录因子，则DNA结合结构域和激活结构域可以分开地选择并组合形成完整的转录因子。

转录因子DNA结合结构域可以来源于现有的核酸结合蛋白。例如，现有的DNA结合蛋白的DNA结合序列或结构域可用作本公开的转录因子DNA结合结构域或被另外修饰而产生本公开的转录因子DNA结合结构域。

在一些方面，转录因子DNA结合结构域来源于选自由以下组成的组的亲本蛋白质：ZFHD1、Cas9、Cas12和TAL。

在一些实施方案中，转录因子DNA结合结构域来源于ZFHD1亲本蛋白质。ZFHD1是Pomerantz,J.L.等人设计的锌指同源结构域融合蛋白(Pomerantz,J.L.等人,“Structure-Based Design of Transcription Factors.”Science,第267卷,第5194期,1995)。ZFHD1包含Zif268的锌指1和2、gly-gly-arg-arg接头和OCT-1同源结构域。ZFHD1可以结合包含序列TAATGATGGGCG(SEQ ID NO:70)的核酸序列。在一些实施方案中，转录因子DNA结合结构域由ZFHD1的氨基酸序列组成或包含所述氨基酸序列。

在一些实施方案中，本公开提供了使用Cas/引导RNA系统调控靶标基因和其相应功能蛋白(例如有效负载或感兴趣蛋白质)的方法。应理解，本领域技术人员将能够设计适合的引导RNA以与包括如本文所描述的靶标基因在内的靶标核酸形成共定位复合物。

本领域技术人员已知各种Cas蛋白，包括CasI(Cas3)、Cas IA(Cas8a)、CasIB(Cas8b)、CasIC(Cas8c)、CasID(Cas10d)、CasIE(Cse1)、CasIF(Csy1)、CasIU、CasII(Cas9)、CasIIA(Csn2)、CasIIB(Cas4)、CasIIC、CasIII(Cas10)、CasIIIA(Csm2)、CasIIIB(Cmr5)、CasIIIC、CasIIBD、CasIV(Csf1)、CasIVA、CasIVB、CasV(Cpf1)、C2c2和C2c1等。

在一些实施方案中，转录因子DNA结合结构域来源于Cas蛋白，该Cas蛋白选自由以下组成的组：C2C1、C2C3、Cpf1(又称为Cas12a)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3和Csf4。

根据一个方面，Cas9蛋白包括如针对来自金黄色葡萄球菌(S.aureus)、嗜热链球菌(S.thermophile)、化脓性链球菌(S.pyogenes)或脑膜炎奈瑟氏菌(Neisseriameningitidis)Cas9的天然存在的Cas9所示的序列以及与该序列具有至少30％、40％、50％、60％、70％、80％、90％、95％、98％或99％同源性并且作为DNA结合蛋白，如RNA引导的DNA结合蛋白的蛋白质序列。

根据一个方面，Cas12蛋白包括如针对来自新凶手弗朗西斯氏菌(Francisellanovicida)、氨基酸球菌属(Acidaminococcus)、毛螺菌属(Lachnospiraceae)或普氏菌属(Prevotella)的天然存在的Cas12所示的序列以及与该序列具有至少30％、40％、50％、60％、70％、80％、90％、95％、98％或99％同源性并且作为DNA结合蛋白，如RNA引导的DNA结合蛋白的蛋白质序列。

在一些实施方案中，转录因子DNA结合结构域来源于亲本Cas蛋白，如亲本Cas9或Cas12蛋白。在一些实施方案中，转录因子DNA结合结构域是或包含被修饰成缺乏核酸酶活性的Cas9。在一些实施方案中，转录因子DNA结合结构域是或包含被修饰成缺乏核酸酶活性的Cas12。

天然存在的Cas9包含两个核酸酶结构域：HNH样核酸酶结构域，它切割与引导RNA序列互补的DNA链(靶标链)；以及RuvC样核酸酶结构域，它切割与互补链相反的DNA链(非靶标链)。通过同时使HNH和RuvC核酸酶结构域突变(产生所谓的“失活Cas9”或“dCas9”)，得到的dCas9保留了其RNA引导的DNA靶向能力，但失去了其内切核酸酶活性。在一些实施方案中，转录因子DNA结合结构域是包含突变的HNH和RuvC核酸酶结构域的dCas9。在一些实施方案中，转录因子DNA结合结构域是包含突变HNH和RuvC核酸酶结构域的dCas9并且来源于亲本金黄色葡萄球菌、嗜热链球菌、化脓性链球菌或脑膜炎奈瑟氏菌Cas9。

天然存在的Cas12(例如Cas12a和Cas12b)包含切割DNA的RuvC样结构域。通过使RuvC核酸酶结构域突变，催化性失活的Cas12(DNA酶活性失活，在本文中又称为“dCas12”)可以来源于亲本Cas12蛋白。在一些实施方案中，转录因子DNA结合结构域是或包含催化性失活的Cas12(dCas12)。

在一些实施方案中，转录因子DNA结合结构域来源于作为II型Cas同源物的亲本蛋白质。Cas9是II型Cas蛋白的一个例子。在一些实施方案中，转录因子DNA结合结构域是或包含缺乏核酸酶活性或已被修饰为缺乏核酸酶活性的II型Cas同源物。在一些实施方案中，转录因子DNA结合结构域是或包括含突变HNH和RuvC核酸酶结构域的II型Cas同源物。

根据一个例示性实施方案，Cas9被改变或以其他方式修饰成使核酸酶活性失活。这种改变或修饰包括改变一个或多个氨基酸以使核酸酶活性或核酸酶结构域失活。此类修饰包括去除展现出核酸酶活性的一个或多个多肽序列，即核酸酶结构域，由此使得Cas9DNA结合蛋白中不存在展现出核酸酶活性的一个或多个多肽序列，即核酸酶结构域。使核酸酶活性失活的其他修饰对于本领域技术人员来说将是显而易见的。因此，无核酸酶的DNA结合蛋白包括被修饰成使核酸酶活性失活或的多肽序列或去除一个或多个多肽序列以使核酸酶活性失活。即使核酸酶活性已失活，无核酸酶的DNA结合蛋白仍保留与DNA结合的能力。因此，DNA结合蛋白包括DNA结合所需的一个或多个多肽序列，但可能缺少展现出核酸酶活性的一个或多个或所有核酸酶序列。参见Jinek等人(2012)Science 337,816-821。缺乏核酸酶活性的Cas9蛋白被称为无核酸酶Cas9(“Cas9Nuc”、“失活Cas9”或“dCas9”)，并展现出降低或消除的核酸酶活性，或在检测水平内不存在或基本上不存在核酸酶活性。根据这一点，使用已知测定法可能无法检测到Cas9Nuc的核酸酶活性，即，其核酸酶活性低于已知测定法的检测水平。

在一些实施方案中，转录因子DNA结合结构域来源于Cas9亲本蛋白质。在一些实施方案中，转录因子DNA结合结构域包含具有突变核酸酶结构域的Cas9(称为“失活Cas9”或“dCas9”)。由此产生的dCas9保留了其RNA引导的DNA靶向能力，但失去了其核酸内切酶活性。在一些实施方案中，转录因子DNA结合结构域是dCas9。

本公开提供了使用引导RNA使Cas蛋白，例如可操作地连接至DRD的无核酸酶Cas9靶向本文所描述的多核苷酸结合序列。当知道特定的多核苷酸结合序列时，本领域技术人员可以容易地设计出此类引导RNA。引导RNA可以包括间隔序列、tracr配对序列和tracr序列中的一者或多者。术语间隔序列是本领域技术人员所理解的并且可包括与多核苷酸结合序列具有足够互补性以与多核苷酸结合序列杂交并导引CRISPR复合物与多核苷酸结合序列的序列特异性结合的任何多核苷酸。引导RNA可以由间隔序列与tracr配对序列(该序列可称为crRNA)和单独的tracr序列共价联接而形成，其中tracr配对序列与tracr序列的一部分杂交。根据某些方面，tracr配对序列和tracr序列如利用接头序列通过共价键联接或连接，该构建体可称为tracr配对序列和tracr序列的融合物。本文所提到的接头序列是一种联接tracr配对序列和tracr序列的核苷酸序列，本文称为核酸序列。因此，引导RNA可以是一种双组分种类(即，杂交在一起的独立地crRNA和tracr RNA)或单分子种类(即，crRNA-tracr RNA融合物，通常称为sgRNA)。

在一些实施方案中，引导RNA可以通过包括注射或脂转染在内的本领域技术人员已知的方法，作为天然种类或作为从其同源DNA转录的种类直接递送至细胞，其中所述同源DNA通过以下方式引入细胞中：电穿孔、瞬时和稳定转染(包括脂转染)以及病毒转导。

在一些实施方案中，转录因子系统包含一个或多个编码DRD调控的转录因子的多核苷酸，其中转录因子包含DNA结合结构域，该DNA结合结构域是或包含无核酸酶的Cas9。当添加DRD稳定配体时，DRD和转录因子变稳定，并且无核酸酶的Cas9被表达出来并且可用于结合引导RNA。在与引导RNA结合后，Cas9-gRNA系统结合多核苷酸结合序列，该多核苷酸结合序列可操作地连接至感兴趣蛋白质。当Cas9-gRNA系统结合多核苷酸结合序列时，由于存在转录因子激活结构域，故感兴趣蛋白质基因被转录。因此，当可调控的转录因子表达构建体包含Cas9-gRNA系统时，通过将DRD系栓或联接至无核酸酶的Cas9或转录因子激活结构域而在细胞，如人类细胞中实现RNA引导的DNA调控。因此，本公开的方面包括通过将DRD与Cas9Nuc或与转录因子激活结构域或两者融合、联接或接合来将转录调控结构域定位到靶标基因座的方法和材料。

在一些实施方案中，转录因子DNA结合结构域来源于TAL亲本蛋白质。转录激活因子样(TAL)效应子(又称为“TALE”)是由黄单胞菌(Xanthomonas)细菌分泌蛋白，用于调节宿主植物中的基因表达并帮助细菌感染。TAL效应子有一个重复区，由主要具有33或34个氨基酸残基的串联重复序列组成。重复单体主要在氨基酸位置12和13上有所不同，并且在位置12和13的独特氨基酸对与TALE结合位点中的相应核苷酸之间存在强相关性。本公开的转录因子DNA结合结构域可以包含能够结合至特定DNA结合位点的TAL效应子的全部或部分重复区。在一些实施方案中，DNA结合结构域包含能够识别所希望核酸序列的合成TAL效应子。本领域技术人员容易获得用于组装定制TAL效应子的方法。“工程改造的TAL效应子”在本文中是指来源于亲本TAL效应子蛋白的多肽，该多肽包含TAL效应子的重复区和/或合成TAL效应子或其区域。在一些实施方案中，转录因子DNA结合结构域是能够结合至特定核酸位点的工程改造的TAL效应子。在一些实施方案中，转录因子DNA结合结构域来源于锌指蛋白亲本蛋白质。在一些实施方案中，亲本锌指蛋白可以是C2H2锌指蛋白。在一些实施方案中，转录因子DNA结合结构域可以包含一个或多个锌指结构域，所述锌指结构域与DNA进行序列特异性接触。在一些实施方案中，转录因子DNA结合结构域可以包含至少两个锌指结构域、至少三个锌指结构域、至少四个锌指结构域或至少五个锌指结构域，这些锌指结构域形成能够特异性识别DNA位点的锌指阵列。在一些实施方案中，转录因子DNA结合结构域包含三指阵列。包含一个或多个锌指结构域的工程改造的DNA结合结构域在本文中称为“工程改造的锌指结合蛋白”。

在一些实施方案中，转录因子DNA结合结构域可以选自工程改造的锌指结合蛋白、工程改造的TAL效应子或者其他天然或工程改造的DNA结合结构域。

锌指结构域和TALE DNA结合结构域可以被“工程改造”成结合预定的核苷酸序列，例如通过工程改造天然存在的锌指或TALE蛋白的识别区(改变其一个或多个氨基酸)。因此，工程改造的DNA结合蛋白(锌指或TALE)是非天然存在的蛋白质。用于工程改造DNA结合蛋白的方法的非限制性实例是设计和选择。设计的DNA结合蛋白是自然界中不存在的蛋白质，其设计/组成主要是根据合理的标准。设计的合理标准包括应用取代规则和计算机化算法来处理存储现有ZFP和/或TALE设计和结合数据信息的数据库中的信息。参见例如美国专利号8,586,526、6,140,081、6,453,242、6,534,261和8,586,526；另参见WO 98/53058、WO98/53059、WO 98/53060、WO 02/016536和WO 03/016496，这些参考文献涉及来源于现有ZFP和/或TALE蛋白的DNA结合蛋白的设计和选择以及其相关结合数据的公开内容以引用的方式整体并入本文。

根据本公开的工程改造的转录因子的激活结构域可以来源于现有转录因子的区域或结构域。在一些实施方案中，激活结构域是现有转录因子中能够转录激活的区域。在一些实施方案中，转录因子激活结构域可以选自p65、VP64、p300、SAM、VPR的激活结构域或其他激活结构域。在一些实施方案中，激活结构域来源于人转录因子NF-κβp65蛋白(本文称为“p65”)的羧基末端区。在一些实施方案中，激活结构域包含人转录因子NF-κβp65蛋白的羧基末端区。

本文所提供的转录因子系统设计中的一个考虑因素是，编码的转录因子能够结合至特定多核苷酸结合位点，并且编码有效负载的核酸序列可操作地连接至包含该特定多核苷酸结合位点的诱导型启动子。在各个实施方案中，诱导型启动子是外源诱导型启动子。转录因子(包括工程改造的转录因子在内)与其相应多核苷酸结合位点的对是本领域中已知的。DNA结合蛋白的DNA结合结构域与其相应多核苷酸结合位点以及用于鉴别可用于设计合成转录因子和相应合成启动子的新DNA结合结构域序列和相应多核苷酸结合位点的方法也是已知的。例如，Khalil A.S.等人提供了可用作构建合成转录因子的核心构建块的锌指阵列，并且还提供了可插入合成启动子内并被锌指阵列识别的相应核酸结合序列(KhalilA.S.等人,Cell 2012,150,647-658，以引用方式整体并入)。Khalil A.S.等人还鉴别出合成的转录因子-启动子对，并提供了通过改变启动子(例如使锌指结合序列多聚化以产生具有重复操纵子的启动子)和改变合成转录因子(例如通过产生变体)来改进转录输出的设计策略。Khalil A.S.等人公开的任何转录因子-启动子对或工程改造的锌指阵列及其相应核酸结合位点可以用于本公开的转录因子系统。例如，Khalil A.S.等人的图3A提供了锌指阵列的识别螺旋的氨基酸残基和相应DNA结合序列的文库，该文库可用于设计本公开的转录因子DNA结合结构域和特定多核苷酸结合位点。本领域技术人员将能够通过将由Khalil,A.S.等人所提供的转录因子或锌指阵列的序列克隆至本文所提供的转录因子系统的构建体中来修饰这些转录因子或阵列的序列。作为另一个例子，Zhang,F.等人描述了用于设计和制造具有相应核酸结合位点的工程改造的TAL效应子的方法。这些可用于制备工程改造的转录因子及其特定多核苷酸结合位点。Zhang,F.等人提供的TAL效应子中的任一者均可用于制备本公开的转录因子系统中的转录因子DNA结合结构域。例如，Zhang,F.等人公开了17种靶向特定DNA结合位点的人工TAL效应物的构建，并且还在图2a中提供了TAL效应子重复区的序列和相应核酸结合序列。Zhang,F.等人公开的TAL效应子或其DNA结合部分可用于构建本公开的诱导型启动子的DNA结合结构域以及相应核酸结合序列。本领域技术人员将认识到，本公开的DNA结合结构域的选择和设计有若干选项。除了选择本领域已知的公认DNA结合蛋白和结构域之外，还可以基于现有DNA结合蛋白的构架设计本公开的DNA结合结构域。例如，本领域技术人员可使用基于Cys₂His₂锌指蛋白构架选择DNA结合结构域的方法(Pabo,C.O.等人,Annu.Rev.Biochem.2001.70:313-40)。

在一些实施方案中，可操作地连接至编码有效负载的核酸序列的诱导型启动子包含最小启动子(又称为“迷你启动子(min promoter)”或“核心启动子”)和特定多核苷酸结合位点。在这种情况下，最小启动子和特定多核苷酸结合位点均可操作地连接至编码有效负载的核酸序列。术语“最小启动子”是指能够形成起始复合物的最小结构。最小启动子可以包含RNA聚合酶结合位点、TATA盒和转录起始位点。最小启动子可以与一个或多个反应元件(如增强子或转录因子结合位点)偶联以产生诱导型启动子。关于最小启动子以及最小启动子与反应元件偶联的更多细节是由Ede及其同事提供(Ede等人,ACS Synth Biol.2016年5月20日；5(5):395-404)。在一些实施方案中，本公开的转录因子系统或其组分的诱导型启动子包含选自以下最小启动子的最小启动子：minCMV、CMV53(添加了上游GC盒的minCMV)、minSV40(最小猿病毒40启动子)、miniTK(单纯疱疹病毒胸苷激酶启动子的-33至+32区)、MLP(腺病毒主要晚期启动子的-38至+6区)、pJB42CAT5(来源于人junB基因的最小启动子)、YB_TATA(Benenson及其同事开发的合成最小启动子(Hansen,J.等人,Proc Natl Acad SciUSA.2014；111:15705-15710))以及单独TATA盒。

在一些实施方案中，所述特定多核苷酸结合位点可包含至少一个具有被转录因子DNA结合结构域识别和结合的特定序列的核酸位点。在一些实施方案中，所述特定多核苷酸结合位点包含两个或更多个核酸位点，各具有被转录因子DNA结合结构域识别和结合的特定序列。上文论述了DNA结合结构域与其相应多核苷酸结合位点的对。

可以选择编码有效负载的核酸序列来编码任何有效负载或感兴趣蛋白质。有关有效负载的其他详细信息提供于以下“有效负载”部分中。

可以单独使用(作为单个构建体)或作为转录因子系统的一部分组合使用的示例性核酸构建体描述于表1中。表1中的星号(“*”)表示终止密码子的翻译。

表2中提供了包含结构不同的转录因子组分的其他说明性构建体。表2中的星号(“*”)表示终止密码子的翻译。还提供了不包含受调控的转录因子的相应对照构建体以及个别构建体组分。如关于构建体cjun-001和cjun-002的描述中所示，肽接头位于每个构建体的CA2组分与c-Jun组分之间。此外，所有构建体都包含P2A肽。

转录因子系统的配体依赖性活性的表征

转录因子系统的配体依赖性活性可以通过多种方法表征。

在一些实施方案中，转录因子系统的配体依赖性活性是通过由转录因子系统编码的转录因子多肽(例如转录因子DNA结合结构域、转录因子激活结构域或转录因子DNA结合结构域和转录因子激活结构域)的配体依赖性调控表征。在一些实施方案中，转录因子系统的配体依赖性活性是通过由转录因子系统编码的转录因子多肽的配体剂量依赖性调控表征。一方面，转录因子多肽是包含转录因子激活结构域的多肽。另一方面，转录因子多肽是包含转录因子DNA结合结构域的多肽。另一方面，转录因子多肽是包含转录因子激活结构域和转录因子DNA结合结构域两者的多肽。转录因子多肽的配体依赖性调控可以通过多种方法表征。在一些方面，转录因子多肽的配体依赖性调控可以通过测量，如通过免疫测定法测量转录因子多肽或其结构域的水平来评估。

在一些实施方案中，转录因子系统的配体依赖性活性是通过由转录因子系统编码的有效负载的配体依赖性表达表征。有效负载的表达可以通过多种方法评估。在一些方面，有效负载的表达是通过测量有效负载mRNA水平来评估。在一些方面，有效负载的表达是通过测量有效负载多肽水平来评估。

在一些实施方案中，可以将转录因子系统与缺乏DRD的对照转录因子系统相比较。在一些实施方案中，可以相对于包含缺乏DRD的对照转录因子构建体的转录因子系统的活性来分析或表征转录因子系统的配体依赖性活性。对照转录因子构建体的一个实例是本公开所描述的构建体ZFHD-004(如表1中所示)。

转录因子

转录因子是结合DNA，优选地结合位于启动子中或附近的DNA上的序列特异性位点(转录因子多核苷酸结合位点)的蛋白质，该蛋白质促进转录机构与启动子的结合，由此激活DNA序列的转录。此类实体也称为转录调控蛋白。

在各个实施方案中，用于本文所描述的转录因子系统、组合物和方法的转录因子包括转录因子DNA结合结构域和转录因子激活结构域。在一些实施方案中，转录因子DNA结合结构域和转录因子激活结构域的组合产生功能性转录因子。在各个实施方案中，转录因子DNA结合结构域和/或转录因子激活结构域可与其他转录调控元件相互作用。

在一些实施方案中，转录因子是以识别并结合至特定短DNA序列并由此影响基因表达的蛋白质为例说明。转录因子对DNA序列的识别是通过转录因子蛋白质的氨基酸侧链与充当调控序列的DNA碱基对残基的化学相互作用发生的。转录因子由此“读取”基因组序列，该机制提供了序列识别功能，调控性相互作用的信息方面依据该功能来控制基因表达。

转录因子通常由DNA结合结构域和效应子或激活结构域组成，它们介导与转录所需的其他蛋白质的相互作用，包括与其他转录因子的相互作用。转录因子执行许多功能，包括基因激活。它们在细胞核中转录，在细胞质中翻译，并在所有转录因子蛋白质序列中包括的核定位位点介导下重新进入细胞核时在基因组DNA中找到它们的靶位点。转录因子包括基本结构域，这些结构域使它们非特异性地集中在DNA附近，由此促进其靶位点的扩散限制性发现。

在本公开的各个实施方案中，转录因子系统利用由以下构成和/或包含以下的转录因子：转录因子DNA结合结构域和转录因子效应子或激活结构域或蛋白质(在本文中可互换使用)。转录因子激活结构域、转录因子DNA结合结构域和/或转录因子激活结构域和转录因子DNA结合结构域的组合可操作地连接至DRD(其中任一者是DRD-TF)。在通过结合外源稳定配体使连接的DRD稳定后，稳定的DRD-TF能够转录感兴趣蛋白质。

转录因子DNA结合结构域结合的DNA序列称为转录因子结合位点或反应元件，或如本文可互换使用的特定多核苷酸结合位点；这些结合位点位于受调控的DNA序列的启动子中或附近。包含特定多核苷酸结合位点的启动子可以是外源启动子。在一些实施方案中，启动子可以是外源诱导型启动子。转录因子结合位点或特定多核苷酸结合位点在并入到含有感兴趣蛋白质或有效负载的转录因子系统中时，是外源核酸序列。

在本公开的各个实施方案中，可用于合成转录因子系统的适合转录因子可以包括已知转录因子结合位点的任何已知转录因子。此类转录因子的一些实例包括但不限于STAT家族(STAT 1、2、3、4、5a、5b和6)、c-Fos、FosB、Fra-1、Fra-2、c-Jun、JunB和JunD、fos/jun、NFκB、HIV-TAT、E2F家族、T-Box基因家族、螺旋-环-螺旋转录因子、锌指转录因子(例如ZFHD1、Oct4和Zif268)、工程改造的锌指转录因子，以及来自以下家族的转录因子：bHLH、bZIP、叉头、核受体、HMG/Sox、Ets、T盒、AT钩(AT hook)、同源结构域+POU、Myb/SANT、THAP指、CENPB、E2F、BED ZF、GATA、Rel、CxxC、IRF、SAND、SMAD、HSF、MBD、RFX、CUT+同源结构域、DM、STAT、ARID/BRIGHT、Grainyhead、MADS盒、AP-2、CSD和同源结构域+PAX。示例性转录因子DNA结合结构域可以包括一个或多个DNA结合结构域，这些DNA结合结构域来源于选自由ZFHD1、Cas9、Cas12和TAL组成的组的亲本蛋白质。

在各个实施方案中，转录因子系统提供感兴趣蛋白质或有效负载(在本文中可互换使用)的可调性转录。在各个实施方案中，编码感兴趣蛋白质的核酸序列可操作地连接至包含特异性多核苷酸结合位点的外源诱导型启动子，即，确定的DNA多核苷酸序列，该序列特异性结合转录因子DNA结合结构域。转录因子结合结构域与转录因子DNA激活结构域的组合则能够调控感兴趣蛋白质的转录。

当包含DRD-TF的细胞或生物体暴露于外源稳定配体时，DRD-TF变稳定。然后，稳定的DRD-TF能够结合DRD-TF所结合的特定多核苷酸结合位点，并由此调控编码感兴趣蛋白质的多核苷酸的转录。在一些实施方案中，结合稳定的DRD-TF将激活编码感兴趣蛋白质的多核苷酸的转录，由此引起细胞或生物体中的蛋白质表达。在没有外源稳定配体的情况下，DRD-TF被降解并且无法激活转录。因此，可以通过向细胞或生物体施用外源稳定配体来控制蛋白质表达的量和时间。

在各个实施方案中，转录因子DNA结合结构域、转录因子激活结构域通常可操作地连接或可以由一个或多个插入序列，例如接头或切割位点隔开。在各个实施方案中，第一多核苷酸可以包括编码转录因子DNA结合结构域的第一核酸序列；编码转录因子激活结构域的第二核酸序列；以及编码药物反应性结构域(DRD)的第三核酸序列。在此类实施方案中，转录因子激活结构域和/或转录因子DNA结合结构域在细胞中表达后，可操作地连接至DRD。此外，细胞还将包括第二多核苷酸，该第二多核苷酸包含可以被转录因子DNA结合结构域特异性结合的第四核酸序列和编码如本文所描述的感兴趣蛋白质或有效负载的第五核酸序列。

转录因子DNA结合结构域、转录因子激活结构域和感兴趣蛋白质或有效负载可以提供于同一载体上或在不同的载体上以用于本公开的方法。

在一些实施方案中，载体包含本文所描述的多核苷酸。在一些实施方案中，载体至少包含编码转录因子DNA结合结构域和转录因子激活结构域中的至少一者的第一核酸序列，以及编码药物反应性结构域(DRD)的第二核酸序列；其中转录因子DNA结合结构域和/或转录因子激活结构域可操作地连接至DRD。任选地，在一些实施方案中，第一载体包含连接至DRD的转录因子，并且第二载体包含可操作地连接至转录因子多核苷酸结合位点的感兴趣蛋白质或有效负载。在另一个实施方案中，单个载体包含：编码转录因子的第一核酸序列，该转录因子能够结合至特定多核苷酸结合位点并激活转录；编码药物反应性结构域(DRD)的第二核酸序列；其中所述转录因子可操作地连接至DRD；以及任选地，编码感兴趣蛋白质的第三核酸序列，该第三核酸序列可操作地连接至包含转录因子多核苷酸结合位点的诱导型启动子。在一些实施方案中，第一载体至少包含编码转录因子DNA结合结构域和转录因子激活结构域中的至少一者的第一核酸序列，以及编码药物反应性结构域(DRD)的第二核酸序列；其中转录因子DNA结合结构域和/或转录因子激活结构域可操作地连接至DRD，并且第二载体包含可以被转录因子DNA结合结构域特异性结合的第三核酸序列和编码如本文所描述的感兴趣蛋白质或有效负载的第四核酸序列。

在一些实施方案中，载体还具有允许载体例如在细菌中扩增的复制起点(ori)。此外或替代地，载体包括选择性标记物，例如抗生素抗性基因、有色标记物的基因和自杀基因。

药物反应性结构域(DRD)

药物反应性结构域(DRD)是这样一类蛋白质结构域，这些结构域在没有配体的情况下不稳定和降解，但通过结合相应的DRD结合配体将恢复其稳定性。术语药物反应性结构域(DRD)可与术语去稳定结构域(DD)互换。药物反应性结构域(DRD)可以附接到多肽或蛋白质上，并且可以使连接的多肽或蛋白质在无DRD结合配体存在下不稳定。DRD通过蛋白质降解将它们的去稳定特性传递给连接的多肽或蛋白质。不希望受任何理论束缚，在无DRD结合配体存在下，附接的多肽或蛋白质被细胞的泛素-蛋白酶体系统迅速降解。与DRD结合或相互作用的配体可以在这种结合或相互作用后调节附接的多肽或蛋白质的稳定性。当配体结合其预定DRD时，不稳定性被逆转，并且附接的多肽或蛋白质的功能可以得到恢复。DRD稳定的条件性允许从稳定的蛋白质快速且无干扰地切换到不稳定的底物以进行降解。此外，DRD对其配体浓度的依赖性进一步提供了对降解速率的可调性控制。

在一些实施方案中，本公开的DRD可以来源于能够对蛋白质进行翻译后调控的已知多肽。在一些实施方案中，本公开的DRD可以从已知蛋白质开发或得到。野生型蛋白质的区域或部分或结构域可以全部或部分用作DRD。它们可以组合或重新排列以产生新的肽、蛋白质、区域或结构域，其中任一者都可以用作DRD或其他DRD设计的起点。

在一些实施方案中，DRD可以来源于亲本蛋白质或来源于与亲本蛋白质相比具有一个、两个、三个或更多个氨基酸突变的突变蛋白质。在一些实施方案中，亲本蛋白质可以选自但不限于FKBP；人体蛋白质FKBP；人DHFR(hDHFR)；大肠杆菌DHFR(ecDHFR)；PDE5(磷酸二酯酶5)；CA2(碳酸酐酶II)；和ER(雌激素受体)。可用于开发DRD及其配体的蛋白质的实例列于表3中。

表3：蛋白质及其结合配体

在一些实施方案中，用于产生DRD的蛋白质的序列可包含表3中蛋白质序列的全部、部分或其区域。在一些实施方案中，可用于产生DRD的蛋白质包括表3中所列蛋白质的同工型。

hPDE5DRD

在一些实施方案中，本公开的DRD来源于hPDE5。在一些实施方案中，本公开的DRD来源于hPDE5同工型2。在一些实施方案中，本公开的DRD来源于hPDE5同工型3。在一些实施方案中，本公开的DRD来源于hPDE5同工型X1。

在一些实施方案中，本公开的DRD来源于cGMP特异性3’,5’-环状磷酸二酯酶(hPDE5)，它包含SEQ ID NO.71的氨基酸序列。

在一些实施方案中，本公开的DRD可以包括整个hPDE5(SEQ ID NO.71)。在一些实施方案中，来源于hPDE5的DRD可以包含hPDE5的催化结构域(例如SEQ ID NO.71的535-860)。在一些实施方案中，本公开的hPDE5DRD可以在hPDE5的催化结构域(即，hPDE5野生型(WT)的氨基酸535-860)的N末端包括甲硫氨酸。

在一些实施方案中，本公开的DRD全部或部分地包含cGMP特异性3’,5’-环状磷酸二酯酶(hPDE5；SEQ ID NO.71)，并且还包含在SEQ ID NO.71第732位氨基酸(R732)的突变。在一些实施方案中，第732位氨基酸(R732)的突变选自由以下组成的组：R732L、R732A、R732G、R732V、R732I、R732P、R732F、R732W、R732Y、R732H、R732S、R732T、R732D、R732E、R732Q、R732N、R732M、R732C和R732K。

在一些实施方案中，本公开的hPDE5DRD还可包含一个或多个独立地选自由以下组成的组的突变：H653A、F736A、D764A、D764N、Y612F、Y612W、Y612A、W853F、I821A、Y829A、F787A、D656L、Y728L、M625I、E535D、E536G、Q541R、K555R、F559L、F561L、F564L、F564S、K591E、N587S、K604E、K608E、N609H、K630R、K633E、N636S、N661S、Y676D、Y676N、C677R、H678R、D687A、T712S、D724N、D724G、L738H、N742S、A762S、D764G、D764V、S766F、K795E、L797F、I799T、T802P、S815C、M816A、I824T、C839S、K852E、S560G、V585A、I599V、I648V、S663P、L675P、T711A、F744L、L746S、F755L、L804P、M816T和F840S。

在一些实施方案中，本公开的DRD全部或部分地包含cGMP特异性3’,5’-环状磷酸二酯酶(hPDE5；SEQ ID NO.71)，并且还包含在SEQ ID NO.71第732位氨基酸(R732)的突变。在一些此类实施方案中，DRD还包含(i)在SEQ ID NO.71第764位氨基酸(D764)的突变，其中在D764处的突变选自D764N和D764A；(ii)SEQ ID NO.71第612位氨基酸(Y612)的突变，其中在Y612处的突变选自由Y612A、Y612F和Y612W组成的组；(iii)SEQ ID NO.71第736位氨基酸(F736)的突变F736A；或(iv)SEQ ID NO.71第653位氨基酸(H653)的突变H653A。

在一些实施方案中，本公开的DRD全部或部分地包含cGMP特异性3’,5’-环状磷酸二酯酶(hPDE5；SEQ ID NO.71)，并且还包含相对于SEQ ID NO.71在某一位置处的氨基酸突变，该突变选自由以下组成的组：W853F、I821A、Y829A、F787A、F736A、D656L、Y728L、M625I和H653A。

在一些实施方案中，本公开的hPDE5DRD可包含一个或多个独立地选自由以下组成的组的突变：T537A、E539G、V548E、D558G、F559S、E565G、C574N、R577Q、R577W、N583S、Q586R、Q589L、K591R、K591R、L595P、C596R、W615R、F619S、Q623R、K633I、Q635R、N636S、T639S、D640N、E642G、I643T、L646S、A649V、A650T、S652G、H653A、D654G、V660A、V660A、L672P、A673T、C677Y、M681T、E682G、H685R、F686S、Q688R、M691T、S695G、G697D、S702I、I706T、E707K、Y709H、Y709C、I715V、I720V、A722V、D724G、Y728C、K730E、R732L、L738I、I739M、K741N、K741R、F744L、D748N、K752E、K752E、K752E、E753K、L756V、M758T、M760T、A762V、C763R、D764N、D764N、I774V、L781F、L781P、E785K、R794G、M805T、R807G、K812R、I813T、I813T、M816R、Q817R、V818A、F820S、I821V、C825R、Y829C、E830K、L832P、S836L、C846Y、C846S、L856P、L856P、A857T或E858G。

在一些实施方案中，本公开的hPDE5DRD可以包含两个独立地选自以下的突变：E536K、I739W；H678F、S702F；E669G、I700T；G632S、I648T；T639S、M816R；Q586R、D724G；E539G、L738I；L672P、S836L；M691T、D764N；I720V、F820S；E682G、D748N；S652G、Q688R；Y728C、Q817R；H653、R732L；L595P、K741R；R732D、F736S；R732E、F736D；R732V、F736G；R732W、F736G；R732W、F736V；R732L、F736W；R732P、F736Q；R732A、F736A；R732S、F736G；R732T、F736P；R732M、F736H；R732Y、F736M；R732P、F736D；R732P、F736G；R732W、F736L；R732L、F736S；R732D、F736T；R732L、F736V；R732G、F736V；以及R732W、F736A。

在一些实施方案中，本公开的hPDE5DRD可以包含两个独立地选自Q623R、D654G、K741N的突变；A673T、L756V、C846Y；E642G、G697D、I813T；C677Y、H685R、A722V；Q635R、E753K、I813T；Y709H、K812R、L832P；N583S、K752E、C846S；K591R、I643T、L856P；F619S、V818A、Y829C；和F559S、Y709C、M760T。在一些实施方案中，本公开的hPDE5DRD可以包含两个独立地选自以下的突变：S695G、E707K、I739M、C763R；A649V、A650T、K730E、E830K；以及R577W、W615R、M805T、I821V。

在一些实施方案中，本公开的hPDE5DRD可以包含独立地选自下的多个突变：V660A、L781F、R794G、C825R、E858G；T537A、D558G、I706T、F744L、D764N；R577Q、C596R、V660A、I715V、E785K、L856P；以及V548E、Q589L、K633I、M681T、S702I、K752E、L781P、A857T。

hDHFR DRD

在一些实施方案中，本公开的DRD来源于人二氢叶酸还原酶(hDHFR)蛋白，例如但不限于人二氢叶酸还原酶1(hDHFR1)、人二氢叶酸还原酶2(hDHFR2)或其片段或变体。

在一些实施方案中，DRD可以来源于hDHFR蛋白并且包括至少一个突变。在一些实施方案中，DRD可以来源于hDHFR蛋白并且包括多于一个突变。在一些实施方案中，DRD可以来源于hDHFR蛋白并且包括两个、三个、四个或五个突变。

在一些实施方案中，本公开的DRD可以包括整个hDHFR(SEQ ID NO.2)。在一些实施方案中，来源于hDHFR的DRD可以包含亲本hDHFR序列的氨基酸2-187(例如SEQ ID NO.2的氨基酸2-187)。这在本文中被称为hDHFR M1del突变。

在一些实施方案中，本公开的DRD包含hDHFR(SEQ ID NO.2)的一个区域或全部，并且还相对于SEQ ID NO.2包含选自以下的突变：I17V、F59S、N65D、K81R、Y122I、N127Y、M140I、K185E、N186D和M140I。

在一些实施方案中，本公开的DRD包含hDHFR(SEQ ID NO.2)的一个区域或全部，并且还相对于SEQ ID NO.2包含两个或更多个突变。

在一些实施方案中，本公开的hDHFR DRD包含两个或更多个选自以下的突变：(A10V、H88Y)；(C7R/Y163C)；(I17V、Y122I)；(Q36H、Y122I)；(Q36K、Y122I)；(Q36R、Y122I)；(Q36S、Y122I)；(Q36T、Y122I)；(N65H、Y122I)；(N65L、Y122I)；(N65R、Y122I)；(N65W、Y122I)；(Q103E、Y122I)；(Q103S、Y122I)；(N108D；Y122I)；(V121A、Y122I)；(Y122I、K174N)；(Y122I、E162G)；(A125F、Y122I)；(N127Y、Y122I)；(H131R/E144G)；(E162G/I176F)；(K55R、N65K、Y122I)；(Q36E、Q103H、Y122I)；(Q36F、N65F、Y122I)；以及(V110A/V136M/K177R)。

在一些实施方案中，本公开的hDHFR DRD包含两个或更多个选自以下的突变：(I17V、Y122I)；(G21T、Y122N)；(Q36H、Y122I)；(Q36K、Y122I)；(Q36R、Y122I)；(Q36S、Y122I)；(Q36T、Y122I)；(N65H、Y122I)；(N65L、Y122I)；(N65R、Y122I)；(N65W、Y122I)；(L74N、Y122I)；(Q103E、Y122I)；(Q103S、Y122I)；(N108D；Y122I)；(V121A、Y122I)；(Y122I、K174N)；(Y122I、E162G)；(A125F、Y122I)；(N127Y、Y122I)；(K55R、N65K、Y122I)；(Q36E、Q103H、Y122I)；和(Q36F、N65F、Y122I)。

在一些实施方案中，本公开的DRD全部或部分包含人二氢叶酸还原酶(hDHFR；SEQID NO.2)，并且还包含在SEQ ID NO.2的第122位氨基酸(Y122)中的Y122I突变。在一些此类实施方案中，DRD还包含：(i)SEQ ID NO.2的第36位氨基酸(Q36)的Q36K突变；(ii)SEQ IDNO.2的第125位氨基酸(A125)的A125F突变；(iii)SEQ ID NO.2的第65位氨基酸(N65)的N65F突变以及在SEQ ID NO.2的氨基酸位置36(Q36)处的F或K取代。

在一些实施方案中，本公开的hDHFR DRD可以包含一个或多个独立地选自由以下组成的组的突变：M1del、V2A、C7R、I8V、V9A、A10T、A10V、Q13R、N14S、G16S、I17N、I17V、K19E、N20D、G21T、G21E、D22S、L23S、P24S、L28P、N30D、N30H、N30S、E31G、E31D、F32M、R33G、R33S、F35L、Q36R、Q36S、Q36K、Q36F、R37G、M38V、M38T、T40A、V44A、K47R、N49S、N49D、M53T、G54R、K56E、K56R、T57A、F59S、I61T、K64R、N65A、N65S、N65D、N65F、L68S、K69E、K69R、R71G、I72T、I72A、I72V、N73G、L74N、V75F、R78G、L80P、K81R、E82G、H88Y、F89L、R92G、S93G、S93R、L94A、D96G、A97T、L98S、K99G、K99R、L100P、E102G、Q103R、P104S、E105G、A107T、A107V、N108D、K109E、K109R、V110A、D111N、M112T、M112V、V113A、W114R、I115V、I115L、V116I、G117D、V121A、Y122C、Y122D、Y122I、K123R、K123E、A125F、M126I、N127R、N127S、N127Y、H128R、H128Y、H131R、L132P、K133E、L134P、F135P、F135L、F135S、F135V、V136M、T137R、R138G、R138I、I139T、I139V、M140I、M140V、Q141R、D142G、F143S、F143L、E144G、D146G、T147A、F148S、F148L、F149L、P150L、E151G、I152V、D153A、D153G、E155G、K156R、Y157R、Y157C、K158E、K158R、L159P、L160P、E162G、Y163C、V166A、S168C、D169G、V170A、Q171R、E172G、E173G、E173A、K174R、I176A、I176F、I176T、K177E、K177R、Y178C、Y178H、F180L、E181G、V182A、Y183C、Y183H、E184R、E184G、K185R、K185del、K185E、N186S、N186D、D187G和D187N。

在一些实施方案中，本公开的DRD包含hDHFR(C7R、Y163C)；hDHFR(E162G、I176F)；hDHFR(G21T、Y122I)；hDHFR(H131R、E144G)；hDHFR(I17V、Y122I；hDHFR(L74N、Y122I；hDHFR(L94A、T147A)；hDHFR(M53T、R138I)；hDHFR(N127Y、Y122I)；hDHFR(Q36K、Y122I)；hDHFR(T137R、F143L)；hDHFR(T57A、I72A)；hDHFR(V121A、Y122I)；hDHFR(V75F、Y122I)；hDHFR(Y122I、A125F)；hDHFR(Y122I、M140I)；hDHFR(Y178H、E181G)；hDHFR(Y183H、K185E)；hDHFR(WT的氨基酸2-187)(G21T、Y122I)；hDHFR(WT的氨基酸2-187)(I17V、Y122I)；hDHFR(WT的氨基酸2-187)(L74N、Y122I)；hDHFR(WT的氨基酸2-187)(L94A、T147A)；hDHFR(WT的氨基酸2-187)(M53T、R138I)；hDHFR(WT的氨基酸2-187)(N127Y、Y122I)；hDHFR(WT的氨基酸2-187)(Q36K、Y122I)；hDHFR(WT的氨基酸2-187)(V121A、Y122I)；hDHFR(WT的氨基酸2-187)(V75F、Y122I)；hDHFR(WT的氨基酸2-187)(Y122I、A125F)；hDHFR(WT的氨基酸2-187)(Y122I、M140I)；hDHFR(E31D、F32M、V116I)；hDHFR(G21E、I72V、I176T)；hDHFR(I8V、K133E、Y163C)；hDHFR(K19E、F89L、E181G)；hDHFR(L23S、V121A、Y157C)；hDHFR(N49D、F59S、D153G)；hDHFR(Q36F、N65F、Y122I)；hDHFR(Q36F、Y122I、A125F)；hDHFR(V110A、V136M、K177R)；hDHFR(V9A、S93R、P150L)；hDHFR(Y122I、H131R、E144G)；hDHFR(G54R、I115L、M140V、S168C)；hDHFR(WT的氨基酸2-187)(E31D、F32M、V116I)；hDHFR(WT的氨基酸2-187)(Q36F、N65F、Y122I)；hDHFR(WT的氨基酸2-187)(Q36F、Y122I、A125F)；hDHFR(WT的氨基酸2-187)(Y122I、H131R、E144G)；hDHFR(V2A、R33G、Q36R、L100P、K185R)；hDHFR(D22S、F32M、R33S、Q36S、N65S)；hDHFR(WT的氨基酸2-187)(D22S、F32M、R33S、Q36S、N65S)；hDHFR(I17N、L98S、K99R、M112T、E151G、E162G、E172G)；hDHFR(G16S、I17V、F89L、D96G、K123E、M140V、D146G、K156R)；hDHFR(K81R、K99R、L100P、E102G、N108D、K123R、H128R、D142G、F180L、K185E)；hDHFR(R138G、D142G、F143S、K156R、K158E、E162G、V166A、K177E、Y178C、K185E、N186S)；hDHFR(N14S、P24S、F35L、M53T、K56E、R92G、S93G、N127S、H128Y、F135L、F143S、L159P、L160P、E173A、F180L)；hDHFR(F35L、R37G、N65A、L68S、K69E、R71G、L80P、K99G、G117D、L132P、I139V、M140I、D142G、D146G、E173G、D187G)；hDHFR(L28P、N30H、M38V、V44A、L68S、N73G、R78G、A97T、K99R、A107T、K109R、D111N、L134P、F135V、T147A、I152V、K158R、E172G、V182A、E184R)；hDHFR(V2A、I17V、N30D、E31G、Q36R、F59S、K69E、I72T、H88Y、F89L、N108D、K109E、V110A、I115V、Y122D、L132P、F135S、M140V、E144G、T147A、Y157C、V170A、K174R、N186S)；hDHFR(L100P、E102G、Q103R、P104S、E105G、N108D、V113A、W114R、Y122C、M126I、N127R、H128Y、L132P、F135P、I139T、F148S、F149L、I152V、D153A、D169G、V170A、I176A、K177R、V182A、K185R、N186S)；以及hDHFR(A10T、Q13R、N14S、N20D、P24S、N30S、M38T、T40A、K47R、N49S、K56R、I61T、K64R、K69R、I72A、R78G、E82G、F89L、D96G、N108D、M112V、W114R、Y122D、K123E、I139V、Q141R、D142G、F148L、E151G、E155G、Y157R、Q171R、Y183C、E184G、K185del、D187N)。

ecDHFR DRD

在一些实施方案中，本公开的DRD来源于大肠杆菌二氢叶酸还原酶(ecDHFR)。在一些实施方案中，DRD可以来源于ecDHFR蛋白并且包括至少一个突变。在一些实施方案中，DRD可以来源于ecDHFR蛋白并且包括多于一个突变。在一些实施方案中，DRD可以来源于ecDHFR蛋白并且包括两个、三个、四个或五个突变。在一些实施方案中，DRD可以来源于ecDHFR蛋白并且包含至少一个选自Y100I、F103L和G121V的突变。在一些实施方案中，DRD可以来源于ecDHFR蛋白并且包含至少两个选自以下的突变：R12Y、Y100I；R12H、E129K；H12Y、Y100I；H12L、Y100I；R98H、F103S；M42T、H114R；N18T、A19V；以及I61F、T68S。

FKBP DRD

在一些实施方案中，本公开的DRD来源于FK506结合蛋白(FKBP)蛋白或者其片段或变体。在一些实施方案中，DRD可以来源于FKBP蛋白并且包括至少一个突变。在一些实施方案中，DRD可以来源于FKBP蛋白并且包括多于一个突变。在一些实施方案中，DRD可以来源于FKBP蛋白并且包括两个、三个、四个或五个突变。

在一些实施方案中，本公开的DRD全部或部分来源于人FKBP蛋白(SEQ ID NO.3)并且包含至少一个选自以下的突变：F36V、F15S、V24A、H25R、E60G、L106P、D100G、M66T、R71G、D100N、E102G和K105I。在一些实施方案中，本公开的FKBP DRD包含多于一个选自以下的突变：F36P、L106P；以及E31G、F36V、R71G、K105E。

ER DRD

在一些实施方案中，本公开的DRD来源于雌激素受体(ER)蛋白或者其片段或变体。在一些实施方案中，DRD可以来源于ER蛋白并且包括至少一个突变。在一些实施方案中，DRD可以来源于ER蛋白并且包括多于一个突变。在一些实施方案中，DRD可以来源于ER蛋白并且包括两个、三个、四个或五个突变。

在一些实施方案中，本公开的DRD包含ER的配体结合结构域(SEQ ID NO：6的氨基酸305至509)。在一些实施方案中，DRD相对于ER配体结合结构域可以包括至少一个突变，其中该突变出现在第413位(N413)和/或第502位(Q502)。在一些实施方案中，突变在位置N413处并且是N413D、N413T、N413H、N413A、N413Q、N413V、N413C、N413K、N413M、N413R、N413S、N413W、N413I、N413E、N413L、N413P、N413F、N413Y或N413G。在一些实施方案中，突变在位置Q502处并且是Q502H、Q502D、Q502E、Q502V、Q502A、Q502T、Q502N、Q502K、Q502S、Q502L、Q502Y、Q502W、Q502F、Q502I、Q502G、Q502P、Q502M或Q502C。在一些实施方案中，DRD包含位置N413和位置Q502处的突变，其中在位置N413处的突变选自N413D、N413T、N413H、N413A、N413Q、N413V、N413C、N413K、N413M、N413R、N413S、N413W、N413I、N413E、N413L、N413P、N413F、N413Y或N413G，并且在位置Q502处的突变选自Q502H、Q502D、Q502E、Q502V、Q502A、Q502T、Q502N、Q502K、Q502S、Q502L、Q502Y、Q502W、Q502F、Q502I、Q502G、Q502P、Q502M或Q502C。

在一些实施方案中，所述至少一个突变是N413D。在一些实施方案中，所述至少一个突变是N413T。在一些实施方案中，所述至少一个突变是Q502H。在一些实施方案中，ERDRD包含至少两个突变并且是N413T、Q502H或N413D、Q502H。

在一些实施方案中，ER DRD还可包含一个或多个独立地选自L384M、M421G、G521R或Y537S的突变。

在一些实施方案中，本公开的DRD包含以下：ER(WT的氨基酸305-549、L384M、N413F、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413L、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413Y、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413H、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413Q、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413I、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413M、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413K、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413V、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413S、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413C、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413W、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413P、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413R、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413T、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413A、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413E、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、N413G、M421G、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502F、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502L、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502Y、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502H、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502I、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502M、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502N、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502K、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502V、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502S、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502C、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502W、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502P、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502T、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502A、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502D、G521R、Y537S)、ER(WT的氨基酸305-549、L384M、M421G、Q502E、G521R、Y537S)和ER(WT的氨基酸305-549、L384M、M421G、Q502G、G521R、Y537S)。

CA2 DRD

在一些实施方案中，本公开的DRD可来源于人碳酸酐酶2(hCA2)，该酶是金属酶超家族碳酸酐酶的成员。在一些实施方案中，DRD可以来源于hCA2蛋白并且包括至少一个突变。在一些实施方案中，DRD可以来源于hCA2蛋白并且包括多于一个突变。在一些实施方案中，DRD可以来源于hCA2蛋白并且包括两个、三个、四个或五个突变。

在一些实施方案中，本公开的DRD可来源于CA2(SEQ ID NO.5)的氨基酸1-260。在一些实施方案中，DRD来源于包含亲本CA2序列的氨基酸2-260(例SEQ ID NO.5的氨基酸2-260)的CA2。这在本文中被称为CA2M1del突变。在一个实施方案中，来源于CA2的DRD可以包含亲本CA2序列的氨基酸2-237(例如SEQ ID NO.5的氨基酸2-237)。

在一些实施方案中，本公开的DRD包含人碳酸酐酶2(CA2；SEQ ID NO.5)的一个区域或全部，并且相对于SEQ ID NO.5还包含选自以下的突变：E106D、G63D、H122Y、I59N、L156H、L183S、L197P、S56F、S56N、W208S、Y193I和Y51T。

在一些实施方案中，本公开的DRD包含人碳酸酐酶2(CA2；SEQ ID NO.5)的一个区域或全部，并且相对于SEQ ID NO.5还包含选自以下的突变：A115L、A116Q、A116V、A133L、A133T、A141P、A152D、A152L、A152R、A173C、A173G、A173L、A173T、A23P、A247L、A247S、A257L、A257S、A38P、A38V、A54Q、A54V、A54X、A65L、A65N、A65V、A77I、A77P、A77Q、C205M、C205R、C205V、C205W、C205Y、D101G、D101M、D110I、D129I、D138G、D138M、D138N、D161*、D161M、D161V、D164G、D164I、D174*、D174T、D179E、D179I、D179R、D189G、D189I、D19T、D19V、D242G、D242T、D32T、D34T、D41T、D52I、D52L、D71F、D71G、D71K、D71M、D71S、D71Y、D72I、D72S、D72T、D72X、D75T、D75V、D85M、E106D、E106G、E106S、E117*、E117N、E14N、E186*、E186N、E204A、E204D、E204G、E204N、E213*、E213G、E213N、E220K、E220R、E220S、E233D、E233G、E233R、E235*、E235G、E235N、E237K、E237R、E238*、E238N、E238R、E26S、E69D、E69K、E69S、F130L、F146V、F175I、F175L、F175S、F178L、F178S、F20L、F20S、F225I、F225L、F225S、F225Y、F230I、F230L、F230S、F259L、F259S、F66S、F70I、F70L、F95Y、G102D、G104R、G104V、G128R、G12D、G12E、G131E、G131R、G131W、G139D、G144D、G144V、G150A、G150S、G150W、G155A、G155C、G155D、G155S、G170A、G170D、G182A、G182W、G195A、G195R、G232R、G232W、G234L、G234V、G25E、G63D、G63V、G81E、G81V、G82D、G86A、G86D、G98V、H107I、H107Q、H119T、H119Y、H122T、H122Y、H15L、H15T、H15Y、H17D、H17I、H36I、H36Q、H64M、H94T、H96T、I145F、I145M、I166H、I166L、I209D、I209L、I215H、I215S、I22L、I255N、I255S、I33S、I59F、I59N、I59S、I91F、K111E、K111N、K112R、K113I、K113N、K126N、K132E、K132R、K148E、K148R、K153*、K153N、K158E、K158N、K167*、K169N、K169R、K171Q、K171R、K18R、K212N、K212Q、K212R、K212W、K224E、K224N、K227*、K227N、K24R、K251E、K251R、K256Q、K260F、K260L、K260Q、K39S、K45N、K45S、K80M、K80R、L118F、L120W、L140V、L140W、L143*、L147*、L147F、L156F、L156H、L156P、L156Q、L163A、L163W、L183P、L183S、L184F、L184P、L188P、L188W、L197*、L197M、L197P、L197R、L197T、L202F、L202H、L202I、L202P、L202R、L202S、L203P、L203S、L203W、L211*、L211A、L211S、L223*、L223I、L223V、L228F、L228H、L228T、L239*、L239F、L239T、L250*、L250P、L250T、L44*、L44M、L47C、L47V、L57*、L57X、L60S、L79F、L79S、L84W、L90*、L90V、M240D、M240L、M240R、M240W、N11D、N11K、N124T、N177*、N177T、N229*、N229T、N231D、N231F、N231K、N231L、N231M、N231Q、N231T、N243Q、N243T、N252E、N252T、N61R、N61T、N61Y、N62K、N62M、N67D、N67T、P137L、P13A、P13H、P13L、P13S、P154L、P154R、P154T、P180L、P180S、P185L、P185S、P185V、P194Q、P200A、P200L、P200S、P200T、P201A、P201L、P201R、P201S、P214T、P236L、P236T、P246L、P246Q、P249A、P249F、P249H、P249I、P249X、P30L、P30S、P42L、P83A、Q103K、Q135S、Q136N、Q157R、Q157S、Q221A、Q221R、Q248F、Q248L、Q248S、Q254A、Q254K、Q28S、Q53H、Q53K、Q53N、Q74R、Q92H、Q92S、R181H、R181S、R181V、R226H、R226P、R226V、R245A、R253G、R253Q、R27A、R58G、R89D、R89F、R89I、R89X、R89Y、S105L、S105Q、S151A、S151I、S151Q、S165F、S165P、S172E、S172V、S187I、S187P、S196H、S196L、S216A、S216Q、S218A、S218Q、S219A、S219Q、S258F、S258P、S29C、S29P、S43P、S43T、S48L、S50P、S56F、S56N、S56P、S56X、S73L、S73N、S73X、S99H、T108L、T125I、T125P、T168K、T168N、T168Q、T176H、T176L、T192D、T192F、T192I、T192N、T192P、T192X、T198D、T198I、T198P、T199A、T199H、T199P、T207D、T207I、T207P、T207S、T35I、T35L、T37Q、T55L、T87L、V109M、V109W、V121F、V134C、V134F、V142F、V149G、V149L、V159L、V159S、V160C、V160L、V162A、V162C、V206*、V206C、V206M、V210C、V217L、V217R、V217S、V222A、V222C、V222G、V241G、V241W、V241X、V31L、V49F、V68L、V68W、V78C、W123G、W123R、W16G、W191*、W191G、W191L、W208G、W208L、W208S、W244*、W244G、W244L、W97C、W97G、Y114H、Y114M、Y127M、Y190*、Y190L、Y190T、Y193C、Y193F、Y193I、Y193L、Y193T、Y193V、Y193X、Y40M、Y51F、Y51M、Y51T、Y51X、Y88T、K9N和S29A。如本文所使用，“*”表示终止密码子的翻译，并且X表示任何氨基酸。

在一些实施方案中，本公开的DRD包含人碳酸酐酶2(CA2；SEQ ID NO.5)的一个区域或全部，并且相对于SEQ ID NO.5还包含两个或更多个突变。

在一些实施方案中，本公开的DRD包含CA2(WT的氨基酸2-260，R27L、H122Y)、CA2(WT的氨基酸2-260，T87I、H122Y)、CA2(WT的氨基酸2-260，H122Y、N252D)、CA2(WT的氨基酸2-260，D72F、V241F)、CA2(WT的氨基酸2-260，V241F、P249L)、CA2(WT的氨基酸2-260，D72F、P249L)、CA2(WT的氨基酸2-260，D71L、L250R)、CA2(WT的氨基酸2-260，D72F、P249F)、CA2(WT的氨基酸2-260，T55K、G63N、Q248N)、CA2(WT的氨基酸2-260，L156H、A257del、S258del、F259del、K260del)、CA2(WT的氨基酸2-260，L156H、S2del、H3del、H4del、W5del)、CA2(WT的氨基酸2-260，W4Y、L156H)、CA2(WT的氨基酸2-260，L156H、G234del、E235del、P236del)、CA2(WT的氨基酸2-260，L156H、F225L)、CA2(WT的氨基酸2-260，D70N、D74N、D100N、L156H)、(CA2(WT的氨基酸2-260，I59N、G102R)、CA2(WT的氨基酸2-260，G63D、E69V、N231I)、CA2(WT的氨基酸2-260，R27L、T87I、H122Y、N252D)、CA2(WT的氨基酸2-260，D72F、V241F、P249L)、CA2(WT的氨基酸2-260，D71L、T87N、L250R)、CA2(WT的氨基酸2-260，L156H、S172C、F178Y、E186D)、CA2(WT的氨基酸2-260，A77I、P249F)、CA2(WT的氨基酸2-260，E106D、C205S)、CA2(WT的氨基酸2-260，C205S、W208S)、CA2(WT的氨基酸2-260，S73N、R89Y)、CA2(WT的氨基酸2-260，D71K、T192F)、CA2(WT的氨基酸2-260，S73N、R89F)、CA2(WT的氨基酸2-260，G63D、M240L)、CA2(WT的氨基酸2-260，V134F、L228F)或CA2(WT的氨基酸2-260，S56F、D71S).

在一些实施方案中，本公开的DRD包含CA2(WT的氨基酸2-260，R27L、H122Y)、CA2(WT的氨基酸2-260，T87I、H122Y)、CA2(WT的氨基酸2-260，H122Y、N252D)、CA2(WT的氨基酸2-260，D72F、V241F)、CA2(WT的氨基酸2-260，V241F、P249L)、CA2(WT的氨基酸2-260，D72F、P249L)、CA2(WT的氨基酸2-260，D71L、L250R)、CA2(WT的氨基酸2-260，D72F、P249F)、CA2(WT的氨基酸2-260，T55K、G63N、Q248N)、CA2(WT的氨基酸2-260，L156H、A257del、S258del、F259del、K260del)、CA2(WT的氨基酸2-260，L156H、S2del、H3del、H4del、W5del)、CA2(WT的氨基酸2-260，W4Y、L156H)、CA2(WT的氨基酸2-260，L156H、G234del、E235del、P236del)、CA2(WT的氨基酸2-260，L156H、F225L)、CA2(WT的氨基酸2-260，D70N、D74N、D100N、L156H)、(CA2(WT的氨基酸2-260，I59N、G102R)、CA2(WT的氨基酸2-260，G63D、E69V、N231I)、CA2(WT的氨基酸2-260，R27L、T87I、H122Y、N252D)、CA2(WT的氨基酸2-260，D72F、V241F、P249L)、CA2(WT的氨基酸2-260，D71L、T87N、L250R)、CA2(WT的氨基酸2-260，L156H、S172C、F178Y、E186D)、CA2(WT的氨基酸2-260，D71F、N231F)、CA2(WT的氨基酸2-260，A77I、P249F)、CA2(WT的氨基酸2-260，D71K、P249H)、CA2(WT的氨基酸2-260，D72F、P249H)、CA2(WT的氨基酸2-260，Q53N、N61Y)、CA2(WT的氨基酸2-260，E106D、C205S)、CA2(WT的氨基酸2-260，C205S、W208S)、CA2(WT的氨基酸2-260，S73N、R89Y)、CA2(WT的氨基酸2-260，D71K、T192F)、CA2(WT的氨基酸2-260，Y193L、K260L)、CA2(WT的氨基酸2-260，D71F、V241F、P249L)、CA2(WT的氨基酸2-260，L147F、Q248F)、CA2(WT的氨基酸2-260，D52I、S258P)、CA2(WT的氨基酸2-260，D72S、T192N)、CA2(WT的氨基酸2-260，D179E、T192I)、CA2(WT的氨基酸2-260，S56N、Q103K)、CA2(WT的氨基酸2-260，D71Y、Q248L)、CA2(WT的氨基酸2-260，S73N、R89F)、CA2(WT的氨基酸2-260，D71K、N231L、E235G、L239F)、CA2(WT的氨基酸2-260，D72F、P249I)、CA2(WT的氨基酸2-260，D72X、V241X、P249X)、CA2(WT的氨基酸2-260，A54X、S56X、L57X、T192X)、CA2(WT的氨基酸2-260，Y193V、K260F)、CA2(WT的氨基酸2-260，G63D、M240L)、CA2(WT的氨基酸2-260，V134F、L228F)、CA2(WT的氨基酸2-260，D71G、N231K)、CA2(WT的氨基酸2-260，S56F、D71S)、CA2(WT的氨基酸2-260，D52L、G128R、Q248F)、CA2(WT的氨基酸2-260，S73X、R89X)、CA2(WT的氨基酸2-260，Y51X、D72X、V241X、P249X)、CA2(WT的氨基酸2-260，D72I、W97C)、CA2(WT的氨基酸2-260，D71K、T192F、N231F)、CA2(WT的氨基酸2-260，H36Q、S43T、Y51F、N67D、G131W、R226H)、CA2(WT的氨基酸2-260，F70I、F146V)、CA2(WT的氨基酸2-260，K45N、V68L、H119Y、K169R、D179E)、CA2(WT的氨基酸2-260，H15L、A54V、K111E、E220K、F225I)、CA2(WT的氨基酸2-260，P13S、P83A、D101G、K111N、F230I)、CA2(WT的氨基酸2-260，G63D、W123R、E220K)、CA2(WT的氨基酸2-260，N11D、E69K、G86D、V109M、K113I、T125I、D138G、G155S)、CA2(WT的氨基酸2-260，I59N、G102R、A173T)、CA2(WT的氨基酸2-260，L79F、P180S)、CA2(WT的氨基酸2-260，A77P、G102R、D138N)、CA2(WT的氨基酸2-260，F20L、K45N、G63D、E69V、N231I)、CA2(WT的氨基酸2-260，T199N、L202P、L228F)、CA2(WT的氨基酸2-260，K9N、H122Y、T168K)、CA2(WT的氨基酸2-260，Q53H、L90V、Q92H、G131E)、CA2(WT的氨基酸2-260，L44M、L47V、N62K、E69D)、CA2(WT的氨基酸2-260，D75V、K169N、F259L)、CA2(WT的氨基酸2-260，T207S、V222A、N231D)、CA2(WT的氨基酸2-260，I59F、V206M、G232R)、CA2(WT的氨基酸2-260，P13A、A133T)、CA2(WT的氨基酸2-260，I59N、R89I)、CA2(WT的氨基酸2-260，A65N、G86D、G131R、G155D、K158N、V162A、G170D、P236L)、CA2(WT的氨基酸2-260，G12R、H15Y、D19V)、CA2(WT的氨基酸2-260，A65V、F95Y、E106G、H107Q、I145M、F175I)、CA2(WT的氨基酸2-260，G63D、E69V、N231I)、CA2(WT的氨基酸2-260，S29A、C205S)和/或CA2(WT的氨基酸2-260，S29C、C205S)。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且还包含在SEQ ID NO.5的第122位氨基酸(H122)的H122Y突变。在一些此类实施方案中，DRD还包含：(i)SEQ ID NO.5第27位氨基酸(R27)的R27L突变；(ii)SEQ ID NO.5的第87位氨基酸(T87)的T87I突变；(iii)SEQ ID NO.5的第252位氨基酸(N252)的N252D突变；或(i)、(ii)和/或(iii)的组合。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且还包含在SEQ ID NO.5的第106位氨基酸(E106)的E106D突变。在一些此类实施方案中，DRD还包含在SEQ ID NO.5的第205位氨基酸(C205)的C205S突变。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且还包含在SEQ ID NO.5的第208位氨基酸(W208)的W208S突变。在一些此类实施方案中，DRD还包含在SEQ ID NO.5的第205位氨基酸(C205)的C205S突变。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且还包含在SEQ ID NO.5的第59位氨基酸(I59)的I59N突变。在一些此类实施方案中，DRD还包含在SEQ ID NO.5的第102位氨基酸(G102)的G102R突变。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且还包含在SEQ ID NO.5的第156位氨基酸(L156)的L156H突变。在一些此类实施方案中，DRD还包含(i)在SEQ ID NO.5的第4位氨基酸(W4)的W4Y突变；(ii)在SEQ ID NO.5的第225位氨基酸(F225)的F225L突变；(iii)在SEQ ID NO.5的第257-260位的氨基酸缺失；(iv)SEQ ID NO.5的第1-5位氨基酸缺失；或(v)SEQ ID NO.5的氨基酸G234、E235和P236的缺失。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且相对于SEQ ID NO.5还包含四个突变，所述突变对应于：(i)L156H、S172C、F178Y和E186D；(ii)D70N、D74N、D100N和L156H。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且相对于SEQ ID NO.5还包含第一突变和第二突变，其中：(i)第一个突变是在SEQID NO.5的第73位氨基酸(S73)的S73N突变；(ii)第二个突变是在SEQ ID NO.5的氨基酸位置89(R89)处的F或Y的取代。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且还包含在SEQ ID NO.5的氨基酸位置56处(S56)的N或F取代。在一些此类实施方案中，DRD相对于SEQ ID NO.5包含对应于S56F和D71S的两个取代。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且相对于SEQ ID NO.5还包含一个或多个取代，其中至少一个取代是在SEQ IDNO.5的氨基酸位置63(G63)处的D或N取代，并且其中该一个或多个取代对应于：(i)G63D；(ii)G63D和M240L；(iii)G63D、E69V和N231I；或(iv)T55K、G63N和Q248N。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且相对于SEQ ID NO.5还包含两个或更多个取代，其中该两个或更多个取代中的一个是在SEQ ID NO.5的氨基酸位置71(D71)处L或K的取代，并且其中该两个或更多个取代对应于：(i)D71L和T87N；(ii)D71L和L250R；(iii)D71L、T87N和L250R；或(iv)D71K和T192F。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且相对于SEQ ID NO.5还包含两个或更多个取代，其中该两个或更多个取代中的至少一个是：(i)在SEQ ID NO.5的氨基酸位置241(V241)处的F取代；(ii)在SEQ ID NO.5的氨基酸位置249(P249)处的F或L取代；并且其中该两个或更多个取代对应于：(i)D72F和V241F；(ii)D72F和P249L；(iii)D72F和P249F；(iv)D72F、V241F和P249L；(v)A77I和P249F；或(vi)V241F和P249L。

在一些实施方案中，本公开的DRD全部或部分包含人碳酸酐酶2(CA2；SEQ IDNO.5)，并且相对于SEQ ID NO.5还包含一个或多个选自以下的取代：Y51T、L183S、Y193I、L197P以及V134F和L228F的组合。

本公开所涵盖的DRD的氨基酸序列与作为该序列的来源的亲本蛋白质的氨基酸序列具有至少约70％的同一性，优选至少约75％或80％同一性，更优选至少约85％、86％、87％、88％、89％或90％同一性，并且更优选至少约91％、92％、93％、94％、95％、96％、97％、98％或99％同一性。在一些实施方案中，本公开所涵盖的DRD的氨基酸序列与作为其来源的亲本蛋白质(例如具有SEQ ID No:1、2、3、4、5、6和71中任一者的氨基酸序列的亲本蛋白质)至少约70％的同一性，优选至少约75％或80％同一性，更优选至少约85％、86％、87％、88％、89％或90％同一性，并且更优选至少约91％、92％、93％、94％、95％、96％、97％、98％或99％同一性。

本公开的DRD的实例包括来源于以下的那些：人碳酸酐酶2(C A2)、人DHFR、ecDHFR、人雌激素受体(ER)、FKBP、人蛋白质F KBP和人PDE5。适合的DRD，可称为去稳定结构域或配体结合结构域，也是本领域已知的。参见例如WO2018/161000；WO2018/231759；WO2019/241315；US8,173,792；US8,530,636；WO2018/237323；WO2017/181119；US2017/0114346；US2019/0300864；WO2017/156238；Miyazaki等人,J Am Chem Soc,134:3942(2012)；Banasz ynski等人(2006)Cell 126:995-1004；Stankunas,K.等人(2003)Mol.Cell12:1615-1624；Banaszynski等人(2008)Nat.Med.14:1123-1127；Iwamoto等人(2010)Chem.Biol.17:981-988；Armstrong等人(2007)Nat.Methods 4:1007-1009；Madeira daSilva等人(2009)Proc.Natl.Acad.Sci.USA106:7583-7588；Pruett-Miller等人(2009)PLoS Gene t.5:e1000376；以及Feng等人(2015)Elife 4:e10606。

如上文在“转录因子系统”部分所提供的，转录因子系统的一种或多种多核苷酸的组合包含编码药物反应性结构域(DRD)的核酸序列，其中转录因子(例如转录因子DNA结合结构域、转录因子激活结构域或两者)可操作地连接至DRD。编码DRD的核酸序列可以选自本文所描述的DRD序列。包含DRD序列的构建体提供于上表1中。表4中提供了包含不同DRD的另外的构建体。表4中的星号(“*”)表示终止密码子的翻译。

转录因子系统的刺激物

本公开的转录因子系统可以对刺激物具有反应。

在一些实施方案中，刺激物是配体。配体可以是基于核酸的、基于蛋白质的、基于脂质的、有机的、无机的或前述的任何组合。在一些实施方案中，配体可以是合成分子。在一些实施方案中，配体可以是小分子治疗化合物。在一些实施方案中，配体可以是先前被监管机构，如美国食品和药物管理局(FDA)批准的小分子药物。

如本公开中所述，转录因子系统可以展现出配体依赖性活性。配体可以与DRD结合并使由转录因子系统编码的转录因子或转录因子的结构域稳定。可以测试已知与候选DRD结合的配体对转录因子系统活性的影响。

在一些实施方案中，配体是细胞可渗透的。在一些实施方案中，配体可以被设计为亲脂性的以改善细胞渗透性。

在一些实施方案中，配体是小分子。临床上批准的小分子配体可以是安全的并且具有适当的药物动力学和分布。

在一些实施方案中，配体可以与一种或多种其他分子复合或结合，例如但不限于另一种配体、蛋白质、肽、核酸、脂质、脂质衍生物、固醇、类固醇、代谢物、代谢物衍生物或小分子。在一些实施方案中，配体刺激物与一种或多种不同种类和/或数量的其他分子复合或结合。在一些实施方案中，配体刺激物是同一种类配体的多聚体。在一些实施方案中，配体刺激物多聚体包含2、3、4、5、6个或更多个单体。

CA2配体

在一些实施方案中，本公开的配体结合碳酸酐酶。在一些实施方案中，配体结合并抑制碳酸酐酶功能并且在本文中称为碳酸酐酶抑制剂。

在一些实施方案中，配体是与碳酸酐酶2结合的小分子。在一个实施方案中，小分子是CA2抑制剂。CA2抑制剂的实例包括但不限于塞来昔布(Celecoxib)(也称为西乐葆(Celebrex))、伐地昔布(Valdecoxib)、罗非昔布(Rofecoxib)、乙酰唑胺(Acetazolamide)、甲唑胺(Methazolamide)、多佐胺(Dorzolamide)、布林佐胺(Brinzolamide)、双氯芬胺(Diclofenamide)、乙恶唑胺(Ethoxzolamide)、唑尼沙胺(Zonisamide)、丹磺酰胺(Dansylamide)和二氯苯胺(Dichlorphenamide)。

在一些实施方案中，配体可包含已知介导与CA2结合的小分子部分。配体还可以被修饰以减少与除CA2以外的碳酸酐酶的脱靶结合并增加与CA2的特异性结合。

在一些实施方案中，刺激物可以是与多于一种碳酸酐酶结合的配体。在一个实施方案中，刺激物是可以结合两种或更多种碳酸酐酶的泛碳酸酐酶抑制剂。

DHFR配体

在一些实施方案中，本公开的配体结合二氢叶酸还原酶。在一些实施方案中，配体结合并抑制二氢叶酸还原酶功能并且在本文中称为二氢叶酸抑制剂。

在一些实施方案中，配体可以是人DHFR的选择性抑制剂。本公开的配体也可以是细菌和寄生生物体如肺孢子虫属(Pneumocystis spp.)、弓形虫属(Toxoplasma spp.)、锥虫属(Trypanosoma spp.)、分枝杆菌属(Mycobacterium spp.)和链球菌属(Streptococcusspp.)生物体的二氢叶酸还原酶的选择性抑制剂。对其他DHFR具有特异性的配体可以被修饰成用于改善与人二氢叶酸还原酶的结合。

二氢叶酸抑制剂的实例包括但不限于甲氧苄氨嘧啶(TMP)、甲氨蝶呤(MTX)、普拉曲沙(Pralatrexate)、吡瑞昔(Piritrexim)、乙胺嘧啶(Pyrimethamine)、他洛曲辛(Talotrexin)、氯胍(Chloroguanide)、喷他脒(Pentamidine)、曲美曲沙(Trimetrexate)、氨基蝶呤(aminopterin)、C1898三盐酸盐、培美曲塞二钠(Pemetrexed Disodium)、拉替曲塞(Raltitrexed)、磺胺胍(Sulfaguanidine)、福洛汀(Folotyn)、艾拉普林(Iclaprim)和二甲氧苄氨嘧啶(Diaveridine)。

在一些实施方案中，本公开的配体可包括二氢叶酸或其可结合人DHFR的任何衍生物。在一些实施方案中，本公开的配体可以是2,4,二氨基杂环化合物。在一些实施方案中，二氢叶酸中的4-氧代基团可以被修饰以产生DHFR抑制剂。在一个实例中，4-氧代基团可以被4-氨基置换。各种二氨基杂环，包括蝶啶、喹唑啉、吡啶并嘧啶、嘧啶和三嗪，也可用作开发DHFR抑制剂的骨架并且可根据本公开使用。

在一些实施方案中，配体包括含有已知介导与DHFR的结合的配体部分的TMP衍生的配体。配体还可以被修饰以减少与其他叶酸代谢酶的脱靶结合并增加与DHFR的特异性结合。

ER配体

在一些实施方案中，本公开的配体结合ER。配体可以是激动剂或拮抗剂。在一些实施方案中，配体结合并抑制ER功能并且在本文中称为ER抑制剂。在一些实施方案中，配体可以是人ER的选择性抑制剂。本公开的配体也可以是其他物种的ER的选择性抑制剂。对其他ER具有特异性的配体可以被修饰以改善与人ER的结合。

配体可以是ER激动剂，例如但不限于内源性雌激素17b-雌二醇(E2)和合成非类固醇雌激素己烯雌酚(DES)。在一些实施方案中，配体可以是ER拮抗剂，例如ICI-164,384、RU486、他莫昔芬、4-羟基他莫昔芬(4-OHT)、氟维司群(fulvestrant)、奥瑞米芬(oremifene)、拉索昔芬(lasofoxifene)、克罗米芬(clomifene)、芬吗瑞乐(femarelle)以及奥美洛昔芬(ormeloxifene)和雷洛昔芬(RAL)。

在一些实施方案中，本公开的刺激物可以是ER拮抗剂，例如但不限于巴多昔芬和/或雷洛昔芬。

在一些实施方案中，配体包括含有已知介导与ER的结合的配体部分的巴多昔芬衍生的配体。配体还可以被修饰以减少与其他叶酸代谢酶的脱靶结合并增加与ER衍生的DRD的特异性结合。

磷酸二酯酶配体

在一些实施方案中，本公开的配体结合磷酸二酯酶。在一些实施方案中，配体结合并抑制磷酸二酯酶功能并且在本文中称为磷酸二酯酶抑制剂。

在一些实施方案中，配体是与磷酸二酯酶5结合的小分子。在一个实施方案中，所述小分子是hPDE5抑制剂。hPDE5抑制剂的实例包括但不限于西地那非、伐地那非、他达拉非、阿伐那非(Avanafil)、洛地那非(Lodenafil)、米罗地那非(Mirodenafil)、乌地那非(Udenafil)、苯甲酰胺那非(Benzamidenafil)、达山他非(Dasantafil)、贝米那非(Beminafil)、SLx-2101、LAS 34179、UK-343,664、UK-357903、UK-371800和BMS-341400。

在一些实施方案中，配体包括含有已知介导与hPDE5的结合的配体部分的西地那非衍生的配体。配体还可以被修饰以减少与磷酸二酯酶的脱靶结合并增加与hPDE5的特异性结合。

在一些实施方案中，刺激物可以是与多于一种磷酸二酯酶结合的配体。在一个实施方案中，该刺激物是可以结合两种或更多种hPDE的泛磷酸二酯酶抑制剂，例如氨茶碱(Aminophyline)、对黄嘌呤(Paraxanthine)、己酮可可碱(Pentoxifylline)、可可碱(Theobromine)、双嘧达莫(Dipyridamole)、茶碱(Theophyline)、扎普司特(Zaprinast)、淫羊藿苷(Icariin)、CDP-840、依唑酯(Etazolate)和格劳辛(Glaucine)。

在一些实施方案中，配体是hPDE1抑制剂。在一些实施方案中，配体是hPDE2抑制剂。在一些实施方案中，配体是hPDE3抑制剂。

在一些实施方案中，配体是hPDE4抑制剂。在一些实施方案中，配体是hPDE6抑制剂。在一些实施方案中，配体是hPDE7抑制剂。在一些实施方案中，配体是hPDE8抑制剂。在一些实施方案中，配体是hPDE9抑制剂。在一些实施方案中，配体是hPDE10抑制剂。

FKBP配体

在一些实施方案中，本公开的配体结合FKBP，包括人FKBP。在一些实施方案中，配体是SLF或Shield-1。

有效负载

有效负载可以包括任何多肽或任何蛋白质或其片段。有效负载可以是野生型序列、野生型序列的片段和/或包含一个或多个突变。有效负载可以是来自生物体基因组的天然蛋白质，或其变体、突变体和衍生物。天然蛋白质可以来自例如哺乳动物生物体、细菌和病毒。有效负载可以是由重组核酸分子编码的蛋白质或多肽、融合或嵌合多肽、或作为蛋白质复合物的一部分起作用的多肽。

在一个实例中，有效负载可以是由来自人类基因组的核酸序列编码的多肽。

在一些实施方案中，有效负载可以是亲本多肽的变体序列。在一些方面，变体序列可以具有与参考序列相同或相似的活性。或者，变体相对于参考序列可以具有改变(例如增加或减少)的活性。一般来说，据利用本领域技术人员已知的序列比对程序所确定，本公开的特定多肽的变体将与该特定参考多肽具有至少约40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％但小于100％的序列同一性。

治疗剂作为有效负载

在一些实施方案中，本公开的有效负载可以是治疗剂。例如，有效负载可以是癌症治疗剂、自身免疫疾病的治疗剂、免疫治疗剂、抗炎剂、抗病原体剂或基因治疗剂。在一些方面，免疫治疗剂可以是抗体及其片段和变体、T细胞受体(TCR)、嵌合抗原受体(CAR)、嵌合开关受体、共抑制分子的拮抗剂、共刺激分子的激动剂、细胞因子、细胞因子受体、趋化因子、趋化因子受体、代谢因子、凝血因子、酶、归巢受体和安全开关。

在一些实施方案中，本公开的有效负载可以是在生物体中诱导免疫反应的免疫治疗剂。免疫治疗剂可以是但不限于抗体及其片段和变体、TCR、嵌合抗原受体(CAR)、嵌合开关受体、细胞因子、趋化因子、细胞因子受体、趋化因子受体、细胞因子-细胞因子受体融合多肽，或任何诱导免疫反应的任何剂。在一个实施方案中，免疫治疗剂在细胞中或在受试者体内诱导抗癌免疫反应。

细胞因子、趋化因子和其他可溶性因子作为有效负载

在一些实施方案中，本公开的有效负载可以是由免疫细胞、癌细胞和其他细胞类型产生的细胞因子、趋化因子、生长因子和可溶性蛋白质，它们充当体内细胞和组织之间的化学通讯剂。这些蛋白质介导多种生理功能，从对细胞生长、分化、迁移和存活的作用，到许多效应子活性。例如，活化的T细胞产生具有消除肿瘤细胞的细胞毒性功能的多种细胞因子。

在一些实施方案中，本公开的有效负载可以是细胞因子及其片段、变体、类似物和衍生物，包括但不限于白细胞介素、肿瘤坏死因子(TNF)、干扰素(IFN)、TGFβ和趋化因子。在一些实施方案中，本发明的有效负载可以是刺激免疫反应的细胞因子。在其他实施方案中，本发明的有效负载可以是对抗癌免疫反应产生负面影响的细胞因子的拮抗剂。

在一些实施方案中，本公开的有效负载可以是细胞因子受体、重组受体、其变体、类似物和衍生物；或细胞因子的信号组分。在各个实施方案中，本公开的有效负载可以包括分泌的细胞因子或细胞因子的膜结合形式。膜细胞因子的说明性实例可包括可操作地融合、连接或联接至跨膜结构域，例如CD8α跨膜结构域、B7-1跨膜结构域、CD4跨膜结构域、CD28跨膜结构域、CTLA-4跨膜结构域、PD-1跨膜结构域或人IgG4Fc区的细胞因子(例如免疫刺激细胞因子，例如IL12、IL2、IL15和IL18)。在各个实施方案中，细胞因子可以通过中间肽或蛋白质序列，例如接头、铰链、跨膜尾等融合或联接至跨膜结构域。

在一个实施方案中，本公开的有效负载可以是与TNFα胞外结构域融合的细胞因子。此类有效负载是以与TNF胞外结构域融合的膜相关细胞因子形式产生。在一个实施方案中，细胞因子可以通过膜相关蛋白酶和/或细胞外空间中的蛋白酶(例如MMP9)的作用从细胞表面脱落。

在一些实施方案中，本公开的有效负载可以是白细胞介素(IL)细胞因子。白细胞介素(IL)是由白细胞产生的一类糖蛋白，用于调控免疫反应。如本文所使用，术语“白细胞介素(IL)”是指来自任何物种或来源的白细胞介素多肽并且包括全长蛋白质以及该蛋白质的片段或部分。

在一些实施方案中，本公开的有效负载可以包含IL12。IL12是由抗原呈递细胞(如巨噬细胞和树突细胞)分泌的两个亚基(p35、p40)的异二聚体蛋白。IL12的表达需要两个亚基同时表达以产生具有生物活性的异二聚体。在一些实施方案中，本公开的有效负载可以是p35亚基或p40亚基。

在一些实施方案中，本公开的有效负载可以包含IL12的全部或一部分。

在一些实施方案中，IL12可以是Flexi IL12，其中p35和p40亚基是由产生单链多肽的单个cDNA编码。可以通过将p35亚基放置于单链多肽的N末端或C末端来产生单链多肽。类似地，p40亚基可以在单链多肽的N末端或C末端。

本公开的IL12有效负载的格式可以被优化。在一个实施方案中，有效负载可以是含有p40和p35亚基的双顺反子IL12，这些亚基被内部核糖体进入位点或切割位点如P2A或弗林蛋白酶隔开，以允许从单一载体独立表达两个亚基。在另一个实施方案中，有效负载可以是IL12的p40亚基或IL12的p35亚基。

在一些实施方案中，有效负载可以是膜结合的IL12。IL12可以通过跨膜结构域与膜结合。跨膜结构域还可以包括任选存在的铰链结构域。在一些方面，IL12分子在细胞外并且通过跨膜结构域系栓于细胞。在一些方面，膜结合的IL12可以在蛋白酶的作用下从细胞表面脱落或切割。在一些实施方案中，本公开的跨膜结构域可以来源于天然或合成来源。跨膜结构域可以来源于任何天然的膜结合或跨膜蛋白。或者，本公开的跨膜结构域可以是合成的。在一些方面，合成序列可以主要包含疏水性残基，例如亮氨酸和缬氨酸。在一些方面，选择的跨膜和/或铰链结构域可以对蛋白酶活性有抗性。

在一些实施方案中，本公开的有效负载可以包含IL15。白细胞介素15是一种强效的免疫刺激细胞因子，而且也是T细胞和自然杀伤细胞的重要存活因子。

在一些实施方案中，本公开的有效负载可以包含IL15的全部或一部分。保留全长或成熟IL15的一种或多种功能的IL15的任何部分均可用于本公开。这些功能包括促进NK细胞存活、调控NK细胞和T细胞活化和增殖以及支持NK细胞从造血干细胞发育。

在一些情况下，IL15的全部或部分与一种或多种跨膜蛋白的全部或一部分连接。

IL15有效负载可设计为分泌型(使用例如IL2信号序列)或膜结合型(使用例如IgE或CD8a信号序列)。

IL15介导的激活的一个独特特征是反式呈递机制，其中IL15以与IL15受体的α亚基(IL15Ra)的复合物形式呈递，该复合物结合并激活在同一细胞或不同细胞上的膜结合IL15β/γ受体。在一些实施方案中，本公开的有效负载是膜结合的IL15。在一些实施方案中，本公开的有效负载可以包括IL15/IL15Ra融合多肽。在一些实施方案中，有效负载可以是与IL15Ra的整体或一部分融合的IL15的整体或一部分。可以使用分别保留全长或成熟IL15或IL15Ra的一种或多种功能的IL15和IL15Ra的任何部分。

在一些方面，IL15分子在细胞外并且通过跨膜结构域系栓于细胞。在一些方面，膜结合的IL15可以在蛋白酶的作用下从细胞表面脱落或切割。

本公开的膜结合IL15或IL15/IL15Ra融合多肽的整体或一部分可以脱落到细胞外空间中。如本文所使用，脱落是指与膜缔合的生物分子从它们所系栓的膜中释放出来。在某些情况下，脱落可能是由蛋白水解切割引起的。

本公开的有效负载可以包含与人IL15的氨基酸序列类似的氨基酸序列，例如UniProtKB-P40933(IL15_HUMAN)。

在一些实施方案中，本公开的有效负载可用于改善免疫细胞的扩增、存活、持久性和效力，免疫细胞例如是CD8+TEM、自然杀伤细胞和肿瘤浸润淋巴细胞(TIL)细胞，以及用于免疫疗法的CAR T细胞。一方面，本公开提供用于最大限度地减小与细胞因子疗法相关的毒性的有效负载。在一些实施方案中，本公开的有效负载可以包含IL2的全部或一部分。保留全长或成熟IL2的一种或多种功能的IL2的任何部分均可用于本公开。

本领域中应理解，相同基因或蛋白质中某些基因和/或蛋白质命名法可以包括或不包括标点符号，如破折号“-”；或符号，例如希腊字母。无论这些是包括在本文中还是不包括在本文中，其含义都不打算如本领域技术人员所理解的那样改变。例如，IL2、IL-2和IL 2是指相同的白细胞介素。同样，IL15、IL 15和IL-15指的是相同的白细胞介素。同样，TNFalpha、TNFα、TNF-alpha、TNF-α、TNF alpha和TNFα都指相同的蛋白质。

抗体和抗体片段作为有效负载

在一些实施方案中，本公开的有效负载可以是抗体、抗体片段及其变体。

抗体可以是完整抗体、抗体轻链、抗体重链、抗体片段、抗体变体或抗体衍生物。

出于本文的目的，“抗体”可以包含重可变结构域和轻可变结构域以及Fc区。

在一些实施方案中，有效负载可以是单克隆抗体。如本文所使用，术语“单克隆抗体”是指从基本上同源细胞(克隆)的群体获得的抗体，即，除了在单克隆抗体产生期间可能出现的可能的变体外，构成该群体的个别抗体是相同的和/或结合相同的表位，此类变体一般是以微量存在。与通常包括针对不同决定簇(表位)的不同抗体的多克隆抗体制剂相反，各单克隆抗体针对抗原上的单一决定簇。

在一个实施方案中，本公开的有效负载可以是人源化抗体。如本文所使用，术语“人源化抗体”是指包含来自一种或多种非人(例如鼠)抗体来源的最小部分以及来源于一种或多种人免疫球蛋白来源的其余部分的嵌合抗体。在大多数情况下，人源化抗体是来自受体抗体的高变区的残基被具有所需特异性、亲和力和/或能力的来自非人物种的抗体(供体抗体)的高变区的残基置换，该非人物种例如为小鼠、大鼠、兔或非人灵长类动物。在一个实施方案中，抗体可以是人源化全长抗体。

如本文所使用，术语“抗体变体”是指修饰的抗体(相对于天然或起始抗体)或在结构和/或功能上类似于天然或起始抗体的生物分子(例如抗体模拟物)。与天然抗体相比，抗体变体的氨基酸序列、组成或结构可以改变。抗体变体可以包括但不限于具有改变的同种型(例如IgA、IgD、IgE、IgG1、IgG2、IgG3、IgG4或IgM)的抗体、人源化变体、优化的变体、多特异性抗体变体(例如双特异性变体)和抗体片段。

在一些实施方案中，抗体片段和变体可以包含来自完整抗体的抗原结合区。抗体片段的实例包括但不限于Fab、Fab'、F(ab')2和Fv片段；双功能抗体(diabody)；线性抗体；单链抗体分子，如单链可变片段(scFv)；以及由抗体片段形成的多特异性抗体。木瓜蛋白酶消化抗体产生两个相同的抗原结合片段，称为"Fab"片段，各自具有单一抗原结合位点。还产生了残留的“Fc”片段，其名称反映了其容易结晶的能力。胃蛋白酶处理产生F(ab')2片段，该片段具有两个抗原结合位点并且仍然能够交联抗原。本公开的有效负载可以包含这些片段中的一个或多个。

在一些实施方案中，本公开的有效负载可以是治疗性抗体。

嵌合抗原受体有效负载

在一些实施方案中，本公开的有效负载可以是嵌合抗原受体(CAR)。如本文所使用，术语“嵌合抗原受体(CAR)”是指模拟T细胞表面上的T细胞受体(TCR)的合成受体。一般来说，CAR由细胞外靶向结构域、跨膜结构域/区域以及细胞内信号传导/激活结构域组成。细胞，如被工程改造成表达CAR的T细胞，可被重定向以攻击表达可被CAR的靶向部分识别的分子的靶细胞。在标准的CAR受体中，以下组分以线性构造成单一融合蛋白形式：细胞外靶向结构域、跨膜结构域和细胞内信号传导/激活结构域。胞外区包含靶向结构域/部分(例如scFv)，它识别特定肿瘤抗原或其他肿瘤细胞表面分子。胞内区可以含有TCR复合物的信号传导结构域(例如CD3ζ的信号区)和/或一个或多个共刺激信号传导结构域，例如来自CD28、4-1BB(CD137)和OX-40(CD134)的那些。例如，“第一代CAR”只有CD3ζ信号传导结构域，而为了增强T细胞持久性和增殖，添加了共刺激细胞内结构域，由此产生具有CD3ζ信号结构域和一个共刺激信号传导结构域的第二代CAR，以及具有CD3ζ信号结构域和两个或更多个共刺激信号传导结构域的第三代CAR。CAR当由T细胞表达时，赋予T细胞由CAR的细胞外靶向部分决定的抗原特异性。第四代CAR包括添加一个或多个成分，例如归巢和自杀基因，以开发更有能力且更安全的CAR架构。

在一些实施方案中，当转导到免疫细胞(例如T细胞和NK细胞)中时，CAR有效负载可以重定向针对靶标(例如肿瘤细胞)的免疫细胞，该靶标表达被CAR的细胞外靶标部分识别的分子。

核酸修饰剂作为有效负载

在一些实施方案中，本公开的有效负载可以是核酸修饰剂。

在一些实施例中，本公开的有效负载可以是基因编辑系统的组分。在一些实施方案中，本公开的有效负载可以是Cas蛋白(CRISPR相关蛋白)，包括Cas9和Cas12。Cas蛋白可以被改变或以其他方式修饰。例如，Cas蛋白可以是deadCas9。在一些实施方案中，Cas9蛋白是酶活性Cas9蛋白、Cas9蛋白野生型蛋白、Cas9蛋白切口酶或者无核酸酶或核酸酶缺陷性Cas9蛋白。在一些实施方案中，本公开的有效负载可以是锌指核酸酶、TALEN(转录激活因子样效应子核酸酶)和大范围核酸酶。

在一些实施例中，本公开的有效负载可以是重组酶，例如Cre重组酶。

用于治疗自身免疫疾病的试剂作为有效负载

在一些实施方案中，本公开的有效负载可以是用于治疗、改善或预防自身免疫病症的剂。

在一些实施方案中，本公开的有效负载包括抗细胞因子，例如针对肿瘤坏死因子(TNF)-α、IL-1和IL-6的中和抗体。在一些实施方案中，本公开的有效负载靶向B细胞耗尽，例如针对CD20、CD22、CD28、CTLA-4和B淋巴细胞刺激物(BLyS)的中和抗体。

药物组合物和配制物

本教导还包含药物组合物，该药物组合物包含以下中的一者或多者：本公开的转录因子系统、核酸、多核苷酸、经过修饰的细胞或有效负载；以及任选地至少一种药学上可接受的赋形剂或惰性成分。

如本文所使用，术语“药物组合物”是指本文描述的转录因子系统、核酸、多核苷酸、经过修饰的细胞、有效负载或转录因子系统组分中的一者或多者或其药学上可接受的盐，以及任选地其他化学组分，如生理上适合的载剂和赋形剂的制剂。

术语“赋形剂”或“非活性成分”是指添加到药物组合物中以进一步促进化合物施用的惰性或非活性物质。

在一些实施方案中，将组合物施用给人类、人类患者或受试者。出于本公开的目的，短语“活性成分”一般是指如本文所描述递送的任何一种或多种转录因子系统组分。

尽管本文提供的药物组合物的描述主要针对适合施用给人类的药物组合物，但本领域技术人员应理解，此类组合物一般适合施用给任何其他动物，例如施用给非人动物，例如非人哺乳动物。考虑施用药物组合物的受试者包括但不限于非人哺乳动物，包括农业动物如牛、马、鸡和猪；家畜如猫、狗；或研究用动物如小鼠、大鼠、兔、狗和非人灵长类动物。

根据本公开的药物组合物可以呈散装、单一单位剂量和/或多次单一单位剂量形式制备、包装和/或销售。如本文所使用，“单位剂量”是包含预定量的活性成分的离散量的药物组合物。活性成分的量一般等于施用给受试者的活性成分的剂量和/或这种剂量的便利分量，例如这种剂量的二分之一或三分之一。

根据本公开的药物组合物中活性成分、药学上可接受的赋形剂或惰性成分和/或任何附加成分的相对量将取决于所治疗受试者的身份、体格和/或状况并且另外取决于施用组合物的途径而变化。例如，该组合物可包含在0.1％与100％之间，例如在0.5％与50％之间、在1-30％之间、在5-80％之间、至少80％(w/w)的活性成分。

可以例如通过测量疾病进展、疾病缓解、症状严重程度、疼痛减轻、生活质量、维持治疗效果所需的药物剂量、疾病标志物水平或任何适用于所治疗的给定疾病或作为预防靶标的其他可测量参数来评估疾病治疗或改善的功效。本领域的健康护理从业人员可以通过测量这些参数中的任何一个参数或参数的任何组合来监测治疗或预防的功效。关于本公开的组合物的施用，“有效针对”例如癌症指示，以临床上适当的方式施用引起对至少一大部患者的有益效果，例如症状改善、治愈、疾病负荷减小、肿块或细胞数量减少、生命延长、生活质量改善或其他一般被熟悉治疗特定类型癌症的医生认为是积极的效果。

当疾病状态的一个或多个参数存在统计上显著的改善，或者没有恶化或发展预期原本会出现的症状时，治疗或预防效果是明显的。例如，疾病的可测量参数的至少10％的有利变化，优选至少20％、30％、40％、50％或更高百分比可指示有效治疗。还可以使用本领域已知的给定疾病的实验动物模型来判断本公开的给定组合物或配制物的功效。当使用实验动物模型时，在观察到统计上显著的变化时，治疗的功效得到证实。

配制物

本公开的多核苷酸和载体组合物可以通过适合递送的任何方式配制。配制物可以是但不限于纳米颗粒、聚(乳酸-共-乙醇酸)(PLGA)微球、类脂质、脂质复合物、脂质体、聚合物、碳水化合物(包括单糖)、阳离子脂质及其组合。

在一个实施方案中，多核苷酸和载体配制物是可以包含至少一种脂质的纳米颗粒。脂质可以选自但不限于DLin-DMA、DLin-K-DMA、98N12-5、C12-200、DLin-MC3-DMA、DLin-KC2-DMA、DODMA、PLGA、PEG、PEG-DMG和聚乙二醇化脂质。在另一方面，脂质可以是阳离子脂质，例如但不限于DLin-DMA、DLin-D-DMA、DLin-MC3-DMA、DLin-KC2-DMA和DODMA。

对于本公开的多核苷酸，配制物可以选自例如国际申请PCT/US2012/069610中教导的任何配制物。

非活性成分

在一些实施方案中，药物或其他配制物可以包含至少一种赋形剂，该赋形剂是非活性成分。如本文所使用，术语“非活性成分”是指包括在配制物中的一种或多种非活性剂。在一些实施方案中，可用于本公开的配制物中的所有、没有或一些非活性成分可以被美国食品和药物管理局(FDA)批准。

给药、递送和施用

本公开的组合物可以通过一种或多种途径和方式递送至细胞或受试者。含有一种或多种本文所描述的转录因子系统、核酸、多核苷酸、有效负载和其他组分的病毒载体可用于将它们递送至细胞和/或受试者。也可以使用其他方式，例如mRNA、质粒和重组蛋白。

递送

裸递送

本公开的药物组合物、转录因子系统、核酸、多核苷酸或有效负载可呈裸形式递送至细胞、组织、器官和/或生物体。如本文所使用，术语“裸”是指药物组合物、转录因子系统、核酸、多核苷酸或有效负载是在无促进转染或渗透的剂或修饰的情况下递送。可以使用本领域已知和本文所描述的施用途径将裸药物组合物、转录因子系统、核酸、多核苷酸或有效负载递送至细胞、组织、器官和/或生物体。在一些实施方案中，裸递送可包括在简单的缓冲液如盐水或PBS中的配制物。

配制物递送

在一些实施方案中，本公开的药物组合物、转录因子系统、核酸、多核苷酸或有效负载可以使用本文所描述的方法配制。配制物可包含可被修饰和/或未修饰的药物组合物、转录因子系统、核酸、多核苷酸或有效负载。配制物还可包括但不限于细胞渗透剂、药学上可接受的载体、递送剂、生物可蚀性或生物相容性聚合物、溶剂和/或持续释放递送储槽。本公开的配制物可以使用本领域已知和本文描述的施用途径递送至细胞。

药物组合物、转录因子系统、核酸、多核苷酸或有效负载也可以被配制用于以本领域中的若干方式中的任一者直接递送至器官或组织，包括但不限于直接浸泡或浸浴；通过导管递送；通过凝胶、粉末、软膏、乳膏、凝胶、洗液和/或滴剂递送；通过使用基材如涂有或浸渍有组合物的织物或可生物降解材料等。

递送至细胞

在本公开的另一个方面，本公开的转录因子系统或其组分和组合物的多核苷酸以及包含所述多核苷酸的载体可以被引入细胞，例如免疫效应细胞中。

在本公开的一个方面，本公开的转录因子系统或其组分和组合物的多核苷酸可以被包装于质粒、病毒载体中或整合到病毒基因组中，从而允许所述多核苷酸的瞬时或稳定表达。优选的病毒载体是逆转录病毒载体，包括慢病毒载体和γ逆转录病毒载体。为了构建逆转录病毒载体，将转录因子系统的多核苷酸分子插入病毒基因组中代替某些病毒序列，以产生复制缺陷型病毒。然后，将重组病毒载体引入含有gag、pol和env基因但不含LTR和包装组分的包装细胞系中。重组逆转录病毒颗粒被分泌到培养基中，然后收集，任选地进行浓缩，并用于基因转移。慢病毒载体是特别优选的，因为它们能够感染分裂和非分裂细胞。

载体还可以通过非病毒方法，利用物理方法例如针、电穿孔、声穿孔、水穿孔转移到细胞中；利用化学载体，如无机颗粒(如磷酸钙、二氧化硅、金)和/或化学方法转移到细胞中。在一些实施方案中，可使用合成或天然可生物降解试剂进行递送，如阳离子脂质、脂质纳米乳液、纳米颗粒、基于肽的载体或基于聚合物的载体。在一些实施方案中，载体可以通过临时膜破坏，例如通过高速细胞变形转移至细胞。

在一些实施方案中，本公开的多肽可直接递送至细胞。在一个实施方案中，本公开的多肽可以使用合成肽来递送，该合成肽包含与细胞穿透结构域(cell penetrationdomain，CLD)融合的内体渗漏结构域(endosomal leakage domain，ELD)。本公开的多肽与ELD-CLD-合成肽共同引入细胞中。ELD促进截留在内体中的蛋白质逃逸到细胞溶质中。此类结构域是微生物和病毒来源的衍生蛋白质并且已在本领域中描述。CPD允许蛋白质跨质膜转运并且在本领域中也已描述。当与单独使用任一结构域进行的共转导相比时，ELD-CLD融合蛋白协同地增加转导效率。在一些实施方案中，可以任选地将富含组氨酸的结构域添加到穿梭构建体中，作为允许运载物从内体逃逸到细胞溶质中的附加方法。穿梭还可以在N或C末端包括半胱氨酸残基以产生融合肽的多聚体。当与单一融合肽构建体相比时，通过向肽末端添加半胱氨酸残基产生的ELD-CLD融合肽的多聚体显示出甚至更高的转导效率。本公开的多肽还可以附加到适当的定位信号以将运载物引导至适当的亚细胞位置，例如细胞核。在一些实施方案中，国际专利公开WO2016161516和WO2017175072中教导的ELD、CLD或融合ELD-CLD合成肽中的任一者均可用于本公开(各案的内容以引用的方式整体并入本文)。

递送方式和/或载体

本公开的转录因子系统或其组分可以使用一种或多种方式递送。本公开还提供了包装本公开的多核苷酸的载体，该多核苷酸编码转录因子及其部分、DRD或有效负载构建体及其组合。本公开的载体还可用于将包装的多核苷酸递送至细胞、局部组织部位或受试者。这些载体可以是任何种类的载体，包括DNA载体、RNA载体、质粒、病毒载体和颗粒。病毒载体技术是众所周知的，并在Sambrook等人(2001,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,New York)中有描述。可用作载体的病毒包括但不限于腺病毒、腺相关病毒(AAV)、甲病毒、黄病毒、疱疹病毒、麻疹病毒、弹状病毒、逆转录病毒、慢病毒、新城疫病毒(NDV)、痘病毒和小核糖核酸病毒。在一个实施方案中，病毒载体选自慢病毒载体、γ逆转录病毒载体、腺相关病毒(AAV)载体、腺病毒载体和疱疹病毒载体。

一般而言，载体含有在至少一种生物体中具有功能的复制起点、启动子序列和适宜的限制性内切核酸酶位点，以及一种或多种选择性标记物，例如抗药性基因。

在一些实施方案中，重组表达载体可以包含调控序列，例如转录和翻译起始和终止密码子，这些调控序列对要引入载体的宿主细胞类型具有特异性。

在一些实施方案中，本公开的载体可包含本文教导的一种或多种有效负载，其中两种或更多种有效负载可包括在一种配体反应中。在这种情况下，该两种或更多种有效负载同时受到同一配体或反应性剂的调节。

慢病毒媒剂/颗粒

在一些实施方案中，慢病毒媒剂/颗粒可作为递送方式使用。慢病毒是逆转录病毒(Retroviridae)科病毒的亚群，之所以如此命名是因为在整合到宿主基因组之前需要将病毒RNA基因组逆转录为DNA。因此，慢病毒媒剂/颗粒的最重要特征是将它们的遗传物质整合到靶标/宿主细胞的基因组中。慢病毒的一些实例包括人免疫缺陷病毒HIV-1和HIV-2、猿猴免疫缺陷病毒(SIV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、拉纳病病毒(JembranaDisease Virus，JDV)、马感染性贫血病毒(EIAV)、马感染性贫血病毒、梅迪维斯纳病(visna-maedi)和山羊关节炎脑炎病毒(CAEV)。

典型地，构成基因递送媒剂的慢病毒颗粒本身存在复制缺陷(也称为“自我失活”的)。慢病毒能够借助于穿过完整宿主核包膜的进入机制感染分裂细胞和非分裂细胞。重组慢病毒媒剂/颗粒已经通过多重衰减HIV毒力基因产生，例如，使基因Env、Vif、Vpr、Vpu、Nef和Tat缺失，由此使载体在生物学上是安全的。相应地，例如，来源于HIV-1/HIV-2的慢病毒载体可以介导转基因在非分裂细胞中的高效递送、整合和长期表达。

慢病毒颗粒可以通过在生产细胞如人HEK293T细胞中共表达病毒包装元件和载体基因组本身来产生。这些元件通常以三个或四个独立的质粒提供。将生产细胞用编码慢病毒组分的质粒以及包含要转移到靶标细胞中的外来转基因的质粒，即媒剂本身(也称为转移载体)共转染，所述慢病毒组分包括病毒的核心组分(即，结构蛋白)和酶组分，以及包膜蛋白(称为包装系统)。一般来说，质粒或载体被包括在生产细胞系中。质粒/载体通过转染、转导或感染而引入生产细胞系中。转染、转导或感染的方法是本领域技术人员众所周知的。作为非限制性实例，可以通过磷酸钙转染、脂转染或电穿孔将包装和转移构建体一般与显性选择性标记物如neo、DHFR、Gln合成酶或ADA一起引入生产细胞系中，然后在适当药物存在下进行选择并分离克隆。

生产细胞产生含有外来基因的重组病毒颗粒，例如本公开的转录因子系统组分或其多核苷酸。从培养基中回收重组病毒颗粒并通过本领域技术人员使用的标准方法进行滴定。重组慢病毒载体可用于感染靶标细胞。

可用于产生高效价慢病毒颗粒的细胞可包括但不限于HEK293T细胞、293G细胞、STAR细胞(Relander等人,Mol.Ther.,2005,11:452-459)、FreeStyle^TM 293表达系统(ThermoFisher,Waltham,MA)和其他基于HEK293T的生产细胞系(例如Stewart等人,HumGene Ther.2011,22(3):357-369；Lee等人,Biotechnol Bioeng,2012,10996):1551-1560；Throm等人,Blood.2009,113(21):5104-5110；各自的内容以引用的方式整体并入本文中)。

在一些方面，包膜蛋白可以是来自其他病毒的异源包膜蛋白，例如水疱性口炎病毒的G蛋白(VSV G)或杆状病毒gp64包膜蛋白。VSV-G糖蛋白可尤其选自归类于水疱病毒属的物种：卡拉加斯病毒(Carajas virus)(CJSV)、昌迪普拉病毒(Chandipura virus)(CHPV)、可卡耳病毒(Cocal virus)(COCV)、伊斯法罕病毒(Isfahan virus)(ISFV)、马拉巴病毒(Maraba virus)(MARAV)、皮里病毒(Piry virus)(PIRYV)、水疱性口炎阿拉戈斯病毒(Vesicular stomatitis Alagoas virus)(VSAV)、水疱性口炎印第安纳病毒(Vesicularstomatitis Indiana virus)(VSIV)和水疱性口炎新泽西病毒(Vesicular stomatitisNew Jersey virus)(VSNJV)，和/或暂时归类为水疱病毒属的病毒株，如草鲡弹状病毒(Grass carp rhabdovirus)、BeAn 157575病毒(BeAn 157575)、博特克病毒(Botekevirus)(BTKV)、卡察基病毒(Calchaqui virus)(CQIV)、美国鳗鲡病毒(Eel virusAmerican)(EVA)、格雷洛奇病毒(Gray Lodge virus)(GLOV)、朱罗纳病毒(Jurona virus)(JURY)、克拉马斯病毒(Klamath virus)(KLAV)、克瓦塔病毒(Kwatta virus)(KWAV)、拉霍亚病毒(La Joya virus)(LJV)、马尔佩斯泉病毒(Malpais Spring virus)(MSPV)、芒特埃尔岗蝙蝠病毒(Mount Elgon bat virus)(MEBV)、佩里内特病毒(Perinet virus)(PERV)、梭子鱼鱼苗弹状病毒(Pike fry rhabdovirus)(PFRV)、波登病毒(Porton virus)(PORV)、拉迪病毒(Radi virus)(RADIV)、鲤春病毒血症病毒(Spring viremia of carp virus)(SVCV)、图帕亚病毒(Tupaia virus)(TUPV)、溃疡病弹状病毒(Ulcerative diseaserhabdovirus)(UDRV)和尤格波格达诺瓦克病毒(Yug Bogdanovac virus)(YBV)。gp64或其他杆状病毒env蛋白可来源于苜蓿银纹夜蛾(Autographa californica)核型多角体病毒(AcMNPV)、芹菜夜蛾(Anagrapha falcifera)核型多角体病毒、家蚕(Bombyx mori)核型多角体病毒、云杉蚜虫(Choristoneura fumiferana)核型多角体病毒、枞树毒蛾(Orgyiapseudotsugata)单衣壳核型多角体病毒、苹淡褐卷蛾(Epiphyas postvittana)核型多角体病毒、美国白蛾(Hyphantria cunea)核型多角体病毒、大蜡螟(Galleria mellonella)核型多角体病毒、多里病毒(Dhori virus)、索戈托病毒(Thogoto virus)、柞蚕(Antheraeapemyi)核型多角体病毒或巴特肯病毒(Batken virus)。在一些方面，包膜蛋白可以是RD114、RD115或衍生自长臂猿白血病病毒(GaLV)或狒狒逆转录病毒包膜糖蛋白(BaEV)。

慢病毒颗粒中提供的其他元件可包含位于5'或3'末端的逆转录病毒LTR(长末端重复序列)、逆转录病毒输出元件、任选地慢病毒反向反应元件(RRE)、启动子或其活性部分以及基因座控制区(LCR)或其活性部分。

用于产生重组慢病毒颗粒的方法在本领域中进行了论述，例如美国专利号8,846,385、7,745,179、7,629,153、7,575,924、7,179,903和6,808,905。

使用的慢病毒载体可以选自但不限于pLVX、pLenti、pLenti6、pLJM1、FUGW、pWPXL、pWPI、pLenti CMV puro DEST、pLJM1-EGFP、pULTRA、pInducer20、pHIV-EGFP、pCW57.1、pTRPE、pELPS、pRRL和pLionII。

腺相关病毒颗粒

本公开的转录因子系统、转录因子构建体或有效负载构建体中任一者的多核苷酸的递送可以使用重组腺相关病毒(rAAV)载体来实现。此类载体或病毒颗粒可设计成利用任何已知血清型的衣壳或血清型衣壳的组合。

AAV载体不仅包括单链载体，而且还包括自互补AAV载体(scAAV)。scAAV载体含有退火在一起形成双链载体基因组的DNA。通过跳过第二条链合成，scAAV允许在细胞中进行快速表达。

rAAV载体可以通过本领域的标准方法，例如通过三重转染在sf9昆虫细胞中或在人细胞例如HEK293细胞的悬浮细胞培养物中制造。

转录因子构建体和有效负载构建体可以在一种或多种病毒基因组中编码以包装在本文教导的AAV衣壳中。

除至少一个或两个ITR(反向末端重复序列)之外，此类载体或病毒基因组还可以包括从载体或病毒基因组表达所必需的某些调控元件。此类调控元件在本领域中是众所周知的并且包括例如启动子、内含子、间隔子、填充序列等。

本公开的转录因子构建体或有效负载构建体可以呈一个或多个或独立的AAV颗粒形式施用。

在一些实施方案中，转录因子系统构建体可以呈一个或多个AAV颗粒形式施用。在一些实施方案中，可以在病毒基因组中编码多于一个转录因子系统构建体。

逆转录病毒媒剂/颗粒(γ-逆转录病毒载体)

在一些实施方案中，逆转录病毒媒剂/颗粒可用于递送本公开的转录因子系统、转录因子构建体或有效负载构建体。逆转录病毒载体(RV)允许将转基因永久整合到靶标细胞中。除了基于复合HIV-1/2的慢病毒载体外，基于简单γ-逆转录病毒的逆转录病毒载体也已被广泛用于递送治疗基因，并在临床上被证明是能够转导多种细胞类型的最高效且最强大的基因递送系统之一。γ逆转录病毒的示例种类包括鼠白血病病毒(MLV)和猫白血病病毒(FeLV)。

在一些实施方案中，来源于哺乳动物γ-逆转录病毒如鼠白血病病毒(MLV)的γ-逆转录病毒载体是重组的。γ逆转录病毒的MLV科包括单嗜性、双嗜性、异嗜性和多嗜性亚科。单嗜性病毒只能使用mCAT-1受体感染鼠细胞。单嗜性病毒的实例是莫洛尼MLV和AKV。双嗜性病毒通过Pit-2受体感染鼠、人和其他物种。双嗜性病毒的一个实例是4070A病毒。异嗜性和多嗜性病毒利用相同的(Xpr1)受体，但它们的物种趋向性不同。NZB-9-1等异嗜性病毒感染人和其他物种，但不感染鼠科物种，而多嗜性病毒如病灶形成病毒(MCF)感染鼠科动物、人和其他物种。

γ-逆转录病毒载体可以通过用若干质粒共转染细胞而在包装细胞中产生，这些质粒包括编码逆转录病毒结构和酶(gag-pol)多蛋白的质粒、编码包膜(env)蛋白的质粒以及编码载体mRNA的质粒，该载体mRNA包含编码本公开的组合物的多核苷酸，该多核苷酸将被包装在新形成的病毒颗粒中。

在一些方面，将重组γ-逆转录病毒载体用来自其他病毒的包膜蛋白进行假型化。包膜糖蛋白被并入病毒颗粒外部脂质层中，由此可以增加/改变细胞趋向性。在一些方面，包膜蛋白可以是RD114、RD115或衍生自长臂猿白血病病毒(GaLV)或狒狒逆转录病毒包膜糖蛋白(BaEV)。

在一些实施方案中，重组γ-逆转录病毒载体是自失活(SIN)γ-逆转录病毒载体。载体不能复制。SIN载体可在最初包含增强子/启动子活性的3'U3区内存在缺失。此外，5'U3区可以用来源于巨细胞病毒或RSV的强启动子(包装细胞系中所需的)或选择的内部启动子和/或增强子元件置换。可以根据本公开的特定目的所需的基因表达的具体要求来选择内部启动子。

在一些实施方案中，转录因子系统、转录因子构建体或有效负载构建体的多核苷酸被插入重组病毒基因组内。重组γ-逆转录病毒载体的病毒mRNA的其他组分可以通过插入或去除天然存在的序列来修饰(例如插入IRES、插入编码感兴趣多肽或抑制性核酸的异源多核苷酸、代替野生型启动子的来自不同逆转录病毒或病毒的更有效启动子的改组等)。在一些实例中，重组γ-逆转录病毒载体可以包含修饰的包装信号，和/或引物结合位点(PBS)，和/或在5'-长末端重复序列(LTR)的U3区域中的5'-增强子/启动子元件元素，和/或在3'-LTR的U3区中的修饰的3'-SIN元件。这些修饰可能会增加效价和感染能力。

溶瘤病毒载体

在一些实施方案中，本公开的多核苷酸可以包装到溶瘤病毒中。如本文所使用，术语“溶瘤病毒”是指优先感染并杀死癌细胞的病毒，例如疫苗病毒。溶瘤病毒可以天然存在，或者可以是经过基因修饰的病毒，例如溶瘤腺病毒和溶瘤疱疹病毒。

在一些实施方案中，溶瘤疫苗病毒可包括胸苷激酶(TK)缺陷、表达粒细胞巨噬细胞(GM)集落刺激因子(CSF)、有复制能力的痘苗病毒载体的病毒颗粒，该载体足以诱导肿瘤中细胞的溶瘤；参见例如美国专利号9,226,977。

信使RNA(mRNA)

在一些实施方案中，本公开的转录因子系统、转录因子构建体或有效负载构建体可以设计为信使RNA(mRNA)形式。如本文所使用，术语“信使RNA”(mRNA)是指编码感兴趣多肽并且能够翻译以在体外、体内、原位或离体产生编码的感兴趣多肽的任何多核苷酸。这样的mRNA分子可以具有国际申请号PCT/US2013/030062中教导的任何mRNA分子的结构组分或特征。

在一些实施方案中，转录因子系统或其组分可以设计为自扩增RNA形式。如本文所使用，“自扩增RNA”是指可以在宿主中复制而引起RNA和由该RNA编码的蛋白质的量增加的RNA分子。这种自扩增的RNA可具有国际专利申请公开号WO2011005799中教导的任何RNA的结构特征或组分。

给药

本公开提供了包括向有需要的受试者施用任何一种或多种转录因子系统的组分或组合物的方法。这些可以使用有效预防或治疗疾病、病症和/或疾患(例如与癌症或自身免疫疾病有关的疾病、病症和/或疾患)或使其成像的任何量和任何施用途径施用给受试者。所需的确切量将取决于受试者的物种、年龄和一般状况、疾病的严重程度、特定组合物、其施用模式、其活性模式等随受试者而变化。

根据本公开的组合物典型地被配制成剂量单位形式以便于施用和剂量的均匀性。然而，应理解，本公开的组合物的总每日用量将由主治医师在合理医学判断范围内决定。对于任何特定受试者，特定的治疗有效、预防有效或适当成像剂量水平将取决于多种因素，包括正在治疗的病症和病症的严重程度；采用的特定化合物的活性；采用的特定组合物；患者的年龄、体重、一般健康状况、性别和饮食；采用的特定化合物的施用时间、施用途径及排泄速率；治疗持续时间；与采用的特定化合物组合或同时使用的药物；及医学领域众所周知的类似因素。

在一些实施方案中，本公开的组合物可以通过不同的剂量用于癌症免疫疗法以避免T细胞耗竭、预防细胞因子释放综合征以及最大限度地减少与免疫疗法相关的毒性。例如，低剂量的本公开组合物可以用于初始治疗具有高肿瘤负荷的患者，而具有低肿瘤负荷的患者可以用高剂量和重复剂量的本公开组合物治疗以确保识别最小的肿瘤抗原负荷。在另一种情况下，本公开的组合物可以通过脉动方式递送以减少强直性T细胞信号传导并增强体内持久性。在一些方面，可通过最初使用低剂量的本公开组合物，随后施用高剂量来最大限度地减少毒性。如果血清标记物如铁蛋白、血清C反应蛋白、IL6、IFN-γ和TNF-α升高，则可以改变剂量。

在一些实施方案中，神经毒性可能与CAR或TIL疗法有关。这种神经毒性可能与CD19-CAR相关。毒性可能是由过多的T细胞浸润到脑中引起。在一些实施方案中，可以通过防止T细胞穿过血脑屏障来减轻神经毒性。这可以通过内源性α-4整合素抑制剂的靶向基因缺失来实现，例如Tysabri/那他珠单抗(natalizumab)也可用于本公开中。

本文还提供了向有需要的受试者施用根据本公开的配体或DRD配体的方法。在一些实施方案中，配体选自乙酰唑胺(ACZ)、甲氨蝶呤(MTX)和甲氧苄氨嘧啶(TMP)。可以使用有效调节本公开的转录因子系统、DRD或有效负载的任何量和任何施用途径将配体施用至受试者或细胞。在一些实施方案中，ACZ可以与hCA2 DRD一起使用，甲氨蝶呤可以与hDHFRDRD一起使用，并且甲氧苄氨嘧啶可以与ecDHFR DRD一起使用。所需的确切量将取决于受试者的物种、年龄和一般状况、疾病的严重程度、特定组合物、其施用模式、其活性模式等随受试者而变化。受试者可以是人、哺乳动物或动物。根据本公开的组合物典型地被配制成单位剂型，以便于施用和剂量的均匀性。然而，应理解，本公开的组合物的总每日用量将由主治医师在合理医学判断范围内决定。在某些实施方案中，根据本公开的配体可以通过基于受试者的体重足以递送每天约0.0001mg/kg至约100mg/kg、约0.001mg/kg至约0.05mg/kg、约0.005mg/kg至约0.05mg/kg、约0.001mg/kg至约0.005mg/kg、约0.05mg/kg至约0.5mg/kg、约0.01mg/kg至约50mg/kg、约0.1mg/kg至约40mg/kg、约0.5mg/kg至约30mg/kg、约0.01mg/kg至约10mg/kg、约0.1mg/kg至约10mg/kg或约1mg/kg至约25mg/kg、约10mg/kg至约100mg/kg、约50mg/kg至约500mg/kg、约100mg/kg至约1000mg/kg的剂量水平，每天一次或多次施用，以获得所希望的效果。在一些实施方案中，剂量水平基于受试者的体重可以是每天或每天一次或多次1mg/kg,5mg/kg,10mg/kg,20mg/kg,30mg/kg,40mg/kg,50mg/kg,60mg/kg,70mg/kg,80mg/kg,90mg/kg,100mg/kg,100mg/kg,110mg/kg,120mg/kg,130mg/kg,140mg/kg,150mg/kg,160mg/kg,170mg/kg,180mg/kg,190mg/kg或者mg/kg，以获得所希望的效果。

本公开提供了用于将本文所描述的任何配体递送至细胞或组织的方法，该方法包括使细胞或组织与配体接触并且可以在体外、离体或体内实现。在某些实施方案中，根据本公开的配体可以按足以递送约1nM至约10nM、约5nM至约50nM、约10nM至约100nM、约50nM至约500nM、约100nM至约1000nM、约1μM至约10μM、约5μM至约50μM、约10μM至约100μM、约25μM至约250μM、约50μM至约500μM的剂量水平施用于细胞。在一些实施方案中，配体可以按选自但不限于以下的剂量施用于细胞：0.00064μM、0.0032μM、0.016μM、0.08μM、0.4μM、1μM、2μM、10μM、50μM、75μM、100μM、150μM、175μM、200μM、250μM。

本公开配体的希望剂量可以仅递送一次、一天三次、一天两次、一天一次、每隔一天一次、每三天一次、每周一次、每两周一次、每三周一次或每四周一次递送。在某些实施方案中，所希望的剂量可使用多次施用(例如二、三、四、五、六、七、八、九、十、十一、十二、十三、十四次或更多次施用)进行递送。当采用多次施用时，可以使用如本文所描述的分开给药方案。如本文所使用，“分次剂量”是将“单一单位剂量”或总日剂量分成两次或更多次剂量，例如分两次或更多次施用“单一单位剂量”。如本文所使用，“单一单位剂量”是指以一次剂量/一次性/单一途径/单一接触点，即单次施用事件施用哦任何治疗剂的剂量。本公开配体的希望剂量可以作为“脉冲剂量”或作为“连续流”施用。如本文所使用，“脉冲剂量”是经一段时间以设定频率施用的任何治疗剂的一系列单一单位剂量。如本文所使用，“连续流”是以单一途径/单一接触点，即以连续施用事件经一段时间连续施用的治疗剂的剂量。可以通过这些方法中的任何一种，或通过这些方法的组合，或通过任何其他适于药物施用的方法来施用总日剂量，即在24小时内给予或规定的量。

施用

在一些实施方案中，用于癌症免疫疗法或自身免疫疾病治疗的组合物可以离体施用于细胞并随后施用给受试者。在另外的实施方案中，细胞选自B细胞、T细胞、自然杀伤细胞(NK细胞)或肿瘤浸润淋巴细胞(TIL)。免疫细胞可以使用本领域已知的多种方法离体分离和扩增。例如，分离细胞毒性T细胞的方法描述于美国专利号6,805,861和6,531,451中。NK细胞的分离描述于美国专利号7,435,596中。

在一些实施方案中，取决于细胞的性质，可以通过多种方式将细胞引入宿主生物体例如哺乳动物中，包括注射、输血、输注、局部滴注或植入。在一些方面，本公开的细胞可以被引入肿瘤部位。使用的细胞数量取决于多种情况，即引入的目的、细胞的寿命、使用的方案(例如施用次数)、细胞倍增的能力等。细胞可以在生理上可接受的培养基中。

在一些实施方案中，本公开的细胞可以分多次剂量施用给患有疾病或疾患的受试者。施用一般实现癌症的一种或多种症状或临床状况的改善和/或治疗或预防癌症或其临床状况或症状。

在一些实施方案中，用于免疫疗法或治疗自身免疫疾病的组合物可在体内施用。在一些实施方案中，包含本公开的转录因子系统、有效负载和组合物的本公开的多核苷酸可以通过基因疗法在体内递送给受试者。

递送途径

本公开的药物组合物、转录因子系统、核酸、多核苷酸、有效负载、载体和细胞可以通过任何途径施用以实现治疗有效的结果。这些包括但不限于肠内(进入肠道)、胃肠道、硬膜外(进入硬脑膜)、口服(通过口腔)、透皮、硬膜周围腔、大脑内(进入大脑)、脑室内(进入脑室)、表皮(施加至皮肤上)、皮内(进入皮肤本身)、皮下(在皮肤下方)、经鼻施用(通过鼻子施用)、静脉内(进入静脉)、静脉内团注、静脉内滴注、动脉内(进入动脉)、肌肉内(进入肌肉)、心内(进入心脏)、骨内输注(进入骨髓)、鞘内(进入椎管)、腹膜内(输注或注射到腹膜)、膀胱内输注、玻璃体内(通过眼睛)、海绵体内注射(进入病理腔)、腔内(进入阴茎根部)、阴道内施用、子宫内、羊膜外施用、透皮(通过完整皮肤扩散以实现全身分布)、经粘膜(通过粘膜扩散)、经阴道、吹入(鼻吸)、舌下、唇下、灌肠剂、滴眼液(施加至结膜上)、滴耳液、耳廓(在耳内或借助于耳施用)、颊(针对脸颊)、结膜、皮肤、牙(施加至一颗或多颗牙齿)、电渗透、子宫颈内、鼻窦内、气管内、体外、血液透析、浸润、间质、腹内、羊膜内、关节内、胆管内、支气管内、滑囊内、软骨内(在软骨内)、尾部内(在马尾内)、脑池内(小脑延髓池内)、角膜内(在角膜内)、冠状牙齿内、冠状动脉内(在冠状动脉内)、海绵体内(在阴茎海绵体的可扩张空间内)、椎间盘内(在椎间盘内)、导管内(在腺管内)、十二指肠内(在十二指肠内)、硬膜内(在硬膜之内或之下)、表皮内(施用至表皮)、食管内(施用至食道)、胃内(在胃内)、牙龈内(在牙龈内)、回肠内(在小肠远端部分内)、病灶内(在局部病变内或直接引入局部病变中)、腔内(在管腔内)、淋巴管内(在淋巴内)、髓内(在骨髓腔内)、脑膜内(在脑膜内)、心肌内(在心肌内)、眼内(在眼内)、卵巢内(在卵巢内)、心包内(在心包内)、胸膜内(在胸膜内)、前列腺内(在前列腺内)、肺内(在肺或其支气管内)、窦内(在鼻窦或眶周窦内)、脊柱内(在脊柱内)、滑膜内(在关节滑膜腔内)、腱内(在肌腱内)、睾丸内(在睾丸内)、鞘内(在脑脊髓轴任何水平处的脑脊髓液内)、胸内(在胸腔内)、管内(在器官小管内)、肿瘤内(在肿瘤内)、鼓室内(在中耳内)、血管内(在一个或多个血管内)、室内(在室内)、离子电渗疗法(借助于可溶性盐离子迁移到身体组织中的电流)、冲洗(清洗或冲净开放的伤口或体腔)、喉部(直接施加至喉部)、鼻胃(穿过鼻子并进入胃部)、封闭敷料技术(表面途径施用，然后用敷料覆盖以封闭该区域)、眼科(施加至外眼)、口咽(直接施加至口和咽)、肠胃外、经皮、关节周围、硬膜周围、神经周围、牙周、直肠、呼吸道(通过经口或经鼻吸入施加至呼吸道内以获得局部或全身作用)、球后(在脑桥后或在眼球后面)、心肌内(进入心肌中)、软组织、蛛网膜下腔、结膜下、黏膜下、表面、经胎盘(穿过或跨过胎盘)、经气管(穿过气管壁)、经鼓膜(跨过或穿过鼓室)、输尿管(施加至输尿管)、尿道(施加至尿道)、阴道、骶管阻滞、诊断、神经阻滞、胆道灌注、心脏灌注、光分离置换法或脊髓。

肠胃外和注射施用

在一些实施方案中，本公开的药物组合物、转录因子系统、核酸、多核苷酸、有效负载、载体和细胞可通过肠胃外施用。供口服和肠胃外施用的液体剂型包括但不限于药学上可接受的乳液、微乳液、溶液、悬浮液、糖浆和/或酏剂。除活性化合物外，液体剂型还可包含本领域中常用的惰性稀释剂，如水或其他溶剂、增溶剂和乳化剂，如乙醇、异丙醇、碳酸乙酯、乙酸乙酯、苯甲醇、苯甲酸苯甲酯、丙二醇、1,3-丁二醇、二甲基甲酰胺、油(尤其是棉籽油、花生油、玉米油、胚芽油、橄榄油、蓖麻油和芝麻油)、甘油、四氢糠醇、聚乙二醇以及脱水山梨糖醇的脂肪酸酯，以及其混合物。除惰性稀释剂外，口服组合物还可包括佐剂，如润湿剂、乳化剂和悬浮剂、甜味剂、调味剂以及芳香剂。在供肠胃外施用的某些实施方案中，组合物与增溶剂混合，增溶剂例如为

醇、油、改性油、二醇、聚山梨醇酯、环糊精、聚合物和/或其组合。在其他实施方案中，包括表面活性剂，如羟丙基纤维素。

可注射制剂，例如无菌可注射水性或油性悬浮液，可根据已知技术，使用适合的分散剂、润湿剂和/或悬浮剂来配制。无菌可注射制剂还可以是在无毒肠胃外可接受的稀释剂和/或溶剂中的无菌可注射溶液、悬浮液和/或乳液，例如于1,3-丁二醇中的溶液。可使用的可接受的媒剂和溶剂之中有水、林格氏溶液、U.S.P.以及等渗氯化钠溶液。通常将无菌、不挥发性油用作溶剂或悬浮介质。为此，可采用任何温和的不挥发性油，包括合成的单酸甘油酯或二酸甘油酯。此外，脂肪酸如油酸也可用于可注射液的制备。

可注射配制物可例如通过经细菌截留过滤器过滤，和/或通过并入呈无菌固体组合物形式的灭菌剂来进行灭菌，所述无菌固体组合物可在使用前溶解或分散于无菌水或其他无菌可注射介质中。

可检测试剂和标记

本公开的转录因子系统、核酸、多核苷酸、有效负载、载体和细胞可以与一种或多种放射性试剂或可检测试剂相联或结合。

这些试剂包括各种有机小分子、无机化合物、纳米颗粒、酶或酶底物、荧光材料、发光材料(例如鲁米诺(luminol))、生物发光材料(例如荧光素酶、荧光素和水母发光蛋白)、化学发光材料、放射性材料(例如¹⁸F、⁶⁷Ga、^81mKr、⁸²Rb、¹¹¹In、¹²³I、¹³³Xe、²⁰¹Tl、¹²⁵I、³⁵S、¹⁴C、³H或^99mTc(例如呈高锝酸盐(锝酸盐(VII)，TcO₄ ^-)形式)，以及造影剂(例如金(例如金纳米颗粒)、钆(例如螯合的Gd)、铁氧化物(例如超顺磁性铁氧化物(SPIO)、单晶铁氧化物纳米颗粒(MION)和超小超顺磁性铁氧化物(USPIO))、锰螯合物(例如Mn-DPDP)、硫酸钡、碘化造影剂(碘海醇(iohexol))、微泡或全氟碳)。

在一些实施方案中，可检测试剂可以是在激活时变得可检测的不可检测前体(例如荧光四嗪-荧光团构建体(例如四嗪-BODIPY FL、四嗪-俄勒冈绿488或四嗪-BODIPY TMR-X)或酶可激活荧光剂(例如

(VisEn Medical)))。可使用酶标记组合物的体外测定包括但不限于酶联免疫吸附测定(ELISA)、免疫沉淀测定、免疫荧光、酶免疫测定(EIA)、放射免疫测定(RIA)和蛋白质印迹分析。

应用和用途

本公开的转录因子系统、构建体、配体或组合物可用于多种应用，包括但不限于治疗、诊断和预后、生物工程、生物加工、生物制造、研究试剂、代谢组学、基因表达、酶替代品等。

本公开提供了包括向有需要的受试者施用组合物，例如包含转录因子系统的一种或多种组分的药物组合物的方法。

虽然可能有几种用途不涉及医学治疗，例如产生用于科学研究的细胞系和试剂，但一种用途涉及施用本公开的组合物以产生体内基因疗法或经过修饰的细胞用于过继细胞疗法，例如治疗癌症、自身免疫疾病和其他疾病。在有关有需要的受试者的疾病、疾患或病症的医学治疗或预防的说明性方法中可包括以下步骤：(a)提供细胞群(人体细胞、动物细胞、初代细胞或细胞培养物，包括自体细胞、同种异体细胞或同基因细胞)；(b)将至少一个核酸分子引入该细胞群中的至少一个细胞中，其中该至少一个核酸分子包含：(i)第一多核苷酸，该第一多核苷酸包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列，其中该转录因子激活结构域和/或该转录因子DNA结合结构域可操作地连接至该DRD；和(ii)第二多核苷酸，该第二多核苷酸包含编码治疗疾病的感兴趣蛋白质的第四核酸序列，该第四核酸序列可操作地连接至外源诱导型启动子，该启动子包含特定多核苷酸结合位点；(c)将该细胞递送至该受试者；并且(d)向该受试者施用配体以使该DRD足够稳定，从而能够表达形成转录因子的量的转录因子激活结构域和转录因子DNA结合结构域，该转录因子结合该特定多核苷酸结合位点并且能够使该感兴趣蛋白质在细胞中表达；其中该感兴趣蛋白质的表达受该受试者体内配体的存在调控，并且配体施用的量和/或持续时间足以产生治疗有效量的该感兴趣蛋白质。

在上述方法中，该感兴趣蛋白质可用于改善、治愈、预防或减轻疾病、疾患或病症的一种或多种症状。

本公开的组合物可以使用有效预防或治疗疾病、病症和/或疾患(例如与癌症或自身免疫疾病和其他疾病有关的疾病、病症和/或疾患)或使其成像的任何量和任何施用途径施用给受试者。所需的确切量将取决于受试者的物种、年龄和一般状况、疾病的严重程度、特定的组合物、其施用模式、其活性方式等随受试者而变化。

本文还提供了向有需要的受试者施用一种或多种稳定配体(如本文所使用，使DRD稳定的配体可称为稳定配体或简称为配体，并且应理解，该配体有效地使根据本公开的转录因子系统中使用的DRD稳定)的方法。配体可以使用有效地调节在包含转录因子系统的细胞中本公开的转录因子的表达量的任何量和任何施用途径施用至受试者或细胞。所需稳定配体的确切量将取决于受试者的物种、年龄和一般状况、疾病的严重程度、特定的组合物、其施用模式、其活性方式等随受试者而变化。受试者可以是人、哺乳动物或动物。

治疗用途

癌症免疫疗法

癌症免疫疗法旨在诱导或恢复免疫系统对癌症的反应性。免疫疗法研究的重大进展引起了各种策略的开发，这些策略可大致分为主动免疫疗法和被动免疫疗法。一般来说，这些策略可用于直接杀死癌细胞或对抗免疫抑制性肿瘤微环境。主动免疫疗法旨在诱导内源性、持久的肿瘤抗原特异性免疫反应。通过免疫反应调节剂如细胞因子的非特异性刺激可以进一步增强该反应。相比之下，被动免疫疗法包括将效应免疫分子如肿瘤抗原特异性细胞毒性T细胞或抗体施用于宿主的方法。这种方法是短效的，并且需要多次应用。

尽管取得了重大进展，但当前免疫疗法策略的功效受到相关毒性的限制。这些通常与免疫疗法相关的狭窄治疗窗口有关，部分原因是需要将疗法剂量推到潜在致命毒性的边缘以获得临床上有意义的治疗效果。此外，由于过继转移的免疫细胞在患者体内不断增殖，这通常是不可预测的，故在体内剂量会增加。

免疫疗法中涉及的主要风险是T细胞响应于肿瘤相关抗原(TAA)的正常组织表达而激活所引起的在靶但偏离肿瘤的副作用。利用表达针对特定TAA的T细胞受体的T细胞进行的临床试验报告了响应于免疫疗法而出现的皮疹、结肠炎和听力损失。

当肿瘤细胞响应于免疫疗法而被杀死时，免疫疗法也可能产生在靶且靶向肿瘤的毒性。不良作用包括肿瘤溶解综合征、细胞因子释放综合征和相关的巨噬细胞激活综合征。重要的是，这些不良作用可能在肿瘤破坏过程中发生，因此即使是成功的靶向肿瘤的免疫疗法也可能导致毒性。因此，特别需要通过免疫治疗剂调控来控制免疫疗法的方法，因为它们具有降低毒性和最大化功效的潜力。

本公开提供了用于免疫疗法的系统、组合物、免疫治疗剂和方法。这些组合物在例如用于预防和治疗癌症的免疫疗法中提供对基因表达和功能的可调性调控。

一方面，本公开的系统、组合物、免疫治疗剂和其他组分可以通过单独添加的稳定配体控制，这为调控癌症免疫疗法提供了显著的灵活性。此外，本公开的系统、组合物和方法还可以与治疗剂如化学治疗剂、小分子、基因疗法和抗体组合以预防和/或治疗疾病，例如癌症。

本公开的系统和组合物的可调性质具有提高免疫疗法功效的效力和持续时间的潜力。使用本公开的组合物使过继转移细胞的生物活性可逆地沉默允许最大化细胞疗法的潜力，而不会不可挽回地杀死和终止该疗法。

本公开提供了在施用于患者之后精细调节免疫疗法的方法。这又提高了免疫疗法的安全性和功效，并增加可能从免疫疗法中受益的受试者群体。

在一些实施方案中，本公开的免疫细胞可以是被修饰成表达感兴趣的有效负载或蛋白质的T细胞，例如抗原特异性T细胞受体(TCR)或本文教导的抗原特异性嵌合抗原受体(CAR)(称为CAR T细胞)。因此，将至少一种编码感兴趣蛋白质的多核苷酸，例如本文所描述的CAR系统(或TCR)，或包含该多核苷酸的载体引入T细胞中。表达CAR或TCR的T细胞通过CAR或TCR的细胞外靶向部分与特定抗原结合，由此将信号通过细胞内信号传导结构域传递到T细胞，并因此将T细胞激活。激活的CAR T细胞改变其行为，包括释放细胞毒性细胞因子(例如肿瘤坏死因子和淋巴毒素等)、提高细胞增殖率、改变细胞表面分子等。这种变化会破坏表达CAR或TCR所识别的抗原的靶标细胞。此外，细胞因子的释放或细胞表面分子的变化会刺激其他免疫细胞，例如B细胞、树突状细胞、NK细胞和巨噬细胞。

引入T细胞中的CAR可以是仅包括来自TCR CD3ζ的细胞内信号传导结构域的第一代CAR，或包括来自TCR CD3ζ的细胞内信号传导结构域和共刺激信号传导结构域的第二代CAR，或包括来自TCR CD3ζ的细胞内信号传导结构域和两个或更多个共刺激信号传导结构域的第三代CAR，或分裂的CAR系统，或开/关切换CAR系统。在一个实施方案中，CAR或TCR的表达受转录因子控制，其中转录因子或其组分可操作地连接至DRD，在无稳定配体存在下，这将导致转录因子积累很少或不积累。有效负载具有对转录因子或其组分具特异性的多核苷酸结合序列，因此，在没有稳定配体的情况下，几乎不产生感兴趣蛋白质。当将稳定配体施用于包含转录因子系统的细胞时，转录因子在与DRD偶联时免于降解，然后转录因子与其紧邻感兴趣蛋白质的同源多核苷酸结合序列结合，然后转录。然后，对转录的mRNA进行翻译以产生感兴趣多肽/蛋白质。在一些示例性实施方案中，使用了DRD稳定配体的存在或不存在来调节转导的T细胞或NK细胞中CAR或TCR的表达。

在一些实施方案中，本公开的CAR T细胞可以进一步被修饰以表达另一种、两种、三种或更多种免疫治疗剂。免疫治疗剂可以是对不同靶标分子具有特异性的另一种CAR或TCR；细胞因子如IL2、IL12、IL15和IL18，或细胞因子受体如IL15Ra；将抑制信号转化为刺激信号的嵌合开关受体；将过继转移的细胞引导至如肿瘤组织等靶标部位的归巢受体；优化免疫细胞的代谢的药剂；或当过继细胞转移后观察到严重事件时或转移的免疫细胞不再需要时杀死激活的T细胞的安全开关基因(例如自杀基因)。这些分子可以包含在相同的构建体或独立的构建体中。

在一个实施方案中，本公开的CAR T细胞(包括TCR T细胞)可以是“武装”的CAR T细胞，该细胞用包含CAR有效负载的转录因子系统的一种或多种组分以及在可操作地连接至相同或不同DRD的相同或不同转录因子的控制下编码细胞因子的相同或不同转录因子系统转染或转导。诱导型或组成型分泌的活性细胞因子进一步武装CAR T细胞以改善功效和持久性。在本文中，这种CAR T细胞也被称为“装甲的CAR T细胞”。可以根据肿瘤微环境以及先天性和适应性免疫系统的其他元件来选择“装甲”分子。在一些实施方案中，该分子可以是刺激因子，例如IL2、IL12、IL15、IL18、I型IFN、CD40L和4-1BBL，经显示，这些刺激因子可进一步增强CAR T细胞在通过不同机制面对敌对肿瘤微环境时的功效和持久性。

嵌合抗原受体工程改造的T细胞(CAR-T)疗法尚未成功应用于实体肿瘤。增强CAR-T细胞功能和将运载物选择性递送到实体肿瘤是实现有效针对实体肿瘤的CAR-T疗法的关键策略。在一个实施方案中，有效负载或感兴趣蛋白质可包括白细胞介素12(IL12)，它可用于增强CAR-T细胞的有效性，特别是因为它具有重塑肿瘤微环境的潜力。先前在临床前和临床模型中已显示，IL12可有效增强CAR或TCR修饰的T细胞以及肿瘤浸润淋巴细胞(TIL)的功效。然而，IL12的组成型生产可能会损害安全性和/或功效；因此，根据需要，局部递送细胞因子可能是一种优选的方法。在一些实施方案中，本公开的转录因子系统或其组分可用于外源控制IL12表达以便能够在过继细胞疗法中使用IL12。

在一些实施方案中，本公开的转录因子调控系统可用于调控被转化的免疫细胞中有效负载如Flexi IL12(或其他IL12构建体，如膜结合IL12)的表达以改善CAR的功效，尤其是在实体肿瘤环境中，通过提供肿瘤微环境重塑和表位扩散的受控的局部信号实现。在添加DRD特异性稳定配体后，本文所描述的转录因子调控还提供IL12的快速、剂量依赖性和局部生产。

在一些方面，本公开的武装的CAR T细胞被修饰成表达CD19CAR和有效负载如IL12，该表达是使用本公开的转录因子系统或组合物进行调控。此类T细胞在肿瘤中发生CAR介导的激活后，释放诱导型IL12，由此加强T细胞激活并吸引和激活先天免疫细胞消除CD19阳性癌细胞。

在一个实施方案中，本公开的T细胞可以被修饰以并入转录因子系统中，该转录因子系统包含由转录因子系统或其组分编码的CAR有效负载和编码自杀基因的核酸序列。

在一个实施方案中，本公开的CAR T细胞(包括TCR T细胞)可以用包含细胞因子和安全开关基因(例如自杀基因)的转录因子系统的一种或多种组分转染或转导。当被转录因子系统编码的DRD的细胞外稳定配体激活时，自杀基因可以是诱导型半胱天冬酶，例如诱导细胞凋亡的半胱天冬酶9。根据需要，这种诱导的细胞凋亡消除转移的细胞，以降低直接毒性和不受控制的细胞增殖的风险。

在一个实施方案中，调节任何所述有效负载或感兴趣蛋白质(可互换使用)的表达水平和活性的转录因子系统及其组分可用于免疫疗法。作为非限制性实例，免疫治疗剂可以是抗体及其片段和变体、癌症特异性T细胞受体(TCR)及其变体、抗肿瘤特异性嵌合抗原受体(CAR)、嵌合开关受体、共抑制受体或配体的抑制剂、共刺激受体和配体的激动剂、细胞因子、趋化因子、细胞因子受体、趋化因子受体、可溶性生长因子、代谢因子、自杀基因、归巢受体或在细胞和受试者中诱导免疫反应的任何试剂。

在一些实施方案中，用于诱导或抑制免疫反应的组合物可以包含转录因子系统的一种或多种组分，或由转录因子系统编码的一种或多种多肽。在一些实施方案中，转录因子系统可包含：第一多核苷酸，该第一多核苷酸包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列；其中该转录因子激活结构域、该转录因子DNA结合结构域以及该转录因子激活结构域和该转录因子DNA结合结构域的组合中的至少一者可操作地连接至该DRD；及第二多核苷酸，该第二多核苷酸包含编码感兴趣蛋白质的第四核酸序列，该第四核酸序列可操作地连接至包含该特定多核苷酸结合位点的诱导型启动子；其中该转录因子激活结构域与该转录因子DNA结合结构域相互作用而形成转录因子；并且其中该转录因子与该特定多核苷酸结合位点的结合是该转录因子调控该第四核酸序列的转录所需的。

一方面，有效负载可以是免疫治疗剂。

在一些实施方案中，本公开的转录因子系统和组合物涉及蛋白质(感兴趣蛋白质或有效负载)功能的转录调控，包括例如免疫治疗剂的抗肿瘤免疫反应。在一些实施方案中，免疫治疗剂可包括细胞因子、趋化因子、抗体、整合素、整合蛋白、膜蛋白、细胞外蛋白，它们可用于上调或改善一个或多个免疫细胞类型的功能，或下调一个或多个免疫细胞类型的活性。在各个实施方案中，可用于治疗疾病、疾患或病症的免疫治疗剂可以包括细胞因子，例如白细胞介素。在各个实施方案中，转录因子系统提供了感兴趣蛋白质或有效负载，该感兴趣蛋白质或有效负载包括白细胞介素，例如IL-2、IL-6、IL12、IL15、IL18和其他免疫治疗剂，所述免疫治疗剂促进或上调一个或多个可用于治疗疾病、疾患或病症或与任何这些疾病、疾患或病症相关的症状的免疫细胞类型的寿命和活性。

在一些实施方案中，基因修饰成编码和表达至少一个转录因子的细胞可用于过继细胞疗法(ACT，又称为“过继细胞转移”)中，该至少一个转录因子可操作以允许转录与转录因子多核苷酸结合位点连接的感兴趣蛋白质(免疫治疗剂)。如本文所使用，过继细胞转移是指施用具有直接抗癌活性的免疫细胞(来自于字体、同种异体或基因修饰的宿主)。ACT在针对恶性和感染性疾病的临床应用中显示出前景。例如，基因工程改造成识别CD19的T细胞已被用于治疗滤泡性B细胞淋巴瘤Kochenderfer等人,Blood,2010,116:4099-4102；以及Kochenderfer和Rosenberg,Nat Rev Clin Oncol.,2013,10(5):267-276)，并且使用基因修饰成表达抗肿瘤T细胞受体的自体淋巴细胞的ACT已被用于治疗转移性黑色素瘤(Rosenberg和Dudley,Curr.Opin.Immunol.2009,21:233-240)。

根据本公开，转录因子系统的一种或多种组分可用于开发和实施细胞疗法，例如过继细胞疗法。在一些实施方案中，转录因子系统的一种或多种组分可用于细胞疗法中以实现CAR疗法；用于TIL的操作或调控中；用于同种异体细胞疗法中；用于T细胞疗法与其他治疗线(例如放射线、细胞因子)的组合中，以编码工程改造的TCR或修饰的TCR，或增强除TCR以外的T细胞(例如通过引入细胞因子基因、检查点抑制剂PD1、CTLA4的基因)。

本文提供了用于过继细胞疗法的方法。该方法包括对有需要的受试者进行预处理；用转录因子系统的一种或多种组分和/或本公开的组合物调节免疫细胞；向受试者施用表达本公开的组合物的工程改造的免疫细胞和在受试者体内成功移植工程改造的细胞。

在一些实施方案中，本公开的可调控的转录因子表达构建体和组合物可用于最大限度地减少与过继细胞疗法相关的预处理方案。如本文所使用，“预处理”是指施用给受试者以改善过继细胞疗法的结果的任何治疗方案。预处理策略包括但不限于全身照射和/或清除淋巴的化学疗法。不进行预处理的过继疗法临床试验未能展示任何临床益处，表明预处理在ACT中的重要性。然而，预处理会伴随显著毒性，并限制适合ACT的受试者队列。在一些情况下，可以使用本文所描述的转录因子对用于ACT的免疫细胞进行工程改造，以使其表达细胞因子如IL-2、IL-6、IL12和IL15作为有效负载，从而允许感兴趣蛋白质的选择性表达，该感兴趣蛋白质可以使用本公开的稳定配体进行调节以减少对预处理的需求(Pengram等人(2012)Blood 119(18):4133-41；其内容以引用的方式整体并入)。

在一些实施方案中，用于ACT的免疫细胞可以是树突状细胞；T细胞，如CD8+T细胞和CD4+T细胞；自然杀伤(NK)细胞；NK T细胞；细胞毒性T淋巴细胞(CTL)；肿瘤浸润淋巴细胞(TIL)；淋巴因子激活杀伤(LAK)细胞；记忆T细胞；调节性T细胞(Treg)；辅助T细胞；细胞因子诱导的杀伤(CIK)细胞，及其任何组合。在其他实施方案中，用于ACT的免疫刺激细胞可以由胚胎干细胞(ESC)和诱导型多能干细胞(iPSC)产生。在一些实施方案中，将自体或同种异体免疫细胞用于ACT。

在一些实施方案中，用于ACT的细胞可以是工程改造成表达CAR的T细胞，所述CAR包含对感兴趣肿瘤细胞上的抗原具有特异性的抗原结合结构域。在一些实施方案中，用于ACT的细胞可以是工程改造成表达CAR的NK细胞，所述CAR包含对感兴趣肿瘤细胞上的抗原具有特异性的抗原结合结构域。除了过继转移基因修饰的T细胞(例如CAR T细胞)进行免疫疗法之外，还可将单独或与CAR T细胞组合的替代类型的表达CAR的白细胞用于过继免疫疗法。在一个实例中，可将T细胞和NK细胞的混合物用于ACT。根据本公开，T细胞和NK细胞中CAR的表达水平由结合DRD的小分子调节和控制，该DRD可操作地连接至转录因子或其组分，这使得能够在转染或转导的T细胞和NK细胞中选择性转录CAR。在这种情况下，CAR由可操作地连接至诱导型启动子的核酸序列编码，该诱导型启动子包含转录因子的特定多核苷酸结合位点。

在一些实施方案中，可将工程改造成表达转录因子系统的一种或多种组分的NK细胞用于ACT。NK细胞激活将诱导穿孔素/颗粒酶依赖性靶标细胞凋亡。NK细胞激活还诱导细胞因子分泌，例如IFNγ、TNF-α和GM-CSF。这些细胞因子增强巨噬细胞的吞噬功能及其抗微生物活性，并通过上调抗原呈递细胞如树突状细胞(DC)的抗原呈递来增强适应性免疫反应(评述于Vivier等人,Nat.Immunol.,2008,9(5):503-510中)。

基因修饰的其他实例可包括引入嵌合抗原受体(CAR)和下调抑制性NK细胞受体，如NKG2A。

NK细胞也可以通过基因重编程来规避NK细胞在与肿瘤细胞相互作用时的抑制信号。例如，使用CRISPR、ZFN或TALEN对NK细胞进行基因修饰以使其抑制性受体沉默，可能会增强NK细胞的抗肿瘤能力。

免疫细胞可以使用本领域已知的多种方法离体分离和扩增。例如，分离和扩增细胞毒性T细胞的方法描述于美国专利号6,805,861和6,531,451；美国专利公开号US20160348072A1和国际专利公开号WO2016168595A1中；各案的内容以引用的方式整体并入本文。NK细胞的分离和扩增描述于美国专利公开号US20150152387A1、美国专利号7,435,596；以及Oyer,J.L.(2016).Cytotherapy.18(5):653-63；各案的内容以引用的方式整体并入本文中。具体而言，人初代NK细胞可以在饲养细胞，例如被基因修饰成表达膜结合IL15、IL21、IL12和4-1BBL的骨髓细胞系存在下扩增。

在一些情况下，可富集免疫细胞亚群进行ACT。用于免疫细胞富集的方法教示于国际专利公开号WO2015039100A1中。在另一个实例中，可使用对B和T淋巴细胞衰减标记物(BTLA)呈阳性的T细胞富集具有抗癌反应性的T细胞，如美国专利号9,512,401(各案内容以引用待方式整体并入本文中)中所描述。

在一些实施方案中，用于ACT的免疫细胞可以耗尽选定的亚群以增强T细胞扩增。例如，可以使用美国专利公开号US20160298081A1中所教示的方法，使免疫细胞耗尽Foxp3+T淋巴细胞仪最大限度地减少抗肿瘤免疫反应；该专利的内容以引用的方式整体并入本文。

在一些实施方案中，用于ACT的T细胞的激活和扩增是通过对细胞表面上瞬时表达的嵌合抗原受体(CAR)进行抗原刺激来实现。这种激活方法教示于国际专利号WO2017015427中，该案内容以引用的方式整体并入本文。

在一些实施方案中，免疫细胞可以被与抗原呈递细胞(APC)相关的抗原激活。在一些实施方案中，APC可以是抗原特异性或非特异性的树突细胞、巨噬细胞或B细胞。APC在其器官中可能是自体的或同源的。在一些实施方案中，APC可以是人工抗原呈递细胞(aAPC)，例如基于细胞的aAPC或无细胞aAPC。基于细胞的aAPC可以选自基因修饰的同种异体细胞如人红白血病细胞，或异种细胞如鼠成纤维细胞和果蝇细胞。或者，APC可以是无细胞的，其中抗原或共刺激结构域呈递于合成表面上，例如乳胶珠粒、聚苯乙烯珠粒、脂质囊泡或外来体上。

在一些实施方案中，本公开的细胞，特别是T细胞可以使用人工细胞平台进行扩增。在一个实施方案中，成熟T细胞可以使用Seet CS等人,2017.Nat Methods.14,521-530(其内容以引用的方式整体并入本文)所描述的人工胸腺类器官(ATO)产生。ATO是基于表达delta样典型缺口配体(delta like canonical notch ligand，DLL1)的基质细胞系。在这种方法中，基质细胞通过离心而与造血干细胞和祖细胞聚集在一起，并部署于细胞培养小室上的空气-流体界面处，以产生类器官培养物。ATO源性T细胞展现出幼稚表型、多样化的T细胞受体(TCR)库和TCR依赖性功能。

在一些实施方案中，过继细胞疗法通过自体转移进行，其中细胞来源于需要治疗的受试者并且细胞在分离和加工之后施用给同一受试者。在其他情况下，ACT可能涉及同种异体转移，其中细胞是从除最终接受细胞疗法的受体受试者以外的供体受试者分离和/或制备。供体受试者与受体受试者在基因上可能相同或相似，或可能表达相同的HLA类别或亚型。

在一些实施方案中，引入用于ACT的免疫细胞(例如T细胞和NK细胞)中的多种免疫治疗剂可以由相同或不同的转录因子系统控制。在一个实例中，两种有效负载中的每一者，例如细胞因子如IL12和CAR构建体如CD19CAR，由相同或不同转录因子系统上的一个或多个转录因子转录，其中该一个或多个转录因子连接至相同或不同的DRD。当用对DRD具有特异性的稳定配体使DRD稳定时，有效负载被转录和翻译。IL12和CD19CAR的表达是使用一种或多种稳定配体调节的。在其他实施方案中，引入用于ACT的免疫细胞(例如T细胞和NK细胞)中的多种免疫治疗剂可以由不同的转录因子系统控制。在一个实例中，细胞因子如IL12和CAR构建体如CD19CAR各自由两个不同转录因子中的一者转录，各转录因子可操作地连接至不同的DRD，并由此可以使用不同的刺激物独立地调节。在另一个实例中，自杀基因和CAR构建体可以被两个不同的转录因子转录激活。

在使用本公开的转录因子系统和组合物的一种或多种组分进行基因调节之后，将细胞施用给有需要的受试者。施用细胞以进行过继细胞疗法的方法是已知的并且可以与所提供的方法和组合物结合使用。例如，过继性T细胞疗法方法描述于例如颁予Gruenberg等人的美国专利申请公开号2003/0170238；颁予Rosenberg的美国专利号4,690,915；Rosenberg(2011)Nat Rev Clin Oncol.8(10):577-85)中。参见例如Themeli等人(2013)Nat Biotechnol.31(10):928-933；Tsukahara等人(2013)Biochem Biophys Res Commun438(1):84-9；Davila等人(2013)PLoS ONE 8(4):e61338；各案的内容以引用的方式整体并入本文中。

在一些实施方案中，用于ACT的免疫细胞可以被修饰成表达一种或多种免疫治疗剂(感兴趣蛋白质)，该一种或多种免疫治疗剂促进免疫细胞激活、浸润、扩增、存活和抗肿瘤功能。免疫治疗剂可以是对不同靶标分子具有特异性的第二种CAR或TCR；细胞因子或细胞因子受体；将抑制信号转化为刺激信号的嵌合开关受体；将过继转移的细胞引导至如肿瘤组织等靶标部位的归巢受体；优化免疫细胞的代谢的药剂；或当过继细胞转移后观察到严重事件时或转移的免疫细胞不再需要时杀死激活的T细胞的安全开关基因(例如自杀基因)。

在一些实施方案中，可对用于过继细胞转移的免疫细胞进行基因操作，以改善它们的持久性、细胞毒性、肿瘤靶向能力和在体内归巢到疾病部位的能力，总体目标是进一步改善它们杀死癌症患者体内的肿瘤的能力。一个实例是将编码细胞因子如γ-细胞因子(例如IL2和IL15)的本公开的转录因子系统的一种或多种组分引入免疫细胞中以促进免疫细胞增殖和存活。将由转录因子系统编码的细胞因子基因(例如γ-细胞因子IL2和IL15)转导到免疫细胞中将使免疫细胞(例如NK细胞)能够在不添加外源细胞因子的情况下繁殖，由此使表达细胞因子的NK细胞具有增强的肿瘤细胞毒性。

在一些实施方案中，可以利用转录因子系统的一种或多种组分来防止T细胞耗竭。如本文所使用，“T细胞耗竭”是指由慢性T细胞激活引起的T细胞功能的逐步和进行性丧失。T细胞耗竭是限制抗病毒和抗肿瘤免疫疗法的功效的主要因素。耗竭的T细胞具有低增殖和细胞因子产生能力，同时具有高凋亡速率和多种抑制性受体的高表面表达。导致耗竭的T细胞激活可以在抗原存在或不存在下发生。

在一些实施方案中，转录因子系统的一种或多种组分可用于在嵌合抗原受体-T细胞疗法(CAR-T)的背景下防止T细胞衰竭。在这一背景下，耗竭在一些情况下可能是由CAR的scFv在细胞表面上寡聚化导致CAR的细胞内结构域的连续激活引起。作为非限制性实例，本公开的CAR可以包括不能寡聚化的scFv。作为另一个非限制性实例，还可以选择在抗原暴露后快速内化并重新表达的CAR以防止细胞表面上的慢性scFv寡聚化。在一个实施方案中，可以对scFv的框架区进行修饰以防止组成型CAR信号传导(Long等人,2014.CancerResearch.74(19)S1；其内容以引用的方式整体并入)。本公开的转录因子系统的一种或多种组分也可用于调控T细胞表面上CAR的表面表达以防止慢性T细胞激活。本公开的CAR也可以被工程改造成最大限度地减少耗竭。作为一个非限制性实例，41-BB信号传导结构域可以并入CAR设计中以改善T细胞耗竭。在一些实施方案中，可使用Long H A等人公开的任何策略防止耗竭(Long A H等人(2015)Nature Medicine 21,581-590；其内容以引用的方式整体并入本文)。

在一些实施方案中，本公开的转录因子系统的可调性质可用于逆转在强直性CAR信号传导下观察到的人T细胞衰竭。使用本公开的组合物可逆地沉默过继转移的细胞的生物活性可用于逆转强直性信号传导，强直性信号传导的逆转又可重振T细胞。耗竭的逆转可以通过下调与耗竭相关的多种抑制性受体来测量。

在一些实施方案中，可以对T细胞代谢途径进行修饰以降低T细胞对耗竭的敏感性。代谢途径可以包括但不限于糖酵解、尿素循环、柠檬酸循环、β氧化、脂肪酸生物合成、磷酸戊糖途径、核苷酸生物合成和糖原代谢途径。作为一个非限制性实例，降低糖酵解速率的有效负载可用于限制或防止T细胞耗竭(Long等人,Journal for Immunotherapy ofCancer 2013,1(增刊1):P21；其内容以引用的方式整体并入)。在一个实施方案中，本公开的T细胞可以与糖酵解抑制剂如2-脱氧葡萄糖和雷帕霉素组合使用。

在一些实施方案中，本公开的有效负载或感兴趣蛋白质可以与靶向与T细胞耗竭相关的T细胞表面标记物的抗体或片段结合使用。可以使用的与T细胞耗竭相关的T细胞表面标记物包括但不限于CTLA-1、PD-1、TGIT、LAG-3、2B4、BTLA、TIM3、VISTA和CD96。在一些实施方案中，可以利用转录因子系统的一种或多种组分来防止T细胞耗竭。

在一些实施方案中，本公开的组合物可用于改变受试者体内的肿瘤浸润淋巴细胞(TIL)群体。在一个实施方案中，本文所描述的任何有效负载均可用于改变CD4阳性细胞与CD8阳性群体的比率。在一些实施方案中，TIL可以离体分选并且被工程改造成表达本文所描述的任何细胞因子。本公开的有效负载可用于扩增CD4和/或CD8TIL群以增强TIL介导的免疫反应。

用于改善CAR-T疗法结果的参数描述于Finney等人,JCI.2019；129(5):2123-2132(其内容以引用的方式整体并入本文)中。在单采术时外周血CD8+T细胞中生物标记物LAG3(高)/TNF-α(低)的水平也可以预测具有高抗原负荷的受试者的后续功能失调反应，这些受试者没有实现持续数周以上的完全反应。作为起始T细胞库的结果的T细胞内在特征以及制造过程联合过继转移后CD19抗原诱导的激活的影响也可在CAR-T疗法的结果中发挥作用。起始T细胞库可能部分受单采时间的影响。在一个实施方案中，单采术可以在化学疗法之前执行。在清除淋巴细胞的化学疗法之前在骨髓中评价的表达CD19的白血病和正常B细胞的累积负担对于确定CAR-T疗法的结果可能很重要。根据Finney等人，增加抗原负担可改善CAR-T疗法的结果。为了增加体内CD19抗原负担，还可以向受试者输注基因修饰成表达CD19的扩增的受试者源性T细胞(也称为T-APC)。

在一些实施方案中，本公开的可调控转录因子表达构建体、感兴趣有效负载(例如免疫治疗剂)、载体、细胞和组合物可以与癌症疫苗结合使用。

在一些实施方案中，癌症疫苗可以包含来源于肿瘤相关抗原(TAA)的肽和/或蛋白质。此类策略可用于在受试者体内引发免疫反应，在一些情况下，该免疫反应可能是细胞毒性T淋巴细胞(CTL)反应。用于癌症疫苗的肽也可以被修饰成匹配受试者的突变谱。例如，具有与在需要疗法的受试者体内所发现的突变相匹配的突变的EGFR源性肽已成功用于肺癌患者(Li F等人(2016)Oncoimmunology.Oct 7；5(12):e1238539；其内容以引用的方式整体并入本文)。

在一个实施方案中，本公开的癌症疫苗可以包括来源于肿瘤相关抗原(TAA)的超激动剂改变的肽配体(APL)。这些是突变型肽配体，与天然肽序列相差一个或多个氨基酸，比天然表位更有效地激活特定的CTL克隆。这些改变可以使肽更好地结合限制性I类MHC分子或更有利地与给定肿瘤特异性CTL子集的TCR相互作用。APL可以使用美国专利号US20160317633A1中教示的方法选择，该案的内容以引用的方式整体并入本文。

在一些实施方案中，基因修饰成编码本公开的转录因子系统的组分和有效负载的效应免疫细胞可以与本文所描述的生物佐剂组合。CAR与细胞因子和配体的双重调控将靶标介导激活的动力学控制与内在细胞T细胞扩增分开。这种双重调控还最大限度地减少了患者对预处理方案的需求。作为一个非限制性实例，转录有效负载(例如CAR，例如CD19CAR)的DRD调控的转录因子可以与细胞因子(例如IL12)组合以增强CAR的抗肿瘤功效(PegramH.J.等人,Tumor-targeted T cells modified to secrete IL12 eradicate systemictumors without need for prior conditioning.Blood.2012；119:4133-41；其各自的内容以引用的方式整体并入本文)。作为另一个非限制性实例，Merchant等人将基于树突状细胞的疫苗接种与重组人IL7相结合，以改善高危儿科肉瘤患者的结果(Merchant,M.S.等人,Adjuvant immunotherapy to Improve Outcome in High-Risk PediatricSarcomas.Clin Cancer Res.2016.22(13):3182-91；其各自的内容以引用的方式整体并入本文)。

在一些实施方案中，被修饰成表达一种或多种抗原特异性TCR或CAR的效应免疫细胞可以与本公开的组合物组合，该组合物包含转化免疫抑制性肿瘤微环境的免疫治疗剂。

一方面，可组合被修饰成表达对同一细胞上的不同靶标分子具有特异性的CAR的效应免疫细胞。在另一方面，被修饰成表达相同CAR构建体的不同免疫细胞，例如NK细胞和T细胞可组合用于肿瘤治疗，例如被修饰成表达CD19CAR的T细胞可与被修饰成表达相同CD19CAR的NK细胞组合以治疗B细胞恶性病。

在其他实施方案中，被修饰成表达CAR的免疫细胞可以与检查点阻断剂组合。

在一些实施方案中，被基因修饰成表达转录因子系统的一种或多种组分(例如本公开的有效负载)的效应免疫细胞可与癌症疫苗以及本公开的其他免疫治疗剂和辅助治疗组合。

在一些实施方案中，本公开的方法可以包括将本公开的组合物与有效治疗癌症、感染性疾病和其他免疫缺陷疾病的其他药剂(例如抗癌剂)组合。如本文所使用，术语“抗癌剂”是指能够例如通过杀死癌细胞、诱导癌细胞凋亡、降低癌细胞的生长速率、降低癌转移的发生或次数、减小肿瘤大小、抑制肿瘤生长、减少肿瘤或癌细胞的血液供应、促进针对癌细胞或肿瘤的免疫反应、预防或抑制癌症的进展、或者延长患有癌症的受试者的寿命对受试者的癌症产生负面影响的任何药剂。

在一些实施方案中，抗癌剂或疗法可以是化学治疗剂，或放射疗法、免疫治疗剂、手术或与本公开组合以改善治疗的疗效的任何其他治疗剂。

在一个实施方案中，包含CD19CAR的转录因子系统的一种或多种组分可以使用国际专利申请号WO2016164580中教导的方法与氨基嘧啶衍生物，如伯基特氏酪氨酸受体激酶(Burkit's tyrosine receptor kinase，BTK)抑制剂组合使用，该专利申请的内容以引用的方式整体并入本文。

在一些实施方案中，本公开的组合物可以与除本文所描述的本发明疗法之外的免疫治疗剂组合使用，例如对肿瘤细胞表面上的一些靶标分子具有特异性的抗体。

示例性化学疗法包括但不限于阿西维辛(Acivicin)；阿柔比星(Aclarubicin)；盐酸阿科达唑(Acodazole hydrochloride)；阿克罗宁(Acronine)；阿多来新(Adozelesin)；阿德白介素(Aldesleukin)；阿曲他明(Altretamine)；安布霉素(Ambomycin)；醋酸阿米坦酮(Ametantrone acetate)；安吖啶(Amsacrine)；阿那曲唑(Anastrozole)；蒽霉素(Anthramycin)；天冬酰胺酶(Asparaginase)；阿司匹林(Asperrin)；舒林酸(Sulindac)；姜黄素(Curcumin)；烷化剂，包括：氮芥(Nitrogenmustards)，如甲氯乙胺(mechlor-ethamine)、环磷酰胺(cyclophosphamide)、异环磷酰胺(ifosfamide)、美法仑(melphalan)和苯丁酸氮芥(chlorambucil)；亚硝基脲(nitrosoureas)，如卡莫司汀(carmustine；BCU)、洛莫司汀(lomustine；CCNU)和司莫司汀(semustine；甲基-CC U)；乙烯亚胺/甲基三聚氰胺，如三乙烯三聚氰胺(thriethylenemelamine，TEM)、三乙烯、硫代磷酰胺(噻替哌(thiotepa))、六甲基三聚氰胺(HMM，阿曲他明)；烷基磺酸盐，例如白消安(busulfan)；三嗪类，如达卡巴嗪(dacarbazine；DTIC)；抗代谢物，包括叶酸类似物如甲氨蝶呤和三甲氨蝶呤，吡咯烷类似物如5-氟尿嘧啶、氟脱氧尿苷、吉西他滨(gemcitabine)、胞嘧啶阿拉伯糖苷(AraC、阿糖胞苷(cytarabine))、5-氮杂胞苷、2,2'-二氟脱氧胞苷，嘌呤类似物如6-巯基嘌呤，6-硫鸟嘌呤、硫唑嘌呤(azathioprine)、2'-脱氧考福霉素(coformycin)(喷司他丁(pentostatin))、红羟基壬基腺嘌呤(erythrohydroxynonyladenine，EHNA)、磷酸氟达拉滨(fludarabine phosphate)和2-氯脱氧腺苷(克拉屈滨(cladribine)，2-CdA)；天然产物，包括抗有丝分裂药物如太平洋紫杉醇(paclitaxel)、长春花生物碱(vinca alkaloids)，包括长春碱(vinblastine，VLB)、长春新碱(vincristine)和长春瑞滨(vinorelbine)、泰索帝(taxotere)、雌莫司汀(estramustine)和磷酸雌莫司汀；表鬼臼毒素，如依托泊苷(etoposide)和替尼泊苷(teniposide)；抗生素，如放线菌素D(actimomycin D)、道诺霉素(daunomycin)(红霉素(rubidomycin))、阿霉素(doxorubicin)、米托蒽醌(mitoxantrone)、伊达比星(idarubicin)、博来霉素(bleomycins)、普卡霉素(plicamycin)(光神霉素(mithramycin))、丝裂霉素C和放线菌素；酶，如L-天冬酰胺酶；细胞因子如干扰素(IFN)-γ、肿瘤坏死因子(TNF)-α、TNF-β和GM-CSF；抗血管生成因子，例如血管抑制素(angiostatin)和内皮抑制素(endostatin)；FGF或VEGF抑制剂，例如血管生成因子受体的可溶性形式，包括可溶性VGF/VEGF受体；铂配位络合物，如顺铂(cisplatin)和卡铂(carboplatin)；蒽二酮类，如米托蒽醌；取代的脲，如羟基脲；甲基肼衍生物，包括N-甲基肼(MIFf)和丙卡巴肼(procarbazine)；肾上腺皮质抑制剂，例如米托坦(mitotane)(o,ρ'-DDD)和氨鲁米特(aminoglutethimide)；激素和拮抗剂，包括肾上腺皮质激素拮抗剂，如泼尼松(prednisone)和等效物、地塞米松(dexamethasone)和氨鲁米特；孕激素，如己酸羟孕酮(hydroxyprogesterone caproate)、醋酸甲羟孕酮(medroxyprogesterone acetate)和醋酸甲地孕酮(megestrol acetate)；雌激素，例如己烯雌酚(diethylstilbestrol)和乙炔雌二醇等效物；抗雌激素，如他莫昔芬；雄激素，包括丙酸睾酮(testosterone propionate)和氟氧睾酮(fluoxymesterone)/等效物；抗雄激素，如氟他胺(flutamide)、促性腺激素释放激素类似物和亮丙瑞林(leuprolide)；非类固醇抗雄激素，如氟他胺；激酶抑制剂、组蛋白去乙酰化酶抑制剂、甲基化抑制剂、蛋白酶体抑制剂、单克隆抗体、氧化剂、抗氧化剂、端粒酶抑制剂、BH3模拟物、泛素连接酶抑制剂、stat抑制剂和受体酪氨酸激酶抑制剂，例如甲磺酸伊马替尼(imatinib mesylate；以Gleevac或Glivac销售)和厄洛替尼(erlotinib；一种EGF受体抑制剂，现以Tarveca上市)；抗病毒剂，如磷酸奥司他韦(oseltamivirphosphate)、两性霉素B(Amphotericin B)和帕利珠单抗(palivizumab)；Sdi 1模拟物；西莫司汀(Semustine)；衰老衍生抑制剂1；石榴酸(Sparfosic acid)；辣霉素D(SpicamycinD)；螺莫司汀(Spiromustine)；脾脏五肽(Splenopentin)；海绵抑素1；角鲨胺；司匹胺(Stipiamide)；溶血素抑制剂；斯菲诺辛(Sulfinosine)；超活性血管活性肠肽拮抗剂；维拉瑞索(Velaresol)；维拉胺(Veramine)；维丁斯(Verdins)；维替泊芬(Verteporfin)；长春瑞滨；长春新碱(Vinxaltine)；维他辛(Vitaxin)；伏罗唑(Vorozole)；扎诺泰隆(Zanoterone)；泽尼铂(Zeniplatin)；亚苄维C(Zilascorb)；和净司他丁斯酯(Zinostatinstimalamer)；PI3Kβ小分子抑制剂，GSK2636771；泛PI3K抑制剂(BKM120)；BRAF抑制剂。维罗非尼(Vemurafenib)(Zelboraf)和达拉非(dabrafenib)(Tafinlar)；或前述的任何类似物或衍生物和变体。

放射治疗剂和因素包括诱导DNA损伤的辐射和波，例如γ-辐照、X射线、UV辐照、微波、电子发射、放射性同位素等。疗法可以通过用上述形式的辐射照射局部肿瘤部位来实现。很可能所有这些因素都会实现DNA、DNA前体、DNA的复制和修复以及染色体的组装和维持的广泛损伤。X射线的剂量范围从在一段较长时间(3至4周)内每天50至200伦琴的剂量到2000至6000伦琴的单次剂量。放射性同位素的剂量范围变化很大，并且取决于同位素的半衰期、所发射的辐射的强度和类型以及赘生性细胞的吸收。

在一些实施方案中，化学治疗剂可以是免疫调节剂，例如来那度胺(lenalidomide，LEN)。最近的研究表明，来那度胺可以增强CAR修饰的T细胞的抗肿瘤功能(Otahal等人Oncoimmunology,2015,5(4):e1115940)。抗肿瘤抗体的一些实例包括托珠单抗(ocilizumab)、西妥昔单抗(siltuxima)。

可以与本公开的组合物组合使用的其他试剂还可以包括但不限于实现细胞表面受体及其配体的上调的试剂，例如Fas/Fas配体、DR4或DR5/TRAIL GAP连接、细胞生长抑制剂和分化剂、细胞粘附抑制剂如局部粘着斑激酶(focal adhesion kinase，FAK)抑制剂和洛伐他汀(Lovastatin)，或增加过度增殖细胞对凋亡诱导剂如抗体C225的敏感性的试剂。

组合可包括同时或分别施用本公开的组合物和其他试剂。或者，本发明的免疫疗法可以在其他试剂/疗法之前或之后施用，间隔从几分钟、几天、几周到几个月不等。

本公开中提供了一种减小有需要的受试者的肿瘤体积或负担的方法，该方法包括将本公开的组合物引入受试者体内。

本公开还提供了用于治疗受试者的癌症的方法，该方法包括向受试者施用有效量的被基因修饰成包含本公开的转录因子系统的效应免疫细胞。

癌症

各种癌症可以用本公开的包括DRD或有效负载的药物组合物、转录因子系统组分、可调控的转录因子表达构建体来治疗。如本文所使用，术语“癌症”是指以倾向于侵入周围组织并转移至新的身体部位的间变细胞增殖为特征的各种恶性赘瘤中的任一者，并且还指以此类恶性赘瘤生长为特征的病理状况。癌症可以是肿瘤或血液系统恶性病，并且包括但不限于所有类型的淋巴瘤/白血病、癌瘤和肉瘤，例如在肛门、膀胱、胆管、骨、脑、乳房、子宫颈、结肠/直肠、子宫内膜、食道、眼、胆囊、头颈、肝、肾、喉、肺、纵隔(胸部)、口、卵巢、胰腺、阴茎、前列腺、皮肤、小肠、胃、脊髓、尾骨、睾丸、甲状腺和子宫中发现的癌症或肿瘤。

可用本公开的组合物治疗的癌瘤的类型包括但不限于乳头瘤/癌瘤、绒毛膜癌、内胚窦瘤、畸胎瘤、腺瘤/腺癌、黑色素瘤、纤维瘤、脂肪瘤、平滑肌瘤、横纹肌瘤、间皮瘤、血管瘤、骨瘤、软骨瘤、神经胶质瘤、淋巴瘤/白血病、鳞状细胞癌、小细胞癌、大细胞未分化癌、基底细胞癌和鼻窦未分化癌。

可用本公开的组合物治疗的肉瘤类型包括但不限于软组织肉瘤，例如肺泡状软组织肉瘤、血管肉瘤、皮肤纤维肉瘤、韧带样瘤、促纤维组织增生性小圆细胞瘤、骨外软骨肉瘤、骨外骨肉瘤、纤维肉瘤、血管外皮细胞瘤、血管肉瘤、卡波西氏肉瘤(Kaposi's sarcom)、平滑肌肉瘤、脂肪肉瘤、淋巴管肉瘤、淋巴肉瘤、恶性纤维组织细胞瘤、神经纤维肉瘤、横纹肌肉瘤、滑膜肉瘤和阿斯金氏瘤(Askin's tumor)、尤文氏肉瘤(Ewing's sarcoma)(原始神经外胚层肿瘤)、恶性血管内皮瘤、恶性神经鞘瘤、骨肉瘤和软骨肉瘤。

感染性疾病

在一些实施方案中，本公开的转录因子系统可用于治疗感染性疾病。本公开的转录因子系统可以被引入适合过继细胞转移的细胞中，例如巨噬细胞、树突状细胞、自然杀伤细胞和/或T细胞。用本公开的转录因子系统治疗的感染性疾病可以包括由病毒、细菌、真菌和/或寄生虫引起的疾病。本公开的IL15-IL15Ra有效负载可用于增加可用于治疗感染性疾病的免疫细胞的增殖和/或免疫细胞的持久性。

“感染性疾病”在本文中是指由感染哺乳动物细胞、优选人体细胞并引起疾病状况的任何病原体或试剂引起的疾病。其实例包括细菌、酵母、真菌、原生动物、支原体、病毒、朊病毒和寄生虫。实例包括涉及以下的那些：(a)病毒性疾病，例如由腺病毒、疱疹病毒(例如HSV-I、HSV-II、CMV或VZV)、痘病毒(例如正痘病毒，如天花或牛痘，或传染性软疣)、小核糖核酸病毒(例如鼻病毒或肠道病毒)、正粘病毒(例如流感病毒)、副粘病毒(例如副流感病毒、腮腺炎病毒、麻疹病毒和呼吸道合胞病毒(RSV))、冠状病毒(例如SARS)、乳多空病毒(例如乳头瘤病毒，如引起生殖器疣、普通疣或足底疣的病毒)、肝炎病毒(例如乙型肝炎病毒)、黄病毒(例如丙型肝炎病毒或登革热病毒)或逆转录病毒(例如慢病毒，如HIV)感染引起的疾病；(b)细菌性疾病，例如由埃希氏菌属(Escherichia)、肠杆菌属(Enterobacter)、沙门氏菌属(Salmonella)、葡萄球菌属(Staphylococcus)、志贺氏菌属(Shigella)、李斯特氏菌属(Listeria)、气杆菌属(Aerobacter)、螺杆菌属Helicobacter()、克雷伯氏菌属(Klebsiella)、变形杆菌属(Proteus)、假单胞菌属(Pseudomonas)、链球菌属(Streptococcus)、衣原体(Chlamydia)、支原体(Mycoplasma)、肺炎球菌属(Pneumococcus)、奈瑟氏菌属(Neisseria)、梭菌属(Clostridium)、芽孢杆菌属(Bacillus)、棒状杆菌属(Corynebacterium)、分枝杆菌属(Mycobacterium)、弯曲杆菌属(Campylobacter)、弧菌属(Vibrio)、沙雷氏菌属(Serratia)、普罗维登氏菌属(Providencia)、色杆菌属(Chromobacterium)、布鲁氏菌属(Brucella)、耶尔森氏菌属(Yersinia)、嗜血杆菌属(Haemophilus)或博德特氏菌属(Bordetella)的细菌感染引起的疾病；(c)其他感染性疾病，例如衣原体、真菌病(包括但不限于念珠菌病、曲霉病、组织胞浆菌病、隐球菌性脑膜炎)、寄生虫病(包括但不限于疟疾、卡尼肺孢子虫肺炎、利什曼病、隐孢子虫病、弓形虫病和锥虫感染)和朊病毒引起人类疾病，如克-雅二氏病(Creutzfeldt-Jakob Disease，CJD)、变异型克-雅二氏病(vCJD)、戈斯特曼-斯特劳斯勒-杉克综合征(Gerstmann-Straüssler-Scheinker syndrome)、致命性家族性失眠症和库鲁病(kuru)。

免疫肿瘤学和细胞疗法

癌症免疫学领域的最新进展允许开发几种方法来帮助免疫系统阻止癌症。此类免疫疗法方法包括通过单克隆抗体或通过过继转移离体工程改造的T细胞(例如所述细胞含有嵌合抗原受体或工程改造的T细胞受体)来靶向癌症抗原。

在一些实施方案中，本公开的药物组合物、转录因子系统、可调控的转录因子表达构建体、可调控的转录因子表达构建体组分、包括其有效负载的可调控的转录因子表达构建体可用于调节或改变或利用免疫系统以靶向一种或多种癌症。这种方法也可以与其他此类生物方法一起考虑，例如免疫反应调节疗法，如施用干扰素、白细胞介素、集落刺激因子、其他单克隆抗体、疫苗、基因疗法，并且设想非特异性免疫调节剂也可作为抗癌疗法以与本公开的药物组合物、转录因子系统、可调控的转录因子表达构建体、可调控的转录因子表达构建体组分、包括其有效负载的可调控的转录因子表达构建体组合。

癌症免疫疗法是指设计用于诱导患者自身免疫系统对抗癌症的一组不同的治疗策略。在一些实施方案中，本公开的药物组合物、转录因子系统、可调控的转录因子表达构建体、可调控的转录因子表达构建体组分、包括其转录因子和/或有效负载的可调控的转录因子表达构建体被设计作为免疫肿瘤治疗剂。

细胞疗法

有几种类型的细胞免疫疗法，包括肿瘤浸润淋巴细胞(TIL)疗法、携带嵌合抗原受体(CAR)的基因工程改造的T细胞和重组TCR技术。

根据本公开，转录因子系统可用于开发和实施细胞疗法，例如过继细胞疗法。转录因子系统及其转录因子和有效负载可用于细胞疗法中以实现TCR去除-TCR基因破坏、TCR工程改造；调控表位标记的受体；用于刺激T细胞的APC平台中；作为增强离体APC刺激的工具；改善T细胞扩增方法；用抗原离体刺激；用于TCR/CAR组合中；用于TIL的操作或调控中；用于同种异体细胞疗法中；用于T细胞疗法与其他治疗线(例如放射线、细胞因子)的组合中；编码工程改造的TCR或修饰的TCR；或增强除TCR之外的T细胞(例如通过引入细胞因子基因、检查点抑制剂PD1、CTLA4的基因)。

在一些实施方案中，获得改善的反应速率以支持细胞疗法。

可以通过调控或精细调节有效负载，例如T细胞、NK细胞或其他免疫相关细胞中的受体或途径组分，来实现细胞群的扩增和持久性。在一些实施方案中，本公开的转录因子系统被设计为在空间上和/或在时间上控制增强T细胞或NK细胞反应的蛋白质的表达。在一些实施方案中，转录因子系统被设计为在空间上和/或在时间上控制抑制T细胞或NK细胞反应的蛋白质的表达。

在一些实施方案中，被基因修饰成包含如本文所描述的转录因子系统的细胞可被设计成用于减少、减轻或消除CAR细胞因子风暴。在一些实施方案中，此类减少、减轻和/或消除是在实体肿瘤或肿瘤微环境中发生。

在一些实施方案中，转录因子系统可以编码一种或多种细胞因子，例如白细胞介素，如IL2、IL6、IL12、IL15和IL21。

在一个实施方案中，本公开的有效负载可以包含IL2。一方面，本公开的转录因子系统可以编码选择性转录IL2、IL12、IL15和其他白细胞介素免疫治疗剂的转录因子，所述转录因子可以使用对转录因子系统中使用的DRD具有选择性的稳定配体小心地进行调整。

一方面，本公开的转录因子系统可以编码选择性转录有效负载的转录因子，例如IL12融合多肽。可调控的IL12融合多肽可直接用作免疫治疗剂或被转导至效应免疫细胞(T细胞和TIL细胞)中以产生具有较大体内扩增和存活能力的修饰的T细胞以用于过继细胞转移。使用受调控的IL12可以最大限度地减少当前过继细胞疗法中对苛刻预处理方案的需求。IL12可用于改变肿瘤微环境并增加当前肿瘤抗原靶向疗法无法治疗的实体肿瘤的持久性。在一些实施方案中，表达CAR的T细胞可以用转录因子调控的IL12武装以减轻免疫抑制作用，而且没有全身毒性。

在一些实施方案中，IL12可以是Flexi IL12，其中p35和p40亚基是由产生单链多肽的单个cDNA编码。

在一些实施方案中，说明性转录因子系统可以编码或被调节或诱导以产生一种或多种用于扩增本公开的细胞的细胞因子。在此类情形中，可以测试细胞的实际扩增情况。扩增可以是至少5％、10％、20％、30％、40％、50％、60％、70％、80％、90％或更高百分比。在一些实施方案中，细胞因子是IL15。编码IL15的转录因子系统可被设计成用于诱导细胞毒性群体的增殖并避免刺激T regs。在其他情形中，诱导细胞毒性群体增殖的转录因子系统也可刺激NK和NKT细胞。白细胞介素15是一种强效的免疫刺激性细胞因子，而且还是T细胞和自然杀伤细胞的重要存活因子。比较IL2和IL15的临床前研究表明，相较于IL2，IL15与较低毒性相关。在一些实施方案中，本公开的转录因子系统可以编码IL15融合多肽。IL15多肽也可以被修饰成增加其对IL15受体的结合亲和力。例如，在IL15第72位的天冬酰胺可以被天冬氨酸替代(美国专利公开US20140134128的SEQ ID NO.2；其内容以引用的方式整体并入)。

免疫系统可用于治疗除癌症以外的疾病。转录因子系统、它们的组分或可调控的转录因子表达构建体均可用于免疫疗法中以治疗疾病，包括但不限于自身免疫疾病、过敏、移植物抗宿主病以及可能导致免疫缺陷的疾病和病症，如获得性免疫缺陷综合征(AIDS)。

在一些实施方案中，本公开的有效负载可以是嵌合抗原受体(CAR)，CAR当转导到免疫细胞(例如T细胞和NK细胞)中时，可以重定向针对靶标(例如肿瘤细胞)的免疫细胞，该靶标表达被CAR的细胞外靶标部分识别的分子。

在一些实施方案中，包含转录因子系统的药物组合物，包括它们的感兴趣有效负载或蛋白质，可用于调节或改变或利用免疫系统以靶向一种或多种自身反应性免疫组分，例如自身抗体和自身反应性免疫细胞，以减轻自身免疫疾病。

在一些实施方案中，转录因子系统可用于基于免疫疗法的治疗中，以减弱或减轻移植物抗宿主病(GVHD)。GVHD是指在干细胞或骨髓移植后发生的一种疾患，其中同种异体供体免疫细胞对宿主组织发生反应。在一些实施方案中，转录因子系统可设计为编码细胞因子或免疫剂，该细胞因子或免疫剂被设计用于调节Tregs以治疗GVHD。

在一些实施方案中，归因于人天然或野生型感兴趣蛋白质的表达，转录因子系统的免疫原性可明显低于本领域中的其他生物电路或开关。

可以用包含本公开的转录因子系统的药物组合物治疗各种自身免疫疾病和自身免疫相关疾病。如本文所使用，术语“自身免疫疾病”是指身体产生攻击其自身组织的抗体的疾病。

自身免疫疾病包括但不限于急性播散性脑脊髓炎(ADEM)、急性坏死性出血性白质脑炎、艾迪生氏病(Addison’s disease)、无丙种球蛋白血症、斑秃、淀粉样变性、强直性脊柱炎、抗GBM/抗TBM肾炎、抗磷脂综合征(APS)、自身免疫性血管性水肿、自身免疫性再生障碍性贫血、自身免疫性自主神经功能障碍、自身免疫性肝炎、自身免疫性高脂血症、自身免疫性免疫缺陷、自身免疫性内耳病(AIED)、自身免疫性心肌炎、自身免疫性卵巢炎、自身免疫性胰腺炎、自身免疫性视网膜病变、自身免疫性血小板减少性紫癜(ATP)、自身免疫性甲状腺疾病、自身免疫性荨麻疹、轴突及神经元神经病、巴洛氏病(Balo disease)、白塞氏病(Behcet’s disease)、大疱性类天疱疮、心肌病、卡斯尔曼氏病(Castleman disease)、乳糜泻、查加斯氏病(Chagas disease)、慢性炎症性脱髓鞘性多发性神经病(CIDP)、慢性复发性多灶性骨髓炎(CRMO)、查格-施特劳斯综合征(Churg-Strauss syndrome)、瘢痕性类天疱疮/良性黏膜类天疱疮、克罗恩氏病(Crohn’s disease)、柯根氏综合征(Coganssyndrome)、冷凝集素病、柯萨奇氏心肌炎(Coxsackie myocarditis)、CREST病、原发性混合型冷球蛋白血症、脱髓鞘性神经病、疱疹样皮炎、皮肌炎、德维克氏病(Devic’s disease)(视神经脊髓炎)、盘状狼疮、德雷斯勒氏综合征(Dressler’s syndrome)、子宫内膜异位症、嗜酸性食管炎、嗜酸性筋膜炎、结节性红斑、实验性过敏性脑脊髓炎、埃文斯氏综合征(Evans syndrome)、纤维化肺泡炎、巨细胞动脉炎(颞动脉炎)、巨细胞心肌炎、肾小球肾炎、古德帕斯彻氏综合征(Goodpasture’s syndrome)、肉芽肿性多血管炎(GPA)(以前称为韦格纳氏肉芽肿病(Wegener’s Granulomatosis))、格雷夫斯氏病(Graves’disease)、格林-巴利氏综合征(Guillain-Barre syndrome)、桥本氏脑炎(Hashimoto’s encephalitis)、桥本氏甲状腺炎(Hashimoto’s thyroiditis)、溶血性贫血、亨诺-许兰氏紫癜(Henoch-Schonlein purpura)、妊娠疱疹、低丙种球蛋白血症、特发性血小板减少性紫癜(ITP)、IgA肾病、IgG4相关硬化性疾病、免疫调节性脂蛋白、包涵体肌炎、间质性膀胱炎、幼年型关节炎、幼年型糖尿病(1型糖尿病)、幼年型肌炎、川崎氏综合征(Kawasaki syndrome)、兰伯特-伊顿氏综合征(Lambert-Eaton syndrome)、白细胞破碎性血管炎、扁平苔藓、硬化性苔藓、木样结膜炎、线性IgA病(LAD)、狼疮(SLE)、莱姆氏病(Lyme disease)、慢性梅尼埃氏病(chronic,Meniere’s disease)、显微镜下多血管炎、混合型结缔组织病(MCTD)、莫伦氏溃疡(Mooren’s ulcer)、穆-哈二氏病(Mucha-Habermann disease)、多发性硬化症、重症肌无力、肌炎、嗜睡症、视神经脊髓炎(德维克氏病)、中性粒细胞减少症、眼瘢痕性类天疱疮、视神经炎、复发性风湿病、与链球菌相关的小儿自身免疫性神经精神障碍(PANDAS)、副肿瘤性小脑变性、阵发性睡眠性血红蛋白尿症(PNH)、帕罗氏综合征(Parry Romberg syndrome)、帕森纳-特纳氏综合征(Parsonnage-Turner syndrome)、睫状体平坦部炎(周边葡萄膜炎)、天疱疮、外周神经病、静脉周围脑脊髓炎、恶性贫血、POEMS综合征、结节性多动脉炎、I型、II型和III型自身免疫性多腺体综合征、风湿性多肌痛、多发性肌炎、心肌梗死后综合征、心包切开术后综合征、孕酮性皮炎、原发性胆汁性肝硬化、原发性硬化性胆管炎、银屑病、银屑病性关节炎、特发性肺纤维化、坏疽性脓皮病、纯红细胞再生障碍性贫血、雷诺现象、反应性关节炎、反射性交感神经营养不良、瑞特氏综合征(Reiter’s syndrome)、复发性多软骨炎、不宁腿综合征、腹膜后纤维化、类风湿性关节炎、结节病、施密特氏综合征(Schmidtsyndrome)、巩膜炎、硬皮病、休格连氏综合征(Sjogren’s syndrom)、精子和睾丸自身免疫、僵人综合征(Stiff person syndrome)、苏萨克氏综合征(Susac’s syndrome)、交感性眼炎、高安氏动脉炎(Takayasu’s arteritis)、颞动脉炎/巨细胞动脉炎、血小板减少性紫癜(TTP)、托洛萨-亨特氏综合征(Tolosa-Hunt syndrome)、横贯性脊髓炎、溃疡性结肠炎、未分化型结缔组织病(UCTD)、葡萄膜炎、血管炎、水疱大疱性皮肤病和白癜风。

可以用包含本公开的转录因子系统的一种或多种组分的药物组合物治疗各种肾病。

可以用包含本公开的转录因子系统的一种或多种组分的药物组合物治疗各种心血管疾病。

可以用包含本公开的转录因子系统的一种或多种组分的药物组合物治疗各种抗体缺乏症。

可以用包含本公开的转录因子系统的一种或多种组分的药物组合物治疗各种神经疾病。

可以用包含本公开的转录因子系统的一种或多种组分的药物组合物治疗各种肺病。

可以用包含本公开的转录因子系统的一种或多种组分的药物组合物治疗各种骨病。

可以用包含本公开的转录因子系统的一种或多种组分的药物组合物治疗各种血液病。

在一些实施方案中，包含本公开的转录因子系统的一种或多种组分的药物组合物可用于调节或改变或利用中枢神经系统中的蛋白质，包括脑脊髓(CSF)蛋白质。

在一些实例中，包含本公开的转录因子系统的一种或多种组分的药物组合物可用于向中枢神经系统提供可调节的ERT(酶替代疗法)产品。许多溶酶体贮积病(LSD)涉及CNS症状，例如智力低下、癫痫发作、严重的神经退行性变、行为异常和精神运动缺陷。用于LSD的ERT是现代分子医学中真实成功案例之一。ERT的成功应用依赖于受控的溶酶体蛋白(例如酶)和向CNS细胞的递送。

基因编辑

在一些实施方案中，转录因子系统包括有效负载，该有效负载包含核酸酶，该核酸酶含有DNA结合结构域以选择性靶向特定DNA序列用于基因编辑和基因疗法。在一些实施方案中，转录因子系统包含编码锌指核酸酶、TALES或CRISPR核酸酶的多核苷酸作为有效负载，所述多核苷酸由系统中的转录因子调节。

CRISPR-Cas9系统是一种新颖的基因组编辑系统，该系统已在多种模式生物体和细胞类型中迅速开发和实施，并取代了其他基因组编辑技术，如TALEN和ZFN。CRISPR是存在于细菌和古细菌基因组中的序列基序，由短的(约24-48个核苷酸)直接重复序列构成，这些序列通过大小类似的独特间隔子隔开(Grissa等人,BMC Bioinformatics 8,172(2007))。它们一般侧接一组编码CRISPR相关(Cas)蛋白质的基因，这些基因是CRISPR维持和功能所必需的(Barrangou等人,Science 315,1709(2007)；Brouns等人,Science 321,960(2008)；Haft等人,PLoS Comput Biol 1,e60(2005))。CRISPR-Cas系统提供针对侵入性基因元件(例如病毒、噬菌体和质粒)的适应性免疫(Horvath和Barrangou,Science,2010,327:167-170；Bhaya等人,Annu.Rev.Genet.,2011,45:273-297；和Brrangou R,RNA,2013,4:267-278)。三种不同类型的CRISPR-Cas系统已在细菌中分类，并且II型CRISPR-Cas系统研究最多。在细菌II型CRISPR-Cas系统中，在反式激活RNA(tracrRNA)/Cas9存在下由重复间隔子转录物前体(pre-crRNA)加工得到的小CRISPR RNA(crRNA)可以与tracrRNA/Cas9复合物形成双链体。双链体将成熟复合物募集到与tracrRNA:crRNA双链体中的间隔子序列互补的靶标双链DNA序列以通过Cas9核酸内切酶切割靶标DNA(Garneau等人,Nature,2010,468:67-71；Jinek等人,Science,2012,337:816-821；Gasiunas等人,Proc.Natl Acad.Sci.USA.,109:E2579-2586；以及Haurwitz等人,Science,2010,329:1355-1358)。II型CRISPR-CAS系统中crRNA:tracrRNA/Cas9复合物引起的靶标识别和切割不仅需要tracrRNA:crRNA双链体中与靶标序列互补的序列(也称为“原间隔子”序列)，而且还需要位于靶标多核苷酸的原间隔子序列的3'端的原间隔子相邻基序(protospacer adjacent motif，PAM)序列。PAM基序可以在不同CRISPR-Cas系统之间变化。

CRISPR-Cas9系统已被开发和改进用于基因编辑，并且被证明是一种用于编辑核酸序列的有效且特殊的技术，即使在真核细胞中也能编辑核酸序列。

然而，控制CRISPR-Cas系统(例如引导RNA和核酸酶)的作用和活性一直是个难题，并且经常会出现问题。

本公开的转录因子系统和/或它们的任何组分都可用于调控或调节CRISPR/Cas9系统以优化其效用。

在一些实施方案中，本公开的可调控的转录因子表达构建体的有效负载可以包括Cas9酶的替代同工型或直系同源物。

最常用的Cas9来源于化脓性链球菌(Streptococcus pyogenes)，并且RuvC结构域可因D10A突变而失活，而且HNH结构域可因H840A突变而失活。除了来源于化脓性链球菌的Cas9外，其他RNA引导的核酸内切酶(RGEN)也可用于可编程的基因组编辑。已在600多种细菌菌株中鉴别出Cas9序列。尽管Cas9家族显示出高度多样性的氨基酸序列和蛋白质大小，但所有Cas9蛋白都共有一个共同的结构，并且具有一个中央HNH核酸酶结构域和一个分开的RuvC/RHase H结构域。

在一些实施方案中，本公开的有效负载可以是分开的Cas-9(Zetsche B等人,Asplit-Cas9 architecture for inducible genome editing and transcriptionmodulation.Nat Biotechnol.2015年2月；33(2):139-42；其内容以引用的方式整体并入)。

除了Cas9直系同源物外，其他Cas9变体，如非活性dCas9和具有不同功能的效应物结构域的融合蛋白，也可以用作基因调节的平台。任何前述酶均可用于本公开中。

基于CRISPR/Cas9的可调控转录因子表达构建体可以通过国际公开号WO2016106244和Gao Y等人(Complex transcriptional modulation with orthogonaland inducible dCas9 regulators.Nat Methods.2016年12月；13(12):1043-1049)；其各自的内容以引用的方式整体并入本文)中所教示的方法中的任一者产生。

CRISPR/Cas9系统还可以用于调节基因表达，这可以与其基因编辑效用相结合。在一些实施方案中，本公开的可调控的转录因子系统的有效负载可以包括CRISPR相关的转录激活物，例如VP64-p65-Rta(VPR)；与CRISPR/Cas9系统相关联。

其他应用和用途

干细胞应用

本公开的转录因子系统和/或它们的组分可用于细胞的受控重编程、干细胞移植或这些重编程因子的受控或可调表达将有用的其他应用。

本公开的可调控的转录因子表达构建体可用于重编程细胞，包括干细胞或诱导型干细胞。诱导型多能干细胞(iPSC)的诱导最先由Takahashi和Yamanaka(Cell,2006.126(4):663-76；以引用的方式整体并入本文)使用病毒载体表达KLF4、c-MYC、OCT4和SOX2(又统称为KMOS)实现。

可切除的慢病毒和转座子载体、瞬时质粒的重复应用、游离型和腺病毒载体也已被用于尝试得到iPSC(Chang,C.-W.等人,Stem Cells,2009.27(5):1042-1049；Kaji,K.等人,Nature,2009.458(7239):771-5；Okita,K.等人,Science,2008.322(5903):949-53；Stadtfeld,M.等人.,Science,2008.322(5903):945-9；Woltjen,K.等人,Nature,2009；Yu,J.等人,Science,2009:1172482；Fusaki,N.等人,Proc Jpn Acad Ser B Phys Biol Sci,2009.85(8):348-62；各自以引用的方式整体并入本文)。

产生人iPSC的无DNA方法也已使用并入细胞穿透肽部分的重组蛋白进行的连续蛋白质转导(Kim,D.等人,Cell Stem Cell,2009.4(6):472-476；Zhou,H.等人,Cell StemCell,2009.4(5):381-4；各自以引用的方式整体并入本文中)，以及使用仙台病毒(Sendaivirus)进行的感染性转基因递送(Fusaki,N.等人,Proc Jpn Acad Ser B Phys Biol Sci,2009.85(8):第348-62页；以引用的方式整体并入本文)获得。

本公开的可调控的转录因子表达构建体可以包括有效负载，该有效负载包含支持重编程细胞的任何基因，包括但不限于OCT，如OCT4；SOX，如SOX1、SOX2、SOX3、SOX15和SOX18；NANOG；KLF，如KLF1、KLF2、KLF4和KLF5；MYC，如c-MYC和n-MYC；REM2；TERT；和LIN28，以及其变体。此类重编程因子的序列教示于例如国际申请PCT/US2013/074560中，其内容以引用的方式整体并入本文。

本公开的可调控的转录因子表达构建体可以包括有效负载，该有效负载包含有助于干细胞动员的任何因子。在自体干细胞疗法中，供移植的干细胞的来源可包括骨髓、外周血单核细胞和脐带血。来自这些来源(例如骨髓)的干细胞被刺激进入血流中。因此，有足够的干细胞可供收集以备将来再输注。可使用一种细胞因子策略或细胞因子策略组合来动员干细胞，包括但不限于G-CSF(非格司亭(filgrastim))、GM-CSF和在细胞因子之前进行化学疗法(化学动员)。

代谢肽和激素

在一些实施方案中，本公开的转录因子系统和/或它们的任何组分都可用于调控天然或合成的肽。天然存在的肽可包括但不限于肽激素、利钠肽、食物肽以及衍生物和前体。

本公开的转录因子系统和/或它们的任何组分也可用于激素或其他肽药物的脉冲释放。

酶替代疗法(ERT)

酶替代疗法(ERT)是一种替代患者体内的酶的药物治疗。ERT提供治疗干预措施，以解决由缺乏酶引起的许多病症中潜在的代谢缺陷。此类病症包括但不限于溶酶体贮积病(LSD)、先天性糖基化障碍和以细胞质中酶活性缺失或降低为特征的代谢障碍。

凝血

凝血缺陷常引起出血和/或血栓形成。最著名的凝血因子病症是血友病。其三种主要形式是甲型血友病(缺乏因子VIII)、乙型血友病(缺乏因子IX或“克雷司马斯氏病(Christmas disease)”)以及丙型血友病(缺乏因子XI，中度出血倾向)。由凝血因子缺乏引起的其他病症还包括但不限于温韦伯氏病(Von Willebrand disease)(由缺乏温韦伯因子(vWF)引起)、伯-苏氏综合征(Bernard-Soulier syndrome)(由vWF受体GPIb缺陷或缺乏引起)、血栓性静脉炎(由因子XII突变引起)、先天性无纤维蛋白原血症、家族性淀粉样变肾病(由因子I突变引起)、先天性凝血酶原转变加速因子前体/因子VII缺乏症、血栓形成倾向(由因子II缺乏症引起)、先天性因子X缺乏症、先天性因子XIIIa/b缺乏症、前激肽释放酶/弗莱彻因子(Fletcher Factor)缺乏症、激肽原缺乏症、伴有纤连蛋白沉积的肾小球病、肝素辅因子II缺乏症、蛋白质C缺乏症、蛋白质S缺乏症、蛋白质Z缺乏症、抗凝血酶III缺乏症、纤溶酶原缺乏症、I型(木样结膜炎)、抗纤维蛋白溶酶缺乏症、纤溶酶原激活物抑制剂1缺乏症和魁北克血小板紊乱(Quebec platelet disorder)。

用于凝血因子替代的基因疗法是由凝血缺乏引起的病症的医学治疗方法。根据本公开，本公开的可调控的转录因子表达构建体和/或它们的任何组分也可用于调控用于基因疗法的凝血因子。在一些实例中，凝血因子可以选自因子I(纤维蛋白原)、因子II(凝血酶原)、因子III(组织因子)、因子IV、因子V(前加速因子)、因子VI、因子VII(稳定因子)、因子VIII(抗血友病因子A)、因子IX(抗血友病因子B)、因子X(斯图尔特因子(Stuart-Prowerfactor))、因子XI(血浆凝血活酶前质)、因子XII(哈格曼因子(Hageman factor))、因子XIII(纤维蛋白稳定因子)、温韦伯因子、前激肽释放酶(弗莱彻因子)、高分子量激肽原(HMWK)(菲茨杰拉德因子(Fitzgerald factor))、纤连蛋白、抗凝血酶III、肝素辅因子II、蛋白质C、蛋白质S、蛋白质Z、蛋白质Z相关蛋白酶抑制剂(ZPI)、纤溶酶原、组织纤溶酶原激活物(tPA)、尿激酶、纤溶酶原、纤溶酶原激活物抑制剂1(PAI1)和纤溶酶原激活物抑制剂2(PAI2)。

在一个实施方案中，凝血因子是用于血友病基因疗法的因子VIII，包括野生型因子VIII、工程改造的因子VIII、激活的fVIII(fVIIIa)或等效物。示例性工程改造的因子VIII可以包括Roberts等人(J.Genet.Syndr.Gene Ther.,2011,1:S1-006；其内容以引用的方式整体并入本文)所论述的那些。

在另一个实施方案中，凝血因子可以是用于血友病B基因疗法的因子IX。因子IX可以是美国专利号7,575,897、7,700,734、7,888,067和8,168,425；PCT专利申请公开号WO2016/075473中所公开的重组因子IX；各案的内容以引用的方式整体并入本文。

在一些实施方案中，本公开的可调控的转录因子表达构建体和/或它们的任何组分可以包含在蛋白质加工和修饰中起作用的任何因子。蛋白质翻译后修饰可包括但不限于利用酶添加疏水性基团(例如肉豆蔻酰化、棕榈酰化、异戊二烯化(isoprenylation)、异戊烯化(prenylation)、法尼基化、香叶基香叶基化、糖基磷脂酰肌醇化(glypiation)和糖基磷脂酰肌醇(GPI)锚)；连接辅助因子以增强功能(例如脂酰化、黄素、磷酸泛酰巯基乙胺化和血红素C)；添加小化学基团(例如酰化、甲酰化、烷基化、磷酸化、甲基化、精氨酰化、聚谷氨酰化、聚甘氨酰化、丁酰化、糖基化、丙酰化、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、琥珀酰化、硫酸化和乙酰化)；连接其他蛋白质和/或肽，例如ISG化、SUMO化、泛素化、nedd化和pup化；氨基酸的化学修饰；以及结构变化。

肝脏靶向

肝脏是产生蛋白质的重要器官，并且参与血液凝固和许多代谢功能。多种疾病可以影响肝脏，并且靶向肝脏进行疾病治疗一直是一种很有前景的方法，尤其是靶向肝脏的基因疗法。在一些实施方案中，本公开的可调控的转录因子表达构建体和/或它们的任何组分都可用于调控靶向肝脏的基因疗法和基因转移。

可靶向肝脏并构建成本发明的可调控转录因子表达构建体以进行调控的蛋白质可包括肝癌中的蛋白质，例如肝细胞癌(HCC)、纤维板层HCC、胆管癌、血管肉瘤和继发性肝癌；由基因缺陷引起的遗传性病症，如血色素沉着症、威尔逊氏病(Wilson disease)、酪氨酸血症、α1抗胰蛋白酶缺乏症、糖原贮积病；由酶缺乏引起的代谢紊乱，例如吉尔伯特氏综合征(Gilbert's syndrome)、溶酶体酸性脂肪酶缺乏症(LALD)和戈谢氏病(Gaucherdisease)；自身免疫性肝炎；脂肪肝疾病；和病毒性肝炎(甲型、乙型和丙型)。在一些实例中，本发明的可调控的转录因子表达构建体可用于指导IL12治疗肝细胞癌(HCC)，以及指导IL10治疗糖尿病性神经病变。

在一些实施方案中，本发明的可调控的转录因子表达构建体可用于控制用于基因疗法的肝脏特异性基因产物。

在一些实施方案中，本发明的可调控的转录因子表达构建体可用于控制分泌(例如分泌至血液)的肝脏蛋白。

用于制备治疗剂的工具和试剂

本公开提供了可用于产生治疗剂，例如但不限于用于减少有需要的受试者的肿瘤体积或负担的免疫治疗剂的工具和试剂。治疗剂的制造涉及相当多的变量，例如有效负载的结构、细胞的类型、基因转移的方法、离体扩增的方法和时间、预处理以及受试者体内肿瘤负担的量和类型。此类参数可以使用本文所描述的工具和试剂进行优化。

细胞系

本公开提供了已经用本公开的组合物基因修饰的哺乳动物细胞。适合的哺乳动物细胞包括初代细胞和永生化细胞系。适合的哺乳动物细胞系包括但不限于人胚肾细胞系293、成纤维细胞系NIH 3T3、人结肠直肠癌细胞系HCT116、卵巢癌细胞系SKOV-3、永生化T细胞系(例如Jurkat细胞和SupT1细胞)、淋巴瘤细胞系Raji细胞、NALM-6细胞、K562细胞、HeLa细胞、PC12细胞、HL-60细胞、NK细胞系(例如NKL、NK92、NK962和YTS)等。在一些情况下，细胞不是永生化细胞系，而是从个体获得的细胞并且在本文中称为初代细胞。例如，细胞是从个体获得的T淋巴细胞。其他实例包括但不限于从个体获得的细胞毒性细胞、干细胞、外周血单核细胞或祖细胞。

细胞测定

在一些实施方案中，本公开组合物作为免疫治疗剂的有效性可使用细胞测定来评价。本公开组合物的表达水平和/或身份可以根据本领域已知的用于鉴别蛋白质和/或定量蛋白质水平的任何方法来确定。在一些实施方案中，此类方法可包括蛋白质印迹、流式细胞术和免疫测定。

本文提供了用于在功能上表征用本公开的可调控转录因子表达构建体和本公开的组合物转染或转导的细胞的方法。在一些实施方案中，功能表征是在初代免疫细胞或永生化免疫细胞系中进行并且可以通过细胞表面标记物的表达来确定。T细胞的细胞表面标记物的实例包括但不限于CD3、CD4、CD8、CD 14、CD20、CD11b、CD16、CD45和HLA-DR、CD 69、CD28、CD44、IFNγ。T细胞耗竭的标记物包括PD1、TIM3、BTLA、CD160、2B4、CD39和LAG3。抗原呈递细胞的细胞表面标记物的实例包括但不限于I类MHC、II类MHC、CD40、CD45、B7-1、B7-2、IFNγ受体和IL2受体、ICAM-1和/或Fcγ受体。树突状细胞的细胞表面标记物的实例包括但不限于I类MHC、II类MHC、B7-2、CD18、CD29、CD31、CD43、CD44、CD45、CD54、CD58、CD83、CD86、CMRF-44、CMRF-56、DCIR和/或Dectin-1等；而在某些情况下也没有CD2、CD3、CD4、CD8、CD14、CD15、CD16、CD 19、CD20、CD56和/或CD57。NK细胞的细胞表面标记物的实例包括但不限于CCL3、CCL4、CCL5、CCR4、CXCR4、CXCR3、NKG2D、CD71、CD69、CCR5、磷酸化JAK/STAT、磷酸化ERK、磷酸化p38/MAPK、磷酸化AKT、磷酸化STAT3、粒溶素、颗粒酶B、颗粒酶K、IL10、IL22、IFNg、LAP、穿孔素和TNFa。

在一些实施方案中，Long H A等人公开的任何策略均可用于防止耗竭(Long A H等人(2015)Nature Medicine 21,581-590；其内容以引用的方式整体并入本文)。在一些实施方案中，可以对T细胞代谢途径进行修饰以降低T细胞对耗竭的敏感性。代谢途径可以包括但不限于糖酵解、尿素循环、柠檬酸循环、β氧化、脂肪酸生物合成、磷酸戊糖途径、核苷酸生物合成和糖原代谢途径。作为一个非限制性实例，降低糖酵解速率的有效负载可用于限制或防止T细胞耗竭(Long等人,Journal for Immunotherapy of Cancer 2013,1(增刊1):P21；其内容以引用的方式整体并入)。在一个实施方案中，本公开的T细胞可以与糖酵解抑制剂如2-脱氧葡萄糖和雷帕霉素组合使用。

在一些实施方案中，可用于免疫疗法的本公开的可调控转录因子表达构建体可处于T细胞中T细胞受体α基因座恒定区(T cell receptor alpha locus constant，TRAC)基因座的转录控制下。Eyquem等人已经表明，来自TRAC基因座的CAR的表达可防止T细胞耗竭以及由过度T细胞激活引起的T细胞加速分化(Eyquem J.等人(2017)Nature.543(7643):113-117；其内容以引用的方式整体并入本文)。

在一些实施方案中，本公开的有效负载可以包括靶向与T细胞耗竭相关的T细胞表面标记物的抗体或片段。可以用作有效负载的与T细胞耗竭相关的T细胞表面标记物包括但不限于CTLA-1、PD-1、TGIT、LAG-3、2B4、BTLA、TIM3、VISTA和CD96。

在一个实施方案中，本公开的有效负载可以是CD276CAR(具有CD28、4-IBB和CD3ζ细胞内结构域)，它不显示与早期T细胞耗竭相关的标记物的上调(参见国际专利公开号WO2017044699；其内容以引用的方式整体并入)。

细胞

根据本公开，提供了被基因修饰成在本公开的编码的转录因子和DRD配体的调控下表达至少一种感兴趣蛋白质或有效负载的细胞。本公开的细胞可以包括但不限于免疫细胞、干细胞和肿瘤细胞。在一些实施方案中，免疫细胞是效应免疫细胞，包括但不限于T细胞，如CD8+T细胞和CD4+T细胞(例如Th1、Th2、Th17、Foxp3+细胞)、记忆T细胞如T记忆干细胞、中央记忆T细胞和效应记忆T细胞、终末分化的效应T细胞、自然杀伤(NK)细胞、NK T细胞、肿瘤浸润淋巴细胞(TIL)、细胞毒性T淋巴细胞(CTL)、调节性T细胞(Treg)和树突状细胞(DC)、可引发效应功能的其他免疫细胞，或它们的混合物。T细胞可以是Tαβ细胞和Tγδ细胞。在一些实施方案中，干细胞可以来自人胚胎干细胞、间充质干细胞和神经干细胞。在一些实施方案中，T细胞可以是耗尽的内源性T细胞受体(参见美国专利号9,273,283、9,181,527和9,028,812；各案的内容以引用的方式整体并入本文)。

在一些实施方案中，本公开的细胞对于特定个别受试者可以是自体的、同种异体的、同基因的或异种的。

在一些实施方案中，本公开的细胞可以是哺乳动物细胞，尤其是人体细胞。本公开的细胞可以是初代细胞或永生化细胞系。

工程改造的免疫细胞可以通过包括将核酸分子引入细胞的方法来实现，该核酸分子包含：

a.编码转录因子DNA结合结构域和转录因子激活结构域中的至少一者的第一核酸序列；和

b.编码药物反应性结构域(DRD)的第二核酸序列。在一些实施方案中，还可以对细胞进行基因修饰以插入编码感兴趣蛋白质的第三核酸序列，该第三核酸序列可操作地连接至包含转录因子多核苷酸结合位点的诱导型启动子。在一个实施方案中，第三核酸序列与第一核酸序列和第二核酸序列在同一核酸分子上。

或者，第三核酸序列与第一核酸序列和第二核酸序列在不同的核酸分子上。如本文所使用，第一核酸序列和第二核酸序列可以代表在一个载体上的第一多核苷酸和第二多核苷酸或在不同载体中的各个多核苷酸。

载体可以是病毒载体，例如慢病毒载体、γ-逆转录病毒载体、重组AAV、腺病毒载体和溶瘤病毒载体。在其他方面，也可以使用非病毒载体，例如纳米颗粒和脂质体。在一些实施方案中，本公开的免疫细胞被基因修饰成表达至少一种本公开的免疫治疗剂，该免疫治疗剂可使用稳定配体进行调节。在一些实例中，将构建于同一可调控转录因子表达构建体中的两种、三种或更多种免疫治疗剂引入细胞中。在其他实例中，可以将两个、三个或更多个可调控转录因子表达构建体引入细胞中。

在一些实施方案中，本公开的免疫细胞可以是被修饰成表达抗原特异性T细胞受体(TCR)或本文教示的抗原特异性嵌合抗原受体(CAR)的NK细胞。

自然杀伤(NK)细胞是先天性淋巴样细胞家族的成员，在人体中的特征是在没有CD3(T细胞辅助受体)的情况下表达表型标记物CD56(神经细胞粘附分子)。NK细胞是先天免疫系统的强效效应细胞，该细胞介导细胞毒性攻击，无需事先抗原引发，形成了抵御包括癌症恶性病和病毒感染在内的疾病的第一道防线。

若干临床前和临床试验表明，过继转移NK细胞是治疗急性髓性白血病等癌症的一种颇具前景的治疗方法(Ruggeri等人,Science；2002,295:2097-2100；和Geller等人,Immunotherapy,2011,3:1445-1459)。过继转移表达CAR(如基于DAP12的激活CAR)的NK细胞显示出肿瘤细胞根除效果的改善(Topfer等人,J Immunol.2015；194:3201-3212)。工程改造成表达CS-1特异性CAR的NK细胞还在多发性骨髓瘤中展示出增强的细胞溶解和干扰素-γ(IFN-γ)产生(Chu等人,Leukemia,2014,28(4):917-927)。

NK细胞活化的特征在于一系列具有激活和抑制功能的受体。NK细胞上重要的激活受体包括CD94/NKG2C和NKG2D(C型凝集素样受体)，以及天然细胞毒性受体(NCR)NKp30、NKp44和NKp46，它们识别肿瘤细胞或病毒感染的细胞上的配体。NK细胞抑制主要由多态性抑制性杀伤细胞免疫球蛋白样受体(KIR)与其同源的人白细胞抗原(HLA)配体通过HLA分子的α-1螺旋相互作用介导。激活受体和抑制受体产生的信号之间的平衡主要决定了即时细胞毒性激活。

NK细胞可以从外周血单核细胞(PBMC)中分离，或从人胚胎干(ES)细胞和诱导多能干细胞(iPSC)获得。从PBMC中分离的初代NK细胞可以进一步扩增以用于过继免疫疗法。对NK细胞扩增有用的策略和方案可包括白细胞介素2(IL2)刺激和使用自体饲养细胞，或使用基因修饰的同种异体饲养细胞。在一些方面，NK细胞可以用包括IL15、IL21、IL2、41BBL、IL12、IL18、MICA、2B4、LFA-1和BCM1/SLAMF2在内的刺激性配体的组合选择性扩增(例如美国专利公开号US20150190471)。

定义

除非另有定义，否则本文所使用的所有技术术语、表示法和其他科学术语意图具有本发明所属领域的技术人员通常所理解的含义。在一些情况下，为了清楚起见和/或为了便于参考和理解，本文定义了具有通常所理解的含义的术语，并且本文中包括这些定义不一定被解释为意味着与本领域一般所理解的含义存在显著差异。分子生物学术语和/或方法和/或方案的通常所理解的定义可见于Rieger等人,Glossary of Genetics:Classicaland Molecular,第5版,Springer-Verlag:New York,1991；Lewin,Genes V,OxfordUniversity Press:New York,1994；Sambrook等人,Molecular Cloning,A LaboratoryManual(第3版,2001)；以及Ausubel等人,Current Protocols in Molecular Biology(1994)；Sambrook和Russel(2006)Condensed Protocols from Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Laboratory Press,ISBN-10:0879697717；Ausubel等人(2002)Short Protocols in Molecular Biology,第5版,CurrentProtocols,ISBN-10:0471250929。

除非另外说明，否则适当时，涉及使用市售试剂盒和/或试剂的程序一般是根据制造商的指导和/或方案和/或参数来实施。

“亲和力”是指结合的强度：结合亲和力增加与较低的Kd相关。

如本文所使用，术语“过继细胞疗法”或“过继细胞转移”是指涉及将细胞转移到患者体内的细胞疗法，其中细胞可源自患者或来自另一名个体，并且是在转移回患者体内之前经过工程改造(改变)。治疗细胞可以来源于免疫系统，如效应免疫细胞：CD4+T细胞；CD8+T细胞、自然杀伤细胞(NK细胞)；以及B细胞和来自切除的肿瘤的肿瘤浸润淋巴细胞(TIL)。最常见的转移细胞是经历离体扩增或操作后的自体抗肿瘤T细胞。例如，自体外周血淋巴细胞可以通过基因工程改造，通过表达T细胞受体(TCR)或嵌合抗原受体(CAR)来识别特定的肿瘤抗原。

如本文所使用，术语“试剂”是指生物、药物或化学化合物。非限制性实例包括简单或复杂的有机或无机分子、肽、蛋白质、寡核苷酸、抗体、抗体衍生物、抗体片段、受体和可溶性因子。

如本文所使用，术语“激动剂”是指与受体组合可产生细胞反应的化合物。激动剂可以是直接结合受体的配体。或者，激动剂可以与受体间接结合，例如，(a)与直接结合受体的另一分子形成复合物，或(b)以其他方式引起对另一化合物的修饰以使该另一化合物直接结合至受体。激动剂可称为特定受体或受体家族的激动剂，例如共刺激受体的激动剂。

如本文所使用，术语“拮抗剂”是指抑制或降低所结合的靶标的生物活性的任何试剂。

如本文所使用，应用于一个或多个感兴趣值的术语“大约”或“约”是指与规定的参考值相似的值。在某些实施方案中，除非另有说明或另外从上下文中显而易见，否则术语“大约”或“约”是指在任一方向(大于或小于)上在所述参考值的25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或更小范围内的一系列值。

如本文所使用，当用于两个或更多个部分时，术语“与……缔合”、“缀合”、“连接”、“附接”和“系栓”意味着这些部分直接或通过一个或多个充当连接剂的附加部分在物理上彼此缔合或联接，以形成结构，该结构足够稳定，以使得这些部分在使用该结构的条件下，例如在生理条件下保持物理缔合。“缔合”不需要严格地通过直接的共价化学键合实现。它还可能表明离子或氢键合或基于杂交的联接，它们足够稳定以使得“缔合”的实体保持物理缔合。

如本文所使用，术语“自体”是指任何材料所来源的个体与稍后重新引入该材料的个体是同一个体。

“结合”是指大分子之间(例如蛋白质和核酸之间)的序列特异性、非共价相互作用。不是所有的结合相互作用组分都需要为序列特异性的(例如与DNA主链中的磷酸酯残基的接触残基)，只要该相互作用整体是序列特异性的即可。这种相互作用一般以10-6M或更低的解离常数(Kd)为特征。

“结合蛋白”是能够与另一个分子结合的蛋白质。结合结构域可结合例如DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)。就蛋白质结合蛋白来说，它可结合其自身(形成同源二聚体、同源三聚体等)和/或它可结合一个或多个分子的一种或多种不同蛋白质。结合蛋白可以具有多于一种类型的结合活性。例如，锌指蛋白具有DNA结合、RNA结合和蛋白质结合活性。

术语“盒”、“表达盒”和“基因表达盒”是指可以插入核酸或多核苷酸中特定位点(例如限制性位点或通过同源重组)处的DNA区段。所述DNA区段包含编码感兴趣多肽的多核苷酸，并且所述盒和限制性位点被设计成确保该盒插入正确阅读框中进行转录和翻译。盒、表达盒和基因表达盒还可以包含允许增强编码感兴趣多肽的多核苷酸在宿主细胞中的表达的元件。这些元件可以包括但不限于：启动子、最小启动子、增强子、反应元件、终止子序列、聚腺苷酸化序列等。

“切割”是指DNA分子的共价主链的断裂。切割可通过多种方法起始，包括但不限于磷酸二酯键的酶水解或化学水解。单链切割和双链切割都是可能的，并且双链切割可由于两个不同单链切割事件而发生。DNA切割可产生平端或交错端。在某些实施方案中，将融合多肽用于靶向双链DNA切割。

当RNA聚合酶将编码序列转录成mRNA，然后经历RNA剪接(如果编码序列含有内含子)并翻译成编码序列所编码的蛋白质时，编码序列在细胞中处于转录和翻译控制序列“控制下”。

术语“构建体”和“核酸构建体”可互换使用，意思指包含编码肽、多肽或蛋白质中的一者或多者的核酸序列的多核苷酸。“构建体”可以是能够进行基因组整合或自主复制的来源于任何来源的任何重组核酸分子，例如质粒、粘粒、病毒、自主复制的核酸分子、噬菌体或者线性或环状单链或双链DNA或RNA核酸分子。构建体可以包括但不限于来自例如3'-非翻译区(3'UTR)的额外调控核酸元件。构建体可以包括但不限于mRNA核酸分子的5'非翻译区(5'UTR)，它可在翻译起始中起重要作用并且还可以是表达构建体中的遗传组分。这些额外的上游和下游调控核酸元件可以来源于相对于构建体上存在的其他元件而言是天然的或异源的来源。

如本文所使用，术语“细胞因子”是指具有多效性功能的小的可溶性因子家族，这些因子是由可影响和调控免疫系统功能的许多细胞类型产生。

如本文所使用，术语“递送”是指递送化合物、物质、实体、部分、运载物或有效负载的动作或方式。“递送剂”是指至少部分地促进将一种或多种物质(包括但不限于化合物和/或本公开的组合物)递送至细胞、受试者或其他生物系统的任何试剂。

如本文所使用，短语“来源于”是指源自指定亲本分子或其区域或结构域或者指定亲本序列(例如核酸序列或氨基酸序列)并保持与亲本分子或其区域或结构域或者亲本序列的一种或多种结构和/或功能的相似性的多肽或多核苷酸。亲本分子可以是多肽或核酸分子。例如，亲本分子可以是天然蛋白质(包含天然氨基酸序列)或野生型蛋白质，并且可以称为“亲本蛋白质”。作为另一个实例，亲本分子可以是包含天然核酸序列或编码野生型蛋白质的序列的核酸分子。在一些实施方案中，多肽或多核苷酸来源于(i)全长野生型亲本分子或序列；或(ii)全长野生型亲本分子或序列的区域或结构域并分别保留(i)全长野生型亲本分子或序列或者(ii)其区域或结构域的结构和/或功能特征。结构特征包括氨基酸序列、核酸序列或蛋白质结构(例如二级蛋白质结构、三级蛋白质结构和/或四级蛋白质结构)。功能特征包括生物活性，例如催化活性、结合能力和/或亚细胞定位。作为非限制性实例，如果多肽或多核苷酸与亲本核酸序列或氨基酸序列在亲本分子或序列的全长内具有至少约70％同一性，优选至少约75％或80％同一性，更优选至少约85％、86％、87％、88％、89％或90％同一性，并且更优选至少约91％、92％、93％、94％、95％、96％、97％、98％或99％同一性，则该多肽或多核苷酸与亲本分子或序列保持相似性。作为另一个非限制性实例，如果多肽包含与亲本氨基酸序列共有100％同一性的氨基酸区域并且该区域的长度范围是10-1,000个氨基酸(例如大于20、30、40、45、50、55、60、70、80、90、100、120、140、160、180、200、250、300、350、400、450、500、600、700、800和900个氨基酸或至少10、15、20、25、30、35、40、45、50、55、60、70、80、90、100、120、140、160、180，200、250、300、350、400、450、500、600、700、800、900和1,000个氨基酸)，则该多肽与亲本分子或序列保持相似性。作为另一个非限制性实例，如果多肽与亲本氨基酸序列相比包含一个、两个、三个、四个或五个氨基酸突变，则该多肽与亲本分子或氨基酸序列保持相似性。在一些实施方案中，如果与亲本分子或其区域或结构域或者亲本序列相比，多肽或多核苷酸具有基本上相同的生物学活性，则认为该多肽或多核苷酸与亲本分子或其区域或结构域或者亲本序列保持相似性。在一些实施方案中，如果与亲本分子或其区域或结构域或者亲本序列相比，有至少一种生物活性重叠，则认为多肽或多核苷酸与亲本分子或其区域或结构域或者亲本序列保持相似性。在一些实施方案中，如果与亲本分子或其区域或结构域或者亲本序列相比，多肽或多核苷酸的一种或多种生物学活性具有改善或优化，则认为该多肽或多核苷酸与亲本分子或其区域或结构域或者亲本序列保持相似性。例如，DRD可以来源于天然存在的蛋白质的结构域或区域，并以本文教示的任何方式进行修饰以优化DRD功能。在一些实施方案中，生物活性可以出于特定目的而进行优化，例如通过保持或增强某些活性，同时相较于亲本分子，降低或消除另一种活性来进行优化。在一些实施方案中，来源于指定亲本分子或其区域或结构域或者指定亲本序列的DRD是该指定亲本分子或其区域或结构域或者该指定亲本序列的变体。例如，在一些实施方案中，来源于人碳酸酐酶2(hCA2)的DRD是hCA2的变体。

如本文所使用，术语“不稳定”、“去稳定化”、“去稳定化区域”或“去稳定化结构域”是指一个区域或分子不如该区域或分子的起始、参考、野生型或天然形式稳定。

DNA“编码序列”或“编码区”是指这样一种双链DNA序列，该序列编码多肽并且当处于适合调控序列的控制下时可在细胞中、离体、体外或体内转录和翻译成多肽。“适合调控序列”是指位于编码序列上游(5'非编码序列)、内部或下游(3'非编码序列)并且影响相连编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调控序列可以包括启动子、翻译前导序列、内含子、聚腺苷酸化识别序列、RNA加工位点、效应结合位点和茎-环结构。编码序列的边界是由在5'(氨基)末端处的起始密码子和在3'(羧基)末端处的翻译终止密码子决定。编码序列可包括但不限于原核生物序列、由mRNA得到的cDNA、基因组DNA序列以及甚至是合成DNA核酸。如果打算在真核细胞中表达编码序列，则聚腺苷酸化信号和转录终止序列通常位于编码序列的3'端。

术语“下游”是指位于参考核苷酸序列3'端的核苷酸序列。具体而言，下游核苷酸序列一般涉及在转录起始点之后的序列。例如，基因的翻译起始密码子位于转录起始位点的下游。

术语“下游”是指位于参考核苷酸序列5'端的核苷酸序列。具体而言，上游核苷酸序列一般涉及位于编码序列或转录起始点的5'侧的序列。例如，大多数启动子位于转录起始位点的上游。

如本文所使用，当本公开的实施方案被设计为具有相对于起始点、野生型或天然分子变化的特征或性质(无论是结构的还是化学的)时，它们是“工程改造的”。

“外源”分子是通常不存在于细胞中但可以通过一种或多种遗传、生物化学或其他方法引入细胞中的分子。“细胞中正常存在”是根据细胞的特定发育阶段和环境条件确定的。因此，例如，仅在肌肉胚胎发育过程中存在的分子对于成体肌肉细胞而言是外源分子。类似地，由热休克诱导的分子对于非热休克细胞而言是外源分子。外源分子可以包含例如功能失常的内源分子的有功能形式或有正常功能的内源分子的功能失常形式。

此外，外源分子还可以是小分子，如通过组合化学过程产生的小分子；或大分子，如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任何修饰的衍生物，或包含上述分子中的一者或多者的任何复合物。核酸包括DNA和RNA；可以是单链或双链的；可以是线性的、分支的或环形的；并且可以是任意长度。核酸包括能够形成双链体的核酸，以及形成三链体的核酸。参见例如美国专利号5,176,996和5,422,251。蛋白质包括但不限于DNA结合蛋白、转录因子、染色质重塑因子、甲基化DNA结合蛋白、聚合酶、甲基化酶、去甲基化酶、乙酰化酶、去乙酰化酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解旋酶。

外源分子可以是与内源分子相同类型的分子，例如外源蛋白质或核酸。例如，外源核酸可以包含感染病毒基因组、引入细胞中的质粒或游离体，或通常不存在于细胞中的染色体。用于将外源分子引入细胞中的方法是本领域技术人员已知的并且包括但不限于脂质介导的转移(即脂质体，包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、颗粒轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。外源分子也可以是与内源分子相同类型的分子，但来源于与细胞来源不同的物种。例如，可以将人核酸序列引入最初来源于小鼠或仓鼠的细胞系中。

外源核酸序列可以包含例如一个或多个基因或cDNA分子，或任何类型的编码或非编码序列，以及一个或多个控制元件(例如启动子)。此外，外源核酸序列可以产生一个或多个RNA分子(例如小发夹RNA(shRNA)、抑制性RNA(RNAis)、微小RNA(miRNA)等)。

相比之下，“内源性”分子是通常在特定环境条件下存在于处于特定发育阶段的特定细胞中的分子。例如，内源性核酸可以包含染色体、线粒体基因组或其他细胞器，或天然存在的游离核酸。额外的内源分子可以包括蛋白质，例如转录因子和酶。

“游离体”是复制性核酸、核蛋白复合物或包含并非细胞染色体核型的一部分的核酸的其他结构。游离体的实例包括质粒和某些病毒基因组。

“真核”细胞包括但不限于真菌细胞(例如酵母)、植物细胞、动物细胞、哺乳动物细胞和人体细胞(例如T细胞)。

如本文所使用，核酸序列的“表达”是指以下事件中的一者或多者：(1)从DNA序列产生RNA模板(例如通过转录)；(2)RNA转录物的加工(例如通过剪接、编辑、5'帽形成和/或3'端加工)；(3)将RNA翻译成多肽或蛋白质；(4)多肽或蛋白质的折叠；以及(5)多肽或蛋白质的翻译后修饰。

表达载体、表达构建体、质粒或重组DNA构建体一般被理解为是指通过人为干预产生的核酸，包括通过重组手段或直接化学合成产生的核酸，具有一系列允许特定核酸在例如宿主细胞中转录或翻译的指定核酸元件。表达载体可以是质粒、病毒或核酸片段的一部分。典型地，表达载体可以包括可操作地连接至启动子的待转录核酸。

应用于多核苷酸序列的术语“片段”是指长度相对于参考核酸减少并且在共同部分上包含与参考核酸相同的核苷酸序列的核苷酸序列。适当时，根据本发明的此类核酸片段可以包括具有该核酸片段作为组成部分的较大多核苷酸中。此类片段包含长度范围为至少6、8、9、10、12、15、18、20、21、22、23、24、25、30、39、40、42、45、48、50、51、54、57、60、63、66、70、75、78、80、90、100、105、120、135、150、200、300、500、720、900、1000、1500、2000、3000、4000、5000个或更多个根据本发明核酸的连续核苷酸的寡核苷酸，或者由所述寡核苷酸组成。

蛋白质、多肽或核酸的“功能片段”是序列与全长蛋白质、多肽或核酸不同但保留与全长蛋白质、多肽或核酸相同的功能的蛋白质、多肽或核酸。功能片段可以具有多于、少于或等于相应天然分子的数量的残基，和/或可以含有一个或多个氨基酸或核苷酸取代。用于确定核酸功能(例如编码功能、与另一个核酸杂交的能力)的方法是本领域众所周知的。类似地，用于确定蛋白质功能的方法也是众所周知的。例如，多肽的DNA结合功能可以通过例如过滤结合、电泳迁移率变化或免疫沉淀测定来确定。DNA切割可以通过凝胶电泳来测定。参见Ausubel等人，同上。一种蛋白质与另一种蛋白质相互作用的能力可以通过例如免疫共沉淀、双杂交测定或互补，以基因和生物化学方法确定。例如，参见Fields等人(1989)Nature 340:245-246；美国专利号5,585,245和PCT WO 98/44350。

如本文所使用，“功能性”生物分子是具有一定结构和形式的生物实体，其中它展现出作为它的特征的特性和/或活性。

“融合”分子是两个或更多个亚基分子连接，优选地共价连接而的分子。亚基分子可以是相同化学类型的分子或可以是不同化学类型的分子。第一类融合分子的实例包括但不限于融合蛋白，例如DNA结合结构域(例如ZFP、TALE和/或大范围核酸酶DNA结合结构域)与核酸酶(切割)结构域(例如核酸内切酶、大范围核酸酶等)之间的融合物以及融合核酸(例如编码上述融合蛋白的核酸)。第二类融合分子的实例包括但不限于三链体形成核酸与多肽之间的融合物，以及小沟结合物与核酸之间的融合物。

细胞中融合蛋白的表达可以由将融合蛋白递送至细胞或通过将编码融合蛋白的多核苷酸递送至细胞而引起，其中多核苷酸被转录并且转录物被翻译而产生融合蛋白。细胞中蛋白质的表达也可能涉及RNA剪接、多肽切割和多肽连接。用于向细胞递送多核苷酸和多肽的方法在本公开别处呈现。

“基因”是指包含编码功能分子的核苷酸的多核苷酸，该功能分子包括仅通过转录(例如生物活性RNA种类)或通过转录和翻译(例如多肽)产生的功能分子。术语“基因”包括cDNA和基因组DNA核酸。“基因”还指表达特定RNA、蛋白质或多肽的核酸片段，包括在编码序列之前(5'非编码序列)和之后(3'非编码序列)的调控序列。“天然基因”是指在自然界中发现的具有自身调控序列的基因。“嵌合基因”是指作为非天然基因的任何基因，该基因包含在自然界中未一起发现的调控序列和/或编码序列。因此，嵌合基因可包含来源于不同来源的调控序列和编码序列，或来源于相同来源但排列方式不同于自然界中发现的方式的调控序列和编码序列。嵌合基因可以包含来源于不同来源的编码序列和/或来源于不同来源的调控序列。“内源基因”是指在生物体基因组中处于其天然位置的天然基因。“外来”基因或“异源”基因是指通常未见于宿主生物体中但通过基因转移引入宿主生物体中的基因。外源基因可以包含插入非天然生物体中的天然基因，或嵌合基因。“转基因”是已被引入基因组中的基因。例如，白细胞介素12(IL-12)基因编码IL-12蛋白。IL-12是通过二硫键连接形成具有完整功能的IL-12p70的35kD亚基(p35)和40kD亚基(p40)的异二聚体。IL-12基因编码p35和p40亚基。

转录的多核苷酸可以具有编码多肽(例如功能性蛋白质)的序列，当处于适当调控区控制下时，该序列可以翻译成编码的多肽。基因可以包含若干可操作地连接的片段，例如启动子、5'前导序列、编码序列和3'非翻译序列，例如聚腺苷酸化位点，以及调控基因产物的产生的所有DNA区域，不管这些调控序列是否与编码序列和/或转录的序列相邻。因此，基因包括但未必限于启动子序列、终止子、翻译调控序列如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点以及基因座控制区。

“基因表达”是指将基因中包含的信息转化为基因产物。基因产物可以是基因的直接转录产物(例如mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA或任何其他类型的RNA)或由mRNA翻译产生的蛋白质。基因产物还包括通过如加帽、聚腺苷酸化、甲基化和编辑等过程修饰的RNA，以及通过例如甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、肉豆蔻化和糖基化修饰的蛋白质。

嵌合或重组基因是通常不存在于自然界中的基因，如例如启动子在自然界中未与转录的DNA区域部分或全部缔合的基因。“基因的表达”是指基因转录成RNA和/或翻译成功能性蛋白质的过程。

“基因递送”或“基因转移”是指用于将重组或外来DNA引入宿主细胞中的方法。转移的DNA可以保持未整合或优选整合至宿主细胞的基因组中。基因递送可以例如通过使用病毒载体转导或通过使用已知方法如电穿孔、细胞轰击转化或转染细胞来进行。

术语“基因组”包括染色体以及线粒体、叶绿体和病毒DNA或RNA。

如本文所使用，术语“异源DNA序列”、“外源DNA区段”或“异源核酸”各自指源自对于特定宿主细胞而言为外来的来源或如果来自相同来源，则相对于初始形式而经历修饰的序列。因此，宿主细胞中的异源基因包括对于特定宿主细胞而言是内源的但已经通过例如使用DNA改组而进行修饰的基因。该术语还包括天然存在的DNA序列的非天然存在的多个拷贝。因此，这些术语是指这样一种DNA区段，该区段对于细胞而言是外来的或异源的，或与细胞同源但在宿主细胞核酸内通常不存在该元件的位置处。外源DNA片段被表达而产生外源多肽。“异源蛋白”(可与“外源蛋白质”互换使用)或“目的异源蛋白”分别是由异源核酸编码的蛋白质或目的蛋白质。“同源”DNA序列是与引入该序列的宿主细胞天然相关联的DNA序列。

“异源DNA”是指并非天然位于细胞中或细胞染色体位点中的DNA。异源DNA可包括细胞外来基因。

如本文所使用，术语“免疫细胞”是指源自骨髓中的造血干细胞的免疫系统的任何细胞，该细胞产生两个主要谱系，即骨髓祖细胞(该细胞产生骨髓细胞，例如单核细胞、巨噬细胞、树突状细胞、巨核细胞和粒细胞)和淋巴祖细胞(该细胞产生淋巴样细胞，例如T细胞、B细胞和自然杀伤(NK)细胞)。示例性免疫系统细胞包括CD4+T细胞、CD8+T细胞、CD4-CD8-双阴性T细胞、Tγδ细胞、Tαβ细胞、调节性T细胞、自然杀伤细胞和树突状细胞。巨噬细胞和树突状细胞可称为“抗原呈递细胞”或“APC”，它们是特化细胞，当与肽形成复合物的APC表面上的主要组织相容性复合物(MHC)受体与T细胞表面上的TCR相互作用时，它们可以激活T细胞。

如本文所使用，术语“免疫疗法”是指通过诱导或恢复免疫系统对疾病的反应性的一种类型的疾病治疗方法。

如本文所使用，术语“免疫治疗剂”是指可用于免疫疗法的生物、药物或化学化合物。

出于本发明的目的，术语“分离的”是指生物材料(细胞、核酸或蛋白质)已从其原始环境(其天然存在的环境)中移出。例如，在植物或动物中以自然状态存在的多核苷酸不是分离的，但是与天然存在的相邻核酸分离的相同多核苷酸被认为是“分离的”。

基因表达的“调节”是指基因活性的改变。表达的调节可以包括但不限于基因激活和基因抑制。基因组编辑(例如切割、改变、失活、随机突变)可用于调节表达。

如本文所使用，术语“修饰的”是指分子或实体的状态或结构相较于亲本或参考分子或实体有所变化。分子可以通过多种方式进行修饰，包括化学上、结构上和功能上的修饰。在一些实施方案中，通过引入非天然氨基酸对本公开的化合物和/或组合物进行修饰。

如本文所使用，术语“突变”是指变化和/或改变。在一些实施方案中，突变可以是蛋白质(包括肽和多肽)和/或核酸(包括多核苷酸)的变化和/或改变。在一些实施方案中，突变包含蛋白质和/或核酸序列的变化和/或改变。这样的变化和/或改变可包含一个或多个氨基酸(在蛋白质和/或肽的情况下)和/或核苷酸(在核酸和/或聚核酸例如多核苷酸的情况下)的添加、取代和或缺失。在突变包含氨基酸和/或核苷酸的添加和/或取代的一些实施方案中，此类添加和/或取代可以包含1个或多个氨基酸和/或核苷酸残基，并且可包括修饰的氨基酸和/或核苷酸。由此得到的具有突变、变化或改变的构建体、分子或序列在本文中可以称为突变体。

“核酸”、“核酸分子”、“寡核苷酸”、“核苷酸”和“多核苷酸”可互换使用，并且指的是呈单链形式或双链螺旋形式的核糖核苷(腺苷、鸟苷、尿苷或胞苷；“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷；“DNA分子”)的磷酸酯聚合形式或其任何磷酸酯类似物，例如硫代磷酸酯和硫酯。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋都是可能的。术语核酸分子，特别是DNA或RNA分子，仅指分子的一级和二级结构，并不将其局限于任何特定的三级形式。因此，这一术语包括尤其见于线性或环状DNA分子(例如限制性片段)、质粒、超螺旋DNA和染色体中的双链DNA。在讨论特定双链DNA分子的结构时，本文可根据仅给出沿DNA非转录链(即，具有与mRNA同源的序列的链)5'至3'方向的序列的标准惯例来描述序列。“重组DNA分子”是经过分子生物学操作的DNA分子。DNA包括但不限于cDNA、基因组DNA、质粒DNA、合成DNA和半合成DNA。

如本文所使用，短语“可操作地连接”是指两个或更多个分子、构建体、转录物、实体、部分等之间的功能性联接。

当提到核酸序列和多核苷酸时，“可操作地连接”或“功能性连接”是指核酸序列的缔合使得一个核酸序列的功能受另一个影响，而核酸序列不一定要彼此相邻或连续，但它们之间可具有插入序列。例如，如果调控性DNA序列与编码RNA或多肽的DNA序列的位置使得调控性DNA序列影响该编码DNA序列的表达(即，编码序列或功能性RNA处于启动子的转录控制下)，则称该调控性DNA序列与该编码RNA或多肽的DNA序列“可操作地连接”或“缔合”。编码序列可以按有义或反义取向可操作地连接至调控序列。转录调控序列一般以顺式方式与编码序列可操作地连接，而不必与其直接相邻。例如，增强子是可操作地连接至编码序列的一个转录调控序列，即使它们不相邻也如此，或者如果启动子调控或介导感兴趣基因在细胞中的转录，则启动子可操作地连接至该感兴趣基因。

例如，如果EF-1启动子或增强子序列刺激或调节编码序列在适当宿主细胞或其他表达系统中的转录，则它可操作地连接至该编码序列。一般来说，可操作地连接至转录的序列的启动子转录调控序列与转录的序列物理上连续，即，它们是顺式作用的。然而，一些转录调控序列，例如增强子，不需要在物理上是连续的或紧密邻近它们增强转录的编码序列。

在两个或更多个多肽或其结构域之间缔合产生融合多肽时，术语“可操作地连接”意味着融合蛋白中一个多肽的状态或功能受该融合蛋白中另一个多肽的影响。例如，对于包含DRD和转录因子或其结构域的融合蛋白，如果DRD在配体存在下变稳定使得转录因子或其结构域稳定，而DRD在无配体存在下不稳定使得转录因子或其结构域不稳定，则该DRD与该转录因子或其结构域是可操作地连接。对于DNA结合结构域与激活结构域融合的融合多肽，如果在融合多肽中DNA结合结构域部分能够结合至其特定结合位点，并由此使激活结构域能够上调基因表达，则该DNA结合结构域与该激活结构域是可操作地连接。

术语“多肽”、“肽”和“蛋白质”可互换使用，意思指氨基酸残基的聚合物。该术语也适用于氨基酸聚合物，其中一个或多个氨基酸是相应天然存在的氨基酸的化学类似物或经过修饰的衍生物。如本文所使用，该术语是指任何大小、结构或功能的蛋白质、多肽和肽。在一些情况下，多肽小于约50个氨基酸，则该多肽可以称为“肽”。多肽包括基因产物、天然存在的多肽、合成多肽、同源物、直系同源物、旁系同源物、前述的片段和其他等效物、变体和类似物。多肽可以是单分子或可以是多分子复合物，例如二聚体、三聚体或四聚体。它们还可以包含单链或多链多肽并且可以是缔合的或连接的。这些术语还包括多肽的表达后修饰，例如糖基化、唾液酸化、乙酰化、磷酸化等。

术语“质粒”是指通常携带不属于宿主细胞染色体一部分的基因的遗传元件，并且通常呈环状双链DNA分子的形式。此类元件可以是来源于任何来源的单链或双链DNA或RNA的呈线性、环状或超螺旋的自主复制序列、基因组整合序列、噬菌体或核苷酸序列。质粒可包含已接合或重组成独特构造的许多核苷酸序列，该构造能够将选定基因产物的启动子片段和DNA序列以及适当的3'非翻译序列引入细胞中。本文所公开的起始质粒是可商购的，可在不受限制的基础上公开获得的，或者可以通过常规应用众所周知的公开程序从可获得的质粒构建。可以根据本发明使用的许多质粒以及其他克隆和表达载体是本领域技术人员众所周知并且容易获得的。此外，本领域技术人员可以容易地构建任何数量的适用于本发明的其他质粒。本发明中此类质粒以及其他载体的特性、构建和用途对于本领域技术人员来说将是显而易见的。

“启动子”和“启动子序列”可互换使用，并且是指能够控制编码序列或功能性RNA的表达的DNA序列。一般来说，编码序列位于启动子序列的3'端。启动子可以全部来源于天然基因，或由来源于自然界中发现的不同启动子的不同元件构成，或甚至包含合成的DNA区段。本领域技术人员应理解，不同的启动子可以引导基因在不同组织或细胞类型中，或在不同发育阶段，或响应于不同环境或生理条件进行表达。如本文所使用，启动子包括在转录起始位点附近的必需核酸序列，例如在II型聚合酶启动子的情况下的TATA元件。启动子还任选地包括远端增强子或阻遏子元件，所述元件可距转录起始位点多达数千碱基对。

大多数时候，使基因在大多数细胞类型中表达的启动子通常被称为“组成型启动子”。使基因在特定细胞类型中表达的启动子通常称为“细胞特异性启动子”或“组织特异性启动子”。使基因在特定发育或细胞分化阶段表达的启动子通常称为“发育特异性启动子”或“细胞分化特异性启动子”。在使细胞暴露于诱导启动子的试剂、生物分子、化学物质、配体、光等或用这些处理细胞后被诱导并引起基因表达的启动子通常被称为“诱导型启动子”或“可调控的启动子”。另外，应认识到，由于在大多数情况下调控序列的确切边界尚未完全界定，故不同长度的DNA片段可能具有相同的启动子活性。启动子序列典型地在其3'末端处通过转录起始位点定界并向上游(5'方向)延伸以包括起始高于背景的可检测水平的转录所需的最小数目的碱基或元件。在启动子序列内将发现转录起始位点(宜例如通过用核酸酶S1定位来界定)以及负责RNA聚合酶结合的蛋白质结合结构域(共同序列)。

基因的启动子区包括典型地位于结构基因的5'端的转录调控元件。如果要激活基因，则称为转录因子的蛋白质会连接至该基因的启动子区。通过使酶能够将第二个遗传区段从DNA转录为RNA，这一组装类似于“开启开关(on switch)”。在大多数情况下，所得到的RNA分子可充当合成特定蛋白质的模板；有时RNA本身就是最终产物。启动子区可以是正常细胞启动子或癌启动子。

作为疾病特异性启动子的一个实例，用于治疗癌症的有用启动子包括癌基因的启动子，包括用于治疗贫血的启动子。癌基因类别的实例包括但不限于生长因子、生长因子受体、蛋白激酶、程序性细胞死亡调控因子和转录因子。

本领域已知且可在本发明中用作治疗开关启动子的启动子序列和其他调控元件(例如增强子)的实例公开于2012年3月2日申请的美国专利9,402,919，序列号14/001,943中。

术语“有效负载”是指功能或量有待改变的任何蛋白质或多肽或化合物。在本公开的上下文中，有效负载可以是由转录活性受本公开的转录因子调控的核酸序列编码的多肽。转录因子与相应的特定多核苷酸结合位点的结合使得编码的多肽能够转录，然后，转录的核酸分子(转录物)可以被翻译和表达，由此引起有效负载的表达。有效负载可以是蛋白质、融合蛋白或非编码基因的产物，或其变体和片段。当基于氨基酸时，有效负载可以称为“感兴趣蛋白质”。

如本文所使用，术语“药学上可接受的赋形剂”是指存在于药物组合物中的除活性剂(例如本文所描述)之外的任何成分，该成分在受试者体内具有基本上无毒和非炎症特性。在一些实施方案中，药学上可接受的赋形剂是能够悬浮和/或溶解活性剂的媒剂。赋形剂可以包括例如：抗粘附剂、抗氧化剂、粘合剂、包衣剂、压缩助剂、崩解剂、染料(颜料)、润肤剂、乳化剂、填充剂(稀释剂)、成膜剂或包衣剂、调味剂、香料、助流剂(流动增强剂)、润滑剂、防腐剂、印刷油墨、吸附剂、悬浮剂或分散剂、甜味剂和水合水。示例性赋形剂包括但不限于：丁基化羟基甲苯(BHT)、碳酸钙、磷酸钙(二碱式)、硬脂酸钙、交联羧甲基纤维素、交联聚乙烯吡咯烷酮、柠檬酸、交联聚维酮、半胱氨酸、乙基纤维素、明胶、羟丙基纤维素、羟丙基甲基纤维素、乳糖、硬脂酸镁、麦芽糖醇、甘露糖醇、甲硫氨酸、甲基纤维素、对羟基苯甲酸甲酯、微晶纤维素、聚乙二醇、聚乙烯吡咯烷酮、聚维酮、预胶化淀粉、对羟基苯甲酸丙酯、棕榈酸视黄酯、虫胶、二氧化硅、羧甲基纤维素钠、柠檬酸钠、乙醇酸淀粉钠、山梨糖醇、淀粉(玉米淀粉)、硬脂酸、蔗糖、滑石、二氧化钛、维生素A、维生素E、维生素C和木糖醇。

本文所描述的化合物的“药学上可接受的盐”是所公开化合物的形式，其中酸或碱部分呈其盐形式(例如通过使游离碱性基团与适合的有机酸反应而产生)。药学上可接受的盐的实例包括但不限于碱性残基如胺的无机酸盐或有机酸盐；酸性残基如羧酸的碱金属盐或有机盐等等。适合酸加成盐的实例包括乙酸盐、己二酸盐、海藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯甲酸盐、硫酸氢盐、硼酸盐、丁酸盐、樟脑酸盐、樟脑磺酸盐、柠檬酸盐、环戊烷丙酸盐、二葡糖酸盐、十二烷基硫酸盐、乙烷磺酸盐、反丁烯二酸盐、葡糖庚酸盐、甘油磷酸盐、半硫酸盐、庚酸盐、己酸盐、氢溴酸盐、盐酸盐、氢碘酸盐、2-羟基乙烷磺酸盐、乳糖酸盐、乳酸盐、月桂酸盐、月桂基硫酸盐、苹果酸盐、顺丁烯二酸盐、丙二酸盐、甲烷磺酸盐、2-萘磺酸盐、烟酸盐、硝酸盐、油酸盐、草酸盐、棕榈酸盐、双羟萘酸盐、果胶酸盐、过硫酸盐、3-苯基丙酸酯、磷酸盐、苦味酸盐、特戊酸盐、丙酸盐、硬脂酸盐、琥珀酸盐、硫酸盐、酒石酸盐、硫氰酸盐、甲苯磺酸盐、十一烷酸盐、戊酸盐等。代表性碱金属或碱土金属盐包括钠盐、锂盐、钾盐、钙盐、镁盐等，以及无毒铵、季铵和胺阳离子，包括但不限于铵、四甲基铵、四乙基铵、甲胺、二甲胺、三甲胺、三乙胺、乙胺等。药学上可接受的盐包括常规的无毒盐，例如来自无毒无机或有机酸的盐。在一些实施方案中，药学上可接受的盐是由含有碱性或酸性部分的母体化合物通过常规化学方法制备。一般来说，此类盐可通过将这些化合物的游离酸或碱形式与化学计算量的适当碱或酸在水中或有机溶剂中或者二者的混合物中反应来制备；一般地，非水性介质，如乙醚、乙酸乙酯、乙醇、异丙醇或乙腈是优选的。适合的盐的清单见于Remington’s Pharmaceutical Sciences,第17版,Mack Publishing Company,Easton,Pa.,1985,第1418页,Pharmaceutical Salts:Properties,Selection,and Use,P.H.Stahl和C.G.Wermuth(编),Wiley-VCH,2008；以及Berge等人,Journal ofPharmaceutical Science,66,1-19(1977)，其各自以引用的方式整体并入本文。药学上可接受的溶剂化物：如本文所使用，术语“药学上可接受的溶剂化物”是指化合物的结晶形式，其中适合溶剂的分子被并入晶格中。例如，溶剂化物可通过从包括有机溶剂、水或其混合物的溶液结晶、重结晶或沉淀来制备。适合的溶剂的实例是乙醇、水(例如一水合物、二水合物和三水合物)、N-甲基吡咯烷酮(NMP)、二甲亚砜(DMSO)、N,N'-二甲基甲酰胺(DMF)、N,N'-二甲基乙酰胺(DMAC)、1,3-二甲基-2-咪唑烷酮(DMEU)、1,3-二甲基-3,4,5,6-四氢-2-(1H)-嘧啶酮(DMPU)、乙腈(ACN)、丙二醇、乙酸乙酯、苯甲醇、2-吡咯烷酮、苯甲酸苯甲酯等。当水是溶剂时，溶剂化物称为“水合物”。在一些实施方案中，并入溶剂化物中的溶剂的类型或水平对于施用该溶剂化物的生物体应当是生理上可耐受的(例如在药物组合物的单位剂型中)。

术语“重组”具有本领域常用的含义，并且是指在体外合成或以其他方式操作的多核苷酸(例如“重组多核苷酸”)；使用重组多核苷酸在细胞或其他生物系统中产生基因产物的方法；或由重组多核苷酸编码的多肽(“重组蛋白”)。当用于细胞时，该术语指示细胞复制异源核酸，或表达由异源核酸编码的肽或蛋白质。重组细胞可以含有在细胞的天然(非重组)形式中未发现的基因。重组细胞还可以含有在细胞的天然形式中发现的基因，其中所述基因经过修饰并通过人工手段重新引入细胞中。该术语还涵盖含有细胞内源性核酸的细胞，该核酸已经过修饰，但未从该细胞中去除该核酸；此类修饰包括通过基因置换、位点特异性突变和相关技术获得的修饰。

“重组表达盒”或简称“表达盒”是重组或合成产生的核酸构建体，该构建体具有能够影响结构基因表达的控制元件，该结构基因可操作地连接至宿主中与此类序列相容的控制元件。表达盒至少包括启动子和任选的转录终止信号。典型地，重组表达盒至少包括待转录的核酸和启动子。在实现表达中需要或有帮助的额外因子也可以如本文所描述来使用。例如，转录终止信号、增强子和影响基因表达的其他核酸序列也可以包括在表达盒中。

“重组”是指在两个多核苷酸之间交换遗传信息的过程，包括但不限于通过非同源末端接合(NHEJ)和同源重组进行的供体捕获。出于本公开的目的，“同源重组(HR)”是指此类交换的特殊形式，该交换是例如在通过同源引导的修复机制修复细胞中的双链断裂期间发生。这一过程需要核苷酸序列同源性，使用“供体”分子作为“靶标”分子(即，经历双链断裂的分子)修复的模板，并且由于它引起遗传信息从供体向靶标转移，故不同地称为“非交换型基因转换(short tract gene conversion)”或“短道基因转换(short tract geneconversion)”。不希望受任何特定理论的束缚，这种转移可以涉及对在断裂的靶标与供体之间形成的异源双链DNA进行的错配校正，和/或“合成依赖性链退火”，在此情形中，使用供体重新合成遗传信息，该遗传信息将成为靶标的一部分，和/或相关过程。这种特化的HR通常会引起靶标分子序列的改变，使得供体多核苷酸的部分或全部序列并入靶标多核苷酸中。在一些实施方案中，“同源重组”是指将外来DNA序列插入另一个DNA分子中，例如将载体插入染色体中。优选地，载体靶向用于进行同源重组的特定染色体位点。对于特定同源重组，载体将含有足够长的与染色体序列同源的区域，以允许载体互补结合以及染色体中载体的并入。较长的同源区和较大程度的序列相似性可以增加同源重组的效率。

术语“报告基因”是指编码鉴别因子的核酸，该鉴别因子能够基于报告基因的作用进行鉴别，其中该作用被用于追踪感兴趣核酸的遗传；鉴别遗传了该感兴趣核酸的细胞或生物体；和/或测量基因表达诱导或转录。本领域已知和使用的报告基因的实例包括：荧光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(LacZ)、β-葡糖醛酸酶(Gus)等。选择性标记物基因也可以被认为是报告基因。

术语“反应元件”是指通过与转录因子的DNA结合结构域相互作用介导而赋予对启动子的反应性的一个或多个顺式作用DNA元件。在一些实施方案中，反应元件提供RNA聚合酶和转录因子的结合位点。这一DNA元件可以是回文(完全或不完全)序列，或由不同数量的核苷酸隔开的序列基序或半位点构成。半位点可以相似或相同，并且排列成直接或反向重复序列形式或者单个半位点或相邻半位点串联的多聚体形式。取决于并入反应元件的细胞或生物体的性质，反应元件可包含从不同生物体分离的最小启动子。转录因子的DNA结合结构域结合至反应元件的DNA序列，在该反应元件的调控下起始或抑制下游基因的转录。

当用于核酸分子时，术语“序列”是指任何长度的核苷酸序列，该核苷酸序列可以是DNA或RNA序列；可以是线性的、环状的或分支的，并且可以是单链或双链的。

术语“选择性标记物”是指一种鉴别因子，通常是抗生素或化学抗性基因，它能够基于标记物基因的作用进行选择，即，对抗生素的抗性、对除草剂的抗性、比色标记物、酶、荧光标记物等，其中该作用被用于追踪感兴趣核酸的遗传和/或鉴别遗传了该感兴趣核酸的细胞或生物体。本领域已知和使用的选择性标记物基因的实例包括：提供对氨苄青霉素(ampicillin)、链霉素(streptomycin)、庆大霉素(gentamycin)、卡那霉素(kanamycin)、潮霉素(hygromycin)、双丙氨磷除草剂(bialaphos herbicide)、磺胺(sulfonamide)等的抗性的基因；以及用作表型标记物的基因，即花青素调控基因、异戊基转移酶基因等。

如本文所使用，术语“稳定化”、“稳定化的”、“稳定化区域”是指使多肽或其区域变得稳定或保持稳定。在一些实施方案中，稳定性是相对于绝对值测量的。例如，可以将包含与其配体结合的DRD的多肽的稳定性与野生型多肽的稳定性相比较。在一些实施方案中，稳定性是相对于同一多肽的不同状态或状况测量的。例如，可以将包含与其配体结合的DRD的多肽的稳定性与包含DRD且不存在其配体的多肽的稳定性相比较。

如本文所使用，术语“标准CAR”是指嵌合抗原受体的标准设计。将CAR融合蛋白的组分线性构建为单一融合蛋白形式，所述组分包括细胞外scFv片段、跨膜结构域和一个或多个细胞内结构域。

术语“受试者”与“患者”可互换使用，并且是指哺乳动物，如人类患者和非人灵长类动物，以及实验动物，如兔、狗、猫、大鼠、小鼠和其他动物。因此，如本文所使用，术语“受试者”或“患者”意思指可被施用本公开的核酸、多核苷酸、有效负载、组合物、载体或细胞的任何患者或受试者(例如哺乳动物)。

“T细胞”是一种产生T细胞受体(TCR)的免疫细胞。T细胞可以是初始T细胞(未暴露于抗原；与TCM相比，CD62L、CCR7、CD28、CD3、CD127和CD45RA的表达增加，而CD45RO的表达降低)、记忆T细胞(TM)(经历抗原刺激并且长期存活的)和效应细胞(经历抗原刺激，有细胞毒性)。TM可进一步分为中央记忆T细胞亚群(TCM；相较于初始T细胞，CD62L、CCR7、CD28、CD127、CD45RO和CD95表达增加，并且CD54RA表达减少)和效应记忆T细胞(TEM，与初始T细胞或TCM相比，CD62L、CCR7、CD28、CD45RA的表达降低，并且CD127的表达增加)。效应T细胞(TE)是指经历过抗原刺激的CD8+细胞毒性T淋巴细胞，与TCM相比，所述细胞具有降低的CD62L、CCR7、CD28表达，并且对颗粒酶和穿孔素呈阳性。其他示例性T细胞包括调节性T细胞，例如CD4+CD25+(Foxp3+)调节性T细胞和Treg17细胞，以及Tr1、Th3、CD8+CD28-和Qa-1限制性T细胞。

T细胞受体(TCR)是指具有可变抗原结合结构域、恒定结构域、跨膜区和短胞质尾的免疫球蛋白超家族成员，它能够特异性结合至与MHC受体结合的抗原肽。TCR可以见于细胞表面上或以可溶形式存在，并且一般包含具有α和β链(又分别称为TCRα和TCRβ)或γ和δ链(又分别称为TCRγ和TCRδ)的异二聚体。TCR链(例如α链、β链)的细胞外部分含有两个免疫球蛋白结构域，一个是位于N末端的可变结构域(例如α链可变结构域或Vα；β链可变结构域或Vβ)，并且一个是与细胞膜相邻的恒定结构域(例如α链恒定结构域或Cα，以及β-链恒定结构域或Cβ)。与免疫球蛋白类似，可变结构域含有由框架区(FR)隔开的互补决定区(CDR)。TCR通常与CD3复合物缔合形成TCR复合物。如本文所使用，术语“TCR复合物”是指由CD3与TCR缔合形成的复合物。例如，TCR复合物可以由CD3γ链、CD3δ链、两条CD3ε链、CD3ζ链的同源二聚体、TCRα链和TCRβ链构成。或者，TCR复合物可以由CD3γ链、CD3δ链、两条CD3ε链、CD3ζ链的同源二聚体、TCRγ链和TCRδ链构成。如本文所使用，“TCR复合物的组分”是指TCR链(即，TCRα、TCRβ、TCRγ或TCRδ)、CD3链(即，CD3γ、CD3δ、CD3ε或CD3ζ)，或由两个或更多个TCR链或CD3链形成的复合物(例如TCRα和TCRβ的复合物、TCRγ和TCRδ的复合物、CD3ε和CD3δ的复合物、CD3γ和CD3ε的复合物，或TCRα、TCRβ、CD3γ、CD3δ和两条CD3ε链的亚TCR复合物)。

如本文所使用，术语“治疗有效量”是指当施用给罹患或易患感染、疾病、病症和/或疾患的受试者时足以治疗该感染、疾病、病症和/或疾患；改善其症状；对其进行诊断；和/或延迟其发作的拟递送的试剂(例如核酸、药物、治疗剂、诊断剂、预防剂等)的量。在一些实施方案中，治疗有效量是以单次剂量提供。在一些实施方案中，治疗有效量是以包含多次剂量的剂量方案施用。本领域技术人员应了解，在一些实施方案中，如果单位剂型包含当作为此类剂量方案的一部分施用时有效的量，则可以认为单位剂型包含治疗有效量的特定试剂或实体。

如本文所使用，术语“治疗(treatment/treating)”表示用于获得有益或期望的结果的方法，所述结果包括并且优选是有益或期望的临床结果。此类有益或期望的临床结果包括但不限于以下中的一者或多者：减少(或破坏)癌细胞或其他患病细胞的增殖；减少癌症中发现的癌细胞的转移；缩小肿瘤的大小；减轻疾病引起的症状；提高患病者的生活质量；减小治疗该疾病所需的其他药物的剂量；延迟疾病的进展；和/或延长个体的存活期。

如本文所使用，术语“调节”表示响应于刺激物或针对特定结果调整、平衡或调适一件事。在一个非限制性实例中，本公开的DRD响应于特定刺激物和/或环境而调整、平衡或调适它们所附加、连接或缔合的组合物的功能或结构。

“TALE DNA结合结构域”或“TALE”是包含一个或多个TALE重复结构域/单元的多肽。重复结构域参与TALE与其同源靶标DNA序列的结合。单个“重复单元”(又称为“重复序列”)典型地是33-35个氨基酸长，并且与天然存在的TALE蛋白质内的其他TALE重复序列展现出至少一定序列同源性。

“靶标位点”或“靶标序列”是限定在存在充分的结合条件时结合分子将结合的核酸的一部分的核酸序列。“预定”靶标位点是DNA结合分子被设计和/或选择结合的靶标位点。

“转录”是指涉及RNA聚合酶与基因相互作用的过程，该过程指导基因编码序列中存在的结构信息表达为RNA。该过程包括但不限于以下步骤：(1)转录起始、(2)转录物伸长、(3)转录物剪接、(4)转录物加帽、(5)转录物终止、(6)转录物聚腺苷酸化、(7)转录物的核输出、(8)转录物编辑以及(9)稳定转录物。

转录调控元件或序列包括但不限于启动子序列(例如TATA盒)、增强子元件、信号序列或转录因子结合位点阵列。它控制或调控与其可操作地连接的基因的转录。

“转录起始位点”或“起始位点”是作为转录序列一部分的在第一个核苷酸附近的位置，也被定义为位置+1。基因的所有其他序列及其控制区都可以相对于这一位点编号。下游序列(即，在3'方向的其他蛋白质编码序列)可以命名为正链序列，而上游序列(主要是在5'方向的控制区)命名为负链序列。

“转基因”是指已被引入宿主细胞中的基因。转基因可包含细胞天然的序列、非天然存在于细胞中的序列或其组合。转基因可以含有编码一种或多种蛋白质的序列，这些蛋白质可以可操作地连接至适当的调控序列以在细胞中表达编码序列。

“转导”是指将核酸分子递送至受体宿主细胞中，例如通过基因递送载体，例如慢病毒载体或rAAV递送。例如，rAAV病毒粒子对靶标细胞的转导使得包含在该病毒粒子中的rAAV载体转移至被转导的细胞中。“宿主细胞”或“靶标细胞”是指发生核酸递送的细胞。

“转化的”、“转基因的”和“重组”是指引入了异源核酸分子的宿主细胞或生物体，例如细菌、蓝细菌、动物或植物。如本领域一般了解的和公开的(Sambrook 1989；Innis1995；Gelfand 1995；Innis和Gelfand 1999)，核酸分子可以稳定地整合至基因组中。

术语“转染”是指外源或异源核酸被细胞吸收。当核酸被引入细胞内时，细胞已被这些核酸“转染”。转化核酸可以整合(共价连接)至构成细胞基因组的染色体DNA中。

“转录和翻译控制序列”是指实现编码序列在宿主细胞中的表达的核酸调控序列，例如启动子、增强子、终止子等。在真核细胞中，聚腺苷酸化信号是控制序列。

如本文所使用，术语“变体”在用于多肽时是指氨基酸序列与天然或参考序列不同的分子。与天然或参考序列相比，氨基酸序列变体可在氨基酸序列内的某些位置处具有取代、插入、添加、缺失和/或共价修饰。如本文所使用，“缺失”还包括在多肽N末端或C末端处截短。通常，变体将与天然或参考序列具有至少约50％同一性(同源性)，并且优选地，它们将与天然或参考序列具有至少约80％、更优选地至少约90％同一性(同源性)。如本文所使用，在提到序列时术语“天然”或“起始”或“参考”是相对术语，指可供比较的原始分子。不应将天然或起始或参考序列与野生型序列混淆。天然序列或分子可以代表野生型(自然界中发现的序列)的，但不必与野生型序列相同。

“载体”是指用于将核酸克隆和/或转移到宿主细胞中的任何媒剂。这种核酸可以被称为“携带”在载体中或由载体“携带”。载体可以是复制子，另一个DNA片段可以连接至该复制子上以引起所连接的区段的复制。“复制子”是指作为体内DNA复制的自主单元发挥作用，即，能够在其自身控制下复制的任何遗传元件(例如质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括用于在体外、离体或体内将核酸引入细胞中的病毒和非病毒媒剂。本领域已知的大量载体可用于操作核酸、将反应元件和启动子并入基因等。可能的载体包括例如质粒或修饰的病毒，包括例如噬菌体，如λ衍生物；或质粒，如pBR322或pUC质粒衍生物；或Bluescript载体。例如，将对应于反应元件和启动子的DNA片段插入到适合的载体中可以通过将适当DNA片段连接至具有互补粘性末端的选定载体来实现。或者，可以对DNA分子的末端进行酶促修饰，或者可以通过将核苷酸序列(接头)连接至DNA末端来产生任何位点。此类载体可以被工程改造成含有选择性标记物基因，这些基因可用于选择已将标记物并入细胞基因组中的细胞。此类标记物允许鉴别和/或选择并入并表达该标记物所编码的蛋白质的宿主细胞。常见的载体包括质粒、病毒基因组和(主要在酵母和细菌中)“人工染色体”。“表达载体”是这样一类载体，这些载体包含提供或促进被克隆到载体中的核酸的转录的元件。此类元件可以包括例如与感兴趣核酸可操作地偶联的启动子和/或增强子。包含的载体

“克隆载体”是指“复制子”，它是单位长度的核酸，优选是DNA，它依序复制并且包含复制起点，例如质粒、噬菌体或粘粒，另一个核酸区段可与其相连以便实现所连接的区段的复制。克隆载体能够在一种细胞类型中复制并在另一种细胞类型中表达(“穿梭载体”)。克隆载体可以包含一个或多个可以用于选择包含该载体的细胞的序列和/或一个或多个供插入感兴趣序列的多克隆位点。

术语“表达载体”是指设计成能够表达插入的核酸序列的载体、质粒或媒剂。克隆的基因，即插入的核酸序列，通常处于如启动子、最小启动子、增强子等控制元件的控制下。可用于驱动核酸在所希望的宿主细胞中表达的起始控制区或启动子有很多并且是本领域技术人员熟知的。几乎任何能够驱动这些基因表达的启动子都可以用于表达载体中，包括但不限于病毒启动子、细菌启动子、动物启动子、哺乳动物启动子、合成启动子、组成型启动子、组织特异性启动子、致病或疾病相关启动子、发育特异性启动子、诱导型启动子、光调控的启动子；CYC1、HIS3、GAL1、GAL4、GAL10、ADH1、PGK、PHO5、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TP1、碱性磷酸酶启动子(可用于在酵母中表达)；AOX1启动子(可用于在毕赤酵母中表达)；β-内酰胺酶、lac、ara、tet、trp、lPL、lPR、T7、tac和trc启动子(可用于在大肠杆菌中表达)；光调控、种子特异性、花粉特异性、卵巢特异性、花椰菜花叶病毒35S、CMV 35S最小、木薯脉花叶病毒(CsVMV)、叶绿素a/b结合蛋白、核酮糖1,5-二磷酸羧化酶、芽特异性、根特异性、几丁质酶、胁迫诱导型、水稻东格鲁杆状病毒(rice tungro bacilliform virus)、植物超级启动子、马铃薯亮氨酸氨基肽酶、硝酸还原酶、甘露碱合酶、胭脂碱合酶、泛素、玉米醇溶蛋白和花青素启动子(可用于在植物细胞中表达)；本领域已知的动物和哺乳动物启动子，包括但不限于SV40早期(SV40e)启动子区、包含在劳斯肉瘤病毒(RSV)的3'长末端重复序列(LTR)中的启动子、腺病毒(Ad)的E1A或主要晚期启动子(MLP)基因的启动子、巨细胞病毒(CMV)早期启动子、单纯疱疹病毒(HSV)胸苷激酶(TK)启动子、杆状病毒1E1启动子、延伸因子1α(EF1)启动子、磷酸甘油酸激酶(PGK)启动子、泛素(Ubc)启动子、白蛋白启动子、小鼠金属硫蛋白-L启动子和转录控制区的调控序列、普遍存在的启动子(HPRT、波形蛋白、α-肌动蛋白、微管蛋白等)、中间丝(结蛋白、神经丝、角蛋白、GFAP等)的启动子、治疗性基因(MDR、CFTR或因子VIII型等)的启动子、致病或疾病相关启动子以及展现出组织特异性并已在转基因动物中应用的启动子，如在胰腺腺泡细胞中具有活性的弹性蛋白酶I基因控制区；在胰腺β细胞中具有活性的胰岛素基因控制区、在淋巴样细胞中具有活性的免疫球蛋白基因控制区、在睾丸、乳房、淋巴样细胞和肥大细胞中具有活性的小鼠乳腺肿瘤病毒控制区；在肝脏中具有活性的白蛋白基因、Apo AI和Apo AII控制区；在肝脏中具有活性的甲胎蛋白基因控制区；在肝脏中具有活性的α1-抗胰蛋白酶基因控制区；在骨髓细胞中具有活性的β-珠蛋白基因控制区；在脑中少突胶质细胞中具有活性的髓鞘碱性蛋白基因控制区；在骨骼肌中具有活性的肌球蛋白轻链-2基因控制区；以及在下丘脑中具有活性的促性腺激素释放激素基因控制区；丙酮酸激酶启动子、绒毛蛋白启动子、脂肪酸结合肠蛋白质的启动子、平滑肌细胞α-肌动蛋白的启动子等。此外，这些表达序列还可以通过添加增强子或调控序列等进行修饰。

载体可以通过本领域已知的方法引入所希望的宿主细胞中，例如转染、电穿孔、显微注射、转导、细胞融合、DEAF葡聚糖、磷酸钙沉淀、脂转染(溶酶体融合)、使用基因枪或DNA载体转运蛋白(参见例如Wu等人,J.Biol.Chem.267:963(1992)；Wu等人,J.Biol.Chem.263:14621(1988)；以及Hartmut的人,加拿大专利申请号2,012,311)。

病毒载体，特别是慢病毒和逆转录病毒载体，已被用于在细胞以及活体动物受试者中进行的多种基因递送应用。可以使用的病毒载体包括但不限于逆转录病毒、腺相关病毒、痘病毒、杆状病毒、牛痘、单纯疱疹病毒、爱泼斯坦-巴尔病毒、腺病毒、双粒病毒和花椰菜病毒载体。非病毒载体包括质粒、脂质体、带电脂质(细胞转染素)、DNA-蛋白质复合物和生物聚合物。除核酸外，载体还可包含一个或多个调控区，和/或可用于选择、测量和监测核酸转移结果(转移到哪些组织、表达持续时间等)的选择性标记物。

本领域已知的若干方法可用于繁殖根据本发明的多核苷酸。一旦建立了适合的宿主系统和生长条件，就可以大量繁殖和制备重组表达载体。如本文所描述，可以使用的表达载体包括但不限于以下载体或其衍生物：人或动物病毒，例如慢病毒、牛痘病毒或AAV，或腺病毒；昆虫病毒，如杆状病毒；酵母载体；噬菌体载体(例如λ)，以及质粒和粘粒DNA载体等等。本发明的载体也可以通过任何施用途径施用给受试者，包括但不限于肌肉内施用。

根据本公开的多核苷酸也可以通过脂转染在体内引入。越来越多地使用脂质体在体外囊封和转染核酸。设计用于限制脂质体介导的转染所遇到的困难和危险的合成阳离子脂质可用于制备用于在体内转染基因的脂质体。阳离子脂质的使用可以促进带负电荷的核酸的囊封，而且还可以促进与带负电荷的细胞膜的融合。特别适用于转移核酸的脂质化合物和组合物描述于WO95/18863、WO96/17823和美国专利号5,459,127中。使用脂转染将外源基因引入体内特定器官具有一定的实际优势。脂质体对特定细胞的分子靶向代表了一个有益的领域。很明显，在具有细胞异质性的组织，例如胰腺、肝脏、肾脏和脑中，将特别优选针对特定细胞类型的定向转染。出于靶向的目的，脂质可以与其他分子化学偶联。靶向肽(例如激素或神经递质)和蛋白质(例如抗体)或非肽分子可以与脂质体化学偶联。

其他分子也可用于促进核酸的体内转染，例如阳离子寡肽(例如WO95/21931)、来源于DNA结合蛋白的肽(例如WO96/25508)或阳离子聚合物(例如WO95/21931)。

还可在体内引入呈裸DNA质粒形式的载体(参见美国专利号5,693,622、5,589,466和5,580,859)。也可以使用受体介导的DNA递送方法。

此外，包含根据本发明的多核苷酸的重组载体可以包括一个或多个在试图进行扩增或表达的细胞宿主中的复制起点、标记物或选择性标记物。

“野生型”是指在自然界中发现的没有任何已知突变的核酸序列、核酸分子、氨基酸序列、多肽、病毒或生物体。该术语还可用于描述野生型核酸序列、核酸分子、氨基酸序列、多肽、病毒或生物体的特性。

实施例

实施例1：转录因子系统的设计和测试

本实施例提供了用于设计、制备和评价本公开所教示的转录因子系统的方法。

转录因子系统的设计：如上文所述，转录因子系统是一种模块化系统，因为转录因子系统的多核苷酸或核酸构建体可以包含呈不同布置的核酸序列，和/或可以独特地组合作为转录因子系统的一部分，只要所得到的多核苷酸或核酸构建体的组合包含(1)一个或多个编码转录因子的核酸序列，该转录因子能够结合至特定多核苷酸结合位点并激活转录；(2)编码药物反应性结构域(DRD)的核酸序列，其中该转录因子可操作地连接至DRD；以及(3)编码有效负载并且可操作地连接至包含特定多核苷酸结合位点的诱导型启动子的核酸序列。

本实施例展示了一种用于设计说明性转录因子系统的方法。本实施例的转录因子系统是由核酸构建体编码的，该核酸构建体包含：(i)编码转录因子DNA结合结构域、转录因子激活结构域和药物反应性结构域(DRD)的第一核酸构建体；以及(2)编码有效负载的第二核酸构建体，其中该有效负载的表达由包含转录因子DNA结合结构域的结合位点的诱导型启动子驱动(图1A至图1B)。如图1A中所示，启动子驱动转录因子DNA结合结构域、转录因子激活结构域和DRD的表达。本实施例的转录因子DNA结合结构域和转录因子激活结构域表达为转录因子融合蛋白的形式，其中该融合蛋白可操作地连接至DRD(DRD-TF)。转录因子融合蛋白的水平可以通过DRD配体调控。此外，受调控的转录因子融合蛋白可以通过配体依赖性方式诱导有效负载的表达。如上文所论述以及在随后的实施例中进一步举例说明，这一设计方案的可行变化包括：改变构建体组分的定位；包括额外的核酸序列作为构建体的一部分(例如接头序列、调控元件、聚腺苷酸化序列和核糖体跳跃元件)；以及设计编码转录因子系统的单一核酸构建体。

本实施例的转录因子系统的每种组分都可以独立地选择。例如，转录因子DNA结合结构域可以选自工程改造的锌指结合蛋白、工程改造的TAL效应子或者其他天然或工程改造的DNA结合结构域。转录因子激活结构域可以选自p65、VP64、p300、SAM、VPR的激活结构域或其他激活结构域。驱动转录因子DNA结合结构域、转录因子激活结构域和DRD的表达的启动子可以选自组成型启动子、组织特异性启动子、细胞特异性启动子、细胞分化特异性启动子和/或疾病特异性启动子。任选地，驱动转录因子DNA结合结构域、转录因子激活结构域和DRD的表达的启动子可以选自EF1a、CMV、EFS、RSV、SFFV、PGK、CAG和SV40。有效负载可以选自任何感兴趣蛋白质，例如细胞内蛋白质、膜结合蛋白质或分泌蛋白。任选地，有效负载可以是治疗性蛋白质。有效负载的非限制性实例包括：细胞因子(例如IL2、IL12或IL15)、抗体、凝血因子、酶(例如Cas9、ZFN或Cre)、基因编辑蛋白、T细胞受体(TCR)和嵌合抗原受体(CAR)。可操作地连接至编码有效负载的核酸序列的诱导型启动子可以通过从能够形成用于核酸转录的起始复合物的已知调控序列中选择来设计。这种与转录因子系统的特定多核苷酸结合位点偶联的调控序列可用于设计本文所描述的转录因子系统的诱导型启动子。例如，Ede,C.等人描述了本领域中已知的可用于设计本公开的转录因子系统的启动子(Ede,C.等人,ACS SynthBiol.2016年5月20日；5(5):395-404)。

对于本实施例的说明性转录因子系统，选择的转录因子DNA结合结构域应对应于诱导型启动子，该启动子包含结合结构域的结合位点并驱动有效负载的表达。本实施例的DNA结合结构域可以包含或来源于DNA结合蛋白的DNA结合结构域，其对应的特定多核苷酸结合位点是已知的或可以确定的。本领域已知的DNA结合蛋白的DNA结合结构域与其对应多核苷酸结合位点的配对可用于本实施例的核酸构建体中。例如，说明性转录因子系统的核酸构建体可以包含由Khalil A.S.等人提供的锌指阵列。或者，核酸构建体可包含由Zhang,F.等人提供的TAL效应子重复区。此外，用于设计转录因子的DNA结合结构域与其对应的多核苷酸结合位点的相互作用对的方法对于本领域技术人员来说是可用的。例如，鉴别结合蛋白-DNA识别位点对的方法包括寡聚池工程改造方法和噬菌体展示方法，以及在KhalilA.S.等人、Pabo,C.O.等人和Zhang,F.等人(Khalil A.S.等人,Cell 2012,150,647-658；Pabo,C.O.等人,Annu.Rev.Biochem.2001,70:313-40)中所论述的其他方法。

转录因子系统的制备：如本文所示，转录因子系统可以通过将编码该系统的核酸构建体引入细胞中来制备。这些构建体可以被引入一个或多个核酸分子上并且可以瞬时表达或稳定整合。对于瞬时表达，将细胞用如实施例2中所述制备的转移载体转染。对于稳定整合，根据实施例2中所描述的方法制备和选择稳定整合有构建体的转导后的细胞系。待转导的细胞系可以选自包括但不限于以下细胞：U2OS、Jurkat、HEK293T或其他细胞系细胞。

评价转录因子系统：如上文例如在“转录因子系统的配体依赖性活性的表征”部分中所描述，可以使用各种方法来评价转录因子系统。本实施例提供了评价通过稳定整合以上论述的构建体所制备的转录因子系统的方法。这些方法也可用于评价通过瞬时表达转录因子系统所制备的转录因子系统。

待评价的细胞可以包括未转导的(亲本)细胞和用慢病毒转导的细胞，所述慢病毒由以下构建体制成：(1)DRD-TF构建体，例如图1A中所示；(2)有效负载构建体，如图1B中所示；以及(3)由DRD-TF构建体制成的慢病毒和由有效负载构建体制成的慢病毒两者。将各细胞系用含有配体或DMSO的培养基处理。将细胞培育约24-48小时，收集并分析。分析技术可包括流式细胞术和免疫测定，例如免疫印迹分析、ELISA或电化学发光方法，如Meso ScaleDiscovery平台的方法。例如，由DRD-TF构建体编码的转录因子多肽的配体依赖性调控可以通过免疫印迹分析，利用针对转录因子多肽的DNA结合结构域和/或转录激活结构域的抗体进行评价。还可以通过免疫印迹分析，使用针对有效负载的抗体来评价有效负载。流式细胞术也可用于评价有效负载水平，例如使用识别有效负载的标记的抗体。ELISA和Meso ScaleDiscovery等分析技术可用于评价分泌的有效负载的水平。

预计与用DMSO条件处理的细胞相比，配体处理的细胞将具有增加的由DRD-TF构建体编码的转录因子多肽的水平以及增加的有效负载水平。这些结果将证实，转录因子融合蛋白的水平可以用DRD配体调控，并且被调控的转录因子融合蛋白可以通过配体依赖性方式诱导有效负载的表达。

本实施例展示了在设计本公开的转录因子系统的模块性以及制备和评价这些系统的方法。如本文所示，可以采用各种构建体工程改造方案来设计转录因子系统。另外的工程改造方案在本公开别处有描述。

实施例2：构建体组装、病毒制造和细胞系产生

使用以下材料和方法制备在本公开的实施例中使用的构建体、病毒和细胞系。

克隆方法：表1中列出的构建体由Gibson assembly，利用NEBuilder HiFi DNA组装预混液(New England BioLabs,Inc.,Ipswich,MA)制备。用于组装的DNA片段是购买并从头合成或从先前制造的构建体经PCR复制的。将表1中的所有构建体引入转移载体主链中。使用的转移载体包括pELDS-puro(其序列提供于本文中，图18和SEQ ID NO:68)。pELDS-blast、pELDS-Thy1.2和pELDS-Thy1.1转移载体是通过将pELDS-puro载体中的嘌呤霉素抗性基因分别交换为杀稻瘟素抗性(pLenti6.3,Thermo Fisher Scientific,Waltham,MA)；Thy1.2cDNA(Origene,Rockville,MD)；或Thy1.1cDNA(Origene,Rockville,MD)而产生的。表5显示了用于指定构建体的转移载体。

表5：转移载体

构建体	转移载体
		ZFHD-004	pELDS-blast
ZFHD-005	pELDS-blast
		ZFHD-007	pELDS-puro
ZFHD-008	pELDS-blast
		ZFHD-009	pELDS-blast
ZFHD-012	pELDS-puro
		ZFHD-013	pELDS-puro
ZFHD-017	pELDS-puro
		ZFHD-018	pELDS-puro
ZFHD-019	pELDS-blast
		ZFHD-022	pELDS-Thy1.2
ZFHD-036	pELDS-Thy1.2
		ZFHD-048	pELDS-Thy1.1
ZFHD-010	pELDS-puro
		ZFHD-059	pELDS-Thy1.1
ZFHD-060	pELDS-Thy1.1
		ZFHD-054	pELDS-Thy1.1
ZFHD-055	pELDS-Thy1.1

将组装的质粒转化到大肠杆菌(NEB稳定感受态大肠杆菌(Stable CompetentE.coli)；New England BioLabs,Inc.,Ipswich,MA)中进行扩增，并在进行病毒生产之前确认序列。

慢病毒制造：将HEK293T细胞接种于涂有胶原蛋白的组织培养板上，并维持在生长培养基(补充有5％FBS和1％青霉素-链霉素的DMEM)中直至70％汇合。在转染之前，将培养基更换为SFM4Transfx-293培养基。将细胞用如上所述制备的转移载体以及包装质粒(pRSV.REV、pMDLg/p.RRE和pMD2.G)，在Opti-MEM培养基(Thermo Fisher Scientific,Waltham,MA)中使用Lipofectamine 3000转染试剂(Thermo Fisher Scientific,Waltham,MA)转染。转染后6-8小时，将培养基更换为新鲜的SFM4Transfx-293培养基。转染后24小时，收集含有病毒的上清液，添加新鲜培养基，并在转染后48小时再次收集上清液。过滤病毒上清液以去除碎片，并通过在20％蔗糖梯度中超速离心进行浓缩。将病毒再悬浮于Opti-MEM中，等分试样并在-80℃储存。

稳定细胞系的产生：用由相应构建体制成的慢病毒转导细胞。将转导后的U2OS细胞通过与2μg/mL嘌呤霉素(如果表达有效负载构建体或单一载体构建体)或与10μg/mL杀稻瘟菌素(如果表达转录因子构建体)一起培养2周来进行选择。将转导后的ARPE-19细胞通过与2μg/mL嘌呤霉素(如果表达有效负载构建体或单一载体构建体)或与20μg/mL杀稻瘟菌素(如果表达转录因子构建体)一起培养2周来进行选择。将用由包含有效负载构建体的转移载体制成的慢病毒和由包含转录因子构建体的转移载体制成的慢病毒两者转导的细胞置于组合选择下。取决于转导用的慢病毒，在针对Thy1.1和/或Thy1.2染色后，通过荧光激活细胞分选(FACS)分离转导的Jurkat细胞。

实施例3：转录因子的配体依赖性调控

本实施例展示了使用不同药物反应性结构域(DRD)和配体进行的转录因子调控。在本实施例中，转录因子是由编码转录因子DNA结合结构域、转录因子激活结构域和药物反应性结构域(DRD)的核酸构建体编码(图1A)。本实施例的转录因子DNA结合结构域和转录因子激活结构域被表达为转录因子融合蛋白形式，其中该融合蛋白可操作地连接至来源于ecDHFR、CA2、hDHFR或ER亲本蛋白质的DRD。如此处所示，转录因子融合蛋白的水平可以用配体进行调控。

细胞系：本实施例分析了未转染的(亲本)HEK293T细胞和用以下构建体的质粒DNA转染的HEK293T细胞：(1)ZFHD-059、(2)ZFHD-060、(3)ZFHD-054、(4)ZFHD-048或(5)ZFHD-055。将细胞在补充有10％FBS的DMEM培养基中培养并如下进行转染：将HEK293T细胞接种于组织培养板上并维持在生长培养基(补充有10％FBS和1％青霉素-链霉素的DMEM)中直至70-80％汇合。用如上所述制备的转移载体，在Opti-MEM培养基(Thermo FisherScientific,Waltham,MA)中使用Lipofectamine 3000转染试剂(Thermo FisherScientific,Waltham,MA)转染细胞。转染后24小时，将培养基更换为含有10μM TMP、1μM巴多昔芬、100μM乙酰唑胺、50μM甲氧苄氨嘧啶或0.1％DMSO的生长培养基。24小时后，收集细胞用于免疫印迹测定。表6中提供了质粒和相应配体处理条件的描述。表6中的“OT-”标记表示提及包含指定构建体的质粒(例如ZFHD-059、ZFHD-060等)。表6的描述中显示的组分包括在本实施例中基于用于转染细胞的质粒的组分选择，以及转移载体主链(pELDS)的名称。在表6的“描述”一栏中，术语“ZFHD1”是指ZFDH1DNA结合结构域，并且术语“p65”是指p65激活结构域。

表6.质粒描述和配体处理条件

配体处理：对各细胞系进行平板接种，并使细胞贴壁生长过夜。去除培养基并添加1mL具有适当配体或0.1％DMSO的培养基(表6)。将细胞培育24小时并用0.25％胰蛋白酶从板中取出进行收集。使收集的细胞沉淀，去除培养基，并将细胞沉淀物在-20℃储存，以待稍后的免疫印迹测定。

免疫印迹测定：将细胞沉淀物再悬浮于含有蛋白酶抑制剂的溶解缓冲液(T-PER^TM组织蛋白萃取试剂；Thermo Fisher Scientific,Waltham,MA)中。将细胞溶解产物添加至含有β-巯基乙醇或还原试剂(Thermo Fisher Scientific,Waltham,MA)的NuPAGE LDS样品缓冲液(Thermo Fisher Scientific,Waltham,MA)中，并在300rpm搅动下，在96℃培育6分钟。将样品用含BOLT抗氧化剂的BOLT MES SDS电泳缓冲液(Thermo Fisher Scientific,Waltham,MA)上样至NuPAGE4-12％Bis-Tris凝胶上。将蛋白质转印至硝酸纤维素膜上并用以下抗体探测：兔抗NFκB-p65抗体(1:1000；Cell Signaling Technology,Danvers,MA)和小鼠抗β肌动蛋白抗体(1:2000；Cell Signaling Technology,Danvers,MA)。二次抗体是

680RD驴抗小鼠(1:4000；LI-COR,Lincoln,NE)或

800CW驴抗兔(1:3000；LI-COR)。

结果：对于用DRD-TF构建体转染的HEK293T细胞进行的免疫印迹分析显示，相较于DMSO处理的细胞，由转录因子构建体ZFHD-059、ZFHD-060、ZFHD-054和ZFHD-048编码的转录因子和DRD多肽在配体处理的细胞中以较高水平存在(图2A-图2B)。这一数据表明，可操作地连接至DRD的转录因子的蛋白质水平可以用DRD的配体调控。

实施例4：包含ecDHFR DRD调控的转录因子的转录因子系统的配体依赖性活性

本实施例展示了转录因子系统的配体依赖性活性。在本实施例中，转录因子系统是由核酸构建体编码，该核酸构建体包含：(1)编码转录因子DNA结合结构域、转录因子激活结构域和药物反应性结构域(DRD)的第一核酸构建体；以及(2)编码有效负载的第二核酸构建体，其中该有效负载的表达由包含转录因子DNA结合结构域的结合位点的诱导型启动子驱动(图3A-图3B)。本实施例的转录因子DNA结合结构域和转录因子激活结构域被表达为转录因子融合蛋白形式，其中该融合蛋白连接至来源于ecDHFR亲本蛋白质的DRD。如此处所示，转录因子融合蛋白的水平可以用ecDHFR配体进行调控。此外，受调控的转录因子融合蛋白可以通过配体依赖性方式诱导有效负载的表达。

细胞系：本实施例分析了未转导的(亲本)U2OS细胞和用由以下构建体制成的慢病毒转导的U2OS细胞：(1)ZFHD-005、(2)ZFHD-007、(3)由构建体ZFHD-005制成的慢病毒和由构建体ZFHD-007制成的慢病毒两者，或(4)由构建体ZFHD-004制成的慢病毒和由构建体ZFHD-007制成的慢病毒两者。根据实施例2中描述的方法制备和选择稳定整合有构建体的转导后的细胞系。将细胞在补充有10％FBS的McCoy's 5A培养基中培养。

配体处理：将各细胞系以25,000个细胞/孔的密度平板接种于24孔板的6-8个孔中并使其贴壁生长过夜。去除培养基，并将1mL含有10μM甲氧苄氨嘧啶(TMP)的培养基添加至各细胞系的一半孔中。剩余的孔接受1mL含0.1％DMSO的培养基。将细胞培育48小时并用0.25％胰蛋白酶从板中取出进行收集。将各处理条件的一个孔通过流式细胞术分析。对于剩余的样品，使收集的细胞沉淀，去除培养基，并将细胞沉淀物在-20℃储存以待稍后进行免疫印迹分析。

流式细胞术：将收集的细胞用PBS洗涤一次，使其再悬浮于PBS中并通过流式细胞术分析。

免疫印迹测定：将细胞沉淀物再悬浮于含有蛋白酶抑制剂的溶解缓冲液(T-PER^TM组织蛋白萃取试剂；Thermo Fisher Scientific, Waltham,MA)中。将细胞溶解产物添加至含有β-巯基乙醇的NuPAGE LDS样品缓冲液(Thermo Fisher Scientific,Waltham,MA)中，并在300rpm搅动下，在96℃培育6分钟。将样品用含BOLT抗氧化剂的BOLT MES SDS电泳缓冲液(Thermo Fisher Scientific,Waltham,MA)上样至NuPAGE 4-12％Bis-Tris凝胶上。将蛋白质转印至硝酸纤维素膜上并用以下抗体探测：兔抗NFκB-p65抗体(1:1000；CellSignaling Technology,Danvers,MA)和小鼠抗β肌动蛋白抗体(1:2000；Cell SignalingTechnology,Danvers,MA)。二次抗体是

680RD驴抗小鼠(1:4000；LI-COR,Lincoln,NE)或

800CW驴抗兔(1:3000；LI-COR)。

结果：对于稳定整合有构建体ZFHD-005和ZFHD-007的U2OS细胞进行的免疫印迹分析显示，相较于DMSO处理的细胞，由转录因子构建体ZFHD-005编码的转录因子和DRD多肽在TMP处理的细胞中以较高水平存在(图3D)。这一数据表明，可操作地连接至DRD的转录因子的蛋白质水平可以用DRD的配体调控。比较起来，稳定整合有组成型转录因子构建体(ZFHD-004，如图3C中所描绘)的U2OS细胞显示，当细胞用DMSO或TMP处理时，检测到由构建体ZFHD-004编码的转录因子多肽。

关于稳定整合有构建体ZFHD-005和ZFHD-007的U2OS细胞的流式细胞术分析表明，利用GFP中值荧光强度(MFI)所测量，与DMSO处理的细胞相比，在TMP处理的细胞中的有效负载表达量较高(图3E)。这一数据表明DRD调控的转录因子可以通过配体依赖性方式诱导有效负载的表达。

实施例5：包含ecDHFR DRD调控的转录因子的转录因子系统的配体依赖性活性

本实施例展示了转录因子系统响应于配体的剂量反应行为。本实施例的转录因子系统在以上实施例4中进行了描述。如本实施例所示，可操作地连接至DRD的转录因子的蛋白质水平可以响应于DRD的配体而以剂量依赖性方式调控。此外，由可操作地连接至包含转录因子结合位点的诱导型启动子的核酸序列编码的有效负载的表达也取决于配体的剂量。

细胞系：本实施例分析了未转导的(亲本)U2OS细胞以及用由构建体ZFHD-005制成的慢病毒和由构建体ZFHD-007制成的慢病毒两者转导的U2OS细胞。根据以上实施例2中描述的方法制备和选择稳定整合有构建体的转导后的细胞系。将细胞在补充有10％FBS的McCoy's 5A培养基中培养。

配体处理：将细胞以25,000个细胞/孔的密度平板接种于24孔板中。使平板接种的细胞贴壁生长过夜。

为了制备获得10点剂量反应曲线的培养基，将含有10μM甲氧苄氨嘧啶(TMP)的培养基在普通培养基中以1:3进行8次连续稀释。对于剂量反应曲线的第10个点，制备含0.1％DMSO的培养基。

从板中取出培养基并更换为DMSO培养基或含有TMP的培养基。一半的亲本U2OS孔接受含有10μM TMP的替代培养基。另一半亲本U2OS孔接受含有0.1％DMSO的替代培养基。稳定整合有构建体ZFHD-005和ZFHD-007的U2OS细胞接受含有0.1％DMSO或各剂量TMP的替代培养基(每种条件2-3个孔)。将处理过的细胞培育48小时。用0.25％胰蛋白酶从板中取出细胞并收集。对于免疫印迹样品分析，将收集的细胞沉淀，去除培养基，并将细胞在-20℃储存，直至进行蛋白质印迹的程序，如上文实施例4中所述。对于流式细胞术样品分析，将收集的细胞用PBS洗涤一次，再悬浮于PBS中并通过流式细胞术进行分析。

结果：较高浓度的TMP产生较高水平的转录因子融合蛋白(图4A-图4B)。这一数据表明，TMP以剂量依赖性方式调控可操作地连接至ecDHFR DRD的转录因子的蛋白质水平。

通过GFP MFI所评估，较高浓度的TMP引起较高水平的有效负载表达(图4C)。有效负载反应的EC₅₀与转录因子反应的EC₅₀相似。这一数据表明，ecDHFR DRD调控的转录因子可以响应于不同剂量的TMP而以剂量依赖性方式驱动有效负载的表达。

实施例6：包含ecDHFR DRD调控的转录因子的转录因子系统在T细胞中的配体依赖性活性

本实施例展示了转录因子系统在T细胞中的配体依赖性活性。本实施例的转录因子系统的组分在以上实施例4中进行了描述。

T细胞转导和配体处理：第0天，将冷冻的人T细胞解冻并使其再悬浮于完全T细胞培养基(补充有Glutamax、10％FBS、1％青霉素-链霉素、NEAA(1％来自100X储备液)、HEPES(1％来自100X储备液)、丙酮酸钠(1％来自100X储备液)和巯基乙醇(1X来自1000X储备液)的RPMI)中。对细胞进行洗涤，计数并平板接种于24孔板中(每孔500μL，密度为1×10^6个细胞/毫升)。将Dynabeads(T-expander CD3/CD28)用无菌PBS或培养基洗涤并以1.5×10^6个珠粒/孔添加。将细胞培育过夜。

第1天，将病毒(OTLV-ZFHD-007、OTLV-ZFHD-005、OTLV-EGFP-001或OTLV-ZFHD-005和OTLV-ZFHD-007)添加至激活的T细胞中。如本文所使用，“OTLV-”标记是指由包含指定构建体(例如ZFHD-007和ZFHD-005)的质粒制造的慢病毒。第2天，每孔添加1mL新鲜的完全T细胞培养基。第3天，用配体处理T细胞如下：将每个转导的T细胞各8个孔平板接种(每孔75μL)于96孔平底板中，并将75μL含20μM TMP的培养基添加至一半孔中，并将含等效DMSO的培养基添加至另一半孔中。第5天，如上文实施例4中所述，收集各转导/处理各一个孔，短暂离心，去除上清液并在-20℃储存，直至用于蛋白质印迹的程序。对剩余样品短暂离心并去除上清液。将样品用细胞染色缓冲液(Biolegend,San Diego,CA)洗涤一次，并在4℃下在50μL于细胞染色缓冲液中的1:1000可固定活力染料(Thermo Fisher Scientific,Waltham,MA)中染色20分钟。将样品用细胞染色缓冲液洗涤两次，并将细胞再悬浮于200μL固定缓冲液(Biolegend,San Diego,CA)中并在4℃下储存过夜。第6天，对细胞进行短暂离心并使其再悬浮于含1％QSol^TM缓冲液(Intellicyt Corporation,Albuquerque,NM)的细胞染色缓冲液中，并通过流式细胞术进行分析。

结果：免疫印迹分析表明，与用DMSO处理的相同细胞相比，由转录因子构建体ZFHD-005编码的转录因子和DRD多肽在用OTLV-ZFHD-005病毒转导并用TMP处理的T细胞中以较高水平存在(图5A)。这一数据表明，可操作地连接至DRD的转录因子在T细胞中的蛋白质水平可以用DRD的配体调控。

流式细胞术分析表明，根据GFP MFI测量，在用OTLV-ZFHD-005和OTLV-ZFHD-007病毒转导并用TMP处理的T细胞中的有效负载表达量相较于用DMSO处理的相同细胞增加了大约1.6倍(图5B)。这一数据表明，DRD调控的转录因子可以通过配体依赖性方式诱导T细胞中有效负载的表达。

这些结果表明，本公开所描述的转录因子系统可以调控T细胞中有效负载的表达。观察到的有效负载表达量的低倍数变化可能是因为细胞没有100％转导，也没有针对任何转导标记物进行分选。

实施例7：包含CA2 DRD调控的转录因子的转录因子系统在ARPE-19细胞中的配体依赖性活性

本实施例展示了转录因子系统在ARPE-19细胞中的配体依赖性活性。在本实施例中，转录因子系统是由核酸构建体编码的，该核酸构建体包含：(1)编码转录因子DNA结合结构域、转录因子激活结构域和药物反应性结构域(DRD)的第一核酸构建体；以及(2)编码有效负载的第二核酸构建体，其中该有效负载的表达由包含转录因子DNA结合结构域的结合位点的诱导型启动子驱动(图3B和图6A)。本实施例的转录因子DNA结合结构域和转录因子激活结构域被表达为转录因子融合蛋白形式，其中该融合蛋白连接至来源于CA2亲本蛋白质的DRD。如此处所示，转录因子融合蛋白的水平可以用CA2配体进行调控。此外，受调控的转录因子融合蛋白可以通过配体依赖性方式诱导有效负载的表达。

细胞系：本实施例分析了未转导的(亲本)ARPE-19细胞和用慢病毒转导的ARPE-19细胞，所述慢病毒是由以下构建体制成：(1)ZFHD-007、(2)ZFHD-019以及(3)由构建体ZFHD-007制成的慢病毒和由构建体ZFHD-019制成的慢病毒两者。根据实施例2中描述的方法制备和选择稳定整合有构建体的转导后的细胞系。将细胞在补充有10％FBS的DMEM-F12培养基中培养。

配体处理：将各细胞系以15,000个细胞/孔的密度平板接种于24孔板的6-8个孔中。使细胞贴壁生长过夜。次日，将各细胞类型的一半孔中的培养基更换为1mL含10μM乙酰唑胺(ACZ)的培养基，并将剩余孔中的培养基更换为1mL含0.1％DMSO的培养基。培育48小时后，将细胞用0.25％胰蛋白酶从板中取出并收集起来。对于免疫印迹测定，使收集的细胞沉淀，去除培养基，并将细胞沉淀物在-20℃储存，直至进行蛋白质印迹的程序，如上文实施例4中所述。对于流式细胞术，将样品用细胞染色缓冲液(Biolegend,San Diego,CA)洗涤一次，使其再悬浮于含1％QSol^TM缓冲液(Intellicyt Corporation,Albuquerque,NM)的细胞染色缓冲液中，并通过流式细胞术进行分析。

结果：关于稳定整合有构建体ZFHD-019和ZFHD-007的ARPE-19细胞的免疫印迹分析显示，使用ACZ处理的由转录因子构建体ZFHD-019编码的转录因子和DRD多肽的水平相较于DMSO处理有大约13.5倍增加(图6B-图6C)。这一数据表明，可操作地连接至CA2 DRD的转录因子在ARPE-19细胞中的蛋白质水平可以用CA2配体调控。

流式细胞术分析表明，通过GFP MFI所测量，在稳定整合有构建体ZFHD-019和ZFHD-007的ARPE-19细胞中，在ACZ处理情况下有效负载的表达量相较于DMSO处理有约1.9倍增加(图6D)。这一数据表明，CA2 DRD调控的转录因子可以通过配体依赖性方式诱导ARPE-19细胞中有效负载的表达。

这些结果表明，具有含CA2 DRD的转录因子构建体的转录因子系统可以调控ARPE-19细胞中有效负载的表达。

实施例8：包含CA2 DRD调控的转录因子的转录因子系统在ARPE-19细胞中的剂量依赖性活性

本实施例展示了包含CA2 DRD调控的转录因子的转录因子系统的配体剂量反应行为，并分析了转录因子的蛋白质水平。本实施例的转录因子系统在以上实施例7中进行了描述。如本实施例所示，转录因子的蛋白质水平可以通过配体剂量依赖性方式调控。

细胞系：本实施例分析了未转导的(亲本)ARPE-19细胞以及用由构建体ZFHD-007制成的慢病毒和由构建体ZFHD-019制成的慢病毒两者转导的ARPE-19细胞。根据实施例2中描述的方法制备和选择稳定整合有构建体的转导后的细胞系。将细胞在补充有10％FBS的DMEM-F12培养基中培养。

配体处理：将细胞以15,000个细胞/孔的密度平板接种于24孔板中。使细胞贴壁生长过夜。

为了制备获得10点剂量反应曲线的培养基，将含有10μM乙酰唑胺(ACZ)的培养基在普通培养基中以1:3进行8次连续稀释。对于剂量反应曲线的第10个点，制备含0.1％DMSO的培养基。

从板中取出培养基并更换为DMSO培养基或含有ACZ的培养基。一半的亲本ARPE-19孔接受含有10μM ACZ的替代培养基。另一半亲本ARPE-19孔接受含有0.1％DMSO的替代培养基。转导后的ARPE-19细胞接受含有0.1％DMSO或各剂量ACZ的替代培养基(每种条件2-3个孔)。将处理过的细胞培育48小时。用0.25％胰蛋白酶从板中取出细胞并收集。对于免疫印迹样品分析，使收集的细胞沉淀，去除培养基，并将细胞在-20℃储存，直至进行蛋白质印迹的程序，如以上实施例4中所述。

结果：较高浓度的ACZ产生较高水平的转录因子融合蛋白(图7A-图7B)。这一数据表明，ACZ以剂量依赖性方式调控可操作地连接至CA2 DRD的转录因子的蛋白质水平。

实施例9：包含CA2 DRD调控的转录因子的转录因子系统在U2OS细胞中的剂量依赖性活性

本实施例展示了包含CA2 DRD调控的转录因子的转录因子系统的配体剂量反应行为，并分析了有效负载的表达情况。本实施例的转录因子系统在以上实施例7中进行了描述。如本实施例所示，有效负载的表达可以通过配体剂量依赖性方式进行调控。

细胞系：本实施例分析了用由构建体ZFHD-019制成的慢病毒和由构建体ZFHD-007制成的慢病毒两者转导的U2OS细胞。根据实施例2中描述的方法制备和选择稳定整合有构建体的转导后的细胞，其中添加足够的病毒以转导>30％的细胞。将细胞在补充有10％FBS的McCoy's 5A培养基中培养。

从板中取出培养基并更换为含有0.1％DMSO或各剂量ACZ的替代培养基(每种条件2-3个孔)。将处理过的细胞培育48小时。用0.25％胰蛋白酶从板中取出细胞并收集。将细胞用PBS洗涤一次，再悬浮于PBS中并通过流式细胞术分析。

结果：通过MFI所评估，较高浓度的ACZ产生较高水平的有效负载(图8)。有效负载反应的EC50是1.1μM。这一数据表明，CA2 DRD调控的转录因子可以响应于不同剂量的ACZ而以剂量依赖性方式驱动有效负载的表达。

实施例10：包含CA2 DRD调控的转录因子的转录因子系统在Jurkat细胞中的配体依赖性活性

本实施例展示了转录因子系统在Jurkat细胞中的配体依赖性活性。在本实施例中，转录因子系统是由核酸构建体编码的，该核酸构建体包含：(1)编码转录因子DNA结合结构域、转录因子激活结构域和药物反应性结构域(DRD)的第一核酸构建体；以及(2)编码有效负载的第二核酸构建体，其中该有效负载的表达由包含转录因子DNA结合结构域的结合位点的诱导型启动子驱动(图9A-图9B)。本实施例的转录因子DNA结合结构域和转录因子激活结构域被表达为转录因子融合蛋白形式，其中该融合蛋白可操作地连接至来源于CA2亲本蛋白质的DRD。如此处所示，受调控的转录因子融合蛋白可以通过配体依赖性方式诱导有效负载的表达。

细胞系：本实施例分析了用由构建体ZFHD-022制成的慢病毒和由构建体ZFHD-048制成的慢病毒两者转导的Jurkat细胞。根据实施例2中描述的方法制备和选择稳定整合有构建体的转导后的细胞。将细胞在补充有10％FBS的RPMI培养基中培养。

配体处理：将细胞以1e6个细胞/孔的密度以100μL平板接种于96孔u形底板中。添加100μL含20μM乙酰唑胺(ACZ)或0.2％DMSO的培养基。将细胞培育48小时并收集。使收集的细胞沉淀；用细胞染色缓冲液(Biolegend,San Diego,CA)洗涤；在含转导标记物抗体的细胞染色缓冲液中再悬浮并培育；洗涤；再悬浮于含1％QSol^TM缓冲液(IntellicytCorporation,Albuquerque,NM)的细胞染色缓冲液中；并通过流式细胞术进行分析。用于染色的抗体是1:1000的APC抗大鼠CD90/小鼠CD90.1(Thy-1.1)抗体和1:100的BrilliantViolet 421抗小鼠CD90.2(Thy-1.2)抗体。

结果：流式细胞术分析表明，通过GFP中值荧光强度(MFI)测量，在用ACZ处理的稳定整合有构建体ZFHD-048和ZFHD-022的Jurkat细胞中有效负载的表达量相较于用DMSO处理的相同细胞系增加了大约2.1倍(图9C)。这一数据表明，CA2 DRD调控的转录因子可以通过配体依赖性方式诱导Jurkat细胞中有效负载的表达。

实施例11：包含ecDHFR DRD调控的转录因子的单载体转录因子系统的配体依赖性活性

本实施例展示了由单一核酸构建体编码的转录因子系统的配体反应。在本实施例中分析了两个示例性单载体转录因子系统(图10A-图10B)。本实施例的两个核酸构建体各包含：编码转录因子DNA结合结构域的核酸序列、编码转录因子激活结构域的核酸序列、编码药物反应性结构域(DRD)的核酸序列以及编码有效负载的核酸序列，其中该有效负载的表达由包含转录因子DNA结合结构域的结合位点的诱导型启动子驱动。本实施例的转录因子DNA结合结构域和转录因子激活结构域被表达为转录因子融合蛋白形式，其中该融合蛋白可操作地连接至来源于ecDHFR亲本蛋白质的DRD。如此处所示，转录因子融合蛋白的水平可以用ecDHFR配体进行调控。此外，受调控的转录因子融合蛋白可以通过配体依赖性方式诱导有效负载的表达。

细胞系：本实施例分析了未转导的(亲本)U2OS细胞和用由以下构建体制成的慢病毒转导的U2OS细胞：(1)ZFHD-005；(2)ZFHD-007；(3)由构建体ZFHD-005制成的慢病毒和由构建体ZFHD-007制成的慢病毒两者；(4)由构建体ZFHD-005制成的慢病毒和由构建体ZFHD-010制成的慢病毒两者；(5)ZFHD-012；以及(6)ZFHD-018。根据实施例2中描述的方法制备和选择稳定整合有构建体的转导后的细胞系。将细胞在补充有10％FBS的McCoy's 5A培养基中培养。

配体处理：将各细胞系以25,000个细胞/孔的密度平板接种于24孔板的6-8个孔中并使其贴壁生长过夜。去除培养基，并将1mL含有10μM甲氧苄氨嘧啶(TMP)的培养基添加至各细胞系的一半孔中。剩余的孔接受1mL含0.1％DMSO的培养基。将细胞培育48小时并用0.25％胰蛋白酶从板中取出进行收集。将各处理条件的三个孔通过流式细胞术分析。对于剩余的样品，使收集的细胞沉淀，去除培养基，并将细胞沉淀物在-20℃储存以待稍后进行免疫印迹分析。

流式细胞术：将收集的细胞用PBS洗涤一次，再悬浮于PBS中并通过流式细胞术分析。

免疫印迹法：免疫印迹测定的程序是如以上实施例4所述进行。

结果：免疫印迹分析表明，用对应于单一核酸构建体(即，ZFHD-012或ZFHD-018，如本文所展示)的慢病毒转导的细胞在用TMP处理情况下显示出的转录因子多肽水平高于用DMSO处理时的水平(图10C-10D)。这一数据表明，可操作地连接至ecDHFR DRD的转录因子的蛋白质水平可以在单载体转录因子系统中用ecDHFR DRD配体调控。

通过中值荧光强度(MFI)所测量，与DMSO处理相比，单载体系统在用TMP处理时显示出增加的GFP表达(图10E-10F)。然而，与双载体系统相比，在利用单载体系统情况下有效负载的基础表达量、有效负载的诱导表达量和MFI的倍数变化较低。这一数据表明，ecDHFRDRD调控的转录因子可以在单载体转录因子系统中以配体依赖性方式诱导有效负载的部分表达。

本实施例显示，由单个载体进行的转录因子和有效负载的表达可以展现出配体依赖性活性。

实施例12：包含CA2 DRD调控的转录因子的单载体转录因子系统在Jurkat细胞中的配体依赖性活性

本实施例表征了包含CA2-DRD的单载体转录因子系统在Jurkat细胞中的配体反应。在本实施例中，转录因子系统是由核酸构建体编码的，该核酸构建体包含：编码转录因子DNA结合结构域的核酸序列、编码转录因子激活结构域的核酸序列、编码药物反应性结构域(DRD)的核酸序列以及编码有效负载的核酸序列，其中该有效负载的表达由包含转录因子DNA结合结构域的结合位点的诱导型启动子驱动(图11A)。本实施例的转录因子DNA结合结构域和转录因子激活结构域被表达为转录因子融合蛋白形式，其中该融合蛋白可操作地连接至来源于CA2亲本蛋白质的DRD。该构建体还包含连接至有效负载序列的聚腺苷酸化(Poly-A)信号。

细胞系：本实施例分析了用由以下构建体制成的慢病毒转导的Jurkat细胞系：(1)ZFHD-022、(2)Jurkat ZHFD-036以及(3)由构建体ZHFD-036制成的慢病毒和由构建体ZFHD-022制成的慢病毒两者。根据实施例2中描述的方法制备和选择稳定整合有构建体的转导后的细胞系。将细胞在补充有10％FBS的RPMI培养基中培养。

配体处理：将各细胞系以1e6个细胞/孔的密度以100μL平板接种于96孔u形底板中。添加100μL含20μM乙酰唑胺(ACZ)或0.2％DMSO的培养基。将细胞培育48小时并收集；使其沉淀；用细胞染色缓冲液(Biolegend,San Diego,CA)洗涤；在含转导标记物抗体的细胞染色缓冲液中再悬浮并培育；洗涤；再悬浮于含1％QSol^TM缓冲液(IntellicytCorporation,Albuquerque,NM)的细胞染色缓冲液中；并通过流式细胞术进行分析。用于染色的抗体是1:100的Brilliant Violet 421抗小鼠CD90.2(Thy-1.2)抗体。

结果：流式细胞术分析表明，在未分选的Jurkat细胞中，利用包含Poly-A信号的单载体转录因子系统具有一定配体依赖性活性(图11B)；然而，观察到的配体依赖性活性低于如实施例10中所示的两种载体系统。

实施例13：转录因子构建体变体的表征

本实施例表征了包含转录因子构建体的不同变体的转录因子系统的配体反应。在本实施例中，研究了三种转录因子构建体。所有三种转录因子构建体都编码转录因子DNA结合结构域、转录因子激活结构域和来源于ecDHFR亲本蛋白质的药物反应性结构域(DRD)(图12A)。构建体ZFHD-005(以上也有举例)包含编码转录因子DNA结合结构域的核酸序列，该核酸序列位于编码转录因子激活结构域的核酸序列的5'端，该编码转录因子激活结构域的核酸序列本身位于编码DRD的核酸序列的5'端。构建体ZFHD-008包含编码转录因子DNA结合结构域的核酸序列，该核酸序列位于编码DRD的核酸序列的5'端，该编码DRD的核酸序列本身位于编码转录因子激活结构域的核酸序列的5'端。构建体ZFHD-009包含与构建体ZFHD-005具有相同布置的核酸序列，并且另外包含编码在转录因子激活结构域与DRD之间的接头的核酸序列。本实施例中的转录因子构建体是作为包含相同有效负载构建体ZFHD-007的转录因子系统的一部分进行分析。如此处所示，包含ecDHFR-DRD的全部三种转录因子系统均显示以配体依赖性方式诱导有效负载的表达。

细胞系：本实施例分析了未转导的(亲本)U2OS细胞和用由以下构建体制成的慢病毒转导的U2OS细胞：(1)ZFHD-007；(2)由构建体ZFHD-004制成的慢病毒和由构建体ZFHD-007制成的慢病毒两者；(3)由构建体ZFHD-005制成的慢病毒和由构建体ZFHD-007制成的慢病毒两者；(4)由构建体ZFHD-008制成的慢病毒和由构建体ZFHD-007制成的慢病毒两者；以及(5)由构建体ZFHD-009制成的慢病毒和由构建体ZFHD-007制成的慢病毒两者。根据实施例2中描述的方法制备和选择稳定整合有构建体的转导后的细胞系。将细胞在补充有10％FBS的McCoy's 5A培养基中培养。

配体处理：将各细胞系以25,000个细胞/孔的密度平板接种于24孔板的6-8个孔中并使其贴壁生长过夜。去除培养基，并将1mL含有10μM甲氧苄氨嘧啶(TMP)的培养基添加至各细胞系的一半孔中。剩余的孔接受1mL含0.1％DMSO的培养基。将细胞培育48小时并用0.25％胰蛋白酶从板中取出进行收集。将收集的细胞用PBS洗涤一次，再悬浮于PBS中并通过流式细胞术分析。

结果：通过MFI所测量，本实施例中的包含DRD的三种转录因子系统各自都实现了有效负载表达的配体依赖性诱导(图12B)。未对在所测试的所有不同细胞系中观察到的调控作用进行秩序分析；不过，此类分析在考虑不同的构建体拷贝数之后才能执行。

这一实施例展示，转录因子构建变体(例如包括以下变体：包含编码接头的核酸序列的变体，该接头位于编码转录因子激活结构域的核酸序列与编码DRD的核酸序列之间；以及包含编码DRD的核酸序列的变体，该编码DRD的核酸序列位于编码转录因子DNA结合结构域的核酸序列与编码转录因子激活结构域的核酸序列之间)可以通过配体依赖性方式诱导转录因子系统中有效负载的表达。

实施例14：具有变体ecDHFR调控的转录因子构建体的转录因子系统的配体依赖性活性的时间进程

本实施例表征了包含转录因子构建体的不同变体的转录因子系统的配体反应时间进程。在本实施例中，研究了以上在实施例13中描述的转录因子构建体ZFHD-005、ZFHD-008和ZFHD-009。将具有相同有效负载构建体ZFHD-007的本实施例中的转录因子构建体组合，并作为独立的转录因子系统引入U2OS细胞中。如此处所示，包含ecDHFR-DRD的全部三种转录因子系统都显示以配体依赖性方式诱导有效负载的表达，并且还显示有效负载的表达量随时间增加。

细胞系：本实施例分析了与以上在实施例13中所描述相同的细胞系。将细胞在补充有10％FBS的McCoy's 5A培养基中培养。

配体处理：将各细胞系以80,000个细胞/孔的密度平板接种于12孔板中并使其贴壁生长过夜。去除培养基并添加含有10μM甲氧苄氨嘧啶(TMP)或0.1％DMSO的替代培养基。将细胞培育24小时、48小时和72小时的时间点。在各时间点，用0.25％胰蛋白酶从板中取出细胞进行收集。还在添加TMP或DMSO之前的0小时时间点进行收集。将收集的细胞用PBS洗涤一次，使其再悬浮于PBS中并通过流式细胞术分析。

结果：本实施例中的包含DRD的三种转录因子系统各自在指定时间点显示出对有效负载表达的配体依赖性诱导作用(图13)。TMP相对于DMSO处理条件的MFI倍数变化示于表7中。

表7：具有转录因子变体的转录因子系统的时间进程

样品ID	MFI倍数变化
		U2OS	0
007/004	0.894396
		0h 007	1.067418
0h 007/005	0.987225
		0h 007/008	0.932676
0h 07/009	1
		24h 007	0.984313
24h 007/005	3.113796
		24h 007/008	1.450984
24h 07/009	2.135991
		48h 007	0.959293
48h 007/005	7.113078
		48h 007/008	2.315987
48h 07/009	4.548889
		72h 007	1
72h 007/005	11.4449
		72h 007/008	3.568371
72h 07/009	5.712837

如表7和图13中所示，在72小时的时间过程中，各转录因子系统的MFI倍数变化增加。这一数据显示，测试的转录因子构建体变体在添加配体后继续诱导转录因子系统中有效负载的表达。

实施例15：有效负载构建体取向变体的表征

本实施例表征了包含有效负载构建体的不同变体的转录因子系统的配体反应。在本实施例中，研究了两种有效负载构建体(图14A-图1444B)。有效负载构建体ZFHD-007包含编码有效负载结构域的核酸序列，该核酸序列位于启动子和转录因子结合位点的3'端。有效负载构建体ZFHD-017包含编码有效负载结构域的核酸序列，该核酸序列位于PolyA信号的3’端并在启动子和转录因子结合位点的5'端。本实施例中的两种有效负载构建体是作为包含相同转录因子构建体ZFHD-005的转录因子系统的一部分进行分析。

细胞系：本实施例分析了未转导的(亲本)U2OS细胞和用由以下构建体制成的慢病毒转导的U2OS细胞：(1)ZFHD-005；(2)ZFHD-007；(3)由构建体ZFHD-005制成的慢病毒和由构建体ZFHD-007制成的慢病毒两者；(4)ZFHD-017；(5)由构建体ZFHD-005制成的慢病毒和由构建体ZFHD-017制成的慢病毒两者。根据实施例2中描述的方法制备和选择稳定整合有构建体的转导后的细胞系。将细胞在补充有10％FBS的McCoy's 5A培养基中培养。

配体处理：将各细胞系以25,000个细胞/孔的密度平板接种于24孔板的6-8个孔中并使其贴壁生长过夜。去除培养基，并将1mL含有10μM甲氧苄氨嘧啶(TMP)的培养基添加至各细胞系的一半孔中。剩余的孔接受1mL含0.1％DMSO的培养基。将细胞培育48小时并用0.25％胰蛋白酶从板中取出进行收集。将收集的细胞用PBS洗涤一次，使其再悬浮于PBS中并通过流式细胞术分析。

结果：本实施例的两种转录因子系统均实现了对有效负载表达的配体依赖性诱导(图14C-图14D)。与由构建体ZFHD-007得到的表达量相比，由构建体ZFHD-017得到的有效负载的表达量减少了大约100倍。由这两种示例性转录因子系统得到的有效负载表达量的差异以图14C相较于图14D的100倍标度差异示出。

本实施例展示，编码有效负载结构域的核酸序列定位于启动子和转录因子结合位点的5'端(例如与有效负载构建体ZFHD-017一样)将维持对转录因子系统中响应于配体而进行的有效负载表达的诱导；然而，相较于包含位于启动子和转录因子结合位点3'端的编码有效负载结构域的核酸序列的有效负载构建体(例如与有效负载构建体ZFHD-007一样)，有效负载的表达量减少。

实施例16：包含分泌的IL12有效负载的转录因子系统的配体依赖性活性

本实施例展示了包含分泌的IL12有效负载的转录因子系统引起的配体依赖性反应。在本实施例中，转录因子系统是由以上在实施例4中所描述的转录因子构建体ZFHD-005和有效负载构建体ZFHD-013编码，该有效负载构建体包含编码分泌的IL12的核酸序列。

细胞系：本实施例分析了未转导的(亲本)U2OS细胞和用由以下构建体制成的慢病毒转导的U2OS细胞：(1)ZFHD-013；(2)ZFHD-005；(3)由构建体ZFHD-013制成的慢病毒和由构建体ZFHD-004制成的慢病毒两者；以及(4)由构建体ZFHD-013制成的慢病毒和由构建体ZFHD-005制成的慢病毒两者。

配体处理：将各细胞系以25,000个细胞/孔的密度平板接种于24孔板的6-8个孔中并使其贴壁生长过夜。去除培养基，并将1mL含有10μM甲氧苄氨嘧啶(TMP)的培养基添加至各细胞系的一半孔中。剩余的孔接受1mL含0.1％DMSO的培养基。将细胞培育72小时。培育后，从各孔中收集200μL条件培养基并在-20℃储存以待稍后进行Meso Scale Discovery(MSD)分析。遵循制造商的方案(V-PLEX Plus Human IL-12p70试剂盒；Meso ScaleDiagnostics,Rockville,MD)，利用IL12MSD生物标记物测定来分析收集的上清液。

结果：与用DMSO处理的细胞相比，稳定整合有构建体ZFHD-005和ZFHD-013的细胞在TMP处理下显示出分泌的IL12水平增加(图15)。这一数据表明，DRD调控的转录因子可以通过配体依赖性方式诱导分泌的IL12有效负载的表达。

实施例17：c-Jun和FOXP3转录因子的配体依赖性调控

本实施例提供的结果显示了在结构上不同于以上实施例的工程改造的转录因子的两个转录因子的调控。本实施例展示，根据本公开的DRD-TF构建体的设计和制备能够利用DRD技术调控结构多样的转录因子。

本实施例中测试的转录因子是c-Jun和FOXP3，它们各自都可操作地连接至来源于CA2亲本蛋白质的DRD。表2中提供了本实施例中测试的DRD-TF构建体、相应对照构建体和构建体组分的描述。表2中各构建体的启动子是EF1a启动子。根据实施例2中描述的克隆方法制备表2中列出的构建体，但用于表2中构建体的转移载体是pELNS(图19和SEQ ID NO：69)。

细胞系：本实施例分析了亲本HEK293T细胞和用以下构建体的质粒DNA转染的HEK293T细胞：(1)cjun-001、(2)cjun-002、(3)cjun-003、(4)FOXP3-013、(5)FOXP3-014或(6)FOXP3-015。将细胞在补充有10％FBS的DMEM培养基中培养并如下进行转染：将HEK293T细胞接种于组织培养板上并维持在生长培养基(补充有10％FBS和1％青霉素-链霉素的DMEM)，直至70-80％汇合。将细胞用如上所述制备的转移载体，在Opti-MEM培养基(ThermoFisher Scientific,Waltham,MA)中使用Lipofectamine 3000转染试剂(Thermo FisherScientific,Waltham,MA)转染。转染后24小时，将培养基更换为含有100μM乙酰唑胺或0.1％DMSO的生长培养基。24小时后，收集细胞用于免疫印迹测定。

配体处理：将各细胞系平板接种于12或24孔板中并使其贴壁生长过夜。去除培养基并添加1mL具有配体或0.1％DMSO的培养基。将细胞培育24小时并用0.25％胰蛋白酶从板中取出进行收集。使收集的细胞沉淀，去除培养基，并将细胞沉淀物在-20℃储存，以待稍后的免疫印迹测定。

免疫印迹测定：将细胞沉淀物再悬浮于含有蛋白酶抑制剂的溶解缓冲液(T-PER^TM组织蛋白萃取试剂；Thermo Fisher Scientific,Waltham,MA)中。将细胞溶解产物添加至含有β-巯基乙醇或还原试剂(Thermo Fisher Scientific,Waltham,MA)的NuPAGE LDS样品缓冲液(Thermo Fisher Scientific,Waltham,MA)中，并在300rpm搅动下，在96℃培育6分钟。将样品用含BOLT抗氧化剂的BOLT MES SDS电泳缓冲液(Thermo Fisher Scientific,Waltham,MA)上样至NuPAGE4-12％Bis-Tris凝胶上。将蛋白质转印至硝酸纤维素膜上并用以下抗体探测：兔抗c-Jun抗体(1:1000；Cell Signaling Technology,Danvers,MA)、兔抗FoxP3抗体(1:1000；Cell Signaling Technology,Danvers,MA)和小鼠抗微管蛋白抗体(1:4000；Sigma Aldrich)。二次抗体是

680RD驴抗小鼠(1:4000；LI-COR,Lincoln,NE)或

800CW驴抗兔(1:3000；LI-COR)。

分析：构建体被设计成共表达标记物(对于cJun构建体为mCherry；对于FoxP3构建体为RQR8)，该标记物可以通过流式细胞术定量，以使样品之间的转染或转导效率差异归一化。在进行蛋白质印迹分析的同时，通过流式细胞术分析细胞以确定mCherry阳性细胞百分比或RQR8阳性细胞百分比。对蛋白质印迹进行定量，并将信号针对微管蛋白信号以及通过流式细胞术测量的mCherry阳性％(c-Jun构建体)或RQR8阳性％(FoxP3构建体)归一化。利用DMSO的cJun-002或利用DMSO的FOXP3-014的归一化信号设置为1。

结果：用包含cjun-002构建体的质粒转染的HEK293T细胞显示，与DMSO处理的细胞相比，编码的转录因子和DRD多肽在配体处理的细胞中以较高水平存在(图16A-图16B)。比较起来，用包含构建体cjun-001(包含野生型CA2组分)或cjun-003(不包含任何CA2组分)的质粒转染的HEK293T细胞显示，在DMSO和配体处理的条件中均检测到c-Jun蛋白，并且两种条件之间的变化很小，甚至没有变化。

用包含FOXP3-014构建体的质粒转染的HEK293T细胞显示，与DMSO处理的细胞相比，编码的转录因子和DRD多肽在配体处理的细胞中以较高水平存在(图16C-图16D)。比较起来，用包含构建体FOXP3-013(包含野生型CA2组分)或FOXP3-015(不包含任何CA2组分)的质粒转染的HEK293T细胞显示，在DMSO和配体处理的条件中均检测到FOXP3蛋白，并且两种条件之间的变化很小，甚至没有变化。

本实施例展示了包含可操作地连接至DRD的结构多样的转录因子的转录因子构建体的配体依赖性表达。这些数据为本公开的转录因子系统的模块化提供了额外的支持，并证实了可操作地连接至DRD的不同转录因子的蛋白质水平可以用DRD的配体来调控。因此，本公开的转录因子系统可以设计成包含具有其他结构多样的转录因子的DRD-TF构建体，所述转录因子包括工程改造的转录因子，例如在实施例1和本公开别处讨论的那些。

实施例18：在Jurkat细胞中稳定整合的c-Jun转录因子构建体的配体依赖性调控

本实施例展示了在Jurkat细胞中在稳定整合后c-Jun转录因子构建体的配体依赖性调控。测试并比较了在如以上实施例17中所描述的转移载体中制备的构建体cjun-001和cjun-002。

细胞系：本实施例分析了未转导的(亲本)Jurkat细胞以及用由构建体cjun-001和cjun-002制成的慢病毒转导的Jurkat细胞。将细胞在补充有10％FBS的RPMI培养基中培养。在转导后，将细胞培养8天，然后平板接种于6孔板中，并用100μM乙酰唑胺或0.1％DMSO处理。24小时后，收集细胞用于免疫印迹测定。

免疫印迹测定：免疫印迹测定的程序如以上实施例17所述。使用了以下抗体：兔抗c-Jun抗体(1:1000；Cell Signaling Technology,Danvers,MA)、兔抗磷酸化c-Jun抗体(1:1000；Cell Signaling Technology,Danvers,MA)和小鼠抗微管蛋白抗体(1:4000；SigmaAldrich)。二次抗体是

680RD驴抗小鼠(1:4000；LI-COR,Lincoln,NE)或

800CW驴抗兔(1:3000；LI-COR)。

分析：根据实施例17中所描述，将免疫印迹信号的定量针对mCherry阳性细胞百分比归一化。

结果：用由构建体cjun-002制成的慢病毒转导的Jurkat细胞显示，与DMSO处理的细胞相比，编码的c-Jun和DRD多肽在配体处理的细胞中以较高的水平存在(图17A-图17B)。用配体处理还观察到c-Jun磷酸化的相应增加。比较起来，亲本Jurkat细胞和用构建体cjun-001制成的慢病毒转导的Jurkat细胞显示，在DMSO和配体处理的条件下均检测到c-Jun和磷酸化c-Jun，并且两种条件之间的变化很小，甚至没有变化。这一数据证实，可操作地连接至DRD的转录因子的蛋白质水平可以用DRD的配体调控。

实施例19：癌症或自身免疫疾病的治疗

本实施例阐述了应用以上详细描述中所描述的转录因子系统的原理和组分治疗或预防有需要的受试者的疾病的说明性方法。虽然转录因子系统的应用和用途可以应用于上述各种方法，例如在本公开的“应用和用途”部分中的方法，但本实施例展示用于治疗患有癌症或自身免疫疾病的受试者的方法。

上文提供了多种使用转录因子系统或其组分治疗或预防癌症或自身免疫疾病的方法。本实施例的说明性方法包括：(a)提供细胞群；(b)将至少一个核酸分子引入细胞群中的至少一个细胞中，其中所得到的细胞将包含转录因子系统的一种或多种多核苷酸的组合；(c)将所得到的细胞递送至受试者体内；并且(d)向受试者施用使DRD稳定的配体，该DRD是由转录因子系统的多核苷酸编码。以下是示例方法的这些(a)-(d)部分中每一者的附加细节。尽管下面的附加细节更具体地说明了本实施例的方法的各个部分，但这些特定细节不应被解释为限制可用于根据本公开的用于治疗或预防疾病的方法中的(a)-(d)各部分的其他变化，这些变化在以上详细描述中已进一步详述。

A.提供细胞群：

提供自体或同种异体免疫细胞群。细胞可以选自T细胞、自然杀伤细胞(NK细胞)或肿瘤浸润淋巴细胞(TIL)。如果细胞群是自体细胞群，则细胞来源于待治疗的受试者，并且在分离和加工之后，施用给同一受试者。如果细胞群是同种异体细胞群，则细胞是从除待治疗受试者之外的供体受试者分离和/或制备。从受试者获得细胞的方法是本领域已知的，并且可以包括通过白细胞分离法分离外周血T细胞或从切除的肿瘤中分离TIL。

B.将至少一个核酸分子引入细胞群中的至少一个细胞中：多种用于将核酸分子引入细胞中的方法均可使用，包括病毒和非病毒递送方法以及上述其他方法，例如在以上详细描述的“给药、递送和施用”部分中的方法。对于本实施例，递送方法可以是通过选自慢病毒载体、γ逆转录病毒载体、腺相关病毒(AAV)载体、腺病毒载体和疱疹病毒载体的一个或多个病毒载体递送。

在成功递送后，所得到的细胞将包含转录因子系统的一种或多种多核苷酸的组合。对于本实施例，所述一种或多种多核苷酸的组合包含：编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，该转录因子DNA结合结构域结合至特定多核苷酸结合位点；编码药物反应性结构域(DRD)的第三核酸序列，其中该转录因子激活结构域和/或转录因子DNA结合结构域可操作地连接至DRD；以及编码感兴趣蛋白质(也称为“有效负载”)的第四核酸序列，该感兴趣蛋白质治疗癌症或自身免疫疾病，该第四核酸序列可操作地连接至包含特定多核苷酸结合位点的外源诱导型启动子。包含第一核酸序列、第二核酸序列、第三核酸序列和第四核酸序列的多核苷酸可以在单个载体或多个载体上递送至细胞，例如包含第一核酸序列、第二核酸序列和第三核酸序列的第一载体和包含第四核酸序列的第二载体。

编码的转录因子激活结构域；转录因子DNA结合结构域；药物反应性结构域(DRD)；和感兴趣蛋白质可以分开选择。关于选择转录因子系统的这些组分的模块化的额外细节在本公开别处提供。对于本实施例，有效负载是可选自细胞因子、抗体、T细胞受体(TCR)或嵌合抗原受体(CAR)的治疗性蛋白质。细胞因子有效负载包括IL2、IL12、IL15或其变体，包括这些细胞因子的膜结合形式。

C.将所得到的细胞递送至受试者体内：

将细胞递送给受试者的方法是本领域中已知的并且包括以上在详细描述中提供的方法，例如在“施用”部分中提供的方法。对于本实施例，可以通过输注将细胞递送至受试者体内。

D.将配体施用给受试者

为了在受试者中实现治疗效果，将使DRD稳定的配体施用给受试者。如以上在本说明性方法的部分(B)中所述，转录因子激活结构域和/或转录因子DNA结合结构域可操作地连接至DRD。将配体施用给受试者，由此该配体使DRD足够稳定以便能表达足以形成转录因子的量的转录因子激活结构域和转录因子DNA结合结构域，该转录因子结合至特定多核苷酸结合位点并且使感兴趣蛋白质能够表达。因此，感兴趣蛋白质的表达受到受试者体内配体存在的调控。施用给受试者的配体的量和/或持续时间足以产生治疗有效量的感兴趣蛋白质。ACZ可以与hCA2 DRD一起用作配体，甲氨蝶呤可以与hDHFRDRD一起使用，并且甲氧苄氨嘧啶可以与ecDHFR DRD一起使用。可以使用有效产生治疗有效量的感兴趣蛋白质的任何量和任何施用途径将配体施用至受试者或细胞。配体的总日剂量可由主治医师在合理的医学判断范围内决定。

如本实施例所示，本文所描述的转录因子系统可用于递送和调控用于治疗患有癌症或自身免疫疾病的受试者的治疗性有效负载。如上所述，针对所提供方法和其他方法的变化也被考虑用于本公开的转录因子系统的应用。

尽管本公开已关于若干所描述的实施方案以一定篇幅和一定具体性进行了描述，但并不打算局限于任何此类细节或实施方案或任何特定实施方案，而是要参照所附权利要求来解释，以便根据现有技术提供对这些权利要求的最广泛的可能解释，并因此有效地涵盖本公开的预期范围。

各部分标题、材料、方法和实施例仅是说明性的，而不打算作为限制。

<110> 黑曜石治疗公司(OBSIDIAN THERAPEUTICS, INC.)

<120> 用于可调节性调控转录的组合物和方法

<130> 268052-483267

<140>

<141>

<150> 62/959,859

<151> 2020-01-10

<150> 62/958,693

<151> 2020-01-08

<160> 71

<170> PatentIn 3.5版

<210> 1

<211> 159

<212> PRT

<213> 大肠杆菌(Escherichia coli)

<400> 1

Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Arg Val Ile Gly Met

1 5 10 15

Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys

20 25 30

Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu

35 40 45

Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser

50 55 60

Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu

65 70 75 80

Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly

85 90 95

Gly Arg Val Tyr Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu

100 105 110

Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr

115 120 125

Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp

130 135 140

Ala Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg

145 150 155

<210> 2

<211> 187

<212> PRT

<213> 智人(Homo sapiens)

<400> 2

Met Val Gly Ser Leu Asn Cys Ile Val Ala Val Ser Gln Asn Met Gly

1 5 10 15

Ile Gly Lys Asn Gly Asp Leu Pro Trp Pro Pro Leu Arg Asn Glu Phe

20 25 30

Arg Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly Lys Gln

35 40 45

Asn Leu Val Ile Met Gly Lys Lys Thr Trp Phe Ser Ile Pro Glu Lys

50 55 60

Asn Arg Pro Leu Lys Gly Arg Ile Asn Leu Val Leu Ser Arg Glu Leu

65 70 75 80

Lys Glu Pro Pro Gln Gly Ala His Phe Leu Ser Arg Ser Leu Asp Asp

85 90 95

Ala Leu Lys Leu Thr Glu Gln Pro Glu Leu Ala Asn Lys Val Asp Met

100 105 110

Val Trp Ile Val Gly Gly Ser Ser Val Tyr Lys Glu Ala Met Asn His

115 120 125

Pro Gly His Leu Lys Leu Phe Val Thr Arg Ile Met Gln Asp Phe Glu

130 135 140

Ser Asp Thr Phe Phe Pro Glu Ile Asp Leu Glu Lys Tyr Lys Leu Leu

145 150 155 160

Pro Glu Tyr Pro Gly Val Leu Ser Asp Val Gln Glu Glu Lys Gly Ile

165 170 175

Lys Tyr Lys Phe Glu Val Tyr Glu Lys Asn Asp

180 185

<210> 3

<211> 107

<212> PRT

<213> 智人(Homo sapiens)

<400> 3

Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro

1 5 10 15

Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp

20 25 30

Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe

35 40 45

Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala

50 55 60

Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr

65 70 75 80

Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr

85 90 95

Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu

100 105

<210> 4

<211> 327

<212> PRT

<213> 智人(Homo sapiens)

<400> 4

Met Glu Glu Thr Arg Glu Leu Gln Ser Leu Ala Ala Ala Val Val Pro

1 5 10 15

Ser Ala Gln Thr Leu Lys Ile Thr Asp Phe Ser Phe Ser Asp Phe Glu

20 25 30

Leu Ser Asp Leu Glu Thr Ala Leu Cys Thr Ile Arg Met Phe Thr Asp

35 40 45

Leu Asn Leu Val Gln Asn Phe Gln Met Lys His Glu Val Leu Cys Arg

50 55 60

Trp Ile Leu Ser Val Lys Lys Asn Tyr Arg Lys Asn Val Ala Tyr His

65 70 75 80

Asn Trp Arg His Ala Phe Asn Thr Ala Gln Cys Met Phe Ala Ala Leu

85 90 95

Lys Ala Gly Lys Ile Gln Asn Lys Leu Thr Asp Leu Glu Ile Leu Ala

100 105 110

Leu Leu Ile Ala Ala Leu Ser His Asp Leu Asp His Arg Gly Val Asn

115 120 125

Asn Ser Tyr Ile Gln Arg Ser Glu His Pro Leu Ala Gln Leu Tyr Cys

130 135 140

His Ser Ile Met Glu His His His Phe Asp Gln Cys Leu Met Ile Leu

145 150 155 160

Asn Ser Pro Gly Asn Gln Ile Leu Ser Gly Leu Ser Ile Glu Glu Tyr

165 170 175

Lys Thr Thr Leu Lys Ile Ile Lys Gln Ala Ile Leu Ala Thr Asp Leu

180 185 190

Ala Leu Tyr Ile Lys Arg Arg Gly Glu Phe Phe Glu Leu Ile Arg Lys

195 200 205

Asn Gln Phe Asn Leu Glu Asp Pro His Gln Lys Glu Leu Phe Leu Ala

210 215 220

Met Leu Met Thr Ala Cys Asp Leu Ser Ala Ile Thr Lys Pro Trp Pro

225 230 235 240

Ile Gln Gln Arg Ile Ala Glu Leu Val Ala Thr Glu Phe Phe Asp Gln

245 250 255

Gly Asp Arg Glu Arg Lys Glu Leu Asn Ile Glu Pro Thr Asp Leu Met

260 265 270

Asn Arg Glu Lys Lys Asn Lys Ile Pro Ser Met Gln Val Gly Phe Ile

275 280 285

Asp Ala Ile Cys Leu Gln Leu Tyr Glu Ala Leu Thr His Val Ser Glu

290 295 300

Asp Cys Phe Pro Leu Leu Asp Gly Cys Arg Lys Asn Arg Gln Lys Trp

305 310 315 320

Gln Ala Leu Ala Glu Gln Gln

325

<210> 5

<211> 260

<212> PRT

<213> 智人(Homo sapiens)

<400> 5

Met Ser His His Trp Gly Tyr Gly Lys His Asn Gly Pro Glu His Trp

1 5 10 15

His Lys Asp Phe Pro Ile Ala Lys Gly Glu Arg Gln Ser Pro Val Asp

20 25 30

Ile Asp Thr His Thr Ala Lys Tyr Asp Pro Ser Leu Lys Pro Leu Ser

35 40 45

Val Ser Tyr Asp Gln Ala Thr Ser Leu Arg Ile Leu Asn Asn Gly His

50 55 60

Ala Phe Asn Val Glu Phe Asp Asp Ser Gln Asp Lys Ala Val Leu Lys

65 70 75 80

Gly Gly Pro Leu Asp Gly Thr Tyr Arg Leu Ile Gln Phe His Phe His

85 90 95

Trp Gly Ser Leu Asp Gly Gln Gly Ser Glu His Thr Val Asp Lys Lys

100 105 110

Lys Tyr Ala Ala Glu Leu His Leu Val His Trp Asn Thr Lys Tyr Gly

115 120 125

Asp Phe Gly Lys Ala Val Gln Gln Pro Asp Gly Leu Ala Val Leu Gly

130 135 140

Ile Phe Leu Lys Val Gly Ser Ala Lys Pro Gly Leu Gln Lys Val Val

145 150 155 160

Asp Val Leu Asp Ser Ile Lys Thr Lys Gly Lys Ser Ala Asp Phe Thr

165 170 175

Asn Phe Asp Pro Arg Gly Leu Leu Pro Glu Ser Leu Asp Tyr Trp Thr

180 185 190

Tyr Pro Gly Ser Leu Thr Thr Pro Pro Leu Leu Glu Cys Val Thr Trp

195 200 205

Ile Val Leu Lys Glu Pro Ile Ser Val Ser Ser Glu Gln Val Leu Lys

210 215 220

Phe Arg Lys Leu Asn Phe Asn Gly Glu Gly Glu Pro Glu Glu Leu Met

225 230 235 240

Val Asp Asn Trp Arg Pro Ala Gln Pro Leu Lys Asn Arg Gln Ile Lys

245 250 255

Ala Ser Phe Lys

260

<210> 6

<211> 595

<212> PRT

<213> 智人(Homo sapiens)

<400> 6

Met Thr Met Thr Leu His Thr Lys Ala Ser Gly Met Ala Leu Leu His

1 5 10 15

Gln Ile Gln Gly Asn Glu Leu Glu Pro Leu Asn Arg Pro Gln Leu Lys

20 25 30

Ile Pro Leu Glu Arg Pro Leu Gly Glu Val Tyr Leu Asp Ser Ser Lys

35 40 45

Pro Ala Val Tyr Asn Tyr Pro Glu Gly Ala Ala Tyr Glu Phe Asn Ala

50 55 60

Ala Ala Ala Ala Asn Ala Gln Val Tyr Gly Gln Thr Gly Leu Pro Tyr

65 70 75 80

Gly Pro Gly Ser Glu Ala Ala Ala Phe Gly Ser Asn Gly Leu Gly Gly

85 90 95

Phe Pro Pro Leu Asn Ser Val Ser Pro Ser Pro Leu Met Leu Leu His

100 105 110

Pro Pro Pro Gln Leu Ser Pro Phe Leu Gln Pro His Gly Gln Gln Val

115 120 125

Pro Tyr Tyr Leu Glu Asn Glu Pro Ser Gly Tyr Thr Val Arg Glu Ala

130 135 140

Gly Pro Pro Ala Phe Tyr Arg Pro Asn Ser Asp Asn Arg Arg Gln Gly

145 150 155 160

Gly Arg Glu Arg Leu Ala Ser Thr Asn Asp Lys Gly Ser Met Ala Met

165 170 175

Glu Ser Ala Lys Glu Thr Arg Tyr Cys Ala Val Cys Asn Asp Tyr Ala

180 185 190

Ser Gly Tyr His Tyr Gly Val Trp Ser Cys Glu Gly Cys Lys Ala Phe

195 200 205

Phe Lys Arg Ser Ile Gln Gly His Asn Asp Tyr Met Cys Pro Ala Thr

210 215 220

Asn Gln Cys Thr Ile Asp Lys Asn Arg Arg Lys Ser Cys Gln Ala Cys

225 230 235 240

Arg Leu Arg Lys Cys Tyr Glu Val Gly Met Met Lys Gly Gly Ile Arg

245 250 255

Lys Asp Arg Arg Gly Gly Arg Met Leu Lys His Lys Arg Gln Arg Asp

260 265 270

Asp Gly Glu Gly Arg Gly Glu Val Gly Ser Ala Gly Asp Met Arg Ala

275 280 285

Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn

290 295 300

Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu

305 310 315 320

Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro

325 330 335

Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg

340 345 350

Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val

355 360 365

Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu

370 375 380

Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Gly

385 390 395 400

Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys

405 410 415

Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser

420 425 430

Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu

435 440 445

Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser

450 455 460

Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp

465 470 475 480

Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr

485 490 495

Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser

500 505 510

His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met

515 520 525

Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Met Leu

530 535 540

Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val

545 550 555 560

Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser

565 570 575

His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro

580 585 590

Ala Thr Val

595

<210> 7

<211> 1918

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 7

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360

ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420

cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480

ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540

tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600

gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660

tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720

tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780

caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840

ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900

ttccgtcctc agccgtcgct tcatgtgact ccactgagta ccgggcgccg tccaggcacc 960

tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020

cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080

tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140

agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgatctaga ggatcactag 1200

tgccaccatg gcacctaaga aaaagaggaa ggttgaacgc ccatatgctt gccctgtcga 1260

gtcctgcgat cgccgctttt ctcgctcgga tgagcttacc cgccatatcc gcatccacac 1320

aggccagaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgta gtgaccacct 1380

taccacccac atccgcaccc acacaggcgg cggccgcagg aggaagaaac gcaccagcat 1440

agagaccaac atccgtgtgg ccttagagaa gagtttcttg gagaatcaaa agcctacctc 1500

ggaagagatc actatgattg ctgatcagct caatatggaa aaagaggtga ttcgtgtttg 1560

gttctgtaac cgccgccaga aagaaaaaag aatcaacact agactggggg ccttgcttgg 1620

caacagcaca gacccagctg tgttcacaga cctggcatcc gtggacaact ccgagtttca 1680

gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 1740

gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 1800

tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 1860

ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccg gatcctga 1918

<210> 8

<211> 236

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 8

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Ser

225 230 235

<210> 9

<211> 2404

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 9

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360

ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420

cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480

ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540

tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600

gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660

tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720

tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780

caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840

ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900

ttccgtcctc agccgtcgct tcatgtgact ccactgagta ccgggcgccg tccaggcacc 960

tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020

cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080

tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140

agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgatctaga ggatcactag 1200

tgccaccatg gcacctaaga aaaagaggaa ggttgaacgc ccatatgctt gccctgtcga 1260

gtcctgcgat cgccgctttt ctcgctcgga tgagcttacc cgccatatcc gcatccacac 1320

aggccagaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgta gtgaccacct 1380

taccacccac atccgcaccc acacaggcgg cggccgcagg aggaagaaac gcaccagcat 1440

agagaccaac atccgtgtgg ccttagagaa gagtttcttg gagaatcaaa agcctacctc 1500

ggaagagatc actatgattg ctgatcagct caatatggaa aaagaggtga ttcgtgtttg 1560

gttctgtaac cgccgccaga aagaaaaaag aatcaacact agactggggg ccttgcttgg 1620

caacagcaca gacccagctg tgttcacaga cctggcatcc gtggacaact ccgagtttca 1680

gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 1740

gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 1800

tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 1860

ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccg gatccagcgg 1920

catctctctg attgcggcgc tggcagttga ctacgttatt ggcatggaaa acgcgatgcc 1980

atggaacctc ccggctgacc tggcgtggtt caaacgtaac accctgaaca aacctgtgat 2040

catgggtcgt cacacctggg aatctattgg ccgtcctctc ccgggtcgta aaaacatcat 2100

tctgtcttct cagccaggca ccgacgaccg tgttacctgg gttaaaagcg ttgacgaagc 2160

gattgctgcg tgcggtgatg ttcctgaaat tatggtgatc ggcggtggcc gtgttatcga 2220

acagttcctg ccgaaagcgc agaaactgta cctgacccac atcgacgcgg aagttgaagg 2280

tgacacccac ttcccggact acgaaccgga tgattgggag agcgtattct ccgaattcca 2340

tgatgcggat gcgcaaaact ctcattctta ctgttttgaa atcctggaac gtcgtggatc 2400

ctga 2404

<210> 10

<211> 398

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 10

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Ser Ser Gly Ile Ser

225 230 235 240

Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met Glu Asn Ala

245 250 255

Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys Arg Asn Thr

260 265 270

Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu Ser Ile Gly

275 280 285

Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser Gln Pro Gly

290 295 300

Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu Ala Ile Ala

305 310 315 320

Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly Gly Arg Val

325 330 335

Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu Thr His Ile

340 345 350

Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr Glu Pro Asp

355 360 365

Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp Ala Gln Asn

370 375 380

Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg Gly Ser

385 390 395

<210> 11

<211> 943

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 11

taatgatggg cgcacgagta atgatgggcg gacgactaat gatgggcgca cgagtaatga 60

tgggcgtcta gctaatgatg ggcgctagag taatgatggg cggtagacta atgatgggcg 120

ctccagtaat gatgggcgtt ctagctctag agggtatata atgggggcca ctagtctact 180

accagatagc ttggtaccga gctctgatcc agccaccatg gtgagcaagg gcgaggagct 240

gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 300

cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat 360

ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg 420

cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc 480

catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 540

gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 600

catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 660

ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat 720

ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc 780

catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct 840

gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 900

cgggatcact ctcggcatgg acgagctgta caagggatcc taa 943

<210> 12

<211> 241

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 12

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Gly

225 230 235 240

Ser

<210> 13

<211> 2404

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 13

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360

ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420

cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480

ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540

tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600

gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660

tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720

tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780

caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840

ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900

ttccgtcctc agccgtcgct tcatgtgact ccactgagta ccgggcgccg tccaggcacc 960

tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020

cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080

tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140

agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgatctaga ggatcactag 1200

tgccaccatg gcacctaaga aaaagaggaa ggttgaacgc ccatatgctt gccctgtcga 1260

gtcctgcgat cgccgctttt ctcgctcgga tgagcttacc cgccatatcc gcatccacac 1320

aggccagaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgta gtgaccacct 1380

taccacccac atccgcaccc acacaggcgg cggccgcagg aggaagaaac gcaccagcat 1440

agagaccaac atccgtgtgg ccttagagaa gagtttcttg gagaatcaaa agcctacctc 1500

ggaagagatc actatgattg ctgatcagct caatatggaa aaagaggtga ttcgtgtttg 1560

gttctgtaac cgccgccaga aagaaaaaag aatcaacgga tccagcggca tctctctgat 1620

tgcggcgctg gcagttgact acgttattgg catggaaaac gcgatgccat ggaacctccc 1680

ggctgacctg gcgtggttca aacgtaacac cctgaacaaa cctgtgatca tgggtcgtca 1740

cacctgggaa tctattggcc gtcctctccc gggtcgtaaa aacatcattc tgtcttctca 1800

gccaggcacc gacgaccgtg ttacctgggt taaaagcgtt gacgaagcga ttgctgcgtg 1860

cggtgatgtt cctgaaatta tggtgatcgg cggtggccgt gttatcgaac agttcctgcc 1920

gaaagcgcag aaactgtacc tgacccacat cgacgcggaa gttgaaggtg acacccactt 1980

cccggactac gaaccggatg attgggagag cgtattctcc gaattccatg atgcggatgc 2040

gcaaaactct cattcttact gttttgaaat cctggaacgt cgtggatccc tgggggcctt 2100

gcttggcaac agcacagacc cagctgtgtt cacagacctg gcatccgtgg acaactccga 2160

gtttcagcag ctgctgaacc agggcatacc tgtggccccc cacacaactg agcccatgct 2220

gatggagtac cctgaggcta taactcgcct agtgacaggg gcccagaggc cccccgaccc 2280

agctcctgct ccactggggg ccccggggct ccccaatggc ctcctttcag gagatgaaga 2340

cttctcctcc attgcggaca tggacttctc agccctgctg agtcagatca gctccgctag 2400

ctga 2404

<210> 14

<211> 398

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 14

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Gly Ser Ser Gly Ile Ser Leu Ile Ala Ala Leu Ala Val Asp

130 135 140

Tyr Val Ile Gly Met Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp

145 150 155 160

Leu Ala Trp Phe Lys Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly

165 170 175

Arg His Thr Trp Glu Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn

180 185 190

Ile Ile Leu Ser Ser Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val

195 200 205

Lys Ser Val Asp Glu Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile

210 215 220

Met Val Ile Gly Gly Gly Arg Val Ile Glu Gln Phe Leu Pro Lys Ala

225 230 235 240

Gln Lys Leu Tyr Leu Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr

245 250 255

His Phe Pro Asp Tyr Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu

260 265 270

Phe His Asp Ala Asp Ala Gln Asn Ser His Ser Tyr Cys Phe Glu Ile

275 280 285

Leu Glu Arg Arg Gly Ser Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp

290 295 300

Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln

305 310 315 320

Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro

325 330 335

Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala

340 345 350

Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu

355 360 365

Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp

370 375 380

Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Ala Ser

385 390 395

<210> 15

<211> 2416

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 15

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360

ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420

cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480

ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540

tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600

gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660

tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720

tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780

caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840

ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900

ttccgtcctc agccgtcgct tcatgtgact ccactgagta ccgggcgccg tccaggcacc 960

tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020

cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080

tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140

agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgatctaga ggatcactag 1200

tgccaccatg gcacctaaga aaaagaggaa ggttgaacgc ccatatgctt gccctgtcga 1260

gtcctgcgat cgccgctttt ctcgctcgga tgagcttacc cgccatatcc gcatccacac 1320

aggccagaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgta gtgaccacct 1380

taccacccac atccgcaccc acacaggcgg cggccgcagg aggaagaaac gcaccagcat 1440

agagaccaac atccgtgtgg ccttagagaa gagtttcttg gagaatcaaa agcctacctc 1500

ggaagagatc actatgattg ctgatcagct caatatggaa aaagaggtga ttcgtgtttg 1560

gttctgtaac cgccgccaga aagaaaaaag aatcaacact agactggggg ccttgcttgg 1620

caacagcaca gacccagctg tgttcacaga cctggcatcc gtggacaact ccgagtttca 1680

gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 1740

gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 1800

tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 1860

ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccg gatccggctc 1920

aggtagcagc ggcatctctc tgattgcggc gctggcagtt gactacgtta ttggcatgga 1980

aaacgcgatg ccatggaacc tcccggctga cctggcgtgg ttcaaacgta acaccctgaa 2040

caaacctgtg atcatgggtc gtcacacctg ggaatctatt ggccgtcctc tcccgggtcg 2100

taaaaacatc attctgtctt ctcagccagg caccgacgac cgtgttacct gggttaaaag 2160

cgttgacgaa gcgattgctg cgtgcggtga tgttcctgaa attatggtga tcggcggtgg 2220

ccgtgttatc gaacagttcc tgccgaaagc gcagaaactg tacctgaccc acatcgacgc 2280

ggaagttgaa ggtgacaccc acttcccgga ctacgaaccg gatgattggg agagcgtatt 2340

ctccgaattc catgatgcgg atgcgcaaaa ctctcattct tactgttttg aaatcctgga 2400

acgtcgtgga tcctga 2416

<210> 16

<211> 402

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 16

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Ser Gly Ser Gly Ser

225 230 235 240

Ser Gly Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly

245 250 255

Met Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe

260 265 270

Lys Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp

275 280 285

Glu Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser

290 295 300

Ser Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp

305 310 315 320

Glu Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly

325 330 335

Gly Gly Arg Val Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr

340 345 350

Leu Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp

355 360 365

Tyr Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala

370 375 380

Asp Ala Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg

385 390 395 400

Gly Ser

<210> 17

<211> 3364

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 17

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360

ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420

cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480

ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540

tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600

gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660

tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720

tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780

caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840

ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900

ttccgtcctc agccgtcgct tcatgtgact ccactgagta ccgggcgccg tccaggcacc 960

tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020

cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080

tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140

agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgatctaga ggatcactag 1200

tgccaccatg gcacctaaga aaaagaggaa ggttgaacgc ccatatgctt gccctgtcga 1260

gtcctgcgat cgccgctttt ctcgctcgga tgagcttacc cgccatatcc gcatccacac 1320

aggccagaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgta gtgaccacct 1380

taccacccac atccgcaccc acacaggcgg cggccgcagg aggaagaaac gcaccagcat 1440

agagaccaac atccgtgtgg ccttagagaa gagtttcttg gagaatcaaa agcctacctc 1500

ggaagagatc actatgattg ctgatcagct caatatggaa aaagaggtga ttcgtgtttg 1560

gttctgtaac cgccgccaga aagaaaaaag aatcaacact agactggggg ccttgcttgg 1620

caacagcaca gacccagctg tgttcacaga cctggcatcc gtggacaact ccgagtttca 1680

gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 1740

gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 1800

tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 1860

ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccg gatccagcgg 1920

catctctctg attgcggcgc tggcagttga ctacgttatt ggcatggaaa acgcgatgcc 1980

atggaacctc ccggctgacc tggcgtggtt caaacgtaac accctgaaca aacctgtgat 2040

catgggtcgt cacacctggg aatctattgg ccgtcctctc ccgggtcgta aaaacatcat 2100

tctgtcttct cagccaggca ccgacgaccg tgttacctgg gttaaaagcg ttgacgaagc 2160

gattgctgcg tgcggtgatg ttcctgaaat tatggtgatc ggcggtggcc gtgttatcga 2220

acagttcctg ccgaaagcgc agaaactgta cctgacccac atcgacgcgg aagttgaagg 2280

tgacacccac ttcccggact acgaaccgga tgattgggag agcgtattct ccgaattcca 2340

tgatgcggat gcgcaaaact ctcattctta ctgttttgaa atcctggaac gtcgtggatc 2400

ctgaatcggg ctagcacgcg tttaggatcc cttgtacagc tcgtccatgc cgagagtgat 2460

cccggcggcg gtcacgaact ccagcaggac catgtgatcg cgcttctcgt tggggtcttt 2520

gctcagggcg gactgggtgc tcaggtagtg gttgtcgggc agcagcacgg ggccgtcgcc 2580

gatgggggtg ttctgctggt agtggtcggc gagctgcacg ctgccgtcct cgatgttgtg 2640

gcggatcttg aagttcacct tgatgccgtt cttctgcttg tcggccatga tatagacgtt 2700

gtggctgttg tagttgtact ccagcttgtg ccccaggatg ttgccgtcct ccttgaagtc 2760

gatgcccttc agctcgatgc ggttcaccag ggtgtcgccc tcgaacttca cctcggcgcg 2820

ggtcttgtag ttgccgtcgt ccttgaagaa gatggtgcgc tcctggacgt agccttcggg 2880

catggcggac ttgaagaagt cgtgctgctt catgtggtcg gggtagcggc tgaagcactg 2940

cacgccgtag gtcagggtgg tcacgagggt gggccagggc acgggcagct tgccggtggt 3000

gcagatgaac ttcagggtca gcttgccgta ggtggcatcg ccctcgccct cgccggacac 3060

gctgaacttg tggccgttta cgtcgccgtc cagctcgacc aggatgggca ccaccccggt 3120

gaacagctcc tcgcccttgc tcaccatggt ggctggatca gagctcggta ccaagctatc 3180

tggtagtaga ctagtggccc ccattatata ccctctagag ctagaacgcc catcattact 3240

ggagcgccca tcattagtct accgcccatc attactctag cgcccatcat tagctagacg 3300

cccatcatta ctcgtgcgcc catcattagt cgtccgccca tcattactcg tgcgcccatc 3360

atta 3364

<210> 18

<211> 398

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 18

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Ser Ser Gly Ile Ser

225 230 235 240

Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met Glu Asn Ala

245 250 255

Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys Arg Asn Thr

260 265 270

Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu Ser Ile Gly

275 280 285

Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser Gln Pro Gly

290 295 300

Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu Ala Ile Ala

305 310 315 320

Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly Gly Arg Val

325 330 335

Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu Thr His Ile

340 345 350

Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr Glu Pro Asp

355 360 365

Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp Ala Gln Asn

370 375 380

Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg Gly Ser

385 390 395

<210> 19

<211> 241

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 19

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Gly

225 230 235 240

Ser

<210> 20

<211> 1818

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 20

taatgatggg cgcacgagta atgatgggcg gacgactaat gatgggcgca cgagtaatga 60

tgggcgtcta gctaatgatg ggcgctagag taatgatggg cggtagacta atgatgggcg 120

ctccagtaat gatgggcgtt ctagctctag agggtatata atgggggcca ctagttctag 180

aggatcacca tgtgccacca acagctcgtg atcagctggt tctccctggt gttcctggct 240

agccccctgg tggccatctg ggagctcaag aaagacgtgt acgtggtgga actggactgg 300

taccccgacg cccctggcga aatggtggtg ctgacatgcg acacccctga ggaggatggc 360

attacctgga ccctcgatca gagctccgag gtgctgggca gcggcaaaac cctgaccatc 420

caggtgaagg agtttggcga tgccggccag tacacatgtc acaagggcgg cgaggtgctg 480

agccactccc tgctgctgct ccacaagaag gaagatggca tctggagcac cgacattctg 540

aaggatcaga aggagcccaa gaacaagaca ttcctgaggt gtgaggccaa gaactacagc 600

ggcaggttta cctgctggtg gctgacaaca atcagcaccg acctcacatt ctccgtcaag 660

tcctccaggg gttcttccga ccctcaaggc gtgacatgcg gcgctgccac cctgagcgct 720

gagagagtca ggggcgacaa caaggagtac gagtacagcg tcgaatgtca ggaggacagc 780

gcctgtcccg ccgctgaaga gagcctgcct atcgaggtga tggtggacgc cgtgcacaaa 840

ctgaagtatg agaattacac ctccagcttc ttcatcaggg acatcatcaa acccgatccc 900

cccaagaacc tgcagctgaa gcctctgaag aacagcagac aggtcgaagt gtcctgggag 960

taccctgata cctggtccac accccacagc tacttcagcc tgaccttttg cgtgcaggtg 1020

cagggcaaga gcaaaaggga gaagaaggac agggtgttta ccgacaagac ctccgccaca 1080

gtgatttgca gaaagaacgc ctccatcagc gtgagggccc aggacaggta ttacagcagc 1140

tcctggagcg aatgggctag cgtgccctgt agcggaggag gaggcagcgg aggaggaggt 1200

tctggaggag gcggcagcag aaacctgcct gtcgctaccc ccgaccccgg aatgttcccc 1260

tgcctgcacc actcccagaa cctcctgagg gccgtgtcca acatgctgca gaaggctaga 1320

cagaccctcg aattctaccc ctgtaccagc gaggagatcg accatgagga catcaccaag 1380

gataagacca gcaccgtgga ggcttgcctg cctctggagc tgaccaaaaa cgagagctgc 1440

ctgaacagca gggaaaccag cttcattacc aacggctcct gcctggcctc caggaagaca 1500

tccttcatga tggccctgtg cctcagcagc atctacgagg acctgaagat gtatcaggtg 1560

gagtttaaga ccatgaatgc caagctgctg atggacccta agaggcagat cttcctggac 1620

cagaatatgc tggccgtgat tgacgagctg atgcaggccc tcaactttaa cagcgagacc 1680

gtgccccaga aaagcagcct cgaagagcct gacttctaca aaaccaagat taagctgtgt 1740

atcctgctgc acgccttcag gatcagggcc gtgaccatcg acagggtgat gagctacctg 1800

aacgccagcg gatcctaa 1818

<210> 21

<211> 542

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 21

Met Cys His Gln Gln Leu Val Ile Ser Trp Phe Ser Leu Val Phe Leu

1 5 10 15

Ala Ser Pro Leu Val Ala Ile Trp Glu Leu Lys Lys Asp Val Tyr Val

20 25 30

Val Glu Leu Asp Trp Tyr Pro Asp Ala Pro Gly Glu Met Val Val Leu

35 40 45

Thr Cys Asp Thr Pro Glu Glu Asp Gly Ile Thr Trp Thr Leu Asp Gln

50 55 60

Ser Ser Glu Val Leu Gly Ser Gly Lys Thr Leu Thr Ile Gln Val Lys

65 70 75 80

Glu Phe Gly Asp Ala Gly Gln Tyr Thr Cys His Lys Gly Gly Glu Val

85 90 95

Leu Ser His Ser Leu Leu Leu Leu His Lys Lys Glu Asp Gly Ile Trp

100 105 110

Ser Thr Asp Ile Leu Lys Asp Gln Lys Glu Pro Lys Asn Lys Thr Phe

115 120 125

Leu Arg Cys Glu Ala Lys Asn Tyr Ser Gly Arg Phe Thr Cys Trp Trp

130 135 140

Leu Thr Thr Ile Ser Thr Asp Leu Thr Phe Ser Val Lys Ser Ser Arg

145 150 155 160

Gly Ser Ser Asp Pro Gln Gly Val Thr Cys Gly Ala Ala Thr Leu Ser

165 170 175

Ala Glu Arg Val Arg Gly Asp Asn Lys Glu Tyr Glu Tyr Ser Val Glu

180 185 190

Cys Gln Glu Asp Ser Ala Cys Pro Ala Ala Glu Glu Ser Leu Pro Ile

195 200 205

Glu Val Met Val Asp Ala Val His Lys Leu Lys Tyr Glu Asn Tyr Thr

210 215 220

Ser Ser Phe Phe Ile Arg Asp Ile Ile Lys Pro Asp Pro Pro Lys Asn

225 230 235 240

Leu Gln Leu Lys Pro Leu Lys Asn Ser Arg Gln Val Glu Val Ser Trp

245 250 255

Glu Tyr Pro Asp Thr Trp Ser Thr Pro His Ser Tyr Phe Ser Leu Thr

260 265 270

Phe Cys Val Gln Val Gln Gly Lys Ser Lys Arg Glu Lys Lys Asp Arg

275 280 285

Val Phe Thr Asp Lys Thr Ser Ala Thr Val Ile Cys Arg Lys Asn Ala

290 295 300

Ser Ile Ser Val Arg Ala Gln Asp Arg Tyr Tyr Ser Ser Ser Trp Ser

305 310 315 320

Glu Trp Ala Ser Val Pro Cys Ser Gly Gly Gly Gly Ser Gly Gly Gly

325 330 335

Gly Ser Gly Gly Gly Gly Ser Arg Asn Leu Pro Val Ala Thr Pro Asp

340 345 350

Pro Gly Met Phe Pro Cys Leu His His Ser Gln Asn Leu Leu Arg Ala

355 360 365

Val Ser Asn Met Leu Gln Lys Ala Arg Gln Thr Leu Glu Phe Tyr Pro

370 375 380

Cys Thr Ser Glu Glu Ile Asp His Glu Asp Ile Thr Lys Asp Lys Thr

385 390 395 400

Ser Thr Val Glu Ala Cys Leu Pro Leu Glu Leu Thr Lys Asn Glu Ser

405 410 415

Cys Leu Asn Ser Arg Glu Thr Ser Phe Ile Thr Asn Gly Ser Cys Leu

420 425 430

Ala Ser Arg Lys Thr Ser Phe Met Met Ala Leu Cys Leu Ser Ser Ile

435 440 445

Tyr Glu Asp Leu Lys Met Tyr Gln Val Glu Phe Lys Thr Met Asn Ala

450 455 460

Lys Leu Leu Met Asp Pro Lys Arg Gln Ile Phe Leu Asp Gln Asn Met

465 470 475 480

Leu Ala Val Ile Asp Glu Leu Met Gln Ala Leu Asn Phe Asn Ser Glu

485 490 495

Thr Val Pro Gln Lys Ser Ser Leu Glu Glu Pro Asp Phe Tyr Lys Thr

500 505 510

Lys Ile Lys Leu Cys Ile Leu Leu His Ala Phe Arg Ile Arg Ala Val

515 520 525

Thr Ile Asp Arg Val Met Ser Tyr Leu Asn Ala Ser Gly Ser

530 535 540

<210> 22

<211> 1107

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 22

cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 60

aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 120

ataaacaagt tcctctcact ctctgatatt catttctttg caagttagga tcccttgtac 180

agctcgtcca tgccgagagt gatcccggcg gcggtcacga actccagcag gaccatgtga 240

tcgcgcttct cgttggggtc tttgctcagg gcggactggg tgctcaggta gtggttgtcg 300

ggcagcagca cggggccgtc gccgatgggg gtgttctgct ggtagtggtc ggcgagctgc 360

acgctgccgt cctcgatgtt gtggcggatc ttgaagttca ccttgatgcc gttcttctgc 420

ttgtcggcca tgatatagac gttgtggctg ttgtagttgt actccagctt gtgccccagg 480

atgttgccgt cctccttgaa gtcgatgccc ttcagctcga tgcggttcac cagggtgtcg 540

ccctcgaact tcacctcggc gcgggtcttg tagttgccgt cgtccttgaa gaagatggtg 600

cgctcctgga cgtagccttc gggcatggcg gacttgaaga agtcgtgctg cttcatgtgg 660

tcggggtagc ggctgaagca ctgcacgccg taggtcaggg tggtcacgag ggtgggccag 720

ggcacgggca gcttgccggt ggtgcagatg aacttcaggg tcagcttgcc gtaggtggca 780

tcgccctcgc cctcgccgga cacgctgaac ttgtggccgt ttacgtcgcc gtccagctcg 840

accaggatgg gcaccacccc ggtgaacagc tcctcgccct tgctcaccat ggtggctgga 900

tcagagctcg gtaccaagct atctggtagt agactagtgg cccccattat ataccctcta 960

gagctagaac gcccatcatt actggagcgc ccatcattag tctaccgccc atcattactc 1020

tagcgcccat cattagctag acgcccatca ttactcgtgc gcccatcatt agtcgtccgc 1080

ccatcattac tcgtgcgccc atcatta 1107

<210> 23

<211> 241

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 23

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Gly

225 230 235 240

Ser

<210> 24

<211> 3360

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 24

taatgatggg cgcacgagta atgatgggcg gacgactaat gatgggcgca cgagtaatga 60

tgggcgtcta gctaatgatg ggcgctagag taatgatggg cggtagacta atgatgggcg 120

ctccagtaat gatgggcgtt ctagctctag agggtatata atgggggcca ctagtctact 180

accagatagc ttggtaccga gctctgatcc agccaccatg gtgagcaagg gcgaggagct 240

gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 300

cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat 360

ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg 420

cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc 480

catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 540

gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 600

catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 660

ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat 720

ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc 780

catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct 840

gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 900

cgggatcact ctcggcatgg acgagctgta caagggatcc taaatcgggc tagccacgtg 960

aggctccggt gcccgtcagt gggcagagcg cacatcgccc acagtccccg agaagttggg 1020

gggaggggtc ggcaattgaa ccggtgccta gagaaggtgg cgcggggtaa actgggaaag 1080

tgatgtcgtg tactggctcc gcctttttcc cgagggtggg ggagaaccgt atataagtgc 1140

agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc gccagaacac aggtaagtgc 1200

cgtgtgtggt tcccgcgggc ctggcctctt tacgggttat ggcccttgcg tgccttgaat 1260

tacttccacc tggctgcagt acgtgattct tgatcccgag cttcgggttg gaagtgggtg 1320

ggagagttcg aggccttgcg cttaaggagc cccttcgcct cgtgcttgag ttgaggcctg 1380

gcctgggcgc tggggccgcc gcgtgcgaat ctggtggcac cttcgcgcct gtctcgctgc 1440

tttcgataag tctctagcca tttaaaattt ttgatgacct gctgcgacgc tttttttctg 1500

gcaagatagt cttgtaaatg cgggccaaga tctgcacact ggtatttcgg tttttggggc 1560

cgcgggcggc gacggggccc gtgcgtccca gcgcacatgt tcggcgaggc ggggcctgcg 1620

agcgcggcca ccgagaatcg gacgggggta gtctcaagct ggccggcctg ctctggtgcc 1680

tggcctcgcg ccgccgtgta tcgccccgcc ctgggcggca aggctggccc ggtcggcacc 1740

agttgcgtga gcggaaagat ggccgcttcc cggccctgct gcagggagct caaaatggag 1800

gacgcggcgc tcgggagagc gggcgggtga gtcacccaca caaaggaaaa gggcctttcc 1860

gtcctcagcc gtcgcttcat gtgactccac tgagtaccgg gcgccgtcca ggcacctcga 1920

ttagttctcg agcttttgga gtacgtcgtc tttaggttgg ggggaggggt tttatgcgat 1980

ggagtttccc cacactgagt gggtggagac tgaagttagg ccagcttggc acttgatgta 2040

attctccttg gaatttgccc tttttgagtt tggatcttgg ttcattctca agcctcagac 2100

agtggttcaa agtttttttc ttccatttca ggtgtcgtga tctagaggat cactagtgcc 2160

accatggcac ctaagaaaaa gaggaaggtt gaacgcccat atgcttgccc tgtcgagtcc 2220

tgcgatcgcc gcttttctcg ctcggatgag cttacccgcc atatccgcat ccacacaggc 2280

cagaagccct tccagtgtcg aatctgcatg cgtaacttca gtcgtagtga ccaccttacc 2340

acccacatcc gcacccacac aggcggcggc cgcaggagga agaaacgcac cagcatagag 2400

accaacatcc gtgtggcctt agagaagagt ttcttggaga atcaaaagcc tacctcggaa 2460

gagatcacta tgattgctga tcagctcaat atggaaaaag aggtgattcg tgtttggttc 2520

tgtaaccgcc gccagaaaga aaaaagaatc aacactagac tgggggcctt gcttggcaac 2580

agcacagacc cagctgtgtt cacagacctg gcatccgtgg acaactccga gtttcagcag 2640

ctgctgaacc agggcatacc tgtggccccc cacacaactg agcccatgct gatggagtac 2700

cctgaggcta taactcgcct agtgacaggg gcccagaggc cccccgaccc agctcctgct 2760

ccactggggg ccccggggct ccccaatggc ctcctttcag gagatgaaga cttctcctcc 2820

attgcggaca tggacttctc agccctgctg agtcagatca gctccggatc cagcggcatc 2880

tctctgattg cggcgctggc agttgactac gttattggca tggaaaacgc gatgccatgg 2940

aacctcccgg ctgacctggc gtggttcaaa cgtaacaccc tgaacaaacc tgtgatcatg 3000

ggtcgtcaca cctgggaatc tattggccgt cctctcccgg gtcgtaaaaa catcattctg 3060

tcttctcagc caggcaccga cgaccgtgtt acctgggtta aaagcgttga cgaagcgatt 3120

gctgcgtgcg gtgatgttcc tgaaattatg gtgatcggcg gtggccgtgt tatcgaacag 3180

ttcctgccga aagcgcagaa actgtacctg acccacatcg acgcggaagt tgaaggtgac 3240

acccacttcc cggactacga accggatgat tgggagagcg tattctccga attccatgat 3300

gcggatgcgc aaaactctca ttcttactgt tttgaaatcc tggaacgtcg tggatcctga 3360

<210> 25

<211> 241

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 25

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Gly

225 230 235 240

Ser

<210> 26

<211> 398

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 26

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Ser Ser Gly Ile Ser

225 230 235 240

Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met Glu Asn Ala

245 250 255

Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys Arg Asn Thr

260 265 270

Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu Ser Ile Gly

275 280 285

Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser Gln Pro Gly

290 295 300

Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu Ala Ile Ala

305 310 315 320

Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly Gly Arg Val

325 330 335

Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu Thr His Ile

340 345 350

Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr Glu Pro Asp

355 360 365

Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp Ala Gln Asn

370 375 380

Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg Gly Ser

385 390 395

<210> 27

<211> 2701

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 27

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360

ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420

cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480

ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540

tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600

gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660

tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720

tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780

caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840

ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900

ttccgtcctc agccgtcgct tcatgtgact ccactgagta ccgggcgccg tccaggcacc 960

tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020

cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080

tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140

agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgatctaga ggatcactag 1200

tgccaccatg gcacctaaga aaaagaggaa ggttgaacgc ccatatgctt gccctgtcga 1260

gtcctgcgat cgccgctttt ctcgctcgga tgagcttacc cgccatatcc gcatccacac 1320

aggccagaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgta gtgaccacct 1380

taccacccac atccgcaccc acacaggcgg cggccgcagg aggaagaaac gcaccagcat 1440

agagaccaac atccgtgtgg ccttagagaa gagtttcttg gagaatcaaa agcctacctc 1500

ggaagagatc actatgattg ctgatcagct caatatggaa aaagaggtga ttcgtgtttg 1560

gttctgtaac cgccgccaga aagaaaaaag aatcaacact agactggggg ccttgcttgg 1620

caacagcaca gacccagctg tgttcacaga cctggcatcc gtggacaact ccgagtttca 1680

gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 1740

gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 1800

tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 1860

ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccg gatcctccca 1920

tcactggggg tacggcaaac acaacggacc tgagcactgg cataaggact tccccattgc 1980

caagggagag cgccagtccc ctgttgacat cgacactcat acagccaagt atgacccttc 2040

cctgaagccc ctgtctgttt cctatgatca agcaacttcc ctgaggatcc tcaacaatgg 2100

tcatgctttc aacgtggagt ttgatgactc tcaggacaaa gcagtgctca agggaggacc 2160

cctggatggc acttacagat tgattcagtt tcactttcac tggggttcac ttgatggaca 2220

aggttcagag catactgtgg ataaaaagaa atatgctgca gaacttcact tggttcactg 2280

gaacaccaaa tatggggatt ttgggaaagc tgtgcagcaa cctgatggac tggccgttct 2340

aggtattttt ttgaaggttg gcagcgctaa accgggccat cagaaagttg ttgatgtgct 2400

ggattccatt aaaacaaagg gcaagagtgc tgacttcact aacttcgatc ctcgtggcct 2460

ccttcctgaa tccctggatt actggaccta cccaggctca ctgaccaccc ctcctcttct 2520

ggaatgtgtg acctggattg tgctcaagga acccatcagc gtcagcagcg agcaggtgtt 2580

gaaattccgt aaacttaact tcaatgggga gggtgaaccc gaagaactga tggtggacaa 2640

ctggcgccca gctcagccac tgaagaacag gcaaatcaaa gcttccttca aaggatcctg 2700

a 2701

<210> 28

<211> 497

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 28

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Ser Ser His His Trp

225 230 235 240

Gly Tyr Gly Lys His Asn Gly Pro Glu His Trp His Lys Asp Phe Pro

245 250 255

Ile Ala Lys Gly Glu Arg Gln Ser Pro Val Asp Ile Asp Thr His Thr

260 265 270

Ala Lys Tyr Asp Pro Ser Leu Lys Pro Leu Ser Val Ser Tyr Asp Gln

275 280 285

Ala Thr Ser Leu Arg Ile Leu Asn Asn Gly His Ala Phe Asn Val Glu

290 295 300

Phe Asp Asp Ser Gln Asp Lys Ala Val Leu Lys Gly Gly Pro Leu Asp

305 310 315 320

Gly Thr Tyr Arg Leu Ile Gln Phe His Phe His Trp Gly Ser Leu Asp

325 330 335

Gly Gln Gly Ser Glu His Thr Val Asp Lys Lys Lys Tyr Ala Ala Glu

340 345 350

Leu His Leu Val His Trp Asn Thr Lys Tyr Gly Asp Phe Gly Lys Ala

355 360 365

Val Gln Gln Pro Asp Gly Leu Ala Val Leu Gly Ile Phe Leu Lys Val

370 375 380

Gly Ser Ala Lys Pro Gly His Gln Lys Val Val Asp Val Leu Asp Ser

385 390 395 400

Ile Lys Thr Lys Gly Lys Ser Ala Asp Phe Thr Asn Phe Asp Pro Arg

405 410 415

Gly Leu Leu Pro Glu Ser Leu Asp Tyr Trp Thr Tyr Pro Gly Ser Leu

420 425 430

Thr Thr Pro Pro Leu Leu Glu Cys Val Thr Trp Ile Val Leu Lys Glu

435 440 445

Pro Ile Ser Val Ser Ser Glu Gln Val Leu Lys Phe Arg Lys Leu Asn

450 455 460

Phe Asn Gly Glu Gly Glu Pro Glu Glu Leu Met Val Asp Asn Trp Arg

465 470 475 480

Pro Ala Gln Pro Leu Lys Asn Arg Gln Ile Lys Ala Ser Phe Lys Gly

485 490 495

Ser

<210> 29

<211> 943

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 29

taatgatggg cgcacgagta atgatgggcg gacgactaat gatgggcgca cgagtaatga 60

tgggcgtcta gctaatgatg ggcgctagag taatgatggg cggtagacta atgatgggcg 120

ctccagtaat gatgggcgtt ctagctctag agggtatata atgggggcca ctagtctact 180

accagatagc ttggtaccga gctctgatcc agccaccatg gtgagcaagg gcgaggagct 240

gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 300

cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat 360

ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg 420

cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc 480

catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 540

gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 600

catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 660

ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat 720

ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc 780

catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct 840

gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 900

cgggatcact ctcggcatgg acgagctgta caagggatcc taa 943

<210> 30

<211> 241

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 30

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Gly

225 230 235 240

Ser

<210> 31

<211> 3811

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 31

cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 60

aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 120

ataaacaagt tcctctcact ctctgatatt catttctttg caagttagga tcccttgtac 180

agctcgtcca tgccgagagt gatcccggcg gcggtcacga actccagcag gaccatgtga 240

tcgcgcttct cgttggggtc tttgctcagg gcggactggg tgctcaggta gtggttgtcg 300

ggcagcagca cggggccgtc gccgatgggg gtgttctgct ggtagtggtc ggcgagctgc 360

acgctgccgt cctcgatgtt gtggcggatc ttgaagttca ccttgatgcc gttcttctgc 420

ttgtcggcca tgatatagac gttgtggctg ttgtagttgt actccagctt gtgccccagg 480

atgttgccgt cctccttgaa gtcgatgccc ttcagctcga tgcggttcac cagggtgtcg 540

ccctcgaact tcacctcggc gcgggtcttg tagttgccgt cgtccttgaa gaagatggtg 600

cgctcctgga cgtagccttc gggcatggcg gacttgaaga agtcgtgctg cttcatgtgg 660

tcggggtagc ggctgaagca ctgcacgccg taggtcaggg tggtcacgag ggtgggccag 720

ggcacgggca gcttgccggt ggtgcagatg aacttcaggg tcagcttgcc gtaggtggca 780

tcgccctcgc cctcgccgga cacgctgaac ttgtggccgt ttacgtcgcc gtccagctcg 840

accaggatgg gcaccacccc ggtgaacagc tcctcgccct tgctcaccat ggtggctgga 900

tcagagctcg gtaccaagct atctggtagt agactagtgg cccccattat ataccctcta 960

gagctagaac gcccatcatt actggagcgc ccatcattag tctaccgccc atcattactc 1020

tagcgcccat cattagctag acgcccatca ttactcgtgc gcccatcatt agtcgtccgc 1080

ccatcattac tcgtgcgccc atcattagca cgtgaggctc cggtgcccgt cagtgggcag 1140

agcgcacatc gcccacagtc cccgagaagt tggggggagg ggtcggcaat tgaaccggtg 1200

cctagagaag gtggcgcggg gtaaactggg aaagtgatgt cgtgtactgg ctccgccttt 1260

ttcccgaggg tgggggagaa ccgtatataa gtgcagtagt cgccgtgaac gttctttttc 1320

gcaacgggtt tgccgccaga acacaggtaa gtgccgtgtg tggttcccgc gggcctggcc 1380

tctttacggg ttatggccct tgcgtgcctt gaattacttc cacctggctg cagtacgtga 1440

ttcttgatcc cgagcttcgg gttggaagtg ggtgggagag ttcgaggcct tgcgcttaag 1500

gagccccttc gcctcgtgct tgagttgagg cctggcctgg gcgctggggc cgccgcgtgc 1560

gaatctggtg gcaccttcgc gcctgtctcg ctgctttcga taagtctcta gccatttaaa 1620

atttttgatg acctgctgcg acgctttttt tctggcaaga tagtcttgta aatgcgggcc 1680

aagatctgca cactggtatt tcggtttttg gggccgcggg cggcgacggg gcccgtgcgt 1740

cccagcgcac atgttcggcg aggcggggcc tgcgagcgcg gccaccgaga atcggacggg 1800

ggtagtctca agctggccgg cctgctctgg tgcctggcct cgcgccgccg tgtatcgccc 1860

cgccctgggc ggcaaggctg gcccggtcgg caccagttgc gtgagcggaa agatggccgc 1920

ttcccggccc tgctgcaggg agctcaaaat ggaggacgcg gcgctcggga gagcgggcgg 1980

gtgagtcacc cacacaaagg aaaagggcct ttccgtcctc agccgtcgct tcatgtgact 2040

ccactgagta ccgggcgccg tccaggcacc tcgattagtt ctcgagcttt tggagtacgt 2100

cgtctttagg ttggggggag gggttttatg cgatggagtt tccccacact gagtgggtgg 2160

agactgaagt taggccagct tggcacttga tgtaattctc cttggaattt gccctttttg 2220

agtttggatc ttggttcatt ctcaagcctc agacagtggt tcaaagtttt tttcttccat 2280

ttcaggtgtc gtgatctaga ggatcactag tgccaccatg gcacctaaga aaaagaggaa 2340

ggttgaacgc ccatatgctt gccctgtcga gtcctgcgat cgccgctttt ctcgctcgga 2400

tgagcttacc cgccatatcc gcatccacac aggccagaag cccttccagt gtcgaatctg 2460

catgcgtaac ttcagtcgta gtgaccacct taccacccac atccgcaccc acacaggcgg 2520

cggccgcagg aggaagaaac gcaccagcat agagaccaac atccgtgtgg ccttagagaa 2580

gagtttcttg gagaatcaaa agcctacctc ggaagagatc actatgattg ctgatcagct 2640

caatatggaa aaagaggtga ttcgtgtttg gttctgtaac cgccgccaga aagaaaaaag 2700

aatcaacact agactggggg ccttgcttgg caacagcaca gacccagctg tgttcacaga 2760

cctggcatcc gtggacaact ccgagtttca gcagctgctg aaccagggca tacctgtggc 2820

cccccacaca actgagccca tgctgatgga gtaccctgag gctataactc gcctagtgac 2880

aggggcccag aggccccccg acccagctcc tgctccactg ggggccccgg ggctccccaa 2940

tggcctcctt tcaggagatg aagacttctc ctccattgcg gacatggact tctcagccct 3000

gctgagtcag atcagctccg gatcctccca tcactggggg tacggcaaac acaacggacc 3060

tgagcactgg cataaggact tccccattgc caagggagag cgccagtccc ctgttgacat 3120

cgacactcat acagccaagt atgacccttc cctgaagccc ctgtctgttt cctatgatca 3180

agcaacttcc ctgaggatcc tcaacaatgg tcatgctttc aacgtggagt ttgatgactc 3240

tcaggacaaa gcagtgctca agggaggacc cctggatggc acttacagat tgattcagtt 3300

tcactttcac tggggttcac ttgatggaca aggttcagag catactgtgg ataaaaagaa 3360

atatgctgca gaacttcact tggttcactg gaacaccaaa tatggggatt ttgggaaagc 3420

tgtgcagcaa cctgatggac tggccgttct aggtattttt ttgaaggttg gcagcgctaa 3480

accgggccat cagaaagttg ttgatgtgct ggattccatt aaaacaaagg gcaagagtgc 3540

tgacttcact aacttcgatc ctcgtggcct ccttcctgaa tccctggatt actggaccta 3600

cccaggctca ctgaccaccc ctcctcttct ggaatgtgtg acctggattg tgctcaagga 3660

acccatcagc gtcagcagcg agcaggtgtt gaaattccgt aaacttaact tcaatgggga 3720

gggtgaaccc gaagaactga tggtggacaa ctggcgccca gctcagccac tgaagaacag 3780

gcaaatcaaa gcttccttca aaggatcctg a 3811

<210> 32

<211> 241

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 32

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Gly

225 230 235 240

Ser

<210> 33

<211> 497

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 33

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Ser Ser His His Trp

225 230 235 240

Gly Tyr Gly Lys His Asn Gly Pro Glu His Trp His Lys Asp Phe Pro

245 250 255

Ile Ala Lys Gly Glu Arg Gln Ser Pro Val Asp Ile Asp Thr His Thr

260 265 270

Ala Lys Tyr Asp Pro Ser Leu Lys Pro Leu Ser Val Ser Tyr Asp Gln

275 280 285

Ala Thr Ser Leu Arg Ile Leu Asn Asn Gly His Ala Phe Asn Val Glu

290 295 300

Phe Asp Asp Ser Gln Asp Lys Ala Val Leu Lys Gly Gly Pro Leu Asp

305 310 315 320

Gly Thr Tyr Arg Leu Ile Gln Phe His Phe His Trp Gly Ser Leu Asp

325 330 335

Gly Gln Gly Ser Glu His Thr Val Asp Lys Lys Lys Tyr Ala Ala Glu

340 345 350

Leu His Leu Val His Trp Asn Thr Lys Tyr Gly Asp Phe Gly Lys Ala

355 360 365

Val Gln Gln Pro Asp Gly Leu Ala Val Leu Gly Ile Phe Leu Lys Val

370 375 380

Gly Ser Ala Lys Pro Gly His Gln Lys Val Val Asp Val Leu Asp Ser

385 390 395 400

Ile Lys Thr Lys Gly Lys Ser Ala Asp Phe Thr Asn Phe Asp Pro Arg

405 410 415

Gly Leu Leu Pro Glu Ser Leu Asp Tyr Trp Thr Tyr Pro Gly Ser Leu

420 425 430

Thr Thr Pro Pro Leu Leu Glu Cys Val Thr Trp Ile Val Leu Lys Glu

435 440 445

Pro Ile Ser Val Ser Ser Glu Gln Val Leu Lys Phe Arg Lys Leu Asn

450 455 460

Phe Asn Gly Glu Gly Glu Pro Glu Glu Leu Met Val Asp Asn Trp Arg

465 470 475 480

Pro Ala Gln Pro Leu Lys Asn Arg Gln Ile Lys Ala Ser Phe Lys Gly

485 490 495

Ser

<210> 34

<211> 2701

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 34

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360

ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420

cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480

ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540

tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600

gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660

tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720

tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780

caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840

ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900

ttccgtcctc agccgtcgct tcatgtgact ccactgagta ccgggcgccg tccaggcacc 960

tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020

cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080

tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140

agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgatctaga ggatcactag 1200

tgccaccatg gcacctaaga aaaagaggaa ggttgaacgc ccatatgctt gccctgtcga 1260

gtcctgcgat cgccgctttt ctcgctcgga tgagcttacc cgccatatcc gcatccacac 1320

aggccagaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgta gtgaccacct 1380

taccacccac atccgcaccc acacaggcgg cggccgcagg aggaagaaac gcaccagcat 1440

agagaccaac atccgtgtgg ccttagagaa gagtttcttg gagaatcaaa agcctacctc 1500

ggaagagatc actatgattg ctgatcagct caatatggaa aaagaggtga ttcgtgtttg 1560

gttctgtaac cgccgccaga aagaaaaaag aatcaacact agactggggg ccttgcttgg 1620

caacagcaca gacccagctg tgttcacaga cctggcatcc gtggacaact ccgagtttca 1680

gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 1740

gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 1800

tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 1860

ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccg gatcctccca 1920

tcactggggg tacggcaaac acaacggacc tgagcactgg cataaggact tccccattgc 1980

caagggagag cgccagtccc ctgttgacat cgacactcat acagccaagt atgacccttc 2040

cctgaagccc ctgtctgttt cctatgatca agcaacttcc ctgaggatcc tcaacaatgg 2100

tcatgctttc aacgtggagt ttgatgactc tcaggacaaa gcagtgctca agggaggacc 2160

cctggatggc acttacagat tgattcagtt tcactttcac tggggttcac ttgatggaca 2220

aggttcagag catactgtgg ataaaaagaa atatgctgca gaacttcact tggttcactg 2280

gaacaccaaa tatggggatt ttgggaaagc tgtgcagcaa cctgatggac tggccgttct 2340

aggtattttt ttgaaggttg gcagcgctaa accgggccat cagaaagttg ttgatgtgct 2400

ggattccatt aaaacaaagg gcaagagtgc tgacttcact aacttcgatc ctcgtggcct 2460

ccttcctgaa tccctggatt actggaccta cccaggctca ctgaccaccc ctcctcttct 2520

ggaatgtgtg acctggattg tgctcaagga acccatcagc gtcagcagcg agcaggtgtt 2580

gaaattccgt aaacttaact tcaatgggga gggtgaaccc gaagaactga tggtggacaa 2640

ctggcgccca gctcagccac tgaagaacag gcaaatcaaa gcttccttca aaggatcctg 2700

a 2701

<210> 35

<211> 497

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 35

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Ser Ser His His Trp

225 230 235 240

Gly Tyr Gly Lys His Asn Gly Pro Glu His Trp His Lys Asp Phe Pro

245 250 255

Ile Ala Lys Gly Glu Arg Gln Ser Pro Val Asp Ile Asp Thr His Thr

260 265 270

Ala Lys Tyr Asp Pro Ser Leu Lys Pro Leu Ser Val Ser Tyr Asp Gln

275 280 285

Ala Thr Ser Leu Arg Ile Leu Asn Asn Gly His Ala Phe Asn Val Glu

290 295 300

Phe Asp Asp Ser Gln Asp Lys Ala Val Leu Lys Gly Gly Pro Leu Asp

305 310 315 320

Gly Thr Tyr Arg Leu Ile Gln Phe His Phe His Trp Gly Ser Leu Asp

325 330 335

Gly Gln Gly Ser Glu His Thr Val Asp Lys Lys Lys Tyr Ala Ala Glu

340 345 350

Leu His Leu Val His Trp Asn Thr Lys Tyr Gly Asp Phe Gly Lys Ala

355 360 365

Val Gln Gln Pro Asp Gly Leu Ala Val Leu Gly Ile Phe Leu Lys Val

370 375 380

Gly Ser Ala Lys Pro Gly His Gln Lys Val Val Asp Val Leu Asp Ser

385 390 395 400

Ile Lys Thr Lys Gly Lys Ser Ala Asp Phe Thr Asn Phe Asp Pro Arg

405 410 415

Gly Leu Leu Pro Glu Ser Leu Asp Tyr Trp Thr Tyr Pro Gly Ser Leu

420 425 430

Thr Thr Pro Pro Leu Leu Glu Cys Val Thr Trp Ile Val Leu Lys Glu

435 440 445

Pro Ile Ser Val Ser Ser Glu Gln Val Leu Lys Phe Arg Lys Leu Asn

450 455 460

Phe Asn Gly Glu Gly Glu Pro Glu Glu Leu Met Val Asp Asn Trp Arg

465 470 475 480

Pro Ala Gln Pro Leu Lys Asn Arg Gln Ile Lys Ala Ser Phe Lys Gly

485 490 495

Ser

<210> 36

<211> 943

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 36

ttaggatccc ttgtacagct cgtccatgcc gagagtgatc ccggcggcgg tcacgaactc 60

cagcaggacc atgtgatcgc gcttctcgtt ggggtctttg ctcagggcgg actgggtgct 120

caggtagtgg ttgtcgggca gcagcacggg gccgtcgccg atgggggtgt tctgctggta 180

gtggtcggcg agctgcacgc tgccgtcctc gatgttgtgg cggatcttga agttcacctt 240

gatgccgttc ttctgcttgt cggccatgat atagacgttg tggctgttgt agttgtactc 300

cagcttgtgc cccaggatgt tgccgtcctc cttgaagtcg atgcccttca gctcgatgcg 360

gttcaccagg gtgtcgccct cgaacttcac ctcggcgcgg gtcttgtagt tgccgtcgtc 420

cttgaagaag atggtgcgct cctggacgta gccttcgggc atggcggact tgaagaagtc 480

gtgctgcttc atgtggtcgg ggtagcggct gaagcactgc acgccgtagg tcagggtggt 540

cacgagggtg ggccagggca cgggcagctt gccggtggtg cagatgaact tcagggtcag 600

cttgccgtag gtggcatcgc cctcgccctc gccggacacg ctgaacttgt ggccgtttac 660

gtcgccgtcc agctcgacca ggatgggcac caccccggtg aacagctcct cgcccttgct 720

caccatggtg gctggatcag agctcggtac caagctatct ggtagtagac tagtggcccc 780

cattatatac cctctagagc tagaacgccc atcattactg gagcgcccat cattagtcta 840

ccgcccatca ttactctagc gcccatcatt agctagacgc ccatcattac tcgtgcgccc 900

atcattagtc gtccgcccat cattactcgt gcgcccatca tta 943

<210> 37

<211> 241

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 37

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Gly

225 230 235 240

Ser

<210> 38

<211> 720

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 38

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480

ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720

<210> 39

<211> 239

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 39

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210> 40

<211> 2568

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 40

atgtctcacc actggggcta cggcaagcac aatggacctg agcactggca caaggacttc 60

cctatcgcca agggcgagag acagagcccc gtggacatcg atacccacac cgccaaatac 120

gaccccagcc tgaagcctct gagcgtgtcc tatgatcagg ccaccagcct gcgcatcctg 180

aacaatggcc acgccttcaa cgtggaattc gacgacagcc aggacaaggc cgtgctgaaa 240

ggtggacctc tggacggcac ctaccggctg atccagttcc actttcactg gggcagcctg 300

gatggccagg gatctgaaca caccgtggac aagaagaagt acgccgccga actgcacctg 360

gtgcactgga acaccaaata cggcgacttc ggcaaagccg tgcagcagcc tgatggactg 420

gctgtgctgg gcatcttcct gaaagtgggc tctgccaagc ctggcctgca gaaagtggtg 480

gacgtgctgg acagcatcaa gaccaagggc aagagcgccg acttcaccaa cttcgaccct 540

agaggactgc tgcccgagag cctggactac tggacatacc ctggcagcct gaccacacct 600

cctctgctgg aatgtgtgac ctggatcgtc ctgaaagagc ccatcagcgt cagcagcgaa 660

caggtgctga agttccggaa gctgaacttc aacggcgagg gcgagcctga ggaactgatg 720

gtggataatt ggaggcccgc tcagcccctg aagaacagac agatcaaggc cagcttcaag 780

ggcggctctg gcggaggatc tggaaccgcc aagatggaaa ccaccttcta cgacgacgcc 840

ctgaacgcca gctttctgcc ttctgagtct ggcccctacg gctacagcaa ccccaagatc 900

ctgaagcaga gcatgaccct gaacctggcc gatcctgtgg gcagcctgaa acctcacctg 960

agagccaaga acagcgacct gctgacaagc cctgatgtgg gcctgctgaa actggctagc 1020

cccgagctgg aacggctgat catccagtct agcaacggcc acatcaccac cacacctaca 1080

ccaacacagt ttctgtgccc caagaacgtg accgacgagc aagagggatt cgccgagggc 1140

tttgttagag ccctggccga actgcacagc cagaataccc tgcctagcgt gacatctgcc 1200

gctcagcctg ttaatggcgc cggaatggtt gctcctgccg tggcttctgt tgctggcgga 1260

tctggatctg gcggctttag cgcctctctg cactctgagc ctccagtgta cgccaacctg 1320

agcaacttca accctggcgc tcttagctct ggtggcggag caccttctta tggcgctgcc 1380

ggattggcct ttcctgctca gcctcagcag cagcaacagc ctcctcatca tctgccccag 1440

cagatgcctg tgcagcaccc tagactgcag gccctgaaag aggaacccca gacagtccct 1500

gagatgcccg gcgaaacacc tcctctgagc cccatcgaca tggaaagcca agagcggatc 1560

aaggccgagc ggaagcggat gagaaataga atcgccgcct ccaagtgccg gaagaggaag 1620

ctggaaagaa tcgcccggct ggaagagaaa gtgaaaaccc tgaaggccca gaactccgag 1680

ctggcctcta ccgccaacat gctgagagaa caggtggccc agctgaaaca gaaagtcatg 1740

aaccacgtga acagcggctg ccagctgatg ctgacacagc agctgcagac cttcggatcc 1800

ggagctacta acttcagcct gctgaagcag gctggagacg tggaggagaa ccctggacct 1860

ttgagcaagg gcgaggagga caacatggcc atcatcaagg agttcatgcg cttcaaggtg 1920

cacatggagg gctccgtgaa cggccacgag ttcgagatcg agggcgaggg cgagggccgc 1980

ccctacgagg gcacccagac cgccaagctg aaggtgacca agggcggccc cctgcccttc 2040

gcctgggaca tcctgtcccc tcagttcatg tacggctcca aggcctacgt gaagcacccc 2100

gccgacatcc ccgactactt gaagctgtcc ttccccgagg gcttcaagtg ggagcgcgtg 2160

atgaacttcg aggacggcgg cgtggtgacc gtgacccagg actcctccct gcaggacggc 2220

gagttcatct acaaggtgaa gctgcgcggc accaacttcc cctccgacgg ccccgtaatg 2280

cagaagaaga ccatgggctg ggaggcctcc tccgagcgga tgtaccccga ggacggcgcc 2340

ctgaagggcg agatcaagca gaggctgaag ctgaaggacg gcggccacta cgacgccgag 2400

gtcaagacca cctacaaggc caagaagccc gtgcagctgc ccggcgccta caacgtcaac 2460

atcaagctgg acatcacctc ccacaacgag gactacacca tcgtggaaca gtacgagcgc 2520

gccgagggcc gccactccac cggcggcatg gacgagctgt acaagtaa 2568

<210> 41

<211> 855

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 41

Met Ser His His Trp Gly Tyr Gly Lys His Asn Gly Pro Glu His Trp

1 5 10 15

His Lys Asp Phe Pro Ile Ala Lys Gly Glu Arg Gln Ser Pro Val Asp

20 25 30

Ile Asp Thr His Thr Ala Lys Tyr Asp Pro Ser Leu Lys Pro Leu Ser

35 40 45

Val Ser Tyr Asp Gln Ala Thr Ser Leu Arg Ile Leu Asn Asn Gly His

50 55 60

Ala Phe Asn Val Glu Phe Asp Asp Ser Gln Asp Lys Ala Val Leu Lys

65 70 75 80

Gly Gly Pro Leu Asp Gly Thr Tyr Arg Leu Ile Gln Phe His Phe His

85 90 95

Trp Gly Ser Leu Asp Gly Gln Gly Ser Glu His Thr Val Asp Lys Lys

100 105 110

Lys Tyr Ala Ala Glu Leu His Leu Val His Trp Asn Thr Lys Tyr Gly

115 120 125

Asp Phe Gly Lys Ala Val Gln Gln Pro Asp Gly Leu Ala Val Leu Gly

130 135 140

Ile Phe Leu Lys Val Gly Ser Ala Lys Pro Gly Leu Gln Lys Val Val

145 150 155 160

Asp Val Leu Asp Ser Ile Lys Thr Lys Gly Lys Ser Ala Asp Phe Thr

165 170 175

Asn Phe Asp Pro Arg Gly Leu Leu Pro Glu Ser Leu Asp Tyr Trp Thr

180 185 190

Tyr Pro Gly Ser Leu Thr Thr Pro Pro Leu Leu Glu Cys Val Thr Trp

195 200 205

Ile Val Leu Lys Glu Pro Ile Ser Val Ser Ser Glu Gln Val Leu Lys

210 215 220

Phe Arg Lys Leu Asn Phe Asn Gly Glu Gly Glu Pro Glu Glu Leu Met

225 230 235 240

Val Asp Asn Trp Arg Pro Ala Gln Pro Leu Lys Asn Arg Gln Ile Lys

245 250 255

Ala Ser Phe Lys Gly Gly Ser Gly Gly Gly Ser Gly Thr Ala Lys Met

260 265 270

Glu Thr Thr Phe Tyr Asp Asp Ala Leu Asn Ala Ser Phe Leu Pro Ser

275 280 285

Glu Ser Gly Pro Tyr Gly Tyr Ser Asn Pro Lys Ile Leu Lys Gln Ser

290 295 300

Met Thr Leu Asn Leu Ala Asp Pro Val Gly Ser Leu Lys Pro His Leu

305 310 315 320

Arg Ala Lys Asn Ser Asp Leu Leu Thr Ser Pro Asp Val Gly Leu Leu

325 330 335

Lys Leu Ala Ser Pro Glu Leu Glu Arg Leu Ile Ile Gln Ser Ser Asn

340 345 350

Gly His Ile Thr Thr Thr Pro Thr Pro Thr Gln Phe Leu Cys Pro Lys

355 360 365

Asn Val Thr Asp Glu Gln Glu Gly Phe Ala Glu Gly Phe Val Arg Ala

370 375 380

Leu Ala Glu Leu His Ser Gln Asn Thr Leu Pro Ser Val Thr Ser Ala

385 390 395 400

Ala Gln Pro Val Asn Gly Ala Gly Met Val Ala Pro Ala Val Ala Ser

405 410 415

Val Ala Gly Gly Ser Gly Ser Gly Gly Phe Ser Ala Ser Leu His Ser

420 425 430

Glu Pro Pro Val Tyr Ala Asn Leu Ser Asn Phe Asn Pro Gly Ala Leu

435 440 445

Ser Ser Gly Gly Gly Ala Pro Ser Tyr Gly Ala Ala Gly Leu Ala Phe

450 455 460

Pro Ala Gln Pro Gln Gln Gln Gln Gln Pro Pro His His Leu Pro Gln

465 470 475 480

Gln Met Pro Val Gln His Pro Arg Leu Gln Ala Leu Lys Glu Glu Pro

485 490 495

Gln Thr Val Pro Glu Met Pro Gly Glu Thr Pro Pro Leu Ser Pro Ile

500 505 510

Asp Met Glu Ser Gln Glu Arg Ile Lys Ala Glu Arg Lys Arg Met Arg

515 520 525

Asn Arg Ile Ala Ala Ser Lys Cys Arg Lys Arg Lys Leu Glu Arg Ile

530 535 540

Ala Arg Leu Glu Glu Lys Val Lys Thr Leu Lys Ala Gln Asn Ser Glu

545 550 555 560

Leu Ala Ser Thr Ala Asn Met Leu Arg Glu Gln Val Ala Gln Leu Lys

565 570 575

Gln Lys Val Met Asn His Val Asn Ser Gly Cys Gln Leu Met Leu Thr

580 585 590

Gln Gln Leu Gln Thr Phe Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu

595 600 605

Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Ser Lys Gly

610 615 620

Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe Met Arg Phe Lys Val

625 630 635 640

His Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu

645 650 655

Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val

660 665 670

Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln

675 680 685

Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro Ala Asp Ile Pro

690 695 700

Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val

705 710 715 720

Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser

725 730 735

Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys Leu Arg Gly Thr Asn

740 745 750

Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu

755 760 765

Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly Ala Leu Lys Gly Glu

770 775 780

Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly His Tyr Asp Ala Glu

785 790 795 800

Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val Gln Leu Pro Gly Ala

805 810 815

Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr

820 825 830

Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His Ser Thr Gly

835 840 845

Gly Met Asp Glu Leu Tyr Lys

850 855

<210> 42

<211> 2568

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 42

atgtctcacc actggggcta cggcaagcac aatggacctg agcactggca caaggacttc 60

cctatcgcca agggcgagag acagagcccc gtggacatcg atacccacac cgccaaatac 120

gaccccagcc tgaagcctct gagcgtgtcc tatgatcagg ccaccagcct gcgcatcctg 180

aacaatggcc acgccttcaa cgtggaattc gacgacagcc aggacaaggc cgtgctgaaa 240

ggtggacctc tggacggcac ctaccggctg atccagttcc actttcactg gggcagcctg 300

gatggccagg gatctgaaca caccgtggac aagaagaagt acgccgccga actgcacctg 360

gtgcactgga acaccaaata cggcgacttc ggcaaagccg tgcagcagcc tgatggactg 420

gctgtgctgg gcatcttcct gaaagtgggc tctgccaagc ctggccacca gaaagtggtg 480

gacgtgctgg acagcatcaa gaccaagggc aagagcgccg acttcaccaa cttcgaccct 540

agaggactgc tgcccgagag cctggactac tggacatacc ctggcagcct gaccacacct 600

cctctgctgg aatgtgtgac ctggatcgtc ctgaaagagc ccatcagcgt cagcagcgaa 660

caggtgctga agttccggaa gctgaacttc aacggcgagg gcgagcctga ggaactgatg 720

gtggataatt ggaggcccgc tcagcccctg aagaacagac agatcaaggc cagcttcaag 780

ggcggctctg gcggaggatc tggaaccgcc aagatggaaa ccaccttcta cgacgacgcc 840

ctgaacgcca gctttctgcc ttctgagtct ggcccctacg gctacagcaa ccccaagatc 900

ctgaagcaga gcatgaccct gaacctggcc gatcctgtgg gcagcctgaa acctcacctg 960

agagccaaga acagcgacct gctgacaagc cctgatgtgg gcctgctgaa actggctagc 1020

cccgagctgg aacggctgat catccagtct agcaacggcc acatcaccac cacacctaca 1080

ccaacacagt ttctgtgccc caagaacgtg accgacgagc aagagggatt cgccgagggc 1140

tttgttagag ccctggccga actgcacagc cagaataccc tgcctagcgt gacatctgcc 1200

gctcagcctg ttaatggcgc cggaatggtt gctcctgccg tggcttctgt tgctggcgga 1260

tctggatctg gcggctttag cgcctctctg cactctgagc ctccagtgta cgccaacctg 1320

agcaacttca accctggcgc tcttagctct ggtggcggag caccttctta tggcgctgcc 1380

ggattggcct ttcctgctca gcctcagcag cagcaacagc ctcctcatca tctgccccag 1440

cagatgcctg tgcagcaccc tagactgcag gccctgaaag aggaacccca gacagtccct 1500

gagatgcccg gcgaaacacc tcctctgagc cccatcgaca tggaaagcca agagcggatc 1560

aaggccgagc ggaagcggat gagaaataga atcgccgcct ccaagtgccg gaagaggaag 1620

ctggaaagaa tcgcccggct ggaagagaaa gtgaaaaccc tgaaggccca gaactccgag 1680

ctggcctcta ccgccaacat gctgagagaa caggtggccc agctgaaaca gaaagtcatg 1740

aaccacgtga acagcggctg ccagctgatg ctgacacagc agctgcagac cttcggatcc 1800

ggagctacta acttcagcct gctgaagcag gctggagacg tggaggagaa ccctggacct 1860

ttgagcaagg gcgaggagga caacatggcc atcatcaagg agttcatgcg cttcaaggtg 1920

cacatggagg gctccgtgaa cggccacgag ttcgagatcg agggcgaggg cgagggccgc 1980

ccctacgagg gcacccagac cgccaagctg aaggtgacca agggcggccc cctgcccttc 2040

gcctgggaca tcctgtcccc tcagttcatg tacggctcca aggcctacgt gaagcacccc 2100

gccgacatcc ccgactactt gaagctgtcc ttccccgagg gcttcaagtg ggagcgcgtg 2160

atgaacttcg aggacggcgg cgtggtgacc gtgacccagg actcctccct gcaggacggc 2220

gagttcatct acaaggtgaa gctgcgcggc accaacttcc cctccgacgg ccccgtaatg 2280

cagaagaaga ccatgggctg ggaggcctcc tccgagcgga tgtaccccga ggacggcgcc 2340

ctgaagggcg agatcaagca gaggctgaag ctgaaggacg gcggccacta cgacgccgag 2400

gtcaagacca cctacaaggc caagaagccc gtgcagctgc ccggcgccta caacgtcaac 2460

atcaagctgg acatcacctc ccacaacgag gactacacca tcgtggaaca gtacgagcgc 2520

gccgagggcc gccactccac cggcggcatg gacgagctgt acaagtaa 2568

<210> 43

<211> 855

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 43

Met Ser His His Trp Gly Tyr Gly Lys His Asn Gly Pro Glu His Trp

1 5 10 15

His Lys Asp Phe Pro Ile Ala Lys Gly Glu Arg Gln Ser Pro Val Asp

20 25 30

Ile Asp Thr His Thr Ala Lys Tyr Asp Pro Ser Leu Lys Pro Leu Ser

35 40 45

Val Ser Tyr Asp Gln Ala Thr Ser Leu Arg Ile Leu Asn Asn Gly His

50 55 60

Ala Phe Asn Val Glu Phe Asp Asp Ser Gln Asp Lys Ala Val Leu Lys

65 70 75 80

Gly Gly Pro Leu Asp Gly Thr Tyr Arg Leu Ile Gln Phe His Phe His

85 90 95

Trp Gly Ser Leu Asp Gly Gln Gly Ser Glu His Thr Val Asp Lys Lys

100 105 110

Lys Tyr Ala Ala Glu Leu His Leu Val His Trp Asn Thr Lys Tyr Gly

115 120 125

Asp Phe Gly Lys Ala Val Gln Gln Pro Asp Gly Leu Ala Val Leu Gly

130 135 140

Ile Phe Leu Lys Val Gly Ser Ala Lys Pro Gly His Gln Lys Val Val

145 150 155 160

Asp Val Leu Asp Ser Ile Lys Thr Lys Gly Lys Ser Ala Asp Phe Thr

165 170 175

Asn Phe Asp Pro Arg Gly Leu Leu Pro Glu Ser Leu Asp Tyr Trp Thr

180 185 190

Tyr Pro Gly Ser Leu Thr Thr Pro Pro Leu Leu Glu Cys Val Thr Trp

195 200 205

Ile Val Leu Lys Glu Pro Ile Ser Val Ser Ser Glu Gln Val Leu Lys

210 215 220

Phe Arg Lys Leu Asn Phe Asn Gly Glu Gly Glu Pro Glu Glu Leu Met

225 230 235 240

Val Asp Asn Trp Arg Pro Ala Gln Pro Leu Lys Asn Arg Gln Ile Lys

245 250 255

Ala Ser Phe Lys Gly Gly Ser Gly Gly Gly Ser Gly Thr Ala Lys Met

260 265 270

Glu Thr Thr Phe Tyr Asp Asp Ala Leu Asn Ala Ser Phe Leu Pro Ser

275 280 285

Glu Ser Gly Pro Tyr Gly Tyr Ser Asn Pro Lys Ile Leu Lys Gln Ser

290 295 300

Met Thr Leu Asn Leu Ala Asp Pro Val Gly Ser Leu Lys Pro His Leu

305 310 315 320

Arg Ala Lys Asn Ser Asp Leu Leu Thr Ser Pro Asp Val Gly Leu Leu

325 330 335

Lys Leu Ala Ser Pro Glu Leu Glu Arg Leu Ile Ile Gln Ser Ser Asn

340 345 350

Gly His Ile Thr Thr Thr Pro Thr Pro Thr Gln Phe Leu Cys Pro Lys

355 360 365

Asn Val Thr Asp Glu Gln Glu Gly Phe Ala Glu Gly Phe Val Arg Ala

370 375 380

Leu Ala Glu Leu His Ser Gln Asn Thr Leu Pro Ser Val Thr Ser Ala

385 390 395 400

Ala Gln Pro Val Asn Gly Ala Gly Met Val Ala Pro Ala Val Ala Ser

405 410 415

Val Ala Gly Gly Ser Gly Ser Gly Gly Phe Ser Ala Ser Leu His Ser

420 425 430

Glu Pro Pro Val Tyr Ala Asn Leu Ser Asn Phe Asn Pro Gly Ala Leu

435 440 445

Ser Ser Gly Gly Gly Ala Pro Ser Tyr Gly Ala Ala Gly Leu Ala Phe

450 455 460

Pro Ala Gln Pro Gln Gln Gln Gln Gln Pro Pro His His Leu Pro Gln

465 470 475 480

Gln Met Pro Val Gln His Pro Arg Leu Gln Ala Leu Lys Glu Glu Pro

485 490 495

Gln Thr Val Pro Glu Met Pro Gly Glu Thr Pro Pro Leu Ser Pro Ile

500 505 510

Asp Met Glu Ser Gln Glu Arg Ile Lys Ala Glu Arg Lys Arg Met Arg

515 520 525

Asn Arg Ile Ala Ala Ser Lys Cys Arg Lys Arg Lys Leu Glu Arg Ile

530 535 540

Ala Arg Leu Glu Glu Lys Val Lys Thr Leu Lys Ala Gln Asn Ser Glu

545 550 555 560

Leu Ala Ser Thr Ala Asn Met Leu Arg Glu Gln Val Ala Gln Leu Lys

565 570 575

Gln Lys Val Met Asn His Val Asn Ser Gly Cys Gln Leu Met Leu Thr

580 585 590

Gln Gln Leu Gln Thr Phe Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu

595 600 605

Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Ser Lys Gly

610 615 620

Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe Met Arg Phe Lys Val

625 630 635 640

His Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu

645 650 655

Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val

660 665 670

Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln

675 680 685

Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro Ala Asp Ile Pro

690 695 700

Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val

705 710 715 720

Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser

725 730 735

Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys Leu Arg Gly Thr Asn

740 745 750

Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu

755 760 765

Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly Ala Leu Lys Gly Glu

770 775 780

Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly His Tyr Asp Ala Glu

785 790 795 800

Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val Gln Leu Pro Gly Ala

805 810 815

Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr

820 825 830

Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His Ser Thr Gly

835 840 845

Gly Met Asp Glu Leu Tyr Lys

850 855

<210> 44

<211> 1767

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 44

atgaccgcca agatggaaac caccttctac gacgacgccc tgaacgccag ctttctgcct 60

tctgagtctg gcccctacgg ctacagcaac cccaagatcc tgaagcagag catgaccctg 120

aacctggccg atcctgtggg cagcctgaaa cctcacctga gagccaagaa cagcgacctg 180

ctgacaagcc ctgatgtggg cctgctgaaa ctggctagcc ccgagctgga acggctgatc 240

atccagtcta gcaacggcca catcaccacc acacctacac caacacagtt tctgtgcccc 300

aagaacgtga ccgacgagca agagggattc gccgagggct ttgttagagc cctggccgaa 360

ctgcacagcc agaataccct gcctagcgtg acatctgccg ctcagcctgt taatggcgcc 420

ggaatggttg ctcctgccgt ggcttctgtt gctggcggat ctggatctgg cggctttagc 480

gcctctctgc actctgagcc tccagtgtac gccaacctga gcaacttcaa ccctggcgct 540

cttagctctg gtggcggagc accttcttat ggcgctgccg gattggcctt tcctgctcag 600

cctcagcagc agcaacagcc tcctcatcat ctgccccagc agatgcctgt gcagcaccct 660

agactgcagg ccctgaaaga ggaaccccag acagtccctg agatgcccgg cgaaacacct 720

cctctgagcc ccatcgacat ggaaagccaa gagcggatca aggccgagcg gaagcggatg 780

agaaatagaa tcgccgcctc caagtgccgg aagaggaagc tggaaagaat cgcccggctg 840

gaagagaaag tgaaaaccct gaaggcccag aactccgagc tggcctctac cgccaacatg 900

ctgagagaac aggtggccca gctgaaacag aaagtcatga accacgtgaa cagcggctgc 960

cagctgatgc tgacacagca gctgcagacc ttcggatccg gagctactaa cttcagcctg 1020

ctgaagcagg ctggagacgt ggaggagaac cctggacctt tgagcaaggg cgaggaggac 1080

aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg ctccgtgaac 1140

ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg cacccagacc 1200

gccaagctga aggtgaccaa gggcggcccc ctgcccttcg cctgggacat cctgtcccct 1260

cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc cgactacttg 1320

aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga ggacggcggc 1380

gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta caaggtgaag 1440

ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac catgggctgg 1500

gaggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga gatcaagcag 1560

aggctgaagc tgaaggacgg cggccactac gacgccgagg tcaagaccac ctacaaggcc 1620

aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagctgga catcacctcc 1680

cacaacgagg actacaccat cgtggaacag tacgagcgcg ccgagggccg ccactccacc 1740

ggcggcatgg acgagctgta caagtaa 1767

<210> 45

<211> 588

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 45

Met Thr Ala Lys Met Glu Thr Thr Phe Tyr Asp Asp Ala Leu Asn Ala

1 5 10 15

Ser Phe Leu Pro Ser Glu Ser Gly Pro Tyr Gly Tyr Ser Asn Pro Lys

20 25 30

Ile Leu Lys Gln Ser Met Thr Leu Asn Leu Ala Asp Pro Val Gly Ser

35 40 45

Leu Lys Pro His Leu Arg Ala Lys Asn Ser Asp Leu Leu Thr Ser Pro

50 55 60

Asp Val Gly Leu Leu Lys Leu Ala Ser Pro Glu Leu Glu Arg Leu Ile

65 70 75 80

Ile Gln Ser Ser Asn Gly His Ile Thr Thr Thr Pro Thr Pro Thr Gln

85 90 95

Phe Leu Cys Pro Lys Asn Val Thr Asp Glu Gln Glu Gly Phe Ala Glu

100 105 110

Gly Phe Val Arg Ala Leu Ala Glu Leu His Ser Gln Asn Thr Leu Pro

115 120 125

Ser Val Thr Ser Ala Ala Gln Pro Val Asn Gly Ala Gly Met Val Ala

130 135 140

Pro Ala Val Ala Ser Val Ala Gly Gly Ser Gly Ser Gly Gly Phe Ser

145 150 155 160

Ala Ser Leu His Ser Glu Pro Pro Val Tyr Ala Asn Leu Ser Asn Phe

165 170 175

Asn Pro Gly Ala Leu Ser Ser Gly Gly Gly Ala Pro Ser Tyr Gly Ala

180 185 190

Ala Gly Leu Ala Phe Pro Ala Gln Pro Gln Gln Gln Gln Gln Pro Pro

195 200 205

His His Leu Pro Gln Gln Met Pro Val Gln His Pro Arg Leu Gln Ala

210 215 220

Leu Lys Glu Glu Pro Gln Thr Val Pro Glu Met Pro Gly Glu Thr Pro

225 230 235 240

Pro Leu Ser Pro Ile Asp Met Glu Ser Gln Glu Arg Ile Lys Ala Glu

245 250 255

Arg Lys Arg Met Arg Asn Arg Ile Ala Ala Ser Lys Cys Arg Lys Arg

260 265 270

Lys Leu Glu Arg Ile Ala Arg Leu Glu Glu Lys Val Lys Thr Leu Lys

275 280 285

Ala Gln Asn Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Arg Glu Gln

290 295 300

Val Ala Gln Leu Lys Gln Lys Val Met Asn His Val Asn Ser Gly Cys

305 310 315 320

Gln Leu Met Leu Thr Gln Gln Leu Gln Thr Phe Gly Ser Gly Ala Thr

325 330 335

Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly

340 345 350

Pro Leu Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe

355 360 365

Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe

370 375 380

Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr

385 390 395 400

Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp

405 410 415

Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His

420 425 430

Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe

435 440 445

Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val

450 455 460

Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys

465 470 475 480

Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys

485 490 495

Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly

500 505 510

Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly

515 520 525

His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val

530 535 540

Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser

545 550 555 560

His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly

565 570 575

Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys

580 585

<210> 46

<211> 2634

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 46

atgggcacaa gcctgctgtg ttggatggcc ctgtgtctgc tgggagccga tcatgctgat 60

gcctgtcctt acagcaaccc cagcctgtgt tctggcggcg gaggatctga actgcctaca 120

cagggcacct tcagcaacgt gtccaccaat gtgtccccag ccaagcctac caccaccgct 180

tgtccctact ccaatcctag cctgtgtagc ggaggtggcg gaagccctgc tcctagacct 240

cctacaccag ctcctacaat cgccagccag cctctgtctc tgaggccaga agcttgtaga 300

cctgctgctg gcggagccgt gcatacaaga ggactggatt tcgcctgcga catctacatc 360

tgggcccctc tggctggaac atgtggcgtt ctgctgctga gcctggtcat caccctgtac 420

tgcaaccacc ggaacaggcg gagagtgtgc aagtgcccta gacctgtggt tggatctggt 480

gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacctgga 540

ggatccatgt cccatcactg ggggtacggc aaacacaacg gacctgagca ctggcataag 600

gacttcccca ttgccaaggg agagcgccag tcccctgttg acatcgacac tcatacagcc 660

aagtatgacc cttccctgaa gcccctgtct gtttcctatg atcaagcaac ttccctgagg 720

atcctcaaca atggtcatgc tttcaacgtg gagtttgatg actctcagga caaagcagtg 780

ctcaagggag gacccctgga tggcacttac agattgattc agtttcactt tcactggggt 840

tcacttgatg gacaaggttc agagcatact gtggataaaa agaaatatgc tgcagaactt 900

cacttggttc actggaacac caaatatggg gattttggga aagctgtgca gcaacctgat 960

ggactggccg ttctaggtat ttttttgaag gttggcagcg ctaaaccggg ccttcagaaa 1020

gttgttgatg tgctggattc cattaaaaca aagggcaaga gtgctgactt cactaacttc 1080

gatcctcgtg gcctccttcc tgaatccctg gattactgga cctacccagg ctcactgacc 1140

acccctcctc ttctggaatg tgtgacctgg attgtgctca aggaacccat cagcgtcagc 1200

agcgagcagg tgttgaaatt ccgtaaactt aacttcaatg gggagggtga acccgaagaa 1260

ctgatggtgg acaactggcg cccagctcag ccactgaaga acaggcaaat caaagcttcc 1320

ttcaaaggag gatccggaat gccgaaccca aggccaggga agccctctgc tcctagcctg 1380

gccctcggcc ccagccctgg cgctagcccc tcttggaggg cggctccgaa ggcttccgac 1440

ctcctgggtg ctaggggccc tggtggaacc ttccaaggca gggatctgcg aggaggggcg 1500

cacgcctcta gctcaagcct gaacccgatg cccccctcac agctgcaact gcctaccctg 1560

ccgctcgtca tggtggcccc cagcggcgca agactgggcc cgttgccgca cctgcaagcc 1620

ttgctgcagg accggccaca tttcatgcac cagctcagca ccgtggacgc acatgcaagg 1680

acacccgtgc tgcaagtcca ccccctggag agccctgcca tgatcagcct gacgccgccc 1740

accaccgcaa ccggcgtgtt ttcactgaag gcaagacccg ggctgccacc gggcatcaac 1800

gtggccagcc tggaatgggt gagcagggag ccagcgctcc tgtgtacctt cccaaaccca 1860

tccgccccaa gaaaggacag caccctgtct gccgtgcccc aatcatctta cccgctgctg 1920

gcgaatggcg tatgcaagtg gcccggatgt gaaaaggtgt tcgaggagcc ggaagatttc 1980

ctgaaacatt gccaggccga ccacctgttg gacgaaaagg gaagggccca atgcctgctt 2040

cagagggaga tggtgcagag cttggagcaa caactcgtgc tcgagaagga gaagctgagc 2100

gccatgcagg cacacctcgc cggcaagatg gccctgacca aagccagtag cgtagccagc 2160

tccgacaagg gtagctgttg catcgtggcc gcaggaagtc aaggccccgt tgtgcccgcc 2220

tggagcggtc caagggaggc acccgactca ctgttcgccg tgaggaggca tctgtggggc 2280

agccacggta acagcacgtt ccccgagttc ctgcataaca tggactactt caagttccac 2340

aacatgcggc ctccattcac ctacgccaca ctgataaggt gggctatcct ggaggctccc 2400

gagaagcaaa ggaccctgaa cgagatctac cactggttca ccaggatgtt cgctttcttt 2460

aggaaccacc ccgcgacctg gaaaaacgcc ataaggcata acttgagcct tcacaagtgc 2520

ttcgtgaggg tggagagtga gaaaggtgcc gtgtggactg tggatgagtt ggagttccgc 2580

aagaagcgaa gccaacgacc tagcaggtgt agcaatccaa cgcctggacc ctaa 2634

<210> 47

<211> 877

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 47

Met Gly Thr Ser Leu Leu Cys Trp Met Ala Leu Cys Leu Leu Gly Ala

1 5 10 15

Asp His Ala Asp Ala Cys Pro Tyr Ser Asn Pro Ser Leu Cys Ser Gly

20 25 30

Gly Gly Gly Ser Glu Leu Pro Thr Gln Gly Thr Phe Ser Asn Val Ser

35 40 45

Thr Asn Val Ser Pro Ala Lys Pro Thr Thr Thr Ala Cys Pro Tyr Ser

50 55 60

Asn Pro Ser Leu Cys Ser Gly Gly Gly Gly Ser Pro Ala Pro Arg Pro

65 70 75 80

Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro

85 90 95

Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu

100 105 110

Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys

115 120 125

Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys Asn His Arg

130 135 140

Asn Arg Arg Arg Val Cys Lys Cys Pro Arg Pro Val Val Gly Ser Gly

145 150 155 160

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

165 170 175

Pro Gly Pro Gly Gly Ser Met Ser His His Trp Gly Tyr Gly Lys His

180 185 190

Asn Gly Pro Glu His Trp His Lys Asp Phe Pro Ile Ala Lys Gly Glu

195 200 205

Arg Gln Ser Pro Val Asp Ile Asp Thr His Thr Ala Lys Tyr Asp Pro

210 215 220

Ser Leu Lys Pro Leu Ser Val Ser Tyr Asp Gln Ala Thr Ser Leu Arg

225 230 235 240

Ile Leu Asn Asn Gly His Ala Phe Asn Val Glu Phe Asp Asp Ser Gln

245 250 255

Asp Lys Ala Val Leu Lys Gly Gly Pro Leu Asp Gly Thr Tyr Arg Leu

260 265 270

Ile Gln Phe His Phe His Trp Gly Ser Leu Asp Gly Gln Gly Ser Glu

275 280 285

His Thr Val Asp Lys Lys Lys Tyr Ala Ala Glu Leu His Leu Val His

290 295 300

Trp Asn Thr Lys Tyr Gly Asp Phe Gly Lys Ala Val Gln Gln Pro Asp

305 310 315 320

Gly Leu Ala Val Leu Gly Ile Phe Leu Lys Val Gly Ser Ala Lys Pro

325 330 335

Gly Leu Gln Lys Val Val Asp Val Leu Asp Ser Ile Lys Thr Lys Gly

340 345 350

Lys Ser Ala Asp Phe Thr Asn Phe Asp Pro Arg Gly Leu Leu Pro Glu

355 360 365

Ser Leu Asp Tyr Trp Thr Tyr Pro Gly Ser Leu Thr Thr Pro Pro Leu

370 375 380

Leu Glu Cys Val Thr Trp Ile Val Leu Lys Glu Pro Ile Ser Val Ser

385 390 395 400

Ser Glu Gln Val Leu Lys Phe Arg Lys Leu Asn Phe Asn Gly Glu Gly

405 410 415

Glu Pro Glu Glu Leu Met Val Asp Asn Trp Arg Pro Ala Gln Pro Leu

420 425 430

Lys Asn Arg Gln Ile Lys Ala Ser Phe Lys Gly Gly Ser Gly Met Pro

435 440 445

Asn Pro Arg Pro Gly Lys Pro Ser Ala Pro Ser Leu Ala Leu Gly Pro

450 455 460

Ser Pro Gly Ala Ser Pro Ser Trp Arg Ala Ala Pro Lys Ala Ser Asp

465 470 475 480

Leu Leu Gly Ala Arg Gly Pro Gly Gly Thr Phe Gln Gly Arg Asp Leu

485 490 495

Arg Gly Gly Ala His Ala Ser Ser Ser Ser Leu Asn Pro Met Pro Pro

500 505 510

Ser Gln Leu Gln Leu Pro Thr Leu Pro Leu Val Met Val Ala Pro Ser

515 520 525

Gly Ala Arg Leu Gly Pro Leu Pro His Leu Gln Ala Leu Leu Gln Asp

530 535 540

Arg Pro His Phe Met His Gln Leu Ser Thr Val Asp Ala His Ala Arg

545 550 555 560

Thr Pro Val Leu Gln Val His Pro Leu Glu Ser Pro Ala Met Ile Ser

565 570 575

Leu Thr Pro Pro Thr Thr Ala Thr Gly Val Phe Ser Leu Lys Ala Arg

580 585 590

Pro Gly Leu Pro Pro Gly Ile Asn Val Ala Ser Leu Glu Trp Val Ser

595 600 605

Arg Glu Pro Ala Leu Leu Cys Thr Phe Pro Asn Pro Ser Ala Pro Arg

610 615 620

Lys Asp Ser Thr Leu Ser Ala Val Pro Gln Ser Ser Tyr Pro Leu Leu

625 630 635 640

Ala Asn Gly Val Cys Lys Trp Pro Gly Cys Glu Lys Val Phe Glu Glu

645 650 655

Pro Glu Asp Phe Leu Lys His Cys Gln Ala Asp His Leu Leu Asp Glu

660 665 670

Lys Gly Arg Ala Gln Cys Leu Leu Gln Arg Glu Met Val Gln Ser Leu

675 680 685

Glu Gln Gln Leu Val Leu Glu Lys Glu Lys Leu Ser Ala Met Gln Ala

690 695 700

His Leu Ala Gly Lys Met Ala Leu Thr Lys Ala Ser Ser Val Ala Ser

705 710 715 720

Ser Asp Lys Gly Ser Cys Cys Ile Val Ala Ala Gly Ser Gln Gly Pro

725 730 735

Val Val Pro Ala Trp Ser Gly Pro Arg Glu Ala Pro Asp Ser Leu Phe

740 745 750

Ala Val Arg Arg His Leu Trp Gly Ser His Gly Asn Ser Thr Phe Pro

755 760 765

Glu Phe Leu His Asn Met Asp Tyr Phe Lys Phe His Asn Met Arg Pro

770 775 780

Pro Phe Thr Tyr Ala Thr Leu Ile Arg Trp Ala Ile Leu Glu Ala Pro

785 790 795 800

Glu Lys Gln Arg Thr Leu Asn Glu Ile Tyr His Trp Phe Thr Arg Met

805 810 815

Phe Ala Phe Phe Arg Asn His Pro Ala Thr Trp Lys Asn Ala Ile Arg

820 825 830

His Asn Leu Ser Leu His Lys Cys Phe Val Arg Val Glu Ser Glu Lys

835 840 845

Gly Ala Val Trp Thr Val Asp Glu Leu Glu Phe Arg Lys Lys Arg Ser

850 855 860

Gln Arg Pro Ser Arg Cys Ser Asn Pro Thr Pro Gly Pro

865 870 875

<210> 48

<211> 2634

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 48

atgggcacaa gcctgctgtg ttggatggcc ctgtgtctgc tgggagccga tcatgctgat 60

gcctgtcctt acagcaaccc cagcctgtgt tctggcggcg gaggatctga actgcctaca 120

cagggcacct tcagcaacgt gtccaccaat gtgtccccag ccaagcctac caccaccgct 180

tgtccctact ccaatcctag cctgtgtagc ggaggtggcg gaagccctgc tcctagacct 240

cctacaccag ctcctacaat cgccagccag cctctgtctc tgaggccaga agcttgtaga 300

cctgctgctg gcggagccgt gcatacaaga ggactggatt tcgcctgcga catctacatc 360

tgggcccctc tggctggaac atgtggcgtt ctgctgctga gcctggtcat caccctgtac 420

tgcaaccacc ggaacaggcg gagagtgtgc aagtgcccta gacctgtggt tggatctggt 480

gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacctgga 540

ggatccatgt cccatcactg ggggtacggc aaacacaacg gacctgagca ctggcataag 600

gacttcccca ttgccaaggg agagcgccag tcccctgttg acatcgacac tcatacagcc 660

aagtatgacc cttccctgaa gcccctgtct gtttcctatg atcaagcaac ttccctgagg 720

atcctcaaca atggtcatgc tttcaacgtg gagtttgatg actctcagga caaagcagtg 780

ctcaagggag gacccctgga tggcacttac agattgattc agtttcactt tcactggggt 840

tcacttgatg gacaaggttc agagcatact gtggataaaa agaaatatgc tgcagaactt 900

cacttggttc actggaacac caaatatggg gattttggga aagctgtgca gcaacctgat 960

ggactggccg ttctaggtat ttttttgaag gttggcagcg ctaaaccggg ccatcagaaa 1020

gttgttgatg tgctggattc cattaaaaca aagggcaaga gtgctgactt cactaacttc 1080

gatcctcgtg gcctccttcc tgaatccctg gattactgga cctacccagg ctcactgacc 1140

acccctcctc ttctggaatg tgtgacctgg attgtgctca aggaacccat cagcgtcagc 1200

agcgagcagg tgttgaaatt ccgtaaactt aacttcaatg gggagggtga acccgaagaa 1260

ctgatggtgg acaactggcg cccagctcag ccactgaaga acaggcaaat caaagcttcc 1320

ttcaaaggag gatccggaat gccgaaccca aggccaggga agccctctgc tcctagcctg 1380

gccctcggcc ccagccctgg cgctagcccc tcttggaggg cggctccgaa ggcttccgac 1440

ctcctgggtg ctaggggccc tggtggaacc ttccaaggca gggatctgcg aggaggggcg 1500

cacgcctcta gctcaagcct gaacccgatg cccccctcac agctgcaact gcctaccctg 1560

ccgctcgtca tggtggcccc cagcggcgca agactgggcc cgttgccgca cctgcaagcc 1620

ttgctgcagg accggccaca tttcatgcac cagctcagca ccgtggacgc acatgcaagg 1680

acacccgtgc tgcaagtcca ccccctggag agccctgcca tgatcagcct gacgccgccc 1740

accaccgcaa ccggcgtgtt ttcactgaag gcaagacccg ggctgccacc gggcatcaac 1800

gtggccagcc tggaatgggt gagcagggag ccagcgctcc tgtgtacctt cccaaaccca 1860

tccgccccaa gaaaggacag caccctgtct gccgtgcccc aatcatctta cccgctgctg 1920

gcgaatggcg tatgcaagtg gcccggatgt gaaaaggtgt tcgaggagcc ggaagatttc 1980

ctgaaacatt gccaggccga ccacctgttg gacgaaaagg gaagggccca atgcctgctt 2040

cagagggaga tggtgcagag cttggagcaa caactcgtgc tcgagaagga gaagctgagc 2100

gccatgcagg cacacctcgc cggcaagatg gccctgacca aagccagtag cgtagccagc 2160

tccgacaagg gtagctgttg catcgtggcc gcaggaagtc aaggccccgt tgtgcccgcc 2220

tggagcggtc caagggaggc acccgactca ctgttcgccg tgaggaggca tctgtggggc 2280

agccacggta acagcacgtt ccccgagttc ctgcataaca tggactactt caagttccac 2340

aacatgcggc ctccattcac ctacgccaca ctgataaggt gggctatcct ggaggctccc 2400

gagaagcaaa ggaccctgaa cgagatctac cactggttca ccaggatgtt cgctttcttt 2460

aggaaccacc ccgcgacctg gaaaaacgcc ataaggcata acttgagcct tcacaagtgc 2520

ttcgtgaggg tggagagtga gaaaggtgcc gtgtggactg tggatgagtt ggagttccgc 2580

aagaagcgaa gccaacgacc tagcaggtgt agcaatccaa cgcctggacc ctaa 2634

<210> 49

<211> 877

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 49

Met Gly Thr Ser Leu Leu Cys Trp Met Ala Leu Cys Leu Leu Gly Ala

1 5 10 15

Asp His Ala Asp Ala Cys Pro Tyr Ser Asn Pro Ser Leu Cys Ser Gly

20 25 30

Gly Gly Gly Ser Glu Leu Pro Thr Gln Gly Thr Phe Ser Asn Val Ser

35 40 45

Thr Asn Val Ser Pro Ala Lys Pro Thr Thr Thr Ala Cys Pro Tyr Ser

50 55 60

Asn Pro Ser Leu Cys Ser Gly Gly Gly Gly Ser Pro Ala Pro Arg Pro

65 70 75 80

Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro

85 90 95

Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu

100 105 110

Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys

115 120 125

Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys Asn His Arg

130 135 140

Asn Arg Arg Arg Val Cys Lys Cys Pro Arg Pro Val Val Gly Ser Gly

145 150 155 160

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

165 170 175

Pro Gly Pro Gly Gly Ser Met Ser His His Trp Gly Tyr Gly Lys His

180 185 190

Asn Gly Pro Glu His Trp His Lys Asp Phe Pro Ile Ala Lys Gly Glu

195 200 205

Arg Gln Ser Pro Val Asp Ile Asp Thr His Thr Ala Lys Tyr Asp Pro

210 215 220

Ser Leu Lys Pro Leu Ser Val Ser Tyr Asp Gln Ala Thr Ser Leu Arg

225 230 235 240

Ile Leu Asn Asn Gly His Ala Phe Asn Val Glu Phe Asp Asp Ser Gln

245 250 255

Asp Lys Ala Val Leu Lys Gly Gly Pro Leu Asp Gly Thr Tyr Arg Leu

260 265 270

Ile Gln Phe His Phe His Trp Gly Ser Leu Asp Gly Gln Gly Ser Glu

275 280 285

His Thr Val Asp Lys Lys Lys Tyr Ala Ala Glu Leu His Leu Val His

290 295 300

Trp Asn Thr Lys Tyr Gly Asp Phe Gly Lys Ala Val Gln Gln Pro Asp

305 310 315 320

Gly Leu Ala Val Leu Gly Ile Phe Leu Lys Val Gly Ser Ala Lys Pro

325 330 335

Gly His Gln Lys Val Val Asp Val Leu Asp Ser Ile Lys Thr Lys Gly

340 345 350

Lys Ser Ala Asp Phe Thr Asn Phe Asp Pro Arg Gly Leu Leu Pro Glu

355 360 365

Ser Leu Asp Tyr Trp Thr Tyr Pro Gly Ser Leu Thr Thr Pro Pro Leu

370 375 380

Leu Glu Cys Val Thr Trp Ile Val Leu Lys Glu Pro Ile Ser Val Ser

385 390 395 400

Ser Glu Gln Val Leu Lys Phe Arg Lys Leu Asn Phe Asn Gly Glu Gly

405 410 415

Glu Pro Glu Glu Leu Met Val Asp Asn Trp Arg Pro Ala Gln Pro Leu

420 425 430

Lys Asn Arg Gln Ile Lys Ala Ser Phe Lys Gly Gly Ser Gly Met Pro

435 440 445

Asn Pro Arg Pro Gly Lys Pro Ser Ala Pro Ser Leu Ala Leu Gly Pro

450 455 460

Ser Pro Gly Ala Ser Pro Ser Trp Arg Ala Ala Pro Lys Ala Ser Asp

465 470 475 480

Leu Leu Gly Ala Arg Gly Pro Gly Gly Thr Phe Gln Gly Arg Asp Leu

485 490 495

Arg Gly Gly Ala His Ala Ser Ser Ser Ser Leu Asn Pro Met Pro Pro

500 505 510

Ser Gln Leu Gln Leu Pro Thr Leu Pro Leu Val Met Val Ala Pro Ser

515 520 525

Gly Ala Arg Leu Gly Pro Leu Pro His Leu Gln Ala Leu Leu Gln Asp

530 535 540

Arg Pro His Phe Met His Gln Leu Ser Thr Val Asp Ala His Ala Arg

545 550 555 560

Thr Pro Val Leu Gln Val His Pro Leu Glu Ser Pro Ala Met Ile Ser

565 570 575

Leu Thr Pro Pro Thr Thr Ala Thr Gly Val Phe Ser Leu Lys Ala Arg

580 585 590

Pro Gly Leu Pro Pro Gly Ile Asn Val Ala Ser Leu Glu Trp Val Ser

595 600 605

Arg Glu Pro Ala Leu Leu Cys Thr Phe Pro Asn Pro Ser Ala Pro Arg

610 615 620

Lys Asp Ser Thr Leu Ser Ala Val Pro Gln Ser Ser Tyr Pro Leu Leu

625 630 635 640

Ala Asn Gly Val Cys Lys Trp Pro Gly Cys Glu Lys Val Phe Glu Glu

645 650 655

Pro Glu Asp Phe Leu Lys His Cys Gln Ala Asp His Leu Leu Asp Glu

660 665 670

Lys Gly Arg Ala Gln Cys Leu Leu Gln Arg Glu Met Val Gln Ser Leu

675 680 685

Glu Gln Gln Leu Val Leu Glu Lys Glu Lys Leu Ser Ala Met Gln Ala

690 695 700

His Leu Ala Gly Lys Met Ala Leu Thr Lys Ala Ser Ser Val Ala Ser

705 710 715 720

Ser Asp Lys Gly Ser Cys Cys Ile Val Ala Ala Gly Ser Gln Gly Pro

725 730 735

Val Val Pro Ala Trp Ser Gly Pro Arg Glu Ala Pro Asp Ser Leu Phe

740 745 750

Ala Val Arg Arg His Leu Trp Gly Ser His Gly Asn Ser Thr Phe Pro

755 760 765

Glu Phe Leu His Asn Met Asp Tyr Phe Lys Phe His Asn Met Arg Pro

770 775 780

Pro Phe Thr Tyr Ala Thr Leu Ile Arg Trp Ala Ile Leu Glu Ala Pro

785 790 795 800

Glu Lys Gln Arg Thr Leu Asn Glu Ile Tyr His Trp Phe Thr Arg Met

805 810 815

Phe Ala Phe Phe Arg Asn His Pro Ala Thr Trp Lys Asn Ala Ile Arg

820 825 830

His Asn Leu Ser Leu His Lys Cys Phe Val Arg Val Glu Ser Glu Lys

835 840 845

Gly Ala Val Trp Thr Val Asp Glu Leu Glu Phe Arg Lys Lys Arg Ser

850 855 860

Gln Arg Pro Ser Arg Cys Ser Asn Pro Thr Pro Gly Pro

865 870 875

<210> 50

<211> 1845

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 50

atgggcacaa gcctgctgtg ttggatggcc ctgtgtctgc tgggagccga tcatgctgat 60

gcctgtcctt acagcaaccc cagcctgtgt tctggcggcg gaggatctga actgcctaca 120

cagggcacct tcagcaacgt gtccaccaat gtgtccccag ccaagcctac caccaccgct 180

tgtccctact ccaatcctag cctgtgtagc ggaggtggcg gaagccctgc tcctagacct 240

cctacaccag ctcctacaat cgccagccag cctctgtctc tgaggccaga agcttgtaga 300

cctgctgctg gcggagccgt gcatacaaga ggactggatt tcgcctgcga catctacatc 360

tgggcccctc tggctggaac atgtggcgtt ctgctgctga gcctggtcat caccctgtac 420

tgcaaccacc ggaacaggcg gagagtgtgc aagtgcccta gacctgtggt tggatctggt 480

gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacctgga 540

ggatccggaa tgccgaaccc aaggccaggg aagccctctg ctcctagcct ggccctcggc 600

cccagccctg gcgctagccc ctcttggagg gcggctccga aggcttccga cctcctgggt 660

gctaggggcc ctggtggaac cttccaaggc agggatctgc gaggaggggc gcacgcctct 720

agctcaagcc tgaacccgat gcccccctca cagctgcaac tgcctaccct gccgctcgtc 780

atggtggccc ccagcggcgc aagactgggc ccgttgccgc acctgcaagc cttgctgcag 840

gaccggccac atttcatgca ccagctcagc accgtggacg cacatgcaag gacacccgtg 900

ctgcaagtcc accccctgga gagccctgcc atgatcagcc tgacgccgcc caccaccgca 960

accggcgtgt tttcactgaa ggcaagaccc gggctgccac cgggcatcaa cgtggccagc 1020

ctggaatggg tgagcaggga gccagcgctc ctgtgtacct tcccaaaccc atccgcccca 1080

agaaaggaca gcaccctgtc tgccgtgccc caatcatctt acccgctgct ggcgaatggc 1140

gtatgcaagt ggcccggatg tgaaaaggtg ttcgaggagc cggaagattt cctgaaacat 1200

tgccaggccg accacctgtt ggacgaaaag ggaagggccc aatgcctgct tcagagggag 1260

atggtgcaga gcttggagca acaactcgtg ctcgagaagg agaagctgag cgccatgcag 1320

gcacacctcg ccggcaagat ggccctgacc aaagccagta gcgtagccag ctccgacaag 1380

ggtagctgtt gcatcgtggc cgcaggaagt caaggccccg ttgtgcccgc ctggagcggt 1440

ccaagggagg cacccgactc actgttcgcc gtgaggaggc atctgtgggg cagccacggt 1500

aacagcacgt tccccgagtt cctgcataac atggactact tcaagttcca caacatgcgg 1560

cctccattca cctacgccac actgataagg tgggctatcc tggaggctcc cgagaagcaa 1620

aggaccctga acgagatcta ccactggttc accaggatgt tcgctttctt taggaaccac 1680

cccgcgacct ggaaaaacgc cataaggcat aacttgagcc ttcacaagtg cttcgtgagg 1740

gtggagagtg agaaaggtgc cgtgtggact gtggatgagt tggagttccg caagaagcga 1800

agccaacgac ctagcaggtg tagcaatcca acgcctggac cctaa 1845

<210> 51

<211> 614

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 51

Met Gly Thr Ser Leu Leu Cys Trp Met Ala Leu Cys Leu Leu Gly Ala

1 5 10 15

Asp His Ala Asp Ala Cys Pro Tyr Ser Asn Pro Ser Leu Cys Ser Gly

20 25 30

Gly Gly Gly Ser Glu Leu Pro Thr Gln Gly Thr Phe Ser Asn Val Ser

35 40 45

Thr Asn Val Ser Pro Ala Lys Pro Thr Thr Thr Ala Cys Pro Tyr Ser

50 55 60

Asn Pro Ser Leu Cys Ser Gly Gly Gly Gly Ser Pro Ala Pro Arg Pro

65 70 75 80

Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro

85 90 95

Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu

100 105 110

Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys

115 120 125

Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys Asn His Arg

130 135 140

Asn Arg Arg Arg Val Cys Lys Cys Pro Arg Pro Val Val Gly Ser Gly

145 150 155 160

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

165 170 175

Pro Gly Pro Gly Gly Ser Gly Met Pro Asn Pro Arg Pro Gly Lys Pro

180 185 190

Ser Ala Pro Ser Leu Ala Leu Gly Pro Ser Pro Gly Ala Ser Pro Ser

195 200 205

Trp Arg Ala Ala Pro Lys Ala Ser Asp Leu Leu Gly Ala Arg Gly Pro

210 215 220

Gly Gly Thr Phe Gln Gly Arg Asp Leu Arg Gly Gly Ala His Ala Ser

225 230 235 240

Ser Ser Ser Leu Asn Pro Met Pro Pro Ser Gln Leu Gln Leu Pro Thr

245 250 255

Leu Pro Leu Val Met Val Ala Pro Ser Gly Ala Arg Leu Gly Pro Leu

260 265 270

Pro His Leu Gln Ala Leu Leu Gln Asp Arg Pro His Phe Met His Gln

275 280 285

Leu Ser Thr Val Asp Ala His Ala Arg Thr Pro Val Leu Gln Val His

290 295 300

Pro Leu Glu Ser Pro Ala Met Ile Ser Leu Thr Pro Pro Thr Thr Ala

305 310 315 320

Thr Gly Val Phe Ser Leu Lys Ala Arg Pro Gly Leu Pro Pro Gly Ile

325 330 335

Asn Val Ala Ser Leu Glu Trp Val Ser Arg Glu Pro Ala Leu Leu Cys

340 345 350

Thr Phe Pro Asn Pro Ser Ala Pro Arg Lys Asp Ser Thr Leu Ser Ala

355 360 365

Val Pro Gln Ser Ser Tyr Pro Leu Leu Ala Asn Gly Val Cys Lys Trp

370 375 380

Pro Gly Cys Glu Lys Val Phe Glu Glu Pro Glu Asp Phe Leu Lys His

385 390 395 400

Cys Gln Ala Asp His Leu Leu Asp Glu Lys Gly Arg Ala Gln Cys Leu

405 410 415

Leu Gln Arg Glu Met Val Gln Ser Leu Glu Gln Gln Leu Val Leu Glu

420 425 430

Lys Glu Lys Leu Ser Ala Met Gln Ala His Leu Ala Gly Lys Met Ala

435 440 445

Leu Thr Lys Ala Ser Ser Val Ala Ser Ser Asp Lys Gly Ser Cys Cys

450 455 460

Ile Val Ala Ala Gly Ser Gln Gly Pro Val Val Pro Ala Trp Ser Gly

465 470 475 480

Pro Arg Glu Ala Pro Asp Ser Leu Phe Ala Val Arg Arg His Leu Trp

485 490 495

Gly Ser His Gly Asn Ser Thr Phe Pro Glu Phe Leu His Asn Met Asp

500 505 510

Tyr Phe Lys Phe His Asn Met Arg Pro Pro Phe Thr Tyr Ala Thr Leu

515 520 525

Ile Arg Trp Ala Ile Leu Glu Ala Pro Glu Lys Gln Arg Thr Leu Asn

530 535 540

Glu Ile Tyr His Trp Phe Thr Arg Met Phe Ala Phe Phe Arg Asn His

545 550 555 560

Pro Ala Thr Trp Lys Asn Ala Ile Arg His Asn Leu Ser Leu His Lys

565 570 575

Cys Phe Val Arg Val Glu Ser Glu Lys Gly Ala Val Trp Thr Val Asp

580 585 590

Glu Leu Glu Phe Arg Lys Lys Arg Ser Gln Arg Pro Ser Arg Cys Ser

595 600 605

Asn Pro Thr Pro Gly Pro

610

<210> 52

<211> 990

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 52

accgccaaga tggaaaccac cttctacgac gacgccctga acgccagctt tctgccttct 60

gagtctggcc cctacggcta cagcaacccc aagatcctga agcagagcat gaccctgaac 120

ctggccgatc ctgtgggcag cctgaaacct cacctgagag ccaagaacag cgacctgctg 180

acaagccctg atgtgggcct gctgaaactg gctagccccg agctggaacg gctgatcatc 240

cagtctagca acggccacat caccaccaca cctacaccaa cacagtttct gtgccccaag 300

aacgtgaccg acgagcaaga gggattcgcc gagggctttg ttagagccct ggccgaactg 360

cacagccaga ataccctgcc tagcgtgaca tctgccgctc agcctgttaa tggcgccgga 420

atggttgctc ctgccgtggc ttctgttgct ggcggatctg gatctggcgg ctttagcgcc 480

tctctgcact ctgagcctcc agtgtacgcc aacctgagca acttcaaccc tggcgctctt 540

agctctggtg gcggagcacc ttcttatggc gctgccggat tggcctttcc tgctcagcct 600

cagcagcagc aacagcctcc tcatcatctg ccccagcaga tgcctgtgca gcaccctaga 660

ctgcaggccc tgaaagagga accccagaca gtccctgaga tgcccggcga aacacctcct 720

ctgagcccca tcgacatgga aagccaagag cggatcaagg ccgagcggaa gcggatgaga 780

aatagaatcg ccgcctccaa gtgccggaag aggaagctgg aaagaatcgc ccggctggaa 840

gagaaagtga aaaccctgaa ggcccagaac tccgagctgg cctctaccgc caacatgctg 900

agagaacagg tggcccagct gaaacagaaa gtcatgaacc acgtgaacag cggctgccag 960

ctgatgctga cacagcagct gcagaccttc 990

<210> 53

<211> 330

<212> PRT

<213> 智人(Homo sapiens)

<400> 53

Thr Ala Lys Met Glu Thr Thr Phe Tyr Asp Asp Ala Leu Asn Ala Ser

1 5 10 15

Phe Leu Pro Ser Glu Ser Gly Pro Tyr Gly Tyr Ser Asn Pro Lys Ile

20 25 30

Leu Lys Gln Ser Met Thr Leu Asn Leu Ala Asp Pro Val Gly Ser Leu

35 40 45

Lys Pro His Leu Arg Ala Lys Asn Ser Asp Leu Leu Thr Ser Pro Asp

50 55 60

Val Gly Leu Leu Lys Leu Ala Ser Pro Glu Leu Glu Arg Leu Ile Ile

65 70 75 80

Gln Ser Ser Asn Gly His Ile Thr Thr Thr Pro Thr Pro Thr Gln Phe

85 90 95

Leu Cys Pro Lys Asn Val Thr Asp Glu Gln Glu Gly Phe Ala Glu Gly

100 105 110

Phe Val Arg Ala Leu Ala Glu Leu His Ser Gln Asn Thr Leu Pro Ser

115 120 125

Val Thr Ser Ala Ala Gln Pro Val Asn Gly Ala Gly Met Val Ala Pro

130 135 140

Ala Val Ala Ser Val Ala Gly Gly Ser Gly Ser Gly Gly Phe Ser Ala

145 150 155 160

Ser Leu His Ser Glu Pro Pro Val Tyr Ala Asn Leu Ser Asn Phe Asn

165 170 175

Pro Gly Ala Leu Ser Ser Gly Gly Gly Ala Pro Ser Tyr Gly Ala Ala

180 185 190

Gly Leu Ala Phe Pro Ala Gln Pro Gln Gln Gln Gln Gln Pro Pro His

195 200 205

His Leu Pro Gln Gln Met Pro Val Gln His Pro Arg Leu Gln Ala Leu

210 215 220

Lys Glu Glu Pro Gln Thr Val Pro Glu Met Pro Gly Glu Thr Pro Pro

225 230 235 240

Leu Ser Pro Ile Asp Met Glu Ser Gln Glu Arg Ile Lys Ala Glu Arg

245 250 255

Lys Arg Met Arg Asn Arg Ile Ala Ala Ser Lys Cys Arg Lys Arg Lys

260 265 270

Leu Glu Arg Ile Ala Arg Leu Glu Glu Lys Val Lys Thr Leu Lys Ala

275 280 285

Gln Asn Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Arg Glu Gln Val

290 295 300

Ala Gln Leu Lys Gln Lys Val Met Asn His Val Asn Ser Gly Cys Gln

305 310 315 320

Leu Met Leu Thr Gln Gln Leu Gln Thr Phe

325 330

<210> 54

<211> 471

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 54

atgggcacaa gcctgctgtg ttggatggcc ctgtgtctgc tgggagccga tcatgctgat 60

gcctgtcctt acagcaaccc cagcctgtgt tctggcggcg gaggatctga actgcctaca 120

cagggcacct tcagcaacgt gtccaccaat gtgtccccag ccaagcctac caccaccgct 180

tgtccctact ccaatcctag cctgtgtagc ggaggtggcg gaagccctgc tcctagacct 240

cctacaccag ctcctacaat cgccagccag cctctgtctc tgaggccaga agcttgtaga 300

cctgctgctg gcggagccgt gcatacaaga ggactggatt tcgcctgcga catctacatc 360

tgggcccctc tggctggaac atgtggcgtt ctgctgctga gcctggtcat caccctgtac 420

tgcaaccacc ggaacaggcg gagagtgtgc aagtgcccta gacctgtggt t 471

<210> 55

<211> 157

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 55

Met Gly Thr Ser Leu Leu Cys Trp Met Ala Leu Cys Leu Leu Gly Ala

1 5 10 15

Asp His Ala Asp Ala Cys Pro Tyr Ser Asn Pro Ser Leu Cys Ser Gly

20 25 30

Gly Gly Gly Ser Glu Leu Pro Thr Gln Gly Thr Phe Ser Asn Val Ser

35 40 45

Thr Asn Val Ser Pro Ala Lys Pro Thr Thr Thr Ala Cys Pro Tyr Ser

50 55 60

Asn Pro Ser Leu Cys Ser Gly Gly Gly Gly Ser Pro Ala Pro Arg Pro

65 70 75 80

Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro

85 90 95

Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu

100 105 110

Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys

115 120 125

Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys Asn His Arg

130 135 140

Asn Arg Arg Arg Val Cys Lys Cys Pro Arg Pro Val Val

145 150 155

<210> 56

<211> 1293

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 56

atgccgaacc caaggccagg gaagccctct gctcctagcc tggccctcgg ccccagccct 60

ggcgctagcc cctcttggag ggcggctccg aaggcttccg acctcctggg tgctaggggc 120

cctggtggaa ccttccaagg cagggatctg cgaggagggg cgcacgcctc tagctcaagc 180

ctgaacccga tgcccccctc acagctgcaa ctgcctaccc tgccgctcgt catggtggcc 240

cccagcggcg caagactggg cccgttgccg cacctgcaag ccttgctgca ggaccggcca 300

catttcatgc accagctcag caccgtggac gcacatgcaa ggacacccgt gctgcaagtc 360

caccccctgg agagccctgc catgatcagc ctgacgccgc ccaccaccgc aaccggcgtg 420

ttttcactga aggcaagacc cgggctgcca ccgggcatca acgtggccag cctggaatgg 480

gtgagcaggg agccagcgct cctgtgtacc ttcccaaacc catccgcccc aagaaaggac 540

agcaccctgt ctgccgtgcc ccaatcatct tacccgctgc tggcgaatgg cgtatgcaag 600

tggcccggat gtgaaaaggt gttcgaggag ccggaagatt tcctgaaaca ttgccaggcc 660

gaccacctgt tggacgaaaa gggaagggcc caatgcctgc ttcagaggga gatggtgcag 720

agcttggagc aacaactcgt gctcgagaag gagaagctga gcgccatgca ggcacacctc 780

gccggcaaga tggccctgac caaagccagt agcgtagcca gctccgacaa gggtagctgt 840

tgcatcgtgg ccgcaggaag tcaaggcccc gttgtgcccg cctggagcgg tccaagggag 900

gcacccgact cactgttcgc cgtgaggagg catctgtggg gcagccacgg taacagcacg 960

ttccccgagt tcctgcataa catggactac ttcaagttcc acaacatgcg gcctccattc 1020

acctacgcca cactgataag gtgggctatc ctggaggctc ccgagaagca aaggaccctg 1080

aacgagatct accactggtt caccaggatg ttcgctttct ttaggaacca ccccgcgacc 1140

tggaaaaacg ccataaggca taacttgagc cttcacaagt gcttcgtgag ggtggagagt 1200

gagaaaggtg ccgtgtggac tgtggatgag ttggagttcc gcaagaagcg aagccaacga 1260

cctagcaggt gtagcaatcc aacgcctgga ccc 1293

<210> 57

<211> 431

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 57

Met Pro Asn Pro Arg Pro Gly Lys Pro Ser Ala Pro Ser Leu Ala Leu

1 5 10 15

Gly Pro Ser Pro Gly Ala Ser Pro Ser Trp Arg Ala Ala Pro Lys Ala

20 25 30

Ser Asp Leu Leu Gly Ala Arg Gly Pro Gly Gly Thr Phe Gln Gly Arg

35 40 45

Asp Leu Arg Gly Gly Ala His Ala Ser Ser Ser Ser Leu Asn Pro Met

50 55 60

Pro Pro Ser Gln Leu Gln Leu Pro Thr Leu Pro Leu Val Met Val Ala

65 70 75 80

Pro Ser Gly Ala Arg Leu Gly Pro Leu Pro His Leu Gln Ala Leu Leu

85 90 95

Gln Asp Arg Pro His Phe Met His Gln Leu Ser Thr Val Asp Ala His

100 105 110

Ala Arg Thr Pro Val Leu Gln Val His Pro Leu Glu Ser Pro Ala Met

115 120 125

Ile Ser Leu Thr Pro Pro Thr Thr Ala Thr Gly Val Phe Ser Leu Lys

130 135 140

Ala Arg Pro Gly Leu Pro Pro Gly Ile Asn Val Ala Ser Leu Glu Trp

145 150 155 160

Val Ser Arg Glu Pro Ala Leu Leu Cys Thr Phe Pro Asn Pro Ser Ala

165 170 175

Pro Arg Lys Asp Ser Thr Leu Ser Ala Val Pro Gln Ser Ser Tyr Pro

180 185 190

Leu Leu Ala Asn Gly Val Cys Lys Trp Pro Gly Cys Glu Lys Val Phe

195 200 205

Glu Glu Pro Glu Asp Phe Leu Lys His Cys Gln Ala Asp His Leu Leu

210 215 220

Asp Glu Lys Gly Arg Ala Gln Cys Leu Leu Gln Arg Glu Met Val Gln

225 230 235 240

Ser Leu Glu Gln Gln Leu Val Leu Glu Lys Glu Lys Leu Ser Ala Met

245 250 255

Gln Ala His Leu Ala Gly Lys Met Ala Leu Thr Lys Ala Ser Ser Val

260 265 270

Ala Ser Ser Asp Lys Gly Ser Cys Cys Ile Val Ala Ala Gly Ser Gln

275 280 285

Gly Pro Val Val Pro Ala Trp Ser Gly Pro Arg Glu Ala Pro Asp Ser

290 295 300

Leu Phe Ala Val Arg Arg His Leu Trp Gly Ser His Gly Asn Ser Thr

305 310 315 320

Phe Pro Glu Phe Leu His Asn Met Asp Tyr Phe Lys Phe His Asn Met

325 330 335

Arg Pro Pro Phe Thr Tyr Ala Thr Leu Ile Arg Trp Ala Ile Leu Glu

340 345 350

Ala Pro Glu Lys Gln Arg Thr Leu Asn Glu Ile Tyr His Trp Phe Thr

355 360 365

Arg Met Phe Ala Phe Phe Arg Asn His Pro Ala Thr Trp Lys Asn Ala

370 375 380

Ile Arg His Asn Leu Ser Leu His Lys Cys Phe Val Arg Val Glu Ser

385 390 395 400

Glu Lys Gly Ala Val Trp Thr Val Asp Glu Leu Glu Phe Arg Lys Lys

405 410 415

Arg Ser Gln Arg Pro Ser Arg Cys Ser Asn Pro Thr Pro Gly Pro

420 425 430

<210> 58

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成肽

<400> 58

Gly Gly Ser Gly Gly Gly Ser Gly

1 5

<210> 59

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成肽

<400> 59

Gly Gly Ser Gly Gly Gly Ser Gly Gly

1 5

<210> 60

<211> 2503

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 60

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360

ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420

cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480

ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540

tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600

gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660

tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720

tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780

caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840

ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900

ttccgtcctc agccgtcgct tcatgtgact ccactgagta ccgggcgccg tccaggcacc 960

tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020

cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080

tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140

agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgatctaga ggatcactag 1200

tgccaccatg gcacctaaga aaaagaggaa ggttgaacgc ccatatgctt gccctgtcga 1260

gtcctgcgat cgccgctttt ctcgctcgga tgagcttacc cgccatatcc gcatccacac 1320

aggccagaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgta gtgaccacct 1380

taccacccac atccgcaccc acacaggcgg cggccgcagg aggaagaaac gcaccagcat 1440

agagaccaac atccgtgtgg ccttagagaa gagtttcttg gagaatcaaa agcctacctc 1500

ggaagagatc actatgattg ctgatcagct caatatggaa aaagaggtga ttcgtgtttg 1560

gttctgtaac cgccgccaga aagaaaaaag aatcaacact agactggggg ccttgcttgg 1620

caacagcaca gacccagctg tgttcacaga cctggcatcc gtggacaact ccgagtttca 1680

gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 1740

gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 1800

tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 1860

ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccg gaggtagtgg 1920

tggaggcagt ggtggtgttg gttcgctaaa ctgcatcgtc gctgtgtccc agaacatggg 1980

catcggcaag aacggggacc tgccctggcc accgctcagg aatgaattca gatatttcca 2040

gagaatgacc acaacctctt cagtagaagg taaacagaat ctggtgatta tgggtaagaa 2100

gacctggttc tccattcctg agaagaatcg acctttaaag ggtagaatta atttagttct 2160

cagcagagaa ctcaaggaac ctccacaagg agctcatttt ctttccagaa gtctagatga 2220

tgccttaaaa cttactgaac aaccagaatt agcaaataaa gtagacatgg tctggatagt 2280

tggtggcagt tctgttatta aggaagccat gaatcaccca ggccatctta aactatttgt 2340

gacaaggatc atgcaagact ttgaaagtga cacgtttttt ccagaaattg atttggagaa 2400

atataaactt ctgccagaat acccaggtgt tctctctgat gtccaggagg agaaaggcat 2460

taagtacaaa tttgaagtat atgagaagaa tgatggatcc tga 2503

<210> 61

<211> 431

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 61

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Gly Ser Gly Gly Gly

225 230 235 240

Ser Gly Gly Val Gly Ser Leu Asn Cys Ile Val Ala Val Ser Gln Asn

245 250 255

Met Gly Ile Gly Lys Asn Gly Asp Leu Pro Trp Pro Pro Leu Arg Asn

260 265 270

Glu Phe Arg Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly

275 280 285

Lys Gln Asn Leu Val Ile Met Gly Lys Lys Thr Trp Phe Ser Ile Pro

290 295 300

Glu Lys Asn Arg Pro Leu Lys Gly Arg Ile Asn Leu Val Leu Ser Arg

305 310 315 320

Glu Leu Lys Glu Pro Pro Gln Gly Ala His Phe Leu Ser Arg Ser Leu

325 330 335

Asp Asp Ala Leu Lys Leu Thr Glu Gln Pro Glu Leu Ala Asn Lys Val

340 345 350

Asp Met Val Trp Ile Val Gly Gly Ser Ser Val Ile Lys Glu Ala Met

355 360 365

Asn His Pro Gly His Leu Lys Leu Phe Val Thr Arg Ile Met Gln Asp

370 375 380

Phe Glu Ser Asp Thr Phe Phe Pro Glu Ile Asp Leu Glu Lys Tyr Lys

385 390 395 400

Leu Leu Pro Glu Tyr Pro Gly Val Leu Ser Asp Val Gln Glu Glu Lys

405 410 415

Gly Ile Lys Tyr Lys Phe Glu Val Tyr Glu Lys Asn Asp Gly Ser

420 425 430

<210> 62

<211> 2680

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 62

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360

ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420

cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480

ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540

tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600

gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660

tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720

tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780

caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840

ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900

ttccgtcctc agccgtcgct tcatgtgact ccactgagta ccgggcgccg tccaggcacc 960

tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020

cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080

tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140

agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgatctaga ggatcactag 1200

tgccaccatg gcacctaaga aaaagaggaa ggttgaacgc ccatatgctt gccctgtcga 1260

gtcctgcgat cgccgctttt ctcgctcgga tgagcttacc cgccatatcc gcatccacac 1320

aggccagaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgta gtgaccacct 1380

taccacccac atccgcaccc acacaggcgg cggccgcagg aggaagaaac gcaccagcat 1440

agagaccaac atccgtgtgg ccttagagaa gagtttcttg gagaatcaaa agcctacctc 1500

ggaagagatc actatgattg ctgatcagct caatatggaa aaagaggtga ttcgtgtttg 1560

gttctgtaac cgccgccaga aagaaaaaag aatcaacact agactggggg ccttgcttgg 1620

caacagcaca gacccagctg tgttcacaga cctggcatcc gtggacaact ccgagtttca 1680

gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 1740

gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 1800

tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 1860

ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccg gaggtagtgg 1920

tggaggcagt ggtggttcac tggcgctcag ccttactgcc gaccaaatgg tatcagctct 1980

tctggacgca gaacccccaa ttctttattc cgagtacgac cccacacgcc cgttcagtga 2040

agcttccatg atgggcctcc ttacgaacct tgccgaccgg gaactcgtgc acatgatcaa 2100

ttgggcgaag cgggtgccgg ggttcgtaga tttgacactt cacgaccaag ttcatctctt 2160

ggaatgtgct tggatggaga tattgatgat cggactcgtg tggaggtcaa tggagcatcc 2220

tggtaaactt cttttcgcac ccaatctgct cttggataga aatcagggta agtgcgtcga 2280

gggtggcgtt gaaatcttcg acatgctcct tgcgacatcc agccgattcc gaatgatgaa 2340

tcttcaagga gaggaatttg tctgtcttaa gagcattata ctcctcaata gtggagttta 2400

caccttcttg tcctctacac tgaaatcact tgaggaaaaa gatcacatac atagggtgtt 2460

ggataaaatc acggatacac tcatacatct gatggcaaaa gcaggattga ccctgcaaca 2520

gcagcaccga cgactggccc aactgctgtt gatccttagc catatcagac acatgtctaa 2580

caaaaggatg gaacatttgt acagcatgaa atgtaagaac gtagtgccac tgtccgattt 2640

gttgctggaa atgctggacg ctcatcggct cggatcctga 2680

<210> 63

<211> 490

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 63

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Gly Ser Gly Gly Gly

225 230 235 240

Ser Gly Gly Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser

245 250 255

Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro

260 265 270

Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu

275 280 285

Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro

290 295 300

Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys

305 310 315 320

Ala Trp Met Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu

325 330 335

His Pro Gly Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn

340 345 350

Gln Gly Lys Cys Val Glu Gly Gly Val Glu Ile Phe Asp Met Leu Leu

355 360 365

Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe

370 375 380

Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe

385 390 395 400

Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg

405 410 415

Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala

420 425 430

Gly Leu Thr Leu Gln Gln Gln His Arg Arg Leu Ala Gln Leu Leu Leu

435 440 445

Ile Leu Ser His Ile Arg His Met Ser Asn Lys Arg Met Glu His Leu

450 455 460

Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Ser Asp Leu Leu Leu

465 470 475 480

Glu Met Leu Asp Ala His Arg Leu Gly Ser

485 490

<210> 64

<211> 2404

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 64

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360

ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420

cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480

ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540

tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600

gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660

tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720

tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780

caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840

ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900

ttccgtcctc agccgtcgct tcatgtgact ccactgagta ccgggcgccg tccaggcacc 960

tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020

cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080

tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140

agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgatctaga ggatcactag 1200

tgccaccatg gcacctaaga aaaagaggaa ggttgaacgc ccatatgctt gccctgtcga 1260

gtcctgcgat cgccgctttt ctcgctcgga tgagcttacc cgccatatcc gcatccacac 1320

aggccagaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgta gtgaccacct 1380

taccacccac atccgcaccc acacaggcgg cggccgcagg aggaagaaac gcaccagcat 1440

agagaccaac atccgtgtgg ccttagagaa gagtttcttg gagaatcaaa agcctacctc 1500

ggaagagatc actatgattg ctgatcagct caatatggaa aaagaggtga ttcgtgtttg 1560

gttctgtaac cgccgccaga aagaaaaaag aatcaacact agactggggg ccttgcttgg 1620

caacagcaca gacccagctg tgttcacaga cctggcatcc gtggacaact ccgagtttca 1680

gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 1740

gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 1800

tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 1860

ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccg gatccagcgg 1920

catctctctg attgcggcgc tggcagttga ctacgttatt ggcatggaaa acgcgatgcc 1980

atggaacctc ccggctgacc tggcgtggtt caaacgtaac accctgaaca aacctgtgat 2040

catgggtcgt cacacctggg aatctattgg ccgtcctctc ccgggtcgta aaaacatcat 2100

tctgtcttct cagccaggca ccgacgaccg tgttacctgg gttaaaagcg ttgacgaagc 2160

gattgctgcg tgcggtgatg ttcctgaaat tatggtgatc ggcggtggcc gtgttatcga 2220

acagttcctg ccgaaagcgc agaaactgta cctgacccac atcgacgcgg aagttgaagg 2280

tgacacccac ttcccggact acgaaccgga tgattgggag agcgtattct ccgaattcca 2340

tgatgcggat gcgcaaaact ctcattctta ctgttttgaa atcctggaac gtcgtggatc 2400

ctga 2404

<210> 65

<211> 398

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 65

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Ser Ser Gly Ile Ser

225 230 235 240

Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met Glu Asn Ala

245 250 255

Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys Arg Asn Thr

260 265 270

Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu Ser Ile Gly

275 280 285

Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser Gln Pro Gly

290 295 300

Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu Ala Ile Ala

305 310 315 320

Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly Gly Arg Val

325 330 335

Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu Thr His Ile

340 345 350

Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr Glu Pro Asp

355 360 365

Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp Ala Gln Asn

370 375 380

Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg Gly Ser

385 390 395

<210> 66

<211> 1918

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 66

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360

ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420

cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480

ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540

tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600

gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660

tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720

tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780

caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840

ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900

ttccgtcctc agccgtcgct tcatgtgact ccactgagta ccgggcgccg tccaggcacc 960

tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020

cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080

tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140

agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgatctaga ggatcactag 1200

tgccaccatg gcacctaaga aaaagaggaa ggttgaacgc ccatatgctt gccctgtcga 1260

gtcctgcgat cgccgctttt ctcgctcgga tgagcttacc cgccatatcc gcatccacac 1320

aggccagaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgta gtgaccacct 1380

taccacccac atccgcaccc acacaggcgg cggccgcagg aggaagaaac gcaccagcat 1440

agagaccaac atccgtgtgg ccttagagaa gagtttcttg gagaatcaaa agcctacctc 1500

ggaagagatc actatgattg ctgatcagct caatatggaa aaagaggtga ttcgtgtttg 1560

gttctgtaac cgccgccaga aagaaaaaag aatcaacact agactggggg ccttgcttgg 1620

caacagcaca gacccagctg tgttcacaga cctggcatcc gtggacaact ccgagtttca 1680

gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 1740

gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 1800

tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 1860

ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccg gatcctga 1918

<210> 67

<211> 236

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 67

Met Ala Pro Lys Lys Lys Arg Lys Val Glu Arg Pro Tyr Ala Cys Pro

1 5 10 15

Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg

20 25 30

His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg Ile Cys

35 40 45

Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile Arg Thr

50 55 60

His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile Glu Thr

65 70 75 80

Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln Lys Pro

85 90 95

Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met Glu Lys

100 105 110

Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu Lys Arg

115 120 125

Ile Asn Thr Arg Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala

130 135 140

Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu

145 150 155 160

Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu

165 170 175

Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg

180 185 190

Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn

195 200 205

Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp

210 215 220

Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly Ser

225 230 235

<210> 68

<211> 7733

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 68

tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 60

gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat 120

taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt 180

aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt 240

atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat 300

tacgccaagc gcgcaattaa ccctcactaa agggaacaaa agctggagct gcaagcttaa 360

tgtagtctta tgcaatactc ttgtagtctt gcaacatggt aacgatgagt tagcaacatg 420

ccttacaagg agagaaaaag caccgtgcat gccgattggt ggaagtaagg tggtacgatc 480

gtgccttatt aggaaggcaa cagacgggtc tgacatggat tggacgaacc actgaattgc 540

cgcattgcag agatattgta tttaagtgcc tagctcgata cataaacggg tctctctggt 600

tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg cttaagcctc 660

aataaagctt gccttgagtg cttcaagtag tgtgtgcccg tctgttgtgt gactctggta 720

actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt ggcgcccgaa 780

cagggacttg aaagcgaaag ggaaaccaga ggagctctct cgacgcagga ctcggcttgc 840

tgaagcgcgc acggcaagag gcgaggggcg gcgactggtg agtacgccaa aaattttgac 900

tagcggaggc tagaaggaga gagatgggtg cgagagcgtc agtattaagc gggggagaat 960

tagatcgcga tgggaaaaaa ttcggttaag gccaggggga aagaaaaaat ataaattaaa 1020

acatatagta tgggcaagca gggagctaga acgattcgca gttaatcctg gcctgttaga 1080

aacatcagaa ggctgtagac aaatactggg acagctacaa ccatcccttc agacaggatc 1140

agaagaactt agatcattat ataatacagt agcaaccctc tattgtgtgc atcaaaggat 1200

agagataaaa gacaccaagg aagctttaga caagatagag gaagagcaaa acaaaagtaa 1260

gaccaccgca cagcaagcgg ccgctgatct tcagacctgg aggaggagat atgagggaca 1320

attggagaag tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac 1380

ccaccaaggc aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt 1440

tgttccttgg gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga 1500

cggtacaggc cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg 1560

ctattgaggc gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg 1620

caagaatcct ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt 1680

gctctggaaa actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat 1740

ctctggaaca gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt 1800

acacaagctt aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac 1860

aagaattatt ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt 1920

ggctgtggta tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag 1980

tttttgctgt actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc 2040

agacccacct cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg 2100

gagagagaga cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgattag 2160

actgtagccc aggaatatgg cagctagatt gtacacattt agaaggaaaa gttatcttgg 2220

tagcagttca tgtagccagt ggatatatag aagcagaagt aattccagca gagacagggc 2280

aagaaacagc atacttcctc ttaaaattag caggaagatg gccagtaaaa acagtacata 2340

cagacaatgg cagcaatttc accagtacta cagttaaggc cgcctgttgg tgggcgggga 2400

tcaagcagga atttggcatt ccctacaatc cccaaagtca aggagtaata gaatctatga 2460

ataaagaatt aaagaaaatt ataggacagg taagagatca ggctgaacat cttaagacag 2520

cagtacaaat ggcagtattc atccacaatt ttaaaagaaa aggggggatt ggggggtaca 2580

gtgcagggga aagaatagta gacataatag caacagacat acaaactaaa gaattacaaa 2640

aacaaattac aaaaattcaa aattttcggg tttattacag ggacagcaga gatccagttt 2700

ggctgcattg atcacgtgag gctccggtgc ccgtcagtgg gcagagcgca catcgcccac 2760

agtccccgag aagttggggg gaggggtcgg caattgaacc ggtgcctaga gaaggtggcg 2820

cggggtaaac tgggaaagtg atgtcgtgta ctggctccgc ctttttcccg agggtggggg 2880

agaaccgtat ataagtgcag tagtcgccgt gaacgttctt tttcgcaacg ggtttgccgc 2940

cagaacacag gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg 3000

cccttgcgtg ccttgaatta cttccacctg gctgcagtac gtgattcttg atcccgagct 3060

tcgggttgga agtgggtggg agagttcgag gccttgcgct taaggagccc cttcgcctcg 3120

tgcttgagtt gaggcctggc ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct 3180

tcgcgcctgt ctcgctgctt tcgataagtc tctagccatt taaaattttt gatgacctgc 3240

tgcgacgctt tttttctggc aagatagtct tgtaaatgcg ggccaagatc tgcacactgg 3300

tatttcggtt tttggggccg cgggcggcga cggggcccgt gcgtcccagc gcacatgttc 3360

ggcgaggcgg ggcctgcgag cgcggccacc gagaatcgga cgggggtagt ctcaagctgg 3420

ccggcctgct ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag 3480

gctggcccgg tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc 3540

agggagctca aaatggagga cgcggcgctc gggagagcgg gcgggtgagt cacccacaca 3600

aaggaaaagg gcctttccgt cctcagccgt cgcttcatgt gactccactg agtaccgggc 3660

gccgtccagg cacctcgatt agttctcgag cttttggagt acgtcgtctt taggttgggg 3720

ggaggggttt tatgcgatgg agtttcccca cactgagtgg gtggagactg aagttaggcc 3780

agcttggcac ttgatgtaat tctccttgga atttgccctt tttgagtttg gatcttggtt 3840

cattctcaag cctcagacag tggttcaaag tttttttctt ccatttcagg tgtcgtgatc 3900

tagaggatcc actagtgata tcgggctagc gtcgacaatc aacctctgga ttacaaaatt 3960

tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct 4020

gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg 4080

tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag gcaacgtggc 4140

gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc caccacctgt 4200

cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga actcatcgcc 4260

gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggtg 4320

ttgtcgggga agctgacgtc ctttccatgg ctgctcgcct gtgttgccac ctggattctg 4380

cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct tccttcccgc 4440

ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca gacgagtcgg 4500

atctcccttt gggccgcctc cccgcctgga attcgagctc ggtaccttta agaccaatga 4560

cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga ctggaagggc 4620

taattcactc ccaacgaaga caagatctgc tttttgcttg tactgggtct ctctggttag 4680

accagatctg agcctgggag ctctctggct aactagggaa cccactgctt aagcctcaat 4740

aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac tctggtaact 4800

agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcagtagt agttcatgtc 4860

atcttattat tcagtattta taacttgcaa agaaatgaat atcagagagt gagaggaact 4920

tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 4980

aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 5040

atgtctggct ctagctatcc cgcccctaac tccgcccatc ccgcccctaa ctccgcccag 5100

ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag aggccgaggc 5160

cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag gcctagggac 5220

gtacccaatt cgccctatag tgagtcgtat tacgcgcgct cactggccgt cgttttacaa 5280

cgtcgtgact gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct 5340

ttcgccagct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc 5400

agcctgaatg gcgaatggga cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 5460

gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 5520

ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc 5580

cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 5640

gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 5700

tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 5760

gtctattctt ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag 5820

ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat taacgcttac aatttaggtg 5880

gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 5940

atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 6000

agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 6060

ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 6120

gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 6180

gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 6240

tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 6300

acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 6360

aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 6420

cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 6480

gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 6540

cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 6600

tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 6660

tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 6720

ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 6780

tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 6840

gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 6900

ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 6960

tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 7020

agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 7080

aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 7140

cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 7200

agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 7260

tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 7320

gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 7380

gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 7440

ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 7500

gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 7560

ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 7620

ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 7680

acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcc 7733

<210> 69

<211> 7733

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多核苷酸

<400> 69

tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 60

gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat 120

taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt 180

aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt 240

atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat 300

tacgccaagc gcgcaattaa ccctcactaa agggaacaaa agctggagct gcaagcttaa 360

tgtagtctta tgcaatactc ttgtagtctt gcaacatggt aacgatgagt tagcaacatg 420

ccttacaagg agagaaaaag caccgtgcat gccgattggt ggaagtaagg tggtacgatc 480

gtgccttatt aggaaggcaa cagacgggtc tgacatggat tggacgaacc actgaattgc 540

cgcattgcag agatattgta tttaagtgcc tagctcgata caataaacgg gtctctctgg 600

ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 660

caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 720

aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 780

acagggacct gaaagcgaaa gggaaaccag agctctctcg acgcaggact cggcttgctg 840

aagcgcgcac ggcaagaggc gaggggcggc gactggtgag tacgccaaaa attttgacta 900

gcggaggcta gaaggagaga gatgggtgcg agagcgtcag tattaagcgg gggagaatta 960

gatcgcgatg ggaaaaaatt cggttaaggc cagggggaaa gaaaaaatat aaattaaaac 1020

atatagtatg ggcaagcagg gagctagaac gattcgcagt taatcctggc ctgttagaaa 1080

catcagaagg ctgtagacaa atactgggac agctacaacc atcccttcag acaggatcag 1140

aagaacttag atcattatat aatacagtag caaccctcta ttgtgtgcat caaaggatag 1200

agataaaaga caccaaggaa gctttagaca agatagagga agagcaaaac aaaagtaaga 1260

ccaccgcaca gcaagcggcc gctgatcttc agacctggag gaggagatat gagggacaat 1320

tggagaagtg aattatataa atataaagta gtaaaaattg aaccattagg agtagcaccc 1380

accaaggcaa agagaagagt ggtgcagaga gaaaaaagag cagtgggaat aggagctttg 1440

ttccttgggt tcttgggagc agcaggaagc actatgggcg cagcctcaat gacgctgacg 1500

gtacaggcca gacaattatt gtctggtata gtgcagcagc agaacaattt gctgagggct 1560

attgaggcgc aacagcatct gttgcaactc acagtctggg gcatcaagca gctccaggca 1620

agaatcctgg ctgtggaaag atacctaaag gatcaacagc tcctggggat ttggggttgc 1680

tctggaaaac tcatttgcac cactgctgtg ccttggaatg ctagttggag taataaatct 1740

ctggaacaga ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 1800

caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 1860

aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 1920

tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 1980

ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2040

cccacctccc aaccccgagg ggacccgaca ggcccgaagg aatagaagaa gaaggtggag 2100

agagagacag agacagatcc attcgattag tgaacggatc tcgacggtat cgattagact 2160

gtagcccagg aatatggcag ctagattgta cacatttaga aggaaaagtt atcttggtag 2220

cagttcatgt agccagtgga tatatagaag cagaagtaat tccagcagag acagggcaag 2280

aaacagcata cttcctctta aaattagcag gaagatggcc agtaaaaaca gtacatacag 2340

acaatggcag caatttcacc agtactacag ttaaggccgc ctgttggtgg gcggggatca 2400

agcaggaatt tggcattccc tacaatcccc aaagtcaagg agtaatagaa tctatgaata 2460

aagaattaaa gaaaattata ggacaggtaa gagatcaggc tgaacatctt aagacagcag 2520

tacaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg gggtacagtg 2580

caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa ttacaaaaac 2640

aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat ccagtttggc 2700

tgcatacgcg tcgtgaggct ccggtgcccg tcagtgggca gagcgcacat cgcccacagt 2760

ccccgagaag ttggggggag gggtcggcaa ttgaaccggt gcctagagaa ggtggcgcgg 2820

ggtaaactgg gaaagtgatg tcgtgtactg gctccgcctt tttcccgagg gtgggggaga 2880

accgtatata agtgcagtag tcgccgtgaa cgttcttttt cgcaacgggt ttgccgccag 2940

aacacaggta agtgccgtgt gtggttcccg cgggcctggc ctctttacgg gttatggccc 3000

ttgcgtgcct tgaattactt ccacctggct gcagtacgtg attcttgatc ccgagcttcg 3060

ggttggaagt gggtgggaga gttcgaggcc ttgcgcttaa ggagcccctt cgcctcgtgc 3120

ttgagttgag gcctggcctg ggcgctgggg ccgccgcgtg cgaatctggt ggcaccttcg 3180

cgcctgtctc gctgctttcg ataagtctct agccatttaa aatttttgat gacctgctgc 3240

gacgcttttt ttctggcaag atagtcttgt aaatgcgggc caagatctgc acactggtat 3300

ttcggttttt ggggccgcgg gcggcgacgg ggcccgtgcg tcccagcgca catgttcggc 3360

gaggcggggc ctgcgagcgc ggccaccgag aatcggacgg gggtagtctc aagctggccg 3420

gcctgctctg gtgcctggcc tcgcgccgcc gtgtatcgcc ccgccctggg cggcaaggct 3480

ggcccggtcg gcaccagttg cgtgagcgga aagatggccg cttcccggcc ctgctgcagg 3540

gagctcaaaa tggaggacgc ggcgctcggg agagcgggcg ggtgagtcac ccacacaaag 3600

gaaaagggcc tttccgtcct cagccgtcgc ttcatgtgac tccactgagt accgggcgcc 3660

gtccaggcac ctcgattagt tctcgtgctt ttggagtacg tcgtctttag gttgggggga 3720

ggggttttat gcgatggagt ttccccacac tgagtgggtg gagactgaag ttaggccagc 3780

ttggcacttg atgtaattct ccttggaatt tgcccttttt gagtttggat cttggttcat 3840

tctcaagcct cagacagtgg ttcaaagttt ttttcttcca tttcaggtgt cgtgagctag 3900

actagtgata tcggatcccg ggacgtggtc gacgctagca atcaacctct ggattacaaa 3960

atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac 4020

gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc 4080

ttgtataaat cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt 4140

ggcgtggtgt gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc 4200

tgtcagctcc tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc 4260

gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg 4320

gtgttgtcgg ggaagctgac gtcctttcca tggctgctcg cctgtgttgc cacctggatt 4380

ctgcgcggga cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc 4440

cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt 4500

cggatctccc tttgggccgc ctccccgcct ggaattcgag ctcggtacct ttaagaccaa 4560

tgacttacaa ggcagctgta gatcttagcc actttttaaa agaaaagggg ggactggaag 4620

ggctaattca ctcccaacga agacaagatc tgctttttgc ttgtactggg tctctctggt 4680

tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg cttaagcctc 4740

aataaagctt gccttgagtg cttcaagtag tgtgtgcccg tctgttgtgt gactctggta 4800

actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt agtagttcat 4860

gtcatcttat tattcagtat ttataacttg caaagaaatg aatatcagag agtgagagga 4920

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 4980

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 5040

atcatgtctg gctctagcta tcccgcccct aactccgccc agttccgccc attctccgcc 5100

ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctcgg cctctgagct 5160

attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcgtcg agacgtaccc 5220

aattcgccct atagtgagtc gtattacgcg cgctcactgg ccgtcgtttt acaacgtcgt 5280

gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 5340

agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 5400

aatggcgaat ggcgcgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 5460

acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 5520

ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 5580

ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat 5640

ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 5700

acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc 5760

tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 5820

atttaacaaa aatttaacgc gaattttaac aaaatattaa cgtttacaat ttcccaggtg 5880

gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 5940

atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 6000

agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 6060

ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 6120

gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 6180

gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 6240

tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 6300

acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 6360

aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 6420

cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 6480

gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 6540

cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 6600

tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 6660

tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 6720

ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 6780

tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 6840

gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 6900

ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 6960

tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 7020

agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 7080

aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 7140

cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 7200

agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 7260

tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 7320

gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 7380

gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 7440

ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 7500

gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 7560

ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 7620

ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 7680

acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcc 7733

<210> 70

<211> 12

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成寡核苷酸

<400> 70

taatgatggg cg 12

<210> 71

<211> 875

<212> PRT

<213> 智人(Homo sapiens)

<400> 71

Met Glu Arg Ala Gly Pro Ser Phe Gly Gln Gln Arg Gln Gln Gln Gln

1 5 10 15

Pro Gln Gln Gln Lys Gln Gln Gln Arg Asp Gln Asp Ser Val Glu Ala

20 25 30

Trp Leu Asp Asp His Trp Asp Phe Thr Phe Ser Tyr Phe Val Arg Lys

35 40 45

Ala Thr Arg Glu Met Val Asn Ala Trp Phe Ala Glu Arg Val His Thr

50 55 60

Ile Pro Val Cys Lys Glu Gly Ile Arg Gly His Thr Glu Ser Cys Ser

65 70 75 80

Cys Pro Leu Gln Gln Ser Pro Arg Ala Asp Asn Ser Ala Pro Gly Thr

85 90 95

Pro Thr Arg Lys Ile Ser Ala Ser Glu Phe Asp Arg Pro Leu Arg Pro

100 105 110

Ile Val Val Lys Asp Ser Glu Gly Thr Val Ser Phe Leu Ser Asp Ser

115 120 125

Glu Lys Lys Glu Gln Met Pro Leu Thr Pro Pro Arg Phe Asp His Asp

130 135 140

Glu Gly Asp Gln Cys Ser Arg Leu Leu Glu Leu Val Lys Asp Ile Ser

145 150 155 160

Ser His Leu Asp Val Thr Ala Leu Cys His Lys Ile Phe Leu His Ile

165 170 175

His Gly Leu Ile Ser Ala Asp Arg Tyr Ser Leu Phe Leu Val Cys Glu

180 185 190

Asp Ser Ser Asn Asp Lys Phe Leu Ile Ser Arg Leu Phe Asp Val Ala

195 200 205

Glu Gly Ser Thr Leu Glu Glu Val Ser Asn Asn Cys Ile Arg Leu Glu

210 215 220

Trp Asn Lys Gly Ile Val Gly His Val Ala Ala Leu Gly Glu Pro Leu

225 230 235 240

Asn Ile Lys Asp Ala Tyr Glu Asp Pro Arg Phe Asn Ala Glu Val Asp

245 250 255

Gln Ile Thr Gly Tyr Lys Thr Gln Ser Ile Leu Cys Met Pro Ile Lys

260 265 270

Asn His Arg Glu Glu Val Val Gly Val Ala Gln Ala Ile Asn Lys Lys

275 280 285

Ser Gly Asn Gly Gly Thr Phe Thr Glu Lys Asp Glu Lys Asp Phe Ala

290 295 300

Ala Tyr Leu Ala Phe Cys Gly Ile Val Leu His Asn Ala Gln Leu Tyr

305 310 315 320

Glu Thr Ser Leu Leu Glu Asn Lys Arg Asn Gln Val Leu Leu Asp Leu

325 330 335

Ala Ser Leu Ile Phe Glu Glu Gln Gln Ser Leu Glu Val Ile Leu Lys

340 345 350

Lys Ile Ala Ala Thr Ile Ile Ser Phe Met Gln Val Gln Lys Cys Thr

355 360 365

Ile Phe Ile Val Asp Glu Asp Cys Ser Asp Ser Phe Ser Ser Val Phe

370 375 380

His Met Glu Cys Glu Glu Leu Glu Lys Ser Ser Asp Thr Leu Thr Arg

385 390 395 400

Glu His Asp Ala Asn Lys Ile Asn Tyr Met Tyr Ala Gln Tyr Val Lys

405 410 415

Asn Thr Met Glu Pro Leu Asn Ile Pro Asp Val Ser Lys Asp Lys Arg

420 425 430

Phe Pro Trp Thr Thr Glu Asn Thr Gly Asn Val Asn Gln Gln Cys Ile

435 440 445

Arg Ser Leu Leu Cys Thr Pro Ile Lys Asn Gly Lys Lys Asn Lys Val

450 455 460

Ile Gly Val Cys Gln Leu Val Asn Lys Met Glu Glu Asn Thr Gly Lys

465 470 475 480

Val Lys Pro Phe Asn Arg Asn Asp Glu Gln Phe Leu Glu Ala Phe Val

485 490 495

Ile Phe Cys Gly Leu Gly Ile Gln Asn Thr Gln Met Tyr Glu Ala Val

500 505 510

Glu Arg Ala Met Ala Lys Gln Met Val Thr Leu Glu Val Leu Ser Tyr

515 520 525

His Ala Ser Ala Ala Glu Glu Glu Thr Arg Glu Leu Gln Ser Leu Ala

530 535 540

Ala Ala Val Val Pro Ser Ala Gln Thr Leu Lys Ile Thr Asp Phe Ser

545 550 555 560

Phe Ser Asp Phe Glu Leu Ser Asp Leu Glu Thr Ala Leu Cys Thr Ile

565 570 575

Arg Met Phe Thr Asp Leu Asn Leu Val Gln Asn Phe Gln Met Lys His

580 585 590

Glu Val Leu Cys Arg Trp Ile Leu Ser Val Lys Lys Asn Tyr Arg Lys

595 600 605

Asn Val Ala Tyr His Asn Trp Arg His Ala Phe Asn Thr Ala Gln Cys

610 615 620

Met Phe Ala Ala Leu Lys Ala Gly Lys Ile Gln Asn Lys Leu Thr Asp

625 630 635 640

Leu Glu Ile Leu Ala Leu Leu Ile Ala Ala Leu Ser His Asp Leu Asp

645 650 655

His Arg Gly Val Asn Asn Ser Tyr Ile Gln Arg Ser Glu His Pro Leu

660 665 670

Ala Gln Leu Tyr Cys His Ser Ile Met Glu His His His Phe Asp Gln

675 680 685

Cys Leu Met Ile Leu Asn Ser Pro Gly Asn Gln Ile Leu Ser Gly Leu

690 695 700

Ser Ile Glu Glu Tyr Lys Thr Thr Leu Lys Ile Ile Lys Gln Ala Ile

705 710 715 720

Leu Ala Thr Asp Leu Ala Leu Tyr Ile Lys Arg Arg Gly Glu Phe Phe

725 730 735

Glu Leu Ile Arg Lys Asn Gln Phe Asn Leu Glu Asp Pro His Gln Lys

740 745 750

Glu Leu Phe Leu Ala Met Leu Met Thr Ala Cys Asp Leu Ser Ala Ile

755 760 765

Thr Lys Pro Trp Pro Ile Gln Gln Arg Ile Ala Glu Leu Val Ala Thr

770 775 780

Glu Phe Phe Asp Gln Gly Asp Arg Glu Arg Lys Glu Leu Asn Ile Glu

785 790 795 800

Pro Thr Asp Leu Met Asn Arg Glu Lys Lys Asn Lys Ile Pro Ser Met

805 810 815

Gln Val Gly Phe Ile Asp Ala Ile Cys Leu Gln Leu Tyr Glu Ala Leu

820 825 830

Thr His Val Ser Glu Asp Cys Phe Pro Leu Leu Asp Gly Cys Arg Lys

835 840 845

Asn Arg Gln Lys Trp Gln Ala Leu Ala Glu Gln Gln Glu Lys Met Leu

850 855 860

Ile Asn Gly Glu Ser Gly Gln Ala Lys Arg Asn

865 870 875

Claims

1.一种经过修饰的细胞，所述细胞包含第一多核苷酸，所述第一多核苷酸包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，所述转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列；

其中所述转录因子激活结构域、所述转录因子DNA结合结构域或者所述转录因子激活结构域与所述转录因子DNA结合结构域的组合中的至少一者可操作地连接至所述DRD；

其中所述转录因子激活结构域与所述转录因子DNA结合结构域相互作用以形成转录因子，所述转录因子在结合至所述特定多核苷酸结合位点后，能够激活第四核酸序列的转录；并且

其中所述第四核酸序列编码感兴趣蛋白质并且可操作地连接至包含所述特定多核苷酸结合位点的外源诱导型启动子。

2.一种经过修饰的细胞，所述细胞包含第一多核苷酸，所述第一多核苷酸包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，所述转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列；

其中所述第四核酸序列编码感兴趣蛋白质并且可操作地连接至所述特定多核苷酸结合位点。

3.如权利要求2所述的经过修饰的细胞，其中所述第四核酸序列可操作地连接至包含所述特定多核苷酸结合位点的外源诱导型启动子。

4.如权利要求1至3中任一项所述的经过修饰的细胞，其中所述感兴趣蛋白质是异源蛋白。

5.如权利要求1至4中任一项所述的经过修饰的细胞，其中所述第四核酸序列位于所述第一多核苷酸上。

6.如权利要求1至4中任一项所述的经过修饰的细胞，所述经过修饰的细胞还包含第二多核苷酸，所述第二多核苷酸包含所述第四核酸序列。

7.如权利要求1至6中任一项所述的经过修饰的细胞，其中所述转录因子DNA结合结构域来源于选自由以下组成的组的亲本蛋白质：ZFHD1、Cas9、Cas12和TAL。

8.如权利要求1至7中任一项所述的经过修饰的细胞，其中所述转录因子激活结构域来源于亲本蛋白质，其中所述亲本蛋白质是p65。

9.一种经过修饰的细胞，所述经过修饰的细胞包含多核苷酸，所述多核苷酸包含编码药物反应性结构域(DRD)的第一核酸序列和编码转录因子的第二核酸序列，其中所述转录因子可操作地连接至所述DRD；并且

其中所述转录因子能够结合至特定多核苷酸结合位点并激活编码感兴趣蛋白质的第三核酸序列的转录，其中所述第三核酸序列可操作地连接至包含所述特定多核苷酸结合位点的外源诱导型启动子。

10.一种经过修饰的细胞，所述经过修饰的细胞包含多核苷酸，所述多核苷酸包含编码药物反应性结构域(DRD)的第一核酸序列和编码转录因子的第二核酸序列，其中所述转录因子可操作地连接至所述DRD；并且

其中所述转录因子能够结合至特定多核苷酸结合位点并激活编码感兴趣蛋白质的第三核酸序列的转录，其中所述第三核酸序列可操作地连接至所述特定多核苷酸结合位点。

11.如权利要求10所述的经过修饰的细胞，其中所述第三核酸序列可操作地连接至包含所述特定多核苷酸结合位点的外源诱导型启动子。

12.如权利要求9至11中任一项所述的经过修饰的细胞，其中所述感兴趣蛋白质是异源蛋白。

13.如权利要求9至12中任一项所述的经过修饰的细胞，其中所述第三核酸序列位于包含所述第一核酸序列和所述第二核酸序列的所述多核苷酸上。

14.如权利要求9至12中任一项所述的经过修饰的细胞，所述经过修饰的细胞还包含第二多核苷酸，所述第二多核苷酸包含所述第三核酸序列。

15.如权利要求1至14中任一项所述的经过修饰的细胞，其中所述DRD来源于选自包含以下各物的组的亲本蛋白质：人碳酸酐酶2(CA2)、人DHFR、大肠杆菌DHFR(ecDHFR)、人雌激素受体(ER)、FKBP、人蛋白质FKBP和人PDE5。

16.如权利要求1至15中任一项所述的经过修饰的细胞，其中所述DRD在配体存在下稳定，所述配体选自包含以下各物的组：乙酰唑胺(ACZ)、甲氨蝶呤(MTX)和甲氧苄氨嘧啶(TMP)。

17.如权利要求1至16中任一项所述的经过修饰的细胞，其中所述感兴趣蛋白质是野生型蛋白质。

18.如权利要求1至17中任一项所述的经过修饰的细胞，其中所述感兴趣蛋白质是治疗性蛋白质。

19.如权利要求18所述的经过修饰的细胞，其中所述感兴趣蛋白质选自由以下组成的组：细胞因子、抗体、凝血因子、酶、基因编辑蛋白、T细胞受体(TCR)和嵌合抗原受体(CAR)。

20.如权利要求1至17中任一项所述的经过修饰的细胞，其中所述感兴趣蛋白质选自由以下组成的组：IL2、IL12、IL15、Cas9、ZFN和Cre。

21.如权利要求1至17中任一项所述的经过修饰的细胞，其中所述感兴趣蛋白质是分泌蛋白。

22.如权利要求1至21中任一项所述的经过修饰的细胞，其中所述细胞是T细胞、自然杀伤细胞(NK细胞)或肿瘤浸润淋巴细胞(TIL)。

23.如权利要求1至21中任一项所述的经过修饰的细胞，其中所述细胞是干细胞、肝细胞、血细胞、胰腺细胞、神经元细胞、眼细胞、肌肉细胞或骨细胞。

24.一种核酸分子，所述核酸分子包含：

a.编码转录因子DNA结合结构域的第一核酸序列，所述转录因子DNA结合结构域结合至特定多核苷酸结合位点；和

b.编码药物反应性结构域(DRD)的第二核酸序列。

25.如权利要求24所述的核酸分子，所述核酸分子还包含：

c.编码转录因子激活结构域的第三核酸序列；其中(i)所述转录因子DNA结合结构域可操作地连接至所述DRD；(ii)所述转录因子激活结构域可操作地连接至所述DRD；或(iii)所述转录因子DNA结合结构域和所述转录因子激活结构域的组合可操作地连接至所述DRD。

26.如权利要求24或25所述的核酸分子，所述核酸分子还包含：

d.编码感兴趣蛋白质的第四核酸序列，所述第四核酸序列可操作地连接至包含所述特定多核苷酸结合位点的诱导型启动子。

27.如权利要求24至26中任一项所述的核酸分子，其中所述转录因子DNA结合结构域来源于选自由以下组成的组的亲本蛋白质：ZFHD1、Cas9、Cas12和TAL。

28.如权利要求24至27中任一项所述的核酸分子，其中所述转录因子激活结构域来源于亲本蛋白质，其中所述亲本蛋白质是p65。

29.一种核酸分子，所述核酸分子包含：

a.编码转录因子的第一核酸序列，所述转录因子能够结合至特定多核苷酸结合位点并激活转录；和

b.编码药物反应性结构域(DRD)的第二核酸序列；其中所述转录因子可操作地连接至所述DRD。

30.如权利要求29所述的核酸分子，所述核酸分子还包含：

c.编码感兴趣蛋白质的第三核酸序列，所述第三核酸序列可操作地连接至包含所述特定多核苷酸结合位点的诱导型启动子。

31.如权利要求24至30中任一项所述的核酸分子，其中所述DRD来源于选自包含以下各物的组的亲本蛋白质：人碳酸酐酶2(CA2)、人DHFR、ecDHFR、人雌激素受体(ER)、FKBP、人蛋白质FKBP和人PDE5。

32.如权利要求24至31中任一项所述的核酸分子，其中所述DRD在配体存在下稳定，所述配体选自包含以下各物的组：乙酰唑胺(ACZ)、甲氨蝶呤(MTX)和甲氧苄氨嘧啶(TMP)。

33.如权利要求26至28或30至32中任一项所述的核酸分子，其中所述感兴趣蛋白质是野生型蛋白质。

34.如权利要求26至28或30至32中任一项所述的核酸分子，其中所述感兴趣蛋白质是治疗性蛋白质。

35.如权利要求34所述的核酸分子，其中所述感兴趣蛋白质选自由以下组成的组：细胞因子、抗体、凝血因子、酶、基因编辑蛋白、T细胞受体(TCR)和嵌合抗原受体(CAR)。

36.如权利要求26至28或30至32中任一项所述的核酸分子，其中所述感兴趣蛋白质选自由以下组成的组：IL2、IL12、IL15、Cas9、ZFN和Cre。

37.如权利要求26至28或30至32所述的核酸分子，其中所述感兴趣蛋白质是分泌蛋白。

38.一种载体，所述载体包含根据权利要求24至37中任一项所述的核酸分子。

39.根据权利要求38所述的载体，其中所述载体是质粒或病毒载体。

40.根据权利要求39所述的载体，其中所述病毒载体来源于腺病毒、腺相关病毒(AAV)、甲病毒、黄病毒、疱疹病毒、麻疹病毒、弹状病毒、逆转录病毒、慢病毒、新城疫病毒(NDV)、痘病毒和小核糖核酸病毒。

41.如权利要求39所述的载体，其中所述病毒载体选自由以下组成的组：慢病毒载体、γ逆转录病毒载体、腺相关病毒(AAV)载体、腺病毒载体和疱疹病毒载体。

42.一种第一多核苷酸和第二多核苷酸，所述第一多核苷酸包含：

编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，所述转录因子DNA结合结构域结合至特定多核苷酸结合位点；和

编码药物反应性结构域(DRD)的第三核酸序列；其中所述转录因子激活结构域、所述转录因子DNA结合结构域或者所述转录因子激活结构域与所述转录因子DNA结合结构域的组合中的至少一者可操作地连接至所述DRD；并且

第二多核苷酸包含：

编码感兴趣蛋白质的第四核酸序列，所述第四核酸序列可操作地连接至包含所述特定多核苷酸结合位点的诱导型启动子；

其中所述转录因子激活结构域和所述转录因子DNA结合结构域相互作用以形成转录因子，所述转录因子在与所述特定多核苷酸结合位点结合后，能够激活转录，并且其中所述第一多核苷酸和所述第二多核苷酸各自携带于单个载体中，或所述第一多核苷酸和所述第二多核苷酸携带于独立的载体中。

43.一种第一多核苷酸和第二多核苷酸，所述第一多核苷酸包含：

编码转录因子的第一核酸序列和编码药物反应性结构域(DRD)的第二核酸序列，其中所述转录因子可操作地连接至所述DRD，并且其中所述转录因子在与特定多核苷酸结合位点结合后能够激活转录；并且

第二多核苷酸包含：

编码感兴趣蛋白质的第三核酸序列，所述第三核酸序列可操作地连接至包含所述特定多核苷酸结合位点的诱导型启动子；

其中所述第一多核苷酸和所述第二多核苷酸各自携带于单个载体中，或所述第一多核苷酸和所述第二多核苷酸携带于独立的载体中。

44.如权利要求42或43所述的第一多核苷酸和第二多核苷酸，其中所述DRD来源于选自包含以下各物的组的亲本蛋白质：人碳酸酐酶2(CA2)、人DHFR、ecDHFR、人雌激素受体(ER)、FKBP、人蛋白质FKBP和人PDE5。

45.如权利要求42至44中任一项所述的第一多核苷酸和第二多核苷酸，其中所述DRD在配体存在下稳定，所述配体选自包含以下各物的组：乙酰唑胺(ACZ)、甲氨蝶呤(MTX)和甲氧苄氨嘧啶(TMP)。

46.如权利要求42至45中任一项所述的第一多核苷酸和第二多核苷酸，其中所述感兴趣蛋白质是野生型蛋白质。

47.如权利要求42至45中任一项所述的第一多核苷酸和第二多核苷酸，其中所述感兴趣蛋白质是治疗性蛋白质。

48.如权利要求47所述的第一多核苷酸和第二多核苷酸，其中所述感兴趣蛋白质选自由以下组成的组：细胞因子、抗体、凝血因子、酶、基因编辑蛋白、T细胞受体(TCR)和嵌合抗原受体(CAR)。

49.如权利要求42至45中任一项所述的第一多核苷酸和第二多核苷酸，其中所述感兴趣蛋白质选自由以下组成的组：IL2、IL12、IL15、Cas9、ZFN和Cre。

50.如权利要求42至45中任一项所述的第一多核苷酸和第二多核苷酸，其中所述感兴趣蛋白质是分泌蛋白。

51.一种产生经过修饰的细胞的方法，所述方法包括将核酸分子引入细胞中，所述核酸分子包含：

b.编码药物反应性结构域(DRD)的第二核酸序列。

52.如权利要求51所述的方法，其中所述核酸分子还包含编码转录因子激活结构域的第三核酸序列。

53.如权利要求52所述的方法，其中(i)所述转录因子DNA结合结构域可操作地连接至所述DRD；(ii)所述转录因子激活结构域可操作地连接至所述DRD；或(iii)所述转录因子DNA结合结构域和所述转录因子激活结构域的组合可操作地连接至所述DRD。

54.根据权利要求53所述的方法，所述方法还包括向所述细胞中引入：

编码感兴趣蛋白质的第四核酸序列，所述第四核酸序列可操作地连接至包含所述特定多核苷酸结合位点的诱导型启动子。

55.根据权利要求54所述的方法，其中所述感兴趣蛋白质是异源蛋白。

56.根据权利要求54或55所述的方法，其中所述第四核酸序列与所述第一核酸序列、所述第二核酸序列和所述第三核酸序列在同一核酸分子上。

57.根据权利要求54或55所述的方法，其中所述第四核酸序列与所述第一核酸序列、所述第二核酸序列和所述第三核酸序列在不同的核酸分子上。

58.根据权利要求54至57中任一项所述的方法，其中所述感兴趣蛋白质选自由以下组成的组：细胞因子、抗体、凝血因子、酶、基因编辑蛋白、T细胞受体(TCR)和嵌合抗原受体(CAR)。

59.根据权利要求54至57中任一项所述的方法，其中所述感兴趣蛋白质选自由以下组成的组：IL2、IL12、IL15、Cas9、ZFN和Cre。

60.根据权利要求54至57中任一项所述的方法，其中所述感兴趣蛋白质是分泌蛋白。

61.根据权利要求51至60中任一项所述的方法，其中所述核酸分子通过质粒或病毒载体引入所述细胞中。

62.根据权利要求61所述的方法，其中所述病毒载体来源于腺病毒、腺相关病毒(AAV)、甲病毒、黄病毒、疱疹病毒、麻疹病毒、弹状病毒、逆转录病毒、慢病毒、新城疫病毒(NDV)、痘病毒和小核糖核酸病毒。

63.根据权利要求61所述的载体，其中所述病毒载体选自由以下组成的组：慢病毒载体、γ逆转录病毒载体、腺相关病毒(AAV)载体、腺病毒载体和疱疹病毒载体。

64.根据权利要求51至60中任一项所述的方法，其中所述核酸分子通过非病毒递送方法引入所述细胞中。

65.如权利要求51至64中任一项所述的方法，其中所述细胞是T细胞、自然杀伤细胞(NK细胞)或肿瘤浸润淋巴细胞(TIL)。

66.如权利要求51至64中任一项所述的方法，其中所述细胞是干细胞、肝细胞、血细胞、胰腺细胞、神经元细胞、眼细胞、肌肉细胞或骨细胞。

67.一种治疗或预防有需要的受试者的疾病的方法，所述方法包括：

a.提供细胞群；

b.将至少一个核酸分子引入所述细胞群中的至少一个细胞中，其中所述至少一个核酸分子包含：

i.第一多核苷酸，所述第一多核苷酸包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，所述转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列，其中所述转录因子激活结构域和所述转录因子DNA结合结构域中的至少一者可操作地连接至所述DRD；和

ii.第二多核苷酸，所述第二多核苷酸包含编码感兴趣蛋白质的第四核酸序列，所述感兴趣蛋白质预防或治疗所述疾病或其症状，所述第四核酸序列可操作地连接至包含所述特定多核苷酸结合位点的外源诱导型启动子；

c.将所述细胞递送至所述受试者体内；并且

d.将配体施用给所述受试者，所述配体使所述DRD足够稳定以便能表达足以形成转录因子的量的所述转录因子激活结构域和所述转录因子DNA结合结构域中的至少一者，所述转录因子结合至所述特定多核苷酸结合位点并且能够使所述感兴趣蛋白质在所述细胞中表达；

其中所述感兴趣蛋白质的表达受所述受试者体内配体的存在调控，并且配体施用的量和/或持续时间足以产生治疗有效量的所述感兴趣蛋白质。

68.一种用于将经过修饰的细胞引入需要疾病治疗或预防的受试者体内的方法，所述方法包括：

a.提供细胞群；

ii.第二多核苷酸，所述第二多核苷酸包含编码感兴趣蛋白质的第四核酸序列，所述感兴趣蛋白质治疗所述疾病，所述第四核酸序列可操作地连接至包含所述特定多核苷酸结合位点的外源诱导型启动子；并且

c.将所述细胞递送至所述受试者体内。

69.一种用于将经过修饰的细胞引入需要疾病治疗或预防的受试者体内的方法，所述方法包括：

a.提供细胞群；

b.将至少一个如权利要求24至37中任一项所述的核酸分子或如权利要求42至50中任一项所述的第一多核苷酸和第二多核苷酸引入所述细胞群中的至少一个细胞中；并且

c.将所述细胞递送至所述受试者体内。

70.一种用于对需要疾病治疗或预防的受试者体内的一个或多个细胞进行基因修饰的方法，所述方法包括：

a.将至少一个核酸分子引入所述受试者的至少一个细胞中，其中所述至少一个核酸分子包含：

i.第一多核苷酸，所述第一多核苷酸包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，所述转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列，其中所述转录因子激活结构域和所述转录因子DNA结合结构域中的至少一者在所述细胞中表达后，可操作地连接至所述DRD；和

ii.第二多核苷酸，所述第二多核苷酸包含编码感兴趣蛋白质的第四核酸序列，所述感兴趣蛋白质治疗所述疾病，所述第四核酸序列可操作地连接至包含所述特定多核苷酸结合位点的外源诱导型启动子。

71.一种用于对需要疾病治疗或预防的受试者体内的一个或多个细胞进行基因修饰的方法，所述方法包括：

b.将配体施用给所述受试者，所述配体使所述DRD足够稳定以便能表达足以形成转录因子的量的所述转录因子激活结构域和所述转录因子DNA结合结构域中的至少一者，所述转录因子结合至所述特定多核苷酸结合位点并且能够使所述感兴趣蛋白质在所述细胞中表达；

72.一种用于治疗有需要的受试者的疾病的方法，所述方法包括：

a.提供细胞群；

b.将至少一个第一核酸分子和至少一个第二核酸分子引入所述细胞群中的至少一个细胞中，其中：

i.所述第一核酸分子包含编码转录因子激活结构域的第一核酸序列；编码转录因子DNA结合结构域的第二核酸序列，所述转录因子DNA结合结构域结合至特定多核苷酸结合位点；以及编码药物反应性结构域(DRD)的第三核酸序列，其中所述转录因子激活结构域和所述转录因子DNA结合结构域中的至少一者在所述细胞中表达后，可操作地连接至所述DRD；并且

ii.所述第二核酸分子包含编码感兴趣蛋白质的第四核酸序列，所述感兴趣蛋白质治疗所述疾病，所述第四核酸序列可操作地连接至包含所述特定多核苷酸结合位点的外源诱导型启动子；

c.将所述细胞递送至所述受试者体内；并且

d.将配体施用给所述受试者，所述配体使所述DRD足够稳定以便能表达足以形成转录因子的量的所述转录因子激活结构域和所述转录因子DNA结合结构域，所述转录因子结合至所述特定多核苷酸结合位点并且能够使所述感兴趣蛋白质在所述细胞中表达；

73.一种用于治疗有需要的受试者的疾病的方法，所述方法包括：

a.提供细胞群；

ii.所述第二核酸分子包含编码感兴趣蛋白质的第四核酸序列，所述感兴趣蛋白质治疗所述疾病，所述第四核酸序列可操作地连接至包含所述特定多核苷酸结合位点的外源诱导型启动子；并且

c.将所述细胞递送至所述受试者体内。

74.根据权利要求67至73中任一项所述的方法，其中所述核酸分子通过质粒或病毒载体引入所述细胞中。

75.根据权利要求74所述的方法，其中所述病毒载体来源于腺病毒、腺相关病毒(AAV)、甲病毒、黄病毒、疱疹病毒、麻疹病毒、弹状病毒、逆转录病毒、慢病毒、新城疫病毒(NDV)、痘病毒和小核糖核酸病毒。

76.根据权利要求74所述的方法，其中所述病毒载体选自由以下组成的组：慢病毒载体、γ逆转录病毒载体、腺相关病毒(AAV)载体、腺病毒载体和疱疹病毒载体。

77.根据权利要求67至73中任一项所述的方法，其中所述核酸分子通过非病毒递送方法引入所述细胞中。

78.一种用于在细胞中可调节地表达感兴趣蛋白质的系统，所述系统包含：

a.编码连接至药物反应结构域(DRD)的转录因子的第一多核苷酸，所述转录因子选择性地转录编码所述感兴趣蛋白质的多核苷酸序列；

b.包含外源转录因子结合位点的第二多核苷酸，所述外源转录因子结合位点位于编码所述感兴趣蛋白质的核酸序列上游和附近；

c.在将所述第一多核苷酸和所述第二多核苷酸稳定整合至所述细胞的基因组中的条件下，将所述第一多核苷酸和所述第二多核苷酸引入所述细胞中；

d.通过添加使所述DRD稳定的配体来调节所述转录因子的表达；

其中所述转录因子特异性结合至位于编码所述感兴趣蛋白质的多核苷酸序列的上游和附近的转录因子结合位点，并且其中所述感兴趣蛋白质的表达受所述细胞中存在的转录因子的量调控。