CN117157407A

CN117157407A - 编码ap-1转录因子的密码子优化的核苷酸序列

Info

Publication number: CN117157407A
Application number: CN202280016399.5A
Authority: CN
Inventors: S·帕克; Q·冯; B·萨瑟; B·琉; M·拉乔伊
Original assignee: Lyle Immune Pharmaceutical Co ltd
Current assignee: Lyle Immune Pharmaceutical Co ltd
Priority date: 2021-02-25
Filing date: 2022-02-24
Publication date: 2023-12-01

Abstract

本文公开了包含编码AP‑1转录因子(即c‑Jun)的核苷酸序列的多核苷酸。在一些方面，核苷酸序列是密码子优化的。在一些方面，多核苷酸包含编码以下的一个或多个另外的核苷酸序列：接头、信号肽、抗原结合结构域、间隔子、跨膜结构域、共刺激结构域、细胞内信号传导结构域、截短的EGFR及其组合。本文还公开了包含此类多核苷酸的细胞、载体和药物组合物。还提供了此类多核苷酸、细胞、载体和药物组合物用于治疗疾病或病症(例如癌症)的用途。

Description

编码AP-1转录因子的密码子优化的核苷酸序列

相关申请的交叉引用

本PCT申请要求2021年2月25日提交的美国临时申请号63/153,879；2021年10月28日提交的美国临时申请号63/263,231；和2022年2月11日提交的美国临时申请号63/309,380的优先权权益，所述临时申请各自以引用的方式整体并入本文。

对经由EFS-WEB以电子方式提交的序列表的引用

在本申请中提交的电子提交的序列表(名称：4385_068PC03_Seqlisting_ST25.txt，大小：99,232字节；以及创建日期：2022年2月22日)的内容通过引用以其整体并入本文。

技术领域

本公开的主题总体上涉及与编码AP-1转录因子的密码子优化的核苷酸序列有关的多核苷酸、多肽、细胞、载体、用途和试剂盒。

发明背景

癌症免疫疗法依赖于利用T细胞(感染和患病细胞的免疫系统的主要杀伤细胞)攻击和杀伤肿瘤细胞。然而，免疫细胞靶向和杀死肿瘤细胞的能力受到肿瘤微环境中存在的各种免疫应答抑制剂的存在的抑制。因此，虽然CAR T细胞在治疗某些癌症方面取得了各种成功(例如，KYMRIAH^TM(tisagenlecleucel，Novartis)和YESCARTA^TM(axicabtageneciloleucel，Kite/Gilead)已获得FDA批准)，但挑战仍然存在。例如，CAR T细胞免疫疗法的成功通常受限于接受者体内CAR T扩增程度，这通常需要大量细胞输注。此外，已经观察到转移的CAR T细胞的耗竭和持久性丧失，从而导致临床功效丧失和潜在复发。

因此，仍然需要在癌症患者中具有可接受的安全性谱和高功效的新的改进的治疗选择。

发明内容

本文提供了一种多核苷酸，其包含：a)与SEQ ID NO:1中所示的核酸序列具有至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；b)与SEQ ID NO:2中所示的核酸序列具有至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；c)与SEQ ID NO:4中所示的核酸序列具有至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；d)与SEQ ID NO:5中所示的核酸序列具有至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；e)与SEQ ID NO:6中所示的核酸序列具有至少88％、至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；f)与SEQ ID NO:7中所示的核酸序列具有至少82％、至少83％、至少84％、至少85％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；g)与SEQ ID NO:8中所示的核酸序列具有至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；h)与SEQ ID NO:9中所示的核酸序列具有至少55％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；或i)与SEQ ID NO:10中所示的核酸序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；其中该核苷酸序列编码AP-1转录因子。

本文提供了一种多核苷酸，其包含与SEQ ID NO:1中所示的核酸序列具有至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中该核苷酸序列编码AP-1转录因子。在某些方面，该核苷酸序列包括SEQ ID NO:1中所示的核酸序列。

本文还提供了一种多核苷酸，其包含与SEQ ID NO:2中所示的核酸序列具有至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中该核苷酸序列编码AP-1转录因子。在一些方面，该核苷酸序列包括SEQ ID NO:2中所示的核酸序列。

本文提供了一种多核苷酸，其包含与SEQ ID NO:4中所示的核酸序列具有至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中该核苷酸序列编码AP-1转录因子。在一些方面，该核苷酸序列包括SEQ ID NO:4中所示的核酸序列。

本公开还提供的多核苷酸包含与SEQ ID NO:5中所示的核酸序列具有至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中该核苷酸序列编码AP-1转录因子。在某些方面，该核苷酸序列包括SEQ ID NO:5中所示的核酸序列。

本文提供了一种多核苷酸，其包含与SEQ ID NO:6中所示的核酸序列具有至少88％、至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中该核苷酸序列编码AP-1转录因子。在一些方面，该核苷酸序列包括SEQ ID NO:6中所示的核酸序列。

本文提供了一种多核苷酸，其包含与SEQ ID NO:7中所示的核酸序列具有至少82％、至少83％、至少84％、至少85％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中该核苷酸序列编码AP-1转录因子。在某些方面，该核苷酸序列包括SEQ ID NO:7中所示的核酸序列。

本文提供了一种多核苷酸，其包含与SEQ ID NO:8中所示的核酸序列具有至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中该核苷酸序列编码AP-1转录因子。在一些方面，该核苷酸序列包括SEQ ID NO:8中所示的核酸序列。

本文提供了一种多核苷酸，其包含与SEQ ID NO:9中所示的核酸序列具有至少55％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中该核苷酸序列编码AP-1转录因子。在某些方面，该核苷酸序列包括SEQ ID NO:9中所示的核酸序列。

本文还提供了一种多核苷酸，其包含与SEQ ID NO:10中所示的核酸序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中该核苷酸序列编码AP-1转录因子。在一些方面，该核苷酸序列包括SEQ ID NO:10中所示的核酸序列。

在一些方面，由上述多核苷酸中的任一个编码的AP-1转录因子包含与SEQ ID NO:13中所示的序列具有至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。

在一些方面，本公开的多核苷酸还包含编码配体结合蛋白的核苷酸序列。在一些方面，本公开的多核苷酸还包含编码配体结合蛋白的核苷酸序列。在某些方面，配体结合蛋白包含嵌合抗原受体(CAR)、T细胞受体(TCR)、嵌合抗体-T细胞受体(caTCR)、嵌合信号传导受体(CSR)、T细胞受体模拟物(TCR模拟物)或其组合。在一些方面，CAR被设计为标准CAR、分体式CAR、关闭开关CAR、开启开关CAR、第一代CAR、第二代CAR、第三代CAR或第四代CAR。

在一些方面，配体结合蛋白包含抗原结合结构域、跨膜结构域、共刺激结构域和/或细胞内信号传导结构域。在某些方面，抗原结合结构域特异性结合选自由以下组成的组的抗原：AFP(甲胎蛋白)、αvβ6或另一种整联蛋白、BCMA、Braf、B7-H3、B7-H6、CA9(碳酸酐酶9)、CCL-1(C-C基序趋化因子配体1)、CD5、CD19、CD20、CD21、CD22、CD23、CD24、CD30、CD33、CD38、CD40、CD44、CD44v6、CD44v7/8、CD45、CD47、CD56、CD66e、CD70、CD74、CD79a、CD79b、CD98、CD123、CD138、CD171、CD352、CEA(癌胚抗原)、密封蛋白18.2、密封蛋白6、c-MET、DLL3(δ样蛋白3)、DLL4、ENPP3(外切核苷酸焦磷酸酶/磷酸二酯酶家族成员3)、EpCAM、EPG-2(上皮糖蛋白2)、EPG-40、ephrinB2、EPHa2(ephrine受体A2)、ERBB二聚体、雌激素受体、ETBR(内皮素B受体)、FAP-α(成纤维细胞活化蛋白α)、胎儿AchR(胎儿乙酰胆碱受体)、FBP(叶酸结合蛋白)、FCRL5、FR-α(叶酸受体α)、GCC(鸟苷酸环化酶C(guanyl cyclase C))、GD2、GD3、GPC2(磷脂酰肌醇蛋白聚糖2)、GPC3、gp100(糖蛋白100)、GPNMB(糖蛋白NMB)、GPRC5D(G蛋白偶联受体5D)、HER2、HER3、HER4、乙型肝炎表面抗原、HLA-A1(人白细胞抗原Al)、HLA-A2(人白细胞抗原A2)、HMW-MAA(人高分子量黑素瘤相关抗原)、IGF1R(胰岛素样生长因子1受体)、Igκ、Igλ、IL-22Ra(IL-22受体α)、IL-13Ra2(IL-13受体α2)、KDR(激酶插入结构域受体)、LI细胞粘附分子(LI-CAM)、Liv-1、LRRC8A(含有富亮氨酸重复序列的蛋白8家族成员A)、Lewis Y、黑素瘤相关抗原(MAGE)-A1、MAGE-A3、MAGE-A6、MART-1(melan A)、鼠巨细胞病毒(MCMV)、MCSP(黑素瘤相关硫酸软骨素蛋白聚糖)、间皮素、粘蛋白1(MUC1)、MUC16、MHC/肽复合物(例如，与衍生自AFP、KRAS、NY-ESO、MAGE-A和WT1的肽复合的HLA-A)、NCAM(神经细胞粘附分子)、Nectin-4、NKG2D(自然杀伤细胞家族2成员D)配体、NY-ESO、癌胚抗原、PD-1、PD-L1、PRAME(黑素瘤优先表达抗原)、孕酮受体、PSA(前列腺特异性抗原)、PSCA(前列腺干细胞抗原)、PSMA(前列腺特异性膜抗原)、ROR1、ROR2、SIRPα(信号调节蛋白α)、SLIT、SLITRK6(NTRK样蛋白6)、STEAP1(前列腺六段跨膜上皮抗原1)、存活素(survivin)、TAG72(肿瘤相关糖蛋白72)、TPBG(滋养层糖蛋白)、Trop-2、VEGFR1(血管内皮生长因子受体1)、VEGFR2、以及来自HIV、HBV、HCV、HPV和其他病原体的抗原以及其任何组合。

在一些方面，抗原结合结构域特异性结合ROR1。在某些方面，抗原结合结构域特异性结合GPC2。

在一些方面，配体结合蛋白的共刺激结构域包含白介素-2受体(IL-2R)、白介素-12受体(IL-12R)、IL-7、IL-21、IL-23、IL-15、CD2、CD3、CD4、CD7、CD8、CD27、CD28、CD30、CD40、4-1BB/CD137、ICOS、淋巴细胞功能相关抗原-1(LFA-1)、LIGHT、NKG2C、OX40、DAP10或其任何组合。在一些方面，共刺激结构域包含4-1BB/CD137共刺激结构域。

在一些方面，本文所述的配体结合蛋白的跨膜结构域包含KIRDS2、OX40、CD2、CD27、LFA-1(CD11a、CD18)、ICOS(CD278)、4-1BB(CD137)、GITR、CD40、BAFFR、HVEM(LIGHTR)、SLAMF7、NKp80(KLRF1)、NKp44、NKp30、NKp46、CD160、CD19、IL2Rβ、IL2Rγ、IL7Rα、ITGA1、VLA1、CD49a、ITGA4、IA4、CD49D、ITGA6、VLA-6、CD49f、ITGAD、CD11d、ITGAE、CD103、ITGAL、CD11a、LFA-1、ITGAM、CD11b、ITGAX、CD11c、ITGB1、CD29、ITGB2、CD18、LFA-1、ITGB7、TNFR2、DNAM1(CD226)、SLAMF4(CD244、2B4)、CD84、CD96(触觉)、CEACAM1、CRTAM、Ly9(CD229)、CD160(BY55)、PSGL1、CD100(SEMA4D)、SLAMF6(NTB-A、Ly108)、SLAM(SLAMF1、CD150、IPO-3)、BLAME(SLAMF8)、SELPLG(CD162)、LTBR、PAG/Cbp、NKG2D、NKG2C、CD19或其任何组合的跨膜结构域区域。在某些方面，跨膜结构域包含CD28跨膜结构域。

在一些方面，配体结合结构域的细胞内信号传导结构域包括衍生自CD3ζ、FcRγ、共同FcRγ(FCER1G)、FcγRIIa、FcRβ(FcεRib)、CD3γ、CD3δ、CD3ε、CD22、CD79a、CD79b、CD278(“ICOS”)、FcεRI、CD66d、CD32、DAP10、DAP12或其任何组合的细胞内信号传导结构域区域。在某些方面，细胞内信号传导结构域包括CD3ζ细胞内信号传导结构域。

在一些方面，由本公开的多核苷酸编码的配体结合结构域包括TCR，其中TCR特异性结合肿瘤抗原/MHC复合物。在某些方面，肿瘤抗原衍生自AFP、CD19、BCMA、CLL-1、CS1、CD38、CD19、TSHR、CD123、CD22、CD30、CD171、CD33、EGFRvIII、GD2、GD3、Tn Ag、PSMA、ROR1、ROR2、GPC1、GPC2、FLT3、FAP、TAG72、CD44v6、CEA、EPCAM、B7H3、KIT、IL-13Ra2、间皮素、IL-llRa、PSCA、PRSS21、VEGFR2、LewisY、CD24、PDGFR-β、SSEA-4、CD20、叶酸受体α、ERBB2(Her2/neu)、MUC1、MUC16、EGFR、NCAM、前列腺酶(prostase)、PAP、ELF2M、肝配蛋白(Ephrin)B2、IGF-I受体、CAIX、LMP2、gp100、bcr-abl、酪氨酸酶、EphA2、岩藻糖基GM1、sLe、GM3、TGS5、HMWMAA、o-乙酰基-GD2、叶酸受体β、TEM1/CD248、TEM7R、CLDN6、GPRC5D、CXORF61、CD97、CD179a、ALK、多唾液酸、PLAC1、GloboH、NY-BR-1、UPK2、HAVCR1、ADRB3、PANX3、GPR20、LY6K、OR51E2、TARP、WT1、NY-ESO-1、LAGE-la、MAGE-Al、legumain、HPV E6,E7、MAGE Al、ETV6-AML、精子蛋白17、XAGE1、Tie 2、MAD-CT-1、MAD-CT-2、Fos相关抗原1、p53、p53突变体、prostein、存活素、端粒酶、PCTA-1/半乳糖凝集素8、MelanA/MART1、Ras突变体(例如，HRAS、KRAS、NRAS)、hTERT、肉瘤易位断点、ML-IAP、ERG(TMPRSS2 ETS融合基因)、NA17、PAX3、雄激素受体、细胞周期蛋白B1、MYCN、RhoC、TRP-2、CYP1B1、BORIS、SART3、PAX5、OY-TES1、LCK、AKAP-4、SSX2、RAGE-1、人端粒酶逆转录酶、RU1、RU2、肠羧基酯酶、mut hsp70-2、CD79a、CD79b、CD72、LAIR1、FCAR、LILRA2、CD300LF、CLEC12A、BST2、EMR2、LY75、GPC3、FCRL5、IGLL1、CD2、CD3ε、CD4、CD5、CD7、APRIL蛋白的细胞外部分、新抗原或其任何组合。

在一些方面，AP-1转录因子通过接头与配体结合蛋白连接。在某些方面，接头包括可切割接头。在一些方面，接头是P2A接头、T2A接头、F2A接头、E2A接头、弗林蛋白酶切割位点(furin cleavage site)或其任何组合。在某些方面，接头包含与SEQ ID NO:14-18中任一个所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在一些方面，接头包含SEQ ID NO:14中所示的氨基酸序列。

在一些方面，本文所述的多核苷酸还包含编码截短的EGFR(EGFRt)的核酸序列。在某些方面，EGFRt包含与SEQ ID NO:19中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在某些方面，EGFRt包含SEQ ID NO:23或24中所示的氨基酸序列。

在某些方面，EGFRt通过接头与AP-1转录因子和/或嵌合结合蛋白连接。在某些方面，接头包括可切割接头。在一些方面，接头是P2A接头、T2A接头、F2A接头、E2A接头、弗林蛋白酶切割位点或其任何组合。在某些方面，接头包含与SEQ ID NO:14-18中任一个所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在某些方面，接头包含SEQ IDNO:14中所示的氨基酸序列。

本文提供了一种载体，其包含本文所述的任何多核苷酸和调控元件。在一些方面，载体是多顺反子表达载体。在某些方面，调控元件包含启动子。在一些方面，启动子包括dl587rev引物结合位点取代的(MND)启动子、EF1a启动子、泛素启动子或其组合。

在一些方面，载体包括病毒载体、哺乳动物载体或细菌载体。在某些方面，载体是腺病毒载体、慢病毒、仙台病毒载体、杆状病毒载体、爱泼斯坦巴尔病毒载体、乳多空病毒载体、痘苗病毒载体、单纯疱疹病毒载体、杂交载体或腺相关病毒(AAV)载体。在一些方面，载体是慢病毒。

本文还提供了包含本文所述的多核苷酸或载体的组合物。本公开还提供包含本文所述的多核苷酸、载体或组合物的试剂盒。本文提供了包含由本文所述的多核苷酸、载体或组合物编码的AP-1转录因子的多肽。本公开还提供了一组多肽，其包含多肽(例如，AP-1转录因子)、由本公开的多核苷酸编码的配体结合蛋白和/或本文所述的EGFRt。

本文还提供了包含本文所述的多核苷酸、载体、组合物、多肽或一组多肽的细胞。在一些方面，细胞包括免疫细胞。在某些方面，细胞包括T细胞、B细胞、调节性T细胞(Treg)、自然杀伤(NK)细胞、自然杀伤T(NKT)细胞、干细胞或诱导多能干细胞。

本文提供了一种药物组合物，其包含本文所述的多核苷酸、载体、多肽、多肽组或细胞，以及药学上可接受的载体。

在一些方面，本文所述的细胞或药物组合物用于治疗需要治疗的受试者。在某些方面，本文所述的多核苷酸、载体、组合物、多肽、多肽组、细胞或药物组合物用于减少或防止用于治疗的细胞耗竭。

本文提供了本文所述的细胞或药物组合物用于制造用于治疗或预防有需要的受试者的疾病或疾患的药物的用途。在一些方面，疾病或疾患是癌症。

本文提供了本文所述的多核苷酸、载体、组合物、多肽、多肽组、细胞或药物组合物用于防止或减少可用于治疗的细胞耗竭的用途。

在一些方面，本公开中提供的治疗或预防有需要的受试者的疾病或疾患的方法包括向受试者施用本文中公开的任何细胞或药物组合物。在某些方面，疾病或疾患是癌症。

本文还提供了一种增加细胞中c-Jun多肽的方法，该方法包括修饰细胞以包含本文提供的多核苷酸、载体、组合物、多肽或多肽组中的任一种，其中修饰后c-Jun多肽在细胞中的表达与已用野生型c-Jun多核苷酸修饰的相应细胞相比增加。

在一些方面，与相应细胞相比，c-Jun多肽的表达增加至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约16倍、至少约17倍、至少约18倍、至少约19倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍、至少约75倍、至少约100倍、至少约200倍、至少约300倍、至少约400倍、至少约500倍、至少约750倍，或至少约1,000倍或更多。在一些方面，与相应细胞相比，c-Jun多肽的表达增加约1倍、约2倍、约3倍、约4倍、约5倍、约6倍、约7倍、约8倍、约9倍或约10倍。

附图说明

图1显示了本文所述的13种不同的抗ROR1 CAR构建体的图形表示。这些构建体包括编码以下一种或多种的核苷酸序列：(i)c-Jun蛋白(“cJun”)；(ii)截短的CD19(“CD19t”)；(iii)P2A接头(“P2A”)；(iv)人Igκ信号肽(“hIgK”)；(v)抗ROR1 scFv(“R12”)；以及(vi)截短的EGFR(“EGFRt”)。构建体#3-#12分别包括SEQ ID NO:1-10中所示的密码子优化的c-Jun序列。构建体#13包括野生型(即非密码子优化的)c-Jun序列(SEQ ID NO:11)。

图2A、2B、2C和2D显示了各种抗ROR1构建体的转导效率和转基因表达水平。在图2A中，转导效率显示为EGFRt⁺cJun⁺细胞的百分比。在图2B中，转导效率显示为EGFRt⁺R12⁺细胞的百分比。在图2C中，每个细胞的基因表达水平显示为EGFRt⁺细胞中c-Jun表达的几何平均值(gMFI)。在图2D中，每个细胞的基因表达水平显示为EGFRt⁺细胞中抗ROR1(R12)scFv表达的几何平均值(gMFI)。如所示，每种抗ROR1构建体用于在以下感染复数(MOI)下转导细胞：20(每种构建体的第1条)、10(每种构建体的第2条)、5(每种构建体的第3条)和2(每种构建体的最后一条)。测试的抗ROR1 CAR构建体如图1所示并包括：(i)构建体#1(即，缺少c-Jun)；(ii)构建体#11(即，包含SEQ ID NO:9中所示的密码子优化的c-Jun序列)；(iii)构建体#2(即，缺少c-Jun并包含截短的CD19)；(iv)构建体#3(即，包含SEQ ID NO:1中所示的密码子优化的c-Jun序列)；和(v)构建体#12(即，包含SEQ ID NO:10中所示的密码子优化的c-Jun序列)。

图3A显示了转导效率，图3B显示了包含不同密码子优化的c-Jun序列的抗ROR1CAR构建体的转基因表达水平。转导效率显示为不同MOI(x轴)下EGFRt⁺R12CAR⁺细胞百分比(y轴)。在图3A中，显示了以下抗ROR1 CAR构建体的结果：(i)构建体#3(即，包含SEQ ID NO:1中所示的密码子优化的c-Jun序列)(圆圈)；(ii)构建体#5(即，包含SEQ ID NO:3中所示的密码子优化的c-Jun序列)(正方形)；(iii)构建体#4(即，包含SEQ ID NO:2中所示的密码子优化的c-Jun序列)(三角形)；和(iv)构建体#2(即，缺少c-Jun并包含截短的CD19)(菱形)。在图3B中，显示了以下抗ROR1 CAR构建体的结果：(i)构建体#3(即，包含SEQ ID NO:1中所示的密码子优化的c-Jun序列)(小圆圈)；(ii)构建体#6(即，包含SEQ ID NO:4中所示的密码子优化的c-Jun序列)(小正方形)；(iii)构建体#7(即，包含SEQ ID NO:5中所示的密码子优化的c-Jun序列)(三角形)；(iv)构建体#8(即，包含SEQ ID NO:6中所示的密码子优化的c-Jun序列)(倒三角形)；(v)构建体#13(即，包含野生型c-Jun序列)(菱形)；(vi)构建体#9(即，包含SEQ ID NO:7中所示的密码子优化的c-Jun序列)(大圆圈)；和(vii)构建体#2(即，缺少c-Jun并包含截短的CD19)(大正方形)。图3A和3B中每一个中的带圆圈的数据点表示用于在图右侧的表中所示的各种构建体之间进行比较的滴度。

具体实施方式

综述

本公开涉及一种多核苷酸(例如，经分离的多核苷酸)，其包含编码Jun原癌基因AP-1转录因子亚基(“c-Jun”；本文也称为“AP-1”)蛋白的核苷酸序列。如本文所述，本文公开的多核苷酸包含一个或多个特征，这些特征使它们(例如，在结构上和/或功能上)与自然界中存在的参考多核苷酸不同。例如，如本公开中的其他地方进一步描述的，核苷酸序列已经被密码子优化(即，是合成的)。在一些方面，本公开的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列)还包含编码以下一种或多种的一个或多个另外的核苷酸序列：接头、信号肽、抗原结合结构域、间隔子、跨膜结构域、共刺激结构域、细胞内信号传导结构域、截短的EGFR及其组合。

定义

为了更容易理解本公开，首先定义某些术语。如本申请中所使用的，除非本文另有明确规定，否则以下术语中的每一个应具有下文所述的含义。另外的定义在整个申请中阐述。

应注意术语“一个(种)(a/an)”实体是指一个(种)或多个(种)所述实体；例如“一个(种)核苷酸序列”应理解为表示一个(种)或多个(种)核苷酸序列。因此，术语“一个(种)”、“一个(种)或多个(种)”和“至少一个(种)”在本文中可互换使用。还应注意，权利要求可以被草拟为排除任何任选的要素。因此，对于与叙述权利要求要素结合使用的像“单独”、“只”等这样的排他性术语或所使用的“否定性”限制，这份说明书仅欲充当一个先行基础。

在本文中使用时术语“和/或”应被视为在有或没有另一者的情况下，对两种指定特征或组分中的每一者的具体公开。因此，本文在短语中使用的术语“和/或”诸如“A和/或B”意为包括：“A和B”；“A或B”；“A”(单独)；和“B”(单独)。同样，如在诸如“A、B和/或C”的短语中使用术语“和/或”意图包括以下方面的每一方面：A、B和C；A、B或C；A或C；A或B；B或C；A和C；A和B；B和C；A(单独的)；B(单独的)；和C(单独的)。

应当理解，本文无论在何处用措辞“包含/包括(comprising)”来描述方面，都还提供了以“由……组成”和/或“基本上由……组成”描述的其它类似方面。

如本文所用，用于一个或多个感兴趣的值的术语“大约”或“约”是指与所述参考值相似且在所述的参考值的任一方向(大于或小于)上落在25％、20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％或更小范围内的值范围内的值，除非另外说明或以另外的方式从上下文显而易见(除了这样的数值将超过可能值的100％的情况)。当术语“大约”或“约”在本文中应用于特定值时，本文也公开了没有术语“近似”或“约”的值。

如本文所述，除非另有说明，任何浓度范围、百分比范围、比率范围或整数范围应理解为包括所述范围内的任何整数的值，以及在适当情况下，其分数(诸如整数的十分之一和百分之一)。

如本文所用，术语“ug”和“uM”可分别与“μg”和“μΜ”互换使用。

除非另外定义，否则本文所用的所有技术和科学术语都具有与由本公开所相关领域中的普通技术人员通常理解相同的含义。例如，Concise Dictionary of Biomedicineand Molecular Biology,Juo,Pei-Show,第2版,2002,CRC Press；Dictionary of Celland Molecular Biology,第3版,1999,Academic Press；和Oxford Dictionary OfBiochemistry And Molecular Biology,修订板,2000,Oxford University Press，给普通技术人员提供本公开中使用的许多术语的通用字典。

单位、前缀和符号以它们的国际单位制(SI)接受形式表示。数值范围包括限定范围的数字。本文提供的标题并非是对本公开的各个方面的限制，所述各个方面可通过参考说明书整体而得到。因此，即将在下文定义的术语通过参考说明书全文来更充分地定义。

如本文所用，术语“免疫细胞”是指免疫系统的细胞。在一些方面，免疫细胞选自T淋巴细胞(“T细胞”)、B淋巴细胞(“B细胞”)、自然杀伤(NK)细胞、自然杀伤T(NKT)细胞、巨噬细胞、嗜酸性粒细胞、肥大细胞、树突细胞或嗜中性粒细胞。如本文所用，术语“T细胞”和“T淋巴细胞”是可互换的，并且是指由胸腺产生或加工的任何淋巴细胞。T细胞的非限制性种类包括效应T细胞和Th细胞(诸如CD4⁺或CD8⁺T细胞)。在一些方面，免疫细胞是Th1细胞。在一些方面，免疫细胞是Th2细胞。在一些方面，免疫细胞是Tc17细胞。在一些方面，免疫细胞是Th17细胞。在一些方面，免疫细胞是肿瘤浸润细胞(TIL)。在一些方面，免疫细胞是T_reg细胞。如本文所用，“免疫细胞”也指能够分化为免疫细胞的多能细胞，例如干细胞(例如，胚胎干细胞或造血干细胞)或诱导多能干细胞。

在一些方面，T细胞是记忆T细胞。如本文所用，术语“记忆”T细胞是指先前已遇到并响应于其同源抗原(例如，在体内、在体外或离体)或已用例如抗CD3抗体刺激(例如，在体外或离体)的T细胞。在第二次暴露时具有“记忆样”表型的免疫细胞，这种记忆T细胞与第一次暴露期间相比可以复制以产生更快和更强的免疫应答。在一些方面，记忆T细胞包括中央记忆T细胞(T_CM细胞)、效应记忆T细胞(T_EM细胞)、组织驻留记忆T细胞(T_RM细胞)、干细胞样记忆T细胞(T_SCM细胞)或其任何组合。

在一些方面，T细胞是干细胞样记忆T细胞。如本文所用，术语“干细胞样记忆T细胞”、“T记忆干细胞”或“T_SCM细胞”是指表达CD95、CD45RA、CCR7和CD62L并且被赋予干细胞样自我更新能力和重建整个记忆和效应亚群谱的多潜能能力的记忆T细胞。

在一些方面，T细胞是中央记忆T细胞。如本文所用，术语“中央记忆T细胞”或“T_CM细胞”是指表达CD45RO、CCR7和CD62L的记忆T细胞。中央记忆T细胞通常存在于淋巴结和外周循环中。

在一些方面，T细胞是效应记忆T细胞。如本文所用，术语“效应记忆T细胞”或“T_EM细胞”是指表达CD45RO但缺乏CCR7和CD62L表达的记忆T细胞。因为效应记忆T细胞缺乏淋巴结归巢受体(例如CCR7和CD62L)，所以这些细胞通常存在于外周循环和非淋巴组织中。

在一些方面，T细胞是组织驻留记忆T细胞。如本文所用，术语“组织驻留记忆T细胞”或“T_RM细胞”是指不循环并且保持驻留在外周组织诸如皮肤、肺和胃肠道中的记忆T细胞。在某些方面，组织驻留记忆T细胞也是效应记忆T细胞。

在一些方面，T细胞是初始T细胞。如本文所用，术语“初始T细胞”或“T_N细胞”是指表达CD45RA、CCR7和CD62L但不表达CD95的T细胞。T_N细胞代表T细胞谱系中最不分化的细胞。在T_N细胞和抗原呈递细胞(APC)之间的相互作用诱导T_N细胞向激活的T_EFF细胞分化和免疫应答。在一些方面，T细胞是效应T(T_eff)细胞。

如本文所用，“细胞工程化”是指细胞(例如本文所公开的免疫细胞)的靶向修饰。在一些方面，细胞工程化包括病毒基因工程化、非病毒基因工程化、引入允许肿瘤特异性靶向的受体(例如，嵌合结合蛋白)、引入一种或多种改善T细胞功能的内源基因、引入一种或多种改善免疫细胞(例如，T细胞)功能的合成基因(例如，本文提供的密码子优化的AP-1核苷酸序列)或其任何组合。

如本文所用，术语“细胞因子”是指由细胞释放的对细胞之间的相互作用和通讯具有特定作用的小分泌蛋白。细胞因子的非限制性实例包括白介素(例如白介素(IL)-1、IL-2、IL-4、IL-7、IL-9、IL-13、IL-15、IL-3、IL-5、IL-6、IL-11、IL-10、IL-20、IL-14、IL-16、IL-17、IL-21和IL-23)、干扰素(IFN；例如，IFNα、IFNβ和IFNγ)、肿瘤坏死因子(TNF)家族成员和转化生长因子(TGF)家族成员。在本公开的某些方面，TGFβ与本文公开的嵌合激活受体在宿主免疫细胞中的相互作用导致一种或多种细胞因子的表达增加。在一些方面，细胞因子是白介素。在一些方面，细胞因子选自IL-2、IL-7、IL-15、IL-21及其任何组合。在特定方面，细胞因子是IL-2。IL-2(UniProtKB–P60568)由T细胞响应于抗原或促有丝分裂刺激而产生。已知IL-2刺激T细胞增殖和其他对调节免疫应答至关重要的活性。

在一些方面，细胞因子是干扰素。在一些方面，干扰素选自IFNα、IFNβ和IFNγ。在某些方面，干扰素是IFNγ。IFNγ(UniProtKB–P01579)由活化的淋巴细胞产生，促进免疫细胞功能。

如本文所用，术语“抗原”是指任何天然或合成的免疫原性物质，诸如蛋白质、肽或半抗原。如本文所用，术语“同源抗原”是指免疫细胞(例如T细胞)识别并由此诱导免疫细胞活化(例如触发诱导效应子功能(诸如细胞因子产生)和/或细胞增殖的细胞内信号)的抗原。在某些方面，抗原包括肿瘤抗原。在一些方面，抗原包括新抗原。

“癌症”是指广泛的一组各类疾病，其特征在于体内异常细胞的不受控制的生长。不受调控的细胞分裂和生长导致恶性肿瘤的形成，所述恶性肿瘤侵入邻近组织，并且还可以通过淋巴系统或血流转移到身体的远侧部分。如本文所用，“癌症”是指原发性、转移性和复发性癌症。

如本文所用，术语“免疫应答”是指脊椎动物内针对外来剂的生物学应答，所述应答保护生物体免受这些剂和由它们引起的疾病的影响。免疫应答是由免疫系统的细胞(例如，T淋巴细胞、B淋巴细胞、自然杀伤(NK)细胞、NKT细胞、巨噬细胞、嗜酸性粒细胞、肥大细胞、树突细胞或中性粒细胞)和由这些细胞中的任一种或肝产生的可溶性大分子(包括抗体、细胞因子和补体)的作用介导的，所述免疫应答导致选择性靶向、结合、损伤、破坏侵入病原体、感染了病原体的细胞或组织、癌细胞或其他异常细胞或者(在自身免疫或病理性炎症的情况下)正常的人细胞或组织和/或将它们从脊椎动物体内消除。免疫反应包括例如T细胞的激活或抑制，例如效应T细胞或Th细胞，诸如CD4⁺或CD8⁺T细胞，或Treg细胞的抑制。如本文所用，术语“T细胞”和“T淋巴细胞”是可互换的，并且是指由胸腺产生或加工的任何淋巴细胞。在一些方面，T细胞是CD4+T细胞。在一些方面，T细胞是CD8+T细胞。在一些方面，T细胞是NKT细胞。

如本文所用，术语“抗肿瘤免疫应答”是指针对肿瘤抗原的免疫应答。

“受试者”包括任何人或非人动物。术语“非人动物”包括但不限于脊椎动物(诸如非人灵长类动物、绵羊、狗)和啮齿动物(诸如小鼠、大鼠和豚鼠)。在一些方面，受试者是人。术语“受试者”和“患者”在本文中可互换使用。如本文所用，短语“有需要的受试者”包括将受益于例如施用免疫细胞例如如本文所述的T细胞以控制肿瘤生长的受试者，诸如哺乳动物受试者。

术语“有效量”或“有效剂量”是指提供所需生物学、治疗和/或预防结果的剂(例如，用多核苷酸转导的免疫细胞，该多核苷酸包含编码嵌合结合蛋白的核苷酸序列和密码子优化的c-Jun序列)的量。所述结果可以是疾病的一种或多种体征、症状或病因的减少、改善、缓和、减轻、延迟和/或缓解，或者生物系统的任何其他所需的改变。关于实体瘤，有效量包括足以引起肿瘤缩小和/或降低肿瘤生长速率(诸如抑制肿瘤生长)或者预防或延迟其他不需要的细胞增殖的量。在一些方面，有效量是足以延迟肿瘤发展的量。在一些方面，有效量是足以预防或延迟肿瘤复发的量。有效量可以在一次或多次施用中施用。本领域普通技术人员将理解，治疗有效量等可以以单剂量施用，或可以通过施用多剂量(即1、2、3、4、5、6、7、8、9、10或更多个剂量)来实现。治疗剂促进疾病消退或抑制疾病的显现或复发的能力可使用为熟练从业者所知的多种方法评估，诸如在临床试验期间在人受试者中，在预测在人中的功效的动物模型系统中，或通过测定剂在体外测定中的活性。

组合物(例如，如本文所述的免疫细胞)的有效量可以例如(i)减少癌细胞的数量；(ii)缩小肿瘤尺寸；(iii)在一定程度上抑制、延迟、减缓、并且可能停止癌细胞浸润到周围器官中；(iv)抑制(即在一定程度上减缓并且可能停止)肿瘤转移；(v)抑制肿瘤生长；(vi)防止或延迟肿瘤的发生和/或复发；和/或(vii)在一定程度上缓解一种或多种与癌症相关的症状。

关于治疗的术语“有效的”和“有效性”包括药理学有效性和生理学安全性两者。药理学有效性是指本文所公开的组合物(例如，如本文所述的免疫细胞)促进患者中的癌症消退的能力。生理学安全性是指由施用本文所公开的组合物(例如，如本文所述的免疫细胞)引起的毒性水平或其他在细胞、器官和/或生物体水平上的不良生理作用(不良作用)。

本文所用的术语“嵌合抗原受体”和“CAR”是指一组多肽，通常是两种最简单形式的多肽，它们在免疫效应细胞中时，为细胞提供对靶细胞(通常是癌细胞)的特异性，并产生细胞内信号。在一些方面，CAR至少包含细胞外抗原结合结构域、跨膜结构域和细胞质信号传导结构域(本文也称为“细胞内信号传导结构域”)，所述细胞质信号传导结构域包含衍生自下面定义的刺激分子和/或共刺激分子的功能信号传导结构域。在一些方面，该组多肽在同一多肽链中，例如包含嵌合融合蛋白。在一些方面，该组多肽彼此不连续，例如位于不同的多肽链中。在一些方面，该组多肽包括二聚化开关，其在二聚化分子存在时可以将多肽彼此偶联，例如可以将抗原结合结构域与细胞内信号传导结构域偶联。在一些方面，CAR的刺激分子是与T细胞受体复合物相关的ζ链(例如CD3ζ)。在一些方面，细胞质信号传导结构域包含初级信号传导结构域(例如，CD3ζ的初级信号传导结构域)。在一些方面，细胞质信号传导结构域还包含一个或多个衍生自至少一种如下定义的共刺激分子的功能性信号传导结构域。在一些方面，共刺激分子选自本文所述的共刺激分子，例如4-1BB(即CD137)、CD27和/或CD28。

在一些方面，CAR包含嵌合融合蛋白，所述嵌合融合蛋白包含抗原结合结构域、跨膜结构域和细胞内信号传导结构域，所述细胞内信号传导结构域包含衍生自刺激分子的功能性信号传导结构域，其中所述抗原结合结构域和跨膜结构域通过CAR间隔子连接。在一些方面，CAR包含嵌合融合蛋白，所述嵌合融合蛋白包含通过CAR间隔子连接至跨膜结构域的抗原结合结构域和细胞内信号传导结构域，所述细胞内信号传导结构域包含衍生自共刺激分子的功能性信号传导结构域和衍生自刺激分子的功能性信号传导结构域。在一些方面，CAR包含嵌合融合蛋白，所述嵌合融合蛋白包含通过CAR间隔子连接至跨膜结构域的抗原结合结构域和细胞内信号传导结构域，所述细胞内信号传导结构域包含两个衍生自一种或多种共刺激分子的功能性信号传导结构域和衍生自刺激分子的功能性信号传导结构域。在一些方面，CAR包含嵌合融合蛋白，所述嵌合融合蛋白包含通过CAR间隔子连接至跨膜结构域的抗原结合结构域和细胞内信号传导结构域，所述细胞内信号传导结构域包含至少两个衍生自一种或多种共刺激分子的功能性信号传导结构域和衍生自刺激分子的功能性信号传导结构域。在一些方面，CAR包含在CAR的氨基末端(N末端)处的任选前导序列。在一些方面，CAR还包含在抗原结合结构域的N末端处的前导序列，其中所述前导序列在细胞加工和CAR定位到细胞膜的过程中任选地从抗原结合结构域(例如，scFv)切割。

嵌合抗原受体与其他抗原结合剂的区别在于它们既结合MHC-非依赖性抗原又通过其细胞内结构域转导活化信号的能力。

嵌合抗原受体的抗原特异性细胞外结构域识别并特异性地结合抗原，通常是恶性肿瘤的表面表达抗原。当抗原特异性细胞外结构域例如以在约0.1pM至约10μM之间(例如约0.1pM至约1μM或约0.1pM至约100nM)的亲和力常数或相互作用亲和力(K_D)结合抗原时，其特异性地结合抗原。用于确定相互作用的亲和力的方法是本领域已知的。适用于本公开的CAR的抗原特异性细胞外结构域可以是任何抗原结合多肽，广泛多种所述多肽在本领域中是已知的。在一些方面，抗原结合结构域是单链Fv(scFv)。其他基于抗体的识别结构域诸如cAb VHH(骆驼科动物抗体可变结构域)及其人源化形式、lgNAR VH(鲨鱼抗体可变结构域)及其人源化形式、sdAb VH(单结构域抗体可变结构域)和“骆驼源化”抗体可变结构域也适用于本公开的CAR。

在一些方面，基于T细胞受体(TCR)的识别结构域(诸如单链TCR(scTv，即含有VαVβ的单链双结构域TCR))也适用于本公开的嵌合结合蛋白。

术语“核酸”、“核酸分子”、“核苷酸”、“核苷酸序列”和“多核苷酸”可互换使用并且是指呈单链形式或双链螺旋形式的核糖核苷(腺苷、鸟苷、尿苷或胞苷；“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷；“DNA分子”)的磷酸酯聚合形式或其任何磷酸酯类似物，如硫代磷酸酯和硫酯。单链核酸序列是指单链DNA(ssDNA)或单链RNA(ssRNA)。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋是可能的。术语核酸分子，特别是DNA或RNA分子，仅指分子的一级和二级结构，并且不将其限制于任何特定的三级形式。因此，这一术语包括尤其见于线性或环状DNA分子(例如限制片段)、质粒、超螺旋DNA和染色体中的双链DNA。在讨论特定的双链DNA分子的结构中，本文可根据仅给出沿DNA的非转录链(即该链具有与mRNA同源的序列)5'至3'方向的序列的标准惯例来描述序列。“重组DNA分子”是经过分子生物学操作的DNA分子。DNA包括但不限于cDNA、基因组DNA、质粒DNA、合成DNA和半合成DNA。本公开的“核酸组合物”包含一种或多种如本文所述的核酸。如本文所述，在一些方面，本公开的多核苷酸可以包含编码单个蛋白质的单个核苷酸序列(例如，密码子优化的c-Jun核苷酸序列)(“单顺反子”)。在一些方面，本公开的多核苷酸是多顺反子(即，包含两个或更多个顺反子)。在某些方面，多顺反子多核苷酸的每个顺反子可编码本文公开的蛋白质(例如AP-1转录因子、嵌合结合蛋白或EGFRt)。在一些方面，每个顺反子可以彼此独立地翻译。

如本文所用，术语“多肽”涵盖肽和蛋白质，除非另有说明。

如本文所用，“编码区”、“编码序列”或“可翻译序列”是多核苷酸中由可翻译成氨基酸的密码子组成的一部分。虽然“终止密码子”(TAG、TGA或TAA)通常未被翻译成氨基酸，它可被认为是编码区的一部分，但是任何侧翼序列(例如启动子、核糖体结合位点、转录终止子、内含子等)并非编码区的一部分。编码区的边界通常通过位于5’末端处编码所得多肽的氨基末端的起始密码子和位于3’末端处编码所得多肽的羧基末端的翻译终止密码子决定。

术语“互补的”和“互补性”是指通过沃森-克里克(Watson-Crick)碱基配对彼此相关的两种或更多种低聚物(即，各自包含核碱基序列)，或在低聚物与靶基因之间。例如，核碱基序列“T-G-A(5'至3')”与核碱基序列“A-C-T(3'至5')”互补。互补性可以是“部分的”，其中根据碱基配对规则，给定核碱基序列的少于所有核碱基与另一核碱基序列匹配。例如，在一些方面，给定核碱基序列与其它核碱基序列之间的互补性可以是约70％、约75％、约80％、约85％、约90％或约95％。因此，在某些方面，术语“互补”是指与靶核酸序列(例如，c-Jun编码核酸序列)至少约80％、至少约85％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％匹配或互补性。或者，在给定核碱基序列与其它核碱基序列之间可存在“完全”或“完美”(100％)互补性以继续所述实例。在一些方面，核碱基序列之间的互补性程度对序列之间杂交的效率和强度具有显著影响。

如本文所用，术语“表达”是指多核苷酸产生基因产物，例如AP-1转录因子的过程。它包括但不限于将多核苷酸转录成信使RNA(mRNA)和将mRNA翻译成多肽。表达产生“基因产物”。如本文所用，基因产物可以是由基因的转录产生的核酸，例如信使RNA，或从转录物翻译的多肽。本文所述的基因产物还包括具有转录后修饰的核酸，所述修饰例如为聚腺苷酸化或剪接；或具有翻译后修饰的多肽，所述修饰例如甲基化、糖基化、添加脂质、与其它蛋白质亚基缔合或蛋白水解切割。

如本文所用，术语“同一性”是指聚合物分子之间，例如多核苷酸分子之间的总体单体保守性。没有任何另外限定符的术语“同一的”，例如多核苷酸A与多核苷酸B同一，意味着多核苷酸序列是100％同一的(100％序列同一性)。将两个序列描述为例如“70％同一”等同于将它们描述为具有例如“70％序列同一性”。当在本文中用作与本公开的核苷酸序列的比较时，“参考核苷酸序列”是指与本公开的核苷酸序列基本相同的多核苷酸序列，但该序列未被优化。例如，在一些方面，参考核苷酸序列包含SEQ ID NO:11中所示的野生型JUN核酸序列。

两个多肽或多核苷酸序列的同一性百分比的计算例如可通过出于最佳比较目的比对两个序列来进行(例如，为了最佳比对可将空位引入第一和第二多肽或多核苷酸序列之一或两者中并且出于比较目的可忽视不相同的序列)。在某些方面，出于比较目的比对的序列的长度是参考序列的长度的至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％或约100％。然后比对相应氨基酸位置的氨基酸，或在多核苷酸的情况下碱基进行比较。

第一序列中的位置被与第二序列中相应位置相同的氨基酸或核苷酸占据时，则分子在所述位置处是同一的。两个序列之间的同一性百分比随将为了两个序列的最优比对而需要引入的空位的数目和每个空位的长度考虑在内，由所述序列共有的相同位置的数目而变化。两个序列之间的序列的比较和一致性百分比的确定可使用数学算法来完成。

可用于比对各种序列(例如，多核苷酸序列)的合适软件程序可从各种来源获得。用于确定序列同一性百分比的一种合适的程序是bl2seq，其为可从美国政府国家生物技术信息中心BLAST网址(blast.ncbi.nlm.nih.gov)获得的BLAST程序套件的一部分。Bl2seq使用BLASTN或BLASTP算法进行两个序列之间的比较。BLASTN用于比较核酸序列，而BLASTP用于比较氨基酸序列。其它合适的程序是例如Needle、Stretcher、Water或Matcher，其为生物信息学程序的EMBOSS套件的一部分，并且也可从欧洲生物信息学研究所(EBI)在worldwideweb.ebi.ac.uk/Tools/psa获得。

序列比对可使用本领域中已知的方法如MAFFT、Clustal(ClustalW、Clustal X或Clustal Omega)、MUSCLE等来进行。

与多核苷酸或多肽参考序列比对的单个多核苷酸或多肽靶序列内的不同区域可各自具有其自己的序列同一性百分比。应注意，序列同一性百分比值四舍五入至最接近的十分位。例如，80.11、80.12、80.13和80.14向下舍入到80.1，而80.15、80.16、80.17、80.18和80.19向上舍入到80.2。还应注意，长度值将始终是整数。

在某些方面，第一氨基酸序列(或核酸序列)与第二氨基酸序列(或核酸序列)的同一性百分比(％ID)被计算为％ID＝100x(Y/Z)，其中Y是在第一序列和第二序列的比对中评分为相同匹配的氨基酸残基(或核碱基)的数目(如通过目视检查或特定序列比对程序所比对)，并且Z是第二序列中的残基总数。如果第一序列的长度长于第二序列，则第一序列与第二序列的同一性百分比将高于第二序列与第一序列的同一性百分比。

本领域技术人员将理解，用于计算序列同一性百分比的序列比对的生成不限于仅由一级序列数据驱动的二进制序列-序列比较。还应理解，序列比对可通过将序列数据与来自异构源的数据如结构数据(例如，晶体学蛋白质结构)、功能数据(例如，突变的位置)或系统发育数据整合而产生。整合异构数据以生成多重序列比对的合适程序是可在worldwidewebtcoffee.org获得且可替代地可例如从EBI获得的T-Coffee。还应理解，用于计算百分比序列同一性的最终比对可自动地或人工地加以验证。

如本文所用，术语“分离的”、“纯化的”、“提取的”及其语法变体可互换地使用并且是指已进行一个或多个纯化过程的本公开的所需组合物的制剂状态，例如密码子优化的多核苷酸或表达由密码子优化的多核苷酸编码的蛋白质的工程化细胞。在一些方面，如本文所用的分离或纯化是从含有污染物的样品中除去、部分除去(例如，一部分)本公开的组合物，例如本公开的密码子优化的多核苷酸的过程。

在一些方面，经分离的组合物没有可检测的不希望的活性，或者可替代地，不希望的活性的水平或量处于或低于可接受的水平或量。在其他方面，经分离的组合物具有等于或高于可接受的量和/或浓度和/或活性的本公开的所需组合物的量和/或浓度。在其它方面，与从其中获得组合物的起始材料相比，经分离的组合物得到富集。这种富集可以是与起始材料相比的至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％、至少约99.9％、至少约99.99％、至少约99.999％、至少约99.9999％或大于99.9999％。

在一些方面，经分离的制剂基本上不含残留生物产物。在一些方面，经分离的制剂100％不含、至少约99％不含、至少约98％不含、至少约97％不含、至少约96％不含、至少约95％不含、至少约94％不含、至少约93％不含、至少约92％不含、至少约91％不含或至少约90％不含任何污染性生物物质。残留生物产物可包括非生物物质(包括化学物质)或不想要的核酸、蛋白质、脂质或代谢物。

如本文所用，术语“连接的”是指第一氨基酸序列或多核苷酸序列分别共价或非共价连接至第二氨基酸序列或多核苷酸序列。第一氨基酸或多核苷酸序列可直接连接至第二氨基酸或多核苷酸序列或与第二氨基酸或多核苷酸序列并置，或者可替代地插入序列可将第一序列共价连接至第二序列。术语“连接”不仅指第一多核苷酸序列在5'-端或3'-端与第二多核苷酸序列的融合，而且包括将整个第一多核苷酸序列(或第二多核苷酸序列)插入第二多核苷酸序列(或相应地第一多核苷酸序列)中的任何两个核苷酸中。第一多核苷酸序列可通过磷酸二酯键或接头与第二多核苷酸序列连接。接头可以是例如多核苷酸。

“施用”是指使用本领域技术人员已知的各种方法和递送系统中的任一种，将治疗剂(例如本文所述的核酸分子)物理引入受试者中。示例性施用途径包括静脉内、肌内、动脉内、鞘内、淋巴内、病灶内、囊内、眶内、心内、皮内、腹膜内、经气管、皮下、表皮下、关节内、囊下、蛛网膜下、脊髓内、硬膜外、胸骨内、口服、直肠、局部、表皮、粘膜、鼻内、阴道、直肠、舌下施用及其组合。施用还可以例如进行一次、多次和/或在一个或多个延长时间段内进行。

对受试者的“治疗”或“疗法”是指对受试者进行的任何类型的干预或处理，或者向受试者施用活性剂，目的是逆转、缓解、改善、抑制、减缓或预防与疾病相关的症状、并发症、疾患或者生化指标的发作、进展、发展、严重性或复发。

如本文所用，就核苷酸序列而言，术语“优化”是指编码多肽的多核苷酸序列，其中所述多核苷酸序列已被突变以增强该多核苷酸序列的性质。在一些方面，进行优化以提高转录水平、提高翻译水平、提高稳态mRNA水平、增加或减少调节蛋白例如一般转录因子的结合、增加或减少剪接，或增加多核苷酸序列产生的多肽的产量。可以对多核苷酸序列进行改变以优化的实例包括密码子优化、G/C含量优化、去除重复序列、去除富含AT的元件、去除隐蔽剪接位点、去除抑制转录或翻译的顺式作用元件、添加或去除多聚T或多聚A序列、在转录起始位点周围添加增强转录的序列，例如Kozak共有序列、去除可能形成茎环结构的序列、去除不稳定序列以及其两个或多个组合。贯穿本公开提供了与此类优化相关的另外的公开。

如本文所用，术语“启动子”是指能够控制编码序列或功能性RNA的表达的DNA序列。一般来说，编码序列位于启动子序列的3'。启动子可全部来源于天然基因，或由来源于自然界中发现的不同启动子的不同元件构成，或甚至包含合成的DNA区段。本领域技术人员应理解不同启动子可在不同组织或细胞类型中，或在不同发育阶段，或响应于不同环境或生理条件来引导基因的表达。引起基因大部分时候在大部分细胞类型中表达的启动子通常被称为“组成型启动子”。引起基因在特定细胞类型中表达的启动子通常被称为“细胞特异性启动子”或“组织特异性启动子”。引起基因在发育或细胞分化的特定阶段表达的启动子通常被称为“发育特异性启动子”或“细胞分化特异性启动子”。在用诱导启动子的剂、生物分子、化学品、配体、光等暴露或处理细胞后被诱导并引起基因表达的启动子通常被称为“诱导型启动子”或“可调控的启动子”。进一步认识到由于在大部分情况下调控序列的精确边界未完全限定，具有不同长度的DNA片段可具有相同的启动子活性。

在以下小节中更详细地描述了本公开的各个方面。

c-Jun表达核苷酸序列

c-Jun(本文中也称为“AP-1转录因子”或“AP-1”)是属于激活蛋白-1(AP-1)家族的致癌转录因子。它与各种蛋白质(例如c-Fos)相互作用形成二聚体复合物，该二聚体复合物调节多种细胞信号传导途径，包括细胞增殖和肿瘤进展。因此，在某些癌症中观察到c-Jun表达增加，并且对开发c-Jun拮抗剂来治疗此类癌症非常感兴趣。参见例如，Brennan,A.,等人,J Exp Clin Cancer Res 39(1):184(2020年9月)。

在人中，c-Jun蛋白由JUN基因编码，该基因位于1号染色体上(GenBank登录号NC_000001.11的核苷酸58,780,791至58,784,047，负链取向)。JUN基因及其编码的蛋白质的同义词是已知的，包括“Jun原癌基因，AP-1转录因子亚基”、“v-Jun禽肉瘤病毒17癌基因同源物”、“转录因子AP-1”、“Jun癌基因”、“AP-1”、“Jun激活结构域结合蛋白”、“p39”和“增强子结合蛋白AP1”。野生型人c-Jun蛋白序列长度为331个氨基酸。野生型人c-Jun的氨基酸和核酸序列分别提供于表1和2中。

表1.c-Jun蛋白序列

表2.c-Jun核酸序列

/>

密码子优化

如本文所述，本公开的多核苷酸包含编码AP-1转录因子的核苷酸序列，其中该核苷酸序列已被密码子优化。因此，在一些方面，编码本文所述的c-Jun蛋白的核苷酸序列不同于野生型c-Jun核苷酸序列(例如，SEQ ID NO:11)。

在一些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:1至10中所示的核酸序列中的任一个具有至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％，或至少约99％序列同一性。在某些方面，编码AP-1转录因子的核苷酸序列包含SEQID NO:1至10中任一个所示的核酸序列。

在一些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:1中所示的核酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性。在某些方面，编码AP-1转录因子的核苷酸序列与SEQ IDNO:1中所示的核酸序列具有至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性。在一些方面，核苷酸序列包含SEQ ID NO:1中所示的核酸序列。

在一些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:2中所示的核酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性。在某些方面，编码AP-1转录因子的核苷酸序列与SEQ IDNO:2中所示的核酸序列具有至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性。在一些方面，核苷酸序列包含SEQ ID NO:2中所示的核酸序列。

在一些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:3中所示的核酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性。在某些方面，编码本文所述的AP-1转录因子的核苷酸序列与SEQ ID NO:3中所示的核酸序列具有至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性。在一些方面，核苷酸序列包含SEQ ID NO:3中所示的核酸序列。

在一些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:4中所示的核酸序列具有至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性。在某些方面，核苷酸序列与SEQ ID NO:4中所示的核酸序列具有至少96％、至少97％、至少98％或至少99％。在一些方面，核苷酸序列包含SEQ ID NO:4中所示的核酸序列。

在一些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:5中所示的核酸序列具有至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性。在某些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:5中所示的核酸序列具有至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性。在一些方面，核苷酸序列包含SEQ ID NO:5中所示的核酸序列。

在一些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:6中所示的核酸序列具有至少约80％、至少85％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性。在某些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:6中所示的核酸序列具有至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性。在一些方面，核苷酸序列包含SEQ ID NO:6中所示的核酸序列。

在一些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:7中所示的核酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性。在某些方面，编码AP-1转录因子的核苷酸序列与SEQ IDNO:7中所示的核酸序列具有至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性。在一些方面，核苷酸序列包含SEQ ID NO:7中所示的核苷酸序列。

在一些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:8中所示的核酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性。在某些方面，编码AP-1转录因子的核苷酸序列与SEQ IDNO:8中所示的核酸序列具有至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性。在一些方面，核苷酸序列包含SEQ ID NO:8中所示的核苷酸序列。

在一些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:9中所示的核酸序列具有至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性。在某些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:9中所示的核酸序列具有至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性。在一些方面，核苷酸序列包含SEQ IDNO:9中所示的核苷酸序列。

在一些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:10中所示的核酸序列具有至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％，或至少约99％序列同一性。在某些方面，编码AP-1转录因子的核苷酸序列与SEQ ID NO:10中所示的核酸序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性。在一些方面，该核苷酸序列包括SEQ ID NO:10中所示的核苷酸序列。

示例性密码子优化的AP-1核苷酸序列提供于表3(下文)中。

表3.密码子优化的c-Jun核苷酸序列

/>

本文公开的AP-1核苷酸序列可以使用本领域已知的任何方法进行密码子优化。例如，在某些方面，本文公开的AP-1核苷酸序列的密码子已被优化以与野生型核苷酸序列(例如，SEQ ID NO:11)相比，修饰(例如，增加或减少)一个或多个以下参数：(i)密码子适应指数(即密码子使用偏好)；(ii)鸟嘌呤-胞嘧啶(GC)核苷酸含量；(iii)mRNA二级结构和不稳定基序；(iv)重复序列(例如，正向重复、反向重复、二元重复)；(v)限制酶识别位点；或(vi)其组合。

不受任一种理论的束缚，在一些方面，此类密码子优化可以增加由核苷酸序列(例如，c-Jun)编码的蛋白质的表达。因此，在一些方面，与用野生型核苷酸序列(例如SEQ IDNO:11)转染的细胞中的相应表达相比，本公开的密码子优化的AP-1核苷酸序列当转染、转导或以其他方式引入人细胞(例如，人T细胞)时能够增加所编码的AP-1转录因子的表达。在一些方面，与用野生型核苷酸序列(例如，SEQ ID NO:11)转染、转导或以其他方式进行基因修饰以表达的细胞(即“参考细胞”)中的相应表达相比，AP-1转录因子的表达增加至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约16倍、至少约17倍、至少约18倍、至少约19倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍、至少约75倍、至少约100倍、至少约200倍、至少约300倍、至少约400倍、至少约500倍、至少约750倍或至少约1,000倍或更多。在一些方面，与参考细胞相比，c-Jun多肽的表达增加约1倍、约2倍、约3倍、约4倍、约5倍、约6倍、约7倍、约8倍、约9倍或约10倍。

在一些方面，AP-1转录因子表达的增加可以改善和/或增强转染细胞(例如免疫细胞，例如T细胞，例如CD4+和/或CD8+T细胞)的一种或多种特性。此类特性的非限制性实例包括：对耗竭的抗性(例如，如耗竭标记物如PD-1、CD39、TIM-3和/或LAG-3的表达减少所指示的；增加的存活率；和/或增加的细胞因子产生)、增加的持久性/存活率、增加的扩增/增殖、改善的效应子功能(例如，抗原刺激后的细胞因子产生、表达靶抗原的细胞裂解或两者)或其组合。

用于测量耗竭、细胞表型、持久性、细胞毒性和/或杀伤、增殖、细胞因子产生/释放和基因表达谱的测定是本领域已知的，并且包括例如流式细胞术、细胞内细胞因子染色(ICS)、免疫细胞杀伤分析、中尺度发现(Meso Scale Discovery；MSD)或类似测定、持续抗原刺激测定、批量和单细胞RNAseq(参见例如Fron Genet.2020；11:220；2019Bioinformatics 35:i436-445；2019Annual Review of Biomed.Data Sci.2:139-173)、细胞毒性/杀伤测定、ELISA、蛋白质印迹和其他标准分子和细胞生物学方法，例如文中所述的或例如分子生物学现行方案或免疫学现行方案(John Wiley&Sons,Inc.,1999-2021)或其他地方中所述。

在一些方面，AP-1转录因子表达的增加增加了细胞对耗竭的抗性。在一些方面，与参考细胞(例如，未修饰以具有增加的AP-1表达的相应细胞)相比，对耗竭的抗性增加至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍，至少约15倍、至少约16倍、至少约17倍、至少约18倍、至少约19倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍、至少约75倍、至少约100倍、至少约200倍、至少约300倍、至少约400倍、至少约500倍、至少约750倍或至少约1,000倍或更多。

在一些方面，AP-1转录因子的过表达可以减少耗竭细胞中的耗竭。在某些方面，与参考细胞(例如，未修饰以具有增加的AP-1表达的相应耗竭细胞)相比，AP-1转录因子表达的增加可以使耗竭减少至少约5％、至少约10％、至少约15％、至少约20％、至少约25％、至少约30％、至少约35％、至少约40％、至少约45％、至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％或约100％。

在一些方面，AP-1转录因子表达的增加可以增加细胞的持久性/存活率，例如，当体内施用给受试者时。在一些方面，与参考细胞(例如，未修饰以具有增加的AP-1表达的相应细胞)相比，细胞的持久性/存活率增加至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍，至少约15倍、至少约16倍、至少约17倍、至少约18倍、至少约19倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍、至少约75倍、至少约100倍、至少约200倍、至少约300倍、至少约400倍、至少约500倍、至少约750倍或至少约1,000倍或更多。

在一些方面，AP-1转录因子表达的增加可以增加细胞的扩增/增殖，例如，在抗原刺激后。在一些方面，与参考细胞(例如，未修饰以具有增加的AP-1表达的相应细胞)相比，细胞的扩增/增殖增加至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍，至少约15倍、至少约16倍、至少约17倍、至少约18倍、至少约19倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍、至少约75倍、至少约100倍、至少约200倍、至少约300倍、至少约400倍、至少约500倍、至少约750倍或至少约1,000倍或更多。

在一些方面，AP-1转录因子表达的增加可以增加细胞的效应子功能，例如增加细胞因子产生、颗粒酶释放和/或细胞毒性。在一些方面，与参考细胞(例如，未修饰以具有增加的AP-1表达的相应细胞)相比，细胞的效应子功能增加至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍，至少约15倍、至少约16倍、至少约17倍、至少约18倍、至少约19倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍、至少约75倍、至少约100倍、至少约200倍、至少约300倍、至少约400倍、至少约500倍、至少约750倍或至少约1,000倍或更多。

T细胞中c-Jun的过表达有助于通过例如减轻或防止T细胞功能障碍(例如T细胞耗竭)来维持细胞的活性状态。本文所述的密码子优化的c-Jun可用于工程化免疫细胞，例如T细胞，其随后表现出针对所需靶细胞(例如，本文所述的内源性TCR的靶标或嵌合结合蛋白的靶标)的持续、有效的细胞毒性。与不过表达c-Jun的T细胞相比，过表达本文公开的密码子优化的c-Jun的工程化T细胞显示出较少的T细胞耗竭迹象。

密码子使用偏好

尽管对表达系统和重组DNA技术的知识不断增加，但在选定的细胞中表达某些基因(例如，外源的或合成的)仍存在重大障碍。例如，即使与强启动子偶联，合成基因的表达也常常以比预期低得多的效率或动力学发生。对于细胞来说外源基因通常也是如此。在一些方面，这种低于预期的表达效率是由于基因的蛋白质编码区具有与表达蛋白质的细胞中的密码子使用模式不同的密码子使用模式。

因此，在一些方面，本文公开的密码子优化的AP-1核苷酸序列具有相对于野生型核苷酸序列(例如SEQ ID NO:11)增加的人密码子适应指数。如本文所用，术语“密码子适应指数”是指密码子使用偏好的量度。密码子适应指数(CAI)测量给定蛋白质编码基因序列相对于参考基因集的偏差(Sharp PM和Li WH,Nucleic Acids Res.15(3):1281–95(1987))。CAI是通过确定基因序列长度上每个密码子相关权重的几何平均值来计算的(以密码子为单位)：

对于每个氨基酸，CAI中其每个密码子的权重计算为观察到的密码子频率(fi)与该氨基酸的同义密码子频率(fj)之间的比率：

在一些方面，本文公开的密码子优化的AP-1核苷酸序列的CAI为至少约0.75(75％)、至少约0.76(76％)、至少约0.77(77％)、至少约0.78(78％)、至少约0.79(79％)、至少约0.80(80％)、至少约0.81(81％)、至少约0.82(82％)、至少约0.83(83％)，至少约0.84(84％)、至少约0.85(85％)、至少约0.86(86％)、至少约0.87(87％)、至少约0.88(88％)、至少约0.89(89％)、至少约0.90(90％)、至少约0.91(91％)、至少约0.92(92％)、至少约0.93(93％)、至少约0.94(94％)、至少约0.95(95％)、至少约0.96(96％)、至少约0.97(97％)、至少约0.98(98％)或至少约0.99(99％)。

G/C含量优化

人基因的G/C含量具有高度异质性，一些基因的G/C含量低至20％，而另一些基因的G/C含量高达95％。一般来说，富含G/C的基因表达更高。事实上，已经证明增加基因的G/C含量可以导致基因表达增加，这主要是由于转录的增加和更高的稳态mRNA水平。参见Kudla等人.,PLoS Biol 4(6):e180(2006)。如本文所用，术语“G/C含量”(或鸟嘌呤-胞嘧啶含量)或“G/C核苷酸的百分比”是指DNA分子中鸟嘌呤或胞嘧啶的含氮碱基的百分比。G/C含量可以使用下式计算：

在一些方面，本文公开的密码子优化的AP-1核苷酸序列含有与野生型核苷酸序列(例如SEQ ID NO:11)中的G/C核苷酸百分比相比更高的G/C核苷酸百分比。在一些方面，本文所述的密码子优化的AP-1核苷酸序列的G/C含量为至少约50％、至少约51％、至少约52％、至少约53％、至少约54％、至少约55％、至少约56％、至少约57％、至少约58％、至少约59％、至少约60％、至少约61％、至少约62％、至少约63％、至少约64％或至少约65％。在某些方面，本文公开的密码子优化的AP-1核苷酸序列具有至少约0.60(60％)的G/C含量(例如SEQ ID NO:1)。在一些方面，本文公开的密码子优化的AP-1核苷酸序列具有至少约0.61(61％)的G/C含量(例如SEQ ID NO:2)。在一些方面，密码子优化的AP-1核苷酸序列具有至少约0.59(59％)的G/C含量(例如SEQ ID NO:3)。在一些方面，密码子优化的AP-1核苷酸序列具有至少约0.52(52％)的G/C含量(例如SEQ ID NO:4)。在一些方面，本公开的密码子优化的AP-1核苷酸序列具有至少约0.56(56％)的G/C含量(例如SEQ ID NO:5)。在一些方面，本文所述的密码子优化的AP-1核苷酸序列具有至少约0.59(59％)的G/C含量(例如SEQ IDNO:6)。在一些方面，密码子优化的AP-1核苷酸序列具有至少约0.61(61％)的G/C含量(例如SEQ ID NO:7)。在一些方面，密码子优化的AP-1核苷酸序列具有至少约0.63(63％)的G/C含量(例如SEQ ID NO:8)。在一些方面，密码子优化的AP-1核苷酸序列具有至少约0.56(56％)的G/C含量(例如SEQ ID NO:9)。在一些方面，密码子优化的AP-1核苷酸序列具有至少约0.62(62％)的G/C含量(例如SEQ ID NO:10)。

另外的可翻译序列

在一些方面，本文所述的多核苷酸(例如，包含编码AP-1转录因子的核苷酸序列的表达构建体)还可包含一个或多个编码另外的感兴趣蛋白质的核苷酸序列。因此，在一些方面，本公开的多核苷酸可用于表达AP-1转录因子与任何合适的感兴趣蛋白质组合。下面描述了此类另外的可翻译序列的非限制性实例。

配体结合蛋白

在一些方面，本文提供的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列的表达构建体)还包含编码配体结合蛋白的核苷酸序列。如本文所用，术语“配体结合蛋白”是指能够结合感兴趣的分子(即配体)(例如，在肿瘤细胞上表达的抗原或肽/MHC复合物)的任何蛋白质。在某些方面，配体结合蛋白是嵌合结合蛋白。如本文所用，术语“嵌合结合蛋白”是指能够结合一种或多种配体(例如，抗原(例如，包含抗原结合部分))并且通过连接最初编码单独蛋白质的两个或更多个多核苷酸序列而产生的蛋白质。除非另有说明，否则术语在本公开中可互换使用。

配体结合蛋白(例如嵌合结合蛋白)的非限制性实例包括嵌合抗原受体(CAR)、T细胞受体(TCR)、嵌合抗体-T细胞受体(caTCR)、嵌合信号传导受体(CSR)、T细胞受体模拟物(TCR模拟物)及其组合。

在一些方面，嵌合结合蛋白包含CAR。

在一些方面，CAR(例如，其可以与AP-1转录因子组合表达)被设计为标准CAR。在“标准CAR”中，不同的组分(例如，细胞外靶向结构域、跨膜结构域和细胞内信号传导/激活结构域)被线性构建为单个融合蛋白。在一些方面，CAR被设计为第一代CAR。“第一代”CAR由细胞外结合结构域、铰链区、跨膜结构域和一个或多个细胞内信号传导结构域组成。所有第一代CAR都包含CD3ζ链结构域作为细胞内信号传导结构域。在一些方面，CAR被设计为第二代CAR。“第二代”CAR还包含共刺激结构域(例如CD28或4-1BB)。在一些方面，CAR被设计为第三代CAR。“第三代”CAR与第二代CAR相似，不同之处在于它们包含多个共刺激结构域(例如，CD28-4-1BB或CD28-OX40)。在一些方面，CAR被设计为第四代CAR。“第四代”CAR(也称为TRUCK或装甲CAR)还包含可以进一步改善功能的另外的因子。例如，在一些方面，第四代CAR另外含有CAR在靶向肿瘤组织中信号传导时可以释放的细胞因子。在某些方面，第四代CAR包含一个或多个另外的元件，例如归巢基因和自杀基因，其可以帮助进一步调节CAR的活性。在一些方面，CAR被设计为分体式CAR。在“分体式CAR”系统中，CAR的一个或多个组分(例如，细胞外靶向结构域、跨膜结构域和细胞内信号传导/激活结构域)被分成两个或多个部分，使得它依赖于促进完整功能受体组装的多个输入。在一些方面，CAR被设计为可切换的CAR。利用“可切换的CAR”，CAR可以在存在刺激的情况下被切换(例如，瞬时地)打开(开启开关CAR)或关闭(关闭开关CAR)。可以与本公开一起使用的CAR的另外的实例描述于例如US2020/0172879 A1和US2019/0183932 A1中，每一篇均通过引用以其整体并入本文。

在一些方面，本文的构建体编码工程化T细胞受体(TCR)(在本领域中也称为“转基因”TCR)。TCR是一种存在于T细胞表面的分子，其负责将抗原片段识别为与主要组织相容性复合物(MHC)分子结合的肽。TCR是由两条不同的蛋白质链组成的异二聚体。在一些方面，TCR由α(α)链和β(β)链(分别由TRA和TRB编码)组成。在一些方面，TCR由γ和δ(γ/δ)链(分别由TRG和TRD编码)组成。当TCR与MHC分子呈递的抗原肽(肽/MHC)结合时，T淋巴细胞通过信号转导被激活。在一些方面，TCR是工程化的(转基因)TCR。如本文所用，术语“工程化的TCR”或“工程化的T细胞受体”是指经分离或经工程化以所需亲和力与主要组织相容性复合物(MHC)/肽靶抗原特异性地结合并引入免疫细胞(例如，T细胞、NK细胞和/或TIL)群中的T细胞受体(TCR)。

在一些方面，嵌合结合蛋白包含嵌合抗体T细胞受体(caTCR)。如本文所用，“嵌合抗体-T细胞受体”或“caTCR”包含(i)特异性结合感兴趣抗原的抗体部分和(ii)能够募集至少一种TCR相关的信号传导分子的T细胞受体模块。在一些方面，抗体部分和T细胞受体模块融合在一起。在一些方面，嵌合结合蛋白包含嵌合信号传导受体(CSR)。“嵌合信号传导受体”或“CSR”包含特异性结合靶配体的配体结合结构域和能够向表达CSR的免疫细胞提供刺激信号的共刺激信号传导结构域。caTCR和CSR的非限制性实例在US10,822,413B2中进一步描述，其通过引用整体并入本文。

在一些方面，嵌合结合蛋白包含T细胞受体模拟物(TCR模拟物)。如本文所用，术语“T细胞受体模拟物”或“TCR模拟物”是指已被工程化成识别肿瘤抗原的抗体(或其片段)，其中肿瘤抗原在HLA分子的背景下展示。如本领域技术人员显而易见的，这些抗体可以模拟TCR的特异性。TCR模拟物的非限制性实例例如在US2009/0226474 A1和US2019/0092876 A1中提供，其各自的全部内容通过引用并入本文。

在一些方面，嵌合结合蛋白可以与基因编辑工具(例如，CRISPR-Cas系统)相关联，其中嵌合结合蛋白的激活可以诱导基因编辑工具的激活，使得一个或多个基因的表达和/或活性在细胞中被调节。例如，在一些方面，本文所述的细胞(例如，T细胞)被修饰成包含与蛋白酶连接的嵌合结合蛋白(例如，CAR)和靶向感兴趣基因的调节区(例如，启动子)的单个引导RNA。在一些方面，该细胞被修饰成还包含用于激活T细胞(LAT)的接头，例如通过接头与基因编辑工具复合。嵌合结合蛋白的激活(例如，通过抗原刺激)允许释放用于核定位和基因表达调节的基因编辑工具。此类嵌合结合蛋白的其他方面在本公开的另外的地方提供。另请参见Pietrobon等人,Int J Mol Sci22(19):10828(2021年10月)，其全部内容通过引用并入本文。

如本文所述，可用于本公开的嵌合结合蛋白包含抗原结合结构域、跨膜结构域、共刺激结构域、细胞内信号传导结构域或其组合。在某些方面，抗原结合结构域识别并特异性结合抗原。抗原的非限制性实例包括：AFP(甲胎蛋白)、αvβ6或另一种整联蛋白、BCMA、Braf、B7-H3、B7-H6、CA9(碳酸酐酶9)、CCL-1(C-C基序趋化因子配体1)、CD5、CD19、CD20、CD21、CD22、CD23、CD24、CD30、CD33、CD38、CD40、CD44、CD44v6、CD44v7/8、CD45、CD47、CD56、CD66e、CD70、CD74、CD79a、CD79b、CD98、CD123、CD138、CD171、CD352、CEA(癌胚抗原)、密封蛋白18.2、密封蛋白6、c-MET、DLL3(δ样蛋白3)、DLL4、ENPP3(外切核苷酸焦磷酸酶/磷酸二酯酶家族成员3)、EpCAM、EPG-2(上皮糖蛋白2)、EPG-40、肝配蛋白B2、EPHa2(ephrine受体A2)、ERBB二聚体、雌激素受体、ETBR(内皮素B受体)、FAP-α(成纤维细胞活化蛋白α)、胎儿AchR(胎儿乙酰胆碱受体)、FBP(叶酸结合蛋白)、FCRL5、FR-α(叶酸受体α)、GCC(鸟苷酸环化酶C)、GD2、GD3、GPC2(磷脂酰肌醇蛋白聚糖2)、GPC3、gp100(糖蛋白100)、GPNMB(糖蛋白NMB)、GPRC5D(G蛋白偶联受体5D)、HER2、HER3、HER4、乙型肝炎表面抗原、HLA-A1(人白细胞抗原Al)、HLA-A2(人白细胞抗原A2)、HMW-MAA(人高分子量黑素瘤相关抗原)、IGF1R(胰岛素样生长因子1受体)、Igκ、Igλ、IL-22Ra(IL-22受体α)、IL-13Ra2(IL-13受体α2)、KDR(激酶插入结构域受体)、LI细胞粘附分子(LI-CAM)、Liv-1、LRRC8A(含有富亮氨酸重复序列的蛋白8家族成员A)、Lewis Y、黑素瘤相关抗原(MAGE)-A1、MAGE-A3、MAGE-A6、MART-1(melan A)、鼠巨细胞病毒(MCMV)、MCSP(黑素瘤相关硫酸软骨素蛋白聚糖)、间皮素、粘蛋白1(MUC1)、MUC16、MHC/肽复合物(例如，与衍生自AFP、KRAS、HPV(例如HPV E6或E7)、NY-ESO、MAGE-A和WT1的肽复合的HLA-A)、NCAM(神经细胞粘附分子)、Nectin-4、NKG2D(自然杀伤细胞家族2成员D)配体、NY-ESO、癌胚抗原、PD-1、PD-L1、PRAME(黑素瘤优先表达抗原)、孕酮受体、PSA(前列腺特异性抗原)、PSCA(前列腺干细胞抗原)、PSMA(前列腺特异性膜抗原)、ROR1、ROR2、SIRPα(信号调节蛋白α)、SLIT、SLITRK6(NTRK样蛋白6)、STEAP1(前列腺六段跨膜上皮抗原1)、存活素、TAG72(肿瘤相关糖蛋白72)、TPBG(滋养层糖蛋白)、Trop-2、VEGFR1(血管内皮生长因子受体1)、VEGFR2、以及来自HIV、HBV、HCV、HPV和其他病原体的抗原或其组合。在一些方面，本文所述的嵌合结合蛋白的抗原结合结构域特异性结合ROR1。在一些方面，嵌合结合蛋白的抗原结合结构域特异性结合GPC2。在一些方面，嵌合结合蛋白的抗原结合结构域特异性结合肿瘤抗原，其中该肿瘤抗原衍生自：甲胎蛋白(AFP)、CD19、BCMA、CLL-1、CS1、CD38、CD19、TSHR、CD123、CD22、CD30、CD171、CD33、EGFRvIII、GD2、GD3、Tn Ag、PSMA、ROR1、ROR2、GPC1、GPC2、FLT3、FAP、TAG72、CD44v6、CEA、EPCAM、B7H3、KIT、IL-13Ra2、间皮素、IL-l lRa、PSCA、PRSS21、VEGFR2、LewisY、CD24、PDGFR-β、SSEA-4、CD20、叶酸受体α、ERBB2(Her2/neu)、MUC1、MUC16、EGFR、NCAM、前列腺酶、PAP、ELF2M、肝配蛋白B2、IGF-I受体、CAIX、LMP2、gplOO、bcr-abl、酪氨酸酶、EphA2、岩藻糖基GM1、sLe、GM3、TGS5、HMWMAA、o-乙酰基-GD2、叶酸受体β、TEM1/CD248、TEM7R、CLDN6、GPRC5D、CXORF61、CD97、CD179a、ALK、多唾液酸、PLAC1、GloboH、NY-BR-1、UPK2、HAVCR1、ADRB3、PANX3、GPR20、LY6K、OR51E2、TARP、WTl、NY-ESO-1、LAGE-la、MAGE-Al、legumain、HPV E6,E7、MAGE Al、ETV6-AML、精子蛋白17、XAGE1、Tie 2、MAD-CT-1、MAD-CT-2、Fos相关抗原1、p53、p53突变体、prostein、存活素(surviving)、端粒酶、PCTA-1/半乳凝素8、MelanA/MARTl、Ras突变体(例如，HRAS、KRAS、NRAS)、hTERT、肉瘤易位断点、ML-IAP、ERG(TMPRSS2 ETS融合基因)、NA17、PAX3、雄激素受体、细胞周期蛋白Bl、MYCN、RhoC、TRP-2、CYP1B1、BORIS、SART3、PAX5、OY-TES1、LCK、AKAP-4、SSX2、RAGE-1、人端粒酶逆转录酶、RU1、RU2、肠羧基酯酶、mut hsp70-2、CD79a、CD79b、CD72、LAIR1、FCAR、LILRA2、CD300LF、CLEC12A、BST2、EMR2、LY75、GPC3、FCRL5、IGLL1、CD2、CD3ε、CD4、CD5、CD7、APRIL蛋白的细胞外部分、新抗原或其任何组合。

如本公开其他地方进一步描述的，嵌合结合蛋白的抗原结合结构域可以是能够结合一种或多种抗原的任何多肽。在一些方面，抗原结合结构域包含或衍生自Ig NAR、Fab片段、Fab'片段、F(ab)′2片段、F(ab)′3片段、Fv、单链可变片段(scFv)、双-scFv、(scFv)2、微型抗体、双抗体、三抗体、四抗体、胞内抗体、二硫键稳定的Fv蛋白(dsFv)、一体抗体、纳米抗体、以及衍生自抗体的抗原结合区，其可以特异性结合任何感兴趣的蛋白质、配体、受体、受体片段、肽适体或其组合。在一些方面，抗原结合结构域是单链Fv(scFv)。

在一些方面，本文所述的嵌合结合蛋白包含细胞内信号传导结构域，该细胞内信号传导结构域在抗原与细胞外结构域结合后转导效应子功能信号并指导表达嵌合结合蛋白的细胞(例如，T细胞)执行专门功能。细胞内信号传导结构域的非限制性实例包括衍生自CD3ζ、FcRγ、共同FcRγ(FCER1G)、FcγRIIa、FcRβ(FcεRib)、CD3γ、CD3δ、CD3ε、CD22、CD79a、CD79b、CD278(“ICOS”)、FcεRI、CD66d、CD32、DAP10、DAP12或其任何组合的细胞内信号传导结构域区域。在某些方面，细胞内信号传导结构域包括CD3ζ细胞内信号传导结构域。在一些方面，嵌合结合蛋白包含本文所公开的蛋白质的整个细胞内结构域。在一些方面，细胞内结构域被截短。可使用细胞内结构域的截短部分代替完整链，只要其仍转导效应子功能信号即可。因此，术语细胞内结构域意指包括细胞内结构域的足以转导效应子功能信号的任何截短部分。

在一些方面，可以在本文所述的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列)中编码的嵌合结合蛋白还包含跨膜结构域。在某些方面，抗原结合结构域通过跨膜结构域连接至嵌合结合蛋白的细胞内结构域。在一些方面，抗原结合结构域通过接头连接至嵌合结合蛋白(例如，CAR)的跨膜结构域。在某些方面，在抗原结合结构域和跨膜结构域之间包含接头可以影响抗原结合结构域的柔性，从而改善嵌合结合蛋白功能。

本领域已知的任何跨膜结构域均可用于本文所述的嵌合结合蛋白(例如，CAR)。在一些方面，跨膜结构域是人工的(例如，工程化的跨膜结构域)。在一些方面，跨膜结构域衍生自天然存在的多肽。在一些方面，跨膜结构域包含来自天然存在的多肽的跨膜结构域。跨膜结构域的非限制性实例包括KIRDS2、OX40、CD2、CD27、LFA-1(CD11a、CD18)、ICOS(CD278)、4-1BB(CD137)、GITR、CD40、BAFFR、HVEM(LIGHTR)、SLAMF7、NKp80(KLRF1)、NKp44、NKp30、NKp46、CD160、CD19、IL2Rβ、IL2Rγ、IL7Rα、ITGA1、VLA1、CD49a、ITGA4、IA4、CD49D、ITGA6、VLA-6、CD49f、ITGAD、CD11d、ITGAE、CD103、ITGAL、CD11a、LFA-1、ITGAM、CD11b、ITGAX、CD11c、ITGB1、CD29、ITGB2、CD18、LFA-1、ITGB7、TNFR2、DNAM1(CD226)、SLAMF4(CD244、2B4)、CD84、CD96(触觉)、CEACAM1、CRTAM、Ly9(CD229)、CD160(BY55)、PSGL1、CD100(SEMA4D)、SLAMF6(NTB-A、Ly108)、SLAM(SLAMF1、CD150、IPO-3)、BLAME(SLAMF8)、SELPLG(CD162)、LTBR、PAG/Cbp、NKG2D、NKG2C、CD19或其任何组合的跨膜结构域区域。在某些方面，跨膜结构域包含CD28跨膜结构域。

如本文所述，在一些方面，嵌合结合蛋白(例如，CAR)包含一个或多个共刺激结构域(例如，第二代和第三代CAR)。不受任何一种理论的束缚，这些共刺激结构域可以进一步改善经工程化以表达嵌合结合蛋白(例如，与AP-1转录因子组合)的细胞的扩增、激活、记忆、持久性和/或效应子功能。在一些方面，跨膜结构域融合至共刺激结构域，任选地共刺激结构域融合至第二共刺激结构域，并且共刺激结构域融合至信号传导结构域，不限于CD3ζ。共刺激结构域的非限制性实例包含白介素-2受体(IL-2R)、白介素-12受体(IL-12R)、IL-7、IL-21、IL-23、IL-15、CD2、CD3、CD4、CD7、CD8、CD27、CD28、CD30、CD40、4-1BB/CD137、ICOS、淋巴细胞功能相关抗原-1(LFA-1)、LIGHT、NKG2C、OX40、DAP10或其任何组合。在某些方面，共刺激结构域包含4-1BB/CD137共刺激结构域。

接头

在一些方面，本文所述的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列)还包含编码接头的核苷酸序列。接头可以位于本文提供的多核苷酸的任何不同组分之间。例如，在某些方面，多核苷酸包含编码AP-1转录因子的第一核苷酸序列、编码接头的第二核苷酸序列和编码嵌合结合蛋白(例如，CAR)的第三核苷酸序列，其中第二核苷酸序列位于第一和第三核苷酸序列之间，使得AP-1转录因子通过接头连接至嵌合结合蛋白。在一些方面，本公开的多核苷酸可以包含编码接头的多个核苷酸序列(例如，至少两个单独的核苷酸序列)。在某些方面，多个接头是相同的。在一些方面，多个接头是不同的。

在某些方面，接头是肽接头。在一些方面，接头包含至少约1个氨基酸、至少约2个氨基酸、至少约3个氨基酸、至少约4个氨基酸、至少约5个氨基酸、至少约6个氨基酸、至少约7个氨基酸、至少约8个氨基酸、至少约9个氨基酸、至少约10个氨基酸、至少约11个氨基酸、至少约12个氨基酸、至少约13个氨基酸、至少约14个氨基酸、至少约15个氨基酸、至少约16个氨基酸、至少约17个氨基酸、至少约18个氨基酸、至少约19个氨基酸、至少约20个氨基酸、至少约25个氨基酸或至少约30个氨基酸。在一些方面，接头富含甘氨酸(例如，为了柔性)。在一些方面，接头包含丝氨酸和/或苏氨酸(例如，为了溶解性)。在一些方面，接头是Gly/Ser接头。

在一些方面，接头是不可切割的接头，使得接头和本文提供的多核苷酸的不同组分(例如，AP-1转录因子和嵌合结合蛋白)表达为单个多肽。在某些方面，接头包括可切割的接头。如本文所用，术语“可切割的接头”是指包含切割位点的接头，使得当表达时可以选择性切割以产生两个或更多个产物。在一些方面，接头选自P2A接头、T2A接头、F2A接头、E2A接头、弗林蛋白酶切割位点或其任何组合(参见下表4)。在一些方面，接头还包括GSG接头序列。在一些方面，可用于本公开的接头包含内部核糖体进入位点(IRES)，使得在翻译过程中产生由第一和第二基因编码的单独的多肽。例如，在WO 2020/223625A1和US2019/0276801A1中提供了可与本公开一起使用的接头的另外的描述，每一篇均通过引用以其整体并入本文。

表4：接头序列

在一些方面，接头包括P2A接头。在一些方面，接头包含与SEQ ID NO:14中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在一些方面，接头包含SEQ IDNO:14中所示的氨基酸序列。

在一些方面，接头包括T2A接头。在一些方面，接头包含与SEQ ID NO:15中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在一些方面，接头包含SEQ IDNO:15中所示的氨基酸序列。

在一些方面，接头包括F2A接头。在一些方面，接头包含与SEQ ID NO:16中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在一些方面，接头包含SEQ IDNO:16中所示的氨基酸序列。

在一些方面，接头包括E2A接头。在一些方面，接头包含与SEQ ID NO:17中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在一些方面，接头包含SEQ IDNO:17中所示的氨基酸序列。

在一些方面，接头包含含有弗林蛋白酶切割位点的氨基酸序列。在一些方面，接头包含与SEQ ID NO:18中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在一些方面，接头包含SEQ ID NO:18中所示的氨基酸序列。

截短的EGFR

在一些方面，本公开的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列)包含编码截短的表皮生长因子受体(EGFRt)的另外的核苷酸序列，使得EGFRt仅包含全长EGFR蛋白的部分序列(例如SEQ ID NO:19)。在一些方面，EGFRt包含EGFR细胞外结构域III和IV以及EGFR跨膜结构域，但缺乏EGFR细胞外结构域I和II以及EGFR细胞内序列。

EGFR是一种180kDa单体糖蛋白，包含大的细胞外区、单个跨膜结构域、细胞内近膜区、酪氨酸激酶结构域和C末端调节区。细胞外区包含四个结构域：结构域I和III是同源配体结合结构域，结构域II和IV是富含半胱氨酸的结构域(Ferguson,Annu Rev Biophys.(2008)37:353-3)。除非另有说明，否则本文所用的EGFR是指人EGFR。由于选择性剪接，至少有四种已知的人EGFR亚型。表5(以下)提供了不同EGFR亚型的序列。

表5：人EGFR序列

/>

在上述EGFR的规范序列(即亚型1)中，各个EGFR结构域描述如下。信号肽跨越氨基酸1-24。细胞外序列跨越氨基酸25-645，其中结构域I、结构域II、结构域III和结构域IV分别跨越氨基酸25-188、189-333、334-504和505-645。跨膜结构域跨越氨基酸646-668。细胞内结构域跨越氨基酸669-1,210，其中近膜结构域跨越氨基酸669-703，酪氨酸激酶结构域跨越氨基酸704-1,210。

在某些方面，可用于本公开的EGFRt包含与SEQ ID NO:19中所示的氨基酸序列具有至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。

在一些方面，可用于本公开的EGFRt包含与SEQ ID NO:23中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在某些方面，EGFRt包含SEQ ID NO:23中所示的氨基酸序列(参见表6)。在一些方面，可用于本公开的EGFRt包含与SEQ ID NO:24中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在某些方面，EGFRt包含SEQ IDNO:24中所示的氨基酸序列(参见表6)。

表6：截短的EGFR序列

在一些方面，本文所述的EGFRt还包含近膜结构域。如本文所用，术语“近膜结构域”是指紧邻跨膜结构域C末端的细胞表面蛋白(例如EGFR)的细胞内部分。不受任何一种理论的束缚，在一些方面，添加近膜结构域可以增加由本公开的多核苷酸编码的蛋白质的表达。

在一些方面，近膜结构域的长度可以是约1至约20(例如，2-20、3-20、4-20、5-20、2-18、3-18、4-18或5-18)个氨基酸。在某些方面，近膜结构域可以长于20个氨基酸。在一些方面，近膜结构域的前1个或多个(例如前2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19，或20)氨基酸是净中性或净带正电荷的序列(例如，精氨酸和赖氨酸残基的数目大于或等于天冬氨酸和谷氨酸残基的数目)。在某些方面，那些第一氨基酸含有超过约30％(例如，超过40、50、60、70、80或90％)的亲水性氨基酸。可用于本公开的近膜结构域的非限制性实例在表7(下文)中提供。

表7：近膜结构域序列

净电荷	序列
		+1	K
+2	KR
		+3	KRK
+2	KSR
		+1	KSGSGS(SEQ ID NO:25)
+2	SKR
		+1	KRSD(SEQ ID NO:26)
+2	KRSDK(SEQ ID NO:27)
		0	SGGGG(SEQ ID NO:28)
0	SGAGG(SEQ ID NO:29)
		+2	KRADK(SEQ ID NO:30)
+3	RRRSGGGGSGGGGS(SEQ ID NO:31)
		0	SGGGGSGGGGS(SEQ ID NO:32)
0	(GGGGS)n,n>1(SEQ ID NO:33)

在一些方面，可与本公开一起使用的近膜结构域可衍生自天然细胞表面蛋白的近膜区域，例如与磷脂酰胆碱(PC)、磷脂酰丝氨酸(PS)或磷脂酰肌醇-4,5-二磷酸(PIP2)相互作用的人受体酪氨酸激酶的近膜区域(例如，前20个近膜氨基酸的完整或部分序列)(参见例如，Hedger等人,Sci Rep.(2015)5:9198)。受体酪氨酸激酶的非限制性实例是ERBB1(EGFR)、ERBB2(HER2)、ERBB3(HER3)、ERBB4(HER4)、INSR、IGF1R、INSRR、PGFRA、PGFRB、KIT、CSF1R、FLT3、VGFR1、VGFR2、VGFR3、FGFR1、FGFR2、FGFR3、FGFR4、PTK7、NTRK1、NTRK2、NTRK3、ROR1、ROR2、MUSK、MET、RON、UFO、TYRO3、MERTK、TIE1、TIE2、EPHA1、EPHA2、EPHA3、EPHA4、EPHA5、EPHA6、EPHA7、EPHA8、EPHAA、EPHB1、EPHB2、EPHB3、EPHB4、EPHB6、RET、RYK、DDR1、DDR2、ROS1、LMTK1、LMTK2、LMTK3、LTK、ALK和STYK1。在某些方面，近膜结构域可以包含一个或多个突变(例如，取代或缺失)，这些突变去除已知被磷酸化的残基，从而规避由本公开的多核苷酸编码的蛋白质的任何非预期的信号转导能力。

在一些方面，近膜结构域衍生自EGFR的近膜区。EGFR衍生的近膜结构域的非限制性实例包含表8(下文)中提供的序列之一。在某些方面，近膜结构域包含氨基酸序列RRR。在某些方面，包含此类近膜结构域的EGFRt包含SEQ ID NO:22中所示的序列。

表8：EGFR衍生的近膜结构域序列

净电荷	序列
		+6	RRRHIVRKR(SEQ ID NO:34)
+5	RRRHIVRK(SEQ ID NO:35)
		+4	RRRHIVR(SEQ ID NO:36)
+3	RRRHIV(SEQ ID NO:37)
		+3	RRRHI(SEQ ID NO:38)
+3	RRRH(SEQ ID NO:39)
		+3	RRR
+2	RR
		+1	R

从本公开中显而易见的，包含编码EGFRt的核苷酸序列提供了本公开的多核苷酸(例如，包含密码子优化的c-Jun核苷酸序列和编码嵌合结合蛋白的核苷酸序列)某些优点。例如，在一些方面，EGFRt可以用作杀伤开关。当体内不再需要工程化细胞(例如，用本文所述的多核苷酸转导的CAR T细胞)时，可以向接受工程化细胞的受试者施用药物级抗EGFR抗体，例如西妥昔单抗、帕尼单抗、尼妥珠单抗或奈西妥单抗，从而例如通过抗体依赖性细胞毒性(ADCC)、补体依赖性细胞毒性(CDC)和/或抗体依赖性细胞吞噬作用(ADCP)除去工程化细胞。

在一些方面，本公开的多核苷酸包含编码AP-1转录因子的第一核苷酸序列、编码嵌合结合蛋白(例如CAR)的第二核苷酸序列和编码EGFRt的第三核苷酸序列。在某些方面，多核苷酸另外包含编码第一接头的第四核苷酸序列，其中第四核苷酸序列位于第一和第二核苷酸序列之间，使得AP-1转录因子通过第一接头连接至嵌合结合蛋白。在某些方面，多核苷酸还包含编码第二接头的第五核苷酸序列，其中第五核苷酸序列位于第二和第三核苷酸序列之间，使得嵌合结合蛋白通过第二接头连接至EGFRt。在一些方面，第一接头和第二接头是相同的。在某些方面，第一接头和第二接头是不同的。本文所述的任何接头(例如，P2A接头)可以用作第二接头。

间隔子

在一些方面，本公开的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列)包含编码间隔子的核苷酸序列。如本文所用，术语“间隔子”是指能够将两个间隔部分(例如，P2A接头和嵌合结合蛋白)共价连接在一起的多肽序列。

在某些方面，间隔子衍生自免疫球蛋白(例如，衍生自铰链区或环区)。在一些方面，间隔子包含IgA1、IgA2、IgG1、IgG2、IgG3、IgG4、IgD、IgE或IgM铰链区、其片段(单独的或被另外的序列加帽，例如CH1或CH2区序列)，或来自IgA1、IgA2、IgG1、IgG2、IgG3、IgG4、IgD、IgE或IgM铰链区的片段(本文称为“铰链区衍生的间隔子”)的组合。在一些方面，间隔子包含IgA1、IgA2、IgG1、IgG2、IgG3、IgG4、IgD、IgE或IgM恒定结构域环区、其片段(单独的或被另外的序列加帽，例如来自相邻β链)，或来自IgA1、IgA2、IgG1、IgG2、IgG3、IgG4、IgD、IgE或IgM环区的片段(本文称为“环区衍生的间隔子”)的组合。在某些方面，间隔子包括铰链区衍生的间隔子、环区衍生的间隔子或两者(例如，两个或更多个级联的铰链区衍生的间隔子和环区衍生的间隔子)。

因此，在一些方面，本公开的多核苷酸编码多肽，该多肽包含(i)AP-1转录因子，(ii)第一接头(例如，P2A接头)，(iii)信号肽(例如，hIgκ)，(iv)抗原结合结构域(例如，scFv)，(v)第二接头(例如，GGGSG；SEQ ID NO:40)，(vi)间隔子(例如，IgG2铰链衍生的间隔子)，(vii)跨膜结构域(例如，CD28)，(viii)共刺激结构域(例如，4-1BB)，(ix)细胞内信号传导结构域(例如，CD3ζ)，(x)第三接头(例如，P2A接头)，和(xi)EGFRt。

在一些方面，可用于本公开的间隔子包含选自由以下组成的组的免疫球蛋白重链的子序列：人IgA1(Uniprot:P01876、IGHA1_HUMAN、免疫球蛋白重链恒定区α1；SEQ ID NO:41)、人IgA2(Uniprot P01877，IGHA2_HUMAN，免疫球蛋白重链恒定区α2；SEQ ID NO:42)、鼠IgG2A(Uniprot P01665，GCAM_MOUSE，免疫球蛋白γ2A链C区；SEQ ID NO:43)、人IgG1(Uniprot P01857，IGHG1_HUMAN、免疫球蛋白重链恒定区γ1；SEQ ID NO:44)、人IgG2(Uniprot P01859，IGHG2_HUMAN，免疫球蛋白重链恒定区γ2；SEQ ID NO:45)、人IgG3(Uniprot P01860，IGHG3_HUMAN，免疫球蛋白重链恒定区γ3；SEQ ID NO:46)、人IgG4(Uniprot P01861，IGHG4，免疫球蛋白重链恒定区γ4；SEQ ID NO:47)、人IgD(UniprotP01880，IGHD_HUMAN，免疫球蛋白重链恒定区δ；SEQ ID NO:48)、人IgE(Uniprot P01854，IGHE_HUMAN，免疫球蛋白重链恒定区ε；SEQ ID NO:49)，或IgM(Uniprot P01871，IGHM_HUMAN，免疫球蛋白重链恒定区μ；SEQ ID NO:50)，其中子序列包含CH1-CH2铰链区或其一部分。在一些方面，子序列还包含CH1和/或CH2恒定结构域的相邻部分。

在一些方面，间隔子包含选自由以下组成的组的免疫球蛋白重链的子序列：人IgA1(Uniprot:P01876、IGHA1_HUMAN、免疫球蛋白重链恒定区α1；SEQ ID NO:41)、人IgA2(Uniprot P01877，IGHA2_HUMAN，免疫球蛋白重链恒定区α2；SEQ ID NO:42)、鼠IgG2A(Uniprot P01665，GCAM_MOUSE，免疫球蛋白γ2A链C区；SEQ ID NO:43)、人IgG1(UniprotP01857，IGHG1_HUMAN、免疫球蛋白重链恒定区γ1；SEQ ID NO:44)、人IgG2(UniprotP01859，IGHG2_HUMAN，免疫球蛋白重链恒定区γ2；SEQ ID NO:45)、人IgG3(UniprotP01860，IGHG3_HUMAN，免疫球蛋白重链恒定区γ3；SEQ ID NO:46)、人IgG4(UniprotP01861，IGHG4，免疫球蛋白重链恒定区γ4；SEQ ID NO:47)、人IgD(Uniprot P01880，IGHD_HUMAN，免疫球蛋白重链恒定区δ；SEQ ID NO:48)、人IgE(Uniprot P01854，IGHE_HUMAN，免疫球蛋白重链恒定区ε；SEQ ID NO:49)，或IgM(Uniprot P01871，IGHM_HUMAN，免疫球蛋白重链恒定区μ；SEQ ID NO:50)，其中子序列包含来自恒定结构域的环区或其一部分。在一些方面，子序列还包含β链的相邻部分。

在一些方面，可用于本公开的间隔子衍生自IgG，例如IgG1、IgG2、IgG3或IgG4。在某些方面，间隔子衍生自IgG2铰链。在一些方面，IgG2铰链衍生的间隔子包含SEQ ID NO:51(KPCPPCKCP)的至少五个、六个或七个连续氨基酸。在一些方面，间隔子包含与SEQ ID NO：51(KPCPPCKCP)中所示的序列至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％相同的氨基酸序列。在某些方面，间隔子包含SEQ ID NO:51(KPCPPCKCP)中所示的序列、由其组成或基本上由其组成。在进一步的方面，间隔子包含SEQ ID NO:51(KPCPPCKCP)中所示的序列，除了1、2、3、4、5、6、7、8、9或10个氨基酸取代之外。在一些方面，氨基酸取代是保守氨基酸取代。在一些方面，氨基酸取代包括至少一种非保守氨基酸取代。

在一些方面，本公开的间隔子包含SEQ ID NO:51中所示的序列，其中间隔子序列还包含任选的柔性接头(例如，GGGSG(SEQ ID NO:40)的接头)。因此，在一些方面，本公开的间隔子包含间隔子序列(例如SEQ ID NO:51)和任选的C末端或N末端柔性接头。在一些方面，本文公开的任何任选的柔性接头(例如，富含gly/ser的接头)可以附加至间隔子的C末端和/或N末端。

信号肽

如本文所述，在一些方面，本公开的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列)还包含编码信号肽的核苷酸序列。信号肽可以促进所编码蛋白质的细胞表面表达，然后可以随后从成熟蛋白质中切割。

本领域已知的任何合适的信号肽可以与本公开一起使用。表9(下文)中提供了信号肽的非限制性实例。在某些方面，信号肽衍生自人Igκ。在一些方面，信号肽包含与SEQ IDNO:54(MVLQTQVFISLLLWISGAYG)中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在某些方面，信号肽包含SEQ ID NO:54(MVLQTQVFISLLLWISGAYG)中所示的氨基酸序列。在一些方面，信号肽衍生自GM-CSF。在某些方面，这种信号肽包含与SEQ ID NO:53(MLLLVTSLLLCELPHPAFLLIP)中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。在一些方面，信号肽包含SEQ ID NO:53(MLLLVTSLLLCELPHPAFLLIP)中所示的氨基酸序列。

表9：信号肽序列

来源	序列
		EGFR	MRPSGTAGAALLALLAALCPASRA(SEQ ID NO:52)
GM-CSF	MLLLVTSLLLCELPHPAFLLIP(SEQ ID NO:53)
		人Igκ	MVLQTQVFISLLLWISGAYG(SEQ ID NO:54)
人CD33	MPLLLLLPLLWAGALA(SEQ ID NO:55)

在一些方面，本文所述的多核苷酸包含单个信号肽(例如SEQ ID NO:53或54)。在一些方面，多核苷酸包含多个信号肽(例如，至少两个、三个、四个或更多个)。因此，在一些方面，本公开的多核苷酸编码多肽，该多肽包含(i)AP-1转录因子，(ii)第一接头(例如，P2A接头)，(iii)第一信号肽(例如，hIgκ)，(iv)抗原结合结构域(例如，scFv)，(v)第二接头(例如，GGGSG；SEQ ID NO:40)，(vi)间隔子(例如，IgG2铰链衍生的间隔子)，(vii)跨膜结构域(例如，CD28)，(viii)共刺激结构域(例如，4-1BB)，(ix)细胞内信号传导结构域(例如，CD3ζ)，(x)第三接头(例如，P2A接头)，(xi)第二信号肽(例如，GM-CSF)和(xii)EGFRt。

载体

在一些方面，本文提供了包含本文所述的多核苷酸(例如，包含编码AP-1转录因子的核苷酸序列，例如密码子优化的核苷酸序列)的载体(例如表达载体)。在一些方面，本文所述的载体包含多个(例如，2个、3个或4个或更多个)多核苷酸，其中所述多个多核苷酸各自编码本文所述的蛋白质(例如，AP-1转录因子、配体结合蛋白(例如，嵌合结合蛋白，例如CAR)或EGFRt)。因此，在某些方面，载体包含多顺反子载体(例如，双顺反子载体或三顺反子载体)。在某些方面，本文所述的多核苷酸包含在同一载体上(例如，在多顺反子表达载体上)。在某些方面，编码本文所述蛋白质(例如AP-1转录因子、配体结合蛋白(例如嵌合结合蛋白，例如CAR)或EGFRt)的多核苷酸在一个或多个单独的载体上提供。

如本文所述，此类载体可用于在宿主细胞和治疗干预靶向的细胞中重组表达。如本文所用，术语“载体”旨在指能够转运已与其连接的另一核酸的核酸分子；或包含这种能够转运另一核酸的核酸分子的实体。在一些方面，载体是“质粒”，其是指可将另外的DNA区段连接到其中的环状双链DNA环。在一些方面，载体是病毒载体，其中另外的DNA区段可连接到病毒基因组中。某些载体或作为载体一部分的多核苷酸能够在引入了它们的宿主细胞中自主复制(例如，具有细菌复制起点的细菌载体和附加型(episomal)哺乳动物载体)。其他载体(例如，非附加型哺乳动物载体)可在引入到宿主细胞中之后整合到宿主细胞的基因组中，并且由此与宿主基因组一起复制。此外，某些载体能够指导它们可操作地连接的基因的表达。此类载体在本文中称为“重组表达载体”(或简称为“表达载体”)。通常，在重组DNA技术中有用的表达载体通常呈质粒形式。在本公开中，“质粒”和“载体”有时可互换使用，这取决于上下文，因为质粒是最常使用的载体形式。然而，本文还公开了提供等效功能的其他形式的表达载体，诸如病毒载体(例如，慢病毒、复制缺陷型逆转录病毒、痘病毒、疱疹病毒、杆状病毒、腺病毒和腺相关病毒)。

在一些方面，载体包含本文所述的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列)和调控元件。例如，在某些方面，载体包含可操作地连接至启动子的本文所述的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列)。在一些方面，载体可以包含多个启动子(例如，至少两个、至少三个、至少四个、至少五个或更多个)。例如，在一些方面，编码AP-1转录因子的核苷酸序列(例如，密码子优化的AP-1核苷酸序列)可以在第一启动子的控制下，并且编码多核苷酸的一个或多个另外的组分(例如，嵌合结合蛋白)的核苷酸序列可以在第二启动子的控制下。在某些方面，多个启动子中的每一个都是相同的。在一些方面，多个启动子中的一个或多个是不同的。

本领域已知的任何合适的启动子可以与本公开一起使用。在一些方面，可用于本公开的启动子包括哺乳动物或病毒启动子，例如组成型或诱导型启动子。在一些方面，本公开的启动子包含至少一个组成型启动子和至少一个诱导型启动子，例如组织特异性启动子。

组成型哺乳动物启动子包括但不限于以下基因的启动子：次黄嘌呤磷酸核糖基转移酶(HPRT)、腺苷脱氨酶、丙酮酸激酶、β-肌动蛋白启动子和其他组成型启动子。在真核细胞中组成型起作用的示例性病毒启动子包括例如来自巨细胞病毒(CMV)、猿猴病毒(例如SV40)、乳头瘤病毒、腺病毒、人免疫缺陷病毒(HIV)、劳斯肉瘤病毒、巨细胞病毒、莫洛尼白血病病毒的长末端重复序列(LTR)、和其他逆转录病毒的启动子，以及单纯疱疹病毒的胸苷激酶启动子。如本文所述，在一些方面，可与本公开一起使用的启动子是诱导型启动子。诱导型启动子在诱导剂存在下表达。例如，在某些金属离子存在下，金属硫蛋白启动子被诱导以促进转录和翻译。当存在多个诱导型启动子时，它们可以由相同的诱导物分子或不同的诱导物诱导。

在一些方面，启动子包含骨髓增殖肉瘤病毒增强子、缺失的阴性控制区、dl587rev引物结合位点取代的(MND)启动子、EF1a启动子或两者。

在一些方面，包含本公开的任何多核苷酸(例如，包含密码子优化的AP-1核苷酸序列)的载体还包含一个或多个另外的调控元件。调控元件的非限制性实例包括翻译增强子元件(TEE)、翻译起始序列、微小RNA结合位点或其种子、连接核苷的3'尾部区域、富含AU的元件(ARE)、转录后控制调控物、5'UTR、3'UTR、定位序列(例如，膜定位序列、核定位序列、核排除序列或蛋白酶体靶向序列)、翻译后修饰序列(例如，泛素化、磷酸化或去磷酸化)或其组合。

在一些方面，载体还可包含转座元件。因此，在某些方面，载体包含本文所述的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列)，其两侧为至少两个转座子特异性反向末端重复序列(ITR)。在一些方面，转座子特异性ITR被DNA转座子识别。在一些方面，转座子特异性ITR被反转录转座子识别。本领域已知的任何转座子系统可用于将核酸分子引入宿主细胞例如免疫细胞的基因组中。在一些方面，转座子选自hAT样Tol2、Sleeping Beauty(SB)、Frog Prince、piggyBac(PB)及其任何组合。在一些方面，转座子包括SleepingBeauty。在一些方面，转座子包括piggyBac。参见例如，Zhao等人,Transl.Lung CancerRes.5(1):120-25(2016)，其全部内容通过引用并入本文。

在一些方面，载体是转移载体。术语“转移载体”是指包含经分离的核酸(例如，本公开的多核苷酸)并且可用于将经分离的核酸递送至细胞内部的物质组合物。许多载体是本领域已知的，包括但不限于线性多核苷酸、与离子或两性化合物相关的多核苷酸、质粒和病毒。因此，术语“转移载体”包括自主复制的质粒或病毒。该术语还应当解释为还包括促进核酸转移到细胞中的非质粒和非病毒化合物，例如聚赖氨酸化合物、脂质体等。病毒转移载体的实例包括但不限于腺病毒载体、腺相关病毒载体、逆转录病毒载体、慢病毒载体等。

在一些方面，载体是表达载体。术语“表达载体”指包含重组多核苷酸(例如，本公开的多肽)的载体，所述重组多核苷酸包含与待表达的核苷酸序列可操作地连接的表达控制序列。表达载体包含足够的顺式作用元件用于表达；用于表达的其他元件可以由宿主细胞或在体外表达系统中提供。表达载体包括本领域已知的所有表达载体，包括掺入重组多核苷酸的粘粒、质粒(例如，裸露的或包含在脂质体中)和病毒(例如，慢病毒、逆转录病毒、腺病毒和腺相关病毒)。

在一些方面，载体是病毒载体、哺乳动物载体或细菌载体。在一些方面，载体选自由以下组成的组：腺病毒载体、慢病毒、仙台病毒载体、杆状病毒载体、爱泼斯坦巴尔病毒载体、乳多空病毒载体、痘苗病毒载体、单纯疱疹病毒载体、杂交载体或腺相关病毒(AAV)载体。

在一些方面，腺病毒载体是第三代腺病毒载体。ADEASY^TM是迄今为止创建腺病毒载体构建体的最流行方法。系统由两种类型的质粒组成：穿梭(或转移)载体和腺病毒载体。将感兴趣的转基因克隆到穿梭载体中，进行验证，并用限制酶PmeI进行线性化。然后将此构建体转化到ADEASIER-1细胞中，所述细胞是含有PADEASY^TM的BJ5183大肠杆菌细胞。PADEASY^TM是含有病毒生产所必需的腺病毒基因的约33Kb的腺病毒质粒。穿梭载体和腺病毒质粒具有匹配的左和右同源臂，这有助于转基因同源重组到腺病毒质粒中。还可以用超螺旋PADEASY^TM和穿梭载体共转化标准BJ5183，但这种方法会导致非重组腺病毒质粒的较高背景。然后验证重组腺病毒质粒的大小和适当的限制性消化模式，以确定转基因已插入腺病毒质粒中，并且未发生其他重组模式。一旦验证，就将重组质粒用PacI线性化，以产生由ITR侧接的线性dsDNA构建体。将293或911细胞用线性化构建体转染，并且约7-10天后可收获病毒。除了这方法外，在提交本申请时本领域中已知的用于产生腺病毒载体构建体的其它方法可用于实践本文公开的方法。

在一些方面，病毒载体是逆转录病毒载体，例如，慢病毒载体(例如，第三代或第四代慢病毒载体)。术语“慢病毒”是指逆转录病毒科的一个属。慢病毒在逆转录病毒中是独一无二的，它能够感染非分裂细胞；它们可以将大量的遗传信息递送到宿主细胞的DNA中，因此它们是基因递送载体最有效的方法之一。HIV、SIV和FIV都是慢病毒的实例。术语“慢病毒载体”是指衍生自慢病毒基因组的至少一部分的载体，尤其包括如Milone等人,Mol.Ther17(8):1453-1464(2009)中提供的自失活慢病毒载体。可用于临床的慢病毒载体的其他实例包括但不限于例如来自Oxford BioMedica的基因递送技术、来自Lentigen的LENTIMAX^TM载体系统等。非临床类型的慢病毒载体也是可用的并且是本领域技术人员已知的。

慢病毒载体通常在瞬时转染系统中产生，其中用三种单独的质粒表达系统转染细胞系。这些包括转移载体质粒(HIV原病毒的部分)、包装质粒或构建体以及具有不同病毒的异源包膜基因(env)的质粒。将载体的三种质粒组分放入包装细胞中，然后将所述包装细胞插入HIV外壳中。载体的病毒部分包含插入序列，因此病毒不能在细胞系统内复制。目前的第三代慢病毒载体仅编码九种HIV-1蛋白中的三种(Gag、Pol、Rev)，这些蛋白由单独的质粒表达，以避免重组介导的复制能力病毒的产生。在第四代慢病毒载体中，逆转录病毒基因组被进一步减少(参见例如，LENTI-X^TM第四代包装系统)。

在一些方面，非病毒方法可用于将本公开的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列和编码嵌合结合蛋白的核苷酸序列)递送到受试者的细胞或组织中。在一些方面，非病毒方法包括使用转座子。在一些方面，使用非病毒递送方法允许对细胞例如T或NK细胞进行重编程，并将细胞直接输注到受试者中。在一些方面，可以通过使用CRISPR/Cas系统和基因组编辑替代方案，例如锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)和大范围核酸酶(TALEN)，将本公开的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列和编码嵌合结合蛋白的核苷酸序列)插入靶细胞(例如，T细胞)或宿主细胞(例如，用于重组表达所编码蛋白质的细胞)的基因组中。

在一些方面，本文公开的载体(例如，慢病毒载体)包含多核苷酸，所述多核苷酸包含一个或多个核苷酸序列，这些序列编码(i)AP-1转录因子(例如，密码子优化的AP-1核苷酸序列)和(ii)抗原结合结构域(例如抗ROR1 scFv)。在一些方面，载体包含多核苷酸，所述多核苷酸包含一个或多个核苷酸序列，这些序列编码(i)AP-1转录因子(例如，密码子优化的AP-1核苷酸序列)，(ii)抗原结合结构域(例如抗ROR1scFv)，和(iii)EGFRt。在一些方面，载体包含多核苷酸，所述多核苷酸包含一个或多个核苷酸序列，这些序列编码(i)AP-1转录因子(例如密码子优化的AP-1核苷酸序列)，(ii)抗原结合结构域(例如、抗ROR1scFv)、(iii)跨膜结构域(例如CD28)，(iv)共刺激结构域(4-1BB)、(v)细胞内信号传导结构域(CD3ζ)和(vi)EGFRt。在某些方面，该一个或多个核苷酸序列还编码接头、间隔子、信号肽或其组合。例如，在一些方面，本文所述的载体包含多核苷酸，该多核苷酸包含(从5'至3')(i)编码AP-1转录因子(例如密码子优化的AP-1核苷酸序列)的第一核苷酸序列，(ii)编码第一接头(例如，P2A接头)的第二核苷酸序列，(iii)编码第一信号肽(例如，hIgκ)的第三核苷酸序列，(iv)编码抗原结合结构域(例如，抗ROR1 scFv)的第四核苷酸序列，(v)编码第二接头(例如，GGGSG；SEQ ID NO:40)的第五核苷酸序列，(vi)编码间隔子(例如，IgG2铰链衍生的间隔子)的第六核苷酸序列，(vii)编码跨膜结构域(例如，CD28)的第七核苷酸序列，(viii)编码共刺激结构域(例如，4-1BB)的第八核苷酸序列，(ix)编码细胞内信号传导结构域(例如，CD3ζ)的第九核苷酸序列，(x)编码第三接头(例如，P2A接头)的第十核苷酸序列，(xi)编码第二信号肽(例如，GM-CSF)的第十一核苷酸序列，和(xii)编码EGFRt的第十二核苷酸序列。

在一些方面，本文公开的多核苷酸(例如，包含密码子优化的AP-1核苷酸序列)是DNA(例如，DNA分子或其组合)、RNA(例如，RNA分子或其组合)或其任何组合。在一些方面，本文公开的多核苷酸包含核酸序列，所述核酸序列包含基因组或cDNA形式的单链或双链RNA或DNA(例如，ssDNA或dsDNA)，或DNA-RNA杂交体，其中每一个可包括化学或生物化学修饰、非天然或衍生的核苷酸碱基。如本文所述，此类核酸序列可包含可用于促进所编码的多肽的表达和/或纯化的另外的序列，包括但不限于多聚A序列、经修饰的Kozak序列和编码表位标签、输出信号和分泌信号、核定位信号和质膜定位信号的序列。对于本领域技术人员来说显而易见的是，基于本文的教导，哪些核苷酸序列将编码本文所述的不同多肽(例如，AP-1转录因子或嵌合结合蛋白)。

细胞

在一些方面，本文提供了已被修饰(例如，遗传修饰)以包含本文所述的任何多核苷酸、载体、组合物、多肽或多肽组的细胞(例如，免疫细胞，例如，T细胞)。因此，在一些方面，本文所述的修饰细胞过表达AP-1转录因子。如本公开其他地方所述，AP-1转录因子的过表达可以改善和/或增强细胞的一种或多种特性(例如，对耗竭的抗性、持久性/存活率、扩增/增殖、效应子功能(例如，抗原刺激时细胞因子的产生、表达靶抗原的细胞的裂解或两者)或其组合)。在一些方面，经修饰的细胞还表达由本文所述的另外的翻译序列编码的一种或多种蛋白质(例如，嵌合结合蛋白、接头、EGFRt、间隔子、信号肽或其组合)。

在一些方面，本文公开的修饰细胞已用本文所述的多核苷酸或载体转染。术语“转染”(或等同术语“转化”和“转导”)是指将外源核酸(例如本文所述的多核苷酸或载体)转移或引入宿主细胞的基因组(例如T细胞)中的过程。“转染”细胞是已经用外源核酸(例如本文所述的多核苷酸或载体)转染、转化或转导的细胞。细胞包括原代受试者细胞及其后代。

在一些方面，本文所述的细胞已用转录激活物修饰，这能够诱导和/或增加细胞中感兴趣的蛋白质(例如c-Jun)的内源性表达。如本文所用，术语“转录激活物”指增加基因或基因组转录的蛋白质(例如，通过结合核酸序列的增强子或启动子近端元件，从而诱导其转录)。可与本公开一起使用的此类转录激活物的非限制性实例包括：基于转录激活物样效应子(TALE)的转录激活物、基于锌指蛋白(ZFP)的转录激活物、基于成簇规则间隔短回文重复序列(CRISPR)/CRISPR相关蛋白(Cas)系统的转录激活物或其组合。参见例如，Kabadi等人,Methods69(2):188-197(2014年9月)，其全部内容通过引用并入本文。

在一些方面，本文所述的细胞已用基于CRISPR/Cas系统的转录激活物(例如CRISPR激活(CRISPRa))修饰。参见例如，Nissim等人,Molecular Cell 54:1-13(2014年5月)，其全部内容通过引用并入本文。CRISPRa是一种CRISPR工具，包括使用经修饰的Cas蛋白，该蛋白缺乏核酸内切酶活性，但保留与其引导RNA和靶DNA核酸序列结合的能力。可与本公开一起使用的此类经修饰的Cas蛋白的非限制性实例是本领域已知的。参见例如，Pandelakis等人,Cell Systems 10(1):1-14(2020年1月)，其全部内容通过引用并入本文。在一些方面，经修饰的Cas蛋白包含经修饰的Cas9蛋白(在本领域中也称为“dCas9”)。在一些方面，经修饰的Cas蛋白包含经修饰的Cas12a蛋白。在一些方面，可用于本公开的经修饰的Cas蛋白与引导多核苷酸(例如，小引导RNA)结合(“经修饰的Cas-引导复合物”)，其中引导多核苷酸包含与编码感兴趣的蛋白质(例如，c-Jun)的核酸序列区域互补的识别序列。在一些方面，一个或多个转录激活物附接到经修饰的Cas-引导复合物(例如，经修饰的Cas蛋白的N和/或C末端)，使得当经修饰的Cas-引导复合物被引入到细胞中时，该一个或多个转录激活物可以结合核酸序列的调控元件，从而诱导和/或增加所编码的蛋白质(例如c-Jun)的表达。在一些方面，一个或多个转录阻遏物(例如，Kruppel相关盒结构域(KRAB))可以附接到经修饰的Cas-引导复合物(例如，经修饰的Cas蛋白的N和/或C末端)，使得当引入细胞中时，该一个或多个转录阻遏物可以抑制或减少基因的转录，例如可以干扰c-Jun表达的基因(例如，Bach2)。参见例如，US20200030379A1和Yang等人,J Transl Med 19:459(2021)，每一篇均通过引用整体并入本文。在一些方面，可用于本公开的经修饰的Cas蛋白可以附接到一个或多个转录激活物和一个或多个转录阻遏物。

不受任何一种理论的束缚，在一些方面，使用此类经修饰的Cas蛋白可以允许感兴趣的基因的条件转录和表达。例如，在一些方面，细胞(例如，T细胞)被修饰成包含嵌合抗原受体(CAR)(例如，抗ROR1CAR)，该嵌合抗原受体与蛋白酶(例如，烟草蚀纹病毒(TEV))和靶向c-Jun启动子区域的单个引导RNA(sgRNA)连接。在一些方面，该细胞被修饰成还包含用于激活T细胞(LAT)的接头，其通过接头(例如，TEV可切割接头)与附接到转录激活物(例如，dCas9-VP64-p65-Rta转录激活物(VPR))的经修饰的Cas蛋白复合。CAR激活后，经修饰的Cas蛋白被释放用于核定位，并有条件地和可逆地诱导c-Jun的表达。Yang等人,J ImmunotherCancer 9(增刊2):A164(2021)，其全部内容通过引用并入本文。

如本领域技术人员显而易见的，在一些方面，本文所述的细胞已使用多种方法的组合进行修饰。例如，在一些方面，细胞已被修饰成包含本文所述的密码子优化的c-Jun核苷酸序列，例如单独的或与编码其他感兴趣蛋白(例如配体结合蛋白)的一个或多个核苷酸序列组合。在一些方面，这样的细胞进一步用能够增加内源性c-Jun蛋白的表达的外源性转录激活物(例如，CRISPRa)修饰。不受任何一种理论的束缚，在一些方面，这样的组合方法可以允许免疫细胞具有甚至更高水平的c-Jun蛋白表达(例如，由外源性核苷酸序列编码并由免疫细胞内源性表达)。

除非另有说明，否则可以使用本领域已知的任何合适的方法将该一个或多个外源性核苷酸序列和/或转录激活物引入细胞中。用于将一个或多个外源性核苷酸序列递送到细胞中的合适方法的非限制性实例包括：转染(也称为转化和转导)、电穿孔、非病毒递送、病毒转导、脂质纳米颗粒递送及其组合。

在一些方面，细胞是免疫细胞。在一些方面，免疫细胞分离自人受试者。在一些方面，免疫细胞是T细胞。在一些方面，T细胞是Th1细胞、Th2细胞、Th17细胞、Tc17细胞或其组合。在一些方面，免疫细胞是NK细胞。在一些方面，免疫细胞是肿瘤浸润淋巴细胞(TIL)。在一些方面，免疫细胞是调节性T细胞(Treg)。在一些方面，免疫细胞是自然杀伤T(NKT)细胞。在一些方面，免疫细胞是B细胞。

在一些方面，细胞是免疫效应细胞。如本文所用，术语“免疫效应细胞”是指参与免疫应答(例如促进免疫效应子应答)的细胞。“免疫效应子功能”或“免疫效应子应答”是指例如免疫效应细胞的增强或促进靶细胞的免疫攻击的功能或应答。例如，免疫效应子功能或应答是指促进杀伤靶细胞或抑制靶细胞生长或增殖的T或NK细胞的特性。就T细胞而言，初级刺激和共刺激是免疫效应子功能或应答的实例。

术语“效应子功能”是指细胞的特化功能。例如，T细胞的效应子功能可以是细胞溶解活性或辅助活性(包括细胞因子的分泌)。嵌合结合蛋白(例如CAR)的细胞内信号传导结构域可以产生促进含有嵌合结合蛋白的细胞(例如CAR T细胞)的免疫效应子功能的信号。例如，CAR T细胞中免疫效应子功能的实例包括细胞溶解活性或辅助活性(包括细胞因子的分泌)。在一些方面，细胞内信号结构域是嵌合结合蛋白(例如CAR)中转导效应子功能信号并指导细胞执行专门功能的部分。虽然可以使用整个细胞内信号传导结构域，但在许多情况下没有必要使用整个链。就使用细胞内信号传导结构域的截短部分而言，只要其转导效应子功能信号，就可使用这种截短部分代替完整链。因此，术语细胞内信号传导结构域意指包括足以转导效应子功能信号的细胞内信号传导结构域的任何截短部分。

在一些方面，免疫细胞从多能或多能祖细胞分化。因此，如本文所用，“免疫细胞”还包括可以产生成熟免疫细胞的多能或多能细胞。在一些方面，细胞(例如，免疫细胞)是诱导多能干细胞(IPSC)。在一些方面，细胞(例如，免疫细胞)是胚胎干细胞。在一些方面，细胞是造血干细胞。

在一些方面，T细胞是CD4⁺T细胞。在一些方面，T细胞是CD8⁺T细胞。在一些方面，T细胞是幼稚T(T_N)细胞。在一些方面，T细胞是CD95^-/CD45RA⁺/CD62L⁺/CCR7⁺。在一些方面，T细胞是CD95⁺/CD45RA⁺/CD62L⁺/CCR7⁺。在一些方面，T细胞是CD45RO⁺/CCR7⁺/CD62L⁺。在一些方面，T细胞是CD45RO⁺/CCR7^-/CD62L^-。

如从本公开显而易见的，在一些方面，AP-1表达增加的细胞(例如，免疫细胞)还表达嵌合结合蛋白。在一些方面，嵌合结合蛋白是嵌合抗原受体(CAR)。因此，在一些方面，本文所述的细胞(例如，免疫细胞)已被工程化成从单个多核苷酸(例如，本文所述的那些)表达AP-1转录因子和CAR。在一些方面，本文所述的细胞(例如，免疫细胞)已被工程化成表达来自第一多核苷酸的AP-1转录因子和来自第二多核苷酸的CAR。本领域已知的任何CAR都可以用于本公开的细胞，例如第5.5.1节中所述的那些。在某些方面，CAR特异性结合ROR1。在一些方面，CAR特异性地结合GPC2。在一些方面，CAR表达细胞是CAR T细胞，例如单CAR T细胞、基因组编辑的CAR T细胞、双CAR T细胞或串联CAR T细胞。这种CAR T细胞的实例在国际申请号PCT/US2019/044195(对应于US20210299223A1)中提供，该申请的全部内容通过引用并入本文。

在一些方面，嵌合结合蛋白包含TCR(例如，工程化的TCR)。在一些方面，本文所述的细胞(例如，免疫细胞)已被工程化成从单个多核苷酸(例如，本文所述的那些)表达AP-1转录因子和TCR。在一些方面，本文所述的细胞(例如，免疫细胞)已被工程化成表达来自第一多核苷酸的AP-1转录因子和来自第二多核苷酸的TCR。本领域已知的任何TCR可用于本公开的细胞中，例如第5.4.1节中所述的那些。

在一些方面，嵌合结合蛋白包含嵌合抗体T细胞受体(CaTCR)。在一些方面，本文所述的细胞(例如，免疫细胞)已被工程化成从单个多核苷酸(例如，本文所述的那些)表达AP-1转录因子和caTCR。在一些方面，本文所述的细胞(例如，免疫细胞)已被工程化成表达来自第一多核苷酸的AP-1转录因子和来自第二多核苷酸的caTCR。本领域已知的任何caTCR可用于本公开的细胞中，例如第5.4.1节中所述的那些。

在一些方面，嵌合结合蛋白包含嵌合信号传导受体(CSR)。在一些方面，本文所述的细胞(例如，免疫细胞)已被工程化成从单个多核苷酸(例如，本文所述的那些)表达AP-1转录因子和CSR。在一些方面，本文所述的细胞(例如，免疫细胞)已被工程化成表达来自第一多核苷酸的AP-1转录因子和来自第二多核苷酸的CSR。本领域已知的任何CSR可用于本公开的细胞中，例如第5.4.1节中所述的那些。

在一些方面，嵌合结合蛋白包含TCR模拟物。在一些方面，本文所述的细胞(例如，免疫细胞)已被工程化成从单个多核苷酸(例如，本文所述的那些)表达AP-1转录因子和TCR模拟物。在一些方面，本文所述的细胞(例如，免疫细胞)已被工程化成表达来自第一多核苷酸的AP-1转录因子和来自第二多核苷酸的TCR模拟物。本领域已知的任何TCR模拟物可用于本公开的细胞中，例如第5.4.1节中所述的那些。

在一些方面，本文所述的细胞(例如，表达AP-1转录因子和嵌合结合蛋白)可以被修饰成另外表达由本文所述的另外的翻译序列编码的一种或多种蛋白质(参见，例如，第5.4节)。

本公开的某些方面涉及通过用文中公开的多核苷酸(例如包含密码子优化的AP-1核苷酸序列和编码嵌合结合蛋白的核苷酸序列的多顺反子多核苷酸)转染细胞(例如免疫细胞)并在合适的条件下培养细胞来制备本文公开的嵌合结合蛋白的方法。

组合物

在一些方面，本公开还包含组合物，该组合物包含本文所述的任何多核苷酸、载体、细胞、多肽或多肽组。在某些方面，该组合物包含T细胞，该T细胞已被工程化成表达由本文所述的多核苷酸编码的蛋白质，例如嵌合结合蛋白(例如，CAR)和AP-1转录因子(例如，CAR T细胞，例如，抗ROR1 CAR T细胞)。在一些方面，该组合物是药物组合物。因此，本文公开的药物组合物包含(i)已被修饰成表达AP-1转录因子的细胞(例如，免疫细胞)，例如，其中AP-1转录因子的表达与未用包含密码子优化的AP-1核苷酸序列的多核苷酸转导的相应细胞中的表达相比增加，和(ii)药学上可接受的载体。在一些方面，本文提供了一种药物组合物，其包含(i)已被修饰成表达AP-1转录因子和嵌合结合蛋白(例如CAR)的细胞(例如，免疫细胞)，例如，其中AP-1转录因子的表达与未用包含密码子优化的AP-1核苷酸序列的多核苷酸转导的相应细胞中的表达相比增加，和(ii)药学上可接受的载体。如本文所述，此类药物组合物可用于预防和/或治疗疾病或病症(例如癌症)。在一些方面，本文公开的药物组合物中存在的细胞是T细胞或NK细胞。

如文中所用，术语“药物组合物”是指与一种或多种其它化学组分(诸如药学上可接受的载体和赋形剂)混合或掺混或悬浮于其中的本文所述的一种或多种化合物，诸如，例如，包含嵌合结合蛋白(例如CAR)和过表达AP-1转录因子的工程化T细胞。不受任何一种理论的束缚，在一些方面，药物组合物的目的是促进例如表达本公开的AP-1转录因子和嵌合结合蛋白(例如CAR)的细胞的制剂施用给受试者。

术语“赋形剂”和“载体”可互换使用并且是指添加至药物组合物中以进一步促进化合物例如本文所述的任何多核苷酸、载体、细胞、多肽或多肽组的施用的惰性物质。

术语“药学上可接受的载体”、“药学上可接受的赋形剂”及其语法变化形式涵盖美国联邦政府的监管机构批准的或美国药典中列出的用于包括人在内的动物的任何剂，以及不会导致产生以至于禁止向受试者施用所述组合物的程度的不希望的生理效应并且不会消除所施用的化合物的生物活性和性质的任何载体或稀释剂。包括可用于制备药物组合物并且通常是安全、无毒且合乎需要的赋形剂和载体。

可接受的载体、赋形剂或稳定剂在采用的剂量和浓度下对接受者是无毒的，并且包括：缓冲剂，诸如磷酸盐、柠檬酸盐和其他有机酸；抗氧化剂，包括抗坏血酸和蛋氨酸；防腐剂(诸如十八烷基二甲基苄基氯化铵；氯化六甲双铵；苯扎氯铵、苄索氯铵；苯酚、丁醇或苄醇；对羟基苯甲酸烷基酯，诸如对羟基苯甲酸甲酯或对羟基苯甲酸丙酯；儿茶酚；间苯二酚；环己醇；3-戊醇；和间甲酚)；低分子量(小于约10个残基)的多肽；蛋白质，诸如血清白蛋白、明胶或免疫球蛋白；亲水性聚合物，诸如聚乙烯吡咯烷酮；氨基酸，诸如甘氨酸、谷氨酰胺、天冬酰胺、组氨酸、精氨酸或赖氨酸；单糖、二糖和其他碳水化合物，包括葡萄糖、甘露糖或糊精；螯合剂，诸如EDTA；糖类，诸如蔗糖、甘露糖醇、海藻糖或山梨糖醇；成盐抗衡离子，诸如钠离子；金属络合物(例如，Zn-蛋白质络合物)；和/或非离子型表面活性剂，诸如或聚乙二醇(PEG)。

药物组合物可以被配制用于向受试者的任何施用途径。施用途径的具体实例包括肌内、皮下、眼部、静脉内、腹膜内、皮内、眶内、脑内、颅内、脊柱内、心室内、鞘内、脑池内、囊内或瘤内。本文还预期了以皮下、肌内或静脉内注射为特征的肠胃外施用。可以制备呈常规形式的注射剂，作为液体溶液或混悬液、适合用于在注射前在液体中溶解或悬浮的固体形式或作为乳剂。注射剂、溶液和乳剂还含有一种或多种赋形剂。合适的赋形剂是例如水、盐水、右旋糖或甘油。另外，如果需要，要施用的药物组合物还可以含有少量的无毒辅助物质、pH缓冲剂、稳定剂和其他这样的剂，例如乙酸钠、脱水山梨糖醇单月桂酸酯、三乙醇胺油酸酯和环糊精。

如果静脉内施用，则合适的载体包括生理盐水或磷酸盐缓冲盐水(PBS)以及含有增稠剂和增溶剂(诸如葡萄糖、聚乙二醇和聚丙二醇及其混合物)的溶液。

用于体内施用的组合物(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化T细胞)可以是无菌的。这可通过例如无菌过滤膜过滤来实现。

试剂盒

本文还公开了包含本文所述的任何多核苷酸、载体、组合物、细胞(例如过表达AP-1转录因子的CAR T细胞)、多肽或多肽组的试剂盒。在一些方面，试剂盒用于针对疾病或病症(例如癌症)的免疫疗法和/或治疗或减少疾病或病症(例如癌症)的风险。在某些方面，试剂盒包括一个或多个容器，这些容器包含本文所述的任何多核苷酸、载体、组合物、多肽或多肽组。

在一些方面，试剂盒包含根据本文所述的任何方法使用的说明书。例如，所包含的说明书可以包括施用本文所述的药物组合物以治疗、延迟发作或缓解目标疾病的描述。在一些方面，说明书包括向处于目标疾病/病症(例如癌症)风险的受试者施用本文所述的组合物的描述。

在一些方面，说明书包括剂量信息、给药时间表和施用途径。在一些方面，容器是单位剂量、散装包装(例如多剂量包装)或亚单位剂量。在一些方面，说明书是标签或包装插页(例如，试剂盒中包含的纸片)上的书面说明书。在一些方面，说明书是机器可读说明书(例如，在磁性或光学存储盘上携带的说明书)。

在一些方面，标签或包装插页表明本文公开的组合物用于治疗、延迟发作和/或缓解与癌症相关的疾病或病症，例如本文所述的那些。可以提供用于实践本文所述的任何方法的说明书。

在一些方面，本文所述的试剂盒采用合适的包装。在一些方面，合适的包装包括小瓶、瓶子、罐子、软包装(例如密封Mylar或塑料袋)或其组合。在一些方面，包装包括与特定装置例如吸入器、鼻施用装置(例如雾化器)或输注装置例如微型泵组合使用的包装。在一些方面，试剂盒包括无菌进入端口(例如，容器可以是具有通过皮下注射针可刺穿的塞子的静脉内溶液袋或小瓶)。在一些方面，容器还可以具有无菌进入端口(例如，容器可以是具有通过皮下注射针可刺穿的塞子的静脉内溶液袋或小瓶)。在一些方面，至少一种活性剂是本文所述的组合物(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化T细胞)。

在一些方面，试剂盒还包含另外的组分，例如缓冲剂和解释信息。在一些方面，试剂盒包括容器和在所述容器上或与所述容器相关联的标签或包装插页。在一些方面，本公开提供了包含本文所述的试剂盒的内容物的制品。

治疗用途

本公开的某些方面涉及施用本文所述的任何多核苷酸、载体、组合物、细胞多肽或多肽组(例如，AP-1转录因子和嵌合结合蛋白)的方法。本公开的某些方面涉及治疗有需要的受试者中的疾病或病症的方法，其包括向所述受试者施用本文所述的任何多核苷酸、载体、组合物、细胞多肽或多肽组(例如，AP-1转录因子和嵌合结合蛋白)。例如，在某些方面，本文公开了治疗有需要的受试者中的疾病或病症的方法，该方法包括向受试者施用已被工程化成表达嵌合结合蛋白(例如，CAR)并过表达AP-1转录因子的细胞。在一些方面，疾病或疾患包括肿瘤，即癌症。在一些方面，该方法包括在受试者中刺激对靶细胞群体或组织的T细胞介导的免疫应答，包括施用有效量的本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)。在一些方面，靶细胞群体包含肿瘤。在一些方面，肿瘤是实体瘤。

在一些方面，与参考肿瘤体积相比，施用本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)减少受试者中的肿瘤体积。在一些方面，参考肿瘤体积是在施用之前受试者中的肿瘤体积。在另外的方面，参考肿瘤体积是未接受施用的相应受试者的肿瘤体积。在一些方面，与参考肿瘤体积相比，施用后受试者的肿瘤体积减少了至少约5％、至少约10％、至少约15％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％或至少约100％。

在一些方面，治疗肿瘤包括减少受试者的肿瘤重量。在某些方面，施用本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)可以在施用给受试者时降低受试者中的肿瘤重量。在一些方面，与参考肿瘤重量相比，施用后肿瘤重量降低了至少约5％、至少约10％、至少约15％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％或至少约100％。在一些方面，参考肿瘤重量是在施用之前受试者中的肿瘤重量。在另外的方面，参考肿瘤重量是未接受施用的相应受试者的肿瘤重量。

在一些方面，向例如患有肿瘤的受试者施用本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)可以增加受试者的肿瘤和/或肿瘤微环境(TME)中TIL(例如CD4⁺或CD8⁺)的数量和/或百分比。在某些方面，与参考(例如，在未接受施用的受试者中或在施用之前的同一受试者中的相应值)相比，肿瘤和/或TME中TIL的数量和/或百分比增加了至少约5％、至少约10％、至少约15％、至少约20％、至少约25％、至少约30％、至少约35％、至少约40％、至少约45％、至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约100％、至少约110％、至少约120％、至少约130％、至少约140％、至少约150％、至少约160％、至少约170％、至少约180％、至少约190％、至少约200％、至少约210％、至少220％、至少约230％、至少约240％、至少约250％、至少约260％、至少约270％、至少约280％、至少约290％，或至少约300％或更多。

在一些方面，相对于未接受施用的相应受试者(例如，用相应细胞处理但缺乏AP-1转录因子表达)的免疫应答持续时间，向例如患有肿瘤的受试者施用本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)可以增加受试者的免疫应答持续时间。在某些方面，与参考(例如未接受施用的相应受试者)相比，免疫应答的持续时间增加了至少约5％、至少约10％、至少约20％、至少约30％、至少约40％、至少约50％、至少约75％、至少约100％、至少约150％、至少约200％、至少约300％、与至少约400％、至少约500％或至少约1000％或更多。在某些方面，与参考(例如未接受施用的相应受试者)相比，免疫应答的持续时间增加了至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍，或至少约10倍或更多。

如本文所述，本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)可用于治疗多种癌症。可以治疗的癌症的非限制性实例包括肾上腺皮质癌、晚期癌、肛门癌、再生障碍性贫血、胆管癌、膀胱癌、骨癌、骨转移癌、脑肿瘤、脑癌、乳腺癌、童年期癌症、未知原发性来源的癌症、Castleman病、宫颈癌、结肠/直肠癌、子宫内膜癌、食管癌、尤因家族肿瘤、眼癌、胆囊癌、胃肠道类癌瘤、胃肠道间质肿瘤、妊娠滋养细胞疾病、霍奇金病、卡波西肉瘤、肾细胞癌、喉和下咽癌、急性淋巴细胞白血病、急性髓样白血病、慢性淋巴细胞白血病、慢性髓样白血病、慢性粒单核细胞白血病、肝癌、非小细胞肺癌、小细胞肺癌、肺类癌瘤、皮肤淋巴瘤、恶性间皮瘤、多发性骨髓瘤、骨髓增生异常综合征、鼻腔和鼻旁窦癌、鼻咽癌、成神经细胞瘤、非霍奇金淋巴瘤、口腔和口咽癌、骨肉瘤、卵巢癌、胰腺癌、阴茎癌、垂体瘤、前列腺癌、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌、成人软组织肉瘤、基底细胞和鳞状细胞皮肤癌、黑素瘤、小肠癌、胃癌、睾丸癌、喉癌、胸腺癌、甲状腺癌、子宫肉瘤、阴道癌、外阴癌、华氏巨球蛋白血症(Waldenstrommacroglobulinemia)、维尔姆斯瘤、由癌症治疗引起的继发性癌症及其组合。在一些方面，癌症与实体瘤有关。

在一些方面，本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)与其他治疗剂(例如，抗癌剂和/或免疫调节剂)组合使用。因此，在某些方面，治疗本文公开的疾病或病症(例如，肿瘤)的方法包括施用本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白和过表达AP-1转录因子的工程化细胞)与一种或多种另外的治疗剂组合。此类剂可以包括例如化学治疗药物、靶向抗癌疗法、溶瘤药物、细胞毒性剂、基于免疫的疗法、细胞因子、手术、放疗、共刺激分子的激活物、免疫检查点抑制剂、疫苗、细胞免疫疗法或其任何组合。

在一些方面，本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)在施用另外的治疗剂之前或之后施用给受试者。在其他方面，本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)与另外的治疗剂同时施用给受试者。在某些方面，本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)和另外的治疗剂可以作为在药学上可接受的载体中的单一组合物同时施用。在其他方面，本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)和另外的治疗剂作为单独的组合物同时施用。

在一些方面，本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)与标准护理治疗(例如手术、放疗和化疗)组合使用。本文所述的方法还可用作维持疗法，例如，旨在预防肿瘤发生或复发的疗法。

在一些方面，本文所述的任何多核苷酸、载体、组合物、细胞、多肽或多肽组(例如，包含嵌合结合蛋白并过表达AP-1转录因子的工程化细胞)与一种或多种抗癌剂组合使用，从而可以靶向免疫途径的多个元件。此类组合的非限制性实例包括：增强肿瘤抗原呈递的疗法(例如，树突细胞疫苗、分泌GM-CSF的细胞疫苗、CpG寡核苷酸、咪喹莫德)；抑制负免疫调节的疗法，例如通过抑制CTLA-4和/或PD1/PD-L1/PD-L2途径和/或耗尽或阻断Treg或其他免疫抑制细胞(例如骨髓来源的抑制细胞)；刺激正免疫调节的疗法，例如用刺激CD-137、OX-40和/或CD40或GITR途径和/或刺激T细胞效应子功能的激动剂；系统增加抗肿瘤T细胞频率的疗法；耗尽或抑制Treg(诸如肿瘤中的Treg)的疗法，例如使用CD25的拮抗剂(例如达克珠单抗(daclizumab))或通过离体抗CD25珠耗尽；影响肿瘤中的抑制性骨髓细胞功能的疗法；增强肿瘤细胞免疫原性的疗法(例如蒽环类药物)；过继T细胞或NK细胞转移，包括基因工程化的细胞，例如经工程化以表达嵌合抗原受体的细胞(CAR-T疗法)；抑制代谢酶诸如吲哚胺二氧化酶(IDO)、二氧化酶、精氨酸酶或一氧化氮合成酶的疗法；逆转/预防T细胞无反应性或耗竭的疗法；引发肿瘤部位的先天免疫活化和/或炎症的疗法；施用免疫刺激细胞因子；阻断免疫抑制性细胞因子；或其任何组合。

在一些方面，抗癌剂包括免疫检查点抑制剂(即，阻断通过特定免疫检查点途径的信号传导)。可用于本方法的免疫检查点抑制剂的非限制性示例包括CTLA-4拮抗剂(例如，抗CTLA-4抗体)、PD-1拮抗剂(例如，抗PD-1抗体、抗PD-L1抗体)、TIM-3拮抗剂(例如，抗TIM-3抗体)或其组合。此类免疫检查点抑制剂的非限制性示例包括以下：抗PD1抗体(例如，纳武单抗派姆单抗(/>MK-3475)、匹地利珠单抗(CT-011)、PDR001、MEDI0680(AMP-514)、TSR-042、REGN2810、JS001、AMP-224(GSK-2661380)、PF-06801591、BGB-A317、BI 754091、SHR-1210、及其组合)；抗PD-L1抗体(例如，阿替利珠单抗(RG7446；MPDL3280A；RO5541267)、度伐利尤单抗(durvalumab)(MEDI4736、)、BMS-936559、阿维鲁单抗(avelumab)/>LY3300054、CX-072(Proclaim-CX-072)、FAZ053、KN035、MDX-1105、及其组合)；和抗CTLA-4抗体(例如，伊匹单抗/>曲美木单抗(tremelimumab)(替西木单抗(ticilimumab)；CP-675,206)、AGEN-1884、ATOR-1015、及其组合)。

在一些方面，抗癌剂包括免疫检查点活化剂(即，促进通过特定免疫检查点途径的信号传导)。在某些方面，免疫检查点活化剂包括OX40激动剂(例如，抗OX40抗体)、LAG-3激动剂(例如抗LAG-3抗体)、4-1BB(CD137)激动剂(例如，抗CD137抗体)、GITR激动剂(例如，抗GITR抗体)、TIM3激动剂(例如，抗TIM3抗体)或其组合。

除非另外指示，否则本公开的实践将采用在本领域技术人员的技术之内的细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的常规技术。文献中详尽地说明了此类技术。参见例如，Sambrook等人,编辑(1989)Molecular CloningALaboratory Manual(第2版；Cold Spring Harbor Laboratory Press)；Sambrook等人,编辑(1992)Molecular Cloning:A Laboratory Manual,(Cold Springs HarborLaboratory,NY)；D.N.Glover编辑,(1985)DNA Cloning,第I和II卷；Gait,编辑(1984)Oligonucleotide Synthesis；Mullis等人美国专利第4,683,195号；Hames和Higgins，编辑(1984)Nucleic Acid Hybridization；Hames和Higgins，编辑(1984)Transcription AndTranslation；Freshney(1987)Culture Of Animal Cells(Alan R.Liss,Inc.)；Immobilized Cells And Enzymes(IRL Press)(1986)；Perbal(1984)A Practical GuideTo Molecular Cloning；the treatise,Methods In Enzymology(Academic Press,Inc.,N.Y.)；Miller和Calos编辑(1987)Gene Transfer Vectors For Mammalian Cells,(ColdSpring Harbor Laboratory)；Wu等人，编辑，Methods In Enzymology，第154卷和第155卷；Mayer和Walker，编辑(1987)Immunochemical Methods In Cell And Molecular Biology(Academic Press,London)；Weir和Blackwell，编辑，(1986)Handbook Of ExperimentalImmunology，第I-IV卷；Manipulating the Mouse Embryo,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.,(1986)；)；Crooks,Antisense drugTechnology:Principles,strategies and applications，第2版CRC Press(2007)以及在Ausubel等人(1989)Current Protocols in Molecular Biology(John Wiley和Sons,Baltimore,Md.)。

以上引用的所有参考文献以及本文引用的所有参考文献和氨基酸或核苷酸序列(例如GenBank编号和/或Uniprot编号)均通过引用以其整体并入本文。

通过说明而不是通过限制的方式提供以下实例。

实施例

实施例1-具有密码子优化的c-Jun序列的构建体的产生

为了增加转基因表达，使用不同的优化方法产生包含密码子优化的c-Jun序列的R12-EGFRt构建体(即，包含抗ROR1 scFv+截短的EGFR)。密码子优化的c-Jun序列提供于SEQID No:1-10中。作为对照，使用缺乏c-Jun序列的双顺反子R12-EGFRt构建体(图1中的构建体#1)。作为另外的对照，还使用包含截短的CD19(CD19t)而不是c-Jun的三顺反子R12-EGFRt构建体(图1中的构建体#2)。在SEQ ID NO:1中，定制密码子优化以模拟人细胞中的密码子使用偏好(图1中的构建体#3)，并且在SEQ ID NO:2中，定制密码子优化使用以模拟人T细胞中的密码子使用偏好(图1中的构建体#4)。

为了评估密码子优化的c-Jun是否可以改善c-Jun在抗ROR1构建体中的表达，图1所示的一组抗ROR1构建体用于以不同感染复数(MOI 2、5、10和20)转导T细胞。然后，使用流式细胞术测定不同构建体的c-Jun和R12 CAR和EGFRt的表达水平。

如图2A所示，与对照抗ROR1构建体(即，R12-EGFRt和CD19t-R12-EGFRt)相比，分别含有SEQ ID NO:1和10中提供的c-Jun密码子优化序列的抗ROR1构建体3和12证明了最高百分比的EGFRt⁺c-Jun⁺细胞。正如预期的，用缺乏c-Jun的抗ROR1构建体(即，R12-EGFRt和CD19t-R12-EGFRt)转导的细胞具有可忽略百分比的表达EGFRt和c-Jun的细胞。当分析转导细胞的EGFRt和抗ROR1 scFv(R12)表达时，与包含含有SEQ ID NO:9的密码子优化的c-Jun序列的构建体11的抗ROR1构建体(图2B)和对照CD19t-R12-EGFRt构建体相比，当用构建体3和12密码子优化的c-Jun抗ROR1构建体转导细胞时，EGFRt+R12+细胞的百分比要高得多。

在单细胞水平上，与包含SEQ ID NO:9的构建体11密码子优化的c-Jun序列的抗ROR1构建体(图2C)相比，用构建体3和构建体12密码子优化的c-Jun抗ROR1构建体转导的细胞中的c-Jun表达也显著更高。此外，与包含SEQ ID NO:9的构建体11密码子优化的c-Jun序列的抗ROR1构建体(图2D)和对照CD19t-R12-EGFRt构建体相比，在用构建体3和构建体12密码子优化的c-Jun抗ROR1构建体转导的细胞中抗ROR1 CAR表达在单细胞水平上也较高。

这些结果表明，构建体3和12抗ROR1-EGFRt构建体中包含SEQ ID NO:1和10的密码子优化的c-Jun序列可以显著增加靶细胞中的c-Jun转基因表达。总体转导效率与R12-EGFRt构建体(即，缺乏c-Jun)相似，并且密码子优化的c-Jun抗ROR1 CAR构建体与高载体拷贝数不相关(数据未显示)。

在另一个实验中，使用上述另外的密码子优化的c-Jun序列来以各种感染复数转导T细胞，并使用流式细胞术测定不同构建体的转基因的表达水平。对于每种构建体，选择通过抗ROR1 CAR和EGFRt的共表达测量的提供相似转导水平的MOI来比较T细胞的转基因表达。

进行了第一个实验(第1层；图3A)。在本实验中，构建体3表现出最高的c-Jun表达，同时保持抗ROR1 CAR和EGFRt转基因的良好表达，与构建体5和CD19t对照相比，转导效率仅略有下降，构建体5也表现出略低但仍然良好的c-Jun表达。选择构建体3，然后与第2层实验中的另外的密码子优化的c-Jun构建体进行比较，如图3B所示。在第2层比较中，构建体3和8显示出高c-Jun表达，同时保持抗ROR1 CAR和EGFRt转基因的良好表达，其中构建体3具有最高的c-Jun表达。构建体7也显示出良好的c-Jun表达，但显示出较低的转导效率以及ROR1CAR和EGFRt表达。

总之，生成了大量密码子优化的c-Jun序列并筛选了它们对转导效率和c-Jun、R12和EGFRt转基因表达的影响。这些实验表明，构建体3、8和12(分别具有SEQ ID NO:1、6和10中所述的密码子优化的c-Jun序列)具有高c-Jun表达，对转导效率和转基因(R12和EGFRt)表达具有可接受的影响。构建体7还具有良好的c-Jun和R12表达，并且转导效率和EGFRt表达适度降低。这些候选密码子优化的c-Jun序列尤其可用于减少用于过继细胞免疫治疗的工程化免疫细胞的耗竭。

序列表

<110> 莱尔免疫制药公司

<120> 编码AP-1转录因子的密码子优化的核苷酸序列

<130> 4385.068PC03/C-K/DKC

<150> US 63/153,879

<151> 2021-02-25

<150> US 63/263,231

<151> 2021-10-28

<150> US 63/309,380

<151> 2022-02-11

<160> 74

<170> PatentIn version 3.5

<210> 1

<211> 993

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 密码子优化的c-Jun核苷酸序列#1

<400> 1

atgacagcca agatggaaac cacattctac gacgacgccc tgaacgcctc attcctgcct 60

tctgagagcg gaccttacgg ctacagcaat cctaagatcc tgaaacagag catgaccctt 120

aacctggctg atcctgttgg aagcctgaaa cctcacctga gagccaaaaa cagcgacctg 180

ctcaccagcc ctgatgtggg cctgctgaag ctggcctctc cagagctgga acggctgatc 240

atccagagca gcaacggcca catcacaacc acccctaccc ctacacaatt cctgtgccct 300

aagaacgtga ccgacgagca ggagggcttc gccgaaggct ttgtgcgggc cctggcagaa 360

ctgcactctc agaacaccct gcctagcgtg acctccgccg cccagcctgt caacggcgcc 420

ggaatggtgg cccctgccgt ggcttctgtg gccggcggca gcggcagcgg cggattcagc 480

gcctctctgc actctgagcc tcctgtctac gccaatctgt ctaatttcaa ccccggagcc 540

ctgtccagcg gcggcggagc tcctagctac ggcgctgctg gactggcctt ccccgcccag 600

ccccagcaac agcagcagcc tccacaccac ctgccccagc agatgcccgt gcagcaccct 660

agactgcagg ccctgaagga agaaccccaa acagtgcctg agatgcctgg cgagacacct 720

ccactgagcc ccatcgacat ggaaagccag gagcggatca aggccgagag aaagagaatg 780

cggaacagaa tcgccgctag caagtgcaga aagcggaagc tggaaagaat cgccagactg 840

gaagagaagg tgaagaccct gaaagcccaa aatagcgagc tggccagcac cgccaacatg 900

ctgcgggaac aggtggccca gctgaagcag aaggtgatga accacgtgaa ctctggttgt 960

cagctgatgc tgacccagca gctccagacc ttc 993

<210> 2

<211> 993

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 密码子优化的c-Jun核苷酸序列#2

<400> 2

atgacagcca agatggaaac caccttctac gacgacgccc tcaacgcctc cttcctgcct 60

tctgagagcg gtccttacgg ctacagcaac cccaagatcc tgaagcaaag catgaccctg 120

aacctggccg accccgttgg ctccctgaaa cctcacctga gagccaaaaa cagcgacctg 180

ctgaccagcc ctgatgtggg cctgctgaag ctggcctctc cagagctgga aagactgatt 240

atccagagca gcaacggcca catcaccaca acacctaccc ctacacagtt cctgtgccct 300

aagaacgtga ctgatgagca ggagggcttt gccgagggct tcgtgagagc cctggctgag 360

ctgcattctc agaacaccct gcctagcgtg acctctgccg cccagcctgt taatggcgcc 420

ggcatggtgg cccctgccgt ggcctctgtg gccggaggca gcggcagcgg cggattcagc 480

gcctctctgc acagcgagcc ccccgtctac gccaacctga gcaatttcaa ccctggcgcc 540

ctgtccagcg gcggcggcgc cccttcatat ggcgctgccg gcctggcctt ccccgctcag 600

ccccagcagc agcaacagcc tccacaccac ctgccccagc agatgcccgt gcagcacccc 660

agactgcagg ccctgaagga agaacctcag accgtgcccg agatgcctgg cgagacccct 720

cctctgagcc ctatcgacat ggaaagccag gagagaatca aggccgagag gaagcggatg 780

cggaacagaa tcgccgccag caagtgcaga aaaagaaagc tggaacggat cgccagactg 840

gaggagaagg tgaagacact gaaagcccaa aattctgaac tggcctctac cgccaatatg 900

ctgcgcgagc aggtggctca actgaagcag aaggtgatga accacgtgaa cagcggatgt 960

cagctgatgc tgacacagca gctgcagact ttt 993

<210> 3

<211> 993

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 密码子优化的c-Jun核苷酸序列#3

<400> 3

atgaccgcca agatggaaac caccttctac gacgacgccc tgaacgccag ctttctgcct 60

tctgagtctg gcccctacgg ctacagcaac cccaagatcc tgaagcagag catgaccctg 120

aacctggccg atcctgtggg cagcctgaaa cctcacctga gagccaagaa cagcgacctg 180

ctgacaagcc ctgatgtggg cctgctgaaa ctggcctctc ctgagctgga acggctgatc 240

atccagagca gcaacggcca catcaccacc acacctacac caacacagtt tctgtgcccc 300

aagaacgtga ccgacgagca agagggattc gccgagggct ttgttagagc cctggccgaa 360

ctgcacagcc agaataccct gcctagcgtg acatctgccg ctcagcctgt taatggcgcc 420

ggaatggttg ctcctgccgt ggcttctgtt gctggcggat ctggatctgg cggctttagc 480

gcctctctgc actctgagcc tccagtgtac gccaacctga gcaacttcaa ccctggcgct 540

cttagctctg gtggcggagc accttcttat ggcgctgccg gattggcctt tcctgctcag 600

cctcagcagc agcaacagcc tcctcatcat ctgccccagc agatgcctgt gcagcaccct 660

agactgcagg ccctgaaaga ggaaccccag acagtccctg agatgcccgg cgaaacacct 720

cctctgagcc ccatcgacat ggaaagccaa gagcggatca aggccgagcg gaagcggatg 780

agaaatagaa tcgccgcctc caagtgccgg aagaggaagc tggaaagaat cgcccggctg 840

gaagagaaag tgaaaaccct gaaggcccag aactccgagc tggcctctac cgccaacatg 900

ctgagagaac aggtggccca gctgaaacag aaagtcatga accacgtgaa cagcggctgc 960

cagctgatgc tgacacagca gctgcagacc ttc 993

<210> 4

<211> 993

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 密码子优化的c-Jun核苷酸序列#4

<400> 4

atgactgcca aaatggagac tacattctat gacgacgccc tcaatgccag ttttttgccg 60

agtgaatccg gcccctacgg ctattcaaac cctaagatcc tcaagcaatc aatgaccctc 120

aatcttgctg acccagttgg ctccctgaaa ccccatctca gagctaaaaa tagtgacctc 180

cttacttccc ctgatgttgg actcctcaaa cttgcttctc ccgaactcga acgcttgatc 240

attcaatctt ccaacggcca catcacaaca acacccacac ccacccagtt tctttgccca 300

aaaaatgtca ccgatgaaca ggaaggtttc gcggaaggat tcgtccgcgc gctggccgaa 360

ctgcactccc agaatacact tccttcagtt acgtcagccg cccagccagt gaatggtgcg 420

ggaatggttg ctcctgcggt cgcttctgtc gcagggggct ccggttctgg cggatttagc 480

gcctctctgc attccgagcc acctgtatat gctaatcttt ctaattttaa ccccggagcc 540

ttgtctagcg gcggtggtgc ccccagctac ggtgctgcag gactcgcctt cccagctcaa 600

cctcagcagc agcaacaacc cccccatcac cttccccaac agatgccagt acaacatcca 660

aggctccagg ccctcaaaga ggaaccacag acggtgcccg aaatgcctgg cgaaactcca 720

ccactttccc ctattgatat ggaatcccaa gagcgcatca aggccgaaag aaagcgaatg 780

cggaatagaa tagcagcttc aaaatgtaga aaacggaaat tggaacgaat cgcacggttg 840

gaagaaaagg tgaagacctt gaaagcccag aacagtgagc tcgcctctac cgctaacatg 900

ctgcgcgagc aagtcgcaca acttaagcag aaggtgatga accatgtgaa tagcggatgt 960

caacttatgc tgactcaaca gttgcaaacc ttt 993

<210> 5

<211> 993

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 密码子优化的c-Jun核苷酸序列#5

<400> 5

atgaccgcga aaatggagac aacattttac gatgatgcac tgaacgcctc ttttctgcca 60

agtgaatccg gcccctacgg atactcaaac cctaagattc tgaaacagtc tatgactctc 120

aacctggccg acccagttgg cagtctgaag cctcatttgc gagccaagaa tagtgatctg 180

ctgacctccc cagacgtggg actgctgaaa ctcgcctcac ctgaacttga gcgcttgatt 240

atacagtcat ccaatgggca catcacaaca acacctactc ctacccagtt tctgtgcccc 300

aaaaacgtca ccgatgagca ggagggattc gcggaaggct ttgtgcgcgc cctggctgaa 360

ttgcatagtc agaacactct tcccagcgta accagcgccg cccaaccagt gaatggagcc 420

ggtatggtgg ctcccgcggt ggctagtgtt gcgggggggt caggctctgg tgggttcagt 480

gcttctcttc actctgaacc ccctgtgtat gccaatctgt ctaactttaa ccctggggcc 540

ctctcctctg gtgggggtgc ccccagctac ggagcggccg gcctggcctt tcctgcccag 600

cctcagcagc agcagcaacc ccctcatcat cttccgcagc agatgccagt acagcatcca 660

cgcctgcagg ctcttaagga ggagccccag acggtgcccg aaatgcccgg ggaaactcca 720

cccttgtccc ccattgacat ggagtcccag gagcggatca aggctgaaag aaagaggatg 780

cggaatcgca tcgcagcctc taaatgccgc aagcggaaac ttgagaggat cgcgcggttg 840

gaggaaaaag taaaaacctt gaaggcacag aactctgagc tggcgagtac tgccaacatg 900

ctcagagaac aagtcgcaca gctgaagcag aaagtgatga accatgtgaa cagcggttgt 960

cagctgatgc tgactcagca gctgcagacc ttc 993

<210> 6

<211> 993

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 密码子优化的c-Jun核苷酸序列#6

<400> 6

atgaccgcca agatggagac cacattctac gatgacgctc tgaacgcttc ctttctgcct 60

tccgagtccg gcccctacgg ctactccaat cccaagattc tgaagcagag catgacactg 120

aatctggctg atcccgtggg atctctgaag cctcatctga gagccaagaa ttccgatctg 180

ctgacaagcc ccgacgtggg actgctcaaa ctggccagcc ccgaactgga gaggctcatt 240

atccagagct ccaacggcca catcaccaca acacctaccc ctacccagtt tctctgtccc 300

aagaacgtga cagacgagca agagggattt gccgaaggct tcgtgagagc cctcgccgaa 360

ctgcatagcc agaacacact gccttccgtg accagcgctg ctcaacccgt gaacggcgct 420

ggcatggtcg ctcccgccgt cgccagcgtg gctggaggaa gcggatccgg aggcttcagc 480

gcttccctcc acagcgaacc tcccgtgtac gctaatctga gcaacttcaa ccccggcgct 540

ctgagcagcg gaggaggagc tcctagctat ggagctgccg gactggcttt tcccgcccag 600

ccccagcagc agcagcagcc cccccatcat ctgcctcagc agatgcccgt gcagcatccc 660

agactccaag ctctgaagga ggagcctcag accgtccccg agatgcccgg cgaaaccccc 720

cctctgtccc ccatcgacat ggaaagccaa gagaggatca aggccgagag gaagaggatg 780

aggaatagaa tcgccgccag caagtgtaga aagaggaagc tggagaggat cgccagactg 840

gaggagaagg tgaagaccct caaggctcag aattccgagc tggccagcac agccaacatg 900

ctgagagagc aagtggccca gctcaagcag aaggtgatga accacgtcaa cagcggatgc 960

cagctgatgc tcacccagca gctgcagacc ttc 993

<210> 7

<211> 993

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 密码子优化的c-Jun核苷酸序列#7

<400> 7

atgaccgcta aaatggaaac cactttctat gacgatgccc tgaacgcctc cttccttccg 60

tccgagtccg gaccctacgg atactcaaat cctaagatcc tcaaacagtc gatgaccctc 120

aacctggccg accccgtggg atccctgaag ccgcacttgc gcgccaagaa ctccgacctc 180

ctgacgagcc cagacgtggg cctgctgaag ctcgcatcac ccgaacttga gcggttgatc 240

attcagtcct ccaacggaca tatcaccacc actcccaccc caactcagtt tctgtgtccg 300

aagaacgtga ccgatgagca agagggattc gccgagggat tcgtgcgggc cctggccgag 360

ctgcatagcc agaacaccct tccatccgtg acctcggcgg ctcagcctgt gaacggcgcg 420

ggaatggtcg cgcccgccgt ggcctcggtg gccgggggca gcggcagcgg gggattttcc 480

gcgtcgctgc actccgagcc gccggtgtac gccaacctgt caaacttcaa ccctggggcc 540

ctgagctccg gcggtggagc accttcgtac ggcgccgctg gcctggcgtt ccccgcgcaa 600

ccacagcagc aacagcagcc ccctcaccac ctcccccaac aaatgcctgt gcagcacccg 660

aggctgcagg ccctcaagga agaaccccag actgtgccgg aaatgccggg ggagactccg 720

ccgctgtccc ctatcgacat ggaatcacag gaacgcatta aggcagagcg gaagcgcatg 780

cggaaccgga ttgccgcctc caagtgccgc aagagaaagc tcgaaagaat cgccagattg 840

gaagaaaagg tcaagactct gaaggcccag aactctgagc tggcatccac cgctaatatg 900

ctgagggaac aagtggccca gctgaaacag aaggtcatga accacgtcaa cagcggttgc 960

cagctgatgc tgacccagca actccagaca ttc 993

<210> 8

<211> 993

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 密码子优化的c-Jun核苷酸序列#8

<400> 8

atgaccgcca agatggagac caccttctac gacgacgccc tgaacgccag cttcctgccc 60

agcgagagcg gaccctacgg ctactctaac cccaagatcc tgaaacagag catgacactg 120

aatctggccg accccgtggg cagcctgaag cctcacctta gagccaagaa cagcgacctg 180

ctgaccagcc ccgacgtggg cctgctgaag ctcgcctctc cagagttaga gagactgatc 240

atccagtcca gcaacggcca catcacaacc accccaaccc ctacccagtt cctgtgcccc 300

aagaacgtga ccgacgagca ggagggcttc gccgagggct ttgtgagagc cctggccgag 360

ttgcactctc agaacaccct gccctccgtg accagcgccg ctcaacctgt gaacggcgca 420

ggaatggttg ctcctgccgt ggccagcgtt gcaggcggat ctggaagtgg aggcttctcc 480

gcctcccttc acagcgagcc tcccgtgtac gccaacctga gcaacttcaa ccccggcgcc 540

ctgagcagtg gaggaggcgc tcccagctat ggagcagctg gattagcctt ccccgcccag 600

ccacagcagc agcaacagcc tccccaccac ctgcctcagc aaatgcctgt gcagcaccct 660

cggctgcagg cccttaagga ggagccccag accgttcctg agatgcctgg cgagacccct 720

cccctgagcc ctatcgacat ggagtcccag gagcggatca aggccgagcg gaagcggatg 780

cggaaccgga tcgctgcttc caagtgccgg aagagaaagc tggagagaat cgcccggctg 840

gaggagaagg tgaagaccct gaaggcccag aactccgagc tggcctccac cgccaacatg 900

ctgcgggagc aggttgcaca gctgaagcag aaggtcatga accacgtgaa cagcggctgc 960

cagctgatgc tgacccagca gctgcagacc ttc 993

<210> 9

<211> 1059

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 密码子优化的c-Jun核苷酸序列#9

<400> 9

atgacagcga agatggagac aaccttctat gacgatgctc ttaacgcctc cttcctgcct 60

tccgaaagcg ggccctacgg gtactctaat cctaagatac ttaagcaatc gatgactctc 120

aacctcgctg acccggttgg ctcactgaaa ccacacctga gagctaagaa tagtgacctg 180

ctcactagtc ccgatgtcgg gcttctgaag ctggcctctc ccgagctgga gaggcttatc 240

atccaatcat caaatggcca catcaccact accccaacac caactcaatt cctttgccct 300

aaaaacgtga ccgacgaaca ggaaggcttc gccgagggtt ttgtccgggc cttggccgag 360

ctgcattctc aaaatacact gccaagcgtc acttctgcgg cgcagccggt taacggagca 420

gggatggtgg ctcccgccgt tgctagcgtg gccggcggtt ccggctccgg cggtttctct 480

gcctccttgc attctgagcc accagtctac gcgaacctgt ccaactttaa tccgggggcg 540

ctgagtagcg gaggcggcgc ccctagctat ggggcagctg gactggcctt cccggcacaa 600

ccccaacaac aacagcaacc gccacaccat cttcctcaac aaatgccagt gcaacatcca 660

cgcttacaag ccctcaagga ggaaccccag accgtgcctg agatgcccgg cgaaaccccg 720

ccattgagcc ctattgacat ggaaagtcaa gagagaatta aggcagagcg caagagaatg 780

aggaaccgga tcgcagcatc taagtgccgc aaacggaaat tggagcggat cgctcgcttg 840

gaggagaagg tcaagactct caaggcccag aactccgagc ttgcgagcac agctaatatg 900

ctgcgcgagc aggtggccca gttaaaacaa aaggtcatga accatgtgaa cagcggctgt 960

cagctgatgc ttacgcaaca gctgcaaacc tttggctccg gtgcaacgaa cttcagcctg 1020

ctgaagcagg ccggagatgt tgaggaaaat ccaggtccc 1059

<210> 10

<211> 993

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 密码子优化的c-Jun核苷酸序列#10

<400> 10

atgacggcca aaatggagac tacgttctac gatgacgcac tcaacgcgtc cttcctgccc 60

tctgagagtg gaccctatgg ctactccaat ccaaagatcc tgaagcagtc tatgaccctc 120

aacctggcgg acccggtggg ctcccttaag ccgcacttgc gcgccaagaa ctccgacctg 180

ctgacctccc ctgatgtggg cctcctcaag ctcgctagcc ctgaattgga gaggctgatc 240

atccagagct caaatggcca catcaccacc acacctaccc caacccagtt cctgtgccca 300

aaaaacgtga ccgacgagca ggagggcttc gcggagggct tcgtcagagc tctggccgag 360

ctgcactcac agaacacgct cccttccgtg acctccgctg cccagccggt caatggcgct 420

ggaatggtgg ctccggctgt ggcctctgtt gccggcggct ccggctccgg aggcttttca 480

gcttctctgc attctgagcc cccagtgtac gctaacctga gcaacttcaa ccccggggcg 540

ctcagctccg gtggcggtgc cccgagctac ggcgcggctg ggctggcgtt ccccgctcag 600

cctcagcagc aacagcaacc tccccaccac ctgccacagc agatgcctgt gcagcaccca 660

cgcctgcagg ccttgaagga ggaacctcag actgtgccag agatgcccgg cgagacccca 720

cccctgtccc cgattgacat ggagagccag gagcgcatca aggcagagcg caagcgtatg 780

cgcaaccgca tcgcggcctc caagtgccga aagcgcaagc tggagcggat tgctcgcctg 840

gaggagaagg tgaagaccct gaaggcccag aattccgagc tggcctcgac cgccaacatg 900

ctacgagaac aggtcgcgca gctgaaacag aaggtcatga accatgtcaa cagcgggtgc 960

cagctgatgt tgacccagca gcttcagacc ttc 993

<210> 11

<211> 993

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 野生型c-Jun - 编码区

<400> 11

atgactgcaa agatggaaac gaccttctat gacgatgccc tcaacgcctc gttcctcccg 60

tccgagagcg gaccttatgg ctacagtaac cccaagatcc tgaaacagag catgaccctg 120

aacctggccg acccagtggg gagcctgaag ccgcacctcc gcgccaagaa ctcggacctc 180

ctcacctcgc ccgacgtggg gctgctcaag ctggcgtcgc ccgagctgga gcgcctgata 240

atccagtcca gcaacgggca catcaccacc acgccgaccc ccacccagtt cctgtgcccc 300

aagaacgtga cagatgagca ggagggcttc gccgagggct tcgtgcgcgc cctggccgaa 360

ctgcacagcc agaacacgct gcccagcgtc acgtcggcgg cgcagccggt caacggggca 420

ggcatggtgg ctcccgcggt agcctcggtg gcagggggca gcggcagcgg cggcttcagc 480

gccagcctgc acagcgagcc gccggtctac gcaaacctca gcaacttcaa cccaggcgcg 540

ctgagcagcg gcggcggggc gccctcctac ggcgcggccg gcctggcctt tcccgcgcaa 600

ccccagcagc agcagcagcc gccgcaccac ctgccccagc agatgcccgt gcagcacccg 660

cggctgcagg ccctgaagga ggagcctcag acagtgcccg agatgcccgg cgagacaccg 720

cccctgtccc ccatcgacat ggagtcccag gagcggatca aggcggagag gaagcgcatg 780

aggaaccgca tcgctgcctc caagtgccga aaaaggaagc tggagagaat cgcccggctg 840

gaggaaaaag tgaaaacctt gaaagctcag aactcggagc tggcgtccac ggccaacatg 900

ctcagggaac aggtggcaca gcttaaacag aaagtcatga accacgttaa cagtgggtgc 960

caactcatgc taacgcagca gttgcaaaca ttt 993

<210> 12

<211> 3257

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 野生型c-Jun

<400> 12

gctcagagtt gcactgagtg tggctgaagc agcgaggcgg gagtggaggt gcgcggagtc 60

aggcagacag acagacacag ccagccagcc aggtcggcag tatagtccga actgcaaatc 120

ttattttctt ttcaccttct ctctaactgc ccagagctag cgcctgtggc tcccgggctg 180

gtgtttcggg agtgtccaga gagcctggtc tccagccgcc cccgggagga gagccctgct 240

gcccaggcgc tgttgacagc ggcggaaagc agcggtaccc acgcgcccgc cgggggaagt 300

cggcgagcgg ctgcagcagc aaagaacttt cccggctggg aggaccggag acaagtggca 360

gagtcccgga gccaactttt gcaagccttt cctgcgtctt aggcttctcc acggcggtaa 420

agaccagaag gcggcggaga gccacgcaag agaagaagga cgtgcgctca gcttcgctcg 480

caccggttgt tgaacttggg cgagcgcgag ccgcggctgc cgggcgcccc ctccccctag 540

cagcggagga ggggacaagt cgtcggagtc cgggcggcca agacccgccg ccggccggcc 600

actgcagggt ccgcactgat ccgctccgcg gggagagccg ctgctctggg aagtgagttc 660

gcctgcggac tccgaggaac cgctgcgcac gaagagcgct cagtgagtga ccgcgacttt 720

tcaaagccgg gtagcgcgcg cgagtcgaca agtaagagtg cgggaggcat cttaattaac 780

cctgcgctcc ctggagcgag ctggtgagga gggcgcagcg gggacgacag ccagcgggtg 840

cgtgcgctct tagagaaact ttccctgtca aaggctccgg ggggcgcggg tgtcccccgc 900

ttgccacagc cctgttgcgg ccccgaaact tgtgcgcgca gcccaaacta acctcacgtg 960

aagtgacgga ctgttctatg actgcaaaga tggaaacgac cttctatgac gatgccctca 1020

acgcctcgtt cctcccgtcc gagagcggac cttatggcta cagtaacccc aagatcctga 1080

aacagagcat gaccctgaac ctggccgacc cagtggggag cctgaagccg cacctccgcg 1140

ccaagaactc ggacctcctc acctcgcccg acgtggggct gctcaagctg gcgtcgcccg 1200

agctggagcg cctgataatc cagtccagca acgggcacat caccaccacg ccgaccccca 1260

cccagttcct gtgccccaag aacgtgacag atgagcagga gggcttcgcc gagggcttcg 1320

tgcgcgccct ggccgaactg cacagccaga acacgctgcc cagcgtcacg tcggcggcgc 1380

agccggtcaa cggggcaggc atggtggctc ccgcggtagc ctcggtggca gggggcagcg 1440

gcagcggcgg cttcagcgcc agcctgcaca gcgagccgcc ggtctacgca aacctcagca 1500

acttcaaccc aggcgcgctg agcagcggcg gcggggcgcc ctcctacggc gcggccggcc 1560

tggcctttcc cgcgcaaccc cagcagcagc agcagccgcc gcaccacctg ccccagcaga 1620

tgcccgtgca gcacccgcgg ctgcaggccc tgaaggagga gcctcagaca gtgcccgaga 1680

tgcccggcga gacaccgccc ctgtccccca tcgacatgga gtcccaggag cggatcaagg 1740

cggagaggaa gcgcatgagg aaccgcatcg ctgcctccaa gtgccgaaaa aggaagctgg 1800

agagaatcgc ccggctggag gaaaaagtga aaaccttgaa agctcagaac tcggagctgg 1860

cgtccacggc caacatgctc agggaacagg tggcacagct taaacagaaa gtcatgaacc 1920

acgttaacag tgggtgccaa ctcatgctaa cgcagcagtt gcaaacattt tgaagagaga 1980

ccgtcggggg ctgaggggca acgaagaaaa aaaataacac agagagacag acttgagaac 2040

ttgacaagtt gcgacggaga gaaaaaagaa gtgtccgaga actaaagcca agggtatcca 2100

agttggactg ggttgcgtcc tgacggcgcc cccagtgtgc acgagtggga aggacttggc 2160

gcgccctccc ttggcgtgga gccagggagc ggccgcctgc gggctgcccc gctttgcgga 2220

cgggctgtcc ccgcgcgaac ggaacgttgg acttttcgtt aacattgacc aagaactgca 2280

tggacctaac attcgatctc attcagtatt aaagggggga gggggagggg gttacaaact 2340

gcaatagaga ctgtagattg cttctgtagt actccttaag aacacaaagc ggggggaggg 2400

ttggggaggg gcggcaggag ggaggtttgt gagagcgagg ctgagcctac agatgaactc 2460

tttctggcct gccttcgtta actgtgtatg tacatatata tattttttaa tttgatgaaa 2520

gctgattact gtcaataaac agcttcatgc ctttgtaagt tatttcttgt ttgtttgttt 2580

gggtatcctg cccagtgttg tttgtaaata agagatttgg agcactctga gtttaccatt 2640

tgtaataaag tatataattt ttttatgttt tgtttctgaa aattccagaa aggatattta 2700

agaaaataca ataaactatt ggaaagtact cccctaacct cttttctgca tcatctgtag 2760

atactagcta tctaggtgga gttgaaagag ttaagaatgt cgattaaaat cactctcagt 2820

gcttcttact attaagcagt aaaaactgtt ctctattaga ctttagaaat aaatgtacct 2880

gatgtacctg atgctatggt caggttatac tcctcctccc ccagctatct atatggaatt 2940

gcttaccaaa ggatagtgcg atgtttcagg aggctggagg aaggggggtt gcagtggaga 3000

gggacagccc actgagaagt caaacatttc aaagtttgga ttgtatcaag tggcatgtgc 3060

tgtgaccatt tataatgtta gtagaaattt tacaataggt gcttattctc aaagcaggaa 3120

ttggtggcag attttacaaa agatgtatcc ttccaatttg gaatcttctc tttgacaatt 3180

cctagataaa aagatggcct ttgcttatga atatttataa cagcattctt gtcacaataa 3240

atgtattcaa ataccaa 3257

<210> 13

<211> 331

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 野生型c-Jun

<400> 13

Met Thr Ala Lys Met Glu Thr Thr Phe Tyr Asp Asp Ala Leu Asn Ala

1 5 10 15

Ser Phe Leu Pro Ser Glu Ser Gly Pro Tyr Gly Tyr Ser Asn Pro Lys

20 25 30

Ile Leu Lys Gln Ser Met Thr Leu Asn Leu Ala Asp Pro Val Gly Ser

35 40 45

Leu Lys Pro His Leu Arg Ala Lys Asn Ser Asp Leu Leu Thr Ser Pro

50 55 60

Asp Val Gly Leu Leu Lys Leu Ala Ser Pro Glu Leu Glu Arg Leu Ile

65 70 75 80

Ile Gln Ser Ser Asn Gly His Ile Thr Thr Thr Pro Thr Pro Thr Gln

85 90 95

Phe Leu Cys Pro Lys Asn Val Thr Asp Glu Gln Glu Gly Phe Ala Glu

100 105 110

Gly Phe Val Arg Ala Leu Ala Glu Leu His Ser Gln Asn Thr Leu Pro

115 120 125

Ser Val Thr Ser Ala Ala Gln Pro Val Asn Gly Ala Gly Met Val Ala

130 135 140

Pro Ala Val Ala Ser Val Ala Gly Gly Ser Gly Ser Gly Gly Phe Ser

145 150 155 160

Ala Ser Leu His Ser Glu Pro Pro Val Tyr Ala Asn Leu Ser Asn Phe

165 170 175

Asn Pro Gly Ala Leu Ser Ser Gly Gly Gly Ala Pro Ser Tyr Gly Ala

180 185 190

Ala Gly Leu Ala Phe Pro Ala Gln Pro Gln Gln Gln Gln Gln Pro Pro

195 200 205

His His Leu Pro Gln Gln Met Pro Val Gln His Pro Arg Leu Gln Ala

210 215 220

Leu Lys Glu Glu Pro Gln Thr Val Pro Glu Met Pro Gly Glu Thr Pro

225 230 235 240

Pro Leu Ser Pro Ile Asp Met Glu Ser Gln Glu Arg Ile Lys Ala Glu

245 250 255

Arg Lys Arg Met Arg Asn Arg Ile Ala Ala Ser Lys Cys Arg Lys Arg

260 265 270

Lys Leu Glu Arg Ile Ala Arg Leu Glu Glu Lys Val Lys Thr Leu Lys

275 280 285

Ala Gln Asn Ser Glu Leu Ala Ser Thr Ala Asn Met Leu Arg Glu Gln

290 295 300

Val Ala Gln Leu Lys Gln Lys Val Met Asn His Val Asn Ser Gly Cys

305 310 315 320

Gln Leu Met Leu Thr Gln Gln Leu Gln Thr Phe

325 330

<210> 14

<211> 19

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> P2A接头

<400> 14

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

1 5 10 15

Pro Gly Pro

<210> 15

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> T2A接头

<400> 15

Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro

1 5 10 15

Gly Pro

<210> 16

<211> 22

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> F2A接头

<400> 16

Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val

1 5 10 15

Glu Ser Asn Pro Gly Pro

20

<210> 17

<211> 20

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> E2A接头

<400> 17

Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 18

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 弗林蛋白酶切割位点

<400> 18

Arg Ala Lys Arg

1

<210> 19

<211> 1210

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> EGFR亚型1

<400> 19

Met Arg Pro Ser Gly Thr Ala Gly Ala Ala Leu Leu Ala Leu Leu Ala

1 5 10 15

Ala Leu Cys Pro Ala Ser Arg Ala Leu Glu Glu Lys Lys Val Cys Gln

20 25 30

Gly Thr Ser Asn Lys Leu Thr Gln Leu Gly Thr Phe Glu Asp His Phe

35 40 45

Leu Ser Leu Gln Arg Met Phe Asn Asn Cys Glu Val Val Leu Gly Asn

50 55 60

Leu Glu Ile Thr Tyr Val Gln Arg Asn Tyr Asp Leu Ser Phe Leu Lys

65 70 75 80

Thr Ile Gln Glu Val Ala Gly Tyr Val Leu Ile Ala Leu Asn Thr Val

85 90 95

Glu Arg Ile Pro Leu Glu Asn Leu Gln Ile Ile Arg Gly Asn Met Tyr

100 105 110

Tyr Glu Asn Ser Tyr Ala Leu Ala Val Leu Ser Asn Tyr Asp Ala Asn

115 120 125

Lys Thr Gly Leu Lys Glu Leu Pro Met Arg Asn Leu Gln Glu Ile Leu

130 135 140

His Gly Ala Val Arg Phe Ser Asn Asn Pro Ala Leu Cys Asn Val Glu

145 150 155 160

Ser Ile Gln Trp Arg Asp Ile Val Ser Ser Asp Phe Leu Ser Asn Met

165 170 175

Ser Met Asp Phe Gln Asn His Leu Gly Ser Cys Gln Lys Cys Asp Pro

180 185 190

Ser Cys Pro Asn Gly Ser Cys Trp Gly Ala Gly Glu Glu Asn Cys Gln

195 200 205

Lys Leu Thr Lys Ile Ile Cys Ala Gln Gln Cys Ser Gly Arg Cys Arg

210 215 220

Gly Lys Ser Pro Ser Asp Cys Cys His Asn Gln Cys Ala Ala Gly Cys

225 230 235 240

Thr Gly Pro Arg Glu Ser Asp Cys Leu Val Cys Arg Lys Phe Arg Asp

245 250 255

Glu Ala Thr Cys Lys Asp Thr Cys Pro Pro Leu Met Leu Tyr Asn Pro

260 265 270

Thr Thr Tyr Gln Met Asp Val Asn Pro Glu Gly Lys Tyr Ser Phe Gly

275 280 285

Ala Thr Cys Val Lys Lys Cys Pro Arg Asn Tyr Val Val Thr Asp His

290 295 300

Gly Ser Cys Val Arg Ala Cys Gly Ala Asp Ser Tyr Glu Met Glu Glu

305 310 315 320

Asp Gly Val Arg Lys Cys Lys Lys Cys Glu Gly Pro Cys Arg Lys Val

325 330 335

Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu Ser Ile Asn

340 345 350

Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile Ser Gly Asp

355 360 365

Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe Thr His Thr

370 375 380

Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr Val Lys Glu

385 390 395 400

Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn Arg Thr Asp

405 410 415

Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg Thr Lys Gln

420 425 430

His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile Thr Ser Leu

435 440 445

Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val Ile Ile Ser

450 455 460

Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp Lys Lys Leu

465 470 475 480

Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn Arg Gly Glu

485 490 495

Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu Cys Ser Pro

500 505 510

Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser Cys Arg Asn

515 520 525

Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu Leu Glu Gly

530 535 540

Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln Cys His Pro

545 550 555 560

Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly Arg Gly Pro

565 570 575

Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro His Cys Val

580 585 590

Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr Leu Val Trp

595 600 605

Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His Pro Asn Cys

610 615 620

Thr Tyr Gly Cys Thr Gly Pro Gly Leu Glu Gly Cys Pro Thr Asn Gly

625 630 635 640

Pro Lys Ile Pro Ser Ile Ala Thr Gly Met Val Gly Ala Leu Leu Leu

645 650 655

Leu Leu Val Val Ala Leu Gly Ile Gly Leu Phe Met Arg Arg Arg His

660 665 670

Ile Val Arg Lys Arg Thr Leu Arg Arg Leu Leu Gln Glu Arg Glu Leu

675 680 685

Val Glu Pro Leu Thr Pro Ser Gly Glu Ala Pro Asn Gln Ala Leu Leu

690 695 700

Arg Ile Leu Lys Glu Thr Glu Phe Lys Lys Ile Lys Val Leu Gly Ser

705 710 715 720

Gly Ala Phe Gly Thr Val Tyr Lys Gly Leu Trp Ile Pro Glu Gly Glu

725 730 735

Lys Val Lys Ile Pro Val Ala Ile Lys Glu Leu Arg Glu Ala Thr Ser

740 745 750

Pro Lys Ala Asn Lys Glu Ile Leu Asp Glu Ala Tyr Val Met Ala Ser

755 760 765

Val Asp Asn Pro His Val Cys Arg Leu Leu Gly Ile Cys Leu Thr Ser

770 775 780

Thr Val Gln Leu Ile Thr Gln Leu Met Pro Phe Gly Cys Leu Leu Asp

785 790 795 800

Tyr Val Arg Glu His Lys Asp Asn Ile Gly Ser Gln Tyr Leu Leu Asn

805 810 815

Trp Cys Val Gln Ile Ala Lys Gly Met Asn Tyr Leu Glu Asp Arg Arg

820 825 830

Leu Val His Arg Asp Leu Ala Ala Arg Asn Val Leu Val Lys Thr Pro

835 840 845

Gln His Val Lys Ile Thr Asp Phe Gly Leu Ala Lys Leu Leu Gly Ala

850 855 860

Glu Glu Lys Glu Tyr His Ala Glu Gly Gly Lys Val Pro Ile Lys Trp

865 870 875 880

Met Ala Leu Glu Ser Ile Leu His Arg Ile Tyr Thr His Gln Ser Asp

885 890 895

Val Trp Ser Tyr Gly Val Thr Val Trp Glu Leu Met Thr Phe Gly Ser

900 905 910

Lys Pro Tyr Asp Gly Ile Pro Ala Ser Glu Ile Ser Ser Ile Leu Glu

915 920 925

Lys Gly Glu Arg Leu Pro Gln Pro Pro Ile Cys Thr Ile Asp Val Tyr

930 935 940

Met Ile Met Val Lys Cys Trp Met Ile Asp Ala Asp Ser Arg Pro Lys

945 950 955 960

Phe Arg Glu Leu Ile Ile Glu Phe Ser Lys Met Ala Arg Asp Pro Gln

965 970 975

Arg Tyr Leu Val Ile Gln Gly Asp Glu Arg Met His Leu Pro Ser Pro

980 985 990

Thr Asp Ser Asn Phe Tyr Arg Ala Leu Met Asp Glu Glu Asp Met Asp

995 1000 1005

Asp Val Val Asp Ala Asp Glu Tyr Leu Ile Pro Gln Gln Gly Phe

1010 1015 1020

Phe Ser Ser Pro Ser Thr Ser Arg Thr Pro Leu Leu Ser Ser Leu

1025 1030 1035

Ser Ala Thr Ser Asn Asn Ser Thr Val Ala Cys Ile Asp Arg Asn

1040 1045 1050

Gly Leu Gln Ser Cys Pro Ile Lys Glu Asp Ser Phe Leu Gln Arg

1055 1060 1065

Tyr Ser Ser Asp Pro Thr Gly Ala Leu Thr Glu Asp Ser Ile Asp

1070 1075 1080

Asp Thr Phe Leu Pro Val Pro Glu Tyr Ile Asn Gln Ser Val Pro

1085 1090 1095

Lys Arg Pro Ala Gly Ser Val Gln Asn Pro Val Tyr His Asn Gln

1100 1105 1110

Pro Leu Asn Pro Ala Pro Ser Arg Asp Pro His Tyr Gln Asp Pro

1115 1120 1125

His Ser Thr Ala Val Gly Asn Pro Glu Tyr Leu Asn Thr Val Gln

1130 1135 1140

Pro Thr Cys Val Asn Ser Thr Phe Asp Ser Pro Ala His Trp Ala

1145 1150 1155

Gln Lys Gly Ser His Gln Ile Ser Leu Asp Asn Pro Asp Tyr Gln

1160 1165 1170

Gln Asp Phe Phe Pro Lys Glu Ala Lys Pro Asn Gly Ile Phe Lys

1175 1180 1185

Gly Ser Thr Ala Glu Asn Ala Glu Tyr Leu Arg Val Ala Pro Gln

1190 1195 1200

Ser Ser Glu Phe Ile Gly Ala

1205 1210

<210> 20

<211> 405

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> EGFR亚型2

<400> 20

Met Arg Pro Ser Gly Thr Ala Gly Ala Ala Leu Leu Ala Leu Leu Ala

1 5 10 15

Ala Leu Cys Pro Ala Ser Arg Ala Leu Glu Glu Lys Lys Val Cys Gln

20 25 30

Gly Thr Ser Asn Lys Leu Thr Gln Leu Gly Thr Phe Glu Asp His Phe

35 40 45

Leu Ser Leu Gln Arg Met Phe Asn Asn Cys Glu Val Val Leu Gly Asn

50 55 60

Leu Glu Ile Thr Tyr Val Gln Arg Asn Tyr Asp Leu Ser Phe Leu Lys

65 70 75 80

Thr Ile Gln Glu Val Ala Gly Tyr Val Leu Ile Ala Leu Asn Thr Val

85 90 95

Glu Arg Ile Pro Leu Glu Asn Leu Gln Ile Ile Arg Gly Asn Met Tyr

100 105 110

Tyr Glu Asn Ser Tyr Ala Leu Ala Val Leu Ser Asn Tyr Asp Ala Asn

115 120 125

Lys Thr Gly Leu Lys Glu Leu Pro Met Arg Asn Leu Gln Glu Ile Leu

130 135 140

His Gly Ala Val Arg Phe Ser Asn Asn Pro Ala Leu Cys Asn Val Glu

145 150 155 160

Ser Ile Gln Trp Arg Asp Ile Val Ser Ser Asp Phe Leu Ser Asn Met

165 170 175

Ser Met Asp Phe Gln Asn His Leu Gly Ser Cys Gln Lys Cys Asp Pro

180 185 190

Ser Cys Pro Asn Gly Ser Cys Trp Gly Ala Gly Glu Glu Asn Cys Gln

195 200 205

Lys Leu Thr Lys Ile Ile Cys Ala Gln Gln Cys Ser Gly Arg Cys Arg

210 215 220

Gly Lys Ser Pro Ser Asp Cys Cys His Asn Gln Cys Ala Ala Gly Cys

225 230 235 240

Thr Gly Pro Arg Glu Ser Asp Cys Leu Val Cys Arg Lys Phe Arg Asp

245 250 255

Glu Ala Thr Cys Lys Asp Thr Cys Pro Pro Leu Met Leu Tyr Asn Pro

260 265 270

Thr Thr Tyr Gln Met Asp Val Asn Pro Glu Gly Lys Tyr Ser Phe Gly

275 280 285

Ala Thr Cys Val Lys Lys Cys Pro Arg Asn Tyr Val Val Thr Asp His

290 295 300

Gly Ser Cys Val Arg Ala Cys Gly Ala Asp Ser Tyr Glu Met Glu Glu

305 310 315 320

Asp Gly Val Arg Lys Cys Lys Lys Cys Glu Gly Pro Cys Arg Lys Val

325 330 335

Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu Ser Ile Asn

340 345 350

Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile Ser Gly Asp

355 360 365

Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe Thr His Thr

370 375 380

Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr Val Lys Glu

385 390 395 400

Ile Thr Gly Leu Ser

405

<210> 21

<211> 705

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> EGFR亚型3

<400> 21

Met Arg Pro Ser Gly Thr Ala Gly Ala Ala Leu Leu Ala Leu Leu Ala

1 5 10 15

Ala Leu Cys Pro Ala Ser Arg Ala Leu Glu Glu Lys Lys Val Cys Gln

20 25 30

Gly Thr Ser Asn Lys Leu Thr Gln Leu Gly Thr Phe Glu Asp His Phe

35 40 45

Leu Ser Leu Gln Arg Met Phe Asn Asn Cys Glu Val Val Leu Gly Asn

50 55 60

Leu Glu Ile Thr Tyr Val Gln Arg Asn Tyr Asp Leu Ser Phe Leu Lys

65 70 75 80

Thr Ile Gln Glu Val Ala Gly Tyr Val Leu Ile Ala Leu Asn Thr Val

85 90 95

Glu Arg Ile Pro Leu Glu Asn Leu Gln Ile Ile Arg Gly Asn Met Tyr

100 105 110

Tyr Glu Asn Ser Tyr Ala Leu Ala Val Leu Ser Asn Tyr Asp Ala Asn

115 120 125

Lys Thr Gly Leu Lys Glu Leu Pro Met Arg Asn Leu Gln Glu Ile Leu

130 135 140

His Gly Ala Val Arg Phe Ser Asn Asn Pro Ala Leu Cys Asn Val Glu

145 150 155 160

Ser Ile Gln Trp Arg Asp Ile Val Ser Ser Asp Phe Leu Ser Asn Met

165 170 175

Ser Met Asp Phe Gln Asn His Leu Gly Ser Cys Gln Lys Cys Asp Pro

180 185 190

Ser Cys Pro Asn Gly Ser Cys Trp Gly Ala Gly Glu Glu Asn Cys Gln

195 200 205

Lys Leu Thr Lys Ile Ile Cys Ala Gln Gln Cys Ser Gly Arg Cys Arg

210 215 220

Gly Lys Ser Pro Ser Asp Cys Cys His Asn Gln Cys Ala Ala Gly Cys

225 230 235 240

Thr Gly Pro Arg Glu Ser Asp Cys Leu Val Cys Arg Lys Phe Arg Asp

245 250 255

Glu Ala Thr Cys Lys Asp Thr Cys Pro Pro Leu Met Leu Tyr Asn Pro

260 265 270

Thr Thr Tyr Gln Met Asp Val Asn Pro Glu Gly Lys Tyr Ser Phe Gly

275 280 285

Ala Thr Cys Val Lys Lys Cys Pro Arg Asn Tyr Val Val Thr Asp His

290 295 300

Gly Ser Cys Val Arg Ala Cys Gly Ala Asp Ser Tyr Glu Met Glu Glu

305 310 315 320

Asp Gly Val Arg Lys Cys Lys Lys Cys Glu Gly Pro Cys Arg Lys Val

325 330 335

Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu Ser Ile Asn

340 345 350

Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile Ser Gly Asp

355 360 365

Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe Thr His Thr

370 375 380

Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr Val Lys Glu

385 390 395 400

Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn Arg Thr Asp

405 410 415

Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg Thr Lys Gln

420 425 430

His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile Thr Ser Leu

435 440 445

Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val Ile Ile Ser

450 455 460

Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp Lys Lys Leu

465 470 475 480

Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn Arg Gly Glu

485 490 495

Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu Cys Ser Pro

500 505 510

Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser Cys Arg Asn

515 520 525

Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu Leu Glu Gly

530 535 540

Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln Cys His Pro

545 550 555 560

Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly Arg Gly Pro

565 570 575

Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro His Cys Val

580 585 590

Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr Leu Val Trp

595 600 605

Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His Pro Asn Cys

610 615 620

Thr Tyr Gly Pro Gly Asn Glu Ser Leu Lys Ala Met Leu Phe Cys Leu

625 630 635 640

Phe Lys Leu Ser Ser Cys Asn Gln Ser Asn Asp Gly Ser Val Ser His

645 650 655

Gln Ser Gly Ser Pro Ala Ala Gln Glu Ser Cys Leu Gly Trp Ile Pro

660 665 670

Ser Leu Leu Pro Ser Glu Phe Gln Leu Gly Trp Gly Gly Cys Ser His

675 680 685

Leu His Ala Trp Pro Ser Ala Ser Val Ile Ile Thr Ala Ser Ser Cys

690 695 700

His

705

<210> 22

<211> 628

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> EGFR亚型4

<400> 22

Met Arg Pro Ser Gly Thr Ala Gly Ala Ala Leu Leu Ala Leu Leu Ala

1 5 10 15

Ala Leu Cys Pro Ala Ser Arg Ala Leu Glu Glu Lys Lys Val Cys Gln

20 25 30

Gly Thr Ser Asn Lys Leu Thr Gln Leu Gly Thr Phe Glu Asp His Phe

35 40 45

Leu Ser Leu Gln Arg Met Phe Asn Asn Cys Glu Val Val Leu Gly Asn

50 55 60

Leu Glu Ile Thr Tyr Val Gln Arg Asn Tyr Asp Leu Ser Phe Leu Lys

65 70 75 80

Thr Ile Gln Glu Val Ala Gly Tyr Val Leu Ile Ala Leu Asn Thr Val

85 90 95

Glu Arg Ile Pro Leu Glu Asn Leu Gln Ile Ile Arg Gly Asn Met Tyr

100 105 110

Tyr Glu Asn Ser Tyr Ala Leu Ala Val Leu Ser Asn Tyr Asp Ala Asn

115 120 125

Lys Thr Gly Leu Lys Glu Leu Pro Met Arg Asn Leu Gln Glu Ile Leu

130 135 140

His Gly Ala Val Arg Phe Ser Asn Asn Pro Ala Leu Cys Asn Val Glu

145 150 155 160

Ser Ile Gln Trp Arg Asp Ile Val Ser Ser Asp Phe Leu Ser Asn Met

165 170 175

Ser Met Asp Phe Gln Asn His Leu Gly Ser Cys Gln Lys Cys Asp Pro

180 185 190

Ser Cys Pro Asn Gly Ser Cys Trp Gly Ala Gly Glu Glu Asn Cys Gln

195 200 205

Lys Leu Thr Lys Ile Ile Cys Ala Gln Gln Cys Ser Gly Arg Cys Arg

210 215 220

Gly Lys Ser Pro Ser Asp Cys Cys His Asn Gln Cys Ala Ala Gly Cys

225 230 235 240

Thr Gly Pro Arg Glu Ser Asp Cys Leu Val Cys Arg Lys Phe Arg Asp

245 250 255

Glu Ala Thr Cys Lys Asp Thr Cys Pro Pro Leu Met Leu Tyr Asn Pro

260 265 270

Thr Thr Tyr Gln Met Asp Val Asn Pro Glu Gly Lys Tyr Ser Phe Gly

275 280 285

Ala Thr Cys Val Lys Lys Cys Pro Arg Asn Tyr Val Val Thr Asp His

290 295 300

Gly Ser Cys Val Arg Ala Cys Gly Ala Asp Ser Tyr Glu Met Glu Glu

305 310 315 320

Asp Gly Val Arg Lys Cys Lys Lys Cys Glu Gly Pro Cys Arg Lys Val

325 330 335

Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu Ser Ile Asn

340 345 350

Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile Ser Gly Asp

355 360 365

Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe Thr His Thr

370 375 380

Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr Val Lys Glu

385 390 395 400

Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn Arg Thr Asp

405 410 415

Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg Thr Lys Gln

420 425 430

His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile Thr Ser Leu

435 440 445

Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val Ile Ile Ser

450 455 460

Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp Lys Lys Leu

465 470 475 480

Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn Arg Gly Glu

485 490 495

Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu Cys Ser Pro

500 505 510

Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser Cys Arg Asn

515 520 525

Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu Leu Glu Gly

530 535 540

Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln Cys His Pro

545 550 555 560

Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly Arg Gly Pro

565 570 575

Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro His Cys Val

580 585 590

Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr Leu Val Trp

595 600 605

Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His Pro Asn Cys

610 615 620

Thr Tyr Gly Ser

625

<210> 23

<211> 335

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> EGFRt #1

<400> 23

Arg Lys Val Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu

1 5 10 15

Ser Ile Asn Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile

20 25 30

Ser Gly Asp Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe

35 40 45

Thr His Thr Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr

50 55 60

Val Lys Glu Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn

65 70 75 80

Arg Thr Asp Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg

85 90 95

Thr Lys Gln His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile

100 105 110

Thr Ser Leu Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val

115 120 125

Ile Ile Ser Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp

130 135 140

Lys Lys Leu Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn

145 150 155 160

Arg Gly Glu Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu

165 170 175

Cys Ser Pro Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser

180 185 190

Cys Arg Asn Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu

195 200 205

Leu Glu Gly Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln

210 215 220

Cys His Pro Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly

225 230 235 240

Arg Gly Pro Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro

245 250 255

His Cys Val Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr

260 265 270

Leu Val Trp Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His

275 280 285

Pro Asn Cys Thr Tyr Gly Cys Thr Gly Pro Gly Leu Glu Gly Cys Pro

290 295 300

Thr Asn Gly Pro Lys Ile Pro Ser Ile Ala Thr Gly Met Val Gly Ala

305 310 315 320

Leu Leu Leu Leu Leu Val Val Ala Leu Gly Ile Gly Leu Phe Met

325 330 335

<210> 24

<211> 338

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> EGFRt #2

<400> 24

Arg Lys Val Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu

1 5 10 15

Ser Ile Asn Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile

20 25 30

Ser Gly Asp Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe

35 40 45

Thr His Thr Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr

50 55 60

Val Lys Glu Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn

65 70 75 80

Arg Thr Asp Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg

85 90 95

Thr Lys Gln His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile

100 105 110

Thr Ser Leu Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val

115 120 125

Ile Ile Ser Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp

130 135 140

Lys Lys Leu Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn

145 150 155 160

Arg Gly Glu Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu

165 170 175

Cys Ser Pro Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser

180 185 190

Cys Arg Asn Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu

195 200 205

Leu Glu Gly Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln

210 215 220

Cys His Pro Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly

225 230 235 240

Arg Gly Pro Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro

245 250 255

His Cys Val Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr

260 265 270

Leu Val Trp Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His

275 280 285

Pro Asn Cys Thr Tyr Gly Cys Thr Gly Pro Gly Leu Glu Gly Cys Pro

290 295 300

Thr Asn Gly Pro Lys Ile Pro Ser Ile Ala Thr Gly Met Val Gly Ala

305 310 315 320

Leu Leu Leu Leu Leu Val Val Ala Leu Gly Ile Gly Leu Phe Met Arg

325 330 335

Arg Arg

<210> 25

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#5

<400> 25

Lys Ser Gly Ser Gly Ser

1 5

<210> 26

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#7

<400> 26

Lys Arg Ser Asp

1

<210> 27

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#8

<400> 27

Lys Arg Ser Asp Lys

1 5

<210> 28

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#9

<400> 28

Ser Gly Gly Gly Gly

1 5

<210> 29

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#10

<400> 29

Ser Gly Ala Gly Gly

1 5

<210> 30

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#11

<400> 30

Lys Arg Ala Asp Lys

1 5

<210> 31

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#12

<400> 31

Arg Arg Arg Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10

<210> 32

<211> 11

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#13

<400> 32

Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10

<210> 33

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#14

<400> 33

Gly Gly Gly Gly Ser Asn Asn

1 5

<210> 34

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#15

<400> 34

Arg Arg Arg His Ile Val Arg Lys Arg

1 5

<210> 35

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#16

<400> 35

Arg Arg Arg His Ile Val Arg Lys

1 5

<210> 36

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#17

<400> 36

Arg Arg Arg His Ile Val Arg

1 5

<210> 37

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#18

<400> 37

Arg Arg Arg His Ile Val

1 5

<210> 38

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#19

<400> 38

Arg Arg Arg His Ile

1 5

<210> 39

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 近膜结构域#20

<400> 39

Arg Arg Arg His

1

<210> 40

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Linker

<400> 40

Gly Gly Gly Ser Gly

1 5

<210> 41

<211> 353

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 免疫球蛋白重链恒定区α1

<400> 41

Ala Ser Pro Thr Ser Pro Lys Val Phe Pro Leu Ser Leu Cys Ser Thr

1 5 10 15

Gln Pro Asp Gly Asn Val Val Ile Ala Cys Leu Val Gln Gly Phe Phe

20 25 30

Pro Gln Glu Pro Leu Ser Val Thr Trp Ser Glu Ser Gly Gln Gly Val

35 40 45

Thr Ala Arg Asn Phe Pro Pro Ser Gln Asp Ala Ser Gly Asp Leu Tyr

50 55 60

Thr Thr Ser Ser Gln Leu Thr Leu Pro Ala Thr Gln Cys Leu Ala Gly

65 70 75 80

Lys Ser Val Thr Cys His Val Lys His Tyr Thr Asn Pro Ser Gln Asp

85 90 95

Val Thr Val Pro Cys Pro Val Pro Ser Thr Pro Pro Thr Pro Ser Pro

100 105 110

Ser Thr Pro Pro Thr Pro Ser Pro Ser Cys Cys His Pro Arg Leu Ser

115 120 125

Leu His Arg Pro Ala Leu Glu Asp Leu Leu Leu Gly Ser Glu Ala Asn

130 135 140

Leu Thr Cys Thr Leu Thr Gly Leu Arg Asp Ala Ser Gly Val Thr Phe

145 150 155 160

Thr Trp Thr Pro Ser Ser Gly Lys Ser Ala Val Gln Gly Pro Pro Glu

165 170 175

Arg Asp Leu Cys Gly Cys Tyr Ser Val Ser Ser Val Leu Pro Gly Cys

180 185 190

Ala Glu Pro Trp Asn His Gly Lys Thr Phe Thr Cys Thr Ala Ala Tyr

195 200 205

Pro Glu Ser Lys Thr Pro Leu Thr Ala Thr Leu Ser Lys Ser Gly Asn

210 215 220

Thr Phe Arg Pro Glu Val His Leu Leu Pro Pro Pro Ser Glu Glu Leu

225 230 235 240

Ala Leu Asn Glu Leu Val Thr Leu Thr Cys Leu Ala Arg Gly Phe Ser

245 250 255

Pro Lys Asp Val Leu Val Arg Trp Leu Gln Gly Ser Gln Glu Leu Pro

260 265 270

Arg Glu Lys Tyr Leu Thr Trp Ala Ser Arg Gln Glu Pro Ser Gln Gly

275 280 285

Thr Thr Thr Phe Ala Val Thr Ser Ile Leu Arg Val Ala Ala Glu Asp

290 295 300

Trp Lys Lys Gly Asp Thr Phe Ser Cys Met Val Gly His Glu Ala Leu

305 310 315 320

Pro Leu Ala Phe Thr Gln Lys Thr Ile Asp Arg Leu Ala Gly Lys Pro

325 330 335

Thr His Val Asn Val Ser Val Val Met Ala Glu Val Asp Gly Thr Cys

340 345 350

Tyr

<210> 42

<211> 340

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 免疫球蛋白重链恒定区α2

<400> 42

Ala Ser Pro Thr Ser Pro Lys Val Phe Pro Leu Ser Leu Asp Ser Thr

1 5 10 15

Pro Gln Asp Gly Asn Val Val Val Ala Cys Leu Val Gln Gly Phe Phe

20 25 30

Pro Gln Glu Pro Leu Ser Val Thr Trp Ser Glu Ser Gly Gln Asn Val

35 40 45

Thr Ala Arg Asn Phe Pro Pro Ser Gln Asp Ala Ser Gly Asp Leu Tyr

50 55 60

Thr Thr Ser Ser Gln Leu Thr Leu Pro Ala Thr Gln Cys Pro Asp Gly

65 70 75 80

Lys Ser Val Thr Cys His Val Lys His Tyr Thr Asn Ser Ser Gln Asp

85 90 95

Val Thr Val Pro Cys Arg Val Pro Pro Pro Pro Pro Cys Cys His Pro

100 105 110

Arg Leu Ser Leu His Arg Pro Ala Leu Glu Asp Leu Leu Leu Gly Ser

115 120 125

Glu Ala Asn Leu Thr Cys Thr Leu Thr Gly Leu Arg Asp Ala Ser Gly

130 135 140

Ala Thr Phe Thr Trp Thr Pro Ser Ser Gly Lys Ser Ala Val Gln Gly

145 150 155 160

Pro Pro Glu Arg Asp Leu Cys Gly Cys Tyr Ser Val Ser Ser Val Leu

165 170 175

Pro Gly Cys Ala Gln Pro Trp Asn His Gly Glu Thr Phe Thr Cys Thr

180 185 190

Ala Ala His Pro Glu Leu Lys Thr Pro Leu Thr Ala Asn Ile Thr Lys

195 200 205

Ser Gly Asn Thr Phe Arg Pro Glu Val His Leu Leu Pro Pro Pro Ser

210 215 220

Glu Glu Leu Ala Leu Asn Glu Leu Val Thr Leu Thr Cys Leu Ala Arg

225 230 235 240

Gly Phe Ser Pro Lys Asp Val Leu Val Arg Trp Leu Gln Gly Ser Gln

245 250 255

Glu Leu Pro Arg Glu Lys Tyr Leu Thr Trp Ala Ser Arg Gln Glu Pro

260 265 270

Ser Gln Gly Thr Thr Thr Tyr Ala Val Thr Ser Ile Leu Arg Val Ala

275 280 285

Ala Glu Asp Trp Lys Lys Gly Glu Thr Phe Ser Cys Met Val Gly His

290 295 300

Glu Ala Leu Pro Leu Ala Phe Thr Gln Lys Thr Ile Asp Arg Met Ala

305 310 315 320

Gly Lys Pro Thr His Ile Asn Val Ser Val Val Met Ala Glu Ala Asp

325 330 335

Gly Thr Cys Tyr

340

<210> 43

<211> 330

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 免疫球蛋白 γ 2A链C区

<400> 43

Ala Lys Thr Thr Ala Pro Ser Val Tyr Pro Leu Ala Pro Val Cys Gly

1 5 10 15

Asp Thr Thr Gly Ser Ser Val Thr Leu Gly Cys Leu Val Lys Gly Tyr

20 25 30

Phe Pro Glu Pro Val Thr Leu Thr Trp Asn Ser Gly Ser Leu Ser Ser

35 40 45

Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Asp Leu Tyr Thr Leu

50 55 60

Ser Ser Ser Val Thr Val Thr Ser Ser Thr Trp Pro Ser Gln Ser Ile

65 70 75 80

Thr Cys Asn Val Ala His Pro Ala Ser Ser Thr Lys Val Asp Lys Lys

85 90 95

Ile Glu Pro Arg Gly Pro Thr Ile Lys Pro Cys Pro Pro Cys Lys Cys

100 105 110

Pro Ala Pro Asn Leu Leu Gly Gly Pro Ser Val Phe Ile Phe Pro Pro

115 120 125

Lys Ile Lys Asp Val Leu Met Ile Ser Leu Ser Pro Ile Val Thr Cys

130 135 140

Val Val Val Asp Val Ser Glu Asp Asp Pro Asp Val Gln Ile Ser Trp

145 150 155 160

Phe Val Asn Asn Val Glu Val His Thr Ala Gln Thr Gln Thr His Arg

165 170 175

Glu Asp Tyr Asn Ser Thr Leu Arg Val Val Ser Ala Leu Pro Ile Gln

180 185 190

His Gln Asp Trp Met Ser Gly Lys Glu Phe Lys Cys Lys Val Asn Asn

195 200 205

Lys Asp Leu Pro Ala Pro Ile Glu Arg Thr Ile Ser Lys Pro Lys Gly

210 215 220

Ser Val Arg Ala Pro Gln Val Tyr Val Leu Pro Pro Pro Glu Glu Glu

225 230 235 240

Met Thr Lys Lys Gln Val Thr Leu Thr Cys Met Val Thr Asp Phe Met

245 250 255

Pro Glu Asp Ile Tyr Val Glu Trp Thr Asn Asn Gly Lys Thr Glu Leu

260 265 270

Asn Tyr Lys Asn Thr Glu Pro Val Leu Asp Ser Asp Gly Ser Tyr Phe

275 280 285

Met Tyr Ser Lys Leu Arg Val Glu Lys Lys Asn Trp Val Glu Arg Asn

290 295 300

Ser Tyr Ser Cys Ser Val Val His Glu Gly Leu His Asn His His Thr

305 310 315 320

Thr Lys Ser Phe Ser Arg Thr Pro Gly Lys

325 330

<210> 44

<211> 330

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 免疫球蛋白重链恒定区γ1

<400> 44

Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys

1 5 10 15

Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr

20 25 30

Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser

35 40 45

Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser

50 55 60

Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr

65 70 75 80

Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys

85 90 95

Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys

100 105 110

Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro

115 120 125

Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys

130 135 140

Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp

145 150 155 160

Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu

165 170 175

Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu

180 185 190

His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn

195 200 205

Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly

210 215 220

Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu

225 230 235 240

Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr

245 250 255

Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn

260 265 270

Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe

275 280 285

Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn

290 295 300

Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr

305 310 315 320

Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

325 330

<210> 45

<211> 326

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 免疫球蛋白重链恒定区γ2

<400> 45

Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg

1 5 10 15

Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr

20 25 30

Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser

35 40 45

Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser

50 55 60

Leu Ser Ser Val Val Thr Val Pro Ser Ser Asn Phe Gly Thr Gln Thr

65 70 75 80

Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys

85 90 95

Thr Val Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro

100 105 110

Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp

115 120 125

Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp

130 135 140

Val Ser His Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly

145 150 155 160

Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn

165 170 175

Ser Thr Phe Arg Val Val Ser Val Leu Thr Val Val His Gln Asp Trp

180 185 190

Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro

195 200 205

Ala Pro Ile Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg Glu

210 215 220

Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn

225 230 235 240

Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile

245 250 255

Ser Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr

260 265 270

Thr Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys

275 280 285

Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys

290 295 300

Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu

305 310 315 320

Ser Leu Ser Pro Gly Lys

325

<210> 46

<211> 377

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 免疫球蛋白重链恒定区γ3

<400> 46

Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg

1 5 10 15

Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr

20 25 30

Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser

35 40 45

Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser

50 55 60

Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr

65 70 75 80

Tyr Thr Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys

85 90 95

Arg Val Glu Leu Lys Thr Pro Leu Gly Asp Thr Thr His Thr Cys Pro

100 105 110

Arg Cys Pro Glu Pro Lys Ser Cys Asp Thr Pro Pro Pro Cys Pro Arg

115 120 125

Cys Pro Glu Pro Lys Ser Cys Asp Thr Pro Pro Pro Cys Pro Arg Cys

130 135 140

Pro Glu Pro Lys Ser Cys Asp Thr Pro Pro Pro Cys Pro Arg Cys Pro

145 150 155 160

Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys

165 170 175

Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val

180 185 190

Val Val Asp Val Ser His Glu Asp Pro Glu Val Gln Phe Lys Trp Tyr

195 200 205

Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu

210 215 220

Gln Tyr Asn Ser Thr Phe Arg Val Val Ser Val Leu Thr Val Leu His

225 230 235 240

Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys

245 250 255

Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln

260 265 270

Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met

275 280 285

Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro

290 295 300

Ser Asp Ile Ala Val Glu Trp Glu Ser Ser Gly Gln Pro Glu Asn Asn

305 310 315 320

Tyr Asn Thr Thr Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Phe Leu

325 330 335

Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Ile

340 345 350

Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn Arg Phe Thr Gln

355 360 365

Lys Ser Leu Ser Leu Ser Pro Gly Lys

370 375

<210> 47

<211> 327

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 免疫球蛋白重链恒定区γ4

<400> 47

Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg

1 5 10 15

Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr

20 25 30

Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser

35 40 45

Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser

50 55 60

Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr

65 70 75 80

Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys

85 90 95

Arg Val Glu Ser Lys Tyr Gly Pro Pro Cys Pro Ser Cys Pro Ala Pro

100 105 110

Glu Phe Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys

115 120 125

Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val

130 135 140

Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp

145 150 155 160

Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe

165 170 175

Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp

180 185 190

Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu

195 200 205

Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg

210 215 220

Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys

225 230 235 240

Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp

245 250 255

Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys

260 265 270

Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser

275 280 285

Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser

290 295 300

Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser

305 310 315 320

Leu Ser Leu Ser Leu Gly Lys

325

<210> 48

<211> 384

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 免疫球蛋白重链恒定区 δ

<400> 48

Ala Pro Thr Lys Ala Pro Asp Val Phe Pro Ile Ile Ser Gly Cys Arg

1 5 10 15

His Pro Lys Asp Asn Ser Pro Val Val Leu Ala Cys Leu Ile Thr Gly

20 25 30

Tyr His Pro Thr Ser Val Thr Val Thr Trp Tyr Met Gly Thr Gln Ser

35 40 45

Gln Pro Gln Arg Thr Phe Pro Glu Ile Gln Arg Arg Asp Ser Tyr Tyr

50 55 60

Met Thr Ser Ser Gln Leu Ser Thr Pro Leu Gln Gln Trp Arg Gln Gly

65 70 75 80

Glu Tyr Lys Cys Val Val Gln His Thr Ala Ser Lys Ser Lys Lys Glu

85 90 95

Ile Phe Arg Trp Pro Glu Ser Pro Lys Ala Gln Ala Ser Ser Val Pro

100 105 110

Thr Ala Gln Pro Gln Ala Glu Gly Ser Leu Ala Lys Ala Thr Thr Ala

115 120 125

Pro Ala Thr Thr Arg Asn Thr Gly Arg Gly Gly Glu Glu Lys Lys Lys

130 135 140

Glu Lys Glu Lys Glu Glu Gln Glu Glu Arg Glu Thr Lys Thr Pro Glu

145 150 155 160

Cys Pro Ser His Thr Gln Pro Leu Gly Val Tyr Leu Leu Thr Pro Ala

165 170 175

Val Gln Asp Leu Trp Leu Arg Asp Lys Ala Thr Phe Thr Cys Phe Val

180 185 190

Val Gly Ser Asp Leu Lys Asp Ala His Leu Thr Trp Glu Val Ala Gly

195 200 205

Lys Val Pro Thr Gly Gly Val Glu Glu Gly Leu Leu Glu Arg His Ser

210 215 220

Asn Gly Ser Gln Ser Gln His Ser Arg Leu Thr Leu Pro Arg Ser Leu

225 230 235 240

Trp Asn Ala Gly Thr Ser Val Thr Cys Thr Leu Asn His Pro Ser Leu

245 250 255

Pro Pro Gln Arg Leu Met Ala Leu Arg Glu Pro Ala Ala Gln Ala Pro

260 265 270

Val Lys Leu Ser Leu Asn Leu Leu Ala Ser Ser Asp Pro Pro Glu Ala

275 280 285

Ala Ser Trp Leu Leu Cys Glu Val Ser Gly Phe Ser Pro Pro Asn Ile

290 295 300

Leu Leu Met Trp Leu Glu Asp Gln Arg Glu Val Asn Thr Ser Gly Phe

305 310 315 320

Ala Pro Ala Arg Pro Pro Pro Gln Pro Arg Ser Thr Thr Phe Trp Ala

325 330 335

Trp Ser Val Leu Arg Val Pro Ala Pro Pro Ser Pro Gln Pro Ala Thr

340 345 350

Tyr Thr Cys Val Val Ser His Glu Asp Ser Arg Thr Leu Leu Asn Ala

355 360 365

Ser Arg Ser Leu Glu Val Ser Tyr Val Thr Asp His Gly Pro Met Lys

370 375 380

<210> 49

<211> 428

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 免疫球蛋白重链恒定区ε

<400> 49

Ala Ser Thr Gln Ser Pro Ser Val Phe Pro Leu Thr Arg Cys Cys Lys

1 5 10 15

Asn Ile Pro Ser Asn Ala Thr Ser Val Thr Leu Gly Cys Leu Ala Thr

20 25 30

Gly Tyr Phe Pro Glu Pro Val Met Val Thr Trp Asp Thr Gly Ser Leu

35 40 45

Asn Gly Thr Thr Met Thr Leu Pro Ala Thr Thr Leu Thr Leu Ser Gly

50 55 60

His Tyr Ala Thr Ile Ser Leu Leu Thr Val Ser Gly Ala Trp Ala Lys

65 70 75 80

Gln Met Phe Thr Cys Arg Val Ala His Thr Pro Ser Ser Thr Asp Trp

85 90 95

Val Asp Asn Lys Thr Phe Ser Val Cys Ser Arg Asp Phe Thr Pro Pro

100 105 110

Thr Val Lys Ile Leu Gln Ser Ser Cys Asp Gly Gly Gly His Phe Pro

115 120 125

Pro Thr Ile Gln Leu Leu Cys Leu Val Ser Gly Tyr Thr Pro Gly Thr

130 135 140

Ile Asn Ile Thr Trp Leu Glu Asp Gly Gln Val Met Asp Val Asp Leu

145 150 155 160

Ser Thr Ala Ser Thr Thr Gln Glu Gly Glu Leu Ala Ser Thr Gln Ser

165 170 175

Glu Leu Thr Leu Ser Gln Lys His Trp Leu Ser Asp Arg Thr Tyr Thr

180 185 190

Cys Gln Val Thr Tyr Gln Gly His Thr Phe Glu Asp Ser Thr Lys Lys

195 200 205

Cys Ala Asp Ser Asn Pro Arg Gly Val Ser Ala Tyr Leu Ser Arg Pro

210 215 220

Ser Pro Phe Asp Leu Phe Ile Arg Lys Ser Pro Thr Ile Thr Cys Leu

225 230 235 240

Val Val Asp Leu Ala Pro Ser Lys Gly Thr Val Asn Leu Thr Trp Ser

245 250 255

Arg Ala Ser Gly Lys Pro Val Asn His Ser Thr Arg Lys Glu Glu Lys

260 265 270

Gln Arg Asn Gly Thr Leu Thr Val Thr Ser Thr Leu Pro Val Gly Thr

275 280 285

Arg Asp Trp Ile Glu Gly Glu Thr Tyr Gln Cys Arg Val Thr His Pro

290 295 300

His Leu Pro Arg Ala Leu Met Arg Ser Thr Thr Lys Thr Ser Gly Pro

305 310 315 320

Arg Ala Ala Pro Glu Val Tyr Ala Phe Ala Thr Pro Glu Trp Pro Gly

325 330 335

Ser Arg Asp Lys Arg Thr Leu Ala Cys Leu Ile Gln Asn Phe Met Pro

340 345 350

Glu Asp Ile Ser Val Gln Trp Leu His Asn Glu Val Gln Leu Pro Asp

355 360 365

Ala Arg His Ser Thr Thr Gln Pro Arg Lys Thr Lys Gly Ser Gly Phe

370 375 380

Phe Val Phe Ser Arg Leu Glu Val Thr Arg Ala Glu Trp Glu Gln Lys

385 390 395 400

Asp Glu Phe Ile Cys Arg Ala Val His Glu Ala Ala Ser Pro Ser Gln

405 410 415

Thr Val Gln Arg Ala Val Ser Val Asn Pro Gly Lys

420 425

<210> 50

<211> 453

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 免疫球蛋白重链恒定区μ

<400> 50

Gly Ser Ala Ser Ala Pro Thr Leu Phe Pro Leu Val Ser Cys Glu Asn

1 5 10 15

Ser Pro Ser Asp Thr Ser Ser Val Ala Val Gly Cys Leu Ala Gln Asp

20 25 30

Phe Leu Pro Asp Ser Ile Thr Phe Ser Trp Lys Tyr Lys Asn Asn Ser

35 40 45

Asp Ile Ser Ser Thr Arg Gly Phe Pro Ser Val Leu Arg Gly Gly Lys

50 55 60

Tyr Ala Ala Thr Ser Gln Val Leu Leu Pro Ser Lys Asp Val Met Gln

65 70 75 80

Gly Thr Asp Glu His Val Val Cys Lys Val Gln His Pro Asn Gly Asn

85 90 95

Lys Glu Lys Asn Val Pro Leu Pro Val Ile Ala Glu Leu Pro Pro Lys

100 105 110

Val Ser Val Phe Val Pro Pro Arg Asp Gly Phe Phe Gly Asn Pro Arg

115 120 125

Lys Ser Lys Leu Ile Cys Gln Ala Thr Gly Phe Ser Pro Arg Gln Ile

130 135 140

Gln Val Ser Trp Leu Arg Glu Gly Lys Gln Val Gly Ser Gly Val Thr

145 150 155 160

Thr Asp Gln Val Gln Ala Glu Ala Lys Glu Ser Gly Pro Thr Thr Tyr

165 170 175

Lys Val Thr Ser Thr Leu Thr Ile Lys Glu Ser Asp Trp Leu Gly Gln

180 185 190

Ser Met Phe Thr Cys Arg Val Asp His Arg Gly Leu Thr Phe Gln Gln

195 200 205

Asn Ala Ser Ser Met Cys Val Pro Asp Gln Asp Thr Ala Ile Arg Val

210 215 220

Phe Ala Ile Pro Pro Ser Phe Ala Ser Ile Phe Leu Thr Lys Ser Thr

225 230 235 240

Lys Leu Thr Cys Leu Val Thr Asp Leu Thr Thr Tyr Asp Ser Val Thr

245 250 255

Ile Ser Trp Thr Arg Gln Asn Gly Glu Ala Val Lys Thr His Thr Asn

260 265 270

Ile Ser Glu Ser His Pro Asn Ala Thr Phe Ser Ala Val Gly Glu Ala

275 280 285

Ser Ile Cys Glu Asp Asp Trp Asn Ser Gly Glu Arg Phe Thr Cys Thr

290 295 300

Val Thr His Thr Asp Leu Pro Ser Pro Leu Lys Gln Thr Ile Ser Arg

305 310 315 320

Pro Lys Gly Val Ala Leu His Arg Pro Asp Val Tyr Leu Leu Pro Pro

325 330 335

Ala Arg Glu Gln Leu Asn Leu Arg Glu Ser Ala Thr Ile Thr Cys Leu

340 345 350

Val Thr Gly Phe Ser Pro Ala Asp Val Phe Val Gln Trp Met Gln Arg

355 360 365

Gly Gln Pro Leu Ser Pro Glu Lys Tyr Val Thr Ser Ala Pro Met Pro

370 375 380

Glu Pro Gln Ala Pro Gly Arg Tyr Phe Ala His Ser Ile Leu Thr Val

385 390 395 400

Ser Glu Glu Glu Trp Asn Thr Gly Glu Thr Tyr Thr Cys Val Val Ala

405 410 415

His Glu Ala Leu Pro Asn Arg Val Thr Glu Arg Thr Val Asp Lys Ser

420 425 430

Thr Gly Lys Pro Thr Leu Tyr Asn Val Ser Leu Val Met Ser Asp Thr

435 440 445

Ala Gly Thr Cys Tyr

450

<210> 51

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 间隔子

<400> 51

Lys Pro Cys Pro Pro Cys Lys Cys Pro

1 5

<210> 52

<211> 24

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> EGFR信号肽

<400> 52

Met Arg Pro Ser Gly Thr Ala Gly Ala Ala Leu Leu Ala Leu Leu Ala

1 5 10 15

Ala Leu Cys Pro Ala Ser Arg Ala

20

<210> 53

<211> 22

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> GM-CSF信号肽

<400> 53

Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro

1 5 10 15

Ala Phe Leu Leu Ile Pro

20

<210> 54

<211> 20

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人Igκ信号肽

<400> 54

Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser

1 5 10 15

Gly Ala Tyr Gly

20

<210> 55

<211> 16

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人CD33信号肽

<400> 55

Met Pro Leu Leu Leu Leu Leu Pro Leu Leu Trp Ala Gly Ala Leu Ala

1 5 10 15

<210> 56

<211> 121

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> R12 VH

<400> 56

Gln Glu Gln Leu Val Glu Ser Gly Gly Arg Leu Val Thr Pro Gly Gly

1 5 10 15

Ser Leu Thr Leu Ser Cys Lys Ala Ser Gly Phe Asp Phe Ser Ala Tyr

20 25 30

Tyr Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Ile

35 40 45

Ala Thr Ile Tyr Pro Ser Ser Gly Lys Thr Tyr Tyr Ala Thr Trp Val

50 55 60

Asn Gly Arg Phe Thr Ile Ser Ser Asp Asn Ala Gln Asn Thr Val Asp

65 70 75 80

Leu Gln Met Asn Ser Leu Thr Ala Ala Asp Arg Ala Thr Tyr Phe Cys

85 90 95

Ala Arg Asp Ser Tyr Ala Asp Asp Gly Ala Leu Phe Asn Ile Trp Gly

100 105 110

Pro Gly Thr Leu Val Thr Ile Ser Ser

115 120

<210> 57

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> R12 VH CDR1

<400> 57

Ala Tyr Tyr Met Ser

1 5

<210> 58

<211> 17

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> R12 VH CDR2

<400> 58

Thr Ile Tyr Pro Ser Ser Gly Lys Thr Tyr Tyr Ala Thr Trp Val Asn

1 5 10 15

Gly

<210> 59

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> R12 VH CDR3

<400> 59

Asp Ser Tyr Ala Asp Asp Gly Ala Leu Phe Asn Ile

1 5 10

<210> 60

<211> 112

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> R12 VL

<400> 60

Glu Leu Val Leu Thr Gln Ser Pro Ser Val Ser Ala Ala Leu Gly Ser

1 5 10 15

Pro Ala Lys Ile Thr Cys Thr Leu Ser Ser Ala His Lys Thr Asp Thr

20 25 30

Ile Asp Trp Tyr Gln Gln Leu Gln Gly Glu Ala Pro Arg Tyr Leu Met

35 40 45

Gln Val Gln Ser Asp Gly Ser Tyr Thr Lys Arg Pro Gly Val Pro Asp

50 55 60

Arg Phe Ser Gly Ser Ser Ser Gly Ala Asp Arg Tyr Leu Ile Ile Pro

65 70 75 80

Ser Val Gln Ala Asp Asp Glu Ala Asp Tyr Tyr Cys Gly Ala Asp Tyr

85 90 95

Ile Gly Gly Tyr Val Phe Gly Gly Gly Thr Gln Leu Thr Val Thr Gly

100 105 110

<210> 61

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> R12 VL CDR1

<400> 61

Thr Leu Ser Ser Ala His Lys Thr Asp Thr Ile Asp

1 5 10

<210> 62

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> R12 VL CDR2

<400> 62

Gly Ser Tyr Thr Lys Arg Pro

1 5

<210> 63

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> R12 VL CDR3

<400> 63

Gly Ala Asp Tyr Ile Gly Gly Tyr Val

1 5

<210> 64

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Gly/Ser接头 #1

<220>

<221> misc_feature

<222> (1)..(5)

<223> 其中序列可以重复大于1的整数

<400> 64

Gly Gly Gly Ser Gly

1 5

<210> 65

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Gly/Ser接头#2

<220>

<221> misc_feature

<222> (1)..(5)

<223> 其中序列可以重复大于1的整数

<400> 65

Gly Gly Gly Gly Ser

1 5

<210> 66

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Gly/Ser接头#3

<220>

<221> misc_feature

<222> (1)..(4)

<223> 其中序列可以重复大于1的整数

<400> 66

Gly Gly Gly Ser

1

<210> 67

<211> 3

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Gly/Ser接头 #4

<220>

<221> misc_feature

<222> (1)..(3)

<223> 其中序列可以重复大于1的整数

<400> 67

Gly Gly Ser

1

<210> 68

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Gly/Ser接头 #5

<400> 68

Gly Ser Gly Ser Gly Ser

1 5

<210> 69

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Gly/Ser接头 #6

<400> 69

Gly Gly Ser Gly Gly

1 5

<210> 70

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Gly/Ser接头 #7

<400> 70

Ser Gly Gly Ser Gly Gly Ser

1 5

<210> 71

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Gly/Ser接头 #8

<400> 71

Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Gly

1 5 10 15

<210> 72

<211> 16

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Gly/Ser接头 #9

<400> 72

Gly Gly Ser Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 73

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Gly/Ser接头 #10

<400> 73

Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly

1 5 10 15

Gly Ser

<210> 74

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Gly/Ser接头 #11

<400> 74

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

Claims

1.一种多核苷酸，所述多核苷酸包含

a.与SEQ ID NO:1中所示的核酸序列具有至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或至少约100％序列同一性的核苷酸序列；

b.与SEQ ID NO:2中所示的核酸序列具有至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；

c.与SEQ ID NO:4中所示的核酸序列具有至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；

d.与SEQ ID NO:5中所示的核酸序列具有至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；

e.与SEQ ID NO:6中所示的核酸序列具有至少88％、至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；

f.与SEQ ID NO:7中所示的核酸序列具有至少82％、至少83％、至少84％、至少85％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；

g.与SEQ ID NO:8中所示的核酸序列具有至少90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；

h.与SEQ ID NO:9中所示的核酸序列具有至少55％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；或

i.与SEQ ID NO:10中所示的核酸序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％序列同一性的核苷酸序列；

其中所述核苷酸序列编码AP-1转录因子。

2.一种多核苷酸，所述多核苷酸包含与SEQ ID NO:1中所示的核酸序列具有至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中所述核苷酸序列编码AP-1转录因子。

3.如权利要求2所述的多核苷酸，其中所述核苷酸序列包含SEQ ID NO:1中所示的核酸序列。

4.一种多核苷酸，所述多核苷酸包含与SEQ ID NO:2中所示的核酸序列具有至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中所述核苷酸序列编码AP-1转录因子。

5.如权利要求4所述的多核苷酸，其中所述核苷酸序列包含SEQ ID NO:2中所示的核酸序列。

6.一种多核苷酸，所述多核苷酸包含与SEQ ID NO:4中所示的核酸序列具有至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中所述核苷酸序列编码AP-1转录因子。

7.如权利要求6所述的多核苷酸，其中所述核苷酸序列包含SEQ ID NO:4中所示的核酸序列。

8.一种多核苷酸，所述多核苷酸包含与SEQ ID NO:5中所示的核酸序列具有至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中所述核苷酸序列编码AP-1转录因子。

9.如权利要求8所述的多核苷酸，其中所述核苷酸序列包含SEQ ID NO:5中所示的核酸序列。

10.一种多核苷酸，所述多核苷酸包含与SEQ ID NO:6中所示的核酸序列具有至少88％、至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中所述核苷酸序列编码AP-1转录因子。

11.如权利要求10所述的多核苷酸，其中所述核苷酸序列包含SEQ ID NO:6中所示的核酸序列。

12.一种多核苷酸，所述多核苷酸包含与SEQ ID NO:7中所示的核酸序列具有至少82％、至少83％、至少84％、至少85％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中所述核苷酸序列编码AP-1转录因子。

13.如权利要求12所述的多核苷酸，其中所述核苷酸序列包含SEQ ID NO:7中所示的核酸序列。

14.一种多核苷酸，所述多核苷酸包含与SEQ ID NO:8中所示的核酸序列具有至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中所述核苷酸序列编码AP-1转录因子。

15.如权利要求14所述的多核苷酸，其中所述核苷酸序列包含SEQ ID NO:8中所示的核酸序列。

16.一种多核苷酸，所述多核苷酸包含与SEQ ID NO:9中所示的核酸序列具有至少55％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中所述核苷酸序列编码AP-1转录因子。

17.如权利要求16所述的多核苷酸，其中所述核苷酸序列包含SEQ ID NO:9中所示的核酸序列。

18.一种多核苷酸，所述多核苷酸包含与SEQ ID NO:10中所示的核酸序列具有至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的核苷酸序列；其中所述核苷酸序列编码AP-1转录因子。

19.如权利要求18所述的多核苷酸，其中所述核苷酸序列包含SEQ ID NO:10中所示的核酸序列。

20.如权利要求1至19中任一项所述的多核苷酸，其中所述AP-1转录因子包含与SEQ IDNO:9中所示的序列具有至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。

21.如权利要求1至20中任一项所述的多核苷酸，其还包含编码配体结合蛋白的核苷酸序列。

22.如权利要求21所述的多核苷酸，其中所述配体结合蛋白包含嵌合抗原受体(CAR)、T细胞受体(TCR)、嵌合抗体-T细胞受体(caTCR)、嵌合信号传导受体(CSR)、T细胞受体模拟物(TCR模拟物)或其组合。

23.如权利要求22所述的多核苷酸，其中所述CAR被设计为标准CAR、分体式CAR、关闭开关CAR、开启开关CAR、第一代CAR、第二代CAR、第三代CAR或第四代CAR。

24.如权利要求21至23中任一项所述的多核苷酸，其中所述配体结合蛋白包含抗原结合结构域、跨膜结构域、共刺激结构域和/或细胞内信号传导结构域。

25.如权利要求24所述的多核苷酸，其中所述抗原结合结构域特异性结合选自由以下组成的组的抗原：AFP(甲胎蛋白)、αvβ6或另一种整联蛋白、BCMA、Braf、B7-H3、B7-H6、CA9(碳酸酐酶9)、CCL-1(C-C基序趋化因子配体1)、CD5、CD19、CD20、CD21、CD22、CD23、CD24、CD30、CD33、CD38、CD40、CD44、CD44v6、CD44v7/8、CD45、CD47、CD56、CD66e、CD70、CD74、CD79a、CD79b、CD98、CD123、CD138、CD171、CD352、CEA(癌胚抗原)、密封蛋白18.2、密封蛋白6、c-MET、DLL3(δ样蛋白3)、DLL4、ENPP3(外切核苷酸焦磷酸酶/磷酸二酯酶家族成员3)、EpCAM、EPG-2(上皮糖蛋白2)、EPG-40、肝配蛋白B2、EPHa2(ephrine受体A2)、ERBB二聚体、雌激素受体、ETBR(内皮素B受体)、FAP-α(成纤维细胞活化蛋白α)、胎儿AchR(胎儿乙酰胆碱受体)、FBP(叶酸结合蛋白)、FCRL5、FR-α(叶酸受体α)、GCC(鸟苷酸环化酶C)、GD2、GD3、GPC2(磷脂酰肌醇蛋白聚糖2)、GPC3、gp100(糖蛋白100)、GPNMB(糖蛋白NMB)、GPRC5D(G蛋白偶联受体5D)、HER2、HER3、HER4、乙型肝炎表面抗原、HLA-A1(人白细胞抗原Al)、HLA-A2(人白细胞抗原A2)、HMW-MAA(人高分子量黑素瘤相关抗原)、IGF1R(胰岛素样生长因子1受体)、Igκ、Igλ、IL-22Ra(IL-22受体α)、IL-13Ra2(IL-13受体α2)、KDR(激酶插入结构域受体)、LI细胞粘附分子(LI-CAM)、Liv-1、LRRC8A(含有富亮氨酸重复序列的蛋白8家族成员A)、Lewis Y、黑素瘤相关抗原(MAGE)-A1、MAGE-A3、MAGE-A6、MART-1(melan A)、鼠巨细胞病毒(MCMV)、MCSP(黑素瘤相关硫酸软骨素蛋白聚糖)、间皮素、粘蛋白1(MUC1)、MUC16、MHC/肽复合物(例如，与衍生自AFP、KRAS、HPV、NY-ESO、MAGE-A和WT1的肽复合的HLA-A)、NCAM(神经细胞粘附分子)、Nectin-4、NKG2D(自然杀伤细胞家族2成员D)配体、NY-ESO、癌胚抗原、PD-1、PD-L1、PRAME(黑素瘤优先表达抗原)、孕酮受体、PSA (前列腺特异性抗原)、PSCA(前列腺干细胞抗原)、PSMA(前列腺特异性膜抗原)、ROR1、ROR2、SIRPα(信号调节蛋白α)、SLIT、SLITRK6(NTRK样蛋白6)、STEAP1(前列腺六段跨膜上皮抗原1)、存活素、TAG72(肿瘤相关糖蛋白72)、TPBG(滋养层糖蛋白)、Trop-2、VEGFR1(血管内皮生长因子受体1)、VEGFR2、以及来自HIV、HBV、HCV、HPV和其他病原体的抗原以及其任何组合。

26.如权利要求25所述的多核苷酸，其中所述抗原结合结构域特异性结合ROR1。

27.如权利要求25所述的多核苷酸，其中所述抗原结合结构域特异性结合GPC2。

28.如权利要求24至27中任一项所述的多核苷酸，其中所述共刺激结构域包含白介素-2受体(IL-2R)、白介素-12受体(IL-12R)、IL-7、IL-21、IL-23、IL-15、CD2、CD3、CD4、CD7、CD8、CD27、CD28、CD30、CD40、4-1BB/CD137、ICOS、淋巴细胞功能相关抗原-1(LFA-1)、LIGHT、NKG2C、OX40、DAP10或其任何组合。

29.如权利要求28所述的多核苷酸，其中所述共刺激结构域包含4-1BB/CD137共刺激结构域。

30.如权利要求24至29中任一项所述的多核苷酸，其中所述跨膜结构域包括KIRDS2、OX40、CD2、CD27、LFA-1(CD11a、CD18)、ICOS(CD278)、4-1BB(CD137)、GITR、CD40、BAFFR、HVEM(LIGHTR)、SLAMF7、NKp80(KLRF1)、NKp44、NKp30、NKp46、CD160、CD19、IL2Rβ、IL2Rγ、IL7Rα、ITGA1、VLA1、CD49a、ITGA4、IA4、CD49D、ITGA6、VLA-6、CD49f、ITGAD、CD11d、ITGAE、CD103、ITGAL、CD11a、LFA-1、ITGAM、CD11b、ITGAX、CD11c、ITGB1、CD29、ITGB2、CD18、LFA-1、ITGB7、TNFR2、DNAM1(CD226)、SLAMF4(CD244、2B4)、CD84、CD96(触觉)、CEACAM1、CRTAM、Ly9(CD229)、CD160(BY55)、PSGL1、CD100(SEMA4D)、SLAMF6(NTB-A、Ly108)、SLAM(SLAMF1、CD150、IPO-3)、BLAME(SLAMF8)、SELPLG(CD162)、LTBR、PAG/Cbp、NKG2D、NKG2C、CD19或其任何组合的跨膜结构域区域。

31.如权利要求24至30中任一项所述的多核苷酸，其中所述跨膜结构域包含CD28跨膜结构域。

32.如权利要求24至31中任一项所述的多核苷酸，其中所述细胞内信号传导结构域包括衍生自CD3ζ、FcRγ、共同FcRγ(FCER1G)、FcγRIIa、FcRβ(FcεRib)、CD3γ、CD3δ、CD3ε、CD22、CD79a、CD79b、CD278(“ICOS”)、FcεRI、CD66d、CD32、DAP10、DAP12或其任何组合的细胞内信号传导结构域区域。

33.如权利要求32所述的多核苷酸，其中所述细胞内信号传导结构域包括CD3ζ细胞内信号传导结构域。

34.如权利要求22所述的多核苷酸，其中所述TCR特异性结合肿瘤抗原/MHC复合物。

35.如权利要求34所述的多核苷酸，其中所述肿瘤抗原衍生自AFP、CD19、BCMA、CLL-1、CS1、CD38、CD19、TSHR、CD123、CD22、CD30、CD171、CD33、EGFRvIII、GD2、GD3、Tn Ag、PSMA、ROR1、ROR2、GPC1、GPC2、FLT3、FAP、TAG72、CD44v6、CEA、EPCAM、B7H3、KIT、IL-13Ra2、间皮素、IL-l lRa、PSCA、PRSS21、VEGFR2、LewisY、CD24、PDGFR-β、SSEA-4、CD20、叶酸受体α、ERBB2(Her2/neu)、MUC1、MUC16、EGFR、NCAM、前列腺酶、PAP、ELF2M、肝配蛋白B2、IGF-I受体、CAIX、LMP2、gplOO、bcr-abl、酪氨酸酶、EphA2、岩藻糖基GM1、sLe、GM3、TGS5、HMWMAA、o-乙酰基-GD2、叶酸受体β、TEM1/CD248、TEM7R、CLDN6、GPRC5D、CXORF61、CD97、CD179a、ALK、多唾液酸、PLAC1、GloboH、NY-BR-1、UPK2、HAVCR1、ADRB3、PANX3、GPR20、LY6K、OR51E2、TARP、WTl、NY-ESO-1、LAGE-la、MAGE-Al、legumain、HPV(例如，HPV E6,E7)、MAGE Al、ETV6-AML、精子蛋白17、XAGE1、Tie 2、MAD-CT-1、MAD-CT-2、Fos相关抗原1、p53、p53突变体、prostein、存活素、端粒酶、PCTA-1/半乳糖凝集素8、MelanA/MARTl、Ras突变体(例如，HRAS、KRAS、NRAS)、hTERT、肉瘤易位断点、ML-IAP、ERG(TMPRSS2 ETS融合基因)、NA17、PAX3、雄激素受体、细胞周期蛋白Bl、MYCN、RhoC、TRP-2、CYP1B1、BORIS、SART3、PAX5、OY-TES1、LCK、AKAP-4、SSX2、RAGE-1、人端粒酶逆转录酶、RU1、RU2、肠羧基酯酶、mut hsp70-2、CD79a、CD79b、CD72、LAIR1、FCAR、LILRA2、CD300LF、CLEC12A、BST2、EMR2、LY75、GPC3、FCRL5、IGLL1、CD2、CD3ε、CD4、CD5、CD7、APRIL蛋白的细胞外部分、新抗原或其任何组合。

36.如权利要求21至35中任一项所述的多核苷酸，其中所述AP-1转录因子通过接头连接至所述嵌合结合蛋白。

37.如权利要求36所述的多核苷酸，其中所述接头包含可切割接头。

38.如权利要求36或37所述的多核苷酸，其中所述接头是P2A接头、T2A接头、F2A接头、E2A接头、弗林蛋白酶切割位点或其任何组合。

39.如权利要求36至38中任一项所述的多核苷酸，其中所述接头包含与SEQ ID NO:10中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。

40.如权利要求36至39中任一项所述的多核苷酸，其中所述接头包含SEQ ID NO:10中所示的氨基酸序列。

41.如权利要求1至38中任一项所述的多核苷酸，其还包含编码截短的EGFR(EGFRt)的核酸序列。

42.如权利要求41所述的多核苷酸，其中所述EGFRt包含与SEQ ID NO:24中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。

43.如权利要求41或42所述的多核苷酸，其中所述EGFRt包含SEQ ID NO:24中所示的氨基酸序列。

44.如权利要求41至43中任一项所述的多核苷酸，其中所述EGFRt通过接头连接到所述AP-1转录因子和/或所述嵌合结合蛋白。

45.如权利要求44所述的多核苷酸，其中所述接头包含可切割接头。

46.如权利要求44或45所述的多核苷酸，其中所述接头是P2A接头、T2A接头、F2A接头、E2A接头、弗林蛋白酶切割位点或其任何组合。

47.如权利要求44至46中任一项所述的多核苷酸，其中所述接头包含与SEQ ID NO:12中所示的氨基酸序列具有至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。

48.如权利要求44至47中任一项所述的多核苷酸，其中所述接头包含SEQ ID NO:12中所示的氨基酸序列。

49.一种载体，所述载体包含如权利要求1至48中任一项所述的多核苷酸和调控元件。

50.如权利要求49所述的载体，所述载体是多顺反子表达载体。

51.如权利要求49或50所述的载体，其中所述调控元件包含启动子。

52.如权利要求51所述的载体，其中所述启动子包括dl587rev引物结合位点取代的(MND)启动子、EF1a启动子、泛素启动子或其组合。

53.如权利要求49至52中任一项所述的载体，其中所述载体包括病毒载体、哺乳动物载体或细菌载体。

54.如权利要求49至53中任一项所述的载体，所述载体是腺病毒载体、慢病毒、仙台病毒载体、杆状病毒载体、爱泼斯坦巴尔病毒载体、乳多空病毒载体、痘苗病毒载体、单纯疱疹病毒载体、杂交载体或腺相关病毒(AAV)载体。

55.如权利要求54所述的载体，所述载体是慢病毒。

56.一种组合物，所述组合物包含权利要求1至46中任一项所述的多核苷酸或权利要求47至51中任一项所述的载体。

57.一种试剂盒，所述试剂盒包含权利要求1至48中任一项所述的多核苷酸、权利要求49至55中任一项所述的载体或权利要求56所述的组合物。

58.一种多肽，所述多肽包含由权利要求1至48中任一项所述的多核苷酸编码的AP-1转录因子、权利要求49至55中任一项所述的载体或权利要求56所述的组合物。

59.一组多肽，所述多肽组包含权利要求58所述的多肽、由权利要求21至48中任一项所述的多核苷酸编码的配体结合蛋白和/或权利要求41至48中任一项所述的EGFRt。

60.一种细胞，所述细胞包含权利要求1至48中任一项所述的多核苷酸、权利要求49至55中任一项所述的载体、权利要求56所述的组合物、权利要求58所述的多肽或如权利要求59所述的多肽组。

61.如权利要求60所述的细胞，其中所述细胞包括免疫细胞。

62.如权利要求60或61所述的细胞，其中所述细胞包括T细胞、B细胞、调节性T细胞(Treg)、自然杀伤(NK)细胞、自然杀伤T(NKT)细胞、干细胞或诱导多能干细胞。

63.一种药物组合物，所述药物组合物包含权利要求1至48中任一项所述的多核苷酸、如权利要求49至55中任一项所述的载体、权利要求58所述的多肽、权利要求59所述的多肽组或如权利要求60至62中任一项所述的细胞，和药学上可接受的载体。

64.如权利要求60至62中任一项所述的细胞或如权利要求63所述的药物组合物，其用于治疗需要治疗的受试者。

65.如权利要求1至48中任一项所述的多核苷酸、如权利要求49至55中任一项所述的载体、如权利要求56所述的组合物、如权利要求58所述的多肽、如权利要求59所述的多肽组、如权利要求60至62中任一项所述的细胞或如权利要求63所述的药物组合物，其用于减少或防止可用于治疗的细胞的耗竭。

66.如权利要求60至62中任一项所述的细胞或如权利要求63所述的药物组合物在制造用于治疗或预防有需要的受试者的疾病或疾患的药物中的用途。

67.如权利要求66所述的用途，其中所述疾病或疾患是癌症。

68.如权利要求1至48中任一项所述的多核苷酸、如权利要求49至55中任一项所述的载体、如权利要求56所述的组合物、如权利要求58所述的多肽、如权利要求59所述的多肽组、如权利要求60至62中任一项所述的细胞或如权利要求63所述的药物组合物用于防止或减少可用于治疗的细胞的耗竭的用途。

69.一种治疗或预防有需要的受试者的疾病或疾患的方法，所述方法包括向所述受试者施用权利要求60至62中任一项所述的细胞或权利要求63所述的药物组合物。

70.如权利要求69所述的方法，其中所述疾病或疾患是癌症。

71.一种增加细胞中c-Jun多肽表达的方法，所述方法包括修饰细胞以包含权利要求1至48中任一项所述的多核苷酸、权利要求49至55中任一项所述的载体、权利要求56所述的组合物、权利要求58所述的多肽或权利要求59所述的多肽组，其中在修饰后，与已经用野生型c-Jun多核苷酸修饰的相应细胞相比，所述细胞中c-Jun多肽的表达增加。

72.如权利要求71所述的方法，其中与所述相应细胞相比，所述c-Jun多肽的表达增加至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约16倍、至少约17倍、至少约18倍、至少约19倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍、至少约75倍、至少约100倍、至少约200倍、至少约300倍、至少约400倍、至少约500倍、至少约750倍，或至少约1,000倍或更多。

73.如权利要求71或72所述的方法，其中与所述相应细胞相比，所述c-Jun多肽的表达增加约1倍、约2倍、约3倍、约4倍、约5倍、约6倍、约7倍、约8倍、约9倍或约10倍。