CN117979979A - 用于改进的免疫疗法的方法和组合物 - Google Patents

用于改进的免疫疗法的方法和组合物 Download PDF

Info

Publication number
CN117979979A
CN117979979A CN202280058758.3A CN202280058758A CN117979979A CN 117979979 A CN117979979 A CN 117979979A CN 202280058758 A CN202280058758 A CN 202280058758A CN 117979979 A CN117979979 A CN 117979979A
Authority
CN
China
Prior art keywords
cells
cell
ltbr
nucleic acid
lymphocyte
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280058758.3A
Other languages
English (en)
Inventor
N·E·桑贾纳
M·莱古特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New York University NYU
New York Genome Center Inc
Original Assignee
New York University NYU
New York Genome Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New York University NYU, New York Genome Center Inc filed Critical New York University NYU
Priority claimed from PCT/US2022/073294 external-priority patent/WO2023279049A1/en
Publication of CN117979979A publication Critical patent/CN117979979A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文提供了核酸、表达盒、经修饰的淋巴细胞和包括所述核酸、表达盒、经修饰的淋巴细胞的组合物,所述核酸、表达盒、经修饰的淋巴细胞包含编码表1的基因的序列。在一些实施例中,所述基因是LTBR。在某些实施例中,所述细胞是T细胞。在某些实施例中,所述细胞进一步包括CAR或经工程化的TCR。还描述了使用所提供的组合物的治疗方法。

Description

用于改进的免疫疗法的方法和组合物
政府支持声明
本发明是在美国国立卫生研究院(National Institutes of Health)授予的R00HG008171、DP2HG010099和R01CA218668以及美国国防部高级研究计划局(DefenseAdvanced Research Projects Agency)授予的D18AP00053下由政府支持完成的。政府拥有本发明中的某些权利。
背景技术
使用针对所选肿瘤抗原重新定向的经工程化的自体患者T细胞的细胞免疫疗法对血癌产生了很好的功效,迄今为止,美国食品和药物管理局(FDA)批准了五种嵌合抗原受体(CAR)6。相比之下,由于肿瘤微环境中的T细胞效应子功能的抑制,对实体瘤的CAR疗法显示出低得多的总体功效。即使对于血液恶性肿瘤,除了B急性淋巴母细胞性白血病之外,大多数患者也不会经历持久的应答,抗性主要是由于T细胞功能障碍而不是抗原丧失7。在鉴定导致T细胞功能障碍的基因和通路方面已经付出了相当大的努力8,9。然而,迄今为止,对T细胞功能的调节剂的全面、全基因组筛选仅限于功能丧失筛选2-4
CRISPR基因组工程的进展使得以可扩展和可定制的方式轻松敲除基因组中的每个基因成为可能。虽然其大尺寸使得通过慢病毒将Cas9递送至原代T细胞具有挑战性(尽管并非不可能10),但替代性方法已经开发出来,其依赖于Cas9蛋白2或mRNA11的瞬时递送,或依赖于经工程化的等基因小鼠品系中的组成型Cas9表达3。然而,这些方法不适用于人细胞中的功能获得筛选,所述筛选需要驱动靶基因表达的转录激活因子的持续表达。
需要的是用于更有效免疫疗法的改进的组合物和方法。
发明内容
一方面,本文提供了一种经修饰的淋巴细胞,所述经修饰的淋巴细胞包括编码表1的基因的外源性核酸。在某些实施例中,所述基因是LTBR。在其它实施例中,所述基因是LTBR、ADA、IFNL2、IL12B CALML3 MRPL51、DBI GPN3、ITM2A、AHNAK、BATF、GPD1、ATF6B、AHCY、DUPD1或AKR1C4。
在一个实施例中,所述淋巴细胞包括表达盒,所述表达盒包括表达控制序列和编码表1的基因的核酸。在某些实施例中,所述基因是LTBR。在其它实施例中,所述基因是LTBR、ADA、IFNL2、IL12B CALML3 MRPL51、DBI GPN3、ITM2A、AHNAK、BATF、GPD1、ATF6B、AHCY、DUPD1或AKR1C4。
在某些实施例中,所述淋巴细胞进一步包括编码嵌合抗原受体(CAR)的核酸。在某些实施例中,所述CAR是阿基仑赛(Axicabtagene ciloleucel)布瑞基奥仑赛(Brexucabtagene autoleucel)(TecartusTM)、艾基维仑赛(Idecabtagene vicleucel)(AbecmaTM)、利基迈仑赛(Lisocabtagene maraleucel)/>替沙仑赛(Tisagenlecleucel)/>或在图19中发现的那些中的一者。在某些实施例中,所述CAR是嵌合自身抗体受体(CAAR)。在某些实施例中,所述淋巴细胞进一步包括编码T细胞受体(TCR)的核酸。在某些实施例中,所述TCR选自在图17中发现的那些。在某些实施例中,所述淋巴细胞是T细胞。
另一方面,提供了一种疫苗组合物,所述疫苗组合物包括编码表1的基因的核酸和编码病毒蛋白的核酸。在某些实施例中,所述病毒蛋白是糖蛋白。在某些实施例中,所述糖蛋白是病毒刺突蛋白,任选地是冠状病毒刺突蛋白。在某些实施例中,编码表1的所述基因的核酸是mRNA,或者编码所述病毒刺突蛋白的核酸是mRNA,或者两者都是。在某些实施例中,所述基因是LTBR。在其它实施例中,所述基因是LTBR、ADA、IFNL2、IL12B CALML3MRPL51、DBI GPN3、ITM2A、AHNAK、BATF、GPD1、ATF6B、AHCY、DUPD1或AKR1C4。
另一方面,提供了一种表达盒,所述表达盒包括编码嵌合抗原受体的核苷酸序列和编码表1的基因的核酸。在某些实施例中,所述基因是LTBR。在其它实施例中,所述基因是LTBR、ADA、IFNL2、IL12B CALML3 MRPL51、DBI GPN3、ITM2A、AHNAK、BATF、GPD1、ATF6B、AHCY、DUPD1或AKR1C4。
另一方面,提供了一种表达盒,所述表达盒包括编码T细胞受体的核酸和编码表1的基因的核酸。在某些实施例中,所述基因是LTBR。在其它实施例中,所述基因是LTBR、ADA、IFNL2、IL12B CALML3 MRPL51、DBI GPN3、ITM2A、AHNAK、BATF、GPD1、ATF6B、AHCY、DUPD1或AKR1C4。
另一方面,提供了一种表达盒,所述表达盒包括编码病毒蛋白的核酸和编码表1的基因的核酸。在某些实施例中,所述基因是LTBR。在其它实施例中,所述基因是LTBR、ADA、IFNL2、IL12B CALML3 MRPL51、DBI GPN3、ITM2A、AHNAK、BATF、GPD1、ATF6B、AHCY、DUPD1或AKR1C4。
另一方面,一种产生经修饰的淋巴细胞的方法,所述方法包括将编码表1的基因的外源性核酸引入到所述细胞中。在某些实施例中,所述淋巴细胞包括表达盒,所述表达盒包括表达控制序列和编码表1的基因的核酸。在某些实施例中,所述基因是LTBR。在其它实施例中,所述基因是LTBR、ADA、IFNL2、IL12B CALML3 MRPL51、DBI GPN3、ITM2A、AHNAK、BATF、GPD1、ATF6B、AHCY、DUPD1或AKR1C4。在某些实施例中,所述淋巴细胞进一步包括编码嵌合抗原受体(CAR)的核酸。在其它实施例中,所述淋巴细胞进一步包括编码经工程化的T细胞受体(TCR)的核酸。
另一方面,提供了一种治疗有需要的受试者的癌症的方法。所述方法包含向有需要的受试者施用如本文所描述的组合物。在某些实施例中,所述受试者患有实体瘤。在某些实施例中,所述受试者患有淋巴瘤,任选地B细胞淋巴瘤、滤泡性淋巴瘤或套细胞淋巴瘤。在某些实施例中,所述受试者患有白血病。在某些实施例中,所述受试者患有多发性骨髓瘤。在某些实施例中,所述受试者患有病毒驱动的癌症,任选地伯基特氏淋巴瘤(Burkitt'slymphoma)、肝癌、卡波西肉瘤(Kaposi's sarcoma)、宫颈癌、头癌、颈癌、肛门癌、口腔癌、咽癌、阴茎癌、成人T细胞淋巴瘤或梅克尔细胞癌(merkel cell carcinoma)。
另一方面,提供了一种治疗有需要的受试者的病毒性疾病的方法。所述方法包含向有需要的受试者施用如本文所描述的组合物。在某些实施例中,所述疾病是HIV。在某些实施例中,所述疾病是HPV。在某些实施例中,所述疾病是自身免疫性病症。
另一方面,提供了一种治疗有需要的受试者的自身免疫性疾病的方法。所述方法包含向有需要的受试者施用如本文所描述的组合物。
另一方面,一种增加增殖或包含细胞因子产生和/或分泌的T细胞效应子功能的方法,所述方法包括向T细胞施用如本文所描述的组合物。在某些方面,所述T细胞是在处理所述T细胞以过表达表1的所述基因之前从人获得的,并且将经处理的T细胞重新引入到人体内。在某些实施例中,所述基因是LTBR。在其它实施例中,所述基因是LTBR、ADA、IFNL2、IL12B CALML3 MRPL51、DBI GPN3、ITM2A、AHNAK、BATF、GPD1、ATF6B、AHCY、DUPD1或AKR1C4。
另一方面,提供了一种增加对疫苗组合物的应答的方法。所述方法包含与疫苗共施用编码表1的基因的核酸。在某些实施例中,所述基因是LTBR。在其它实施例中,所述基因是LTBR、ADA、IFNL2、IL12B CALML3 MRPL51、DBI GPN3、ITM2A、AHNAK、BATF、GPD1、ATF6B、AHCY、DUPD1或AKR1C4。
在本文所描述的方法中的任何方法的某些实施例中,表1的所述基因的表达是瞬时的。
另一方面,提供了一种鉴定基因的方法,所述基因当在经修饰的淋巴细胞中外源性地表达时改变所述经修饰的淋巴细胞的治疗功能。所述方法包含:(a)获得淋巴细胞群体;(b)用多个病毒载体转导所述淋巴细胞群体,每个病毒载体编码能够与一个或多个条形码连接的基因;(c)刺激经转导的淋巴细胞以诱导激活、增殖和/或效应子功能;(d)从(c)的所述淋巴细胞群体中分离经转导的淋巴细胞;以及(e)检测经分离的淋巴细胞中的所述基因和/或连接的条形码的存在;其中检测到的基因可有效改变表达所述基因的经修饰的淋巴细胞的所述治疗功能。在某些实施例中,所述基因是开放阅读框(ORF)或编码非编码RNA的核苷酸序列,任选地是微小RNA(miRNA)或长非编码RNA(lncRNA,长ncRNA)。在某些实施例中,其中所述淋巴细胞群体包括已富集T细胞、B细胞、NK T细胞、NK细胞或其亚群体中的一种或多种的细胞群体,任选地其中所述细胞是人。在某些实施例中,所述多个病毒载体包括开放阅读框(ORF)的文库。在某些实施例中,所述病毒载体是逆转录病毒载体或慢病毒载体。在某些实施例中,刺激所述经转导的淋巴细胞包括用抗体、细胞因子、抗原、超抗原、抗原呈递细胞、癌细胞和癌细胞系中的一者或多者培养所述淋巴细胞。在某些实施例中,所述转导的淋巴细胞的刺激包括TCR刺激,任选地包括CD3/CD28刺激。在某些实施例中,所述方法进一步包含:用细胞增殖染料标记所述经转导的淋巴细胞;以及分离后代细胞。在某些实施例中,步骤(d)包括鉴定表达一种或多种细胞表面标志物和/或一种或多种效应子功能和/或一种或多种分泌的细胞因子的细胞。在某些实施例中,步骤(e)包括从所述经分离的淋巴细胞获得基因组DNA,并对所述基因和/或条形码序列进行PCR扩增。在某些实施例中,步骤(e)进一步包括单细胞转录组和/或蛋白质组分析。在某些实施例中,(e)包括流式细胞术分析、细胞哈希、单细胞测序分析、单细胞RNA测序(scRNA-seq)、Perturb-seq、CROP-seq、CRISP-seq、ECCITE-seq或转录组和表位的细胞索引(CITE-seq)。
另一方面,提供了一种分析所关注ORF的过表达对单个细胞的效应的方法。所述方法包含:(a)将包括编码所述所关注ORF的核酸的表达盒引入到所述细胞中并过表达所述ORF;(b)将源自所述单个细胞的第一组核酸和具有共同条形码序列的寡核苷酸提供到离散分区中,其中所述寡核苷酸与珠粒可释放地连接,其中所述第一组核酸包括内源性转录组mRNA和ORF mRNA;(c)进行RT-PCR以产生源自所述第一组核酸的第二组核酸,其中所述分区内的所述第二组核酸具有与其连接的包括所述共同核酸条形码序列的寡核苷酸,并且其中所述RT-PCR使用RT-PCR试剂进行,所述RT-PCR试剂包括与所述ORF mRNA上的序列特异性粘接的引物,所述序列不是poly A序列,并且其中所述第二组核酸包括内源性转录组cDNA和ORF cDNA;(d)使用PCR试剂扩增所述第二组核酸以产生第三组核酸,所述PCR试剂包括与所述ORF cDNA上的序列特异性粘接的第二引物,所述序列不是poly A序列;以及(e)检测所述条形码序列、所述转录组cDNA和/或所述ORF cDNA和/或对其进行测序。在某些实施例中,步骤(e)进一步包括单细胞转录组和/或蛋白质组分析。在某些实施例中,(e)包括流式细胞术分析、细胞哈希、单细胞测序分析、单细胞RNA测序(scRNA-seq)、Perturb-seq、CROP-seq、CRISP-seq、ECCITE-seq或转录组和表位的细胞索引(CITE-seq)。
在某些实施例中,所述方法包含获得所述第三组核酸的一部分,并使用第二组PCR试剂扩增所述ORF cDNA,以产生第四组核酸,所述第二组PCR试剂包括第三引物,所述第三引物与所述ORF cDNA上的序列特异性粘接,所述序列不是poly A序列。
在某些实施例中,所述方法包含使用第三组PCR试剂扩增所述第四组核酸中的所述ORF cDNA,以产生第五组核酸,所述第三组PCR试剂包括第四引物,所述第四引物与所述ORF cDNA上的序列特异性粘接,所述序列不是poly A序列;并且其中步骤(e)包括将所述第三组和所述第五组核酸片段化,将适配子与末端连接,并进行NGS。
根据本发明的以下详细描述,本发明的其它方面和优点将变得显而易见。
附图说明
图1A-图1B示出了鉴定促进原代人T细胞的增殖的基因的基因组规模的过表达筛选。(图1A)汇集的ORF屏幕的概述。从三名健康供体的外周血中分别分离CD4+和CD8+ T细胞。然后将带条形码的基因组规模的ORF文库引入到CD3/CD28刺激的T细胞中,接着选择经转导的细胞。在培养14天之后,将T细胞用羧基荧光素琥珀酰亚胺酯(CFSE)标记并再刺激以诱导增殖。通过比较细胞分选前后特定ORF条形码的计数,鉴定了CFSE低群体中富集的ORF。这些基因包含LTBR、VSTM1、CD59、IL12B、1L23A、MAPK3、ADA和DBI。(图1B)基于每个基因的单个条形码的一致富集,示出了CFSECD4+和CFSECD8+ T细胞两者中的基因的稳健排序整合。
图2A-图2F示出了排序靠前的ORF的过表达增加了CD4+和CD8+ T细胞的增殖、激活和细胞因子分泌。(图2A)分别分离来自筛选非依赖性供体的CD4+和CD8+ T细胞,并且然后用编码排序靠前的ORF的慢病毒和选择标志物一起转导。在转导和选择之后,再刺激T细胞,然后测量增殖、激活标志物的表达和细胞因子分泌。(图2B)用排序靠前的基因转导的T细胞的增殖作为相对增殖,其被定义为经刺激的细胞与对应未经刺激的对照的比率,相对于tNGFR归一化。每个过表达的基因至少测试两个供体,生物学一式三份。框示出第25-第75个百分位数,平均值处有一条线;箱须延伸到最大值和最小值。DUPD1也称为DUSP29。(图2C)CD4+和CD8+ T细胞中的ORF转导的T细胞的平均相对增殖,相对于tNGFR归一化。两个T细胞亚群或其中一个亚群中的显著基因被标记(斯图登氏双边t测试P<0.05,并且假发现率<0.1)。(图2D)CD25或CD154在再刺激之后的代表性表达。直方图上的数字与门控细胞(CD8+CD154+)的百分比或平均荧光强度(MFI)相对应。虚线指示用于列举CD154+细胞(CD8+)或对照(tNGFR)细胞的MFI的门。(图2E)IL-2和IFNγ在再刺激之后的分泌,相对于tNGFR归一化。仅示出了显著增加CD4+、CD8+或两种T细胞亚群中的T细胞增殖的基因。每个基因至少测试两个供体,一式三份。框示出第25-第75个百分位数,平均值处有一条线;箱须延伸到最大值和最小值。(图2F)CD8+或CD4+ T细胞中给定ORF显著(P<0.05)改进的不同T细胞激活表型之间的交叉。
图3A-图3E示出了单细胞OverCITE-seq鉴定了由T细胞中的基因过表达诱导的共享和不同的转录程序。(图3A)OverCITE-seq捕获单细胞中的过表达(ORF)构建体、转录组、TCR克隆型、细胞表面蛋白和治疗哈希标签。(图3B)静息和CD3/CD28刺激的T细胞的ORF分配率。(图3C)抗体源性标签测序(ADT;右)在tNGFR转导的T细胞中产生的NGFR表达与用tNGFR转导的T细胞的流式细胞术(左)产生的NGFR表达类似。未经转导的细胞(左)或分配非tNGFRORF的细胞(右)示出为灰色。(图3D)在对OverCITE-seq捕获的ORF单重态进行无监督聚类之后,单细胞转录组的均匀流形近似和投影(UMAP)表示。左上方的插图鉴定了治疗哈希标签所给出的刺激和静息T细胞。对于每个簇,示出了前20个差异表达的基因的亚群。HIST1H1B也被称为Hl-5并且HIST1H3C也被称为H3C3。(图3E)两个代表性簇中的ORF患病率。标准化残差值来自卡方测试(chi-squared test)。示出了所关注ORF。
图4A-图4K示出了LTBR过表达通过激活典型NF-κB通路改进T细胞功能。(图4A)静息LTBR和tNGFR(阴性对照)T细胞中的基因的差异表达。用红色突出显示的基因是表达有两倍或更大变化的基因并且经调整的P<0.05。(图4B)在过表达LTBR的T细胞中显著富集GO生物过程(p<0.05)。(图4C)用LTBR或tNGFR慢病毒转导的CD8+ T细胞的细胞活力,用CD3/CD28再刺激四天或不受刺激(n=2个供体,其中每个供体有3个生物复制品)。(图4D)每三天用3:1过量的CD3/CD28珠粒刺激静息LTBR或tNGFR T细胞上的PD-1表达,至多三轮连续刺激。(图4E)用Flag标记的LTBR突变体转导的T细胞的ICAM-1表达(静息)和IL-2分泌(激活),相对于野生型LTBR归一化(两个实验中n=6个复制品)。(图4F)差异可及染色质中的转录因子基序的富集(来自每次比较的前10个基序)。(图4G)用CD3/CD28抗体刺激的LTBR或tNGFR T细胞中的磷酸化的RELA(磷酸-RELA)的定量持续指定的时间段。(图4H、图4I)静息或CD3/CD28刺激(15分钟)的LTBR或tNGFR细胞中的磷酸化的IκBα(图4H)或成熟NF-KB2(图4I)的定量。(图4J)在CRISPR敲除指定基因之后刺激的LTBR或tNGFR细胞的IFNγ分泌(n=18,3个生物复制品中的2个供体的3个sgRNA)。IFNγ数量相对于对应的非靶向(NT)对照(LTBR或tNGFR)归一化以允许比较基因敲除对T细胞激活的相对影响。(图4K)在CRISPR敲除RELA或RELB(在LTBR细胞中相对于非靶向对照归一化)之后,LTBR和tNGFR细胞中的核心LTBR基因(n=274个基因)的表达水平。框示出第25-第75个百分位数,中值处有一条线;箱须延伸到四分位数间距的1.5倍。未配对双边t测试P值(图4C、图4G-图4K):不显著(NS)P>0.05,*P<0.05,**P<0.01,***P<0.001,****P<0.0001。误差条,s.e.m.;n=3个生物复制品,除非另有说明。
图5A-图5I示出了排序靠前的基因改进抗原特异性T细胞应答和肿瘤杀伤。(图5A-图5F)将抗CD19 CAR和ORF共递送至来自健康供体的T细胞。(图5A)三顺反子载体和CAR T细胞实验的示意图。(图5B、图5C)在CD8+ T细胞与Nalm6细胞以1:1比率共温育过夜之后,IFNγ(图5B)和IL-2(图5C)的分泌(n=3个生物复制品,表示2个供体)。(图5D)在以指示的效应子与靶标比率与共表达19-28z CAR和LTBR或tNGFR(阴性对照)的T细胞共温育之后,Nalm6GFP+细胞增殖(每个孔的归一化总GFP)。(图5E)以0.25的效应子与靶标比率相对于tNGFR归一化并且在共温育48小时之后的共表达19-28z或18-BBz CAR和排序靠前的基因(n=3个生物复制品,表示2个供体)的T细胞的Nalm6 GFP+清除率的定量。(图5F)每3天将共表达LTBR或tNGFR的19-BBz CAR T细胞与Nalm6细胞以1:1比率例共温育至多3轮刺激(n=3个生物复制品)。在重复抗原刺激七天之后,CAR T细胞重新暴露于Nalm6细胞。在过夜温育之后测量IFNγ分泌。(图5G)来自患有弥漫性大B细胞淋巴瘤的患者的抗CD19CAR和ORF到总PBMC的共递送。经转导的T细胞单独温育,或以1:1比率与CD19+Nalm6或CD19-Jurkat细胞系共温育(n=3个生物复制品,表示2名患者)。在过夜温育之后测量IFNγ和IL2的分泌。对于Nalm6条件,上文指示的列对的数字是LTBR细胞比tNGFR(阴性对照)细胞的细胞因子分泌增加的倍数。(图5H)ORF到Vγ9Vδ2T细胞的递送。在与用唑来膦酸盐预处理以促进磷酸化抗原积累的胰腺导管腺癌(PDAC)系Capan-2共温育过夜之后的IFNγ和IL-2的分泌(n=3个生物复制品)。在适当的情况下,数据为平均值±s.e.m.。
图6A-图6M示出了原代T细胞中的人ORF文库筛选的设计。(图6A)用于ORF过表达的带条形码的载体设计。(图6B)文库中每个ORF的条形码的数量的分布。(图6C)用于定量不同启动子和ORF插入物大小对慢病毒转导效率的影响的载体设计。EFS-延伸因子-1α短启动子,CMV-巨细胞病毒启动子,PGK-磷酸甘油酸激酶-1启动子。(图6D)在经转导的原代CD4+ T细胞的嘌呤霉素选择之后,从EFS和CMV启动子表达的大鼠CD2(rCD2)的阳性细胞百分比和(图6E)平均荧光强度(MFI)。每个数据点指示单独的转导(n=3个生物复制品)。误差条是SEM。(图6F)基因组规模的文库中的ORF大小的分布。标记了在图6D和图6E的小图中测试的TCR-rCD2构建体的大小。(图6G)CD3/CD28抗体的滴定。将T细胞用CFSE标记,刺激并温育4天。将用于增殖T细胞的门设置为包含增殖至少两次的细胞(第三CFSE峰)。(图6H)用ORF文库转导的来自三个健康供体的T细胞的扩增。(图6I)在分选之前再刺激的CD8+和CD4+ T细胞的代表性CFSE图谱。标记了CFSE分选门。(图6J)在用于慢病毒产生的经转导的T细胞和质粒中回收单个条形码或对应的ORF。在计数最少一次读数时存在多少条形码或ORF之前,将来自三个供体的相应样品以相等的读数数量计算汇集在一起。(图6K)通过将单个条形码折叠成对应的基因来计算的CFSECD4+和CD8+ T细胞两者中的基因的富集。显著富集的基因(高于0.5的log2变化倍数和低于0.05的经调整的p值)用红色标记。标记了所关注免疫应答基因。(图6L)图6K中的显著富集的基因的GO生物过程。(图6M)CD3/CD28刺激的T细胞与原初T细胞之间显著富集的基因与差异表达的基因的重叠41
图7A-图7J示出了在筛选独立供体中选择的ORF的过表达。(图7A)在嘌呤霉素选择之后的T细胞中所选ORF表达的直方图。(图7B)经转导的CD4+和CD8+ T细胞中的tNGFR表达的定量。转导后7天之后完成嘌呤霉素选择。为了维持培养物中的T细胞,在第21和42天用CD3/CD28对其进行再刺激。(图7C)相对于tNGFR,ORF大小与增殖变化之间的相关性。示出了平均log2变化倍数。(图7D)相对于单独的供体中的tNGFR,再刺激的CD8+或(图7E)CD4+ T细胞的增殖(n=3个生物复制品)。示出了平均值和SEM。(图7F、图7G)通过稀释CellTrace Yellow测量,用显著改进的T细胞增殖的ORF转导的T细胞的增殖(参见图2C)。示出了代表性CellTrace Yellow直方图和拟合分布(图7F)以及增殖指数的定量(图7G)(n=3个生物复制品)。P值:<0.0001、0.0008,<0.0001、0.011、0.0031、0.0007,<0.0001、0.28、0.004,<0.0001、0.58、0.01、0.0003,<0.0001、0.036、0.0049(从左到右)。(图7H)CD3/CD28再刺激之后4天ORF转导的T细胞的活力。示出了来自一个供体(测试的4个供体中的一个)的代表性数据(n=3个生物复制品;CD8左边条,CD4右边条)。(图7I、图7J)用CD3/CD28刺激24小时的T细胞的细胞周期分析。基于同种型和荧光减一对照进行门控。示出了S-G2-M期细胞(对于经刺激的T细胞)的代表性门控(图7I)以及(图7J)定量(n=6个来自两个供体的生物复制品)。P值:1、0.29、0.0065、0.17、0.0051、1、0.13、0.55、0.0004、0.98、0.0088、0.68、0.91、0.7、1(从左到右)。图7G和图7I的小图的统计显著性:单向ANOVA与邓尼特多重比较测试(Dunnett's multiple comparisons test)*p<0.05,**p<0.01,***p<0.001,****p<0.0001。误差条指示SEM。
图8A-图8E示出了过表达ORF的T细胞的功能应答。(图8A)CD25或CD154在再刺激之后的定量表达。每个基因至少测试两个供体,一式三份。仅示出了显著增加CD4+、CD8+或两种T细胞亚群中的T细胞增殖的基因。示出了平均值和SEM。CD4+在顶部条中示出;CD8+细胞在底部条中示出。(图8B、图8C)对抗原剂量的灵敏度。将T细胞与指定浓度的抗CD3抗体一起温育24小时并定量分泌的IFNγ的量。示出了代表性剂量-应答曲线拟合(图8B)和IC50定量(图8C)(n=2个生物复制品)。(图8D)单独温育或与CD3/CD28抗体一起温育24小时的T细胞中的分泌的IL-2和IFNγ的定量。示出了来自四个供体中的一个的代表性数据(n=3个生物复制品)。静息细胞用左边条示出,+CD3/CD28在右边示出。(图8E)在CD3/CD28刺激24小时之后,通过ORF转导的T细胞对所选分泌的细胞因子和趋化因子的多重定量。示出了相对于tNGFR归一化的重复测量(来自独立样品)的平均z-评分。
图9A-图9J示出了OverCITE-seq鉴定ORF和其转录效应。(图9A)如通过凝胶珠粒条形码鉴定的细胞的质量参数。阴性、单重态和双重态基于细胞哈希分配。(图9B)分配给每个ORF的细胞中的经刺激的和静息T细胞的比例。卡方测试p值示出了经刺激的和静息细胞的分布显著偏移(不均匀)的ORF。(图9C)细胞周期校正过表达基因在用相应ORF和阴性对照(tNGFR)转导的细胞中的比例表达。小提琴状图上方示出的双边威尔科克森测试p值指示特定ORF与tNGFR转导的T细胞之间的基因表达水平的统计显著性。框示出25-75百分位数,中值处有一条线;箱须延伸到最大值和最小值。N=71(ADA)、147(AHCY)、190(AHNAK)、119(AKR1C4)、124(ATF6B)、179(BATF)、137(CALML3)、189(CDK1)、129(CDK2)、236(CLIC1)、84(CRLF2)、91(CXCL12)、88(CYP27A1)、129(DBI)、26(DCLRE1B)、261(DUPD1)、25(FOSB)、119(GPD1)、124(GPN3)、199(IFNL2)、60(IL12B)、70(IL1RN)、156(ITM2A)、74(LTBR)、88(MRPL18)、167(MRPL51)、107(MS4A3)、69(NFYB)、355(NGFR)、261(RAN)、182(SLC10A7)和56个(ZNF830)单细胞。(图9D)分配给每个ORF的细胞的所有ORF基因的表达。每个行是z-评分归一化的。(图9E)簇中的单独的ORF频率的分布。展现了ORF细胞的数量和卡方测试残差。指示每个簇中的ORF分布是否显著不同于总体ORF分布的卡方测试p值在图的顶部示出。每个簇中的经刺激的和静息T细胞的比例在簇标签下方示出。(图9F、图9G)静息(图9F)和经刺激的(图9G)群体中的所选ORF细胞的转录图谱之间的斯皮尔曼相关性。(图9H)静息和经刺激的T细胞中具有指示的ORF的细胞之间的最高差异表达的基因的变化倍数。对于每种条件,示出了具有最强转录变化的ORF(与tNGFR细胞相比)。(图9I)与静息T细胞相比,经刺激的ORF T细胞中的差异基因表达。示出了在至少一个ORF中具有显著表达变化的基因(经调整的DESeq2,p<0.05)。对于所有基因,展现每个ORF(经刺激的)到tNGFR(静息)的log2变化倍数,相对于tNGFR(经刺激的)到tNGFR(静息)的log2变化倍数归一化。标记每个簇中的所关注基因。(图9J)ORF细胞中的平均TCR克隆型多样性。
图10A-图10M示出了T细胞中的LTBR过表达的功能分析。(图10A)来自基因型-组织表达(GTEx)项目v875的指示的人原代组织中的LTBR表达(n=948个供体)。框示出25-75百分位数,中值处有一条线。(图10B)来自2个供体的31,021个细胞的外周血单核细胞(PBMC)中的LTBR表达76。指示的细胞类型源自单细胞转录组的Harmony tSNE聚类。(图10C)与单细胞或整体RNA-seq中鉴定的tNGFR细胞相比,LTBR细胞中显著上调的基因之间的重叠。(图10D、图10E)LTBR或tNGFR转导的T细胞中的TCF1表达。(图10D)示出了TCF1表达的代表性直方图和TCF1+细胞的门(虚线),以及(图10E)TCF1+细胞的定量(n=3个生物复制品)。(图10F-图10H)LTBR和tNGFR T细胞中的ICAM-1、CD70、CD74和MHC-II表达。代表性直方图(图10F)、n=3个供体(CD8+)或n=4个供体(CD4+)中的定量(图10G)以及CD3/CD28刺激之后LTBR和tNGFR细胞中的表达的时间过程(图10H)(n=3个生物复制品)。(图10I)NGFR和LTBR转导的T细胞的分化表型(n=4个供体,分别为CD4+和CD8+)。CM:中央记忆。EM:效应子记忆。基于CD45RO和CCR7表达来定义分化(原初:CD45ROneg CCR7+、CM:CD45RO+CCR7+、EM:CD45RO+CCR7neg、效应子CD45ROneg CCR7neg)。(图10J)CD3/CD28刺激之后T细胞活力的代表性点图。活细胞在左下象限。(图10K)用LTBR或tNGFR慢病毒转导的CD4+ T细胞的细胞活力,用CD3/CD28再刺激四天或不受刺激(n=2个供体,其中每个供体有3个生物复制品)。(图10L、图10M)每三天用3:1过量的CD3/CD28珠粒刺激LTBR或tNGFR细胞,至多三轮刺激。在重复刺激之后,在静息细胞中测量TIM-3和LAG-3的表达(图10L),并且在再刺激的细胞中测量IFNγ和IL2的分泌(图10M)(n=3个生物复制品)。图10E、图10I和图10K的小图的统计显著性:双边未配对t测试:对于图10G的小图:双边配对t测试。误差条指示SEM。
图11A-图11K示出了LTBR配体和LTBR通过mRNA或缺失和点突变体的表达。(图11A)用CD3/CD28抗体刺激24小时之后的IL2分泌。在指示的情况下,重组可溶性LTA(1ng/mL)或LIGHT(10ng/mL)与CD3/CD28抗体一起添加。来自一个供体的CD4+ T细胞一式三份进行测试。(图11B、图11C)将来自两个供体的CD4+和CD8+ T细胞与CD3/CD28抗体或重组可溶性LTA或LIGHT共温育24小时,并且然后测量IL2(图11B)和IFNγ(图11C)(n=3个生物复制品)。无刺激、+CD3/CD28、+LTA和+LIGHT从左到右示出。(图10D、图10E)在培养期间,在单独与IL2或与LTA(1ng/mL)或LIGHT(10ng/mL)一起温育的tNGFR和LTBR转导的T细胞(n=3个生物复制品)的再刺激之后的分化表型(图10D)或增殖(图10E)。CM:中央记忆。EM:效应子记忆。示出了未配对双边t测试p值。(图11F、图11I)通过mRNA核转染的瞬时LTBR或tNGFR表达(图101F)。用LTBR或tNGFR mRNA核转染T细胞(n=3个生物复制品),并在21天内监测LTBR(图11G)、tNGFR(图11H)或LTBR细胞中上调的四种基因(图11I)的表面表达。在每个时间点,靶基因的表达相对于匹配的tNGFR对照归一化。(图11J)FLAG标记的LTBR突变体的示意性图示。(图11K)用LTBR突变体转导的T细胞中的LTBR和FLAG的表达。误差条指示SEM。
图12A-图12I示出了LTBR T细胞中的染色质可及性。(图12A)LTBR和tNGFR T细胞的全局可及染色质区的主组分(PC)分析,无论是静息还是用CD3/CD28刺激24小时。(图12B)经刺激的与静息tNGFR,经刺激的与静息LTBR,静息LTBR与静息tNGFR,以及经刺激的LTBR与经刺激的tNGFR之间的差异可及染色质区。示出了获得/丧失的峰的数量(使用1的绝对log2变化倍数和经调整的p值<0.1作为截止值)。(图12C、图12D)差异表达(经调整的p<0.05)基因的染色质可及性(图12C)或差异可及(经调整的p<0.05)区的基因表达(图12D)的变化。示出了双边t测试p值。框示出25-75百分位数,中值处有一条线;箱须延伸到1.5×四分位数间距。N=614个基因(图12C)或基因组区(图12D)。(图12E、图12F)与静息或刺激24小时的tNGFR细胞相比,LTBR中更多(图12E)或更少开口(图12F)的基因座处的染色质可及性图谱。y轴表示归一化读数(标度:BATF3为0-860,IL13为0-1950,TRAF1为0-1230,TNFSF4为0-1000,PDCD1为0-300,LAG3为0-2350)。(图12G)静息或经刺激的LTBR和tNGFR细胞的染色质可及性。每个行表示与匹配的tNGFR对照相比显著富集LTBR的峰(log2变化倍数>1,经调整的DESeq2,p值<0.05)。使用k平均值聚类对峰进行聚类,并且指示了来自每个簇的峰处/附近的所选基因。(图12H)基于偏向校正的偏差的每个ATAC样品(生物复制品)的相关性。(图12I)与静息tNGFR细胞相比,静息LTBR细胞中富含差异可及染色质区的顶端转录因子(TF)基序。
图13A-图13P示出了NF-κB激活的蛋白质组和功能基因组测定。(图13A)LTBR和tNGFR中的细胞内流式细胞术的磷酸-RELA染色。示出了用于鉴定磷酸-RELA+细胞的门控。(图13B、图13C)静息或用CD3/CD28刺激15分钟的LTBR和tNGFR细胞中的NF-κB通路中的关键蛋白的蛋白质印迹定量。示出了代表性凝胶(图13B)或相对于GAPHD的条带强度的定量(图13C)(n=3个生物复制品)。示出了未配对双边t测试p值。(图13D)LTBR信号传导通路的图示。每个基因基于在LTBR中相对于匹配的tNGFR细胞(CD4+和CD8+ T细胞,静息或经刺激24小时)的差异表达而着色。(图13E-图13G)通过CRISPR和ORF过表达同时进行基因敲除。用共表达单向导RNA(sgRNA)和LTBR ORF的慢病毒载体转导T细胞。在转导之后,通过核转染递送Cas9蛋白。(图13F)共表达靶向MHC-I复合物的必需组分B2M或αβTCR的必需组分TRBC1/2的sgRNA的LTBR细胞中的靶基因的代表性表达。(图13G)再刺激之后的IFNγ的定量(n=3个sgRNA)。(图13H-图13O)基于代表性蛋白质水平的基因敲除效率的定量。示出了代表性直方图(图13H、图13J、图13L)和LTA、LIGHT和RELA的相对表达水平的定量(图13I、图13K、图13M)(n=3个sgRNA)。虚线表示用于列举表达给定蛋白质的细胞的门。示出了代表性凝胶(图13N)和RELB表达的定量(图13O)(n=3个RELB的sgRNA和2个非靶向对照sgRNA)。(图13P)在用LTBR转导的CD4+和CD8+T细胞两者中鉴定为比匹配的tNGFR对照富集的274个基因的鉴定(“核心LTBR”基因)。误差条指示SEM。
图14A-图14P示出了ORF与靶向CD19的CAR的共递送。(图14A)CAR+ORF慢病毒载体或单独的ORF的转导效率(n=4个生物复制品)。(图14B、图14C)如通过用抗小鼠Fab F(ab')2染色确定的CAR表达水平。显示了两名健康供体和两名患有弥漫性大B细胞淋巴瘤(DLBCL)的患者的代表性直方图(图14B)和相对于tNGFR的CAR表达的定量(图14C)。(图14D)CAR+ORF转导的T细胞的扩增曲线(n=4个生物复制品)。(图14E)用单独的LTBR或CAR+LTBR转导的自体CD14+单核细胞和T细胞中的LTBR表达。(图14F-图14I)仅用LTBR ORF、CAR+LTBR或CAR+tNGFR转导的T细胞的ICAM-1(图14F)、CD70(图14G)、CD74(图14H)和MHC-II(图14I)的表达。所有数据相对于仅tNGFR归一化(无CAR)。示出了未配对双边t测试p值。(图14J-图14M)CAR+ORF T细胞中的耗竭标志物PD-1(图14J)、TIM-3(图14K)、LAG-3(图14L)和CD39(图14M)的表达。CD8左边条,CD4右边条。(图14N)CAR+ORF T细胞的分化表型。CM:中央记忆。EM:效应子记忆。基于CD45RO和CCR7表达来定义分化(原初:CD45ROneg CCR7+、CM:CD45RO+CCR7+、EM:CD45RO+CCR7neg、效应子CD45ROneg CCR7neg)。(图14O、图14P)在单独或与Nalm6细胞一起温育24小时的CAR+ORF T细胞中的激活标志物CD25(图14O)和CD69(图14P)的表达。误差条指示SEM。N=3个生物复制品,除非另有说明。
图15A-图15P示出了来自ORF筛选的排序靠前的基因增强抗原特异性T细胞应答。(图15A、图15B)将抗CD19 CAR和ORF共递送至来自健康供体的T细胞。(图15A)CD4+ T细胞与Nalm6细胞以1:1比率共温育过夜之后的IFNγ和(图15B)IL2分泌(n=3个生物复制品,表示两个供体)。(图15C、图15D)单独或与Nalm6细胞共温育24小时的CAR+ORF或仅ORF T细胞的IFNγ(图15C)或IL-2(图15D)分泌。(图15E)与Nalm6 GFP细胞共温育之后,表达tNGFR或LTBR ORF的19-BBz CAR T细胞的细胞毒性。(图15F)在不同效应子/大比率下,对CAR+ORF或ORF单独T细胞的Nalm6清除率(相对于与未经诱导的T细胞共温育的Nalm6)的定量。未配对双边t测试p值:0.011、1.3x10-4、0.072、0.02、0.021、0.52、0.087、1、0.51(从左到右)。(图15G)用19-28z CAR和NGFR或LTBR转导的T细胞与CD19+Nalm6 GFP细胞以1:1比率共温育48小时的代表性图像。比例尺:200μm。(图15H-图15J)用Nalm6细胞重复刺激CAR+ORF T细胞。在用Nalm6细胞每三天重复刺激至多三轮刺激之后,用Nalm6再激发的19-BBz CAR LTBR或tNGFR T细胞的IL-2分泌(图15I)或Nalm6存活率(图15J)。(图15K)来自两名患有DLBCL的患者的CAR/LTBR或CAR/tNGFR T细胞在与Nalm6靶细胞温育过夜之后的细胞因子IL2和IFNγ的分泌。示出了双边配对t测试p值。(图15L)内源性表达Vγ9Vδ2TCR的ORF转导的T细胞的代表性染色。(图15M)表达Vγ9Vδ2TCR的ORF转导的T细胞的定量。(图15N、图15O)ORF转导的Vγ9Vδ2T细胞与白血病细胞系共温育24小时之后的IL2(图15N)或IFNγ(图15O)分泌。(图15P)ORF转导的Vγ9Vδ2T细胞与胰腺导管腺癌细胞系BxPC3共温育24小时之后的IL2或IFNγ分泌。在共温育之前,用唑来膦酸预处理的小图(图15N-图15P)中的细胞系。误差条指示SEM。示出了N=3个生物复制品,除非另有说明。
图16A-图16F示出了排序靠前的基因在实体瘤中改进抗原特异性CAR T细胞应答。(图16A)将抗间皮素CAR和ORF共递送至来自健康供体的T细胞。(图16B-图16D)与间皮素高细胞系Capan-2(图16B、图16C)或间皮素低细胞系BxPC3(图16D)共温育过夜之后,用抗间皮素CAR和ORF共转导的CD4+和CD8+ T细胞的细胞因子IFNγ和IL2的分泌。在单独温育的T细胞中没有观察到特异性细胞因子分泌。N=3个生物复制品。虚线指示常规CAR T细胞中的细胞因子分泌的水平(即共表达tNGFR)。(图16E、图16F)在与经工程化的CAR T细胞以1:2的T细胞与癌症细胞比率共温育48小时之后,杀伤GFP+间皮素高Capan-2或间皮素低BxPC3。通过将含有常规CAR T细胞(即共表达tNGFR)的孔中的整合GFP信号除以特定样品中的整合GFP信号,将癌细胞杀伤归一化。高于一的比率指示比匹配的CAR对照(CAR+tNGFR)更高的杀伤,即特定样品中更低的GFP信号(并且因此癌细胞的数量更低)。WT或无CAR=未经转导的T细胞。
图17A-图17D示出了排序靠前的基因在实体瘤中改进抗原特异性TCR T细胞应答。(图17A)将抗NY-ESO-1 TCR和ORF共递送至来自健康供体的T细胞。(图17B、图17C)在与黑色素瘤细胞系A375共温育过夜之后,与抗NY-ESO-1 TCR和ORF共转导的CD8+ T细胞的细胞因子IFNγ和IL-2的分泌。在单独温育的T细胞中没有观察到特异性细胞因子分泌。N=3个生物复制品。虚线指示常规TCR T细胞中的细胞因子分泌的水平(即共表达tNGFR)。(图17E、图17F)杀伤与经工程化的TCR T细胞以1:1的T细胞与癌细胞比率共温育48小时的GFP+A375细胞。通过将仅含有A375细胞但不含T细胞的孔中的整合GFP信号除以特定样品中的整合GFP信号,将癌细胞杀伤归一化。无TCR=未经转导的T细胞。
图18A-图18G提供了OverCITE-seq的概述。
图19是与clinicaltrials.gov上可获得的嵌合抗原受体相关的临床试验列表。
图20是与clinicaltrials.gov上可获得的T细胞受体相关的临床试验列表。
图21提供了用于构建嵌合抗原受体的示例性抗体序列。
图22A-D展示了共表达LTBR的19-BB-z CAR T细胞对NSG小鼠中的播散性白血病模型的体内功效。(图22A)实验设计。对雌性NSG小鼠(n=4/组)尾静脉接种5×105个Nalm6-luc细胞。在四天后,进行生物发光(BLI)测量对小鼠进行分级,以确保每个组具有相同的中值肿瘤负荷。第二天,将未经转导或CAR转导的T细胞(CD4:CD8,1:1)注射到尾静脉中。(图22B)研究期间小鼠的存活率。示出了对数秩Mantel-Cox p值。(图22C)背侧和腹侧全身BLI信号。示出了所有存活小鼠的单独的值。这些线连接每个组的中值。示出了LTBR与tNGFR组之间的单向ANOVA和事后的多重比较测试p值。****p<0.0001。(图22D)与每只小鼠的起始(d=0)体重相比体重的变化。
图23展示了LTBR CAR T细胞在不存在IL2的情况下的存活率。在存在IL2的情况下扩增和培养转导和所选T细胞,如先前所描述的。在转导后第14天,洗涤CAR+LTBR或CAR+tNGFR T细胞,并在两种条件下分开:具有IL2和不具有IL2。然后,通过直接细胞计数,使用台盼蓝排除法(Trypan Blue exclusion)(直到第23天)或使用活力染料的流式细胞术(从第23天开始),每周三次评估细胞活力。在每个时间点,将无IL2条件下的活细胞数与+IL2条件下的活细胞数进行比较以确定存活率。N=3
图24A-F展示了在不同培养基中的LTBR表型和功能。(图24A-图24C)在整个实验中,将来自健康供体的CD4和CD8 T细胞在给定的培养基中培养,包含激活、慢病毒转导、选择和培养。转导后14天,将T细胞重悬于不具有IL2的相应培养基中,并刺激过夜以诱导细胞因子分泌。ELISA测量分泌的IFNγ(a)和IL2(b)的量。所有匹配条件下分泌的细胞因子的平均量在(c)中示出。(图24D)用tNGFR或LTBR转导的CD4和CD8 T细胞中的CD54和CD74的表达,相对于未经转导的对照归一化。(图24E)用tNGFR或LTBR转导的CD4和CD8 T细胞中的中央记忆(CM)与效应子T细胞的比率。CM:CD45RO+CCR7+,效应子:CD45RO+/-CCR7-。(图24F)用tNGFR或LTBR转导的CD4和CD8 T细胞中的PD1的表达。**p<0.01
图25A-C展示了在原代T细胞中TNFRSF成员的过表达。(图25A)在ORF转导和未经转导的T细胞中的所选TNFRSF成员的表面表达。(图25B)CD8左边条,CD4右边条。在用CD3/CD28刺激4天之后,用TNFRSF成员转导的T细胞的增殖,相对于tNGFR归一化。(图25C)在用CD3/CD28刺激24小时之后,用TNFRSF成员转导的T细胞的IFNγ分泌,相对于tNGFR归一化。CD8左边条,CD4右边条。
图26A-G展示了NFκB通路的组成型活性阳性调节因子过表达。(图26A、B)在用CD3/CD28刺激经转导的T细胞过夜之后的IFNγ(a)和IL2(b)分泌。分泌的细胞因子的绝对量相对于LTBR归一化。(图26C-F)LTBR T细胞中上调的代表性标志物的表面表达。表达水平相对于LTBR归一化。(图26G)与LTBR相比,NFκB通路的组成型活性阳性调节因子诱导的表型的热图总结。tNGFR用作无关基因。
图27A-G展示了敲除NFκB通路的阴性调节因子。从左到右依次为NT、TNFAP3和NFKBIA。(图27A-B)在用CD3/CD28刺激经转导的T细胞过夜之后的IFNγ(a)和IL2(b)分泌。分泌的细胞因子的绝对量相对于共表达NT sgRNA的LTBR归一化。每个点表示单独的sgRNA。(图27C-F)LTBR T细胞中上调的代表性标志物的表面表达。表达水平相对于共表达NTsgRNA的LTBR归一化。每个点表示单独的sgRNA。(图27G)与共表达NT sgRNA的LTBR相比,NFκB通路的阴性调节因子的敲除诱导的表型的热图总结。
图28A-F展示了LTBR和CAR共表达的转基因定位。(图28A)所用载体的示意图描绘。(图28B)CD4和CD8 T细胞中的LTBR或tNGFR的表达,相对于对应的CAR-puro-基因载体归一化。(图28C-E)CAR T细胞与CD19+靶细胞Nalm6共温育过夜后的细胞因子分泌。(图28F)CD4和CD8 T细胞中的对靶细胞作出应答的细胞因子分泌,相对于对应的CAR-puro基因载体归一化。
图29A-D证明了T细胞中的诱导型转基因表达。(图29A)载体设计。(图29B-C)用a.T细胞所示的载体转导的CD4和CD8 T细胞中的LTBR(b)和tNGFR(c)的表达,所述a.T细胞不受刺激(无刺激)或者用CD3/CD28抗体刺激24小时。转基因表达相对于用无启动子载体转导的T细胞中的染色强度归一化。(图29D)与用EFS启动子载体转导的T细胞中的表达相比,用NFκB启动子载体转导的T细胞中的转基因表达。
具体实施方式
用于过继性细胞疗法的自体患者T细胞的工程化已经彻底改变几种类型的癌症的治疗1。然而,需要另外的改进以增加应答和治愈率。基于CRISPR的功能丧失筛选已经仅限于T细胞功能的阴性调节因子2-4,并且由于基因组的永久修饰而引起安全问题。在这里,通过约12,000个带条形码的人开放阅读框(ORF)的过表达来鉴定T细胞功能的阳性调节因子。排序靠前的基因增加了原代人CD4+和CD8+ T细胞的增殖和激活,以及其对如白介素-2和干扰素-γ等关键细胞因子的分泌。另外,开发了单细胞基因组学方法OverCITE-seq,用于高通量定量ORF工程化的T细胞中的转录组和表面抗原。排序靠前的ORF-淋巴毒素-β受体(LTBR)-通常在骨髓细胞中表达,但在淋巴细胞中不存在。当在T细胞中过表达时,LTBR诱导深刻的转录和表观基因组重塑,通过典型NF-κB通路的组成型激活,导致T细胞效应子功能增加和对慢性刺激环境中耗竭的抗性。LTBR和其它排序较高的基因改进了嵌合抗原受体T细胞和γδT细胞的抗原特异性应答,突出了其在未来癌症诊断疗法中的潜力5。结果为用于通过诱导合成细胞程序改进下一代T细胞疗法提供了几种策略。
除非本说明书中另有定义,否则本文所使用的技术术语和科学术语具有与本发明所属领域的普通技术人员和参照公开文本所通常理解的相同含义,这为本领域的技术人员提供了本申请中使用的许多术语的通用指南。
如贯穿本说明书和权利要求所使用的,术语“包括”、“含有”、“包含”和其变体包含其它组分、元件、整数、步骤等。相反,术语“由…组成”及其变体不包含其它组分、元件、整数、步骤等。
应当注意,术语“一个/一种(a/an)”是指一个或多个/一种或多种,例如,“T细胞”应被理解为表示一种或多种T细胞。如此,术语“一个”(或“一种”)、“一个或多个/一种或多种”和“至少一个/种”在本文中可互换地使用。
如本文所使用的,除非另有说明,否则术语“约”意指相对于给定参考的正或负10%的变化性。
此外,本文中使用“和/或”应当理解为在有或没有另一者的情况下明确公开了两个指定特征或组分中的每一者。因此,本文中如在如“A和/或B”等短语中使用的术语“和/或”旨在包含“A和B”、“A或B”、“A”(单独)和“B”(单独)。同样,在如“A、B和/或C”等短语中使用的术语“和/或”旨在涵盖以下方面中的每个方面:A、B、和C;A、B、或C;A或C;A或B;B或C;A和C;A和B;B和C;A(单独);B(单独);和C(单独)。
术语“核酸”或“多核苷酸”是指呈单链或双链形式的脱氧核糖核酸(DNA)或核糖核酸(RNA)和其聚合物。除非具体限制,否则所述术语涵盖含有天然核苷酸的已知类似物的核酸,所述已知类似物具有与参考核酸类似的结合特性并且以与天然存在的核苷酸类似的方式代谢。除非另外指出,否则特定核酸序列还隐含地涵盖其保守修饰的变体(例如,简并密码子取代)、等位基因、直系同源物、SNP和互补序列以及明确指出的序列。具体地,简并密码子取代可以通过产生序列来实现,其中一个或多个所选的(或全部)密码子的第三位被混合碱基和/或脱氧肌苷残基取代(Batzer等人,《核酸研究(Nucleic Acid Res.)》19:5081(1991);Qhtsuka等人,《生物化学杂志(J.Biol.Chem.)》260:2605-2608(1985);以及Rossolim等人,《分子与细胞探测(Mol.Cell.Probes)》8:91-98(1994))。
术语“核酸序列”、“核苷酸序列”或“多核苷酸序列”可互换使用并且是指连续核酸序列。序列可以是单链或双链DNA或RNA,例如,mRNA。
本文所描述的核酸可以使用常规分子生物学技术进行克隆,或通过DNA合成从头产生,这可以由在DNA合成和/或分子克隆领域拥有业务的服务公司(例如GeneArt公司(GeneArt)、金斯瑞公司(GenScript)、生命技术公司(Life Technologies)、欧陆集团(Eurofins))使用常规程序进行。将编码本文所描述的CRISPR-Cas编辑系统的各方面的核酸序列组装并置于任何合适的遗传元件中,所述遗传元件例如裸DNA、噬菌体、转座子、粘粒、附加体等,所述遗传元件将其上携带的序列转移到宿主细胞,例如用于产生非病毒递送系统(例如,基于RNA的系统、裸DNA等)或用于在包装宿主细胞中产生病毒载体和/或用于递送至受试者的宿主细胞。在某些实施例中,遗传元件是载体。在一个实施例中,遗传元件是质粒。用于制备此类经工程化的构建体的方法对核酸操纵技术人员而言是已知的并且包含基因工程、重组工程以及合成技术。参见例如Green和Sambrook,《分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》,纽约市冷泉港的冷泉港实验室出版社(Cold Spring Harbor Press,Cold Spring Harbor,NY)(2012)。
可以产生如在本发明的上下文中定义的蛋白质或肽的“变体”,其氨基酸序列在一个或多个突变上不同于原始序列,如一个或多个经取代的、插入的和/或缺失的氨基酸。优选地,与全长天然蛋白质相比,这些片段和/或变体具有相同的生物功能或特异性活性,例如其特异性抑制性质。如本发明的上下文中定义的蛋白质或肽的“变体”与其天然的,即非突变的生理序列相比,可以包括保守氨基酸取代。来源于同一种类的氨基酸相互交换的取代被称为保守取代。具体地,这些是具有脂肪族侧链、带正电或负电的侧链、侧链中的芳香族基团的氨基酸或其侧链可以进入到氢键中的氨基酸,例如具有羟基功能的侧链。这意味着,例如,具有极性侧链的氨基酸被另一种具有类似极性侧链的氨基酸替代,或者,例如,以疏水性侧链为特征的氨基酸被另一种具有类似疏水性侧链的氨基酸取代(例如,丝氨酸(苏氨酸)被苏氨酸(丝氨酸)取代,或者亮氨酸(异亮氨酸)被异亮氨酸(亮氨酸)取代)。插入和取代是可能的,具体地在那些不引起三维结构修饰或不影响结合区的序列位置处。通过插入或缺失对三维结构的修饰可以容易地确定,例如,使用CD光谱(圆二色性光谱)(Urry,1985,多肽的吸收、圆二色性和ORD(Absorption,Circular Dichroism and ORD ofPolypeptides),《生物化学中的现代物理方法(Modern Physical Methods inBiochemistry)》,Neuberger等人(编辑),阿姆斯特丹爱思唯尔(Elsevier,Amsterdam))。变体也可以包含非天然氨基酸。
蛋白质或肽的“变体”在此类蛋白质或肽的一段10、20、30、50、75、100个或更多个氨基酸上或者在所述蛋白质或肽的全长上可以具有至少70%、75%、80%、85%、90%、95%、98%或99%氨基酸同一性。
术语“基因”可以指涉及产生或编码多肽链的DNA区段。其可以包含编码区之前和之后的区(前导区和尾区)以及单个编码区段(外显子)之间的插入序列(内含子)。
如本文所使用的,术语“编码区”和“编码的区”和其语法变体是指在表达时产生多肽或蛋白质的多核苷酸中的开放阅读框(ORF)。
“多肽”、“肽”和“蛋白质”在本文中可互换使用,是指氨基酸残基的聚合物。所述术语涵盖任何长度的氨基酸链,包含全长蛋白,其中通过共价肽键连接氨基酸残基。
术语“编码”是指如基因、cDNA或mRNA等多核苷酸中的核苷酸的特异性序列的固有性质,所述序列用于充当在生物过程中合成其它聚合物和大分子的模板,所述其它聚合物和大分子具有定义的核苷酸序列(即,rRNA、tRNA和mRNA)或定义的氨基酸序列和由其产生的生物性质。因此,如果对应于基因的mRNA的转录和翻译在细胞或其它生物系统中产生蛋白质,则所述基因、cDNA或RNA编码所述蛋白质。编码链(其核苷酸序列与mRNA序列一致且通常提供于序列表中)与非编码链(用作基因或cDNA转录的模板)均可以称为编码所述基因或cDNA的蛋白质或其它产物。
除非另有说明,否则“编码氨基酸序列的核酸序列”包含彼此的简并版本以及编码相同氨基酸序列的所有核酸序列。编码蛋白质或RNA的核酸序列还可以包含内含子,其程度为编码蛋白质的核苷酸序列在某些版本中可以含有内含子。
术语“表达”在本文中以其最广泛的含义使用,并且包括RNA、蛋白质或RNA和蛋白质两者的产生。表达可以是暂时的或可以是稳定的。
术语“表达”和“过表达”是指增加基因或蛋白质的表达。所述术语是指与参考对照水平相比,表达增加,例如T细胞、其它淋巴细胞或宿主细胞中表达的mRNA或蛋白质的量增加至少10%,或增加至少约20%、或至少约30%、或至少约40%、或至少约50%、或至少约60%、或至少约70%、或至少约80%、或至少约90%、或至少约100%、或至少约200%、或至少约300%或至少约400%。用于表达和/或过表达的各种方法是本领域技术人员已知的,并且包含但不限于稳定或瞬时引入编码要在细胞中表达和/或过表达的蛋白质(即,表1中所示的基因)的异源多核苷酸,或者诱导编码蛋白质的内源性基因在细胞中的表达或过表达。应当理解,表1中所示的一种或多种基因可以在细胞中表达和/或过表达。还应当理解,在细胞中要表达和/或过表达的两种或更多种基因可以选自表1中所示的基因中的一种或多种基因。
术语“自体”是指源自同一受试者的任何材料,所述材料随后将被重新引入到所述受试者中。
术语“外源性”是指从生物体、细胞、组织或系统外部引入或产生的任何材料。
术语“表达载体”是指包括重组多核苷酸的载体,所述重组多核苷酸包括与要表达的核苷酸序列可操作地连接的表达控制序列。表达载体包括用于表达的足够顺式作用元件;用于表达的其它元件可以由宿主细胞或在体外表达系统中供应。表达载体包含本领域已知的所有表达载体,如掺入重组多核苷酸的粘粒、质粒(例如,裸的或包含在脂质体中)和病毒(例如,慢病毒、逆转录病毒、腺病毒和腺相关病毒)。
如本文所使用的,“表达盒”是指编码一个或多个ORF或基因,例如效应子增强基因,或CAR或TCR或其组分的核酸分子。表达盒还含有启动子并且可以含有控制宿主细胞中的基因编辑系统的一个或多个元件的表达的另外的调节元件。在一个实施例中,可以将表达盒包装到病毒载体(例如,病毒颗粒)的衣壳中。在一个实施例中,用于产生如本文所描述的病毒载体的此类表达盒侧接病毒基因组的包装信号和其它表达控制序列,如本文所描述的那些。
术语“调节元件”或“调节序列”是指与所关注核酸序列邻接的表达控制序列,以及以反式或在远处起作用以控制所关注核酸序列的表达控制序列。如本文所描述的,调节元件包括但不限于:启动子;增强子;转录因子;转录终止子;有效的RNA加工信号,如剪接和聚腺苷酸化信号(polyA);稳定胞质mRNA的序列,例如土拨鼠肝炎病毒(WHP)转录后调节元件(WPRE);增强翻译效率的序列(即,Kozak共有序列);增强蛋白稳定性的序列;以及在期望时,增强经过编码的产物的分泌的序列。还参见Goeddel;《基因表达技术:酶学方法(GeneExpression Technology:Methods in Enzymology)》185,加利福尼亚州圣地亚哥的学术出版社(Academic Press,San Diego,CA)(1990)。调节序列包含指导核酸序列在许多类型的靶细胞中的组成型表达的序列以及指导核酸序列只在某些靶细胞中表达的序列(例如,组织特异性调节序列)。
“启动子”被定义为指导核酸的转录的一个或多个核酸控制序列。如本文所使用的,启动子包含转录起始位点附近的必需核酸序列,如在聚合酶II型启动子的情况下为TATA元件。启动子还可以任选地包含远侧增强子或阻遏子元件,所述元件可以定位在与转录起始位点相距多达数千个碱基对处。当涉及启动子时,术语“组成型”指定核苷酸序列,当所述核苷酸序列与编码或指定基因产物的多核苷酸可操作地连接时,使基因产物在细胞的大部分或所有生理条件下在细胞中产生。当涉及启动子时,术语“诱导型”或“可调节”指定核苷酸序列,当所述核苷酸序列与编码或指定基因产物的多核苷酸可操作地连接时,使基因产物基本上仅当细胞中存在与所述启动子相对应的诱导子时在细胞中产生。在某些实施例中,诱导型启动子对T细胞刺激作出应答而被激活。在某些实施例中,启动子是NFAT、AP1、NFκB或IRF4启动子。当涉及启动子时,术语“组织特异性”指定核苷酸序列,当所述核苷酸序列与基因编码或指定的多核苷酸可操作地连接时,基本上仅当细胞是与所述启动子相对应的组织类型的细胞时才使基因产物在细胞中产生。另外的启动子元件,例如增强子调节转录起始的频率。通常,这些启动子元件位于起始位点上游30-110bp的区中,尽管已显示许多启动子也含有起始位点下游的功能元件。启动子元件之间的间隔往往是灵活的,使得当元件相对于彼此反转或移动时保留启动子功能。在胸苷激酶(tk)启动子中,启动子元件之间的间隔可以在活性开始下降之前增加至50bp。取决于启动子,似乎各元件可以协同或独立地起作用以激活转录。示例性启动子包含CMV IE基因、EF-1α.、泛素C或磷酸甘油激酶(PGK)启动子。
术语“可操作地连接”或是指一个或多个调节序列与异源核酸序列之间的导致后者表达的功能连接。例如,当第一核酸序列被放置成与第二核酸序列成功能关系时,第一核酸序列与第二核酸序列可操作地连接。例如,如果启动子影响编码序列的转录或表达,则启动子与编码序列可操作地连接。可操作地连接的DNA序列可以是彼此连续的,并且在需要连接两个蛋白质编码区的情况下,处于同一阅读框中。
术语“慢病毒”是指逆转录病毒科的属。慢病毒在能够感染非分裂细胞的逆转录病毒中是独特的;其可以将大量的遗传信息递送至宿主细胞的DNA中,因此其是基因递送载体的最有效方法之一。HIV、SIV和FIV都是慢病毒的实例。
在某些实施例中,一种或多种基因由核酸序列编码,所述核酸序列通过载体或病毒载体递送至宿主细胞,其中许多是本领域已知的和可获得的。在一个实施例中,提供了包括如本文所描述的表达盒的载体。在一个实施例中,载体是非病毒载体。在另一个实施例中,载体是病毒载体。“病毒载体”是指合成或人工病毒颗粒,其中含有所关注核酸序列的表达盒被包装在病毒衣壳或包膜中。病毒载体的实例包含但不限于慢病毒、腺病毒、逆转录病毒(γ-逆转录病毒和慢病毒)、痘病毒、腺相关病毒(AAV)、杆状病毒、单纯疱疹病毒。在一个实施例中,病毒载体是复制缺陷型的。“复制缺陷型病毒”是指病毒载体,其中也包装在病毒衣壳或包膜内的任何病毒基因组序列是复制缺陷型的,即其不能产生后代病毒体,但保留了感染细胞的能力。
术语“慢病毒载体”是指源自慢病毒基因组的至少一部分的载体,所述载体包含尤其如Milone等人,《分子疗法(Mol.Ther.)》17(8):1453-1464(2009)中所提供的自灭活慢病毒载体。可以用于临床的慢病毒载体的其它实例包含但不限于,例如,来自牛津生物医药公司(Oxford BioMedica)的基因递送技术、来自Lentigen公司(Lentigen)的LENTIMAXTM载体系统等。慢病毒载体的非临床类型也是可用的,并且将是本领域的技术人员已知的。
在某些实施例中,载体是非病毒质粒,所述非病毒质粒包括本文所描述的表达盒,例如,裸DNA、裸质粒DNA、RNA和mRNA;与各种组合物和纳米颗粒偶联,包含例如胶束、脂质体、阳离子脂质-核酸组合物、多聚糖组合物和其它聚合物、基于脂质和/或胆固醇的核酸缀合物以及如本文所描述的其它构建体。参见例如X.Su等人,《分子制药学(Mol.Pharmaceutics)》,2011,8(3),第774-787页;网络出版物:2011年3月21日;WO2013/182683、WO 2010/053572和WO 2012/170930,所有所述文献都通过引用并入本文。
可以根据本发明使用的质粒、其它克隆和表达载体、其性质和其构建/操纵方法对本领域技术人员来说是显而易见的。在一个实施例中,将如本文所描述的表达盒工程化成合适的遗传元件(载体),所述遗传元件可用于产生病毒载体和/或用于引入到宿主细胞,例如裸DNA、噬菌体、转座子、粘粒、附加体等中,所述遗传元件转移其上携带的序列。所选载体可以通过任何合适的方法递送,所述方法包含转染、电穿孔、脂质体递送、膜融合技术、高速DNA包被的粒料、病毒感染和原生质体融合。用于制备此类构建体的方法对核酸操纵技术人员而言是已知的并且包含基因工程、重组工程以及合成技术。参见例如Sambrook等人,《分子克隆:实验室手册》,纽约市冷泉港的冷泉港实验室出版社。
术语“经转染的”是指将外源性核酸转移或引入到宿主细胞中的过程。“经转染的”细胞是用外源性核酸转染的细胞。所述细胞包含原代受试者细胞和其后代。
如本文所使用,“瞬时”是指未整合的转基因在数小时、数天或数周的时间段内表达,其中表达的时间段小于基因如果整合到基因组中或包含在宿主细胞中的稳定质粒复制子内的表达时间段。
可以使用多种不同方法中的任何一种方法将RNA或DNA引入到靶细胞中,例如,可商购获得的方法包含但不限于电穿孔(Amaxa Nucleofector-II(德国科隆的Amaxa生物系统公司(Amaxa Biosystems,Cologne,Germany)))、ECM 830(BTX)(马萨诸塞州波士顿的哈佛仪器公司(Harvard Instruments,Boston,Mass.))或基因脉冲仪II(Gene Pulser II)(科罗拉多州丹佛的伯乐公司(BioRad,Denver,Colo.)、Multiporator(德国汉堡的艾本德公司(Eppendorf,Hamburg Germany))、使用脂质转染的阳离子脂质体介导的转染、聚合物包封、肽介导的转染或如“基因枪”等生物弹道颗粒递送系统(biolisticparticledelivery system)(参见例如Nishikawa等人《人类基因疗法(Hum Gene Ther.)》,12(8):861-70(2001))。
如本文所使用的,术语“受试者”意指哺乳动物,包含人、兽医或农场动物、家畜或宠物以及通常用于临床研究的动物。在一个实施例中,这些方法和组合物的受试者是人。仍其它合适的受试者包含但不限于鼠、大鼠、犬、猫、猪、牛、绵羊、非人灵长类动物等。如本文所使用的,术语“受试者”可与“患者”互换使用。
组合物
本文提供了包含核酸、表达盒和/或淋巴细胞的组合物,所述核酸、表达盒和/或淋巴细胞包含已显示增强T细胞存活率、增殖和/或效应子功能的基因(本文统称为“效应子增强基因”)的编码序列。在某些实施例中,效应子增强基因包括在下表1中鉴定的基因中的任何基因。
表1
/>
/>
/>
表达盒和含有表达盒的细胞
本文提供了表达盒,所述表达盒包含编码一个或多个效应子增强基因的核酸序列。在某些实施例中,基因包括上文表1中鉴定的基因中的任何基因或其片段或变体。在其它实施例中,基因包括下文表2中鉴定的基因中的任何基因或其片段或变体。在某些实施例中,表达盒包含多于一个效应子增强基因或其片段或变体。还提供了含有本文所描述的核酸和表达盒的宿主细胞。在某些实施例中,宿主细胞是淋巴细胞。如本文所使用的,当提及表1或表2的特定基因时,旨在使用全长蛋白、具有缺失或截短的片段或在氨基酸中具有一个或多个取代的变体的编码序列。例如,在某些实施例中,核酸编码在N末端中具有缺失或截短的蛋白质序列。在某些实施例中,核酸编码在C末端中具有缺失或截短的蛋白质序列。在一个实施例中,核酸编码具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95、至少100、至少105、至少110、至少115、至少120或至少125个氨基酸的蛋白质。
在一个实施例中,效应子增强基因是LTBR。由专业抗原呈递细胞而非淋巴细胞内源性表达的受体LTBR被鉴定为T细胞增殖和关键细胞因子:IL-2和IFNγ的分泌的强合成驱动因子。使用多模式单细胞测序方法,表明LTBR在T细胞中过表达时诱导深刻的转录变化,激活涉及抗原呈递和预防凋亡的细胞程序。如本文所描述的,开发了用于测试T细胞中的组合扰动的平台,通过将所关注基因(例如LTBR)与靶向其它基因的CRISPR sgRNA一起共表达,来绘制T细胞中的信号传导网络。本文还证明了LTBR的mRNA递送作为组成型慢病毒表达的替代方案,突出了筛选方法的翻译潜力。
在某些实施例中,表达盒包括编码LTBR或其片段的核酸。编码肿瘤坏死因子受体超家族成员3的LTBR(淋巴毒素-β受体)对于次级淋巴组织的发育和组织以及趋化因子释放是必需的。LTBR的代表性核酸序列可以在登录ID NM_002342.3,SEQ ID NO:1中找到。LTBR的全长氨基酸序列如SEQ ID NO:2所示。
LTBR蛋白可以分为三个区或结构域:细胞外结构域(SEQ ID NO:2的氨基酸31-227);跨膜(或螺旋)结构域(SEQ ID NO:2的氨基酸228-248);以及细胞质(或细胞内)结构域(SEQ ID NO:2的氨基酸249-435)。未成熟蛋白质的信号肽位于SEQ ID NO:2的氨基酸1-30处。
在某些实施例中,表达盒包括编码LTBR的片段的核酸。在某些实施例中,核酸编码相较于天然蛋白质(SEQ ID NO:2)具有氨基酸2-31、32-41、32-151、32-180、393-435、377-435、324-377、297-435或262-435的缺失的蛋白质序列。在某些实施例中,LTBR相较于天然蛋白质(SEQ ID NO:2)具有378-435、379-435、380-435、381-435、382-435、383-435、384-435、385-435、386-435、387-435、388-435、389-435、390-435、391-435或392-435的缺失。在某些实施例中,核酸编码在N末端中具有缺失的蛋白质序列。在某些实施例中,核酸编码在C末端中具有缺失的蛋白质序列。在一个实施例中,LTBR具有残基393-435的缺失。在某些实施例中,LTBR具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95、至少100、至少105、至少110、至少115、至少120或至少125个氨基酸的缺失。
在某些实施例中,表达盒包括编码作为LTBR的结构域的片段的核酸。在某些实施例中,核酸编码LTBR的细胞外结构域(SEQ ID NO:2的氨基酸31-227)。在某些实施例中,核酸编码LTBR的跨膜结构域(SEQ ID NO:2的氨基酸228-248)。在某些实施例中,核酸编码LTBR的细胞质(或细胞内)结构域(SEQ ID NO:2的氨基酸249-435)。在其它实施例中,结构域是LTBR结构域中的一个结构域的变体,包含具有缺失的变体。细胞质结构域的期望变体包含包括SEQ ID NO:2的全部氨基酸249-378、249-379、249-380、249-381、249-382、249-383、249-384、249-385、249-386、249-387、249-388、249-389、249-390、249-391或249-392的变体。另外的期望变体包含包括相较于SEQ ID NO:2具有1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个氨基酸取代的SEQ ID NO:2的全部氨基酸249-378、249-379、249-380、249-381、249-382、249-383、249-384、249-385、249-386、249-387、249-388、249-389、249-390、249-391或249-392的变体。
在其它实施例中,表达盒包括编码LTBR的两个或更多个结构域或其片段的核酸。在一个实施例中,核酸编码LTBR的细胞质结构域(或其片段)和跨膜结构域。在另一个实施例中,核酸编码LTBR的细胞质结构域(或其片段)、跨膜结构域和细胞外结构域。
在某些实施例中,表达盒包括编码AHCY的核酸。AHCY编码催化S-腺苷高半胱氨酸(AdoHcy)可逆水解为腺苷(Ado)和L-高半胱氨酸(Hcy)的S-腺苷高半胱氨酸水解酶。AHCY的代表性核酸序列可以在登录ID XM_011528656.3中找到。
在某些实施例中,表达盒包括编码DUPD1的核酸。DUPD1编码含有1的酶双特异性磷酸酶和前异构酶结构域(也被称为DUSP29-双特异性磷酸酯酶29),能够使同一底物内的磷酸酪氨酸、磷酸丝氨酸和磷酸苏氨酸残基去磷酸化。DUPD1的代表性核酸序列可以在登录IDXM_011539747.2中找到。
在某些实施例中,表达盒包括编码AKR1C4的核酸。AKR1C4编码醛酮还原酶家族1成员C4(也被称为3-α-HSD1、CDR和DD-4),能够催化酮类固醇的NADH和NADPH依赖性还原为羟基类固醇。AKR1C4的代表性核酸序列可以在登录ID NM_001818.5中找到。
在某些实施例中,表达盒包括编码ATF6B的核酸。ATF6B编码激活转录因子6β(也被称为环状AMP依赖性转录因子ATF-6β)。ATF-6β的加工形式通过激活ER应激诱导的UPR靶基因在未折叠蛋白应答通路中起作用。ATF6B的代表性核酸序列可以在登录ID NM_004381.5中找到。
在某些实施例中,表达盒包括编码ITM2A的核酸。ITM2A编码与淀粉样-β结合的整合膜蛋白2A(也被称为蛋白E25)。ITM2A的代表性核酸序列可以在登录ID NM_004867.5中找到。
在某些实施例中,表达盒包括编码AHNAK的核酸。AHNAK编码神经母细胞分化相关蛋白AHNAK(也被为AHNAK核蛋白)。经编码的蛋白可能在如血脑屏障形成、细胞结构和迁移、心脏钙通道调节和肿瘤转移等此类不同过程中发挥作用。AHNAK的代表性核酸序列可以在登录ID XM_017018270.1中找到。
在某些实施例中,表达盒包括编码BATF的核酸。BATF编码作为控制免疫系统中的谱系特异性细胞的分化的AP-1家族转录因子的碱性亮氨酸拉链转录因子ATF样(也被称为B细胞激活转录因子(B-ATF);以及SF-HT激活的基因2蛋白(SFA-2))。BATF的代表性核酸序列可以在登录ID NM_006399.5中找到。
在某些实施例中,表达盒包括编码GPD1的核酸。GPD1编码细胞质中的甘油-3-磷酸脱氢酶[NAD(+)](也被称为GPD-C和GPDH-C)。GPD1的代表性核酸序列可以在登录ID NM_005276.4中找到。
在某些实施例中,表达盒包括编码GPN3的核酸。GPN3编码作为RNA聚合酶II的正确定位所需的小GTP酶的GPN-环GTP酶3(也被称为ATP结合域1家族成员C)。GPN3的代表性核酸序列可以在登录ID XM_017019394.1中找到。
在某些实施例中,表达盒包括编码MRPL51的核酸。MRPL51编码作为RNA聚合酶II的正确定位所需的小GTP酶的GPN-环GTP酶3(也被称为ATP结合域1家族成员C)。MRPL51的代表性核酸序列可以在登录ID NM_016497.4中找到。
在某些实施例中,表达盒包括编码DBI的核酸。DBI编码地西泮结合抑制剂(也被称为ACBD1、ACBP、CCK-RP、EP),由激素调节的蛋白质并涉及脂质代谢和β-咔啉和苯二氮卓类的置换。DBI的代表性核酸序列可以在登录ID NM_001282635.3中找到。
在某些实施例中,表达盒包括编码CALML3的核酸。CALML3编码钙调素样3(也被称为CLP),增强肌球蛋白-10翻译的蛋白质。CALML3的代表性核酸序列可以在登录ID NM_005185.4中找到。
在某些实施例中,表达盒包括编码IL12B的核酸。IL12B编码白介素12B(也被称为CLMF、CLMF2、IL-12B、IMD28、IMD29、NKSF、NKSF2),作用于T细胞和自然杀伤细胞的细胞因子并且具有广泛的生物活性。IL12B的代表性核酸序列可以在登录ID NM_002187.3中找到。
在某些实施例中,表达盒包括编码IFNL2的核酸。IFNL2编码干扰素λ2(也被称为IL28A;IFNL2a;IFNL3a;IL-28A)。该基因,白介素28B(IL28B)和白介素29(IL29)是在映射于19q13的染色体区上形成细胞因子基因簇的三种密切相关的细胞因子基因。由这三种基因编码的细胞因子的表达可以由病毒感染诱导。所有三种细胞因子已经显示与异二聚体II类细胞因子受体相互作用,所述受体包括白介素10受体β(IL10RB)和白介素28受体α(IL28RA)。IFNL2的代表性核酸序列可以在登录ID NM_172138.2中找到。
在某些实施例中,表达盒包括编码ADA的核酸。ADA编码腺苷脱氨酶(也被称为ADA1;IFNL2a;IFNL3a;IL-28A)。该基因编码在嘌呤分解代谢通路中催化腺苷水解为肌苷的酶。ADA的代表性核酸序列可以在登录ID NM_000022.4中找到。
上文所鉴定的基因的各种同种型是本领域已知的。一些在下表2中描述。在另一个实施例中,提供了一种表达盒,所述表达盒包含替代性同种型中的任何替代性同种型的编码序列。本领域技术人员可以鉴定用于这些基因的解释遗传密码简并性的替代性编码序列,包含密码子优化的编码序列,并将其用作本文所描述的组合物和方法的替代性实施例。
表2
/>
/>
/>
在其它实施例中,表达盒包括编码选自表1的基因的基因的核酸。
经工程化的T细胞受体
本公开提供了编码经工程化的T细胞受体,例如T细胞受体(TCR)、如本文所描述的经修饰的TCR和嵌合抗原受体(CAR)的核酸序列,用于在具有编码改变T细胞效应子功能的基因的核酸序列的T细胞中表达。本文进一步描述了TCR和CAR的组分。
TCR是T细胞淋巴细胞上存在的二硫键连接的膜锚定异二聚体,并且大多数T细胞是具有由α(alpha)链和β(beta)链组成的TCR的αβT细胞。每条链包括可变(V)和恒定(C)结构域,其中可变结构域识别抗原或MHC呈递的肽。使用本文所描述的方法,可将对特定抗原,例如本文所描述的肿瘤抗原具有已知特异性或亲和力的TCRα和TCRβ链引入到T细胞中。使用本领域已知的标准分子克隆技术,可以分离对特定抗原具有期望的,例如增强的特异性或亲和力的TCRα和TCRβ链。普通技术人员可以容易地设想增加TCR或表达TCR的经工程化的T细胞的特异性、亲合力或功能的其它修饰,例如,用于调节表达的启动子选择、TCRα和TCRβ链的抗原结合区中的突变。任何分离的或经修饰的TCRα和TCRβ链可以与本文所描述的一个或多个细胞内信号传导结构域可操作地连接或可以与其缔合。信号传导可以通过抗原结合的αβ异二聚体与CD3链分子,例如CD3ζ(zeta)之间的相互作用来介导。
T细胞的较小亚群表达具有(gamma)γ链和δ(delta)链的TCR。γ-δ(γδ)T细胞占人的循环淋巴细胞的3-10%,并且Vδ2+亚群可以占血液中的γδT细胞的至多95%。Vδ2+细胞识别非肽表位并且不需要主要组织相容性复合物(“MHC”)或人白细胞抗原(“HLA”)的抗原呈递。大多数Vδ2+ T细胞也表达Vγ9链,并受到暴露于5-碳焦磷酸化合物的刺激,所述化合物是甲羟戊酸和非甲羟戊酸甾醇/类异戊二烯合成通路的中间体。对焦磷酸异戊烯酯(5-碳)的应答在健康人类中是普遍的。γδT细胞的另一个亚群Vδ1+占血液循环中的T细胞的百分比小得多,但通常在上皮粘膜和皮肤中发现。γδT细胞具有多种功能,包含杀伤肿瘤细胞和病原体感染细胞。通过γδTCR的刺激改进了细胞毒性、细胞因子分泌和其它效应子功能的能力。γδT细胞的TCR具有独特的特异性,并且细胞本身以高克隆频率出现,因此允许对肿瘤和病原体的快速先天样应答。参见例如Park和Lee,《实验与分子医学(Exp Mol Med.)》2021年3月;53(3):318-327.,所述文献通过引用并入本文。
在某些实施例中,T细胞包括编码TCR,例如靶向本文所描述的肿瘤抗原的经修饰的TCR的核酸序列和编码基因的核酸序列。在本文所描述的实施例中的任何实施例中,TCR可以取代本文所描述的CAR来产生T细胞。本文所描述的经工程化的TCR可以取代本文所描述的实施例中的任何实施例中的CAR。在某些实施例中,靶向NY-ESO-1(SEQ ID NO:23和24)的经工程化的TCR(参见,例如,Thomas等人,基于NY-ESO-1的癌症免疫疗法:当前展望(NY-ESO-1Based Immunotherapy of Cancer:Current Perspectives),《免疫学前沿(Front.Immunol.)》,2018年5月01日,所述文献通过引用并入本文)。
在某些实施例中,T细胞包括图20中鉴定的TCR。在某些实施例中,TCR靶向MART-1。Chodon T等人,MART-1 T细胞受体转基因淋巴细胞的过继性转移和患有转移性黑色素瘤的患者的树突细胞接种(Adoptive transfer of MART-1 T-cell receptor transgeniclymphocytes and dendritic cell vaccination in patients with metastaticmelanoma.)《临床癌症研究(Clin Cancer Res.)》2014年5月1日;20(9):2457-65.doi:10.1158/1078-0432.CCR-13-3017.电子版2014年3月14日.PMID:24634374;PMCID:PMC4070853。在其它实施例中,TCR靶向MAGE A4。Hong等人,评估ADP-A2M4 SPEAR T细胞在晚期实体瘤中的安全性和功效的I期剂量递增和扩增试验(Phase I dose escalation andexpansion trial to assess the safety and efficacy of ADP-A2M4 SPEAR T cellsin advanced solid tumors.)ASCO会议图书馆(ASCO Meeting Library),2020ASCO虚拟科学计划(2020 ASCO Virtual Scientific Program),《临床肿瘤学杂志(J Clin Oncol)》38:2020(增刊;摘要102)。在其它实施例中,TCR靶向WT1。Chapuis AG等人靶向WT1的T细胞受体基因疗法预防移植后急性髓性白血病复发(T cell receptor gene therapytargeting WT1 prevents acute myeloid leukemia relapse post-transplant.)《自然医学(Nat Med.)》2019年7月;25(7):1064-1072.doi:10.1038/s41591-019-0472-9.电子版2019年6月24日.PMID:31235963;PMCID:PMC6982533。在其它实施例中,TCR靶向MR1。Crowther,M.D.,Dolton,G.,Legut,M.等人全基因组CRISPR-Cas9筛查揭示了通过单态MHCI类相关蛋白MR1靶向普遍存在的T细胞癌(Genome-wide CRISPR-Cas9 screening revealsubiquitous T cell cancer targeting via the monomorphic MHC class I-relatedprotein MR1.)《自然免疫学(Nat Immunol)》21,178-185(2020).https://doi.org/10.1038/s41590-019-0578-8。在其它实施例中,TCR靶向E6。在其它实施例中,TCR靶向E7。在其它实施例中,TCR靶向KK-LC-1。在其它实施例中,TCR靶向NY-ESO-1。在其它实施例中,TCR靶向MAGE A3。在其它实施例中,TCR靶向GD-2。在其它实施例中,TCR靶向P53。在其它实施例中,TCR靶向LAGE-A1。在其它实施例中,TCR靶向GP100。
嵌合抗原受体(CAR)
术语“嵌合抗原受体”或替代性地“CAR”是指包括至少细胞外抗原结合结构域的重组多肽构建体,跨膜结构域和细胞质信号传导结构域(也被称为细胞内信号传导结构域),其包括源自如下文所定义的刺激分子的功能性信号传导结构域。在一些实施例中,刺激分子是TCRζ、FcRγ、FcRβ、CD3γ、CD3δ、CD3ε、CD5、CD22、CD79a、CD79b、CD66d、4-1BB或CD3ζ。在某些实施例中,刺激分子是与T细胞受体复合物缔合的ζ链。在某些实施例中,刺激分子是4-1BB。在某些实施例中,刺激分子是CD28。在某些实施例中,细胞质信号传导结构域进一步包括一个或多个源自至少一种如下文所定义的共刺激分子的功能性信号传导结构域(也被称为“共刺激信号传导结构域”)。在某些实施例中,共刺激分子选自本文所描述的共刺激分子,例如OX40、CD27、CD28、CD30、CD40、PD-1、CD2、CD7、CD258、NKG2C、B7-H3、与CD83、ICAM-1、LFA-1(CD11a/CD18)、ICOS和4-1BB(CD137)结合的配体或其任何组合。在某些实施例中,CAR包括嵌合融合蛋白,所述嵌合融合蛋白包括细胞外抗原识别结构域、跨膜结构域和细胞内信号传导结构域,所述细胞内信号传导结构域包括源自刺激分子的功能性信号传导结构域(初级信号传导结构域)。在某些实施例中,CAR包括嵌合融合蛋白,所述嵌合融合蛋白包括细胞外抗原识别结构域、跨膜结构域和细胞内信号传导结构域,所述细胞内信号传导结构域包括源自共刺激分子的功能性信号传导结构域(共刺激信号结构域)和源自刺激分子的功能性信号传导结构域(初级信号传导结构域)。在某些实施例中,CAR包括嵌合融合蛋白,所述嵌合融合蛋白包括细胞外抗原结合结构域、跨膜结构域和细胞内信号传导结构域,所述细胞内信号传导结构域包括源自一个或多个共刺激分子的两个功能性信号传导结构域和源自刺激分子的功能性信号传导结构域。在某些实施例中,CAR包括嵌合融合蛋白,所述嵌合融合蛋白包括细胞外抗原结合结构域、跨膜结构域和细胞内信号传导结构域,所述细胞内信号传导结构域包括源自一个或多个共刺激分子的至少两个功能性信号传导结构域和源自刺激分子的功能性信号传导结构域。在某些实施例中,CAR在CAR融合蛋白的氨基末端(N末端)处包括任选的前导序列。在某些实施例中,CAR进一步包括在细胞外抗原结合结构域的N末端处的前导序列,其中在细胞处理和CAR定位到细胞膜期间,前导序列任选地从scFv结构域切割。
本公开提供了编码CAR的核酸序列,例如DNA或RNA构建体,其中CAR包括与疾病相关抗原结合的抗体片段。在某些实施例实施例中,编码抗体片段的序列与编码细胞内结构域的核酸序列相邻,并且在相同的阅读框中。细胞内结构域包括共刺激信号传导区和/或ζ链。共刺激信号传导区是指CAR的一部分,其包括共刺激分子的细胞内结构域。
在某些实施例中,CAR构建体包括任选的前导序列、细胞外抗原结合结构域、铰链、跨膜结构域和细胞内刺激结构域。在某些实施例中,CAR构建体包括任选的前导序列、细胞外抗原结合结构域、铰链、跨膜结构域、细胞内共刺激结构域和细胞内刺激结构域。
在某些实施例中,除了效应子增强基因之外,表达盒还包含编码嵌合抗原受体的一种或多种组分的表达盒。例如,在一个实施例中,提供了单个表达盒,所述单个表达盒包含效应子增强基因的编码序列和嵌合融合蛋白的编码序列,所述嵌合融合蛋白包括细胞外抗原结合结构域、跨膜结构域和细胞内信号传导结构域。
在某些实施例中,CAR靶向CD19。在一个实施例中,CAR是阿基仑赛。在另一个实施例中,CAR是布瑞基奥仑赛。在另一个实施例中,CAR是替沙仑赛。在另一个实施例中,CAR是利基迈仑赛。在另一个实施例中,CAR是艾基维仑赛。
在一个实施例中,提供了一种表达盒,所述表达盒包括LTBR和阿基仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括LTBR和布瑞基奥仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括LTBR和替沙仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括LTBR和利基迈仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括LTBR和艾基维仑赛的编码序列。
在另一个实施例中,提供了一种表达盒,所述表达盒包括AHCY、DUPD1、AKR1C4、ATF6B、ITM2A、AHNAK、BATF、GPD1、GPN3、MRPL51、DBI、CALML3、IL12B、IFNL2或ADA和阿基仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括AHCY、DUPD1、AKR1C4、ATF6B、ITM2A、AHNAK、BATF、GPD1、GPN3、MPRL51、DBI、CALML3、IL12B、IFNL2或ADA和布瑞基奥仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括AHCY、DUPD1、AKR1C4、ATF6B、ITM2A、AHNAK、BATF、GPD1、GPN3、MRPL51、DBI、CALML3、IL12B、IFNL2或ADA和替沙仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括AHCY、DUPD1、AKR1C4、ATF6B、ITM2A、AHNAK、BATF、GPD1、GPN3、MRPL51、DBI、CALML3、IL12B、IFNL2或ADA和利基迈仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括AHCY、DUPD1、AKR1C4、ATF6B、ITM2A、AHNAK、BATF、GPD1、GPN3、MRPL51、DBI、CALML3、IL12B、IFNL2或ADA和艾基维仑赛的编码序列。
在另一个实施例中,提供了一种表达盒,所述表达盒包括表1的基因中的任何基因和阿基仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括表1的基因中的任何基因和布瑞基奥仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括表1的基因中的任何基因和替沙仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括表1的基因中的任何基因和利基迈仑赛的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括表1的基因中的任何基因和艾基维仑赛的编码序列。
在某些实施例中,CAR靶向间皮素。在某些实施例中,CAR靶向ROR1。在某些实施例中,CAR靶向B7-H3。在某些实施例中,CAR靶向CD33。在某些实施例中,CAR靶向EGFR806。在某些实施例中,CAR靶向IL13Rα2。在某些实施例中,CAR靶向GD2。在某些实施例中,CAR靶向HER2。在某些实施例中,CAR靶向磷脂酰肌醇蛋白聚糖3。在某些实施例中,CAR靶向CD7。在某些实施例中,CAR靶向NY-ESO-1。在某些实施例中,CAR靶向CD30。在某些实施例中,CAR靶向MAGE-A1。在某些实施例中,CAR靶向LMP2。在某些实施例中,CAR靶向PD1。在某些实施例中,CAR靶向突变体KRAS G12V。在某些实施例中,CAR靶向CD20。在某些实施例中,CAR靶向CD22。在某些实施例中,CAR靶向CD171。在某些实施例中,CAR靶向CD123。在某些实施例中,CAR靶向CD38。在某些实施例中,CAR靶向CD10。在某些实施例中,CAR靶向BAFFR。在某些实施例中,CAR靶向PSMA。在某些实施例中,CAR靶向粘蛋白(TnMUC1)。Posey AD Jr等人,靶向膜粘蛋白MUC1控制腺癌的癌症相关Tn-糖型的经工程化的CAR T细胞(Engineered CAR T CellsTargeting the Cancer-Associated Tn-Glycoform of the Membrane Mucin MUC1Control Adenocarcinoma.)《免疫学(Immunity.)》2016年6月21日;44(6):1444-54.doi:10.1016/j.immuni.2016.05.014.PMID:27332733;PMCID:PMC5358667。在某些实施例中,CAR靶向CD70。参见Srinivasan等人,1972ALLO-316的研究:靶向CD70的抗自相残杀同种异体CAR T作为AML治疗的潜在疗法(1972Investigation of ALLO-316:A Fratricide-Resistant Allogeneic CAR T Targeting CD70 As aPotential Therapy for theTreatment of AML),第62届ASH年会和博览会(62nd ASH Annual Meeting andExposition),2020年12月5-8日。在某些实施例中,CAR靶向TRIB1C。Maciocia PM等人,靶向T细胞受体β-链恒定区用于T细胞恶性肿瘤的免疫疗法(Targeting the T cell receptorβ-chain constant region for immunotherapy of T cell malignancies.)《自然医学》2017年12月;23(12):1416-1423.doi:10.1038/nm.4444.电子版2017年11月13日.PMID:29131157。
各种其它嵌合抗原受体是本领域已知的或者可以由技术人员设计。此类CAR包含目前正在进行临床测试的那些,如在图19中鉴定的那些。使用所提供的NCT编号,可以在ClinicalTrials.gov中找到临床试验信息。在替代性实施例中,提供了一种表达盒,所述表达盒包括表1的基因中的任何基因和在图19中鉴定的CAR的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括LTBR和在19中鉴定的CAR的编码序列。
其它嵌合抗原受体包含用于治疗自身免疫性疾病的那些,如嵌合自身抗原受体(CAAR)。此类CAAR包含DSG3-CAART和MuSK-CAART。其它可以是本领域已知的或者可以由技术人员设计。在替代性实施例中,提供了一种表达盒,所述表达盒包括表1的基因中的任何基因和CAAR的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括LTBR和CAAR的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括AHCY、DUPD1、AKR1C4、ATF6B、ITM2A、AHNAK、BATF、GPD1、GPN3、MRPL51、DBI、CALML3、IL12B、IFNL2或ADA和CAAR的编码序列。
本文所描述的CAR和TCR的示例性序列在以下实施例2、3和4中提供。可用于构建CAR的其它示例性抗体序列在图21中提供。
在某些,表达盒包括表1的基因和卵泡刺激素免疫受体的编码序列,如Powell等人,WO 2016/073456中描述的,所述文献通过引用并入本文。
在某些实施例中,除了效应子增强基因之外,表达盒还包含一种或多种包括经工程化的T细胞受体(TCR)的组分。例如,在一个实施例中,提供了单个表达盒,所述单个表达盒包含效应子增强基因的编码序列和包括TCRα和β链的经工程化的TCR的编码序列。在一个实施例中,提供了一种表达盒,所述表达盒包括LTBR和TCR的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括AHCY、DUPD1、AKR1C4、ATF6B、ITM2A、AHNAK、BATF、GPD1、GPN3、MRPL51、DBI、CALML3、IL12B、IFNL2或ADA和TCR的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括表1的基因中的任何基因和TCR的编码序列。
各种其它经工程化的T细胞受体是本领域已知的或者可以由技术人员设计。此类TCR包含目前正在进行临床测试的那些,如在图20中鉴定的那些。在替代性实施例中,提供了一种表达盒,所述表达盒包括表1的基因中的任何基因和在图20中鉴定的TCR的编码序列。在另一个实施例中,提供了一种表达盒,所述表达盒包括LTBR和在20中鉴定的TCR的编码序列。
在本文所提供的核酸的某些实施例中,效应子增强基因与CAR或TCR的组分一起在表达盒中提供。在其它实施例中,效应子增强基因与CAR或TCR的组分分开在表达盒中提供。
在某些实施例中,期望下调或沉默与效应子增强基因和CAR或TCR的表达结合的某些其它基因。此类基因包含例如NFκB通路的基因,如TNFAIP3和NFKBIA。用于基因下调或沉默的组合物和方法是本领域已知的,并且包含例如siRNA、miRNA、CRISPR/CAS等。在某些实施例中,结合CAS蛋白的递送,提供了靶向所关注基因的sgRNA,如实例10中所描述的。
在其它实施例中,提供了一种组合物,所述组合物包含编码效应子增强基因的核酸和编码病毒蛋白的核酸。期望的病毒蛋白包含糖蛋白,如刺突蛋白、E2蛋白、E1蛋白和血凝素。在一个实施例中,病毒蛋白是冠状病毒刺突蛋白。存在至少16种不同的HA,包含亚型H1到H16。H1、H2和H3是在人流感病毒上发现的。另一个所关注HA是在禽流感病毒H5N1上发现的H5。例如,病毒蛋白可以包括从亚型H1到H16的任何HA。其它合适的病毒糖蛋白包含但不限于登革热病毒包膜糖多肽、丙型肝炎病毒包膜糖多肽E1、丙型肝炎病毒包膜糖多肽E2、汉坦病毒包膜糖多肽G1、汉坦病毒包膜糖多肽G2。汉坦病毒包膜糖多肽G1和G2任选地来自汉坦病毒的安第斯、汉坦或辛诺柏菌株。病毒糖肽还包含人巨细胞病毒糖多肽B、人巨细胞病毒糖多肽H、人疱疹病毒-8糖多肽B、人疱疹病毒-8糖多肽H、人偏肺病毒糖多肽F、人偏肺病毒糖多肽G、人副流感病毒人类凝集素-神经氨酸酶、人副流感病毒融合糖多肽、尼帕病毒糖多肽F、尼帕病毒糖多肽G、呼吸道合胞病毒糖多肽F、呼吸道合胞病毒糖多肽G、严重急性呼吸综合征(SARS)病毒刺突糖多肽、西尼罗病毒包膜糖多肽和HIV-1包膜糖多肽。HIV-1包膜糖多肽任选地是YU2 Env、SF162 Env、来自HIV-1B菌株的Env、来自HIV-1C菌株的Env和来自HIV-1M菌株的Env。在某些实施例中,效应子增强基因和/或病毒蛋白的编码序列以mRNA的形式提供。
如本文所使用的,术语“表达盒”是指编码一个或多个生物学上有用的核酸序列(例如,编码蛋白质、酶或其它有用的基因产物的基因cDNA、mRNA等)和与其可操作地连接的调节序列的核酸分子,所述调节序列指导或调节核酸序列和其基因产物的转录、翻译和/或表达。此类调节序列通常包含例如启动子、增强子、内含子、Kozak序列、聚腺苷酸化序列和TATA信号中的一者或多者。表达盒可以含有基因序列上游(5'处)的调节序列,例如,启动子、增强子、内含子等中的一者或多者以及增强子中的一者或多者,或基因序列下游(3'处)的调节序列,例如,包括聚腺苷酸化位点的3'非翻译区,以及其它元件。因此,除了效应子增强基因(和/或CAR或TCR)的编码序列之外,表达盒还可以包含表达控制序列。
表达控制序列包含启动子。在一些实施例中,期望利用具有高转录活性的启动子。某些强组成型启动子是本领域已知的,包含但不限于CMV启动子、EF-1α启动子、EFS启动子、CBG启动子、CB7启动子、hPGK、RPBSA、WAS启动子等。可替代地,可以利用其它启动子,如可调节(诱导型)启动子[参见例如WO 2011/126808和WO 2013/049493,所述文献通过引用并入本文],或对生理学线索作出应答的启动子。在某些实施例中,期望利用系统,通过所述系统,LTBR(或其它效应子增强基因)仅在T细胞遇到其靶细胞并通过抗原受体(CAR或TCR)接收信号之后才表达;并且一旦靶细胞被清除并且抗原受体不再传输信号,效应子增强基因表达就会衰减回背景水平。因此,在某些实施例中,期望利用对T细胞的激活作出应答的启动子。此类启动子包含但不限于NFAT、NFκB和AP1启动子。
在某些实施例中,表达盒还可以包含一个或多个IRES或2A序列,以允许从同一表达盒中表达多个编码序列。如本文所例示的,在一个实施例中,针对CD19的CAR提供有针对在表1中鉴定的基因中的一个基因,例如LTBR的ORF。参见图5A,在包含2A序列的慢病毒载体中。示例性P2A序列在SEQ ID NO:59中示出。此类盒和载体的构建是本领域已知的,并在本文的实例中有所描述。参见例如Sack等人增殖控制中深刻的组织特异性是癌症驱动因子和非整倍体模式的基础(Profound Tissue Specificity in Proliferation ControlUnderlies Cancer Drivers and Aneuploidy Patterns.)《细胞(Cell.)》2018年4月5日;173(2):499-514.e2以及Yang等人,人ORF的公共基因组规模的慢病毒表达文库(A publicgenome-scale lentiviral expression library of human ORFs),《自然方法(NatMethods.)》2011年8月;8(8):659-661,所述文献通过引用并入本文。
构建体的各种组分的编码序列的定位可以变化。例如,在某些方面,期望将效应子增强基因编码序列定位到CAR编码序列的上游。在其它实施例中,期望将效应子增强基因编码序列定位到CAR编码序列的下游。在其它实施例中,选择标志物基因包含在构建体中。
在某些方面,本文提供了包含经修饰的淋巴细胞的组合物,所述经修饰的淋巴细胞包括如本文所描述的核酸和/或表达盒。在一个实施例中,宿主淋巴细胞是T细胞。在另一个实施例中,宿主淋巴细胞是自然杀伤(NK)细胞。在某些实施例中,组合物包括细胞群体,所述细胞群体包含淋巴细胞的混合群体(例如,αβT细胞和NK T细胞)。在其它实施例中,组合物包括细胞,所述细胞包含富集特定淋巴细胞群体的群体。
如本文所使用的,短语“T细胞”是指表达T细胞受体分子的淋巴细胞。T细胞包含人αβ(alpha beta)T细胞和人γδ(gamma delta)T细胞。T细胞包含但不限于原初T细胞、经刺激的T细胞、原代T细胞、经培养的T细胞、永生化T细胞、辅助T细胞、细胞毒性T细胞、记忆T细胞、调节T细胞、自然杀伤T细胞、其组合或其亚群体。T细胞可以是CD4+、CD8+或CD4+和CD8+。T细胞还可以是CD4-、CD8-或CD4-和CD8-。T细胞可以是辅助细胞,例如TH1、TH2、TH3、TH9、TH17或TFH型辅助细胞。T细胞可以是细胞毒性T细胞。T细胞还可以是调节T细胞。调节T细胞(Treg)可以是FOXP3+或FOXP3-。T细胞可以是α/βT细胞或γ/δT细胞。在一些情况下,T细胞是CD4+CD25hiCD127lo调节T细胞。在一些情况下,T细胞是选自由以下组成的组的调节T细胞:1型调节(Tr1)、TH3、CD8+CD28-、Tregl7和Qa-1限制性T细胞或其组合或亚群体。在一些情况下,T细胞是FOXP3+ T细胞。在一些情况下,T细胞是CD4+CD25loCD127hi效应子T细胞。在一些情况下,T细胞是CD4+CD25loCD127hiCD45RAhiCD45RO-原初T细胞。在某些实施例中,T细胞是Vγ9Vδ2T细胞。在一些实施例中,T细胞表达病毒抗原。在其它实施例中,T细胞表达癌症抗原。T细胞可以是经过基因操纵的重组T细胞。
如本文所使用的,原代细胞的上下文中的短语“原代”是未被转化或永生化细胞。此类原代细胞可以培养、传代培养或传代有限次数(例如,培养0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次)。在一些情况下,原代细胞适应体外培养条件。在一些情况下,原代细胞从生物体、系统、器官或组织中分离,任选地分选,并直接利用,无需培养或传代培养。在一些情况下,原代细胞被刺激、激活或分化。例如,可以通过与CD3、CD28激动剂、IL-2、IFN-γ或其组合接触(例如,在其存在下培养)来激活原代T细胞。
方法
制备经修饰的宿主细胞的方法
本文还提供了制备如本文所描述的经修饰的细胞和含有经修饰的细胞的组合物的方法。经修饰的细胞,例如淋巴细胞引入外源性序列的方法是本领域已知的,所述外源性序列如包括效应子增强基因、CAR或TCR或这些序列中的多于一种的编码序列的表达盒或表达载体。例如,参见例如WO 2016/109410 A2,所述文献通过引用并入本文。在某些实施例中,引入多于一个外源性序列。
如本文所使用的术语“经修饰的”意指本发明的分子或细胞的改变的状态或结构。可以以许多方式,包含化学上、结构上、和/或功能上对分子进行修饰。可以通过引入核酸来修饰细胞。修饰可以是指改变基因在淋巴细胞中的表达,例如,通过引入编码基因的外源性核酸。
本文所提供的淋巴细胞可以通过例如转染、转导或电穿孔进行遗传修饰,以表达编码基因的核酸序列,如本文所描述的。根据临床情况,例如患者的病状或要治疗的病状,基因的延长或永久表达和/或,例如,对于稳健和持久的CAR活性,例如抗肿瘤活性,可能是期望的。在此类实施例中,使用包括编码本文所公开的基因的核酸序列的载体对淋巴细胞进行遗传修饰,例如转导,例如病毒转导,以赋予期望的效应子功能。在其它实施例中,基因的瞬时表达是期望的。在此类实施例中,可以使用例如mRNA或可调节启动子来表达效应子增强基因。
将基因引入到细胞中并进行表达的方法是本领域已知的。在表达载体的上下文中,可以通过本领域的任何将载体容易地引入到宿主细胞,例如,哺乳动物、细菌、酵母或昆虫细胞中。例如,表达载体可以通过物理、化学或生物手段转移到宿主细胞中。
用于将多核苷酸引入到宿主细胞中的物理方法包含磷酸钙沉淀、脂质转染、颗粒轰击、微注射、电穿孔等。用于产生包括载体和/或外源性核酸的细胞的方法是本领域众所周知的。参见例如,Sambrook等人,2012,《分子克隆:实验室手册》,第1-4卷,纽约的冷泉港出版社(Cold Spring Harbor Press,NY)。将多核苷酸引入到宿主细胞中的合适的方法是磷酸钙转染。
用于将所关注多核苷酸引入到宿主细胞中的生物方法包含使用DNA和RNA载体。病毒载体,以及尤其是逆转录病毒载体已成为用于将基因插入到哺乳动物,例如,人类细胞中的最广泛使用的方法。其它病毒载体可以源自慢病毒、痘病毒、单纯疱疹病毒I、腺病毒和腺相关病毒等。
用于将多核苷酸引入宿主细胞的化学手段包含胶态分散系统,如大分子复合物、纳米胶囊、微球、珠以及包含水包油乳剂、微团、混合胶束和脂质体的基于脂质的系统。用作体外和体内递送媒剂的示例性胶体系统是脂质体(例如,人工膜囊泡)。靶向递送核酸的其它方法是可用的,如用靶向纳米颗粒或其它适合的亚微米大小的递送系统递送多核苷酸。考虑使用脂质调配物将核酸引入到宿主细胞中(体外、离体或体内)。另一方面,核酸可以与脂质缔合。可以将与脂质缔合的核酸包封在脂质体的含水内部、散布在脂质体的脂质双层、经由与脂质体和多核苷酸二者缔合的连接分子与脂质体连接、捕获在脂质体中、与脂质体复合、分散在含有脂质的溶液中、与脂质混合、与脂质合并、作为脂质中的悬浮液而含有、含有微团或与微团复合、或以其它方式与脂质缔合。与脂质、脂质/DNA或脂质/表达载体缔合的组合物分不限于溶液中的任何具体结构。例如,所述组合物可以按以下存在:双层结构、微团、或“折叠”结构。所述组合物还可以简单地散布在溶液中,可能形成大小或性状并不均匀的聚集体。脂质是可以是天然存在的脂质或合成脂质的脂肪物质。例如,脂质包含在细胞质中天然存在的脂肪滴,以及含有长链脂肪烃的化合物和其衍生物,如脂肪酸、醇、胺、氨基醇、和醛的类别。还考虑了脂质转染胺-核酸复合物。
无论用于将外源性核酸引入到宿主细胞中或以其它方式将细胞暴露于本发明的抑制剂的方法如何,为了证实重组核酸序列存在于宿主细胞中,可以进行多种测定。此类测定包含例如Southern和Northern印迹、RT-PCR和PCR、生物化学测定,如例如通过免疫学方法(ELISA和蛋白质印迹)来检测特定肽的存在或不存在。
在某些实施例中,提供了包含效应子增强基因的编码序列的表达载体。在其它实施例中,表达载体包含CAR或TCR的一个或多个组分的编码序列。在其它实施例中,提供了包含CAR或TCR的一个或多个组分的编码序列的单独表达载体。表达载体包含本领域已知的所有表达载体,包含掺入重组多核苷酸的粘粒、质粒(例如,裸的或包含在脂质体中)和病毒(例如,慢病毒、逆转录病毒、腺病毒和腺相关病毒)。在一个实施例中,表达载体是慢病毒。如果利用多于一个表达载体,则每个表达载体可以单独选自本领域已知的载体。
本文提供了制备免疫效应子细胞(例如,T细胞、NK细胞)群体的方法,所述免疫效应子细胞被修饰以表达如本文所描述的效应子增强基因,并且任选地表达CAR或TCR。用于制备此类免疫细胞的方法包含将编码选自表1的那些的基因的外源性核酸导入到细胞中。在下文所描述的实例中,为了方便起见,描述了制备经修饰的T细胞的方法。然而,使用其它种类的免疫细胞,例如NK T细胞或NK细胞的替代性实施例是可设想的。合适的方法是本领域已知的。
简而言之,示例性方法包含提供免疫效应子细胞(例如,T细胞)群体,并且任选地,从群体中去除T调节细胞,例如,CD25+ T细胞。在某些实施例中,免疫效应子细胞群体与将施用细胞治疗的受试者是自体的。在某些实施例中,免疫效应子细胞群体包括自体Vγ9Vδ2T细胞。在某些实施例中,免疫效应子细胞群体与将施用细胞治疗的受试者是同种异体的。在一个实施例中,使用抗CD25抗体或其片段或CD25结合配体,例如IL-2从群体中去除T调节细胞,例如CD25+ T细胞。在一个实施例中,抗CD25抗体或其片段或CD25结合配体与底物,例如,珠粒缀合,或以其它方式涂覆在底物,例如,珠粒上。在一个实施例中,抗CD25抗体或其片段与如本文所描述的底物缀合。在一个实施例中,使用抗CD25抗体分子或其片段从群体中去除T调节细胞,例如CD25+T细胞。在另一个实施例中,不去除CD25+细胞。
另一个示例性方法包含提供免疫效应子细胞(例如,T细胞)群体,并富集CD8+细胞和/或CD4+细胞群体。在一个实施例中,使用抗CD8和/或抗CD4抗体或其片段或CD8结合配体和/或CD4结合配体富集群体的CD8+和/或CD4+ T细胞。在一个实施例中,抗CD4和/或抗CD8抗体或其片段或抗CD4和/或抗CD8结合配体与底物,例如,珠粒缀合,或以其它方式涂覆在底物,例如,珠粒上。
在某些实施例中,所述方法进一步包括向细胞递送一种或多种载体,所述一种或多种载体包括编码选自表1的那些的基因,例如LTBR,并且任选地CAR或TCR的核酸。在某些实施例中,载体选自DNA、RNA、质粒、慢病毒载体、腺病毒载体或逆转录病毒载体。在某些实施例实施例中,用载体转导来自T细胞群体的细胞一次,例如,在从受试者的血液样品中获得免疫效应子细胞群体之后的一天内,所述血液样品例如通过单采术获得。在某些实施例中,所述方法进一步包括从T细胞群体中产生瞬时表达外源性RNA的RNA工程化的细胞群体。所述方法包括将体外转录的RNA或合成RNA引入到来自群体的细胞中,其中RNA包括编码表1的基因,例如LTBR的核酸。例如,在某些实施例中,可以用包括编码CAR的核酸的载体转导T细胞群体,并且然后可以将编码表1的基因,例如LTBR的mRNA引入同一细胞群体。
在一个实施例中,本文所描述的经修饰的细胞被扩增。在一个实施例中,细胞在培养物中扩增几小时(例如,约2、3、4、5、6、7、8、9、10、15、18、21小时)至约14天(例如,1、2、3、4、5、6、7、8、9、10、11、12、13或14天)的时间段。在一个实施例中,细胞在培养下扩增3或4天,并且所得细胞比在相同培养条件下在培养下扩增9天的相同细胞更有效力。效力可以通过例如各种T细胞功能,例如增殖、靶细胞杀伤、细胞因子产生、激活、迁移或其组合来定义。
治疗方法
在某些方面,本文还提供了治疗受试者的癌症的方法。在某些实施例中,所述方法包含向受试者施用表达如本文所描述的效应子增强基因的细胞,使得治疗受试者的癌症。在某些实施例中,细胞进一步表达CAR。在其它实施例中,细胞进一步表达TCR。如本文在描述治疗方法时所使用的,为了方便起见,LTBR用作示例性效应子增强基因。然而,在替代性实施例中,利用了表1的其它基因。在某些实施例中,所述方法包含从患者获得细胞,如本文所描述的修饰细胞,并将细胞施用于患者。
可由表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)治疗的癌症的实例是血液癌症。在某些实施例中,血液癌症包含但不限于白血病(如急性髓系白血病、慢性髓系白血病、急性淋巴性白血病、慢性淋巴性白血病和骨髓增生异常综合征)和恶性淋巴增生性病状,包含淋巴瘤(如多发性骨髓瘤、非霍奇金氏淋巴瘤、伯基特氏淋巴瘤和小细胞和大细胞滤泡性淋巴瘤)。在其它实施例中,血液癌症可以包含例如白血病,例如AML或MDS的最小残留疾病MRD。在某些实施例中,癌症是实体瘤。在某些实施例中,癌症是胰腺癌、黑色素瘤、多发性骨髓瘤、肉瘤或肺癌。在另一个实施例中,癌症是与促卵泡激素相关的癌症。此类癌症包含乳腺癌、肺癌、前列腺癌、结直肠癌、食道癌、胃癌、膀胱癌、胰腺癌、肾癌、宫颈癌、肝癌、卵巢癌和睾丸癌。在另一个实施例中,癌症是包含在图19或图20中的列表中的癌症。
在某些实施例中,所述CAR选自阿基仑赛布瑞基奥仑赛(TecartusTM)、艾基维仑赛(AbecmaTM)、利基迈仑赛/>替沙仑赛/>
在另一个实施例中,受试者患有病毒驱动的癌症。在某些实施例中,病毒驱动的癌症选自以下:
表3
另一方面,提供了治疗受试者的自身免疫性疾病的方法。自身免疫性疾病是由对身体的异常免疫攻击引起的病状,并且其大大增加了世界范围内的发病率、死亡率和医疗费用。由于T细胞在自身免疫性疾病的过程中发挥关键作用,因此出现了经工程化的T细胞疗法,并且所述疗法也被认为是克服当前自身免疫性疾病治疗中的障碍的潜在方法。自身反应或自身抗体在自身免疫性疾病的过程中发挥关键作用。因此,对T细胞进行工程化以表达嵌合自身抗体受体(CAAR)是治疗自身免疫性疾病的策略。在一个实施例中,CAR包括CAAR。参见例如Zhang等人,超越癌症的嵌合抗原受体T细胞疗法:当前实践与未来展望(Chimeric antigen receptor T-cell therapy beyond cancer:current practice andfuture prospects),《免疫疗法(Immunotherapy)》,2020年9月;12(13):1021-1034.doi:10.2217/imt-2020-0009.电子版2020年7月30日,所述文献通过引用并入本文。
自身免疫性疾病包含寻常性天疱疮(PV)(例如,DSG3-CAAR-T)和狼疮(例如,MuSK-CAAR-T))。其它自身免疫性疾病包含1型糖尿病、自身免疫性甲状腺疾病、类风湿性关节炎(RA)、炎症性肠病、结肠炎、系统性红斑狼疮和多发性硬化(MS)。参见例如Chen等人,源自自身免疫性疾病中的CAR-T细胞治疗的免疫疗法(Immunotherapy Deriving from CAR-TCell Treatment in Autoimmune Diseases),《免疫学研究杂志(Journal of ImmunologyResearch)》第2019卷,2019年12月31日,所述文献通过引用并入本文。
一方面,所述方法包括将有效量的本文所描述的表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)与有效量的另一种疗法组合施用于有需要的受试者。如本文所使用的,“组合”施用意味着在受试者患有病症的过程期间向受试者递送两种(或更多种)不同的治疗,例如,在受试者已经被诊断为患有所述病症之后并且在所述病症已经治愈或消除或治疗由于其它原因已经停止之前递送所述两种或更多种治疗。在一些实施例中,对一种治疗的递送在对第二治疗的递送开始时仍然发生,使得在施用方面存在重叠。这在本文中有时被称为“同时”或“同时递送”。在其它实施例中,对一种治疗的递送在对另一种治疗的递送开始之前结束。在任一情况的一些实施例中,治疗由于组合施用而更有效。例如,第二治疗更有效,例如,在较少的第二治疗的情况下看到相当的效果,或者相比于在不存在第一治疗的情况下施用第二治疗的情形下将看到的程度,第二治疗在更大程度上减少症状,或者在第一治疗的情况下看到类似情形。在一些实施例中,递送使得症状或与病症相关的其它参数的减少大于在不存在另一种治疗的情况下递送的一种治疗将观察到的减少。两种治疗的作用可以是部分加性的、完全加性的或大于加性的。递送可以使得在递送第二治疗时仍然可检测到所递送的第一治疗的效果。
本文所描述的表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)和所述至少一种另外的治疗剂可以在相同或单独的组合物中同时施用或顺序施用。对于顺序施用,可以首先施用本文所描述的表达效应子增强基因的细胞(例如,LTBR CART或LTBRTCR-T细胞),并且可以其次施用另外的药剂,或者施用顺序可以颠倒。
表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)和/或其它治疗剂、手术或模态可以在病症活跃的时间段期间,或在疾病缓解或疾病不太活跃的时间段期间施用。表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)可以在其它治疗之前、与治疗同时、在治疗之后或在病症缓解期间施用。
在组合施用时,表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)和另外的药剂(例如,第二药剂或第三药剂)或全部均可以以比单独使用的每种药剂,例如作为单一疗法的量或剂量更高、更低或相同的量或剂量施用。在某些实施例中,表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)、另外的药剂(例如,第二药剂或第三药剂)或全部的施用量或剂量比单独使用的每种药剂,例如作为单一疗法的量或剂量低(例如,至少20%、至少30%、至少40%或至少50%)。在其它实施例中,表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)、另外的药剂(例如,第二药剂或第三药剂)或全部的量或剂量比用于实现相同的治疗作用所需的单独使用的每种药剂,例如作为单一疗法的量或剂量低(例如,低至少20%、至少30%、至少40%或至少50%)。
在另外的方面,本文所描述的表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)可以与外科手术、化疗、辐射、如环孢霉素、硫唑嘌呤、甲氨蝶呤、麦考酚酯和FK506等免疫抑制剂、抗体或如CAMPATH等其它免疫清除剂、抗CD3抗体或其它抗体疗法、cytoxan、氟达拉滨、环孢菌素、FK506、雷帕霉素、麦考酚酸、类固醇、FR901228、细胞因子、照射或肽疫苗,如Izumoto等人2008《神经外科杂志(JNeurosurg)》108:963-971中所描述的在治疗方案中组合使用。
在某些实例中,如本文所描述的表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)与其它治疗剂组合,如其它抗癌剂、抗过敏剂、止吐剂(或镇吐药)、止痛药、细胞保护剂和其组合。
在某些实施例中,本文的表达效应子增强基因的细胞(例如,LTBR CART或LTBRTCR-T细胞)可以与化疗剂组合使用。示例性化疗剂包含蒽环类(例如,多柔比星(doxorubicin)(例如,脂质体多柔比星))、长春花生物碱(例如,长春花碱(vinblastine)、长春新碱(vincristine)、长春地辛(vindesine)、长春瑞滨(vinorelbine))、烷基化剂(例如,环磷酰胺、达卡巴嗪(decarbazine)、美法仑(melphalan)、异环磷酰胺(ifosfamide)、替莫唑胺(temozolomide))、免疫细胞抗体(例如,阿伦单抗(Alemtuzamab)、吉妥珠单抗(gemtuzumab)、利妥昔单抗(rituximab)、奥法木单抗(ofatumumab)、托西莫单抗(tositumomab)、本妥昔单抗(Brentuximab))、抗代谢物(包含,例如,叶酸拮抗剂、嘧啶类似物、嘌呤类似物和腺苷脱氨酶抑制剂(例如,氟达拉滨(fludarabine)))、mTOR抑制剂、TNFR糖皮质激素诱导的TNFR相关蛋白(GITR)激动剂、蛋白酶体抑制剂(例如,阿克拉霉素A(aclacinomycin A)、胶霉毒素(gliotoxin)或硼替佐米(bortezomib))、免疫调节剂,如沙利度胺(thalidomide)或沙利度胺衍生物(例如,来那度胺(lenalidomide))或检查点抑制剂(例如,PD-1或PD-L1抑制剂,例如,派姆单抗(Pembrolizumab)(可瑞达(Keytruda))、纳武单抗(Nivolumab)(欧狄沃(Opdivo))、西米普利单抗(Cemiplimab)(利伯塔约(Libtayo))、阿特朱单抗(Atezolizumab)(特森特里克(Tecentriq))、阿维鲁单抗(Avelumab)(巴文西亚(Bavencio))、德瓦鲁单抗(Durvalumab)(因芬齐(Imfinzi)))。
考虑用于组合疗法的一般化疗剂包含阿那曲唑(anastrozole,)、比卡鲁胺(bicalutamide,/>)、硫酸博来霉素(bleomycin sulfate,/>)、白消安/>白消安注射剂/>卡培他滨(capecitabine,/>)、N4-戊氧基羰基-5-脱氧-5-氟胞嘧啶、卡铂(carboplatin,/>)、卡莫司汀(carmustine,)、苯丁酸氮芥(chlorambucil,/>)、顺铂(cisplatin,/>)、克拉屈滨/>环磷酰胺(/>或/>)、阿糖胞苷、胞嘧啶阿拉伯苷 阿糖胞苷脂质体注射剂/>达卡巴嗪(dacarbazine,)、放线菌素D(dactinomycin,Actinomycin D,Cosmegan)、盐酸柔红霉素柠檬酸柔红霉素脂质体注射剂/>地塞米松、多西他赛(docetaxel,/>)、盐酸多柔比星/>依托泊苷磷酸氟达拉滨/>5-氟尿嘧啶/>氟他胺替扎西滨(tezacitibine)、吉西他滨(Gemcitabine,二氟脱氧西替丁)、羟基脲/>伊达比星/>异环磷酰胺/>伊立替康(irinotecan,)、L-天冬酰胺酶/>亚叶酸钙、美法仑/>6-巯基嘌呤甲氨蝶呤/>米托蒽醌/>麦塔罗(mylotarg)、紫杉醇phoenix(钇90/MX-DTPA)、喷司他汀(pentostatin)、具有卡莫司汀植入物的聚苯丙生20/>柠檬酸他莫昔芬(tamoxifen citrate,/>)、替尼泊苷(teniposide,/>)、6-硫鸟嘌呤、噻替哌(thiotepa)、替拉扎明(tirapazamine,)、注射用盐酸拓扑替康(topotecan hydrochloride for injection,)、长春花碱/>长春新碱/>和长春瑞滨/>
用本文所描述的化疗剂和表达效应子增强基因的细胞(例如,LTBR CART或LTBRTCR-T细胞)的组合进行的治疗可以用于治疗本文所描述的血液学癌症,例如AML。在实施例中,化疗剂和表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)的组合可用于靶向,例如杀伤癌症干细胞,例如白血病干细胞,例如在患有AML的受试者体内靶向。在实施例中,化疗剂和表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)的组合可用于治疗微小残留疾病(MRD)。MRD是指在治疗,例如化疗期间或在治疗之后,在受试者体内残留的少量癌细胞。MRD通常是复发的主要原因。本发明提供了用于治疗癌症,例如MRD的方法,所述方法包括组合施用化疗剂和表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞),如本文所描述的。
在某些实施例中,在施用表达效应子增强基因的细胞(例如,LTBR CART或LTBRTCR-T细胞)之前施用化疗剂。在期望多于一次施用化疗剂的化疗方案中,化疗方案在施用表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)之前开始或完成。在实施例中,在施用表达效应子增强基因的细胞(例如,LTBR CART或LTBR TCR-T细胞)之前至少1天、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、20天、25天或30天施用化疗剂。在实施例中,在施用表达效应子增强基因的细胞(例如,LTBR CART或LTBRTCR-T细胞)之前至少1天、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、20天、25天或30天开始或完成化疗方案。
当指示“免疫有效量”、“抗肿瘤有效量”、“肿瘤抑制有效量”或“有效量”时,要施用的本发明组合物的精确量可以由医师考虑年龄、体重、肿瘤大小、感染或转移程度方面的个体差异以及患者(受试者)的病状来确定。通常可以说,包括本文所描述的T细胞的药物组合物可以以104至109个细胞/kg体重,在一些实例中105至106个细胞/kg体重,包含那些范围内的所有整数值的剂量施用。还可以按这些剂量多次施用T细胞组合物。细胞可以通过使用免疫疗法中已知的输注技术来施用(参见例如,Rosenberg等人,《新英格兰医学杂志》319:1676,1988)。如本文所使用的,术语药剂的“有效量”是足以产生有益或期望的结果例如临床结果的量,并且因此,“有效量”取决于其应用的环境。例如,在施用治疗肿瘤的药剂的情况下,与未施用药剂获得的应答相比,药剂的有效量是例如足以减小或降低肿瘤大小或抑制肿瘤生长的量。术语“有效量”可以与“有效剂量”、“治疗有效量”或“治疗有效剂量”互换使用。
本文还提供了用组合疫苗对受试者进行疫苗接种的方法,所述组合疫苗包含编码至少一种效应子增强基因和至少一种病毒蛋白的至少两种核酸序列。在一个实施例中,效应子增强基因是LTBR。在另一个实施例中,病毒蛋白是冠状病毒刺突蛋白。一些实施例提供了疫苗,所述疫苗包括在阳离子脂质纳米颗粒(LNP)内调配的具有编码效应子增强基因的开放阅读框的RNA多核苷酸、具有编码效应子增强基因的开放阅读框的RNA多核苷酸、病毒蛋白和药学上可接受的载体或赋形剂。本文所描述的疫苗(例如LNP包封的mRNA疫苗)在接种疫苗的受试者的血液或血清中产生抗原特异性抗体的预防和/或治疗有效水平、浓度和/或滴度。参见例如US2018/0311336A1,所述文献通过引用整体并入本文。
如本文所使用的,术语“治疗(treatment)”和其变体,如“治疗(treat)”或“治疗(treating)”是指试图改变正被治疗的个体的自然进程的临床干预,并且可以被执行以用于预防或者在临床病理学进程期间执行。治疗的期望的效果包含但不限于预防或减少疾病发生或复发、减轻症状、减少疾病的任何直接或间接病理性后果、降低疾病进展速率、改善或缓和疾病状态以及缓解或改进预后。在某些实施例中,本文所描述的组合物用于延缓疾病的发展或减缓疾病的进展。
同样,如本文所使用的,术语“癌症的治疗”或“治疗癌症”可以用许多不同的参数来描述,包含但不限于,与对照相比,患有癌症的动物中的肿瘤大小的减小、患有癌症的动物中的肿瘤生长或增殖的减少、预防转移或减少转移的程度和/或延长患有癌症的动物的存活期。在某些实施例中,治疗导致远处复发或转移的风险降低。
如本文所使用的术语“癌症”是指以不受调节的细胞生长或复制为特征的任何疾病、病状、性状、基因型或表型。在某些实施例中,施用本文所公开的组合物,例如根据本文所公开的方法,治疗癌症。在某些实施例中,癌症选自由以下组成的组:肾上腺皮质癌、晚期癌症、肛门癌、再生障碍性贫血、胆道癌、膀胱癌、骨癌、骨转移瘤、脑瘤、脑癌、乳腺癌、儿童癌症、原发原因不明的癌症、卡斯特曼病(Castleman disease)、宫颈癌、结肠/直肠癌、子宫内膜癌、食道癌、尤文氏肿瘤家族、眼癌、胆囊癌、胃肠道类癌肿瘤、胃肠道间质瘤、妊娠滋养细胞疾病、霍奇金病、卡波西肉瘤、肾细胞癌、喉癌和下咽癌、急性淋巴细胞白血病、急性髓性白血病、慢性淋巴细胞白血病、慢性髓性白血病、慢性粒单核细胞白血病、肝癌、肝细胞癌(HCC)、非小细胞肺癌、小细胞肺癌、肺类癌肿瘤、皮肤淋巴瘤、恶性间皮瘤、多发性骨髓瘤、骨髓增生异常综合征、鼻腔和鼻窦癌、鼻咽癌、神经母细胞瘤、非霍奇金淋巴瘤、口腔和口咽癌、骨肉瘤、卵巢癌、胰腺癌、阴茎癌、垂体肿瘤、前列腺癌、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌、成人软组织肉瘤、基底和鳞状细胞皮肤癌、黑色素瘤、小肠癌、胃癌、睾丸癌、喉癌、胸腺癌、甲状腺癌、子宫肉瘤、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症(Waldenstrommacroglobulinemia)、肾母细胞瘤、由癌症治疗引起的继发性癌症和其任何组合。在某些实施例中,癌症是图19或图20中列出的那些中的一者。
筛选方法
本文公开了进行功能获得筛选以鉴定改变淋巴细胞活性的基因的方法。基因包含例如,通常不由淋巴细胞表达的那些或仅在特定淋巴细胞群体或环境中表达(例如,在暴露于抗原之后)的基因。鉴定其表达因刺激而改变或通常不表达的基因的能力具有依赖定制的、偏向的文库的方法的某些优点,包含基于RNA测序的方法。具体地,所公开的方法有助于将功能获得研究翻译为许多不同的生理和病理背景,并修饰难以工程化的细胞类型。
在某些实施例中,提供了一种鉴定基因的方法,所述基因当在经修饰的淋巴细胞中外源性地表达时改变所述经修饰的淋巴细胞的治疗功能,其中所述方法包含:(a)获得淋巴细胞群体;(b)用多个病毒载体转导所述淋巴细胞群体,每个病毒载体编码与条形码连接的基因;(c)刺激经转导的淋巴细胞以诱导激活、增殖和/或效应子功能;(d)从(c)的所述淋巴细胞群体中分离经转导的淋巴细胞;以及(e)检测经分离的淋巴细胞中的所述基因和/或连接的条形码的存在。根据所述方法鉴定的基因可有效改变表达所述基因的经修饰的淋巴细胞的治疗功能。本文提供了表达基因的淋巴细胞和用于将淋巴细胞递送至受试者的方法。
虽然本文所例示的筛选方法利用了慢病毒介导的开放阅读框(ORF)文库的递送(参见Sack等人,《细胞》2018年4月5日;173(2):499-514.e2,所述文献通过引用并入本文),所述方法延伸至筛选如非编码RNA(例如,微小RNA(miRNA)和长非编码RNA(IncRNA,长ncRNA))等非编码序列的表达,以及选择性ORF、微小ORF、上游ORF等(即,基因组中的小蛋白质编码元件)的方法。因此,如本文所使用的术语“基因”是指编码蛋白质的序列和不编码蛋白质的序列两者。
如本文所使用的术语“条形码”或“条形码序列”是指与经表达的基因的检测和/或鉴定相对应并允许经表达的基因的检测和/或鉴定的核苷酸序列。条形码通常包括四个或更多个核苷酸。在一些实施例中,条形码包括4、5、6、7、8、9、10、11、2、13、14或15个核苷酸。在一些实施例中,条形码包括8至15个核苷酸。如本文所使用的,术语“带条形码的基因”、“带条形码的ORF”等是指具有附加带条形码的序列的核酸,无论条形码是与ORF的5'或3'末端直接连接,还是在ORF的5'或3'末端被1个或多个核苷酸分开。
尽管本文参考T细胞描述了某些方面,但所公开的方法可以鉴定其它淋巴细胞群体中改变的功能应答,包含但不限于NK T细胞、NK细胞、B细胞、γδT细胞和其组合和亚群体。在某些实施例中,淋巴细胞群体是已经富集了T细胞、B细胞、NK T细胞、NK细胞、Vγ9Vδ2T细胞或其亚群体中的一者或多者的细胞群体。可以使用本领域已知的用于获得和/或富集具有淋巴细胞或淋巴细胞群体/亚群体的细胞样品的各种分离或纯化方法,包含例如Ficoll梯度分离、使用抗体、四聚体等的阳性和阴性选择技术,通过磁分离或流式细胞术,从生物样品(血液、组织等)中的一个或多个受试者获得细胞。在某些实施例中,所述淋巴细胞群体富集CD4+ T细胞、CD8+ T细胞、αβT细胞和γδT细胞中的一者或多者。在某些实施例中,筛选方法包含具有在淋巴细胞表面上表达的功能性抗原特异性受体的淋巴细胞。在某些实施例中,淋巴细胞群体包括表达CAR或经工程化的表达TCR的淋巴细胞。在某些实施例中,淋巴细胞群体是永生化细胞系。在另外的实施例中,细胞系已经被修饰以表达CAR或经工程化的TCR。在某些实施例中,淋巴细胞群体是NK细胞系(例如,NK-92或经修饰的变体)。在某些实施例中,淋巴细胞群体源自受试者或患有某种疾病或具有人口概况的受试者。此类疾病包含如本文所描述的癌症等癌症或感染性疾病。
本文所公开的筛选方法需要在淋巴细胞群体中表达带条形码的基因的集合。用于将核酸导入到细胞中的方法包含病毒介导的和非病毒介导的。在某些,所述方法利用带条形码的ORF文库,所述文库使用合适的逆转录病毒或慢病毒载体递送至细胞群体(参见,例如Sack等人《细胞》2018年4月5日;173(2):499-514.e2以及Yang等人《自然方法》2011年6月26日;8(8):659-61,所述文献通过引入并入本文)。在某些实施例中,淋巴细胞群体的至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%用递送要筛选的基因的载体转导。虽然更高的转导效率是有利的,具体地当分析更小或更稀少的淋巴细胞群体时,但在某些实施例中,所述方法包含进一步富集表达要筛选的基因的细胞的细胞群体的一个或多个选择步骤。例如,药物抗性基因(例如,嘌呤霉素抗性基因)可以包含在基因递送载体中,以促进经转导的细胞的选择。在某些实施例中,基因编码构建体包含有助于使用流式细胞术进一步分离或富集经转导的细胞的选择基因(例如,荧光蛋白,GFP)。
在某些实施例中,所述方法包含递送与启动子和/或其它调节元件可操作地连接的带条形码的基因。启动子的选择可以取决于如靶细胞类型(即,淋巴细胞群体)、期望的基因表达水平和/或表达持续时间等因素。本文提供了合适的引物。在某些实施例中,启动子的选择确定所述方法的效率或有效性,并赋予了令人惊讶的优势。在某些实施例中,启动子是延伸因子-1α短(EFS)启动子。在某些实施例中,启动子是延伸因子-1α短(EFS)启动子。在某些实施例中,启动子是巨细胞病毒(CMV)启动子。在某些实施例中,当CMV启动子提供的表达水平比EFS启动子提供的表达水平高时是优选的。在某些实施例中,启动子是磷酸甘油酸激酶-1(PGK)启动子。在又另外的实施例中,启动子是诱导型启动子。
在某些实施例中,所提供的方法需要在刺激淋巴细胞群体之后评估一种或多种效应子功能,其中效应子功能的变化指示由于筛选中包含的外源性基因的表达而改变的应答。如本文所使用的术语“刺激”是指由淋巴细胞的刺激分子与其同源配体结合而诱导的初级应答,由此甚至介导信号转导。在某些实施例中,所述方法包含通过TCR/CD3复合物诱导信号转导的刺激。刺激可以介导某些分子表达的改变,如TGF-β的下调和/或细胞骨架结构的重组等。
术语“刺激分子”是指由免疫细胞,例如T细胞、NK细胞或B细胞表达的分子,所述分子提供细胞质信号传导序列,所述细胞质信号传导序列以刺激性方式调节免疫细胞对免疫细胞信号传导通路的至少一些方面的激活。一方面,信号是由例如TCR/CD3复合物与加载有肽的MHC分子的结合或多克隆交联引发的主要信号,并导致应答,包含但不限于增殖、激活、分化和对凋亡的抗性。
所公开的方法可以适用于根据各种方式刺激细胞,包含使用多克隆和非特异性刺激。在某些实施例中,使用结合的或可溶的抗体刺激细胞,所述抗体对淋巴细胞表面上的表位具有特异性。在某些实施例中,抗体与细胞的表面上的抗原受体结合并交联。在某些实施例中,淋巴细胞以抗原特异性方式被刺激。在某些实施例中,所述方法包括用抗体、细胞因子、抗原、超抗原、抗原呈递细胞、癌细胞和癌细胞系中的一者或多者培养淋巴细胞中的一者或多者刺激淋巴细胞群体。在某些实施例中,淋巴细胞群体包含通过与抗CD3和抗CD28抗体温育而被激活的T细胞。淋巴细胞也可以与促进激活、增殖、分化、凋亡和/或存活的细胞因子一起培养。
术语“抗原呈递细胞”是指免疫系统细胞,如辅助细胞(例如,B细胞、树突细胞等),其表面上展示与主要组织相容性复合物(MHC)复合的外源抗原。T细胞可以使用其T细胞受体(TCR)识别这些复合物。APC处理抗原并将其呈递到T细胞。在某些实施例中,抗原呈递细胞在表达CAR或经工程化的TCR的淋巴细胞中诱导应答。在某些实施例中,抗原呈递细胞是癌细胞系。
在某些实施例中,淋巴细胞的刺激鉴定了由于外源性基因的表达而具有改变的应答的细胞。改变的应答包含但不限于增殖、存活、凋亡、表型变化(例如,表面标志物、大小)、细胞因子或趋化因子的产生和/或分泌以及细胞毒性潜力的程度的变化。在某些实施例中,通过在刺激之前用染料(例如,CFSE或CellTrace)标记细胞来确定淋巴细胞的增殖。在某些实施例中,确定包含CD69、CD25、OX40L(CD154)、ICAM-1、CD70、CD74、CD54、MHC-II、CD137、CD44、CD62L、CCR7、CD107a、PD1、TIM3、LAG3、CD80、CD86、TIGIT、VISTA、B7-H3、BTLA和SIGLEC15中的一者或多者的淋巴细胞上的标志物的表达,以鉴定和/或分离经刺激的细胞。在某些实施例中,确定包含IL-2、IL-12、IL-23、IFNγ、TNFα、GM-CSF、IL7、IL15、IL12、IL18、IL21、IL23、LTA、IL4、IL5、IL6、IL10、IL13、TGFβ、IL17、LTA、LIGHT、CCL3、CCL4、CCL5、MCP-3、CXCL9、MIP1α、IL8、PDGF-AA、IP10、IL22、IL3、MCP-1、IL9、MDC、sCD40L和M-CSF中的一者或多者的细胞因子或趋化因子的产生和/或分泌,以鉴定和/或分离经刺激的细胞。在某些实施例中,通过流式细胞术确定标志物、细胞因子和/或趋化因子的表达,以促进基于包含相对表达水平的表达的细胞分选。在某些实施例中,淋巴细胞表达指示细胞毒性潜力的蛋白质。在某些实施例中,确定穿孔素和/或颗粒酶的表达。
在分离经刺激的淋巴细胞之后,通过基因和/或条形码序列的PCR扩增来确定经表达的基因的鉴定。在某些实施例中,对从淋巴细胞获得的基因组DNA(gDNA)进行PCR。在某些实施例中,进行逆转录步骤以从细胞转录组和/或从外源性基因和条形码mRNA转录物产生cDNA。然后对扩增的DNA产物进行测序,以鉴定在分离的淋巴细胞中表达的外源性基因和/或定量分离的淋巴细胞群体中的外源性基因的相对表达。在某些实施例中,所公开的筛选方法包含分离的淋巴细胞的RNA和/或DNA测序,使用的技术包含但不限于全转录组分析、全基因组分析、基因组的整个或靶向区的带条形码的测序和其组合。在某些实施例中,RNA和/或DNA测序与蛋白质组分析组合进行。在某些实施例中,所述方法包含使用例如流式细胞术检测细胞表面或细胞内蛋白质。在某些实施例中,所述方法包括使用本领域中描述的方法检测或鉴定带条形码的基因,并对另外的分子模态进行分析,包含例如单细胞测序分析(例如,10X Genomics Multiome平台)、单细胞RNA测序(scRNA-seq)(参见例如,Haque等人用于生物医学研究和临床应用的单细胞RNA测序实用指南(A practical guide to single-cell RNA-sequencing for biomedical research and clinical applications),《基因组医学(Genome Medicine)》,9,文章编号:75(2017);Hwang等人单细胞RNA测序技术和生物信息学管道(Single-cell RNA sequencing technologies and bioinformaticspipelines.)《实验与分子医学》2018年8月7日;50(8):96)、细胞哈希(参见例如Stoeckius等人使用带条形码的抗体的细胞哈希实现了单细胞基因组学的多重和双重态检测(CellHashing with barcoded antibodies enables multiplexing and doublet detectionfor single cell genomics.)《基因组生物学(Genome Biol.)》2018;19:224)、Perturb-Seq.(参见例如Dixit等人Perturb-seq:用可扩展的单细胞RNA图谱剖析汇集的遗传筛选的分子回路(Perturb-seq:Dissecting molecular circuits with scalable single cellRNA profding of pooled genetic screens.)《细胞》2016年12月15日;167(7):1853-1866.e17)、CROP-seq(参见例如Datlinger等人用单细胞转录组读数进行汇集的CRISPR筛选(Pooled CRISPR screening with single-cell transcriptome readout)《自然方法》2017年3月;14(3):297-301)、CRISP-seq(参见例如Jaitin等人通过将CRISPR汇集的筛选与单细胞连接来剖析免疫回路(Dissecting Immune Circuits by Linking CRISPR-PooledScreens with Single-Cell)《RNA-Seq细胞(RNA-Seq Cell.)》2016年12月15日;167(7):1883-1896.e15)、扩展的CRISPR兼容CITE-seq(ECCITE-seq)(参见例如Mimitou等人单细胞中蛋白质、转录组、克隆型和CRISPR扰动的多重检测(Multiplexed detection ofproteins,transcriptomes,clonotypes and CRISPR perturbations in single cells.)《自然方法》2019年5月;16(5):409-41)以及转录组和表位-seq的细胞索引(CITE-seq)(参见例如,Stoeckius等人单细胞中表位和转录组的同时测量(Simultaneous epitope andtranscriptome measurement in single cells.)《自然方法》2017年9月;14(9):865-868)。
OverCITE-seq
为了获取对单独的基因的作用机制的更全面了解,并提供其诱导的表型变化的多维描述,本文描述了具有直接ORF捕获的单细胞测序策略。该方面的实施例的概述在图18A中提供。如本文所述,术语“开放阅读框mRNA”或ORF mRNA不仅是指所关注基因的编码序列,在一些实施例中,还包含下游序列,所述下游序列可以包含条形码和/或选择标志物,例如嘌呤霉素。被称为OverCITE-seq(过表达兼容CITE-seq)的这种方法建立在先前开发的用于定量表面抗原和CRISPR扰动的方法的基础上,并允许对具有不同ORF的T细胞池进行高通量单细胞分析。简而言之,在模板切换期间,来自慢病毒整合的ORF的mRNA通常通过与ORF下游转录物的恒定序列结合的引物特异性逆转录,并与细胞转录组一起被带条形码的。然后将所得cDNA池分开以分别构建基因表达和ORF表达文库。
因此,另一方面,提供了一种分析所关注ORF的过表达对单个细胞的效应的方法。所述方法包含将包括编码所述所关注ORF的核酸的表达盒引入到所述细胞中并过表达所述细胞中的所述ORF。ORF的过表达可以通过使用如CMV、EF-1a、CAG、PKG等强启动子来实现。此类启动子是本领域已知的。
将源自单个细胞的第一组核酸与具有共同条形码序列的寡核苷酸一起提供到离散分区中,其中所述寡核苷酸与珠粒连接。条形码序列提供了独特的标识符,使得在对那些核酸进行表征时,其可以被认为是源自同一细胞。也就是说,寡核苷酸被分区,使得在给定分区中的寡核苷酸之间,其中含有的核酸条形码序列是相同的,但是在不同分区之间,寡核苷酸具有不同的条形码序列。核酸条形码序列可以在寡核苷酸序列内包含6至约20个或更多个核苷酸。在一些情况下,条形码序列的长度可以是6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可以是至少6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可以是至多6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更短。
所述第一组核酸包括内源性转录组mRNA和ORF mRNA。在一些实施例中,核酸从离散分区中的单个细胞释放。在一些实施例中,核酸包括核糖核酸(RNA),例如信使RNA(mRNA)。如本文所使用的,在一些实施例中,分区是指容器或器皿(例如孔、微孔、管、纳米阵列基底中的通口,例如BioTrove纳米阵列或其它容器)。然而,在一些实施例中,隔室或分区包括在流体流中可流动的分区。这些分区可以包括例如具有围绕内部流体中心或核心的外部屏障的微胶囊或微囊泡,或者其可以是能够在其基质中夹带和/或保留材料的多孔基质。然而,在一些实施例中,这些分区包括非水连续相,例如油相中的水性流体液滴。参见例如US2015/0376609A1,所述文献通过引用整体并入本文。在一些实施例中,细胞可以与裂解试剂一起被分区,以便在分区内释放细胞的内容物。在此类情况下,裂解剂可以与细胞悬浮液同时接触,或者在将细胞引入到分区连接/液滴产生区中之前立即接触。除了与上文所描述的细胞共同分离的裂解剂之外,其它试剂也可以与细胞共同分离,包含例如DNA酶和RNA酶灭活剂或抑制剂,如蛋白酶K、螯合剂、如EDTA和其它用于去除或以其它方式减少负面活性或不同细胞裂解物组分对核酸后续处理的影响的试剂。
另外的试剂也可以与细胞共同分离,如用于片段化细胞的DNA的内切酶、DNA聚合酶和用于扩增细胞的核酸片段并将条形码寡核苷酸与扩增片段连接的dNTP。其它试剂还可以包含逆转录酶,包含具有末端转移酶活性的酶、引物和寡核苷酸,以及可以用于模板切换的切换寡核苷酸(在本文中也被称为“切换寡核苷酸”)。在一些情况下,模板切换可以用于增加cDNA的长度。在模板切换的一个实例中,可以从模板例如细胞mRNA的逆转录产生cDNA,其中具有末端转移酶活性的逆转录酶可以将另外的核苷酸,例如,polyC添加到未由模板编码的cDNA中,如在cDNA的末端处。切换寡核苷酸可以包含与另外的核苷酸互补的序列,例如polyG。cDNA上的另外的核苷酸(例如,polyC)可以与和切换寡核苷酸上的另外的核苷酸(例如,polyG)互补的序列杂交,由此切换寡核苷酸可以被逆转录酶用作模板以进一步延伸cDNA。切换寡核苷酸可以包括脱氧核糖核酸、核糖核酸、包含锁定核酸(LNA)的经修饰的核酸或任何组合。此类试剂是本领域已知的。参见例如《Chromium Next GEM单细胞5'试剂盒v2用户指南(Chromium Next GEM Single Cell 5'Reagent Kits v2 User Guide)》(可从assets.ctfassets.net/an68im79xiti/1Ap6qQysq80oQAGacem7RD/6f895796e18c38al4ef1e8b8ff79a82c/CG000331_ChromiumNextGEMSing1eCell5-v2_RevB.pdf获得),所述文献通过引用以其整体并入本文。
所述方法进一步包含进行RT-PCR以产生源自所述第一组核酸的第二组核酸,所述第一组核酸包括内源性转录组cDNA和ORF cDNA,其中所述分区内的所述第二组核酸具有与其连接的包括所述共同核酸条形码序列的寡核苷酸。RT-PCR试剂包含与所述ORF mRNA上的序列特异性粘接的寡核苷酸引物,所述序列不是poly A序列。在一些实施例中,与所述ORFmRNA上的序列特异性粘接的寡核苷酸引物与和文库的序列共有的转录物的一部分上的mRNA,例如,抗性标志物的编码序列,例如嘌呤霉素粘接。这允许使用一组通用试剂从ORF文库中扩增许多ORF序列。在一些实施例中,产生一个或多个第二核酸序列包含在产生所述一个或多个第二核酸序列的条件下对核酸进行逆转录。在一些实施例中,逆转录在离散分区中发生。在一些实施例中,寡核苷酸在离散分区中提供并且包含poly-T序列。在一些实施例中,逆转录包括将poly-T序列与核酸中的每种核酸的至少一部分杂交,并以模板指导的方式延伸poly-T序列。在一些实施例中,寡核苷酸包含有助于poly-T序列的杂交的锚定序列。在一些实施例中,寡核苷酸包含可以是例如随机六聚体的随机引发序列。在一些实施例中,逆转录包括将随机引发序列与核酸中的每种核酸的至少一部分杂交,并以模板指导的方式延伸随机引发序列。
所述方法包含使用PCR试剂扩增所述第二组核酸以产生第三组核酸,所述PCR试剂包括与所述ORF cDNA上的序列特异性粘接的第二引物,所述序列不是poly A序列。
在某些实施例中,所述方法包含获得所述第三组核酸的一部分,并使用第二组PCR试剂扩增所述ORF cDNA,以产生第四组核酸,所述第二组PCR试剂包括第三引物,所述第三引物与所述ORF cDNA上的序列特异性粘接,所述序列不是poly A序列。
在某些实施例中,所述方法包含使用第三组PCR试剂扩增所述第四组核酸中的所述ORF cDNA,以产生第五组核酸,所述第三组PCR试剂包括第四引物,所述第四引物与所述ORF cDNA上的序列特异性粘接,所述序列不是poly A序列。
然后将第三组并且任选地第五组核酸片段化,将适配子与片段的两个末端连接,并使用本领域已知的标准技术进行下一代测序(NGS)。参见例如,Kanzi等人,家族基因遗传的下一代测序和生物信息学分析(Next Generation Sequencing and BioinformaticsAnalysis of Family Genetic Inheritance),《遗传学前沿(Front.Genet.)》,2020年10月23日|https://doi.org/10.3389/fgene.2020.544162,所述文献通过引用并入本文。还参见US 2018-0251825A1和US2015-0376609,所有所述文献都通过引用并入本文中。
在某些实施例中,所述方法包括使用本领域中描述的方法检测或鉴定带条形码的序列,并对另外的分子模态进行分析,包含例如单细胞测序分析(例如,10X GenomicsMultiome平台)、单细胞RNA测序(scRNA-seq)(参见例如,Haque等人用于生物医学研究和临床应用的单细胞RNA测序实用指南,《基因组医学》,9,文章编号:75(2017);Hwang等人单细胞RNA测序技术和生物信息学管道.《实验与分子医学》2018年8月7日;50(8):96)、细胞哈希(参见例如Stoeckius等人使用带条形码的抗体的细胞哈希实现了单细胞基因组学的多重和双重态检测《基因组生物学》2018;19:224)、Perturb-Seq.(参见例如Dixit等人Perturb-seq:用可扩展的单细胞RNA图谱剖析汇集的遗传筛选的分子回路.《细胞》2016年12月15日;167(7):1853-1866.e17)、CROP-seq(参见例如Datlinger等人用单细胞转录组读数进行汇集的CRISPR筛选《自然方法》2017年3月;14(3):297-301)、CRISP-seq(参见例如Jaitin等人通过将CRISPR汇集的筛选与单细胞连接来剖析免疫回路.《RNA-Seq细胞》2016年12月15日;167(7):1883-1896.e15)、扩展的CRISPR兼容CITE-seq(ECCITE-seq)(参见例如Mimitou等人单细胞中蛋白质、转录组、克隆型和CRISPR扰动的多重检测.《自然方法》2019年5月;16(5):409-41)以及转录组和表位-seq的细胞索引(CITE-seq)(参见例如,Stoeckius等人单细胞中表位和转录组的同时测量.《自然方法》2017年9月;14(9):865-868)。
关于本文所提供的本发明的描述,在另一个实施例中,预期本文所描述的组合物中的每种组合物在本发明的方法中是有用的。另外,还预期在另一个实施例中,本文所描述的可用于所述方法的组合物中的每种组合物本身也是本发明的实施例。
具体实施例
1.一种经修饰的淋巴细胞,其包括编码LTBR的外源性核酸。
2.根据实施例1所述的经修饰的淋巴细胞,其中所述编码LTBR的核酸编码细胞内结构域或其片段或变体。
3.根据实施例2所述的经修饰的淋巴细胞,其中LTBR细胞内结构域包括SEQ IDNO:2的氨基酸249至435或其片段、缺失或变体。
4.根据实施例2或3所述的经修饰的淋巴细胞,其中所述LTBR细胞内结构域在至少氨基酸393至435中具有缺失。
5.根据实施例1至4中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞包括表达盒,所述表达盒包括表达控制序列和所述编码LTBR的核酸。
6.根据实施例1至5中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞进一步包括编码嵌合抗原受体(CAR)的核酸。
7.根据实施例5所述的经修饰的淋巴细胞,其中所述表达盒进一步包括编码CAR的核酸。
8.根据实施例1或5所述的经修饰的淋巴细胞,其中所述淋巴细胞进一步包括编码T细胞受体(TCR)的核酸。
9.根据实施例8所述的经修饰的淋巴细胞,其中所述表达盒进一步包括所述编码所述TCR的核酸。
10.根据实施例1至9中任一项所述的经修饰的淋巴细胞,其中所述表达控制序列包括EF-1α、EFS或CMV启动子。
11.根据实施例1所述的经修饰的淋巴细胞,其中所述编码LTBR的外源性核酸是mRNA。
12.根据实施例1至11中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞是T细胞。
13.根据实施例1至12中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞是αβT或γδT细胞,任选地是Vγ9Vδ2T细胞。
14.根据实施例1至12中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞是NK细胞。
15.根据实施例1至12中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞是NKT细胞。
16.根据实施例6、7、10或12至15中任一项所述的经修饰的淋巴细胞,其中所述CAR是阿基仑赛布瑞基奥仑赛(TecartusTM)、艾基维仑赛(AbecmaTM)、利基迈仑赛替沙仑赛/>或在图19中发现的那些中的一者。
17.一种疫苗组合物,其包括编码LTBR的核酸和编码病毒蛋白的核酸。
18.根据实施例17所述的疫苗组合物,其中所述编码LTBR的核酸编码LTBR细胞内结构域或其片段或变体。
19.根据实施例18所述的经修饰的淋巴细胞,其中LTBR细胞内结构域包括SEQ IDNO:2的氨基酸249至435或其片段、缺失或变体。
20.根据任何实施例18或19所述的经修饰的淋巴细胞,其中所述LTBR细胞内结构域在至少氨基酸393至435中具有缺失。
21.根据实施例17至20中任一项所述的疫苗组合物,其中所述病毒蛋白是糖蛋白。
22.根据实施例21所述的疫苗组合物,其中所述糖蛋白是病毒刺突蛋白。
23.根据实施例22所述的疫苗组合物,其中所述病毒刺突蛋白是冠状病毒刺突蛋白。
24.根据实施例17至23中任一项所述的疫苗组合物,其中所述编码LTBR的核酸是mRNA,或者所述编码所述病毒刺突蛋白的核酸是mRNA,或者两者都是。
25.一种表达盒,其包括编码嵌合抗原受体(CAR)的核苷酸序列和编码LTBR的核酸。
26.一种表达盒,其包括编码T细胞受体的核酸和编码LTBR的核酸。
27.一种表达盒,其包括编码病毒蛋白的核酸和编码LTBR的核酸。
28.根据实施例25至27中任一项所述的表达盒,其中所述编码LTBR的核酸编码LTBR细胞内结构域或其片段或变体。
29.根据实施例28所述的表达盒,其中LTBR细胞内结构域包括SEQ ID NO:2的氨基酸249至435或其片段、缺失或变体。
30.根据实施例28或29所述的表达盒,其中所述LTBR细胞内结构域在至少氨基酸393至435中具有缺失。
31.一种组合物,其包括经修饰的淋巴细胞,所述经修饰的淋巴细胞包括根据实施例25至30中任一项所述的表达盒。
32.一种产生经修饰的淋巴细胞的方法,所述方法包括将编码LTBR的外源性核酸引入到所述细胞中。
33.根据实施例32所述的方法,其中所述编码LTBR的核酸编码LTBR细胞内结构域或其片段或变体。
34.根据实施例32或33所述的方法,其中LTBR细胞内结构域包括SEQ ID NO:2的氨基酸249至435或其片段、缺失或变体。
35.根据实施例32至34中任一项所述的方法,其中所述LTBR细胞内结构域在至少氨基酸393至435中具有缺失。
36.根据实施例32至35中任一项所述的方法,其中所述淋巴细胞包括表达盒,所述表达盒包括表达控制序列和所述编码LTBR的核酸。
37.根据实施例32至36中任一项所述的方法,其中所述淋巴细胞进一步包括编码嵌合抗原受体(CAR)的核酸。
38.根据实施例37所述的方法,其中所述表达盒进一步包括所述编码所述CAR的核酸。
39.根据实施例32至36中任一项所述的方法,其中所述淋巴细胞进一步包括编码经工程化的T细胞受体(TCR)的核酸。
40.根据实施例39所述的方法,其中所述表达盒进一步包括所述编码所述TCR的核酸。
41.根据实施例36至40中任一项所述的方法,其中所述表达控制序列包括EF-1α(全长或缩短的)或CMV启动子。
42.根据实施例32至42中任一项所述的方法,其中所述编码LTBR的外源性核酸是mRNA。
43.根据实施例32至42中任一项所述的方法,其中所述淋巴细胞是T细胞,任选地是CD4+ T细胞、CD8+ T细胞或Treg细胞。
44.根据实施例32至43中任一项所述的方法,其中所述淋巴细胞是αβT细胞。
45.根据实施例32至43中任一项所述的方法,其中所述淋巴细胞是γδT细胞,任选地是Vγ9Vδ2T细胞。
46.根据实施例32至42中任一项所述的方法,其中所述淋巴细胞是NK细胞。
47.根据实施例32至42中任一项所述的方法,其中所述淋巴细胞是NK T细胞。
48.根据实施例37、38或41至47中任一项所述的方法,其中所述CAR是阿基仑赛布瑞基奥仑赛(TecartusTM)、艾基维仑赛(AbecmaTM)、利基迈仑赛替沙仑赛/>嵌合自身抗体受体或在图19中发现的那些中的一者。
49.根据实施例32至48中任一项所述的方法,其中所述淋巴细胞用编码LTBR的mRNA进行核转染。
50.一种治疗有需要的受试者的癌症的方法,所述方法包括向所述受试者施用根据实施例1至16中任一项所述的经修饰的淋巴细胞、根据实施例25至30中任一项所述的表达盒或根据实施例31所述的组合物。
51.根据实施例50所述的方法,其中所述受试者患有淋巴瘤。
52.根据实施例50所述的方法,其中所述受试者患有实体瘤。
53.根据实施例50所述的方法,其中所述受试者患有白血病。
54.根据实施例50所述的方法,其中所述受试者患有多发性骨髓瘤。
55.根据实施例50所述的方法,其中所述受试者患有病毒驱动的癌症。
56.根据实施例55所述的方法,其中所述受试者患有HPV。
57.根据实施例50所述的方法,其中所述受试者患有癌症,所述癌症是伯基特氏淋巴瘤、肝癌、卡波西肉瘤、宫颈癌、头癌、颈癌、肛门癌、口腔癌、胰腺癌、卵巢癌、黑色素瘤、咽癌、阴茎癌、成人T细胞淋巴瘤或梅克尔细胞癌。
58.一种治疗有需要的受试者的病毒性疾病的方法,所述方法包括向所述受试者施用根据实施例1至16中任一项所述的组合物。
59.根据实施例58所述的方法,其中所述疾病是HIV或HPV。
60.一种治疗有需要的受试者的自身免疫性病症的方法,所述方法包括向所述受试者施用根据实施例1至16中任一项所述的经修饰的淋巴细胞、根据实施例25至30中任一项所述的表达盒或根据实施例31所述的组合物。
61.一种增加增殖或包含细胞因子产生和/或分泌的T细胞效应子功能的方法,所述方法包括将根据实施例25至30中任一项所述的表达盒引入到T细胞中。
62.根据实施例61所述的方法,其中所述T细胞是在处理所述T细胞以过表达LTBR之前从人获得的,并且将经处理的T细胞重新引入到人体内。
63.一种增加对疫苗组合物的应答的方法,所述方法包括向受试者共施用包括编码LTBR的核酸的疫苗。
64.根据实施例63所述的方法,其中所述编码LTBR的核酸编码LTBR细胞内结构域或其片段或变体。
65.根据实施例64所述的方法,其中LTBR细胞内结构域包括SEQ ID NO:2的氨基酸249至435或其片段、缺失或变体。
66.根据任何实施例64或65所述的方法,其中所述LTBR细胞内结构域在至少氨基酸393至435中具有缺失。
67.根据实施例63至66中任一项所述的方法,其中LTBR的表达是瞬时的。
68.一种经修饰的淋巴细胞,其包括编码表1的基因的外源性核酸。
69.根据实施例68所述的经修饰的淋巴细胞,其中所述淋巴细胞包括表达盒,所述表达盒包括表达控制序列和编码表1的所述基因的核酸。
70.根据实施例68或69所述的经修饰的淋巴细胞,其中所述淋巴细胞进一步包括编码嵌合抗原受体(CAR)的核酸。
71.根据实施例70所述的经修饰的淋巴细胞,其中所述表达盒进一步包括所述编码所述CAR的核酸。
72.根据实施例68或69所述的经修饰的淋巴细胞,其中所述淋巴细胞进一步包括编码T细胞受体(TCR)的核酸。
73.根据实施例72所述的经修饰的淋巴细胞,其中所述表达盒进一步包括所述编码所述TCR的核酸。
74.根据实施例68至73中任一项所述的经修饰的淋巴细胞,其中所述表达控制序列包括EF-1α、EFS或CMV启动子。
75.根据实施例68所述的经修饰的淋巴细胞,其中所述编码表1的所述基因的外源性核酸是mRNA。
76.根据实施例68至75中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞是T细胞。
77.根据实施例68至75中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞是αβT细胞。
78.根据实施例68至75中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞是γδT细胞,任选地是Vγ9Vδ2T细胞。
79.根据实施例68至75中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞是NK细胞。
80.根据实施例68至75中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞是NK T细胞。
81.根据实施例70、71或74至80中任一项所述的经修饰的淋巴细胞,其中所述CAR是阿基仑赛布瑞基奥仑赛(TecartusTM)、艾基维仑赛(AbecmaTM)、利基迈仑赛替沙仑赛/>或在图19中发现的那些中的一者。
82.一种疫苗组合物,其包括编码表1的基因的核酸和编码病毒蛋白的核酸。
83.根据实施例82所述的疫苗组合物,其中所述病毒蛋白是糖蛋白。
84.根据实施例83所述的疫苗组合物,其中所述糖蛋白是病毒刺突蛋白。
85.根据实施例84所述的疫苗组合物,其中所述病毒刺突蛋白是冠状病毒刺突蛋白。
86.根据实施例82至85中任一项所述的疫苗组合物,其中所述编码表1的所述基因的核酸是mRNA,或者所述编码所述病毒刺突蛋白的核酸是mRNA,或者两者都是。
87.一种表达盒,其包括编码嵌合抗原受体的核苷酸序列和编码表1的基因的核酸。
88.一种表达盒,其包括编码T细胞受体的核酸和编码表1的基因的核酸。
89.一种表达盒,其包括编码病毒蛋白的核酸和编码表1的基因的核酸。
90.一种组合物,其包括经修饰的淋巴细胞,所述经修饰的淋巴细胞包括根据实施例87至89中任一项所述的表达盒。
91.一种产生经修饰的淋巴细胞的方法,所述方法包括将编码表1的基因的外源性核酸引入到所述淋巴细胞中。
92.根据实施例91所述的方法,其中所述淋巴细胞包括表达盒,所述表达盒包括表达控制序列和编码表1的所述基因的核酸。
93.根据实施例91或92所述的方法,其中所述淋巴细胞进一步包括编码嵌合抗原受体(CAR)的核酸。
94.根据实施例93所述的方法,其中所述表达盒进一步包括所述编码所述CAR的核酸。
95.根据实施例91或92所述的方法,其中所述淋巴细胞进一步包括编码经工程化的T细胞受体(TCR)的核酸。
96.根据实施例95所述的方法,其中所述表达盒进一步包括所述编码所述TCR的核酸。
97.根据实施例91至97中任一项所述的方法,其中所述表达控制序列包括EF-1α(全长或缩短的)或CMV启动子。
98.根据实施例91中任一项所述的方法,其中所述编码表1的所述基因的外源性核酸是mRNA。
99.根据实施例91至98中任一项所述的方法,其中所述淋巴细胞是T细胞,任选地是CD4+ T细胞、CD8+ T细胞或Treg细胞。
100.根据实施例91至99中任一项所述的方法,其中所述淋巴细胞是αβT细胞。
101.根据实施例91至98中任一项所述的方法,其中所述淋巴细胞是γδT细胞。
102.根据实施例91至98中任一项所述的方法,其中所述淋巴细胞是NK细胞。
103.根据实施例91至98中任一项所述的方法,其中所述淋巴细胞是NK T细胞。
104.根据实施例93、94或97至103中任一项所述的方法,其中所述CAR是阿基仑赛布瑞基奥仑赛(TecartusTM)、艾基维仑赛(AbecmaTM)、利基迈仑赛替沙仑赛/>或在图19中发现的那些中的一者。
105.根据实施例91至104中任一项所述的方法,其中所述淋巴细胞用编码表1的所述基因的mRNA进行核转染。
106.一种治疗有需要的受试者的癌症的方法,所述方法包括向所述受试者施用68至81、根据实施例87至89中任一项所述的表达盒或根据实施例90所述的组合物。
107.根据实施例106所述的方法,其中所述受试者患有淋巴瘤。
108.根据实施例106所述的方法,其中所述受试者患有实体瘤。
109.根据实施例106所述的方法,其中所述受试者患有白血病。
110.根据实施例106所述的方法,其中所述受试者患有多发性骨髓瘤。
111.根据实施例106所述的方法,其中所述受试者患有病毒驱动的癌症。
112.根据实施例111所述的方法,其中所述受试者患有HPV。
113.根据实施例106所述的方法,其中所述受试者患有癌症,所述癌症是伯基特氏淋巴瘤、肝癌、卡波西肉瘤、宫颈癌、头癌、颈癌、肛门癌、口腔癌、咽癌、阴茎癌、成人T细胞淋巴瘤或梅克尔细胞癌。
114.一种治疗有需要的受试者的疾病的方法,所述方法包括向所述受试者施用根据实施例82至86中任一项所述的组合物。
115.根据实施例114所述的方法,其中所述疾病是HIV。
116.根据实施例114所述的方法,其中所述疾病是HPV。
117.根据实施例114所述的方法,其中所述疾病是自身免疫性病症。
118.一种增加增殖或包含细胞因子产生和/或分泌的T细胞效应子功能的方法,所述方法包括将根据实施例87至89中任一项所述的组合物引入到T细胞中。
119.根据实施例118所述的方法,其中所述T细胞是在处理所述T细胞以过表达表1的基因之前从人获得的,并且将经处理的T细胞重新引入到所述人体内。
120.一种增加对疫苗组合物的应答的方法,所述方法包括与疫苗共施用编码表1的基因的核酸。
121.根据实施例118至120中任一项所述的方法,其中表1的所述基因的表达是瞬时的。
122.根据实施例68至121中任一项所述的经修饰的淋巴细胞、组合物、表达盒或方法,其中表1的所述基因是LTBR、ADA、IFNL2、IL12B CALML3 MRPL51、DBI GPN3、ITM2A、AHNAK、BATF、GPD1、ATF6B、AHCY、DUPD1或AKR1C4。
123.一种鉴定基因的方法,所述基因当在经修饰的淋巴细胞中外源性地表达时改变所述经修饰的淋巴细胞的治疗功能,所述方法包括:
(a)获得淋巴细胞群体;
(b)用多个病毒载体转导所述淋巴细胞群体,每个病毒载体编码能够与一个或多个条形码连接的基因;
(c)刺激经转导的淋巴细胞以诱导激活、增殖和/或效应子功能;
(d)从(c)的所述淋巴细胞群体中分离经转导的淋巴细胞;以及
(e)检测经分离的淋巴细胞中的所述基因和/或连接的条形码的存在;
其中检测到的基因可有效改变表达所述基因的经修饰的淋巴细胞的所述治疗功能。
124.根据实施例123所述的方法,其中所述基因是开放阅读框(ORF)或编码非编码RNA的核苷酸序列,任选地是微小RNA(miRNA)或长非编码RNA(lncRNA,长ncRNA)。
125.根据实施例123或124所述的方法,其中所述淋巴细胞群体包括已富集T细胞、B细胞、NK T细胞、NK细胞或其亚群体中的一种或多种的细胞群体,任选地其中所述细胞是人。
126.根据实施例125所述的方法,其中所述淋巴细胞群体富集CD4+ T细胞、CD8+ T细胞、αβT细胞和γδT细胞中的一者或多者。
127.根据实施例123至126中任一项所述的方法,其中所述淋巴细胞群体包括CART细胞。
128.根据实施例123至126中任一项所述的方法,其中所述淋巴细胞群体包括淋巴细胞,所述淋巴细胞包括在其表面上表达的经工程化的TCR。
129.根据实施例123至128中任一项所述的方法,其中所述淋巴细胞群体包括细胞系。
130.根据实施例123至129中任一项所述的方法,其中所述多个病毒载体包括开放阅读框(ORF)的文库。
131.根据实施例123至130中任一项所述的方法,其中所述病毒载体包括逆转录病毒载体或慢病毒载体。
132.根据实施例123至131中任一项所述的方法,其中(b)包括转导所述淋巴细胞群体的至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%。
133.根据实施例123至132中任一项所述的方法,其中所述病毒载体包括表达盒,所述表达盒具有延伸因子-1α短(EFS)启动子、巨细胞病毒(CMV)启动子或磷酸甘油酸激酶-1(PGK)启动子。
134.根据实施例123至133中任一项所述的方法,其中所述病毒载体包括编码选择基因或标志物的核苷酸序列。
135.根据实施例123至134中任一项所述的方法,其中所述经修饰的淋巴细胞是γδT细胞或αβT细胞。
136.根据实施例123至134中任一项所述的方法,其中所述经修饰的淋巴细胞是表达Vγ9-或Vγ9Vδ2TCR的T细胞。
137.根据实施例123至136中任一项所述的方法,其中所述经修饰的淋巴细胞是CAR T细胞。
138.根据实施例123至136中任一项所述的方法,其中所述经修饰的淋巴细胞已基于内源性抗原受体,任选地TCR的表达而被选择。
139.根据实施例123至138中任一项所述的方法,其中刺激所述经转导的淋巴细胞包括用抗体、细胞因子、抗原、超抗原、抗原呈递细胞、癌细胞和癌细胞系中的一者或多者培养所述淋巴细胞。
140.根据实施例123至138中任一项所述的方法,其中所述经转导的淋巴细胞的刺激包括TCR刺激,任选地包括CD3/CD28刺激。
141.根据实施例123至140中任一项所述的方法,其进一步包括:用细胞增殖染料标记所述经转导的淋巴细胞;以及分离后代细胞。
142.根据实施例123至141中任一项所述的方法,其中(d)包括鉴定表达一种或多种细胞表面标志物和/或一种或多种效应子功能和/或一种或多种分泌的细胞因子的细胞。
143.根据实施例142所述的方法,其中所述一种或多种细胞表面标志物包括CD69、CD25、OX40L(CD154)、ICAM-1、CD70、CD74、CD54、MHC-II、CD137、CD44、CD62L、CCR7、CD107a、PD1、TIM3、LAG3、CD80、CD86、TIGIT、VISTA、B7-H3、BTLA和SIGLEC15。
144.根据实施例123至143所述的方法,其中所述一种或多种效应子功能包括细胞因子或趋化因子产生和/或分泌,任选地其中所述细胞因子或趋化因子是IL-2、IL-12、IL-23、IFNγ、TNF、GM-CSF、IL7、IL15、IL12、IL18、IL21、IL23、LTA、IL4、IL5、IL6、IL10、IL13、TGFβ、IL17、LTA、LIGHT、CCL3、CCL4和CCL5中的一者或多者。
145.根据实施例123至144中任一项所述的方法,其中所述一种或多种效应子功能包括细胞毒性潜力,任选地其中细胞毒性潜力是通过穿孔素和/或颗粒酶的表达鉴定的。
146.根据实施例123至145中任一项所述的方法,其中(e)包括从所述经分离的淋巴细胞获得基因组DNA,并对所述基因和/或条形码序列进行PCR扩增。
147.根据实施例123至146中任一项所述的方法,其中(e)进一步包括单细胞转录组和/或蛋白质组分析。
148.根据实施例123至147中任一项所述的方法,其中(e)包括流式细胞术分析、细胞哈希、单细胞测序分析、单细胞RNA测序(scRNA-seq)、Perturb-seq、CROP-seq、CRISP-seq、ECCITE-seq或转录组和表位的细胞索引(CITE-seq)。
149.一种分析所关注ORF的过表达对单个细胞的效应的方法,所述方法包括:
(a)将包括编码所述所关注ORF的核酸的表达盒引入到所述细胞中并过表达所述ORF;
(b)将源自所述单个细胞的第一组核酸和具有第一条形码序列的第一寡核苷酸提供到离散分区中,其中所述寡核苷酸与珠粒连接,其中所述第一组核酸包括内源性转录组mRNA和ORF mRNA;
(c)进行RT-PCR以产生源自所述第一组核酸的第二组核酸,其中所述分区内的所述第二组核酸具有与其连接的包括第一核酸条形码序列的第一寡核苷酸,并且其中所述RT-PCR使用RT-PCR试剂进行,所述RT-PCR试剂包括与所述ORF mRNA上的序列特异性粘接的引物,所述序列不是poly A序列,并且其中所述第二组核酸包括内源性转录组cDNA和ORFcDNA;以及
(d)使用PCR试剂扩增所述第二组核酸以产生第三组核酸,所述PCR试剂包括与所述ORF cDNA上的序列特异性粘接的第二引物,所述序列不是poly A序列;以及
(e)检测所述条形码序列、所述转录组cDNA和/或所述ORF cDNA和/或对其进行测序。
150.根据实施例149所述的方法,其进一步包括(d')获得所述第三组核酸的一部分,并使用第二组PCR试剂扩增所述ORF cDNA,以产生第四组核酸,所述第二组PCR试剂包括第三引物,所述第三引物与所述ORF cDNA上的序列特异性粘接,所述序列不是poly A序列。
151.根据实施例150所述的方法,其进一步包括(d")使用第三组PCR试剂扩增所述第四组核酸中的所述ORF cDNA,以产生第五组核酸,所述第三组PCR试剂包括第四引物,所述第四引物与所述ORF cDNA上的序列特异性粘接,所述序列不是poly A序列。
152.根据实施例149至151中任一项所述的方法,其进一步包括使(a)的所述细胞与构建体接触,所述构建体包括与所述第一寡核苷酸连接的抗体或抗体片段。
153.根据实施例149至152中任一项所述的方法,其进一步包括单细胞转录组和/或蛋白质组分析。
154.根据实施例149至153中任一项所述的方法,其中(e)包括流式细胞术分析、细胞哈希、单细胞测序分析、单细胞RNA测序(scRNA-seq)、Perturb-seq、CROP-seq、CRISP-seq、ECCITE-seq或转录组和表位的细胞索引(CITE-seq)。
提供以下实例仅为了说明目的,并且本发明绝不应理解为限制于该实例,而是应理解为涵盖由于本文所提供的教导而变得明显的任何和所有变化。
实例
实例1:材料与方法
原代人T细胞的分离和培养
根据IRB豁免方案,由纽约血液中心收集并从纽约血液中心购买含有未经鉴定的健康供体的外周血的标准血沉棕黄层。所有供体提供了知情同意书。使用Lymphoprep(干细胞公司(Stemcell))梯度离心从血沉棕黄层中分离外周血单核细胞(PBMC)。对于大多数测定,CD8+和CD4+是从同一供体中依次分离的。首先,使用EasySep人CD8阳性选择试剂盒II(干细胞公司)通过磁性阳性选择分离CD8+ T细胞。然后,使用EasySep人CD4+ T细胞分离试剂盒(干细胞公司)通过阴性磁性选择从所得流过液中分离CD4+ T细胞。使用EasySep人γ/δT细胞分离试剂盒(干细胞公司)通过磁性阴性选择分离γδT细胞。在分离之后,立即将T细胞重悬于T细胞培养基中,所述培养基由补充有10ng ml-1重组人IL-2(干细胞公司)的Immunocult-XF T细胞扩增培养基(干细胞公司)组成。
用Immunocult人CD3/CD28 T细胞激活剂(干细胞公司)激活T细胞,使用25μl/106个细胞/ml。通常,T细胞在分离之后24小时用浓缩的慢病毒转导。对于一些实验,T细胞在分离之后24小时用体外转录的mRNA电穿孔或者在分离之后48小时用Cas9蛋白电穿孔。在分离之后72小时,用2μg ml-1嘌呤霉素选择慢病毒转导的T细胞。
每隔2-3天,分裂T细胞或更换培养基,以维持1×106-2×106个细胞/ml的细胞密度。在培养期间,将慢病毒转导的T细胞维持在含有2μg ml-1嘌呤霉素的培养基中。T细胞在分离之后14至21天之间用于表型或功能测定,或冷冻保存在Bambanker细胞冷冻培养基(Bulldog生物公司(Bulldog Bio))中。γδT细胞在功能测定之前根据制造商的建议使用抗Vγ9PE抗体(百进生物公司(Biolegend))和抗PE微珠(美天旎生物技术公司(MiltenyiBiotec))在存在蛋白激酶抑制剂达沙替尼(dasatinib)的情况下进一步纯化,以预防TCR交联导致的激活诱导的细胞死亡42。根据Perlmutter癌症中心机构审查委员会批准的方案,从Perlmutter癌症中心获得患有弥漫性大B细胞淋巴瘤的患者的PBMC(S14-02164)。
载体设计和分子克隆
使用Gibson组装(NEB)克隆所有使用的载体。对于图1A-图1B中所示的实验,使用了来自pHAGE质粒的慢病毒主链14。对于所有其它实验,使用来自lentiCRISPRv2(Addgene公司(Addgene)52961)的主链。对ORF进行PCR扩增,用于从用于筛选的基因组规模的文库中克隆。
在通过PCR添加Gibson突出端之后,将ORF和P2A-puro插入到XbaI-和EcoRI切割的lentiCRISPRv2中。使用PacI和NheI消化从lentiCRISPRv2中去除sgRNA盒。对于LTBR过表达和敲除实验,没有去除sgRNA盒。CAR被合成为gBlocks(IDT)。对于CAR-ORF克隆,首先将CAR-P2A-puro-T2A(部分)插入到XbaI-和EcoRI切割的lentiCRISPRv2中。对于后续ORF插入,用位于部分T2A和EcoRI内的HpaI切割质粒。将以下载体沉积到以下Addgene中:pOT_01(lenti-EFS-LTBR-2A-puro,Addgene公司181970)、pOT_02(lenti-EFS-tNGFR-2A-puro,Addgene公司181971)、pOT_03(lenti-EFS-FMC6.3-28z-2A-puro-2A-LTBR,Addgene公司181972)、pOT_04(lenti-EFS-FMC6.3-BBz-2A-puro-2A-LTBR,Addgene公司181973)、pOT_05(lenti-EFS-FMC6.3-28z-2A-puro-2A-tNGFR,Addgene公司181974)和pOT_06(lenti-EFS-FMC6.3-BBz-2A-puro-2A-tNGFR,Addgene公司181975)。
核酸酶和CRISPR向导RNA设计
所有sgRNA是使用指南网络工具设计的43。选择了靶向初始蛋白质编码外显子的指南(在指南中启用了靶向蛋白质家族结构域的偏好)以及最大限度地减少脱靶评分和最大限度地提高靶上评分。对于Cas9核酸酶核转染,使用纯化的sNLS-SpCas9-sNLS核酸酶(Aldevron公司(Aldevron))。
用于成对末端测序的ORF文库质粒的制备
使用Endura电感受态细胞(卢西根公司(Lucigen))重新扩增了先前描述的基因组规模的ORF文库14。通过成对末端测序来确认ORF和匹配条形码的同一性。简而言之,首先用I-SceI大核酸酶将质粒线性化,所述大核酸酶在条形码的下游切割。然后,使用TnY转座酶标记线性化的质粒44。然后,使用与由TnY引入的手柄结合的正向引物和与条形码下游的序列结合的反向引物,在PCR反应中扩增片段化的质粒。所有转座子和PCR引物寡核苷酸由IDT合成。在NextSeq 500上对所得扩增子进行测序。使用STAR v.2.7.3a将正向读数(含有ORF)映射至GRCh38.101 CDS转录组注释(映射质量≥10)45。使用成对末端读数,还捕获了恒定质粒序列下游的24个核苷酸条形码。将ORF-条形码组合制成表格,并通过排除任何可能由测序或PCR错误引起的虚假配对来进一步整理该表格。具体地,进行排列测试以鉴定随机机会预期的ORF-条形码组合的最大数量,之后仅保留计数超过该最大数量的ORF-条形码组合。从参考中排除了所有非编码元素,并且然后折叠莱文斯坦(Levenshtein)距离小于2的条形码。
细胞培养
HEK293FT细胞从赛默飞世尔科技公司(Thermo Fisher Scientific)获得并在补充有10%血清Plus-II(赛默飞世尔科技公司)的杜尔贝科改良伊格尔培养基(Dulbecco'smodified Eagle's medium,DMEM)中培养。Nalm6、Jurkat和BxPC3细胞从ATCC获得并在补充有10%血清Plus-II的RPMI-1640中培养。Capan-2细胞从ATCC获得并在补充有10%血清Plus-II的McCoy的培养基中培养。对于γδ共温育实验,将细胞系用50μM唑来膦酸(西格玛公司(Sigma))预处理24小时。使用MycoAlert PLUS(龙沙公司(Lonza))对细胞系进行支原体常规检测并且结果为阴性。在这项研究中没有鉴定细胞系。
慢病毒产生
通过使用聚乙烯亚胺线性MW 25000(波利塞斯公司(Polysciences))将第三代慢病毒转移质粒与包装质粒psPAX2(Addgene公司12260)和包膜质粒pMD2.G(Addgene公司12259)一起共转染到HEK293FT细胞中来产生慢病毒。在72小时之后,收集上清液,通过0.45-μm Steriflip-HV过滤器(密理博公司(Millipore))过滤,并使用慢病毒沉淀溶液(Alstem公司(Alstem))浓缩病毒。将浓缩的慢病毒重悬于含有IL-2的T细胞培养基中并在-80℃下储存。
汇集的ORF文库筛选
对于汇集的ORF文库筛选,CD4+和CD8+ T细胞从来自3名健康供体的至少500×106个PBMC中分离。用于转导的慢病毒的量被滴定以产生20-30%的转导效率,以最小化多个ORF被引入到单细胞中的概率。将细胞维持在含有2μg ml-1嘌呤霉素的T细胞培养基中,并且每2-3天计数一次,以维持1×106-2×106细胞/ml的细胞密度。在分离之后的第14天,将T细胞收集,计数,用5μM CFSE(百进生物公司)标记,并用CD3/CD28激活剂(干细胞公司)以1.56μl/1×106个细胞刺激。在该步骤中,将表示l,000x文库覆盖范围的细胞等分试样冷冻以用作预刺激对照。在刺激4天之后,收集细胞并将表示l,000×文库覆盖范围的细胞等分试样冷冻以用作预分选对照。将剩余的细胞用LIVE/DEAD Violet细胞活力染料(赛默飞世尔科技公司)染色,并使用Sony SH800S细胞分选仪分选CFSE细胞(与分布的底部15%相对应)。分离基因组DNA,并且进行两轮PCR以扩增ORF条形码并添加Illumina衔接子46
汇集的ORF筛选分析
对于大多数分析,在修剪和比对之前,将来自所有三个供体的相同数量的读数合并到每个箱中。在用Cutadapt v.1.13(-m 24-e 0.1-丢弃-未修剪)使用Bowtie v.1.1.2(-v1-m 1-最佳-层)进行衔接子修剪之后,将条形码映射到参考文库47,48。所有后续分析在RStudio v.1.1.419中与R 4.0.0.2一起进行。为了计算单个条形码富集,条形码计数相对于每个样品的总读数数量(添加了假计数)和转化的log2归一化。为了计算ORF富集,在归一化和log2转化之前,原始条形码计数首先被基因折叠。
在条形码和基因水平两者下进行了富集分析。使用MAGeCK49对条形码富集进行统计分析,将CFSE样品与对应的输入(预刺激)进行比较,使用CD4+和CD8+作为复制品。使用DESeq250对ORF富集进行统计分析。通过将条形码折叠成对应的基因来获得原始基因计数。将CFSE样品与对应的输入(预刺激和预分选两者)进行比较,使用CD4+和CD8+作为复制品。使用topGO包51对通过DESeq2标准(转化的log2变化倍数>0.5,Padj<0.05)的基因进行GO富集(生物过程)。对于在CFSE筛选中富集的基因(DESeq2分析),在CD3/CD28刺激之后,使用来自免疫细胞eQTL、表达、表观基因组的数据库的数据将这些基因与差异表达的基因重叠(DICE;https://dice-database.org/)41。对于差异表达的基因,使用以下DICE数据集:‘T细胞,CD4,原初’对‘T细胞,CD4,原初[激活的]’、‘T细胞,CD8,原初’对‘T细胞,CD8,原初[激活的]’。DICE数据集中给出了显著的差异表达(Padj<0.05)。
增殖测定
在分离之后的第14天收集经转导的T细胞,计数并以2.5×104个细胞/孔铺在圆底96孔板中,在每次转导的2组一式三份的孔中。一组一式三份的孔在补充有10ng ml-1IL-2的Immunocult-XF T细胞扩增培养基中培养,并且另一组一式三份的孔进一步补充有1.56μlCD3/CD28激活剂/1ml的培养基。将细胞培养4天,并且然后收集并用LIVE/DEAD Violet细胞活力染料染色。在流式细胞术采集之前,将细胞重悬于含有10%v/v精确计数珠粒(百进生物公司)的D-PBS中。为了定量,将活细胞事件的数量相对于每个样品的珠粒事件的数量归一化。然后,对于每个ORF,用补充有CD3/CD28激活剂的孔中活细胞的归一化数量除以对照孔中活细胞的平均数量,以定量T细胞增殖。为了能够在供体与CD4+/CD8+ T细胞之间进行比较,用给定ORF转导的T细胞的增殖最终相对于匹配的tNGFR对照的增殖归一化。
除了计数珠粒测定之外,还使用染料稀释测定来测量增殖。对于该测定,在分离之后第14天收集经转导的T细胞,用D-PBS洗涤,并且然后在室温下用D-PBS中的5μMCellTrace Yellow(CTY)标记20分钟。通过用五倍过量的补充有10%血清Plus-II的RPMI-1640洗涤来去除过量的染料。然后将标记的细胞以2.5×104个细胞/孔铺在圆底96孔板中。在补充的Immunocult-XF T细胞扩增培养基(也就是说,不含IL-2)中培养一组一式三份的孔,并且另一组一式三份的孔补充有10ng ml-1IL-2和1.56μl CD3/CD28激活剂/1ml的培养基。将细胞培养4天,并且然后收集并用LIVE/DEAD Violet细胞活力染料染色。为了对增殖指数进行定量,首先在FlowJo(Treestar公司(Treestar))中的活T细胞上对事件进行门控,并使用flowFit和flowCore包将其导出用于R/RStudio中的进一步分析52。未经刺激的细胞用于确定亲代群体大小和定位,以说明不同样品之间染色强度的差异。然后将这些拟合的亲代群体参数用于拟合匹配的受刺激样品的CTY图谱,建模为高斯分布,假设细胞分裂和染料稀释导致的log2距离峰。目测检查拟合的CTY图谱与原始CTY图谱的一致性,并用于计算增殖指数。增殖指数被定义为所有代中细胞的总和除以在测定开始时存在的亲代细胞的计算数量。
细胞表面和细胞内标志物的流式细胞术
对于CD25(IL2RA)和CD154(CD40L)定量,将T细胞在染色之前用CD3/CD28激活剂(6.25μl/106个细胞)再刺激6小时(CD8+中的CD154染色)或24小时(CD4+和CD8+两者中的CD25染色,以及CD4+中的CD154染色)。对于Ki-67和7-氨基-放线菌素D(7-AAD)染色,将T细胞在不含IL-2的Immunocult-XF T细胞扩增培养基中静置过夜,并且然后用CD3/CD28激活剂(25μl/106个细胞)激活24小时。在其它情况下,T细胞在没有刺激的情况下进行染色。为了检测分泌的蛋白质,用CD3/CD28激活剂(25μl/106个细胞)(LTA、LIGHT)刺激T细胞24小时,并且在刺激的最后6小时(IL12B、LTA、LIGHT)包含蛋白质转运抑制剂布雷菲德菌素A(5μg ml-1)和莫能菌素(2μM)。
首先,将细胞收集,用D-PBS洗涤并用LIVE/DEAD Violet细胞活力染料在室温下黑暗中染色5分钟,然后在冰上表面抗体染色20分钟。在表面抗体染色(如果适用)之后,将细胞用PBS洗涤,并在Sony SH800S细胞分选仪上采集或进行细胞内染色。对于细胞内染色,将细胞重悬于适当的固定缓冲液中。以下固定缓冲液用于特定蛋白质检测:用于IL12B和MS4A3染色的固定缓冲液(百进生物公司);用于BATF、TCF1和FLAG染色的真核转录因子固定(百进生物公司);以及用于Ki-67的FoxP3/转录因子固定试剂(eBioscience公司(eBioscience))。在重悬于固定缓冲液中之后,将细胞在室温下在黑暗中温育1小时。在温育之后,将细胞在适当的透化缓冲液中洗涤两次。使用以下透化缓冲液:用于IL12B和MS4A3染色的细胞内染色透化洗涤缓冲液(百进生物公司);用于BATF、TCF1和FLAG染色的真核Perm缓冲液(百进生物公司);以及用于Ki-67的FoxP3/转录因子透化缓冲液(eBioscience公司)。在透化之后,将细胞用特异性抗体或同种型对照在黑暗中在室温下染色30分钟。最后,将细胞在适当的透化缓冲液中洗涤两次,并在Sony SH800S流式细胞仪上采集。对于细胞周期分析,将细胞在采集之前立即用0.5μg ml-1 7-AAD进一步染色5分钟。使用适当的同种型、荧光减一和生物对照进行门控。通常,每个样品记录5,000-10,000个实时事件。
磷酸化蛋白质的流式细胞术检测
在检测磷酸化蛋白质之前,将T细胞在不含IL-2的Immunocult-XF T细胞扩增培养基中静置24小时。用CD3/CD28激活剂(25μl/106个)刺激静息的细胞,刺激时间在对应的图中指示。在刺激时间段之后,将细胞立即用1:1体积比率的预热固定缓冲液(百进生物公司)在37℃下固定15分钟,并用细胞染色缓冲液(D-PBS+2% FBS)洗涤两次。按照制造商的方案,将细胞重悬于剩余体积中,并在1ml的预冷的True-Phos Perm缓冲液(百进生物公司)中透化,同时涡旋。将细胞在-20℃下在True-Phos Perm缓冲液中温育60分钟。在透化之后,将细胞用细胞染色缓冲液洗涤两次,并用抗CD4、抗CD8、抗RELA和抗磷酸-RELA抗体(或同种型对照)在室温下染色30分钟。染色后,将细胞在细胞染色缓冲液中洗涤两次,并在SonySH800S细胞分选仪上采集。对CD4+或CD8+细胞进行门控,并使用适当的同种型和生物对照确定RELA和磷酸-RELA的水平。
蛋白质和磷酸化蛋白质的蛋白质印迹检测
收集表达tNGFR或LTBR的T细胞,用CD3/CD28激活剂(25μl/106个细胞)静息或刺激15分钟,用1×D-PBS洗涤,并在存在蛋白酶抑制剂混合物(Bimake公司(Bimake)B14001)和磷酸酶抑制剂混合物(细胞信号传导技术公司(Cell Signaling Technologies)5872S)的情况下用TNE缓冲液(10mM Tris-HCl,pH 7.4,150mM NaCl,1mM EDTA,1%Nonidet P-40)在冰上裂解1小时。将细胞裂解物以10,000g离心10分钟,并且用BCA测定(赛默飞世尔科技公司)确定蛋白质浓度。将等量的细胞裂解物(25mg)在Tris-甘氨酸SDS样品缓冲液(赛默飞世尔科技公司)中变性,并加载到Novex 4-12或4-20% Tris-甘氨酸凝胶(赛默飞世尔科技公司)上。PageRuler预染色蛋白质阶梯(赛默飞世尔科技公司)用于确定蛋白质大小。将凝胶在120V下在1×Tris-甘氨酸-SDS缓冲液(IBI科学公司(IBI Scientific))中运行约120分钟。将蛋白质在存在补充有20%甲醇的预冷的1×Tris-甘氨酸转移缓冲液(赛默飞世尔科技公司)的情况下,在硝酸纤维素膜(伯乐公司)上在100V下转移100分钟。
用溶解于含1% Tween-20的1×PBS(PBST)中的5%脱脂乳阻断免疫印迹,并分别与以下一级抗体在4℃下温育过夜:兔抗GAPDH(0.1mg ml-1,细胞信号传导公司(CellSignaling),2118S)、小鼠抗IKKα(1:1,000稀释度,细胞信号传导公司,3G12)、兔抗IKKβ(1:1,000稀释度,细胞信号传导公司,D30C6)、兔抗NF-κB p65(1:1,000稀释度,细胞信号传导公司,D14E12)、兔抗磷酸-NF-κB p65 Ser536(1:1,000稀释度,细胞信号传导公司,93H1)、小鼠抗-IκBα(1:1,000稀释度,细胞信号传导公司,L35A5)、兔抗磷酸-IκBαSer32(1:1,000稀释度,细胞信号传导公司,14D4)、兔抗NF-κB pl00/p52(1:1,000稀释度,细胞信号传导公司,4882)和兔抗RELB(1:1,000稀释度,细胞信号传导公司,C1E4)。在一级抗体之后,将印迹与IRDye 680RD驴抗兔(0.2mg ml-1,LI-COR 926-68073)或IRDye 800CW驴抗鼠(0.2mg ml-1,LI-COR 926-32212)一起温育。使用Odyssey CLx(LI-COR)对印迹进行成像,并使用ImageJ v.1.52进行定量。
细胞因子分泌的定量
为了测量分泌的IFNγ和IL-2,首先收集T细胞并在不含IL-2的培养基中静置24小时。然后,对其进行计数,以2.5×104个细胞/孔铺在圆底96孔板中,并在不含IL-2、含或不含CD3/CD28激活剂(25μl/106个细胞)的培养基中温育24小时。然后,收集、稀释细胞上清液,并使用Infinite F200 Pro(Tecan公司(Tecan))平板读数器,通过酶联免疫吸附测定(人IL-2或IFNγDuoSet,R&D系统公司(R&D Systems))用于细胞因子定量。使用人细胞因子/趋化因子48-Plex发现测定阵列(Eve技术公司(Eve Technologies))对静息或经刺激的T细胞中分泌的细胞因子和趋化因子进行多重定量。
T细胞杀伤测定
首先用编码EGFPd2PEST-NLS和嘌呤霉素抗性基因的慢病毒载体转导CD19+Nalm6细胞53。在整个培养过程中,将经转导的细胞保持在嘌呤霉素选择中,以维持稳定的EGFP表达,并且嘌呤霉素仅在杀伤测定之前从培养基中去除。使用CD28柄、CD28跨膜和CD28信号传导结构域或具有4-1BB信号传导结构域和CD3ζ信号传导结构域的CD8柄和CD8跨膜结构域,用编码对CD19具有特异性的CAR的载体转导T细胞54。在转导之后十四天,将经转导的T细胞与5×104个Nalm6 GFP+细胞以指定的效应子靶标比率一式三份组合在平坦96孔板中,所述板在不含IL-2的Immunocult培养基中预涂有0.01%聚-l-鸟氨酸(EMD密理博公司(EMDMillipore))。然后使用Incucyte SX1对孔进行成像,使用20倍放大率并且每2小时采集4个图像,持续120小时。对于每个孔,整合的GFP强度相对于2小时时间点归一化,以允许细胞在铺板之后完全沉降。
体外mRNA制备
用于体外转录的模板由编码LTBR或tNGFR的质粒通过PCR产生,所得扩增子包含ORF上游的T7启动子。然后使用带有加帽的HiScribe T7 ARCA mRNA试剂盒(NEB)将纯化的模板用于带有加帽和poly-A尾的体外转录。
原代T细胞核转染
在激活之后24小时用体外转录的mRNA或在激活之后48小时用Cas9蛋白对经激活的T细胞进行核转染。将细胞收集,在PBS中洗涤两次,并以5×105个细胞/20μl重悬于P3原代细胞Nucleofector溶液(龙沙公司)中。在重悬浮之后,立即添加1μg mRNA或10μg Cas9(Aldevron公司)(不超过反应的10%v/v)并在4D-Nucleofector(龙沙公司)上使用E0-115程序对细胞进行核转染。在核转染之后,将细胞重悬于含有IL-2的预热的Immunocult培养基中,并在37℃下用5% CO2回收20分钟。在回收之后,将细胞以1×106个细胞/ml铺板,用于下游测定。
OverCITE-seq样品制备和测序
对于单细胞测序,将CD8+ T细胞分别用ORF转导,并分别在嘌呤霉素选择下保持14天。然后,将经转导的细胞合并并分成两种条件:一种仅在存在IL-2的情况下培养24小时;另一种进一步补充有6.25μl CD3/CD28激活剂/106个细胞。在刺激之后,收集细胞,计数并以2×107个细胞/ml重悬于染色缓冲液(含2% BSA+0.01% Tween-20的PBS)中。然后,添加10%(v/v)人TruStain FcX Fc受体阻断溶液(百进生物公司)并将细胞在4℃下温育10分钟。在Fc受体阻断之后,将细胞浓度调节至5×106个细胞/ml,并将经刺激和未经刺激的细胞各自分成4种条件。每种条件接受不同的寡核苷酸缀合(带条形码的)细胞哈希抗体,以允许在相同的10x Genomics Chromium泳道中汇集不同的条件23。在冰上共温育20分钟之后,将细胞用染色缓冲液洗涤3次,并使用台盼蓝排除法计数。细胞活力通常为约95%。
然后,将用不同哈希抗体染色的细胞以相等的数量汇集在一起,并用以下寡核苷酸缀合的(带条形码的)抗体染色,用于细胞表面抗原的定量:CD11c(0.1μg)、CD14(0.2μg)、CD16(0.1μg)、CD19(0.1μg)、CD56(0.2μg)、CD3(0.2μg)、CD45(0.01μg)、CD45RA(0.2μg)、CD45RO(0.2μg)、CD4(0.1μg)、CD8(0.1μg)、CD25(0.25μg)、CD69(0.25μg)和NGFR(0.25μg)(TotalSeq-C,百进生物公司)。将细胞在冰上染色30分钟,用染色缓冲液洗涤3次,重悬于PBS中,并通过40-μm细胞过滤器过滤。然后对细胞进行计数并将浓度调整至1×106ml-1。为了加载到10x Genomics Chromium中,将3×104个细胞与Chromium Next GEM单细胞5'v2主混合物(10x Genomics)组合,所述主混合物补充有与嘌呤霉素抗性盒结合的定制反向引物,用于在逆转录阶段增强ORF转录物捕获。将定制的反向引物以1:3比率添加到包含在主混合物中的poly-dT引物中。
对于cDNA扩增,包含用于扩增样品哈希和表面抗原条形码的附加引物23,以及与ORF下游的嘌呤霉素抗性盒结合的嵌套反向引物。在cDNA扩增之后,SPRI珠粒用于所得PCR产物的大小选择:小尺寸(小于300bp)样品哈希和表面抗原条形码被物理地从较大的cDNA和ORF扩增子中分离出来用于下游处理。还处理了样品哈希和表面抗原条形码22。然后将扩增的cDNA分成三个条件,用于构建基因表达文库、αβTCR文库和ORF文库。使用与ORF下游结合的嵌套反向引物,对ORF文库进行类似于αβTCR文库的处理。使用高灵敏度DNA试剂盒(安捷伦公司(Agilent))在生物分析仪上验证产生的文库的质量。在NextSeq 500上对文库进行测序。对于基因表达文库,每个细胞产生了超过25,000个读数。对于其它文库,每个细胞产生了超过5,000个读数。
OverCITE-seq数据分析
使用10x Genomics Cell Ranger 3.1.0获得基因表达唯一分子标识符(UMI)计数矩阵和TCR克隆型。使用kallisto v.0.46.055和bustools v.0.39.356产生哈希标签寡核苷酸(HTO)和抗体UMI计数矩阵。首先使用Bowtie2 v.2.2.857将ORF读数与质粒参考进行比对,并索引到相关的ORF,之后使用kallisto和bustools产生UMI计数矩阵。使用中心对数比率(CLR)转化对所有模态进行归一化。使用HTODemux58功能鉴定细胞双重态和阴性,并且然后从下游分析中排除。HTODemux的UMI截止分位数经过优化,以使用值在0与1之间的网格搜索来最大化单重态回收率。ORF单重态使用MULTIseqDemux59进行鉴定。然后,排除了低质量基因表达指标的细胞,并去除了具有少于200个独特RNA特征或多于5%的映射到线粒体转录组的读数的细胞。
然后将计数矩阵加载到Seurat v.4.0.160中并用其进行分析。使用具有默认基因的CellCycleScoring函数进行细胞周期校正和基因表达数据的缩放,随后使用ScaleData函数缩放数据。然后使用JackStraw61对缩放和校正的数据进行主组分(PC)优化,其中选择所有PC,直到第一不显著PC用于聚类。使用基于共享最近邻(SNN)的聚类算法进行细胞的聚类,并使用UMAP维数降低62将簇PC投影到2D空间中进行可视化。使用FindAllMarkers函数进行簇标志物分析,假设集定义为至少25%的簇细胞中存在阳性和阴性标志物,并且与非簇细胞相比,转化的log2变化倍数阈值为0.25。使用DESeq250进行ORF的差异表达分析,以鉴定与NGFR(对照)细胞相比,表达ORF的细胞中的上调和下调的基因,其中差异表达被定义为使用Storey方法63计算的q<0.1的差异表达。
整体RNA-seq和分析
用CD3/CD28激活剂(25μl/106个细胞)刺激CD4+和CD8+LTBR或tNGFR转导的T细胞24小时,或者不受刺激(n=3个生物复制品)。使用Direct-zol RNA纯化试剂盒(Zymo公司(Zymo))提取总RNA。制备3'富集的RNA-seq文库,如之前所描述的64。简而言之,使用SMARTScribe逆转录酶(塔卡拉生物公司(Takara Bio))和含有部分Nextera手柄的poly(dT)寡核苷酸逆转录RNA。然后使用OneTaq聚合酶(NEB)将所得cDNA PCR扩增3个周期,并使用自制转座酶TnY44在55℃下标记5分钟。之后,立即在MinElute柱(凯杰公司(Qiagen))上纯化标记的DNA,并使用OneTaq聚合酶和带条形码的引物进行12个周期的PCR扩增。使用双重(0.5×-0.8×)SPRI净化(Agencourt)纯化PCR产物,并使用Tapestation(安捷伦公司)确定大小分布。使用v2.5 75周期试剂盒(成对末端)在NextSeq 500(Illumina)上对样品进行测序。使用kallisto v.0.46.055将成对末端读数与转录组(人Ensembl v.96参考65)进行比对,并使用tximport包66加载到具有R 4.0.0.2的RStudio 1.1.419中。使用DESeq250进行差异基因表达分析。使用topGO包51对通过DESeq2标准(log2的转化的变化倍数>1,Padj<0.05)的基因进行GO富集(生物过程)。
ATAC-seq文库制备
用CD3/CD28激活剂(25μl/106个细胞)刺激CD8+LTBR和tNGFR T细胞24小时,或者不受刺激(n=2个生物复制品)。进行了整体ATAC-seq,如先前所描述的44。简而言之,在新鲜添加0.1% IGEPAL的RSB缓冲液(10mM Tris-HCL pH 7.4,3mM MgCl2,10mM NaCl)中裂解细胞膜。在上下移液之后,通过在4℃下以500g离心5分钟来分离核。在弃去上清液之后,将核重悬于含有自制转座酶TnY蛋白44的标记DNA(TD)缓冲液44中,并在37℃下温育30分钟。在MinElute柱(凯杰公司)上纯化之后,使用自制Pfu X7 DNA聚合酶44和带条形码的引物对标记的DNA进行12个周期的PCR扩增。将PCR产物通过1.5×SPRI净化(Agencourt)纯化,并使用TapeStation(安捷伦公司)检查特性核小体条带模式。使用v2.5 75周期试剂盒(单末端)在NextSeq 500(Illumina)上对样品进行测序。
ATAC-seq分析
使用Bowtie2 v.2.4.457将单末端读数与Gencode hg38主要组装67进行比对。然后,使用SAMtools v.1.968过滤掉低映射质量(MAPQ<30)的比对,并且随后对过滤后的BAM文件68进行分选和索引。使用Picard v.4.1.8.169去除了读数复制品。使用MACS3v.3.0.070和默认参数(-g 2.7e9-q 0.05)调用峰。
为了构建用于大部分下游分析的联合特征空间(‘联合峰’),开始使用BEDToolsv.2.29.0(使用bedtools intersect)对生物复制品窄峰文件对进行交叉,仅保留在两个复制品中发现的峰71。在标记复制品之间的共享峰之后,使用bedtools merge合并每个共享峰处的生物复制品(至少1bp重叠)。在这个新的峰BED文件中,每个共享峰包含在任何一个生物复制品中的峰下发现的所有序列。接下来,取这些峰文件(LTBR静息、LTBR刺激的、tNGFR静息、tNGFR刺激的)中每一个的联合;合并了具有至少1bp重叠的任何峰。使用联合峰,产生了峰读数计数矩阵(联合峰×ATAC样品),其中矩阵中的每个条目与指定样品中与该峰重叠的读数数量相对应,称之为每峰ATAC矩阵。重叠读数直接取自为每个样品提供比对的BAM文件(转换为BED)。因此,基质包含用于每个生物复制品的列。尽管样品在比对读数上差异极小,但通过每个样品中与TSS区重叠的读数数量来归一化矩阵中的每个条目。以这种方式,样品之间的任何读数或比对深度的差异将被适当地归一化。除了每峰ATAC矩阵之外,还构建了每基因ATAC矩阵如下:将基因的总ATAC读数指定为基因的起始或终止坐标的3kb内所有峰的每峰ATAC矩阵的归一化读数之和。
将这两个ATAC矩阵(每峰和每基因)导入到R v.4.1.1中,用于使用DESeq2v.1.32.0进行基因和峰富集分析。为了在ATAC-seq与RNA-seq之间进行比较,使用经调整的P值<0.05的统计阈值,并且转化的log2的变化倍数>0(用于ATAC或RNA的增加)或转化的log2的变化倍数<0(用于ATAC或RNA的减少)。对于转录因子基序分析,使用Chrom-VARv.1.14.072,如下所示:对于每个测试与对照条件,使用每峰矩阵的列和样品亚群以及联合特征空间来构建总结的实验对象。使用matchMotifs函数来注释转录因子基序。使用computeDeviations函数计算了测试与对照条件之间的富集偏差。
为了在特定的基因组基因座处产生读数堆积轨迹,使用samtools merge汇集了来自生物复制品的去复制读数(BAM)。通过使用来自deeptools v.3.4.2的bamCoverage函数,并将scaleFactor设置为与所有其它样品聚集体73相比,在汇集的生物复制品中发现的TSS的相对数量,从而将这些汇集的复制品BAM文件转换为bigWig文件。使用bigWig文件,用pyGenomeTracks v.3.674绘制读数堆积。
最后,对染色质可及性增加的基因附近的ATAC峰进行了k平均值聚类。首先,在ATAC每基因矩阵上使用DEseq2,在两个比较中的任何一个中鉴定了转化的log2的变化倍数>1且经调整的P值<0.05的基因(也就是说,染色质可及性增加的基因):(1)经刺激的LTBR对经刺激的tNGFR;(2)LTBR静息对tNGFR静息。在鉴定这些基因之后,分离了3kb的基因体内的每峰ATAC矩阵中的所有可及性峰;来自每峰ATAC矩阵的这个峰亚群用作聚类的输入。然后,使用deeptools(computeMatrix和plotHeatmap函数)对ATAC峰的这个亚群进行k平均值聚类,其中k=4个簇并且读数窗口为6kb。
统计分析
根据数据类型(取决于分布的正态性),使用双尾未配对斯图登氏t测试或克鲁斯拉-沃利斯测试(Mann-Whitney test)对两个组之间的数据进行比较。除非另有说明,否则小于或等于0.05的P值被认为在所有分析中具有统计学意义,并且在多重比较中不进行校正。在需要多重比较校正的情况下,使用Benjamini-Hochberg方法调整P值。除非另有说明,否则所有组的结果都表示为平均值±s.e.m.。在Prism(GraphPad)和RStudio(RstudioPBC)中进行统计分析。使用Flow Jo v.10.7.1(Treestar公司)分析流式细胞术数据。
实例2:T细胞增殖的合成驱动因子的基因组规模的筛选
使用带条形码的的人ORF的慢病毒文库,在原代人CD4+和CD8+ T细胞中进行了基因组规模的功能获得筛选。表明具有最强增殖表型的T细胞富含已知和未知的免疫应答调节因子两者,其中许多通常不由外周T细胞表达。验证了来自筛选非依赖性供体的细胞中的排序靠前的ORF,并进一步证明这些ORF不仅驱动T细胞增殖,而且增加激活标志物的表达和关键促炎细胞因子的分泌。为了获取对这些基因的作用机制的更全面了解,开发了与直接ORF捕获偶联的单细胞测序方法。鉴定出LTBR,即淋巴细胞不表达的排序靠前的ORF之一是通过增加NF-κB信号传导的深刻的转录和表观遗传重塑的关键驱动因子,这导致促炎细胞因子的分泌和对凋亡的抗性显著增加。最后,表明在CD19导向的CAR T细胞和来自健康供体和患有血癌的患者的广泛肿瘤反应性γδT细胞的背景下,排序靠前的ORF增强抗原特异性T细胞功能。
T细胞中基因组规模的ORF筛选
为了避免依赖大型细菌蛋白质的组成型表达或靶基因附近的染色质可及性13,决定使用人ORF的慢病毒文库;该文库含有近12,000个全长基因,每个基因有约6个条形码14(图1A、图6A-图6F)。先前,人T细胞的基因组规模的功能丧失筛选集中在CD4+或CD8+ T细胞上。然而,CD4+和CD8+ T细胞两者是在过继性疗法中持久控制肿瘤所必需的15,16,如FDA批准CD4+和CD8+比率为1:1的抗CD19 CAR T细胞进一步证明了这一点1。因此,决定使用ORF文库来发现对T细胞受体(TCR)刺激作出应答而促进CD4+和CD8+ T细胞两者增殖的基因(图1A、图6G-图6I)。
将慢病毒ORF文库转导到来自三名健康供体的CD4+和CD8+ T细胞中,并且在短暂的培养时间段(14天)之后,重新刺激细胞以鉴定对TCR刺激作出应答的增殖驱动因子。能够捕获大多数单独的ORF条形码,以及几乎所有ORF,包含最大的ORF(图6J)。比较最高度增殖的细胞与未分选细胞中基因的相对频率,发现已知参与免疫过程的基因在排序靠前的ORF中富集(图6K)。鉴定了MAPK3(编码ERK1),T细胞功能的关键介体17,共刺激分子CD5918,转录因子BATF,以及已知促进T细胞增殖的细胞因子,如IL12B和IL23A19。事实上,最近的两项研究表明,IL12B和BATF的过表达促进了CAR T细胞的增殖、细胞毒性和细胞因子分泌19,20
文库中的每个ORF平均与六个DNA条形码连接(图6B)。为了增加在汇集的筛选中的排序靠前的ORF的置信度,评估了增殖的CD4+和CD8+细胞中与给定ORF相对应的单独的条形码的富集(图6B、图6C)。对于大多数ORF,每个基因的多个单独的条形码在高度增殖的群体中富集,因此表明观察到的富集不是源于假克隆生长或PCR偏差。令人惊讶的是,最显著富集的基因是淋巴毒素-β受体(LTBR),广泛表达于基质细胞和骨髓细胞但在淋巴细胞中完全不存在的基因。
总的来说,富集的ORF跨越了一系列不同的生物过程。顶部富集的基因本体(GO)生物过程包括淋巴细胞增殖、干扰素-γ(IFNγ)产生和NF-κB信号传导(图6L)。观察到,在用CD3和CD28(CD3/CD28)刺激时,富集的ORF仅示出对T细胞的内源性上调基因的轻微偏好,并且事实上在所有类别的差异表达中有表达(图6M)。这一结果强调了汇集的ORF筛选发现能够使T细胞增殖但在CD3/CD28介导的激活和增殖期间不正常表达的基因的能力。为了后续验证,决定测试广泛范围的ORF,其在与T细胞适应性相关的多种通路中发挥作用,并显示出不同的内源性调节模式。包含中性基因(MHC-I复合物和细胞类型特异性分化标志物)用于比较。基于CD3/CD28刺激的和静息T细胞中的差异表达鉴定基因(上调:IL1RN、NFYB、BATF、AHNAK、CLIC1、RAN、DBI、GPD1、GPN3、AHCY、HOMER1、MRPL18、MRPL51、LIG3、ZNF830、HLA-A;下调:FOSB、ATF6B、SLC10A7、CDK2、ADA、CD19;无变化:CDK1、DCLRE1B、B2M;无表达:IFNL2、LTBR、CXCL12、CRLF2、IL12B、CALML3、CYP27A1、AKR1C4、DUPD1、NGFR)41
靠前的ORF增强T细胞功能
为了验证排序靠前的ORF并了解其对T细胞功能的其它相关方面的效应,将来自文库的33个ORF亚克隆到载体中,所述载体共表达来自同一启动子的P2A连接的嘌呤霉素抗性基因。选择截短的神经生长因子受体(tNGFR),缺乏其细胞内结构域,作为对T细胞表型没有效应的对照21。CD4+和CD8+群体分别从几个筛选非依赖性健康供体中分离,并用单独的ORF转导(图2A)。对代表性ORF使用流式细胞术,证实了在实验期间其在T细胞的两个亚群中稳定而均匀地表达(图7A、图7B)。
在分离之后十四天,再刺激细胞并测量细胞数量的相对增加。发现,与tNGFR相比,16个测试的ORF显著提高了细胞增殖,并且增殖在CD4+与CD8+细胞之间具有良好相关性(斯皮尔曼r=0.61,P=0.002)(图2B、图2C、图7C-图7H)。已经确定靠前的ORF促进T细胞增殖,接下来测试是否在其它T细胞表型和功能上也有变化,如增加细胞周期进入,激活标志物IL2RA(CD25)和CD40L(CD154)的表达,以及细胞因子分泌。大多数测试的ORF在循环中没有示出差异(图2I、图2J),但是在刺激之后示出T细胞中的CD25和CD154两者的更高表达(图2D、图8A),进一步证实了其在改进T细胞应答的幅度中的效应。
最后,在CD3/CD28再刺激之后测量了细胞因子白介素-2(IL-2)和IFNγ的分泌(图2E、图8B-图8E)。虽然筛选不是为了鉴定调节细胞因子分泌的基因,但几个ORF既能改进T细胞增殖,又能促进IL-2或IFNγ分泌(图2F)。观察到最强的效应是LTBR,其将CD4+和CD8+ T细胞中这两种细胞因子的分泌增加了五倍以上。
ORF表型的单细胞分析
基于对每个ORF如何影响增殖、激活和细胞因子释放的定量,接下来试图更好地理解驱动细胞状态的这些变化的潜在机制。为了获取对单独的ORF的作用机制的更全面了解,并提供其诱导的表型变化的多维特性,开发了具有直接ORF捕获的单细胞测序策略。这种方法OverCITE-seq(通过测序对转录组和表位进行过表达兼容细胞索引)扩展了先前开发的用于定量表面抗原22和CRISPR扰动23的方法,并允许对具有不同ORF的T细胞池进行高通量单细胞分析。简而言之,在模板切换期间,来自慢病毒整合的ORF的mRNA通过与ORF下游转录物的恒定序列结合的引物特异性逆转录,并与细胞转录组一起被带条形码的。然后将所得cDNA池分开以分别构建基因表达和ORF表达文(图3A、图3B、图9A)。
优化了OverCITE-seq并将其应用于从健康供体转导到CD8+ T细胞中的约30个ORF的池。细胞池不受刺激(“静息”)或者用CD3/CD28抗体刺激以模拟TCR激活。为了获取ORF如何被分配到每个单细胞的置信度,我们利用了由对照基因tNGFR产生的蛋白质在细胞表面表达,并且因此可以被DNA带条形码的抗体捕获的事实23。当通过CITE-seq或流式细胞术测量时,指定为tNGFR阳性的细胞比例是一致的(图3C)。对整个ORF池的分析显示,分配有给定ORF的单细胞总体上具有对应基因的最强表达(图9B-图9D),指示ORF捕获策略可靠地将基因扰动分配给每个单细胞。
无监督聚类示出了经刺激的和静息T细胞的清晰分离。在这些激活驱动的超簇中,可以观察到与特定细胞状态或功能相关的单独的簇,如细胞周期(簇1和9)、大分子生物合成(簇2)、I型IFN信号传导(簇3)、细胞毒性(簇6)、T细胞激活和增殖(簇10)以及应激应答和凋亡(簇11)(图3D)。尽管在许多情况下,几个ORF有助于给定的簇表型(图9E),但观察到簇1中的CDK1和CLIC1这两个ORF的显著富集,其特征在于负责细胞周期准备中的染色体浓缩的基因的表达增加(图3E)。对于簇10观察到甚至更强的富集,其几乎完全由表达LTBR的细胞组成。
为了研究具有最强转录变化的基因扰动的机制,观察了CD3/CD28刺激的ORF T细胞与未经刺激的对照T细胞相比的转录图谱(图9F-图9I)。这种方法允许鉴定不同扰动之间共享的基因模块,或者是特定扰动的基因模块。例如,LTBR和CDK1示出了涉及RNA代谢和细胞周期(CDK4、HSPA8和BTG3)以及肿瘤坏死因子(TNF)信号传导通路(TNFAIP3、TRAF1和CD70)的基因的最强富集。在涉及TCR信号传导(CD3D、CD3E、LAPTM5和LAT)、细胞因子应答(GATA3和TNFRSF4)和NF-κB通路(NFKB2、NFKBIA和UBE2N)的基因方面,FOSB似乎驱动了与LTBR相对的程序。最后,确定观察到的表型是基因扰动的结果,而不是单克隆的结果,因为实际上每个单细胞表达独特的TCR克隆型(图9J)。这一结果突出了OverCITE-seq的多模式捕获方法的效用,产生了每个T细胞的转录组、克隆型、细胞表面蛋白质组、细胞哈希(用于治疗或刺激条件)和慢病毒ORF身份。
LTBR改进多种T细胞功能
已经鉴定LTBR是促炎细胞因子分泌(图2E)和深刻的转录重塑(图3D、图3E)的强驱动因子,决定更详细地研究其作用机制。LTBR属于肿瘤坏死因子受体超家族(TNFRSF)并且在多种非免疫细胞类型和骨髓来源的免疫细胞上表达,但在淋巴细胞中不存在(图10A、图10B)。使用整体RNA测序(RNA-seq),比较了有或没有TCR刺激的LTBR与tNGFR转导的细胞之间的整体基因表达(图4A、图4B、图10C)。除了MHC-I和II基因(HLA-C、HLA-B、HLA-DPB1、HLA-DPA1和HLA-DRB6)和MHC-II表达必需的转录因子(RFX5和CIITA)的上调之外,LTBR细胞也表达MHC-II不变链(由CD74编码)。值得注意的是,CD74已在B细胞中示出激活促存活的NF-κB通路,具体地通过上调抗凋亡基因TRAF1和BIRC3(两者在过表达LTBR的细胞中也上调)24。类似地,LTBR细胞强上调已被证明促进CD8+ T细胞25的存活的BATF3。还观察到涉及IL-2产生26的转录因子JUNB和负责T细胞自我更新27的关键转录因子TCF7(编码TCF1)的上调。在蛋白质水平上证实了RNA-seq结果(图10D-图10I)。LTBR细胞也对激活诱导的细胞死亡更具有抗性,并在反复刺激之后保留更强的功能(图4C、图4D、图10J-图10M)。
LTBR信号传导在其内源性环境中(在骨髓细胞中)由淋巴毒素-α(LTA)和淋巴毒素-β(LTB)的异源三聚体或由LIGHT(由TNFSF14基因编码)触发。由于LTA、LTB和LIGHT由激活的T细胞表达,试图阐明外源性LTA或LIGHT的添加是否可以调节过表达CD3/CD28刺激的LTBR的T细胞的细胞因子分泌、分化或增殖;然而,没有发现外源性配体对LTBR T细胞功能的效应(图11A-图11E)。因此,尽管LTBR可以加强TCR驱动的T细胞应答,但其本身并不驱动激活,这将是潜在的安全问题,并导致经工程化的T细胞应答的抗原特异性的丧失。还确定了LTBR的组成型表达对于维持其表型是必需的,但是在可检测的LTBR表达的丧失与表型的丧失之间存在相当大的滞后时间(图11F-图11I),指示了LTBR的瞬时表达可能是进入治疗应用的安全途径。
最后,为了鉴定驱动LTBR蛋白在T细胞中的活性的关键结构域,设计了一系列LTBR的点或缺失突变(图4E、图11J)。通常,发现LTBR的N末端对缺失的灵敏度低于C末端对缺失的灵敏度。类似地,通过在LTA和LTB结合28的关键残基中引入三个丙氨酸点突变,或者通过去除信号肽来实现LTBR表型的部分减少。使用C-末端缺失,发现缺乏残基393-435的LTBR的突变体版本与全长LTBR相比没有差异,而残基377-435的缺失完全消除了LTBR表型,尽管表达水平相当(如果不是更高的话)(图11K),这可能是由于TRAF2、TRAF3或TRAF529的结合位点的丧失。此外,自身缔合结构域30(324-377)的缺失也完全消除了表型。
LTBR通过T细胞中的典型NF-κB发挥作用
LTBR过表达被示出诱导T细胞的广泛转录组变化,伴随着T细胞功能的变化(图4A、图4B)。因此,试图通过测序(ATAC-seq)利用转座酶可及染色质的测定来确定LTBR细胞中的基因表达的扰动是否伴有表观遗传改变(图12A-图12G)。比较特异性转录因子基序在差异可及的染色质区的富集,鉴定NF-κB p65(RELA)是LTBR细胞中最富集的转录因子(图12H、图12I)。值得注意的是,NF-κB p65和NFAT-AP-1是经刺激对静息T细胞(LTBR和tNGFR两者)中的开放染色质中最富集的两种转录因子,这与其在T细胞激活31中的公认的作用一致,但只有NF-κB p65在LTBR细胞中显示出强富集,无论有无刺激(图4F)。这一结果表明,LTBR诱导部分T细胞激活状态,但仍需要信号1(TCR刺激)进行完全激活。
然后决定研究NF-κB信号传导通路的成员的蛋白表达和/或磷酸化的变化。观察到p65(RELA)的更快速的磷酸化和NF-κB抑制剂IκBα的磷酸化的强增加,靶向IκBα用于降解;这两种效应增强了NF-κB的激活或转录(图4G、图4H、图13A-图13C)。除了典型NF-κB通路的变化之外,还检测到非典型NF-κB通路的关键介体RELB和NF-κB p52的上调(图4I、图13B、图13C)。
已经确定LTBR激活典型和非典型NF-κB通路两者,试图通过干扰LTBR和NF-κB通路中的关键基因来确定这一现象的分子基础,这是通过共递送LTBR或tNGFR和CRISPR构建体来实现的,所述构建体靶向涉及LTBR信号传导通路32的11个基因(图4J、图13D-图13O)。敲除LTB、TRAF2和NIK(也被称为MAP3K14)显著减少来自LTBR细胞的IFNγ的分泌,但不(或在较小程度上)减少来自对照(tNGFR)细胞的IFNγ的分泌,而LIGHT(也被称为TNFSF14)、ASK1(也被称为MAP3K5)和RELA的扰动对对照细胞的效应比对LTBR细胞的效应更强。LTB丧失对LTBR细胞中的T细胞激活的效应支持了这样的观察,即涉及LTA或LTB结合的关键残基的丙氨酸诱变(图4E)部分降低了LTBR表型。值得注意的是,观察到TRAF2或TRAF3的丧失仅在tNGFR细胞中促进IFNγ分泌,这与先前的发现一致,即来自显性阴性小鼠TRAF2的T细胞对TCR刺激反应过度33
为了研究LTBR T细胞中的典型对非典型NF-κB信号传导的潜在作用,决定分析RELA或RELB丧失对LTBR驱动的基因表达图谱的整体效应。使用过表达LTBR或tNGFR的T细胞上的整体RNA-seq,发现仅RELA的丧失显著下调‘核心’LTBR基因的表达,而RELB的丧失没有效应(图4K、图13P)。
ORF增强抗原特异性应答
到目前为止,已经表明,使用非特异性的泛TCR刺激,来自ORF筛选的排序靠前的基因改进T细胞功能。接下来,试图确定使用抗原特异性刺激是否可以观察到类似的改进(图5A)。为此,用两种FDA批准的靶向B细胞标志物CD19的CAR共表达了几个排序靠前的基因(图14A-图14D)。使用LTBR作为实例,证明了用这种三顺反子载体可以实现ORF表达(图14E-图14I)。序列表中提供了三顺反子载体的序列(图5A中提供了示意图):
19-28-z+LTBR蛋白:SEQ ID NO:3
19-28-z+LTBR DNA:SEQ ID NO:4
19-28-z+NGFR蛋白:SEQ ID NO:5
19-28-z+NGFR DNA:SEQ ID NO:6
19-BB-z+LTBR蛋白:SEQ ID NO:7
19-BB-z+LTBR DNA:SEQ ID NO:8
19-BB-z+NGFR蛋白:SEQ ID NO:9
19-BB-z+NGFR DNA:SEQ ID NO:10
由于两个CAR使用不同的共刺激结构域,从CD28或4-1BB,想确定使用CD28共刺激选择的排序靠前的基因是否也可以在4-1BB共刺激的情况下工作。除了AKR1C4之外,几乎所有测试的排序靠前的基因改进了CD25和抗原特异性细胞因子分泌的上调,在分化或衰竭表型上没有显著差异(图5B、图5C、图14J-图14P、图15A-图15D)。
尽管IL-2和IFNγ的产生对T细胞的克隆扩增和抗肿瘤活性至关重要,但肿瘤免疫监视的另一个重要组分是直接细胞毒性。排序靠前的基因对CD28 CAR T细胞的细胞毒性比4-1BB CAR T细胞对CD28 CAR T细胞的细胞毒性具有总体上更强的效应(图5D-图5E、图15E、图15F)。值得注意的是,观察到共表达LTBR的CAR T细胞倾向于形成大细胞簇;这些簇通常在具有对照细胞的孔中不存在,但与如表达LTBR的细胞中的ICAM-1等粘附分子的总体高表达一致(图15G)。有效的抗肿瘤T细胞的另一个重要特征是尽管长期暴露于抗原下仍能保持功能的能力。与先前在单独LTBR的情况下的发现一致(图4D),在用靶细胞重复激发之后,表达LTBR的CAR T细胞显示出比匹配的表达tNGFR的CAR T细胞更好的功能性(图5F、图15H-图15J)。
来自健康供体的T细胞相对容易工程化并且在培养中很少表现出功能障碍的迹象,而患有癌症的患者的自体T细胞通常功能障碍,表现出有限的增殖和效应子功能34。为了研究排序靠前的基因是否可以改进健康T细胞和源自患者的潜在功能障碍T细胞中的CAR T细胞应答,将与LTBR或对照基因共表达的CD19 CAR转导到来自患有弥漫性大B细胞淋巴瘤的患者的外周血单核细胞(PBMC)中。在与CD19+靶细胞共温育之后,观察到来自LTBR CAR T细胞的IL-2和IFNγ的分泌增加与健康供体相似,这表明已鉴定的ORF可以成功地用于离体对来自患有淋巴瘤的患者的T细胞进行工程化(图5G、图15K)。值得注意的是,不存在对CD19-细胞作出应答的细胞因子的分泌,这指示LTBR的过表达不会诱导虚假的、抗原非依赖性应答。
在人外周血中的T细胞的主要亚群αβT细胞中进行筛选和后续验证。虽然基于αβT细胞的免疫疗法在临床上显示出相当大的潜力,但γδT细胞呈现了有吸引力的替代方案,因为其缺乏MHC限制,能够以癌症类型不可知的方式靶向广泛表达的应激标志物并且具有更多先天样特性5。因此,试图确定在αβT细胞中验证的靠前的基因是否翻译为γδT细胞。在与白血病或胰腺导管腺癌细胞共温育之后,观察到来自用排序靠前的基因转导的γδT细胞的IL-2和IFNγ分泌增加(图5H、图15L-图15P)。因此,筛选出的排序靠前的基因可以作用于信号传导通路,所述信号传导通路甚至在高度分化的T细胞亚群之间也是保守的,这突出了其在癌症免疫疗法中的广泛适用性。
讨论
总之,在原代人T细胞中开发了基因组规模的功能获得筛选,其中以大规模平行的方式检测了近12,000个全长基因对TCR驱动的增殖的效应。据了解,先前公开的最大规模的原代T细胞的功能获得研究涉及36个构建体,包含全长基因和合成受体35。该方法依赖于通过供体DNA和Cas9介导的靶向插入物进行构建体递送。虽然使用供体DNA进行靶基因递送允许在构建体设计方面具有更大的灵活性,具体地对于工程化合成受体,但所述方法在成本和复杂性方面比在此使用的慢病毒文库更难扩展和获得。因此,基于ORF的功能获得筛选很容易应用于过多的T细胞表型和环境,并且其提供了临床翻译的机会。事实上,所有FDA批准的CAR疗法已经依赖于CAR转基因的慢病毒或逆转录病毒整合,并且因此在该系统中添加ORF不会对制造或调节造成重大挑战。使用在输注之前递送至CAR T细胞的编码ORF的mRNA是另一种翻译途径,具体地如果对特定ORF的作用模式存在安全顾虑。
功能获得筛选有可能揭示被严格控制、被限制在特定发育阶段或仅在某些情况下表达的调节因子。如本文所示,LTBR通常不存在于淋巴来源的细胞中,但是,由于完整的信号传导通路,当引入T细胞时可以发挥合成作用。虽然其它TNFRSF成员的组成型激活可能导致类似的表型,但区别LTBR的特征之一(并且似乎导致其富集,但不是筛选中的其它TNFRSF成员的富集)是自分泌环的形成,由此受体和其配体存在于同一细胞中。特别值得注意的是,LTBR的表达促进了IL-2的分泌,因为这种细胞因子仅由T细胞产生,并且不是由内源性表达LTBR的细胞类型产生。除了促进细胞因子分泌之外,LTBR的过表达促进了干性(TCF1的表达)和减少了激活诱导的细胞凋亡,以及提供了一定程度的保护来对抗T细胞耗竭的表型和功能标志,所有这些是内源性表达LTBR的细胞类型无法概括的特征。先前在细胞系中过表达LTBR的工作表明,LTBR具有促凋亡作用36,与在原代T细胞中观察到的表型形成直接对比。转录和蛋白质水平的分析揭示,LTBR驱动典型和非典型NF-κB通路两者的组成型激活。然而,使用表观基因组分析和基于CRISPR的功能扰动,显示出LTBR表达导致的表型和功能变化主要是通过典型NF-κB通路的激活来介导的,而非典型通路的变化对于观察到的表型可能不是必需的,这与内源性表达LTBR37的细胞中的非典型NF-κB激活的公认的作用形成对比。
在许多研究中,基因过表达已用于CAR T细胞疗法的临床前增强。例如,用如IL-12或IL-18等细胞因子武装CAR T细胞,所述细胞因子通常不由T细胞产生,但已知当由其它类型的细胞分泌时改进T细胞的功能,显示出改进其抗肿瘤活性38,39。值得注意的是,先前的研究发现,CAR T细胞耗竭可以通过由RNA-seq鉴定为在耗竭的细胞40中特异性地耗竭的转录因子的c-JUN的过表达来缓解。使全基因组功能获得筛选适应相关免疫疗法模型的未来研究将导致用于对合成细胞疗法进行工程化的高级靶标选择,所述合成细胞疗法可以克服免疫抑制肿瘤微环境并根除既定的癌症。
实例3:改进的CAR实体瘤应答
已经显示,在B细胞白血病的背景下,LTBR和在筛选中鉴定的其它几个排序靠前的基因(ORF,开放阅读框)增强了抗CD19 CAR的抗肿瘤应答。本文中测试了在胰腺癌的情况下,结合两种经临床测试的抗间皮素CAR(使用4-1BB或CD28共刺激结构域)是否可以看到类似的活性改进。测试了共表达CAR和ORF的T细胞对抗Capan-2和BxPC3,所述Capan-2是表达高水平间皮素CAR靶标的胰腺癌细胞系,所述BxPC3是表达低水平间皮素的胰腺癌细胞系(图16A)。序列表中提供了三顺反子载体的序列(图16A中提供了示意图):
SS1-28-z+LTBR蛋白:SEQ ID NO:11
SS1-28-z+LTBR DNA:SEQ ID NO:12
SS1-BB-z+LTBR蛋白:SEQ ID NO:13
SS1-BB-z+LTBR DNA:SEQ ID NO:14
在过夜共温育之后,确定当与任一CAR(41BB或CD28)一起用于抗间皮素高细胞系Capan-2时,除了一个测试的ORF(即,AHNAK、BATF、IFNL2、IL12B和LTBR)之外,所有测试的ORF促进了IFNγ的抗原特异性分泌(图16B)。在促进IL-2分泌方面,观察到当使用LTBR并且在较小程度上使用AHNAK时,与阴性(tNGFR)对照相比有显著的改进(图16C)。在针对间皮素低系BxPC3的反应性方面,主要在过表达IL12B或LTBR的T细胞中观察到相对于阴性对照的改进(图16D)。
细胞因子分泌是产生抗肿瘤应答的方面中的一个方面,另一个方面是直接细胞毒性。因此,测试了共表达靠前的基因的CAR T细胞杀伤GFP+Capan2或BxPC3细胞的能力(图16E、图16F)。鉴于细胞因子分泌的改进,过表达测试的前六个基因(包含GPD1)中任何一个基因的CAR T细胞所表现出的针对间皮素高Capan-2的细胞毒性增加,也观察到针对BxPC3细胞的细胞毒性增加。因此,得出结论,在筛选中鉴定的排序靠前的基因(包含但不限于AHNAK、BATF、GPD1、IFNL2、IL12B和LTBR)可以在不同的癌症类型(包含如B细胞白血病等液体肿瘤和如胰腺癌等实体瘤)中以及在不同的靶抗原密度(间皮素高和间皮素低细胞系)下使用不同的共刺激结构域(CD28或4-1BB)增强不同CAR(先前显示的抗CD19,此处显示的抗间皮素)的反应性。
实例4:改进TCR在实体瘤中的活性
T细胞疗法可以依赖于使用CAR或TCR将细胞重定向到给定的肿瘤靶标。前者的优点是能够靶向不同患者的肿瘤,而不考虑其HLA单体型,而后者也可以靶向细胞内的抗原(因为来自所有细胞蛋白质的表位由HLA分子取样并展示在其上)。本文中使用了针对来自NY-ESO-1的表位的临床上测试的TCR,所述表位通常在许多癌症组织学中表达,包含但不限于黑色素瘤、多发性骨髓瘤、肉瘤、肺癌。由于大小限制,将TCR和基因(ORF,开放阅读框)递送至两个单独的慢病毒上,用于共转导T细胞(图17A)。然后,使用嘌呤霉素(仅用ORF慢病毒转导的T细胞将存活)并使用基于抗体的NY-ESO-1 TCR阳性细胞的选择(在存在达沙替尼以预防T细胞激活并且因此在选择期间预防激活诱导的细胞死亡)来选择双转导的T细胞。
然后,测试了针对HLA-A2+NY-ESO-1+黑色素瘤细胞系A375的经工程化的CD8+T细胞。大多数测试的基因增加细胞因子IFNγ和IL2中的一者或两者的分泌(图17B、图17C)。还测量了针对A375细胞的直接细胞毒性,并证明所有测试的基因显示的细胞毒性比共表达阴性对照基因tNGFR的TCR转导的T细胞显示的细胞毒性优越(图17D)。因此,得出结论,在筛选中鉴定的排序靠前的基因(包含但不限于AHNAK、BATF、GPD1、IFNL2、IL12B和LTBR)可以增强用癌症特异性TCR工程化的T细胞的反应性。
实例5:LTBR共递送改进体内抗CD19 4-lBB-z CAR活性。
先前已经表明,在同一慢病毒载体上共递送LTBR作为抗CD19 CAR在体外产生优越的抗肿瘤活性(Legut等人,《自然》2022)。本文中测试了抗CD19 CAR(FMC6.3scFv,CD8柄和跨膜结构域,4-1BB和CD3z信号传导结构域:19-BB-z)在有或没有LTBR的情况下,在免疫受损(NSG)小鼠弥散性白血病模型Nalm6中的功效(图22A)。用未经转导的T细胞(CD4和CD8,1:1比率)处理的小鼠在肿瘤接种后平均存活19天,而用共表达无关基因tNGFR的CAR T细胞处理的小鼠的存活期延长至平均23天(比未经转导的T细胞增加20%)。相比之下,用共表达LTBR的CAR T细胞处理的小鼠存活了31天的中值(比未经转导的T细胞增加63%并且比对照CAR T细胞增加35%)(图22B)。此外,与对照CAR T细胞相比,LTBR CAR T细胞显著降低了经处理的小鼠的肿瘤负荷(图22C)。最后,在用任一CAR T细胞产物处理的小鼠中没有观察到特异性毒性,这通过终止时的大体病理学检查来确定的;观察到的体重减轻对于该模型是典型的,并且是由于肿瘤负荷。与LTBR CAR T细胞的改进的抗肿瘤功效相一致,与未经转导的或对照CAR T细胞相比,用LTBR CAR T细胞处理的小鼠体重减轻显著延迟(图22D)。
实例6:LTBR共递送改进抗CD19 4-lBB-z CAR在不存在IL2的情况下的存活率,但不导致白血病转化。
先前已经表明,LTBR促进T细胞增殖并减少凋亡(Legut等人,《自然(Nature)》2022)。然而,组成型引入能够诱导T细胞增殖/凋亡的逃逸的基因增加了恶性转化的可能性。为了测试LTBR是否可以在缺乏细胞因子的情况下允许T细胞存活和/或增殖,按照标准方案,在没有任何细胞因子或有外源性IL2的培养基中培养用CAR+LTBR或对照基因tNGFR转导的T细胞。tNGFR和LTBR转导的CAR T细胞的两个群体在IL2退出之后经历了快速细胞死亡(图23)。在初始阶段,在不存在IL2的情况下,LTBR CAR T细胞比对照CAR T细胞存活得更好,这与LTBR的抗凋亡效应一致,然而,在实验过程中,两种T细胞类型达到了活力的完全丧失,没有任何证据表明生长出IL2非依赖性的、潜在恶性转化的T细胞群体。因此,得出结论,组成型LTBR表达不会引起经转导的T细胞的恶性转化。
实例7:LTBR表型不依赖于所用的培养基。
用于研究或临床应用的T细胞的离体扩增的细胞培养基的组合物可以对T细胞表型、功能和临床功效产生重大影响(Sarah MacPherson等人,临床相关的T细胞扩增培养基激活与细胞功能不偶联的不同代谢程序(Clinically relevant T cell expansion mediaactivate distinct metabolic programs uncoupled from cellular function),《分子疗法:方法与临床发展(Molecular Therapy-Methods&Clinical Development)》,第24卷,2022年3月,第380-393页)。在这里,想确定培养基组合物是否影响T细胞中LTBR表达诱导的表型。因此,在五种不同类型的培养基(均补充有10ng/ml rhIL2)中培养新鲜分离的T细胞,如下所列:
1-AIM V+5% FBS+10mM HEPES(Lynn等人,CAR T细胞中的c-Jun过表达诱导耗竭抗性(c-Jun overexpression in CAR T cells induces exhaustion resistance),《自然》,576,293-300(2019年12月))
2-AIM V+5%人血清(Gurusamy等人,多表型CRISPR-Cas9筛选鉴定p38激酶为过继性免疫疗法的靶标(Multi-phenotype CRISPR-Cas9 Screen Identifies p38 Kinase asaTarget for Adoptive Immunotherapies),《癌细胞(Cancer Cell.)》2020年6月8日;37(6):818-833.e9)
3-RPMI 1640+10% FBS+10mM HEPES+1mM丙酮酸钠+1X非必需氨基酸(Legut等人,CRISPR介导的TCR替代产生优越的抗癌转基因T细胞(CRISPR-mediated TCR replacementgenerates superior anticancer transgenic T cells),《血液(Blood.)》2018年1月18日;131(3):311-322)
4-ImmunoCult-XF T细胞扩增培养基(Legut等人,T细胞增殖的合成驱动因子的基因组规模的筛选(A genome-scale screen for synthetic drivers of T cellproliferation),《自然》2022年3月;603(7902):728-735)
5-X-Vivo 15+5% FBS+50μMβ-巯基乙醇+10mM N-乙酰-L-半胱氨酸(Shifrut等人,原代人T细胞的全基因组CRISPR筛选揭示了免疫功能的关键调节因子(Genome-wideCRISPR Screens in Primary Human T Cells Reveal Key Regulators of ImmuneFunction),《细胞》2018年12月13日;175(7):1958-1971.el5)
在慢病毒转导、选择和培养之后,再刺激T细胞,并测量分泌的细胞因子IFNγ(图24A)和IL2(图24B)的量(从左到右为未经处理的、tNGFR、LTBR)。正如之前示出的,LTBR过表达显著增加了刺激后分泌的细胞因子水平。虽然细胞因子的绝对量在不同的培养基组合物之间不同,但在几乎所有测试的情况下,LTBR过表达增加了细胞因子水平,高于用无关基因tNGFR观察到的水平(图24C)。
T细胞中的LTBR过表达的另一个标志是包含CD54和CD74的数百种基因的表达的变化,所述基因在蛋白质水平上是可检测的。与之前示出的数据一致,观察到在所有测试的培养基中,LTBR T细胞中的CD54和CD74表达增加到类似的程度(图24D)。LTBR T细胞还显示出对中央记忆表型的优先富集,这与经工程化的T细胞产物的改进的临床功效相关,这种对中央记忆表型的偏好在除了一种测试的培养基类型之外的所有测试的培养基类型中的LTBRT细胞内观察到(图24E)。最后,LTBR缓解T细胞耗竭的标志,包含抑制性检查点PD-1的表达。在所有测试的培养基组合物中,观察到表达LTBR的T细胞中的PD 1水平显著降低(图24F)。
因此,得出结论,虽然不同的培养基组合物确实影响T细胞表型和功能应答,但无论使用何种培养基,LTBR过表达可以改进临床上相关的T细胞表型。
实例8:LTBR表型不由其它TNFRSF成员进行表型复制。
LTBR是被称为肿瘤坏死因子受体超家族(TNFRSF)的蛋白家族的成员。TNFRSF成员被认为通过类似的分子机制和通路发挥作用(Dostert等人,配体和受体的TNF家族:免疫系统内外的通讯模块(The TNF Family of Ligands and Receptors:CommunicationModules in the Immune System and Beyond),《生理学评论(Physiol Rev)》99:115-160,2019,2018年10月电子出版),因此,希望确定用在T细胞中的LTBR过表达观察到的表型是否可以通过过表达其它TNFRSF成员来复制。在来自健康供体的CD4和CD8 T细胞中克隆并过表达了13个TNFRSF成员以及LTBR和无关基因tNGFR。不管内源性表达水平如何,在测试的TNFRSF成员中实现了高水平的过表达(图25A)。然后,刺激经转导的T细胞并在4天之后观察T细胞增殖。如之前所展示的,LTBR驱动CD4和CD8 T细胞两者的T细胞增殖显著增加(图25B)。在测试的其它TNFRSF的情况下,仅观察到CD4增殖的轻微(最多)增加,而CD8增殖没有增加。LTBR过表达的另一个标志是刺激之后的细胞因子分泌增加。然而,在测试的14个TNFRSF成员中,仅LTBR诱导CD4和CD8两者中的IFNγ分泌的显著增加(图25C)。因此,得出结论,与其它TNFRSF成员相比,LTBR在T细胞中过表达时驱动独特的程序。
实例9:LTBR表型不由NFκB通路的组成型活性阳性调节因子的过表达进行表型复制。
之前表明LTBR表型依赖于NFκB通路的组成型激活。因此,试图通过递送NFκB通路中的关键介体的组成型活性变体,具体地以下突变体来复制在过表达LTBR的T细胞中观察到的表型:
·AKT1(Kim等人,罕见癌症变体的系统功能询问鉴定致癌等位基因(SystematicFunctional Interrogation of Rare Cancer Variants Identifies OncogenicAlleles),《癌症发现(Cancer Discov.)》2016年7月;6(7):714-26.doi:10.1158/2159-8290.CD-16-0160.电子版2016年5月4日)
·IKK2(Mercurio等人,IKK-1和IKK-2:细胞因子激活的IκB激酶对NF-κB激活至关重要(IKK-1and IKK-2:cytokine-activated IkappaB kinases essential for NF-kappaB activation),《科学(Science)》,1997年10月31日;278(5339):860-6.doi:10.1126/science.278.5339.860)
·STAT5(Richter等人,非典型H3K79me2依赖性通路促进MLL重排白血病的存活(Non-canonical H3K79me2-dependent pathways promote the survival of MLL-rearranged leukemia),《E生命(Elife)》,2021年7月15日;10:e64960.doi:10.7554/eLife.64960.)
·p65(He和Weber,环状GMP依赖性激酶对NF-κB蛋白的磷酸化作用(Phosphorylation of NF-kappaB proteins by cyclic GMP-dependent kinase.)NF-κB激活的非典型通路(A noncanonical pathway to NF-kappaB activation),《欧洲生物化学杂志(Eur J Biochem.)》2003年5月;270(10):2174-85.doi:10.1046/j.l432-1033.2003.03574.x)
·NFKB1,p50的加工活性变体(Ballard等人,人NF-κB的65-kDa亚基用作有效的转录激活因子和v-Rel介导的阻遏作用的靶标(The 65-kDa subunit of human NF-kappa Bfunctions as a potent transcriptional activator and a target for v-Rel-mediated repression),《美国国家科学院院刊(Proc Natl Acad Sci USA.)》1992年3月1日;89(5):1875-9.doi:10.1073/pnas.89.5.1875.)。
在转导和选择原代人CD4和CD8 T细胞后两周,观察了LTBR过表达表型的标志:刺激后细胞因子的分泌增加和静息T细胞中的所选细胞表面标志物的表达增加。在细胞因子分泌方面,观察到CD8中的IFNγ显著增加,但CD4细胞、表达AKT1或STAT5的T细胞以及表达IKK2的T细胞中的IFNγ不显著增加(图26A)。相反,T细胞中的AKT1表达并没有增加IL2的水平,而STAT5和IKK2对其有轻微增加(图26B)。在增强细胞因子分泌方面,没有一个测试的基因变体超过LTBR。
LTBR的过表达已经显示出影响T细胞中数百种基因的表达,包含CD54、CD74、CD70和MHC-II水平的增加,这可以在蛋白质水平上检测到。STAT5和IKK2在较小程度上过表达导致这三种标志物的水平显著增加,在一些情况下超过了LTBR的水平(图26C-F)。总的来说,NFκB通路中关键介体的一些组成型活性变体的过表达可以导致与LTBR的表型相似的表型,但没有一种测试的蛋白质可以完全复制T细胞中的LTBR诱导的程序的呼吸和强度(图26G)。
实例10:LTBR表型不能通过敲除NFκB通路的阴性调节因子来进行表型复制,但可以通过所述敲除来进一步增强。
之前表明LTBR表型依赖于NFκB通路的组成型激活。因此,试图通过敲除NFκB通路的两个关键抑制剂,即TNFAIP3(也被称为A20)和NFKBIA(也被称为IκBα),复制在过表达LTBR的T细胞中观察到的表型。为了做到这一点,将LTBR或tNGFR与靶向TNFAIP3、NFKBIA(各自3个独立的sgRNA)或非靶向(NT)sgRNA(2个sgRNA)的sgRNA(在同一载体上)一起慢病毒递送至原代CD4 T细胞。在慢病毒整合之后,用Cas9蛋白电穿孔T细胞,如之前所描述的(Legut等人,《自然》2022)。
在转导和选择原代人CD4 T细胞后两周,观察了LTBR过表达表型的标志:刺激后细胞因子的分泌增加和静息T细胞中的所选细胞表面标志物的表达增加。在细胞因子分泌方面,敲除TNFAIP3或NFKBIA对tNGFR T细胞几乎没有任何效应;相反,敲除LTBR T细胞中的任一基因都稳健地增加IFNγ(图27A)和IL2(图27B)的分泌。在静息T细胞中观察到非常类似的表型,观察到在LTBR过表达时上调的代表性基因(CD54、CD74、CD70和MHC-II)的蛋白表达,虽然敲除tNGFR细胞中的TNFAIP3或NFKBIA不会导致所述基因表达的有意义的变化,但其在LTBR T细胞中进一步上调(图27C-F)。综上所述,敲除NFκB通路的阴性调节因子本身不能复制在LTBR过表达中看到的表型,但是当LTBR存在时,去除这些阴性调节因子可以进一步增强LTBR效应(图27G)。
表4:sgRNA序列。
实例11:LTBR转基因在慢病毒CAR表达内的定位影响表达水平和功能应答。
先前,观察到LTBR从与CAR和嘌呤霉素抗性基因(CAR-puro-LTBR)相同的三顺反子载体中共表达,其表达水平低于从双顺反子载体(LTBR-puro)表达的水平(Legut等人,《自然》2022)。因此,试图通过去除嘌呤霉素抗性基因并检测载体(CAR-LTBR或LTBR-CAR)内的LTBR的不同定位来改进CAR T细胞中的LTBR表达(图28A)。为了控制载体结构变化可能导致的转导效率和CAR表达水平,还产生了包含替代LTBR的无关基因tNGFR的载体。序列表中公开了所用的载体。
19BBz-P2A-puro-T2A-tNGFR-SEQ ID NO:25和26
19BBz-P2A-puro-T2A-LTBR-SEQ ID NO:27和28
1928z-P2A-puro-T2A-tNGFR-SEQ ID NO:29和30
1928z-P2A-puro-T2A-LTBR-SEQ ID NO:31和32
19BBz-P2A-tNGFR-SEQ ID NO:33和34
1928z-P2A-tNGFR-SEQ ID NO:35和36
19BBz-P2A-LTBR-SEQ ID NO:37和38
1928z-P2A-LTBR-SEQ ID NO:39和40
tNGFR-P2A-19BBz-SEQ ID NO:41和42
tNGFR-P2A-1928z-SEQ ID NO:43和44
LTBR-P2A-19BBz-SEQ ID NO:45和46
LTBR-P2A-1928z-SEQ ID NO:47和48
EFS-tNGFR PGK-puro-SEQ ID NO:49
(无启动子)tNGFR PGK-puro-SEQ ID NO:50
NFAT-tNGFR PGK-puro-SEQ ID NO:51
NFκB-tNGFR PGK-puro-SEQ ID NO:52
APl-tNGFR PGK-puro-SEQ ID NO:53
EFS-LTBR PGK-puro-SEQ ID NO:54
(无启动子)LTBR PGK-puro-SEQ ID NO:55
NFAT-LTBR PGK-puro-SEQ ID NO:56
NFκB-LTBR PGK-puro-SEQ ID NO:57
AP1-LTBR PGK-puro-SEQ ID NO:58
观察转基因(LTBR或tNGFR)的表达,相对于对应的CAR-puro-基因载体归一化,观察到去除嘌呤霉素抗性基因(CAR-基因)对LTBR水平只有轻微的效应,而对tNGFR水平有强得多的效应;相反,将基因定位在CAR(基因-CAR)的上游导致LTBR而非tNGFR的强得多的表达(图28B)。
为了评估转基因表达水平的变化的功能影响,将用不同CAR载体工程化的T细胞暴露于表达抗原的靶细胞,并测量对靶接合作出应答而分泌的细胞因子的量。总体而言,在所有测试的系统(CAR中的4-1BB或CD28共刺激;CD4或CD8 T细胞;IL2或IFNγ分泌)中,在LTBR表达水平与CAR功能应答之间存在明显的剂量依赖性,其中CAR-puro-LTBR显示最低应答,CAR-LTBR显示中等应答,并且LTBR-CAR显示最高显示(图28C-E)。有趣的是,在tNGFR的情况下,CAR-tNGFR载体导致最强应答,而CAR-puro-tNGFR与tNGFR-CAR之间不存在有意义的差异。总之,在LTBR和tNGFR转基因两者的情况下,CAR-基因载体对靶细胞产生的功能应答比CAR-puro-基因载体对靶细胞产生的功能应答更强,这可能是由于CAR表达水平的增加。相反,在基因-CAR设计中,仅LTBR转基因而非tNGFR显示出的功能应答比CAR-puro-基因载体显示出的功能应答显著增加(图28F)。可能的解释是CAR-puro-基因与基因-CAR之间的CAR表达是类似的(在前一种情况下是由于转基因的大小增加,在后一种情况下是由于载体中的CAR定位),并且在两种情况下低于CAR-基因载体中的CAR表达。在LTBR的情况下,来自基因-CAR载体中较高LTBR表达的收益抵消了总体较低CAR表达的丧失。
实例12:LTBR的诱导型表达。
控制转基因表达为用于改进经工程化的T细胞疗法的安全性质提供了有吸引力的可能性。具体地,可以设想系统,通过所述系统,LTBR(或其它增效剂转基因)仅在T细胞遇到其靶细胞并通过抗原受体(CAR或TCR)接收信号之后才表达;并且一旦靶细胞被清除并且抗原受体不再传输信号,增效剂基因表达就会衰减回背景水平。为了测试这一点,设计了通过诱导型启动子驱动LTBR(或对照基因tNGFR)表达的慢病毒载体,所述诱导型启动子由T细胞刺激后上调的转录因子激活:NFAT、NFκB和AP1(全部来自Jutz等人,三参数T细胞报告系中的共刺激和共抑制的评估:NF-κB、NFAT和AP-1的同时测量(Assessment of costimulationand coinhibition in a triple parameter T cell reporter line:Simultaneousmeasurement of NF-κB,NFAT and AP-1),《免疫学方法杂志(J Immunol Methods)》,2016年3月;430:10-20.doi:10.1016/j.jim.2016.01.007.电子版2016年1月15日)。作为阳性对照,包含通过强组成型启动子(EFS)驱动转基因表达的载体;而对于阴性对照,设计了在转基因上游缺少启动子的载体。所有载体还含有由单独的启动子驱动的选择标志物(嘌呤霉素抗性),以允许完全选择经转导的细胞,而不管测试的启动子如何(图29A)。
在分离、转导和选择原代人T细胞(CD4和CD8)后十四天,用抗CD3/CD28抗体激活用每个载体转导的T细胞。再刺激后24小时(图29B-D)、48小时和72小时(数据未显示),测量了转基因LTBR和tNGFR的表达,并将其与作为对照的未经刺激的T细胞的表达进行比较。在NFAT和AP1启动子的情况下,无论有无刺激,都没有观察到有意义的转基因表达。在组成型启动子EFS的情况下,观察到在刺激之后的转基因(LTBR和tNGFR)表达的增加,推测是由于激活的/分裂T细胞中的转录和翻译速率的增加。有趣的是,NFκB启动子在静息和经刺激的T细胞两者中驱动的LTBR表达比组成型EFS启动子在静息和经刺激的T细胞两者中驱动的LTBR表达更强(图29B),这可以通过LTBR对NFκB通路的组成型激活来解释(Legut等人,《自然》2022)。相反,只有在刺激之后,NFκB启动子才表达tNGFR(图29C)。因此,我们确定NFκB启动子可以用于T细胞中的诱导型、刺激依赖性的转基因表达,但不能与如LTBR等激活的NFκB转基因联合使用(图29D)。对于LTBR,NFκB启动子提供了有吸引力的EFS启动子的替代方案,因为其可以驱动比EFS更高的转基因表达。
参考文献
1.Abramson,J.S.等人Transcend NHL 001:用CD19导向的CAR T细胞产物JCAR017进行免疫疗法导致复发性或难治性B细胞非霍奇金淋巴瘤的高完全应答率(Transcend NHL001:immunotherapy with the CD19-directed CAR T-cell product JCAR017results inhigh complete response rates in relapsed or refractory B-cell non-Hodgkinlymphoma.)《血液(Blood)》128,4192-4192(2016)。
2.Shifrut,E.等人原代人T细胞的全基因组CRISPR筛选揭示了免疫功能的关键调节因子(Genome-wide CRISPR screens in primary human T cells reveal keyregulators of immune function.)《细胞(Cell)》175,1958-1971(2018)。
3.Dong,M.B.等人在CD8 T细胞中使用基因组规模的体内CRISPR筛选的系统性免疫疗法靶标发现(Systematic immunotherapy target discovery using genome-scalein vivo CRISPR screens in CD8 T cells.)《细胞》178,1189-1204(2019)。
4.Chen,Z.等人体内CD8+ T细胞CRISPR筛选揭示了Fli1在感染和癌症中的控制(In vivo CD8+ T cell CRISPR screening reveals control by Fli1 in infectionand cancer.)《细胞》184,1262-1280(2021)。
5.Kabelitz,D.,Serrano,R.,Kouakanou,L.,Peters,C.和Kalyan,S.用γδT细胞进行癌症免疫疗法:还有许多路要走(Cancer immunotherapy withγδT cells:manypaths ahead of us.)《细胞与分子免疫(Cell.Mol.Immunol.)》17,925-939(2020)。
6.Munshi,N.C.等人艾基维仑赛治疗复发性和难治性多发性骨髓瘤(Idecabtagene vicleucel in relapsed and refractory multiple myeloma.)《新英格兰医学杂志(N.Engl.J.Med.)》384,705-716(2021)。
7.Fraietta,J.A.等人慢性淋巴细胞白血病对CD19嵌合抗原受体(CAR)T细胞疗法的应答和抗性的决定簇(Determinants of response and resistance to CD19 chimericantigen receptor(CAR)T cell therapy of chronic lymphocytic leukemia.)《自然医学(Nat.Med.)》24,563-571(2018)。
8.Singer,M.等人肿瘤浸润性T细胞中未与激活偶联的功能障碍的独特基因模块(Adistinct gene module for dysfunction uncoupled from activation in tumor-infiltrating T cells.)《细胞》166,1500-1511(2016)。
9.Gurusamy,D.等人多表型CRISPR-Cas9筛选鉴定p38激酶为过继性免疫疗法的靶标(Multi-phenotype CRISPR-Cas9 screen identifies p38 kinase as a target foradoptive immunotherapies.)《癌细胞(Cancer Cell)》37,818-833(2020)。
10.Legut,M.,Dolton,G.,Mian,A.A.,Ottmann,O.G.和Sewell,A.K.CRISPR介导的TCR替代产生优越的抗癌转基因T细胞(CRISPR-mediated TCR replacement generatessuperior anticancer transgenic T cells.)《血液》131,311–322(2018)。
11.Ren,J.等人多重基因组编辑以产生对PD1抑制具有抗性的通用CAR T细胞(Multiplex genome editing to generate universal CAR T cells resistant to PD1inhibition.)《临床癌症研究(Clin.Cancer Res.)》23,2255-2266(2017)。
12.Wagner,D.L.等人成年人群体中酿脓链球菌Cas9反应性T细胞的高患病率(High prevalence of Streptococcus pyogenes Cas9-reactive T cells within theadult human population.)《自然医学》25,242-248(2019)。
13.Wu,X.等人哺乳动物细胞中CRISPR核酸内切酶Cas9的全基因组结合(Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells.)《自然生物技术(Nat.Biotechnol.)》32,670-676(2014)。
14.Sack,L.M.等人增殖控制中深刻的组织特异性是癌症驱动因子和非整倍体模式的基础(Profound tissue specificity in proliferation control underliescancer drivers and aneuploidy patterns.)《细胞》173,499-514(2018)。
15.Yuan,J.等人CTLA-4阻断增强转移性黑色素瘤患者的多功能NY-ESO-1特异性T细胞应答,具有临床益处(CTLA-4blockade enhances polyfunctional NY-ESO-1specificT cell responses in metastatic melanoma patients with clinical benefit.)《美国国家科学院院刊(Proc.Natl Acad.Sci.USA)》105,20410-20415(2008)。
16.Sommermeyer,D.等人源自定义的CD8+和CD4+亚群的嵌合抗原受体修饰的T细胞赋予了体内优越的抗肿瘤反应性(Chimeric antigen receptor-modified T cellsderived from defined CD8+and CD4+subsets confer superior antitumor reactivityin vivo.)《白血病(Leukemia)》30,492-500(2016)。
17.Fischer,A.M.,Katayama,C.D.,Pagès,G.,Pouysségur,J.和Hedrick,S.M.Erkl和Erk2在T细胞发育的多个阶段中的作用(The role of Erkl and Erk2 inmultiple stages of T cell development.)《免疫学(Immunity)》23,431-443(2005)。
18.Lipp,A.M.等人Lck介导Jurkat T细胞中从CD59到TCR/CD3通路的信号传输(Lck mediates signal transmission from CD59 to the TCR/CD3 pathway in JurkatT cells.)《公共科学图书馆综合(PLoS One)》9,e85934(2014)。
19.Ma,X.等人白介素-23工程化改进实体瘤中的CAR T细胞功能(Interleukin-23engineering improves CAR T cell function in solid tumors.)《自然生物技术》38,448-459(2020)。
20.Seo,H.等人BATF和IRF4协同对抗肿瘤浸润性CAR T细胞的耗竭(BATF andIRF4 cooperate to counter exhaustion in tumor-infiltrating CAR T cells.)《自然免疫学(Nat.Immunol.)》22,983-995(2021)。
21.Jamah,A.等人使用CD4-和CD8-靶向的慢病毒载体的高效和选择性CAR基因转移(Highly efficient and selective CAR-gene transfer using CD4-and CD8-targeted lentiviral vectors.)《分子疗法方法临床发展(Mol.Ther.MethodsClin.Dev.)》13,371-379(2019)。
22.Stoeckius,M.等人单细胞中表位和转录组的同时测量(Simultaneousepitope and transcriptome measurement in single cells.)《自然方法(Nat.Methods)》14,865-868(2017)。
23.Mimitou,E.P.等人单细胞中蛋白质、转录组、克隆型和CRISPR扰动的多重检测(Multiplexed detection of proteins,transcriptomes,clonotypes and CRISPRperturbations in single cells.)《自然方法》16,409-412(2019)。
24.Gil-Yarom,N.等人CD74是新的转录调节因子(CD74 is a noveltranscription regulator.)《美国国家科学院院刊》114,562-567(2017)。
25.Ataide,M.A.等人BATF3对CD8+ T细胞记忆进行编程(BATF3 programs CD8+ Tcell memory.)《自然免疫学》21,1397-1407(2020)。
26.Katagiri,T.,Kameda,H.,Nakano,H.和Yamazaki,S.AP-1转录因子JunB对T细胞分化的调节(Regulation of T cell differentiation by the AP-1transcriptionfactor JunB.)《免疫医学(Immunol.Med.)》44,197-203(2021)。
27.Zhao,X.,Shan,Q.和Xue,H.-H.T细胞免疫中的TCF1:拓宽的前沿(TCF1 inTcell immunity:a broadened frontier.)《免疫学自然评论(Nat.Rev.Immunol)》,https://doi.org/10.1038/s41577-021-00563-6(2021)。
28.Sudhamsu,J.等人LTα1β2对LTβR的二聚化对于信号转导是必要和充分的。(Dimerization of LTβR by LTα1β2is necessary and sufficient for signaltransduction.)《美国国家科学院院刊》110,19896-19901(2013)。
29.Li,C.等人淋巴毒素-β受体和CD40对肿瘤坏死因子受体相关因子(TRAF)介导的信号传导的结构上不同的识别基序(Structurally distinct recognition motifs inlymphotoxin-βreceptor and CD40 for tumor necrosis factor receptor-associatedfactor(TRAF)-mediated signaling.)《生物化学杂志(J.Biol.Chem.)》278,50523-50529(2003)。
30.Wu,M.-Y.,Wang,P.-Y.,Han,S.-H.和Hsieh,S.-L.淋巴毒素-β受体的胞质结构域介导HeLa细胞的细胞死亡(The cytoplasmic domain of the lymphotoxin-βreceptormediates cell death in HeLa cells.)《生物化学杂志》274,11868-11873(1999)。
31.Macian,NFAT蛋白:T细胞发育和功能的关键调节因子(NFAT proteins:keyregulators of T-cell development and function.)《免疫学自然评论》5,472-484(2005)。
32.Dejardin,E.等人淋巴毒素-β受体通过两种NF-κB通路诱导不同的基因表达模式(The lymphotoxin-βreceptor induces different patterns of gene expressionvia two NF-κBpathways.)《免疫学》17,525-535(2002)。
33.Saoulli,K.等人4-1BB配体对静息T细胞的CD28非依赖性、TRAF2依赖性共刺激(CD28-independent,TRAF2-dependent costimulation of resting T cells by 4-1BBligand.)《实验医学杂志(J.Exp.Med.)》187,1849-1862(1998)。
34.Thommen,D.S.和Schumacher,T.N.癌症中的T细胞功能障碍(T celldysfunction in cancer.)《癌细胞》33,547-562(2018)。
35.Roth,T.L.等人细胞免疫疗法的基因组工程的汇集的敲入靶向(Pooledknockin targeting for genome engineering of cellular immunotherapies.)《细胞》181,728-744(2020)。
36.VanArsdale,T.L.等人淋巴毒素-受体信号传导复合物:肿瘤坏死因子受体相关因子3募集在细胞死亡和核因子B的激活中的作用(Lymphotoxin-receptor signalingcomplex:role of tumor necrosis factor receptor-associated factor 3recruitmentin cell death and activation of nuclear factor B.)《美国国家科学院院刊》94,2460-2465(1997)。
37.Yilmaz,Z.B.等人NF-κB p100-p105模块的定量解剖和建模揭示了相互依赖的前体蛋白水解(Quantitative dissection and modeling of the NF-κB p100-p105module reveals interdependent precursor proteolysis.)《细胞报告(Cell Rep.)》9,1756-1769(2014)。
38.Hu,B.等人分泌IL-18的人和小鼠CAR T细胞的抗肿瘤免疫的增强(Augmentation of antitumor immunity by human and mouse CAR T cells secretingIL-18.)《细胞报告》20,3025-3033(2017)。
39.Yeku,O.O.,Purdon,T.J.,Koneru,M.,Spriggs,D.和Brentjens,R.J.装甲的CAR T细胞增强抗肿瘤功效并克服肿瘤微环境(Armored CAR T cells enhance antitumorefficacy and overcome the tumor microenvironment.)《科学报告(Sci.Rep.)》7,10541(2017)。
40.Lynn,R.C.等人CAR T细胞中的c-Jun过表达诱导耗竭抗性(c-Junoverexpression in CAR T cells induces exhaustion resistance.)《自然(Nature)》576,293-300(2019)。
41.Schmiedel,B.J.等人遗传多态性对人免疫细胞基因表达的影响(Impact ofgenetic polymorphisms on human immune cell gene expression.)《细胞》175,1701-1715(2018)。
本说明书中引用的所有出版物通过引用并入本文。于2021年6月30日提交的美国临时专利申请第63/217,014号、于2021年12月8日提交的美国临时专利申请第63/287,389号以及于2022年3月15日提交的美国临时专利申请第63/320,101号通过引用并入本文。虽然已经参考特定实施例描述了本发明,但是应当理解,可以在不脱离本发明的精神的情况下进行修改。此类修改旨在落入所附实施例的范围内。
序列表
<110> 纽约基因组中心公司(New York Genome Center, Inc.)
纽约大学(New York University)
<120> 用于改进的免疫治疗的方法和组合物
<130> NYG-LIPP-143.PCT
<150> 63/217,014
<151> 2021-06-30
<150> 63/287,389
<151> 2021-12-08
<150> 63/320,101
<151> 2022-03-15
<160> 59
<170> PatentIn第3.5版
<210> 1
<211> 1308
<212> DNA
<213> 智人(Homo sapiens)
<400> 1
atgctcctgc cttgggccac ctctgccccc ggcctggcct gggggcctct ggtgctgggc 60
ctcttcgggc tcctggcagc atcgcagccc caggcggtgc ctccatatgc gtcggagaac 120
cagacctgca gggaccagga aaaggaatac tatgagcccc agcaccgcat ctgctgctcc 180
cgctgcccgc caggcaccta tgtctcagct aaatgtagcc gcatccggga cacagtttgt 240
gccacatgtg ccgagaattc ctacaacgag cactggaact acctgaccat ctgccagctg 300
tgccgcccct gtgacccagt gatgggcctc gaggagattg ccccctgcac aagcaaacgg 360
aagacccagt gccgctgcca gccgggaatg ttctgtgctg cctgggccct cgagtgtaca 420
cactgcgagc tactttctga ctgcccgcct ggcactgaag ccgagctcaa agatgaagtt 480
gggaagggta acaaccactg cgtcccctgc aaggccgggc acttccagaa tacctcctcc 540
cccagcgccc gctgccagcc ccacaccagg tgtgagaacc aaggtctggt ggaggcagct 600
ccaggcactg cccagtccga cacaacctgc aaaaatccat tagagccact gcccccagag 660
atgtcaggaa ccatgctgat gctggccgtt ctgctgccac tggccttctt tctgctcctt 720
gccaccgtct tctcctgcat ctggaagagc cacccttctc tctgcaggaa actgggatcg 780
ctgctcaaga ggcgtccgca gggagaggga cccaatcctg tagctggaag ctgggagcct 840
ccgaaggccc atccatactt ccctgacttg gtacagccac tgctacccat ttctggagat 900
gtttccccag tatccactgg gctccccgca gccccagttt tggaggcagg ggtgccgcaa 960
cagcagagtc ctctggacct gaccagggag ccgcagttgg aacccgggga gcagagccag 1020
gtggcccacg gtaccaatgg cattcatgtc accggcgggt ctatgactat cactggcaac 1080
atctacatct acaatggacc agtactgggg ggaccaccgg gtcctggaga cctcccagct 1140
acccccgaac ctccataccc cattcccgaa gagggggacc ctggccctcc cgggctctct 1200
acaccccacc aggaagatgg caaggcttgg cacctagcgg agacagagca ctgtggtgcc 1260
acaccctcta acaggggccc aaggaaccaa tttatcaccc atgactga 1308
<210> 2
<211> 435
<212> PRT
<213> 智人
<400> 2
Met Leu Leu Pro Trp Ala Thr Ser Ala Pro Gly Leu Ala Trp Gly Pro
1 5 10 15
Leu Val Leu Gly Leu Phe Gly Leu Leu Ala Ala Ser Gln Pro Gln Ala
20 25 30
Val Pro Pro Tyr Ala Ser Glu Asn Gln Thr Cys Arg Asp Gln Glu Lys
35 40 45
Glu Tyr Tyr Glu Pro Gln His Arg Ile Cys Cys Ser Arg Cys Pro Pro
50 55 60
Gly Thr Tyr Val Ser Ala Lys Cys Ser Arg Ile Arg Asp Thr Val Cys
65 70 75 80
Ala Thr Cys Ala Glu Asn Ser Tyr Asn Glu His Trp Asn Tyr Leu Thr
85 90 95
Ile Cys Gln Leu Cys Arg Pro Cys Asp Pro Val Met Gly Leu Glu Glu
100 105 110
Ile Ala Pro Cys Thr Ser Lys Arg Lys Thr Gln Cys Arg Cys Gln Pro
115 120 125
Gly Met Phe Cys Ala Ala Trp Ala Leu Glu Cys Thr His Cys Glu Leu
130 135 140
Leu Ser Asp Cys Pro Pro Gly Thr Glu Ala Glu Leu Lys Asp Glu Val
145 150 155 160
Gly Lys Gly Asn Asn His Cys Val Pro Cys Lys Ala Gly His Phe Gln
165 170 175
Asn Thr Ser Ser Pro Ser Ala Arg Cys Gln Pro His Thr Arg Cys Glu
180 185 190
Asn Gln Gly Leu Val Glu Ala Ala Pro Gly Thr Ala Gln Ser Asp Thr
195 200 205
Thr Cys Lys Asn Pro Leu Glu Pro Leu Pro Pro Glu Met Ser Gly Thr
210 215 220
Met Leu Met Leu Ala Val Leu Leu Pro Leu Ala Phe Phe Leu Leu Leu
225 230 235 240
Ala Thr Val Phe Ser Cys Ile Trp Lys Ser His Pro Ser Leu Cys Arg
245 250 255
Lys Leu Gly Ser Leu Leu Lys Arg Arg Pro Gln Gly Glu Gly Pro Asn
260 265 270
Pro Val Ala Gly Ser Trp Glu Pro Pro Lys Ala His Pro Tyr Phe Pro
275 280 285
Asp Leu Val Gln Pro Leu Leu Pro Ile Ser Gly Asp Val Ser Pro Val
290 295 300
Ser Thr Gly Leu Pro Ala Ala Pro Val Leu Glu Ala Gly Val Pro Gln
305 310 315 320
Gln Gln Ser Pro Leu Asp Leu Thr Arg Glu Pro Gln Leu Glu Pro Gly
325 330 335
Glu Gln Ser Gln Val Ala His Gly Thr Asn Gly Ile His Val Thr Gly
340 345 350
Gly Ser Met Thr Ile Thr Gly Asn Ile Tyr Ile Tyr Asn Gly Pro Val
355 360 365
Leu Gly Gly Pro Pro Gly Pro Gly Asp Leu Pro Ala Thr Pro Glu Pro
370 375 380
Pro Tyr Pro Ile Pro Glu Glu Gly Asp Pro Gly Pro Pro Gly Leu Ser
385 390 395 400
Thr Pro His Gln Glu Asp Gly Lys Ala Trp His Leu Ala Glu Thr Glu
405 410 415
His Cys Gly Ala Thr Pro Ser Asn Arg Gly Pro Arg Asn Gln Phe Ile
420 425 430
Thr His Asp
435
<210> 3
<211> 1161
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 3
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ile Glu Val Met Tyr Pro
260 265 270
Pro Pro Tyr Leu Asp Asn Glu Lys Ser Asn Gly Thr Ile Ile His Val
275 280 285
Lys Gly Lys His Leu Cys Pro Ser Pro Leu Phe Pro Gly Pro Ser Lys
290 295 300
Pro Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser
305 310 315 320
Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser Lys Arg
325 330 335
Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro
340 345 350
Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe
355 360 365
Ala Ala Tyr Arg Ser Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro
370 375 380
Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly
385 390 395 400
Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro
405 410 415
Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr
420 425 430
Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly
435 440 445
Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln
450 455 460
Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln
465 470 475 480
Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
485 490 495
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Glu Tyr Lys Pro
500 505 510
Thr Val Arg Leu Ala Thr Arg Asp Asp Val Pro Arg Ala Val Arg Thr
515 520 525
Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala Thr Arg His Thr Val Asp
530 535 540
Pro Asp Arg His Ile Glu Arg Val Thr Glu Leu Gln Glu Leu Phe Leu
545 550 555 560
Thr Arg Val Gly Leu Asp Ile Gly Lys Val Trp Val Ala Asp Asp Gly
565 570 575
Ala Ala Val Ala Val Trp Thr Thr Pro Glu Ser Val Glu Ala Gly Ala
580 585 590
Val Phe Ala Glu Ile Gly Pro Arg Met Ala Glu Leu Ser Gly Ser Arg
595 600 605
Leu Ala Ala Gln Gln Gln Met Glu Gly Leu Leu Ala Pro His Arg Pro
610 615 620
Lys Glu Pro Ala Trp Phe Leu Ala Thr Val Gly Val Ser Pro Asp His
625 630 635 640
Gln Gly Lys Gly Leu Gly Ser Ala Val Val Leu Pro Gly Val Glu Ala
645 650 655
Ala Glu Arg Ala Gly Val Pro Ala Phe Leu Glu Thr Ser Ala Pro Arg
660 665 670
Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe Thr Val Thr Ala Asp Val
675 680 685
Glu Val Pro Glu Gly Pro Arg Thr Trp Cys Met Thr Arg Lys Pro Gly
690 695 700
Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val
705 710 715 720
Glu Glu Asn Pro Gly Pro Met Leu Leu Pro Trp Ala Thr Ser Ala Pro
725 730 735
Gly Leu Ala Trp Gly Pro Leu Val Leu Gly Leu Phe Gly Leu Leu Ala
740 745 750
Ala Ser Gln Pro Gln Ala Val Pro Pro Tyr Ala Ser Glu Asn Gln Thr
755 760 765
Cys Arg Asp Gln Glu Lys Glu Tyr Tyr Glu Pro Gln His Arg Ile Cys
770 775 780
Cys Ser Arg Cys Pro Pro Gly Thr Tyr Val Ser Ala Lys Cys Ser Arg
785 790 795 800
Ile Arg Asp Thr Val Cys Ala Thr Cys Ala Glu Asn Ser Tyr Asn Glu
805 810 815
His Trp Asn Tyr Leu Thr Ile Cys Gln Leu Cys Arg Pro Cys Asp Pro
820 825 830
Val Met Gly Leu Glu Glu Ile Ala Pro Cys Thr Ser Lys Arg Lys Thr
835 840 845
Gln Cys Arg Cys Gln Pro Gly Met Phe Cys Ala Ala Trp Ala Leu Glu
850 855 860
Cys Thr His Cys Glu Leu Leu Ser Asp Cys Pro Pro Gly Thr Glu Ala
865 870 875 880
Glu Leu Lys Asp Glu Val Gly Lys Gly Asn Asn His Cys Val Pro Cys
885 890 895
Lys Ala Gly His Phe Gln Asn Thr Ser Ser Pro Ser Ala Arg Cys Gln
900 905 910
Pro His Thr Arg Cys Glu Asn Gln Gly Leu Val Glu Ala Ala Pro Gly
915 920 925
Thr Ala Gln Ser Asp Thr Thr Cys Lys Asn Pro Leu Glu Pro Leu Pro
930 935 940
Pro Glu Met Ser Gly Thr Met Leu Met Leu Ala Val Leu Leu Pro Leu
945 950 955 960
Ala Phe Phe Leu Leu Leu Ala Thr Val Phe Ser Cys Ile Trp Lys Ser
965 970 975
His Pro Ser Leu Cys Arg Lys Leu Gly Ser Leu Leu Lys Arg Arg Pro
980 985 990
Gln Gly Glu Gly Pro Asn Pro Val Ala Gly Ser Trp Glu Pro Pro Lys
995 1000 1005
Ala His Pro Tyr Phe Pro Asp Leu Val Gln Pro Leu Leu Pro Ile
1010 1015 1020
Ser Gly Asp Val Ser Pro Val Ser Thr Gly Leu Pro Ala Ala Pro
1025 1030 1035
Val Leu Glu Ala Gly Val Pro Gln Gln Gln Ser Pro Leu Asp Leu
1040 1045 1050
Thr Arg Glu Pro Gln Leu Glu Pro Gly Glu Gln Ser Gln Val Ala
1055 1060 1065
His Gly Thr Asn Gly Ile His Val Thr Gly Gly Ser Met Thr Ile
1070 1075 1080
Thr Gly Asn Ile Tyr Ile Tyr Asn Gly Pro Val Leu Gly Gly Pro
1085 1090 1095
Pro Gly Pro Gly Asp Leu Pro Ala Thr Pro Glu Pro Pro Tyr Pro
1100 1105 1110
Ile Pro Glu Glu Gly Asp Pro Gly Pro Pro Gly Leu Ser Thr Pro
1115 1120 1125
His Gln Glu Asp Gly Lys Ala Trp His Leu Ala Glu Thr Glu His
1130 1135 1140
Cys Gly Ala Thr Pro Ser Asn Arg Gly Pro Arg Asn Gln Phe Ile
1145 1150 1155
Thr His Asp
1160
<210> 4
<211> 3486
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 4
atggctcttc ctgttacagc cctcctgctt cccctggcgc tgctgttgca cgccgcccgc 60
cccgacatcc agatgaccca gactacctcc tctctgagtg ctagcctggg ggaccgcgta 120
accatttcat gccgagcctc ccaggacatc tccaagtacc tgaattggta ccagcagaag 180
ccggacggca ccgtgaagct tcttatctac catactagcc gcctgcactc tggcgtccca 240
tccagatttt caggctccgg ctctggcacc gactactctc ttaccatctc taacctcgaa 300
caggaggaca tcgccaccta tttctgtcaa cagggcaaca cgctgcccta taccttcggc 360
ggtggcacca agctggagat caccggctct acctcgggca gcggcaaacc tggctccggg 420
gaaggcagca ccaagggaga ggtgaagctg caggagagcg gaccaggcct ggtggctccc 480
tcccagtccc tgtctgtgac ctgtaccgta tcgggggtct cactgccgga ctacggcgtt 540
agttggattc gccagccacc ccgcaagggt ctggagtggc tgggcgttat ctggggctcc 600
gagactacct actacaattc cgcgctgaag tcgcgcctga ctatcatcaa ggacaactcc 660
aagagccagg tgttcctgaa aatgaactcg ttgcagacgg atgacaccgc aatctattat 720
tgcgccaagc actactacta cggcggcagc tacgccatgg attactgggg tcagggtacc 780
tccgtgaccg tgtcctcgat tgaggtgatg tatccacccc cctatctgga caacgagaaa 840
tcaaatggca ccatcatcca cgtaaagggc aagcacctgt gcccctctcc tctgttcccc 900
ggcccttcca agcccttctg ggtgctagtg gtggtagggg gcgtcctggc gtgctactcc 960
ttgctggtca ctgtggcgtt catcatcttc tgggtccgga gcaagcgttc tcgcctgctg 1020
cacagcgatt acatgaatat gactccgcgc cgccccgggc caacccgcaa gcactaccag 1080
ccgtacgcgc ccccccgcga ctttgccgcc taccgatccc gcgtgaaatt ttcacgcagc 1140
gcggacgccc cggcctatca gcagggacag aaccagcttt acaacgagct caacctgggc 1200
aggagggagg agtacgatgt gctggacaag cgccgcggta gagacccgga gatgggcggt 1260
aagccgcgca ggaagaaccc tcaggagggc ctctacaacg agctccagaa ggacaagatg 1320
gccgaggctt actctgagat cggtatgaaa ggcgagcggc gccgtggcaa aggccatgac 1380
ggcctgtacc agggtctctc gactgccact aaggatactt acgacgcact gcacatgcag 1440
gccctgcccc cgcgcggatc cggcgcaaca aacttctctc tgctgaaaca agccggagat 1500
gtcgaagaga atcctggacc gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac 1560
gacgtcccca gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc 1620
cacaccgtcg atccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc 1680
acgcgcgtcg ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg 1740
gtctggacca cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc 1800
atggccgagt tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg 1860
ccgcaccggc ccaaggagcc cgcgtggttc ctggccaccg tcggagtctc gcccgaccac 1920
cagggcaagg gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc 1980
ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc 2040
ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc 2100
cgcaagcccg gtgccggcag cggcgagggc agaggcagcc tgttaacctg cggcgacgtg 2160
gaggagaacc caggtcctat gctcctgcct tgggccacct ctgcccccgg cctggcctgg 2220
gggcctctgg tgctgggcct cttcgggctc ctggcagcat cgcagcccca ggcggtgcct 2280
ccatatgcgt cggagaacca gacctgcagg gaccaggaaa aggaatacta tgagccccag 2340
caccgcatct gctgctcccg ctgcccgcca ggcacctatg tctcagctaa atgtagccgc 2400
atccgggaca cagtttgtgc cacatgtgcc gagaattcct acaacgagca ctggaactac 2460
ctgaccatct gccagctgtg ccgcccctgt gacccagtga tgggcctcga ggagattgcc 2520
ccctgcacaa gcaaacggaa gacccagtgc cgctgccagc cgggaatgtt ctgtgctgcc 2580
tgggccctcg agtgtacaca ctgcgagcta ctttctgact gcccgcctgg cactgaagcc 2640
gagctcaaag atgaagttgg gaagggtaac aaccactgcg tcccctgcaa ggccgggcac 2700
ttccagaata cctcctcccc cagcgcccgc tgccagcccc acaccaggtg tgagaaccaa 2760
ggtctggtgg aggcagctcc aggcactgcc cagtccgaca caacctgcaa aaatccatta 2820
gagccactgc ccccagagat gtcaggaacc atgctgatgc tggccgttct gctgccactg 2880
gccttctttc tgctccttgc caccgtcttc tcctgcatct ggaagagcca cccttctctc 2940
tgcaggaaac tgggatcgct gctcaagagg cgtccgcagg gagagggacc caatcctgta 3000
gctggaagct gggagcctcc gaaggcccat ccatacttcc ctgacttggt acagccactg 3060
ctacccattt ctggagatgt ttccccagta tccactgggc tccccgcagc cccagttttg 3120
gaggcagggg tgccgcaaca gcagagtcct ctggacctga ccagggagcc gcagttggaa 3180
cccggggagc agagccaggt ggcccacggt accaatggca ttcatgtcac cggcgggtct 3240
atgactatca ctggcaacat ctacatctac aatggaccag tactgggggg accaccgggt 3300
cctggagacc tcccagctac ccccgaacct ccatacccca ttcccgaaga gggggaccct 3360
ggccctcccg ggctctctac accccaccag gaagatggca aggcttggca cctagcggag 3420
acagagcact gtggtgccac accctctaac aggggcccaa ggaaccaatt tatcacccat 3480
gactga 3486
<210> 5
<211> 995
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 5
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ile Glu Val Met Tyr Pro
260 265 270
Pro Pro Tyr Leu Asp Asn Glu Lys Ser Asn Gly Thr Ile Ile His Val
275 280 285
Lys Gly Lys His Leu Cys Pro Ser Pro Leu Phe Pro Gly Pro Ser Lys
290 295 300
Pro Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser
305 310 315 320
Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser Lys Arg
325 330 335
Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro
340 345 350
Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe
355 360 365
Ala Ala Tyr Arg Ser Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro
370 375 380
Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly
385 390 395 400
Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro
405 410 415
Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr
420 425 430
Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly
435 440 445
Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln
450 455 460
Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln
465 470 475 480
Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
485 490 495
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Glu Tyr Lys Pro
500 505 510
Thr Val Arg Leu Ala Thr Arg Asp Asp Val Pro Arg Ala Val Arg Thr
515 520 525
Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala Thr Arg His Thr Val Asp
530 535 540
Pro Asp Arg His Ile Glu Arg Val Thr Glu Leu Gln Glu Leu Phe Leu
545 550 555 560
Thr Arg Val Gly Leu Asp Ile Gly Lys Val Trp Val Ala Asp Asp Gly
565 570 575
Ala Ala Val Ala Val Trp Thr Thr Pro Glu Ser Val Glu Ala Gly Ala
580 585 590
Val Phe Ala Glu Ile Gly Pro Arg Met Ala Glu Leu Ser Gly Ser Arg
595 600 605
Leu Ala Ala Gln Gln Gln Met Glu Gly Leu Leu Ala Pro His Arg Pro
610 615 620
Lys Glu Pro Ala Trp Phe Leu Ala Thr Val Gly Val Ser Pro Asp His
625 630 635 640
Gln Gly Lys Gly Leu Gly Ser Ala Val Val Leu Pro Gly Val Glu Ala
645 650 655
Ala Glu Arg Ala Gly Val Pro Ala Phe Leu Glu Thr Ser Ala Pro Arg
660 665 670
Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe Thr Val Thr Ala Asp Val
675 680 685
Glu Val Pro Glu Gly Pro Arg Thr Trp Cys Met Thr Arg Lys Pro Gly
690 695 700
Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val
705 710 715 720
Glu Glu Asn Pro Gly Pro Met Tyr Asp Gly Pro Arg Leu Leu Leu Leu
725 730 735
Leu Leu Leu Gly Val Ser Leu Gly Gly Ala Lys Glu Ala Cys Pro Thr
740 745 750
Gly Leu Tyr Thr His Ser Gly Glu Cys Cys Lys Ala Cys Asn Leu Gly
755 760 765
Glu Gly Val Ala Gln Pro Cys Gly Ala Asn Gln Thr Val Cys Glu Pro
770 775 780
Cys Leu Asp Ser Val Thr Phe Ser Asp Val Val Ser Ala Thr Glu Pro
785 790 795 800
Cys Lys Pro Cys Thr Glu Cys Val Gly Leu Gln Ser Met Ser Ala Pro
805 810 815
Cys Val Glu Ala Asp Asp Ala Val Cys Arg Cys Ala Tyr Gly Tyr Tyr
820 825 830
Gln Asp Glu Thr Thr Gly Arg Cys Glu Ala Cys Arg Val Cys Glu Ala
835 840 845
Gly Ser Gly Leu Val Phe Ser Cys Gln Asp Lys Gln Asn Thr Val Cys
850 855 860
Glu Glu Cys Pro Asp Gly Thr Tyr Ser Asp Glu Ala Asn His Val Asp
865 870 875 880
Pro Cys Leu Pro Cys Thr Val Cys Glu Asp Thr Glu Arg Gln Leu Arg
885 890 895
Glu Cys Thr Arg Trp Ala Asp Ala Glu Cys Glu Glu Ile Pro Gly Arg
900 905 910
Trp Ile Thr Arg Ser Thr Pro Pro Glu Gly Ser Asp Ser Thr Ala Pro
915 920 925
Ser Thr Gln Glu Pro Glu Ala Pro Pro Glu Gln Asp Leu Ile Ala Ser
930 935 940
Thr Val Ala Gly Val Val Thr Thr Val Met Gly Ser Ser Gln Pro Val
945 950 955 960
Val Thr Arg Gly Thr Thr Asp Asn Leu Ile Pro Val Tyr Cys Ser Ile
965 970 975
Leu Ala Ala Val Val Val Gly Leu Val Ala Tyr Ile Ala Phe Lys Arg
980 985 990
Trp Asn Ser
995
<210> 6
<211> 2988
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 6
Ala Thr Gly Gly Cys Thr Cys Thr Thr Cys Cys Thr Gly Thr Thr Ala
1 5 10 15
Cys Ala Gly Cys Cys Cys Thr Cys Cys Thr Gly Cys Thr Thr Cys Cys
20 25 30
Cys Cys Thr Gly Gly Cys Gly Cys Thr Gly Cys Thr Gly Thr Thr Gly
35 40 45
Cys Ala Cys Gly Cys Cys Gly Cys Cys Cys Gly Cys Cys Cys Cys Gly
50 55 60
Ala Cys Ala Thr Cys Cys Ala Gly Ala Thr Gly Ala Cys Cys Cys Ala
65 70 75 80
Gly Ala Cys Thr Ala Cys Cys Thr Cys Cys Thr Cys Thr Cys Thr Gly
85 90 95
Ala Gly Thr Gly Cys Thr Ala Gly Cys Cys Thr Gly Gly Gly Gly Gly
100 105 110
Ala Cys Cys Gly Cys Gly Thr Ala Ala Cys Cys Ala Thr Thr Thr Cys
115 120 125
Ala Thr Gly Cys Cys Gly Ala Gly Cys Cys Thr Cys Cys Cys Ala Gly
130 135 140
Gly Ala Cys Ala Thr Cys Thr Cys Cys Ala Ala Gly Thr Ala Cys Cys
145 150 155 160
Thr Gly Ala Ala Thr Thr Gly Gly Thr Ala Cys Cys Ala Gly Cys Ala
165 170 175
Gly Ala Ala Gly Cys Cys Gly Gly Ala Cys Gly Gly Cys Ala Cys Cys
180 185 190
Gly Thr Gly Ala Ala Gly Cys Thr Thr Cys Thr Thr Ala Thr Cys Thr
195 200 205
Ala Cys Cys Ala Thr Ala Cys Thr Ala Gly Cys Cys Gly Cys Cys Thr
210 215 220
Gly Cys Ala Cys Thr Cys Thr Gly Gly Cys Gly Thr Cys Cys Cys Ala
225 230 235 240
Thr Cys Cys Ala Gly Ala Thr Thr Thr Thr Cys Ala Gly Gly Cys Thr
245 250 255
Cys Cys Gly Gly Cys Thr Cys Thr Gly Gly Cys Ala Cys Cys Gly Ala
260 265 270
Cys Thr Ala Cys Thr Cys Thr Cys Thr Thr Ala Cys Cys Ala Thr Cys
275 280 285
Thr Cys Thr Ala Ala Cys Cys Thr Cys Gly Ala Ala Cys Ala Gly Gly
290 295 300
Ala Gly Gly Ala Cys Ala Thr Cys Gly Cys Cys Ala Cys Cys Thr Ala
305 310 315 320
Thr Thr Thr Cys Thr Gly Thr Cys Ala Ala Cys Ala Gly Gly Gly Cys
325 330 335
Ala Ala Cys Ala Cys Gly Cys Thr Gly Cys Cys Cys Thr Ala Thr Ala
340 345 350
Cys Cys Thr Thr Cys Gly Gly Cys Gly Gly Thr Gly Gly Cys Ala Cys
355 360 365
Cys Ala Ala Gly Cys Thr Gly Gly Ala Gly Ala Thr Cys Ala Cys Cys
370 375 380
Gly Gly Cys Thr Cys Thr Ala Cys Cys Thr Cys Gly Gly Gly Cys Ala
385 390 395 400
Gly Cys Gly Gly Cys Ala Ala Ala Cys Cys Thr Gly Gly Cys Thr Cys
405 410 415
Cys Gly Gly Gly Gly Ala Ala Gly Gly Cys Ala Gly Cys Ala Cys Cys
420 425 430
Ala Ala Gly Gly Gly Ala Gly Ala Gly Gly Thr Gly Ala Ala Gly Cys
435 440 445
Thr Gly Cys Ala Gly Gly Ala Gly Ala Gly Cys Gly Gly Ala Cys Cys
450 455 460
Ala Gly Gly Cys Cys Thr Gly Gly Thr Gly Gly Cys Thr Cys Cys Cys
465 470 475 480
Thr Cys Cys Cys Ala Gly Thr Cys Cys Cys Thr Gly Thr Cys Thr Gly
485 490 495
Thr Gly Ala Cys Cys Thr Gly Thr Ala Cys Cys Gly Thr Ala Thr Cys
500 505 510
Gly Gly Gly Gly Gly Thr Cys Thr Cys Ala Cys Thr Gly Cys Cys Gly
515 520 525
Gly Ala Cys Thr Ala Cys Gly Gly Cys Gly Thr Thr Ala Gly Thr Thr
530 535 540
Gly Gly Ala Thr Thr Cys Gly Cys Cys Ala Gly Cys Cys Ala Cys Cys
545 550 555 560
Cys Cys Gly Cys Ala Ala Gly Gly Gly Thr Cys Thr Gly Gly Ala Gly
565 570 575
Thr Gly Gly Cys Thr Gly Gly Gly Cys Gly Thr Thr Ala Thr Cys Thr
580 585 590
Gly Gly Gly Gly Cys Thr Cys Cys Gly Ala Gly Ala Cys Thr Ala Cys
595 600 605
Cys Thr Ala Cys Thr Ala Cys Ala Ala Thr Thr Cys Cys Gly Cys Gly
610 615 620
Cys Thr Gly Ala Ala Gly Thr Cys Gly Cys Gly Cys Cys Thr Gly Ala
625 630 635 640
Cys Thr Ala Thr Cys Ala Thr Cys Ala Ala Gly Gly Ala Cys Ala Ala
645 650 655
Cys Thr Cys Cys Ala Ala Gly Ala Gly Cys Cys Ala Gly Gly Thr Gly
660 665 670
Thr Thr Cys Cys Thr Gly Ala Ala Ala Ala Thr Gly Ala Ala Cys Thr
675 680 685
Cys Gly Thr Thr Gly Cys Ala Gly Ala Cys Gly Gly Ala Thr Gly Ala
690 695 700
Cys Ala Cys Cys Gly Cys Ala Ala Thr Cys Thr Ala Thr Thr Ala Thr
705 710 715 720
Thr Gly Cys Gly Cys Cys Ala Ala Gly Cys Ala Cys Thr Ala Cys Thr
725 730 735
Ala Cys Thr Ala Cys Gly Gly Cys Gly Gly Cys Ala Gly Cys Thr Ala
740 745 750
Cys Gly Cys Cys Ala Thr Gly Gly Ala Thr Thr Ala Cys Thr Gly Gly
755 760 765
Gly Gly Thr Cys Ala Gly Gly Gly Thr Ala Cys Cys Thr Cys Cys Gly
770 775 780
Thr Gly Ala Cys Cys Gly Thr Gly Thr Cys Cys Thr Cys Gly Ala Thr
785 790 795 800
Thr Gly Ala Gly Gly Thr Gly Ala Thr Gly Thr Ala Thr Cys Cys Ala
805 810 815
Cys Cys Cys Cys Cys Cys Thr Ala Thr Cys Thr Gly Gly Ala Cys Ala
820 825 830
Ala Cys Gly Ala Gly Ala Ala Ala Thr Cys Ala Ala Ala Thr Gly Gly
835 840 845
Cys Ala Cys Cys Ala Thr Cys Ala Thr Cys Cys Ala Cys Gly Thr Ala
850 855 860
Ala Ala Gly Gly Gly Cys Ala Ala Gly Cys Ala Cys Cys Thr Gly Thr
865 870 875 880
Gly Cys Cys Cys Cys Thr Cys Thr Cys Cys Thr Cys Thr Gly Thr Thr
885 890 895
Cys Cys Cys Cys Gly Gly Cys Cys Cys Thr Thr Cys Cys Ala Ala Gly
900 905 910
Cys Cys Cys Thr Thr Cys Thr Gly Gly Gly Thr Gly Cys Thr Ala Gly
915 920 925
Thr Gly Gly Thr Gly Gly Thr Ala Gly Gly Gly Gly Gly Cys Gly Thr
930 935 940
Cys Cys Thr Gly Gly Cys Gly Thr Gly Cys Thr Ala Cys Thr Cys Cys
945 950 955 960
Thr Thr Gly Cys Thr Gly Gly Thr Cys Ala Cys Thr Gly Thr Gly Gly
965 970 975
Cys Gly Thr Thr Cys Ala Thr Cys Ala Thr Cys Thr Thr Cys Thr Gly
980 985 990
Gly Gly Thr Cys Cys Gly Gly Ala Gly Cys Ala Ala Gly Cys Gly Thr
995 1000 1005
Thr Cys Thr Cys Gly Cys Cys Thr Gly Cys Thr Gly Cys Ala Cys
1010 1015 1020
Ala Gly Cys Gly Ala Thr Thr Ala Cys Ala Thr Gly Ala Ala Thr
1025 1030 1035
Ala Thr Gly Ala Cys Thr Cys Cys Gly Cys Gly Cys Cys Gly Cys
1040 1045 1050
Cys Cys Cys Gly Gly Gly Cys Cys Ala Ala Cys Cys Cys Gly Cys
1055 1060 1065
Ala Ala Gly Cys Ala Cys Thr Ala Cys Cys Ala Gly Cys Cys Gly
1070 1075 1080
Thr Ala Cys Gly Cys Gly Cys Cys Cys Cys Cys Cys Cys Gly Cys
1085 1090 1095
Gly Ala Cys Thr Thr Thr Gly Cys Cys Gly Cys Cys Thr Ala Cys
1100 1105 1110
Cys Gly Ala Thr Cys Cys Cys Gly Cys Gly Thr Gly Ala Ala Ala
1115 1120 1125
Thr Thr Thr Thr Cys Ala Cys Gly Cys Ala Gly Cys Gly Cys Gly
1130 1135 1140
Gly Ala Cys Gly Cys Cys Cys Cys Gly Gly Cys Cys Thr Ala Thr
1145 1150 1155
Cys Ala Gly Cys Ala Gly Gly Gly Ala Cys Ala Gly Ala Ala Cys
1160 1165 1170
Cys Ala Gly Cys Thr Thr Thr Ala Cys Ala Ala Cys Gly Ala Gly
1175 1180 1185
Cys Thr Cys Ala Ala Cys Cys Thr Gly Gly Gly Cys Ala Gly Gly
1190 1195 1200
Ala Gly Gly Gly Ala Gly Gly Ala Gly Thr Ala Cys Gly Ala Thr
1205 1210 1215
Gly Thr Gly Cys Thr Gly Gly Ala Cys Ala Ala Gly Cys Gly Cys
1220 1225 1230
Cys Gly Cys Gly Gly Thr Ala Gly Ala Gly Ala Cys Cys Cys Gly
1235 1240 1245
Gly Ala Gly Ala Thr Gly Gly Gly Cys Gly Gly Thr Ala Ala Gly
1250 1255 1260
Cys Cys Gly Cys Gly Cys Ala Gly Gly Ala Ala Gly Ala Ala Cys
1265 1270 1275
Cys Cys Thr Cys Ala Gly Gly Ala Gly Gly Gly Cys Cys Thr Cys
1280 1285 1290
Thr Ala Cys Ala Ala Cys Gly Ala Gly Cys Thr Cys Cys Ala Gly
1295 1300 1305
Ala Ala Gly Gly Ala Cys Ala Ala Gly Ala Thr Gly Gly Cys Cys
1310 1315 1320
Gly Ala Gly Gly Cys Thr Thr Ala Cys Thr Cys Thr Gly Ala Gly
1325 1330 1335
Ala Thr Cys Gly Gly Thr Ala Thr Gly Ala Ala Ala Gly Gly Cys
1340 1345 1350
Gly Ala Gly Cys Gly Gly Cys Gly Cys Cys Gly Thr Gly Gly Cys
1355 1360 1365
Ala Ala Ala Gly Gly Cys Cys Ala Thr Gly Ala Cys Gly Gly Cys
1370 1375 1380
Cys Thr Gly Thr Ala Cys Cys Ala Gly Gly Gly Thr Cys Thr Cys
1385 1390 1395
Thr Cys Gly Ala Cys Thr Gly Cys Cys Ala Cys Thr Ala Ala Gly
1400 1405 1410
Gly Ala Thr Ala Cys Thr Thr Ala Cys Gly Ala Cys Gly Cys Ala
1415 1420 1425
Cys Thr Gly Cys Ala Cys Ala Thr Gly Cys Ala Gly Gly Cys Cys
1430 1435 1440
Cys Thr Gly Cys Cys Cys Cys Cys Gly Cys Gly Cys Gly Gly Ala
1445 1450 1455
Thr Cys Cys Gly Gly Cys Gly Cys Ala Ala Cys Ala Ala Ala Cys
1460 1465 1470
Thr Thr Cys Thr Cys Thr Cys Thr Gly Cys Thr Gly Ala Ala Ala
1475 1480 1485
Cys Ala Ala Gly Cys Cys Gly Gly Ala Gly Ala Thr Gly Thr Cys
1490 1495 1500
Gly Ala Ala Gly Ala Gly Ala Ala Thr Cys Cys Thr Gly Gly Ala
1505 1510 1515
Cys Cys Gly Ala Cys Cys Gly Ala Gly Thr Ala Cys Ala Ala Gly
1520 1525 1530
Cys Cys Cys Ala Cys Gly Gly Thr Gly Cys Gly Cys Cys Thr Cys
1535 1540 1545
Gly Cys Cys Ala Cys Cys Cys Gly Cys Gly Ala Cys Gly Ala Cys
1550 1555 1560
Gly Thr Cys Cys Cys Cys Ala Gly Gly Gly Cys Cys Gly Thr Ala
1565 1570 1575
Cys Gly Cys Ala Cys Cys Cys Thr Cys Gly Cys Cys Gly Cys Cys
1580 1585 1590
Gly Cys Gly Thr Thr Cys Gly Cys Cys Gly Ala Cys Thr Ala Cys
1595 1600 1605
Cys Cys Cys Gly Cys Cys Ala Cys Gly Cys Gly Cys Cys Ala Cys
1610 1615 1620
Ala Cys Cys Gly Thr Cys Gly Ala Thr Cys Cys Gly Gly Ala Cys
1625 1630 1635
Cys Gly Cys Cys Ala Cys Ala Thr Cys Gly Ala Gly Cys Gly Gly
1640 1645 1650
Gly Thr Cys Ala Cys Cys Gly Ala Gly Cys Thr Gly Cys Ala Ala
1655 1660 1665
Gly Ala Ala Cys Thr Cys Thr Thr Cys Cys Thr Cys Ala Cys Gly
1670 1675 1680
Cys Gly Cys Gly Thr Cys Gly Gly Gly Cys Thr Cys Gly Ala Cys
1685 1690 1695
Ala Thr Cys Gly Gly Cys Ala Ala Gly Gly Thr Gly Thr Gly Gly
1700 1705 1710
Gly Thr Cys Gly Cys Gly Gly Ala Cys Gly Ala Cys Gly Gly Cys
1715 1720 1725
Gly Cys Cys Gly Cys Gly Gly Thr Gly Gly Cys Gly Gly Thr Cys
1730 1735 1740
Thr Gly Gly Ala Cys Cys Ala Cys Gly Cys Cys Gly Gly Ala Gly
1745 1750 1755
Ala Gly Cys Gly Thr Cys Gly Ala Ala Gly Cys Gly Gly Gly Gly
1760 1765 1770
Gly Cys Gly Gly Thr Gly Thr Thr Cys Gly Cys Cys Gly Ala Gly
1775 1780 1785
Ala Thr Cys Gly Gly Cys Cys Cys Gly Cys Gly Cys Ala Thr Gly
1790 1795 1800
Gly Cys Cys Gly Ala Gly Thr Thr Gly Ala Gly Cys Gly Gly Thr
1805 1810 1815
Thr Cys Cys Cys Gly Gly Cys Thr Gly Gly Cys Cys Gly Cys Gly
1820 1825 1830
Cys Ala Gly Cys Ala Ala Cys Ala Gly Ala Thr Gly Gly Ala Ala
1835 1840 1845
Gly Gly Cys Cys Thr Cys Cys Thr Gly Gly Cys Gly Cys Cys Gly
1850 1855 1860
Cys Ala Cys Cys Gly Gly Cys Cys Cys Ala Ala Gly Gly Ala Gly
1865 1870 1875
Cys Cys Cys Gly Cys Gly Thr Gly Gly Thr Thr Cys Cys Thr Gly
1880 1885 1890
Gly Cys Cys Ala Cys Cys Gly Thr Cys Gly Gly Ala Gly Thr Cys
1895 1900 1905
Thr Cys Gly Cys Cys Cys Gly Ala Cys Cys Ala Cys Cys Ala Gly
1910 1915 1920
Gly Gly Cys Ala Ala Gly Gly Gly Thr Cys Thr Gly Gly Gly Cys
1925 1930 1935
Ala Gly Cys Gly Cys Cys Gly Thr Cys Gly Thr Gly Cys Thr Cys
1940 1945 1950
Cys Cys Cys Gly Gly Ala Gly Thr Gly Gly Ala Gly Gly Cys Gly
1955 1960 1965
Gly Cys Cys Gly Ala Gly Cys Gly Cys Gly Cys Cys Gly Gly Gly
1970 1975 1980
Gly Thr Gly Cys Cys Cys Gly Cys Cys Thr Thr Cys Cys Thr Gly
1985 1990 1995
Gly Ala Gly Ala Cys Cys Thr Cys Cys Gly Cys Gly Cys Cys Cys
2000 2005 2010
Cys Gly Cys Ala Ala Cys Cys Thr Cys Cys Cys Cys Thr Thr Cys
2015 2020 2025
Thr Ala Cys Gly Ala Gly Cys Gly Gly Cys Thr Cys Gly Gly Cys
2030 2035 2040
Thr Thr Cys Ala Cys Cys Gly Thr Cys Ala Cys Cys Gly Cys Cys
2045 2050 2055
Gly Ala Cys Gly Thr Cys Gly Ala Gly Gly Thr Gly Cys Cys Cys
2060 2065 2070
Gly Ala Ala Gly Gly Ala Cys Cys Gly Cys Gly Cys Ala Cys Cys
2075 2080 2085
Thr Gly Gly Thr Gly Cys Ala Thr Gly Ala Cys Cys Cys Gly Cys
2090 2095 2100
Ala Ala Gly Cys Cys Cys Gly Gly Thr Gly Cys Cys Gly Gly Cys
2105 2110 2115
Ala Gly Cys Gly Gly Cys Gly Ala Gly Gly Gly Cys Ala Gly Ala
2120 2125 2130
Gly Gly Cys Ala Gly Cys Cys Thr Gly Thr Thr Ala Ala Cys Cys
2135 2140 2145
Thr Gly Cys Gly Gly Cys Gly Ala Cys Gly Thr Gly Gly Ala Gly
2150 2155 2160
Gly Ala Gly Ala Ala Cys Cys Cys Ala Gly Gly Thr Cys Cys Thr
2165 2170 2175
Ala Thr Gly Thr Ala Cys Gly Ala Cys Gly Gly Gly Cys Cys Gly
2180 2185 2190
Cys Gly Cys Cys Thr Gly Cys Thr Gly Cys Thr Gly Thr Thr Gly
2195 2200 2205
Cys Thr Gly Cys Thr Thr Cys Thr Gly Gly Gly Gly Gly Thr Gly
2210 2215 2220
Thr Cys Cys Cys Thr Thr Gly Gly Ala Gly Gly Thr Gly Cys Cys
2225 2230 2235
Ala Ala Gly Gly Ala Gly Gly Cys Ala Thr Gly Cys Cys Cys Cys
2240 2245 2250
Ala Cys Ala Gly Gly Cys Cys Thr Gly Thr Ala Cys Ala Cys Ala
2255 2260 2265
Cys Ala Cys Ala Gly Cys Gly Gly Thr Gly Ala Gly Thr Gly Cys
2270 2275 2280
Thr Gly Cys Ala Ala Ala Gly Cys Cys Thr Gly Cys Ala Ala Cys
2285 2290 2295
Cys Thr Gly Gly Gly Cys Gly Ala Gly Gly Gly Thr Gly Thr Gly
2300 2305 2310
Gly Cys Cys Cys Ala Gly Cys Cys Thr Thr Gly Thr Gly Gly Ala
2315 2320 2325
Gly Cys Cys Ala Ala Cys Cys Ala Gly Ala Cys Cys Gly Thr Gly
2330 2335 2340
Thr Gly Thr Gly Ala Gly Cys Cys Cys Thr Gly Cys Cys Thr Gly
2345 2350 2355
Gly Ala Cys Ala Gly Cys Gly Thr Gly Ala Cys Gly Thr Thr Cys
2360 2365 2370
Thr Cys Cys Gly Ala Cys Gly Thr Gly Gly Thr Gly Ala Gly Cys
2375 2380 2385
Gly Cys Gly Ala Cys Cys Gly Ala Gly Cys Cys Gly Thr Gly Cys
2390 2395 2400
Ala Ala Gly Cys Cys Gly Thr Gly Cys Ala Cys Cys Gly Ala Gly
2405 2410 2415
Thr Gly Cys Gly Thr Gly Gly Gly Gly Cys Thr Cys Cys Ala Gly
2420 2425 2430
Ala Gly Cys Ala Thr Gly Thr Cys Gly Gly Cys Gly Cys Cys Gly
2435 2440 2445
Thr Gly Cys Gly Thr Gly Gly Ala Gly Gly Cys Cys Gly Ala Cys
2450 2455 2460
Gly Ala Cys Gly Cys Cys Gly Thr Gly Thr Gly Cys Cys Gly Cys
2465 2470 2475
Thr Gly Cys Gly Cys Cys Thr Ala Cys Gly Gly Cys Thr Ala Cys
2480 2485 2490
Thr Ala Cys Cys Ala Gly Gly Ala Thr Gly Ala Gly Ala Cys Cys
2495 2500 2505
Ala Cys Thr Gly Gly Gly Cys Gly Cys Thr Gly Cys Gly Ala Gly
2510 2515 2520
Gly Cys Gly Thr Gly Cys Cys Gly Cys Gly Thr Gly Thr Gly Cys
2525 2530 2535
Gly Ala Gly Gly Cys Gly Gly Gly Cys Thr Cys Gly Gly Gly Cys
2540 2545 2550
Cys Thr Cys Gly Thr Gly Thr Thr Cys Thr Cys Cys Thr Gly Cys
2555 2560 2565
Cys Ala Gly Gly Ala Cys Ala Ala Gly Cys Ala Gly Ala Ala Cys
2570 2575 2580
Ala Cys Cys Gly Thr Gly Thr Gly Cys Gly Ala Gly Gly Ala Gly
2585 2590 2595
Thr Gly Cys Cys Cys Cys Gly Ala Cys Gly Gly Cys Ala Cys Gly
2600 2605 2610
Thr Ala Thr Thr Cys Cys Gly Ala Cys Gly Ala Gly Gly Cys Cys
2615 2620 2625
Ala Ala Cys Cys Ala Cys Gly Thr Gly Gly Ala Cys Cys Cys Gly
2630 2635 2640
Thr Gly Cys Cys Thr Gly Cys Cys Cys Thr Gly Cys Ala Cys Cys
2645 2650 2655
Gly Thr Gly Thr Gly Cys Gly Ala Gly Gly Ala Cys Ala Cys Cys
2660 2665 2670
Gly Ala Gly Cys Gly Cys Cys Ala Gly Cys Thr Cys Cys Gly Cys
2675 2680 2685
Gly Ala Gly Thr Gly Cys Ala Cys Ala Cys Gly Cys Thr Gly Gly
2690 2695 2700
Gly Cys Cys Gly Ala Cys Gly Cys Cys Gly Ala Gly Thr Gly Cys
2705 2710 2715
Gly Ala Gly Gly Ala Gly Ala Thr Cys Cys Cys Thr Gly Gly Cys
2720 2725 2730
Cys Gly Thr Thr Gly Gly Ala Thr Thr Ala Cys Ala Cys Gly Gly
2735 2740 2745
Thr Cys Cys Ala Cys Ala Cys Cys Cys Cys Cys Ala Gly Ala Gly
2750 2755 2760
Gly Gly Cys Thr Cys Gly Gly Ala Cys Ala Gly Cys Ala Cys Ala
2765 2770 2775
Gly Cys Cys Cys Cys Cys Ala Gly Cys Ala Cys Cys Cys Ala Gly
2780 2785 2790
Gly Ala Gly Cys Cys Thr Gly Ala Gly Gly Cys Ala Cys Cys Thr
2795 2800 2805
Cys Cys Ala Gly Ala Ala Cys Ala Ala Gly Ala Cys Cys Thr Cys
2810 2815 2820
Ala Thr Ala Gly Cys Cys Ala Gly Cys Ala Cys Gly Gly Thr Gly
2825 2830 2835
Gly Cys Ala Gly Gly Thr Gly Thr Gly Gly Thr Gly Ala Cys Cys
2840 2845 2850
Ala Cys Ala Gly Thr Gly Ala Thr Gly Gly Gly Cys Ala Gly Cys
2855 2860 2865
Thr Cys Cys Cys Ala Gly Cys Cys Cys Gly Thr Gly Gly Thr Gly
2870 2875 2880
Ala Cys Cys Cys Gly Ala Gly Gly Cys Ala Cys Cys Ala Cys Cys
2885 2890 2895
Gly Ala Cys Ala Ala Cys Cys Thr Cys Ala Thr Cys Cys Cys Thr
2900 2905 2910
Gly Thr Cys Thr Ala Thr Thr Gly Cys Thr Cys Cys Ala Thr Cys
2915 2920 2925
Cys Thr Gly Gly Cys Thr Gly Cys Thr Gly Thr Gly Gly Thr Thr
2930 2935 2940
Gly Thr Gly Gly Gly Thr Cys Thr Thr Gly Thr Gly Gly Cys Cys
2945 2950 2955
Thr Ala Cys Ala Thr Ala Gly Cys Cys Thr Thr Cys Ala Ala Gly
2960 2965 2970
Ala Gly Gly Thr Gly Gly Ala Ala Cys Ala Gly Thr Thr Gly Ala
2975 2980 2985
<210> 7
<211> 1165
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 7
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Thr Thr Thr Pro Ala Pro
260 265 270
Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu
275 280 285
Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg
290 295 300
Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly
305 310 315 320
Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys Lys
325 330 335
Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg
340 345 350
Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro
355 360 365
Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe Ser Arg Ser
370 375 380
Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu
385 390 395 400
Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg
405 410 415
Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln
420 425 430
Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr
435 440 445
Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp
450 455 460
Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala
465 470 475 480
Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe
485 490 495
Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr
500 505 510
Glu Tyr Lys Pro Thr Val Arg Leu Ala Thr Arg Asp Asp Val Pro Arg
515 520 525
Ala Val Arg Thr Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala Thr Arg
530 535 540
His Thr Val Asp Pro Asp Arg His Ile Glu Arg Val Thr Glu Leu Gln
545 550 555 560
Glu Leu Phe Leu Thr Arg Val Gly Leu Asp Ile Gly Lys Val Trp Val
565 570 575
Ala Asp Asp Gly Ala Ala Val Ala Val Trp Thr Thr Pro Glu Ser Val
580 585 590
Glu Ala Gly Ala Val Phe Ala Glu Ile Gly Pro Arg Met Ala Glu Leu
595 600 605
Ser Gly Ser Arg Leu Ala Ala Gln Gln Gln Met Glu Gly Leu Leu Ala
610 615 620
Pro His Arg Pro Lys Glu Pro Ala Trp Phe Leu Ala Thr Val Gly Val
625 630 635 640
Ser Pro Asp His Gln Gly Lys Gly Leu Gly Ser Ala Val Val Leu Pro
645 650 655
Gly Val Glu Ala Ala Glu Arg Ala Gly Val Pro Ala Phe Leu Glu Thr
660 665 670
Ser Ala Pro Arg Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe Thr Val
675 680 685
Thr Ala Asp Val Glu Val Pro Glu Gly Pro Arg Thr Trp Cys Met Thr
690 695 700
Arg Lys Pro Gly Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr
705 710 715 720
Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu Pro Trp Ala
725 730 735
Thr Ser Ala Pro Gly Leu Ala Trp Gly Pro Leu Val Leu Gly Leu Phe
740 745 750
Gly Leu Leu Ala Ala Ser Gln Pro Gln Ala Val Pro Pro Tyr Ala Ser
755 760 765
Glu Asn Gln Thr Cys Arg Asp Gln Glu Lys Glu Tyr Tyr Glu Pro Gln
770 775 780
His Arg Ile Cys Cys Ser Arg Cys Pro Pro Gly Thr Tyr Val Ser Ala
785 790 795 800
Lys Cys Ser Arg Ile Arg Asp Thr Val Cys Ala Thr Cys Ala Glu Asn
805 810 815
Ser Tyr Asn Glu His Trp Asn Tyr Leu Thr Ile Cys Gln Leu Cys Arg
820 825 830
Pro Cys Asp Pro Val Met Gly Leu Glu Glu Ile Ala Pro Cys Thr Ser
835 840 845
Lys Arg Lys Thr Gln Cys Arg Cys Gln Pro Gly Met Phe Cys Ala Ala
850 855 860
Trp Ala Leu Glu Cys Thr His Cys Glu Leu Leu Ser Asp Cys Pro Pro
865 870 875 880
Gly Thr Glu Ala Glu Leu Lys Asp Glu Val Gly Lys Gly Asn Asn His
885 890 895
Cys Val Pro Cys Lys Ala Gly His Phe Gln Asn Thr Ser Ser Pro Ser
900 905 910
Ala Arg Cys Gln Pro His Thr Arg Cys Glu Asn Gln Gly Leu Val Glu
915 920 925
Ala Ala Pro Gly Thr Ala Gln Ser Asp Thr Thr Cys Lys Asn Pro Leu
930 935 940
Glu Pro Leu Pro Pro Glu Met Ser Gly Thr Met Leu Met Leu Ala Val
945 950 955 960
Leu Leu Pro Leu Ala Phe Phe Leu Leu Leu Ala Thr Val Phe Ser Cys
965 970 975
Ile Trp Lys Ser His Pro Ser Leu Cys Arg Lys Leu Gly Ser Leu Leu
980 985 990
Lys Arg Arg Pro Gln Gly Glu Gly Pro Asn Pro Val Ala Gly Ser Trp
995 1000 1005
Glu Pro Pro Lys Ala His Pro Tyr Phe Pro Asp Leu Val Gln Pro
1010 1015 1020
Leu Leu Pro Ile Ser Gly Asp Val Ser Pro Val Ser Thr Gly Leu
1025 1030 1035
Pro Ala Ala Pro Val Leu Glu Ala Gly Val Pro Gln Gln Gln Ser
1040 1045 1050
Pro Leu Asp Leu Thr Arg Glu Pro Gln Leu Glu Pro Gly Glu Gln
1055 1060 1065
Ser Gln Val Ala His Gly Thr Asn Gly Ile His Val Thr Gly Gly
1070 1075 1080
Ser Met Thr Ile Thr Gly Asn Ile Tyr Ile Tyr Asn Gly Pro Val
1085 1090 1095
Leu Gly Gly Pro Pro Gly Pro Gly Asp Leu Pro Ala Thr Pro Glu
1100 1105 1110
Pro Pro Tyr Pro Ile Pro Glu Glu Gly Asp Pro Gly Pro Pro Gly
1115 1120 1125
Leu Ser Thr Pro His Gln Glu Asp Gly Lys Ala Trp His Leu Ala
1130 1135 1140
Glu Thr Glu His Cys Gly Ala Thr Pro Ser Asn Arg Gly Pro Arg
1145 1150 1155
Asn Gln Phe Ile Thr His Asp
1160 1165
<210> 8
<211> 3498
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 8
atggctcttc ctgttacagc cctcctgctt cccctggcgc tgctgttgca cgccgcccgc 60
cccgacatcc agatgaccca gactacctcc tctctgagtg ctagcctggg ggaccgcgta 120
accatttcat gccgagcctc ccaggacatc tccaagtacc tgaattggta ccagcagaag 180
ccggacggca ccgtgaagct tcttatctac catactagcc gcctgcactc tggcgtccca 240
tccagatttt caggctccgg ctctggcacc gactactctc ttaccatctc taacctcgaa 300
caggaggaca tcgccaccta tttctgtcaa cagggcaaca cgctgcccta taccttcggc 360
ggtggcacca agctggagat caccggctct acctcgggca gcggcaaacc tggctccggg 420
gaaggcagca ccaagggaga ggtgaagctg caggagagcg gaccaggcct ggtggctccc 480
tcccagtccc tgtctgtgac ctgtaccgta tcgggggtct cactgccgga ctacggcgtt 540
agttggattc gccagccacc ccgcaagggt ctggagtggc tgggcgttat ctggggctcc 600
gagactacct actacaattc cgcgctgaag tcgcgcctga ctatcatcaa ggacaactcc 660
aagagccagg tgttcctgaa aatgaactcg ttgcagacgg atgacaccgc aatctattat 720
tgcgccaagc actactacta cggcggcagc tacgccatgg attactgggg tcagggtacc 780
tccgtgaccg tgtcctcgac aactactccc gcccccaggc ctcctactcc cgcgcccacc 840
atagcttccc agccgctatc tctccgccct gaagcgtgta ggccagctgc aggtggtgct 900
gtccacaccc gcggcttgga tttcgcttgc gacatttata tttgggcgcc gctcgccggc 960
acctgcgggg tcctgctgct gagcctggtg atcacacttt actgtaaacg cggaaggaag 1020
aagctgctgt acatcttcaa gcagcccttc atgcgcccgg tgcagactac acaagaggaa 1080
gatggatgca gctgtcgctt ccctgaggag gaggagggtg gatgcgagct gcgagtgaaa 1140
ttttcccgca gcgcggacgc acctgcctac cagcagggac agaaccagct gtacaacgag 1200
ctcaacctag gtcgccgcga ggagtacgac gtgctggaca agcgtcgcgg gcgggacccg 1260
gagatgggcg gcaagccccg tcgtaagaac cctcaggagg gcctttacaa cgagctgcag 1320
aaggacaaaa tggcggaggc ctacagtgag attggtatga agggcgagcg gcgcagagga 1380
aaaggccacg acgggttgta tcagggcctc tcgaccgcta cgaaggatac gtacgacgcg 1440
ctacacatgc aggccctgcc cccacgggga tccggcgcaa caaacttctc tctgctgaaa 1500
caagccggag atgtcgaaga gaatcctgga ccgaccgagt acaagcccac ggtgcgcctc 1560
gccacccgcg acgacgtccc cagggccgta cgcaccctcg ccgccgcgtt cgccgactac 1620
cccgccacgc gccacaccgt cgatccggac cgccacatcg agcgggtcac cgagctgcaa 1680
gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg tgtgggtcgc ggacgacggc 1740
gccgcggtgg cggtctggac cacgccggag agcgtcgaag cgggggcggt gttcgccgag 1800
atcggcccgc gcatggccga gttgagcggt tcccggctgg ccgcgcagca acagatggaa 1860
ggcctcctgg cgccgcaccg gcccaaggag cccgcgtggt tcctggccac cgtcggagtc 1920
tcgcccgacc accagggcaa gggtctgggc agcgccgtcg tgctccccgg agtggaggcg 1980
gccgagcgcg ccggggtgcc cgccttcctg gagacctccg cgccccgcaa cctccccttc 2040
tacgagcggc tcggcttcac cgtcaccgcc gacgtcgagg tgcccgaagg accgcgcacc 2100
tggtgcatga cccgcaagcc cggtgccggc agcggcgagg gcagaggcag cctgttaacc 2160
tgcggcgacg tggaggagaa cccaggtcct atgctcctgc cttgggccac ctctgccccc 2220
ggcctggcct gggggcctct ggtgctgggc ctcttcgggc tcctggcagc atcgcagccc 2280
caggcggtgc ctccatatgc gtcggagaac cagacctgca gggaccagga aaaggaatac 2340
tatgagcccc agcaccgcat ctgctgctcc cgctgcccgc caggcaccta tgtctcagct 2400
aaatgtagcc gcatccggga cacagtttgt gccacatgtg ccgagaattc ctacaacgag 2460
cactggaact acctgaccat ctgccagctg tgccgcccct gtgacccagt gatgggcctc 2520
gaggagattg ccccctgcac aagcaaacgg aagacccagt gccgctgcca gccgggaatg 2580
ttctgtgctg cctgggccct cgagtgtaca cactgcgagc tactttctga ctgcccgcct 2640
ggcactgaag ccgagctcaa agatgaagtt gggaagggta acaaccactg cgtcccctgc 2700
aaggccgggc acttccagaa tacctcctcc cccagcgccc gctgccagcc ccacaccagg 2760
tgtgagaacc aaggtctggt ggaggcagct ccaggcactg cccagtccga cacaacctgc 2820
aaaaatccat tagagccact gcccccagag atgtcaggaa ccatgctgat gctggccgtt 2880
ctgctgccac tggccttctt tctgctcctt gccaccgtct tctcctgcat ctggaagagc 2940
cacccttctc tctgcaggaa actgggatcg ctgctcaaga ggcgtccgca gggagaggga 3000
cccaatcctg tagctggaag ctgggagcct ccgaaggccc atccatactt ccctgacttg 3060
gtacagccac tgctacccat ttctggagat gtttccccag tatccactgg gctccccgca 3120
gccccagttt tggaggcagg ggtgccgcaa cagcagagtc ctctggacct gaccagggag 3180
ccgcagttgg aacccgggga gcagagccag gtggcccacg gtaccaatgg cattcatgtc 3240
accggcgggt ctatgactat cactggcaac atctacatct acaatggacc agtactgggg 3300
ggaccaccgg gtcctggaga cctcccagct acccccgaac ctccataccc cattcccgaa 3360
gagggggacc ctggccctcc cgggctctct acaccccacc aggaagatgg caaggcttgg 3420
cacctagcgg agacagagca ctgtggtgcc acaccctcta acaggggccc aaggaaccaa 3480
tttatcaccc atgactga 3498
<210> 9
<211> 999
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 9
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Thr Thr Thr Pro Ala Pro
260 265 270
Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu
275 280 285
Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg
290 295 300
Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly
305 310 315 320
Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys Lys
325 330 335
Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg
340 345 350
Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro
355 360 365
Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe Ser Arg Ser
370 375 380
Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu
385 390 395 400
Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg
405 410 415
Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln
420 425 430
Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr
435 440 445
Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp
450 455 460
Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala
465 470 475 480
Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe
485 490 495
Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr
500 505 510
Glu Tyr Lys Pro Thr Val Arg Leu Ala Thr Arg Asp Asp Val Pro Arg
515 520 525
Ala Val Arg Thr Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala Thr Arg
530 535 540
His Thr Val Asp Pro Asp Arg His Ile Glu Arg Val Thr Glu Leu Gln
545 550 555 560
Glu Leu Phe Leu Thr Arg Val Gly Leu Asp Ile Gly Lys Val Trp Val
565 570 575
Ala Asp Asp Gly Ala Ala Val Ala Val Trp Thr Thr Pro Glu Ser Val
580 585 590
Glu Ala Gly Ala Val Phe Ala Glu Ile Gly Pro Arg Met Ala Glu Leu
595 600 605
Ser Gly Ser Arg Leu Ala Ala Gln Gln Gln Met Glu Gly Leu Leu Ala
610 615 620
Pro His Arg Pro Lys Glu Pro Ala Trp Phe Leu Ala Thr Val Gly Val
625 630 635 640
Ser Pro Asp His Gln Gly Lys Gly Leu Gly Ser Ala Val Val Leu Pro
645 650 655
Gly Val Glu Ala Ala Glu Arg Ala Gly Val Pro Ala Phe Leu Glu Thr
660 665 670
Ser Ala Pro Arg Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe Thr Val
675 680 685
Thr Ala Asp Val Glu Val Pro Glu Gly Pro Arg Thr Trp Cys Met Thr
690 695 700
Arg Lys Pro Gly Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr
705 710 715 720
Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Tyr Asp Gly Pro Arg
725 730 735
Leu Leu Leu Leu Leu Leu Leu Gly Val Ser Leu Gly Gly Ala Lys Glu
740 745 750
Ala Cys Pro Thr Gly Leu Tyr Thr His Ser Gly Glu Cys Cys Lys Ala
755 760 765
Cys Asn Leu Gly Glu Gly Val Ala Gln Pro Cys Gly Ala Asn Gln Thr
770 775 780
Val Cys Glu Pro Cys Leu Asp Ser Val Thr Phe Ser Asp Val Val Ser
785 790 795 800
Ala Thr Glu Pro Cys Lys Pro Cys Thr Glu Cys Val Gly Leu Gln Ser
805 810 815
Met Ser Ala Pro Cys Val Glu Ala Asp Asp Ala Val Cys Arg Cys Ala
820 825 830
Tyr Gly Tyr Tyr Gln Asp Glu Thr Thr Gly Arg Cys Glu Ala Cys Arg
835 840 845
Val Cys Glu Ala Gly Ser Gly Leu Val Phe Ser Cys Gln Asp Lys Gln
850 855 860
Asn Thr Val Cys Glu Glu Cys Pro Asp Gly Thr Tyr Ser Asp Glu Ala
865 870 875 880
Asn His Val Asp Pro Cys Leu Pro Cys Thr Val Cys Glu Asp Thr Glu
885 890 895
Arg Gln Leu Arg Glu Cys Thr Arg Trp Ala Asp Ala Glu Cys Glu Glu
900 905 910
Ile Pro Gly Arg Trp Ile Thr Arg Ser Thr Pro Pro Glu Gly Ser Asp
915 920 925
Ser Thr Ala Pro Ser Thr Gln Glu Pro Glu Ala Pro Pro Glu Gln Asp
930 935 940
Leu Ile Ala Ser Thr Val Ala Gly Val Val Thr Thr Val Met Gly Ser
945 950 955 960
Ser Gln Pro Val Val Thr Arg Gly Thr Thr Asp Asn Leu Ile Pro Val
965 970 975
Tyr Cys Ser Ile Leu Ala Ala Val Val Val Gly Leu Val Ala Tyr Ile
980 985 990
Ala Phe Lys Arg Trp Asn Ser
995
<210> 10
<211> 3000
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 10
atggctcttc ctgttacagc cctcctgctt cccctggcgc tgctgttgca cgccgcccgc 60
cccgacatcc agatgaccca gactacctcc tctctgagtg ctagcctggg ggaccgcgta 120
accatttcat gccgagcctc ccaggacatc tccaagtacc tgaattggta ccagcagaag 180
ccggacggca ccgtgaagct tcttatctac catactagcc gcctgcactc tggcgtccca 240
tccagatttt caggctccgg ctctggcacc gactactctc ttaccatctc taacctcgaa 300
caggaggaca tcgccaccta tttctgtcaa cagggcaaca cgctgcccta taccttcggc 360
ggtggcacca agctggagat caccggctct acctcgggca gcggcaaacc tggctccggg 420
gaaggcagca ccaagggaga ggtgaagctg caggagagcg gaccaggcct ggtggctccc 480
tcccagtccc tgtctgtgac ctgtaccgta tcgggggtct cactgccgga ctacggcgtt 540
agttggattc gccagccacc ccgcaagggt ctggagtggc tgggcgttat ctggggctcc 600
gagactacct actacaattc cgcgctgaag tcgcgcctga ctatcatcaa ggacaactcc 660
aagagccagg tgttcctgaa aatgaactcg ttgcagacgg atgacaccgc aatctattat 720
tgcgccaagc actactacta cggcggcagc tacgccatgg attactgggg tcagggtacc 780
tccgtgaccg tgtcctcgac aactactccc gcccccaggc ctcctactcc cgcgcccacc 840
atagcttccc agccgctatc tctccgccct gaagcgtgta ggccagctgc aggtggtgct 900
gtccacaccc gcggcttgga tttcgcttgc gacatttata tttgggcgcc gctcgccggc 960
acctgcgggg tcctgctgct gagcctggtg atcacacttt actgtaaacg cggaaggaag 1020
aagctgctgt acatcttcaa gcagcccttc atgcgcccgg tgcagactac acaagaggaa 1080
gatggatgca gctgtcgctt ccctgaggag gaggagggtg gatgcgagct gcgagtgaaa 1140
ttttcccgca gcgcggacgc acctgcctac cagcagggac agaaccagct gtacaacgag 1200
ctcaacctag gtcgccgcga ggagtacgac gtgctggaca agcgtcgcgg gcgggacccg 1260
gagatgggcg gcaagccccg tcgtaagaac cctcaggagg gcctttacaa cgagctgcag 1320
aaggacaaaa tggcggaggc ctacagtgag attggtatga agggcgagcg gcgcagagga 1380
aaaggccacg acgggttgta tcagggcctc tcgaccgcta cgaaggatac gtacgacgcg 1440
ctacacatgc aggccctgcc cccacgggga tccggcgcaa caaacttctc tctgctgaaa 1500
caagccggag atgtcgaaga gaatcctgga ccgaccgagt acaagcccac ggtgcgcctc 1560
gccacccgcg acgacgtccc cagggccgta cgcaccctcg ccgccgcgtt cgccgactac 1620
cccgccacgc gccacaccgt cgatccggac cgccacatcg agcgggtcac cgagctgcaa 1680
gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg tgtgggtcgc ggacgacggc 1740
gccgcggtgg cggtctggac cacgccggag agcgtcgaag cgggggcggt gttcgccgag 1800
atcggcccgc gcatggccga gttgagcggt tcccggctgg ccgcgcagca acagatggaa 1860
ggcctcctgg cgccgcaccg gcccaaggag cccgcgtggt tcctggccac cgtcggagtc 1920
tcgcccgacc accagggcaa gggtctgggc agcgccgtcg tgctccccgg agtggaggcg 1980
gccgagcgcg ccggggtgcc cgccttcctg gagacctccg cgccccgcaa cctccccttc 2040
tacgagcggc tcggcttcac cgtcaccgcc gacgtcgagg tgcccgaagg accgcgcacc 2100
tggtgcatga cccgcaagcc cggtgccggc agcggcgagg gcagaggcag cctgttaacc 2160
tgcggcgacg tggaggagaa cccaggtcct atgtacgacg ggccgcgcct gctgctgttg 2220
ctgcttctgg gggtgtccct tggaggtgcc aaggaggcat gccccacagg cctgtacaca 2280
cacagcggtg agtgctgcaa agcctgcaac ctgggcgagg gtgtggccca gccttgtgga 2340
gccaaccaga ccgtgtgtga gccctgcctg gacagcgtga cgttctccga cgtggtgagc 2400
gcgaccgagc cgtgcaagcc gtgcaccgag tgcgtggggc tccagagcat gtcggcgccg 2460
tgcgtggagg ccgacgacgc cgtgtgccgc tgcgcctacg gctactacca ggatgagacc 2520
actgggcgct gcgaggcgtg ccgcgtgtgc gaggcgggct cgggcctcgt gttctcctgc 2580
caggacaagc agaacaccgt gtgcgaggag tgccccgacg gcacgtattc cgacgaggcc 2640
aaccacgtgg acccgtgcct gccctgcacc gtgtgcgagg acaccgagcg ccagctccgc 2700
gagtgcacac gctgggccga cgccgagtgc gaggagatcc ctggccgttg gattacacgg 2760
tccacacccc cagagggctc ggacagcaca gcccccagca cccaggagcc tgaggcacct 2820
ccagaacaag acctcatagc cagcacggtg gcaggtgtgg tgaccacagt gatgggcagc 2880
tcccagcccg tggtgacccg aggcaccacc gacaacctca tccctgtcta ttgctccatc 2940
ctggctgctg tggttgtggg tcttgtggcc tacatagcct tcaagaggtg gaacagttga 3000
<210> 11
<211> 1155
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 11
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Gln Val Gln Leu Gln Gln Ser Gly Pro Glu Leu
20 25 30
Glu Lys Pro Gly Ala Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr
35 40 45
Ser Phe Thr Gly Tyr Thr Met Asn Trp Val Lys Gln Ser His Gly Lys
50 55 60
Ser Leu Glu Trp Ile Gly Leu Ile Thr Pro Tyr Asn Gly Ala Ser Ser
65 70 75 80
Tyr Asn Gln Lys Phe Arg Gly Lys Ala Thr Leu Thr Val Asp Lys Ser
85 90 95
Ser Ser Thr Ala Tyr Met Asp Leu Leu Ser Leu Thr Ser Glu Asp Ser
100 105 110
Ala Val Tyr Phe Cys Ala Arg Gly Gly Tyr Asp Gly Arg Gly Phe Asp
115 120 125
Tyr Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Gly Gly Gly Gly
130 135 140
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile Glu Leu Thr
145 150 155 160
Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly Glu Lys Val Thr Met
165 170 175
Thr Cys Ser Ala Ser Ser Ser Val Ser Tyr Met His Trp Tyr Gln Gln
180 185 190
Lys Ser Gly Thr Ser Pro Lys Arg Trp Ile Tyr Asp Thr Ser Lys Leu
195 200 205
Ala Ser Gly Val Pro Gly Arg Phe Ser Gly Ser Gly Ser Gly Asn Ser
210 215 220
Tyr Ser Leu Thr Ile Ser Ser Val Glu Ala Glu Asp Asp Ala Thr Tyr
225 230 235 240
Tyr Cys Gln Gln Trp Ser Gly Tyr Pro Leu Thr Phe Gly Ala Gly Thr
245 250 255
Lys Leu Glu Ile Ile Glu Val Met Tyr Pro Pro Pro Tyr Leu Asp Asn
260 265 270
Glu Lys Ser Asn Gly Thr Ile Ile His Val Lys Gly Lys His Leu Cys
275 280 285
Pro Ser Pro Leu Phe Pro Gly Pro Ser Lys Pro Phe Trp Val Leu Val
290 295 300
Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu Leu Val Thr Val Ala
305 310 315 320
Phe Ile Ile Phe Trp Val Arg Ser Lys Arg Ser Arg Leu Leu His Ser
325 330 335
Asp Tyr Met Asn Met Thr Pro Arg Arg Pro Gly Pro Thr Arg Lys His
340 345 350
Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe Ala Ala Tyr Arg Ser Arg
355 360 365
Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln
370 375 380
Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp
385 390 395 400
Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro
405 410 415
Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp
420 425 430
Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg
435 440 445
Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr
450 455 460
Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Thr Glu Tyr Lys Pro Thr Val Arg Leu Ala Thr
500 505 510
Arg Asp Asp Val Pro Arg Ala Val Arg Thr Leu Ala Ala Ala Phe Ala
515 520 525
Asp Tyr Pro Ala Thr Arg His Thr Val Asp Pro Asp Arg His Ile Glu
530 535 540
Arg Val Thr Glu Leu Gln Glu Leu Phe Leu Thr Arg Val Gly Leu Asp
545 550 555 560
Ile Gly Lys Val Trp Val Ala Asp Asp Gly Ala Ala Val Ala Val Trp
565 570 575
Thr Thr Pro Glu Ser Val Glu Ala Gly Ala Val Phe Ala Glu Ile Gly
580 585 590
Pro Arg Met Ala Glu Leu Ser Gly Ser Arg Leu Ala Ala Gln Gln Gln
595 600 605
Met Glu Gly Leu Leu Ala Pro His Arg Pro Lys Glu Pro Ala Trp Phe
610 615 620
Leu Ala Thr Val Gly Val Ser Pro Asp His Gln Gly Lys Gly Leu Gly
625 630 635 640
Ser Ala Val Val Leu Pro Gly Val Glu Ala Ala Glu Arg Ala Gly Val
645 650 655
Pro Ala Phe Leu Glu Thr Ser Ala Pro Arg Asn Leu Pro Phe Tyr Glu
660 665 670
Arg Leu Gly Phe Thr Val Thr Ala Asp Val Glu Val Pro Glu Gly Pro
675 680 685
Arg Thr Trp Cys Met Thr Arg Lys Pro Gly Ala Gly Ser Gly Glu Gly
690 695 700
Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro
705 710 715 720
Met Leu Leu Pro Trp Ala Thr Ser Ala Pro Gly Leu Ala Trp Gly Pro
725 730 735
Leu Val Leu Gly Leu Phe Gly Leu Leu Ala Ala Ser Gln Pro Gln Ala
740 745 750
Val Pro Pro Tyr Ala Ser Glu Asn Gln Thr Cys Arg Asp Gln Glu Lys
755 760 765
Glu Tyr Tyr Glu Pro Gln His Arg Ile Cys Cys Ser Arg Cys Pro Pro
770 775 780
Gly Thr Tyr Val Ser Ala Lys Cys Ser Arg Ile Arg Asp Thr Val Cys
785 790 795 800
Ala Thr Cys Ala Glu Asn Ser Tyr Asn Glu His Trp Asn Tyr Leu Thr
805 810 815
Ile Cys Gln Leu Cys Arg Pro Cys Asp Pro Val Met Gly Leu Glu Glu
820 825 830
Ile Ala Pro Cys Thr Ser Lys Arg Lys Thr Gln Cys Arg Cys Gln Pro
835 840 845
Gly Met Phe Cys Ala Ala Trp Ala Leu Glu Cys Thr His Cys Glu Leu
850 855 860
Leu Ser Asp Cys Pro Pro Gly Thr Glu Ala Glu Leu Lys Asp Glu Val
865 870 875 880
Gly Lys Gly Asn Asn His Cys Val Pro Cys Lys Ala Gly His Phe Gln
885 890 895
Asn Thr Ser Ser Pro Ser Ala Arg Cys Gln Pro His Thr Arg Cys Glu
900 905 910
Asn Gln Gly Leu Val Glu Ala Ala Pro Gly Thr Ala Gln Ser Asp Thr
915 920 925
Thr Cys Lys Asn Pro Leu Glu Pro Leu Pro Pro Glu Met Ser Gly Thr
930 935 940
Met Leu Met Leu Ala Val Leu Leu Pro Leu Ala Phe Phe Leu Leu Leu
945 950 955 960
Ala Thr Val Phe Ser Cys Ile Trp Lys Ser His Pro Ser Leu Cys Arg
965 970 975
Lys Leu Gly Ser Leu Leu Lys Arg Arg Pro Gln Gly Glu Gly Pro Asn
980 985 990
Pro Val Ala Gly Ser Trp Glu Pro Pro Lys Ala His Pro Tyr Phe Pro
995 1000 1005
Asp Leu Val Gln Pro Leu Leu Pro Ile Ser Gly Asp Val Ser Pro
1010 1015 1020
Val Ser Thr Gly Leu Pro Ala Ala Pro Val Leu Glu Ala Gly Val
1025 1030 1035
Pro Gln Gln Gln Ser Pro Leu Asp Leu Thr Arg Glu Pro Gln Leu
1040 1045 1050
Glu Pro Gly Glu Gln Ser Gln Val Ala His Gly Thr Asn Gly Ile
1055 1060 1065
His Val Thr Gly Gly Ser Met Thr Ile Thr Gly Asn Ile Tyr Ile
1070 1075 1080
Tyr Asn Gly Pro Val Leu Gly Gly Pro Pro Gly Pro Gly Asp Leu
1085 1090 1095
Pro Ala Thr Pro Glu Pro Pro Tyr Pro Ile Pro Glu Glu Gly Asp
1100 1105 1110
Pro Gly Pro Pro Gly Leu Ser Thr Pro His Gln Glu Asp Gly Lys
1115 1120 1125
Ala Trp His Leu Ala Glu Thr Glu His Cys Gly Ala Thr Pro Ser
1130 1135 1140
Asn Arg Gly Pro Arg Asn Gln Phe Ile Thr His Asp
1145 1150 1155
<210> 12
<211> 3468
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 12
atggcgctgc ccgtgactgc tttgttgctt ccattggcgc tcctgcttca cgccgctcgc 60
cctcaggtgc agctgcagca gagtggccct gagctcgaga agcctggcgc cagcgttaag 120
atatcttgca aggcttccgg ttattccttc accggctaca ccatgaactg ggtcaagcag 180
agccatggaa agtcgttgga atggatcggc cttatcaccc cctacaacgg tgcttcgtcc 240
tacaaccaga aatttcgtgg gaaggccacc ctgacagtcg acaaatccag ttccaccgcg 300
tacatggatc tgctgtctct gacgagcgag gacagcgccg tgtacttctg tgctcgcgga 360
ggctatgatg gccggggctt cgactattgg ggccagggca cgaccgtgac cgtcagctcc 420
ggtggcggag gatctggtgg cggtggatct ggcggcggag gtagtgacat tgagctgacc 480
cagagccctg ccatcatgtc tgcaagccca ggcgaaaagg tgacaatgac ctgctctgct 540
tcgtcctctg tgagctacat gcactggtac caacagaagt ctgggacctc cccgaaacgc 600
tggatctacg acacctccaa gctggcctcc ggcgttcccg ggcgcttcag cggctctgga 660
agtggcaact cctactccct gaccatttcg tccgtggagg ctgaagatga cgcaacctac 720
tactgtcaac agtggtctgg ataccccctg accttcggcg ctggaaccaa gctggagatc 780
attgaggtga tgtatccacc cccctatctg gacaacgaga aatcaaatgg caccatcatc 840
cacgtaaagg gcaagcacct gtgcccctct cctctgttcc ccggcccttc caagcccttc 900
tgggtgctag tggtggtagg gggcgtcctg gcgtgctact ccttgctggt cactgtggcg 960
ttcatcatct tctgggtccg gagcaagcgt tctcgcctgc tgcacagcga ttacatgaat 1020
atgactccgc gccgccccgg gccaacccgc aagcactacc agccgtacgc gcccccccgc 1080
gactttgccg cctaccgatc ccgcgtgaaa ttttcacgca gcgcggacgc cccggcctat 1140
cagcagggac agaaccagct ttacaacgag ctcaacctgg gcaggaggga ggagtacgat 1200
gtgctggaca agcgccgcgg tagagacccg gagatgggcg gtaagccgcg caggaagaac 1260
cctcaggagg gcctctacaa cgagctccag aaggacaaga tggccgaggc ttactctgag 1320
atcggtatga aaggcgagcg gcgccgtggc aaaggccatg acggcctgta ccagggtctc 1380
tcgactgcca ctaaggatac ttacgacgca ctgcacatgc aggccctgcc cccgcgcgga 1440
tccggcgcaa caaacttctc tctgctgaaa caagccggag atgtcgaaga gaatcctgga 1500
ccgaccgagt acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta 1560
cgcaccctcg ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac 1620
cgccacatcg agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac 1680
atcggcaagg tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag 1740
agcgtcgaag cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt 1800
tcccggctgg ccgcgcagca acagatggaa ggcctcctgg cgccgcaccg gcccaaggag 1860
cccgcgtggt tcctggccac cgtcggagtc tcgcccgacc accagggcaa gggtctgggc 1920
agcgccgtcg tgctccccgg agtggaggcg gccgagcgcg ccggggtgcc cgccttcctg 1980
gagacctccg cgccccgcaa cctccccttc tacgagcggc tcggcttcac cgtcaccgcc 2040
gacgtcgagg tgcccgaagg accgcgcacc tggtgcatga cccgcaagcc cggtgccggc 2100
agcggcgagg gcagaggcag cctgttaacc tgcggcgacg tggaggagaa cccaggtcct 2160
atgctcctgc cttgggccac ctctgccccc ggcctggcct gggggcctct ggtgctgggc 2220
ctcttcgggc tcctggcagc atcgcagccc caggcggtgc ctccatatgc gtcggagaac 2280
cagacctgca gggaccagga aaaggaatac tatgagcccc agcaccgcat ctgctgctcc 2340
cgctgcccgc caggcaccta tgtctcagct aaatgtagcc gcatccggga cacagtttgt 2400
gccacatgtg ccgagaattc ctacaacgag cactggaact acctgaccat ctgccagctg 2460
tgccgcccct gtgacccagt gatgggcctc gaggagattg ccccctgcac aagcaaacgg 2520
aagacccagt gccgctgcca gccgggaatg ttctgtgctg cctgggccct cgagtgtaca 2580
cactgcgagc tactttctga ctgcccgcct ggcactgaag ccgagctcaa agatgaagtt 2640
gggaagggta acaaccactg cgtcccctgc aaggccgggc acttccagaa tacctcctcc 2700
cccagcgccc gctgccagcc ccacaccagg tgtgagaacc aaggtctggt ggaggcagct 2760
ccaggcactg cccagtccga cacaacctgc aaaaatccat tagagccact gcccccagag 2820
atgtcaggaa ccatgctgat gctggccgtt ctgctgccac tggccttctt tctgctcctt 2880
gccaccgtct tctcctgcat ctggaagagc cacccttctc tctgcaggaa actgggatcg 2940
ctgctcaaga ggcgtccgca gggagaggga cccaatcctg tagctggaag ctgggagcct 3000
ccgaaggccc atccatactt ccctgacttg gtacagccac tgctacccat ttctggagat 3060
gtttccccag tatccactgg gctccccgca gccccagttt tggaggcagg ggtgccgcaa 3120
cagcagagtc ctctggacct gaccagggag ccgcagttgg aacccgggga gcagagccag 3180
gtggcccacg gtaccaatgg cattcatgtc accggcgggt ctatgactat cactggcaac 3240
atctacatct acaatggacc agtactgggg ggaccaccgg gtcctggaga cctcccagct 3300
acccccgaac ctccataccc cattcccgaa gagggggacc ctggccctcc cgggctctct 3360
acaccccacc aggaagatgg caaggcttgg cacctagcgg agacagagca ctgtggtgcc 3420
acaccctcta acaggggccc aaggaaccaa tttatcaccc atgactga 3468
<210> 13
<211> 1159
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 13
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Gln Val Gln Leu Gln Gln Ser Gly Pro Glu Leu
20 25 30
Glu Lys Pro Gly Ala Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr
35 40 45
Ser Phe Thr Gly Tyr Thr Met Asn Trp Val Lys Gln Ser His Gly Lys
50 55 60
Ser Leu Glu Trp Ile Gly Leu Ile Thr Pro Tyr Asn Gly Ala Ser Ser
65 70 75 80
Tyr Asn Gln Lys Phe Arg Gly Lys Ala Thr Leu Thr Val Asp Lys Ser
85 90 95
Ser Ser Thr Ala Tyr Met Asp Leu Leu Ser Leu Thr Ser Glu Asp Ser
100 105 110
Ala Val Tyr Phe Cys Ala Arg Gly Gly Tyr Asp Gly Arg Gly Phe Asp
115 120 125
Tyr Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Gly Gly Gly Gly
130 135 140
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile Glu Leu Thr
145 150 155 160
Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly Glu Lys Val Thr Met
165 170 175
Thr Cys Ser Ala Ser Ser Ser Val Ser Tyr Met His Trp Tyr Gln Gln
180 185 190
Lys Ser Gly Thr Ser Pro Lys Arg Trp Ile Tyr Asp Thr Ser Lys Leu
195 200 205
Ala Ser Gly Val Pro Gly Arg Phe Ser Gly Ser Gly Ser Gly Asn Ser
210 215 220
Tyr Ser Leu Thr Ile Ser Ser Val Glu Ala Glu Asp Asp Ala Thr Tyr
225 230 235 240
Tyr Cys Gln Gln Trp Ser Gly Tyr Pro Leu Thr Phe Gly Ala Gly Thr
245 250 255
Lys Leu Glu Ile Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala
260 265 270
Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg
275 280 285
Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys
290 295 300
Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu
305 310 315 320
Leu Ser Leu Val Ile Thr Leu Tyr Cys Lys Arg Gly Arg Lys Lys Leu
325 330 335
Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln
340 345 350
Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly
355 360 365
Cys Glu Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr
370 375 380
Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg
385 390 395 400
Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met
405 410 415
Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu
420 425 430
Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys
435 440 445
Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu
450 455 460
Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu
465 470 475 480
Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala
485 490 495
Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Glu Tyr Lys Pro Thr Val
500 505 510
Arg Leu Ala Thr Arg Asp Asp Val Pro Arg Ala Val Arg Thr Leu Ala
515 520 525
Ala Ala Phe Ala Asp Tyr Pro Ala Thr Arg His Thr Val Asp Pro Asp
530 535 540
Arg His Ile Glu Arg Val Thr Glu Leu Gln Glu Leu Phe Leu Thr Arg
545 550 555 560
Val Gly Leu Asp Ile Gly Lys Val Trp Val Ala Asp Asp Gly Ala Ala
565 570 575
Val Ala Val Trp Thr Thr Pro Glu Ser Val Glu Ala Gly Ala Val Phe
580 585 590
Ala Glu Ile Gly Pro Arg Met Ala Glu Leu Ser Gly Ser Arg Leu Ala
595 600 605
Ala Gln Gln Gln Met Glu Gly Leu Leu Ala Pro His Arg Pro Lys Glu
610 615 620
Pro Ala Trp Phe Leu Ala Thr Val Gly Val Ser Pro Asp His Gln Gly
625 630 635 640
Lys Gly Leu Gly Ser Ala Val Val Leu Pro Gly Val Glu Ala Ala Glu
645 650 655
Arg Ala Gly Val Pro Ala Phe Leu Glu Thr Ser Ala Pro Arg Asn Leu
660 665 670
Pro Phe Tyr Glu Arg Leu Gly Phe Thr Val Thr Ala Asp Val Glu Val
675 680 685
Pro Glu Gly Pro Arg Thr Trp Cys Met Thr Arg Lys Pro Gly Ala Gly
690 695 700
Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
705 710 715 720
Asn Pro Gly Pro Met Leu Leu Pro Trp Ala Thr Ser Ala Pro Gly Leu
725 730 735
Ala Trp Gly Pro Leu Val Leu Gly Leu Phe Gly Leu Leu Ala Ala Ser
740 745 750
Gln Pro Gln Ala Val Pro Pro Tyr Ala Ser Glu Asn Gln Thr Cys Arg
755 760 765
Asp Gln Glu Lys Glu Tyr Tyr Glu Pro Gln His Arg Ile Cys Cys Ser
770 775 780
Arg Cys Pro Pro Gly Thr Tyr Val Ser Ala Lys Cys Ser Arg Ile Arg
785 790 795 800
Asp Thr Val Cys Ala Thr Cys Ala Glu Asn Ser Tyr Asn Glu His Trp
805 810 815
Asn Tyr Leu Thr Ile Cys Gln Leu Cys Arg Pro Cys Asp Pro Val Met
820 825 830
Gly Leu Glu Glu Ile Ala Pro Cys Thr Ser Lys Arg Lys Thr Gln Cys
835 840 845
Arg Cys Gln Pro Gly Met Phe Cys Ala Ala Trp Ala Leu Glu Cys Thr
850 855 860
His Cys Glu Leu Leu Ser Asp Cys Pro Pro Gly Thr Glu Ala Glu Leu
865 870 875 880
Lys Asp Glu Val Gly Lys Gly Asn Asn His Cys Val Pro Cys Lys Ala
885 890 895
Gly His Phe Gln Asn Thr Ser Ser Pro Ser Ala Arg Cys Gln Pro His
900 905 910
Thr Arg Cys Glu Asn Gln Gly Leu Val Glu Ala Ala Pro Gly Thr Ala
915 920 925
Gln Ser Asp Thr Thr Cys Lys Asn Pro Leu Glu Pro Leu Pro Pro Glu
930 935 940
Met Ser Gly Thr Met Leu Met Leu Ala Val Leu Leu Pro Leu Ala Phe
945 950 955 960
Phe Leu Leu Leu Ala Thr Val Phe Ser Cys Ile Trp Lys Ser His Pro
965 970 975
Ser Leu Cys Arg Lys Leu Gly Ser Leu Leu Lys Arg Arg Pro Gln Gly
980 985 990
Glu Gly Pro Asn Pro Val Ala Gly Ser Trp Glu Pro Pro Lys Ala His
995 1000 1005
Pro Tyr Phe Pro Asp Leu Val Gln Pro Leu Leu Pro Ile Ser Gly
1010 1015 1020
Asp Val Ser Pro Val Ser Thr Gly Leu Pro Ala Ala Pro Val Leu
1025 1030 1035
Glu Ala Gly Val Pro Gln Gln Gln Ser Pro Leu Asp Leu Thr Arg
1040 1045 1050
Glu Pro Gln Leu Glu Pro Gly Glu Gln Ser Gln Val Ala His Gly
1055 1060 1065
Thr Asn Gly Ile His Val Thr Gly Gly Ser Met Thr Ile Thr Gly
1070 1075 1080
Asn Ile Tyr Ile Tyr Asn Gly Pro Val Leu Gly Gly Pro Pro Gly
1085 1090 1095
Pro Gly Asp Leu Pro Ala Thr Pro Glu Pro Pro Tyr Pro Ile Pro
1100 1105 1110
Glu Glu Gly Asp Pro Gly Pro Pro Gly Leu Ser Thr Pro His Gln
1115 1120 1125
Glu Asp Gly Lys Ala Trp His Leu Ala Glu Thr Glu His Cys Gly
1130 1135 1140
Ala Thr Pro Ser Asn Arg Gly Pro Arg Asn Gln Phe Ile Thr His
1145 1150 1155
Asp
<210> 14
<211> 3480
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 14
atggcgctgc ccgtgactgc tttgttgctt ccattggcgc tcctgcttca cgccgctcgc 60
cctcaggtgc agctgcagca gagtggccct gagctcgaga agcctggcgc cagcgttaag 120
atatcttgca aggcttccgg ttattccttc accggctaca ccatgaactg ggtcaagcag 180
agccatggaa agtcgttgga atggatcggc cttatcaccc cctacaacgg tgcttcgtcc 240
tacaaccaga aatttcgtgg gaaggccacc ctgacagtcg acaaatccag ttccaccgcg 300
tacatggatc tgctgtctct gacgagcgag gacagcgccg tgtacttctg tgctcgcgga 360
ggctatgatg gccggggctt cgactattgg ggccagggca cgaccgtgac cgtcagctcc 420
ggtggcggag gatctggtgg cggtggatct ggcggcggag gtagtgacat tgagctgacc 480
cagagccctg ccatcatgtc tgcaagccca ggcgaaaagg tgacaatgac ctgctctgct 540
tcgtcctctg tgagctacat gcactggtac caacagaagt ctgggacctc cccgaaacgc 600
tggatctacg acacctccaa gctggcctcc ggcgttcccg ggcgcttcag cggctctgga 660
agtggcaact cctactccct gaccatttcg tccgtggagg ctgaagatga cgcaacctac 720
tactgtcaac agtggtctgg ataccccctg accttcggcg ctggaaccaa gctggagatc 780
acaactactc ccgcccccag gcctcctact cccgcgccca ccatagcttc ccagccgcta 840
tctctccgcc ctgaagcgtg taggccagct gcaggtggtg ctgtccacac ccgcggcttg 900
gatttcgctt gcgacattta tatttgggcg ccgctcgccg gcacctgcgg ggtcctgctg 960
ctgagcctgg tgatcacact ttactgtaaa cgcggaagga agaagctgct gtacatcttc 1020
aagcagccct tcatgcgccc ggtgcagact acacaagagg aagatggatg cagctgtcgc 1080
ttccctgagg aggaggaggg tggatgcgag ctgcgagtga aattttcccg cagcgcggac 1140
gcacctgcct accagcaggg acagaaccag ctgtacaacg agctcaacct aggtcgccgc 1200
gaggagtacg acgtgctgga caagcgtcgc gggcgggacc cggagatggg cggcaagccc 1260
cgtcgtaaga accctcagga gggcctttac aacgagctgc agaaggacaa aatggcggag 1320
gcctacagtg agattggtat gaagggcgag cggcgcagag gaaaaggcca cgacgggttg 1380
tatcagggcc tctcgaccgc tacgaaggat acgtacgacg cgctacacat gcaggccctg 1440
cccccacggg gatccggcgc aacaaacttc tctctgctga aacaagccgg agatgtcgaa 1500
gagaatcctg gaccgaccga gtacaagccc acggtgcgcc tcgccacccg cgacgacgtc 1560
cccagggccg tacgcaccct cgccgccgcg ttcgccgact accccgccac gcgccacacc 1620
gtcgatccgg accgccacat cgagcgggtc accgagctgc aagaactctt cctcacgcgc 1680
gtcgggctcg acatcggcaa ggtgtgggtc gcggacgacg gcgccgcggt ggcggtctgg 1740
accacgccgg agagcgtcga agcgggggcg gtgttcgccg agatcggccc gcgcatggcc 1800
gagttgagcg gttcccggct ggccgcgcag caacagatgg aaggcctcct ggcgccgcac 1860
cggcccaagg agcccgcgtg gttcctggcc accgtcggag tctcgcccga ccaccagggc 1920
aagggtctgg gcagcgccgt cgtgctcccc ggagtggagg cggccgagcg cgccggggtg 1980
cccgccttcc tggagacctc cgcgccccgc aacctcccct tctacgagcg gctcggcttc 2040
accgtcaccg ccgacgtcga ggtgcccgaa ggaccgcgca cctggtgcat gacccgcaag 2100
cccggtgccg gcagcggcga gggcagaggc agcctgttaa cctgcggcga cgtggaggag 2160
aacccaggtc ctatgctcct gccttgggcc acctctgccc ccggcctggc ctgggggcct 2220
ctggtgctgg gcctcttcgg gctcctggca gcatcgcagc cccaggcggt gcctccatat 2280
gcgtcggaga accagacctg cagggaccag gaaaaggaat actatgagcc ccagcaccgc 2340
atctgctgct cccgctgccc gccaggcacc tatgtctcag ctaaatgtag ccgcatccgg 2400
gacacagttt gtgccacatg tgccgagaat tcctacaacg agcactggaa ctacctgacc 2460
atctgccagc tgtgccgccc ctgtgaccca gtgatgggcc tcgaggagat tgccccctgc 2520
acaagcaaac ggaagaccca gtgccgctgc cagccgggaa tgttctgtgc tgcctgggcc 2580
ctcgagtgta cacactgcga gctactttct gactgcccgc ctggcactga agccgagctc 2640
aaagatgaag ttgggaaggg taacaaccac tgcgtcccct gcaaggccgg gcacttccag 2700
aatacctcct cccccagcgc ccgctgccag ccccacacca ggtgtgagaa ccaaggtctg 2760
gtggaggcag ctccaggcac tgcccagtcc gacacaacct gcaaaaatcc attagagcca 2820
ctgcccccag agatgtcagg aaccatgctg atgctggccg ttctgctgcc actggccttc 2880
tttctgctcc ttgccaccgt cttctcctgc atctggaaga gccacccttc tctctgcagg 2940
aaactgggat cgctgctcaa gaggcgtccg cagggagagg gacccaatcc tgtagctgga 3000
agctgggagc ctccgaaggc ccatccatac ttccctgact tggtacagcc actgctaccc 3060
atttctggag atgtttcccc agtatccact gggctccccg cagccccagt tttggaggca 3120
ggggtgccgc aacagcagag tcctctggac ctgaccaggg agccgcagtt ggaacccggg 3180
gagcagagcc aggtggccca cggtaccaat ggcattcatg tcaccggcgg gtctatgact 3240
atcactggca acatctacat ctacaatgga ccagtactgg ggggaccacc gggtcctgga 3300
gacctcccag ctacccccga acctccatac cccattcccg aagaggggga ccctggccct 3360
cccgggctct ctacacccca ccaggaagat ggcaaggctt ggcacctagc ggagacagag 3420
cactgtggtg ccacaccctc taacaggggc ccaaggaacc aatttatcac ccatgactga 3480
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 15
acggaggcta agcgtcgcaa 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 16
cgcttccgcg gcccgttcaa 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 17
ttgctcaaat acaaagcctg 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 18
tgagagactc cagttgccag 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 19
ggcttccaca gacacaccca 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 20
caaccagcca gaaattgctg 20
<210> 21
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 21
Thr Thr Cys Cys Ala Gly Gly Gly Cys Thr Cys Cys Gly Ala Gly Cys
1 5 10 15
Cys Gly Cys Gly
20
<210> 22
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 22
Gly Thr Thr Gly Thr Thr Cys Thr Gly Gly Ala Ala Gly Thr Thr Gly
1 5 10 15
Ala Gly Gly Ala
20
<210> 23
<211> 615
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 23
Met Glu Thr Leu Leu Gly Leu Leu Ile Leu Trp Leu Gln Leu Gln Trp
1 5 10 15
Val Ser Ser Lys Gln Glu Val Thr Gln Ile Pro Ala Ala Leu Ser Val
20 25 30
Pro Glu Gly Glu Asn Leu Val Leu Asn Cys Ser Phe Thr Asp Ser Ala
35 40 45
Ile Tyr Asn Leu Gln Trp Phe Arg Gln Asp Pro Gly Lys Gly Leu Thr
50 55 60
Ser Leu Leu Leu Ile Gln Ser Ser Gln Arg Glu Gln Thr Ser Gly Arg
65 70 75 80
Leu Asn Ala Ser Leu Asp Lys Ser Ser Gly Arg Ser Thr Leu Tyr Ile
85 90 95
Ala Ala Ser Gln Pro Gly Asp Ser Ala Thr Tyr Leu Cys Ala Val Arg
100 105 110
Pro Thr Ser Gly Gly Ser Tyr Ile Pro Thr Phe Gly Arg Gly Thr Ser
115 120 125
Leu Ile Val His Pro Tyr Ile Gln Asn Pro Asp Pro Ala Val Tyr Gln
130 135 140
Leu Arg Asp Ser Lys Ser Ser Asp Lys Ser Val Cys Leu Phe Thr Asp
145 150 155 160
Phe Asp Ser Gln Thr Asn Val Ser Gln Ser Lys Asp Ser Asp Val Tyr
165 170 175
Ile Thr Asp Lys Thr Val Leu Asp Met Arg Ser Met Asp Phe Lys Ser
180 185 190
Asn Ser Ala Val Ala Trp Ser Asn Lys Ser Asp Phe Ala Cys Ala Asn
195 200 205
Ala Phe Asn Asn Ser Ile Ile Pro Glu Asp Thr Phe Phe Pro Ser Pro
210 215 220
Glu Ser Ser Cys Asp Val Lys Leu Val Glu Lys Ser Phe Glu Thr Asp
225 230 235 240
Thr Asn Leu Asn Phe Gln Asn Leu Ser Val Ile Gly Phe Arg Ile Leu
245 250 255
Leu Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp
260 265 270
Ser Ser Gly Ser Arg Ala Lys Arg Ser Gly Ser Gly Ala Thr Asn Phe
275 280 285
Ser Leu Leu Lys Gln Pro Gly Asp Val Glu Glu Asn Pro Gly Pro Arg
290 295 300
Met Ser Ile Gly Leu Leu Cys Cys Ala Ala Leu Ser Leu Leu Trp Ala
305 310 315 320
Gly Pro Val Asn Ala Gly Val Thr Gln Thr Pro Lys Phe Gln Val Leu
325 330 335
Lys Thr Gly Gln Ser Met Thr Leu Gln Cys Ala Gln Asp Met Asn His
340 345 350
Glu Tyr Met Ser Trp Tyr Arg Gln Asp Pro Gly Met Gly Leu Arg Leu
355 360 365
Ile His Tyr Ser Val Gly Ala Gly Ile Thr Asp Gln Gly Glu Val Pro
370 375 380
Asn Gly Tyr Asn Val Ser Arg Ser Thr Thr Glu Asp Phe Pro Leu Arg
385 390 395 400
Leu Leu Ser Ala Ala Pro Ser Gln Thr Ser Val Tyr Phe Cys Ala Ser
405 410 415
Ser Tyr Val Gly Asn Thr Gly Glu Leu Phe Phe Gly Glu Gly Ser Arg
420 425 430
Leu Thr Val Leu Glu Asp Leu Lys Asn Val Phe Pro Pro Glu Val Ala
435 440 445
Val Phe Glu Pro Ser Glu Ala Glu Ile Ser His Thr Gln Lys Ala Thr
450 455 460
Leu Val Cys Leu Ala Thr Gly Phe Tyr Pro Asp His Val Glu Leu Ser
465 470 475 480
Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro
485 490 495
Gln Pro Leu Lys Glu Gln Pro Ala Leu Asn Asp Ser Arg Tyr Cys Leu
500 505 510
Ser Ser Arg Leu Arg Val Ser Ala Thr Phe Trp Gln Asn Pro Arg Asn
515 520 525
His Phe Arg Cys Gln Val Gln Phe Tyr Gly Leu Ser Glu Asn Asp Glu
530 535 540
Trp Thr Gln Asp Arg Ala Lys Pro Val Thr Gln Ile Val Ser Ala Glu
545 550 555 560
Ala Trp Gly Arg Ala Asp Cys Gly Phe Thr Ser Glu Ser Tyr Gln Gln
565 570 575
Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala
580 585 590
Thr Leu Tyr Ala Val Leu Val Ser Ala Leu Val Leu Met Ala Met Val
595 600 605
Lys Arg Lys Asp Ser Arg Gly
610 615
<210> 24
<211> 1845
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 24
atggagaccc tgctgggcct gctgatcctg tggctgcagc tccagtgggt gtccagcaag 60
caggaggtga cccagatccc tgccgccctg agcgtgcccg agggcgagaa cctggtgctg 120
aactgcagct tcaccgactc cgccatctac aacctgcagt ggttccggca ggaccccggc 180
aagggcctga ccagcctgct gctgatccag agcagccagc gggagcagac cagcggacgg 240
ctgaacgcca gcctggacaa gagcagcggc cggagcaccc tgtacatcgc cgccagccag 300
cccggcgaca gcgccaccta cctgtgcgct gtgcggccta ccagcggcgg cagctacatc 360
cccaccttcg gcagaggcac cagcctgatc gtgcacccct acatccagaa ccccgacccc 420
gccgtgtacc agctgcggga cagcaagagc agcgacaagt ctgtgtgcct gttcaccgac 480
ttcgacagcc agaccaatgt gagccagagc aaggacagcg acgtgtacat caccgacaag 540
accgtgctgg acatgcggag catggacttc aagagcaaca gcgccgtggc ctggagcaac 600
aagagcgact tcgcctgcgc caacgccttc aacaacagca ttatccccga ggacaccttc 660
ttccccagcc ccgagagcag ctgcgacgtg aaactggtgg agaagagctt cgagaccgac 720
accaacctga acttccagaa cctgagcgtg atcggcttca gaatcctgct gctgaaggtg 780
gccggattca acctgctgat gaccctgcgg ctgtggagca gcggctcccg ggccaagaga 840
agcggatccg gcgccaccaa cttcagcctg ctgaagcagc ccggagacgt ggaagaaaac 900
cctggcccta ggatgagcat cggcctgctg tgctgcgccg ccctgagcct gctgtgggca 960
ggtccagtga atgctggtgt cactcagacc ccaaaattcc aggtgctgaa aaccggccag 1020
agcatgaccc tgcagtgcgc ccaggacatg aaccacgagt acatgagctg gtatcggcag 1080
gaccccggca tgggcctgcg gctgatccac tactctgtgg gagccggaat caccgaccag 1140
ggcgaggtgc ccaacggcta caatgtgagc cggagcacca ccgaggactt ccccctgcgg 1200
ctgctgagcg ctgcccccag ccagaccagc gtgtacttct gcgccagcag ctatgtgggc 1260
aacaccggcg agctgttctt cggcgagggc tccaggctga ccgtgctgga ggacctgaag 1320
aacgtgttcc cccccgaggt ggccgtgttc gagcccagcg aggccgagat cagccacacc 1380
cagaaggcca cactggtgtg tctggccacc ggcttctacc ccgaccacgt ggagctgtcc 1440
tggtgggtga acggcaagga ggtgcacagc ggcgtgtcta ccgaccccca gcccctgaag 1500
gagcagcccg ccctgaacga cagccggtac tgcctgtcct ccagactgag agtgagcgcc 1560
accttctggc agaacccccg gaaccacttc cggtgccagg tgcagttcta cggcctgagc 1620
gagaacgacg agtggaccca ggaccgggcc aagcccgtga cccagattgt gagcgccgag 1680
gcctggggca gggccgactg cggcttcacc agcgagagct accagcaggg cgtgctgagc 1740
gccaccatcc tgtacgagat cctgctgggc aaggccaccc tgtacgccgt gctggtgtct 1800
gccctggtgc tgatggctat ggtgaagcgg aaggacagcc ggggc 1845
<210> 25
<211> 2996
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 25
atggctcttc ctgttacagc cctcctgctt cccctggcgc tgctgttgca cgccgcccgc 60
cccgacatcc agatgaccca gactacctcc tctctgagtg ctagcctggg ggaccgcgta 120
accatttcat gccgagcctc ccaggacatc tccaagtacc tgaattggta ccagcagaag 180
ccggacggca ccgtgaagct tcttatctac catactagcc gcctgcactc tggcgtccca 240
tccagatttt caggctccgg ctctggcacc gactactctc ttaccatctc taacctcgaa 300
caggaggaca tcgccaccta tttctgtcaa cagggcaaca cgctgcccta taccttcggc 360
ggtggcacca agctggagat caccggctct acctcgggca gcggcaaacc tggctccggg 420
gaaggcagca ccaagggaga ggtgaagctg caggagagcg gaccaggcct ggtggctccc 480
tcccagtccc tgtctgtgac ctgtaccgta tcgggggtct cactgccgga ctacggcgtt 540
agttggattc gccagccacc ccgcaagggt ctggagtggc tgggcgttat ctggggctcc 600
gagactacct actacaattc cgcgctgaag tcgcgcctga ctatcatcaa ggacaactcc 660
aagagccagg tgttcctgaa aatgaactcg ttgcagacgg atgacaccgc aatctattat 720
tgcgccaagc actactacta cggcggcagc tacgccatgg attactgggg tcagggtacc 780
tccgtgaccg tgtcctcgac aactactccc gcccccaggc ctcctactcc cgcgcccacc 840
atagcttccc agccgctatc tctccgccct gaagcgtgta ggccagctgc aggtggtgct 900
gtccacaccc gcggcttgga tttcgcttgc gacatttata tttgggcgcc gctcgccggc 960
acctgcgggg tcctgctgct gagcctggtg atcacacttt actgtaaacg cggaaggaag 1020
aagctgctgt acatcttcaa gcagcccttc atgcgcccgg tgcagactac acaagaggaa 1080
gatggatgca gctgtcgctt ccctgaggag gaggagggtg gatgcgagct gcgagtgaaa 1140
ttttcccgca gcgcggacgc acctgcctac cagcagggac agaaccagct gtacaacgag 1200
ctcaacctag gtcgccgcga ggagtacgac gtgctggaca agcgtcgcgg gcgggacccg 1260
gagatgggcg gcaagccccg tcgtaagaac cctcaggagg gcctttacaa cgagctgcag 1320
aaggacaaaa tggcggaggc ctacagtgag attggtatga agggcgagcg gcgcagagga 1380
aaaggccacg acgggttgta tcagggcctc tcgaccgcta cgaaggatac gtacgacgcg 1440
ctacacatgc aggccctgcc cccacgggga tccggcgcaa caaacttctc tctgctgaaa 1500
caagccggag atgtcgaaga gaatcctgga ccgaccgagt acaagcccac ggtgcgcctc 1560
gccacccgcg acgacgtccc cagggccgta cgcaccctcg ccgccgcgtt cgccgactac 1620
cccgccacgc gccacaccgt cgatccggac cgccacatcg agcgggtcac cgagctgcaa 1680
gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg tgtgggtcgc ggacgacggc 1740
gccgcggtgg cggtctggac cacgccggag agcgtcgaag cgggggcggt gttcgccgag 1800
atcggcccgc gcatggccga gttgagcggt tcccggctgg ccgcgcagca acagatggaa 1860
ggcctcctgg cgccgcaccg gcccaaggag cccgcgtggt tcctggccac cgtcggagtc 1920
tcgcccgacc accagggcaa gggtctgggc agcgccgtcg tgctccccgg agtggaggcg 1980
gccgagcgcg ccggggtgcc cgccttcctg gagacctccg cgccccgcaa cctccccttc 2040
tacgagcggc tcggcttcac cgtcaccgcc gacgtcgagg tgcccgaagg accgcgcacc 2100
tggtgcatga cccgcaagcc cggtgccggc agcggcgagg gcagaggcag cctgttaacc 2160
tgcggcgacg tggaggagaa cccaggtcct atgtacgacg ggccgcgcct gctgctgttg 2220
ctgcttctgg gggtgtccct tggaggtgcc aaggaggcat gccccacagg cctgtacaca 2280
cacagcggtg agtgctgcaa agcctgcaac ctgggcgagg gtgtggccca gccttgtgga 2340
gccaaccaga ccgtgtgtga gccctgcctg gacagcgtga cgttctccga cgtggtgagc 2400
gcgaccgagc cgtgcaagcc gtgcaccgag tgcgtggggc tccagagcat gtcggcgccg 2460
tgcgtggagg ccgacgacgc cgtgtgccgc tgcgcctacg gctactacca ggatgagacc 2520
actgggcgct gcgaggcgtg ccgcgtgtgc gaggcgggct cgggcctcgt gttctcctgc 2580
caggacaagc agaacaccgt gtgcgaggag tgccccgacg gcacgtattc cgacgaggcc 2640
aaccacgtgg acccgtgcct gccctgcacc gtgtgcgagg acaccgagcg ccagctccgc 2700
gagtgcacac gctgggccga cgccgagtgc gaggagatcc ctggccgttg gattacacgg 2760
tccacacccc cagagggctc ggacagcaca gcccccagca cccaggagcc tgaggcacct 2820
ccagaacaag acctcatagc cagcacggtg gcaggtgtgg tgaccacagt gatgggcagc 2880
tcccagcccg tggtgacccg aggcaccacc gacaacctca tccctgtcta ttgctccatc 2940
ctggctgctg tggttgtggg tcttgtggcc tacatagcct tcaagaggtg gaacag 2996
<210> 26
<211> 998
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 26
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Thr Thr Thr Pro Ala Pro
260 265 270
Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu
275 280 285
Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg
290 295 300
Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly
305 310 315 320
Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys Lys
325 330 335
Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg
340 345 350
Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro
355 360 365
Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe Ser Arg Ser
370 375 380
Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu
385 390 395 400
Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg
405 410 415
Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln
420 425 430
Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr
435 440 445
Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp
450 455 460
Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala
465 470 475 480
Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe
485 490 495
Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr
500 505 510
Glu Tyr Lys Pro Thr Val Arg Leu Ala Thr Arg Asp Asp Val Pro Arg
515 520 525
Ala Val Arg Thr Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala Thr Arg
530 535 540
His Thr Val Asp Pro Asp Arg His Ile Glu Arg Val Thr Glu Leu Gln
545 550 555 560
Glu Leu Phe Leu Thr Arg Val Gly Leu Asp Ile Gly Lys Val Trp Val
565 570 575
Ala Asp Asp Gly Ala Ala Val Ala Val Trp Thr Thr Pro Glu Ser Val
580 585 590
Glu Ala Gly Ala Val Phe Ala Glu Ile Gly Pro Arg Met Ala Glu Leu
595 600 605
Ser Gly Ser Arg Leu Ala Ala Gln Gln Gln Met Glu Gly Leu Leu Ala
610 615 620
Pro His Arg Pro Lys Glu Pro Ala Trp Phe Leu Ala Thr Val Gly Val
625 630 635 640
Ser Pro Asp His Gln Gly Lys Gly Leu Gly Ser Ala Val Val Leu Pro
645 650 655
Gly Val Glu Ala Ala Glu Arg Ala Gly Val Pro Ala Phe Leu Glu Thr
660 665 670
Ser Ala Pro Arg Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe Thr Val
675 680 685
Thr Ala Asp Val Glu Val Pro Glu Gly Pro Arg Thr Trp Cys Met Thr
690 695 700
Arg Lys Pro Gly Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr
705 710 715 720
Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Tyr Asp Gly Pro Arg
725 730 735
Leu Leu Leu Leu Leu Leu Leu Gly Val Ser Leu Gly Gly Ala Lys Glu
740 745 750
Ala Cys Pro Thr Gly Leu Tyr Thr His Ser Gly Glu Cys Cys Lys Ala
755 760 765
Cys Asn Leu Gly Glu Gly Val Ala Gln Pro Cys Gly Ala Asn Gln Thr
770 775 780
Val Cys Glu Pro Cys Leu Asp Ser Val Thr Phe Ser Asp Val Val Ser
785 790 795 800
Ala Thr Glu Pro Cys Lys Pro Cys Thr Glu Cys Val Gly Leu Gln Ser
805 810 815
Met Ser Ala Pro Cys Val Glu Ala Asp Asp Ala Val Cys Arg Cys Ala
820 825 830
Tyr Gly Tyr Tyr Gln Asp Glu Thr Thr Gly Arg Cys Glu Ala Cys Arg
835 840 845
Val Cys Glu Ala Gly Ser Gly Leu Val Phe Ser Cys Gln Asp Lys Gln
850 855 860
Asn Thr Val Cys Glu Glu Cys Pro Asp Gly Thr Tyr Ser Asp Glu Ala
865 870 875 880
Asn His Val Asp Pro Cys Leu Pro Cys Thr Val Cys Glu Asp Thr Glu
885 890 895
Arg Gln Leu Arg Glu Cys Thr Arg Trp Ala Asp Ala Glu Cys Glu Glu
900 905 910
Ile Pro Gly Arg Trp Ile Thr Arg Ser Thr Pro Pro Glu Gly Ser Asp
915 920 925
Ser Thr Ala Pro Ser Thr Gln Glu Pro Glu Ala Pro Pro Glu Gln Asp
930 935 940
Leu Ile Ala Ser Thr Val Ala Gly Val Val Thr Thr Val Met Gly Ser
945 950 955 960
Ser Gln Pro Val Val Thr Arg Gly Thr Thr Asp Asn Leu Ile Pro Val
965 970 975
Tyr Cys Ser Ile Leu Ala Ala Val Val Val Gly Leu Val Ala Tyr Ile
980 985 990
Ala Phe Lys Arg Trp Asn
995
<210> 27
<211> 3495
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 27
atggctcttc ctgttacagc cctcctgctt cccctggcgc tgctgttgca cgccgcccgc 60
cccgacatcc agatgaccca gactacctcc tctctgagtg ctagcctggg ggaccgcgta 120
accatttcat gccgagcctc ccaggacatc tccaagtacc tgaattggta ccagcagaag 180
ccggacggca ccgtgaagct tcttatctac catactagcc gcctgcactc tggcgtccca 240
tccagatttt caggctccgg ctctggcacc gactactctc ttaccatctc taacctcgaa 300
caggaggaca tcgccaccta tttctgtcaa cagggcaaca cgctgcccta taccttcggc 360
ggtggcacca agctggagat caccggctct acctcgggca gcggcaaacc tggctccggg 420
gaaggcagca ccaagggaga ggtgaagctg caggagagcg gaccaggcct ggtggctccc 480
tcccagtccc tgtctgtgac ctgtaccgta tcgggggtct cactgccgga ctacggcgtt 540
agttggattc gccagccacc ccgcaagggt ctggagtggc tgggcgttat ctggggctcc 600
gagactacct actacaattc cgcgctgaag tcgcgcctga ctatcatcaa ggacaactcc 660
aagagccagg tgttcctgaa aatgaactcg ttgcagacgg atgacaccgc aatctattat 720
tgcgccaagc actactacta cggcggcagc tacgccatgg attactgggg tcagggtacc 780
tccgtgaccg tgtcctcgac aactactccc gcccccaggc ctcctactcc cgcgcccacc 840
atagcttccc agccgctatc tctccgccct gaagcgtgta ggccagctgc aggtggtgct 900
gtccacaccc gcggcttgga tttcgcttgc gacatttata tttgggcgcc gctcgccggc 960
acctgcgggg tcctgctgct gagcctggtg atcacacttt actgtaaacg cggaaggaag 1020
aagctgctgt acatcttcaa gcagcccttc atgcgcccgg tgcagactac acaagaggaa 1080
gatggatgca gctgtcgctt ccctgaggag gaggagggtg gatgcgagct gcgagtgaaa 1140
ttttcccgca gcgcggacgc acctgcctac cagcagggac agaaccagct gtacaacgag 1200
ctcaacctag gtcgccgcga ggagtacgac gtgctggaca agcgtcgcgg gcgggacccg 1260
gagatgggcg gcaagccccg tcgtaagaac cctcaggagg gcctttacaa cgagctgcag 1320
aaggacaaaa tggcggaggc ctacagtgag attggtatga agggcgagcg gcgcagagga 1380
aaaggccacg acgggttgta tcagggcctc tcgaccgcta cgaaggatac gtacgacgcg 1440
ctacacatgc aggccctgcc cccacgggga tccggcgcaa caaacttctc tctgctgaaa 1500
caagccggag atgtcgaaga gaatcctgga ccgaccgagt acaagcccac ggtgcgcctc 1560
gccacccgcg acgacgtccc cagggccgta cgcaccctcg ccgccgcgtt cgccgactac 1620
cccgccacgc gccacaccgt cgatccggac cgccacatcg agcgggtcac cgagctgcaa 1680
gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg tgtgggtcgc ggacgacggc 1740
gccgcggtgg cggtctggac cacgccggag agcgtcgaag cgggggcggt gttcgccgag 1800
atcggcccgc gcatggccga gttgagcggt tcccggctgg ccgcgcagca acagatggaa 1860
ggcctcctgg cgccgcaccg gcccaaggag cccgcgtggt tcctggccac cgtcggagtc 1920
tcgcccgacc accagggcaa gggtctgggc agcgccgtcg tgctccccgg agtggaggcg 1980
gccgagcgcg ccggggtgcc cgccttcctg gagacctccg cgccccgcaa cctccccttc 2040
tacgagcggc tcggcttcac cgtcaccgcc gacgtcgagg tgcccgaagg accgcgcacc 2100
tggtgcatga cccgcaagcc cggtgccggc agcggcgagg gcagaggcag cctgttaacc 2160
tgcggcgacg tggaggagaa cccaggtcct atgctcctgc cttgggccac ctctgccccc 2220
ggcctggcct gggggcctct ggtgctgggc ctcttcgggc tcctggcagc atcgcagccc 2280
caggcggtgc ctccatatgc gtcggagaac cagacctgca gggaccagga aaaggaatac 2340
tatgagcccc agcaccgcat ctgctgctcc cgctgcccgc caggcaccta tgtctcagct 2400
aaatgtagcc gcatccggga cacagtttgt gccacatgtg ccgagaattc ctacaacgag 2460
cactggaact acctgaccat ctgccagctg tgccgcccct gtgacccagt gatgggcctc 2520
gaggagattg ccccctgcac aagcaaacgg aagacccagt gccgctgcca gccgggaatg 2580
ttctgtgctg cctgggccct cgagtgtaca cactgcgagc tactttctga ctgcccgcct 2640
ggcactgaag ccgagctcaa agatgaagtt gggaagggta acaaccactg cgtcccctgc 2700
aaggccgggc acttccagaa tacctcctcc cccagcgccc gctgccagcc ccacaccagg 2760
tgtgagaacc aaggtctggt ggaggcagct ccaggcactg cccagtccga cacaacctgc 2820
aaaaatccat tagagccact gcccccagag atgtcaggaa ccatgctgat gctggccgtt 2880
ctgctgccac tggccttctt tctgctcctt gccaccgtct tctcctgcat ctggaagagc 2940
cacccttctc tctgcaggaa actgggatcg ctgctcaaga ggcgtccgca gggagaggga 3000
cccaatcctg tagctggaag ctgggagcct ccgaaggccc atccatactt ccctgacttg 3060
gtacagccac tgctacccat ttctggagat gtttccccag tatccactgg gctccccgca 3120
gccccagttt tggaggcagg ggtgccgcaa cagcagagtc ctctggacct gaccagggag 3180
ccgcagttgg aacccgggga gcagagccag gtggcccacg gtaccaatgg cattcatgtc 3240
accggcgggt ctatgactat cactggcaac atctacatct acaatggacc agtactgggg 3300
ggaccaccgg gtcctggaga cctcccagct acccccgaac ctccataccc cattcccgaa 3360
gagggggacc ctggccctcc cgggctctct acaccccacc aggaagatgg caaggcttgg 3420
cacctagcgg agacagagca ctgtggtgcc acaccctcta acaggggccc aaggaaccaa 3480
tttatcaccc atgac 3495
<210> 28
<211> 1165
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 28
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Thr Thr Thr Pro Ala Pro
260 265 270
Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu
275 280 285
Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg
290 295 300
Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly
305 310 315 320
Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys Lys
325 330 335
Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg
340 345 350
Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro
355 360 365
Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe Ser Arg Ser
370 375 380
Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu
385 390 395 400
Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg
405 410 415
Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln
420 425 430
Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr
435 440 445
Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp
450 455 460
Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala
465 470 475 480
Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe
485 490 495
Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr
500 505 510
Glu Tyr Lys Pro Thr Val Arg Leu Ala Thr Arg Asp Asp Val Pro Arg
515 520 525
Ala Val Arg Thr Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala Thr Arg
530 535 540
His Thr Val Asp Pro Asp Arg His Ile Glu Arg Val Thr Glu Leu Gln
545 550 555 560
Glu Leu Phe Leu Thr Arg Val Gly Leu Asp Ile Gly Lys Val Trp Val
565 570 575
Ala Asp Asp Gly Ala Ala Val Ala Val Trp Thr Thr Pro Glu Ser Val
580 585 590
Glu Ala Gly Ala Val Phe Ala Glu Ile Gly Pro Arg Met Ala Glu Leu
595 600 605
Ser Gly Ser Arg Leu Ala Ala Gln Gln Gln Met Glu Gly Leu Leu Ala
610 615 620
Pro His Arg Pro Lys Glu Pro Ala Trp Phe Leu Ala Thr Val Gly Val
625 630 635 640
Ser Pro Asp His Gln Gly Lys Gly Leu Gly Ser Ala Val Val Leu Pro
645 650 655
Gly Val Glu Ala Ala Glu Arg Ala Gly Val Pro Ala Phe Leu Glu Thr
660 665 670
Ser Ala Pro Arg Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe Thr Val
675 680 685
Thr Ala Asp Val Glu Val Pro Glu Gly Pro Arg Thr Trp Cys Met Thr
690 695 700
Arg Lys Pro Gly Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr
705 710 715 720
Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu Pro Trp Ala
725 730 735
Thr Ser Ala Pro Gly Leu Ala Trp Gly Pro Leu Val Leu Gly Leu Phe
740 745 750
Gly Leu Leu Ala Ala Ser Gln Pro Gln Ala Val Pro Pro Tyr Ala Ser
755 760 765
Glu Asn Gln Thr Cys Arg Asp Gln Glu Lys Glu Tyr Tyr Glu Pro Gln
770 775 780
His Arg Ile Cys Cys Ser Arg Cys Pro Pro Gly Thr Tyr Val Ser Ala
785 790 795 800
Lys Cys Ser Arg Ile Arg Asp Thr Val Cys Ala Thr Cys Ala Glu Asn
805 810 815
Ser Tyr Asn Glu His Trp Asn Tyr Leu Thr Ile Cys Gln Leu Cys Arg
820 825 830
Pro Cys Asp Pro Val Met Gly Leu Glu Glu Ile Ala Pro Cys Thr Ser
835 840 845
Lys Arg Lys Thr Gln Cys Arg Cys Gln Pro Gly Met Phe Cys Ala Ala
850 855 860
Trp Ala Leu Glu Cys Thr His Cys Glu Leu Leu Ser Asp Cys Pro Pro
865 870 875 880
Gly Thr Glu Ala Glu Leu Lys Asp Glu Val Gly Lys Gly Asn Asn His
885 890 895
Cys Val Pro Cys Lys Ala Gly His Phe Gln Asn Thr Ser Ser Pro Ser
900 905 910
Ala Arg Cys Gln Pro His Thr Arg Cys Glu Asn Gln Gly Leu Val Glu
915 920 925
Ala Ala Pro Gly Thr Ala Gln Ser Asp Thr Thr Cys Lys Asn Pro Leu
930 935 940
Glu Pro Leu Pro Pro Glu Met Ser Gly Thr Met Leu Met Leu Ala Val
945 950 955 960
Leu Leu Pro Leu Ala Phe Phe Leu Leu Leu Ala Thr Val Phe Ser Cys
965 970 975
Ile Trp Lys Ser His Pro Ser Leu Cys Arg Lys Leu Gly Ser Leu Leu
980 985 990
Lys Arg Arg Pro Gln Gly Glu Gly Pro Asn Pro Val Ala Gly Ser Trp
995 1000 1005
Glu Pro Pro Lys Ala His Pro Tyr Phe Pro Asp Leu Val Gln Pro
1010 1015 1020
Leu Leu Pro Ile Ser Gly Asp Val Ser Pro Val Ser Thr Gly Leu
1025 1030 1035
Pro Ala Ala Pro Val Leu Glu Ala Gly Val Pro Gln Gln Gln Ser
1040 1045 1050
Pro Leu Asp Leu Thr Arg Glu Pro Gln Leu Glu Pro Gly Glu Gln
1055 1060 1065
Ser Gln Val Ala His Gly Thr Asn Gly Ile His Val Thr Gly Gly
1070 1075 1080
Ser Met Thr Ile Thr Gly Asn Ile Tyr Ile Tyr Asn Gly Pro Val
1085 1090 1095
Leu Gly Gly Pro Pro Gly Pro Gly Asp Leu Pro Ala Thr Pro Glu
1100 1105 1110
Pro Pro Tyr Pro Ile Pro Glu Glu Gly Asp Pro Gly Pro Pro Gly
1115 1120 1125
Leu Ser Thr Pro His Gln Glu Asp Gly Lys Ala Trp His Leu Ala
1130 1135 1140
Glu Thr Glu His Cys Gly Ala Thr Pro Ser Asn Arg Gly Pro Arg
1145 1150 1155
Asn Gln Phe Ile Thr His Asp
1160 1165
<210> 29
<211> 2984
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 29
atggctcttc ctgttacagc cctcctgctt cccctggcgc tgctgttgca cgccgcccgc 60
cccgacatcc agatgaccca gactacctcc tctctgagtg ctagcctggg ggaccgcgta 120
accatttcat gccgagcctc ccaggacatc tccaagtacc tgaattggta ccagcagaag 180
ccggacggca ccgtgaagct tcttatctac catactagcc gcctgcactc tggcgtccca 240
tccagatttt caggctccgg ctctggcacc gactactctc ttaccatctc taacctcgaa 300
caggaggaca tcgccaccta tttctgtcaa cagggcaaca cgctgcccta taccttcggc 360
ggtggcacca agctggagat caccggctct acctcgggca gcggcaaacc tggctccggg 420
gaaggcagca ccaagggaga ggtgaagctg caggagagcg gaccaggcct ggtggctccc 480
tcccagtccc tgtctgtgac ctgtaccgta tcgggggtct cactgccgga ctacggcgtt 540
agttggattc gccagccacc ccgcaagggt ctggagtggc tgggcgttat ctggggctcc 600
gagactacct actacaattc cgcgctgaag tcgcgcctga ctatcatcaa ggacaactcc 660
aagagccagg tgttcctgaa aatgaactcg ttgcagacgg atgacaccgc aatctattat 720
tgcgccaagc actactacta cggcggcagc tacgccatgg attactgggg tcagggtacc 780
tccgtgaccg tgtcctcgat tgaggtgatg tatccacccc cctatctgga caacgagaaa 840
tcaaatggca ccatcatcca cgtaaagggc aagcacctgt gcccctctcc tctgttcccc 900
ggcccttcca agcccttctg ggtgctagtg gtggtagggg gcgtcctggc gtgctactcc 960
ttgctggtca ctgtggcgtt catcatcttc tgggtccgga gcaagcgttc tcgcctgctg 1020
cacagcgatt acatgaatat gactccgcgc cgccccgggc caacccgcaa gcactaccag 1080
ccgtacgcgc ccccccgcga ctttgccgcc taccgatccc gcgtgaaatt ttcacgcagc 1140
gcggacgccc cggcctatca gcagggacag aaccagcttt acaacgagct caacctgggc 1200
aggagggagg agtacgatgt gctggacaag cgccgcggta gagacccgga gatgggcggt 1260
aagccgcgca ggaagaaccc tcaggagggc ctctacaacg agctccagaa ggacaagatg 1320
gccgaggctt actctgagat cggtatgaaa ggcgagcggc gccgtggcaa aggccatgac 1380
ggcctgtacc agggtctctc gactgccact aaggatactt acgacgcact gcacatgcag 1440
gccctgcccc cgcgcggatc cggcgcaaca aacttctctc tgctgaaaca agccggagat 1500
gtcgaagaga atcctggacc gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac 1560
gacgtcccca gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc 1620
cacaccgtcg atccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc 1680
acgcgcgtcg ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg 1740
gtctggacca cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc 1800
atggccgagt tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg 1860
ccgcaccggc ccaaggagcc cgcgtggttc ctggccaccg tcggagtctc gcccgaccac 1920
cagggcaagg gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc 1980
ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc 2040
ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc 2100
cgcaagcccg gtgccggcag cggcgagggc agaggcagcc tgttaacctg cggcgacgtg 2160
gaggagaacc caggtcctat gtacgacggg ccgcgcctgc tgctgttgct gcttctgggg 2220
gtgtcccttg gaggtgccaa ggaggcatgc cccacaggcc tgtacacaca cagcggtgag 2280
tgctgcaaag cctgcaacct gggcgagggt gtggcccagc cttgtggagc caaccagacc 2340
gtgtgtgagc cctgcctgga cagcgtgacg ttctccgacg tggtgagcgc gaccgagccg 2400
tgcaagccgt gcaccgagtg cgtggggctc cagagcatgt cggcgccgtg cgtggaggcc 2460
gacgacgccg tgtgccgctg cgcctacggc tactaccagg atgagaccac tgggcgctgc 2520
gaggcgtgcc gcgtgtgcga ggcgggctcg ggcctcgtgt tctcctgcca ggacaagcag 2580
aacaccgtgt gcgaggagtg ccccgacggc acgtattccg acgaggccaa ccacgtggac 2640
ccgtgcctgc cctgcaccgt gtgcgaggac accgagcgcc agctccgcga gtgcacacgc 2700
tgggccgacg ccgagtgcga ggagatccct ggccgttgga ttacacggtc cacaccccca 2760
gagggctcgg acagcacagc ccccagcacc caggagcctg aggcacctcc agaacaagac 2820
ctcatagcca gcacggtggc aggtgtggtg accacagtga tgggcagctc ccagcccgtg 2880
gtgacccgag gcaccaccga caacctcatc cctgtctatt gctccatcct ggctgctgtg 2940
gttgtgggtc ttgtggccta catagccttc aagaggtgga acag 2984
<210> 30
<211> 994
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 30
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ile Glu Val Met Tyr Pro
260 265 270
Pro Pro Tyr Leu Asp Asn Glu Lys Ser Asn Gly Thr Ile Ile His Val
275 280 285
Lys Gly Lys His Leu Cys Pro Ser Pro Leu Phe Pro Gly Pro Ser Lys
290 295 300
Pro Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser
305 310 315 320
Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser Lys Arg
325 330 335
Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro
340 345 350
Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe
355 360 365
Ala Ala Tyr Arg Ser Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro
370 375 380
Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly
385 390 395 400
Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro
405 410 415
Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr
420 425 430
Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly
435 440 445
Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln
450 455 460
Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln
465 470 475 480
Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
485 490 495
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Glu Tyr Lys Pro
500 505 510
Thr Val Arg Leu Ala Thr Arg Asp Asp Val Pro Arg Ala Val Arg Thr
515 520 525
Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala Thr Arg His Thr Val Asp
530 535 540
Pro Asp Arg His Ile Glu Arg Val Thr Glu Leu Gln Glu Leu Phe Leu
545 550 555 560
Thr Arg Val Gly Leu Asp Ile Gly Lys Val Trp Val Ala Asp Asp Gly
565 570 575
Ala Ala Val Ala Val Trp Thr Thr Pro Glu Ser Val Glu Ala Gly Ala
580 585 590
Val Phe Ala Glu Ile Gly Pro Arg Met Ala Glu Leu Ser Gly Ser Arg
595 600 605
Leu Ala Ala Gln Gln Gln Met Glu Gly Leu Leu Ala Pro His Arg Pro
610 615 620
Lys Glu Pro Ala Trp Phe Leu Ala Thr Val Gly Val Ser Pro Asp His
625 630 635 640
Gln Gly Lys Gly Leu Gly Ser Ala Val Val Leu Pro Gly Val Glu Ala
645 650 655
Ala Glu Arg Ala Gly Val Pro Ala Phe Leu Glu Thr Ser Ala Pro Arg
660 665 670
Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe Thr Val Thr Ala Asp Val
675 680 685
Glu Val Pro Glu Gly Pro Arg Thr Trp Cys Met Thr Arg Lys Pro Gly
690 695 700
Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val
705 710 715 720
Glu Glu Asn Pro Gly Pro Met Tyr Asp Gly Pro Arg Leu Leu Leu Leu
725 730 735
Leu Leu Leu Gly Val Ser Leu Gly Gly Ala Lys Glu Ala Cys Pro Thr
740 745 750
Gly Leu Tyr Thr His Ser Gly Glu Cys Cys Lys Ala Cys Asn Leu Gly
755 760 765
Glu Gly Val Ala Gln Pro Cys Gly Ala Asn Gln Thr Val Cys Glu Pro
770 775 780
Cys Leu Asp Ser Val Thr Phe Ser Asp Val Val Ser Ala Thr Glu Pro
785 790 795 800
Cys Lys Pro Cys Thr Glu Cys Val Gly Leu Gln Ser Met Ser Ala Pro
805 810 815
Cys Val Glu Ala Asp Asp Ala Val Cys Arg Cys Ala Tyr Gly Tyr Tyr
820 825 830
Gln Asp Glu Thr Thr Gly Arg Cys Glu Ala Cys Arg Val Cys Glu Ala
835 840 845
Gly Ser Gly Leu Val Phe Ser Cys Gln Asp Lys Gln Asn Thr Val Cys
850 855 860
Glu Glu Cys Pro Asp Gly Thr Tyr Ser Asp Glu Ala Asn His Val Asp
865 870 875 880
Pro Cys Leu Pro Cys Thr Val Cys Glu Asp Thr Glu Arg Gln Leu Arg
885 890 895
Glu Cys Thr Arg Trp Ala Asp Ala Glu Cys Glu Glu Ile Pro Gly Arg
900 905 910
Trp Ile Thr Arg Ser Thr Pro Pro Glu Gly Ser Asp Ser Thr Ala Pro
915 920 925
Ser Thr Gln Glu Pro Glu Ala Pro Pro Glu Gln Asp Leu Ile Ala Ser
930 935 940
Thr Val Ala Gly Val Val Thr Thr Val Met Gly Ser Ser Gln Pro Val
945 950 955 960
Val Thr Arg Gly Thr Thr Asp Asn Leu Ile Pro Val Tyr Cys Ser Ile
965 970 975
Leu Ala Ala Val Val Val Gly Leu Val Ala Tyr Ile Ala Phe Lys Arg
980 985 990
Trp Asn
<210> 31
<211> 3483
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 31
atggctcttc ctgttacagc cctcctgctt cccctggcgc tgctgttgca cgccgcccgc 60
cccgacatcc agatgaccca gactacctcc tctctgagtg ctagcctggg ggaccgcgta 120
accatttcat gccgagcctc ccaggacatc tccaagtacc tgaattggta ccagcagaag 180
ccggacggca ccgtgaagct tcttatctac catactagcc gcctgcactc tggcgtccca 240
tccagatttt caggctccgg ctctggcacc gactactctc ttaccatctc taacctcgaa 300
caggaggaca tcgccaccta tttctgtcaa cagggcaaca cgctgcccta taccttcggc 360
ggtggcacca agctggagat caccggctct acctcgggca gcggcaaacc tggctccggg 420
gaaggcagca ccaagggaga ggtgaagctg caggagagcg gaccaggcct ggtggctccc 480
tcccagtccc tgtctgtgac ctgtaccgta tcgggggtct cactgccgga ctacggcgtt 540
agttggattc gccagccacc ccgcaagggt ctggagtggc tgggcgttat ctggggctcc 600
gagactacct actacaattc cgcgctgaag tcgcgcctga ctatcatcaa ggacaactcc 660
aagagccagg tgttcctgaa aatgaactcg ttgcagacgg atgacaccgc aatctattat 720
tgcgccaagc actactacta cggcggcagc tacgccatgg attactgggg tcagggtacc 780
tccgtgaccg tgtcctcgat tgaggtgatg tatccacccc cctatctgga caacgagaaa 840
tcaaatggca ccatcatcca cgtaaagggc aagcacctgt gcccctctcc tctgttcccc 900
ggcccttcca agcccttctg ggtgctagtg gtggtagggg gcgtcctggc gtgctactcc 960
ttgctggtca ctgtggcgtt catcatcttc tgggtccgga gcaagcgttc tcgcctgctg 1020
cacagcgatt acatgaatat gactccgcgc cgccccgggc caacccgcaa gcactaccag 1080
ccgtacgcgc ccccccgcga ctttgccgcc taccgatccc gcgtgaaatt ttcacgcagc 1140
gcggacgccc cggcctatca gcagggacag aaccagcttt acaacgagct caacctgggc 1200
aggagggagg agtacgatgt gctggacaag cgccgcggta gagacccgga gatgggcggt 1260
aagccgcgca ggaagaaccc tcaggagggc ctctacaacg agctccagaa ggacaagatg 1320
gccgaggctt actctgagat cggtatgaaa ggcgagcggc gccgtggcaa aggccatgac 1380
ggcctgtacc agggtctctc gactgccact aaggatactt acgacgcact gcacatgcag 1440
gccctgcccc cgcgcggatc cggcgcaaca aacttctctc tgctgaaaca agccggagat 1500
gtcgaagaga atcctggacc gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac 1560
gacgtcccca gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc 1620
cacaccgtcg atccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc 1680
acgcgcgtcg ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg 1740
gtctggacca cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc 1800
atggccgagt tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg 1860
ccgcaccggc ccaaggagcc cgcgtggttc ctggccaccg tcggagtctc gcccgaccac 1920
cagggcaagg gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc 1980
ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc 2040
ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc 2100
cgcaagcccg gtgccggcag cggcgagggc agaggcagcc tgttaacctg cggcgacgtg 2160
gaggagaacc caggtcctat gctcctgcct tgggccacct ctgcccccgg cctggcctgg 2220
gggcctctgg tgctgggcct cttcgggctc ctggcagcat cgcagcccca ggcggtgcct 2280
ccatatgcgt cggagaacca gacctgcagg gaccaggaaa aggaatacta tgagccccag 2340
caccgcatct gctgctcccg ctgcccgcca ggcacctatg tctcagctaa atgtagccgc 2400
atccgggaca cagtttgtgc cacatgtgcc gagaattcct acaacgagca ctggaactac 2460
ctgaccatct gccagctgtg ccgcccctgt gacccagtga tgggcctcga ggagattgcc 2520
ccctgcacaa gcaaacggaa gacccagtgc cgctgccagc cgggaatgtt ctgtgctgcc 2580
tgggccctcg agtgtacaca ctgcgagcta ctttctgact gcccgcctgg cactgaagcc 2640
gagctcaaag atgaagttgg gaagggtaac aaccactgcg tcccctgcaa ggccgggcac 2700
ttccagaata cctcctcccc cagcgcccgc tgccagcccc acaccaggtg tgagaaccaa 2760
ggtctggtgg aggcagctcc aggcactgcc cagtccgaca caacctgcaa aaatccatta 2820
gagccactgc ccccagagat gtcaggaacc atgctgatgc tggccgttct gctgccactg 2880
gccttctttc tgctccttgc caccgtcttc tcctgcatct ggaagagcca cccttctctc 2940
tgcaggaaac tgggatcgct gctcaagagg cgtccgcagg gagagggacc caatcctgta 3000
gctggaagct gggagcctcc gaaggcccat ccatacttcc ctgacttggt acagccactg 3060
ctacccattt ctggagatgt ttccccagta tccactgggc tccccgcagc cccagttttg 3120
gaggcagggg tgccgcaaca gcagagtcct ctggacctga ccagggagcc gcagttggaa 3180
cccggggagc agagccaggt ggcccacggt accaatggca ttcatgtcac cggcgggtct 3240
atgactatca ctggcaacat ctacatctac aatggaccag tactgggggg accaccgggt 3300
cctggagacc tcccagctac ccccgaacct ccatacccca ttcccgaaga gggggaccct 3360
ggccctcccg ggctctctac accccaccag gaagatggca aggcttggca cctagcggag 3420
acagagcact gtggtgccac accctctaac aggggcccaa ggaaccaatt tatcacccat 3480
gac 3483
<210> 32
<211> 1161
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 32
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ile Glu Val Met Tyr Pro
260 265 270
Pro Pro Tyr Leu Asp Asn Glu Lys Ser Asn Gly Thr Ile Ile His Val
275 280 285
Lys Gly Lys His Leu Cys Pro Ser Pro Leu Phe Pro Gly Pro Ser Lys
290 295 300
Pro Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser
305 310 315 320
Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser Lys Arg
325 330 335
Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro
340 345 350
Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe
355 360 365
Ala Ala Tyr Arg Ser Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro
370 375 380
Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly
385 390 395 400
Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro
405 410 415
Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr
420 425 430
Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly
435 440 445
Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln
450 455 460
Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln
465 470 475 480
Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
485 490 495
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Glu Tyr Lys Pro
500 505 510
Thr Val Arg Leu Ala Thr Arg Asp Asp Val Pro Arg Ala Val Arg Thr
515 520 525
Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala Thr Arg His Thr Val Asp
530 535 540
Pro Asp Arg His Ile Glu Arg Val Thr Glu Leu Gln Glu Leu Phe Leu
545 550 555 560
Thr Arg Val Gly Leu Asp Ile Gly Lys Val Trp Val Ala Asp Asp Gly
565 570 575
Ala Ala Val Ala Val Trp Thr Thr Pro Glu Ser Val Glu Ala Gly Ala
580 585 590
Val Phe Ala Glu Ile Gly Pro Arg Met Ala Glu Leu Ser Gly Ser Arg
595 600 605
Leu Ala Ala Gln Gln Gln Met Glu Gly Leu Leu Ala Pro His Arg Pro
610 615 620
Lys Glu Pro Ala Trp Phe Leu Ala Thr Val Gly Val Ser Pro Asp His
625 630 635 640
Gln Gly Lys Gly Leu Gly Ser Ala Val Val Leu Pro Gly Val Glu Ala
645 650 655
Ala Glu Arg Ala Gly Val Pro Ala Phe Leu Glu Thr Ser Ala Pro Arg
660 665 670
Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe Thr Val Thr Ala Asp Val
675 680 685
Glu Val Pro Glu Gly Pro Arg Thr Trp Cys Met Thr Arg Lys Pro Gly
690 695 700
Ala Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val
705 710 715 720
Glu Glu Asn Pro Gly Pro Met Leu Leu Pro Trp Ala Thr Ser Ala Pro
725 730 735
Gly Leu Ala Trp Gly Pro Leu Val Leu Gly Leu Phe Gly Leu Leu Ala
740 745 750
Ala Ser Gln Pro Gln Ala Val Pro Pro Tyr Ala Ser Glu Asn Gln Thr
755 760 765
Cys Arg Asp Gln Glu Lys Glu Tyr Tyr Glu Pro Gln His Arg Ile Cys
770 775 780
Cys Ser Arg Cys Pro Pro Gly Thr Tyr Val Ser Ala Lys Cys Ser Arg
785 790 795 800
Ile Arg Asp Thr Val Cys Ala Thr Cys Ala Glu Asn Ser Tyr Asn Glu
805 810 815
His Trp Asn Tyr Leu Thr Ile Cys Gln Leu Cys Arg Pro Cys Asp Pro
820 825 830
Val Met Gly Leu Glu Glu Ile Ala Pro Cys Thr Ser Lys Arg Lys Thr
835 840 845
Gln Cys Arg Cys Gln Pro Gly Met Phe Cys Ala Ala Trp Ala Leu Glu
850 855 860
Cys Thr His Cys Glu Leu Leu Ser Asp Cys Pro Pro Gly Thr Glu Ala
865 870 875 880
Glu Leu Lys Asp Glu Val Gly Lys Gly Asn Asn His Cys Val Pro Cys
885 890 895
Lys Ala Gly His Phe Gln Asn Thr Ser Ser Pro Ser Ala Arg Cys Gln
900 905 910
Pro His Thr Arg Cys Glu Asn Gln Gly Leu Val Glu Ala Ala Pro Gly
915 920 925
Thr Ala Gln Ser Asp Thr Thr Cys Lys Asn Pro Leu Glu Pro Leu Pro
930 935 940
Pro Glu Met Ser Gly Thr Met Leu Met Leu Ala Val Leu Leu Pro Leu
945 950 955 960
Ala Phe Phe Leu Leu Leu Ala Thr Val Phe Ser Cys Ile Trp Lys Ser
965 970 975
His Pro Ser Leu Cys Arg Lys Leu Gly Ser Leu Leu Lys Arg Arg Pro
980 985 990
Gln Gly Glu Gly Pro Asn Pro Val Ala Gly Ser Trp Glu Pro Pro Lys
995 1000 1005
Ala His Pro Tyr Phe Pro Asp Leu Val Gln Pro Leu Leu Pro Ile
1010 1015 1020
Ser Gly Asp Val Ser Pro Val Ser Thr Gly Leu Pro Ala Ala Pro
1025 1030 1035
Val Leu Glu Ala Gly Val Pro Gln Gln Gln Ser Pro Leu Asp Leu
1040 1045 1050
Thr Arg Glu Pro Gln Leu Glu Pro Gly Glu Gln Ser Gln Val Ala
1055 1060 1065
His Gly Thr Asn Gly Ile His Val Thr Gly Gly Ser Met Thr Ile
1070 1075 1080
Thr Gly Asn Ile Tyr Ile Tyr Asn Gly Pro Val Leu Gly Gly Pro
1085 1090 1095
Pro Gly Pro Gly Asp Leu Pro Ala Thr Pro Glu Pro Pro Tyr Pro
1100 1105 1110
Ile Pro Glu Glu Gly Asp Pro Gly Pro Pro Gly Leu Ser Thr Pro
1115 1120 1125
His Gln Glu Asp Gly Lys Ala Trp His Leu Ala Glu Thr Glu His
1130 1135 1140
Cys Gly Ala Thr Pro Ser Asn Arg Gly Pro Arg Asn Gln Phe Ile
1145 1150 1155
Thr His Asp
1160
<210> 33
<211> 2336
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 33
atggctcttc ctgttacagc cctcctgctt cccctggcgc tgctgttgca cgccgcccgc 60
cccgacatcc agatgaccca gactacctcc tctctgagtg ctagcctggg ggaccgcgta 120
accatttcat gccgagcctc ccaggacatc tccaagtacc tgaattggta ccagcagaag 180
ccggacggca ccgtgaagct tcttatctac catactagcc gcctgcactc tggcgtccca 240
tccagatttt caggctccgg ctctggcacc gactactctc ttaccatctc taacctcgaa 300
caggaggaca tcgccaccta tttctgtcaa cagggcaaca cgctgcccta taccttcggc 360
ggtggcacca agctggagat caccggctct acctcgggca gcggcaaacc tggctccggg 420
gaaggcagca ccaagggaga ggtgaagctg caggagagcg gaccaggcct ggtggctccc 480
tcccagtccc tgtctgtgac ctgtaccgta tcgggggtct cactgccgga ctacggcgtt 540
agttggattc gccagccacc ccgcaagggt ctggagtggc tgggcgttat ctggggctcc 600
gagactacct actacaattc cgcgctgaag tcgcgcctga ctatcatcaa ggacaactcc 660
aagagccagg tgttcctgaa aatgaactcg ttgcagacgg atgacaccgc aatctattat 720
tgcgccaagc actactacta cggcggcagc tacgccatgg attactgggg tcagggtacc 780
tccgtgaccg tgtcctcgac aactactccc gcccccaggc ctcctactcc cgcgcccacc 840
atagcttccc agccgctatc tctccgccct gaagcgtgta ggccagctgc aggtggtgct 900
gtccacaccc gcggcttgga tttcgcttgc gacatttata tttgggcgcc gctcgccggc 960
acctgcgggg tcctgctgct gagcctggtg atcacacttt actgtaaacg cggaaggaag 1020
aagctgctgt acatcttcaa gcagcccttc atgcgcccgg tgcagactac acaagaggaa 1080
gatggatgca gctgtcgctt ccctgaggag gaggagggtg gatgcgagct gcgagtgaaa 1140
ttttcccgca gcgcggacgc acctgcctac cagcagggac agaaccagct gtacaacgag 1200
ctcaacctag gtcgccgcga ggagtacgac gtgctggaca agcgtcgcgg gcgggacccg 1260
gagatgggcg gcaagccccg tcgtaagaac cctcaggagg gcctttacaa cgagctgcag 1320
aaggacaaaa tggcggaggc ctacagtgag attggtatga agggcgagcg gcgcagagga 1380
aaaggccacg acgggttgta tcagggcctc tcgaccgcta cgaaggatac gtacgacgcg 1440
ctacacatgc aggccctgcc cccacgggga tccggcgcaa caaacttctc tctgctgaaa 1500
caagccggag atgtcgaaga gaatcctgga ccgtacgacg ggccgcgcct gctgctgttg 1560
ctgcttctgg gggtgtccct tggaggtgcc aaggaggcat gccccacagg cctgtacaca 1620
cacagcggtg agtgctgcaa agcctgcaac ctgggcgagg gtgtggccca gccttgtgga 1680
gccaaccaga ccgtgtgtga gccctgcctg gacagcgtga cgttctccga cgtggtgagc 1740
gcgaccgagc cgtgcaagcc gtgcaccgag tgcgtggggc tccagagcat gtcggcgccg 1800
tgcgtggagg ccgacgacgc cgtgtgccgc tgcgcctacg gctactacca ggatgagacc 1860
actgggcgct gcgaggcgtg ccgcgtgtgc gaggcgggct cgggcctcgt gttctcctgc 1920
caggacaagc agaacaccgt gtgcgaggag tgccccgacg gcacgtattc cgacgaggcc 1980
aaccacgtgg acccgtgcct gccctgcacc gtgtgcgagg acaccgagcg ccagctccgc 2040
gagtgcacac gctgggccga cgccgagtgc gaggagatcc ctggccgttg gattacacgg 2100
tccacacccc cagagggctc ggacagcaca gcccccagca cccaggagcc tgaggcacct 2160
ccagaacaag acctcatagc cagcacggtg gcaggtgtgg tgaccacagt gatgggcagc 2220
tcccagcccg tggtgacccg aggcaccacc gacaacctca tccctgtcta ttgctccatc 2280
ctggctgctg tggttgtggg tcttgtggcc tacatagcct tcaagaggtg gaacag 2336
<210> 34
<211> 778
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 34
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Thr Thr Thr Pro Ala Pro
260 265 270
Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu
275 280 285
Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg
290 295 300
Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly
305 310 315 320
Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys Lys
325 330 335
Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg
340 345 350
Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro
355 360 365
Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe Ser Arg Ser
370 375 380
Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu
385 390 395 400
Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg
405 410 415
Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln
420 425 430
Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr
435 440 445
Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp
450 455 460
Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala
465 470 475 480
Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe
485 490 495
Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Tyr
500 505 510
Asp Gly Pro Arg Leu Leu Leu Leu Leu Leu Leu Gly Val Ser Leu Gly
515 520 525
Gly Ala Lys Glu Ala Cys Pro Thr Gly Leu Tyr Thr His Ser Gly Glu
530 535 540
Cys Cys Lys Ala Cys Asn Leu Gly Glu Gly Val Ala Gln Pro Cys Gly
545 550 555 560
Ala Asn Gln Thr Val Cys Glu Pro Cys Leu Asp Ser Val Thr Phe Ser
565 570 575
Asp Val Val Ser Ala Thr Glu Pro Cys Lys Pro Cys Thr Glu Cys Val
580 585 590
Gly Leu Gln Ser Met Ser Ala Pro Cys Val Glu Ala Asp Asp Ala Val
595 600 605
Cys Arg Cys Ala Tyr Gly Tyr Tyr Gln Asp Glu Thr Thr Gly Arg Cys
610 615 620
Glu Ala Cys Arg Val Cys Glu Ala Gly Ser Gly Leu Val Phe Ser Cys
625 630 635 640
Gln Asp Lys Gln Asn Thr Val Cys Glu Glu Cys Pro Asp Gly Thr Tyr
645 650 655
Ser Asp Glu Ala Asn His Val Asp Pro Cys Leu Pro Cys Thr Val Cys
660 665 670
Glu Asp Thr Glu Arg Gln Leu Arg Glu Cys Thr Arg Trp Ala Asp Ala
675 680 685
Glu Cys Glu Glu Ile Pro Gly Arg Trp Ile Thr Arg Ser Thr Pro Pro
690 695 700
Glu Gly Ser Asp Ser Thr Ala Pro Ser Thr Gln Glu Pro Glu Ala Pro
705 710 715 720
Pro Glu Gln Asp Leu Ile Ala Ser Thr Val Ala Gly Val Val Thr Thr
725 730 735
Val Met Gly Ser Ser Gln Pro Val Val Thr Arg Gly Thr Thr Asp Asn
740 745 750
Leu Ile Pro Val Tyr Cys Ser Ile Leu Ala Ala Val Val Val Gly Leu
755 760 765
Val Ala Tyr Ile Ala Phe Lys Arg Trp Asn
770 775
<210> 35
<211> 2324
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 35
atggctcttc ctgttacagc cctcctgctt cccctggcgc tgctgttgca cgccgcccgc 60
cccgacatcc agatgaccca gactacctcc tctctgagtg ctagcctggg ggaccgcgta 120
accatttcat gccgagcctc ccaggacatc tccaagtacc tgaattggta ccagcagaag 180
ccggacggca ccgtgaagct tcttatctac catactagcc gcctgcactc tggcgtccca 240
tccagatttt caggctccgg ctctggcacc gactactctc ttaccatctc taacctcgaa 300
caggaggaca tcgccaccta tttctgtcaa cagggcaaca cgctgcccta taccttcggc 360
ggtggcacca agctggagat caccggctct acctcgggca gcggcaaacc tggctccggg 420
gaaggcagca ccaagggaga ggtgaagctg caggagagcg gaccaggcct ggtggctccc 480
tcccagtccc tgtctgtgac ctgtaccgta tcgggggtct cactgccgga ctacggcgtt 540
agttggattc gccagccacc ccgcaagggt ctggagtggc tgggcgttat ctggggctcc 600
gagactacct actacaattc cgcgctgaag tcgcgcctga ctatcatcaa ggacaactcc 660
aagagccagg tgttcctgaa aatgaactcg ttgcagacgg atgacaccgc aatctattat 720
tgcgccaagc actactacta cggcggcagc tacgccatgg attactgggg tcagggtacc 780
tccgtgaccg tgtcctcgat tgaggtgatg tatccacccc cctatctgga caacgagaaa 840
tcaaatggca ccatcatcca cgtaaagggc aagcacctgt gcccctctcc tctgttcccc 900
ggcccttcca agcccttctg ggtgctagtg gtggtagggg gcgtcctggc gtgctactcc 960
ttgctggtca ctgtggcgtt catcatcttc tgggtccgga gcaagcgttc tcgcctgctg 1020
cacagcgatt acatgaatat gactccgcgc cgccccgggc caacccgcaa gcactaccag 1080
ccgtacgcgc ccccccgcga ctttgccgcc taccgatccc gcgtgaaatt ttcacgcagc 1140
gcggacgccc cggcctatca gcagggacag aaccagcttt acaacgagct caacctgggc 1200
aggagggagg agtacgatgt gctggacaag cgccgcggta gagacccgga gatgggcggt 1260
aagccgcgca ggaagaaccc tcaggagggc ctctacaacg agctccagaa ggacaagatg 1320
gccgaggctt actctgagat cggtatgaaa ggcgagcggc gccgtggcaa aggccatgac 1380
ggcctgtacc agggtctctc gactgccact aaggatactt acgacgcact gcacatgcag 1440
gccctgcccc cgcgcggatc cggcgcaaca aacttctctc tgctgaaaca agccggagat 1500
gtcgaagaga atcctggacc gtacgacggg ccgcgcctgc tgctgttgct gcttctgggg 1560
gtgtcccttg gaggtgccaa ggaggcatgc cccacaggcc tgtacacaca cagcggtgag 1620
tgctgcaaag cctgcaacct gggcgagggt gtggcccagc cttgtggagc caaccagacc 1680
gtgtgtgagc cctgcctgga cagcgtgacg ttctccgacg tggtgagcgc gaccgagccg 1740
tgcaagccgt gcaccgagtg cgtggggctc cagagcatgt cggcgccgtg cgtggaggcc 1800
gacgacgccg tgtgccgctg cgcctacggc tactaccagg atgagaccac tgggcgctgc 1860
gaggcgtgcc gcgtgtgcga ggcgggctcg ggcctcgtgt tctcctgcca ggacaagcag 1920
aacaccgtgt gcgaggagtg ccccgacggc acgtattccg acgaggccaa ccacgtggac 1980
ccgtgcctgc cctgcaccgt gtgcgaggac accgagcgcc agctccgcga gtgcacacgc 2040
tgggccgacg ccgagtgcga ggagatccct ggccgttgga ttacacggtc cacaccccca 2100
gagggctcgg acagcacagc ccccagcacc caggagcctg aggcacctcc agaacaagac 2160
ctcatagcca gcacggtggc aggtgtggtg accacagtga tgggcagctc ccagcccgtg 2220
gtgacccgag gcaccaccga caacctcatc cctgtctatt gctccatcct ggctgctgtg 2280
gttgtgggtc ttgtggccta catagccttc aagaggtgga acag 2324
<210> 36
<211> 774
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 36
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ile Glu Val Met Tyr Pro
260 265 270
Pro Pro Tyr Leu Asp Asn Glu Lys Ser Asn Gly Thr Ile Ile His Val
275 280 285
Lys Gly Lys His Leu Cys Pro Ser Pro Leu Phe Pro Gly Pro Ser Lys
290 295 300
Pro Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser
305 310 315 320
Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser Lys Arg
325 330 335
Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro
340 345 350
Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe
355 360 365
Ala Ala Tyr Arg Ser Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro
370 375 380
Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly
385 390 395 400
Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro
405 410 415
Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr
420 425 430
Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly
435 440 445
Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln
450 455 460
Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln
465 470 475 480
Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
485 490 495
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Tyr Asp Gly Pro Arg
500 505 510
Leu Leu Leu Leu Leu Leu Leu Gly Val Ser Leu Gly Gly Ala Lys Glu
515 520 525
Ala Cys Pro Thr Gly Leu Tyr Thr His Ser Gly Glu Cys Cys Lys Ala
530 535 540
Cys Asn Leu Gly Glu Gly Val Ala Gln Pro Cys Gly Ala Asn Gln Thr
545 550 555 560
Val Cys Glu Pro Cys Leu Asp Ser Val Thr Phe Ser Asp Val Val Ser
565 570 575
Ala Thr Glu Pro Cys Lys Pro Cys Thr Glu Cys Val Gly Leu Gln Ser
580 585 590
Met Ser Ala Pro Cys Val Glu Ala Asp Asp Ala Val Cys Arg Cys Ala
595 600 605
Tyr Gly Tyr Tyr Gln Asp Glu Thr Thr Gly Arg Cys Glu Ala Cys Arg
610 615 620
Val Cys Glu Ala Gly Ser Gly Leu Val Phe Ser Cys Gln Asp Lys Gln
625 630 635 640
Asn Thr Val Cys Glu Glu Cys Pro Asp Gly Thr Tyr Ser Asp Glu Ala
645 650 655
Asn His Val Asp Pro Cys Leu Pro Cys Thr Val Cys Glu Asp Thr Glu
660 665 670
Arg Gln Leu Arg Glu Cys Thr Arg Trp Ala Asp Ala Glu Cys Glu Glu
675 680 685
Ile Pro Gly Arg Trp Ile Thr Arg Ser Thr Pro Pro Glu Gly Ser Asp
690 695 700
Ser Thr Ala Pro Ser Thr Gln Glu Pro Glu Ala Pro Pro Glu Gln Asp
705 710 715 720
Leu Ile Ala Ser Thr Val Ala Gly Val Val Thr Thr Val Met Gly Ser
725 730 735
Ser Gln Pro Val Val Thr Arg Gly Thr Thr Asp Asn Leu Ile Pro Val
740 745 750
Tyr Cys Ser Ile Leu Ala Ala Val Val Val Gly Leu Val Ala Tyr Ile
755 760 765
Ala Phe Lys Arg Trp Asn
770
<210> 37
<211> 2834
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 37
atggctcttc ctgttacagc cctcctgctt cccctggcgc tgctgttgca cgccgcccgc 60
cccgacatcc agatgaccca gactacctcc tctctgagtg ctagcctggg ggaccgcgta 120
accatttcat gccgagcctc ccaggacatc tccaagtacc tgaattggta ccagcagaag 180
ccggacggca ccgtgaagct tcttatctac catactagcc gcctgcactc tggcgtccca 240
tccagatttt caggctccgg ctctggcacc gactactctc ttaccatctc taacctcgaa 300
caggaggaca tcgccaccta tttctgtcaa cagggcaaca cgctgcccta taccttcggc 360
ggtggcacca agctggagat caccggctct acctcgggca gcggcaaacc tggctccggg 420
gaaggcagca ccaagggaga ggtgaagctg caggagagcg gaccaggcct ggtggctccc 480
tcccagtccc tgtctgtgac ctgtaccgta tcgggggtct cactgccgga ctacggcgtt 540
agttggattc gccagccacc ccgcaagggt ctggagtggc tgggcgttat ctggggctcc 600
gagactacct actacaattc cgcgctgaag tcgcgcctga ctatcatcaa ggacaactcc 660
aagagccagg tgttcctgaa aatgaactcg ttgcagacgg atgacaccgc aatctattat 720
tgcgccaagc actactacta cggcggcagc tacgccatgg attactgggg tcagggtacc 780
tccgtgaccg tgtcctcgac aactactccc gcccccaggc ctcctactcc cgcgcccacc 840
atagcttccc agccgctatc tctccgccct gaagcgtgta ggccagctgc aggtggtgct 900
gtccacaccc gcggcttgga tttcgcttgc gacatttata tttgggcgcc gctcgccggc 960
acctgcgggg tcctgctgct gagcctggtg atcacacttt actgtaaacg cggaaggaag 1020
aagctgctgt acatcttcaa gcagcccttc atgcgcccgg tgcagactac acaagaggaa 1080
gatggatgca gctgtcgctt ccctgaggag gaggagggtg gatgcgagct gcgagtgaaa 1140
ttttcccgca gcgcggacgc acctgcctac cagcagggac agaaccagct gtacaacgag 1200
ctcaacctag gtcgccgcga ggagtacgac gtgctggaca agcgtcgcgg gcgggacccg 1260
gagatgggcg gcaagccccg tcgtaagaac cctcaggagg gcctttacaa cgagctgcag 1320
aaggacaaaa tggcggaggc ctacagtgag attggtatga agggcgagcg gcgcagagga 1380
aaaggccacg acgggttgta tcagggcctc tcgaccgcta cgaaggatac gtacgacgcg 1440
ctacacatgc aggccctgcc cccacgggga tccggcgcaa caaacttctc tctgctgaaa 1500
caagccggag atgtcgaaga gaatcctgga ccgctcctgc cttgggccac ctctgccccc 1560
ggcctggcct gggggcctct ggtgctgggc ctcttcgggc tcctggcagc atcgcagccc 1620
caggcggtgc ctccatatgc gtcggagaac cagacctgca gggaccagga aaaggaatac 1680
tatgagcccc agcaccgcat ctgctgctcc cgctgcccgc caggcaccta tgtctcagct 1740
aaatgtagcc gcatccggga cacagtttgt gccacatgtg ccgagaattc ctacaacgag 1800
cactggaact acctgaccat ctgccagctg tgccgcccct gtgacccagt gatgggcctc 1860
gaggagattg ccccctgcac aagcaaacgg aagacccagt gccgctgcca gccgggaatg 1920
ttctgtgctg cctgggccct cgagtgtaca cactgcgagc tactttctga ctgcccgcct 1980
ggcactgaag ccgagctcaa agatgaagtt gggaagggta acaaccactg cgtcccctgc 2040
aaggccgggc acttccagaa tacctcctcc cccagcgccc gctgccagcc ccacaccagg 2100
tgtgagaacc aaggtctggt ggaggcagct ccaggcactg cccagtccga cacaacctgc 2160
aaaaatccat tagagccact gcccccagag atgtcaggaa ccatgctgat gctggccgtt 2220
ctgctgccac tggccttctt tctgctcctt gccaccgtct tctcctgcat ctggaagagc 2280
cacccttctc tctgcaggaa actgggatcg ctgctcaaga ggcgtccgca gggagaggga 2340
cccaatcctg tagctggaag ctgggagcct ccgaaggccc atccatactt ccctgacttg 2400
gtacagccac tgctacccat ttctggagat gtttccccag tatccactgg gctccccgca 2460
gccccagttt tggaggcagg ggtgccgcaa cagcagagtc ctctggacct gaccagggag 2520
ccgcagttgg aacccgggga gcagagccag gtggcccacg gtaccaatgg cattcatgtc 2580
accggcgggt ctatgactat cactggcaac atctacatct acaatggacc agtactgggg 2640
ggaccaccgg gtcctggaga cctcccagct acccccgaac ctccataccc cattcccgaa 2700
gagggggacc ctggccctcc cgggctctct acaccccacc aggaagatgg caaggcttgg 2760
cacctagcgg agacagagca ctgtggtgcc acaccctcta acaggggccc aaggaaccaa 2820
tttatcaccc atga 2834
<210> 38
<211> 944
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 38
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Thr Thr Thr Pro Ala Pro
260 265 270
Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu
275 280 285
Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg
290 295 300
Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly
305 310 315 320
Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys Lys
325 330 335
Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg
340 345 350
Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro
355 360 365
Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe Ser Arg Ser
370 375 380
Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu
385 390 395 400
Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg
405 410 415
Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln
420 425 430
Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr
435 440 445
Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp
450 455 460
Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala
465 470 475 480
Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe
485 490 495
Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Leu
500 505 510
Leu Pro Trp Ala Thr Ser Ala Pro Gly Leu Ala Trp Gly Pro Leu Val
515 520 525
Leu Gly Leu Phe Gly Leu Leu Ala Ala Ser Gln Pro Gln Ala Val Pro
530 535 540
Pro Tyr Ala Ser Glu Asn Gln Thr Cys Arg Asp Gln Glu Lys Glu Tyr
545 550 555 560
Tyr Glu Pro Gln His Arg Ile Cys Cys Ser Arg Cys Pro Pro Gly Thr
565 570 575
Tyr Val Ser Ala Lys Cys Ser Arg Ile Arg Asp Thr Val Cys Ala Thr
580 585 590
Cys Ala Glu Asn Ser Tyr Asn Glu His Trp Asn Tyr Leu Thr Ile Cys
595 600 605
Gln Leu Cys Arg Pro Cys Asp Pro Val Met Gly Leu Glu Glu Ile Ala
610 615 620
Pro Cys Thr Ser Lys Arg Lys Thr Gln Cys Arg Cys Gln Pro Gly Met
625 630 635 640
Phe Cys Ala Ala Trp Ala Leu Glu Cys Thr His Cys Glu Leu Leu Ser
645 650 655
Asp Cys Pro Pro Gly Thr Glu Ala Glu Leu Lys Asp Glu Val Gly Lys
660 665 670
Gly Asn Asn His Cys Val Pro Cys Lys Ala Gly His Phe Gln Asn Thr
675 680 685
Ser Ser Pro Ser Ala Arg Cys Gln Pro His Thr Arg Cys Glu Asn Gln
690 695 700
Gly Leu Val Glu Ala Ala Pro Gly Thr Ala Gln Ser Asp Thr Thr Cys
705 710 715 720
Lys Asn Pro Leu Glu Pro Leu Pro Pro Glu Met Ser Gly Thr Met Leu
725 730 735
Met Leu Ala Val Leu Leu Pro Leu Ala Phe Phe Leu Leu Leu Ala Thr
740 745 750
Val Phe Ser Cys Ile Trp Lys Ser His Pro Ser Leu Cys Arg Lys Leu
755 760 765
Gly Ser Leu Leu Lys Arg Arg Pro Gln Gly Glu Gly Pro Asn Pro Val
770 775 780
Ala Gly Ser Trp Glu Pro Pro Lys Ala His Pro Tyr Phe Pro Asp Leu
785 790 795 800
Val Gln Pro Leu Leu Pro Ile Ser Gly Asp Val Ser Pro Val Ser Thr
805 810 815
Gly Leu Pro Ala Ala Pro Val Leu Glu Ala Gly Val Pro Gln Gln Gln
820 825 830
Ser Pro Leu Asp Leu Thr Arg Glu Pro Gln Leu Glu Pro Gly Glu Gln
835 840 845
Ser Gln Val Ala His Gly Thr Asn Gly Ile His Val Thr Gly Gly Ser
850 855 860
Met Thr Ile Thr Gly Asn Ile Tyr Ile Tyr Asn Gly Pro Val Leu Gly
865 870 875 880
Gly Pro Pro Gly Pro Gly Asp Leu Pro Ala Thr Pro Glu Pro Pro Tyr
885 890 895
Pro Ile Pro Glu Glu Gly Asp Pro Gly Pro Pro Gly Leu Ser Thr Pro
900 905 910
His Gln Glu Asp Gly Lys Ala Trp His Leu Ala Glu Thr Glu His Cys
915 920 925
Gly Ala Thr Pro Ser Asn Arg Gly Pro Arg Asn Gln Phe Ile Thr His
930 935 940
<210> 39
<211> 2822
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 39
atggctcttc ctgttacagc cctcctgctt cccctggcgc tgctgttgca cgccgcccgc 60
cccgacatcc agatgaccca gactacctcc tctctgagtg ctagcctggg ggaccgcgta 120
accatttcat gccgagcctc ccaggacatc tccaagtacc tgaattggta ccagcagaag 180
ccggacggca ccgtgaagct tcttatctac catactagcc gcctgcactc tggcgtccca 240
tccagatttt caggctccgg ctctggcacc gactactctc ttaccatctc taacctcgaa 300
caggaggaca tcgccaccta tttctgtcaa cagggcaaca cgctgcccta taccttcggc 360
ggtggcacca agctggagat caccggctct acctcgggca gcggcaaacc tggctccggg 420
gaaggcagca ccaagggaga ggtgaagctg caggagagcg gaccaggcct ggtggctccc 480
tcccagtccc tgtctgtgac ctgtaccgta tcgggggtct cactgccgga ctacggcgtt 540
agttggattc gccagccacc ccgcaagggt ctggagtggc tgggcgttat ctggggctcc 600
gagactacct actacaattc cgcgctgaag tcgcgcctga ctatcatcaa ggacaactcc 660
aagagccagg tgttcctgaa aatgaactcg ttgcagacgg atgacaccgc aatctattat 720
tgcgccaagc actactacta cggcggcagc tacgccatgg attactgggg tcagggtacc 780
tccgtgaccg tgtcctcgat tgaggtgatg tatccacccc cctatctgga caacgagaaa 840
tcaaatggca ccatcatcca cgtaaagggc aagcacctgt gcccctctcc tctgttcccc 900
ggcccttcca agcccttctg ggtgctagtg gtggtagggg gcgtcctggc gtgctactcc 960
ttgctggtca ctgtggcgtt catcatcttc tgggtccgga gcaagcgttc tcgcctgctg 1020
cacagcgatt acatgaatat gactccgcgc cgccccgggc caacccgcaa gcactaccag 1080
ccgtacgcgc ccccccgcga ctttgccgcc taccgatccc gcgtgaaatt ttcacgcagc 1140
gcggacgccc cggcctatca gcagggacag aaccagcttt acaacgagct caacctgggc 1200
aggagggagg agtacgatgt gctggacaag cgccgcggta gagacccgga gatgggcggt 1260
aagccgcgca ggaagaaccc tcaggagggc ctctacaacg agctccagaa ggacaagatg 1320
gccgaggctt actctgagat cggtatgaaa ggcgagcggc gccgtggcaa aggccatgac 1380
ggcctgtacc agggtctctc gactgccact aaggatactt acgacgcact gcacatgcag 1440
gccctgcccc cgcgcggatc cggcgcaaca aacttctctc tgctgaaaca agccggagat 1500
gtcgaagaga atcctggacc gctcctgcct tgggccacct ctgcccccgg cctggcctgg 1560
gggcctctgg tgctgggcct cttcgggctc ctggcagcat cgcagcccca ggcggtgcct 1620
ccatatgcgt cggagaacca gacctgcagg gaccaggaaa aggaatacta tgagccccag 1680
caccgcatct gctgctcccg ctgcccgcca ggcacctatg tctcagctaa atgtagccgc 1740
atccgggaca cagtttgtgc cacatgtgcc gagaattcct acaacgagca ctggaactac 1800
ctgaccatct gccagctgtg ccgcccctgt gacccagtga tgggcctcga ggagattgcc 1860
ccctgcacaa gcaaacggaa gacccagtgc cgctgccagc cgggaatgtt ctgtgctgcc 1920
tgggccctcg agtgtacaca ctgcgagcta ctttctgact gcccgcctgg cactgaagcc 1980
gagctcaaag atgaagttgg gaagggtaac aaccactgcg tcccctgcaa ggccgggcac 2040
ttccagaata cctcctcccc cagcgcccgc tgccagcccc acaccaggtg tgagaaccaa 2100
ggtctggtgg aggcagctcc aggcactgcc cagtccgaca caacctgcaa aaatccatta 2160
gagccactgc ccccagagat gtcaggaacc atgctgatgc tggccgttct gctgccactg 2220
gccttctttc tgctccttgc caccgtcttc tcctgcatct ggaagagcca cccttctctc 2280
tgcaggaaac tgggatcgct gctcaagagg cgtccgcagg gagagggacc caatcctgta 2340
gctggaagct gggagcctcc gaaggcccat ccatacttcc ctgacttggt acagccactg 2400
ctacccattt ctggagatgt ttccccagta tccactgggc tccccgcagc cccagttttg 2460
gaggcagggg tgccgcaaca gcagagtcct ctggacctga ccagggagcc gcagttggaa 2520
cccggggagc agagccaggt ggcccacggt accaatggca ttcatgtcac cggcgggtct 2580
atgactatca ctggcaacat ctacatctac aatggaccag tactgggggg accaccgggt 2640
cctggagacc tcccagctac ccccgaacct ccatacccca ttcccgaaga gggggaccct 2700
ggccctcccg ggctctctac accccaccag gaagatggca aggcttggca cctagcggag 2760
acagagcact gtggtgccac accctctaac aggggcccaa ggaaccaatt tatcacccat 2820
ga 2822
<210> 40
<211> 940
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 40
Met Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu
1 5 10 15
His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu
20 25 30
Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln
35 40 45
Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr
50 55 60
Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile
85 90 95
Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly
100 105 110
Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro
145 150 155 160
Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro
165 170 175
Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu
180 185 190
Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala
195 200 205
Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val
210 215 220
Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp
245 250 255
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ile Glu Val Met Tyr Pro
260 265 270
Pro Pro Tyr Leu Asp Asn Glu Lys Ser Asn Gly Thr Ile Ile His Val
275 280 285
Lys Gly Lys His Leu Cys Pro Ser Pro Leu Phe Pro Gly Pro Ser Lys
290 295 300
Pro Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser
305 310 315 320
Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser Lys Arg
325 330 335
Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro
340 345 350
Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe
355 360 365
Ala Ala Tyr Arg Ser Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro
370 375 380
Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly
385 390 395 400
Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro
405 410 415
Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr
420 425 430
Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly
435 440 445
Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln
450 455 460
Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln
465 470 475 480
Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
485 490 495
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Leu Pro Trp Ala
500 505 510
Thr Ser Ala Pro Gly Leu Ala Trp Gly Pro Leu Val Leu Gly Leu Phe
515 520 525
Gly Leu Leu Ala Ala Ser Gln Pro Gln Ala Val Pro Pro Tyr Ala Ser
530 535 540
Glu Asn Gln Thr Cys Arg Asp Gln Glu Lys Glu Tyr Tyr Glu Pro Gln
545 550 555 560
His Arg Ile Cys Cys Ser Arg Cys Pro Pro Gly Thr Tyr Val Ser Ala
565 570 575
Lys Cys Ser Arg Ile Arg Asp Thr Val Cys Ala Thr Cys Ala Glu Asn
580 585 590
Ser Tyr Asn Glu His Trp Asn Tyr Leu Thr Ile Cys Gln Leu Cys Arg
595 600 605
Pro Cys Asp Pro Val Met Gly Leu Glu Glu Ile Ala Pro Cys Thr Ser
610 615 620
Lys Arg Lys Thr Gln Cys Arg Cys Gln Pro Gly Met Phe Cys Ala Ala
625 630 635 640
Trp Ala Leu Glu Cys Thr His Cys Glu Leu Leu Ser Asp Cys Pro Pro
645 650 655
Gly Thr Glu Ala Glu Leu Lys Asp Glu Val Gly Lys Gly Asn Asn His
660 665 670
Cys Val Pro Cys Lys Ala Gly His Phe Gln Asn Thr Ser Ser Pro Ser
675 680 685
Ala Arg Cys Gln Pro His Thr Arg Cys Glu Asn Gln Gly Leu Val Glu
690 695 700
Ala Ala Pro Gly Thr Ala Gln Ser Asp Thr Thr Cys Lys Asn Pro Leu
705 710 715 720
Glu Pro Leu Pro Pro Glu Met Ser Gly Thr Met Leu Met Leu Ala Val
725 730 735
Leu Leu Pro Leu Ala Phe Phe Leu Leu Leu Ala Thr Val Phe Ser Cys
740 745 750
Ile Trp Lys Ser His Pro Ser Leu Cys Arg Lys Leu Gly Ser Leu Leu
755 760 765
Lys Arg Arg Pro Gln Gly Glu Gly Pro Asn Pro Val Ala Gly Ser Trp
770 775 780
Glu Pro Pro Lys Ala His Pro Tyr Phe Pro Asp Leu Val Gln Pro Leu
785 790 795 800
Leu Pro Ile Ser Gly Asp Val Ser Pro Val Ser Thr Gly Leu Pro Ala
805 810 815
Ala Pro Val Leu Glu Ala Gly Val Pro Gln Gln Gln Ser Pro Leu Asp
820 825 830
Leu Thr Arg Glu Pro Gln Leu Glu Pro Gly Glu Gln Ser Gln Val Ala
835 840 845
His Gly Thr Asn Gly Ile His Val Thr Gly Gly Ser Met Thr Ile Thr
850 855 860
Gly Asn Ile Tyr Ile Tyr Asn Gly Pro Val Leu Gly Gly Pro Pro Gly
865 870 875 880
Pro Gly Asp Leu Pro Ala Thr Pro Glu Pro Pro Tyr Pro Ile Pro Glu
885 890 895
Glu Gly Asp Pro Gly Pro Pro Gly Leu Ser Thr Pro His Gln Glu Asp
900 905 910
Gly Lys Ala Trp His Leu Ala Glu Thr Glu His Cys Gly Ala Thr Pro
915 920 925
Ser Asn Arg Gly Pro Arg Asn Gln Phe Ile Thr His
930 935 940
<210> 41
<211> 2337
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 41
atgtacgacg ggccgcgcct gctgctgttg ctgcttctgg gggtgtccct tggaggtgcc 60
aaggaggcat gccccacagg cctgtacaca cacagcggtg agtgctgcaa agcctgcaac 120
ctgggcgagg gtgtggccca gccttgtgga gccaaccaga ccgtgtgtga gccctgcctg 180
gacagcgtga cgttctccga cgtggtgagc gcgaccgagc cgtgcaagcc gtgcaccgag 240
tgcgtggggc tccagagcat gtcggcgccg tgcgtggagg ccgacgacgc cgtgtgccgc 300
tgcgcctacg gctactacca ggatgagacc actgggcgct gcgaggcgtg ccgcgtgtgc 360
gaggcgggct cgggcctcgt gttctcctgc caggacaagc agaacaccgt gtgcgaggag 420
tgccccgacg gcacgtattc cgacgaggcc aaccacgtgg acccgtgcct gccctgcacc 480
gtgtgcgagg acaccgagcg ccagctccgc gagtgcacac gctgggccga cgccgagtgc 540
gaggagatcc ctggccgttg gattacacgg tccacacccc cagagggctc ggacagcaca 600
gcccccagca cccaggagcc tgaggcacct ccagaacaag acctcatagc cagcacggtg 660
gcaggtgtgg tgaccacagt gatgggcagc tcccagcccg tggtgacccg aggcaccacc 720
gacaacctca tccctgtcta ttgctccatc ctggctgctg tggttgtggg tcttgtggcc 780
tacatagcct tcaagaggtg gaacagtgga tccggcgcaa caaacttctc tctgctgaaa 840
caagccggag atgtcgaaga gaatcctgga ccggctcttc ctgttacagc cctcctgctt 900
cccctggcgc tgctgttgca cgccgcccgc cccgacatcc agatgaccca gactacctcc 960
tctctgagtg ctagcctggg ggaccgcgta accatttcat gccgagcctc ccaggacatc 1020
tccaagtacc tgaattggta ccagcagaag ccggacggca ccgtgaagct tcttatctac 1080
catactagcc gcctgcactc tggcgtccca tccagatttt caggctccgg ctctggcacc 1140
gactactctc ttaccatctc taacctcgaa caggaggaca tcgccaccta tttctgtcaa 1200
cagggcaaca cgctgcccta taccttcggc ggtggcacca agctggagat caccggctct 1260
acctcgggca gcggcaaacc tggctccggg gaaggcagca ccaagggaga ggtgaagctg 1320
caggagagcg gaccaggcct ggtggctccc tcccagtccc tgtctgtgac ctgtaccgta 1380
tcgggggtct cactgccgga ctacggcgtt agttggattc gccagccacc ccgcaagggt 1440
ctggagtggc tgggcgttat ctggggctcc gagactacct actacaattc cgcgctgaag 1500
tcgcgcctga ctatcatcaa ggacaactcc aagagccagg tgttcctgaa aatgaactcg 1560
ttgcagacgg atgacaccgc aatctattat tgcgccaagc actactacta cggcggcagc 1620
tacgccatgg attactgggg tcagggtacc tccgtgaccg tgtcctcgac aactactccc 1680
gcccccaggc ctcctactcc cgcgcccacc atagcttccc agccgctatc tctccgccct 1740
gaagcgtgta ggccagctgc aggtggtgct gtccacaccc gcggcttgga tttcgcttgc 1800
gacatttata tttgggcgcc gctcgccggc acctgcgggg tcctgctgct gagcctggtg 1860
atcacacttt actgtaaacg cggaaggaag aagctgctgt acatcttcaa gcagcccttc 1920
atgcgcccgg tgcagactac acaagaggaa gatggatgca gctgtcgctt ccctgaggag 1980
gaggagggtg gatgcgagct gcgagtgaaa ttttcccgca gcgcggacgc acctgcctac 2040
cagcagggac agaaccagct gtacaacgag ctcaacctag gtcgccgcga ggagtacgac 2100
gtgctggaca agcgtcgcgg gcgggacccg gagatgggcg gcaagccccg tcgtaagaac 2160
cctcaggagg gcctttacaa cgagctgcag aaggacaaaa tggcggaggc ctacagtgag 2220
attggtatga agggcgagcg gcgcagagga aaaggccacg acgggttgta tcagggcctc 2280
tcgaccgcta cgaaggatac gtacgacgcg ctacacatgc aggccctgcc cccacgg 2337
<210> 42
<211> 779
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 42
Met Tyr Asp Gly Pro Arg Leu Leu Leu Leu Leu Leu Leu Gly Val Ser
1 5 10 15
Leu Gly Gly Ala Lys Glu Ala Cys Pro Thr Gly Leu Tyr Thr His Ser
20 25 30
Gly Glu Cys Cys Lys Ala Cys Asn Leu Gly Glu Gly Val Ala Gln Pro
35 40 45
Cys Gly Ala Asn Gln Thr Val Cys Glu Pro Cys Leu Asp Ser Val Thr
50 55 60
Phe Ser Asp Val Val Ser Ala Thr Glu Pro Cys Lys Pro Cys Thr Glu
65 70 75 80
Cys Val Gly Leu Gln Ser Met Ser Ala Pro Cys Val Glu Ala Asp Asp
85 90 95
Ala Val Cys Arg Cys Ala Tyr Gly Tyr Tyr Gln Asp Glu Thr Thr Gly
100 105 110
Arg Cys Glu Ala Cys Arg Val Cys Glu Ala Gly Ser Gly Leu Val Phe
115 120 125
Ser Cys Gln Asp Lys Gln Asn Thr Val Cys Glu Glu Cys Pro Asp Gly
130 135 140
Thr Tyr Ser Asp Glu Ala Asn His Val Asp Pro Cys Leu Pro Cys Thr
145 150 155 160
Val Cys Glu Asp Thr Glu Arg Gln Leu Arg Glu Cys Thr Arg Trp Ala
165 170 175
Asp Ala Glu Cys Glu Glu Ile Pro Gly Arg Trp Ile Thr Arg Ser Thr
180 185 190
Pro Pro Glu Gly Ser Asp Ser Thr Ala Pro Ser Thr Gln Glu Pro Glu
195 200 205
Ala Pro Pro Glu Gln Asp Leu Ile Ala Ser Thr Val Ala Gly Val Val
210 215 220
Thr Thr Val Met Gly Ser Ser Gln Pro Val Val Thr Arg Gly Thr Thr
225 230 235 240
Asp Asn Leu Ile Pro Val Tyr Cys Ser Ile Leu Ala Ala Val Val Val
245 250 255
Gly Leu Val Ala Tyr Ile Ala Phe Lys Arg Trp Asn Ser Gly Ser Gly
260 265 270
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
275 280 285
Pro Gly Pro Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu
290 295 300
Leu Leu His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser
305 310 315 320
Ser Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala
325 330 335
Ser Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp
340 345 350
Gly Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly
355 360 365
Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu
370 375 380
Thr Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln
385 390 395 400
Gln Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu
405 410 415
Ile Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly
420 425 430
Ser Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val
435 440 445
Ala Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser
450 455 460
Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly
465 470 475 480
Leu Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn
485 490 495
Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser
500 505 510
Gln Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile
515 520 525
Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp
530 535 540
Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Thr Thr Thr Pro
545 550 555 560
Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu
565 570 575
Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His
580 585 590
Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu
595 600 605
Ala Gly Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr
610 615 620
Cys Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe
625 630 635 640
Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg
645 650 655
Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe Ser
660 665 670
Arg Ser Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr
675 680 685
Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys
690 695 700
Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn
705 710 715 720
Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu
725 730 735
Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly
740 745 750
His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr
755 760 765
Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg
770 775
<210> 43
<211> 2325
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 43
atgtacgacg ggccgcgcct gctgctgttg ctgcttctgg gggtgtccct tggaggtgcc 60
aaggaggcat gccccacagg cctgtacaca cacagcggtg agtgctgcaa agcctgcaac 120
ctgggcgagg gtgtggccca gccttgtgga gccaaccaga ccgtgtgtga gccctgcctg 180
gacagcgtga cgttctccga cgtggtgagc gcgaccgagc cgtgcaagcc gtgcaccgag 240
tgcgtggggc tccagagcat gtcggcgccg tgcgtggagg ccgacgacgc cgtgtgccgc 300
tgcgcctacg gctactacca ggatgagacc actgggcgct gcgaggcgtg ccgcgtgtgc 360
gaggcgggct cgggcctcgt gttctcctgc caggacaagc agaacaccgt gtgcgaggag 420
tgccccgacg gcacgtattc cgacgaggcc aaccacgtgg acccgtgcct gccctgcacc 480
gtgtgcgagg acaccgagcg ccagctccgc gagtgcacac gctgggccga cgccgagtgc 540
gaggagatcc ctggccgttg gattacacgg tccacacccc cagagggctc ggacagcaca 600
gcccccagca cccaggagcc tgaggcacct ccagaacaag acctcatagc cagcacggtg 660
gcaggtgtgg tgaccacagt gatgggcagc tcccagcccg tggtgacccg aggcaccacc 720
gacaacctca tccctgtcta ttgctccatc ctggctgctg tggttgtggg tcttgtggcc 780
tacatagcct tcaagaggtg gaacagtgga tccggcgcaa caaacttctc tctgctgaaa 840
caagccggag atgtcgaaga gaatcctgga ccggctcttc ctgttacagc cctcctgctt 900
cccctggcgc tgctgttgca cgccgcccgc cccgacatcc agatgaccca gactacctcc 960
tctctgagtg ctagcctggg ggaccgcgta accatttcat gccgagcctc ccaggacatc 1020
tccaagtacc tgaattggta ccagcagaag ccggacggca ccgtgaagct tcttatctac 1080
catactagcc gcctgcactc tggcgtccca tccagatttt caggctccgg ctctggcacc 1140
gactactctc ttaccatctc taacctcgaa caggaggaca tcgccaccta tttctgtcaa 1200
cagggcaaca cgctgcccta taccttcggc ggtggcacca agctggagat caccggctct 1260
acctcgggca gcggcaaacc tggctccggg gaaggcagca ccaagggaga ggtgaagctg 1320
caggagagcg gaccaggcct ggtggctccc tcccagtccc tgtctgtgac ctgtaccgta 1380
tcgggggtct cactgccgga ctacggcgtt agttggattc gccagccacc ccgcaagggt 1440
ctggagtggc tgggcgttat ctggggctcc gagactacct actacaattc cgcgctgaag 1500
tcgcgcctga ctatcatcaa ggacaactcc aagagccagg tgttcctgaa aatgaactcg 1560
ttgcagacgg atgacaccgc aatctattat tgcgccaagc actactacta cggcggcagc 1620
tacgccatgg attactgggg tcagggtacc tccgtgaccg tgtcctcgat tgaggtgatg 1680
tatccacccc cctatctgga caacgagaaa tcaaatggca ccatcatcca cgtaaagggc 1740
aagcacctgt gcccctctcc tctgttcccc ggcccttcca agcccttctg ggtgctagtg 1800
gtggtagggg gcgtcctggc gtgctactcc ttgctggtca ctgtggcgtt catcatcttc 1860
tgggtccgga gcaagcgttc tcgcctgctg cacagcgatt acatgaatat gactccgcgc 1920
cgccccgggc caacccgcaa gcactaccag ccgtacgcgc ccccccgcga ctttgccgcc 1980
taccgatccc gcgtgaaatt ttcacgcagc gcggacgccc cggcctatca gcagggacag 2040
aaccagcttt acaacgagct caacctgggc aggagggagg agtacgatgt gctggacaag 2100
cgccgcggta gagacccgga gatgggcggt aagccgcgca ggaagaaccc tcaggagggc 2160
ctctacaacg agctccagaa ggacaagatg gccgaggctt actctgagat cggtatgaaa 2220
ggcgagcggc gccgtggcaa aggccatgac ggcctgtacc agggtctctc gactgccact 2280
aaggatactt acgacgcact gcacatgcag gccctgcccc cgcgc 2325
<210> 44
<211> 775
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 44
Met Tyr Asp Gly Pro Arg Leu Leu Leu Leu Leu Leu Leu Gly Val Ser
1 5 10 15
Leu Gly Gly Ala Lys Glu Ala Cys Pro Thr Gly Leu Tyr Thr His Ser
20 25 30
Gly Glu Cys Cys Lys Ala Cys Asn Leu Gly Glu Gly Val Ala Gln Pro
35 40 45
Cys Gly Ala Asn Gln Thr Val Cys Glu Pro Cys Leu Asp Ser Val Thr
50 55 60
Phe Ser Asp Val Val Ser Ala Thr Glu Pro Cys Lys Pro Cys Thr Glu
65 70 75 80
Cys Val Gly Leu Gln Ser Met Ser Ala Pro Cys Val Glu Ala Asp Asp
85 90 95
Ala Val Cys Arg Cys Ala Tyr Gly Tyr Tyr Gln Asp Glu Thr Thr Gly
100 105 110
Arg Cys Glu Ala Cys Arg Val Cys Glu Ala Gly Ser Gly Leu Val Phe
115 120 125
Ser Cys Gln Asp Lys Gln Asn Thr Val Cys Glu Glu Cys Pro Asp Gly
130 135 140
Thr Tyr Ser Asp Glu Ala Asn His Val Asp Pro Cys Leu Pro Cys Thr
145 150 155 160
Val Cys Glu Asp Thr Glu Arg Gln Leu Arg Glu Cys Thr Arg Trp Ala
165 170 175
Asp Ala Glu Cys Glu Glu Ile Pro Gly Arg Trp Ile Thr Arg Ser Thr
180 185 190
Pro Pro Glu Gly Ser Asp Ser Thr Ala Pro Ser Thr Gln Glu Pro Glu
195 200 205
Ala Pro Pro Glu Gln Asp Leu Ile Ala Ser Thr Val Ala Gly Val Val
210 215 220
Thr Thr Val Met Gly Ser Ser Gln Pro Val Val Thr Arg Gly Thr Thr
225 230 235 240
Asp Asn Leu Ile Pro Val Tyr Cys Ser Ile Leu Ala Ala Val Val Val
245 250 255
Gly Leu Val Ala Tyr Ile Ala Phe Lys Arg Trp Asn Ser Gly Ser Gly
260 265 270
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
275 280 285
Pro Gly Pro Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu
290 295 300
Leu Leu His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser
305 310 315 320
Ser Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala
325 330 335
Ser Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp
340 345 350
Gly Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly
355 360 365
Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu
370 375 380
Thr Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln
385 390 395 400
Gln Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu
405 410 415
Ile Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly
420 425 430
Ser Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val
435 440 445
Ala Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser
450 455 460
Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly
465 470 475 480
Leu Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn
485 490 495
Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser
500 505 510
Gln Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile
515 520 525
Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp
530 535 540
Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ile Glu Val Met
545 550 555 560
Tyr Pro Pro Pro Tyr Leu Asp Asn Glu Lys Ser Asn Gly Thr Ile Ile
565 570 575
His Val Lys Gly Lys His Leu Cys Pro Ser Pro Leu Phe Pro Gly Pro
580 585 590
Ser Lys Pro Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys
595 600 605
Tyr Ser Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser
610 615 620
Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg
625 630 635 640
Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg
645 650 655
Asp Phe Ala Ala Tyr Arg Ser Arg Val Lys Phe Ser Arg Ser Ala Asp
660 665 670
Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn
675 680 685
Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg
690 695 700
Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly
705 710 715 720
Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu
725 730 735
Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu
740 745 750
Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His
755 760 765
Met Gln Ala Leu Pro Pro Arg
770 775
<210> 45
<211> 2835
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 45
atgctcctgc cttgggccac ctctgccccc ggcctggcct gggggcctct ggtgctgggc 60
ctcttcgggc tcctggcagc atcgcagccc caggcggtgc ctccatatgc gtcggagaac 120
cagacctgca gggaccagga aaaggaatac tatgagcccc agcaccgcat ctgctgctcc 180
cgctgcccgc caggcaccta tgtctcagct aaatgtagcc gcatccggga cacagtttgt 240
gccacatgtg ccgagaattc ctacaacgag cactggaact acctgaccat ctgccagctg 300
tgccgcccct gtgacccagt gatgggcctc gaggagattg ccccctgcac aagcaaacgg 360
aagacccagt gccgctgcca gccgggaatg ttctgtgctg cctgggccct cgagtgtaca 420
cactgcgagc tactttctga ctgcccgcct ggcactgaag ccgagctcaa agatgaagtt 480
gggaagggta acaaccactg cgtcccctgc aaggccgggc acttccagaa tacctcctcc 540
cccagcgccc gctgccagcc ccacaccagg tgtgagaacc aaggtctggt ggaggcagct 600
ccaggcactg cccagtccga cacaacctgc aaaaatccat tagagccact gcccccagag 660
atgtcaggaa ccatgctgat gctggccgtt ctgctgccac tggccttctt tctgctcctt 720
gccaccgtct tctcctgcat ctggaagagc cacccttctc tctgcaggaa actgggatcg 780
ctgctcaaga ggcgtccgca gggagaggga cccaatcctg tagctggaag ctgggagcct 840
ccgaaggccc atccatactt ccctgacttg gtacagccac tgctacccat ttctggagat 900
gtttccccag tatccactgg gctccccgca gccccagttt tggaggcagg ggtgccgcaa 960
cagcagagtc ctctggacct gaccagggag ccgcagttgg aacccgggga gcagagccag 1020
gtggcccacg gtaccaatgg cattcatgtc accggcgggt ctatgactat cactggcaac 1080
atctacatct acaatggacc agtactgggg ggaccaccgg gtcctggaga cctcccagct 1140
acccccgaac ctccataccc cattcccgaa gagggggacc ctggccctcc cgggctctct 1200
acaccccacc aggaagatgg caaggcttgg cacctagcgg agacagagca ctgtggtgcc 1260
acaccctcta acaggggccc aaggaaccaa tttatcaccc atgacggatc cggcgcaaca 1320
aacttctctc tgctgaaaca agccggagat gtcgaagaga atcctggacc ggctcttcct 1380
gttacagccc tcctgcttcc cctggcgctg ctgttgcacg ccgcccgccc cgacatccag 1440
atgacccaga ctacctcctc tctgagtgct agcctggggg accgcgtaac catttcatgc 1500
cgagcctccc aggacatctc caagtacctg aattggtacc agcagaagcc ggacggcacc 1560
gtgaagcttc ttatctacca tactagccgc ctgcactctg gcgtcccatc cagattttca 1620
ggctccggct ctggcaccga ctactctctt accatctcta acctcgaaca ggaggacatc 1680
gccacctatt tctgtcaaca gggcaacacg ctgccctata ccttcggcgg tggcaccaag 1740
ctggagatca ccggctctac ctcgggcagc ggcaaacctg gctccgggga aggcagcacc 1800
aagggagagg tgaagctgca ggagagcgga ccaggcctgg tggctccctc ccagtccctg 1860
tctgtgacct gtaccgtatc gggggtctca ctgccggact acggcgttag ttggattcgc 1920
cagccacccc gcaagggtct ggagtggctg ggcgttatct ggggctccga gactacctac 1980
tacaattccg cgctgaagtc gcgcctgact atcatcaagg acaactccaa gagccaggtg 2040
ttcctgaaaa tgaactcgtt gcagacggat gacaccgcaa tctattattg cgccaagcac 2100
tactactacg gcggcagcta cgccatggat tactggggtc agggtacctc cgtgaccgtg 2160
tcctcgacaa ctactcccgc ccccaggcct cctactcccg cgcccaccat agcttcccag 2220
ccgctatctc tccgccctga agcgtgtagg ccagctgcag gtggtgctgt ccacacccgc 2280
ggcttggatt tcgcttgcga catttatatt tgggcgccgc tcgccggcac ctgcggggtc 2340
ctgctgctga gcctggtgat cacactttac tgtaaacgcg gaaggaagaa gctgctgtac 2400
atcttcaagc agcccttcat gcgcccggtg cagactacac aagaggaaga tggatgcagc 2460
tgtcgcttcc ctgaggagga ggagggtgga tgcgagctgc gagtgaaatt ttcccgcagc 2520
gcggacgcac ctgcctacca gcagggacag aaccagctgt acaacgagct caacctaggt 2580
cgccgcgagg agtacgacgt gctggacaag cgtcgcgggc gggacccgga gatgggcggc 2640
aagccccgtc gtaagaaccc tcaggagggc ctttacaacg agctgcagaa ggacaaaatg 2700
gcggaggcct acagtgagat tggtatgaag ggcgagcggc gcagaggaaa aggccacgac 2760
gggttgtatc agggcctctc gaccgctacg aaggatacgt acgacgcgct acacatgcag 2820
gccctgcccc cacgg 2835
<210> 46
<211> 945
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 46
Met Leu Leu Pro Trp Ala Thr Ser Ala Pro Gly Leu Ala Trp Gly Pro
1 5 10 15
Leu Val Leu Gly Leu Phe Gly Leu Leu Ala Ala Ser Gln Pro Gln Ala
20 25 30
Val Pro Pro Tyr Ala Ser Glu Asn Gln Thr Cys Arg Asp Gln Glu Lys
35 40 45
Glu Tyr Tyr Glu Pro Gln His Arg Ile Cys Cys Ser Arg Cys Pro Pro
50 55 60
Gly Thr Tyr Val Ser Ala Lys Cys Ser Arg Ile Arg Asp Thr Val Cys
65 70 75 80
Ala Thr Cys Ala Glu Asn Ser Tyr Asn Glu His Trp Asn Tyr Leu Thr
85 90 95
Ile Cys Gln Leu Cys Arg Pro Cys Asp Pro Val Met Gly Leu Glu Glu
100 105 110
Ile Ala Pro Cys Thr Ser Lys Arg Lys Thr Gln Cys Arg Cys Gln Pro
115 120 125
Gly Met Phe Cys Ala Ala Trp Ala Leu Glu Cys Thr His Cys Glu Leu
130 135 140
Leu Ser Asp Cys Pro Pro Gly Thr Glu Ala Glu Leu Lys Asp Glu Val
145 150 155 160
Gly Lys Gly Asn Asn His Cys Val Pro Cys Lys Ala Gly His Phe Gln
165 170 175
Asn Thr Ser Ser Pro Ser Ala Arg Cys Gln Pro His Thr Arg Cys Glu
180 185 190
Asn Gln Gly Leu Val Glu Ala Ala Pro Gly Thr Ala Gln Ser Asp Thr
195 200 205
Thr Cys Lys Asn Pro Leu Glu Pro Leu Pro Pro Glu Met Ser Gly Thr
210 215 220
Met Leu Met Leu Ala Val Leu Leu Pro Leu Ala Phe Phe Leu Leu Leu
225 230 235 240
Ala Thr Val Phe Ser Cys Ile Trp Lys Ser His Pro Ser Leu Cys Arg
245 250 255
Lys Leu Gly Ser Leu Leu Lys Arg Arg Pro Gln Gly Glu Gly Pro Asn
260 265 270
Pro Val Ala Gly Ser Trp Glu Pro Pro Lys Ala His Pro Tyr Phe Pro
275 280 285
Asp Leu Val Gln Pro Leu Leu Pro Ile Ser Gly Asp Val Ser Pro Val
290 295 300
Ser Thr Gly Leu Pro Ala Ala Pro Val Leu Glu Ala Gly Val Pro Gln
305 310 315 320
Gln Gln Ser Pro Leu Asp Leu Thr Arg Glu Pro Gln Leu Glu Pro Gly
325 330 335
Glu Gln Ser Gln Val Ala His Gly Thr Asn Gly Ile His Val Thr Gly
340 345 350
Gly Ser Met Thr Ile Thr Gly Asn Ile Tyr Ile Tyr Asn Gly Pro Val
355 360 365
Leu Gly Gly Pro Pro Gly Pro Gly Asp Leu Pro Ala Thr Pro Glu Pro
370 375 380
Pro Tyr Pro Ile Pro Glu Glu Gly Asp Pro Gly Pro Pro Gly Leu Ser
385 390 395 400
Thr Pro His Gln Glu Asp Gly Lys Ala Trp His Leu Ala Glu Thr Glu
405 410 415
His Cys Gly Ala Thr Pro Ser Asn Arg Gly Pro Arg Asn Gln Phe Ile
420 425 430
Thr His Asp Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala
435 440 445
Gly Asp Val Glu Glu Asn Pro Gly Pro Ala Leu Pro Val Thr Ala Leu
450 455 460
Leu Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Asp Ile Gln
465 470 475 480
Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly Asp Arg Val
485 490 495
Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr Leu Asn Trp
500 505 510
Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile Tyr His Thr
515 520 525
Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser
530 535 540
Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln Glu Asp Ile
545 550 555 560
Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr Thr Phe Gly
565 570 575
Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly Ser Gly Lys
580 585 590
Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys Leu Gln Glu
595 600 605
Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Val Thr Cys
610 615 620
Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg
625 630 635 640
Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Ser
645 650 655
Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile
660 665 670
Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln
675 680 685
Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly
690 695 700
Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val
705 710 715 720
Ser Ser Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr
725 730 735
Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala
740 745 750
Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile
755 760 765
Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu Leu Ser
770 775 780
Leu Val Ile Thr Leu Tyr Cys Lys Arg Gly Arg Lys Lys Leu Leu Tyr
785 790 795 800
Ile Phe Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu
805 810 815
Asp Gly Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu
820 825 830
Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Gln Gln
835 840 845
Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu
850 855 860
Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly
865 870 875 880
Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln
885 890 895
Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu
900 905 910
Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr
915 920 925
Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro
930 935 940
Arg
945
<210> 47
<211> 2823
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 47
atgctcctgc cttgggccac ctctgccccc ggcctggcct gggggcctct ggtgctgggc 60
ctcttcgggc tcctggcagc atcgcagccc caggcggtgc ctccatatgc gtcggagaac 120
cagacctgca gggaccagga aaaggaatac tatgagcccc agcaccgcat ctgctgctcc 180
cgctgcccgc caggcaccta tgtctcagct aaatgtagcc gcatccggga cacagtttgt 240
gccacatgtg ccgagaattc ctacaacgag cactggaact acctgaccat ctgccagctg 300
tgccgcccct gtgacccagt gatgggcctc gaggagattg ccccctgcac aagcaaacgg 360
aagacccagt gccgctgcca gccgggaatg ttctgtgctg cctgggccct cgagtgtaca 420
cactgcgagc tactttctga ctgcccgcct ggcactgaag ccgagctcaa agatgaagtt 480
gggaagggta acaaccactg cgtcccctgc aaggccgggc acttccagaa tacctcctcc 540
cccagcgccc gctgccagcc ccacaccagg tgtgagaacc aaggtctggt ggaggcagct 600
ccaggcactg cccagtccga cacaacctgc aaaaatccat tagagccact gcccccagag 660
atgtcaggaa ccatgctgat gctggccgtt ctgctgccac tggccttctt tctgctcctt 720
gccaccgtct tctcctgcat ctggaagagc cacccttctc tctgcaggaa actgggatcg 780
ctgctcaaga ggcgtccgca gggagaggga cccaatcctg tagctggaag ctgggagcct 840
ccgaaggccc atccatactt ccctgacttg gtacagccac tgctacccat ttctggagat 900
gtttccccag tatccactgg gctccccgca gccccagttt tggaggcagg ggtgccgcaa 960
cagcagagtc ctctggacct gaccagggag ccgcagttgg aacccgggga gcagagccag 1020
gtggcccacg gtaccaatgg cattcatgtc accggcgggt ctatgactat cactggcaac 1080
atctacatct acaatggacc agtactgggg ggaccaccgg gtcctggaga cctcccagct 1140
acccccgaac ctccataccc cattcccgaa gagggggacc ctggccctcc cgggctctct 1200
acaccccacc aggaagatgg caaggcttgg cacctagcgg agacagagca ctgtggtgcc 1260
acaccctcta acaggggccc aaggaaccaa tttatcaccc atgacggatc cggcgcaaca 1320
aacttctctc tgctgaaaca agccggagat gtcgaagaga atcctggacc ggctcttcct 1380
gttacagccc tcctgcttcc cctggcgctg ctgttgcacg ccgcccgccc cgacatccag 1440
atgacccaga ctacctcctc tctgagtgct agcctggggg accgcgtaac catttcatgc 1500
cgagcctccc aggacatctc caagtacctg aattggtacc agcagaagcc ggacggcacc 1560
gtgaagcttc ttatctacca tactagccgc ctgcactctg gcgtcccatc cagattttca 1620
ggctccggct ctggcaccga ctactctctt accatctcta acctcgaaca ggaggacatc 1680
gccacctatt tctgtcaaca gggcaacacg ctgccctata ccttcggcgg tggcaccaag 1740
ctggagatca ccggctctac ctcgggcagc ggcaaacctg gctccgggga aggcagcacc 1800
aagggagagg tgaagctgca ggagagcgga ccaggcctgg tggctccctc ccagtccctg 1860
tctgtgacct gtaccgtatc gggggtctca ctgccggact acggcgttag ttggattcgc 1920
cagccacccc gcaagggtct ggagtggctg ggcgttatct ggggctccga gactacctac 1980
tacaattccg cgctgaagtc gcgcctgact atcatcaagg acaactccaa gagccaggtg 2040
ttcctgaaaa tgaactcgtt gcagacggat gacaccgcaa tctattattg cgccaagcac 2100
tactactacg gcggcagcta cgccatggat tactggggtc agggtacctc cgtgaccgtg 2160
tcctcgattg aggtgatgta tccacccccc tatctggaca acgagaaatc aaatggcacc 2220
atcatccacg taaagggcaa gcacctgtgc ccctctcctc tgttccccgg cccttccaag 2280
cccttctggg tgctagtggt ggtagggggc gtcctggcgt gctactcctt gctggtcact 2340
gtggcgttca tcatcttctg ggtccggagc aagcgttctc gcctgctgca cagcgattac 2400
atgaatatga ctccgcgccg ccccgggcca acccgcaagc actaccagcc gtacgcgccc 2460
ccccgcgact ttgccgccta ccgatcccgc gtgaaatttt cacgcagcgc ggacgccccg 2520
gcctatcagc agggacagaa ccagctttac aacgagctca acctgggcag gagggaggag 2580
tacgatgtgc tggacaagcg ccgcggtaga gacccggaga tgggcggtaa gccgcgcagg 2640
aagaaccctc aggagggcct ctacaacgag ctccagaagg acaagatggc cgaggcttac 2700
tctgagatcg gtatgaaagg cgagcggcgc cgtggcaaag gccatgacgg cctgtaccag 2760
ggtctctcga ctgccactaa ggatacttac gacgcactgc acatgcaggc cctgcccccg 2820
cgc 2823
<210> 48
<211> 941
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 48
Met Leu Leu Pro Trp Ala Thr Ser Ala Pro Gly Leu Ala Trp Gly Pro
1 5 10 15
Leu Val Leu Gly Leu Phe Gly Leu Leu Ala Ala Ser Gln Pro Gln Ala
20 25 30
Val Pro Pro Tyr Ala Ser Glu Asn Gln Thr Cys Arg Asp Gln Glu Lys
35 40 45
Glu Tyr Tyr Glu Pro Gln His Arg Ile Cys Cys Ser Arg Cys Pro Pro
50 55 60
Gly Thr Tyr Val Ser Ala Lys Cys Ser Arg Ile Arg Asp Thr Val Cys
65 70 75 80
Ala Thr Cys Ala Glu Asn Ser Tyr Asn Glu His Trp Asn Tyr Leu Thr
85 90 95
Ile Cys Gln Leu Cys Arg Pro Cys Asp Pro Val Met Gly Leu Glu Glu
100 105 110
Ile Ala Pro Cys Thr Ser Lys Arg Lys Thr Gln Cys Arg Cys Gln Pro
115 120 125
Gly Met Phe Cys Ala Ala Trp Ala Leu Glu Cys Thr His Cys Glu Leu
130 135 140
Leu Ser Asp Cys Pro Pro Gly Thr Glu Ala Glu Leu Lys Asp Glu Val
145 150 155 160
Gly Lys Gly Asn Asn His Cys Val Pro Cys Lys Ala Gly His Phe Gln
165 170 175
Asn Thr Ser Ser Pro Ser Ala Arg Cys Gln Pro His Thr Arg Cys Glu
180 185 190
Asn Gln Gly Leu Val Glu Ala Ala Pro Gly Thr Ala Gln Ser Asp Thr
195 200 205
Thr Cys Lys Asn Pro Leu Glu Pro Leu Pro Pro Glu Met Ser Gly Thr
210 215 220
Met Leu Met Leu Ala Val Leu Leu Pro Leu Ala Phe Phe Leu Leu Leu
225 230 235 240
Ala Thr Val Phe Ser Cys Ile Trp Lys Ser His Pro Ser Leu Cys Arg
245 250 255
Lys Leu Gly Ser Leu Leu Lys Arg Arg Pro Gln Gly Glu Gly Pro Asn
260 265 270
Pro Val Ala Gly Ser Trp Glu Pro Pro Lys Ala His Pro Tyr Phe Pro
275 280 285
Asp Leu Val Gln Pro Leu Leu Pro Ile Ser Gly Asp Val Ser Pro Val
290 295 300
Ser Thr Gly Leu Pro Ala Ala Pro Val Leu Glu Ala Gly Val Pro Gln
305 310 315 320
Gln Gln Ser Pro Leu Asp Leu Thr Arg Glu Pro Gln Leu Glu Pro Gly
325 330 335
Glu Gln Ser Gln Val Ala His Gly Thr Asn Gly Ile His Val Thr Gly
340 345 350
Gly Ser Met Thr Ile Thr Gly Asn Ile Tyr Ile Tyr Asn Gly Pro Val
355 360 365
Leu Gly Gly Pro Pro Gly Pro Gly Asp Leu Pro Ala Thr Pro Glu Pro
370 375 380
Pro Tyr Pro Ile Pro Glu Glu Gly Asp Pro Gly Pro Pro Gly Leu Ser
385 390 395 400
Thr Pro His Gln Glu Asp Gly Lys Ala Trp His Leu Ala Glu Thr Glu
405 410 415
His Cys Gly Ala Thr Pro Ser Asn Arg Gly Pro Arg Asn Gln Phe Ile
420 425 430
Thr His Asp Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala
435 440 445
Gly Asp Val Glu Glu Asn Pro Gly Pro Ala Leu Pro Val Thr Ala Leu
450 455 460
Leu Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Asp Ile Gln
465 470 475 480
Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly Asp Arg Val
485 490 495
Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr Leu Asn Trp
500 505 510
Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile Tyr His Thr
515 520 525
Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser
530 535 540
Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln Glu Asp Ile
545 550 555 560
Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr Thr Phe Gly
565 570 575
Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly Ser Gly Lys
580 585 590
Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys Leu Gln Glu
595 600 605
Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Val Thr Cys
610 615 620
Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg
625 630 635 640
Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Ser
645 650 655
Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile
660 665 670
Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln
675 680 685
Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly
690 695 700
Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val
705 710 715 720
Ser Ser Ile Glu Val Met Tyr Pro Pro Pro Tyr Leu Asp Asn Glu Lys
725 730 735
Ser Asn Gly Thr Ile Ile His Val Lys Gly Lys His Leu Cys Pro Ser
740 745 750
Pro Leu Phe Pro Gly Pro Ser Lys Pro Phe Trp Val Leu Val Val Val
755 760 765
Gly Gly Val Leu Ala Cys Tyr Ser Leu Leu Val Thr Val Ala Phe Ile
770 775 780
Ile Phe Trp Val Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr
785 790 795 800
Met Asn Met Thr Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln
805 810 815
Pro Tyr Ala Pro Pro Arg Asp Phe Ala Ala Tyr Arg Ser Arg Val Lys
820 825 830
Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln
835 840 845
Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu
850 855 860
Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg
865 870 875 880
Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met
885 890 895
Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly
900 905 910
Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp
915 920 925
Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg
930 935 940
<210> 49
<211> 2215
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 49
taggtcttga aaggagtggg aattggctcc ggtgcccgtc agtgggcaga gcgcacatcg 60
cccacagtcc ccgagaagtt ggggggaggg gtcggcaatt gatccggtgc ctagagaagg 120
tggcgcgggg taaactggga aagtgatgtc gtgtactggc tccgcctttt tcccgagggt 180
gggggagaac cgtatataag tgcagtagtc gccgtgaacg ttctttttcg caacgggttt 240
gccgccagaa cacaggaccg gttctagagc gctgccacca tgtacgacgg gccgcgcctg 300
ctgctgttgc tgcttctggg ggtgtccctt ggaggtgcca aggaggcatg ccccacaggc 360
ctgtacacac acagcggtga gtgctgcaaa gcctgcaacc tgggcgaggg tgtggcccag 420
ccttgtggag ccaaccagac cgtgtgtgag ccctgcctgg acagcgtgac gttctccgac 480
gtggtgagcg cgaccgagcc gtgcaagccg tgcaccgagt gcgtggggct ccagagcatg 540
tcggcgccat gcgtggaggc cgacgacgcc gtgtgccgct gcgcctacgg ctactaccag 600
gatgagacca ctgggcgctg cgaggcgtgc cgcgtgtgcg aggcgggctc gggcctcgtg 660
ttctcctgcc aggacaagca gaacaccgtg tgcgaggagt gccccgacgg cacgtattcc 720
gacgaggcca accacgtgga cccgtgcctg ccctgcaccg tgtgcgagga caccgagcgc 780
cagctccgcg agtgcacacg ctgggccgac gccgagtgcg aggagatccc tggccgttgg 840
attacacggt ccacaccccc agagggctcg gacagcacag cccccagcac ccaggagcct 900
gaggcacctc cagaacaaga cctcatagcc agcacggtgg caggtgtggt gaccacagtg 960
atgggcagct cccagcccgt ggtgacccga ggcaccaccg acaacctcat ccctgtctat 1020
tgctccatcc tggctgctgt ggttgtgggt cttgtggcct acatagcctt caagaggtgg 1080
aacagctgac ctgcagggta ggggaggcgc ttttcccaag gcagtctgga gcatgcgctt 1140
tagcagcccc gctgggcact tggcgctaca caagtggcct ctggcctcgc acacattcca 1200
catccaccgg taggcgccaa ccggctccgt tctttggtgg ccccttcgcg ccaccttcta 1260
ctcctcccct agtcaggaag ttcccccccg ccccgcagct cgcgtcgtgc aggacgtgac 1320
aaatggaagt agcacgtctc actagtctcg tgcagatgga cagcaccgct gagcaatgga 1380
agcgggtagg cctttggggc agcggccaat agcagctttg ctccttcgct ttctgggctc 1440
agaggctggg aaggggtggg tccgggggcg ggctcagggg cgggctcagg ggcggggcgg 1500
gcgcccgaag gtcctccgga ggcccggcat tctgcacgct tcaaaagcgc acgtctgccg 1560
cgctgttctc ctcttcctca tctccgggcc tttcgacctg cagcccaagc ttaccatgac 1620
cgagtacaag cccacggtgc gcctcgccac ccgcgacgac gtccccaggg ccgtacgcac 1680
cctcgccgcc gcgttcgccg actaccccgc cacgcgccac accgtcgatc cggaccgcca 1740
catcgagcgg gtcaccgagc tgcaagaact cttcctcacg cgcgtcgggc tcgacatcgg 1800
caaggtgtgg gtcgcggacg acggcgccgc ggtggcggtc tggaccacgc cggagagcgt 1860
cgaagcgggg gcggtgttcg ccgagatcgg cccgcgcatg gccgagttga gcggttcccg 1920
gctggccgcg cagcaacaga tggaaggcct cctggcgccg caccggccca aggagcccgc 1980
gtggttcctg gccaccgtcg gcgtctcgcc cgaccaccag ggcaagggtc tgggcagcgc 2040
cgtcgtgctc cccggagtgg aggcggccga gcgcgccggg gtgcccgcct tcctggagac 2100
ctccgcgccc cgcaacctcc ccttctacga gcggctcggc ttcaccgtca ccgccgacgt 2160
cgaggtgccc gaaggaccgc gcacctggtg catgacccgc aagcccggtg cctga 2215
<210> 50
<211> 1952
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 50
ctagagcgct gccaccatgt acgacgggcc gcgcctgctg ctgttgctgc ttctgggggt 60
gtcccttgga ggtgccaagg aggcatgccc cacaggcctg tacacacaca gcggtgagtg 120
ctgcaaagcc tgcaacctgg gcgagggtgt ggcccagcct tgtggagcca accagaccgt 180
gtgtgagccc tgcctggaca gcgtgacgtt ctccgacgtg gtgagcgcga ccgagccgtg 240
caagccgtgc accgagtgcg tggggctcca gagcatgtcg gcgccatgcg tggaggccga 300
cgacgccgtg tgccgctgcg cctacggcta ctaccaggat gagaccactg ggcgctgcga 360
ggcgtgccgc gtgtgcgagg cgggctcggg cctcgtgttc tcctgccagg acaagcagaa 420
caccgtgtgc gaggagtgcc ccgacggcac gtattccgac gaggccaacc acgtggaccc 480
gtgcctgccc tgcaccgtgt gcgaggacac cgagcgccag ctccgcgagt gcacacgctg 540
ggccgacgcc gagtgcgagg agatccctgg ccgttggatt acacggtcca cacccccaga 600
gggctcggac agcacagccc ccagcaccca ggagcctgag gcacctccag aacaagacct 660
catagccagc acggtggcag gtgtggtgac cacagtgatg ggcagctccc agcccgtggt 720
gacccgaggc accaccgaca acctcatccc tgtctattgc tccatcctgg ctgctgtggt 780
tgtgggtctt gtggcctaca tagccttcaa gaggtggaac agctgacctg cagggtaggg 840
gaggcgcttt tcccaaggca gtctggagca tgcgctttag cagccccgct gggcacttgg 900
cgctacacaa gtggcctctg gcctcgcaca cattccacat ccaccggtag gcgccaaccg 960
gctccgttct ttggtggccc cttcgcgcca ccttctactc ctcccctagt caggaagttc 1020
ccccccgccc cgcagctcgc gtcgtgcagg acgtgacaaa tggaagtagc acgtctcact 1080
agtctcgtgc agatggacag caccgctgag caatggaagc gggtaggcct ttggggcagc 1140
ggccaatagc agctttgctc cttcgctttc tgggctcaga ggctgggaag gggtgggtcc 1200
gggggcgggc tcaggggcgg gctcaggggc ggggcgggcg cccgaaggtc ctccggaggc 1260
ccggcattct gcacgcttca aaagcgcacg tctgccgcgc tgttctcctc ttcctcatct 1320
ccgggccttt cgacctgcag cccaagctta ccatgaccga gtacaagccc acggtgcgcc 1380
tcgccacccg cgacgacgtc cccagggccg tacgcaccct cgccgccgcg ttcgccgact 1440
accccgccac gcgccacacc gtcgatccgg accgccacat cgagcgggtc accgagctgc 1500
aagaactctt cctcacgcgc gtcgggctcg acatcggcaa ggtgtgggtc gcggacgacg 1560
gcgccgcggt ggcggtctgg accacgccgg agagcgtcga agcgggggcg gtgttcgccg 1620
agatcggccc gcgcatggcc gagttgagcg gttcccggct ggccgcgcag caacagatgg 1680
aaggcctcct ggcgccgcac cggcccaagg agcccgcgtg gttcctggcc accgtcggcg 1740
tctcgcccga ccaccagggc aagggtctgg gcagcgccgt cgtgctcccc ggagtggagg 1800
cggccgagcg cgccggggtg cccgccttcc tggagacctc cgcgccccgc aacctcccct 1860
tctacgagcg gctcggcttc accgtcaccg ccgacgtcga ggtgcccgaa ggaccgcgca 1920
cctggtgcat gacccgcaag cccggtgcct ga 1952
<210> 51
<211> 2164
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 51
ctagcaagct ggaggaaaaa ctgtttcata cagaaggcgt ggaggaaaaa ctgtttcata 60
cagaaggcgt ggaggaaaaa ctgtttcata cagaaggcgt ggaggaaaaa ctgtttcata 120
cagaaggcgt cgcgaattcg cggagactct agagggtata taatggaagc tcgatttcca 180
gcttggcatt ccggtactgt tggtaaacac ctctagagcg ctgccaccat gtacgacggg 240
ccgcgcctgc tgctgttgct gcttctgggg gtgtcccttg gaggtgccaa ggaggcatgc 300
cccacaggcc tgtacacaca cagcggtgag tgctgcaaag cctgcaacct gggcgagggt 360
gtggcccagc cttgtggagc caaccagacc gtgtgtgagc cctgcctgga cagcgtgacg 420
ttctccgacg tggtgagcgc gaccgagccg tgcaagccgt gcaccgagtg cgtggggctc 480
cagagcatgt cggcgccatg cgtggaggcc gacgacgccg tgtgccgctg cgcctacggc 540
tactaccagg atgagaccac tgggcgctgc gaggcgtgcc gcgtgtgcga ggcgggctcg 600
ggcctcgtgt tctcctgcca ggacaagcag aacaccgtgt gcgaggagtg ccccgacggc 660
acgtattccg acgaggccaa ccacgtggac ccgtgcctgc cctgcaccgt gtgcgaggac 720
accgagcgcc agctccgcga gtgcacacgc tgggccgacg ccgagtgcga ggagatccct 780
ggccgttgga ttacacggtc cacaccccca gagggctcgg acagcacagc ccccagcacc 840
caggagcctg aggcacctcc agaacaagac ctcatagcca gcacggtggc aggtgtggtg 900
accacagtga tgggcagctc ccagcccgtg gtgacccgag gcaccaccga caacctcatc 960
cctgtctatt gctccatcct ggctgctgtg gttgtgggtc ttgtggccta catagccttc 1020
aagaggtgga acagctgacc tgcagggtag gggaggcgct tttcccaagg cagtctggag 1080
catgcgcttt agcagccccg ctgggcactt ggcgctacac aagtggcctc tggcctcgca 1140
cacattccac atccaccggt aggcgccaac cggctccgtt ctttggtggc cccttcgcgc 1200
caccttctac tcctccccta gtcaggaagt tcccccccgc cccgcagctc gcgtcgtgca 1260
ggacgtgaca aatggaagta gcacgtctca ctagtctcgt gcagatggac agcaccgctg 1320
agcaatggaa gcgggtaggc ctttggggca gcggccaata gcagctttgc tccttcgctt 1380
tctgggctca gaggctggga aggggtgggt ccgggggcgg gctcaggggc gggctcaggg 1440
gcggggcggg cgcccgaagg tcctccggag gcccggcatt ctgcacgctt caaaagcgca 1500
cgtctgccgc gctgttctcc tcttcctcat ctccgggcct ttcgacctgc agcccaagct 1560
taccatgacc gagtacaagc ccacggtgcg cctcgccacc cgcgacgacg tccccagggc 1620
cgtacgcacc ctcgccgccg cgttcgccga ctaccccgcc acgcgccaca ccgtcgatcc 1680
ggaccgccac atcgagcggg tcaccgagct gcaagaactc ttcctcacgc gcgtcgggct 1740
cgacatcggc aaggtgtggg tcgcggacga cggcgccgcg gtggcggtct ggaccacgcc 1800
ggagagcgtc gaagcggggg cggtgttcgc cgagatcggc ccgcgcatgg ccgagttgag 1860
cggttcccgg ctggccgcgc agcaacagat ggaaggcctc ctggcgccgc accggcccaa 1920
ggagcccgcg tggttcctgg ccaccgtcgg cgtctcgccc gaccaccagg gcaagggtct 1980
gggcagcgcc gtcgtgctcc ccggagtgga ggcggccgag cgcgccgggg tgcccgcctt 2040
cctggagacc tccgcgcccc gcaacctccc cttctacgag cggctcggct tcaccgtcac 2100
cgccgacgtc gaggtgcccg aaggaccgcg cacctggtgc atgacccgca agcccggtgc 2160
ctga 2164
<210> 52
<211> 2214
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 52
ctagcgggga ctttccgctt ggggactttc cgctggggac tttccgctgg ggactttccg 60
ctggggactt tccgaattca gcttgaataa aatgaatatt agaagctgtt agaataagag 120
aaaatgacag aggaaaactg aaagggagaa ctgaaagtgg gaaattcctc tgaggcagaa 180
aggaccatcc cttataaata gcacaggcca tgaaggaaga tcattctcac tgcagccttt 240
gacagccttt gcctcatctt gtctagagcg ctgccaccat gtacgacggg ccgcgcctgc 300
tgctgttgct gcttctgggg gtgtcccttg gaggtgccaa ggaggcatgc cccacaggcc 360
tgtacacaca cagcggtgag tgctgcaaag cctgcaacct gggcgagggt gtggcccagc 420
cttgtggagc caaccagacc gtgtgtgagc cctgcctgga cagcgtgacg ttctccgacg 480
tggtgagcgc gaccgagccg tgcaagccgt gcaccgagtg cgtggggctc cagagcatgt 540
cggcgccatg cgtggaggcc gacgacgccg tgtgccgctg cgcctacggc tactaccagg 600
atgagaccac tgggcgctgc gaggcgtgcc gcgtgtgcga ggcgggctcg ggcctcgtgt 660
tctcctgcca ggacaagcag aacaccgtgt gcgaggagtg ccccgacggc acgtattccg 720
acgaggccaa ccacgtggac ccgtgcctgc cctgcaccgt gtgcgaggac accgagcgcc 780
agctccgcga gtgcacacgc tgggccgacg ccgagtgcga ggagatccct ggccgttgga 840
ttacacggtc cacaccccca gagggctcgg acagcacagc ccccagcacc caggagcctg 900
aggcacctcc agaacaagac ctcatagcca gcacggtggc aggtgtggtg accacagtga 960
tgggcagctc ccagcccgtg gtgacccgag gcaccaccga caacctcatc cctgtctatt 1020
gctccatcct ggctgctgtg gttgtgggtc ttgtggccta catagccttc aagaggtgga 1080
acagctgacc tgcagggtag gggaggcgct tttcccaagg cagtctggag catgcgcttt 1140
agcagccccg ctgggcactt ggcgctacac aagtggcctc tggcctcgca cacattccac 1200
atccaccggt aggcgccaac cggctccgtt ctttggtggc cccttcgcgc caccttctac 1260
tcctccccta gtcaggaagt tcccccccgc cccgcagctc gcgtcgtgca ggacgtgaca 1320
aatggaagta gcacgtctca ctagtctcgt gcagatggac agcaccgctg agcaatggaa 1380
gcgggtaggc ctttggggca gcggccaata gcagctttgc tccttcgctt tctgggctca 1440
gaggctggga aggggtgggt ccgggggcgg gctcaggggc gggctcaggg gcggggcggg 1500
cgcccgaagg tcctccggag gcccggcatt ctgcacgctt caaaagcgca cgtctgccgc 1560
gctgttctcc tcttcctcat ctccgggcct ttcgacctgc agcccaagct taccatgacc 1620
gagtacaagc ccacggtgcg cctcgccacc cgcgacgacg tccccagggc cgtacgcacc 1680
ctcgccgccg cgttcgccga ctaccccgcc acgcgccaca ccgtcgatcc ggaccgccac 1740
atcgagcggg tcaccgagct gcaagaactc ttcctcacgc gcgtcgggct cgacatcggc 1800
aaggtgtggg tcgcggacga cggcgccgcg gtggcggtct ggaccacgcc ggagagcgtc 1860
gaagcggggg cggtgttcgc cgagatcggc ccgcgcatgg ccgagttgag cggttcccgg 1920
ctggccgcgc agcaacagat ggaaggcctc ctggcgccgc accggcccaa ggagcccgcg 1980
tggttcctgg ccaccgtcgg cgtctcgccc gaccaccagg gcaagggtct gggcagcgcc 2040
gtcgtgctcc ccggagtgga ggcggccgag cgcgccgggg tgcccgcctt cctggagacc 2100
tccgcgcccc gcaacctccc cttctacgag cggctcggct tcaccgtcac cgccgacgtc 2160
gaggtgcccg aaggaccgcg cacctggtgc atgacccgca agcccggtgc ctga 2214
<210> 53
<211> 2210
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 53
ctagctgagt cagtgactca gtgagtcagt gactcagtga gtcagtgact cagtgagtca 60
gtgactcagg aattcagctt gaataaaatg aatattagaa gctgttagaa taagagaaaa 120
tgacagagga aaactgaaag ggagaactga aagtgggaaa ttcctctgag gcagaaagga 180
ccatccctta taaatagcac aggccatgaa ggaagatcat tctcactgca gcctttgaca 240
gcctttgcct catcttgtct agagcgctgc caccatgtac gacgggccgc gcctgctgct 300
gttgctgctt ctgggggtgt cccttggagg tgccaaggag gcatgcccca caggcctgta 360
cacacacagc ggtgagtgct gcaaagcctg caacctgggc gagggtgtgg cccagccttg 420
tggagccaac cagaccgtgt gtgagccctg cctggacagc gtgacgttct ccgacgtggt 480
gagcgcgacc gagccgtgca agccgtgcac cgagtgcgtg gggctccaga gcatgtcggc 540
gccatgcgtg gaggccgacg acgccgtgtg ccgctgcgcc tacggctact accaggatga 600
gaccactggg cgctgcgagg cgtgccgcgt gtgcgaggcg ggctcgggcc tcgtgttctc 660
ctgccaggac aagcagaaca ccgtgtgcga ggagtgcccc gacggcacgt attccgacga 720
ggccaaccac gtggacccgt gcctgccctg caccgtgtgc gaggacaccg agcgccagct 780
ccgcgagtgc acacgctggg ccgacgccga gtgcgaggag atccctggcc gttggattac 840
acggtccaca cccccagagg gctcggacag cacagccccc agcacccagg agcctgaggc 900
acctccagaa caagacctca tagccagcac ggtggcaggt gtggtgacca cagtgatggg 960
cagctcccag cccgtggtga cccgaggcac caccgacaac ctcatccctg tctattgctc 1020
catcctggct gctgtggttg tgggtcttgt ggcctacata gccttcaaga ggtggaacag 1080
ctgacctgca gggtagggga ggcgcttttc ccaaggcagt ctggagcatg cgctttagca 1140
gccccgctgg gcacttggcg ctacacaagt ggcctctggc ctcgcacaca ttccacatcc 1200
accggtaggc gccaaccggc tccgttcttt ggtggcccct tcgcgccacc ttctactcct 1260
cccctagtca ggaagttccc ccccgccccg cagctcgcgt cgtgcaggac gtgacaaatg 1320
gaagtagcac gtctcactag tctcgtgcag atggacagca ccgctgagca atggaagcgg 1380
gtaggccttt ggggcagcgg ccaatagcag ctttgctcct tcgctttctg ggctcagagg 1440
ctgggaaggg gtgggtccgg gggcgggctc aggggcgggc tcaggggcgg ggcgggcgcc 1500
cgaaggtcct ccggaggccc ggcattctgc acgcttcaaa agcgcacgtc tgccgcgctg 1560
ttctcctctt cctcatctcc gggcctttcg acctgcagcc caagcttacc atgaccgagt 1620
acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta cgcaccctcg 1680
ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac cgccacatcg 1740
agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg 1800
tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag agcgtcgaag 1860
cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt tcccggctgg 1920
ccgcgcagca acagatggaa ggcctcctgg cgccgcaccg gcccaaggag cccgcgtggt 1980
tcctggccac cgtcggcgtc tcgcccgacc accagggcaa gggtctgggc agcgccgtcg 2040
tgctccccgg agtggaggcg gccgagcgcg ccggggtgcc cgccttcctg gagacctccg 2100
cgccccgcaa cctccccttc tacgagcggc tcggcttcac cgtcaccgcc gacgtcgagg 2160
tgcccgaagg accgcgcacc tggtgcatga cccgcaagcc cggtgcctga 2210
<210> 54
<211> 2711
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 54
taggtcttga aaggagtggg aattggctcc ggtgcccgtc agtgggcaga gcgcacatcg 60
cccacagtcc ccgagaagtt ggggggaggg gtcggcaatt gatccggtgc ctagagaagg 120
tggcgcgggg taaactggga aagtgatgtc gtgtactggc tccgcctttt tcccgagggt 180
gggggagaac cgtatataag tgcagtagtc gccgtgaacg ttctttttcg caacgggttt 240
gccgccagaa cacaggaccg gttctagagc cgccaccatg ctcctgcctt gggccacctc 300
tgcccccggc ctggcctggg ggcctctggt gctgggcctc ttcgggctcc tggcagcatc 360
gcagccccag gcggtgcctc catatgcgtc ggagaaccag acctgcaggg accaggaaaa 420
ggaatactat gagccccagc accgcatctg ctgctcccgc tgcccgccag gcacctatgt 480
ctcagctaaa tgtagccgca tccgggacac agtttgtgcc acatgtgccg agaattccta 540
caacgagcac tggaactacc tgaccatctg ccagctgtgc cgcccctgtg acccagtgat 600
gggcctcgag gagattgccc cctgcacaag caaacggaag acccagtgcc gctgccagcc 660
gggaatgttc tgtgctgcct gggccctcga gtgtacacac tgcgagctac tttctgactg 720
cccgcctggc actgaagccg agctcaaaga tgaagttggg aagggtaaca accactgcgt 780
cccctgcaag gccgggcact tccagaatac ctcctccccc agcgcccgct gccagcccca 840
caccaggtgt gagaaccaag gtctggtgga ggcagctcca ggcactgccc agtccgacac 900
aacctgcaaa aatccattag agccactgcc cccagagatg tcaggaacca tgctgatgct 960
ggccgttctg ctgccactgg ccttctttct gctccttgcc accgtcttct cctgcatctg 1020
gaagagccac ccttctctct gcaggaaact gggatcgctg ctcaagaggc gtccgcaggg 1080
agagggaccc aatcctgtag ctggaagctg ggagcctccg aaggcccatc catacttccc 1140
tgacttggta cagccactgc tacccatttc tggagatgtt tccccagtat ccactgggct 1200
ccccgcagcc ccagttttgg aggcaggggt gccgcaacag cagagtcctc tggacctgac 1260
cagggagccg cagttggaac ccggggagca gagccaggtg gcccacggta ccaatggcat 1320
tcatgtcacc ggcgggtcta tgactatcac tggcaacatc tacatctaca atggaccagt 1380
actgggggga ccaccgggtc ctggagacct cccagctacc cccgaacctc cataccccat 1440
tcccgaagag ggggaccctg gccctcccgg gctctctaca ccccaccagg aagatggcaa 1500
ggcttggcac ctagcggaga cagagcactg tggtgccaca ccctctaaca ggggcccaag 1560
gaaccaattt atcacccatg actgacctgc agggtagggg aggcgctttt cccaaggcag 1620
tctggagcat gcgctttagc agccccgctg ggcacttggc gctacacaag tggcctctgg 1680
cctcgcacac attccacatc caccggtagg cgccaaccgg ctccgttctt tggtggcccc 1740
ttcgcgccac cttctactcc tcccctagtc aggaagttcc cccccgcccc gcagctcgcg 1800
tcgtgcagga cgtgacaaat ggaagtagca cgtctcacta gtctcgtgca gatggacagc 1860
accgctgagc aatggaagcg ggtaggcctt tggggcagcg gccaatagca gctttgctcc 1920
ttcgctttct gggctcagag gctgggaagg ggtgggtccg ggggcgggct caggggcggg 1980
ctcaggggcg gggcgggcgc ccgaaggtcc tccggaggcc cggcattctg cacgcttcaa 2040
aagcgcacgt ctgccgcgct gttctcctct tcctcatctc cgggcctttc gacctgcagc 2100
ccaagcttac catgaccgag tacaagccca cggtgcgcct cgccacccgc gacgacgtcc 2160
ccagggccgt acgcaccctc gccgccgcgt tcgccgacta ccccgccacg cgccacaccg 2220
tcgatccgga ccgccacatc gagcgggtca ccgagctgca agaactcttc ctcacgcgcg 2280
tcgggctcga catcggcaag gtgtgggtcg cggacgacgg cgccgcggtg gcggtctgga 2340
ccacgccgga gagcgtcgaa gcgggggcgg tgttcgccga gatcggcccg cgcatggccg 2400
agttgagcgg ttcccggctg gccgcgcagc aacagatgga aggcctcctg gcgccgcacc 2460
ggcccaagga gcccgcgtgg ttcctggcca ccgtcggcgt ctcgcccgac caccagggca 2520
agggtctggg cagcgccgtc gtgctccccg gagtggaggc ggccgagcgc gccggggtgc 2580
ccgccttcct ggagacctcc gcgccccgca acctcccctt ctacgagcgg ctcggcttca 2640
ccgtcaccgc cgacgtcgag gtgcccgaag gaccgcgcac ctggtgcatg acccgcaagc 2700
ccggtgcctg a 2711
<210> 55
<211> 2448
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 55
ctagagccgc caccatgctc ctgccttggg ccacctctgc ccccggcctg gcctgggggc 60
ctctggtgct gggcctcttc gggctcctgg cagcatcgca gccccaggcg gtgcctccat 120
atgcgtcgga gaaccagacc tgcagggacc aggaaaagga atactatgag ccccagcacc 180
gcatctgctg ctcccgctgc ccgccaggca cctatgtctc agctaaatgt agccgcatcc 240
gggacacagt ttgtgccaca tgtgccgaga attcctacaa cgagcactgg aactacctga 300
ccatctgcca gctgtgccgc ccctgtgacc cagtgatggg cctcgaggag attgccccct 360
gcacaagcaa acggaagacc cagtgccgct gccagccggg aatgttctgt gctgcctggg 420
ccctcgagtg tacacactgc gagctacttt ctgactgccc gcctggcact gaagccgagc 480
tcaaagatga agttgggaag ggtaacaacc actgcgtccc ctgcaaggcc gggcacttcc 540
agaatacctc ctcccccagc gcccgctgcc agccccacac caggtgtgag aaccaaggtc 600
tggtggaggc agctccaggc actgcccagt ccgacacaac ctgcaaaaat ccattagagc 660
cactgccccc agagatgtca ggaaccatgc tgatgctggc cgttctgctg ccactggcct 720
tctttctgct ccttgccacc gtcttctcct gcatctggaa gagccaccct tctctctgca 780
ggaaactggg atcgctgctc aagaggcgtc cgcagggaga gggacccaat cctgtagctg 840
gaagctggga gcctccgaag gcccatccat acttccctga cttggtacag ccactgctac 900
ccatttctgg agatgtttcc ccagtatcca ctgggctccc cgcagcccca gttttggagg 960
caggggtgcc gcaacagcag agtcctctgg acctgaccag ggagccgcag ttggaacccg 1020
gggagcagag ccaggtggcc cacggtacca atggcattca tgtcaccggc gggtctatga 1080
ctatcactgg caacatctac atctacaatg gaccagtact ggggggacca ccgggtcctg 1140
gagacctccc agctaccccc gaacctccat accccattcc cgaagagggg gaccctggcc 1200
ctcccgggct ctctacaccc caccaggaag atggcaaggc ttggcaccta gcggagacag 1260
agcactgtgg tgccacaccc tctaacaggg gcccaaggaa ccaatttatc acccatgact 1320
gacctgcagg gtaggggagg cgcttttccc aaggcagtct ggagcatgcg ctttagcagc 1380
cccgctgggc acttggcgct acacaagtgg cctctggcct cgcacacatt ccacatccac 1440
cggtaggcgc caaccggctc cgttctttgg tggccccttc gcgccacctt ctactcctcc 1500
cctagtcagg aagttccccc ccgccccgca gctcgcgtcg tgcaggacgt gacaaatgga 1560
agtagcacgt ctcactagtc tcgtgcagat ggacagcacc gctgagcaat ggaagcgggt 1620
aggcctttgg ggcagcggcc aatagcagct ttgctccttc gctttctggg ctcagaggct 1680
gggaaggggt gggtccgggg gcgggctcag gggcgggctc aggggcgggg cgggcgcccg 1740
aaggtcctcc ggaggcccgg cattctgcac gcttcaaaag cgcacgtctg ccgcgctgtt 1800
ctcctcttcc tcatctccgg gcctttcgac ctgcagccca agcttaccat gaccgagtac 1860
aagcccacgg tgcgcctcgc cacccgcgac gacgtcccca gggccgtacg caccctcgcc 1920
gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg atccggaccg ccacatcgag 1980
cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg ggctcgacat cggcaaggtg 2040
tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca cgccggagag cgtcgaagcg 2100
ggggcggtgt tcgccgagat cggcccgcgc atggccgagt tgagcggttc ccggctggcc 2160
gcgcagcaac agatggaagg cctcctggcg ccgcaccggc ccaaggagcc cgcgtggttc 2220
ctggccaccg tcggcgtctc gcccgaccac cagggcaagg gtctgggcag cgccgtcgtg 2280
ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga gacctccgcg 2340
ccccgcaacc tccccttcta cgagcggctc ggcttcaccg tcaccgccga cgtcgaggtg 2400
cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg gtgcctga 2448
<210> 56
<211> 2662
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 56
ctagcaagct ggaggaaaaa ctgtttcata cagaaggcgt ggaggaaaaa ctgtttcata 60
cagaaggcgt ggaggaaaaa ctgtttcata cagaaggcgt ggaggaaaaa ctgtttcata 120
cagaaggcgt cgcgaattcg cggagactct agagggtata taatggaagc tcgatttcca 180
gcttggcatt ccggtactgt tggtaaacac ctctagagcg ctgccaccat gctcctgcct 240
tgggccacct ctgcccccgg cctggcctgg gggcctctgg tgctgggcct cttcgggctc 300
ctggcagcat cgcagcccca ggcggtgcct ccatatgcgt cggagaacca gacctgcagg 360
gaccaggaaa aggaatacta tgagccccag caccgcatct gctgctcccg ctgcccgcca 420
ggcacctatg tctcagctaa atgtagccgc atccgggaca cagtttgtgc cacatgtgcc 480
gagaattcct acaacgagca ctggaactac ctgaccatct gccagctgtg ccgcccctgt 540
gacccagtga tgggcctcga ggagattgcc ccctgcacaa gcaaacggaa gacccagtgc 600
cgctgccagc cgggaatgtt ctgtgctgcc tgggccctcg agtgtacaca ctgcgagcta 660
ctttctgact gcccgcctgg cactgaagcc gagctcaaag atgaagttgg gaagggtaac 720
aaccactgcg tcccctgcaa ggccgggcac ttccagaata cctcctcccc cagcgcccgc 780
tgccagcccc acaccaggtg tgagaaccaa ggtctggtgg aggcagctcc aggcactgcc 840
cagtccgaca caacctgcaa aaatccatta gagccactgc ccccagagat gtcaggaacc 900
atgctgatgc tggccgttct gctgccactg gccttctttc tgctccttgc caccgtcttc 960
tcctgcatct ggaagagcca cccttctctc tgcaggaaac tgggatcgct gctcaagagg 1020
cgtccgcagg gagagggacc caatcctgta gctggaagct gggagcctcc gaaggcccat 1080
ccatacttcc ctgacttggt acagccactg ctacccattt ctggagatgt ttccccagta 1140
tccactgggc tccccgcagc cccagttttg gaggcagggg tgccgcaaca gcagagtcct 1200
ctggacctga ccagggagcc gcagttggaa cccggggagc agagccaggt ggcccacggt 1260
accaatggca ttcatgtcac cggcgggtct atgactatca ctggcaacat ctacatctac 1320
aatggaccag tactgggggg accaccgggt cctggagacc tcccagctac ccccgaacct 1380
ccatacccca ttcccgaaga gggggaccct ggccctcccg ggctctctac accccaccag 1440
gaagatggca aggcttggca cctagcggag acagagcact gtggtgccac accctctaac 1500
aggggcccaa ggaaccaatt tatcacccat gactgacctg cagggtaggg gaggcgcttt 1560
tcccaaggca gtctggagca tgcgctttag cagccccgct gggcacttgg cgctacacaa 1620
gtggcctctg gcctcgcaca cattccacat ccaccggtag gcgccaaccg gctccgttct 1680
ttggtggccc cttcgcgcca ccttctactc ctcccctagt caggaagttc ccccccgccc 1740
cgcagctcgc gtcgtgcagg acgtgacaaa tggaagtagc acgtctcact agtctcgtgc 1800
agatggacag caccgctgag caatggaagc gggtaggcct ttggggcagc ggccaatagc 1860
agctttgctc cttcgctttc tgggctcaga ggctgggaag gggtgggtcc gggggcgggc 1920
tcaggggcgg gctcaggggc ggggcgggcg cccgaaggtc ctccggaggc ccggcattct 1980
gcacgcttca aaagcgcacg tctgccgcgc tgttctcctc ttcctcatct ccgggccttt 2040
cgacctgcag cccaagctta ccatgaccga gtacaagccc acggtgcgcc tcgccacccg 2100
cgacgacgtc cccagggccg tacgcaccct cgccgccgcg ttcgccgact accccgccac 2160
gcgccacacc gtcgatccgg accgccacat cgagcgggtc accgagctgc aagaactctt 2220
cctcacgcgc gtcgggctcg acatcggcaa ggtgtgggtc gcggacgacg gcgccgcggt 2280
ggcggtctgg accacgccgg agagcgtcga agcgggggcg gtgttcgccg agatcggccc 2340
gcgcatggcc gagttgagcg gttcccggct ggccgcgcag caacagatgg aaggcctcct 2400
ggcgccgcac cggcccaagg agcccgcgtg gttcctggcc accgtcggcg tctcgcccga 2460
ccaccagggc aagggtctgg gcagcgccgt cgtgctcccc ggagtggagg cggccgagcg 2520
cgccggggtg cccgccttcc tggagacctc cgcgccccgc aacctcccct tctacgagcg 2580
gctcggcttc accgtcaccg ccgacgtcga ggtgcccgaa ggaccgcgca cctggtgcat 2640
gacccgcaag cccggtgcct ga 2662
<210> 57
<211> 2712
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 57
ctagcgggga ctttccgctt ggggactttc cgctggggac tttccgctgg ggactttccg 60
ctggggactt tccgaattca gcttgaataa aatgaatatt agaagctgtt agaataagag 120
aaaatgacag aggaaaactg aaagggagaa ctgaaagtgg gaaattcctc tgaggcagaa 180
aggaccatcc cttataaata gcacaggcca tgaaggaaga tcattctcac tgcagccttt 240
gacagccttt gcctcatctt gtctagagcg ctgccaccat gctcctgcct tgggccacct 300
ctgcccccgg cctggcctgg gggcctctgg tgctgggcct cttcgggctc ctggcagcat 360
cgcagcccca ggcggtgcct ccatatgcgt cggagaacca gacctgcagg gaccaggaaa 420
aggaatacta tgagccccag caccgcatct gctgctcccg ctgcccgcca ggcacctatg 480
tctcagctaa atgtagccgc atccgggaca cagtttgtgc cacatgtgcc gagaattcct 540
acaacgagca ctggaactac ctgaccatct gccagctgtg ccgcccctgt gacccagtga 600
tgggcctcga ggagattgcc ccctgcacaa gcaaacggaa gacccagtgc cgctgccagc 660
cgggaatgtt ctgtgctgcc tgggccctcg agtgtacaca ctgcgagcta ctttctgact 720
gcccgcctgg cactgaagcc gagctcaaag atgaagttgg gaagggtaac aaccactgcg 780
tcccctgcaa ggccgggcac ttccagaata cctcctcccc cagcgcccgc tgccagcccc 840
acaccaggtg tgagaaccaa ggtctggtgg aggcagctcc aggcactgcc cagtccgaca 900
caacctgcaa aaatccatta gagccactgc ccccagagat gtcaggaacc atgctgatgc 960
tggccgttct gctgccactg gccttctttc tgctccttgc caccgtcttc tcctgcatct 1020
ggaagagcca cccttctctc tgcaggaaac tgggatcgct gctcaagagg cgtccgcagg 1080
gagagggacc caatcctgta gctggaagct gggagcctcc gaaggcccat ccatacttcc 1140
ctgacttggt acagccactg ctacccattt ctggagatgt ttccccagta tccactgggc 1200
tccccgcagc cccagttttg gaggcagggg tgccgcaaca gcagagtcct ctggacctga 1260
ccagggagcc gcagttggaa cccggggagc agagccaggt ggcccacggt accaatggca 1320
ttcatgtcac cggcgggtct atgactatca ctggcaacat ctacatctac aatggaccag 1380
tactgggggg accaccgggt cctggagacc tcccagctac ccccgaacct ccatacccca 1440
ttcccgaaga gggggaccct ggccctcccg ggctctctac accccaccag gaagatggca 1500
aggcttggca cctagcggag acagagcact gtggtgccac accctctaac aggggcccaa 1560
ggaaccaatt tatcacccat gactgacctg cagggtaggg gaggcgcttt tcccaaggca 1620
gtctggagca tgcgctttag cagccccgct gggcacttgg cgctacacaa gtggcctctg 1680
gcctcgcaca cattccacat ccaccggtag gcgccaaccg gctccgttct ttggtggccc 1740
cttcgcgcca ccttctactc ctcccctagt caggaagttc ccccccgccc cgcagctcgc 1800
gtcgtgcagg acgtgacaaa tggaagtagc acgtctcact agtctcgtgc agatggacag 1860
caccgctgag caatggaagc gggtaggcct ttggggcagc ggccaatagc agctttgctc 1920
cttcgctttc tgggctcaga ggctgggaag gggtgggtcc gggggcgggc tcaggggcgg 1980
gctcaggggc ggggcgggcg cccgaaggtc ctccggaggc ccggcattct gcacgcttca 2040
aaagcgcacg tctgccgcgc tgttctcctc ttcctcatct ccgggccttt cgacctgcag 2100
cccaagctta ccatgaccga gtacaagccc acggtgcgcc tcgccacccg cgacgacgtc 2160
cccagggccg tacgcaccct cgccgccgcg ttcgccgact accccgccac gcgccacacc 2220
gtcgatccgg accgccacat cgagcgggtc accgagctgc aagaactctt cctcacgcgc 2280
gtcgggctcg acatcggcaa ggtgtgggtc gcggacgacg gcgccgcggt ggcggtctgg 2340
accacgccgg agagcgtcga agcgggggcg gtgttcgccg agatcggccc gcgcatggcc 2400
gagttgagcg gttcccggct ggccgcgcag caacagatgg aaggcctcct ggcgccgcac 2460
cggcccaagg agcccgcgtg gttcctggcc accgtcggcg tctcgcccga ccaccagggc 2520
aagggtctgg gcagcgccgt cgtgctcccc ggagtggagg cggccgagcg cgccggggtg 2580
cccgccttcc tggagacctc cgcgccccgc aacctcccct tctacgagcg gctcggcttc 2640
accgtcaccg ccgacgtcga ggtgcccgaa ggaccgcgca cctggtgcat gacccgcaag 2700
cccggtgcct ga 2712
<210> 58
<211> 2708
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 58
ctagctgagt cagtgactca gtgagtcagt gactcagtga gtcagtgact cagtgagtca 60
gtgactcagg aattcagctt gaataaaatg aatattagaa gctgttagaa taagagaaaa 120
tgacagagga aaactgaaag ggagaactga aagtgggaaa ttcctctgag gcagaaagga 180
ccatccctta taaatagcac aggccatgaa ggaagatcat tctcactgca gcctttgaca 240
gcctttgcct catcttgtct agagcgctgc caccatgctc ctgccttggg ccacctctgc 300
ccccggcctg gcctgggggc ctctggtgct gggcctcttc gggctcctgg cagcatcgca 360
gccccaggcg gtgcctccat atgcgtcgga gaaccagacc tgcagggacc aggaaaagga 420
atactatgag ccccagcacc gcatctgctg ctcccgctgc ccgccaggca cctatgtctc 480
agctaaatgt agccgcatcc gggacacagt ttgtgccaca tgtgccgaga attcctacaa 540
cgagcactgg aactacctga ccatctgcca gctgtgccgc ccctgtgacc cagtgatggg 600
cctcgaggag attgccccct gcacaagcaa acggaagacc cagtgccgct gccagccggg 660
aatgttctgt gctgcctggg ccctcgagtg tacacactgc gagctacttt ctgactgccc 720
gcctggcact gaagccgagc tcaaagatga agttgggaag ggtaacaacc actgcgtccc 780
ctgcaaggcc gggcacttcc agaatacctc ctcccccagc gcccgctgcc agccccacac 840
caggtgtgag aaccaaggtc tggtggaggc agctccaggc actgcccagt ccgacacaac 900
ctgcaaaaat ccattagagc cactgccccc agagatgtca ggaaccatgc tgatgctggc 960
cgttctgctg ccactggcct tctttctgct ccttgccacc gtcttctcct gcatctggaa 1020
gagccaccct tctctctgca ggaaactggg atcgctgctc aagaggcgtc cgcagggaga 1080
gggacccaat cctgtagctg gaagctggga gcctccgaag gcccatccat acttccctga 1140
cttggtacag ccactgctac ccatttctgg agatgtttcc ccagtatcca ctgggctccc 1200
cgcagcccca gttttggagg caggggtgcc gcaacagcag agtcctctgg acctgaccag 1260
ggagccgcag ttggaacccg gggagcagag ccaggtggcc cacggtacca atggcattca 1320
tgtcaccggc gggtctatga ctatcactgg caacatctac atctacaatg gaccagtact 1380
ggggggacca ccgggtcctg gagacctccc agctaccccc gaacctccat accccattcc 1440
cgaagagggg gaccctggcc ctcccgggct ctctacaccc caccaggaag atggcaaggc 1500
ttggcaccta gcggagacag agcactgtgg tgccacaccc tctaacaggg gcccaaggaa 1560
ccaatttatc acccatgact gacctgcagg gtaggggagg cgcttttccc aaggcagtct 1620
ggagcatgcg ctttagcagc cccgctgggc acttggcgct acacaagtgg cctctggcct 1680
cgcacacatt ccacatccac cggtaggcgc caaccggctc cgttctttgg tggccccttc 1740
gcgccacctt ctactcctcc cctagtcagg aagttccccc ccgccccgca gctcgcgtcg 1800
tgcaggacgt gacaaatgga agtagcacgt ctcactagtc tcgtgcagat ggacagcacc 1860
gctgagcaat ggaagcgggt aggcctttgg ggcagcggcc aatagcagct ttgctccttc 1920
gctttctggg ctcagaggct gggaaggggt gggtccgggg gcgggctcag gggcgggctc 1980
aggggcgggg cgggcgcccg aaggtcctcc ggaggcccgg cattctgcac gcttcaaaag 2040
cgcacgtctg ccgcgctgtt ctcctcttcc tcatctccgg gcctttcgac ctgcagccca 2100
agcttaccat gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac gacgtcccca 2160
gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg 2220
atccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg 2280
ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca 2340
cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc atggccgagt 2400
tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg ccgcaccggc 2460
ccaaggagcc cgcgtggttc ctggccaccg tcggcgtctc gcccgaccac cagggcaagg 2520
gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg 2580
ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg 2640
tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg 2700
gtgcctga 2708
<210> 59
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 59
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20

Claims (50)

1.一种经修饰的淋巴细胞,其包括编码LTBR的外源性核酸。
2.根据权利要求1所述的经修饰的淋巴细胞,其中所述编码LTBR的核酸编码细胞内结构域或其片段或变体。
3.根据权利要求2所述的经修饰的淋巴细胞,其中LTBR细胞内结构域包括SEQ ID NO:2的氨基酸249至435或其片段、缺失或变体。
4.根据权利要求2或3所述的经修饰的淋巴细胞,其中所述LTBR细胞内结构域在至少氨基酸393至435中具有缺失。
5.根据权利要求1至4中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞包括表达盒,所述表达盒包括表达控制序列和所述编码LTBR的核酸。
6.根据权利要求1至5中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞进一步包括编码嵌合抗原受体(CAR)的核酸。
7.根据权利要求1或5所述的经修饰的淋巴细胞,其中所述淋巴细胞进一步包括编码T细胞受体(TCR)的核酸。
8.根据权利要求1所述的经修饰的淋巴细胞,其中所述编码LTBR的外源性核酸是mRNA。
9.根据权利要求1至8中任一项所述的经修饰的淋巴细胞,其中所述淋巴细胞是T细胞、NK细胞或NK T细胞。
10.根据权利要求6或权利要求8所述的经修饰的淋巴细胞,其中所述CAR是阿基仑赛(Axicabtagene ciloleucel)布瑞基奥仑赛(Brexucabtagene autoleucel)(TecartusTM)、艾基维仑赛(Idecabtagene vicleucel)(AbecmaTM)、利基迈仑赛(Lisocabtagene maraleucel)/>替沙仑赛(Tisagenlecleucel)/>或在图19中发现的那些中的一者。
11.一种表达盒,其包括编码嵌合抗原受体(CAR)的核苷酸序列和编码LTBR的核酸。
12.一种表达盒,其包括编码T细胞受体的核酸和编码LTBR的核酸。
13.一种表达盒,其包括编码病毒蛋白的核酸和编码LTBR的核酸。
14.根据权利要求11至13中任一项所述的表达盒,其中所述编码LTBR的核酸编码LTBR细胞内结构域或其片段或变体。
15.一种产生经修饰的淋巴细胞的方法,所述方法包括将编码LTBR的外源性核酸引入到所述细胞中。
16.根据权利要求15所述的方法,其中所述编码LTBR的核酸编码LTBR细胞内结构域或其片段或变体。
17.根据权利要求15或16所述的方法,其中所述淋巴细胞进一步包括编码嵌合抗原受体(CAR)的核酸。
18.根据权利要求15至17中任一项所述的方法,其中所述淋巴细胞进一步包括编码经工程化的T细胞受体(TCR)的核酸。
19.一种治疗有需要的受试者的癌症的方法,所述方法包括向所述受试者施用根据权利要求1至10中任一项所述的经修饰的淋巴细胞或根据权利要求11至14中任一项所述的表达盒。
20.一种治疗有需要的受试者的病毒性疾病的方法,所述方法包括向所述受试者施用根据权利要求1至10中任一项所述的组合物或根据权利要求11至14中任一项所述的表达盒。
21.一种治疗有需要的受试者的自身免疫性病症的方法,所述方法包括向所述受试者施用根据权利要求1至10中任一项所述的经修饰的淋巴细胞或根据权利要求11至14中任一项所述的表达盒。
22.一种增加增殖或包含细胞因子产生和/或分泌的T细胞效应子功能的方法,所述方法包括将根据权利要求1a至14中任一项所述的表达盒引入到T细胞中。
23.根据权利要求22所述的方法,其中所述T细胞是在处理所述T细胞以过表达LTBR之前从人获得的,并且将经处理的T细胞重新引入到人体内。
24.一种增加对疫苗组合物的应答的方法,所述方法包括向受试者共施用包括编码LTBR的核酸的疫苗。
25.根据权利要求24所述的方法,其中所述编码LTBR的核酸编码LTBR细胞内结构域或其片段或变体。
26.根据权利要求24至25中任一项所述的方法,其中LTBR的表达是瞬时的。
27.一种经修饰的淋巴细胞,其包括编码表1的基因的外源性核酸。
28.根据权利要求27所述的经修饰的淋巴细胞,其中所述淋巴细胞包括表达盒,所述表达盒包括表达控制序列和编码表1的所述基因的核酸。
29.根据权利要求27或28所述的经修饰的淋巴细胞,其中所述淋巴细胞进一步包括编码嵌合抗原受体(CAR)的核酸。
30.根据权利要求27或28所述的经修饰的淋巴细胞,其中所述淋巴细胞进一步包括编码T细胞受体(TCR)的核酸。
31.一种表达盒,其包括编码嵌合抗原受体的核苷酸序列和编码表1的基因的核酸。
32.一种表达盒,其包括编码T细胞受体的核酸和编码表1的基因的核酸。
33.一种表达盒,其包括编码病毒蛋白的核酸和编码表1的基因的核酸。
34.一种组合物,其包括经修饰的淋巴细胞,所述经修饰的淋巴细胞包括根据权利要求31至33中任一项所述的表达盒。
35.一种产生经修饰的淋巴细胞的方法,所述方法包括将编码表1的基因的外源性核酸引入到所述淋巴细胞中。
36.一种治疗有需要的受试者的癌症的方法,所述方法包括向所述受试者施用根据权利要求27至30中任一项所述的经修饰的淋巴细胞、根据权利要求31至33中任一项所述的表达盒或根据权利要求34所述的组合物。
37.根据权利要求27至36中任一项所述的经修饰的淋巴细胞、组合物、表达盒或方法,其中表1的所述基因是LTBR、ADA、IFNL2、IL12B CALML3 MRPL51、DBIGPN3、ITM2A、AHNAK、BATF、GPD1、ATF6B、AHCY、DUPD1或AKR1C4。
38.一种鉴定基因的方法,所述基因当在经修饰的淋巴细胞中外源性地表达时改变所述经修饰的淋巴细胞的治疗功能,所述方法包括:
(a)获得淋巴细胞群体;
(b)用多个病毒载体转导所述淋巴细胞群体,每个病毒载体编码能够与一个或多个条形码连接的基因;
(c)刺激经转导的淋巴细胞以诱导激活、增殖和/或效应子功能;
(d)从(c)的所述淋巴细胞群体中分离经转导的淋巴细胞;以及
(e)检测经分离的淋巴细胞中的所述基因和/或连接的条形码的存在;
其中检测到的基因可有效改变表达所述基因的经修饰的淋巴细胞的所述治疗功能。
39.根据权利要求38所述的方法,其中所述基因是开放阅读框(ORF)或编码非编码RNA的核苷酸序列,任选地是微小RNA(miRNA)或长非编码RNA(lncRNA,长ncRNA)。
40.根据权利要求38或39所述的方法,其中所述淋巴细胞群体包括已富集T细胞、B细胞、NK T细胞、NK细胞或其亚群体中的一种或多种的细胞群体,任选地其中所述细胞是人。
41.根据权利要求38至40中任一项所述的方法,其中所述淋巴细胞群体包括CAR T细胞。
42.根据权利要求38至40中任一项所述的方法,其中所述淋巴细胞群体包括淋巴细胞,所述淋巴细胞包括在其表面上表达的经工程化的TCR。
43.根据权利要求38至42中任一项所述的方法,其中所述多个病毒载体包括开放阅读框(ORF)的文库。
44.根据权利要求38至43中任一项所述的方法,其中(e)包括从所述经分离的淋巴细胞获得基因组DNA,并对所述基因和/或条形码序列进行PCR扩增。
45.根据权利要求38至44中任一项所述的方法,其中(e)进一步包括单细胞转录组和/或蛋白质组分析。
46.一种分析所关注ORF的过表达对单个细胞的效应的方法,所述方法包括:
(a)将包括编码所述所关注ORF的核酸的表达盒引入到所述细胞中并过表达所述ORF;
(b)将源自所述单个细胞的第一组核酸和具有第一条形码序列的第一寡核苷酸提供到离散分区中,其中所述寡核苷酸与珠粒连接,其中所述第一组核酸包括内源性转录组mRNA和ORF mRNA;
(c)进行RT-PCR以产生源自所述第一组核酸的第二组核酸,其中所述分区内的所述第二组核酸具有与其连接的包括第一核酸条形码序列的第一寡核苷酸,并且其中所述RT-PCR使用RT-PCR试剂进行,所述RT-PCR试剂包括与所述ORF mRNA上的序列特异性粘接的引物,所述序列不是poly A序列,并且其中所述第二组核酸包括内源性转录组cDNA和ORF cDNA;以及
(d)使用PCR试剂扩增所述第二组核酸以产生第三组核酸,所述PCR试剂包括与所述ORFcDNA上的序列特异性粘接的第二引物,所述序列不是poly A序列;以及
(e)检测所述条形码序列、所述转录组cDNA和/或所述ORF cDNA和/或对其进行测序。
47.根据权利要求146所述的方法,其进一步包括(d')获得所述第三组核酸的一部分,并使用第二组PCR试剂扩增所述ORF cDNA,以产生第四组核酸,所述第二组PCR试剂包括第三引物,所述第三引物与所述ORF cDNA上的序列特异性粘接,所述序列不是poly A序列。
48.根据权利要求47所述的方法,其进一步包括(d")使用第三组PCR试剂扩增所述第四组核酸中的所述ORF cDNA,以产生第五组核酸,所述第三组PCR试剂包括第四引物,所述第四引物与所述ORF cDNA上的序列特异性粘接,所述序列不是poly A序列。
49.根据权利要求46至48中任一项所述的方法,其进一步包括使(a)的所述细胞与构建体接触,所述构建体包括与所述第一寡核苷酸连接的抗体或抗体片段。
50.根据权利要求46至49中任一项所述的方法,其进一步包括单细胞转录组和/或蛋白质组分析。
CN202280058758.3A 2021-06-30 2022-06-30 用于改进的免疫疗法的方法和组合物 Pending CN117979979A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US63/217014 2021-06-30
US63/287389 2021-12-08
US202263320101P 2022-03-15 2022-03-15
US63/320101 2022-03-15
PCT/US2022/073294 WO2023279049A1 (en) 2021-06-30 2022-06-30 Methods and compositions for improved immunotherapies

Publications (1)

Publication Number Publication Date
CN117979979A true CN117979979A (zh) 2024-05-03

Family

ID=90853900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280058758.3A Pending CN117979979A (zh) 2021-06-30 2022-06-30 用于改进的免疫疗法的方法和组合物

Country Status (1)

Country Link
CN (1) CN117979979A (zh)

Similar Documents

Publication Publication Date Title
Micklethwaite et al. Investigation of product-derived lymphoma following infusion of piggyBac-modified CD19 chimeric antigen receptor T cells
JP7224318B2 (ja) 養子細胞療法用の操作された細胞
US20210388389A1 (en) Compositions and methods for rapid and modular generation of chimeric antigen receptor t cells
JP6673838B2 (ja) 免疫細胞と病的細胞の両方に存在する抗原を標的とするように操作された、免疫療法のための細胞
KR20220105664A (ko) Bcma 및 cd19에 결합하는 키메라 항원 수용체 및 이의 용도
KR20200133218A (ko) 개선된 면역요법을 위한 유전자-조절 조성물 및 방법
WO2020057666A1 (zh) 表达有嵌合受体的t细胞
KR20200130826A (ko) 개선된 면역요법을 위한 유전자-조절 조성물 및 방법
JP2021518161A6 (ja) 免疫療法の改善のための遺伝子調節組成物及び遺伝子調節方法
KR20200133219A (ko) 개선된 면역요법을 위한 유전자-조절 조성물 및 방법
US20230108584A1 (en) Methods for activation and expansion of tumor infiltrating lymphocytes
CN110753755A (zh) T细胞耗竭状态特异性基因表达调节子及其用途
CN115397460A (zh) 制备表达嵌合抗原受体的细胞的方法
KR20220146530A (ko) 키메라 항원 수용체-발현 세포의 제조 방법
CN116234558A (zh) 条件性地表达重组受体的工程化t细胞、相关多核苷酸和方法
CN116583537A (zh) 与对过继细胞疗法的应答相关的t细胞表型
US20220162288A1 (en) Cellular therapeutics engineered with signal modulators and methods of use thereof
US20210269794A1 (en) Compositions and Methods for High-Throughput Activation Screening to Boost T Cell Effector Function
KR20220157435A (ko) 면역요법을 위해 단일 세포 분석에 의해 종양으로부터 t 세포 및 t 세포 수용체를 단리하는 방법
Sengupta et al. Cell lineage as a predictor of immune response in neuroblastoma
WO2023049733A2 (en) Methods and composition using patient-derived autologous neoantigens for treating cancer
CN117979979A (zh) 用于改进的免疫疗法的方法和组合物
CN115461452A (zh) 通过破坏SAGA(Spt-Ada-Gcn5-乙酰转移酶)复合物来增强CD8+T细胞的活化和溶细胞活性的组合物和方法
AU2022305356A1 (en) Methods and compositions for improved immunotherapies
EP3737393A1 (en) Mirna modulation of t cell signaling and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication