CN108138362B

CN108138362B - 模块化多肽文库以及其制备和使用方法

Info

Publication number: CN108138362B
Application number: CN201680057253.XA
Authority: CN
Inventors: W·A·林; S·M·科伊尔; R·M·歌德雷; K·T·罗伊鲍尔
Original assignee: University of California
Current assignee: University of California
Priority date: 2015-09-01
Filing date: 2016-08-31
Publication date: 2022-03-29
Anticipated expiration: 2036-08-31
Also published as: IL293963A; JP2021119780A; HK1256697A1; US20200224191A1; CA2995389A1; CA2995389C; EP3344803B1; AU2016315941A1; EP4282979A3; WO2017040694A3; HK1256838A1; CA3227545A1; CN114657173A; EP3344803A4; WO2017040694A2; US20230212557A1; JP7397821B2; MX2018002596A; KR20240056636A; KR20180081486A

Abstract

本公开提供了合成模块化多肽文库和编码这样的合成模块化多肽文库的核酸。还提供了制备合成模块化多肽文库和编码合成模块化多肽文库的核酸的方法。还提供了筛选合成模块化多肽文库以鉴定与合成模块化多肽文库的成员相关的所选表型的方法，其中这样的方法可用于体外测定和体内测定两者。

Description

模块化多肽文库以及其制备和使用方法

交叉引用

本申请要求2015年9月1日提交的美国临时专利申请号62/212,999的权益，该申请以引用的方式整体并入本文。

关于联邦政府资助的研究的声明

本发明是根据国家卫生研究院(National Institutes of Health)授予的基金号EY016546、P50 GM081879、R01 CA196277、F32 GM006499以及R01 GM055040在政府支持下进行的。政府拥有本发明的某些权利。

作为文本文件提供的序列表以引用的方式并入

序列表是作为2016年8月29日创建并且具有145KB的大小的文本文件“UCSF-518WOSeqList_ST25.txt”随本文提供的。所述文本文件的内容以引用的方式整体并入本文。

背景技术

许多真核生物蛋白质经由模块化结构域或基序起作用，所述模块化结构域或基序控制或促进蛋白质整体的输入功能和输出功能。真核生物蛋白质的模块化结构域的重排和重组已经开始提供具有改变的输入/输出关系和完全新颖的总体功能的新蛋白质。成功通过输入结构域和输出结构域的简单重组将单个模块化蛋白质工程化已经用作这种用于新蛋白质开发的模块化方法的原理验证。

到目前为止例如用于治疗性细胞的新合成蛋白的构建已经用逐个构建体进行。同样，这样的合成蛋白的转染和筛选也已经以低通量方法，使用逐个筛选的单个构建体或在一些情况下，并行筛选的少量单个构建体来进行。并行筛选虽然比逐个筛选单个构建体更高效，但是具有有限的可按比例缩放性，这是因为要求单个构建体必须保持物理上分开的以有助于对表现良好的构建体进行末期鉴定。单独筛选大量新的蛋白质在进行体外测定时是繁重的，但是在测试被推进到在体内模型中进行的测定时变得甚至更加过于繁琐和昂贵。这样的单独产生和单独筛选极大地限制了新合成蛋白的开发速率。

发明内容

提供了一种在细胞中鉴定与合成模块化多肽相关的所选表型的方法，所述方法包括：a)将带条形码的核酸文库引入到宿主细胞中，从而产生遗传修饰的宿主细胞的异质群体，其中所述带条形码的核酸文库包含多个成员，所述多个成员中的每一个均包含编码不同合成模块化多肽的核苷酸序列；以及b)在所述异质群体内鉴定响应于刺激物展示出所述所选表型的遗传修饰的宿主细胞。

还提供了一种方法，其中所述合成模块化多肽是嵌合抗原受体(CAR)多肽并且其中所述刺激物是抗原提呈细胞，所述细胞在它的表面上展示由所述CAR结合的抗原。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述刺激物与共刺激分子接触。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述合成模块化多肽是模块化受体多肽。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述模块化受体多肽是嵌合Notch受体多肽。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述刺激物是嵌合Notch受体多肽的配体。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述合成模块化多肽是模块化支架蛋白。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述合成模块化多肽是模块化蛋白激酶或磷酸酶蛋白。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述合成模块化多肽是模块化转录调节因子蛋白。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述合成模块化多肽是模块化表观遗传调节因子蛋白。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述合成模块化多肽是模块化重组酶或核酸酶蛋白。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述所选表型包括包含两种或更多种表型的表型特征。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，所述方法包括对所鉴定的遗传修饰的宿主细胞的条形码进行测序以鉴定所述与所述表型相关的合成模块化多肽。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，所述方法包括对所述与所述表型相关的合成模块化多肽进行定量。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，所述方法包括对所述带条形码的核酸文库的合成模块化多肽的单个模块进行定量。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中编码不同合成模块化多肽的每一个核苷酸序列包含与所述编码所述合成模块化多肽的核苷酸序列可操作连接的编码可检测的报告蛋白的序列并且所述方法还包括基于所述所表达的可检测的报告蛋白分配所述遗传修饰的宿主细胞的异质群体。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述鉴定是在体外或离体进行的。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述表型是以下各项中的一种或多种：a)增殖；b)细胞因子产生；c)细胞表面标志物的表达；d)报告蛋白的表达。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述方法包括包含100个或更多个独特成员的带条形码的核酸文库并且所述鉴定包括针对所述所选表型对所述文库的100个或更多个独特成员进行筛选。

还提供了一种鉴定细胞中与合成模块化多肽相关的所选表型的方法，其中所述方法包括包含多个成员的带条形码的核酸文库，其中所述多个成员包含编码合成模块化多肽的核苷酸序列，所述合成模块化多肽包含选自以下的模块化结构域：抗原结合结构域、特异性结合结构域或特异性结合配偶体蛋白、共刺激结构域、共抑制结构域、细胞内信号转导结构域、跨膜结构域、支架蛋白结构域、蛋白激酶蛋白结构域、蛋白质磷酸酶蛋白结构域、受体酪氨酸激酶蛋白结构域、脂质激酶蛋白结构域、脂质磷酸酶蛋白结构域、泛素化酶蛋白结构域、去泛素化酶蛋白结构域、SUMO化酶蛋白结构域、乙酰化酶蛋白结构域、脱乙酰基酶蛋白结构域、甲基化酶蛋白结构域、脱甲基酶蛋白结构域、核酸酶蛋白结构域、重组酶蛋白结构域、转录因子蛋白结构域以及其组合。

提供了一种带条形码的核酸文库，所述文库包含：多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中每一个独特的多核苷酸包含：i)编码所述独特的合成模块化多肽的编码区，所述编码区包含编码第一模块的第一编码序列，所述第一编码序列与编码第二模块的第二编码序列在框内连接，ii)条形码区，所述条形码区包含对所述第一编码序列具有特异性的第一条形码，所述第一条形码与对所述第二编码序列具有特异性的第二条形码连接，其中与所述第一编码序列和所述第二编码序列相比，所述第一条形码和所述第二条形码处于相反的5′到3′顺序；并且其中对每一个条形码区进行测序允许鉴定每一个独特的合成模块化多肽。

还提供了一种带条形码的核酸文库，其中所述第一编码序列和所述第二编码序列直接连接而没有任何间插的非编码核苷酸。

还提供了一种带条形码的核酸文库，其中所述多个独特的多核苷酸包括至少1000个独特的多核苷酸。

还提供了一种带条形码的核酸文库，其中所述条形码区是所述编码区的5′。

还提供了一种带条形码的核酸文库，其中所述编码区是所述条形码区的5′。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中所述独特的合成模块化多肽包含共刺激结构域。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，所述合成模块化多肽包括第一模块和第二模块，其中所述第一模块和所述第二模块包含不同的共刺激结构域。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中每一个独特的多核苷酸还包含与所述编码区和编码可检测的多肽的报告基因序列两者可操作地连接的启动子序列，其中所述可检测的多肽是可光学检测的多肽，包括例如可光学检测的荧光多肽。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，所述核苷酸序列包括编码区，其中所述编码区还包含与所述第二编码序列在框内连接的编码第三模块的第三编码序列并且所述条形码区包含与所述第二条形码连接的对所述第三编码序列具有特异性的第三条形码，其中与所述第一编码序列、所述第二编码序列以及所述第三编码序列相比，所述第一条形码、所述第二条形码以及所述第三条形码处于相反的5′到3′顺序。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个独特的多核苷酸中的每一个编码的独特的合成模块化多肽是嵌合抗原受体(CAR)多肽。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个独特的多核苷酸中的每一个编码的独特的合成模块化多肽是模块化受体多肽。

还提供了一种带条形码的核酸文库，所述核酸编码模块化受体多肽，其中所述模块化受体多肽是嵌合Notch受体多肽。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个独特的多核苷酸中的每一个编码的独特的合成模块化多肽是模块化支架蛋白。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个独特的多核苷酸中的每一个编码的独特的合成模块化多肽是模块化蛋白激酶或磷酸酶蛋白。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个独特的多核苷酸中的每一个编码的独特的合成模块化多肽是模块化转录调节因子蛋白。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个独特的多核苷酸中的每一个编码的独特的合成模块化多肽是模块化表观遗传调节因子蛋白。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个独特的多核苷酸中的每一个编码的独特的合成模块化多肽是模块化重组酶或核酸酶蛋白。

还提供了一种带条形码的核酸文库，所述核酸文库包括多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个独特的多核苷酸中的每一个编码的独特的合成模块化多肽包含选自以下的模块化结构域：抗原结合结构域、特异性结合结构域或特异性结合配偶体蛋白、共刺激结构域、共抑制结构域、细胞内信号转导结构域、跨膜结构域、支架蛋白结构域、蛋白激酶蛋白结构域、蛋白质磷酸酶蛋白结构域、受体酪氨酸激酶蛋白结构域、脂质激酶蛋白结构域、脂质磷酸酶蛋白结构域、泛素化酶蛋白结构域、去泛素化酶蛋白结构域、SUMO化酶蛋白结构域、乙酰化酶蛋白结构域、脱乙酰基酶蛋白结构域、甲基化酶蛋白结构域、脱甲基酶蛋白结构域、核酸酶蛋白结构域、重组酶蛋白结构域、转录因子蛋白结构域以及其组合。

提供了一种细胞文库，所述文库包含：各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，其中每一个独特的多核苷酸包含：i)编码所述独特的合成模块化多肽的编码区，所述编码区包含编码第一模块的第一编码序列，所述第一编码序列与编码第二模块的第二编码序列在框内连接，ii)条形码区，所述条形码区包含对所述第一编码序列具有特异性的第一条形码，所述第一条形码与对所述第二编码序列具有特异性的第二条形码连接，其中与所述第一编码序列和所述第二编码序列相比，所述第一条形码和所述第二条形码处于相反的5′到3′顺序；并且其中对每一个条形码区进行测序允许鉴定所述文库的每一个细胞的每一个独特的合成模块化多肽。

还提供了一种细胞文库，其中所述细胞是原核细胞或真核细胞。还提供了一种细胞文库，其中所述真核细胞是人类细胞。还提供了一种细胞文库，其中所述人类细胞是人类T细胞。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，所述核苷酸序列包括编码所述独特的合成模块化多肽的编码区，所述编码区包含编码第一模块的第一编码序列，所述第一编码序列与编码第二模块的第二编码序列在框内连接，其中所述第一编码序列和所述第二编码序列直接连接而没有任何间插的非编码核苷酸。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，所述核苷酸序列包括编码所述独特的合成模块化多肽的编码区，所述编码区包含编码第一模块的第一编码序列，所述第一编码序列与编码第二模块的第二编码序列在框内连接，其中所述编码区还包含与所述第二编码序列在框内连接的编码报告蛋白的报告蛋白编码序列。

还提供了一种细胞文库，所述细胞文库包括与所述第二编码序列在框内连接的编码报告蛋白的报告蛋白编码序列，其中所述报告蛋白是表位标签。

还提供了一种细胞文库，所述细胞文库包括与所述第二编码序列在框内连接的编码报告蛋白的报告蛋白编码序列，其中所述报告蛋白是荧光蛋白。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，其中所述多个细胞包含至少1000个独特的多核苷酸。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含包括编码独特的合成模块化多肽的编码区的核苷酸序列，其中所述编码区还包含与所述第二编码序列在框内连接的编码第三模块的第三编码序列并且所述条形码区包含与所述第二条形码连接的对所述第三编码序列具有特异性的第三条形码，其中与所述第一编码序列、所述第二编码序列以及所述第三编码序列相比，所述第一条形码、所述第二条形码以及所述第三条形码处于相反的5′到3′顺序。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个细胞的每一个独特的多核苷酸编码的独特的合成模块化多肽是嵌合抗原受体(CAR)多肽。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个细胞的每一个独特的多核苷酸编码的独特的合成模块化多肽是模块化受体多肽。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，其中所述模块化受体多肽是嵌合Notch受体多肽。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个细胞的每一个独特的多核苷酸编码的独特的合成模块化多肽是模块化支架蛋白。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个细胞的每一个独特的多核苷酸编码的独特的合成模块化多肽是模块化蛋白激酶或磷酸酶蛋白。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个细胞的每一个独特的多核苷酸编码的独特的合成模块化多肽是模块化转录调节因子蛋白。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个细胞的每一个独特的多核苷酸编码的独特的合成模块化多肽是模块化表观遗传调节因子蛋白。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个细胞的每一个独特的多核苷酸编码的独特的合成模块化多肽是模块化重组酶或核酸酶蛋白。

还提供了一种细胞文库，所述细胞文库包括各自包含独特的多核苷酸的多个细胞，所述独特的多核苷酸包含编码独特的合成模块化多肽的核苷酸序列，其中所述由所述多个细胞的每一个独特的多核苷酸编码的独特的合成模块化多肽包含选自以下的模块化结构域：抗原结合结构域、特异性结合结构域或特异性结合配偶体蛋白、共刺激结构域、共抑制结构域、细胞内信号转导结构域、跨膜结构域、支架蛋白结构域、蛋白激酶蛋白结构域、蛋白质磷酸酶蛋白结构域、受体酪氨酸激酶蛋白结构域、脂质激酶蛋白结构域、脂质磷酸酶蛋白结构域、泛素化酶蛋白结构域、去泛素化酶蛋白结构域、SUMO化酶蛋白结构域、乙酰化酶蛋白结构域、脱乙酰基酶蛋白结构域、甲基化酶蛋白结构域、脱甲基酶蛋白结构域、核酸酶蛋白结构域、重组酶蛋白结构域、转录因子蛋白结构域以及其组合。

提供了一种制备带条形码的核酸文库的方法，所述核酸各自编码独特的合成模块化多肽，所述方法包括：使第一多核苷酸与第二多核苷酸在如下条件下接触，所述第一多核苷酸包含与第一条形码序列连接的第一模块编码序列，所述第二多核苷酸包含与第二条形码序列连接的第二模块编码序列，所述条件足以在所述第二编码序列与所述第二条形码序列之间的连接处将所述第一多核苷酸插入到所述第二多核苷酸中，从而产生带条形码的双模块化多核苷酸，其中所述带条形码的双模块化多核苷酸包含所述与所述第一模块编码序列在框内连接的第二模块编码序列，所述第一模块编码序列与所述第一条形码序列连接，所述第一条形码序列与所述第二条形码序列连接。

还提供了一种制备带条形码的核酸文库的方法，所述核酸各自编码独特的合成模块化多肽，其中所述方法还包括使所述第一多核苷酸和所述第二多核苷酸与第三多核苷酸接触，所述第三多核苷酸包含与第三条形码序列连接的第三模块编码序列，其中所述第三多核苷酸在所述第一编码序列与所述第一条形码序列之间的连接处插入所述第一多核苷酸中，从而产生带条形码的三模块化多核苷酸，其中所述带条形码的三模块化多核苷酸包含所述与所述第一模块编码序列在框内连接的第二模块编码序列，所述第一模块编码序列与所述第三模块编码序列在框内连接，所述第三模块编码序列与所述第三条形码序列连接，所述第三条形码序列与所述第一条形码序列连接，所述第一条形码序列与所述第二条形码序列连接。

还提供了一种制备带条形码的核酸文库的方法，所述核酸各自编码独特的合成模块化多肽，其中所述第一模块编码序列和所述第二模块编码序列在框内连接而没有任何间插的非编码核苷酸。

还提供了一种制备带条形码的核酸文库的方法，所述核酸各自编码独特的合成模块化多肽，其中所述带条形码的文库包含各自编码独特的合成模块化多肽的1000个或更多个独特的核酸。

还提供了一种制备带条形码的核酸文库的方法，所述核酸各自编码独特的合成模块化多肽，其中所述条形码序列是所述模块编码序列的5′或所述模块编码序列的3′。

还提供了一种制备带条形码的核酸文库的方法，所述核酸各自编码独特的合成模块化多肽，其中在所述第二编码序列与所述第二条形码序列之间的连接处将所述第一多核苷酸插入到所述第二多核苷酸中是由限制性内切酶的活性介导的，所述限制性内切酶识别所述第二多核苷酸上的限制性内切酶识别位点并且在所述第二编码序列与所述第二条形码序列之间切割所述第二多核苷酸，包括其中所述所使用的限制性内切酶是II型限制性内切酶，包括其中所述所使用的限制性内切酶是IIS型限制性内切酶。

还提供了一种制备带条形码的核酸文库的方法，所述核酸各自编码独特的合成模块化多肽，其中所述第一多核苷酸也包含所述存在于所述第二多核苷酸上的限制性内切酶识别位点。

还提供了一种制备带条形码的核酸文库的方法，所述核酸各自编码独特的合成模块化多肽，其中所述方法还包括使带条形码的双模块化多核苷酸与编码报告蛋白的多核苷酸在如下的条件下接触，所述条件足以在所述第一模块编码序列与所述第一条形码序列之间的连接处将所述编码报告蛋白的多核苷酸插入到所述带条形码的双模块化多核苷酸中，从而产生连接报告蛋白的带条形码的双模块化多核苷酸，其中所述连接报告蛋白的带条形码的双模块化多核苷酸包含所述与所述第一模块编码序列在框内连接的第二模块编码序列，所述第一模块编码序列与所述报告蛋白编码序列在框内连接，所述报告蛋白编码序列与所述第一条形码序列连接，所述第一条形码序列与所述第二条形码序列连接。还提供了一种制备带条形码的文库的方法，其中所述报告蛋白编码序列编码表位标签或荧光报告蛋白。

提供了一种嵌合抗原受体(CAR)，所述嵌合抗原受体是通过筛选编码合成模块化CAR多肽的核酸的文库来鉴定的，其中所述CAR包含表3或表4中所列的至少一个共调节结构域。

还提供了一种CAR，所述CAR是通过筛选编码合成模块化CAR多肽的核酸的文库来鉴定的，其中所述CAR包含抗CD19抗原结合结构域。

还提供了一种CAR，所述CAR是通过筛选编码合成模块化CAR多肽的核酸的文库来鉴定的，其中所述CAR包含CD3ζ主要信号转导结构域。

还提供了一种CAR，所述CAR是通过筛选编码合成模块化CAR多肽的核酸的文库来鉴定的，其中所述CAR刺激T细胞活性并且包含表3中所列的至少一个共刺激结构域。

还提供了一种CAR，所述CAR是通过筛选编码合成模块化CAR多肽的核酸的文库来鉴定的，其中所述CAR抑制T细胞活性并且包含表4中所列的至少一个共抑制结构域。

还提供了一种编码CAR的核酸，所述CAR是通过筛选编码合成模块化CAR多肽的核酸的文库来鉴定的，包括例如本文所述的那些CAR中的任一种。

附图说明

图1描绘了根据本公开的一个实施方案被亚克隆用于文库组装的带条形码的模块序列。

图2描绘了在IIS型限制性内切酶消化以为文库组装作准备之后图1的带条形码的模块序列。

图3描绘了根据图1(在IIS型限制性内切酶(RE)消化之前；SEQ ID NO：16)和图2(在IIS型RE消化之后；SEQ ID NO：17)的示例性序列片段，所述片段含有编码CD28共刺激结构域(IIS型RE消化片段的翻译；SEQ ID NO：18)的序列。

图4提供了表1。表1中序列的序列标识号如下：索引1：SEQ ID NO：19；索引2：SEQID NO：20；索引3：SEQ ID NO：21；索引4：SEQ ID NO：22；索引5：SEQ ID NO：23；索引6：SEQID NO：24；索引7：SEQ ID NO：25；索引8：SEQ ID NO：26；索引9：SEQ ID NO：27；索引10：SEQID NO：28；索引11：SEQ ID NO：29；索引12：SEQ ID NO：30；索引13：SEQ ID NO：31；索引14：SEQ ID NO：32；索引15：SEQ ID NO：33；索引16：SEQ ID NO：34；索引17：SEQ ID NO：35；索引18：SEQ ID NO：36；索引19：SEQ ID NO：37；索引20：SEQ ID NO：38；索引21：SEQ ID NO：39；索引22：SEQ ID NO：40；索引23：SEQ ID NO：41；索引24：SEQ ID NO：42；索引25：SEQ ID NO：43；索引26：SEQ ID NO：44；索引27：SEQ ID NO：45；索引28：SEQ ID NO：46；索引29：SEQ IDNO：47；索引30：SEQ ID NO：48；索引31：SEQ ID NO：49；索引32：SEQ ID NO：50；索引33：SEQID NO：51；索引34：SEQ ID NO：52；索引35：SEQ ID NO：53；索引36：SEQ ID NO：54；索引37：SEQ ID NO：55；索引38：SEQ ID NO：56；索引39：SEQ ID NO：57；索引40：SEQ ID NO：58；索引41：SEQ ID NO：59；索引42：SEQ ID NO：60；索引43：SEQ ID NO：61；索引44：SEQ ID NO：62；索引45：SEQ ID NO：63；索引46：SEQ ID NO：64；索引47：SEQ ID NO：65；索引48：SEQ ID NO：66；索引49：SEQ ID NO：67；索引50：SEQ ID NO：68；索引51：SEQ ID NO：69；索引52：SEQ IDNO：70；索引53：SEQ ID NO：71；索引54：SEQ ID NO：72；索引55：SEQ ID NO：73；索引56：SEQID NO：74；索引57：SEQ ID NO：75；索引58：SEQ ID NO：76；索引59：SEQ ID NO：77；索引60：SEQ ID NO：26；索引61：SEQ ID NO：26；索引62：SEQ ID NO：26。

图5描绘了根据本公开的一个实施方案的带条形码的二维共调节模块文库的逐步组装的一般方案。

图6描绘了根据本公开的一个实施方案的62×62二维共调节模块文库的产生的一般方案。

图7描绘了根据本公开的一个实施方案的一维嵌合抗原受体(CAR)文库的成员的一般构型。

图8描绘了基于所得的激活水平对受刺激的表达CAR的T细胞的功能分选(即分级)。

图9描绘了如通过对模块特异性条形码进行定量测序所进行的文库的每一个共调节结构域对T细胞活性的相对影响的定量。

图10描绘了使用具有62个成员的一维文库所获得的在三个递增的抗原输入水平下六个共调节结构域的剂量-反应特征。

图11描绘了根据本公开的一个实施方案的CAR文库的非限制性实例，表明其中CAR的各个结构域可以在所述文库内变化。

图12描绘了如本文所述的示意性的带条形码的模块编码序列组装策略。

图13描绘了如本文所述的示意性的带条形码的模块编码序列组装策略。

图14描绘了如本文所述的示意性的带条形码的模块编码序列组装策略。

图15描绘了如本文所述的示意性的带条形码的模块编码序列组装策略。

图16描绘了如本文所述的示意性的带条形码的模块编码序列组装策略。

图17描绘了如本文所述的示意性的带条形码的模块编码序列组装策略。

图18描绘了如本文所述的示意性的带条形码的模块编码序列组装策略。

图19描绘了如本文所述的示意性的带条形码的模块编码序列组装策略。

图20描绘了如本文所述的示意性的带条形码的模块编码序列组装策略。

图21描绘了如本文所述的示意性的带条形码的模块编码序列组装策略。

图22描绘了根据本公开的一个实施方案的模块化嵌合抗原受体(CAR)文库的组合嵌套组装的示意性策略。

图23描绘了根据本公开的一个实施方案的汇集的细胞模块化CAR文库的示意性产生。

图24描绘了根据本公开的一个实施方案的用于体外和/或体内使用的集成表型检测和模块化多肽鉴定方法的示意性实例。

图25提供了表2。

图26描绘了如通过对组装的文库进行深度测序所确定的61×61二维文库的每一个成员的完整表示。

图27描绘了如本文所述的预先归一化的组合核酸文库的成员的测序定量。

图28描绘了用于计算与在图27中定量的文库成员相关的归一化调整的线性方程式。

图29示出了根据本文所述的方法进行的归一化调整的可预测性。

定义

在本文可互换使用的术语“多核苷酸”和“核酸”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式。因此，该术语包括但不限于单链、双链或多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂合体、或包含嘌呤碱基和嘧啶碱基或其他天然的、化学修饰或生化修饰的、非天然的或衍生化的核苷酸碱基的聚合物。

本文可互换使用的术语“多肽”、“肽”以及“蛋白质”是指任何长度的氨基酸的聚合形式，可以包括遗传编码和非遗传编码的氨基酸、化学修饰或生化修饰的或衍生化的氨基酸以及具有修饰的肽骨架的多肽。所述术语包括融合蛋白，包括但不限于具有异源氨基酸序列的融合蛋白、具有或没有N末端甲硫氨酸残基的具有异源和同源前导序列的融合体；免疫标记蛋白；等。

本文可互换使用的术语“结构域”和“基序”是指多肽的具有一种或多种特定功能的结构化的结构域和非结构化的片段两者，所述非结构化的片段尽管是非结构化的，但是保留一种或多种特定功能。举例来说，结构化的结构域可以涵盖但不限于折叠多肽中连续的或不连续的多个氨基酸、或其部分，它们包含有助于所述多肽的特定功能的三维结构。在其他情况下，结构域可以包括多肽的包含多个两个或更多个氨基酸或其部分的非结构化的片段，所述非结构化的片段在未折叠或无序的状态下维持所述多肽的特定功能。在该定义内还涵盖的是可以是无序的或非结构化的，但是在与靶标或结合配偶体缔合时变成结构化的或有序的结构域。在本质上非结构化的结构域和在本质上非结构化的蛋白质的结构域的非限制性实例描述于例如Dyson和Wright.Nature Reviews Molecular Cell Biology 6：197-208中。

如本文所用的术语“模块”是指与某种功能，特别是生物功能相关的连续的多肽序列或其片段。

本文可互换使用的术语“嵌合抗原受体”和“CAR”是指能够触发或抑制免疫细胞的激活的人工多模块分子，所述分子一般但非排他地包含细胞外结构域(例如配体/抗原结合结构域)、跨膜结构域以及一个或多个细胞内信号转导结构域。术语CAR不具体限于CAR分子，而且还包括CAR变体。CAR变体包括分裂的CAR，其中CAR的细胞外部分(例如配体结合部分)和细胞内部分(例如细胞内信号转导部分)存在于两个分开的分子上。CAR变体还包括打开开关(ON-switch)CAR和关闭开关(OFF-switch)CAR，它们是有条件可激活/可阻遏的CAR，例如，包括分裂的CAR，其中分裂的CAR的两个部分的条件性异二聚化在药理学上受到控制。CAR变体还包括双特异性CAR，它们包括可以增强或抑制主要CAR的活性的次要CAR结合结构域。CAR变体还包括抑制性嵌合抗原受体(iCAR)，它们可以例如用作双特异性CAR系统的组分，其中次要CAR结合结构域的结合引起对主要CAR激活的抑制。CAR分子和其衍生物(即CAR变体)描述于例如PCT申请号US2014/016527；Fedorov等人，Sci Transl Med(2013)；5(215)：215ra172；Glienke等人，Front Pharmacol(2015)6∶21；Kakarla和Gottschalk 52Cancer J(2014)20(2)：151-5；Riddell等人，Cancer J(2014)20(2)：141-4；Pegram等人，Cancer J(2014)20(2)：127-33；Cheadle等人，Immunol Rev(2014)257(1)：91-106；Barrett等人，Annu Rev Med(2014)65：333-47；Sadelain等人，Cancer Discov (2013)3(4)：388-98；Cartellieri等人，J Biomed Biotechnol(2010)956304中，这些文献的公开内容以引用的方式整体并入本文。

术语“基因”是指存在于生物体的遗传组分内的特定基因座处的特定遗传单位。基因可以是存在于生物体的核酸基因组(DNA基因组或RNA基因组)中的核酸序列，例如DNA序列或RNA序列，并且在一些情况下，可以存在于染色体上。基因可以是对编码蛋白质的mRNA进行编码的DNA序列。基因可以包含单个外显子并且不含内含子，或可以包括多个外显子和一个或多个内含子。存在于特定基因座处的基因的两种或更多种相同或替代形式之一被称为“等位基因”并且例如，二倍体生物体将通常具有特定基因的两个等位基因。特定基因的新等位基因可以经由天然突变或诱导突变天然或人工产生并且经由育种或克隆传播。基因或等位基因可以从生物体的基因组中分离并且复制和/或操纵，或基因或等位基因可以经由基因治疗方法原位修饰。基因或等位基因的基因座可以具有相关的调节元件并且在一些情况下，基因治疗可以包括修饰基因或等位基因的调节元件，而保持基因或等位基因的编码序列未修饰。

“可操作地连接”是指其中如此描述的组分处于容许它们以它们预期的方式起作用的关系中的并置。举例来说，如果启动子影响编码序列的转录或表达，那么所述启动子与所述编码序列可操作地连接。

“载体”或“表达载体”是复制子，如质粒、噬菌体、病毒或粘粒，它可以与另外的DNA片段，即“插入序列”连接以引起所连接的片段在细胞中复制。

如本文所用的“异源”意指分别不存在于天然(例如天然存在)的核酸或蛋白质中的核苷酸序列或多肽序列。

术语“抗体”和“免疫球蛋白”包括任何同种型的抗体或免疫球蛋白；保留与抗原的特异性结合的抗体片段，包括但不限于Fab片段、Fv片段、scFv片段以及Fd片段；嵌合抗体；人源化抗体；单链抗体；以及包含抗体的抗原结合部分和非抗体蛋白质的融合蛋白。

“抗体片段”包含完整抗体的一部分，例如完整抗体的抗原结合区或可变区。抗体片段的实例包括Fab片段、Fab′片段、F(ab′)₂片段以及Fv片段；双链抗体；线性抗体(Zapata等人，Protein Eng.8(10)：1057-1062(1995))；单链抗体分子；以及由抗体片段形成的多特异性抗体。用木瓜蛋白酶对抗体进行消化会产生被称作“Fab”片段的两个相同的抗原结合片段，其各自具有单个抗原结合位点，以及剩余的“Fc”片段，其名称反映了容易结晶的能力。胃蛋白酶处理会产生F(ab′)₂片段，所述片段具有两个抗原结合位点并且仍能够交联抗原。

“单链Fv”或“sFv”抗体片段包含抗体的VH结构域和V_L结构域，其中这些结构域存在于单条多肽链中。在一些实施方案中，Fv多肽还在V_H结构域与V_L结构域之间包含多肽接头，所述多肽接头使得sFv能够形成对于抗原结合来说所期望的结构。关于sFv的综述，参见Pluckthun，The Pharmacology of Monoclonal Antibodies，第113卷，Rosenburg和Moore编著，Springer-Verlag，New York，第269-315页(1994)。

如本文所用的术语“亲和力”是指两种试剂的可逆结合的平衡常数并且被表示为解离常数(Kd)。亲和力可以是抗体对无关氨基酸序列的亲和力的至少1倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍、至少100倍、或至少1000倍、或更多倍。抗体对靶蛋白的亲和力可以是例如约100纳摩尔/升(nM)至约0.1nM、约100nM至约1皮摩尔/升(pM)或约100nM至约1毫微微摩尔/升(fM)或更大。

术语“结合”是指由于例如共价、静电、疏水性以及离子和/或氢键相互作用所引起的两个分子之间的直接缔合，所述相互作用包括诸如盐桥和水桥的相互作用。非特异性结合将指的是以小于约10^-7M的亲和力结合，例如以10^-6M、10^-5M、10^-4M等的亲和力结合。

如本文所用的术语“免疫细胞”一般包括源自于骨髓中产生的造血干细胞(HSC)的白血细胞(白细胞)。“免疫细胞”包括例如淋巴细胞(T细胞、B细胞、自然杀伤(NK)细胞)和骨髓源性细胞(中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、单核细胞、巨噬细胞、树突状细胞)。

“T细胞”包括表达CD3的所有类型的免疫细胞，包括T辅助细胞(CD4⁺细胞)、细胞毒性T细胞(CD8⁺细胞)、调节性T细胞(Treg)以及γ-δT细胞。

“细胞毒性细胞”包括CD8⁺T细胞、自然杀伤(NK)细胞以及中性粒细胞，所述细胞能够介导细胞毒性反应。

如本文所用的术语“干细胞”一般包括多潜能干细胞或多能干细胞。“干细胞”包括例如胚胎干细胞(ES)；间充质干细胞(MSC)；诱导的多潜能干细胞(iPS)；以及定向祖细胞(造血干细胞(HSC)；骨髓衍生细胞等)。

如本文所用的术语“治疗”等是指获得所期望的药理作用和/或生理作用。所述作用就完全或部分预防疾病或其症状而言可能是预防性的和/或就部分或完全治愈疾病和/或可归因于所述疾病的不利影响而言可能是治疗性的。如本文所用的“治疗”涵盖对哺乳动物，例如人类的疾病的任何治疗并且包括：(a)预防所述疾病在可能易患所述疾病，但是尚未被诊断为患有所述疾病的受试者中发生；(b)抑制所述疾病，即阻止疾病发展；以及(c)减轻所述疾病，即引起所述疾病消退。

本文可互换使用的术语“个体”、“受试者”、“宿主”以及“患者”是指哺乳动物，包括但不限于鼠类(例如大鼠、小鼠)、兔类动物(例如兔)、非人类灵长类动物、人类、犬科动物、猫科动物、有蹄类动物(例如马、牛、绵羊、猪、山羊)等。

“治疗有效量”或“有效量”是指在向哺乳动物或其他受试者施用以治疗疾病时足以实现这样的对所述疾病的治疗的药剂的量或两种药剂的组合量。“治疗有效量”将根据一种或多种药剂、疾病和它的严重程度以及待治疗的受试者的年龄、体重等而变化。

术语“对照”、“对照反应”、“对照测定”等是指实验程序或诊断程序或实验设计的反应、测试或其他部分，它的预期结果是以高确定性已知的，例如以指示从相关实验样品获得的结果是否是可靠的、指示相关实验结果指示真实结果的置信度达到何种程度和/或允许校准实验结果。举例来说，在一些情况下，对照可以是“阴性对照”以使得测定的基本组分被排除在阴性对照反应以外以使得实验人员可以非常确定地认为阴性对照反应不会产生阳性结果。在一些情况下，对照可以是“阳性对照”以使得特定测定的所有组分都是被表征的和已知的，以在组合时在所进行的测定中产生特定的结果，以使得实验人员可以非常确定地认为阳性对照反应不会产生阳性阴性结果。

如本文所用的术语“引物”或“寡核苷酸引物”是指当被置于如下的条件下时起到引发互补核酸链合成的作用的寡核苷酸，在所述条件中，引物延伸产物的合成被诱导，例如在核苷酸和聚合诱导剂，如DNA聚合酶或RNA聚合酶存在下以及在合适的温度、pH值、金属浓度和盐浓度下。引物一般具有与它们在合成引物延伸产物中的使用相容的长度，并且可以具有8个至100个核苷酸的范围内的长度，如10个至75个、15个至60个、15个至40个、18个至30个、20个至40个、21个至50个、22个至45个、25个至40个等，包括具有18个-40个、20个-35个、21个-30个核苷酸的范围内的长度以及所述范围之间的任何长度。在一些情况下，引物可以具有10个-50个核苷酸的范围内的长度，如15个-45个、18个-40个、20个-30个、21个-25个等以及所述范围之间的任何长度。在一些实施方案中，引物通常具有不多于约10个、12个、15个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、55个、60个、65个或70个核苷酸的长度。

术语“杂交”是指互补到足以经由沃森-克里克碱基配对(Watson-Crick basepairing)形成复合物的核苷酸序列之间的复合物的形成。举例来说，在引物与靶标(模板)“杂交”的情况下，这样的复合物(或杂交体)是足够稳定的以发挥例如DNA聚合酶引发DNA合成所需的引物引发功能。

“生物样品”涵盖从个体或个体的群体获得的多种样品类型并且可以用于诊断、监测或筛选测定中。所述定义涵盖血液和生物来源的其他液体样品、实体组织样品，如活检标本、或组织培养物或由其衍生的细胞以及其后代。所述定义还包括如下的样品，在获得所述样品之后，已经以任何方式对所述样品进行操作，如通过混合或汇集单个样品、用试剂处理、溶解或富集某些组分，如细胞、多核苷酸、多肽等。术语“生物样品”涵盖临床样品，并且还包括培养中的细胞、细胞上清液、细胞裂解物、血清、血浆、生物流体以及组织样品。术语“生物样品”包括尿液、唾液、脑脊髓液、间质液、眼液、滑液、血液级分，如血浆和血清等。术语“生物样品”还包括实体组织样品、组织培养样品以及细胞样品。

术语“评估”包括任何形式的测量，并且包括确定要素是否存在。术语“确定”、“测量”、“评价”、“评估”以及“测定”可互换使用并且包括定量测定和定性测定。评估可以是相对的或绝对的。“评估......的存在”包括确定存在的某物的量和/或确定它是存在还是不存在。如本文所用的术语“确定”、“测量”和“评估”以及“测定”可互换使用并且包括定量测定和定性测定两者。

在进一步描述本发明之前，应当了解的是，本发明不限于所述的具体实施方案，这是因为这些实施方案当然可以变化。还应当理解的是，本文所使用的术语只是为了描述具体实施方案，而不意图具有限制性，这是因为本发明的范围将仅受限于所附权利要求书。

在提供值的范围的情况下，应当了解的是，除非上下文另外明确规定，否则所述范围的上限和下限以及该所述范围中的任何其他所述值或中间值之间的直到下限单位的十分之一的每一个中间值均涵盖在本发明内。这些更小范围的上限和下限可以独立地被包括在所述更小的范围内，并且也被涵盖在本发明内，受限于所述范围中任何被具体排除的限值。在所述范围包括这些限值中的一个或两个的情况下，不包括那些所包括的限值中的任何一个或两个的范围也被包括在本发明中。

除非另外定义，否则本文所用的所有技术和科学术语所具有的含义与本发明所属领域的普通技术人员通常所理解的含义相同。尽管也可以在实施或测试本发明时使用与本文所述的那些相似或等同的任何方法和材料，但是现在描述优选的方法和材料。本文所提到的所有出版物都以引用的方式并入本文以公开和描述与引用所述出版物相关的方法和/或材料。

必须指出的是，除非上下文另外明确规定，否则如本文和所附权利要求书中所用的单数形式“一个/种”和“该/所述”包括复数指代对象。因此，举例来说，提到“一种多肽”时，包括多种这样的多肽，并且提到“所述抗原”时，包括提到本领域技术人员已知的一种或多种抗原和其等同物，诸如此类。还应当指出的是，权利要求书可以被撰写以排除任何任选的要素。因而，该陈述旨在用作先行基础以用于使用与叙述权利要求要素或使用“否定”限制相关的诸如“单独”、“仅仅”等的排他性术语。

应当了解的是，为清楚起见描述于单独实施方案上下文中的本发明的某些特征也可以组合形式提供于单个实施方案中。反之，为了简洁起见描述于单个实施方案上下文中的本发明的各种特征也可以单独地或以任何合适的子组合形式提供。关于本发明的实施方案的所有组合都由本发明具体包含并且公开于本文中，就如同每一个组合被单独地和明确地公开一样。此外，各种实施方案和其要素的所有子组合也由本发明具体包含并且公开于本文中，就如同每一个这样的子组合被单独地和明确地公开于本文中一样。

提供本文所论述的出版物仅仅是因为其在本申请的申请日之前公开。本文的任何信息并不被理解为承认本发明无权凭借在先发明而早于所述出版物。另外，所提供的出版日期可能不同于实际的出版日期，所述实际的出版日期可能需要独立确认。

具体实施方式

文库

本公开的方面涉及编码多个合成模块化多肽的带条形码的核酸文库。本公开的方面还包括细胞文库，其中每一个细胞表达编码独特的合成模块化多肽的单独的带条形码的核酸或多个这样的单独的带条形码的核酸。如下文所更详细描述，本公开的方面还包括制备这样的文库的方法以及筛选这样的文库以检测特定表型的方法。

本公开的核酸文库一般是从模块化组分组合组装的并且包括多单元条形码，可以读取所述多单元条形码以鉴定所述文库的每一个成员的模块化组分的身份和构型两者。因而，核酸文库的每一个单个成员将至少含有编码区和条形码区。如本文所用，在术语“编码区”涉及核酸文库的单个成员时，它是指每一个核酸的编码所关注的合成多肽的区域，所述所关注的合成多肽例如具有一个或多个多肽模块的合成多肽，所述多肽模块可以针对对特定的所期望或不期望的表型的影响来筛选。在一些情况下，编码区还可以包括编码例如如用于检测和/或测量所关注的合成多肽的表达的报告分子的序列。

编码区一般将编码单个模块化多肽，如下文所更详细描述；然而，该说明并不排除其中每一个文库成员的编码区编码两个或更多个单独的模块化多肽的文库。这样的文库成员可以包括单个编码区，所述单个编码区是多顺反子的(例如双顺反子、多顺反子等)，例如经由在编码可分离的模块多肽的序列之间包括可分离的接头(例如内部核糖体进入位点(IRES)、核糖体支路序列、编码自切割肽的核酸等)。包含编码两个或更多个单独的模块化多肽的序列的编码区将是连续的并且将根据本文对于单个模块化多肽构建体所述的方法来组装和筛选。

编码区将含有可变模块和不可变模块，其中合成模块化多肽的特定部分是可变的还是不可变的将取决于文库的预期用途。编码区的可变模块一般是针对功能特性和/或对所关注的表型的影响单独或组合筛选的那些模块。一般来说，可变模块将与模块鉴定条形码相关并且不可变模块将与条形码无关。任何模块均可以用作可变模块或不可变模块，这取决于特定的文库构建和/或与文库相关的筛选。

作为非限制性实例，在其中编码区编码嵌合抗原受体(CAR)的某些实施方案中，取决于所筛选的CAR活性，所述CAR的任何模块均可以用作可变模块，包括但不限于细胞外结构域、共调节结构域或主要信号转导结构域。举例来说，图11描绘了CAR文库的单个成员，其中所述文库的每一个成员均含有细胞外结构域、共调节结构域以及主要信号转导结构域并且提供了其中每一个结构域均可以用作可变模块的情况的非限制性实例。

在一些情况下，细胞外结构域可以是可变模块，例如在抗原靶向是所关注的情况下；在抗原与细胞外结构域之间的相互作用的强度是所关注的情况下；等等。在一些情况下，共调节结构域可以是可变模块，例如在要针对功能活性的共调节来筛选单个共调节结构域或共调节结构域的组合的情况下。在一些情况下，主要信号转导结构域可以是可变模块，例如在要筛选不同的细胞内信号转导活性的情况下。

作为非限制性实例，在一些情况下，所编码的合成模块化多肽可以是嵌合Notch受体多肽，所述多肽具有细胞外结合结构域、可切割的Notch受体多肽结构域(包括结合触发的切割位点)以及细胞内结构域。有用的嵌合Notch受体多肽和其结构域包括但不限于例如美国PCT申请号US2016/019188中所述的那些；该申请的公开内容以引用的方式整体并入本文。在一些情况下，嵌合Notch受体多肽的一个或多个结构域用作可变结构域，包括但不限于例如细胞外结合结构域、Notch受体多肽结构域、细胞内结构域；细胞外结合结构域和Notch受体多肽结构域；细胞外结合结构域和细胞内结构域；或Notch受体多肽结构域和细胞内结构域。

将选择编码区中所包括的不可变模块，其中期望的是，文库的所有成员均具有不可变模块的功能，即其中由不可变模块所提供的功能在文库的所有成员间保持不变。作为非限制性实例，在一些情况下，如上文所述，细胞外结构域、共调节结构域或主要信号转导结构域可以是不可变模块，其中期望的是或测定需要文库的所有成员均具有细胞外结构域、共调节结构域或主要信号转导结构域的功能。作为非限制性实例，在一些情况下，如上文所述，细胞外结合结构域、可切割的Notch受体多肽结构域或细胞内结构域可以是不可变模块，其中期望的是或测定需要文库的所有成员均具有细胞外结合结构域、可切割的Notch受体多肽结构域或细胞内结构域的功能。

根据所使用的特定模块和针对使用主题文库的筛选测定，每一个文库成员的编码区可以编码可变模块和不可变模块的任何组合，其中最简单的编码区仅编码可变模块。在一些情况下，其中插入有可变模块的每一个单独的文库成员(例如每一个载体)在插入可变模块之前可以含有一个或多个编码序列以使得在插入可变模块时，编码区然后包含可变模块和预先存在的编码序列，所述预先存在的编码序列可能包含或可能不包含不可变模块和/或非模块编码序列。在一些情况下，存在于所有文库成员中的这样的预先存在的编码序列可以被称为“恒定结构域”。

在一些情况下，编码区可以编码两个或更多个可变模块，包括但不限于例如三个或更多个可变模块、四个或更多个可变模块、五个或更多个可变模块、六个或更多个可变模块、七个或更多个可变模块、八个或更多个可变模块等。在一些情况下，编码区可以编码两个或更多个不可变模块，包括但不限于例如三个或更多个不可变模块、四个或更多个不可变模块、五个或更多个不可变模块、六个或更多个不可变模块、七个或更多个不可变模块、八个或更多个不可变模块等。编码区内可变模块和不可变模块的数目可以受到编码序列克隆和文库构建的实际约束的限制。

编码独特的合成模块化多肽的独特的文库成员的数目将取决于用于构建文库的可变模块的数目以及文库的总体预期复杂性。在本文的一些实施方案中，文库复杂性可以用文库维度来描述，其中文库的维度与存在于文库成员的编码区中的可变模块编码序列的数目相关。因此，一维文库在每一个文库成员的每一个编码区中含有一个可变模块编码序列，二维文库在每一个文库成员的每一个编码区中含有两个可变模块编码序列，三维文库在每一个文库成员的每一个编码区中含有三个可变模块编码序列，四维文库在每一个文库成员的每一个编码区中含有四个可变模块编码序列，诸如此类。

文库的维度在整个文库中不需要是均一的并且因此，在一些情况下，文库可以具有混合维度。“混合维度”意指文库含有多于一个维度的文库成员，如上文所述。举例来说，文库可以是部分一维的、部分二维的、部分三维的等。这样的混合维度文库可以是混合的一维和二维文库、二维和三维文库、一维、二维以及三维文库，等等。混合维度文库的这些说明不意图具有限制性并且本领域普通技术人员将容易理解，本文所涵盖的多种混合维度文库扩展得远远超出了明确描述的那些。

因而，编码独特的合成模块化多肽的独特的文库成员的数目将变化并且将是文库维度和用于构建文库的模块的数目的产物。举例来说，由20个独特的可变模块构建的一维文库将含有20个独特的文库成员。由20个独特的可变模块构建的二维文库将含有20×20(即400)个独特的文库成员。由20个独特的可变模块构建的三维文库将含有20×20×20(即8000)个独特的文库成员。在一些情况下，多维文库的独特的文库成员可以含有编码相同可变模块的两个或更多个序列。

在一些情况下，在每一个文库成员具有两个或更多个可变模块的情况下，所述模块可以具有位置特异性，这意味着相对于其他可变模块，可变模块的子集仅可以定位在合成模块化多肽内的特定位置处。举例来说，具有两个可变模块的合成模块化多肽可以含有第一组和第二组可变模块，其中相对于第二组的模块，第一组的模块始终处于特定位置处。因而，由30个独特的可变模块(包括第一组10个独特的可变模块和第二组20个独特的可变模块)以位置特异性方式构建的二维文库可以含有10×20(即200)个独特的文库成员。

鉴于在构建本公开的文库中上文所述的可变维度以及可以位置特异性或非位置特异性组合的模块的可变数目，本领域技术人员将容易理解文库配置的巨大可变性。因而，独特的文库成员的总数将会有很大的变化并且可以在少于20个至50,000个或更多个的范围内，包括但不限于例如20个或更多个、30个或更多个、40个或更多个、50个或更多个、60个或更多个、70个或更多个、80个或更多个、90个或更多个、100个或更多个、150个或更多个、200个或更多个、250个或更多个、300个或更多个、350个或更多个、400个或更多个、450个或更多个、500个或更多个、550个或更多个、600个或更多个、650个或更多个、700个或更多个、750个或更多个、800个或更多个、850个或更多个、900个或更多个、950个或更多个、1,000个或更多个、1,500个或更多个、2,000个或更多个、2,500个或更多个、3,000个或更多个、3,500个或更多个、4,000个或更多个、4,500个或更多个、5,000个或更多个、5,500个或更多个、6,000个或更多个、6,500个或更多个、7,000个或更多个、7,500个或更多个、8,000个或更多个、8,500个或更多个、9,000个或更多个、9,500个或更多个、10,000个或更多个、20,000个或更多个、30,000个或更多个、40,000个或更多个、50,000个或更多个等。

在其中多维文库以汇集组装方式构建的情况下，库内独特的文库成员的总数可能会有很大的变化并且可以在少于20个至50,000个或更多个的范围内，如上文所述的那样，并且达到更高程度的多样性，包括但不限于例如10⁵个或更多个、10⁶个或更多个、10⁷个或更多个、10⁸个或更多个、或10⁹个或更多个。

本文所述的文库的独特的成员不需要为了实现文库构建或筛选的目的而被物理排列。如下文所更详细描述的那样，编码每一个合成模块化多肽的核酸组分的组合组装以及多单元条形码以记录所组装的模块的身份和取向的方式的共同组装允许本文所述的文库的一锅法合成和汇集筛选。因而，所述文库和所述多个独特的文库成员可以存在于单个适当的溶液中和/或存在于单个适当的容器中。

合成模块化多肽

提供了合成模块化多肽和编码合成模块化多肽的核酸的文库。“模块化多肽”意指功能蛋白，所述功能蛋白具有两个或更多个可操作连接的模块化组分以使得所述模块在单个多肽分子中在物理上连接在一起并且共同起作用。模块化多肽的模块可以具有相关的或无关的功能或活性。在许多实施方案中，合成模块化多肽的模块化组分中的至少两个源自于不同的蛋白质。源自于“不同蛋白质”的模块可以源自于在功能上无关或在功能上相关的不同蛋白质并且可以源自于不同物种的生物体、相同物种的生物体、不同的直系同源蛋白质、不同的旁系同源蛋白质等。

在某些实施方案中，如本文所述的合成模块化多肽文库的单个文库成员将至少包括作为特异性结合对(例如抗原-抗体结合对、配体-受体结合对等)的成员的模块以及用于诱导细胞反应的功能或信号转导模块。在一些情况下，特异性结合对的成员在本文可以被称为细胞外结构域或细胞外识别结构域。在一些情况下，特异性结合对的成员可以指参与蛋白质-蛋白质信号转导相互作用的蛋白质或参与蛋白质-脂质信号转导相互作用的蛋白质。

在许多实施方案中，可以用于单个文库成员中的特异性结合对的成员可以包括抗原结合结构域。适用于本公开的文库成员中的抗原结合结构域可以是任何抗原结合多肽，它们中的多种是本领域已知的。在一些情况下，抗原结合结构域是单链Fv(scFv)。其他基于抗体的识别结构域(cAb VHH(骆驼科动物抗体可变结构域)和人源化型式、IgNAR VH(鲨鱼抗体可变结构域)和人源化型式、sdAb VH(单域抗体可变结构域)以及“骆驼源化”抗体可变结构域)是适用的。在一些情况下，基于T细胞受体(TCR)的识别结构域，如单链TCR(scTv，含有VαVβ的单链双结构域TCR)也是适用的。

适用于本公开的文库成员中的抗原结合结构域可以具有多种抗原结合特异性。在一些情况下，所述抗原结合结构域对由癌细胞表达(合成)的抗原，即癌细胞相关抗原中存在的表位具有特异性。所述癌细胞相关抗原可以是与例如以下各项相关的抗原：乳腺癌细胞、B细胞淋巴瘤、霍奇金淋巴瘤(Hodgkin lymphoma)细胞、卵巢癌细胞、前列腺癌细胞、间皮瘤、肺癌细胞(例如小细胞肺癌细胞)、非霍奇金B细胞淋巴瘤(B-NHL)细胞、卵巢癌细胞、前列腺癌细胞、间皮瘤细胞、肺癌细胞(例如小细胞肺癌细胞)、黑色素瘤细胞、慢性淋巴细胞性白血病细胞、急性淋巴细胞性白血病细胞、成神经细胞瘤细胞、神经胶质瘤、成胶质细胞瘤、成神经管细胞瘤、结肠直肠癌细胞等。癌细胞相关抗原也可以由非癌细胞表达。

可以与主题文库成员的抗原结合结构域结合的抗原的非限制性实例包括例如CD19、CD20、CD38、CD30、Her2/neu、ERBB2、CA125、MUC-1、前列腺特异性膜抗原(PSMA)、CD44表面粘附分子、间皮素、癌胚抗原(CEA)、表皮生长因子受体(EGFR)、EGFRvIII、血管内皮生长因子受体-2(VEGFR2)、高分子量黑色素瘤相关抗原(HMW-MAA)、MAGE-A1、IL-13R-a2、GD2等。

在一些情况下，适用于主题文库的文库成员中的特异性结合对的成员是受体的配体。配体包括但不限于细胞因子(例如IL-13等)；生长因子(例如调蛋白；血管内皮生长因子(VEGF)；等)；整合素结合肽(例如包含序列Arg-Gly-Asp的肽)；Notch配体(例如Delta、Serrate、Delta样、X-Delta、Jagged等以及其同源物和直系同源物)等。

在主题文库的文库成员中的特异性结合对的成员是配体的情况下，所述特异性文库成员可以在所述特异性结合对的第二成员存在下被激活，其中所述特异性结合对的第二成员是所述配体的受体。举例来说，在所述配体是VEGF的情况下，所述特异性结合对的第二成员可以是VEGF受体，包括可溶性VEGF受体。在另一个实例中，在所述配体是Notch配体的情况下，所述特异性结合对的第二成员可以是Notch受体或其配体结合部分。作为另一个实例，在所述配体是调蛋白的情况下，所述特异性结合对的第二成员可以是Her2。

在一些情况下，在主题文库的成员中所包括的特异性结合对的成员是受体，例如配体的受体、辅助受体等。所述受体可以是受体的配体结合片段。合适的受体包括但不限于生长因子受体(例如VEGF受体)；杀伤细胞凝集素样受体亚家族K成员1(NKG2D)多肽(MICA、MICB以及ULB6的受体)；细胞因子受体(例如IL-13受体；IL-2受体；等)；Her2；CD27；天然细胞毒性受体(NCR)(例如NKP30(NCR3/CD337)多肽(HLA-B相关转录物3(BAT3)和B7-H6的受体)；等)；Notch受体(例如人类NOTCH1、人类NOTCH2、人类NOTCH3、人类NOTCH4等)等。

在特异性结合配偶体内还涵盖了二聚体对。二聚体对的单个成员适用于主题文库的文库成员中并且包括但不限于二聚化剂结合对。二聚化剂结合对与相同分子(在本文称作“二聚化剂”)的不同位点结合。在二聚化剂存在下，二聚化剂结合对的这两个成员与二聚化剂的不同位点结合并且因此使得彼此接近。在一些实施方案中，与二聚化剂的结合是可逆的。在一些实施方案中，与二聚化剂的结合是不可逆的。在一些实施方案中，与二聚化剂的结合是非共价的。在一些实施方案中，与二聚化剂的结合是共价的。

适用的其他二聚体对包括在二聚体对的第一成员与二聚化剂结合时二聚化的二聚化剂结合对，其中所述二聚化剂诱导二聚体对的第一成员的构象变化，并且其中所述构象变化允许二聚体对的第一成员与二聚体对的第二成员结合(共价或非共价)。适用的其他二聚体对包括其中曝露于光(例如蓝光)诱导二聚体对发生二聚化的二聚体对。

在一些情况下，特异性结合对的成员可以包括参与蛋白质-蛋白质信号转导相互作用或蛋白质-脂质信号转导相互作用的蛋白质并且因此，如本文所述的合成模块化多肽可以包括一个或多个蛋白质-蛋白质相互作用结构域或蛋白质-脂质相互作用结构域。这样的蛋白质-蛋白质相互作用结构域或蛋白质-脂质相互作用结构域包括但不限于例如14-3-3结构域(例如存在于PDB(可在www(.)rcsb(.)org上在线获得的RCSB蛋白质数据库)结构2B05中)，肌动蛋白解聚因子(ADF)结构域(例如存在于PDB结构1CFY中)，ANK结构域(例如存在于PDB结构1SW6中)，ANTH(AP180 N末端同源)结构域(例如存在于PDB结构5AHV中)，Armadillo(ARM)结构域(例如存在于PDB结构1BK6中)，BAR(Bin/双载蛋白(Amphiphysin)/Rvs)结构域(例如存在于PDB结构1I4D中)，BEACH(beige和CHS)结构域(例如存在于PDB结构1MI1中)，BH(Bc1-2同源)结构域(BH1，BH2、BH3以及BH4)(例如存在于PDB结构1BXL中)，杆状病毒IAP重复序列(BIR)结构域(例如存在于PDB结构1G73中)，BRCT(BRCA1 C末端)结构域(例如存在于PDB结构1T29中)，布罗莫结构域(例如存在于PDB结构1E6I中)，BTB(BR-C、ttk以及bab)结构域(例如存在于PDB结构1R2B中)，C1结构域(例如存在于PDB结构1PTQ中)，C2结构域(例如存在于PDB结构1A25中)，胱天蛋白酶募集结构域(CARD)(例如存在于PDB结构1CWW中)，卷曲螺旋(CC)结构域(例如存在于PDB结构1QEY中)，CALM(网格蛋白组装淋巴骨髓)结构域(例如存在于PDB结构1HFA中)，调宁蛋白同源(CH)结构域(例如存在于PDB结构1BKR中)，染色质组织修饰(Chromo)结构域(例如存在于PDB结构1KNA中)，CUE结构域(例如存在于PDB结构1OTR中)，死亡结构域(DD)(例如存在于PDB结构1FAD中)，死亡效应子结构域(DED)(例如存在于PDB结构1A1W中)，散乱蛋白、EGL-10和普列克底物蛋白(DEP)结构域(例如存在于PDB结构1FSH中)，Db1同源(DH)结构域(例如存在于PDB结构1FOE中)、EF手(EFh)结构域(例如存在于PDB结构2PMY中)、Eps15同源(EH)结构域(例如存在于PDB结构1EH2中)、epsin NH2末端同源(ENTH)结构域(例如存在于PDB结构1EDU中)、Ena/Vasp同源结构域1(EVH1)(例如存在于PDB结构1QC6中)、F盒结构域(例如存在于PDB结构1FS1中)，FERM(带4.1蛋白、埃兹蛋白、根蛋白、膜突蛋白)结构域(例如存在于PDB结构1GC6中)，FF结构域(例如存在于PDB结构1UZC中)，形成素同源-2(FH2)结构域(例如存在于PDB结构1UX4中)，叉头蛋白相关(FHA)结构域(例如存在于PDB结构1G6G中)，FYVE(Fab-1、YGL023、Vps27以及EEA1)结构域(例如存在于PDB结构1VFY中)，GAT(GGA和Tom1)结构域(例如存在于PDB结构1O3X中)，凝溶胶蛋白同源结构域(GEL)(例如存在于PDB结构1H1V中)，GLUE(EAP45中的GRAM样泛素结合)结构域(例如存在于PDB结构2CAY中)，GRAM(来自葡糖基转移酶、Rab样GTP酶激活因子以及肌微管素)结构域(例如存在于PDB结构1LW3中)，GRIP结构域(例如存在于PDB结构1UPT中)，甘氨酸-酪氨酸-苯丙氨酸(GYF)结构域(例如存在于PDB结构1GYF中)，HEAT(亨廷顿蛋白(Huntington)，延伸因子3、PR65/A、TOR)结构域(例如存在于PDB结构1IBR中)，E6-AP羧基末端同源(HECT)结构域(例如存在于PDB结构1C4Z中)，IQ结构域(例如存在于PDB结构1N2D中)，LIM(Lin-1、Isl-1以及Mec-3)结构域(例如存在于PDB结构1QLI中)，富含亮氨酸的重复序列(LRR)结构域(例如存在于PDB结构1YRG中)，恶性脑肿瘤(MBT)结构域(例如存在于PDB结构1OYX中)，MH1(Mad同源1)结构域(例如存在于PDB结构1OZJ中)，MH2(Mad同源2)结构域(例如存在于PDB结构1DEV中)，MIU(与泛素相互作用的基序)结构域(例如存在于PDB结构2C7M中)，NZF(Np14锌指)结构域(例如存在于PDB结构1Q5W中)，PAS(Per-ARNT-Sim)结构域(例如存在于PDB结构1P97中)，Phox和Bem1(PB1)结构域(例如存在于PDB结构1IPG中)，PDZ(突触后致密蛋白95，PSD-85；盘状大蛋白(discs large)，Dlg；闭锁小带蛋白-1，ZO-1)结构域(例如存在于PDB结构1BE9中)，普列克底物蛋白同源(PH)结构域(例如存在于PDB结构1MAI中)，Polo盒结构域(例如存在于PDB结构1Q4K中)，磷酸化酪氨酸结合(PTB)结构域(例如存在于PDB结构1SHC中)，Pumilio/Puf(PUF)结构域(例如存在于PDB结构1M8W中)，PWWP结构域(例如存在于PDB结构1KHC中)，Phox同源(PX)结构域(例如存在于PDB结构1H6H中)，RGS(G蛋白信号转导调节因子)结构域(例如存在于PDB结构1AGR中)，RING结构域(例如存在于PDB结构1FBV中)，SAM(不育α基序)结构域(例如存在于PDB结构1B0X中)，Shadow Chromo(SC)结构域(例如存在于PDB结构1E0B中)，Src同源2(SH2)结构域(例如存在于PDB结构1SHB中)，Src同源3(SH3)结构域(例如存在于PDB结构3SEM中)，SOCS(细胞因子信号转导抑制因子)结构域(例如存在于PDB结构1VCB中)，SPRY结构域(例如存在于PDB结构2AFJ中)，类固醇激素合成急性调节蛋白(StAR)相关脂质转移(START)结构域(例如存在于PDB结构1EM2中)，SWIRM结构域(例如存在于PDB结构2AQF中)，Toll/Il-1受体(TIR)结构域(例如存在于PDB结构1FYV中)，三角形四肽重复序列(TPR)结构域(例如存在于PDB结构1ELW中)，TRAF(肿瘤坏死因子(TNF)受体相关因子)结构域(例如存在于PDB结构1F3V中)，tSNARE(SNARE(可溶性NSF附着蛋白(SNAP)受体)结构域(例如存在于PDB结构1SFC中)，Tubby结构域(例如存在于PDB结构1I7E中)，TUDOR结构域(例如存在于PDB结构2GFA中)，泛素相关(UBA)结构域(例如存在于PDB结构1IFY中)，UEV(泛素E2变体)结构域(例如存在于PDB结构1S1Q中)，泛素相互作用基序(UIM)结构域(例如存在于PDB结构1Q0W中)，VHL结构域(例如存在于PDB结构1LM8中)，VHS(Vps27p、Hrs以及STAM)结构域(例如存在于PDB结构1ELK中)，WD40结构域(例如存在于PDB结构1NEX中)，WW结构域(例如存在于PDB结构1I6C中)等。

如本文所述的主题文库的单个文库成员可以包括调节结构域。调节结构域包括具有刺激功能和抑制功能的结构域以及调节其他“上游”信号转导结构域的激活和/或抑制功能的结构域。在一些情况下，调节结构域包括共刺激结构域。在一些情况下，调节结构域包括共抑制结构域。

适用于包括在主题文库的文库成员中的调节结构域可以是短到具有3个氨基酸的线性基序并且长到整个蛋白质的多肽的任何功能单元，其中调节结构域的尺寸只是因为所述结构域必须大到足以保留它的功能并且小到足以与所期望的组装方法相容而受到限制。因此，调节结构域的尺寸可以在3个氨基酸的长度至1000个氨基酸或更多个氨基酸的范围内，并且在一些情况下，可以具有约30个氨基酸至约70个氨基酸(aa)的长度，例如，调节结构域可以具有以下长度：约30个氨基酸至约35个氨基酸、约35个氨基酸至约40个氨基酸、约40个氨基酸至约45个氨基酸、约45个氨基酸至约50个氨基酸、约50个氨基酸至约55个氨基酸、约55个氨基酸至约60个氨基酸、约60个氨基酸至约65个氨基酸或约65个氨基酸至约70个氨基酸。在其他情况下，调节结构域可以具有以下长度：约70个氨基酸至约100个氨基酸、约100个氨基酸至约200个氨基酸或大于200个氨基酸。

在一些情况下，“共刺激结构域”可用于本公开的文库的单个文库成员中。共刺激一般指用以传播主要特异性刺激的次要非特异性激活机制。共刺激的实例包括在经由T细胞受体进行抗原特异性信号转导之后的非抗原特异性T细胞共刺激以及在经由B细胞受体进行信号转导之后的非抗原特异性B细胞共刺激。共刺激，例如T细胞共刺激以及所涉及的因子已经描述于Chen和Flies.Nat Rev Immunol(2013)13(4)：227-42中，该文献的公开内容以引用的方式整体并入本文。共刺激结构域一般是源自于受体的多肽。在一些实施方案中，共刺激结构域同二聚化。主题共刺激结构域可以是跨膜蛋白的细胞内部分(即共刺激结构域可以源自于跨膜蛋白)。合适的共刺激多肽的非限制性实例包括但不限于4-1BB(CD137)、CD28、ICOS、OX-40、BTLA、CD27、CD30、GITR以及HVEM。在一些情况下，共刺激结构域，例如用于本公开的文库成员中的共刺激结构域可以包括表1中所列的共刺激结构域。在一些情况下，文库的单个成员的共刺激结构域包含与如本文所述的共刺激结构域具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列。

在一些情况下，“共抑制结构域”可用于本公开的文库的单个文库成员中。这样的共抑制结构域一般是源自于受体的多肽。共抑制一般指阻止共刺激的对主要抗原特异性激活机制的次要抑制。共抑制，例如T细胞共抑制以及所涉及的因子已经描述于Chen和Flies.Nat Rev Immunol(2013)13(4)：227-42以及Thaventhiran等人，J Clin CellImmunol(2012)S12中，这些文献的公开内容以引用的方式整体并入本文。在一些实施方案中，共抑制结构域同二聚化。主题共抑制结构域可以是跨膜蛋白的细胞内部分(即共抑制结构域可以源自于跨膜蛋白)。合适的共抑制多肽的非限制性实例包括但不限于CTLA-4和PD-1。在一些情况下，共抑制结构域，例如用于本公开的文库成员中的共抑制结构域可以包括表1中所列的共抑制结构域。在一些情况下，文库的单个成员的共刺激结构域包含与如本文所述的共刺激结构域具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列。

在一些情况下，合成模块化多肽文库的单个文库成员可以包括细胞内信号转导结构域模块。适用作本公开的文库的模块的细胞内信号转导结构域包括任何所期望的信号转导结构域，它响应于单个文库成员的激活而提供独特的和可检测的信号(例如细胞的一种或多种细胞因子的产生增加；靶基因的转录发生变化；蛋白质的活性发生变化；细胞行为发生变化，例如细胞死亡；细胞增殖；细胞分化；细胞存活；细胞信号转导反应的调节；等)。细胞内信号转导结构域可能与或可能不与单个文库成员共价连接，例如在所有文库成员均利用共同的细胞内信号转导结构域的情况下，所述细胞内信号转导结构域可以未与文库成员结合，例如在细胞质中扩散。

在一些情况下，本公开的主题文库的单个文库成员将包括用于插入到真核细胞膜中的跨膜结构域。跨膜结构域可以存在于文库成员内的任何方便的位置处，例如文库的模块化组分的N末端、文库的模块化组分的C末端、插入在文库的至少两个模块化组分之间(例如CAR模块化文库的成员的抗原结合结构域与共刺激结构域之间)等等。

使多肽插入到真核(例如哺乳动物)细胞的细胞膜中的任何跨膜(TM)结构域均是适用的。作为一个非限制性实例，可以使用TM序列IYIWAPLAGTCGVLLLSLVITLYC(SEQ ID NO：1)。合适的TM序列的另外的非限制性实例包括：a)CD8β来源的：LGLLVAGVLVLLVSLGVAIHLCC(SEQ ID NO：2)；b)CD4来源的：ALIVLGGVAGLLLFIGLGIFFCVRC(SEQ ID NO：3)；c)CD3ζ来源的：LCYLLDGILFIYGVILTALFLRV(SEQ ID NO：4)；d)CD28来源的：WVLVVVGGVLACYSLLVTVAFIIFWV(SEQ ID NO：5)；e)CD134(OX40)来源的：VAAILGLGLVLGLLGPLAILLALYLL(SEQ ID NO：6)；以及f)CD7来源的：ALPAALAVISFLLGLGLGVACVLA(SEQ ID NO：7)。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括一个或多个另外的模块化元件。举例来说，在其中所述文库是嵌合抗原受体(CAR)文库的情况下，单个文库成员可以被配置成含有如例如PCT专利申请公开号WO2014/127261中所述的一个或多个另外的组分，该申请的公开内容以引用的方式整体并入本文。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括多结构域支架蛋白的一个或多个模块。如本文所用的术语“支架蛋白”包括锚定蛋白和衔接蛋白。这样的蛋白质含有多个结合结构域，所述结合结构域各自募集或锚定信号转导通路的特定成员，例如将它们拴系成复合物、将它们定位在细胞内或调节信号转导(例如控制正反馈和/或负反馈、使激活的信号转导组分稳定而不失活等)。因而，多结构域支架蛋白和多结构域锚定蛋白以及多结构域衔接蛋白的结构域一般包括信号转导通路成员结合结构域。

支架蛋白和其中它们起作用的通路的非限制性实例包括例如有丝分裂原激活蛋白激酶(MAPK)通路的Ste5支架；蛋白激酶A(PKA)信号转导通路的A激酶锚定蛋白(AKAP)；MAPK通路的Ras 1激酶抑制因子(KSR)；JUN N末端激酶(JNK)通路和MAPK通路的B细胞淋巴瘤10(BCL-10)；JNK通路和MAPK通路的有丝分裂原激活蛋白激酶激酶激酶1(MEKK1)；钙信号转导通路的AHNAK-1；钙信号转导通路的HOMER；先天免疫信号转导通路的Pellino蛋白；先天免疫信号转导通路的NLR家族含热蛋白结构域(NLRP)蛋白质；T细胞受体信号转导通路的盘状大同源物1(DLG1)；树突状细胞信号转导通路的树突棘素；等。支架蛋白还包括但不限于例如Buday和Tompa.FEBS Journal(2010)277：4348-4355中所述的那些；该文献的公开内容以引用的方式整体并入本文。在一些情况下，支架蛋白可以是与基因本体(GeneOntology，GO)术语“蛋白质复合物支架”(GO：0032947)和同义术语相关的蛋白质，这些术语可以用于检索关于蛋白激酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括蛋白激酶的一个或多个模块。蛋白激酶是通过将磷酸酯基添加到底物蛋白中以引导底物蛋白活性、与其他蛋白质的缔合和/或定位而起作用的那些蛋白质。蛋白激酶可以包括与GO术语“蛋白质磷酸化”(GO：0006468)、“蛋白激酶活性”(GO：0004672)、“蛋白质丝氨酸/苏氨酸激酶活性”(GO：0004674)、“激酶活性”(GO：0016301)以及同义术语相关的那些蛋白质，这些术语可以用于检索关于蛋白激酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。蛋白激酶含有一个或多个激酶结构域，所述激酶结构域含有所述蛋白激酶的催化功能。蛋白激酶结构域与Pfam标识号PF00069有关，该Pfam标识号PF00069可以用于在线检索蛋白激酶结构域、含有蛋白激酶结构域的那些蛋白质，包括序列和结构在内，例如在pfam(.)xfam(.)org上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括蛋白磷酸酶的一个或多个模块。蛋白磷酸酶是通过从它的底物蛋白的磷酸化的氨基酸残基中去除磷酸酯基，从而引起脱磷酸化以引导底物蛋白活性而起作用并且与蛋白激酶起相反作用的那些蛋白质。蛋白磷酸酶被分成三类：磷蛋白磷酸酶(例如PPP1CA、PPP1CB、PPP1CC、PPP2CA、PPP2CB、PPP3CA、PPP3CB、PPP3CC、PPP4C、PPP5C、PPP6C等)、蛋白Tyr磷酸酶(例如CDC14A、CDC14B、CDC14C、CDKN3、PTEN、SSH1、SSH2、SSH3等)以及双重特异性蛋白磷酸酶(例如DUSP1、DUSP2、DUSP3、DUSP4、DUSP5、DUSP6、DUSP7、DUSP8、DUSP9、DUSP10、DUSP11、DUSP12、DUSP13、DUSP14、DUSP15、DUSP16、DUSP18、DUSP19、DUSP21、DUSP22、DUSP23、DUSP26、DUSP27、DUSP28等)；然而，一些蛋白磷酸酶仍然未分组。蛋白磷酸酶可以包括与GO术语“磷酸酶活性”(GO：0016791)和同义术语相关的那些蛋白质，这些术语可以用于检索关于蛋白磷酸酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。蛋白磷酸酶含有一个或多个磷酸酶结构域，所述磷酸酶结构域含有所述蛋白磷酸酶的脱磷酸化功能。蛋白磷酸酶结构域与Pfam标识号PF15698有关，该Pfam标识号PF15698可以用于在线检索蛋白磷酸酶结构域、含有蛋白磷酸酶结构域的那些蛋白质，包括序列在内，例如在pfam(.)xfam(.)org上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括酪氨酸激酶受体蛋白(也被称为受体酪氨酸激酶(RTK))的一个或多个模块。RTK是膜相关细胞表面受体。蛋白酪氨酸激酶的一个亚类RTK经由细胞外配体结合和蛋白质的细胞质部分的后续磷酸化而起作用。RTK可以被分成包括例如表皮生长因子受体家族、成纤维细胞生长因子受体(FGFR)家族、血管内皮生长因子受体(VEGFR)家族、RET受体家族以及盘状结构域受体(DDR)家族在内的家族。RTK可以包括与GO术语“跨膜受体蛋白酪氨酸激酶活性”(GO：0004714)、“跨膜受体蛋白酪氨酸激酶信号转导通路”(GO：0007169)以及同义术语相关的那些蛋白质，这些术语可以用于检索关于RTK的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。RTK含有一个或多个酪氨酸激酶结构域，所述酪氨酸激酶结构域含有所述RTK的激酶功能。RTK激酶结构域与Pfam标识号PF07714有关，该Pfam标识号PF07714可以用于检索RTK激酶结构域和含有RTK激酶结构域的那些蛋白质，包括序列和结构在内，例如在pfam(.)xfam(.)org上检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括脂质激酶蛋白的一个或多个模块。脂质激酶蛋白将细胞脂质磷酸化，这引起了对脂质的反应性、信号转导和/或脂质的定位的调节。脂质激酶可以被分成包括例如磷脂酰肌醇激酶和鞘氨醇激酶在内的家族。脂质激酶可以包括与GO术语“脂质激酶活性”(GO：0001727)、“脂质磷酸化”(GO：0046834)以及同义术语相关的那些蛋白质，这些术语可以用于检索关于脂质激酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括脂质磷酸酶蛋白的一个或多个模块。脂质磷酸酶蛋白将细胞脂质脱磷酸化，这起到逆转脂质激酶的活性的作用，从而引起对脂质的反应性、信号转导和/或脂质的定位的调节。脂质磷酸酶可以包括与GO术语“脂质磷酸酶活性”(GO：0042577)、“磷脂脱磷酸化”(GO：0046839)以及同义术语相关的那些蛋白质，这些术语可以用于检索关于脂质磷酸酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括泛素化酶蛋白的一个或多个模块。泛素化酶蛋白是介导泛素化(即泛素与底物蛋白的连接)的翻译后修饰的那些蛋白质。底物蛋白的泛素化可以引起底物蛋白的降解、底物蛋白的重新定位、底物蛋白的活性的调节、底物蛋白的蛋白质-蛋白质相互作用的调节等。泛素化酶可以包括与GO术语“蛋白质泛素化”(GO：0016567)、“泛素蛋白转移酶活性”(GO：0004842)以及同义术语相关的那些蛋白质，这些术语可以用于检索关于泛素化酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括去泛素化酶蛋白的一个或多个模块。去泛素化酶蛋白是介导泛素化的逆转，即从底物蛋白中去除泛素的那些蛋白质。底物蛋白的去泛素化可以逆转泛素化酶的作用并且防止底物蛋白的降解、逆转底物蛋白的泛素相关重新定位、逆转对底物蛋白的活性的泛素相关调节、逆转对底物蛋白的蛋白质-蛋白质相互作用的泛素相关调节等。去泛素化酶可以包括与GO术语“蛋白质去泛素化”(GO：0016579)和同义术语相关的那些蛋白质，这些术语可以用于检索关于去泛素化酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括SUMO化酶蛋白的一个或多个模块。SUMO化酶蛋白是介导SUMO化(即将小泛素样修饰(SUMO)蛋白添加到底物蛋白中)的翻译后修饰的那些蛋白质。SUMO化可以调节各种蛋白质功能，包括蛋白质稳定性、核-胞质转运、转录调节等。SUMO化酶可以包括与GO术语“蛋白质SUMO化”(GO：0016925)和同义术语相关的那些蛋白质，这些术语可以用于检索关于SUMO化酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括乙酰化酶蛋白(也被称为乙酰转移酶)的一个或多个模块。乙酰转移酶是催化乙酰基转移到底物蛋白中并且涉及表观遗传和转录调节的转移酶。乙酰转移酶可以被分成包括例如组蛋白乙酰转移酶、胆碱乙酰转移酶、氯霉素乙酰转移酶、血清素N-乙酰转移酶、NatA乙酰转移酶、NatB乙酰转移酶在内的组。乙酰转移酶可以包括与GO术语“乙酰转移酶活性”(GO：0016407)和同义术语相关的那些蛋白质，这些术语可以用于检索关于乙酰转移酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括脱乙酰基酶蛋白的一个或多个模块。脱乙酰基酶蛋白逆转乙酰转移酶的作用并且去除被转移到底物蛋白中的乙酰基并且因此同样涉及表观遗传和转录调节。脱乙酰基酶包括例如组蛋白脱乙酰基酶和沉默信息调节因子2相关酶(sirtuin)。脱乙酰基酶可以包括与GO术语“脱乙酰基酶活性”(GO：0019213)和同义术语相关的那些蛋白质，这些术语可以用于检索关于脱乙酰基酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括甲基化酶蛋白(也被称为甲基转移酶)的一个或多个模块。甲基转移酶通过将甲基转移到底物中来将底物(包括蛋白质底物和核酸底物)烷基化并且涉及表观遗传和转录调节。甲基转移酶可以基于它们的结构被分成包括例如I类、II类、III类在内的类别，并且可以根据它们的底物或甲基化模式来分组，包括例如蛋白质甲基转移酶、DNA甲基转移酶、天然产物甲基转移酶以及非SAM依赖性甲基转移酶。甲基转移酶可以包括与GO术语“DNA甲基转移酶活性”(GO：0009008)、“组蛋白甲基转移酶活性”(GO：0042054)以及同义术语相关的那些蛋白质，这些术语可以用于检索关于甲基转移酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括脱甲基酶蛋白的一个或多个模块。脱甲基酶逆转甲基转移酶的作用并且催化甲基从底物(包括蛋白质底物和核酸底物)中的去除并且因此也涉及表观遗传和转录调节。脱甲基酶可以包括与GO术语“脱甲基酶活性”(GO：0032451)、“DNA脱甲基酶活性”(GO：0035514)、“组蛋白脱甲基酶活性”(GO：0032452)以及同义术语相关的那些蛋白质，这些术语可以用于检索关于脱甲基酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括核酸酶蛋白的一个或多个模块。核酸酶催化核酸底物的核苷酸亚基之间的磷酸二酯键的切割。核酸酶可以被细分成非互斥的类别，如核酸内切酶和核酸外切酶。核酸酶可以包括与GO术语“核酸酶活性”(GO：0004518)、“脱氧核糖核酸酶I活性”(GO：0004530)、“RNA-DNA杂合体核糖核酸酶活性”(GO：0004523)、“核酸磷酸二酯键水解”(GO：0090305)、“核酸内切酶活性”(GO：0004519)、“核酸外切酶活性”(GO：0004527)以及同义术语相关的那些蛋白质，这些术语可以用于检索关于核酸酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括重组酶蛋白的一个或多个模块。重组酶催化对每一种重组酶具有特异性的靶位点序列之间的方向敏感性核酸交换反应，从而引起切除/插入、倒位、易位以及核酸片段交换。重组酶的实例包括但不限于Cre重组酶、Hin重组酶、Tre重组酶、FLP重组酶等。重组酶可以包括与GO术语“重组酶活性”(GO：0000150)、“DNA重组”(GO：0006310)以及同义术语相关的那些蛋白质，这些术语可以用于检索关于重组酶的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括转录因子蛋白的一个或多个模块。转录因子是与特定DNA序列结合并且控制转录的那些蛋白质。转录因子可以是引起转录上调的激活因子或引起转录下调的阻遏因子。转录因子可以根据它们的DNA结合结构域的结构被分成包括例如以下的超类：基本结构域转录因子、锌配位DNA结合结构域转录因子、螺旋-转角-螺旋转录因子、β支架因子转录因子以及没有包括在上述超类中的一个中的那些转录因子(参见例如Stegmaier等人，Genome Inform(2004)15(2)：276-86)。转录因子含有一个或多个DNA结合结构域。转录因子的DNA结合结构域可以是与Pfam标识号PF00010、PF00170、PF00172、PF00046、PF00319、PF08279、PF00096、PF00105等相关的DNA结合结构域中的一个或多个，所述Pfam标识号可以用于检索结构域序列和结构，例如在pfam(.)xfam(.)org上检索。转录因子还可以含有一个或多个反式激活结构域、一个或多个信号感受结构域。转录因子可以包括与GO术语“转录因子复合物”(GO：0005667)以及同义术语和相关术语相关的那些蛋白质，这些术语可以用于检索关于转录因子的信息，包括序列在内，例如在www(.)ebi(.)ac(.)uk/QuickGO上在线检索。

在一些情况下，其他DNA结合结构域，例如不是源自于转录因子的DNA结合结构域或非转录因子DNA结合结构域也可以用于如本文所述的单个合成模块化多肽文库成员的一个或多个模块中。这样的非转录因子DNA结合结构域包括非特异性结合DNA或结合DNA的特定序列的天然多肽结构域和合成多肽结构域。非转录因子DNA结合结构域可以包括但不限于例如锌指核酸内切酶多肽的天然或工程化DNA结合结构域、转录激活因子样效应子核酸酶(TALEN)多肽的天然或工程化DNA结合结构域、Cas9多肽(包括例如核酸酶缺陷型Cas9(dCas9)等)的天然或工程化DNA结合结构域等。

在一些情况下，单个合成模块化多肽文库成员可以被配置成包括如PCT申请号US2004/019778中所述的一个或多个模块；该申请的公开内容以引用的方式整体并入本文。

将模块配置成如本文所述的合成模块化多肽将产生含有多个单独的模块化功能蛋白的文库，所述单独的模块化功能蛋白可以，但是不一定必须共有共同的功能。举例来说，所述单独的文库成员可以包含以下各项或可以由以下各项组成：作为模块化支架蛋白的合成模块化多肽、作为模块化受体蛋白的合成模块化多肽、作为模块化蛋白激酶或磷酸酶蛋白的合成模块化多肽、作为模块化转录调节因子蛋白的合成模块化多肽、作为模块化表观遗传调节因子蛋白的合成模块化多肽、作为模块化重组酶或核酸酶蛋白的合成模块化多肽等等。可以针对所期望的表型筛选这样的文库，例如根据本文所述的方法。

报告蛋白

本文所述的文库包括由编码其的核酸序列表达的可检测信号产生蛋白。用于如本文所述的文库系统中的特定的可检测信号产生蛋白将变化并且部分地取决于检测所产生的信号的优选方法。举例来说，在例如经由使用荧光显微镜术或流式细胞术(包括荧光激活细胞分选(FACS))来光学检测信号的情况下，使用荧光报告蛋白。

合适的可检测信号产生蛋白包括例如荧光蛋白；催化产生可检测信号作为产物的反应的酶；表位标签、表面标记等。可检测信号产生蛋白可以被直接检测或间接检测。举例来说，在使用荧光报告蛋白的情况下，可以直接检测报告蛋白的荧光。在一些情况下，在使用表位标签或表面标记的情况下，可以间接检测所述表位标签或表面标记，例如经由使用特异性结合所述表位标签或表面标记的可检测的结合剂，例如特异性结合所述表位标签或表面标记的荧光标记抗体。在一些情况下，通常被间接检测的报告蛋白例如表位标签或表面标记可以被直接检测，或者通常被直接检测的报告蛋白可以被间接检测，例如经由使用特异性结合荧光报告蛋白的可检测的抗体。

合适的荧光蛋白包括但不限于绿色荧光蛋白(GFP)或其变体、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强型GFP(EGFP)、增强型CFP(ECFP)、增强型YFP(EYFP)、GFPS65T、Emerald、Topaz(TYFP)、Venus、Citrine、mCitrine、GFPuv、不稳定型EGFP(dEGFP)、不稳定型ECFP(dECFP)、不稳定型EYFP(dEYFP)、mCFPm、Cerulean、T-Sapphire、CyPet、YPet、mKO、HcRed、t-HcRed、DsRed、DsRed2、DsRed单体、J-Red、二聚体2、t-二聚体2(12)、mRFP1、杯形珊瑚素(pocilloporin)、海肾GFP、Monster GFP、paGFP、Kaede蛋白和点燃蛋白、藻胆蛋白和藻胆蛋白缀合物，包括B-藻红蛋白、R-藻红蛋白以及别藻蓝蛋白。荧光蛋白的其他实例包括mHoneydew、mBanana、mOrange、dTomato、tdTomato、mTangerine、mStrawberry、mCherry、mGrape1、mRaspberry、mGrape2、mPlum(Shaner等人(2005)Nat.Methods 2：905-909)等。如例如Matz等人(1999)NatureBiotechnol.17：969-973中所述的来自珊瑚虫纲(Anthozoan)物种的多种荧光蛋白和有色蛋白中的任一种是适用的。

合适的酶包括但不限于辣根过氧化物酶(HRP)、碱性磷酸酶(AP)、β-半乳糖苷酶(GAL)、葡萄糖-6-磷酸脱氢酶、β-N-乙酰氨基葡糖苷酶、β-葡萄糖醛酸酶、转化酶、黄嘌呤氧化酶、萤火虫荧光素酶、葡萄糖氧化酶(GO)等。

接头和连接

在单个文库成员内，编码单个多肽的模块化组分之间的连接一般将保持“在框内”，这意味着多模块编码序列的密码子阅读框从一个模块单元维持到下一个模块单元。这样的连接在本文可以被称为框内连接和/或框内连锁。多模块多肽的模块组分之间的接头一般将是柔性的和/或不会含有干扰模块化结构域的功能的氨基酸残基。

这样的框内连接可以如下文更详细描述的那样，通过配置编码序列和模块化组分的嵌套组装以含有框内接头的任何方便的方法来实现。

合适的接头可以容易地选择并且可以具有多个合适长度中的任一个，如1个氨基酸(例如Gly)至20个氨基酸、2个氨基酸至15个氨基酸、3个氨基酸至12个氨基酸，包括4个氨基酸至10个氨基酸、5个氨基酸至9个氨基酸、6个氨基酸至8个氨基酸或7个氨基酸至8个氨基酸，并且可以是1个、2个、3个、4个、5个、6个或7个氨基酸。

示例性接头包括甘氨酸聚合物(G)_n、甘氨酸-丝氨酸聚合物(包括例如(GS)_n、(GSGGS)_n(SEQ ID NO：8)以及(GGGS)_n(SEQ ID NO：9)，其中n是至少1的整数)、甘氨酸-丙氨酸聚合物、丙氨酸-丝氨酸聚合物以及本领域已知的其他柔性接头。可以使用甘氨酸聚合物和甘氨酸-丝氨酸聚合物；Gly和Ser两者是相对非结构化的，并且因此可以用作组分之间的中性系链。可以使用甘氨酸聚合物；甘氨酸甚至比丙氨酸获得显著更多的

空间，并且比具有更长侧链的残基受到少得多的限制(参见Scheraga，Rev.Computational Chem.11173-142(1992))。示例性接头可以包含包括但不限于以下的氨基酸序列：GGSG(SEQ ID NO：10)、GGSGG(SEQ ID NO：11)、GSGSG(SEQ ID NO：12)、GSGGG(SEQ ID NO：13)、GGGSG(SEQ ID NO：14)、GSSSG(SEQ ID NO：15)等。

在一些情况下，接头包含用于克隆目的并且作为接头的一部分的BamHI限制性识别位点序列，这是因为BamHI位点编码GS。

在一些情况下，接头序列可以经由一个或多个克隆步骤(例如经由使用IIS型限制性核酸内切酶或同源重组)或经由直接消化(例如BamHI消化)来消除。

在一些情况下，框内连接是经由在两个模块化组分的连接处不存在接头来实现的。因而，在一定情况下，框内连接可以不包含模块编码序列之间的编码氨基酸的间插核酸。在一些情况下，框内连接可以包含模块编码序列之间的两个或更少个间插核酸碱基对。在一些情况下，框内连接可以包含模块编码序列之间的一个或更少个间插核酸碱基对。在一些情况下，框内连接可以不包含模块编码序列之间的间插核酸碱基对。

条形码

核酸条形码是可以通过核酸序列鉴定的任何方便的方法来鉴定的特定的独特的核酸序列，所述鉴定包括但不限于例如基于杂交的鉴定(即原位杂交)、基于扩增的鉴定(即基于PCR的鉴定)以及核酸测序。本公开的条形码可以是模块特异性条形码，这意味着多模块文库的每一个独特的模块与特定的独特条形码相关以使得对特定条形码的鉴定等同于对相关的模块编码序列的阳性鉴定。

如本文所述的模块特异性条形码将受到所利用的文库组装方法的约束。举例来说，在通过基于限制性内切酶的方法实现多模块构建体的嵌套组装的情况下，条形码将不包括构成在组装中所利用的限制性内切酶的限制性内切酶识别位点的任何序列。因而，在一些情况下，条形码序列不会含有限制性内切酶识别序列。在一些情况下，条形码序列不会含有IIS型限制性内切酶识别序列。

在其中通过测序(包括例如下一代测序方法)来进行条形码的鉴定和/或定量的情况下，通过测序所检测的条形码的常规考虑因素将被应用。在一些情况下，可商购获得的条形码和/或含有条形码的试剂盒和/或条形码衔接头可以被使用或修饰以用于本文所述的方法中，包括例如可商购自诸如但不限于例如以下的供应商的那些条形码和/或条形码衔接头试剂盒：New England Biolabs(Ipswich，MA)、Illumina，Inc.(Hayward，CA)、LifeTechnologies，Inc.(Grand Island，NY)、Bioo Scientific Corporation(Austin，TX)等，或可以被定制制造，例如可获自例如Integrated DNA Technologies，Inc.Coralville，IA)。

条形码长度将变化并且将取决于文库的复杂性和所利用的条形码检测方法。由于核酸条形码(例如DNA条形码)是公知的，因此核酸条形码的设计、合成以及使用在本领域普通技术人员的技术范围内。

在一些情况下，所利用的条形码的长度还将取决于单个条形码序列在文库的某个其他组分(包括但不限于例如模块编码序列、载体、载体组分等)中或在两个条形码单元的连接处偶然出现的可能性。举例来说，在一些情况下，在非条形码序列可能被无意中检测成条形码序列的可能性很大的情况下，例如在高度复杂的文库中，可以利用具有更长长度的条形码单元。在一些情况下，当确定必要的条形码长度时，条形码检测的方法可以被考虑在内，例如在其中使用杂交条形码检测的情况下，与在使用利用特定的测序引物进行的测序的情况下相比，可以使用更长的条形码。

如本文所用，当术语“条形码区”涉及核酸文库的单个成员时，它是指每一个核酸的含有对合成多肽的可变模块化部分具有特异性的核酸序列的区域。在一些情况下，条形码区可以用于特异性鉴定文库的特定成员的编码区中存在的一个或多个可变模块。在一些情况下，条形码区可以用于特异性鉴定一个或多个可变模块并且鉴定文库的特定成员的编码区中存在的可变模块的顺序(即构造)。在一些情况下，条形码区可以用于定量，例如半定量地定量文库的特定成员的出现率或含有多个文库成员的群体内特定模块的出现率。

在如本文所述的文库的带条形码的合成模块多肽内，与模块编码序列相比，条形码区的条形码单元将处于相反取向。此外，条形码区的条形码单元与它们对应的相关模块编码序列相比将按相反的顺序。然而，就与编码的多肽的关系来说，条形码区可以定位于编码合成模块化多肽的核酸序列的“N末端”或“C末端”。

载体特异性元件

“载体特异性元件”意指用于在构建载体之前、期间或之后制备、构建、增殖、维持和/或测定载体的元件。这样的载体特异性元件包括但不限于例如在载体使用期间增殖、克隆以及选择载体所必需的载体元件并且可以包括但不限于例如复制起点、多克隆位点、原核启动子、噬菌体启动子、选择标记(例如抗生素抗性基因、编码的酶蛋白、编码的荧光蛋白或发色蛋白等)等。任何方便的载体特异性元件在适当时均可以用于如本文所述的载体中。

可用作载体特异性元件的合适的启动子元件和增强子元件是本领域已知的。为了在细菌细胞中表达，合适的启动子包括但不限于lacI、lacZ、T3、T7、gpt、λP以及trc。为了在真核细胞中表达，合适的启动子包括但不限于轻链和/或重链免疫球蛋白基因启动子元件和增强子元件；巨细胞病毒立即早期启动子；单纯疱疹病毒胸苷激酶启动子；早期和晚期SV40启动子；存在于来自逆转录病毒的长末端重复序列中的启动子；小鼠金属硫蛋白-I启动子；以及各种本领域已知的组织特异性启动子。

包括可逆的诱导型启动子的合适的可逆启动子是本领域已知的。这样的可逆启动子可以从许多生物体，例如真核生物和原核生物中分离和获得。修饰源自于第一生物体的可逆启动子以用于第二生物体是本领域公知的，例如第一原核生物和第二真核生物，第一真核生物和第二原核生物；等等。这样的可逆启动子以及基于这样的可逆启动子而且还包含另外的控制蛋白的系统包括但不限于醇调节型启动子(例如醇脱氢酶I(alcA)基因启动子、对醇反式激活因子蛋白(AlcR)有响应的启动子等)、四环素调节型启动子(例如包括Tet激活因子、TetON、TetOFF等的启动子系统)、类固醇调节型启动子(例如大鼠糖皮质激素受体启动子系统、人类雌激素受体启动子系统、类视色素启动子系统、甲状腺启动子系统、蜕皮激素启动子系统、米非司酮启动子系统等)、金属调节型启动子(例如金属硫蛋白启动子系统等)、病程相关调节型启动子(例如水杨酸调节型启动子、乙烯调节型启动子、苯并噻二唑调节型启动子等)、温度调节型启动子(例如热激诱导型启动子(例如HSP-70、HSP-90、大豆热激启动子等)、光调节型启动子、合成诱导型启动子等。

在一些情况下，含有合适的启动子的基因座或构建体或转基因经由对诱导系统进行诱导而不可逆地转换。用于诱导不可逆的转换的合适的系统是本领域公知的，例如对不可逆的转换的诱导可以利用Cre-lox介导的重组(参见例如Fuhrmann-Benzakein等人，PNAS(2000)28：e99，该文献的公开内容以引用的方式并入本文)。可以使用本领域已知的重组酶、核酸内切酶、连接酶、重组位点等的任何合适的组合来产生可不可逆转换的启动子。本文其他地方描述的用于进行位点特异性重组的方法、机制以及要求可用于产生不可逆转换的启动子并且是本领域公知的，参见例如Grindley等人，(2006)Annual Review ofBiochemistry，567-605；以及Tropp(2012)Molecular Biology(Jones&BartlettPublishers，Sudbury，MA)，这些文献的公开内容以引用的方式并入本文。

制备文库的方法

本公开提供了制备编码合成模块化多肽的核酸的文库的方法，其中所述文库的每一个核酸包括多单元条形码，所述多单元条形码鉴定所述模块化多肽的一个或多个可变模块并且在存在多个可变模块的情况下鉴定它们相对于彼此的取向。在多个实施方案中，本公开提供了从带条形码的编码模块的核酸逐步组合组装合成模块化多肽以使得所得的编码合成模块化多肽的核酸各自包含框内模块的编码区和多单元条形码的方法，其中条形码单元的排列对应于所述框内模块的排列。一般来说，在文库的每一个成员中包括多个可变模块的情况下，共同组装的多单元条形码提供了每一个文库成员的可变模块的组装的记录。

不受理论所束缚，与在使用单独(即“逐个”)多肽工程化的常规方法的情况下可能或实际的构建相比，如本文所呈现的合成模块化多肽的逐步组合组装提供了更大的和更复杂的文库的构建。本申请的发明人认识到常规的合成模块化多肽工程化代表了高通量合成模块化多肽筛选的一个显著的技术障碍。如本文所呈现的每一个多模块合成多肽和相应的多单元条形码的协调组装克服了这个障碍并且允许编码可筛选的合成模块化多肽的多个独特核酸的“一锅法组装”。这样的高通量一锅法组装不能用常规的多肽工程化进行。

本申请的发明人还认识到常规的物理排列的合成多肽文库也成为高通量筛选的主要技术障碍。具体来说，在筛选大型文库的情况下，当试图对大型文库的整体复杂性进行筛选并且分析所产生的数据时，物理分开的反应室的数目以及每一室之间测定条件的变异性成为显著的技术障碍。本申请的发明人认识到汇集文库筛选可以克服这个问题，但是带来了其他显著的障碍，如很难或无法实现在筛选中从独特模块化多肽的复杂混合库中鉴定和/或定量产生所期望的表型的单个多肽。短的多单元条形码的使用克服了这个问题，这是通过允许仅通过对多单元条形码进行测序来在复杂的库内对产生所期望的表型的单个独特合成模块化多肽进行事后有效阳性鉴定和/或定量来实现的。

克隆策略

一般来说，本公开提供了一种制备如本文所述的文库的方法，所述方法是通过嵌套组装连接条形码的编码多肽模块的核酸来实现的。举例来说，如图12中所描绘，通过切割编码多肽模块的序列与模块特异性条形码之间的连接来使核酸载体(100)线性化(103)，所述核酸载体(100)含有与模块特异性条形码(102)连接的编码多肽模块的序列(101)。在将含有第一模块编码序列和第一模块特异性条形码的载体线性化之后，将含有第二模块编码序列(104)和对所述第二模块具有特异性的第二条形码(105)的核酸插入(即嵌套)到第一模块编码序列与第一条形码之间(106)。所组装的核酸含有编码合成模块化多肽的编码区和条形码区，所述条形码区含有多单元条形码(即“条形码”(BC))。在一些情况下，组装模块编码序列以使得它们通过编码所期望的接头的序列连接，如本文所述的那样。在某些情况下，组装模块编码序列以使得它们在不使用接头序列的情况下连接，例如没有编码一个或多个接头氨基酸的接头序列、在第一模块编码序列与第二模块编码序列之间没有任何间插的非编码核苷酸等等。因而，“所期望的接头序列”或“接头”的指示，特别是如附图中所用，涵盖了完全不存在任何接头或接头序列以及多肽模块和模块编码序列直接连接。

通过在第一模块编码序列与第一模块特异性条形码之间进行切割将载体序列线性化可以通过任何方便的和适当的手段来实现。举例来说，含有模块编码序列和条形码的多核苷酸可以被配置成在模块编码序列与条形码之间含有限制性内切酶(即限制性核酸内切酶)切割位点。所述切割位点可以是II型限制性内切酶切割位点并且更确切地说，可以是所使用的II型限制性内切酶的识别序列内所含的切割位点。在识别序列内切割的任何方便的II型限制性内切酶均可以用于这一所述的目的，包括本领域已知的在识别序列内切割的那些II型限制性内切酶。在一些情况下，所述切割位点可以是BamHI的切割位点，所述BamHI具有5′-GGATCC-3′的识别序列并且在两条链上识别序列的第一个G之后切割，从而留下5′-GATC-3′突出端。可以用于这一目的的其他限制性内切酶包括但不限于例如，

在一些情况下，嵌套组装是经由使用定位在第一模块编码序列与第一模块特异性条形码之间和侧接第二带条形码的模块编码序列的两种限制性内切酶位点(RE1和RE2)来实现的(图13)。在该双限制性内切酶组装策略中，在RE1和RE2两者处消化引起载体的线性化和含有第二带条形码的模块编码序列的片段的释放。在使线性化的载体和所释放的片段连接时，在第一模块编码序列与第二模块编码序列之间存在所期望的接头序列并且与第一模块编码序列和第二模块编码序列相比，第一条形码和第二条形码处于相反取向。

在一些情况下，嵌套组装是经由使用四种限制性内切酶位点(RE1、RE2、RE3以及RE4)实现的，其中RE1和RE2定位在这两个模块编码序列与它们对应的条形码之间并且RE3和RE4侧接第二带条形码的模块编码序列定位(图14)。在该四种限制性内切酶的组装策略中，分别在RE1和RE2处消化第一载体以及在RE3和RE4处消化第二载体引起载体的线性化和含有第二带条形码的模块编码序列的片段的释放。在使线性化的载体和所释放的片段连接时，在第一模块编码序列与第二模块编码序列之间存在所期望的接头序列并且与第一模块编码序列和第二模块编码序列相比，第一条形码和第二条形码处于相反取向。

在一些情况下，限制性内切酶被具体选择以使得在连接时，在第一模块编码序列与第二模块编码序列以及第一条形码与第二条形码之间的连接处不含RE1、RE2、RE3或RE4限制性内切酶识别序列。一般来说，根据这种策略，所利用的RE1位点、RE2位点、RE3位点以及RE4位点在连接之后失活以使得所得的载体仅在第二模块编码序列与它对应的条形码之间含有活性RE1位点和RE2位点。因此，这种策略允许通过在RE1和RE2处限制性消化最近插入的带条形码的模块编码序列将所得载体重复线性化而实现超越二维构建体的连续嵌套组装。

在该四种限制性内切酶的方法中，选择RE1以使得在消化时，线性化载体的所得末端与通过用RE3消化所产生的释放片段的末端相容(即能够连接)。选择RE2以使得在消化时，线性化载体的所得末端与通过用RE4消化所产生的释放片段的末端相容(即能够连接和/或能够完全或至少部分杂交)。在一些情况下，通过用RE1、RE2、RE3或REA消化所产生的一个或多个末端可以被修饰，例如通过一个或多个核苷酸的添加或缺失或其他化学修饰，以在RE1与RE3或RE2与RE4之间产生相容的末端。末端修饰的任何方便的方法可以用于产生相容的末端，包括本领域公知的那些末端修饰方法，包括但不限于例如末端平端化、磷酸化、脱磷酸化等。

在一些情况下，嵌套组装是经由使用IIS型限制性内切酶识别序列(RE1)来实现的，其中两个RE1位点存在于第一模块编码序列与它的条形码之间并且两个RE1位点侧接第二带条形码的模块编码序列(图15)。在这种IIS型限制性内切酶介导的策略中，在邻近于RE1识别位点的位点处消化引起载体的线性化和含有第二带条形码的模块编码序列的片段的释放。邻近于RE1识别位点的切割位点被配置成使得在切割时，载体的3′末端与片段的5′末端相容并且载体的5′末端与片段的3′末端相容。在一些情况下，这些相容末端可以被称为相容的“突出端”。因此，在使线性化载体和所释放的片段连接后，在第一模块编码序列与第二模块编码序列之间存在所期望的接头序列并且与第一模块编码序列和第二模块编码序列相比，第一条形码和第二条形码处于相反取向。

任何方便的IIS型限制性内切酶可以用于如本文所述的利用这样的酶的组装策略中，包括但不限于例如AceIII、AcuI、AlwI、AarI、BbsI、BbvI、BbvII、BccI、Bce83I、BceAI、BcefI、BciVI、BfuAI、BmrI、BmuI、BpmI、BpuEI、BsaI、BsbI、BseRI、BsgI、BslFI、BsmAI、BsmFI、BsoMAI、BspCNI、BspGI、BspMI、BspNCI、BspQI、BsrDI、Bst71I、BtgZI、BtsCI、BtsI、BveI、DrdII、EarI、EciI、FaqI、FinI、FokI、HgaI、Hin4II、HphI、HpyAV、LguI、MboII、MmeI、MnlI、NmeAIII、PleI、SapI、SfaNI、SgeI等。

在一些情况下，用于例如将载体线性化和/或释放含有第二模块的片段的限制性内切酶是在它的识别位点两侧上切割的限制性内切酶。具有这样的功能的任何方便的限制性内切酶可以用于本文所述的组装方法中，包括但不限于例如BcgI。

在一些情况下，嵌套组装是经由使用多种IIS型限制性内切酶识别序列，例如两种IIS型限制性内切酶识别序列(RE1和RE2)实现的，其中两个RE1位点存在于这两个模块编码序列与它们对应的条形码之间并且两个RE2位点侧接第二带条形码的模块编码序列(图16)。在该双IIS型限制性内切酶策略中，分别在RE1位点处消化第一载体以及在RE2位点处消化第二载体引起载体的线性化和含有第二带条形码的模块编码序列的片段的释放。在使线性化的载体和所释放的片段连接时，在第一模块编码序列与第二模块编码序列之间存在所期望的接头序列并且与第一模块编码序列和第二模块编码序列相比，第一条形码和第二条形码处于相反取向。

一般来说，根据这种策略，在第一轮线性化和片段释放中所利用的RE1位点和RE2位点相对于载体和插入序列丧失以使得所得载体仅在第二模块编码序列与它对应的条形码之间含有活性RE1位点。因此，这种策略允许通过使用RE1识别位点限制性消化最近插入的带条形码的模块编码序列将所得载体重复线性化而实现超越二维构建体的连续嵌套组装。

在该双IIS型限制性内切酶方法中，邻近于RE1识别序列和RE2识别序列的切割位点被配置成使得在消化时，线性化载体的所得末端与所释放的片段的末端相容(即能够连接)。在一些情况下，通过用RE1和/或RE2消化所产生的一个或多个末端可以被修饰，例如通过一个或多个核苷酸的添加或缺失或其他化学修饰，以产生相容末端。末端修饰的任何方便的方法可以用于产生相容的末端，包括本领域公知的那些末端修饰方法，包括但不限于例如末端平端化、磷酸化、脱磷酸化等。

在一些情况下，相容末端可以经由使用具有核酸外切酶活性的酶，例如核酸外切酶来产生。举例来说，在一些实施方案中，第一载体和第二载体或核酸片段被配置成使得在用第一限制性内切酶(RE1)对第一载体进行限制性内切酶消化并且用第二限制性内切酶(RE2)对第二载体或核酸进行限制性内切酶消化时，在使用具有核酸外切酶活性的酶之后，新产生的末端对于连接是相容的。经由使用具有核酸外切酶活性的酶产生相容末端的方法是本领域公知的并且包括但不限于例如In-Fusion克隆(无缝克隆)、吉布森组装(GibsonAssembly)等。

在一些情况下，限制性内切酶消化的第一载体和第二核酸，例如核酸片段的第二载体的组装是经由使用In-Fusion反应来实现的，并且在这样的情况下，经由使用具有核酸外切酶活性的酶产生的相容末端可以被称为In-Fusion突出端(IF突出端)(图17)。两个IF突出端的连接可以被配置成在核酸的两个连接末端之间产生所期望的接头和/或所期望的接头序列。举例来说，第一模块编码序列与第二模块编码序列之间连接的IF突出端可以被配置成使得第一模块和第二模块在框内。如本文所更详细描述的那样，框内模块编码序列可能被或可能不被编码一个或多个接头氨基酸的序列分开。举例来说，如图17中所描绘，在第一限制性内切酶的识别位点(RE1)处对第一载体进行消化产生了与通过用IIS型限制性内切酶在由存在于第二载体或核酸片段上的识别位点(RE2)所确定的切割位点处对第二载体或核酸片段进行消化所产生的末端In-Fusion相容的末端。经由In-Fusion反应使相容末端连接，从而产生第一模块编码序列与第二模块编码序列之间的所期望的接头序列和具有第一条形码单元和第二条形码单元的多单元条形码，与第一模块编码序列和第二模块编码序列相比，所述第一条形码单元和所述第二条形码单元处于相反取向。在一些情况下，在第一模块编码序列和第二模块编码序列以及多单元条形码的In-Fusion组装之后，在编码区与条形码区之间存在限制性内切酶位点以允许插入另外的模块编码序列和条形码单元。

在一些情况下，在使含有第一模块编码序列的核酸与含有第二模块编码序列的第二核酸连接时，第一模块编码序列和第二模块编码序列连接以使得在所述第一模块编码序列与所述第二模块编码序列之间不存在接头并且不存在间插的非编码核苷酸。在一个非限制性实例中，在没有接头或间插非编码核苷酸的情况下借助于限制性内切酶消化使含有第一模块编码序列和它对应的条形码的第一载体与含有第二模块编码序列和它对应的条形码的第二载体或核酸片段连接(图18)。使用具有两种不同的识别位点(RE1和RE2)的两种不同的IIS型限制性内切酶消化第一载体和第二载体或核酸片段两者，其中第一限制性内切酶在距它的识别位点(RE1)一定距离的相同位置处切割核酸的两条链，从而留下“平端”并且第二限制性内切酶在距它的识别位点(RE2)一定距离的不同位置处切割核酸的两条链，从而留下突出端或“粘性末端”。起始核酸被配置成使得在用第二限制性内切酶切割第一载体和第二载体时，所产生的粘性末端对于连接是相容的。因此，在使所产生的平端和粘性末端连接时，所得载体含有与第二模块编码序列直接融合而没有接头或间插非编码核酸的第一模块编码序列和含有第一模块编码序列的条形码和第二模块编码序列的条形码的多单元条形码，与所述第一模块编码序列和所述第二模块编码序列相比，这些条形码处于相反取向。

在消化后产生平端的任何方便的IIS型限制性内切酶可以用于本文所述的利用平端连接的方法中，包括本领域公知的那些，包括但不限于例如SlyI、MlyI等。此外，在适当的情况下可以利用在用不产生平端的限制性核酸内切酶消化后产生平端，即“平端化”的方法，包括但不限于用DNA聚合酶进行“末端补平”，所述DNA聚合酶例如像DNA聚合酶I大片段(即克列诺(Klenow))、T4DNA聚合酶、绿豆核酸酶等，或可以通过具有核酸外切酶活性的酶去除末端不成对核苷酸。

在一些情况下，在与非IIS型限制性内切酶相容的序列存在于模块编码序列的末端处的情况下，可以使用非IIS型限制性内切酶，例如在识别序列内切割的II型限制性内切酶进行消化。在这样的情况下，可以使用在模块编码序列的末端处产生平端的限制性内切酶，其中所述模块编码序列在它的3′末端或5′末端处含有所述限制性内切酶的识别序列的全部或一部分。在一些情况下，在模块编码序列含有在识别序列内切割并且不产生平端的限制性内切酶的识别序列的全部或一部分的情况下，可以使用非平端限制性内切酶并且可以将所产生的突出端平端化，例如经由任何方便的方法，包括但不限于例如本文所述的那些方法。

由于模块编码序列的末端处的序列将受到模块的末端氨基酸的约束，因此其中适当的限制性内切酶识别序列方便地存在于或可以被修饰成方便地存在于模块编码序列的一个或多个末端处以允许正确切割和/或产生平端的情况可能是罕见的，这取决于所使用的具体模块。因此，在许多情况下，合成模块化多肽的大型或多维文库的有效产生将取决于存在于模块编码序列外部的酶识别位点。因而，在一些情况下，文库组装中所利用的酶识别序列中的一个或多个(包括全部在内)将存在于模块编码序列外部。在许多情况下，文库组装中所利用的酶识别序列中的一个或多个(包括全部在内)将存在于条形码序列外部。

在一些情况下，产生合成模块化多肽，其中模块编码序列与接头结构域的末端无缝连接以使得在模块编码序列与它们对应的和接头结构域的连接处之间不存在间插序列。在一个非限制性实例中，模块编码序列与接头结构域的这样的无缝连接是通过载体或核酸片段来促进，所述载体或核酸片段被配置成含有与模块编码序列的任一末端无缝连接的所期望的接头序列的一部分。举例来说，第一载体可以被配置成含有与接头结构域的第一部分无缝连接的第一模块编码序列，使所述第一载体与第二载体或核酸片段连接，所述第二载体或核酸片段被配置成含有与第二模块编码序列无缝连接的接头结构域的第二部分(图19)。第一载体可以被配置成在模块编码序列与它对应的条形码之间含有两个第一IIS型限制性内切酶识别位点(RE1)。第二载体或核酸片段可以被配置成含有侧接带条形码的第二模块编码序列的两个第二IIS型限制性内切酶识别位点(RE2)。可以利用第三载体或核酸片段，所述第三载体或核酸片段含有由两个第二IIS型限制性内切酶识别位点(RE2)侧接的接头结构域的其余例如“中间”部分。预消化的载体和/或核酸片段的序列被配置成使得在消化时，在接头结构域的第一部分与接头结构域的中间部分、接头结构域的第二部分与接头结构域的中间部分以及两个条形码之间产生相容的末端。在消化和连接后，所得载体含有第一模块编码序列，所述第一模块编码序列与接头结构域无缝连接，所述接头结构域与第二模块编码序列无缝连接，所述第二模块编码序列与条形码区连接，所述条形码区含有第一条形码和第二条形码，与第一模块编码序列和第二模块编码序列相比，所述第一条形码和所述第二条形码处于相反取向(图19)。例如在模块与接头结构域之间进行无缝组装可以在使用或不使用核酸外切酶介导的组装(例如In-Fusion克隆、吉布森组装等)的情况下来实现。

在一些情况下，上述基于消化的组装策略可以任何方便的和适当的方式全部或部分地组合以得到可用于产生如本文所述的合成模块化多肽文库的方法。此外，在基于消化的组装的替代方法是本领域已知的并且将与本文所述的方法相容的情况下，这样的替代方法可以用于组装如本文所述的合成模块化多肽文库。在一些情况下，所述基于消化的策略可以全部或部分地与核酸组装的基于非消化的方法组合。

编码如本文所述的合成模块化多肽文库的核酸的组装不限于基于消化，即基于限制性内切酶的组装策略。在一些情况下，基于非消化的方法可以用于组装如本文所述的文库，包括但不限于例如基于扩增的策略、基于重组的策略等。基于非消化的方法可以用于代替基于消化的策略，即，以使得整个组装策略作为整体不涉及限制性内切酶消化，或可以与基于消化的策略组合使用，即，以使得组装策略作为整体涉及基于限制性内切酶的消化和基于非消化的方法两者。

在一些情况下，如本文所述的合成模块化多肽文库可以全部或部分地使用基于扩增的组装来组装，基于扩增的组装包括但不限于例如PCR克隆、TA克隆、PCR突出端延伸等。这样的基于扩增的策略将不同，但是一般将利用起始载体和/或核酸片段内的多个引物结合位点。根据所期望的最终产物，可以将这样的引物结合位点特异性地添加到载体和/或核酸片段中，或可以根据各种基于扩增的组装策略，利用载体或核酸片段中存在的预先存在的序列作为引物结合位点。引物结合位点可以足以产生所期望的克隆产物的任何方便的构型和/或取向定位，包括但不限于：以朝向模块编码序列5′到3′取向定位在模块编码序列与它对应的条形码之间；以朝向条形码5′到3′取向定位在模块编码序列与它对应的条形码之间；以朝向模块编码序列5′到3′取向定位在模块编码序列的上游(即5′)；以朝向模块条形码序列5′到3′取向定位在模块条形码序列的下游(即3′)；等。引物结合位点序列可以被配置成使得在基于扩增的克隆后(包括在一轮基于扩增的克隆后)，一个或多个所期望的接头序列存在于所组装的元件之间，所述元件包括例如所组装的模块编码序列、所组装的条形码序列等。

作为基于扩增的组装策略的非限制性实例，可以使用PCR突出端延伸策略(图20)，其中第一载体含有以相反的5′到3′取向定位在模块编码序列与它对应的条形码序列之间的第一引物结合位点(PBS1)和第二引物结合位点(PBS2)。利用第二载体或核酸片段，所述第二载体或核酸片段具有由第一引物结合位点和第二引物结合位点(PBS1和PBS2)侧接的第二带条形码的模块编码序列。在通过突出端延伸PCR，使用与PBS1位点和PBS2位点特异性杂交的引物进行延伸和扩增时，产生组装产物，其中第一模块编码序列以所期望的接头与第二模块编码序列连接，所述第二模块编码序列与含有第一条形码和第二条形码的多单元条形码连接，所述第一条形码和所述第二条形码与它们对应的模块编码序列相比处于相反取向(图20)。

鉴于上述组装策略，本领域普通技术人员将容易理解如何可以将上述策略中的任一种全部或部分组合以根据所期望的文库和/或文库组分的组装产生所期望的结果和/或使特定克隆技术的优势达到最大和/或使特定克隆技术的缺点减到最低限度。作为非限制性实例，基于扩增的策略可以与基于消化的策略组合，其中这些策略的组合产生了所期望的文库和/或文库组分的组装。举例来说，如图21中所描绘，根据定位在第一模块编码序列与它的条形码之间的限制性识别位点酶位点(RE1)对第一载体进行的限制性内切酶消化可以与使用侧接第二载体或核酸片段内所含的第二带条形码的模块编码序列的引物结合位点进行的基于PCR的扩增组合以允许嵌套组装。在所述混合组装策略的组装后，产生组装产物，其中第一模块编码序列以所期望的接头与第二模块编码序列连接，所述第二模块编码序列与含有第一条形码和第二条形码的多单元条形码连接，所述第一条形码和所述第二条形码与它们对应的模块编码序列相比处于相反取向(图21)。

混合策略不限于基于消化的策略和基于扩增的策略的组合并且可以全部或部分包括其他克隆和/或合成生物学方法，包括但不限于例如基于重组的克隆策略(包括但不限于例如基于Gateway的克隆策略、基于Cre/Flp重组酶的克隆(包括其中位点在重组时失活)等)、从头序列组装、从头核酸合成等。在一些情况下，可以独立地使用基于重组的克隆策略、从头序列组装、从头核酸合成等，即单独作为独立的克隆策略并且不作为混合克隆策略的一部分。

在一些情况下，在所使用的特定克隆策略使得不期望的间插序列存在于两个克隆元件之间(这也被称为克隆瘢痕或接缝)的情况下，这些克隆瘢痕可以经由单分子切割以及含有瘢痕的载体的重新连接来减少和/或去除。单分子切割和重新连接可以通过任何方便的方法来实现，包括但不限于例如限制性内切酶介导的单分子切割和重新连接，例如像IIS型单分子切割和重新连接。举例来说，在一些情况下，包括来自基于重组的组装的重组位点的全部或一部分的接缝可以部分或全部经由单分子切割和重新连接来去除。在一些情况下，包括来自基于消化的组装的限制性内切酶识别位点的全部或一部分的切割瘢痕可以部分或全部经由单分子切割和重新连接来去除。在一些情况下，包括来自基于扩增的组装的引物结合位点的全部或一部分的接缝可以部分或全部经由单分子切割和重新连接来去除。

在一个非限制性实施方案中，经由使用基于消化的克隆和In-Fusion克隆对文库组分的每一个维度进行迭代克隆来产生组合文库。举例来说，如图22中所详述，在步骤1中，在Gly/Ser接头内或附近的BamHI位点处消化含有ScFv编码序列和相邻Gly/Ser接头的起始核酸(例如载体)。在步骤2中，通过In-Fusion克隆将核酸片段克隆到消化的BamHI位点中，所述核酸片段含有第一模块编码序列，所述第一模块编码序列与第二Gly/Ser接头连接，所述第二Gly/Ser接头与第一模块特异性条形码融合。在通过In-Fusion克隆连接之后，维持ScFv与第一模块编码序列之间的Gly/Ser接头。在第三个步骤中，在第一模块编码序列核酸片段的Gly/Ser接头内或附近引入的BamHI位点处消化在步骤2中组装的核酸并且用含有第二模块编码序列的第二核酸片段重复In-Fusion克隆，所述第二模块编码序列与第三Gly/Ser接头连接，所述第三Gly/Ser接头与第二模块特异性条形码融合。类似于步骤2，在通过In-Fusion克隆连接之后，维持第一模块编码序列与第二模块编码序列之间的Gly/Ser接头。在期望更高维度的文库成员的情况下，可以迭代地重复步骤3。在步骤4中，在含有最后添加的模块编码序列的核酸的G1y/Ser接头内或邻近引入的BamHI位点处消化允许末端报告基因序列(例如还含有“终止”信号序列(例如终止密码子)的GFP编码序列)在最后一个模块编码序列与下游多单元条形码序列之间的In-Fusion克隆。在这个实施方案中，每一个所得的文库成员均含有组合的框内CAR和描述组合的框内CAR的构造的组合的条形码。

汇集文库

本公开提供了制备带条形码的合成模块化多肽的汇集文库的方法。汇集文库意指文库成员存在于共同的容器和/或共同的溶液中并且单个文库成员不需要在空间上物理分开，例如单个文库成员可以在构建文库期间(例如在“一锅法组装”中)或在构建单个文库成员之后被汇集。举例来说，在通过组合嵌套组装所构建的汇集的合成模块化多肽文库的情况下，文库的组分可以在组装文库成员期间、在文库成员的组装完成之前和/或在文库成员的组装完成之后等被汇集。如本文所用的汇集文库不限于裸合成模块化多肽的文库，而且还包括表达合成模块化多肽的细胞的汇集文库、编码合成模块化多肽的核酸的汇集文库等。

因此，在一些情况下，用于组装文库成员的单个核酸组分可以在组装之前被汇集并且可以在组装文库成员期间保持汇集。在其他情况下，可以在组装后混合所组装的文库成员以产生汇集文库。

由于本文所述的文库和文库组装方法涉及产生可以通过对相关条形码区进行测序来鉴定的文库成员，因此单个核酸可以在组装之前、期间或之后的任何时间点被汇集，并且在下游测定中对单个文库成员的鉴定和定量仍然是可能的。在一些情况下，文库的最终维度可以通过在组装期间的特定时间点汇集文库组分来操纵。举例来说，混合维度文库可以通过单独组装不同维度的部分文库，随后汇集所述部分文库来获得(例如使用“裂分和汇集(split-and-pool)”组装)。在一些情况下，例如在汇集具有不同维度的部分文库之后，可以进行进一步组装，包括添加另外的可变结构域。

在一个非限制性实施方案中，如图23中所描绘，将编码合成模块化CAR多肽的核酸的汇集文库整体转化到人类原代T细胞中以产生表达合成模块化CAR多肽的原代人类T细胞。任选地，在所编码的合成模块化CAR多肽文库成员包括一个或多个报告蛋白模块的情况下，所转化的T细胞可以基于它们的报告蛋白模块(其用来指示合成模块化CAR多肽的表达)的表达来分选以分离具有合成模块化CAR多肽文库成员的均一表达的转化的细胞。这样的所分选的均一表达的转化的T细胞代表了表达合成模块化CAR多肽的T细胞的汇集文库。

在一些情况下，调节表达合成模块化CAR多肽的核酸和/或原代人类T细胞的转化效率。这样的调节可以出于各种实际原因来进行，例如为了控制文库的每一个成员的表达的可能性和/或为了控制每一个细胞表达最多一个文库成员的可能性。这样的调节可以经由任何方便的方法来实现，包括但不限于例如调节在转化期间存在的编码合成模块化CAR多肽的核酸的初始量、控制在转化期间存在的原代T细胞的初始量、控制在转化期间编码核酸与原代T细胞的比率等。因而，在一些情况下，调节转化效率以使得基本上每一个转导的T细胞表达一种独特的合成模块化CAR多肽。在一些情况下，可以根据下游测定的需要对所得的表达独特的合成模块化CAR多肽的汇集细胞文库进行培养、扩增、储存等。

无论是汇集的核酸、汇集的模块化多肽、汇集的转导细胞等，这样的汇集文库不限于编码合成模块化CAR多肽的核酸、合成模块化CAR多肽或表达合成模块化CAR多肽的细胞(例如T细胞)。根据如本文所述的方法所产生的编码模块化多肽的核酸、模块化多肽和/或经过转导以表达模块化多肽的适当细胞的任何文库可以类似的方式汇集以产生可用于例如筛选测定中的汇集文库。

如本文所述的汇集文库的单个成员可以借助于与每一个文库成员相关的特异性多单元条形码而被阳性鉴定。由于产生每一个模块编码序列与它对应的条形码序列之间的可预测的位置关系的特定组合嵌套组装，因此可以通过简单地对相关的多单元条形码进行测序来重建每一个合成模块化多肽的身份和构造。因而，在一些情况下，合成模块化多肽文库的单个成员的身份和/或构造可以根据与文库成员的条形码区相关的序列信息来确定。举例来说，在一些情况下，如本文所述的汇集文库的复杂性和/或每一个单独的成员可以例如在构建文库之后、在特定测定中使用文库之后等来确定。

隔室化的文库组分

在一些情况下，包含编码区和条形码区的单个核酸成员可以被隔室化。汇集文库和具有隔室化组分的文库不一定是相互排斥的并且例如，在一些情况下，文库可以在不同的时间被汇集并且含有隔室化的组分，例如文库可以被构建，例如文库成员可以被组装成库，例如在一锅法组装中那样，然后可以随后被隔室化，例如通过将核酸文库成员转染到单个细胞或非细胞隔室中来隔室化。在其他情况下，文库成员可以在它们的组装的一部分期间被隔室化，然后被汇集用于进一步处理，包括但不限于例如进一步组装或筛选。一般来说，根据如本文所述的嵌套组装和克隆策略所组装的带条形码的编码合成多肽的核酸被组装成库并且随后可能被隔室化或可能不被隔室化。

组装的带条形码的编码合成多肽的核酸的隔室化可以通过任何方便的方法来实现，从而允许从单个核酸文库成员进行转录和翻译以使得每一个核酸文库成员保持与其编码产物相关。在一些情况下，如下文所更详细描述，隔室化可以经由建立细胞文库来实现，其中单个细胞用作“隔室”并且提供从核酸文库成员的翻译和转录。

在一些情况下，隔室化可以经由建立非细胞文库，例如基于封装的文库来实现。无细胞的基于封装的文库一般将包含两种或更多种不混溶液体的乳液，其中核酸文库成员可溶于第一液体，例如水性液体，如水或水性缓冲液中，并且不可溶于第二液体，例如油或其他有机溶剂中，以使得第一液体形成含有单个文库成员的隔室，例如液滴。含有文库的乳液可以被配置成使得每一个隔室含有任何所期望数目的单个文库成员，包括但不限于每个隔室最多一个成员。封装的文库的核酸成员可以在使得转录产物和翻译产物保持与用于编码它们的单个核酸文库成员相关(即保持在隔室内)的条件下被转录(例如体外转录)和翻译(例如体外翻译)。产生核酸编码的多肽的封装文库的任何方便的和适当的方法可以用于本文所述的方法中，包括但不限于例如Bemath等人，Anal Biochem.(2004)325(1)：151-7中所述的那些；该文献的公开内容以引用的方式整体并入本文。

在隔室内产生文库成员的编码产物之后，核酸文库成员和编码的合成模块化多肽可能物理连接或可能不物理连接。举例来说，在一些情况下，核酸文库成员和编码产物可以连接，例如经由任何方便的和适当的方法连接，包括化学连接或缀合(即在核酸文库成员与编码的合成模块化多肽之间产生共价键)或经由分子结合(例如经由文库成员与编码的合成模块化多肽之间的直接结合或经由通过一种或多种结合中间体(例如结合配偶体、底物等)介导的文库成员与编码产物之间的间接结合)。使隔室化的编码多肽与核酸文库成员连接的任何方便的和适当的方法可以用于本文所述的方法中，包括但不限于例如使用包含特异性结合由核酸文库成员编码的表位标签的连接的表位标签结合剂的底物，例如Griffiths和Tawfik.EMBO J(20030 22(1)：24-35中所述，该文献的公开内容以引用的方式整体并入本文。在一些情况下，在连接之后，可以将核酸文库成员去隔室化，例如汇集，并且作为汇集文库进一步测定。

在一些情况下，核酸文库成员和编码产物保持足够相关而没有物理连接，例如经由隔室化在隔室内，包括细胞隔室和非细胞隔室。

无论是细胞的还是非细胞的，隔室化一般允许经由对编码合成模块化多肽的单个文库成员核酸的条形码区进行测序来鉴定与所检测的表型相关的合成模块化多肽或其部分，所述单个文库成员核酸通过它们的隔室化的性质或由于在它们的隔室化期间所形成的物理连接而保持与合成模块化多肽相关。

细胞文库

如上文略微详细描述，如本文所用的文库包括细胞文库，其中所述文库的细胞表达合成模块化多肽。编码合成模块化多肽的核酸的转化可以通过任何方便的方法来进行，包括但不限于例如病毒转染、电穿孔、脂质体转染、轰击、化学转化、使用可转导的载体(例如可转导的载体蛋白)等。在一些情况下，其中转化有编码合成模块化多肽的核酸的细胞在本文被称为宿主细胞。

宿主细胞可以表达编码独特合成模块化多肽的单个单独的带条形码的核酸或可以表达编码独特合成模块化多肽的多个(包括两个或更多个)单独的带条形码的核酸。应当了解的是，由宿主细胞表达的单独的带条形码的核酸的数目可以被控制，例如通过控制向宿主细胞中递送主题核酸的频率或可能性，例如通过调节递送方法的参数来控制。在一些情况下，存在于宿主细胞中的编码独特合成模块化多肽的单独的带条形码的核酸的所得数目可以被称为感染复数(MOI)并且可以被定义为在递送之前或之后核酸与宿主细胞的比率。可以使用调节MOI的常规方法，例如通过增加或降低在递送之前核酸与宿主细胞的比率，以获得在递送之后每个宿主细胞的编码独特合成模块化多肽的单独的带条形码的核酸的所期望的最终数目。

编码合成模块化多肽的核酸可以被转化到任何适当的宿主细胞或细胞系中，包括例如原核细胞和真核细胞。宿主细胞类型的选择将取决于许多因素，包括待筛选的合成模块化多肽文库的类型和具体的筛选测定。在一些情况下，宿主细胞可以是原核细胞，包括但不限于酸杆菌门(Acidobacteria)、放线菌门(Actinobacteria)、产水菌门(Aquificae)、拟杆菌门(Bacteroidetes)、嗜热丝菌门(Caldiserica)、衣原体门(Chlamydiae)、绿菌门(Chlorobi)、绿弯菌门(Chloroflexi)、产金菌门(Chrysiogenetes)、蓝藻门(Cyanobacteria)、脱铁杆菌门(Deferribacteres)、异常球菌-栖热菌门(Deinococcus-Thermus)、网团菌门(Dictyoglomi)、迷踪菌门(Elusimicrobia)、纤维杆菌门(Fibrobacteres)、厚壁菌门(Firmicutes)、梭杆菌门(Fusobacteria)、芽单胞菌门(Gemmatimonadetes)、黏胶球形菌门(Lentisphaerae)、硝化螺旋菌门(Nitrospirae)、浮霉菌门(Planctomycetes)、变形菌门(Proteobacteria)、螺旋体门(Spirochaetes)、互养菌门(Synergistetes)、软壁菌门(Tenericutes)、热脱硫杆菌门(Thermodesulfobacteria)、热袍菌门(Thermotogae)以及疣微菌门(Vermcomicrobia)。在某些实施方案中，宿主细胞可以是细菌细胞，例如大肠杆菌。在一些情况下，可以使用常规的细菌菌株，包括但不限于例如可商购自诸如美国典型培养物保藏中心(American Type Culture Collection，ATCC)(Manassas，VA)、Life Technologies，Inc.(Grand Island，NY)等的供应商的那些。

合适的真核细胞包括最初源自于包括但不限于例如以下的宿主动物的原代细胞和培养细胞：哺乳动物(包括例如人类、灵长类动物、猿、有蹄类动物、犬科动物、猫科动物、兔、啮齿类动物等)、爬行动物、两栖动物(例如爪蟾、鲵、蝾螈等)、鱼类(例如斑马鱼等)、鸟类(例如鸡等)、无脊椎动物(例如昆虫(例如果蝇等)、蠕虫(例如线虫等)、海洋无脊椎动物(例如海胆等)等)、酵母等。在某些实施方案中，细胞可以是源自于小鼠或大鼠的原代啮齿类动物细胞或培养的啮齿类动物细胞。在其他实施方案中，所述细胞可以是原代人类细胞或培养的人类细胞。任何方便的真核细胞可以用作宿主细胞，这取决于待筛选的具体文库和具体的筛选测定，其中在一些情况下，可以使用常规的真核细胞系，包括但不限于例如可商购自诸如美国典型培养物保藏中心(ATCC)(Manassas，VA)、Life Technologies，Inc.(Grand Island，NY)等的供应商的那些。

在一些情况下，细胞文库的细胞是原代细胞(例如原代单核细胞、原代淋巴细胞(例如原代T细胞、原代B细胞、原代NK细胞等)、原代树突状细胞等)、原代内皮细胞、原代上皮细胞、原代成纤维细胞、原代造血干细胞、原代角质细胞、原代黑素细胞、原代间充质干细胞、原代前脂肪细胞、原代肌细胞(例如原代平滑肌细胞、原代骨骼肌细胞等)等。在一些情况下，细胞文库的细胞是建立的细胞系(例如Jurkat细胞等)。在一些情况下，细胞文库的细胞是患者特异性细胞(患者特异性免疫细胞(例如原代T细胞等)、患者特异性干细胞(例如造血干细胞、间充质干细胞、脂肪来源的干细胞等)、患者特异性癌细胞(例如肿瘤细胞、血癌细胞等))。

合适的哺乳动物细胞包括原代细胞和永生化细胞系。合适的哺乳动物细胞系包括人类细胞系、非人类灵长类动物细胞系、啮齿类动物(例如小鼠、大鼠)细胞系等。合适的哺乳动物细胞系包括但不限于HeLa细胞(例如美国典型培养物保藏中心(ATCC)号CCL-2)、CHO细胞(例如ATCC号CRL9618、CCL61、CRL9096)、293细胞(例如ATCC号CRL-1573)、Vero细胞、NIH 3T3细胞(例如ATCC号CRL-1658)、Huh-7细胞、BHK细胞(例如ATCC号CCL10)、PC12细胞(ATCC号CRL1721)、COS细胞、COS-7细胞(ATCC号CRL1651)、RAT1细胞、小鼠L细胞(ATCC号CCLI.3)、人类胚肾(HEK)细胞(ATCC号CRL1573)、HLHepG2细胞、Hut-78、Jurkat、HL-60、NK细胞系(例如NKL、NK92以及YTS)等。

在一些情况下，所述细胞不是永生化细胞系，但是相反是从个体获得的细胞(例如原代细胞)。举例来说，在一些情况下，所述细胞是从个体获得的免疫细胞。举例来说，所述细胞是从个体获得的T淋巴细胞。作为另一个实例，所述细胞是从个体获得的细胞毒性细胞。作为另一个实例，所述细胞是从个体获得的干细胞或祖细胞。

在编码文库的合成模块化多肽的多个核酸的转化之后，可以将转化的宿主细胞基于它们对合成模块化多肽的表达来分选，例如以从文库中去除不表达合成模块化多肽的那些细胞；以仅分离表达高于特定表达阈值的合成模块化多肽的那些细胞；以仅分离表达低于特定表达阈值的合成模块化多肽的那些细胞；以仅分离表达特定表达范围内的合成模块化多肽的那些细胞等等。在一些情况下，可以基于表达对转化的细胞进行分选以仅分离文库中具有均一表达的那些细胞，其中均一表达可以根据具体应用而变化并且在一些情况下，可以被定义为高于和低于群体的平均表达的特定范围内的表达水平。

在某些实施方案中，将转化的细胞基于它们对文库成员的表达进行分选，例如分选具有文库成员的表达或大致相等表达的细胞允许改进对文库成员和/或其中所含的模块的影响的评价。举例来说，通过仅分离表达限定范围内的文库成员的那些细胞，将文库成员鉴定为影响特定表型将基于文库成员和当中所含的那些模块的实际功能而不是特定文库成员表达得如何。在一些实施方案中，例如在对单个文库成员和/或其模块的出现率进行半定量分析的情况下，分选表达预定范围内的文库成员的细胞允许基于它们对特定表型的影响而不是基于它们的相对表达水平对那些文库成员和/或模块进行更准确的定量分析和定量。

此外，分选允许鉴定当在特定表达范围内或高于或低于特定阈值表达时，包括例如当以低水平表达时或当以高水平表达时，起作用以产生或影响特定表型的文库成员和其模块。

文库归一化

本公开的文库可能被归一化或可能不被归一化，这取决于其中制备文库的背景和/或文库的预期最终用途。如本文关于所述文库所用的“归一化”意指与调整之前每一个文库成员的相对量相比，将每一个文库成员的相对量调整到至少更接近于相等。在一些情况下，文库的归一化产生在文库的最多表示的成员的量与文库的最少表示的成员的量之间具有更小范围的文库。在一些情况下，归一化使得文库的一个或多个最少表示的成员的量增加。在一些情况下，归一化使得文库的一个或多个最多表示的成员的量减少。

在一些情况下，文库归一化可以包括对文库的全部或大部分成员进行定量或代表性抽样(或全部或大部分代表性抽样)以确定文库内每一个文库成员的相对量。在定量后，基于定量进行调整以使文库内文库的每一个成员的相对存在均衡。根据背景，可以在已经产生的文库中直接进行这样的调整以使得所述文库直接归一化。或者，可以在文库制备方法中进行调整以使得下一次制备的文库将被归一化。

本公开的任何文库可以被归一化，包括但不限于例如核酸文库、多肽文库、非细胞封装文库、细胞文库等，并且根据待被归一化的文库，可以利用各种方法。举例来说，根据待被归一化的文库的类型，可以利用对文库成员的相对量进行定量的各种方法。可以利用的对核酸文库的成员进行定量的各种方法包括但不限于例如定量测序(例如下一代测序)、定量PCR、定量杂交(例如微阵列)等。可以利用对多肽文库的成员进行定量的各种方法，包括但不限于例如定量质谱法、ELISA等。可以利用对细胞文库的成员进行定量的各种方法，包括但不限于例如流式细胞术、免疫组织化学、定量测序(例如下一代测序)、定量PCR、定量杂交(例如微阵列)等。

在一些情况下，一旦文库的成员被定量，就可以计算归一化所需的一项或多项调整。可以使用归一化计算的任何方便的和适当的方法，这取决于文库的类型和/或文库的大小。在一些情况下，可以使用线性方程式，包括但不限于例如图28中所示的线性方程式。

在一些情况下，一旦为文库的每一个成员计算了归一化，就可以对文库进行调整。可以使用用于直接调整文库的各种方法。举例来说，在一些情况下，可以使用FACS将细胞文库归一化以将代表文库的每一个成员的相等数量的细胞分选到库中或可单独寻址的隔室中。在一些情况下，在文库已经被隔室化的情况下，可以通过调整每一个隔室的体积来将文库归一化，包括例如其中通过将足以使浓度均衡的特定体积的液体添加到每一个隔室中来将每一个隔室中文库成员的不同浓度归一化。

在一些情况下，可以对汇集的核酸文库进行归一化。可以出于各种原因对汇集的核酸文库进行归一化。在一个实施方案中，可以对汇集的核酸文库进行归一化以补偿文库内单个文库成员的过度表示或表示不足，这是例如由于在组合组装期间特定核酸模块过度高效或低效掺入到文库成员中所导致。

在一些情况下，可以对核酸文库的成员和/或构成文库成员的核酸模块进行定量(例如通过定量测序)。在这样的定量之后，计算归一化所需的对每一个成员的调整。在一个实施方案中，可以将所计算的调整应用于文库的下一次组合组装，例如可以将用于组装核酸文库的每一个核酸模块的量基于所定量的文库中该模块的相对表示加以调整。因此，通过在文库的下一次组装之前调整核酸模块的起始量，所得的组合文库将被归一化。因此，在一些情况下，本文所述的文库的归一化可以包括组装文库，继而对组装的文库进行定量以及基于所述定量重新组装文库的归一化型式。

筛选方法

提供了筛选合成模块化多肽文库的方法，包括但不限于例如体外筛选方法和体内筛选方法。“体内筛选”一般意指在活生物体的生物学背景内测定含有多个独特合成模块化多肽的文库。可以根据本文所述的方法体内测定的活生物体包括单细胞生物体和多细胞生物体。

单细胞生物体的体内筛选一般涉及使单细胞生物体与合成模块化多肽文库接触，其中所述合成模块化多肽文库可以是多肽文库或表达合成模块化多肽的细胞文库；以及在所述单细胞生物体中检测表型。在其他情况下，单细胞生物体的体内筛选可以包括使单细胞生物体或多个单细胞生物体与编码合成模块化多肽的核酸文库在足以使所述单细胞生物体表达编码的合成模块化多肽的条件下接触。

多细胞生物体的体内筛选一般涉及使多细胞生物体与合成模块化多肽文库接触，其中所述合成模块化多肽文库可以是多肽文库或表达合成模块化多肽的细胞文库；以及在所述多细胞生物体中检测表型。在其他情况下，多细胞生物体的体内筛选可以包括使多细胞生物体或多个多细胞生物体与编码合成模块化多肽的核酸文库在足以使所述一个或多个多细胞生物体表达编码的合成模块化多肽的条件下接触。任何方便的多细胞生物体均可以用于如本文所述的文库的体内筛选，这取决于待筛选的具体文库以及所使用的具体体内测定，其中特定多细胞生物体包括但不限于例如哺乳动物(例如小鼠、大鼠等)。

“体外筛选”一般意指在例如文库的多肽模块、用于筛选的生物材料或所筛选的表型的正常生物学背景以外测定含有多个独特合成模块化多肽的文库。举例来说，在一些情况下，体外筛选可以使用人工或合成实验背景来进行，包括但不限于例如分离的样品、分离的细胞、细胞培养物、分离的或解剖的组织、明确的样品、成分明确的培养基、人工组织、人工器官、细胞提取物、组织提取物、样品阵列等。体外筛选可以在任何方便的和适当的容器中进行，包括但不限于例如反应容器、反应室、管、小瓶、板、烧瓶、皿、载片等。

包括细胞样品或非细胞样品在内的样品的体外筛选一般涉及使所述样品与合成模块化多肽文库接触，其中所述合成模块化多肽文库可以是多肽文库或表达合成模块化多肽的细胞文库；以及检测细胞表型或其他反应或分子表型。任何方便的样品均可以用于如本文所述的文库的体外筛选，这取决于待筛选的具体文库和所使用的具体体外测定，其中特定样品包括但不限于例如生物样品、细胞样品、多肽样品、核酸样品、化学样品等。

在一些情况下，可以对无细胞合成模块化多肽文库进行体外筛选。举例来说，可以通过使隔室化的合成模块化多肽文库与预测与文库的单个成员发生反应的一种或多种试剂接触来针对表型筛选隔室化的合成模块化多肽文库。无论是封装还是汇集，筛选无细胞多肽文库的任何方便的方法均可以用于本文所述的方法中，包括但不限于例如在无细胞基于封装的测定中对表型进行基于流式细胞术的检测或基于FACS的检测，例如Griffiths和Tawfik.EMBO J(2003)22(1)：24-35以及Bernath等人，Anal Biochem(2004)325(1)：151-7中所述；这些文献的公开内容以引用的方式整体并入本文。

表型和鉴定方法

无论是体内还是体外，筛选方法一般将涉及检测表型以及鉴定与所述表型相关的一个或多个文库成员。如本文所用的术语“表型”一般指在特定的测定中检测的分子、细胞、组织、器官或生物体的特征并且因此可以包括但不限于例如分子表型、细胞表型、生物体表型、组织表型、器官表型、生物体表型等。在特定测定中检测的表型可以是预定表型，例如已知或预期的表型(例如包括特定特征的已知或预期水平、已知或预期水平的特征的存在或不存在等)，或可以在测定时被鉴定，例如新检测到或先前未确定的表型(例如包括特定特征的新检测到或先前未确定的水平、新检测到或先前未确定的特征的存在或不存在等)。用于检测与如本文所述的合成模块化多肽文库相关的表型的任何方便的测定均可以用于筛选这样的文库。

筛选合成模块化多肽的文库或编码合成模块化多肽的文库的核酸允许鉴定有效产生所期望的表型的多肽和/或其模块部分。因此，本公开一般包括通过筛选本文所述的文库所鉴定的多肽。

在一些情况下，在使细胞群体与如本文所述的文库接触之后检测细胞表型。细胞表型可以包括但不限于例如细胞行为(包括但不限于例如细胞活力、细胞增殖、细胞激活、细胞形态、细胞迁移、细胞粘附、细胞分化、细胞多潜能性等)、细胞表达(包括但不限于例如基因表达、蛋白质表达、非编码RNA表达、基因激活、基因阻遏等)、报告蛋白表达(包括但不限于例如转基因报告蛋白表达、标记表达)等。

在一些情况下，在使组织、器官或生物体与如本文所述的文库接触之后检测组织、器官或生物体的表型。组织表型包括但不限于例如组织活力、组织形态、物理组织特征(包括但不限于例如边界功能、机械强度、弹性等)、组织表达(包括但不限于例如组织基因表达、组织蛋白质表达等)、组织报告蛋白表达(包括但不限于例如转基因报告蛋白表达、标记表达)等。器官表型包括但不限于例如器官外观、器官活力、器官形态、器官功能(包括但不限于例如生物分子(例如酶、代谢物、蛋白质等)产生、滤过、机械功能等)。生物体表型包括但不限于例如生物体外观、生物体活力(例如寿命)、生物体生理学、生物体生育力/繁殖力、生物体行为等。

在一些情况下，可以测定与疾病状态相关的表型，其中所述疾病状态可以是模型化的疾病状态(例如已经被改变或处理以显示特定疾病的特征的细胞、组织或生物体)或可以是临床疾病状态(例如显示疾病特征或被诊断为患有疾病的生物体或源自于其的细胞或组织)。可以在任何方便的水平上测定疾病相关表型，包括但不限于例如细胞水平、组织水平、器官水平、生物体水平。在一些情况下，所测定的疾病表型可以是致病因子本身的表型，包括但不限于例如肿瘤表型、癌细胞表型、自身免疫细胞表型、感染因子(细菌、病毒等)表型等。在其他情况下，所测定的疾病表型可以是受疾病影响或与疾病模型相关的细胞、组织或生物体的表型，这些表型提供了关于疾病存在和/或进展的信息，包括但不限于例如细胞激活(例如免疫细胞激活)、疾病反应(例如免疫应答)、生物标志物、细胞计数、生物体生理学、临床结果等。

在一些情况下，可以在群体水平上对表型进行评估，例如可以评估细胞的群体、评估生物体的群体等等。在一些情况下，在基于群体的表型评估中，可以测量特定文库成员对群体表型的存在或不存在的影响。举例来说，可以评估特定文库成员对细胞群体的细胞表型的影响。在其他情况下，可以评估特定文库成员对生物体群体的生物体表型的影响。

在一些实施方案中，响应于所施加的刺激物评估表型，其中所述刺激物的施加包括但不限于例如使细胞与刺激物接触、使组织与刺激物接触、使器官与刺激物接触、使生物体与刺激物接触等。因而，可以在体外或体内使测试样品或测试受试者与刺激物接触，这取决于所使用的测定、取决于刺激物以及取决于所筛选的特定文库。可以单独或组合使用不同的刺激物。刺激物可以是游离(例如可溶性刺激物、游离配体等)刺激物、结合(例如与固体载体结合)、细胞表达的刺激物(例如表达的共刺激分子、表达的抗原、表达的细胞配体等)等。

在一些实施方案中，在体外使表达合成模块化CAR文库的T细胞群体与刺激物接触并且检测所得的表型。可用于筛选表达合成模块化CAR的细胞文库的体外刺激物一般将是抗原，包括例如游离抗原、结合抗原、细胞表达的抗原(例如在抗原提呈细胞上表达、在靶细胞上表达等)等。有用的抗原将变化，这取决于待筛选的具体CAR文库以及所期望的筛选结果。非限制性示例性抗原包括但不限于例如可溶性抗原、固体载体结合的抗原(例如板结合的抗原、珠粒结合的抗原、载片结合的抗原等)、表达的抗原(例如表达抗原的转基因细胞、天然表达抗原的细胞(例如天然抗原表达细胞、表达癌抗原的癌细胞等)。可用于在体外筛选文库的天然抗原表达细胞将变化并且可以包括但不限于例如初始肿瘤细胞(例如从肿瘤活检中获得)。

在一些实施方案中，在体内使表达合成模块化CAR文库的T细胞群体与刺激物接触并且检测所得的表型。合成模块化CAR文库筛选的体内背景将有很大的不同，并且可以包括但不限于动物模型。在一些情况下，可以在小动物模型，例如像啮齿类动物模型，包括但不限于例如小鼠模型、大鼠模型等中进行体内筛选。在一些情况下，在小鼠肿瘤模型，包括转基因小鼠肿瘤模型和非转基因小鼠肿瘤模型中进行体内筛选。

在一些情况下，所利用的模型可以是异种移植模型。举例来说，所利用的模型可以是“人源化”模型，其中这样的人源化模型被定义为具有一个或多个人类来源的组成部分，例如人源化的免疫系统、人源化的T细胞、表达人类蛋白质、携带人类癌细胞等。因而，人源化模型可以是完全或部分人源化的。在其他情况下，所述模型可能不是完全或部分人源化的，但是可能代之以简单地经由注射或移植而引入有人类细胞或人类组织。举例来说，在一些情况下，将人类癌细胞或人类癌细胞系的细胞引入动物模型中。任何方便的人类肿瘤细胞或人类肿瘤细胞系均可以用于这样的模型中，包括但不限于例如K562细胞、Daudi淋巴瘤细胞等。

动物模型和/或被引入到动物模型中的细胞或组织可能是或可能不是转基因的，例如被修饰以表达一种或多种转基因。举例来说，在一些情况下，动物模型可以被转基因修饰成表达异源基因，例如报告基因(例如以鉴定宿主动物的细胞)、靶基因(例如编码要在体内筛选中靶向的基因产物的基因)。在一些情况下，被引入到动物模型中的细胞可以被转基因修饰成表达异源基因，例如报告基因(例如以鉴定所引入的细胞)、靶基因(例如编码要在体内筛选中靶向的基因产物的基因)。作为非限制性实例，可以根据如本文所述的方法筛选小鼠肿瘤模型，其中将表达癌症靶转基因(例如CD19、间皮素等)的人类肿瘤细胞引入小鼠中。

可以针对任何方便的表型对引入体内系统中的文库成员进行筛选，其中所述表型可能取决于所筛选的具体文库、具体的体内背景(例如动物模型)等。在一些情况下，例如在所述体内系统是动物肿瘤模型的情况下，可以针对与文库成员的肿瘤选择性相关的表型对文库进行筛选，例如通过将文库引入到含有两种不同肿瘤的动物模型中、通过将文库引入到含有表达不同水平的肿瘤抗原的肿瘤的动物模型或多个动物模型中等等。针对表型进行测定的任何方便的方法，包括本文所述的那些细胞和生化/分子方法，可以用于评价体内系统，其中这样的评价一般涉及从动物模型获得生物样品。在一些情况下，可用于评估体内模型的生物样品可以包括组织样品(例如血液、肿瘤等)或器官样品(例如脾脏)。

在一些情况下，可以根据T细胞表型在体外或体内筛选文库。T细胞表型将变化并且将包括受刺激的T细胞表型，即抗原应答。T细胞表型的非限制性实例包括但不限于例如T细胞增殖、细胞因子产生(例如IL-2、IFN-γ、TNF、LT-α、IFN-γ、LT-α、TNF、IL-4、IL-5、IL-6、IL-13、IL-9、IL-10、IL-17A、IL-17F、IL-21、IL-22、IL-26、TNF、CCL20、IL-21、TGF-β、IL-10等)、T细胞表面标志物表达(例如CD3、CD4、CD8等)、T细胞激活标志物(例如CD69等)、细胞内信号转导标志物(例如磷酸化ERK1/2、磷酸化p38MAPK等)等。

T细胞表型可以在体外和体内测定并且可以通过任何方便的方法检测。在一些情况下，可以使用细胞计数器或流式细胞仪来测定T细胞表型，包括例如T细胞增殖和/或T细胞定量。举例来说，可以使用流式细胞术通过细胞示踪染料稀释液来测定T细胞增殖。在一些情况下，还可以通过流式细胞术测定细胞表面标志物的表达。细胞内标志物表达可以通过细胞方法来测定(例如流式细胞术、磷酸化特异性流式细胞术(phosphoflow)、细胞内流式细胞术、免疫荧光、原位杂交、荧光原位杂交等)或可以通过分子和/或生化方法来测定(例如ELISA、细胞因子捕捉、基于扩增的方法(例如定量PCR)、基于测序的方法(例如定量测序)、定量质谱法等)。

在一些情况下，可以针对“自然杀伤”激活表型来测定T细胞。用于评估自然杀伤激活的任何方便的方法都可以用于这样的测定中。举例来说，可以分析T细胞的CD107a/b的表达，例如通过流式细胞术来分析。

在一些情况下，可以针对一种或多种分化表型来测定T细胞。用于评估T细胞分化的任何方便的方法都可以用于这样的测定中。举例来说，可以评估向记忆T细胞的分化，例如经由使用任何方便的细胞或分子/生化方法测定记忆T细胞的标志物(例如Th1、Th2、Th17、Treg等)。在一些情况下，可以评估指示记忆T细胞分化的一种或多种细胞内转录因子的表达(例如Gata3、Tbet、RORyt、FoxP3、Bcl-6、CCR7、CD45RO、CD45RA、CD69等)。

筛选合成模块化CAR多肽的文库或编码合成模块化CAR多肽文库的核酸允许鉴定有效产生所期望的T细胞表型的CAR和/或其部分(例如抗原结合结构域、主要信号转导结构域、共调节结构域等)。因此，本公开包括通过筛选本文所述的文库以及编码这样的CAR的核酸所鉴定的CAR。本公开还包括含有有用的CAR模块(例如抗原结合结构域、主要信号转导结构域、共调节结构域等)的CAR，所述模块是通过筛选本文所述的文库以及编码这样的CAR的核酸来鉴定的。

在一些情况下，本公开的CAR可以包括通过筛选如本文所述的合成模块化CAR多肽或编码合成模块化CAR多肽的核酸的文库而被鉴定为T细胞刺激或T细胞抑制的共调节结构域中的一个或多个。因此，CAR的总T细胞表型可以是刺激T细胞活性或抑制T细胞活性。可以被刺激或抑制的T细胞活性包括但不限于例如本文所述的那些T细胞活性。

在一些情况下，通过筛选文库所鉴定的CAR可以包括表3或表4中所列的至少一个共调节结构域，包括但不限于例如包含与所列的结构域序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％序列同一性的氨基酸序列的共调节结构域。在一些情况下，通过筛选文库所鉴定的CAR可以包括表3和表4中所列的那些的两个或更多个共调节结构域，包括但不限于例如包含与所列的结构域序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％序列同一性的氨基酸序列的共调节结构域。在一些情况下，本公开的CAR可以包括在本文所述的筛选中被鉴定为共刺激结构域的共调节结构域，包括但不限于例如表3中所列的那些，包括但不限于例如包含与所列的结构域序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％序列同一性的氨基酸序列的共调节结构域。在一些情况下，本公开的CAR可以包括在本文所述的筛选中被鉴定为共抑制结构域的共调节结构域，包括但不限于例如表4中所列的那些，包括但不限于例如包含与所列的结构域序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％序列同一性的氨基酸序列的共调节结构域。在一些情况下，包括一个或多个共抑制结构域的CAR可以是iCAR。

在一些情况下，具有两个或更多个共调节结构域的CAR可以包括两个共刺激结构域，包括但不限于例如表3中所列的两个或更多个共刺激结构域。在一些情况下，具有两个或更多个共调节结构域的CAR可以包括两个共抑制结构域，包括但不限于例如表4中所列的两个或更多个共抑制结构域。在一些情况下，具有两个或更多个共调节结构域的CAR可以包括共刺激结构域和共抑制结构域的混合物，包括但不限于表3中所列的至少一个共刺激结构域和表4中所列的至少一个共抑制结构域。

表3：显示出刺激功能的共调节结构域(共刺激结构域)

表4：显示出抑制功能的共调节结构域(共抑制结构域)

通过筛选合成模块化CAR多肽的文库或编码合成模块化CAR多肽的核酸的文库所鉴定的CAR可以包括任何有用的抗原结合结构域，包括但不限于例如临床上用于各种CAR构建体中的那些，包括例如抗BCMA抗原结合结构域、抗CD123抗原结合结构域、抗CD138抗原结合结构域、抗CD171抗原结合结构域、抗CD19抗原结合结构域、抗CD22抗原结合结构域、抗CD30抗原结合结构域、抗CD33抗原结合结构域、抗CD7抗原结合结构域、抗CD70抗原结合结构域、抗CEA抗原结合结构域、抗EGFRvIII抗原结合结构域、抗EPCAM抗原结合结构域、抗EphA2抗原结合结构域、抗ErbB抗原结合结构域、抗FAP抗原结合结构域、抗GD2抗原结合结构域、抗GPC3抗原结合结构域、抗HER2抗原结合结构域、抗IL1RAP抗原结合结构域、抗κ抗原结合结构域、抗LeY抗原结合结构域、抗Meso抗原结合结构域、抗MG7抗原结合结构域、抗MUC1抗原结合结构域、抗NKG2D抗原结合结构域、抗PSCA抗原结合结构域、抗ROR1抗原结合结构域等。

通过筛选合成模块化CAR多肽的文库或编码合成模块化CAR多肽的核酸的文库所鉴定的CAR可以包括任何有用的主要信号转导结构域(在本文也被称为细胞内信号转导结构域)，包括但不限于例如包括一个或多个基于免疫受体酪氨酸的激活基序(ITAM)的那些。

合适的细胞内信号转导结构域可以是源自于含有ITAM基序的多肽的含有ITAM基序的部分。举例来说，合适的细胞内信号转导结构域可以是来自任何含有ITAM基序的蛋白质的含有ITAM基序的结构域。因此，合适的细胞内信号转导结构域不必含有作为它的来源的整个蛋白质的整个序列。合适的含有ITAM基序的多肽的实例包括但不限于：DAP12；FCER1G(Fcε受体Iγ链)；CD3D(CD3δ)；CD3E(CD3ε)；CD3G(CD3γ)；CD3Z(CD3ζ)；以及CD79A(抗原受体复合物相关蛋白α链)。

在一些情况下，细胞内信号转导结构域源自于DAP12(也被称为TYROBP；TYRO蛋白酪氨酸激酶结合蛋白；KARAP；PLOSL；DNAX激活蛋白12；KAR相关蛋白；TYRO蛋白酪氨酸激酶结合蛋白；杀伤激活受体相关蛋白；杀伤激活受体相关蛋白；等)。举例来说，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列(4种亚型)中的任一个具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

或

其中ITAM基序以粗体显示并且加下划线。

同样，合适的细胞内信号转导结构域多肽可以包含全长DAP12氨基酸序列的含有ITAM基序的部分。因此，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

其中ITAM基序以粗体显示并且加下划线。

在一些情况下，细胞内信号转导结构域源自于FCER1G(也被称为FCRG；Fcε受体Iγ链；Fc受体γ链；fc-ε RI-γ；fcRγ；fceRIγ；高亲和力免疫球蛋白ε受体亚基γ；免疫球蛋白E受体高亲和力γ链；等)。举例来说，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

其中ITAM基序以粗体显示并且加下划线。

同样，合适的细胞内信号转导结构域多肽可以包含全长FCER1G氨基酸序列的含有ITAM基序的部分。因此，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

其中ITAM基序以粗体显示并且加下划线。

在一些情况下，细胞内信号转导结构域源自于T细胞表面糖蛋白CD3δ链(也被称为CD3D；CD3-δ；T3D；CD3抗原δ亚基；CD3δ；CD3d抗原6多肽(TiT3复合物)；OKT3，δ链；T细胞受体T3δ链；T细胞表面糖蛋白CD3δ链；等)。举例来说，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列(2种亚型)中的任一个的约100个氨基酸至约110个氨基酸(aa)、约110个氨基酸至约115个氨基酸、约115个氨基酸至约120个氨基酸、约120个氨基酸至约130个氨基酸、约130个氨基酸至约140个氨基酸、约140个氨基酸至约150个氨基酸或约150个氨基酸至约170个氨基酸的连续段具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

其中ITAM基序以粗体显示并且加下划线。

同样，合适的细胞内信号转导结构域多肽可以包含全长CD3δ氨基酸序列的含有ITAM基序的部分。因此，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

其中ITAM基序以粗体显示并且加下划线。

在一些情况下，细胞内信号转导结构域源自于T细胞表面糖蛋白CD3ε链(也被称为CD3e、T细胞表面抗原T3/Leu-4ε链、T细胞表面糖蛋白CD3ε链、AI504783、CD3、CD3ε、T3e等)。举例来说，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列的约100个氨基酸至约110个氨基酸(aa)、约110个氨基酸至约115个氨基酸、约115个氨基酸至约120个氨基酸、约120个氨基酸至约130个氨基酸、约130个氨基酸至约140个氨基酸、约140个氨基酸至约150个氨基酸或约150个氨基酸至约205个氨基酸的连续段具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

其中ITAM基序以粗体显示并且加下划线。

同样，合适的细胞内信号转导结构域多肽可以包含全长CD3ε氨基酸序列的含有ITAM基序的部分。因此，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

其中ITAM基序以粗体显示并且加下划线。

在一些情况下，细胞内信号转导结构域源自于T细胞表面糖蛋白CD3γ链(也被称为CD3G、T细胞受体T3γ链、CD3-γ、T3G、γ多肽(TiT3复合物)等)。举例来说，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列的约100个氨基酸至约110个氨基酸(aa)、约110个氨基酸至约115个氨基酸、约115个氨基酸至约120个氨基酸、约120个氨基酸至约130个氨基酸、约130个氨基酸至约140个氨基酸、约140个氨基酸至约150个氨基酸或约150个氨基酸至约180个氨基酸的连续段具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

其中ITAM基序以粗体显示并且加下划线。

同样，合适的细胞内信号转导结构域多肽可以包含全长CD3γ氨基酸序列的含有ITAM基序的部分。因此，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

其中ITAM基序以粗体显示并且加下划线。

在一些情况下，细胞内信号转导结构域源自于T细胞表面糖蛋白CD3ζ链(也被称为CD3Z、T细胞受体T3ζ链、CD247、CD3-ζ、CD3H、CD3Q、T3Z、TCRZ等)。举例来说，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列(2种亚型)中的任一个的约100个氨基酸至约110个氨基酸(aa)、约110个氨基酸至约115个氨基酸、约115个氨基酸至约120个氨基酸、约120个氨基酸至约130个氨基酸、约130个氨基酸至约140个氨基酸、约140个氨基酸至约150个氨基酸或约150个氨基酸至约160个氨基酸的连续段具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

其中ITAM基序以粗体显示并且加下划线。

同样，合适的细胞内信号转导结构域多肽可以包含全长CD3ζ氨基酸序列的含有ITAM基序的部分。因此，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列中的任一个具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

或

其中ITAM基序以粗体显示并且加下划线。

在一些情况下，细胞内信号转导结构域源自于CD79A(也被称为B细胞抗原受体复合物相关蛋白α链；CD79a抗原(免疫球蛋白相关α)；MB-1膜糖蛋白；ig-α；膜结合免疫球蛋白相关蛋白；表面IgM相关蛋白；等)。举例来说，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列(2种亚型)中的任一个的约100个氨基酸至约110个氨基酸(aa)、约110个氨基酸至约115个氨基酸、约115个氨基酸至约120个氨基酸、约120个氨基酸至约130个氨基酸、约130个氨基酸至约150个氨基酸、约150个氨基酸至约200个氨基酸或约200个氨基酸至约220个氨基酸的连续段具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

或

其中ITAM基序以粗体显示并且加下划线。

同样，合适的细胞内信号转导结构域多肽可以包含全长CD79A氨基酸序列的含有ITAM基序的部分。因此，合适的细胞内信号转导结构域多肽可以包含与以下氨基酸序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

其中ITAM基序以粗体显示并且加下划线。

适用于本公开的CAR中的细胞内信号转导结构域包括DAP10/CD28型信号转导链。

DAP10信号转导链的实例是氨基酸序列：

在一些实施方案中，合适的细胞内信号转导结构域包含与氨基酸序列

的整个长度具有至少约85％、至少约90％、至少约95％、至少约98％或至少约99％的氨基酸序列同一性的氨基酸序列。

CD28信号转导链的实例是氨基酸序列：

适用于本公开的CAR中的细胞内信号转导结构域包括ZAP70多肽，例如包含与以下氨基酸序列的约300个氨基酸至约400个氨基酸、约400个氨基酸至约500个氨基酸或约500个氨基酸至619个氨基酸的连续段具有至少约85％、至少约90％、至少约95％、至少约98％、至少约99％或100％的氨基酸序列同一性的氨基酸序列的多肽：

MPDPAAHLPFFYGSISRAEAEEHLKLAGMADGLFLLRQCLRSLGGYVLSLVHDVRFHHFPIERQLNGTYAIAGGKAHCGPAELCEFYSRDPDGLPCNLRKPCNRPSGLEPQPGVFDCLRDAMVRDYVRQTWKLEGEALEQAIISQAPQVEKLIATTAHERMPWYHSSLTREEAERKLYSGAQTDGKFLLRPRKEQGTYALSLIYGKTVYHYLISQDKAGKYCIPEGTKFDTLWQLVEYLKLKADGLIYCLKEACPNSSASNASGAAAPTLPAHPSTLTHPQRRIDTLNSDGYTPEPARITSPDKPRPMPMDTSVYESPYSDPEELKDKKLFLKRDNLLIADIELGCGNFGSVRQGVYRMRKKQIDVAIKVLKQGTEKADTEEMMREAQIMHQLDNPYIVRLIGVCQAEALMLVMEMAGGGPLHKFLVGKREEIPVSNVAELLHQVSMGMKYLEEKNFVHRDLAARNVLLVNRHYAKISDFGLSKALGADDSYYTARSAGKWPLKWYAPECINFRKFSSRSDVWSYGVTMWEALSYGQKPYKKMKGPEVMAFIEQGKRMECPPECPPELYALMSDCWIYKWEDRPDFLTVEQRMRACYYSLASKVEGPPGSTQKAEAACA(SEQ ID NO：132)。

在一些情况下，通过筛选合成模块化CAR多肽的文库或编码合成模块化CAR多肽的核酸的文库所鉴定的CAR，包括具有表3和表4中所列的共调节结构域中的至少一个或两个或更多个的CAR，可以分成两条多肽链，这两条多肽链可在二聚化剂存在下通过每一条链中存在的二聚化结构域连接。这样的分裂的CAR具有条件性活性和药理学诱导性/阻遏性，例如像PCT专利申请公开WO2014/127261中所述的那些，该申请的公开内容以引用的方式整体并入本文。

因此，在一些情况下，通过筛选如本文所述的文库所鉴定的CAR的分裂CAR型式的每一个多肽可以包括二聚化对(也被称为二聚化剂结合对)的一半。合适的二聚体(例如二聚化剂结合对)的非限制性实例包括但不限于：a)FK506结合蛋白(FKBP)和FKBP；b)FKBP和钙调神经磷酸酶催化亚基A(CnA)；c)FKBP和亲环蛋白；d)FKBP和FKBP-雷帕霉素相关蛋白(FRB)；e)旋转酶B(GyrB)和GyrB；f)二氢叶酸还原酶(DHFR)和DHFR；g)DmrB和DmrB；h)PYL和ABI；i)Cry2和CIB1；以及j)GAI和GID1。

在一些情况下，主题CAR的二聚体(例如二聚化剂结合对)的成员源自于FKBP。举例来说，合适的二聚化剂结合对成员可以包含与以下氨基酸序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：MGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE(SEQ ID NO：78)。

在一些情况下，主题CAR的二聚化剂结合对的成员源自于钙调神经磷酸酶催化亚基A(也被称为PPP3CA；CALN；CALNA；CALNA1；CCN1；CNA1；PPP2B；CAM-PRP催化亚基；钙调神经磷酸酶Aα；钙调蛋白依赖性钙调神经磷酸酶A亚基α亚型；蛋白磷酸酶2B催化亚基α亚型；等)。举例来说，合适的二聚化剂结合对成员可以包含与以下氨基酸序列(PP2Ac结构域)具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：LEESVALRIITEGASILRQEKNLLDIDAPVTVCGDIHGQFFDLMKLFEVGGSPANTRYLFLGDYVDRGYFSIECVLYLWALKILYPKTLFLLRGNHECRHLTEYFTFKQECKIKYSERVYDACMDAFDCLPLAALMNQQFLCVHGGLSPEINTLDDIRKLDRFKEPPAYGPMCDILWSDPLEDFGNEKTQEHFTHNTVRGCSYFYSYPAVCEFLQHNNLLSILRAHEAQDAGVRMYRKSQTTGFPSLITIFSAPNYLDVYNNKAAVLKYENNVMNIRQFNCSPHPYWLPNFM(SEQ ID NO：79)。

在一些情况下，二聚体(例如二聚化剂结合对)的成员源自于亲环蛋白(也被称为亲环蛋白A、PPIA、CYPA、CYPH、PPI酶A等)。举例来说，合适的二聚化剂结合对成员可以包含与以下氨基酸序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：MVNPTVFFDIAVDGEPLGRVSFELFADKVPKTAENFRALSTGEKGFGYKGSCFHRIIPGFMCQGGDFTRHNGTGGKSIYGEKFEDENFILKHTGPGILSMANAGPNTNGSQFFICTAKTEWLDGKHVVFGKVKEGMNIVEAMERFGSRNGKTSKKITIADCGQLE(SEQ ID NO：80)。

在一些情况下，二聚体(例如二聚化剂结合对)的成员源自于MTOR(也被称为FKBP-雷帕霉素相关蛋白；FK506结合蛋白12-雷帕霉素相关蛋白1；FK506结合蛋白12-雷帕霉素相关蛋白2；FK506结合蛋白12-雷帕霉素复合物相关蛋白1；FRAP；FRAP1；FRAP2；RAFT1；以及RAPT1)。举例来说，合适的二聚化剂结合对成员可以包含与以下氨基酸序列(也被称为“Frb”：Fkbp-雷帕霉素结合结构域)具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：MILWHEMWHEGLEEASRIYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISK(SEQ ID NO：81)。

在一些情况下，二聚体(例如二聚化剂结合对)的成员源自于GyrB(也被称为DNA旋转酶亚基B)。举例来说，合适的二聚化剂结合对成员可以包含与来自大肠杆菌的以下GyrB氨基酸序列的约100个氨基酸至约200个氨基酸(aa)、约200个氨基酸至约300个氨基酸、约300个氨基酸至约400个氨基酸、约400个氨基酸至约500个氨基酸、约500个氨基酸至约600个氨基酸、约600个氨基酸至约700个氨基酸或约700个氨基酸至约800个氨基酸的连续段(或与来自任何生物体的DNA旋转酶亚基B序列)具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

MSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALAGHCKEIIVTIHADNSVSVQDDGRGIPTGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGVSVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVTGETEKTGTMVRFWPSLETFTNVTEFEYEILAKRLRELSFLNSGVSIRLRDKRDGKEDHFHYEGGIKAFVEYLNKNKTPIHPNIFYFSTEKDGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRTLNAYMDKEGYSKKAKVSATGDDAREGLIAVVSVKVPDPKFSSQTKDKLVSSEVKSAVEQQMNELLAEYLLENPTDAKIVVGKIIDAARAREAARRAREMTRRKGALDLAGLPGKLADCQERDPALSELYLVEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATLITALGCGIGRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHVYIAQPPLYKVKKGKQEQYIKDDEAMDQYQISIALDGATLHTNASAPALAGEALEKLVSEYNATQKMINRMERRYPKAMLKELIYQPTLTEADLSDEQTVTRWVNALVSELNDKEQHGSQWKFDVHTNAEQNLFEPIVRVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLEEDAFIERGERRQPVASFEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRRMLRVTVKDAIAADQLFTTLMGDAVEPRRAFIEENALKAANIDI(SEQ ID NO：82)。在一些情况下，二聚化剂结合对的成员包含与来自大肠杆菌的上列GyrB氨基酸序列的氨基酸1-220具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列。

在一些情况下，二聚体(例如二聚化剂结合对)的成员源自于DHFR(也被称为二氢叶酸还原酶、DHFRP1以及DYR)。举例来说，合适的二聚化剂结合对成员可以包含与以下氨基酸序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：MVGSLNCIVAVSQNMGIGKNGDLPWPPLRNEFRYFQRMTTTSSVEGKQNLVIMGKKTWFSIPEKNRPLKGRINLVLSRELKEPPQGAHFLSRSLDDALKLTEQPELANKVDMVWIVGGSSVYKEAMNHPGHLKLFVTRIMQDFESDTFFPEIDLEKYKLLPEYPGVLSDVQEEKGIKYKFEVYEKND(SEQID NO：83)。

在一些情况下，二聚体(例如二聚化剂结合对)的成员源自于DmrB结合结构域(即DmrB同二聚化结构域)。举例来说，合适的二聚化剂结合对成员可以包含与以下氨基酸序列具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：MASRGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE(SEQ ID NO：84)。

在一些情况下，二聚体(例如二聚化剂结合对)的成员源自于PYL蛋白(也被称为脱落酸受体和RCAR)。举例来说，主题二聚化剂结合对的成员可以源自于诸如拟南芥(Arabidopsis thaliana)的那些的蛋白质：PYR1、RCAR1(PYL9)、PYL1、PYL2、PYL3、PYL4、PYL5、PYL6、PYL7、PYL8(RCAR3)、PYL10、PYL11、PYL12、PYL13。举例来说，合适的二聚化剂结合对成员可以包含与以下氨基酸序列中的任一个具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

PYL10：

MNGDETKKVESEYIKKHHRHELVESQCSSTLVKHIKAPLHLVWSIVRRFDEPQKYKPFISRCVVQGKKLEVGSVREVDLKSGLPATKSTEVLEILDDNEHILGIRIVGGDHRLKNYSSTISLHSETIDGKTGTLAIESFVVDVPEGNTKEETCFFVEALIQCNLNSLADVTERLQAESMEKKI(SEQ ID NO：85)。

PYL11：

METSQKYHTCGSTLVQTIDAPLSLVWSILRRFDNPQAYKQFVKTCNLSSGDGGEGSVREVTVVSGLPAEFSRERLDELDDESHVMMISIIGGDHRLVNYRSKTMAFVAADTEEKTVVVESYVVDVPEGNSEEETTSFADTIVGFNLKSLAKLSERVAHLKL(SEQ ID NO：86)。

PYL12：

MKTSQEQHVCGSTVVQTINAPLPLVWSILRRFDNPKTFKHFVKTCKLRSGDGGEGSVREVTVVSDLPASFSLERLDELDDESHVMVISIIGGDHRLVNYQSKTTVFVAAEEEKTVVVESYVVDVPEGNTEEETTLFADTIVGCNLRSLAKLSEKMMELT(SEQ ID NO：87)。

PYL13：

MESSKQKRCRSSVVETIEAPLPLVWSILRSFDKPQAYQRFVKSCTMRSGGGGGKGGEGKGSVRDVTLVSGFPADFSTERLEELDDESHVMVVSIIGGNHRLVNYKSKTKVVASPEDMAKKTVVVESYVVDVPEGTSEEDTIFFVDNIIRYNLTSLAKLTKKMMK(SEQ ID NO：88)。

PYL1：

MANSESSSSPVNEEENSQRISTLHHQTMPSDLTQDEFTQLSQSIAEFHTYQLGNGRCSSLLAQRIHAPPETVWSVVRRFDRPQIYKHFIKSCNVSEDFEMRVGCTRDVNVISGLPANTSRERLDLLDDDRRVTGFSITGGEHRLRNYKSVTTVHRFEKEEEEERIWTVVLESYVVDVPEGNSEEDTRLEADTVIRLNLQKLASITEAMNRNNNNNNSSQVR(SEQ ID NO：89)。

PYL2：

MSSSPAVKGLTDEEQKTLEPVIKTYHQFEPDPTTCTSLITQRIHAPASVVWPLIRRFDNPERYKHFVKRCRLISGDGDVGSVREVTVISGLPASTSTERLEFVDDDHRVLSFRVVGGEHRLKNYKSVTSVNEFLNQDSGKVYTVVLESYTVDIPEGNTEEDTKMFVDTVVKLNLQKLGVAATSAPMHDDE(SEQ ID NO：90)。

PYL3：

MNLAPIHDPSSSSTTTTSSSTPYGLTKDEFSTLDSIIRTHHTFPRSPNTCTSLIAHRVDAPAHAIWRFVRDFANPNKYKHFIKSCTIRVNGNGIKEIKVGTIREVSVVSGLPASTSVEILEVLDEEKRILSFRVLGGEHRLNNYRSVTSVNEFVVLEKDKKKRVYSVVLESYIVDIPQGNTEEDTRMFVDTVVKSNLQNLAVISTASPT(SEQ ID NO：91)。

PYL4：

MLAVHRPSSAVSDGDSVQIPMMIASFQKRFPSLSRDSTAARFHTHEVGPNQCCSAVIQEISAPISTVWSVVRRFDNPQAYKHFLKSCSVIGGDGDNVGSLRQVHVVSGLPAASSTERLDILDDERHVISFSVVGGDHRLSNYRSVTTLHPSPISGTVVVESYVVDVPPGNTKEETCDFVDVIVRCNLQSLAKIAENTAAESKKKMSL(SEQ ID NO：92)。

PYL5：

MRSPVQLQHGSDATNGFHTLQPHDQTDGPIKRVCLTRGMHVPEHVAMHHTHDVGPDQCCSSVVQMIHAPPESVWALVRRFDNPKVYKNFIRQCRIVQGDGLHVGDLREVMVVSGLPAVSSTERLEILDEERHVISFSVVGGDHRLKNYRSVTTLHASDDEGTVVVESYIVDVPPGNTEEETLSFVDTIVRCNLQSLARSTNRQ(SEQ ID NO：93)。

PYL6：

MPTSIQFQRSSTAAEAANATVRNYPHHHQKQVQKVSLTRGMADVPEHVELSHTHVVGPSQCFSVVVQDVEAPVSTVWSILSRFEHPQAYKHFVKSCHVVIGDGREVGSVREVRVVSGLPAAFSLERLEIMDDDRHVISFSVVGGDHRLMNYKSVTTVHESEEDSDGKKRTRVVESYVVDVPAGNDKEETCSFADTIVRCNLQSLAKLAENTSKFS(SEQID NO：94)。

PYL7：

MEMIGGDDTDTEMYGALVTAQSLRLRHLHHCRENQCTSVLVKYIQAPVHLVWSLVRRFDQPQKYKPFISRCTVNGDPEIGCLREVNVKSGLPATTSTERLEQLDDEEHILGINIIGGDHRLKNYSSILTVHPEMIDGRSGTMVMESFVVDVPQGNTKDDTCYFVESLIKCNLKSLACVSERLAAQDITNSIATFCNASNGYREKNHTETNL(SEQ IDNO：95)。

PYL8：

MEANGIENLTNPNQEREFIRRHHKHELVDNQCSSTLVKHINAPVHIVWSLVRRFDQPQKYKPFISRCVVKGNMEIGTVREVDVKSGLPATRSTERLELLDDNEHILSIRIVGGDHRLKNYSSIISLHPETIEGRIGTLVIESFVVDVPEGNTKDETCYFVEALIKCNLKSLADISERLAVQDTTESRV(SEQ ID NO：96)。

PYL9：

MMDGVEGGTAMYGGLETVQYVRTHHQHLCRENQCTSALVKHIKAPLHLVWSLVRRFDQPQKYKPFVSRCTVIGDPEIGSLREVNVKSGLPATTSTERLELLDDEEHILGIKIIGGDHRLKNYSSILTVHPEIIEGRAGTMVIESFVVDVPQGNTKDETCYFVEALIRCNLKSLADVSERLASQDITQ(SEQ ID NO：97)。

PYR1：

MPSELTPEERSELKNSIAEFHTYQLDPGSCSSLHAQRIHAPPELVWSIVRRFDKPQTYKHFIKSCSVEQNFEMRVGCTRDVIVISGLPANTSTERLDILDDERRVTGFSIIGGEHRLTNYKSVTTVHRFEKENRIWTVVLESYVVDMPEGNSEDDTRMFADTVVKLNLQKLATVAEAMARNSGDGSGSQVT(SEQ ID NO：98)。

在一些情况下，二聚体(例如二聚化剂结合对)的成员源自于ABI蛋白(也被称为脱落酸不敏感蛋白)。举例来说，主题二聚化剂结合对的成员可以源自于诸如拟南芥的那些的蛋白质：ABI1(也被称为脱落酸不敏感蛋白1、蛋白磷酸酶2C 56、AtPP2C56、P2C56以及PP2CABI1)和/或ABI2(也被称为P2C77、蛋白磷酸酶2C 77、AtPP2C77、脱落酸不敏感蛋白2、蛋白磷酸酶2C ABI2以及PP2C ABI2)。举例来说，合适的二聚化剂结合对成员可以包含与以下氨基酸序列中的任一个的约100个氨基酸至约110个氨基酸(aa)、约110个氨基酸至约115个氨基酸、约115个氨基酸至约120个氨基酸、约120个氨基酸至约130个氨基酸、约130个氨基酸至约140个氨基酸、约140个氨基酸至约150个氨基酸、约150个氨基酸至约160个氨基酸、约160个氨基酸至约170个氨基酸、约170个氨基酸至约180个氨基酸、约180个氨基酸至约190个氨基酸或约190个氨基酸至约200个氨基酸的连续段具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

ABI1：

MEEVSPAIAGPFRPFSETQMDFTGIRLGKGYCNNQYSNQDSENGDLMVSLPETSSCSVSGSHGSESRKVLISRINSPNLNMKESAAADIVVVDISAGDEINGSDITSEKKMISRTESRSLFEFKSVPLYGFTSICGRRPEMEDAVSTIPRFLQSSSGSMLDGRFDPQSAAHFFGVYDGHGGSQVANYCRERMHLALAEEIAKEKPMLCDGDTWLEKWKKALFNSFLRVDSEIESVAPETVGSTSVVAVVFPSHIFVANCGDSRAVLCRGKTALPLSVDHKPDREDEAARIEAAGGKVIQWNGARVFGVLAMSRSIGDRYLKPSIIPDPEVTAVKRVKEDDCLILASDGVWDVMTDEEACEMARKRILLWHKKNAVAGDASLLADERRKEGKDPAAMSAAEYLSKLAIQRGSKDNISVVVVDLKPRRKLKSKPLN(SEQ ID NO：99)。

ABI2：

MDEVSPAVAVPFRPFTDPHAGLRGYCNGESRVTLPESSCSGDGAMKDSSFEINTRQDSLTSSSSAMAGVDISAGDEINGSDEFDPRSMNQSEKKVLSRTESRSLFEFKCVPLYGVTSICGRRPEMEDSVSTIPRFLQVSSSSLLDGRVTNGFNPHLSAHFFGVYDGHGGSQVANYCRERMHLALTEEIVKEKPEFCDGDTWQEKWKKALFNSFMRVDSEIETVAHAPETVGSTSVVAVVFPTHIFVANCGDSRAVLCRGKTPLALSVDHKPDRDDEAARIEAAGGKVIRWNGARVFGVLAMSRSIGDRYLKPSVIPDPEVTSVRRVKEDDCLILASDGLWDVMTNEEVCDLARKRILLWHKKNAMAGEALLPAEKRGEGKDPAAMSAAEYLSKMALQKGSKDNISVVVVDLKGIRKFKSKSLN(SEQ ID NO：100)。

在一些情况下，二聚体(例如二聚化剂结合对)的成员源自于Cry2蛋白(也被称为隐花色素2)。举例来说，主题二聚体(例如二聚化剂结合对)的成员可以源自于来自任何生物体(例如植物)的Cry2蛋白，诸如但不限于拟南芥的那些。举例来说，合适的二聚化剂结合对成员可以包含与以下氨基酸序列中的任一个的约100个氨基酸至约110个氨基酸(aa)、约110个氨基酸至约115个氨基酸、约115个氨基酸至约120个氨基酸、约120个氨基酸至约130个氨基酸、约130个氨基酸至约140个氨基酸、约140个氨基酸至约150个氨基酸、约150个氨基酸至约160个氨基酸、约160个氨基酸至约170个氨基酸、约170个氨基酸至约180个氨基酸、约180个氨基酸至约190个氨基酸或约190个氨基酸至约200个氨基酸的连续段具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

Cry2(拟南芥)

MKMDKKTIVWFRRDLRIEDNPALAAAAHEGSVFPVFIWCPEEEGQFYPGRASRWWMKQSLAHLSQSLKALGSDLTLIKTHNTISAILDCIRVTGATKVVFNHLYDPVSLVRDHTVKEKLVERGISVQSYNGDLLYEPWEIYCEKGKPFTSFNSYWKKCLDMSIESVMLPPPWRLMPITAAAEAIWACSIEELGLENEAEKPSNALLTRAWSPGWSNADKLLNEFIEKQLIDYAKNSKKVVGNSTSLLSPYLHFGEISVRHVFQCARMKQIIWARDKNSEGEESADLFLRGIGLREYSRYICFNFPFTHEQSLLSHLRFFPWDADVDKFKAWRQGRTGYPLVDAGMRELWATGWMHNRIRVIVSSFAVKFLLLPWKWGMKYFWDTLLDADLECDILGWQYISGSIPDGHELDRLDNPALQGAKYDPEGEYIRQWLPELARLPTEWIHHPWDAPLTVLKASGVELGTNYAKPIVDIDTARELLAKAISRTREAQIMIGAAPDEIVADSFEALGANTIKEPGLCPSVSSNDQQVPSAVRYNGSKRVKPEEEEERDMKKSRGFDERELFSTAESSSSSSVFFVSQSCSLASEGKNLEGIQDSSDQITTSLGKNGCK(SEQ ID NO：101)。

在一些情况下，二聚体(例如二聚化剂结合对)的成员源自于CIB1拟南芥蛋白(也被称为转录因子bHLH63)。举例来说，合适的二聚体(例如二聚化剂结合对)成员可以包含与以下氨基酸序列的约100个氨基酸至约110个氨基酸(aa)、约110个氨基酸至约115个氨基酸、约115个氨基酸至约120个氨基酸、约120个氨基酸至约130个氨基酸、约130个氨基酸至约140个氨基酸、约140个氨基酸至约150个氨基酸、约150个氨基酸至约160个氨基酸、约160个氨基酸至约170个氨基酸、约170个氨基酸至约180个氨基酸、约180个氨基酸至约190个氨基酸或约190个氨基酸至约200个氨基酸的连续段具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

MNGAIGGDLLLNFPDMSVLERQRAHLKYLNPTFDSPLAGFFADSSMITGGEMDSYLSTAGLNLPMMYGETTVEGDSRLSISPETTLGTGNFKKRKFDTETKDCNEKKKKMTMNRDDLVEEGEEEKSKITEQNNGSTKSIKKMKHKAKKEENNFSNDSSKVTKELEKTDYIHVRARRGQATDSHSIAERVRREKISERMKFLQDLVPGCDKITGKAGMLDEIINYVQSLQRQIEFLSMKLAIVNPRPDFDMDDIFAKEVASTPMTVVPSPEMVLSGYSHEMVHSGYSSEMVNSGYLHVNPMQQVNTSSDPLSCFNNGEAPSMWDSHVQNLYGNLGV(SEQ ID NO：102)。

在一些情况下，二聚体(例如二聚化剂结合对)的成员源自于GAI拟南芥蛋白(也被称为赤霉酸不敏感蛋白和DELLA蛋白GAI)。举例来说，合适的二聚化剂结合对成员可以包含与以下氨基酸序列的约100个氨基酸至约110个氨基酸(aa)、约110个氨基酸至约115个氨基酸、约115个氨基酸至约120个氨基酸、约120个氨基酸至约130个氨基酸、约130个氨基酸至约140个氨基酸、约140个氨基酸至约150个氨基酸、约150个氨基酸至约160个氨基酸、约160个氨基酸至约170个氨基酸、约170个氨基酸至约180个氨基酸、约180个氨基酸至约190个氨基酸或约190个氨基酸至约200个氨基酸的连续段具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

MKRDHHHHHHQDKKTMMMNEEDDGNGMDELLAVLGYKVRSSEMADVAQKLEQLEVMMSNVQEDDLSQLATETVHYNPAELYTWLDSMLTDLNPPSSNAEYDLKAIPGDAILNQFAIDSASSSNQGGGGDTYTTNKRLKCSNGVVETTTATAESTRHVVLVDSQENGVRLVHALLACAEAVQKENLTVAEALVKQIGFLAVSQIGAMRKVATYFAEALARRIYRLSPSQSPIDHSLSDTLQMHFYETCPYLKFAHFTANQAILEAFQGKKRVHVIDFSMSQGLQWPALMQALALRPGGPPVFRLTGIGPPAPDNFDYLHEVGCKLAHLAEAIHVEFEYRGFVANTLADLDASMLELRPSEIESVAVNSVFELHKLLGRPGAIDKVLGVVNQIKPEIFTVVEQESNHNSPIFLDRFTESLHYYSTLFDSLEGVPSGQDKVMSEVYLGKQICNVVACDGPDRVERHETLSQWRNRFGSAGFAAAHIGSNAFKQASMLLALFNGGEGYRVEESDGCLMLGWHTRPLIATSAWKLSTN(SEQ ID NO：103)。

在一些情况下，二聚体(例如二聚化剂结合对)的成员源自于GID1拟南芥蛋白(也被称为赤霉素受体GID1)。举例来说，合适的二聚体成员可以包含与以下氨基酸序列中的任一个的约100个氨基酸至约110个氨基酸(aa)、约110个氨基酸至约115个氨基酸、约115个氨基酸至约120个氨基酸、约120个氨基酸至约130个氨基酸、约130个氨基酸至约140个氨基酸、约140个氨基酸至约150个氨基酸、约150个氨基酸至约160个氨基酸、约160个氨基酸至约170个氨基酸、约170个氨基酸至约180个氨基酸、约180个氨基酸至约190个氨基酸或约190个氨基酸至约200个氨基酸的连续段具有至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约98％或100％的氨基酸序列同一性的氨基酸序列：

GID1A：

MAASDEVNLIESRTVVPLNTWVLISNFKVAYNILRRPDGTFNRHLAEYLDRKVTANANPVDGVFSFDVLIDRRINLLSRVYRPAYADQEQPPSILDLEKPVDGDIVPVILFFHGGSFAHSSANSAIYDTLCRRLVGLCKCVVVSVNYRRAPENPYPCAYDDGWIALNWVNSRSWLKSKKDSKVHIFLAGDSSGGNIAHNVALRAGESGIDVLGNILLNPMFGGNERTESEKSLDGKYFVTVRDRDWYWKAFLPEGEDREHPACNPFSPRGKSLEGVSFPKSLVVVAGLDLIRDWQLAYAEGLKKAGQEVKLMHLEKATVGFYLLPNNNHFHNVMDEISAFVNAEC(SEQ ID NO：104)。

GID1B：

MAGGNEVNLNECKRIVPLNTWVLISNFKLAYKVLRRPDGSFNRDLAEFLDRKVPANSFPLDGVFSFDHVDSTTNLLTRIYQPASLLHQTRHGTLELTKPLSTTEIVPVLIFFHGGSFTHSSANSAIYDTFCRRLVTICGVVVVSVDYRRSPEHRYPCAYDDGWNALNWVKSRVWLQSGKDSNVYVYLAGDSSGGNIAHNVAVRATNEGVKVLGNILLHPMFGGQERTQSEKTLDGKYFVTIQDRDWYWRAYLPEGEDRDHPACNPFGPRGQSLKGVNFPKSLVVVAGLDLVQDWQLAYVDGLKKTGLEVNLLYLKQATIGFYFLPNNDHFHCLMEELNKFVHSIEDSQSKSSPVLLTP(SEQ ID NO：105)

GID1C：

MAGSEEVNLIESKTVVPLNTWVLISNFKLAYNLLRRPDGTFNRHLAEFLDRKVPANANPVNGVFSFDVIIDRQTNLLSRVYRPADAGTSPSITDLQNPVDGEIVPVIVFFHGGSFAHSSANSAIYDTLCRRLVGLCGAVVVSVNYRRAPENRYPCAYDDGWAVLKWVNSSSWLRSKKDSKVRIFLAGDSSGGNIVHNVAVRAVESRIDVLGNILLNPMFGGTERTESEKRLDGKYFVTVRDRDWYWRAFLPEGEDREHPACSPFGPRSKSLEGLSFPKSLVVVAGLDLIQDWQLKYAEGLKKAGQEVKLLYLEQATIGFYLLPNNNHFHTVMDEIAAFVNAECQ(SEQ ID NO：106)。

如将容易了解的那样，通过筛选编码合成模块化CAR多肽的核酸的文库或合成模块化CAR多肽的文库所鉴定的CAR可以被修饰，例如通过添加一个或多个结构域(例如共调节结构域)、通过去除一个或多个结构域(例如去除筛选程序中所利用的荧光报告蛋白)、通过使CAR分成两个多肽(并且添加二聚化结构域)、通过重排结构域等。

在一些情况下，可以针对与对特定细胞环境的细胞反应相关的表型对文库进行筛选。因而，细胞表型可以通过细胞对暴露于特定环境的反应(例如激活或抑制)来定义。举例来说，可以根据对特定细胞环境的暴露来评估T细胞反应。在一些实施方案中，可以响应于暴露于肿瘤微环境来评估T细胞抑制。

在一些情况下，可以针对与细胞定位相关的表型来对文库进行筛选，所述细胞定位例如受归巢或细胞靶向的影响。因而，可以筛选文库成员对细胞靶向的影响。举例来说，可以将细胞文库引入宿主生物体中，并且可以在一段时间之后从宿主生物体的靶向位置回收文库细胞以评估哪些细胞成功地被引导到靶向位置。在一些情况下，可以测定T细胞在体内对肿瘤的靶向。

在一些情况下，可以针对患者特异性病况的表型对文库进行筛选。以这种方式筛选的患者特异性病况将会有很大的不同并且可以包括与患者的特定疾病状态相关的病况并且涉及筛选文库以鉴定显示患者特异性病况的增加或最佳表型的一个或多个特定文库成员。在一些情况下，可以在暴露于源自于患者的外植体或异种移植物之后评估细胞文库成员的定位。举例来说，可以在暴露于患者特异性肿瘤异种移植物之后评估表达CAR的细胞T细胞文库的T细胞定位。在一些情况下，可以在暴露于源自于患者的外植体或异种移植物之后评估细胞文库成员的增殖。举例来说，可以在暴露于患者特异性肿瘤异种移植物之后评估表达CAR的细胞T细胞文库的T细胞增殖。在一些情况下，可以在暴露于细胞文库或特定细胞文库成员之后测定患者特异性外植体或异种移植物的活力的增加或降低。举例来说，可以在暴露于患者特异性肿瘤异种移植物之后评估表达CAR的细胞T细胞文库的T细胞杀伤。因而，可以筛选文库以鉴定一个或多个最佳的文库成员以治疗特定的患者。

在一些情况下，可以在体外通过动态抗原攻击来测定表型。动态抗原攻击意指不仅仅是在存在或不存在抗原的情况下评估表型，并且因此，抗原可以动态变化，例如在一定的浓度范围内动态变化、在一定的时间范围内动态变化等等。举例来说，可以滴定(例如通过各种浓度)抗原水平以在各种剂量下评估筛选表型，即评估剂量反应。抗原可以通过任何方便的手段以不同的浓度提呈。作为非限制性实例，不同量的抗原可以使用以不同水平(包括一定范围的水平)表达抗原的细胞来提呈。在一些情况下，施加抗原的时间可以动态变化，例如以在时间点测定中评估表型或评估所筛选的表型的动力学。

在一些情况下，可以针对表型特征对文库进行筛选。如本文所用的术语“表型特征”一般指单个表型的组合。举例来说，在一些情况下，细胞可以具有包括特定形态与特定标志物的表达的组合的表型特征。表型特征可以组合来自相似或不同的表型类别的表型，例如，表型特征可以包括两种相关的但是不同的细胞表面标志物的表达或表型特征可以包括细胞表面标志物和细胞增殖标志物的表达或表型特征可以包括细胞表面标志物和特定分泌标志物(例如细胞因子)的表达或表型特征可以包括两种不同细胞因子的表达等等。任何方便的表型，包括本文所述的那些，都可以用作表型特征的组成部分。

鉴定表型相关合成模块多肽

本公开包括鉴定与特定检测表型相关的文库成员的方法。不受理论所束缚，每一个多模块合成多肽连同每一个相应的多单元条形码的协调组装允许组装和随后鉴定每一个独特的合成模块多肽。如上文所述，每一个编码合成模块化多肽的核酸的条形码区不仅提供了构成每一个合成模块化多肽的单个模块的身份，而且还提供了模块的特定排列(在本文被称为构造)。因而，每一个文库成员的身份和构造可以通过对条形码区进行测序来确定。

因此，文库筛选不需要使用物理分开的文库成员来进行并且文库成员可以“被汇集”并且同时筛选。文库成员的汇集可以在体外进行，例如在试管中或在相关生物体外部的细胞样品中，或在体内在动物或组织中进行。在同时筛选之后，可以通过鉴定和/或定量相关的条形码区来鉴定表型相关文库成员和/或其模块。在一些情况下，汇集筛选允许筛选大量的独特文库成员，这在常规的顺序或平行筛选中是不实际的。可以针对表型筛选的独特文库成员的数目将取决于文库的大小和复杂性并且因此可以变化，但是可以在96个或更少个至数百万个或更多个的范围内，包括但不限于例如100个或更多个、200个或更多个、300个或更多个、400个或更多个、500个或更多个、1000个或更多个、2000个或更多个、3000个或更多个、4000个或更多个、5000个或更多个、6000个或更多个、7000个或更多个、8000个或更多个、9000个或更多个、10,000个或更多个、20,000个或更多个、30,000个或更多个、40,000个或更多个、50,000个或更多个、60,000个或更多个、70,000个或更多个、80,000个或更多个、90,000个或更多个、100,000个或更多个等。

在一些情况下，可以测量特定条形码的量或出现率以鉴定高度表示的模块。举例来说，可以从含有文库成员和编码文库成员的相关核酸的汇集样品中对每一个条形码的出现率进行定量以使得具有最高出现率的条形码鉴定所述样品中最高表示的那些模块。在某些实施方案中，这样的样品可以是细胞样品。

在一些情况下，可以测量特定多单元条形码(例如条形码区)的量或出现率以鉴定高度表示的模块化多肽。举例来说，可以从含有文库成员和编码文库成员的相关核酸的汇集样品中对每一个多单元条形码的出现率进行定量以使得具有最高出现率的多单元条形码鉴定所述样品中最高表示的那些模块化多肽。在某些实施方案中，这样的样品可以是细胞样品。

在一些情况下，对表型的检测以及对文库成员和它们的组分的鉴定可以作为集成方法的一部分进行。举例来说，在一些情况下，可以通过流式细胞术检测表型并且可以通过测序来鉴定文库成员。这样的集成方法可以结合体外测定和/或体内测定来进行，例如图24中所描绘，其中使用FLOW-Seq作为集成方法的非限制性实例。

如本文所用的术语“FLOW-seq”一般指分选流式细胞术方法(例如FACS)与测序方法(例如下一代测序)在单链接工作流程中的组合。分选流式细胞术的任何方便的和适当的方法以及任何方便的和适当的测序方法可以用于这样的FLOW-Seq方法中。举例来说，在一些情况下，可以通过流式细胞术针对表型测定表达如本文所述的带条形码的合成模块化多肽的细胞文库并且可以分选具有特定表型的那些细胞并且随后对它们的条形码进行测序以鉴定特定的文库成员和/或定量在分选的细胞中出现的特定文库成员和/或其模块的出现率。分选可以通过任何方便的和适当的方式进行，包括例如基于流式细胞术检测的表型分选到一个或多个级别中。在分选后，可以直接对分选的样品和/或分选的细胞进行测序或可以在分选之前扩增和/或培养分选的样品和/或分选的细胞，例如以增加编码文库成员的核酸的拷贝。FLOW-seq方法已经用于例如在细菌中对蛋白质水平进行表型测量以及鉴定相关的遗传元件(参见例如Kosuri等人，Proc Natl Acad Sci USA(2013)110(34)：14024-9以及Goodman等人，Science(2013)342(6157)：475-479)，此外，测序与FACS的联用也已经进行以使基于功能分选的T细胞与它们对应的经过测序的T细胞受体基因相关联(参见例如Han等人，Nature Biotechnology(2014)32：684-692)。

在一些情况下，对与特定表型相关的合成模块多肽的鉴定可以涉及从其中已经引入了文库的体内模型中手术分离组织或器官。举例来说，在一些情况下，在对于测定来说足够的时间之后，可以从宿主动物取出器官或组织并且可以对存在于所述器官或组织中的核酸进行测序以鉴定所述器官或组织中存在的单个文库成员，在其他情况下，可以对从器官或组织或宿主动物中分离的核酸进行定量(包括半定量)测序以定量所述器官或组织中特定文库成员的相对出现率或存在。在另外的其他情况下，可以对从器官或组织或宿主动物中分离的核酸进行定量(包括半定量)测序以定量所述器官或组织中特定模块的相对出现率或存在。

在一些情况下，例如在半定量后特定模块是高度表示的或单个模块被鉴定为促成所期望的表型的情况下，可以进行随后一轮的新文库组装，其中所鉴定的模块被包括在所有新产生的文库成员中(即随后使用所鉴定的可变模块作为不可变模块)并且筛选新产生的文库以鉴定与最初鉴定的模块一起协同影响表型的另外的模块。本领域普通技术人员将容易理解其中可以进行迭代文库组装和筛选以演变文库和具有所期望表型的单个文库成员。

实施例

提出以下实施例以为本领域的普通技术人员提供如何作出和使用本发明的完整公开和说明，并且不意图限制本申请的发明人认为是他们的发明的内容的范围，它们也不意图表示以下实验是所进行的所有或仅有的实验。已经努力确保关于所用数字(例如量、温度等)的准确度，但是应当考虑到一些实验误差和偏差。除非另外指示，否则份数是重量份数，分子量是重均分子量，温度是以摄氏度为单位，并且压力等于或接近大气压。可以使用标准缩写，例如bp：碱基对；kb：千碱基；p1：皮升；s或sec：秒；min：分钟；h或hr：小时；aa：氨基酸；kb：千碱基；bp：碱基对；nt：核苷酸；i.m.：肌内；i.p.：腹膜内；s.c.：皮下；等。

实施例1：构建和筛选其调节结构域模块化文库

为了制备含有必要的元件的带条形码的编码模块的核酸片段以用于文库构建，将编码多肽模块(即共调节结构域(即共刺激或共抑制))的核酸亚克隆到适用于测序和IIS型限制性内切酶消化的克隆载体中。在亚克隆后，所述载体含有：模块编码序列、侧接模块编码序列的最佳Gly/Ser接头序列、模块特异性条形码序列、侧接模块特异性条形码序列的3′克隆同源臂、在模块编码序列与模块特异性条形码序列之间的BamHI限制性酶切位点以及模块编码序列的5′末端和模块特异性条形码序列的3′末端上的IIS型限制性内切酶位点(图1)。对亚克隆的载体插入序列进行测序以确认插入的共调节结构域的身份。用于该组合文库中的共调节结构域和它们对应的蛋白质序列提供于表1中。

使用IIS型限制性内切酶消化含有带条形码的模块编码序列的克隆载体以释放编码每一个多肽模块的“序列完全”核酸(图2)。提供了在IIS型限制性内切酶消化之前和之后含有所述元件和编码CD28共刺激结构域的序列的克隆载体的一部分的实例(图3)并且该实例代表了用于构建文库的每一个模块质粒/片段的一般构型。

通过在脾脏病灶形成病毒启动子(pSFFV)的3′的BamHI位点处进行限制性内切酶消化来制备表达载体(即慢病毒包装载体pHR(也被称为受体载体))。以逐步方式组装文库成员构建体(图5)。首先使用In-Fusion克隆将编码文库的所有成员所共有的单链可变片段(scFv)和跨膜(TM)结构域(scFV-TM)的序列插入表达载体中。将In-Fusion反应混合物转化到感受态大肠杆菌中。将转化的细胞平板接种。选择菌落并且进行微量制备(Miniprep)以提取DNA以回收构建的质粒。在成功构建含有scFV-TM的表达质粒之后，在根据图5的单个步骤中将多模块化多肽的每一个连续组分(包括EGFP报告蛋白)在先前组分的3′插入。每一个步骤包括使用BamHI消化以及In-Fusion组装，继而是转染In-Fusion反应物、选择菌落以及质粒纯化。

如图5中所示，最终In-Fusion反应的每一个所得的文库成员均含有共同的scFV-TM，所述scFV-TM与两个共调节结构域的成员特异性组合连接，所述成员特异性组合与共同的报告蛋白(CD3z-EGFP)和一对模块特异性条形码连接，所述条形码相对于共调节结构域处于相反取向。所述条形码由引物结合位点侧接，从而允许对对应于共调节结构域的文库成员特异性组合的特定条形码组合进行扩增和/或测序。

在最终质粒文库的竞争之后，通过常规手段将单个文库成员转染到HEK-293细胞中并且产生慢病毒。使用产生的慢病毒感染T细胞以产生表达多模块化多肽的工程化的免疫细胞。

基于报告蛋白的EGFP表达对工程化的免疫细胞进行FACS分选。进行分选以分离具有均一表达水平的工程细胞的群体。在后续的功能筛选中利用具有多模块化多肽的均一表达的分选细胞。

使用该一般策略产生四个独立的文库。构建一维文库(即其中每一个文库成员含有单个共调节结构域)和二维文库(即其中每一个文库成员含有两个共调节结构域)。根据图6中所示的一般方案组装二维文库的成员。四个文库和所进行的相关筛选如下：

1)构建具有20个成员的一维文库并且将其用于测试T细胞功能的FLOWseq分析的可行性。每一个文库成员被配置成含有与共调节结构域模块融合的CD8结构域，所述共调节结构域模块与CD3Z结构域融合。通过FACS将工程化的T细胞根据它们的报告蛋白表达分级并且筛选文库以测量对板结合的抗原的T细胞激活(CD69)的剂量反应。

2)构建具有62个成员的一维抗CD19文库并且在体内小鼠肿瘤模型中对其进行筛选。每一个文库成员被配置成含有与共调节结构域模块融合的抗CD19结构域，所述共调节结构域模块与CD3Z结构域融合，该CD3Z结构域与EGFP报告蛋白融合。

3)构建具有62×62个成员的二维文库。每一个文库成员均含有与第一共调节结构域模块融合的抗CD19结构域，该第一共调节结构域模块与第二共调节结构域模块融合，该第二共调节结构域模块与CD3Z结构域融合，该CD3Z结构域与EGFP报告蛋白融合。

4)构建具有62个成员的一维抗间皮素文库。每一个文库成员均含有与共调节结构域模块融合的抗间皮素结构域，所述共调节结构域模块与CD3Z结构域融合，该CD3Z结构域与EGFP报告蛋白融合。

在汇集的具有62个成员的一维抗CD19文库中功能筛选嵌合抗原受体(CAR)中的替代共调节序列。文库的每一个成员均含有指定靶癌细胞抗原的抗CD19 scFv、表1的共调节结构域模块之一以及CD3Z主要信号转导结构域(图7)。

在对汇集文库的工程化的T细胞进行抗原刺激(以32ng/ml、125ng/ml以及1000ng/ml的抗原)之后，通过FACS基于CD69表达将T细胞功能分选到“高”或“低”刺激级别中(图8)。在高刺激级别和低刺激级别中通过测序对对应于单个共调节结构域的特异性条形码的相对富集进行定量(在抗原水平1000ng/ml)(图9)。该方法允许比较在抗CD19-CD3Z CAR内以及在所使用的抗原刺激的特定背景下每一个共调节结构域的刺激和抑制结果。举例来说，在不同的抗原输入水平下进一步分析筛选的结果，从而允许快速评估单个共调节结构域的剂量-反应(图10)。

实施例2：确认61×61二维文库的全面组装

通过嵌套组装将61个可变CAR模块(表2，提供于图25中)组装成编码二维(2D)合成模块化CAR多肽的带条形码的核酸文库。利用MiSeq系统(Illumina Inc.，Hayward，CA)，通过边合成边测序(SBS)方法对文库进行深度测序并且确定每一个组装的文库成员的读段计数(图26)。

在总共3,721个可能的文库成员(即CAR变体)中，通过测序检测所有可能的文库成员，其中最大出现率是1216个计数并且最小出现率是2个计数。在文库中计数的平均数是333，其中中值是311个计数并且标准偏差是140.90％的文库成员被表示为具有中值的2倍以内的计数并且98％的文库成员具有中值的3倍以内的计数。

因而，测序确认了所述嵌套组装方法能够产生含有代表可变模块的所有可能组合的文库成员的二维文库。

实施例3：文库部分归一化

开发了一种方法以使用文库部分归一化增强组合文库中克隆的分布。

在任何组合组装反应中，一些部分(例如模块)比其他部分更有效地整合到组装产物中。因此，含有相对低效整合的部分的组装产物(例如蛋白质变体)在最终的组合文库中是表示不足的或不存在的。出于类似原因，其他组装产物(例如含有有效整合的部分的那些蛋白质变体)是过于丰富的，并且因此，在所有下游测定中是过采样的。

为了解决这个问题，开发了一种用于改进文库组装的方法。在所述方法中，进行初始组装反应，其中每一个部分(DNA插入序列)以相同的体积存在。出于这个目的，产生含有1μL的每一个部分的主混合物。在组合组装完成之后，通过任何方便的定量测定来确定产物的混合物。举例来说，在本实施例中，使用下一代测序(参见图27)，并且计算总文库中每一个部分的分数(在图28中所示的线性方程式中表示为e₁、e₂......)。然后使用线性代数同时计算每一个部分(在主混合物中)的新的优化体积，然后重新合成文库以实现变体的更均匀的分布。

通过合成CAR的组合文库来验证该方法，其中每一个CAR均含有61个不同的共刺激结构域中的两个，这两个是串联连接的(对于3721个蛋白质变体，是61²)。通过利用所组装的组合文库中部分效率、浓度以及丰度之间简单的线性关系，证实该方法可以用于定量控制特定部分的相对出现率。如图29中所描绘，预测(黑色条柱)组装主混合物中一组部分的相对浓度的10倍变化将引起组合文库的所得组成中部分出现率的10倍变化。当测量所组装的组合文库中5个部分的平均出现率(白色条柱)时，确实观测到所预测的10倍变化的影响。所得的归一化的大型组合文库(如图26中所描绘)显示出文库中变体分布的显著改进(例如与在归一化之前文库中的变体分布相比)(图27)。

虽然已经参考本发明的具体实施方案描述了本发明，但是本领域技术人员应当了解的是，可以作出各种变化并且可以用等同物代替而不脱离本发明的真实精神和范围。此外，可以作出许多修改以使特定情况、材料、物质组合物、工艺、一个或多个工艺步骤适用于本发明的目的、精神以及范围。所有这样的修改均意在落入所附权利要求书的范围内。

序列表

<110> W·A·林

S·M·科伊尔

R·M·歌德雷

K·T·罗伊鲍尔

<120> 模块化多肽文库以及其制备和使用方法

<130> UCSF-518WO

<150> US 62/212,999

<151> 2015-09-01

<160> 132

<170> PatentIn 3.5版

<210> 1

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 1

Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu Leu

1 5 10 15

Ser Leu Val Ile Thr Leu Tyr Cys

20

<210> 2

<211> 23

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 2

Leu Gly Leu Leu Val Ala Gly Val Leu Val Leu Leu Val Ser Leu Gly

1 5 10 15

Val Ala Ile His Leu Cys Cys

20

<210> 3

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 3

Ala Leu Ile Val Leu Gly Gly Val Ala Gly Leu Leu Leu Phe Ile Gly

1 5 10 15

Leu Gly Ile Phe Phe Cys Val Arg Cys

20 25

<210> 4

<211> 23

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 4

Leu Cys Tyr Leu Leu Asp Gly Ile Leu Phe Ile Tyr Gly Val Ile Leu

1 5 10 15

Thr Ala Leu Phe Leu Arg Val

20

<210> 5

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 5

Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu Leu

1 5 10 15

Val Thr Val Ala Phe Ile Ile Phe Trp Val

20 25

<210> 6

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 6

Val Ala Ala Ile Leu Gly Leu Gly Leu Val Leu Gly Leu Leu Gly Pro

1 5 10 15

Leu Ala Ile Leu Leu Ala Leu Tyr Leu Leu

20 25

<210> 7

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 7

Ala Leu Pro Ala Ala Leu Ala Val Ile Ser Phe Leu Leu Gly Leu Gly

1 5 10 15

Leu Gly Val Ala Cys Val Leu Ala

20

<210> 8

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<220>

<221> MISC_FEATURE

<222> (1)..(5)

<223> 这段残基可以重复。

<400> 8

Gly Ser Gly Gly Ser

1 5

<210> 9

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<220>

<221> MISC_FEATURE

<222> (1)..(4)

<223> 这段残基可以重复。

<400> 9

Gly Gly Gly Ser

1

<210> 10

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 10

Gly Gly Ser Gly

1

<210> 11

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 11

Gly Gly Ser Gly Gly

1 5

<210> 12

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 12

Gly Ser Gly Ser Gly

1 5

<210> 13

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 13

Gly Ser Gly Gly Gly

1 5

<210> 14

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 14

Gly Gly Gly Ser Gly

1 5

<210> 15

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 15

Gly Ser Ser Ser Gly

1 5

<210> 16

<211> 228

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸序列。

<400> 16

acctgcaaca ctccggatca ggatctggtt cgtgggtgcg cagcaagaga agcagactgc 60

tgcacagcga ctacatgaac atgaccccca gacggcctgg ccccaccaga aagcactacc 120

agccttcgcc cctcccagag acttcgccgc ctacagatct ggctccggat caggatccgg 180

cagtggtaac acatatgtct gcagatccgg cagtggtaca aggcaggt 228

<210> 17

<211> 208

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸序列。

<400> 17

ctccggatca ggatctggtt cgtgggtgcg cagcaagaga agcagactgc tgcacagcga 60

ctacatgaac atgaccccca gacggcctgg ccccaccaga aagcactacc agccttacgc 120

ccctccagag acttcgccgc ctacagatct ggctccggat caggatccgg cagtggtaac 180

acatatgtct gcagatccgg cagtggta 208

<210> 18

<211> 58

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 18

Ser Gly Ser Gly Ser Gly Ser Trp Val Arg Ser Lys Arg Ser Arg Leu

1 5 10 15

Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro Gly Pro Thr

20 25 30

Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe Ala Ala Tyr

35 40 45

Arg Ser Gly Ser Gly Ser Gly Ser Gly Ser

50 55

<210> 19

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 19

Arg Cys Arg Glu Arg Arg Arg Asn Glu Arg Leu Arg Arg Glu Ser Val

1 5 10 15

Arg Pro Val

<210> 20

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 20

Arg Lys Gly Arg Met Met Asp Val Lys Lys Cys Gly Ile Gln Asp Thr

1 5 10 15

Asn Ser Lys Lys Gln Ser Asp Thr His Leu Glu Glu Thr

20 25

<210> 21

<211> 32

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 21

Lys Lys Arg His Met Ala Ser Tyr Ser Met Cys Ser Asp Pro Ser Thr

1 5 10 15

Arg Asp Pro Pro Gly Arg Pro Glu Pro Tyr Val Glu Val Tyr Leu Ile

20 25 30

<210> 22

<211> 35

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 22

Thr Lys Lys Lys Tyr Ser Ser Ser Val His Asp Pro Asn Gly Glu Tyr

1 5 10 15

Met Phe Met Arg Ala Val Asn Thr Ala Lys Lys Ser Arg Leu Thr Asp

20 25 30

Val Thr Leu

35

<210> 23

<211> 35

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 23

Met Glu Glu Ser Val Val Arg Pro Ser Val Phe Val Val Asp Gly Gln

1 5 10 15

Thr Asp Ile Pro Phe Thr Arg Leu Gly Arg Ser His Arg Arg Gln Ser

20 25 30

Cys Ser Val

35

<210> 24

<211> 39

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 24

Ser Leu Ser Lys Met Leu Lys Lys Arg Ser Pro Leu Thr Thr Gly Val

1 5 10 15

Tyr Val Lys Met Pro Pro Thr Glu Pro Glu Cys Glu Lys Gln Phe Gln

20 25 30

Pro Tyr Phe Ile Pro Ile Asn

35

<210> 25

<211> 40

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 25

Ala Arg Thr Gln Ile Lys Lys Leu Cys Ser Trp Arg Asp Lys Asn Ser

1 5 10 15

Ala Ala Cys Val Val Tyr Glu Asp Met Ser His Ser Arg Cys Asn Thr

20 25 30

Leu Ser Ser Pro Asn Gln Tyr Gln

35 40

<210> 26

<211> 42

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 26

Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met

1 5 10 15

Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe

20 25 30

Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu

35 40

<210> 27

<211> 43

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 27

Trp Val Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn

1 5 10 15

Met Thr Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr

20 25 30

Ala Pro Pro Arg Asp Phe Ala Ala Tyr Arg Ser

35 40

<210> 28

<211> 49

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 28

His Gln Arg Arg Lys Tyr Arg Ser Asn Lys Gly Glu Ser Pro Val Glu

1 5 10 15

Pro Ala Glu Pro Cys His Tyr Ser Cys Pro Arg Glu Glu Glu Gly Ser

20 25 30

Thr Ile Pro Ile Gln Glu Asp Tyr Arg Lys Pro Glu Pro Ala Cys Ser

35 40 45

Pro

<210> 29

<211> 51

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 29

Arg Arg Gln Trp Arg Pro Arg Arg Phe Ser Ala Leu Glu Gln Gly Ile

1 5 10 15

His Pro Pro Gln Ala Gln Ser Lys Ile Glu Glu Leu Glu Gln Glu Pro

20 25 30

Glu Pro Glu Pro Glu Pro Glu Pro Glu Pro Glu Pro Glu Pro Glu Pro

35 40 45

Glu Gln Leu

50

<210> 30

<211> 54

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 30

His Ile Trp Gln Leu Arg Ser Gln Cys Met Trp Pro Arg Glu Thr Gln

1 5 10 15

Leu Leu Leu Glu Val Pro Pro Ser Thr Glu Asp Ala Arg Ser Cys Gln

20 25 30

Phe Pro Glu Glu Glu Arg Gly Glu Arg Ser Ala Glu Glu Lys Gly Arg

35 40 45

Leu Gly Asp Leu Trp Val

50

<210> 31

<211> 61

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 31

Asn Arg Arg Arg Arg Arg Glu Arg Arg Asp Leu Phe Thr Glu Ser Trp

1 5 10 15

Asp Thr Gln Lys Ala Pro Asn Asn Tyr Arg Ser Pro Ile Ser Thr Ser

20 25 30

Gln Pro Thr Asn Gln Ser Met Asp Asp Thr Arg Glu Asp Ile Tyr Val

35 40 45

Asn Tyr Pro Thr Phe Ser Arg Arg Pro Lys Thr Arg Val

50 55 60

<210> 32

<211> 62

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 32

Lys Lys Val Ala Lys Lys Pro Thr Asn Lys Ala Pro His Pro Lys Gln

1 5 10 15

Glu Pro Gln Glu Ile Asn Phe Pro Asp Asp Leu Pro Gly Ser Asn Thr

20 25 30

Ala Ala Pro Val Gln Glu Thr Leu His Gly Cys Gln Pro Val Thr Gln

35 40 45

Glu Asp Gly Lys Glu Ser Arg Ile Ser Val Gln Glu Arg Gln

50 55 60

<210> 33

<211> 77

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 33

Lys Trp Tyr Ser His Ser Lys Glu Lys Ile Gln Asn Leu Ser Leu Ile

1 5 10 15

Ser Leu Ala Asn Leu Pro Pro Ser Gly Leu Ala Asn Ala Val Ala Glu

20 25 30

Gly Ile Arg Ser Glu Glu Asn Ile Tyr Thr Ile Glu Glu Asn Val Tyr

35 40 45

Glu Val Glu Glu Pro Asn Glu Tyr Tyr Cys Tyr Val Ser Ser Arg Gln

50 55 60

Gln Pro Ser Gln Pro Leu Gly Cys Arg Phe Ala Met Pro

65 70 75

<210> 34

<211> 80

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 34

Arg Lys Lys Lys Ala Leu Arg Ile His Ser Val Glu Gly Asp Leu Arg

1 5 10 15

Arg Lys Ser Ala Gly Gln Glu Glu Trp Ser Pro Ser Ala Pro Ser Pro

20 25 30

Pro Gly Ser Cys Val Gln Ala Glu Ala Ala Pro Ala Gly Leu Cys Gly

35 40 45

Glu Gln Arg Gly Glu Asp Cys Ala Glu Leu His Asp Tyr Phe Asn Val

50 55 60

Leu Ser Tyr Arg Ser Leu Gly Asn Cys Ser Phe Phe Thr Glu Thr Gly

65 70 75 80

<210> 35

<211> 83

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 35

Lys Leu Arg Lys Ala His Val Ile Trp Lys Lys Glu Asn Glu Val Ser

1 5 10 15

Glu His Thr Leu Glu Ser Tyr Arg Ser Arg Ser Asn Asn Glu Glu Thr

20 25 30

Ser Ser Glu Glu Lys Asn Gly Gln Ser Ser His Pro Met Arg Cys Met

35 40 45

Asn Tyr Ile Thr Lys Leu Tyr Ser Glu Ala Lys Thr Lys Arg Lys Glu

50 55 60

Asn Val Gln His Ser Lys Leu Glu Glu Lys His Ile Gln Val Pro Glu

65 70 75 80

Ser Ile Val

<210> 36

<211> 98

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 36

Ile Cys Ser Arg Ala Ala Arg Gly Thr Ile Gly Ala Arg Arg Thr Gly

1 5 10 15

Gln Pro Leu Lys Glu Asp Pro Ser Ala Val Pro Val Phe Ser Val Asp

20 25 30

Tyr Gly Glu Leu Asp Phe Gln Trp Arg Glu Lys Thr Pro Glu Pro Pro

35 40 45

Val Pro Cys Val Pro Glu Gln Thr Glu Tyr Ala Thr Ile Val Phe Pro

50 55 60

Ser Gly Met Gly Thr Ser Ser Pro Ala Arg Arg Gly Ser Ala Asp Gly

65 70 75 80

Pro Arg Ser Ala Gln Pro Leu Arg Pro Glu Asp Gly His Cys Ser Trp

85 90 95

Pro Leu

<210> 37

<211> 101

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 37

His Arg Gln Asn Gln Ile Lys Gln Gly Pro Pro Arg Ser Lys Asp Glu

1 5 10 15

Glu Gln Lys Pro Gln Gln Arg Pro Asp Leu Ala Val Asp Val Leu Glu

20 25 30

Arg Thr Ala Asp Lys Ala Thr Val Asn Gly Leu Pro Glu Lys Asp Arg

35 40 45

Glu Thr Asp Thr Ser Ala Leu Ala Ala Gly Ser Ser Gln Glu Val Thr

50 55 60

Tyr Ala Gln Leu Asp His Trp Ala Leu Thr Gln Arg Thr Ala Arg Ala

65 70 75 80

Val Ser Pro Gln Ser Thr Lys Pro Met Ala Glu Ser Ile Thr Tyr Ala

85 90 95

Ala Val Ala Arg His

100

<210> 38

<211> 107

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 38

Cys Cys Arg Lys Lys Arg Arg Glu Glu Lys Tyr Glu Lys Glu Val His

1 5 10 15

His Asp Ile Arg Glu Asp Val Pro Pro Pro Lys Ser Arg Thr Ser Thr

20 25 30

Ala Arg Ser Tyr Ile Gly Ser Asn His Ser Ser Leu Gly Ser Met Ser

35 40 45

Pro Ser Asn Met Glu Gly Tyr Ser Lys Thr Gln Tyr Asn Gln Val Pro

50 55 60

Ser Glu Asp Phe Glu Arg Thr Pro Gln Ser Pro Thr Leu Pro Pro Ala

65 70 75 80

Lys Val Ala Ala Pro Asn Leu Ser Arg Met Gly Ala Ile Pro Val Met

85 90 95

Ile Pro Ala Gln Ser Lys Asp Gly Ser Ile Val

100 105

<210> 39

<211> 114

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 39

Cys Cys Leu Arg Arg His Gln Gly Lys Gln Asn Glu Leu Ser Asp Thr

1 5 10 15

Ala Gly Arg Glu Ile Asn Leu Val Asp Ala His Leu Lys Ser Glu Gln

20 25 30

Thr Glu Ala Ser Thr Arg Gln Asn Ser Gln Val Leu Leu Ser Glu Thr

35 40 45

Gly Ile Tyr Asp Asn Asp Pro Asp Leu Cys Phe Arg Met Gln Glu Gly

50 55 60

Ser Glu Val Tyr Ser Asn Pro Cys Leu Glu Glu Asn Lys Pro Gly Ile

65 70 75 80

Val Tyr Ala Ser Leu Asn His Ser Val Ile Gly Pro Asn Ser Arg Leu

85 90 95

Ala Arg Asn Val Lys Glu Ala Pro Thr Glu Tyr Ala Ser Ile Cys Val

100 105 110

Arg Ser

<210> 40

<211> 117

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 40

Thr Lys Arg Lys Lys Gln Arg Ser Arg Arg Asn Asp Glu Glu Leu Glu

1 5 10 15

Thr Arg Ala His Arg Val Ala Thr Glu Glu Arg Gly Arg Lys Pro His

20 25 30

Gln Ile Pro Ala Ser Thr Pro Gln Asn Pro Ala Thr Ser Gln His Pro

35 40 45

Pro Pro Pro Pro Gly His Arg Ser Gln Ala Pro Ser His Arg Pro Pro

50 55 60

Pro Pro Gly His Arg Val Gln His Gln Pro Gln Lys Arg Pro Pro Ala

65 70 75 80

Pro Ser Gly Thr Gln Val His Gln Gln Lys Gly Pro Pro Leu Pro Arg

85 90 95

Pro Arg Val Gln Pro Lys Pro Pro His Gly Ala Ala Glu Asn Ser Leu

100 105 110

Ser Pro Ser Ser Asn

115

<210> 41

<211> 120

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 41

Trp Arg Arg Lys Arg Lys Glu Lys Gln Ser Glu Thr Ser Pro Lys Glu

1 5 10 15

Phe Leu Thr Ile Tyr Glu Asp Val Lys Asp Leu Lys Thr Arg Arg Asn

20 25 30

His Glu Gln Glu Gln Thr Phe Pro Gly Gly Gly Ser Thr Ile Tyr Ser

35 40 45

Met Ile Gln Ser Gln Ser Ser Ala Pro Thr Ser Gln Glu Pro Ala Tyr

50 55 60

Thr Leu Tyr Ser Leu Ile Gln Pro Ser Arg Lys Ser Gly Ser Arg Lys

65 70 75 80

Arg Asn His Ser Pro Ser Phe Asn Ser Thr Ile Tyr Glu Val Ile Gly

85 90 95

Lys Ser Gln Pro Lys Ala Gln Asn Pro Ala Arg Leu Ser Arg Lys Glu

100 105 110

Leu Glu Asn Phe Asp Val Tyr Ser

115 120

<210> 42

<211> 187

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 42

Arg Arg Ala Cys Arg Lys Arg Ile Arg Gln Lys Leu His Leu Cys Tyr

1 5 10 15

Pro Val Gln Thr Ser Gln Pro Lys Leu Glu Leu Val Asp Ser Arg Pro

20 25 30

Arg Arg Ser Ser Thr Gln Leu Arg Ser Gly Ala Ser Val Thr Glu Pro

35 40 45

Val Ala Glu Glu Arg Gly Leu Met Ser Gln Pro Leu Met Glu Thr Cys

50 55 60

His Ser Val Gly Ala Ala Tyr Leu Glu Ser Leu Pro Leu Gln Asp Ala

65 70 75 80

Ser Pro Ala Gly Gly Pro Ser Ser Pro Arg Asp Leu Pro Glu Pro Arg

85 90 95

Val Ser Thr Glu His Thr Asn Asn Lys Ile Glu Lys Ile Tyr Ile Met

100 105 110

Lys Ala Asp Thr Val Ile Val Gly Thr Val Lys Ala Glu Leu Pro Glu

115 120 125

Gly Arg Gly Leu Ala Gly Pro Ala Glu Pro Glu Leu Glu Glu Glu Leu

130 135 140

Glu Ala Asp His Thr Pro His Tyr Pro Glu Gln Glu Thr Glu Pro Pro

145 150 155 160

Leu Gly Ser Cys Ser Asp Val Met Leu Ser Val Glu Glu Glu Gly Lys

165 170 175

Glu Asp Pro Leu Pro Thr Ala Ala Ser Gly Lys

180 185

<210> 43

<211> 108

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 43

Thr Tyr Arg His Cys Trp Pro His Lys Pro Leu Val Thr Ala Asp Glu

1 5 10 15

Ala Gly Met Glu Ala Leu Thr Pro Pro Pro Ala Thr His Leu Ser Pro

20 25 30

Leu Asp Ser Ala His Thr Leu Leu Ala Pro Pro Asp Ser Ser Glu Lys

35 40 45

Ile Cys Thr Val Gln Leu Val Gly Asn Ser Trp Thr Pro Gly Tyr Pro

50 55 60

Glu Thr Gln Glu Ala Leu Cys Pro Gln Val Thr Trp Ser Trp Asp Gln

65 70 75 80

Leu Pro Ser Arg Ala Leu Gly Pro Ala Ala Ala Pro Thr Leu Ser Pro

85 90 95

Glu Ser Pro Ala Gly Ser Pro Ala Met Met Leu Gln

100 105

<210> 44

<211> 42

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 44

Ala Leu Tyr Leu Leu Arg Arg Asp Gln Arg Leu Pro Pro Asp Ala His

1 5 10 15

Lys Pro Pro Gly Gly Gly Ser Phe Arg Thr Pro Ile Gln Glu Glu Gln

20 25 30

Ala Asp Ala His Ser Thr Leu Ala Lys Ile

35 40

<210> 45

<211> 51

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 45

Met Gly Trp Ile Arg Gly Arg Arg Ser Arg His Ser Trp Glu Met Ser

1 5 10 15

Glu Phe His Asn Tyr Asn Leu Asp Leu Lys Lys Ser Asp Phe Ser Thr

20 25 30

Arg Trp Gln Lys Gln Arg Cys Pro Val Val Lys Ser Lys Cys Arg Glu

35 40 45

Asn Ala Ser

50

<210> 46

<211> 48

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 46

Lys Lys Tyr Phe Phe Lys Lys Glu Val Gln Gln Leu Ser Val Ser Phe

1 5 10 15

Ser Ser Leu Gln Ile Lys Ala Leu Gln Asn Ala Val Glu Lys Glu Val

20 25 30

Gln Ala Glu Asp Asn Ile Tyr Ile Glu Asn Ser Leu Tyr Ala Thr Asp

35 40 45

<210> 47

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 47

Ser Gly Phe Leu Gln Glu Lys Val Trp Val Met Leu Val Thr Ser Leu

1 5 10 15

Val Ala Leu Gln Ala Leu

20

<210> 48

<211> 85

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 48

Ser Trp Arg Arg Arg Gln Arg Arg Leu Arg Gly Ala Ser Ser Ala Glu

1 5 10 15

Ala Pro Asp Gly Asp Lys Asp Ala Pro Glu Pro Leu Asp Lys Val Ile

20 25 30

Ile Leu Ser Pro Gly Ile Ser Asp Ala Thr Ala Pro Ala Trp Pro Pro

35 40 45

Pro Gly Glu Asp Pro Gly Thr Thr Pro Pro Gly His Ser Val Pro Val

50 55 60

Pro Ala Thr Glu Leu Gly Ser Thr Glu Leu Val Thr Thr Lys Thr Ala

65 70 75 80

Gly Pro Glu Gln Gln

85

<210> 49

<211> 111

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 49

Ala Cys Phe Leu Lys Lys Arg Gly Asp Pro Cys Ser Cys Gln Pro Arg

1 5 10 15

Ser Arg Pro Arg Gln Ser Pro Ala Lys Ser Ser Gln Asp His Ala Met

20 25 30

Glu Ala Gly Ser Pro Val Ser Thr Ser Pro Glu Pro Val Glu Thr Cys

35 40 45

Ser Phe Cys Phe Pro Glu Cys Arg Ala Pro Thr Gln Glu Ser Ala Val

50 55 60

Thr Pro Gly Thr Pro Asp Pro Thr Cys Ala Gly Arg Trp Gly Cys His

65 70 75 80

Thr Arg Thr Thr Val Leu Gln Pro Cys Pro His Ile Pro Asp Ser Gly

85 90 95

Leu Gly Ile Val Cys Val Pro Ala Gln Glu Gly Gly Pro Gly Ala

100 105 110

<210> 50

<211> 95

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 50

Met Ala Glu Ala Ile Thr Tyr Ala Asp Leu Arg Phe Val Lys Ala Pro

1 5 10 15

Leu Lys Lys Ser Ile Ser Ser Arg Leu Gly Gln Asp Pro Gly Ala Asp

20 25 30

Asp Asp Gly Glu Ile Thr Tyr Glu Asn Val Gln Val Pro Ala Val Leu

35 40 45

Gly Val Pro Ser Ser Leu Ala Ser Ser Val Leu Gly Asp Lys Ala Ala

50 55 60

Val Lys Ser Glu Gln Pro Thr Ala Ser Trp Arg Ala Val Thr Ser Pro

65 70 75 80

Ala Val Gly Arg Ile Leu Pro Cys Arg Thr Thr Cys Leu Arg Tyr

85 90 95

<210> 51

<211> 141

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 51

Lys Leu Gln Arg Arg Trp Lys Arg Thr Gln Ser Gln Gln Gly Leu Gln

1 5 10 15

Glu Asn Ser Ser Gly Gln Ser Phe Phe Val Arg Asn Lys Lys Val Arg

20 25 30

Arg Ala Pro Leu Ser Glu Gly Pro His Ser Leu Gly Cys Tyr Asn Pro

35 40 45

Met Met Glu Asp Gly Ile Ser Tyr Thr Thr Leu Arg Phe Pro Glu Met

50 55 60

Asn Ile Pro Arg Thr Gly Asp Ala Glu Ser Ser Glu Met Gln Arg Pro

65 70 75 80

Pro Pro Asp Cys Asp Asp Thr Val Thr Tyr Ser Ala Leu His Lys Arg

85 90 95

Gln Val Gly Asp Tyr Glu Asn Val Ile Pro Asp Phe Pro Glu Asp Glu

100 105 110

Gly Ile His Tyr Ser Glu Leu Ile Gln Phe Gly Val Gly Glu Arg Pro

115 120 125

Gln Ala Gln Glu Asn Val Asp Tyr Val Ile Leu Lys His

130 135 140

<210> 52

<211> 45

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 52

Arg Lys Trp Cys Gln Tyr Gln Lys Glu Ile Met Glu Arg Pro Pro Pro

1 5 10 15

Phe Lys Pro Pro Pro Pro Pro Ile Lys Tyr Thr Cys Ile Gln Glu Pro

20 25 30

Asn Glu Ser Asp Leu Pro Tyr His Glu Met Glu Thr Leu

35 40 45

<210> 53

<211> 84

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 53

Leu Arg Lys Arg Arg Asp Ser Leu Ser Leu Ser Thr Gln Arg Thr Gln

1 5 10 15

Gly Pro Ala Glu Ser Ala Arg Asn Leu Glu Tyr Val Ser Val Ser Pro

20 25 30

Thr Asn Asn Thr Val Tyr Ala Ser Val Thr His Ser Asn Arg Glu Thr

35 40 45

Glu Ile Trp Thr Pro Arg Glu Asn Asp Thr Ile Thr Ile Tyr Ser Thr

50 55 60

Ile Asn His Ser Lys Glu Ser Lys Pro Thr Phe Ser Arg Ala Thr Ala

65 70 75 80

Leu Asp Asn Val

<210> 54

<211> 88

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 54

Trp Phe Leu Lys Arg Glu Arg Gln Glu Glu Tyr Ile Glu Glu Lys Lys

1 5 10 15

Arg Val Asp Ile Cys Arg Glu Thr Pro Asn Ile Cys Pro His Ser Gly

20 25 30

Glu Asn Thr Glu Tyr Asp Thr Ile Pro His Thr Asn Arg Thr Ile Leu

35 40 45

Lys Glu Asp Pro Ala Asn Thr Val Tyr Ser Thr Val Glu Ile Pro Lys

50 55 60

Lys Met Glu Asn Pro His Ser Leu Leu Thr Met Pro Asp Thr Pro Arg

65 70 75 80

Leu Phe Ala Tyr Glu Asn Val Ile

85

<210> 55

<211> 82

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 55

Lys Thr His Arg Arg Lys Ala Ala Arg Thr Ala Val Gly Arg Asn Asp

1 5 10 15

Thr His Pro Thr Thr Gly Ser Ala Ser Pro Lys His Gln Lys Lys Ser

20 25 30

Lys Leu His Gly Pro Thr Glu Thr Ser Ser Cys Ser Gly Ala Ala Pro

35 40 45

Thr Val Glu Met Asp Glu Glu Leu His Tyr Ala Ser Leu Asn Phe His

50 55 60

Gly Met Asn Pro Ser Lys Asp Thr Ser Thr Glu Tyr Ser Glu Val Arg

65 70 75 80

Thr Gln

<210> 56

<211> 38

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 56

Met Thr Asp Ser Val Ile Tyr Ser Met Leu Glu Leu Pro Thr Ala Thr

1 5 10 15

Gln Ala Gln Asn Asp Tyr Gly Pro Gln Gln Lys Ser Ser Ser Ser Arg

20 25 30

Pro Ser Cys Ser Cys Leu

35

<210> 57

<211> 45

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 57

Met Asp Gln Gln Ala Ile Tyr Ala Glu Leu Asn Leu Pro Thr Asp Ser

1 5 10 15

Gly Pro Glu Ser Ser Ser Pro Ser Ser Leu Pro Arg Asp Val Cys Gln

20 25 30

Gly Ser Pro Trp His Gln Phe Ala Leu Lys Leu Ser Cys

35 40 45

<210> 58

<211> 168

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 58

Leu Arg His Arg Arg Gln Gly Lys His Trp Thr Ser Thr Gln Arg Lys

1 5 10 15

Ala Asp Phe Gln His Pro Ala Gly Ala Val Gly Pro Glu Pro Thr Asp

20 25 30

Arg Gly Leu Gln Trp Arg Ser Ser Pro Ala Ala Asp Ala Gln Glu Glu

35 40 45

Asn Leu Tyr Ala Ala Val Lys His Thr Gln Pro Glu Asp Gly Val Glu

50 55 60

Met Asp Thr Arg Ser Pro His Asp Glu Asp Pro Gln Ala Val Thr Tyr

65 70 75 80

Ala Glu Val Lys His Ser Arg Pro Arg Arg Glu Met Ala Ser Pro Pro

85 90 95

Ser Pro Leu Ser Gly Glu Phe Leu Asp Thr Lys Asp Arg Gln Ala Glu

100 105 110

Glu Asp Arg Gln Met Asp Thr Glu Ala Ala Ala Ser Glu Ala Pro Gln

115 120 125

Asp Val Thr Tyr Ala Gln Leu His Ser Leu Thr Leu Arg Arg Glu Ala

130 135 140

Thr Glu Pro Pro Pro Ser Gln Glu Gly Pro Ser Pro Ala Val Pro Ser

145 150 155 160

Ile Tyr Ala Thr Leu Ala Ile His

165

<210> 59

<211> 83

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 59

Arg Trp Cys Ser Asn Lys Lys Asn Ala Ala Val Met Asp Gln Glu Ser

1 5 10 15

Ala Gly Asn Arg Thr Ala Asn Ser Glu Asp Ser Asp Glu Gln Asp Pro

20 25 30

Gln Glu Val Thr Tyr Thr Gln Leu Asn His Cys Val Phe Thr Gln Arg

35 40 45

Lys Ile Thr Arg Pro Ser Gln Arg Pro Lys Thr Pro Pro Thr Asp Ile

50 55 60

Ile Val Tyr Thr Glu Leu Pro Asn Ala Glu Ser Arg Ser Lys Val Val

65 70 75 80

Ser Cys Pro

<210> 60

<211> 84

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 60

His Leu Trp Cys Ser Asn Lys Lys Asn Ala Ala Val Met Asp Gln Glu

1 5 10 15

Pro Ala Gly Asn Arg Thr Ala Asn Ser Glu Asp Ser Asp Glu Gln Asp

20 25 30

Pro Glu Glu Val Thr Tyr Ala Gln Leu Asp His Cys Val Phe Thr Gln

35 40 45

Arg Lys Ile Thr Arg Pro Ser Gln Arg Pro Lys Thr Pro Pro Thr Asp

50 55 60

Thr Ile Leu Tyr Thr Glu Leu Pro Asn Ala Lys Pro Arg Ser Lys Val

65 70 75 80

Val Ser Cys Pro

<210> 61

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 61

Met Ala Val Phe Lys Thr Thr Leu Trp Arg

1 5 10

<210> 62

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 62

Lys Gly Ser Gln Arg Val Pro Glu Glu Pro Gly Glu Gln Pro Ile Tyr

1 5 10 15

Met Asn Phe Ser Glu Pro Leu Thr Lys Asp Met Ala Thr

20 25

<210> 63

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 63

Val Asn Arg Pro Gln Trp Ala Pro Pro Gly Arg

1 5 10

<210> 64

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 64

Val Thr Leu Arg Ser Phe Val Pro

1 5

<210> 65

<211> 35

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 65

Ala Ala Trp His Gly Gln Lys Pro Gly Thr His Pro Pro Ser Glu Leu

1 5 10 15

Asp Cys Gly His Asp Pro Gly Tyr Gln Leu Gln Thr Leu Pro Gly Leu

20 25 30

Arg Asp Thr

35

<210> 66

<211> 32

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 66

Gln His Ser Gln Arg Ser Pro Pro Arg Cys Ser Gln Glu Ala Asn Ser

1 5 10 15

Arg Lys Asp Asn Ala Pro Phe Arg Val Val Glu Pro Trp Glu Gln Ile

20 25 30

<210> 67

<211> 168

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 67

Gln His Trp Arg Gln Gly Lys His Arg Thr Leu Ala Gln Arg Gln Ala

1 5 10 15

Asp Phe Gln Arg Pro Pro Gly Ala Ala Glu Pro Glu Pro Lys Asp Gly

20 25 30

Gly Leu Gln Arg Arg Ser Ser Pro Ala Ala Asp Val Gln Gly Glu Asn

35 40 45

Phe Cys Ala Ala Val Lys Asn Thr Gln Pro Glu Asp Gly Val Glu Met

50 55 60

Asp Thr Arg Gln Ser Pro His Asp Glu Asp Pro Gln Ala Val Thr Tyr

65 70 75 80

Ala Lys Val Lys His Ser Arg Pro Arg Arg Glu Met Ala Ser Pro Pro

85 90 95

Ser Pro Leu Ser Gly Glu Phe Leu Asp Thr Lys Asp Arg Gln Ala Glu

100 105 110

Glu Asp Arg Gln Met Asp Thr Glu Ala Ala Ala Ser Glu Ala Pro Gln

115 120 125

Asp Val Thr Tyr Ala Gln Leu His Ser Phe Thr Leu Arg Gln Lys Ala

130 135 140

Thr Glu Pro Pro Pro Ser Gln Glu Gly Ala Ser Pro Ala Glu Pro Ser

145 150 155 160

Val Tyr Ala Thr Leu Ala Ile His

165

<210> 68

<211> 116

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 68

Leu Arg His Arg Arg Gln Gly Lys His Trp Thr Ser Thr Gln Arg Lys

1 5 10 15

Ala Asp Phe Gln His Pro Ala Gly Ala Val Gly Pro Glu Pro Thr Asp

20 25 30

Arg Gly Leu Gln Trp Arg Ser Ser Pro Ala Ala Asp Ala Gln Glu Glu

35 40 45

Asn Leu Tyr Ala Ala Val Lys Asp Thr Gln Pro Glu Asp Gly Val Glu

50 55 60

Met Asp Thr Arg Ala Ala Ala Ser Glu Ala Pro Gln Asp Val Thr Tyr

65 70 75 80

Ala Gln Leu His Ser Leu Thr Leu Arg Arg Lys Ala Thr Glu Pro Pro

85 90 95

Pro Ser Gln Glu Arg Glu Pro Pro Ala Glu Pro Ser Ile Tyr Ala Thr

100 105 110

Leu Ala Ile His

115

<210> 69

<211> 128

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 69

Met Ala Lys Arg Lys Gln Gly Asn Arg Leu Gly Val Cys Gly Arg Phe

1 5 10 15

Leu Ser Ser Arg Val Ser Gly Met Asn Pro Ser Ser Val Val His His

20 25 30

Val Ser Asp Ser Gly Pro Ala Ala Glu Leu Pro Leu Asp Val Pro His

35 40 45

Ile Arg Leu Asp Ser Pro Pro Ser Phe Asp Asn Thr Thr Tyr Thr Ser

50 55 60

Leu Pro Leu Asp Ser Pro Ser Gly Lys Pro Ser Leu Pro Ala Pro Ser

65 70 75 80

Ser Leu Pro Pro Leu Pro Pro Lys Val Leu Val Cys Ser Lys Pro Val

85 90 95

Thr Tyr Ala Thr Val Ile Phe Pro Gly Gly Asn Lys Gly Gly Gly Thr

100 105 110

Ser Cys Gly Pro Ala Gln Asn Pro Pro Asn Asn Gln Thr Pro Ser Ser

115 120 125

<210> 70

<211> 61

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 70

Lys Val Asn Gly Cys Arg Lys Tyr Lys Leu Asn Lys Thr Glu Ser Thr

1 5 10 15

Pro Val Val Glu Glu Asp Glu Met Gln Pro Tyr Ala Ser Tyr Thr Glu

20 25 30

Lys Asn Asn Pro Leu Tyr Asp Thr Thr Asn Lys Val Lys Ala Ser Glu

35 40 45

Ala Leu Gln Ser Glu Val Asp Thr Asp Leu His Thr Leu

50 55 60

<210> 71

<211> 98

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 71

Arg Met Phe Gln Lys Trp Ile Lys Ala Gly Asp His Ser Glu Leu Ser

1 5 10 15

Gln Asn Pro Lys Gln Ala Ala Thr Gln Ser Glu Leu His Tyr Ala Asn

20 25 30

Leu Glu Leu Leu Met Trp Pro Leu Gln Glu Lys Pro Ala Pro Pro Arg

35 40 45

Glu Val Glu Val Glu Tyr Ser Thr Val Ala Ser Pro Arg Glu Glu Leu

50 55 60

His Tyr Ala Ser Val Val Phe Asp Ser Asn Thr Asn Arg Ile Ala Ala

65 70 75 80

Gln Arg Pro Arg Glu Glu Glu Pro Asp Ser Asp Tyr Ser Val Ile Arg

85 90 95

Lys Thr

<210> 72

<211> 113

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 72

Trp Arg Met Met Lys Tyr Gln Gln Lys Ala Ala Gly Met Ser Pro Glu

1 5 10 15

Gln Val Leu Gln Pro Leu Glu Gly Asp Leu Cys Tyr Ala Asp Leu Thr

20 25 30

Leu Gln Leu Ala Gly Thr Ser Pro Gln Lys Ala Thr Thr Lys Leu Ser

35 40 45

Ser Ala Gln Val Asp Gln Val Glu Val Glu Tyr Val Thr Met Ala Ser

50 55 60

Leu Pro Lys Glu Asp Ile Ser Tyr Ala Ser Leu Thr Leu Gly Ala Glu

65 70 75 80

Asp Gln Glu Pro Thr Tyr Cys Asn Met Gly His Leu Ser Ser His Leu

85 90 95

Pro Gly Arg Gly Pro Glu Glu Pro Thr Glu Tyr Ser Thr Ile Ser Arg

100 105 110

Pro

<210> 73

<211> 37

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 73

Met Ser Asp Ser Lys Glu Pro Arg Leu Gln Gln Leu Gly Leu Leu Glu

1 5 10 15

Glu Glu Gln Leu Arg Gly Leu Gly Phe Arg Gln Thr Arg Gly Tyr Lys

20 25 30

Ser Leu Ala Gly Cys

35

<210> 74

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 74

Arg Lys Ser Ser Gly Gly Lys Gly Gly Ser Tyr Ser Gln Ala Ala Cys

1 5 10 15

Ser Asp Ser Ala Gln Gly Ser Asp Val Ser Leu Thr Ala

20 25

<210> 75

<211> 95

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 75

Leu Pro Lys Tyr Lys Thr Arg Lys Ala Met Arg Asn Asn Val Pro Arg

1 5 10 15

Asp Arg Gly Asp Thr Ala Met Glu Val Gly Ile Tyr Ala Asn Ile Leu

20 25 30

Glu Lys Gln Ala Lys Glu Glu Ser Val Pro Glu Val Gly Ser Arg Pro

35 40 45

Cys Val Ser Thr Ala Gln Asp Glu Ala Lys His Ser Gln Glu Leu Gln

50 55 60

Tyr Ala Thr Pro Val Phe Gln Glu Val Ala Pro Arg Glu Gln Glu Ala

65 70 75 80

Cys Asp Ser Tyr Lys Ser Gly Tyr Val Tyr Ser Glu Leu Asn Phe

85 90 95

<210> 76

<211> 178

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 76

Arg Arg Arg His Arg Gly Lys Phe Arg Lys Asp Val Gln Lys Glu Lys

1 5 10 15

Asp Leu Gln Leu Ser Ser Gly Ala Glu Glu Pro Ile Thr Arg Lys Gly

20 25 30

Glu Leu Gln Lys Arg Pro Asn Pro Ala Ala Ala Thr Gln Glu Glu Ser

35 40 45

Leu Tyr Ala Ser Val Glu Asp Met Gln Thr Glu Asp Gly Val Glu Leu

50 55 60

Asn Ser Trp Thr Pro Pro Glu Glu Asp Pro Gln Gly Glu Thr Tyr Ala

65 70 75 80

Gln Val Lys Pro Ser Arg Leu Arg Lys Ala Gly His Val Ser Pro Ser

85 90 95

Val Met Ser Arg Glu Gln Leu Asn Thr Glu Tyr Glu Gln Ala Glu Glu

100 105 110

Gly Gln Gly Ala Asn Asn Gln Ala Ala Glu Ser Gly Glu Ser Gln Asp

115 120 125

Val Thr Tyr Ala Gln Leu Cys Ser Arg Thr Leu Arg Gln Gly Ala Ala

130 135 140

Ala Ser Pro Leu Ser Gln Ala Gly Glu Ala Pro Glu Glu Pro Ser Val

145 150 155 160

Tyr Ala Thr Leu Ala Ala Ala Arg Pro Glu Ala Val Pro Lys Asp Met

165 170 175

Glu Gln

<210> 77

<211> 42

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽序列。

<400> 77

Ser Ala Gly Ser Ala Gly Ser Ala Gly Ser Ala Gly Ser Ala Gly Ser

1 5 10 15

Ala Gly Ser Ala Gly Ser Ala Gly Ser Ala Gly Ser Ala Gly Ser Ala

20 25 30

Gly Ser Ala Gly Ser Ala Gly Ser Ala Gly

35 40

<210> 78

<211> 108

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 78

Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe

1 5 10 15

Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu

20 25 30

Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys

35 40 45

Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val

50 55 60

Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp

65 70 75 80

Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala

85 90 95

Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu

100 105

<210> 79

<211> 292

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 79

Leu Glu Glu Ser Val Ala Leu Arg Ile Ile Thr Glu Gly Ala Ser Ile

1 5 10 15

Leu Arg Gln Glu Lys Asn Leu Leu Asp Ile Asp Ala Pro Val Thr Val

20 25 30

Cys Gly Asp Ile His Gly Gln Phe Phe Asp Leu Met Lys Leu Phe Glu

35 40 45

Val Gly Gly Ser Pro Ala Asn Thr Arg Tyr Leu Phe Leu Gly Asp Tyr

50 55 60

Val Asp Arg Gly Tyr Phe Ser Ile Glu Cys Val Leu Tyr Leu Trp Ala

65 70 75 80

Leu Lys Ile Leu Tyr Pro Lys Thr Leu Phe Leu Leu Arg Gly Asn His

85 90 95

Glu Cys Arg His Leu Thr Glu Tyr Phe Thr Phe Lys Gln Glu Cys Lys

100 105 110

Ile Lys Tyr Ser Glu Arg Val Tyr Asp Ala Cys Met Asp Ala Phe Asp

115 120 125

Cys Leu Pro Leu Ala Ala Leu Met Asn Gln Gln Phe Leu Cys Val His

130 135 140

Gly Gly Leu Ser Pro Glu Ile Asn Thr Leu Asp Asp Ile Arg Lys Leu

145 150 155 160

Asp Arg Phe Lys Glu Pro Pro Ala Tyr Gly Pro Met Cys Asp Ile Leu

165 170 175

Trp Ser Asp Pro Leu Glu Asp Phe Gly Asn Glu Lys Thr Gln Glu His

180 185 190

Phe Thr His Asn Thr Val Arg Gly Cys Ser Tyr Phe Tyr Ser Tyr Pro

195 200 205

Ala Val Cys Glu Phe Leu Gln His Asn Asn Leu Leu Ser Ile Leu Arg

210 215 220

Ala His Glu Ala Gln Asp Ala Gly Tyr Arg Met Tyr Arg Lys Ser Gln

225 230 235 240

Thr Thr Gly Phe Pro Ser Leu Ile Thr Ile Phe Ser Ala Pro Asn Tyr

245 250 255

Leu Asp Val Tyr Asn Asn Lys Ala Ala Val Leu Lys Tyr Glu Asn Asn

260 265 270

Val Met Asn Ile Arg Gln Phe Asn Cys Ser Pro His Pro Tyr Trp Leu

275 280 285

Pro Asn Phe Met

290

<210> 80

<211> 165

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 80

Met Val Asn Pro Thr Val Phe Phe Asp Ile Ala Val Asp Gly Glu Pro

1 5 10 15

Leu Gly Arg Val Ser Phe Glu Leu Phe Ala Asp Lys Val Pro Lys Thr

20 25 30

Ala Glu Asn Phe Arg Ala Leu Ser Thr Gly Glu Lys Gly Phe Gly Tyr

35 40 45

Lys Gly Ser Cys Phe His Arg Ile Ile Pro Gly Phe Met Cys Gln Gly

50 55 60

Gly Asp Phe Thr Arg His Asn Gly Thr Gly Gly Lys Ser Ile Tyr Gly

65 70 75 80

Glu Lys Phe Glu Asp Glu Asn Phe Ile Leu Lys His Thr Gly Pro Gly

85 90 95

Ile Leu Ser Met Ala Asn Ala Gly Pro Asn Thr Asn Gly Ser Gln Phe

100 105 110

Phe Ile Cys Thr Ala Lys Thr Glu Trp Leu Asp Gly Lys His Val Val

115 120 125

Phe Gly Lys Val Lys Glu Gly Met Asn Ile Val Glu Ala Met Glu Arg

130 135 140

Phe Gly Ser Arg Asn Gly Lys Thr Ser Lys Lys Ile Thr Ile Ala Asp

145 150 155 160

Cys Gly Gln Leu Glu

165

<210> 81

<211> 94

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 81

Met Ile Leu Trp His Glu Met Trp His Glu Gly Leu Glu Glu Ala Ser

1 5 10 15

Arg Leu Tyr Phe Gly Glu Arg Asn Val Lys Gly Met Phe Glu Val Leu

20 25 30

Glu Pro Leu His Ala Met Met Glu Arg Gly Pro Gln Thr Leu Lys Glu

35 40 45

Thr Ser Phe Asn Gln Ala Tyr Gly Arg Asp Leu Met Glu Ala Gln Glu

50 55 60

Trp Cys Arg Lys Tyr Met Lys Ser Gly Asn Val Lys Asp Leu Leu Gln

65 70 75 80

Ala Trp Asp Leu Tyr Tyr His Val Phe Arg Arg Ile Ser Lys

85 90

<210> 82

<211> 804

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 82

Met Ser Asn Ser Tyr Asp Ser Ser Ser Ile Lys Val Leu Lys Gly Leu

1 5 10 15

Asp Ala Val Arg Lys Arg Pro Gly Met Tyr Ile Gly Asp Thr Asp Asp

20 25 30

Gly Thr Gly Leu His His Met Val Phe Glu Val Val Asp Asn Ala Ile

35 40 45

Asp Glu Ala Leu Ala Gly His Cys Lys Glu Ile Ile Val Thr Ile His

50 55 60

Ala Asp Asn Ser Val Ser Val Gln Asp Asp Gly Arg Gly Ile Pro Thr

65 70 75 80

Gly Ile His Pro Glu Glu Gly Val Ser Ala Ala Glu Val Ile Met Thr

85 90 95

Val Leu His Ala Gly Gly Lys Phe Asp Asp Asn Ser Tyr Lys Val Ser

100 105 110

Gly Gly Leu His Gly Val Gly Val Ser Val Val Asn Ala Leu Ser Gln

115 120 125

Lys Leu Glu Leu Val Ile Gln Arg Glu Gly Lys Ile His Arg Gln Ile

130 135 140

Tyr Glu His Gly Val Pro Gln Ala Pro Leu Ala Val Thr Gly Glu Thr

145 150 155 160

Glu Lys Thr Gly Thr Met Val Arg Phe Trp Pro Ser Leu Glu Thr Phe

165 170 175

Thr Asn Val Thr Glu Phe Glu Tyr Glu Ile Leu Ala Lys Arg Leu Arg

180 185 190

Glu Leu Ser Phe Leu Asn Ser Gly Val Ser Ile Arg Leu Arg Asp Lys

195 200 205

Arg Asp Gly Lys Glu Asp His Phe His Tyr Glu Gly Gly Ile Lys Ala

210 215 220

Phe Val Glu Tyr Leu Asn Lys Asn Lys Thr Pro Ile His Pro Asn Ile

225 230 235 240

Phe Tyr Phe Ser Thr Glu Lys Asp Gly Ile Gly Val Glu Val Ala Leu

245 250 255

Gln Trp Asn Asp Gly Phe Gln Glu Asn Ile Tyr Cys Phe Thr Asn Asn

260 265 270

Ile Pro Gln Arg Asp Gly Gly Thr His Leu Ala Gly Phe Arg Ala Ala

275 280 285

Met Thr Arg Thr Leu Asn Ala Tyr Met Asp Lys Glu Gly Tyr Ser Lys

290 295 300

Lys Ala Lys Val Ser Ala Thr Gly Asp Asp Ala Arg Glu Gly Leu Ile

305 310 315 320

Ala Val Val Ser Val Lys Val Pro Asp Pro Lys Phe Ser Ser Gln Thr

325 330 335

Lys Asp Lys Leu Val Ser Ser Glu Val Lys Ser Ala Val Glu Gln Gln

340 345 350

Met Asn Glu Leu Leu Ala Glu Tyr Leu Leu Glu Asn Pro Thr Asp Ala

355 360 365

Lys Ile Val Val Gly Lys Ile Ile Asp Ala Ala Arg Ala Arg Glu Ala

370 375 380

Ala Arg Arg Ala Arg Glu Met Thr Arg Arg Lys Gly Ala Leu Asp Leu

385 390 395 400

Ala Gly Leu Pro Gly Lys Leu Ala Asp Cys Gln Glu Arg Asp Pro Ala

405 410 415

Leu Ser Glu Leu Tyr Leu Val Glu Gly Asp Ser Ala Gly Gly Ser Ala

420 425 430

Lys Gln Gly Arg Asn Arg Lys Asn Gln Ala Ile Leu Pro Leu Lys Gly

435 440 445

Lys Ile Leu Asn Val Glu Lys Ala Arg Phe Asp Lys Met Leu Ser Ser

450 455 460

Gln Glu Val Ala Thr Leu Ile Thr Ala Leu Gly Cys Gly Ile Gly Arg

465 470 475 480

Asp Glu Tyr Asn Pro Asp Lys Leu Arg Tyr His Ser Ile Ile Ile Met

485 490 495

Thr Asp Ala Asp Val Asp Gly Ser His Ile Arg Thr Leu Leu Leu Thr

500 505 510

Phe Phe Tyr Arg Gln Met Pro Glu Ile Val Glu Arg Gly His Val Tyr

515 520 525

Ile Ala Gln Pro Pro Leu Tyr Lys Val Lys Lys Gly Lys Gln Glu Gln

530 535 540

Tyr Ile Lys Asp Asp Glu Ala Met Asp Gln Tyr Gln Ile Ser Ile Ala

545 550 555 560

Leu Asp Gly Ala Thr Leu His Thr Asn Ala Ser Ala Pro Ala Leu Ala

565 570 575

Gly Glu Ala Leu Glu Lys Leu Val Ser Glu Tyr Asn Ala Thr Gln Lys

580 585 590

Met Ile Asn Arg Met Glu Arg Arg Tyr Pro Lys Ala Met Leu Lys Glu

595 600 605

Leu Ile Tyr Gln Pro Thr Leu Thr Glu Ala Asp Leu Ser Asp Glu Gln

610 615 620

Thr Val Thr Arg Trp Val Asn Ala Leu Val Ser Glu Leu Asn Asp Lys

625 630 635 640

Glu Gln His Gly Ser Gln Trp Lys Phe Asp Val His Thr Asn Ala Glu

645 650 655

Gln Asn Leu Phe Glu Pro Ile Val Arg Val Arg Thr His Gly Val Asp

660 665 670

Thr Asp Tyr Pro Leu Asp His Glu Phe Ile Thr Gly Gly Glu Tyr Arg

675 680 685

Arg Ile Cys Thr Leu Gly Glu Lys Leu Arg Gly Leu Leu Glu Glu Asp

690 695 700

Ala Phe Ile Glu Arg Gly Glu Arg Arg Gln Pro Val Ala Ser Phe Glu

705 710 715 720

Gln Ala Leu Asp Trp Leu Val Lys Glu Ser Arg Arg Gly Leu Ser Ile

725 730 735

Gln Arg Tyr Lys Gly Leu Gly Glu Met Asn Pro Glu Gln Leu Trp Glu

740 745 750

Thr Thr Met Asp Pro Glu Ser Arg Arg Met Leu Arg Val Thr Val Lys

755 760 765

Asp Ala Ile Ala Ala Asp Gln Leu Phe Thr Thr Leu Met Gly Asp Ala

770 775 780

Val Glu Pro Arg Arg Ala Phe Ile Glu Glu Asn Ala Leu Lys Ala Ala

785 790 795 800

Asn Ile Asp Ile

<210> 83

<211> 187

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 83

Met Val Gly Ser Leu Asn Cys Ile Val Ala Val Ser Gln Asn Met Gly

1 5 10 15

Ile Gly Lys Asn Gly Asp Leu Pro Trp Pro Pro Leu Arg Asn Glu Phe

20 25 30

Arg Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly Lys Gln

35 40 45

Asn Leu Val Ile Met Gly Lys Lys Thr Trp Phe Ser Ile Pro Glu Lys

50 55 60

Asn Arg Pro Leu Lys Gly Arg Ile Asn Leu Val Leu Ser Arg Glu Leu

65 70 75 80

Lys Glu Pro Pro Gln Gly Ala His Phe Leu Ser Arg Ser Leu Asp Asp

85 90 95

Ala Leu Lys Leu Thr Glu Gln Pro Glu Leu Ala Asn Lys Val Asp Met

100 105 110

Val Trp Ile Val Gly Gly Ser Ser Val Tyr Lys Glu Ala Met Asn His

115 120 125

Pro Gly His Leu Lys Leu Phe Val Thr Arg Ile Met Gln Asp Phe Glu

130 135 140

Ser Asp Thr Phe Phe Pro Glu Ile Asp Leu Glu Lys Tyr Lys Leu Leu

145 150 155 160

Pro Glu Tyr Pro Gly Val Leu Ser Asp Val Gln Glu Glu Lys Gly Ile

165 170 175

Lys Tyr Lys Phe Glu Val Tyr Glu Lys Asn Asp

180 185

<210> 84

<211> 111

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 84

Met Ala Ser Arg Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly

1 5 10 15

Arg Thr Phe Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly

20 25 30

Met Leu Glu Asp Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys

35 40 45

Pro Phe Lys Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu

50 55 60

Glu Gly Val Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile

65 70 75 80

Ser Pro Asp Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro

85 90 95

Pro His Ala Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu

100 105 110

<210> 85

<211> 183

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 85

Met Asn Gly Asp Glu Thr Lys Lys Val Glu Ser Glu Tyr Ile Lys Lys

1 5 10 15

His His Arg His Glu Leu Val Glu Ser Gln Cys Ser Ser Thr Leu Val

20 25 30

Lys His Ile Lys Ala Pro Leu His Leu Val Trp Ser Ile Val Arg Arg

35 40 45

Phe Asp Glu Pro Gln Lys Tyr Lys Pro Phe Ile Ser Arg Cys Val Val

50 55 60

Gln Gly Lys Lys Leu Glu Val Gly Ser Val Arg Glu Val Asp Leu Lys

65 70 75 80

Ser Gly Leu Pro Ala Thr Lys Ser Thr Glu Val Leu Glu Ile Leu Asp

85 90 95

Asp Asn Glu His Ile Leu Gly Ile Arg Ile Val Gly Gly Asp His Arg

100 105 110

Leu Lys Asn Tyr Ser Ser Thr Ile Ser Leu His Ser Glu Thr Ile Asp

115 120 125

Gly Lys Thr Gly Thr Leu Ala Ile Glu Ser Phe Val Val Asp Val Pro

130 135 140

Glu Gly Asn Thr Lys Glu Glu Thr Cys Phe Phe Val Glu Ala Leu Ile

145 150 155 160

Gln Cys Asn Leu Asn Ser Leu Ala Asp Val Thr Glu Arg Leu Gln Ala

165 170 175

Glu Ser Met Glu Lys Lys Ile

180

<210> 86

<211> 161

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 86

Met Glu Thr Ser Gln Lys Tyr His Thr Cys Gly Ser Thr Leu Val Gln

1 5 10 15

Thr Ile Asp Ala Pro Leu Ser Leu Val Trp Ser Ile Leu Arg Arg Phe

20 25 30

Asp Asn Pro Gln Ala Tyr Lys Gln Phe Val Lys Thr Cys Asn Leu Ser

35 40 45

Ser Gly Asp Gly Gly Glu Gly Ser Val Arg Glu Val Thr Val Val Ser

50 55 60

Gly Leu Pro Ala Glu Phe Ser Arg Glu Arg Leu Asp Glu Leu Asp Asp

65 70 75 80

Glu Ser His Val Met Met Ile Ser Ile Ile Gly Gly Asp His Arg Leu

85 90 95

Val Asn Tyr Arg Ser Lys Thr Met Ala Phe Val Ala Ala Asp Thr Glu

100 105 110

Glu Lys Thr Val Val Val Glu Ser Tyr Val Val Asp Val Pro Glu Gly

115 120 125

Asn Ser Glu Glu Glu Thr Thr Ser Phe Ala Asp Thr Ile Val Gly Phe

130 135 140

Asn Leu Lys Ser Leu Ala Lys Leu Ser Glu Arg Val Ala His Leu Lys

145 150 155 160

Leu

<210> 87

<211> 159

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 87

Met Lys Thr Ser Gln Glu Gln His Val Cys Gly Ser Thr Val Val Gln

1 5 10 15

Thr Ile Asn Ala Pro Leu Pro Leu Val Trp Ser Ile Leu Arg Arg Phe

20 25 30

Asp Asn Pro Lys Thr Phe Lys His Phe Val Lys Thr Cys Lys Leu Arg

35 40 45

Ser Gly Asp Gly Gly Glu Gly Ser Val Arg Glu Val Thr Val Val Ser

50 55 60

Asp Leu Pro Ala Ser Phe Ser Leu Glu Arg Leu Asp Glu Leu Asp Asp

65 70 75 80

Glu Ser His Val Met Val Ile Ser Ile Ile Gly Gly Asp His Arg Leu

85 90 95

Val Asn Tyr Gln Ser Lys Thr Thr Val Phe Val Ala Ala Glu Glu Glu

100 105 110

Lys Thr Val Val Val Glu Ser Tyr Val Val Asp Val Pro Glu Gly Asn

115 120 125

Thr Glu Glu Glu Thr Thr Leu Phe Ala Asp Thr Ile Val Gly Cys Asn

130 135 140

Leu Arg Ser Leu Ala Lys Leu Ser Glu Lys Met Met Glu Leu Thr

145 150 155

<210> 88

<211> 164

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 88

Met Glu Ser Ser Lys Gln Lys Arg Cys Arg Ser Ser Val Val Glu Thr

1 5 10 15

Ile Glu Ala Pro Leu Pro Leu Val Trp Ser Ile Leu Arg Ser Phe Asp

20 25 30

Lys Pro Gln Ala Tyr Gln Arg Phe Val Lys Ser Cys Thr Met Arg Ser

35 40 45

Gly Gly Gly Gly Gly Lys Gly Gly Glu Gly Lys Gly Ser Val Arg Asp

50 55 60

Val Thr Leu Val Ser Gly Phe Pro Ala Asp Phe Ser Thr Glu Arg Leu

65 70 75 80

Glu Glu Leu Asp Asp Glu Ser His Val Met Val Val Ser Ile Ile Gly

85 90 95

Gly Asn His Arg Leu Val Asn Tyr Lys Ser Lys Thr Lys Val Val Ala

100 105 110

Ser Pro Glu Asp Met Ala Lys Lys Thr Val Val Val Glu Ser Tyr Val

115 120 125

Val Asp Val Pro Glu Gly Thr Ser Glu Glu Asp Thr Ile Phe Phe Val

130 135 140

Asp Asn Ile Ile Arg Tyr Asn Leu Thr Ser Leu Ala Lys Leu Thr Lys

145 150 155 160

Lys Met Met Lys

<210> 89

<211> 221

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 89

Met Ala Asn Ser Glu Ser Ser Ser Ser Pro Val Asn Glu Glu Glu Asn

1 5 10 15

Ser Gln Arg Ile Ser Thr Leu His His Gln Thr Met Pro Ser Asp Leu

20 25 30

Thr Gln Asp Glu Phe Thr Gln Leu Ser Gln Ser Ile Ala Glu Phe His

35 40 45

Thr Tyr Gln Leu Gly Asn Gly Arg Cys Ser Ser Leu Leu Ala Gln Arg

50 55 60

Ile His Ala Pro Pro Glu Thr Val Trp Ser Val Val Arg Arg Phe Asp

65 70 75 80

Arg Pro Gln Ile Tyr Lys His Phe Ile Lys Ser Cys Asn Val Ser Glu

85 90 95

Asp Phe Glu Met Arg Val Gly Cys Thr Arg Asp Val Asn Val Ile Ser

100 105 110

Gly Leu Pro Ala Asn Thr Ser Arg Glu Arg Leu Asp Leu Leu Asp Asp

115 120 125

Asp Arg Arg Val Thr Gly Phe Ser Ile Thr Gly Gly Glu His Arg Leu

130 135 140

Arg Asn Tyr Lys Ser Val Thr Thr Val His Arg Phe Glu Lys Glu Glu

145 150 155 160

Glu Glu Glu Arg Ile Trp Thr Val Val Leu Glu Ser Tyr Val Val Asp

165 170 175

Val Pro Glu Gly Asn Ser Glu Glu Asp Thr Arg Leu Phe Ala Asp Thr

180 185 190

Val Ile Arg Leu Asn Leu Gln Lys Leu Ala Ser Ile Thr Glu Ala Met

195 200 205

Asn Arg Asn Asn Asn Asn Asn Asn Ser Ser Gln Val Arg

210 215 220

<210> 90

<211> 190

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 90

Met Ser Ser Ser Pro Ala Val Lys Gly Leu Thr Asp Glu Glu Gln Lys

1 5 10 15

Thr Leu Glu Pro Val Ile Lys Thr Tyr His Gln Phe Glu Pro Asp Pro

20 25 30

Thr Thr Cys Thr Ser Leu Ile Thr Gln Arg Ile His Ala Pro Ala Ser

35 40 45

Val Val Trp Pro Leu Ile Arg Arg Phe Asp Asn Pro Glu Arg Tyr Lys

50 55 60

His Phe Val Lys Arg Cys Arg Leu Ile Ser Gly Asp Gly Asp Val Gly

65 70 75 80

Ser Val Arg Glu Val Thr Val Ile Ser Gly Leu Pro Ala Ser Thr Ser

85 90 95

Thr Glu Arg Leu Glu Phe Val Asp Asp Asp His Arg Val Leu Ser Phe

100 105 110

Arg Val Val Gly Gly Glu His Arg Leu Lys Asn Tyr Lys Ser Val Thr

115 120 125

Ser Val Asn Glu Phe Leu Asn Gln Asp Ser Gly Lys Val Tyr Thr Val

130 135 140

Val Leu Glu Ser Tyr Thr Val Asp Ile Pro Glu Gly Asn Thr Glu Glu

145 150 155 160

Asp Thr Lys Met Phe Val Asp Thr Val Val Lys Leu Asn Leu Gln Lys

165 170 175

Leu Gly Val Ala Ala Thr Ser Ala Pro Met His Asp Asp Glu

180 185 190

<210> 91

<211> 209

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 91

Met Asn Leu Ala Pro Ile His Asp Pro Ser Ser Ser Ser Thr Thr Thr

1 5 10 15

Thr Ser Ser Ser Thr Pro Tyr Gly Leu Thr Lys Asp Glu Phe Ser Thr

20 25 30

Leu Asp Ser Ile Ile Arg Thr His His Thr Phe Pro Arg Ser Pro Asn

35 40 45

Thr Cys Thr Ser Leu Ile Ala His Arg Val Asp Ala Pro Ala His Ala

50 55 60

Ile Trp Arg Phe Val Arg Asp Phe Ala Asn Pro Asn Lys Tyr Lys His

65 70 75 80

Phe Ile Lys Ser Cys Thr Ile Arg Val Asn Gly Asn Gly Ile Lys Glu

85 90 95

Ile Lys Val Gly Thr Ile Arg Glu Val Ser Val Val Ser Gly Leu Pro

100 105 110

Ala Ser Thr Ser Val Glu Ile Leu Glu Val Leu Asp Glu Glu Lys Arg

115 120 125

Ile Leu Ser Phe Arg Val Leu Gly Gly Glu His Arg Leu Asn Asn Tyr

130 135 140

Arg Ser Val Thr Ser Val Asn Glu Phe Val Val Leu Glu Lys Asp Lys

145 150 155 160

Lys Lys Arg Val Tyr Ser Val Val Leu Glu Ser Tyr Ile Val Asp Ile

165 170 175

Pro Gln Gly Asn Thr Glu Glu Asp Thr Arg Met Phe Val Asp Thr Val

180 185 190

Val Lys Ser Asn Leu Gln Asn Leu Ala Val Ile Ser Thr Ala Ser Pro

195 200 205

Thr

<210> 92

<211> 207

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 92

Met Leu Ala Val His Arg Pro Ser Ser Ala Val Ser Asp Gly Asp Ser

1 5 10 15

Val Gln Ile Pro Met Met Ile Ala Ser Phe Gln Lys Arg Phe Pro Ser

20 25 30

Leu Ser Arg Asp Ser Thr Ala Ala Arg Phe His Thr His Glu Val Gly

35 40 45

Pro Asn Gln Cys Cys Ser Ala Val Ile Gln Glu Ile Ser Ala Pro Ile

50 55 60

Ser Thr Val Trp Ser Val Val Arg Arg Phe Asp Asn Pro Gln Ala Tyr

65 70 75 80

Lys His Phe Leu Lys Ser Cys Ser Val Ile Gly Gly Asp Gly Asp Asn

85 90 95

Val Gly Ser Leu Arg Gln Val His Val Val Ser Gly Leu Pro Ala Ala

100 105 110

Ser Ser Thr Glu Arg Leu Asp Ile Leu Asp Asp Glu Arg His Val Ile

115 120 125

Ser Phe Ser Val Val Gly Gly Asp His Arg Leu Ser Asn Tyr Arg Ser

130 135 140

Val Thr Thr Leu His Pro Ser Pro Ile Ser Gly Thr Val Val Val Glu

145 150 155 160

Ser Tyr Val Val Asp Val Pro Pro Gly Asn Thr Lys Glu Glu Thr Cys

165 170 175

Asp Phe Val Asp Val Ile Val Arg Cys Asn Leu Gln Ser Leu Ala Lys

180 185 190

Ile Ala Glu Asn Thr Ala Ala Glu Ser Lys Lys Lys Met Ser Leu

195 200 205

<210> 93

<211> 203

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 93

Met Arg Ser Pro Val Gln Leu Gln His Gly Ser Asp Ala Thr Asn Gly

1 5 10 15

Phe His Thr Leu Gln Pro His Asp Gln Thr Asp Gly Pro Ile Lys Arg

20 25 30

Val Cys Leu Thr Arg Gly Met His Val Pro Glu His Val Ala Met His

35 40 45

His Thr His Asp Val Gly Pro Asp Gln Cys Cys Ser Ser Val Val Gln

50 55 60

Met Ile His Ala Pro Pro Glu Ser Val Trp Ala Leu Val Arg Arg Phe

65 70 75 80

Asp Asn Pro Lys Val Tyr Lys Asn Phe Ile Arg Gln Cys Arg Ile Val

85 90 95

Gln Gly Asp Gly Leu His Val Gly Asp Leu Arg Glu Val Met Val Val

100 105 110

Ser Gly Leu Pro Ala Val Ser Ser Thr Glu Arg Leu Glu Ile Leu Asp

115 120 125

Glu Glu Arg His Val Ile Ser Phe Ser Val Val Gly Gly Asp His Arg

130 135 140

Leu Lys Asn Tyr Arg Ser Val Thr Thr Leu His Ala Ser Asp Asp Glu

145 150 155 160

Gly Thr Val Val Val Glu Ser Tyr Ile Val Asp Val Pro Pro Gly Asn

165 170 175

Thr Glu Glu Glu Thr Leu Ser Phe Val Asp Thr Ile Val Arg Cys Asn

180 185 190

Leu Gln Ser Leu Ala Arg Ser Thr Asn Arg Gln

195 200

<210> 94

<211> 215

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 94

Met Pro Thr Ser Ile Gln Phe Gln Arg Ser Ser Thr Ala Ala Glu Ala

1 5 10 15

Ala Asn Ala Thr Val Arg Asn Tyr Pro His His His Gln Lys Gln Val

20 25 30

Gln Lys Val Ser Leu Thr Arg Gly Met Ala Asp Val Pro Glu His Val

35 40 45

Glu Leu Ser His Thr His Val Val Gly Pro Ser Gln Cys Phe Ser Val

50 55 60

Val Val Gln Asp Val Glu Ala Pro Val Ser Thr Val Trp Ser Ile Leu

65 70 75 80

Ser Arg Phe Glu His Pro Gln Ala Tyr Lys His Phe Val Lys Ser Cys

85 90 95

His Val Val Ile Gly Asp Gly Arg Glu Val Gly Ser Val Arg Glu Val

100 105 110

Arg Val Val Ser Gly Leu Pro Ala Ala Phe Ser Leu Glu Arg Leu Glu

115 120 125

Ile Met Asp Asp Asp Arg His Val Ile Ser Phe Ser Val Val Gly Gly

130 135 140

Asp His Arg Leu Met Asn Tyr Lys Ser Val Thr Thr Val His Glu Ser

145 150 155 160

Glu Glu Asp Ser Asp Gly Lys Lys Arg Thr Arg Val Val Glu Ser Tyr

165 170 175

Val Val Asp Val Pro Ala Gly Asn Asp Lys Glu Glu Thr Cys Ser Phe

180 185 190

Ala Asp Thr Ile Val Arg Cys Asn Leu Gln Ser Leu Ala Lys Leu Ala

195 200 205

Glu Asn Thr Ser Lys Phe Ser

210 215

<210> 95

<211> 211

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 95

Met Glu Met Ile Gly Gly Asp Asp Thr Asp Thr Glu Met Tyr Gly Ala

1 5 10 15

Leu Val Thr Ala Gln Ser Leu Arg Leu Arg His Leu His His Cys Arg

20 25 30

Glu Asn Gln Cys Thr Ser Val Leu Val Lys Tyr Ile Gln Ala Pro Val

35 40 45

His Leu Val Trp Ser Leu Val Arg Arg Phe Asp Gln Pro Gln Lys Tyr

50 55 60

Lys Pro Phe Ile Ser Arg Cys Thr Val Asn Gly Asp Pro Glu Ile Gly

65 70 75 80

Cys Leu Arg Glu Val Asn Val Lys Ser Gly Leu Pro Ala Thr Thr Ser

85 90 95

Thr Glu Arg Leu Glu Gln Leu Asp Asp Glu Glu His Ile Leu Gly Ile

100 105 110

Asn Ile Ile Gly Gly Asp His Arg Leu Lys Asn Tyr Ser Ser Ile Leu

115 120 125

Thr Val His Pro Glu Met Ile Asp Gly Arg Ser Gly Thr Met Val Met

130 135 140

Glu Ser Phe Val Val Asp Val Pro Gln Gly Asn Thr Lys Asp Asp Thr

145 150 155 160

Cys Tyr Phe Val Glu Ser Leu Ile Lys Cys Asn Leu Lys Ser Leu Ala

165 170 175

Cys Val Ser Glu Arg Leu Ala Ala Gln Asp Ile Thr Asn Ser Ile Ala

180 185 190

Thr Phe Cys Asn Ala Ser Asn Gly Tyr Arg Glu Lys Asn His Thr Glu

195 200 205

Thr Asn Leu

210

<210> 96

<211> 188

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 96

Met Glu Ala Asn Gly Ile Glu Asn Leu Thr Asn Pro Asn Gln Glu Arg

1 5 10 15

Glu Phe Ile Arg Arg His His Lys His Glu Leu Val Asp Asn Gln Cys

20 25 30

Ser Ser Thr Leu Val Lys His Ile Asn Ala Pro Val His Ile Val Trp

35 40 45

Ser Leu Val Arg Arg Phe Asp Gln Pro Gln Lys Tyr Lys Pro Phe Ile

50 55 60

Ser Arg Cys Val Val Lys Gly Asn Met Glu Ile Gly Thr Val Arg Glu

65 70 75 80

Val Asp Val Lys Ser Gly Leu Pro Ala Thr Arg Ser Thr Glu Arg Leu

85 90 95

Glu Leu Leu Asp Asp Asn Glu His Ile Leu Ser Ile Arg Ile Val Gly

100 105 110

Gly Asp His Arg Leu Lys Asn Tyr Ser Ser Ile Ile Ser Leu His Pro

115 120 125

Glu Thr Ile Glu Gly Arg Ile Gly Thr Leu Val Ile Glu Ser Phe Val

130 135 140

Val Asp Val Pro Glu Gly Asn Thr Lys Asp Glu Thr Cys Tyr Phe Val

145 150 155 160

Glu Ala Leu Ile Lys Cys Asn Leu Lys Ser Leu Ala Asp Ile Ser Glu

165 170 175

Arg Leu Ala Val Gln Asp Thr Thr Glu Ser Arg Val

180 185

<210> 97

<211> 187

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 97

Met Met Asp Gly Val Glu Gly Gly Thr Ala Met Tyr Gly Gly Leu Glu

1 5 10 15

Thr Val Gln Tyr Val Arg Thr His His Gln His Leu Cys Arg Glu Asn

20 25 30

Gln Cys Thr Ser Ala Leu Val Lys His Ile Lys Ala Pro Leu His Leu

35 40 45

Val Trp Ser Leu Val Arg Arg Phe Asp Gln Pro Gln Lys Tyr Lys Pro

50 55 60

Phe Val Ser Arg Cys Thr Val Ile Gly Asp Pro Glu Ile Gly Ser Leu

65 70 75 80

Arg Glu Val Asn Val Lys Ser Gly Leu Pro Ala Thr Thr Ser Thr Glu

85 90 95

Arg Leu Glu Leu Leu Asp Asp Glu Glu His Ile Leu Gly Ile Lys Ile

100 105 110

Ile Gly Gly Asp His Arg Leu Lys Asn Tyr Ser Ser Ile Leu Thr Val

115 120 125

His Pro Glu Ile Ile Glu Gly Arg Ala Gly Thr Met Val Ile Glu Ser

130 135 140

Phe Val Val Asp Val Pro Gln Gly Asn Thr Lys Asp Glu Thr Cys Tyr

145 150 155 160

Phe Val Glu Ala Leu Ile Arg Cys Asn Leu Lys Ser Leu Ala Asp Val

165 170 175

Ser Glu Arg Leu Ala Ser Gln Asp Ile Thr Gln

180 185

<210> 98

<211> 191

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 98

Met Pro Ser Glu Leu Thr Pro Glu Glu Arg Ser Glu Leu Lys Asn Ser

1 5 10 15

Ile Ala Glu Phe His Thr Tyr Gln Leu Asp Pro Gly Ser Cys Ser Ser

20 25 30

Leu His Ala Gln Arg Ile His Ala Pro Pro Glu Leu Val Trp Ser Ile

35 40 45

Val Arg Arg Phe Asp Lys Pro Gln Thr Tyr Lys His Phe Ile Lys Ser

50 55 60

Cys Ser Val Glu Gln Asn Phe Glu Met Arg Val Gly Cys Thr Arg Asp

65 70 75 80

Val Ile Val Ile Ser Gly Leu Pro Ala Asn Thr Ser Thr Glu Arg Leu

85 90 95

Asp Ile Leu Asp Asp Glu Arg Arg Val Thr Gly Phe Ser Ile Ile Gly

100 105 110

Gly Glu His Arg Leu Thr Asn Tyr Lys Ser Val Thr Thr Val His Arg

115 120 125

Phe Glu Lys Glu Asn Arg Ile Trp Thr Val Val Leu Glu Ser Tyr Val

130 135 140

Val Asp Met Pro Glu Gly Asn Ser Glu Asp Asp Thr Arg Met Phe Ala

145 150 155 160

Asp Thr Val Val Lys Leu Asn Leu Gln Lys Leu Ala Thr Val Ala Glu

165 170 175

Ala Met Ala Arg Asn Ser Gly Asp Gly Ser Gly Ser Gln Val Thr

180 185 190

<210> 99

<211> 434

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 99

Met Glu Glu Val Ser Pro Ala Ile Ala Gly Pro Phe Arg Pro Phe Ser

1 5 10 15

Glu Thr Gln Met Asp Phe Thr Gly Ile Arg Leu Gly Lys Gly Tyr Cys

20 25 30

Asn Asn Gln Tyr Ser Asn Gln Asp Ser Glu Asn Gly Asp Leu Met Val

35 40 45

Ser Leu Pro Glu Thr Ser Ser Cys Ser Val Ser Gly Ser His Gly Ser

50 55 60

Glu Ser Arg Lys Val Leu Ile Ser Arg Ile Asn Ser Pro Asn Leu Asn

65 70 75 80

Met Lys Glu Ser Ala Ala Ala Asp Ile Val Val Val Asp Ile Ser Ala

85 90 95

Gly Asp Glu Ile Asn Gly Ser Asp Ile Thr Ser Glu Lys Lys Met Ile

100 105 110

Ser Arg Thr Glu Ser Arg Ser Leu Phe Glu Phe Lys Ser Val Pro Leu

115 120 125

Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Asp Ala

130 135 140

Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser Met Leu

145 150 155 160

Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly Val Tyr

165 170 175

Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu Arg Met

180 185 190

His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met Leu Cys

195 200 205

Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe Asn Ser

210 215 220

Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro Glu Thr Val

225 230 235 240

Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile Phe Val

245 250 255

Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys Thr Ala

260 265 270

Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu Ala Ala

275 280 285

Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly Ala Arg

290 295 300

Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg Tyr Leu

305 310 315 320

Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys Arg Val

325 330 335

Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp Asp Val

340 345 350

Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile Leu Leu

355 360 365

Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu Ala Asp

370 375 380

Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala Ala Glu

385 390 395 400

Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn Ile Ser

405 410 415

Val Val Val Val Asp Leu Lys Pro Arg Arg Lys Leu Lys Ser Lys Pro

420 425 430

Leu Asn

<210> 100

<211> 423

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 100

Met Asp Glu Val Ser Pro Ala Val Ala Val Pro Phe Arg Pro Phe Thr

1 5 10 15

Asp Pro His Ala Gly Leu Arg Gly Tyr Cys Asn Gly Glu Ser Arg Val

20 25 30

Thr Leu Pro Glu Ser Ser Cys Ser Gly Asp Gly Ala Met Lys Asp Ser

35 40 45

Ser Phe Glu Ile Asn Thr Arg Gln Asp Ser Leu Thr Ser Ser Ser Ser

50 55 60

Ala Met Ala Gly Val Asp Ile Ser Ala Gly Asp Glu Ile Asn Gly Ser

65 70 75 80

Asp Glu Phe Asp Pro Arg Ser Met Asn Gln Ser Glu Lys Lys Val Leu

85 90 95

Ser Arg Thr Glu Ser Arg Ser Leu Phe Glu Phe Lys Cys Val Pro Leu

100 105 110

Tyr Gly Val Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Asp Ser

115 120 125

Val Ser Thr Ile Pro Arg Phe Leu Gln Val Ser Ser Ser Ser Leu Leu

130 135 140

Asp Gly Arg Val Thr Asn Gly Phe Asn Pro His Leu Ser Ala His Phe

145 150 155 160

Phe Gly Val Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys

165 170 175

Arg Glu Arg Met His Leu Ala Leu Thr Glu Glu Ile Val Lys Glu Lys

180 185 190

Pro Glu Phe Cys Asp Gly Asp Thr Trp Gln Glu Lys Trp Lys Lys Ala

195 200 205

Leu Phe Asn Ser Phe Met Arg Val Asp Ser Glu Ile Glu Thr Val Ala

210 215 220

His Ala Pro Glu Thr Val Gly Ser Thr Ser Val Val Ala Val Val Phe

225 230 235 240

Pro Thr His Ile Phe Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu

245 250 255

Cys Arg Gly Lys Thr Pro Leu Ala Leu Ser Val Asp His Lys Pro Asp

260 265 270

Arg Asp Asp Glu Ala Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile

275 280 285

Arg Trp Asn Gly Ala Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser

290 295 300

Ile Gly Asp Arg Tyr Leu Lys Pro Ser Val Ile Pro Asp Pro Glu Val

305 310 315 320

Thr Ser Val Arg Arg Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser

325 330 335

Asp Gly Leu Trp Asp Val Met Thr Asn Glu Glu Val Cys Asp Leu Ala

340 345 350

Arg Lys Arg Ile Leu Leu Trp His Lys Lys Asn Ala Met Ala Gly Glu

355 360 365

Ala Leu Leu Pro Ala Glu Lys Arg Gly Glu Gly Lys Asp Pro Ala Ala

370 375 380

Met Ser Ala Ala Glu Tyr Leu Ser Lys Met Ala Leu Gln Lys Gly Ser

385 390 395 400

Lys Asp Asn Ile Ser Val Val Val Val Asp Leu Lys Gly Ile Arg Lys

405 410 415

Phe Lys Ser Lys Ser Leu Asn

420

<210> 101

<211> 612

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 101

Met Lys Met Asp Lys Lys Thr Ile Val Trp Phe Arg Arg Asp Leu Arg

1 5 10 15

Ile Glu Asp Asn Pro Ala Leu Ala Ala Ala Ala His Glu Gly Ser Val

20 25 30

Phe Pro Val Phe Ile Trp Cys Pro Glu Glu Glu Gly Gln Phe Tyr Pro

35 40 45

Gly Arg Ala Ser Arg Trp Trp Met Lys Gln Ser Leu Ala His Leu Ser

50 55 60

Gln Ser Leu Lys Ala Leu Gly Ser Asp Leu Thr Leu Ile Lys Thr His

65 70 75 80

Asn Thr Ile Ser Ala Ile Leu Asp Cys Ile Arg Val Thr Gly Ala Thr

85 90 95

Lys Val Val Phe Asn His Leu Tyr Asp Pro Val Ser Leu Val Arg Asp

100 105 110

His Thr Val Lys Glu Lys Leu Val Glu Arg Gly Ile Ser Val Gln Ser

115 120 125

Tyr Asn Gly Asp Leu Leu Tyr Glu Pro Trp Glu Ile Tyr Cys Glu Lys

130 135 140

Gly Lys Pro Phe Thr Ser Phe Asn Ser Tyr Trp Lys Lys Cys Leu Asp

145 150 155 160

Met Ser Ile Glu Ser Val Met Leu Pro Pro Pro Trp Arg Leu Met Pro

165 170 175

Ile Thr Ala Ala Ala Glu Ala Ile Trp Ala Cys Ser Ile Glu Glu Leu

180 185 190

Gly Leu Glu Asn Glu Ala Glu Lys Pro Ser Asn Ala Leu Leu Thr Arg

195 200 205

Ala Trp Ser Pro Gly Trp Ser Asn Ala Asp Lys Leu Leu Asn Glu Phe

210 215 220

Ile Glu Lys Gln Leu Ile Asp Tyr Ala Lys Asn Ser Lys Lys Val Val

225 230 235 240

Gly Asn Ser Thr Ser Leu Leu Ser Pro Tyr Leu His Phe Gly Glu Ile

245 250 255

Ser Val Arg His Val Phe Gln Cys Ala Arg Met Lys Gln Ile Ile Trp

260 265 270

Ala Arg Asp Lys Asn Ser Glu Gly Glu Glu Ser Ala Asp Leu Phe Leu

275 280 285

Arg Gly Ile Gly Leu Arg Glu Tyr Ser Arg Tyr Ile Cys Phe Asn Phe

290 295 300

Pro Phe Thr His Glu Gln Ser Leu Leu Ser His Leu Arg Phe Phe Pro

305 310 315 320

Trp Asp Ala Asp Val Asp Lys Phe Lys Ala Trp Arg Gln Gly Arg Thr

325 330 335

Gly Tyr Pro Leu Val Asp Ala Gly Met Arg Glu Leu Trp Ala Thr Gly

340 345 350

Trp Met His Asn Arg Ile Arg Val Ile Val Ser Ser Phe Ala Val Lys

355 360 365

Phe Leu Leu Leu Pro Trp Lys Trp Gly Met Lys Tyr Phe Trp Asp Thr

370 375 380

Leu Leu Asp Ala Asp Leu Glu Cys Asp Ile Leu Gly Trp Gln Tyr Ile

385 390 395 400

Ser Gly Ser Ile Pro Asp Gly His Glu Leu Asp Arg Leu Asp Asn Pro

405 410 415

Ala Leu Gln Gly Ala Lys Tyr Asp Pro Glu Gly Glu Tyr Ile Arg Gln

420 425 430

Trp Leu Pro Glu Leu Ala Arg Leu Pro Thr Glu Trp Ile His His Pro

435 440 445

Trp Asp Ala Pro Leu Thr Val Leu Lys Ala Ser Gly Val Glu Leu Gly

450 455 460

Thr Asn Tyr Ala Lys Pro Ile Val Asp Ile Asp Thr Ala Arg Glu Leu

465 470 475 480

Leu Ala Lys Ala Ile Ser Arg Thr Arg Glu Ala Gln Ile Met Ile Gly

485 490 495

Ala Ala Pro Asp Glu Ile Val Ala Asp Ser Phe Glu Ala Leu Gly Ala

500 505 510

Asn Thr Ile Lys Glu Pro Gly Leu Cys Pro Ser Val Ser Ser Asn Asp

515 520 525

Gln Gln Val Pro Ser Ala Val Arg Tyr Asn Gly Ser Lys Arg Val Lys

530 535 540

Pro Glu Glu Glu Glu Glu Arg Asp Met Lys Lys Ser Arg Gly Phe Asp

545 550 555 560

Glu Arg Glu Leu Phe Ser Thr Ala Glu Ser Ser Ser Ser Ser Ser Val

565 570 575

Phe Phe Val Ser Gln Ser Cys Ser Leu Ala Ser Glu Gly Lys Asn Leu

580 585 590

Glu Gly Ile Gln Asp Ser Ser Asp Gln Ile Thr Thr Ser Leu Gly Lys

595 600 605

Asn Gly Cys Lys

610

<210> 102

<211> 335

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 102

Met Asn Gly Ala Ile Gly Gly Asp Leu Leu Leu Asn Phe Pro Asp Met

1 5 10 15

Ser Val Leu Glu Arg Gln Arg Ala His Leu Lys Tyr Leu Asn Pro Thr

20 25 30

Phe Asp Ser Pro Leu Ala Gly Phe Phe Ala Asp Ser Ser Met Ile Thr

35 40 45

Gly Gly Glu Met Asp Ser Tyr Leu Ser Thr Ala Gly Leu Asn Leu Pro

50 55 60

Met Met Tyr Gly Glu Thr Thr Val Glu Gly Asp Ser Arg Leu Ser Ile

65 70 75 80

Ser Pro Glu Thr Thr Leu Gly Thr Gly Asn Phe Lys Lys Arg Lys Phe

85 90 95

Asp Thr Glu Thr Lys Asp Cys Asn Glu Lys Lys Lys Lys Met Thr Met

100 105 110

Asn Arg Asp Asp Leu Val Glu Glu Gly Glu Glu Glu Lys Ser Lys Ile

115 120 125

Thr Glu Gln Asn Asn Gly Ser Thr Lys Ser Ile Lys Lys Met Lys His

130 135 140

Lys Ala Lys Lys Glu Glu Asn Asn Phe Ser Asn Asp Ser Ser Lys Val

145 150 155 160

Thr Lys Glu Leu Glu Lys Thr Asp Tyr Ile His Val Arg Ala Arg Arg

165 170 175

Gly Gln Ala Thr Asp Ser His Ser Ile Ala Glu Arg Val Arg Arg Glu

180 185 190

Lys Ile Ser Glu Arg Met Lys Phe Leu Gln Asp Leu Val Pro Gly Cys

195 200 205

Asp Lys Ile Thr Gly Lys Ala Gly Met Leu Asp Glu Ile Ile Asn Tyr

210 215 220

Val Gln Ser Leu Gln Arg Gln Ile Glu Phe Leu Ser Met Lys Leu Ala

225 230 235 240

Ile Val Asn Pro Arg Pro Asp Phe Asp Met Asp Asp Ile Phe Ala Lys

245 250 255

Glu Val Ala Ser Thr Pro Met Thr Val Val Pro Ser Pro Glu Met Val

260 265 270

Leu Ser Gly Tyr Ser His Glu Met Val His Ser Gly Tyr Ser Ser Glu

275 280 285

Met Val Asn Ser Gly Tyr Leu His Val Asn Pro Met Gln Gln Val Asn

290 295 300

Thr Ser Ser Asp Pro Leu Ser Cys Phe Asn Asn Gly Glu Ala Pro Ser

305 310 315 320

Met Trp Asp Ser His Val Gln Asn Leu Tyr Gly Asn Leu Gly Val

325 330 335

<210> 103

<211> 533

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 103

Met Lys Arg Asp His His His His His His Gln Asp Lys Lys Thr Met

1 5 10 15

Met Met Asn Glu Glu Asp Asp Gly Asn Gly Met Asp Glu Leu Leu Ala

20 25 30

Val Leu Gly Tyr Lys Val Arg Ser Ser Glu Met Ala Asp Val Ala Gln

35 40 45

Lys Leu Glu Gln Leu Glu Val Met Met Ser Asn Val Gln Glu Asp Asp

50 55 60

Leu Ser Gln Leu Ala Thr Glu Thr Val His Tyr Asn Pro Ala Glu Leu

65 70 75 80

Tyr Thr Trp Leu Asp Ser Met Leu Thr Asp Leu Asn Pro Pro Ser Ser

85 90 95

Asn Ala Glu Tyr Asp Leu Lys Ala Ile Pro Gly Asp Ala Ile Leu Asn

100 105 110

Gln Phe Ala Ile Asp Ser Ala Ser Ser Ser Asn Gln Gly Gly Gly Gly

115 120 125

Asp Thr Tyr Thr Thr Asn Lys Arg Leu Lys Cys Ser Asn Gly Val Val

130 135 140

Glu Thr Thr Thr Ala Thr Ala Glu Ser Thr Arg His Val Val Leu Val

145 150 155 160

Asp Ser Gln Glu Asn Gly Val Arg Leu Val His Ala Leu Leu Ala Cys

165 170 175

Ala Glu Ala Val Gln Lys Glu Asn Leu Thr Val Ala Glu Ala Leu Val

180 185 190

Lys Gln Ile Gly Phe Leu Ala Val Ser Gln Ile Gly Ala Met Arg Lys

195 200 205

Val Ala Thr Tyr Phe Ala Glu Ala Leu Ala Arg Arg Ile Tyr Arg Leu

210 215 220

Ser Pro Ser Gln Ser Pro Ile Asp His Ser Leu Ser Asp Thr Leu Gln

225 230 235 240

Met His Phe Tyr Glu Thr Cys Pro Tyr Leu Lys Phe Ala His Phe Thr

245 250 255

Ala Asn Gln Ala Ile Leu Glu Ala Phe Gln Gly Lys Lys Arg Val His

260 265 270

Val Ile Asp Phe Ser Met Ser Gln Gly Leu Gln Trp Pro Ala Leu Met

275 280 285

Gln Ala Leu Ala Leu Arg Pro Gly Gly Pro Pro Val Phe Arg Leu Thr

290 295 300

Gly Ile Gly Pro Pro Ala Pro Asp Asn Phe Asp Tyr Leu His Glu Val

305 310 315 320

Gly Cys Lys Leu Ala His Leu Ala Glu Ala Ile His Val Glu Phe Glu

325 330 335

Tyr Arg Gly Phe Val Ala Asn Thr Leu Ala Asp Leu Asp Ala Ser Met

340 345 350

Leu Glu Leu Arg Pro Ser Glu Ile Glu Ser Val Ala Val Asn Ser Val

355 360 365

Phe Glu Leu His Lys Leu Leu Gly Arg Pro Gly Ala Ile Asp Lys Val

370 375 380

Leu Gly Val Val Asn Gln Ile Lys Pro Glu Ile Phe Thr Val Val Glu

385 390 395 400

Gln Glu Ser Asn His Asn Ser Pro Ile Phe Leu Asp Arg Phe Thr Glu

405 410 415

Ser Leu His Tyr Tyr Ser Thr Leu Phe Asp Ser Leu Glu Gly Val Pro

420 425 430

Ser Gly Gln Asp Lys Val Met Ser Glu Val Tyr Leu Gly Lys Gln Ile

435 440 445

Cys Asn Val Val Ala Cys Asp Gly Pro Asp Arg Val Glu Arg His Glu

450 455 460

Thr Leu Ser Gln Trp Arg Asn Arg Phe Gly Ser Ala Gly Phe Ala Ala

465 470 475 480

Ala His Ile Gly Ser Asn Ala Phe Lys Gln Ala Ser Met Leu Leu Ala

485 490 495

Leu Phe Asn Gly Gly Glu Gly Tyr Arg Val Glu Glu Ser Asp Gly Cys

500 505 510

Leu Met Leu Gly Trp His Thr Arg Pro Leu Ile Ala Thr Ser Ala Trp

515 520 525

Lys Leu Ser Thr Asn

530

<210> 104

<211> 345

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 104

Met Ala Ala Ser Asp Glu Val Asn Leu Ile Glu Ser Arg Thr Val Val

1 5 10 15

Pro Leu Asn Thr Trp Val Leu Ile Ser Asn Phe Lys Val Ala Tyr Asn

20 25 30

Ile Leu Arg Arg Pro Asp Gly Thr Phe Asn Arg His Leu Ala Glu Tyr

35 40 45

Leu Asp Arg Lys Val Thr Ala Asn Ala Asn Pro Val Asp Gly Val Phe

50 55 60

Ser Phe Asp Val Leu Ile Asp Arg Arg Ile Asn Leu Leu Ser Arg Val

65 70 75 80

Tyr Arg Pro Ala Tyr Ala Asp Gln Glu Gln Pro Pro Ser Ile Leu Asp

85 90 95

Leu Glu Lys Pro Val Asp Gly Asp Ile Val Pro Val Ile Leu Phe Phe

100 105 110

His Gly Gly Ser Phe Ala His Ser Ser Ala Asn Ser Ala Ile Tyr Asp

115 120 125

Thr Leu Cys Arg Arg Leu Val Gly Leu Cys Lys Cys Val Val Val Ser

130 135 140

Val Asn Tyr Arg Arg Ala Pro Glu Asn Pro Tyr Pro Cys Ala Tyr Asp

145 150 155 160

Asp Gly Trp Ile Ala Leu Asn Trp Val Asn Ser Arg Ser Trp Leu Lys

165 170 175

Ser Lys Lys Asp Ser Lys Val His Ile Phe Leu Ala Gly Asp Ser Ser

180 185 190

Gly Gly Asn Ile Ala His Asn Val Ala Leu Arg Ala Gly Glu Ser Gly

195 200 205

Ile Asp Val Leu Gly Asn Ile Leu Leu Asn Pro Met Phe Gly Gly Asn

210 215 220

Glu Arg Thr Glu Ser Glu Lys Ser Leu Asp Gly Lys Tyr Phe Val Thr

225 230 235 240

Val Arg Asp Arg Asp Trp Tyr Trp Lys Ala Phe Leu Pro Glu Gly Glu

245 250 255

Asp Arg Glu His Pro Ala Cys Asn Pro Phe Ser Pro Arg Gly Lys Ser

260 265 270

Leu Glu Gly Val Ser Phe Pro Lys Ser Leu Val Val Val Ala Gly Leu

275 280 285

Asp Leu Ile Arg Asp Trp Gln Leu Ala Tyr Ala Glu Gly Leu Lys Lys

290 295 300

Ala Gly Gln Glu Val Lys Leu Met His Leu Glu Lys Ala Thr Val Gly

305 310 315 320

Phe Tyr Leu Leu Pro Asn Asn Asn His Phe His Asn Val Met Asp Glu

325 330 335

Ile Ser Ala Phe Val Asn Ala Glu Cys

340 345

<210> 105

<211> 358

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 105

Met Ala Gly Gly Asn Glu Val Asn Leu Asn Glu Cys Lys Arg Ile Val

1 5 10 15

Pro Leu Asn Thr Trp Val Leu Ile Ser Asn Phe Lys Leu Ala Tyr Lys

20 25 30

Val Leu Arg Arg Pro Asp Gly Ser Phe Asn Arg Asp Leu Ala Glu Phe

35 40 45

Leu Asp Arg Lys Val Pro Ala Asn Ser Phe Pro Leu Asp Gly Val Phe

50 55 60

Ser Phe Asp His Val Asp Ser Thr Thr Asn Leu Leu Thr Arg Ile Tyr

65 70 75 80

Gln Pro Ala Ser Leu Leu His Gln Thr Arg His Gly Thr Leu Glu Leu

85 90 95

Thr Lys Pro Leu Ser Thr Thr Glu Ile Val Pro Val Leu Ile Phe Phe

100 105 110

His Gly Gly Ser Phe Thr His Ser Ser Ala Asn Ser Ala Ile Tyr Asp

115 120 125

Thr Phe Cys Arg Arg Leu Val Thr Ile Cys Gly Val Val Val Val Ser

130 135 140

Val Asp Tyr Arg Arg Ser Pro Glu His Arg Tyr Pro Cys Ala Tyr Asp

145 150 155 160

Asp Gly Trp Asn Ala Leu Asn Trp Val Lys Ser Arg Val Trp Leu Gln

165 170 175

Ser Gly Lys Asp Ser Asn Val Tyr Val Tyr Leu Ala Gly Asp Ser Ser

180 185 190

Gly Gly Asn Ile Ala His Asn Val Ala Val Arg Ala Thr Asn Glu Gly

195 200 205

Val Lys Val Leu Gly Asn Ile Leu Leu His Pro Met Phe Gly Gly Gln

210 215 220

Glu Arg Thr Gln Ser Glu Lys Thr Leu Asp Gly Lys Tyr Phe Val Thr

225 230 235 240

Ile Gln Asp Arg Asp Trp Tyr Trp Arg Ala Tyr Leu Pro Glu Gly Glu

245 250 255

Asp Arg Asp His Pro Ala Cys Asn Pro Phe Gly Pro Arg Gly Gln Ser

260 265 270

Leu Lys Gly Val Asn Phe Pro Lys Ser Leu Val Val Val Ala Gly Leu

275 280 285

Asp Leu Val Gln Asp Trp Gln Leu Ala Tyr Val Asp Gly Leu Lys Lys

290 295 300

Thr Gly Leu Glu Val Asn Leu Leu Tyr Leu Lys Gln Ala Thr Ile Gly

305 310 315 320

Phe Tyr Phe Leu Pro Asn Asn Asp His Phe His Cys Leu Met Glu Glu

325 330 335

Leu Asn Lys Phe Val His Ser Ile Glu Asp Ser Gln Ser Lys Ser Ser

340 345 350

Pro Val Leu Leu Thr Pro

355

<210> 106

<211> 344

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 106

Met Ala Gly Ser Glu Glu Val Asn Leu Ile Glu Ser Lys Thr Val Val

1 5 10 15

Pro Leu Asn Thr Trp Val Leu Ile Ser Asn Phe Lys Leu Ala Tyr Asn

20 25 30

Leu Leu Arg Arg Pro Asp Gly Thr Phe Asn Arg His Leu Ala Glu Phe

35 40 45

Leu Asp Arg Lys Val Pro Ala Asn Ala Asn Pro Val Asn Gly Val Phe

50 55 60

Ser Phe Asp Val Ile Ile Asp Arg Gln Thr Asn Leu Leu Ser Arg Val

65 70 75 80

Tyr Arg Pro Ala Asp Ala Gly Thr Ser Pro Ser Ile Thr Asp Leu Gln

85 90 95

Asn Pro Val Asp Gly Glu Ile Val Pro Val Ile Val Phe Phe His Gly

100 105 110

Gly Ser Phe Ala His Ser Ser Ala Asn Ser Ala Ile Tyr Asp Thr Leu

115 120 125

Cys Arg Arg Leu Val Gly Leu Cys Gly Ala Val Val Val Ser Val Asn

130 135 140

Tyr Arg Arg Ala Pro Glu Asn Arg Tyr Pro Cys Ala Tyr Asp Asp Gly

145 150 155 160

Trp Ala Val Leu Lys Trp Val Asn Ser Ser Ser Trp Leu Arg Ser Lys

165 170 175

Lys Asp Ser Lys Val Arg Ile Phe Leu Ala Gly Asp Ser Ser Gly Gly

180 185 190

Asn Ile Val His Asn Val Ala Val Arg Ala Val Glu Ser Arg Ile Asp

195 200 205

Val Leu Gly Asn Ile Leu Leu Asn Pro Met Phe Gly Gly Thr Glu Arg

210 215 220

Thr Glu Ser Glu Lys Arg Leu Asp Gly Lys Tyr Phe Val Thr Val Arg

225 230 235 240

Asp Arg Asp Trp Tyr Trp Arg Ala Phe Leu Pro Glu Gly Glu Asp Arg

245 250 255

Glu His Pro Ala Cys Ser Pro Phe Gly Pro Arg Ser Lys Ser Leu Glu

260 265 270

Gly Leu Ser Phe Pro Lys Ser Leu Val Val Val Ala Gly Leu Asp Leu

275 280 285

Ile Gln Asp Trp Gln Leu Lys Tyr Ala Glu Gly Leu Lys Lys Ala Gly

290 295 300

Gln Glu Val Lys Leu Leu Tyr Leu Glu Gln Ala Thr Ile Gly Phe Tyr

305 310 315 320

Leu Leu Pro Asn Asn Asn His Phe His Thr Val Met Asp Glu Ile Ala

325 330 335

Ala Phe Val Asn Ala Glu Cys Gln

340

<210> 107

<211> 113

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 107

Met Gly Gly Leu Glu Pro Cys Ser Arg Leu Leu Leu Leu Pro Leu Leu

1 5 10 15

Leu Ala Val Ser Gly Leu Arg Pro Val Gln Ala Gln Ala Gln Ser Asp

20 25 30

Cys Ser Cys Ser Thr Val Ser Pro Gly Val Leu Ala Gly Ile Val Met

35 40 45

Gly Asp Leu Val Leu Thr Val Leu Ile Ala Leu Ala Val Tyr Phe Leu

50 55 60

Gly Arg Leu Val Pro Arg Gly Arg Gly Ala Ala Glu Ala Ala Thr Arg

65 70 75 80

Lys Gln Arg Ile Thr Glu Thr Glu Ser Pro Tyr Gln Glu Leu Gln Gly

85 90 95

Gln Arg Ser Asp Val Tyr Ser Asp Leu Asn Thr Gln Arg Pro Tyr Tyr

100 105 110

Lys

<210> 108

<211> 112

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 108

Met Gly Gly Leu Glu Pro Cys Ser Arg Leu Leu Leu Leu Pro Leu Leu

1 5 10 15

Leu Ala Val Ser Gly Leu Arg Pro Val Gln Ala Gln Ala Gln Ser Asp

20 25 30

Cys Ser Cys Ser Thr Val Ser Pro Gly Val Leu Ala Gly Ile Val Met

35 40 45

Gly Asp Leu Val Leu Thr Val Leu Ile Ala Leu Ala Val Tyr Phe Leu

50 55 60

Gly Arg Leu Val Pro Arg Gly Arg Gly Ala Ala Glu Ala Thr Arg Lys

65 70 75 80

Gln Arg Ile Thr Glu Thr Glu Ser Pro Tyr Gln Glu Leu Gln Gly Gln

85 90 95

Arg Ser Asp Val Tyr Ser Asp Leu Asn Thr Gln Arg Pro Tyr Tyr Lys

100 105 110

<210> 109

<211> 102

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 109

Met Gly Gly Leu Glu Pro Cys Ser Arg Leu Leu Leu Leu Pro Leu Leu

1 5 10 15

Leu Ala Val Ser Asp Cys Ser Cys Ser Thr Val Ser Pro Gly Val Leu

20 25 30

Ala Gly Ile Val Met Gly Asp Leu Val Leu Thr Val Leu Ile Ala Leu

35 40 45

Ala Val Tyr Phe Leu Gly Arg Leu Val Pro Arg Gly Arg Gly Ala Ala

50 55 60

Glu Ala Ala Thr Arg Lys Gln Arg Ile Thr Glu Thr Glu Ser Pro Tyr

65 70 75 80

Gln Glu Leu Gln Gly Gln Arg Ser Asp Val Tyr Ser Asp Leu Asn Thr

85 90 95

Gln Arg Pro Tyr Tyr Lys

100

<210> 110

<211> 101

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 110

Met Gly Gly Leu Glu Pro Cys Ser Arg Leu Leu Leu Leu Pro Leu Leu

1 5 10 15

Leu Ala Val Ser Asp Cys Ser Cys Ser Thr Val Ser Pro Gly Val Leu

20 25 30

Ala Gly Ile Val Met Gly Asp Leu Val Leu Thr Val Leu Ile Ala Leu

35 40 45

Ala Val Tyr Phe Leu Gly Arg Leu Val Pro Arg Gly Arg Gly Ala Ala

50 55 60

Glu Ala Thr Arg Lys Gln Arg Ile Thr Glu Thr Glu Ser Pro Tyr Gln

65 70 75 80

Glu Leu Gln Gly Gln Arg Ser Asp Val Tyr Ser Asp Leu Asn Thr Gln

85 90 95

Arg Pro Tyr Tyr Lys

100

<210> 111

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 111

Glu Ser Pro Tyr Gln Glu Leu Gln Gly Gln Arg Ser Asp Val Tyr Ser

1 5 10 15

Asp Leu Asn Thr Gln

20

<210> 112

<211> 86

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 112

Met Ile Pro Ala Val Val Leu Leu Leu Leu Leu Leu Val Glu Gln Ala

1 5 10 15

Ala Ala Leu Gly Glu Pro Gln Leu Cys Tyr Ile Leu Asp Ala Ile Leu

20 25 30

Phe Leu Tyr Gly Ile Val Leu Thr Leu Leu Tyr Cys Arg Leu Lys Ile

35 40 45

Gln Val Arg Lys Ala Ala Ile Thr Ser Tyr Glu Lys Ser Asp Gly Val

50 55 60

Tyr Thr Gly Leu Ser Thr Arg Asn Gln Glu Thr Tyr Glu Thr Leu Lys

65 70 75 80

His Glu Lys Pro Pro Gln

85

<210> 113

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 113

Asp Gly Val Tyr Thr Gly Leu Ser Thr Arg Asn Gln Glu Thr Tyr Glu

1 5 10 15

Thr Leu Lys His Glu

20

<210> 114

<211> 171

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 114

Met Glu His Ser Thr Phe Leu Ser Gly Leu Val Leu Ala Thr Leu Leu

1 5 10 15

Ser Gln Val Ser Pro Phe Lys Ile Pro Ile Glu Glu Leu Glu Asp Arg

20 25 30

Val Phe Val Asn Cys Asn Thr Ser Ile Thr Trp Val Glu Gly Thr Val

35 40 45

Gly Thr Leu Leu Ser Asp Ile Thr Arg Leu Asp Leu Gly Lys Arg Ile

50 55 60

Leu Asp Pro Arg Gly Ile Tyr Arg Cys Asn Gly Thr Asp Ile Tyr Lys

65 70 75 80

Asp Lys Glu Ser Thr Val Gln Val His Tyr Arg Met Cys Gln Ser Cys

85 90 95

Val Glu Leu Asp Pro Ala Thr Val Ala Gly Ile Ile Val Thr Asp Val

100 105 110

Ile Ala Thr Leu Leu Leu Ala Leu Gly Val Phe Cys Phe Ala Gly His

115 120 125

Glu Thr Gly Arg Leu Ser Gly Ala Ala Asp Thr Gln Ala Leu Leu Arg

130 135 140

Asn Asp Gln Val Tyr Gln Pro Leu Arg Asp Arg Asp Asp Ala Gln Tyr

145 150 155 160

Ser His Leu Gly Gly Asn Trp Ala Arg Asn Lys

165 170

<210> 115

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 115

Met Glu His Ser Thr Phe Leu Ser Gly Leu Val Leu Ala Thr Leu Leu

1 5 10 15

Ser Gln Val Ser Pro Phe Lys Ile Pro Ile Glu Glu Leu Glu Asp Arg

20 25 30

Val Phe Val Asn Cys Asn Thr Ser Ile Thr Trp Val Glu Gly Thr Val

35 40 45

Gly Thr Leu Leu Ser Asp Ile Thr Arg Leu Asp Leu Gly Lys Arg Ile

50 55 60

Leu Asp Pro Arg Gly Ile Tyr Arg Cys Asn Gly Thr Asp Ile Tyr Lys

65 70 75 80

Asp Lys Glu Ser Thr Val Gln Val His Tyr Arg Thr Ala Asp Thr Gln

85 90 95

Ala Leu Leu Arg Asn Asp Gln Val Tyr Gln Pro Leu Arg Asp Arg Asp

100 105 110

Asp Ala Gln Tyr Ser His Leu Gly Gly Asn Trp Ala Arg Asn Lys

115 120 125

<210> 116

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 116

Asp Gln Val Tyr Gln Pro Leu Arg Asp Arg Asp Asp Ala Gln Tyr Ser

1 5 10 15

His Leu Gly Gly Asn

20

<210> 117

<211> 207

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 117

Met Gln Ser Gly Thr His Trp Arg Val Leu Gly Leu Cys Leu Leu Ser

1 5 10 15

Val Gly Val Trp Gly Gln Asp Gly Asn Glu Glu Met Gly Gly Ile Thr

20 25 30

Gln Thr Pro Tyr Lys Val Ser Ile Ser Gly Thr Thr Val Ile Leu Thr

35 40 45

Cys Pro Gln Tyr Pro Gly Ser Glu Ile Leu Trp Gln His Asn Asp Lys

50 55 60

Asn Ile Gly Gly Asp Glu Asp Asp Lys Asn Ile Gly Ser Asp Glu Asp

65 70 75 80

His Leu Ser Leu Lys Glu Phe Ser Glu Leu Glu Gln Ser Gly Tyr Tyr

85 90 95

Val Cys Tyr Pro Arg Gly Ser Lys Pro Glu Asp Ala Asn Phe Tyr Leu

100 105 110

Tyr Leu Arg Ala Arg Val Cys Glu Asn Cys Met Glu Met Asp Val Met

115 120 125

Ser Val Ala Thr Ile Val Ile Val Asp Ile Cys Ile Thr Gly Gly Leu

130 135 140

Leu Leu Leu Val Tyr Tyr Trp Ser Lys Asn Arg Lys Ala Lys Ala Lys

145 150 155 160

Pro Val Thr Arg Gly Ala Gly Ala Gly Gly Arg Gln Arg Gly Gln Asn

165 170 175

Lys Glu Arg Pro Pro Pro Val Pro Asn Pro Asp Tyr Glu Pro Ile Arg

180 185 190

Lys Gly Gln Arg Asp Leu Tyr Ser Gly Leu Asn Gln Arg Arg Ile

195 200 205

<210> 118

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 118

Asn Pro Asp Tyr Glu Pro Ile Arg Lys Gly Gln Arg Asp Leu Tyr Ser

1 5 10 15

Gly Leu Asn Gln Arg

20

<210> 119

<211> 182

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 119

Met Glu Gln Gly Lys Gly Leu Ala Val Leu Ile Leu Ala Ile Ile Leu

1 5 10 15

Leu Gln Gly Thr Leu Ala Gln Ser Ile Lys Gly Asn His Leu Val Lys

20 25 30

Val Tyr Asp Tyr Gln Glu Asp Gly Ser Val Leu Leu Thr Cys Asp Ala

35 40 45

Glu Ala Lys Asn Ile Thr Trp Phe Lys Asp Gly Lys Met Ile Gly Phe

50 55 60

Leu Thr Glu Asp Lys Lys Lys Trp Asn Leu Gly Ser Asn Ala Lys Asp

65 70 75 80

Pro Arg Gly Met Tyr Gln Cys Lys Gly Ser Gln Asn Lys Ser Lys Pro

85 90 95

Leu Gln Val Tyr Tyr Arg Met Cys Gln Asn Cys Ile Glu Leu Asn Ala

100 105 110

Ala Thr Ile Ser Gly Phe Leu Phe Ala Glu Ile Val Ser Ile Phe Val

115 120 125

Leu Ala Val Gly Val Tyr Phe Ile Ala Gly Gln Asp Gly Val Arg Gln

130 135 140

Ser Arg Ala Ser Asp Lys Gln Thr Leu Leu Pro Asn Asp Gln Leu Tyr

145 150 155 160

Gln Pro Leu Lys Asp Arg Glu Asp Asp Gln Tyr Ser His Leu Gln Gly

165 170 175

Asn Gln Leu Arg Arg Asn

180

<210> 120

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 120

Asp Gln Leu Tyr Gln Pro Leu Lys Asp Arg Glu Asp Asp Gln Tyr Ser

1 5 10 15

His Leu Gln Gly Asn

20

<210> 121

<211> 163

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 121

Met Lys Trp Lys Ala Leu Phe Thr Ala Ala Ile Leu Gln Ala Gln Leu

1 5 10 15

Pro Ile Thr Glu Ala Gln Ser Phe Gly Leu Leu Asp Pro Lys Leu Cys

20 25 30

Tyr Leu Leu Asp Gly Ile Leu Phe Ile Tyr Gly Val Ile Leu Thr Ala

35 40 45

Leu Phe Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr

50 55 60

Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg

65 70 75 80

Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met

85 90 95

Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu

100 105 110

Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys

115 120 125

Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu

130 135 140

Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu

145 150 155 160

Pro Pro Arg

<210> 122

<211> 164

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 122

Met Lys Trp Lys Ala Leu Phe Thr Ala Ala Ile Leu Gln Ala Gln Leu

1 5 10 15

Pro Ile Thr Glu Ala Gln Ser Phe Gly Leu Leu Asp Pro Lys Leu Cys

20 25 30

Tyr Leu Leu Asp Gly Ile Leu Phe Ile Tyr Gly Val Ile Leu Thr Ala

35 40 45

Leu Phe Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr

50 55 60

Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg

65 70 75 80

Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met

85 90 95

Gly Gly Lys Pro Gln Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn

100 105 110

Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met

115 120 125

Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly

130 135 140

Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala

145 150 155 160

Leu Pro Pro Arg

<210> 123

<211> 112

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 123

Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Gln Gln Gly

1 5 10 15

Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr

20 25 30

Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys

35 40 45

Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys

50 55 60

Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg

65 70 75 80

Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala

85 90 95

Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg

100 105 110

<210> 124

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 124

Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp

1 5 10 15

Val Leu Asp Lys Arg

20

<210> 125

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 125

Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr

1 5 10 15

Ser Glu Ile Gly Met Lys

20

<210> 126

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 126

Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp

1 5 10 15

Ala Leu His Met Gln

20

<210> 127

<211> 226

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 127

Met Pro Gly Gly Pro Gly Val Leu Gln Ala Leu Pro Ala Thr Ile Phe

1 5 10 15

Leu Leu Phe Leu Leu Ser Ala Val Tyr Leu Gly Pro Gly Cys Gln Ala

20 25 30

Leu Trp Met His Lys Val Pro Ala Ser Leu Met Val Ser Leu Gly Glu

35 40 45

Asp Ala His Phe Gln Cys Pro His Asn Ser Ser Asn Asn Ala Asn Val

50 55 60

Thr Trp Trp Arg Val Leu His Gly Asn Tyr Thr Trp Pro Pro Glu Phe

65 70 75 80

Leu Gly Pro Gly Glu Asp Pro Asn Gly Thr Leu Ile Ile Gln Asn Val

85 90 95

Asn Lys Ser His Gly Gly Ile Tyr Val Cys Arg Val Gln Glu Gly Asn

100 105 110

Glu Ser Tyr Gln Gln Ser Cys Gly Thr Tyr Leu Arg Val Arg Gln Pro

115 120 125

Pro Pro Arg Pro Phe Leu Asp Met Gly Glu Gly Thr Lys Asn Arg Ile

130 135 140

Ile Thr Ala Glu Gly Ile Ile Leu Leu Phe Cys Ala Val Val Pro Gly

145 150 155 160

Thr Leu Leu Leu Phe Arg Lys Arg Trp Gln Asn Glu Lys Leu Gly Leu

165 170 175

Asp Ala Gly Asp Glu Tyr Glu Asp Glu Asn Leu Tyr Glu Gly Leu Asn

180 185 190

Leu Asp Asp Cys Ser Met Tyr Glu Asp Ile Ser Arg Gly Leu Gln Gly

195 200 205

Thr Tyr Gln Asp Val Gly Ser Leu Asn Ile Gly Asp Val Gln Leu Glu

210 215 220

Lys Pro

225

<210> 128

<211> 188

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 128

Met Pro Gly Gly Pro Gly Val Leu Gln Ala Leu Pro Ala Thr Ile Phe

1 5 10 15

Leu Leu Phe Leu Leu Ser Ala Val Tyr Leu Gly Pro Gly Cys Gln Ala

20 25 30

Leu Trp Met His Lys Val Pro Ala Ser Leu Met Val Ser Leu Gly Glu

35 40 45

Asp Ala His Phe Gln Cys Pro His Asn Ser Ser Asn Asn Ala Asn Val

50 55 60

Thr Trp Trp Arg Val Leu His Gly Asn Tyr Thr Trp Pro Pro Glu Phe

65 70 75 80

Leu Gly Pro Gly Glu Asp Pro Asn Glu Pro Pro Pro Arg Pro Phe Leu

85 90 95

Asp Met Gly Glu Gly Thr Lys Asn Arg Ile Ile Thr Ala Glu Gly Ile

100 105 110

Ile Leu Leu Phe Cys Ala Val Val Pro Gly Thr Leu Leu Leu Phe Arg

115 120 125

Lys Arg Trp Gln Asn Glu Lys Leu Gly Leu Asp Ala Gly Asp Glu Tyr

130 135 140

Glu Asp Glu Asn Leu Tyr Glu Gly Leu Asn Leu Asp Asp Cys Ser Met

145 150 155 160

Tyr Glu Asp Ile Ser Arg Gly Leu Gln Gly Thr Tyr Gln Asp Val Gly

165 170 175

Ser Leu Asn Ile Gly Asp Val Gln Leu Glu Lys Pro

180 185

<210> 129

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 129

Glu Asn Leu Tyr Glu Gly Leu Asn Leu Asp Asp Cys Ser Met Tyr Glu

1 5 10 15

Asp Ile Ser Arg Gly

20

<210> 130

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 130

Arg Pro Arg Arg Ser Pro Ala Gln Asp Gly Lys Val Tyr Ile Asn Met

1 5 10 15

Pro Gly Arg Gly

20

<210> 131

<211> 68

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 131

Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu

1 5 10 15

Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser Lys Arg Ser

20 25 30

Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro Gly

35 40 45

Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe Ala

50 55 60

Ala Tyr Arg Ser

65

<210> 132

<211> 619

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 132

Met Pro Asp Pro Ala Ala His Leu Pro Phe Phe Tyr Gly Ser Ile Ser

1 5 10 15

Arg Ala Glu Ala Glu Glu His Leu Lys Leu Ala Gly Met Ala Asp Gly

20 25 30

Leu Phe Leu Leu Arg Gln Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu

35 40 45

Ser Leu Val His Asp Val Arg Phe His His Phe Pro Ile Glu Arg Gln

50 55 60

Leu Asn Gly Thr Tyr Ala Ile Ala Gly Gly Lys Ala His Cys Gly Pro

65 70 75 80

Ala Glu Leu Cys Glu Phe Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys

85 90 95

Asn Leu Arg Lys Pro Cys Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro

100 105 110

Gly Val Phe Asp Cys Leu Arg Asp Ala Met Val Arg Asp Tyr Val Arg

115 120 125

Gln Thr Trp Lys Leu Glu Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser

130 135 140

Gln Ala Pro Gln Val Glu Lys Leu Ile Ala Thr Thr Ala His Glu Arg

145 150 155 160

Met Pro Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys

165 170 175

Leu Tyr Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg

180 185 190

Lys Glu Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val

195 200 205

Tyr His Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro

210 215 220

Glu Gly Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys

225 230 235 240

Leu Lys Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn

245 250 255

Ser Ser Ala Ser Asn Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala

260 265 270

His Pro Ser Thr Leu Thr His Pro Gln Arg Arg Ile Asp Thr Leu Asn

275 280 285

Ser Asp Gly Tyr Thr Pro Glu Pro Ala Arg Ile Thr Ser Pro Asp Lys

290 295 300

Pro Arg Pro Met Pro Met Asp Thr Ser Val Tyr Glu Ser Pro Tyr Ser

305 310 315 320

Asp Pro Glu Glu Leu Lys Asp Lys Lys Leu Phe Leu Lys Arg Asp Asn

325 330 335

Leu Leu Ile Ala Asp Ile Glu Leu Gly Cys Gly Asn Phe Gly Ser Val

340 345 350

Arg Gln Gly Val Tyr Arg Met Arg Lys Lys Gln Ile Asp Val Ala Ile

355 360 365

Lys Val Leu Lys Gln Gly Thr Glu Lys Ala Asp Thr Glu Glu Met Met

370 375 380

Arg Glu Ala Gln Ile Met His Gln Leu Asp Asn Pro Tyr Ile Val Arg

385 390 395 400

Leu Ile Gly Val Cys Gln Ala Glu Ala Leu Met Leu Val Met Glu Met

405 410 415

Ala Gly Gly Gly Pro Leu His Lys Phe Leu Val Gly Lys Arg Glu Glu

420 425 430

Ile Pro Val Ser Asn Val Ala Glu Leu Leu His Gln Val Ser Met Gly

435 440 445

Met Lys Tyr Leu Glu Glu Lys Asn Phe Val His Arg Asp Leu Ala Ala

450 455 460

Arg Asn Val Leu Leu Val Asn Arg His Tyr Ala Lys Ile Ser Asp Phe

465 470 475 480

Gly Leu Ser Lys Ala Leu Gly Ala Asp Asp Ser Tyr Tyr Thr Ala Arg

485 490 495

Ser Ala Gly Lys Trp Pro Leu Lys Trp Tyr Ala Pro Glu Cys Ile Asn

500 505 510

Phe Arg Lys Phe Ser Ser Arg Ser Asp Val Trp Ser Tyr Gly Val Thr

515 520 525

Met Trp Glu Ala Leu Ser Tyr Gly Gln Lys Pro Tyr Lys Lys Met Lys

530 535 540

Gly Pro Glu Val Met Ala Phe Ile Glu Gln Gly Lys Arg Met Glu Cys

545 550 555 560

Pro Pro Glu Cys Pro Pro Glu Leu Tyr Ala Leu Met Ser Asp Cys Trp

565 570 575

Ile Tyr Lys Trp Glu Asp Arg Pro Asp Phe Leu Thr Val Glu Gln Arg

580 585 590

Met Arg Ala Cys Tyr Tyr Ser Leu Ala Ser Lys Val Glu Gly Pro Pro

595 600 605

Gly Ser Thr Gln Lys Ala Glu Ala Ala Cys Ala

610 615

Claims

1.一种在细胞中鉴定与合成模块化多肽相关的所选表型的用于非诊断目的的离体/体外方法，所述方法包括：

(a)将带条形码的核酸文库引入到宿主细胞中，从而产生遗传修饰的宿主细胞的异质群体，其中所述带条形码的核酸文库包含多个成员，所述多个成员中的每一个均包含编码不同合成模块化多肽的核苷酸序列，所述核苷酸序列包含：编码区和条形码区，所述编码区包含编码两个或更多个可变模块的两个或更多个编码序列，其中所述两个或更多个编码序列彼此在框内；所述条形码区包含两个或更多个独特条形码，其中所述编码区中的每个可变模块与所述条形码区中特定的独特条形码相关；

(b)在所述异质群体内鉴定响应于刺激物展示出所述所选表型的遗传修饰的宿主细胞；以及

(c)从(b)鉴定的宿主细胞，通过测序鉴定和/或定量所述条形码区，由此鉴定产生所选表型的合成模块化多肽和/或其模块。

2.根据权利要求1所述的方法，其中所述合成模块化多肽是：

a)模块化受体多肽，任选地嵌合抗原受体(CAR)多肽或嵌合Notch受体多肽；

b)模块化支架蛋白；

c)模块化蛋白激酶或磷酸酶蛋白；

d)模块化转录调节因子蛋白；

e)模块化表观遗传调节因子蛋白；或

f)模块化重组酶或核酸酶蛋白。

3.根据权利要求2所述的方法，其中所述合成模块化多肽是CAR，并且所述刺激物是抗原提呈细胞，所述抗原提呈细胞在它的表面上展示由所述CAR结合的抗原。

4.根据权利要求1至3中任一项所述的方法，其中所述表型是以下各项中的一种或多种：

a)增殖；

b)细胞因子产生；

c)细胞表面标志物的表达；

d)报告蛋白的表达。

5.根据权利要求1至3中任一项所述的方法，其中所述多个成员包含编码合成模块化多肽的核苷酸序列，所述合成模块化多肽包含选自以下的模块化结构域：抗原结合结构域、特异性结合结构域或特异性结合配偶体蛋白、共刺激结构域、共抑制结构域、细胞内信号转导结构域、跨膜结构域、支架蛋白结构域、蛋白激酶蛋白结构域、蛋白质磷酸酶蛋白结构域、受体酪氨酸激酶蛋白结构域、脂质激酶蛋白结构域、脂质磷酸酶蛋白结构域、泛素化酶蛋白结构域、去泛素化酶蛋白结构域、SUMO化酶蛋白结构域、乙酰化酶蛋白结构域、脱乙酰基酶蛋白结构域、甲基化酶蛋白结构域、脱甲基酶蛋白结构域、核酸酶蛋白结构域、重组酶蛋白结构域、转录因子蛋白结构域以及其组合。

6.一种带条形码的核酸文库，所述文库包含：

多个独特的多核苷酸，所述多个独特的多核苷酸各自包含编码独特的合成模块化多肽的核苷酸序列，其中每一个独特的多核苷酸包含：

i)编码所述独特的合成模块化多肽的编码区，所述编码区包含编码第一模块的第一编码序列，所述第一编码序列与编码第二模块的第二编码序列在框内连接，

ii)多单元条形码区，所述多单元条形码区包含对所述第一编码序列具有特异性的第一条形码，所述第一条形码与对所述第二编码序列具有特异性的第二条形码连接，其中与所述第一编码序列和所述第二编码序列相比，所述第一条形码和所述第二条形码处于相反的5'到3'顺序；并且

其中对每一个多单元条形码区进行测序允许鉴定每一个独特的合成模块化多肽。

7.根据权利要求6所述的文库，其中所述第一编码序列和所述第二编码序列直接连接而没有任何间插的非编码核苷酸。

8.根据权利要求6或7所述的文库，其中所述独特的合成模块化多肽包含共刺激结构域，任选地其中所述第一模块和所述第二模块包含不同的共刺激结构域。

9.根据权利要求6或7所述的文库，其中所述由所述多个独特的多核苷酸中的每一个编码的独特的合成模块化多肽是：

b)模块化支架蛋白；

c)模块化蛋白激酶或磷酸酶蛋白；

d)模块化转录调节因子蛋白；

e)模块化表观遗传调节因子蛋白；或

f)模块化重组酶或核酸酶蛋白。

10.根据权利要求6或7所述的文库，其中所述由所述多个独特的多核苷酸中的每一个编码的独特的合成模块化多肽包含选自以下的模块化结构域：抗原结合结构域、特异性结合结构域或特异性结合配偶体蛋白、共刺激结构域、共抑制结构域、细胞内信号转导结构域、跨膜结构域、支架蛋白结构域、蛋白激酶蛋白结构域、蛋白质磷酸酶蛋白结构域、受体酪氨酸激酶蛋白结构域、脂质激酶蛋白结构域、脂质磷酸酶蛋白结构域、泛素化酶蛋白结构域、去泛素化酶蛋白结构域、SUMO化酶蛋白结构域、乙酰化酶蛋白结构域、脱乙酰基酶蛋白结构域、甲基化酶蛋白结构域、脱甲基酶蛋白结构域、核酸酶蛋白结构域、重组酶蛋白结构域、转录因子蛋白结构域以及其组合。

11.一种细胞文库，所述文库包含：

多个细胞，所述多个细胞各自包含根据权利要求6至10中任一项所述的带条形码的核酸文库的独特的多核苷酸，其中对每一个条形码区进行测序允许鉴定所述文库的每一个细胞的每一个独特的合成模块化多肽。

12.一种制备带条形码的核酸文库的方法，所述核酸各自编码独特的合成模块化多肽，所述方法包括：

使第一多核苷酸与第二多核苷酸在如下条件下接触，所述第一多核苷酸包含与第一条形码序列连接的第一模块编码序列，所述第二多核苷酸包含与第二条形码序列连接的第二模块编码序列，所述条件足以在第二编码序列与所述第二条形码序列之间的连接处将所述第一多核苷酸插入到所述第二多核苷酸中，从而产生带条形码的双模块化多核苷酸，

其中所述带条形码的双模块化多核苷酸包含所述与所述第一模块编码序列在框内连接的第二模块编码序列，所述第一模块编码序列与所述第一条形码序列连接，所述第一条形码序列与所述第二条形码序列连接。