CN115023440A

CN115023440A - 用于单域抗体的变异核酸文库

Info

Publication number: CN115023440A
Application number: CN202080081338.8A
Authority: CN
Inventors: 亚伦·萨托; 潘卡杰·加格; 刘强; 汤姆·袁
Original assignee: Twist Bioscience Corp
Current assignee: Twist Bioscience Corp
Priority date: 2019-09-23
Filing date: 2020-09-23
Publication date: 2022-09-06
Also published as: CA3155630A1; IL291516A; US20210102195A1; WO2021061842A1; EP4034564A1; EP4034564A4; KR20220069046A; JP2022548783A; AU2020355027A1

Abstract

本文提供了与编码抗体(包括单域抗体)的变异核酸文库有关的方法和组合物。使用本文所述方法生成的文库具有改进的特征，包括改进的结合亲和力。本文所述的文库包括斑驳化的文库，其包含各自编码至少一个预定参考核酸序列的预定变体的核酸。本文进一步描述了当翻译所述核酸文库时生成的蛋白质文库。本文进一步描述了表达本文所述的斑驳化核酸文库的细胞文库。

Description

用于单域抗体的变异核酸文库

交叉引用

本申请要求于2019年9月23日提交的美国临时专利申请号62/904,620、于2019年11月14日提交的美国临时专利申请号62/935,603和于2019年12月9日提交的美国临时专利申请号62/945,761的权益，其各自通过引用全文并入。

背景技术

抗体具有与生物靶标以高特异性和亲和力结合的能力。然而，由于平衡免疫效应与功效，治疗性抗体的设计具有挑战性。单域抗体诸如VHH抗体具有几个有益的特征。因此，需要开发用于产生供治疗学中使用的抗体诸如VHH抗体的组合物和方法。

援引并入

本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文，其程度犹如具体地且单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。

发明内容

本文提供了抗体或抗体片段，其包含：CDRH1，所述CDRH1包含与SEQ ID NO:152或SEQ ID NO:155中所示的氨基酸序列具有至少约90％同一性的氨基酸序列；CDRH2，所述CDRH2包含与SEQ ID NO:153或SEQ ID NO:156中所示的氨基酸序列具有至少约90％同一性的氨基酸序列；以及CDRH3，所述CDRH3包含与SEQ ID NO:154或SEQ ID NO:157中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了抗体或抗体片段，其进一步包含：CDRL1，所述CDRL1包含与SEQ ID NO:158或SEQ ID NO:161中所示的氨基酸序列具有至少约90％同一性的氨基酸序列；CDRL2，所述CDRL2包含与SEQ ID NO:159或SEQ IDNO:162中所示的氨基酸序列具有至少约90％同一性的氨基酸序列；以及CDRL3，所述CDRL3包含与SEQ ID NO:160或SEQ ID NO:163中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

本文提供了治疗癌症的方法，其包括施用本文所述的抗体或抗体片段。

本文提供了治疗病毒性感染的方法，其包括施用本文所述的抗体或抗体片段。

本文提供了核酸文库，其包含：多个序列，所述序列包含在翻译时编码抗体或抗体片段的核酸，其中所述多个序列中的每个序列包含编码重链可变区(VH)上的CDR1、CDR2或CDR3或轻链可变区(VL)上的CDR1、CDR2或CDR3的变异序列；其中所述文库包含至少30,000个变异序列；且其中所述抗体或抗体片段以小于100nM的K_D与其抗原结合。本文进一步提供了核酸文库，其中所述抗体是单域抗体。本文进一步提供了核酸文库，其中所述单域抗体是VHH抗体。本文进一步提供了核酸文库，其中所述抗体与TIGIT结合。本文进一步提供了核酸文库，其中重链可变区在翻译时包含与SEQ ID NO:84-SEQ ID NO:100中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了核酸文库，其中轻链可变区在翻译时包含与SEQ ID NO:101-SEQ ID NO:117中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了核酸文库，其中重链可变区上的CDR1、CDR2或CDR3包含与SEQ ID NO:67-SEQ ID NO:83或SEQ ID NO:118-SEQ ID NO:128中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了核酸文库，其中轻链可变区上的CDR1、CDR2或CDR3包含与SEQ ID NO:129-SEQ ID NO:137中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了核酸文库，其中所述抗体与CD47结合。本文进一步提供了核酸文库，其中所述抗体与CD3ε结合。本文进一步提供了核酸文库，其中所述重链可变区在翻译时包含与SEQ ID NO:138-SEQ ID NO:141中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了核酸文库，其中所述轻链可变区在翻译时包含与SEQ ID NO:142-SEQ ID NO:145中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了核酸文库，其中所述核酸文库包含至少50,000个变异序列。本文进一步提供了核酸文库，其中所述核酸文库包含至少100,000个变异序列。本文进一步提供了核酸文库，其中所述核酸文库包含至少10⁵个不相同的核酸。本文进一步提供了核酸文库，其中所述核酸文库具有至少10⁹个序列的理论多样性。

本文提供了核酸文库，其包含：多个序列，所述序列包含在翻译时编码单域抗体的核酸，其中所述多个序列中的每个序列包含编码重链可变区(VH)上的CDR1、CDR2或CDR3的变异序列；其中所述文库包含至少30,000个变异序列；且其中所述抗体或抗体片段以小于100nM的K_D与其抗原结合。本文进一步提供了核酸文库，其中在翻译时所述VH的长度为约90至约100个氨基酸。本文进一步提供了核酸文库，其中在翻译时所述VH的长度为约100至约400个氨基酸。本文进一步提供了核酸文库，其中所述VH的长度为约270至约300个碱基对。本文进一步提供了核酸文库，其中所述VH的长度为约300至约1200个碱基对。本文进一步提供了核酸文库，其中所述单域抗体是VHH抗体。本文进一步提供了核酸文库，其中所述抗体与TIGIT结合。本文进一步提供了核酸文库，其中所述重链可变区上的所述CDR1、CDR2或CDR3包含与SEQ ID NO:67-SEQ ID NO:83或SEQ ID NO:118-SEQ ID NO:128中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了核酸文库，其中所述重链可变区在翻译时包含与SEQ ID NO:84-SEQ ID NO:100中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了核酸文库，其中重链可变区上的CDR3包含与SEQ ID NO:101-SEQ ID NO:117中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了核酸文库，其中所述抗体与CD47结合。本文进一步提供了核酸文库，其中所述抗体与CD3ε结合。本文进一步提供了核酸文库，其中所述重链可变区在翻译时包含与SEQ ID NO:138-SEQ ID NO:141中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了核酸文库，其中所述核酸文库包含至少50,000个变异序列。本文进一步提供了核酸文库，其中所述核酸文库包含至少100,000个变异序列。本文进一步提供了核酸文库，其中所述核酸文库包含至少10⁵个不相同的核酸。本文进一步提供了核酸文库，其中所述核酸文库具有至少10⁹个序列的理论多样性。

本文提供了用于生成编码单域抗体的核酸文库的方法，其包括：(a)提供编码以下项的预定序列：i.第一多个多核苷酸，其中所述第一多个多核苷酸中的每个多核苷酸编码至少1000个编码重链上的CDR1的变异序列；ii.第二多个多核苷酸，其中所述第二多个多核苷酸中的每个多核苷酸编码至少1000个编码重链上的CDR2的变异序列；iii.第三多个多核苷酸，其中所述第三多个多核苷酸中的每个多核苷酸编码至少1000个编码重链上的CDR3的变异序列；以及(b)混合第一多个多核苷酸、第二多个多核苷酸和第三多个多核苷酸以形成编码所述单域抗体的变异核酸的所述核酸文库，且其中至少约70％的所述变异核酸编码以小于100nM的K_D与其抗原结合的单域抗体。本文进一步提供了用于生成核酸文库的方法，其中所述单域抗体包含一个重链可变域。本文进一步提供了用于生成核酸文库的方法，其中所述单域抗体是VHH抗体。本文进一步提供了用于生成核酸文库的方法，其中所述单域抗体与TIGIT结合。本文进一步提供了用于生成核酸文库的方法，其中所述单域抗体包含与SEQID NO:84-SEQ ID NO:100或SEQ ID NO:138-SEQ ID NO:141中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。本文进一步提供了用于生成核酸文库的方法，其中所述单域抗体与CD47结合。本文进一步提供了用于生成核酸文库的方法，其中所述核酸文库包含至少50,000个变异序列。本文进一步提供了用于生成核酸文库的方法，其中所述核酸文库包含至少100,000个变异序列。本文进一步提供了用于生成核酸文库的方法，其中所述核酸文库包含至少10⁵个不相同的核酸。本文进一步提供了用于生成核酸文库的方法，其中所述核酸文库包含至少一个编码所述单域抗体的序列，所述单域抗体以小于75nM的K_D与抗原结合。本文进一步提供了用于生成核酸文库的方法，其中所述核酸文库包含至少一个编码所述单域抗体的序列，所述单域抗体以小于50nM的K_D与抗原结合。本文进一步提供了用于生成核酸文库的方法，其中所述核酸文库包含至少一个编码所述单域抗体的序列，所述单域抗体以小于25nM的K_D与抗原结合。本文进一步提供了用于生成核酸文库的方法，其中所述核酸文库包含至少一个编码所述单域抗体的序列，所述单域抗体以小于10nM的K_D与抗原结合。本文进一步提供了用于生成核酸文库的方法，其中所述核酸文库具有至少10⁹个序列的理论多样性。

附图说明

图1呈现了说明如本文所公开的基因合成的示例性处理工作流程的步骤图。

图2示出了计算机系统的示例。

图3是示出计算机系统的架构的框图。

图4是说明网络的示图，该网络被配置用于并入多个计算机系统、多个蜂窝电话和个人数据助理，以及网络附加存储(NAS)。

图5是使用共享虚拟地址存储空间的多处理器计算机系统的框图。

图6-图7描绘了VHH文库的TIGIT亲和力分布图，描绘了20至4000的亲和力阈值(图6)或20至1000的亲和力阈值(图7)。在140个VHH结合物中，51个变体<100nM，且90个变体<200nM。

图8描绘了“VHH文库”、“VHH改组”和“VHH h改组文库”的每个长度的CDR3计数图。

图9描绘了TIGIT VHH Fc结合物的TIGIT:CD155阻断测定图。以纳摩尔(nM)为单位的TIGIT VHH Fc结合物的浓度在x轴上，且相对的HRP信号在y轴上。

图10描绘了CD47 VHH Fc结合物的CD47亲和力分布图。“VHH比率”文库(水平条形图)、“VHH改组”文库(黑色条形图)和“VHH h改组”文库(点状条形图)的亲和力阈值(单价KD)在x轴上，且计数在y轴上。

图11描绘了CD47 VHH Fc结合物的CD47-SIRPα抑制测定图。以纳摩尔(nM)为单位的CD47 VHH Fc结合物的浓度在x轴上，且相对的HRP信号在y轴上。

图12A-图12B描绘了GLP1R-43-77的FACS分析图(图12A)及剂量曲线和特异性图(图12B)。

图13A-图13B描绘了CRTH2-41-51的FACS分析图(图13A)及剂量曲线和cAMP活性图(图13B)。

图14A-图14B描绘了CRTH2-44-59的剂量曲线图(图14A)和FACS分析图(图14B)。

图15A-图15E描绘了细胞结合的FACS分析图，是通过平均荧光强度(MFI)与CRTH2RIgG的8点滴定使用CRTH2-74、CRTH2-24、CRTH2-28、CRTH2-39、CRTH2-19、CRTH2-9、CRTH2-8、CRTH2-27、CRTH2-45、CRTH2-35、CRTH2-50、CRTH2-66、CRTH2-57、CRTH2-32、CRTH2-15、CRTH2-25、CRTH2-42、CRTH2-55、CRTH2-60和CRTH2-70测量的。

图16A描绘了示例性门控点图，示出了在100nM的CRTH2-27结合。

图16B描绘了示例性APC直方图，示出了在100nM的CRTH2-27结合。

图17A描绘了使用比较物抗体gPCR-51的如在先前图中的结合分析。

图17B描绘了使用比较物抗体gPCR-52的如在先前图中的结合分析。

图18A-图18B描绘了IgG与CRTH2-9、CRTH2-27、CRTH2-50、CRTH2-32和CRTH2-42的结合曲线，它们在cAMP测定中具有功能性效应。

图19A描绘了在300nM、100nM和33nM测试的所有抗体的CRTH2R cAMP测定结果。

图19B描绘了在33nM测试的所有抗体的CRTH2R cAMP测定结果。

图20显示了在五种CRTH2R IgG(CRTH2-9、CRTH2-27、CRTH2-50、CRTH2-32和CRTH2-42)中所见的负别构效应。

图21A-图21C描绘了别构调节剂的对照实验，示出了比较物抗体52是正别构调节剂。

图22A-图22D描绘了CRTH2R在CRTH2R IgG的β-抑制蛋白(β-arrestin)募集测定中的活性。

图23描绘了本文生成的文库的示意图。

图24描绘了本文生成的噬菌体展示的超免疫文库的设计示意图。

图25A-图25B描绘了通过下一代测序评估的超免疫文库的重链CDR长度分布。图25A描绘了每个长度的CDR3计数图。图25B描绘了CDRH1、CDRH2和CDRH3的长度图。

图26描绘了选择可溶性蛋白质靶标的工作流程示意图。

图27A-图27D描绘了在第3轮和第4轮淘选之后来自hTIGIT ELISA的数据图。

图27E-图27F描绘了hTIGIT免疫球蛋白的CDRH3长度、产量和亲和力(K_D)的示意图。

图28A-图28D描绘了在第4轮和第5轮淘选之后来自人CD3ε(hCD3)和猕猴CD3ε(cCD3)ELISA的数据图。

图28E-图28L描绘了交叉反应性人CD3ε(hCD3)和猕猴CD3ε(cCD3)免疫球蛋白的图。

图29A-图29G描绘了在CD8+、CD3+和CD3- T细胞上的人CD3的滴定图。

图30A-图30F描绘了CRTH2R免疫球蛋白CRTH2-48-03(图30A)、CRTH2-48-21(图30B)和CRTH2-48-27(图30C)的结合亲和力图以及CRTH2-48-03(图30D)、CRTH2-48-21(图30E)和CRTH2-48-27(图30F)的cAMP测定图。

图31A-图31B描绘了A2AR-90-007的剂量曲线图(图31A)和FACS分析图(图31B)。

具体实施方式

除非另有说明，否则本公开采用在本领域技术范围内的常规分子生物学技术。除非另有定义，否则本文使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同的含义。

定义

贯穿本公开内容，多个实施方案以范围格式给出。应当理解，范围格式的描述只是为了方便和简明，而不应被解释为对任何实施方案的范围的硬性限制。因此，除非上下文另有明确规定，否则对范围的描述应被认为明确公开了所有可能的子范围以及该范围内精确到下限单位十分之一的各个数值。例如，对诸如从1至6的范围的描述应被认为已经明确公开了诸如从1至3、从1至4、从1至5、从2至4、从2至6、从3至6等子范围，以及该范围内的各个值，例如，1.1、2、2.3、5和5.9。无论范围的宽度如何，这都是适用的。这些中间范围的上限和下限可独立地包括在更小的范围内，并且也被涵盖于本公开内容中，受所述范围中任何具体排除的限值所约束。除非上下文另有明确规定，否则在所述范围包括限值之一或两者的情况下，排除了这些所包含的限值中的任一个或两者的范围也被包括在本公开内容中。

本文使用的术语仅用于描述特定实施方案的目的，而非旨在限制任何实施方案。除非上下文另有明确规定，否则如本文所用的单数形式“一个”、“一种”和“该”也意欲包括复数形式。进一步应当理解，术语“包括”和/或“包含”在本说明书中使用时指代所述特征、整数、步骤、操作、元件和/或组分的存在，但不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组分和/或其群体。如本文所用的，术语“和/或”包括一个或多个相关所列项目的任何及所有组合。

除非具体说明或从上下文中可以明显看出，否则如本文所用的，关于数字或数字范围的术语“约”应被理解为表示所述数字及其+/-10％的数字，或者对于范围列出的值，表示低于所列下限的10％至高于所列上限的10％。

除非具体说明，否则如本文所用的，术语“核酸”涵盖双链或三链核酸以及单链分子。在双链或三链核酸中，核酸链不必共同延伸(即，双链核酸不必沿两条链的全长都是双链的)。当提供时，核酸序列以5’至3’的方向列出，除非另有说明。本文所述的方法提供了分离的核酸的生成。本文所述的方法另外提供了分离并纯化的核酸的生成。本文提及的“核酸”在长度上可包含至少5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000个或更多个碱基。而且，本文提供了合成任意数目的编码多肽区段的核苷酸序列的方法，该序列包括编码非核糖体肽(NRP)的序列，编码以下物质的序列：非核糖肽合成酶(NRPS)模块和合成变体、其它模块化蛋白质如抗体的多肽区段、来自其它蛋白质家族的多肽区段，包括非编码DNA或RNA，如调节序列，例如启动子、转录因子、增强子、siRNA、shRNA、RNAi、miRNA、衍生自微小RNA的核仁小RNA，或任何感兴趣的功能性或结构性DNA或RNA单元。以下是多核苷酸的非限制性实例：基因或基因片段的编码区或非编码区、基因间DNA、由连锁分析限定的基因座(多个基因座)、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核仁小RNA、核酶、互补DNA(cDNA)(其为mRNA的DNA呈现形式，通常通过信使RNA(mRNA)的逆转录或通过扩增来获得)；经合成或通过扩增产生的DNA分子、基因组DNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。编码本文提及的基因或基因片段的cDNA可包含至少一个编码外显子序列的区域，而没有基因组等同序列中的间插内含子序列。

抗体文库

本文提供了用于生成抗体的方法、组合物和系统。在一些情况下，抗体是单域抗体。本文描述的用于优化抗体的方法、组合物和系统包括反映抗体序列的天然多样性的比率-变体方法。在一些情况下，优化的抗体文库包含变异抗体序列。在一些情况下，变异抗体序列被设计为包含变异CDR区。在一些情况下，包含变异CDR区的变异抗体序列是通过在美洲驼、人源化或嵌合框架中改组天然CDR序列而生成的。在一些情况下，合成此类文库，将其克隆到表达载体中，并评估翻译产物(抗体)的活性。在一些情况下，合成并随后组装序列片段。在一些情况下，表达载体用于展示和富集所需抗体，诸如噬菌体展示。在一些情况下，噬菌体载体是Fab噬菌粒载体。在一些情况下，在富集过程中使用的选择压力包括结合亲和力、毒性、免疫耐受性、稳定性或其他因素。此类表达载体允许选择具有特定特性的抗体(“淘选”)，并且此类序列的后续增殖或扩增使具有这些序列的文库富集。淘选轮可以重复任意次数，诸如1、2、3、4、5、6、7轮或多于7轮。在一些情况下，每轮淘选都涉及多次洗涤。在一些情况下，每轮淘选涉及至少或约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16次或多于16次洗涤。

本文描述了计算机文库设计的方法和系统。在一些情况下，本文所述的文库是基于包含多种抗体序列的数据库设计的。在一些情况下，数据库包含针对各种靶标的多个变异抗体序列。在一些情况下，数据库包含至少100、500、1000、1500、2000、2500、3000、3500、4000、4500、5000个或多于5000个抗体序列。示例性数据库是iCAN数据库。在一些情况下，数据库包含幼稚和记忆B细胞受体序列。在一些情况下，幼稚和记忆B细胞受体序列是人、小鼠或灵长类动物的序列。在一些情况下，幼稚和记忆B细胞受体序列是人序列。在一些情况下，分析数据库的位置特异性变异。在一些情况下，本文所述的抗体在CDR区中包含位置特异性变异。在一些情况下，CDR区包含多个变异位点。

本文描述了在CDR区中包含变异的文库。在一些情况下，CDR是可变重链的CDR1、CDR2或CDR3。在一些情况下，CDR是可变轻链的CDR1、CDR2或CDR3。在一些情况下，文库包含多个编码CDR1、CDR2或CDR3的变体。在一些情况下，如本文所述的文库编码至少50、100、200、300、400、500、1000、1200、1500、1700、2000、2500、3000、3500、4000、4500、5000个或多于5000个CDR1序列。在一些情况下，如本文所述的文库编码至少50、100、200、300、400、500、1000、1200、1500、1700、2000、2500、3000、3500、4000、4500、5000个或多于5000个CDR2序列。在一些情况下，如本文所述的文库编码至少50、100、200、300、400、500、1000、1200、1500、1700、2000、2500、3000、3500、4000、4500、5000个或多于5000个CDR3序列。在一些情况下，计算机抗体文库是针对所需序列进行合成、组装和富集的。

在合成CDR1变体、CDR2变体和CDR3变体之后，在一些情况下，CDR1变体、CDR2变体和CDR3变体被改组以生成多样化的文库。在一些情况下，通过本文所述的方法生成的文库的多样性具有至少或约10⁷、10⁸、10⁹、10¹⁰、10¹¹、10¹²、10¹³、10¹⁴、10¹⁵、10¹⁶、10¹⁷、10¹⁸个或多于10¹⁸个序列的理论多样性。在一些情况下，所述文库具有至少或约10⁷、10⁸、10⁹、10¹⁰、10¹¹、10¹²、10¹³、10¹⁴、10¹⁵、10¹⁶、10¹⁷、10¹⁸个或多于10¹⁸个序列的最终文库多样性。

也可以修饰对应于变异序列的种系序列以在文库中生成序列。例如，通过本文所述的方法生成的序列包含来自种系序列的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16个或多于16个突变。在一些情况下，生成的序列包含来自种系序列的不多于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16个或不多于18个突变。在一些情况下，生成的序列相对于种系序列包含约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16个或约18个突变。

抗体文库

本文提供了由本文所述的方法生成的文库。本文所述的抗体导致改进的功能活性、结构稳定性、表达、特异性或其组合。在一些情况下，抗体是单域抗体。在一些情况下，单域抗体包含一个重链可变域。在一些情况下，单域抗体是VHH抗体。

如本文所用的，术语抗体将被理解为包括具有典型抗体分子的特征性双臂、Y形的蛋白质以及保留与抗原特异性结合的能力的抗体的一个或多个片段。示例性抗体包括但不限于单克隆抗体、多克隆抗体、双特异性抗体、多特异性抗体、移植抗体、人抗体、人源化抗体、合成抗体、嵌合抗体、骆驼化抗体、单链Fv(scFv)(包括这样的片段，其中VL和VH使用重组方法通过合成或天然连接体连接，该连接体使它们能够成为单蛋白质链，其中VL和VH区配对形式单价分子，包括单链Fab和scFab)、单链抗体、Fab片段(包括包含VL、VH、CL和CH1结构域的单价片段)、F(ab′)2片段(包括包含在铰链区通过二硫键连接的两个Fab片段的二价片段)、Fd片段(包括包含VH和CH1片段的片段)、Fv片段(包括包含抗体单臂的VL和VH结构域的片段)、单域抗体(dAb或sdAb)(包括包含VH结构域的片段)、分离的互补决定区(CDR)、双抗体(包括包含二价二聚体的片段，该二聚体例如是彼此结合并识别两种不同抗原的两个VL和VH结构域)、仅由单个单体可变域组成的片段、二硫键连接的Fv(sdFv)、胞内抗体、抗独特型(抗Id)抗体，或它们的抗原结合片段。在一些情况下，本文所公开的文库包含编码抗体的核酸，其中所述抗体是Fv抗体，包括由包含完整抗原识别和抗原结合位点的最小抗体片段组成的Fv抗体。在一些实施方案中，该Fv抗体由紧密、非共价缔合的一个重链可变域和一个轻链可变域的二聚体组成，并且每个可变域的三个高变区相互作用以在该VH-VL二聚体的表面上限定抗原结合位点。在一些实施方案中，这六个高变区为抗体赋予抗原结合特异性。在一些实施方案中，单个可变域(或仅包含对抗原为特异性的三个高变区的Fv的一半，包括包含一个重链可变域的从骆驼科动物分离的单域抗体，如VHH抗体或纳米抗体)具有识别并结合抗原的能力。在一些情况下，本文所公开的文库包含编码抗体的核酸，其中所述抗体是单链Fv或scFv，包括包含VH、VL或VH和VL结构域两者的抗体片段，其中这两个结构域均存在于单个多肽链中。在一些实施方案中，Fv多肽在VH与VL结构域之间进一步包含多肽连接体，从而允许scFv形成用于抗原结合的所需结构。在一些情况下，scFv连接至Fc片段，或VHH连接至Fc片段(包括小抗体)。在一些情况下，所述抗体包含免疫球蛋白分子和免疫球蛋白分子的免疫活性片段，例如，含有抗原结合位点的分子。免疫球蛋白分子是任何类型(例如IgG、IgE、IgM、IgD、IgA和IgY)、类别(例如IgG 1、IgG 2、IgG 3、IgG 4、IgA 1和IgA 2)或亚类的。

在一些实施方案中，文库包含适用于预期治疗靶标的种类的免疫球蛋白。通常，这些方法包括“哺乳动物化”，并且包括将供体抗原结合信息转移到免疫原性较低的哺乳动物抗体接受体以生成有用的治疗性处理的方法。在一些情况下，该哺乳动物是小鼠、大鼠、马、绵羊、牛、灵长类动物(例如黑猩猩、狒狒、大猩猩、猩猩、猴)、狗、猫、猪、驴、兔和人。在一些情况下，本文提供了用于抗体的猫科动物化和犬科动物化的文库和方法。

非人抗体的“人源化”形式可以是含有衍生自非人抗体的最小序列的嵌合抗体。人源化抗体通常是人抗体(接受体抗体)，其中来自一个或多个CDR的残基被替换为来自非人抗体(供体抗体)的一个或多个CDR的残基。供体抗体可以是任何合适的非人抗体，如具有所需特异性、亲和力或生物学效应的小鼠、大鼠、兔、鸡或非人灵长类动物抗体。在一些情况下，接受体抗体的选定框架区残基被替换为来自供体抗体的相应框架区残基。人源化抗体还可包含在接受体抗体或供体抗体中均未发现的残基。在一些情况下，进行这些修饰以进一步改进抗体性能。.

“犬科动物化”可包括将非犬抗原结合信息从供体抗体转移到免疫原性较低的犬抗体接受体以生成可在狗中用作治疗剂的治疗的方法。在一些情况下，本文提供的非犬抗体的犬科动物化形式是含有衍生自非犬抗体的最小序列的嵌合抗体。在一些情况下，犬科动物化抗体是犬抗体序列(“接受体”或“受体”抗体)，其中接受体的高变区残基被替换为来自非犬物种(“供体”抗体)如小鼠、大鼠、兔、猫、狗、山羊、鸡、牛、马、美洲驼、骆驼、单峰驼、鲨鱼、非人灵长类动物、人、人源化、重组序列或具有所需性质的工程化序列的高变区残基。在一些情况下，犬抗体的框架区(FR)残基被替换为相应的非犬FR残基。在一些情况下，犬科动物化抗体包括在接受体抗体或供体抗体中未发现的残基。在一些情况下，进行这些修饰以进一步改进抗体性能。犬科动物化抗体还可包含犬抗体的免疫球蛋白恒定区(Fc)的至少一部分。

“猫科动物化”可包括将非猫抗原结合信息从供体抗体转移到免疫原性较低的猫抗体接受体以生成可在猫中用作治疗剂的治疗的方法。在一些情况下，本文提供的非猫抗体的猫科动物化形式是含有衍生自非猫抗体的最小序列的嵌合抗体。在一些情况下，猫科动物化抗体是猫抗体序列(“接受体”或“受体”抗体)，其中接受体的高变区残基被替换为来自非猫物种(“供体”抗体)如小鼠、大鼠、兔、猫、狗、山羊、鸡、牛、马、美洲驼、骆驼、单峰驼、鲨鱼、非人灵长类动物、人、人源化、重组序列或具有所需性质的工程化序列的高变区残基。在一些情况下，猫抗体的框架区(FR)残基被替换为相应的非猫FR残基。在一些情况下，猫科动物化抗体包括在接受体抗体或供体抗体中未发现的残基。在一些情况下，进行这些修饰以进一步改进抗体性能。猫科动物化抗体还可包含猫抗体的免疫球蛋白恒定区(Fc)的至少一部分。

本文所述的方法可用于生成编码非免疫球蛋白的文库。在一些情况下，该文库包含抗体模拟物。示例性抗体模拟物包括但不限于anticalins、affilins、affibody分子、affimers、affitins、alphabodies、avimers、atrimers、DARPins、fynomers、基于Kunitz结构域的蛋白质、单抗体(monobodies)、anticalins、knottins、基于犰狳重复蛋白的蛋白质和双环肽。

本文所述的包含编码抗体的核酸的文库包含抗体的至少一个区域中的变异。用于变异的抗体的示例性区域包括但不限于互补决定区(CDR)、可变域或恒定域。在一些情况下，该CDR是CDR1、CDR2或CDR3。在一些情况下，该CDR是重链结构域，包括但不限于CDRH1、CDRH2和CDRH3。在一些情况下，该CDR是轻链结构域，包括但不限于CDRL1、CDRL2和CDRL3。在一些情况下，该可变域是轻链可变域(VL)或重链可变域(VH)。在一些情况下，CDR1、CDR2或CDR3属于轻链可变域(VL)。轻链可变域(VL)的CDR1、CDR2或CDR3可分别称为CDRL1、CDRL2或CDRL3。重链可变域(VH)的CDR1、CDR2或CDR3可分别称为CDRH1、CDRH2或CDRH3。在一些情况下，该VL结构域包含κ或λ链。在一些情况下，该恒定域是轻链恒定域(CL)或重链恒定域(CH)。

本文提供了包含编码抗体的核酸的文库，所述抗体在抗体的至少一个区域中包含变异，其中所述区域是CDR区。在一些情况下，抗体是包含一个重链可变域的单域抗体，诸如VHH抗体。在一些情况下，VHH抗体包含一个或多个CDR区中的变异。在一些情况下，本文所述的VHH文库包含至少或约100、200、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2400、2600、2800、3000个或多于3000个CDR1、CDR2或CDR3序列。例如，文库包含至少2000个CDR1序列、至少1200个CDR2序列和至少1600个CDR3序列。在一些情况下，每个序列都是不相同的。

如本文所述的文库在翻译时可包含不同长度的CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3氨基酸或其组合。在一些情况下，在翻译时CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3氨基酸或其组合的长度为至少或约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或多于30个氨基酸。

如本文所述的包含编码具有变异CDR序列的抗体的核酸的文库在翻译时包含各种长度的氨基酸。在一些情况下，每个氨基酸片段的长度或合成的氨基酸的平均长度可以是至少或约15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150个或多于150个氨基酸。在一些情况下，氨基酸的长度为约15至150、20至145、25至140、30至135、35至130、40至125、45至120、50至115、55至110、60至110、65至105、70至100、或75至95个氨基酸。在一些情况下，氨基酸的长度为约22个氨基酸至约75个氨基酸。在一些情况下，抗体包含至少或约100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000或多于5000个氨基酸。在一些情况下，文库是VHH文库。在一些情况下，文库是抗体文库。

如本文所述的编码VHH抗体的文库包含变异CDR序列，其被改组以生成具有至少或约10⁷、10⁸、10⁹、10¹⁰、10¹¹、10¹²、10¹³、10¹⁴、10¹⁵、10¹⁶、10¹⁷、10¹⁸个或多于10¹⁸个序列的理论多样性的文库。在一些情况下，所述文库具有至少或约10⁷、10⁸、10⁹、10¹⁰、10¹¹、10¹²、10¹³、10¹⁴、10¹⁵、10¹⁶、10¹⁷、10¹⁸个或多于10¹⁸个序列的最终文库多样性。

如本文所述的编码抗体或免疫球蛋白的文库包含变异CDR序列，其被改组以生成具有至少或约10⁷、10⁸、10⁹、10¹⁰、10¹¹、10¹²、10¹³、10¹⁴、10¹⁵、10¹⁶、10¹⁷、10¹⁸个或多于10¹⁸个序列的理论多样性的文库。在一些情况下，所述文库具有至少或约10⁷、10⁸、10⁹、10¹⁰、10¹¹、10¹²、10¹³、10¹⁴、10¹⁵、10¹⁶、10¹⁷、10¹⁸个或多于10¹⁸个序列的最终文库多样性。

本文所述的方法提供了包含编码抗体或免疫球蛋白的核酸的文库的合成，其中每个核酸编码至少一个预定参考核酸序列的预定变体。在一些情况下，该预定参考序列是编码蛋白质的核酸序列，并且该变体文库包含编码至少单个密码子的变异的序列，使得由合成核酸编码的后续蛋白质中单个残基的多个不同变体通过标准翻译过程生成。在一些情况下，该抗体文库包含不同的核酸，它们共同编码多个位置处的变异。在一些情况下，该变体文库包含编码CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3、VL或VH结构域的至少单个密码子的变异的序列。在一些情况下，该变体文库包含编码CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3、VL或VH结构域的多个密码子的变异的序列。在一些情况下，该变体文库包含编码框架元件1(FW1)、框架元件2(FW2)、框架元件3(FW3)或框架元件4(FW4)的多个密码子的变异的序列。用于变异的密码子的示例性数目包括但不限于至少或约1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、225、250、275、300个或多于300个密码子。

在一些情况下，用于变异的抗体的至少一个区域来自重链V基因家族、重链D基因家族、重链J基因家族、轻链V基因家族或轻链J基因家族。在一些情况下，轻链V基因家族包含免疫球蛋白κ(IGK)基因或免疫球蛋白λ(IGL)。

本文提供了包含编码抗体的核酸的文库，其中所述文库用各种数目的片段合成。在一些情况下，所述片段包含CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3、VL或VH结构域。在一些情况下，所述片段包含框架元件1(FW1)、框架元件2(FW2)、框架元件3(FW3)或框架元件4(FW4)。在一些情况下，该抗体文库用至少或约2个片段、3个片段、4个片段、5个片段或多于5个片段合成。每个核酸片段的长度或合成的核酸的平均长度可以是至少或约50、75、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600个或多于600个碱基对。在一些情况下，该长度是约50至600、75至575、100至550、125至525、150至500、175至475、200至450、225至425、250至400、275至375或300至350个碱基对。

如本文所述的包含编码抗体或免疫球蛋白的核酸的文库在翻译时包含各种长度的氨基酸。在一些情况下，每个氨基酸片段的长度或合成的氨基酸的平均长度可以是至少或约15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150个或多于150个氨基酸。在一些情况下，该氨基酸的长度是约15至150、20至145、25至140、30至135、35至130、40至125、45至120、50至115、55至110、60至110、65至105、70至100或75至95个氨基酸。在一些情况下，该氨基酸的长度是约22个氨基酸至约75个氨基酸。在一些情况下，该抗体包含至少或约100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000或多于5000个氨基酸。

使用如本文所述的方法从头合成用于变异的抗体的至少一个区域的许多变异序列。在一些情况下，为CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3、VL、VH或其组合从头合成大量变异序列。在一些情况下，为框架元件1(FW1)、框架元件2(FW2)、框架元件3(FW3)或框架元件4(FW4)从头合成大量变异序列。变异序列的数目可以是至少或约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500个或多于500个序列。在一些情况下，变异序列的数目是至少或约500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000个或多于8000个序列。在一些情况下，变异序列的数目是约10至500、25至475、50至450、75至425、100至400、125至375、150至350、175至325、200至300、225至375、250至350或275至325个序列。

在一些情况下，用于抗体的至少一个区域的变异序列在长度或序列上是不同的。在一些情况下，从头合成的至少一个区域是用于CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3、VL、VH或其组合。在一些情况下，从头合成的至少一个区域是用于框架元件1(FW1)、框架元件2(FW2)、框架元件3(FW3)或框架元件4(FW4)。在一些情况下，该变异序列与野生型相比包含至少或约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50个或多于50个变异核苷酸或氨基酸。在一些情况下，该变异序列与野生型相比包含至少或约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50个额外的核苷酸或氨基酸。在一些情况下，该变异序列包含比野生型少至少或约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50个的核苷酸或氨基酸。在一些情况下，该文库包含至少或约10¹、10²、10³、10⁴、10⁵、10⁶、10⁷、10⁸、10⁹、10¹⁰个或多于10¹⁰个变体。

抗体文库合成后，抗体文库可用于筛选和分析。例如，测定抗体文库的文库可展示性和淘选。在一些情况下，使用选择性标签分析可展示性。示例性标签包括但不限于放射性标记、荧光标记、酶、化学发光标签、比色标签、亲和标签或本领域已知的其他标记或标签。在一些情况下，该标签是组氨酸、聚组氨酸、myc、血凝素(HA)或FLAG。例如，如图2B中所见。在一些情况下，使用各种方法通过测序测定抗体文库，所述方法包括但不限于单分子实时(SMRT)测序、聚合酶克隆(Polony)测序、连接测序、可逆终止子测序、质子检测测序、离子半导体测序、纳米孔测序、电子测序、焦磷酸测序、Maxam-Gilbert测序、链终止(例如，Sanger)测序、+S测序或合成测序。在一些情况下，抗体文库展示在细胞或噬菌体的表面上。在一些情况下，使用噬菌体展示富集具有所需活性的序列的抗体文库。

在一些情况下，测定抗体文库的功能活性、结构稳定性(例如，热稳定性或pH稳定性)、表达、特异性或其组合。在一些情况下，测定抗体文库中能够折叠的抗体。在一些情况下，测定抗体区域的功能活性、结构稳定性、表达、特异性、折叠或其组合。例如，测定VH区或VL区的功能活性、结构稳定性、表达、特异性、折叠或其组合。

通过本文所述的方法产生的抗体或IgG包含改进的结合亲和力。在一些情况下，抗体包含小于1nM、小于1.2nM、小于2nM、小于5nM、小于10nM、小于11nm、小于13.5nM、小于15nM、小于20nM、小于25nM或小于30nM的结合亲和力(例如K_D)。在一些情况下，抗体包含小于400nM、小于350nM、小于300nM、小于250nM、小于200nM、小于150nm、小于100nM、小于50nM、小于25nM、小于15nM或小于10nM的K_D。在一些情况下，抗体包含小于1nM的K_D。在一些情况下，抗体包含小于1.2nM的K_D。在一些情况下，抗体包含小于2nM的K_D。在一些情况下，抗体包含小于5nM的K_D。在一些情况下，抗体包含小于10nM的K_D。在一些情况下，抗体包含小于13.5nM的K_D。在一些情况下，抗体包含小于15nM的K_D。在一些情况下，抗体包含小于20nM的K_D。在一些情况下，抗体包含小于25nM的K_D。在一些情况下，抗体包含小于30nM的K_D。

在一些情况下，通过如本文所述的方法产生的抗体或IgG的亲和力与比较物抗体相比结合亲和力提高到至少或约1.5x、2.0x、5x、10x、20x、30x、40x、50x、60x、70x、80x、90x、100x、200x或大于200x。在一些情况下，通过如本文所述的方法产生的抗体或IgG的亲和力与比较物抗体相比功能改进到至少或约1.5x、2.0x、5x、10x、20x、30x、40x、50x、60x、70x、80x、90x、100x、200x或大于200x。在一些情况下，比较物抗体是具有相似结构、序列或抗原靶标的抗体。

在一些情况下，如本文所述的方法导致抗体或IgG的产量增加。在一些情况下，产量为至少或约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80微克(ug)或大于80微克(ug)。在一些情况下，产量在约5至约80、约10至约75、约15至约60、约20至约50或约30至约40微克(ug)的范围内。

表达系统

本文提供了包含编码抗体的核酸的文库，所述抗体包含结合结构域，其中所述文库具有改进的特异性、稳定性、表达、折叠或下游活性。在一些情况下，本文所述的文库用于筛选和分析。

本文提供了包含编码抗体的核酸的文库，所述抗体包含结合结构域，其中所述核酸文库用于筛选和分析。在一些情况下，筛选和分析包括体外、体内或离体测定。用于筛选的细胞包括取自活对象的原代细胞或细胞系。细胞可以来自原核生物(例如细菌和真菌)或真核生物(例如动物和植物)。示例性的动物细胞包括但不限于来自小鼠、兔、灵长类动物和昆虫的动物细胞。在一些情况下，用于筛选的细胞包括细胞系，包括但不限于中国仓鼠卵巢(CHO)细胞系、人胚肾(HEK)细胞系或幼仓鼠肾(BHK)细胞系。在一些情况下，本文所述的核酸文库也可以被递送至多细胞生物体。示例性的多细胞生物体包括但不限于植物、小鼠、兔、灵长类动物和昆虫。

可以针对各种药理学或药代动力学特性筛选本文所述的核酸文库。在一些情况下，使用体外测定、体内测定或离体测定来筛选文库。例如，所筛选的体外药理学或药代动力学性质包括但不限于结合亲和力、结合特异性和结合亲合力。所筛选的本文所述文库的示例性体内药理学或药代动力学性质包括但不限于治疗功效、活性、临床前毒性性质、临床功效性质、临床毒性性质、免疫原性、效力和临床安全性性质。

本文提供了核酸文库，其中所述核酸文库可以在载体中表达。用于插入本文公开的核酸文库的表达载体可包括真核或原核表达载体。示例性的表达载体包括但不限于哺乳动物表达载体：pSF-CMV-NEO-NH2-PPT-3XFLAG、pSF-CMV-NEO-COOH-3XFLAG、pSF-CMV-PURO-NH2-GST-TEV、pSF-OXB20-COOH-TEV-FLAG(R)-6His、pCEP4 pDEST27、pSF-CMV-Ub-KrYFP、pSF-CMV-FMDV-daGFP、pEF1a-mCherry-N1载体、pEF1a-tdTomato载体、pSF-CMV-FMDV-Hygro、pSF-CMV-PGK-Puro、pMCP-tag(m)和pSF-CMV-PURO-NH2-CMYC；细菌表达载体：pSF-OXB20-BetaGal、pSF-OXB20-Fluc、pSF-OXB20和pSF-Tac；植物表达载体：pRI 101-AN DNA和pCambia2301；和酵母表达载体：pTYB21和pKLAC2，以及昆虫载体：pAc5.1/V5-His A和pDEST8。在一些情况下，该载体是pcDNA3或pcDNA3.1。

本文描述了在载体中表达以产生包含抗体的构建体的核酸文库。在一些情况下，该构建体的大小各不相同。在一些情况下，该构建体包含至少或约500、600、700、800、900、1000、1100、1300、1400、1500、1600、1700、1800、2000、2400、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800、5000、6000、7000、8000、9000、10000个或多于10000个碱基。在一些情况下，该构建体包含约300至1,000、300至2,000、300至3,000、300至4,000、300至5,000、300至6,000、300至7,000、300至8,000、300至9,000、300至10,000、1,000至2,000、1,000至3,000、1,000至4,000、1,000至5,000、1,000至6,000、1,000至7,000、1,000至8,000、1,000至9,000、1,000至10,000、2,000至3,000、2,000至4,000、2,000至5,000、2,000至6,000、2,000至7,000、2,000至8,000、2,000至9,000、2,000至10,000、3,000至4,000、3,000至5,000、3,000至6,000、3,000至7,000、3,000至8,000、3,000至9,000、3,000至10,000、4,000至5,000、4,000至6,000、4,000至7,000、4,000至8,000、4,000至9,000、4,000至10,000、5,000至6,000、5,000至7,000、5,000至8,000、5,000至9,000、5,000至10,000、6,000至7,000、6,000至8,000、6,000至9,000、6,000至10,000、7,000至8,000、7,000至9,000、7,000至10,000、8,000至9,000、8,000至10,000或9,000至10,000个碱基的范围。

本文提供了包含编码抗体的核酸的文库，其中所述核酸文库在细胞中表达。在一些情况下，合成所述文库以表达报告基因。示例性的报告基因包括但不限于乙酰羟酸合酶(AHAS)、碱性磷酸酶(AP)、β-半乳糖苷酶(LacZ)、β-葡萄糖醛酸酶(GUS)、氯霉素乙酰转移酶(CAT)、绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、黄色荧光蛋白(YFP)、青色荧光蛋白(CFP)、天蓝色荧光蛋白、黄水晶荧光蛋白、橙色荧光蛋白、樱桃荧光蛋白、绿松石荧光蛋白、蓝色荧光蛋白、辣根过氧化物酶(HRP)、萤光素酶(Luc)、胭脂碱合酶(NOS)、章鱼碱合酶(OCS)、萤光素酶及其衍生物。确定报告基因的调节的方法是本领域公知的、并且包括但不限于荧光光度法(例如，荧光光谱法、荧光激活细胞分选(FACS)、荧光显微术)和抗生素抗性确定。

疾病和病症

本文提供了包含编码抗体或免疫球蛋白(包括可具有治疗效果的VHH抗体)的核酸的文库。在一些情况下，抗体或免疫球蛋白在翻译时产生用于治疗对象的疾病或病症的蛋白质。示例性的疾病包括但不限于癌症、炎性疾病或病症、代谢疾病或紊乱、心血管疾病或病症、呼吸系统疾病或病症、疼痛、消化系统疾病或病症、生殖系统疾病或病症、内分泌疾病或病症或者神经系统疾病或病症。在一些情况下，该癌症是实体癌或血液系统癌症。在一些情况下，对象是哺乳动物。在一些情况下，对象是小鼠、兔、狗或人。通过本文所述的方法治疗的对象可以是婴儿、成人或儿童。包含如本文所述的抗体或抗体片段的药物组合物可以静脉内或皮下施用。

在一些情况下，所述疾病或病症与TIGIT功能障碍有关。在一些情况下，所述疾病或病症与经由TIGIT的异常信号传导有关。在一些情况下，所述疾病或病症与CD3功能障碍有关。在一些情况下，所述疾病或病症与经由CD3的异常信号传导有关。在一些情况下，所述疾病或病症是癌症。在一些情况下，所述疾病或病症是病毒性感染。

蛋白质靶标

本文提供了包含编码抗体或免疫球蛋白(包括可针对各种蛋白质靶标设计的VHH抗体)的核酸的文库。在一些情况下，该蛋白质是离子通道、G蛋白偶联受体、酪氨酸激酶受体、免疫受体、膜蛋白或其组合。在一些情况下，蛋白质是受体。在一些情况下，蛋白质是胰高血糖素样肽1(GLP1)受体。在一些情况下，蛋白质是前列腺素D2受体2(DP2或CRTH2)受体。在一些情况下，蛋白质是腺苷A2A受体。在一些情况下，蛋白质是具有Ig和ITIM结构域(TIGIT)的T细胞免疫受体。在一些情况下，蛋白质是分化簇47(CD47)。在一些情况下，蛋白质是分化簇3ε(CD3ε)。

本文提供了抗体或免疫球蛋白，其中所述抗体或免疫球蛋白包含与SEQ ID NO:1-SEQ ID NO:151中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的序列。在一些情况下，所述抗体或免疫球蛋白序列与SEQ ID NO:1-SEQ ID NO:151中的任一个具有至少或约95％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列与SEQ ID NO:1-SEQ ID NO:151中的任一个具有至少或约97％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列与SEQ ID NO:1-SEQ ID NO:151中的任一个具有至少或约99％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列与SEQ ID NO:1-SEQ ID NO:151中的任一个具有至少或约100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含具有SEQ ID NO:1-SEQ ID NO:151中的任一个的至少或约1、2、3、4、5、6、7、8、9、10、12、14、16、18、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400个或多于400个氨基酸的至少一部分。

在一些实施方案中，所述抗体或免疫球蛋白序列包含互补决定区(CDR)，所述互补决定区包含如表1A、表14B、表17和表20中所示的序列。在一些实施方案中，所述抗体或免疫球蛋白序列包含互补决定区(CDR)，所述互补决定区与SEQ ID NO:46-SEQ ID NO:83、SEQID NO:118-SEQ ID NO:137或SEQ ID NO:152-SEQ ID NO:163中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含互补决定区(CDR)，所述互补决定区与SEQ ID NO:46-SEQ ID NO:83、SEQ ID NO:118-SEQ ID NO:137或SEQ ID NO:152-SEQID NO:163中的任一个具有至少或约95％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含互补决定区(CDR)，所述互补决定区与SEQ ID NO:46-SEQ ID NO:83、SEQ ID NO:118-SEQ ID NO:137或SEQ ID NO:152-SEQ ID NO:163中的任一个具有至少或约97％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含互补决定区(CDR)，所述互补决定区与SEQ ID NO:46-SEQ ID NO:83、SEQ ID NO:118-SEQ ID NO:137或SEQ ID NO:152-SEQ IDNO:163中的任一个具有至少或约99％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含互补决定区(CDR)，所述互补决定区与SEQ ID NO:46-SEQ ID NO:83、SEQ ID NO:118-SEQ ID NO:137或SEQ ID NO:152-SEQ ID NO:163中的任一个具有至少或约100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含互补决定区(CDR)，所述互补决定区包含具有SEQ ID NO:46-SEQ ID NO:83、SEQ ID NO:118-SEQ ID NO:137或SEQ ID NO:152-SEQ IDNO:163中的任一个的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

表1A.

构建体描述	氨基酸序列	SEQ ID NO
			IGHV1-69 CDRH1	GGTFSSYA	152
IGHV1-69 CDRH2	IIPIFGTA	153
			IGHV1-69 CDRH3	CARNNNNNNNNNFDYW	154
IGHV3-23 CDRH1	GFTFSSYA	155
			IGHV3-23 CDRH2	ISGSGGST	156
IGHV3-23 CDRH3	CAKNNNNNNNNNFDYW	157
			IGKV1-39 CDRL1	QSISSY	158
IGKV1-39 CDRL2	AAS	159
			IGKV1-39 CDRL3	CQQSYSTPNTF	160
IGKV3-20 CDRL1	QSVSSSY	161
			IGKV3-20 CDRL2	GAS	162
IGKV3-20 CDRL3	CQQYGSSPNTF	163

在一些实施方案中，所述抗体或免疫球蛋白序列包含CDR1，所述CDR1与SEQ IDNO:118-SEQ ID NO:120、SEQ ID NO:129-SEQ ID NO:131、SEQ ID NO:152、SEQ ID NO:155、SEQ ID NO:158或SEQ ID NO:161中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR1，所述CDR1与SEQ ID NO:118-SEQ ID NO:120、SEQ ID NO:129-SEQ ID NO:131、SEQ ID NO:152、SEQ ID NO:155、SEQ ID NO:158或SEQ ID NO:161中的任一个具有至少或约95％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR1，所述CDR1与SEQ ID NO:118-SEQ ID NO:120、SEQ ID NO:129-SEQ ID NO:131、SEQ ID NO:152、SEQ ID NO:155、SEQ ID NO:158或SEQ ID NO:161中的任一个具有至少或约97％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR1，所述CDR1与SEQ ID NO:118-SEQID NO:120、SEQ ID NO:152、SEQ ID NO:155、SEQ ID NO:158或SEQ ID NO:161中的任一个具有至少或约99％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR1，所述CDR1与SEQ ID NO:118-SEQ ID NO:120、SEQ ID NO:129-SEQ ID NO:131、SEQ ID NO:152、SEQID NO:155、SEQ ID NO:158或SEQ ID NO:161中的任一个具有至少或约100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR1，所述CDR1包含具有SEQ ID NO:118-SEQID NO:120、SEQ ID NO:129-SEQ ID NO:131、SEQ ID NO:152、SEQ ID NO:155、SEQ ID NO:158或SEQ ID NO:161中的任一个的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

在一些实施方案中，所述抗体或免疫球蛋白序列包含CDR2，所述CDR2与SEQ IDNO:121-SEQ ID NO:123、SEQ ID NO:132-SEQ ID NO:134、SEQ ID NO:153、SEQ ID NO:156、SEQ ID NO:159或SEQ ID NO:162中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR2，所述CDR2与SEQ ID NO:121-SEQ ID NO:123、SEQ ID NO:132-SEQ ID NO:134、SEQ ID NO:153、SEQ ID NO:156、SEQ ID NO:159或SEQ ID NO:162中的任一个具有至少或约95％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR2，所述CDR2与SEQ ID NO:121-SEQ ID NO:123、SEQ ID NO:132-SEQ ID NO:134、SEQ ID NO:153、SEQ ID NO:156、SEQ ID NO:159或SEQ ID NO:162中的任一个具有至少或约97％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR2，所述CDR2与SEQ ID NO:121-SEQID NO:123、SEQ ID NO:132-SEQ ID NO:134、SEQ ID NO:153、SEQ ID NO:156、SEQ ID NO:159或SEQ ID NO:162中的任一个具有至少或约99％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR2，所述CDR2与SEQ ID NO:121-SEQ ID NO:123、SEQ ID NO:132-SEQID NO:134、SEQ ID NO:153、SEQ ID NO:156、SEQ ID NO:159或SEQ ID NO:162中的任一个具有至少或约100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR2，所述CDR2包含具有SEQ ID NO:121-SEQ ID NO:123、SEQ ID NO:132-SEQ ID NO:134、SEQ IDNO:153、SEQ ID NO:156、SEQ ID NO:159或SEQ ID NO:162中的任一个的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

在一些实施方案中，所述抗体或免疫球蛋白序列包含CDR3，所述CDR3与SEQ IDNO:46-SEQ ID NO:83、SEQ ID NO:124-SEQ ID NO:128、SEQ ID NO:154、SEQ ID NO:157、SEQ ID NO:160或SEQ ID NO:163中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR3，所述CDR3与SEQ ID NO:46-SEQ ID NO:83、SEQ ID NO:124-SEQ ID NO:128、SEQ ID NO:125-SEQ ID NO:137、SEQ ID NO:154、SEQ ID NO:157、SEQID NO:160或SEQ ID NO:163中的任一个具有至少或约95％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR3，所述CDR3与SEQ ID NO:46-SEQ ID NO:83、SEQ ID NO:124-SEQ ID NO:128、SEQ ID NO:125-SEQ ID NO:137、SEQ ID NO:124-SEQ ID NO:128、SEQ IDNO:154、SEQ ID NO:157、SEQ ID NO:160或SEQ ID NO:163中的任一个具有至少或约97％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR3，所述CDR3与SEQ ID NO:46-SEQID NO:83、SEQ ID NO:124-SEQ ID NO:128、SEQ ID NO:125-SEQ ID NO:137、SEQ ID NO:124-SEQ ID NO:128、SEQ ID NO:154、SEQ ID NO:157、SEQ ID NO:160或SEQ ID NO:163中的任一个具有至少或约99％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR3，所述CDR3与SEQ ID NO:46-SEQ ID NO:83、SEQ ID NO:124-SEQ ID NO:128、SEQ ID NO:125-SEQ ID NO:137、SEQ ID NO:124-SEQ ID NO:128、SEQ ID NO:154、SEQ ID NO:157、SEQID NO:160或SEQ ID NO:163中的任一个具有至少或约100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含CDR3，所述CDR3包含具有SEQ ID NO:46-SEQ ID NO:83、SEQ IDNO:124-SEQ ID NO:128、SEQ ID NO:125-SEQ ID NO:137、SEQ ID NO:124-SEQ ID NO:128、SEQ ID NO:154、SEQ ID NO:157、SEQ ID NO:160或SEQ ID NO:163中的任一个的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

在一些实施方案中，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:152中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRH2，其与SEQ ID NO:153中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；以及CDRH3，其与SEQ ID NO:154中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:152中的任一个具有至少或约95％、97％、99％或100％同源性；CDRH2，其与SEQ ID NO:153中的任一个具有至少或约95％、97％、99％或100％同源性；以及CDRH3，其与SEQ ID NO:154中的任一个具有至少或约95％、97％、99％或100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其包含具有SEQ ID NO:152的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRH2，其包含具有SEQ ID NO:153的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；以及CDRH3，其包含具有SEQ ID NO:154的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

在一些实施方案中，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:155具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRH2，其与SEQ ID NO:156具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；以及CDRH3，其与SEQ ID NO:157具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:155具有至少或约95％、97％、99％或100％同源性；CDRH2，其与SEQID NO:156具有至少或约95％、97％、99％或100％同源性；以及CDRH3，其与SEQ ID NO:157具有至少或约95％、97％、99％或100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其包含具有SEQ ID NO:155的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRH2，其包含具有SEQ ID NO:156的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；以及CDRH3，其包含具有SEQ ID NO:157的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

在一些实施方案中，所述抗体或免疫球蛋白序列包含：CDRL1，其与SEQ ID NO:158具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRL2，其与SEQ ID NO:159具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；以及CDRL3，其与SEQ ID NO:160具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRL1，其与SEQ ID NO:158具有至少或约95％、97％、99％或100％同源性；CDRL2，其与SEQID NO:159具有至少或约95％、97％、99％或100％同源性；以及CDRL3，其与SEQ ID NO:160具有至少或约95％、97％、99％或100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRL1，其包含具有SEQ ID NO:158的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRL2，其包含具有SEQ ID NO:159的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；以及CDRL3，其包含具有SEQ ID NO:160的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

在一些实施方案中，所述抗体或免疫球蛋白序列包含：CDRL1，其与SEQ ID NO:161具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRL2，其与SEQ ID NO:162具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；以及CDRL3，其与SEQ ID NO:163具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRL1，其与SEQ ID NO:161具有至少或约95％、97％、99％或100％同源性；CDRL2，其与SEQID NO:162具有至少或约95％、97％、99％或100％同源性；以及CDRL3，其与SEQ ID NO:163具有至少或约95％、97％、99％或100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRL1，其包含具有SEQ ID NO:161的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRL2，其包含具有SEQ ID NO:162的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；以及CDRL3，其包含具有SEQ ID NO:163的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

在一些实施方案中，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:152具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRH2，其与SEQ ID NO:153具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRH3，其与SEQID NO:154具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRL1，其与SEQ ID NO:158具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRL2，其与SEQ ID NO:159具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；以及CDRL3，其与SEQ ID NO:160具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:152具有至少或约95％、97％、99％或100％同源性；CDRH2，其与SEQ ID NO:153具有至少或约95％、97％、99％或100％同源性；CDRH3，其与SEQ ID NO:154具有至少或约95％、97％、99％或100％同源性；CDRL1，其与SEQ ID NO:158具有至少或约95％、97％、99％或100％同源性；CDRL2，其与SEQ ID NO:159具有至少或约95％、97％、99％或100％同源性；以及CDRL3，其与SEQ ID NO:160具有至少或约95％、97％、99％或100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其包含具有SEQ ID NO:152的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRH2，其包含具有SEQ ID NO:153的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRH3，其包含具有SEQ ID NO:154的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRL1，其包含具有SEQ ID NO:158的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRL2，其包含具有SEQ ID NO:159的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；以及CDRL3，其包含具有SEQ ID NO:160的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

在一些实施方案中，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:152具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRH2，其与SEQ ID NO:153具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRH3，其与SEQID NO:154具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRL1，其与SEQ ID NO:161具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRL2，其与SEQ ID NO:162具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；以及CDRL3，其与SEQ ID NO:163具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:152具有至少或约95％、97％、99％或100％同源性；CDRH2，其与SEQ ID NO:153具有至少或约95％、97％、99％或100％同源性；CDRH3，其与SEQ ID NO:154具有至少或约95％、97％、99％或100％同源性；CDRL1，其与SEQ ID NO:161具有至少或约95％、97％、99％或100％同源性；CDRL2，其与SEQ ID NO:162具有至少或约95％、97％、99％或100％同源性；以及CDRL3，其与SEQ ID NO:163具有至少或约95％、97％、99％或100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其包含具有SEQ ID NO:152的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRH2，其包含具有SEQ ID NO:153的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRH3，其包含具有SEQ ID NO:154的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRL1，其包含具有SEQ ID NO:161的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRL2，其包含具有SEQ ID NO:162的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；以及CDRL3，其包含具有SEQ ID NO:163的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

在一些实施方案中，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:155具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRH2，其与SEQ ID NO:156具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRH3，其与SEQID NO:157具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRL1，其与SEQ ID NO:158具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRL2，其与SEQ ID NO:159具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；以及CDRL3，其与SEQ ID NO:160具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:155具有至少或约95％、97％、99％或100％同源性；CDRH2，其与SEQ ID NO:156具有至少或约95％、97％、99％或100％同源性；CDRH3，其与SEQ ID NO:157具有至少或约95％、97％、99％或100％同源性；CDRL1，其与SEQ ID NO:158具有至少或约95％、97％、99％或100％同源性；CDRL2，其与SEQ ID NO:159具有至少或约95％、97％、99％或100％同源性；以及CDRL3，其与SEQ ID NO:160具有至少或约95％、97％、99％或100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其包含具有SEQ ID NO:155的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRH2，其包含具有SEQ ID NO:156的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRH3，其包含具有SEQ ID NO:157的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRL1，其包含具有SEQ ID NO:158的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRL2，其包含具有SEQ ID NO:159的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；以及CDRL3，其包含具有SEQ ID NO:160的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

在一些实施方案中，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:155具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRH2，其与SEQ ID NO:156具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRH3，其与SEQID NO:157具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRL1，其与SEQ ID NO:161具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；CDRL2，其与SEQ ID NO:162具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性；以及CDRL3，其与SEQ ID NO:163具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其与SEQ ID NO:155具有至少或约95％、97％、99％或100％同源性；CDRH2，其与SEQ ID NO:156具有至少或约95％、97％、99％或100％同源性；CDRH3，其与SEQ ID NO:157具有至少或约95％、97％、99％或100％同源性；CDRL1，其与SEQ ID NO:161具有至少或约95％、97％、99％或100％同源性；CDRL2，其与SEQ ID NO:162具有至少或约95％、97％、99％或100％同源性；以及CDRL3，其与SEQ ID NO:163具有至少或约95％、97％、99％或100％同源性。在一些情况下，所述抗体或免疫球蛋白序列包含：CDRH1，其包含具有SEQ ID NO:155的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRH2，其包含具有SEQ ID NO:156的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRH3，其包含具有SEQ ID NO:157的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRL1，其包含具有SEQ ID NO:161的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；CDRL2，其包含具有SEQ ID NO:162的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分；以及CDRL3，其包含具有SEQ ID NO:163的至少或约3、4、5、6、7、8、9、10、12、14、16个或多于16个氨基酸的至少一部分。

在一些实施方案中，本文描述了与CRTH2R结合的抗体或免疫球蛋白。在一些情况下，CRTH2R抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:1-SEQID NO:23或SEQ ID NO:126-SEQ ID NO:148中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，CRTH2R抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:1-SEQID NO:23或SEQ ID NO:126-SEQ ID NO:148中的任一个具有至少或约95％的序列同一性。在一些情况下，CRTH2R抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ IDNO:1-SEQ ID NO:23或SEQ ID NO:126-SEQ ID NO:148中的任一个具有至少或约97％的序列同一性。在一些情况下，CRTH2R抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:1-SEQ ID NO:23或SEQ ID NO:126-SEQ ID NO:148中的任一个具有至少或约99％的序列同一性。在一些情况下，CRTH2R抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:1-SEQ ID NO:23或SEQ ID NO:126-SEQ ID NO:148中的任一个具有至少或约100％的序列同一性。在一些情况下，CRTH2R抗体或免疫球蛋白序列包含重链可变域，所述重链可变域包含具有SEQ ID NO:1-SEQ ID NO:23或SEQ ID NO:126-SEQ ID NO:148的至少或约1、2、3、4、5、6、7、8、9、10、12、14、16、18、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400个或多于400个氨基酸的至少一部分。

在一些情况下，CRTH2R抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:24-SEQ ID NO:45或SEQ ID NO:149-SEQ ID NO:151中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，CRTH2R抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:24-SEQ ID NO:45或SEQ ID NO:149-SEQ ID NO:151中的任一个具有至少或约95％的序列同一性。在一些情况下，CRTH2R抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:24-SEQ ID NO:45或SEQ ID NO:149-SEQ ID NO:151中的任一个具有至少或约97％的序列同一性。在一些情况下，CRTH2R抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:24-SEQ ID NO:45或SEQ ID NO:149-SEQ ID NO:151中的任一个具有至少或约99％的序列同一性。在一些情况下，CRTH2R抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:24-SEQ ID NO:45或SEQ ID NO:149-SEQID NO:151中的任一个具有至少或约100％的序列同一性。在一些情况下，CRTH2R抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域包含具有SEQ ID NO:24-SEQ ID NO:45或SEQ ID NO:149-SEQ ID NO:151的至少或约1、2、3、4、5、6、7、8、9、10、12、14、16、18、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400个或多于400个氨基酸的至少一部分。

本文提供了针对各种蛋白质靶标的抗体或免疫球蛋白。在一些情况下，蛋白质是TIGIT。在一些实施方案中，本文描述了与TIGIT结合的抗体或免疫球蛋白。在一些情况下，TIGIT抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:84-SEQ IDNO:100中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，TIGIT抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:84-SEQ ID NO:100中的任一个具有至少或约95％的序列同一性。在一些情况下，TIGIT抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:84-SEQ ID NO:100中的任一个具有至少或约97％的序列同一性。在一些情况下，TIGIT抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ IDNO:84-SEQ ID NO:100中的任一个具有至少或约99％的序列同一性。在一些情况下，TIGIT抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:84-SEQ ID NO:100中的任一个具有至少或约100％的序列同一性。在一些情况下，TIGIT抗体或免疫球蛋白序列包含重链可变域，所述重链可变域包含具有SEQ ID NO:84-SEQ ID NO:100中的任一个的至少或约1、2、3、4、5、6、7、8、9、10、12、14、16、18、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400个或多于400个氨基酸的至少一部分。

在一些情况下，TIGIT抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:101-SEQ ID NO:117中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，TIGIT抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:101-SEQ ID NO:117中的任一个具有至少或约95％的序列同一性。在一些情况下，TIGIT抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:101-SEQ ID NO:117中的任一个具有至少或约97％的序列同一性。在一些情况下，TIGIT抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:101-SEQ ID NO:117中的任一个具有至少或约99％的序列同一性。在一些情况下，TIGIT抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:101-SEQ ID NO:117中的任一个具有至少或约100％的序列同一性。在一些情况下，TIGIT抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域包含具有SEQ ID NO:101-SEQ ID NO:117中的任一个的至少或约1、2、3、4、5、6、7、8、9、10、12、14、16、18、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400个或多于400个氨基酸的至少一部分。

在一些情况下，所述蛋白质是CD3ε。在一些实施方案中，本文描述了与CD3结合的抗体或免疫球蛋白。在一些情况下，CD3抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:138-SEQ ID NO:141中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，CD3抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:138-SEQ IDNO:141中的任一个具有至少或约95％的序列同一性。在一些情况下，CD3抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:138-SEQ ID NO:141中的任一个具有至少或约97％的序列同一性。在一些情况下，CD3抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQ ID NO:138-SEQ ID NO:141中的任一个具有至少或约99％的序列同一性。在一些情况下，CD3抗体或免疫球蛋白序列包含重链可变域，所述重链可变域与SEQID NO:138-SEQ ID NO:141中的任一个具有至少或约100％的序列同一性。在一些情况下，CD3抗体或免疫球蛋白序列包含重链可变域，所述重链可变域包含具有SEQ ID NO:138-SEQID NO:141中的任一个的至少或约1、2、3、4、5、6、7、8、9、10、12、14、16、18、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400个或多于400个氨基酸的至少一部分。

在一些情况下，CD3抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:142-SEQ ID NO:145中的任一个具有至少或约70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在一些情况下，CD3抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:142-SEQ ID NO:145中的任一个具有至少或约95％的序列同一性。在一些情况下，CD3抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:142-SEQ ID NO:145中的任一个具有至少或约97％的序列同一性。在一些情况下，CD3抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:142-SEQ ID NO:145中的任一个具有至少或约99％的序列同一性。在一些情况下，CD3抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域与SEQ ID NO:142-SEQ ID NO:145中的任一个具有至少或约100％的序列同一性。在一些情况下，CD3抗体或免疫球蛋白序列包含轻链可变域，所述轻链可变域包含具有SEQ ID NO:142-SEQ ID NO:145中的任一个的至少或约1、2、3、4、5、6、7、8、9、10、12、14、16、18、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400个或多于400个氨基酸的至少一部分。

变体文库

密码子变异

本文所述的变异核酸文库可包含多个核酸，其中每个核酸编码与参考核酸序列相比的变异密码子序列。在一些情况下，第一核酸群体中的每个核酸在单变异位点处含有变体。在一些情况下，第一核酸群体在单变异位点处含有多个变体，使得第一核酸群体在相同变异位点处含有多于一个变体。第一核酸群体可包含在相同变异位点处共同编码多个密码子变体的核酸。第一核酸群体可包含在相同位置处共同编码多达19个或更多个密码子的核酸。第一核酸群体可包含在相同位置处共同编码多达60个变异三联体的核酸，或者第一核酸群体可包含在相同位置处共同编码多达61个不同密码子三联体的核酸。每个变体可编码在翻译过程中产生不同氨基酸的密码子。表1B提供了对于变异位点可能的每个密码子(和代表性氨基酸)的列表。

表1B.密码子和氨基酸列表

核酸群体可包含在多个位置处共同编码至多20个密码子变异的改变的核酸。在这类情况下，该群体中的每个核酸包含在相同核酸中多于一个位置处的密码子变异。在一些情况下，该群体中的每个核酸包含在单个核酸中的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个密码子处的密码子变异。在一些情况下，每个变异长核酸包含在单个长核酸中的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个密码子处的密码子变异。在一些情况下，该变异核酸群体包含在单个核酸中的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个密码子处的密码子变异。在一些情况下，该变异核酸群体包含在单个长核酸中的至少约10、20、30、40、50、60、70、80、90、100个或更多个密码子处的密码子变异。

高度平行的核酸合成

本文提供了一种平台方法，其利用从多核苷酸合成到硅上纳米孔内基因装配的端到端过程的小型化、平行化及垂直整合来创建革命性的合成平台。本文所述的装置采用与96孔板相同的占地面积(footprint)提供了这样一种硅合成平台，与传统合成方法相比，该硅合成平台能够将通量提高高达1,000倍或更多，其中在单次高度平行化运行中产生高达约1,000,000个或更多个多核苷酸或10,000个或更多个基因。

随着新一代测序的出现，高分辨率基因组数据已成为深入研究各种基因在正常生物学和疾病发病机理中的生物学作用的研究的重要因素。本研究的核心是分子生物学的中心法则和“连续信息的逐残基转移”的概念。将DNA中编码的基因组信息转录成信息，随后将其翻译成蛋白质，该蛋白质是给定生物学途径内的活性产物。

另一个令人兴奋的研究领域是关于着眼于高度特异性细胞靶标的治疗性分子的发现、研发和制备。高度多样性的DNA序列文库是靶向治疗剂的开发流程的核心。在设计、构建和测试蛋白质工程循环中使用基因突变体表达蛋白质，在理想情况下该循环得到针对对其治疗靶标具有高亲和力的蛋白质的高度表达而优化的基因。作为实例，考虑受体的结合口袋。同时测试结合口袋内所有残基的所有序列排列的能力将允许进行彻底的探索，从而增加成功的可能性。饱和诱变(其中研究人员试图在受体内的特定位点处生成所有可能的突变)代表了针对这种开发挑战的一种方法。虽然其成本高、耗时且耗力，但它能够将每个变体引入到每个位置。相反，组合诱变(其中几个选定的位置或短DNA段可得到广泛修饰)生成具有偏向呈现的变体的不完全组库。

为了加速药物开发流程，具有在可用于测试的正确位置处以预期频率可获得的所需变体的文库(换言之，精确文库)使得能够降低成本以及筛选的周转时间。本文提供了用于合成核酸合成变体文库的方法，其能够以所需的频率精确引入每种期望的变体。对于最终用户来说，这意味着不仅能够彻底对序列空间进行采样，而且能够以有效的方式查询这些假设，从而降低成本和筛选时间。全基因组编辑可以阐明重要的途径，可以检测每个变体和序列排列以获得最佳功能性的文库，并且可以使用数以千计的基因重建整个途径和基因组，以重新改造生物系统以供药物发现。

在第一个实例中，药物本身可以使用本文所述的方法进行优化。例如，为了改善抗体的指定功能，设计并合成编码抗体一部分的变异多核苷酸文库。然后可以通过本文所述的过程(例如，PCR诱变之后插入载体中)生成抗体的变异核酸文库。然后在生产细胞系中表达该抗体，并针对增强的活性进行筛选。示例筛选包括检查对抗原的结合亲和力、稳定性或效应物功能(例如，ADCC、补体或凋亡)的调节。用来优化抗体的示例性区域包括但不限于Fc区、Fab区、Fab区的可变区、Fab区的恒定区、重链或轻链的可变域(V_H或V_L)以及V_H或V_L的特定互补决定区(CDR)。

通过本文所述的方法合成的核酸文库可以在与疾病状态相关的各种细胞中表达。与疾病状态相关的细胞包括细胞系、组织样品、来自对象的原代细胞、从对象扩充的培养细胞或模型系统中的细胞。示例性的模型系统包括但不限于疾病状态的植物和动物模型。

为了鉴定与疾病状态的预防、减轻或治疗相关的变异分子，本文所述的变异核酸文库在与疾病状态相关的细胞中表达，或者在可以诱发细胞疾病状态的细胞中表达。在一些情况下，使用药剂在细胞中诱发疾病状态。用于疾病状态诱发的示例性工具包括但不限于Cre/Lox重组系统、LPS炎症诱发和用来诱发低血糖的链脲佐菌素。与疾病状态相关的细胞可以是来自模型系统的细胞或培养的细胞，以及来自具有特定疾病状况的对象的细胞。示例性疾病状况包括细菌、真菌、病毒、自身免疫性或增生性病症(例如，癌症)。在一些情况下，所述变异核酸文库在模型系统、细胞系或来源于对象的原代细胞中表达，并针对至少一种细胞活性的改变进行筛选。示例性的细胞活性包括但不限于增殖、周期进展、细胞死亡、粘附、迁移、复制、细胞信号传导、能量产生、氧利用、代谢活性和老化、对自由基损伤的响应或其任意组合。

基底

用作多核苷酸合成表面的装置可以是基底的形式，其包括但不限于均质阵列表面、图案化的阵列表面、通道、珠子、凝胶等。本文提供了包含多个簇的基底，其中每个簇包含多个支持多核苷酸附着和合成的座位。在一些情况下，基底包含均匀的阵列表面。例如，该均匀的阵列表面是均匀的板。如本文所用的术语“座位”是指结构上的离散区域，其提供了对编码单个预定序列的多核苷酸从该表面延伸的支持。在一些情况下，座位在二维表面(例如，基本上为平面的表面)上。在一些情况下，座位在三维表面(例如，孔、微孔、通道或柱杆)上。在一些情况下，座位的表面包含这样的材料，该材料被活化官能化，以附着至少一个核苷酸以供多核苷酸合成，或者优选地，附着相同核苷酸的群体以供多核苷酸群体合成。在一些情况下，多核苷酸是指编码相同核酸序列的多核苷酸群体。在一些情况下，基底的表面包括基底的一个或多个表面。使用所提供的系统和方法在本文所述的文库内合成的多核苷酸的平均错误率通常小于1/1000、小于约1/2000、小于约1/3000或更低，通常没有错误校正。

本文提供了支持在共同支持物上的可寻址位置处平行合成具有不同预定序列的多个多核苷酸的表面。在一些情况下，基底为合成多于50、100、200、400、600、800、1000、1200、1400、1600、1800、2,000、5,000、10,000、20,000、50,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000、10,000,000个或更多个不同的多核苷酸提供支持。在一些情况下，该表面为合成多于50、100、200、400、600、800、1000、1200、1400、1600、1800、2,000、5,000、10,000、20,000、50,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000、10,000,000个或更多个编码不同序列的多核苷酸提供支持。在一些情况下，至少一部分多核苷酸具有相同的序列或被配置为用相同的序列合成。在一些情况下，该基底提供用于增长具有至少80、90、100、120、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500个或更多个碱基的多核苷酸的表面环境。

本文提供了在基底的不同座位上合成多核苷酸的方法，其中每个座位支持合成多核苷酸群体。在一些情况下，每个座位支持合成与在另一座位上增长的多核苷酸群体具有不同序列的多核苷酸群体。在一些情况下，每个多核苷酸序列被合成为在用于多核苷酸合成的表面上同一座位簇内的不同座位上具有1、2、3、4、5、6、7、8、9或更多的冗余度。在一些情况下，基底的座位位于多个簇内。在一些情况下，基底包含至少10、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、20000、30000、40000、50000个或更多个簇。在一些情况下，基底包含多于2,000、5,000、10,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,100,000、1,200,000、1,300,000、1,400,000、1,500,000、1,600,000、1,700,000、1,800,000、1,900,000、2,000,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000或10,000,000个或更多个不同的座位。在一些情况下，基底包含约10,000个不同的座位。单簇内的座位的量在不同情况下是不同的。在一些情况下，每个簇包含1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150、200、300、400、500个或更多个座位。在一些情况下，每个簇包含约50-500个座位。在一些情况下，每个簇包含约100-200个座位。在一些情况下，每个簇包含约100-150个座位。在一些情况下，每个簇包含约109、121、130或137个座位。在一些情况下，每个簇包含约19、20、61、64个或更多个座位。备选地或组合地，多核苷酸合成在均匀的阵列表面上进行。

在一些情况下，在基底上合成的不同多核苷酸的数目取决于基底中可用的不同座位的数目。在一些情况下，基底的簇或表面内的座位密度至少是或约为1、10、25、50、65、75、100、130、150、175、200、300、400、500、1,000个或更多个座位/mm²。在一些情况下，基底包含10-500、25-400、50-500、100-500、150-500、10-250、50-250、10-200或50-200mm²。在一些情况下，簇或表面内两个相邻座位的中心之间的距离为约10-500、约10-200或约10-100um。在一些情况下，相邻座位的两个中心之间的距离大于约10、20、30、40、50、60、70、80、90或100um。在一些情况下，两个相邻座位的中心之间的距离小于约200、150、100、80、70、60、40、30、20或10um。在一些情况下，每个座位具有约0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100um的宽度。在一些情况下，每个座位具有约0.5-100、0.5-50、10-75或0.5-50um的宽度。

在一些情况下，基底内的簇的密度是至少或约1个簇/100mm²、1个簇/10mm²、1个簇/5mm²、1个簇/4mm²、1个簇/3mm²、1个簇/2mm²、1个簇/1mm²、2个簇/1mm²、3个簇/1mm²、4个簇/1mm²、5个簇/1mm²、10个簇/1mm²、50个簇/1mm²或更高。在一些情况下，基底包含约1个簇/10mm²至约10个簇/1mm²。在一些情况下，两个相邻簇的中心之间的距离至少为或约为50、100、200、500、1000、2000或5000um。在一些情况下，两个相邻簇的中心之间的距离约为50-100、50-200、50-300、50-500和100-2000um。在一些情况下，两个相邻簇的中心之间的距离约为0.05-50、0.05-10、0.05-5、0.05-4、0.05-3、0.05-2、0.1-10、0.2-10、0.3-10、0.4-10、0.5-10、0.5-5或0.5-2mm。在一些情况下，每个簇具有约0.5至约2、约0.5至约1或约1至约2mm的横截面。在一些情况下，每个簇具有约0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2mm的横截面。在一些情况下，每个簇具有约0.5、0.6、0.7、0.8、0.9、1、1.1、1.15、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2mm的内部横截面。

在一些情况下，基底是约标准96孔板的大小，例如，约100至约200mm乘以约50至约150mm。在一些情况下，基底具有小于或等于约1000、500、450、400、300、250、200、150、100或50mm的直径。在一些情况下，基底的直径约为25-1000、25-800、25-600、25-500、25-400、25-300或25-200mm。在一些情况下，基底具有至少约100、200、500、1,000、2,000、5,000、10,000、12,000、15,000、20,000、30,000、40,000、50,000mm²或更大的平面表面积。在一些情况下，基底的厚度约为50-2000、50-1000、100-1000、200-1000或250-1000mm。

表面材料

本文提供的基底、装置和反应器由适合于本文描述的方法、组合物和系统的任何种类的材料制成。在某些情况下，将基底材料制造成表现出低水平的核苷酸结合。在一些情况下，修饰基底材料以生成表现出高水平的核苷酸结合的不同表面。在一些情况下，基底材料对可见光和/或紫外线是透明的。在一些情况下，基底材料具有足够的导电性，例如，能够跨整个基底或其一部分形成均匀的电场。在一些情况下，导电材料在电气上接地。在一些情况下，该基底是导热的或隔热的。在一些情况下，该材料是耐化学的且耐热的，以支持化学或生化反应，例如多核苷酸合成反应过程。在一些情况下，基底包含柔性材料。对于柔性材料而言，材料可包括但不限于：改性及未改性的尼龙、硝酸纤维素、聚丙烯等。在一些情况下，基底包含刚性材料。对于刚性材料而言，材料可包括但不限于：玻璃；熔融石英；硅、塑料(例如，聚四氟乙烯、聚丙烯、聚苯乙烯、聚碳酸脂，及其混合物等)；金属(例如，金、铂等)。基底、固体支持物或反应器可由选自硅、聚苯乙烯、琼脂糖、葡聚糖、纤维素聚合物、聚丙烯酰胺、聚二甲基硅氧烷(PDMS)和玻璃的材料制成。基底/固体支持物或者其中的微结构、反应器可使用本文所列材料或本领域中已知的任何其他适当材料的组合制成。

表面架构

本文提供了用于本文描述的方法、组合物和系统的基底，其中所述基底具有适合于本文描述的方法、组合物和系统的表面架构。

在一些情况下，基底包含凸起和/或凹陷特征。具有这类特征的一个益处是用来支持多核苷酸合成的表面积增大。在一些情况下，具有凸起和/或凹陷特征的基底被称为三维基底。在一些情况下，三维基底包含一个或多个通道。在一些情况下，一个或多个座位包含通道。在一些情况下，通道可通过沉积装置如材料沉积装置进行试剂沉积。在一些情况下，试剂和/或流体收集在与一个或多个通道流体连通的较大的孔中。例如，基底包含与具有簇的多个座位相对应的多个通道，并且所述多个通道与该簇的一个孔流体连通。在一些方法中，多核苷酸文库在簇的多个座位中合成。

本文提供用于本文描述的方法、组合物和系统的基底，其中该基底被配置用于多核苷酸合成。在一些情况下，该结构被配制为允许用于表面上多核苷酸合成的受控的流动和质量传递路径。在一些情况下，基底的构造允许在多核苷酸合成过程中质量传递路径、化学暴露次数和/或洗涤功效的受控且均匀的分布。在一些情况下，基底的构造允许增加扫描效率，例如通过提供足以用于增长多核苷酸的体积，使得由增长的多核苷酸所排除的体积占可用于或适合于增长多核苷酸的初始可用体积的不多于50％、45％、40％、35％、30％、25％、20％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％或更少。在一些情况下，三维结构允许流体的受管控的流动，从而允许化学暴露的快速交换。

本文提供了用于本文描述的方法、组合物和系统的基底，其中所述基底包含适合于本文描述的方法、组合物和系统的结构。在一些情况下，通过物理结构实现隔离。在一些情况下，通过表面的差异官能化以生成用于多核苷酸合成的活化和钝化区域来实现隔离。在一些情况下，差异官能化通过在整个基底表面上交替呈现疏水性，从而造成可引起沉积的试剂结珠或润湿的水接触角效应来实现。采用较大的结构可减少飞溅和邻近斑点的试剂对不同的多核苷酸合成位置的交叉污染。在一些情况下，使用装置如材料沉积装置将试剂沉积到不同的多核苷酸合成位置。具有三维特征的基底以允许以低错误率(例如，小于约1:500、1:1000、1:1500、1:2,000；1:3,000；1:5,000；或1:10,000)合成大量多核苷酸(例如，多于约10,000个)的方式配置。在一些情况下，基底包含密度为约或大于约1、5、10、20、30、40、50、60、70、80、100、110、120、130、140、150、160、170、180、190、200、300、400或500个特征/mm²的特征。

基底的孔可具有与基底的另一个孔相同或不同的宽度、高度和/或容积。基底的通道可具有与基底的另一个通道相同或不同的宽度、高度和/或容积。在一些情况下，簇的直径或包含簇的孔的直径或两者约为0.05-50、0.05-10、0.05-5、0.05-4、0.05-3、0.05-2、0.05-1、0.05-0.5、0.05-0.1、0.1-10、0.2-10、0.3-10、0.4-10、0.5-10、0.5-5或0.5-2mm。在一些情况下，簇或孔或两者的直径小于或约为5、4、3、2、1、0.5、0.1、0.09、0.08、0.07、0.06或0.05mm。在一些情况下，簇或孔或两者的直径为约1.0mm至1.3mm。在一些情况下，簇或孔或两者的直径约为1.150mm。在一些情况下，簇或孔或两者的直径约为0.08mm。簇的直径是指二维或三维基底内的簇。

在一些情况下，孔的高度约为20-1000、50-1000、100-1000、200-1000、300-1000、400-1000或500-1000um。在一些情况下，孔的高度小于约1000、900、800、700或600um。

在一些情况下，基底包含与簇内的多个座位相对应的多个通道，其中通道的高度或深度为5-500、5-400、5-300、5-200、5-100、5-50或10-50um。在一些情况下，通道的高度小于100、80、60、40或20um。

在一些情况下，通道、座位(例如，在基本上平坦的基底中)或通道和座位两者(例如，在其中座位对应于通道的三维基底中)的直径约为1-1000、1-500、1-200、1-100、5-100或10-100um，例如约90、80、70、60、50、40、30、20或10um。在一些情况下，通道、座位或通道和座位两者的直径小于约100、90、80、70、60、50、40、30、20或10um。在一些情况下，两个相邻通道、座位或通道和座位的中心之间的距离约为1-500、1-200、1-100、5-200、5-100、5-50或5-30，例如约20um。

表面修饰

本文提供了用于在表面上合成多核苷酸的方法，其中该表面包含各种表面修饰。在一些情况下，采用表面修饰通过加成工艺或减成工艺对表面进行化学和/或物理改变，以改变基底表面或基底表面的选定位点或区域的一种或多种化学和/或物理性质。例如，表面修饰包括但不限于：(1)改变表面的润湿性质；(2)对表面进行官能化，即，提供、修改或取代表面官能团；(3)对表面进行去官能化，即，移除表面官能团；(4)以其他方式例如通过刻蚀来改变表面的化学组成；(5)增大或减小表面粗糙度；(6)在表面上提供涂层，例如，展现出与表面的润湿性质不同的润湿性质的涂层；和/或(7)在表面上沉积微粒。

在一些情况下，在表面顶部添加化学层(被称为粘附促进剂)有利于基底表面上的座位的结构化图案化。用于施加粘附促进剂的示例性表面包括但不限于玻璃、硅、二氧化硅和氮化硅。在一些情况下，该粘附促进剂是具有高表面能的化学品。在一些情况下，在基底的表面上沉积第二化学层。在一些情况下，第二化学层具有低表面能。在一些情况下，涂覆在表面上的化学层的表面能支持小液滴在表面上的定位。根据所选择的图案化布置，座位的接近度和/或在座位处的流体接触面积是可改变的。

在一些情况下，(例如为了多核苷酸合成)核酸或其他部分所沉积到的基底表面或解析座位是光滑的或基本上为平面的(例如，二维的)，或者具有不规则性，诸如凸起或凹陷特征(例如，三维特征)。在一些情况下，用一个或多个不同的化合物层来修饰基底表面。感兴趣的此类修饰层包括但不限于无机层和有机层，如金属、金属氧化物，聚合物、有机小分子等。

在一些情况下，使用增大和/或减小表面能的一个或多个部分对基底的解析座位进行官能化。在一些情况下，部分是化学惰性的。在一些情况下，部分被配置为支持所需的化学反应，例如在多核苷酸合成反应中的一个或多个过程。表面的表面能或疏水性是决定核苷酸附着到该表面上的亲和力的因素。在一些情况下，基底官能化方法包括：(a)提供具有包含二氧化硅的表面的基底；和(b)使用本文所述的或本领域已知的合适的硅烷化剂(例如，有机官能烷氧基硅烷分子)对所述表面进行硅烷化。方法和官能化剂在通过引用整体并入本文的美国专利5474796中有描述。

在一些情况下，基底表面通常经由存在于基底表面上的反应性亲水部分，在有效地将硅烷偶联至基底表面的反应条件下，使基底表面与含有硅烷混合物的衍生化组合物相接触来进行官能化。硅烷化一般通过使用有机官能烷氧基硅烷分子自装配来覆盖表面。还可使用本领域当前已知的多种硅氧烷官能化试剂，例如用于降低或增大表面能。有机官能烷氧基硅烷根据其有机官能来分类。

多核苷酸合成

用于多核苷酸合成的本公开的方法可包括涉及亚磷酰胺化学法的过程。在一些情况下，多核苷酸合成包括将碱基与亚磷酰胺偶联。多核苷酸合成可包括通过在偶联条件下沉积亚磷酰胺来偶联碱基，其中相同的碱基任选地与亚磷酰胺沉积多于一次，即双偶联。多核苷酸合成可包括未反应位点的加帽。在一些情况下，加帽是可选的。多核苷酸合成还可包括氧化或氧化步骤或多个氧化步骤。多核苷酸合成可包括解封闭、脱三苯甲基化和硫化。在一些情况下，多核苷酸合成包括氧化或硫化。在一些情况下，在多核苷酸合成反应期间的一个步骤或每个步骤之间，例如使用四唑或乙腈来洗涤所述装置。亚磷酰胺合成方法中任一步骤的时间范围可小于约2min、1min、50sec、40sec、30sec、20sec和10sec。

使用亚磷酰胺方法的多核苷酸合成可包括随后将亚磷酰胺构件(例如，核苷亚磷酰胺)添加至增长的多核苷酸链以形成亚磷酸三酯键。亚磷酰胺多核苷酸合成沿3’至5’方向进行。亚磷酰胺多核苷酸合成允许在每个合成循环中将一个核苷酸受控添加至增长的核酸链。在一些情况下，每个合成循环包括偶联步骤。亚磷酰胺偶联包括在活化的核苷亚磷酰胺与(例如通过连接体)结合至基底的核苷之间形成亚磷酸三酯键。在一些情况下，将活化的核苷亚磷酰胺提供给装置。在一些情况下，将核苷亚磷酰胺与活化剂一起提供给装置。在一些情况下，核苷亚磷酰胺以相对于与基底结合的核苷1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90、100倍或更多倍的过量来提供给装置。在一些情况下，核苷亚磷酰胺的添加在无水环境中(例如，在无水乙腈中)进行。添加核苷亚磷酰胺后，任选地洗涤该装置。在一些情况下，偶联步骤额外重复一次或多次，任选地在向基底添加核苷亚磷酰胺之间进行洗涤步骤。在一些情况下，本文使用的多核苷酸合成方法包括1、2、3个或更多个连续的偶联步骤。在许多情况下，在偶联之前，与装置结合的核苷通过去除保护基团来脱保护，其中该保护基团起到防止聚合的作用。常见的保护基团为4,4’-二甲氧基三苯甲基(DMT)。

偶联后，亚磷酰胺多核苷酸合成方法任选地包括加帽步骤。在加帽步骤中，用加帽剂处理增长的多核苷酸。加帽步骤可用来在偶联后封闭未反应的与基底结合的5’-OH基团以防止进一步链延伸，从而防止形成具有内部碱基缺失的多核苷酸。此外，用1H-四唑活化的亚磷酰胺可以在很小的程度上与鸟苷的O6位置反应。不受理论的束缚，在用I₂/水氧化后，该副产物(可能经由O6-N7迁移)可经历脱嘌呤。无嘌呤位点可终止在多核苷酸的最终脱保护过程中被切割，从而降低全长产物的产率。O6修饰可通过在用I₂/水氧化之前用加帽试剂处理而去除。在一些情况下，与没有加帽的合成相比，在多核苷酸合成过程中包括加帽步骤会降低错误率。作为实例，加帽步骤包括用乙酸酐和1-甲基咪唑的混合物处理与基底结合的多核苷酸。在加帽步骤之后，任选地洗涤所述装置。

在一些情况下，在添加核苷亚磷酰胺之后，并且任选地在加帽和一个或多个洗涤步骤之后，对与装置结合的增长的核酸进行氧化。氧化步骤包括将亚磷酸三酯氧化成四配位的磷酸三酯——天然存在的磷酸二酯核苷间连接的受保护的前体。在一些情况下，增长的多核苷酸的氧化通过任选地在弱碱(例如，吡啶、二甲基吡啶、三甲吡啶)的存在下用碘和水处理来实现。氧化可在无水条件下采用例如叔丁基过氧化氢或(1S)-(+)-(10-樟脑磺酰基)-氧杂吖丙啶(CSO)进行。在一些方法中，在氧化之后进行加帽步骤。第二个加帽步骤允许装置干燥，因为可能持续存在的来自氧化的残余水可以抑制随后的偶联。氧化后，任选地洗涤装置和增长的多核苷酸。在一些情况下，氧化步骤用硫化步骤来代替，以获得多核苷酸硫代磷酸，其中任何加帽步骤均可在硫化之后进行。许多试剂能够进行有效的硫转移，包括但不限于3-(二甲基氨基亚甲基)氨基)-3H-1,2,4-二噻唑-3-硫酮、DDTT、3H-1,2-苯并二噻戊环-3-酮1,1-二氧化物(也被称为Beaucage试剂)和N,N,N'N'-四乙基秋兰姆二硫化物(TETD)。

为了使后续核苷掺入循环通过偶联而发生，除去与装置结合的增长的多核苷酸的受保护的5’末端，使得伯羟基与下一个核苷亚磷酰胺反应。在一些情况下，保护基团为DMT，并且用在二氯甲烷中的三氯乙酸进行解封闭。进行延长时间的脱三苯甲基化或者使用比推荐的酸溶液更强的酸溶液进行脱三苯甲基化可导致与固体支持物结合的多核苷酸的脱嘌呤增加，并因此降低了所需全长产物的产率。本文所述的本公开的方法和组合物提供了受控的解封闭条件，从而限制不希望的脱嘌呤反应。在一些情况下，与装置结合的多核苷酸在解封闭后洗涤。在一些情况下，解封闭后的有效洗涤有助于以低错误率合成多核苷酸。

多核苷酸合成方法一般包括一系列迭代的以下步骤：将受保护的单体施加至活化官能化的表面(例如，座位)以与活化的表面、连接体或与预先脱保护的单体连接；使所施加的单体脱保护，使其可与随后施加的受保护的单体反应；以及施加另一种受保护的单体以供连接。一个或多个中间步骤包括氧化或硫化。在一些情况下，在一个或全部步骤之前或之后有一个或多个洗涤步骤。

基于亚磷酰胺的多核苷酸合成方法包括一系列化学步骤。在一些情况下，合成方法的一个或多个步骤涉及试剂循环，其中该方法的一个或多个步骤包括向该装置施加对该步骤有用的试剂。例如，试剂通过一系列液相沉积和真空干燥步骤进行循环。对于包含诸如孔、微孔、通道等三维特征的基底，试剂任选地经由孔和/或通道穿过该装置的一个或多个区域。

本文所述的方法和系统涉及用于合成多核苷酸的多核苷酸合成装置。该合成可以是平行的。例如，可以平行合成至少或约至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、10000、50000、75000、100000个或更多个多核苷酸。可以平行合成的多核苷酸的总数可以是2-100000、3-50000、4-10000、5-1000、6-900、7-850、8-800、9-750、10-700、11-650、12-600、13-550、14-500、15-450、16-400、17-350、18-300、19-250、20-200、21-150、22-100、23-50、24-45、25-40、30-35个。本领域技术人员知晓，平行合成的多核苷酸的总数可处于由这些值中的任何值所限定的任何范围内，例如25-100。平行合成的多核苷酸的总数可处于由充当范围端点的任何值所限定的任何范围内。在装置内合成的多核苷酸的总摩尔质量或每种多核苷酸的摩尔质量可以是至少或至少约10、20、30、40、50、100、250、500、750、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、25000、50000、75000、100000皮摩尔或更大。每种多核苷酸的长度或装置内多核苷酸的平均长度可以是至少或约至少10、15、20、25、30、35、40、45、50、100、150、200、300、400、500个或更多个核苷酸。每种多核苷酸的长度或装置内多核苷酸的平均长度可以是至多或约至多500、400、300、200、150、100、50、45、35、30、25、20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸。每种多核苷酸的长度或装置内多核苷酸的平均长度可以处于10-500、9-400、11-300、12-200、13-150、14-100、15-50、16-45、17-40、18-35、19-25之间。本领域技术人员知晓，每种多核苷酸的长度或装置内多核苷酸的平均长度可处于由这些值中的任何值所限定的任何范围内，例如100-300。每种多核苷酸的长度或装置内多核苷酸的平均长度可处于由充当范围端点的任何值所限定的任何范围内。

本文提供的在表面上合成多核苷酸的方法允许以较快的速度合成。作为实例，每小时合成至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、70、80、90、100、125、150、175、200个或更多个核苷酸。核苷酸包括腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶、尿苷构件，或其类似物/修饰形式。在一些情况下，多核苷酸文库在基底上平行合成。例如，包含约或至少约100、1,000、10,000、30,000、75,000、100,000、1,000,000、2,000,000、3,000,000、4,000,000或5,000,000个解析座位的装置能够支持合成至少相同数目的不同的多核苷酸，其中编码不同序列的多核苷酸在解析座位上合成。在一些情况下，在少于约三个月、两个月、一个月、三周、15天、14天、13天、12天、11天、10天、9天、8天、7天、6天、5天、4天、3天、2天、24小时或更短的时间内，以本文所述的低错误率在装置上合成多核苷酸文库。在一些情况下，使用本文所述的基底和方法从以低错误率合成的多核苷酸文库装配的较大核酸在少于约三个月、两个月、一个月、三周、15天、14天、13天、12天、11天、10天、9天、8天、7天、6天、5天、4天、3天、2天、24小时或更短的时间内制备。

在一些情况下，本文所述的方法提供了生成包含在多个密码子位点处不同的变异核酸的核酸文库。在一些情况下，核酸可具有1个位点、2个位点、3个位点、4个位点、5个位点、6个位点、7个位点、8个位点、9个位点、10个位点、11个位点、12个位点、13个位点、14个位点、15个位点、16个位点、17个位点、18个位点、19个位点、20个位点、30个位点、40个位点、50个位点或更多个变异密码子位点。

在一些情况下，变异密码子位点的一个或多个位点可以是相邻的。在一些情况下，变异密码子位点的一个或多个位点可以是不相邻的，并且由1、2、3、4、5、6、7、8、9、10个或更多个密码子隔开。

在一些情况下，核酸可包含变异密码子位点的多个位点，其中所有变异密码子位点彼此相邻，形成一段变异密码子位点。在一些情况下，核酸可包含变异密码子位点的多个位点，其中所述变异密码子位点彼此均不相邻。在一些情况下，核酸可包含变异密码子位点的多个位点，其中一些变异密码子位点彼此相邻，形成一段变异密码子位点，而一些变异密码子位点彼此不相邻。

参见附图，图1示出了用于从较短核酸合成核酸(例如，基因)的示例性处理工作流程。该工作流程大致分为以下阶段：(1)从头合成单链核酸文库，(2)连接核酸以形成更大的片段，(3)错误校正，(4)质量控制，以及(5)运输。在从头合成之前，预先选择预期的核酸序列或一组核酸序列。例如，预先选择一组基因用于生成。

一旦选择用于生成的大核酸，则针对从头合成来设计预定的核酸文库。用于生成高密度多核苷酸阵列的各种合适的方法是已知的。在该工作流程示例中，提供了装置表面层。在该示例中，改变表面的化学性质，以改进多核苷酸合成过程。生成低表面能区域以排斥液体，同时生成高表面能区域以吸引液体。表面本身可以是平面表面的形式或者包含形状的变化，例如增加表面积的突起或微孔。在该工作流程示例中，如在通过引用整体并入本文的国际专利申请公开WO/2015/021080中所公开的，所选择的高表面能分子发挥支持DNA化学过程的双重功能。

多核苷酸阵列的原位制备在固体支持物上进行，并利用单核苷酸延伸过程平行延伸多个寡聚物。沉积装置如材料沉积装置被设计为以逐步方式释放试剂，使得多个多核苷酸平行地一次延伸一个残基，以生成具有预定核酸序列的寡聚物102。在一些情况下，多核苷酸在该阶段从表面上切下。切割包括例如采用氨或甲胺的气体切割。

将生成的多核苷酸文库放置于反应室中。在该示例性工作流程中，反应室(也被称为“纳米反应器”)为硅涂覆的孔，其含有PCR试剂并下降到多核苷酸文库上103。在多核苷酸密封104之前或之后，添加试剂以从基底释放多核苷酸。在该示例性工作流程中，多核苷酸在纳米反应器密封105之后释放。一旦释放，单链多核苷酸的片段即发生杂交，以跨越整个长程DNA序列。部分杂交105是可能的，因为每个合成的多核苷酸被设计为具有与池中的至少一个其他多核苷酸重叠的一小部分。

杂交后，开始PCA反应。在聚合酶循环过程中，多核苷酸与互补片段退火，并且用聚合酶补平缺口。根据哪些多核苷酸彼此发现，每个循环随机增加各个片段的长度。片段之间的互补性允许形成完整的大跨度的双链DNA 106。

在PCA完成之后，将纳米反应器与装置分开107，并定位成与具有PCR引物的装置相互作用108。密封后，纳米反应器经历PCR 109并扩增较大的核酸。在PCR之后110，打开纳米室111，添加错误校正试剂112，将腔室密封113并进行错误校正反应，以从双链PCR扩增产物中去除具有较差互补性的错配碱基对和/或链114。打开并分离纳米反应器115。错误校正产物接下来经历另外的处理步骤，如PCR和分子条形码化，随后包装122以供运输123。

在一些情况下，采取质量控制措施。在错误校正之后，质量控制步骤包括例如与具有用于扩增错误校正产物的测序引物的晶片进行相互作用116，将晶片密封到含有错误校正扩增产物的腔室中117，并进行另一轮扩增118。打开纳米反应器119，合并产物120并进行测序121。在得到可接受的质量控制结果之后，包装的产物122准许运输123。

在一些情况下，通过诸如图1中的工作流程生成的核酸使用本文公开的重叠引物进行诱变。在一些情况下，通过在固体支持物上原位制备来生成引物文库，并利用单核苷酸延伸过程平行延伸多个寡聚物。沉积装置如材料沉积装置被设计为以逐步方式释放试剂，使得多个多核苷酸平行地一次延伸一个残基，以生成具有预定核酸序列的寡聚物102。

计算机系统

本文所述的任何系统均可以可操作地连接至计算机，并且可以本地或远程地通过计算机进行自动化。在各种情况下，本公开的方法和系统可进一步包括计算机系统上的软件程序及其使用。因此，对于分配/抽真空/再填充功能的同步(如编排和同步材料沉积装置运动、分配动作和真空致动)的计算机化控制处于本公开内容的范围内。计算机系统可被编程为在用户指定的碱基序列与材料沉积装置的位置之间接合，以将正确的试剂递送至基底的指定区域。

图2中示出的计算机系统200可被理解为能够从介质211和/或网络端口205读取指令的逻辑设备，其可任选地连接至具有固定介质212的服务器209。诸如图2示出的系统可包括CPU 201、磁盘驱动器203、可选的输入设备如键盘215和/或鼠标216以及可选的监视器207。可通过示出的通信媒介实现与本地或远程位置处的服务器的数据通信。通信媒介可包括传输和/或接收数据的任何手段。例如，通信媒介可以是网络连接、无线连接或因特网连接。这样的连接可提供经由万维网的通信。可以设想有关本公开的数据可经过这样的网络或连接而传输，以便由图2所示的用户方222接收和/或审阅。

如图3所示，高速缓冲存储器304可连接至或并入处理器302，以提供由处理器302新近或频繁使用的指令或数据的高速存储器。处理器302通过处理器总线308连接至北桥306。北桥306通过存储器总线312连接至随机存取存储器(RAM)310，并管理处理器302对RAM310的访问。北桥306还通过芯片集总线316连接至南桥314。南桥314又连接至外围总线318。外围总线可以是例如PCI、PCI-X、PCI Express或其他外围总线。北桥和南桥通常被称为处理器芯片集，并管理在处理器、RAM与外围总线318上的外围组件之间的数据传送。在一些备选的架构中，北桥的功能性可以并入处理器中，而不是使用单独的北桥芯片。在一些情况下，系统300可包括附接至外围总线318的加速器卡322。加速器可包括现场可编程门阵列(FPGA)或用于加速某个处理的其他硬件。例如，加速器可用于适应性数据重建或用来评价在扩展集处理中使用的代数表达式。

软件和数据存储在外部存储器324中，并可加载至RAM 310和/或高速缓冲存储器304中，以供处理器使用。系统300包括用于管理系统资源的操作系统；操作系统的非限制性实例包括：Linux、Windows^TM、MACOS^TM、BlackBerry OS^TM、iOS^TM和其他功能上等效的操作系统，以及在操作系统顶部运行的、用于根据本公开的示例情况管理数据存储和优化的应用软件。在该实例中，系统300还包括与外围总线连接的网络接口卡(NIC)320和321，以提供与外部存储如网络附加存储(NAS)和可用于分布式并行处理的其他计算机系统的网络接口。

图4是显示了具有多个计算机系统402a和402b、多个蜂窝电话和个人数据助理402c以及网络附加存储(NAS)404a和404b的网络400的示图。在示例实例中，系统402a、402b和402c可管理数据存储并优化对存储在网络附加存储(NAS)404a和404b中的数据的数据访问。数学模型可用于该数据，并使用跨计算机系统402a和402b和蜂窝电话以及个人数据助理系统402c的分布式并行处理进行评价。计算机系统402a和402b和蜂窝电话以及个人数据助理系统402c也可提供对存储在网络附加存储(NAS)404a和404b中的数据的适应性数据重建的并行处理。图4仅示出了一个实例，而多种多样的其他计算机架构和系统可与本公开的多个实例一起使用。例如，刀片服务器可以用来提供并行处理。处理器刀片可通过背板连接，以提供并行处理。存储还可通过单独的网络接口连接至背板或作为网络附加存储(NAS)。在一些示例实例中，处理器可维持单独的存储空间，并通过网络接口、背板或其他连接器传输数据以便由其他处理器并行处理。在其他情况下，部分或全部处理器可使用共享的虚拟地址存储空间。

图5是根据示例情况使用共享虚拟地址存储空间的多处理器计算机系统500的框图。该系统包括可访问共享的存储器子系统504的多个处理器502a-f。该系统中在存储器子系统504中并入多个可编程硬件存储算法处理器(MAP)506a-f。每个MAP 506a-f可以包含存储器508a-f以及一个或多个现场可编程门阵列(FPGA)510a-f。MAP提供可配置的功能单元，并且可以向FPGA 510a-f提供特定算法或算法的部分，以供与相应的处理器密切协同地进行处理。例如，在示例情况中，MAP可用来评价与数据模型相关的代数表达式以及用来进行适应性数据重建。在该示例中，每个MAP可被用于这些目的的所有处理器全局访问。在一种配置中，每个MAP可使用直接存储器访问(DMA)来访问相关联的存储器508a-f，使其独立于且异步于各自的微处理器502a-f而执行任务。在这一配置中，MAP可将结果直接馈送至另一MAP以用于流水处理和并行执行算法。

以上计算机架构和系统仅为实例，并且多种多样的其他计算机、蜂窝电话和个人数据助理架构和系统可与示例实例结合使用，包括使用通用处理器、协处理器、FPGA和其他可编程逻辑设备、芯片上系统(SOC)、专用集成电路(ASIC)和其他处理和逻辑元件的任何组合的系统。在一些情况下，全部或部分计算机系统可用软件或硬件来实现。任何种类的数据存储介质可与示例实例结合使用，包括随机存取存储器、硬盘驱动器、闪速存储器、磁带驱动器、磁盘阵列、网络附加存储(NAS)和其他的本地或分布式数据存储设备和系统。

在示例性情况中，计算机系统可使用在任何上述或其他计算机架构和系统上执行的软件模块来实现。在其他实例中，该系统的功能可部分或完全地在固件、可编程逻辑设备如图3提到的现场可编程门阵列(FPGA)、芯片上系统(SOC)、专用集成电路(ASIC)或其他处理和逻辑元件中实现。例如，集处理器(Set Processor)和优化器可通过使用硬件加速器卡如图3所示的加速器卡322用硬件加速方式实现。

阐述以下实施例是为了向本领域技术人员更清楚地说明本文所公开的实施方案的原理和实践，而不应解释为限制任何请求保护的实施方案的范围。除非另有说明，否则所有份数和百分比均以重量计。

实施例

给出以下实施例是为了说明本公开的多个实施方案的目的，而并非意图以任何方式限制本发明。这些实施例以及目前代表优选实施方案的本文所述方法是示例性的，而非旨在限制本公开的范围。本领域技术人员将会想到其变化以及包含在由权利要求的范围所限定的本公开的精神之内的其他用途。

实施例1：装置表面的官能化

对装置进行官能化以支持多核苷酸文库的附接和合成。首先使用包含90％H₂SO₄和10％H₂O₂的食人鱼溶液(piranha solution)将装置表面润湿清洗20分钟。将该装置在含有去离子水的数个烧杯中漂洗，在去离子水鹅颈旋塞下保持5min，并用N₂干燥。随后将该装置在NH₄OH(1:100；3mL:300mL)中浸泡5min，使用手持式喷枪(handgun)用去离子水漂洗，在连续三个含有去离子水的烧杯中各浸泡1min，然后再使用手持式喷枪用去离子水漂洗。然后通过将装置表面暴露于O₂来等离子体清洗该装置。使用SAMCO PC-300仪器在下游模式下以250瓦进行O₂等离子体蚀刻1min。

使用具有以下参数的YES-1224P汽相沉积烘箱系统，用包含N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺的溶液对清洁的装置表面进行活化官能化：0.5至1托，60min，70℃，135℃汽化器。使用Brewer Science 200X旋涂仪对装置表面进行抗蚀剂涂覆。将SPRTM3612光致抗蚀剂以2500rpm旋涂在装置上40sec。该装置在Brewer热板上以90℃预烘30min。使用Karl Suss MA6掩模对准仪对装置进行光刻。将该装置暴露2.2sec并在MSF 26A中显影1min。剩余的显影剂用手持式喷枪漂洗，并将装置在水中浸泡5min。该装置在烘箱中以100℃烘烤30min，随后使用Nikon L200目视检查光刻缺陷。采用预清除(descum)工艺利用SAMCO PC-300仪器以250瓦进行O₂等离子体蚀刻1min来去除残余抗蚀剂。

用与10μL轻质矿物油混合的100μL全氟辛基三氯硅烷溶液对装置表面进行钝化官能化。将该装置放置于腔室中，泵送10min，随后关闭通往泵的阀门并静置10min。使该腔室排气。该装置通过在70℃下在500mL NMP中进行两次5min浸泡并同时以最大功率(在Crest系统上的9)进行超声波处理来剥离抗蚀剂。然后将该装置在室温下在500mL异丙醇中浸泡5min，同时以最大功率进行超声波处理。将该装置浸入300mL的200标准酒精度(proof)的乙醇中并用N₂吹干。活化该官能化表面以充当多核苷酸合成的支持物。

实施例2：在寡核苷酸合成装置上合成50-聚体序列

将二维寡核苷酸合成装置组装至流动池中，其与流动池(Applied Biosystems(ABI394 DNA合成仪")连接。该二维寡核苷酸合成装置用N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺(Gelest)均匀地官能化，并用来使用本文所述的多核苷酸合成方法合成50bp的示例性多核苷酸(“50-聚体多核苷酸”)。

所述50-聚体的序列如SEQ ID NO.:104所示。5'AGACAATCAACCATTTGGGGTGGACAGCCTTGACCTCTAGACTTCGGCAT##TTTTTTTTTT3'(SEQ ID NO.:104)，其中#表示胸苷-琥珀酰基己酰胺CED亚磷酰胺(来自ChemGenes的CLP-2244)，它是允许在脱保护过程中从表面上释放多核苷酸的可切割的连接体。

根据表2中的方案和ABI合成仪，使用标准DNA合成化学法(偶联、加帽、氧化和解封闭)完成合成。

表2：合成方案

亚磷酰胺/活化剂组合以类似于本体试剂通过流动池递送的方式进行递送。当在全部时间内保持环境被试剂“润湿”时，不进行干燥步骤。

从ABI 394合成仪中去除限流器，以使得能够更快速流动。在没有限流器的情况下，酰胺类(amidites)(在ACN中0.1M)、活化剂(在ACN中的0.25M苯甲酰基硫基四唑(“BTT”；来自GlenResearch的30-3070-xx))和Ox(在20％吡啶、10％水和70％THF中的0.02M I2)的流速大致为～100uL/sec，乙腈(“ACN”)和加帽试剂(帽A和帽B的1:1混合物，其中帽A是在THF/吡啶中的乙酸酐，帽B是在THF中的16％1-甲基咪唑(1-methylimidizole))的流速大致为～200uL/sec，而解封闭剂(在甲苯中的3％二氯乙酸)的流速大致为～300uL/sec(相比之下，在有限流器的情况下，所有试剂的流速均为～50uL/sec)。观测完全排出氧化剂的时间，相应地调整化学品流动时间的时间选择，并在不同的化学品之间引入额外的ACN洗涤。在多核苷酸合成后，将芯片在75psi下在气态氨中脱保护过夜。将五滴水施加到表面上以回收多核苷酸。然后在BioAnalyzer小RNA芯片上分析所回收的多核苷酸。

实施例3：在寡核苷酸合成装置上合成100-聚体序列

使用实施例2中描述的用于合成50-聚体序列的相同过程，在两个不同的硅芯片上合成100-聚体多核苷酸(“100-聚体多核苷酸”；5'CGGGATCCTTATCGTCATCGTCGTACAGATCCCGACCCATTTGCTGTCCACCAGTCATGCTAGCCATACCATGATGATGATGATGATGAGAACCCCGCAT##TTTTTTTTTT3'，其中#表示胸苷-琥珀酰基己酰胺CED亚磷酰胺(来自ChemGenes的CLP-2244)；SEQ ID NO.:105)，第一个用N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺均匀地官能化，而第二个用11-乙酰氧基十一烷基三乙氧基硅烷和正癸基三乙氧基硅烷的5/95混合物官能化，并在BioAnalyzer仪器上分析从表面提取的多核苷酸。

使用下列热循环程序，在50uL PCR混合物(25uL NEB Q5主混合物，2.5uL 10uM正向引物，2.5uL 10uM反向引物，1uL从表面提取的多核苷酸，用水加至50uL)中使用正向引物(5'ATGCGGGGTTCTCATCATC3'；SEQ ID NO.:106)和反向引物(5'CGGGATCCTTATCGTCATCG3'；SEQ ID NO.:107)进一步PCR扩增来自两个芯片的全部十个样品：

30sec

10sec；

10sec；

10sec；重复12个循环

2min

PCR产物还在BioAnalyzer上运行，在100-聚体位置处显示出尖锐峰。然后，对PCR扩增的样品进行克隆，并进行Sanger测序。

表3总结了从来自芯片1的斑点1-5采集的样品和从来自芯片2的斑点6-10采集的样品的Sanger测序结果。

表3：测序结果

斑点	错误率	循环效率
			1	1/763bp	99.87％
2	1/824bp	99.88％
			3	1/780bp	99.87％
4	1/429bp	99.77％
			5	1/1525bp	99.93％
6	1/1615bp	99.94％
			7	1/531bp	99.81％
8	1/1769bp	99.94％
			9	1/854bp	99.88％
10	1/1451bp	99.93％

因此，合成的多核苷酸的高质量和均匀度在具有不同表面化学的两个芯片上重现。总体上，所测序的100-聚体中有89％是没有错误的完美的序列，对应于262个中的233个。

表4总结了从来自斑点1-10的多核苷酸样品中获得的序列的错误特征。

表4：错误特征

实施例4：VHH文库

开发了合成VHH文库。对于具有定制的CDR多样性的“VHH比率”文库，使用ClustalOmega比对2391个VHH序列(iCAN数据库)，以确定每个位置的共有序列，并且框架衍生自每个位置的共有序列。对所有2391个序列的CDR进行了位置特异性变异分析，并将这种多样性引入到文库设计中。对于具有改组的CDR多样性的“VHH改组”文库，对iCAN数据库扫描纳米抗体序列中的独特CDR。鉴定了1239个独特的CDR1、1600个独特的CDR2和1608个独特的CDR3，并且框架衍生自iCAN数据库中2391个序列中每个框架位置的共有序列。每个独特的CDR都在共有框架中单独合成并改组，以生成理论多样性为3.2x10^9的文库。然后使用限制酶消化将该文库克隆到噬菌粒载体中。对于“VHH h改组”文库(合成的“人”VHH文库，具有改组的CDR多样性)，对iCAN数据库扫描纳米抗体序列中的独特CDR。鉴定了1239个独特的CDR1、1600个独特的CDR2和1608个独特的CDR3，并且框架1、3和4衍生自人种系DP-47框架。框架2衍生自iCAN数据库中2391个序列中每个框架位置的共有序列。每个独特的CDR都使用NUGE工具在部分人源化的框架中单独合成并改组，以生成理论多样性为3.2x10^9的文库。然后使用NUGE工具将该文库克隆到噬菌粒载体中。

使用Carterra SPR系统评估VHH-Fc变体的结合亲和力和亲和力分布。VHH-Fc显示出对TIGIT的一定范围的亲和力，下限为12nM K_D，上限为1685nM K_D(数据未示出)。表5A提供了用于ELISA的VHH-Fc克隆、蛋白A(mg/ml)和KD(nM)的具体值。图7A和图7B在20-4000亲和力阈值(图7A；单价KD)和20-1000亲和力阈值(图7B；单价KD)上描绘了VHH文库的TIGIT亲和力分布。在140个测试的VHH结合物中，51个变体的亲和力<100nM，90个变体的亲和力<200nM。图8示出了“VHH比率”文库、“VHH改组文库”和“VHH h改组文库”的每个长度的CDR3计数数据。表5B示出了对于“VHH比率”文库、“VHH改组文库”和“VHH h改组文库”的TIGIT独特克隆和TIGIT结合物的数量。

表5A.

表5B.TIGIT独特克隆和TIGIT结合物

VHH-Fc TIGIT克隆的热稳定性和竞争分析见于图9和表6中。对于竞争测定，将4ug/mL TIGIT固定并与0.05–100nM VHH-Fc一起孵育，然后与2ug/mL生物素-CD155和1:5000链霉亲和素-HRP一起孵育。

表6.VHH-Fc TIGIT克隆的热稳定性

变体	文库	K<sub>D</sub>(nM)	T<sub>m1</sub>	T<sub>m2</sub>	IC50(nM)
						TIGIT-29-10	比率	32	72	87	17.65
TIGIT-29-7	比率	41	82	90	9.24
						TIGIT-30-30	改组	23	76	87	5.67
TIGIT-30-43	改组	44	82	90	2.32
						TIGIT-31-1	h改组	12	79	89	17.89
TIGIT-31-6	h改组	14	77	87	4.00
						TIGIT-31-26	h改组	19	79	89	8.20
TIGIT-31-32	h改组	27	80	86	2.85
						TIGIT-31-8	h改组	45	76	84	3.92
TIGIT-31-56	h改组	46	74	83	1.52

还生成并分析了CD47 VHH变体。图10示出了CD47亲和力分布。表7示出了“VHH比率”文库、“VHH改组文库”和“VHH h改组文库”的CD47独特克隆和TIGIT结合物的数量。表8示出了CD47 VHH变体的结合亲和力。如表8中所见，8种CD47 VHH结合物对hCD47的亲和力小于100nM，且6种CD47 VHH结合物对cCD47的亲和力小于100nM。

表7.VHH-Fc CD47克隆

表8.VHH-Fc CD47结合亲和力

VHH-Fc CD47克隆的抑制和热稳定性分析见于图11和表9中。对于抑制测定，将3ug/mL CD47固定并与0.3-132nM的VHH-Fc一起孵育，然后与0.25ug/mL生物素-SIRPα和1:5000链霉亲和素-HRP一起孵育。

表9.VHH-Fc CD47克隆的热稳定性

实施例5：GLP1R的VHH文库

通过类似于实施例14所述的方法开发了GLP1R的VHH文库。简言之，产生了表达GLP1R的稳定细胞系，并通过FACS确认了靶标表达。然后将表达>80％的靶标的细胞用于基于细胞的选择。针对稳定过表达目的靶标的细胞进行了五轮基于细胞的选择。每轮选择使用10⁸个细胞。在对表达靶标的细胞进行选择之前，首先在10⁸个CHO背景细胞上耗尽来自每一轮的噬菌体。通过增加随后几轮选择中的洗涤次数来增加选择的严格性。然后使用胰蛋白酶从噬菌体中洗脱细胞，并扩增噬菌体用于下一轮淘选。来自第4轮和第5轮的总共1000个克隆通过NGS进行测序，以鉴定用于重新格式化为VHH-Fc的独特克隆。

在156个独特GLP1R VHH Fc结合物中，有53个的靶细胞平均荧光强度(MFI)值是亲本细胞的2倍。变体GLP1R-43-77的数据见于图12A-图12B和表10-表11。表11示出了使用RL1-A通道检测到的流式细胞术数据。

表10.淘选概述

表11.GLP1R-43-77数据

带有门控路径的子集名称	计数	中值：RL1-A
			样品E10.fcs/CHO-亲本	11261	237
样品E10.fcs/CHO-GLP1R	13684	23439

实施例6.CRTH2R的VHH文库

通过类似于实施例4所述的方法开发了CRTH2R的VHH文库。简言之，产生了表达CRTH2R的稳定细胞系，并通过FACS确认了靶标表达。然后将表达>80％靶标的细胞用于基于细胞的选择。针对稳定过表达目的靶标的细胞进行了五轮基于细胞的选择。每轮选择使用10⁸个细胞。在对表达靶标的细胞进行选择之前，首先在10⁸个CHO背景细胞上耗尽来自每一轮的噬菌体。通过增加随后几轮选择中的洗涤次数来增加选择的严格性。然后使用胰蛋白酶从噬菌体中洗脱细胞，并扩增噬菌体用于下一轮淘选。来自第4轮和第5轮的总共1000个克隆通过NGS进行测序，以鉴定用于重新格式化为VHH-Fc的独特克隆。

175种独特的CRTH2R VHH Fc结合物中的26种结合物的靶细胞平均荧光强度(MFI)值是亲本细胞的2倍。变体CRTH2-41-51的数据见于图13A-图13B和表12-表13中。表13示出了使用RL1-A通道检测到的流式细胞术数据。变体CRTH2-44-59的数据见于图14A-图14D中。

表12.淘选概述

表13.CRTH2-41-51数据

样品名称	子集名称	计数	中值：RL1-A
				样品C7.fcs	CRTH2R细胞	8663	7441
样品E10.fcs	亲本细胞	11589	2120

实施例7.用于CRTH2R的IgG的鉴定

通过测试CHO CRTH2R阳性细胞(GFP+)和亲本CHO细胞(GFP-)并且比较亲本阴性和靶阳性细胞以排除假阳性来确定抗CRTH2R抗体的细胞结合。表14A中列出的抗体从100nM(15ug/mL)开始用3倍滴定总共8个点进行滴定。CRTH2R IgG抗体的重链和轻链序列示于表14B中。通过浓度通过平均荧光强度(MFI)检测的结合示于图15A-图15E中。与CRTH2-27在100nM的示例性门控点图和APC直方图示于图16A-图16B中。两种抗体(gPCR-51和gPCR-52)用作阳性对照。两个阳性对照的结合概况示于图17A-图17B中。

表14A.CRTH2R抗体可变重链和轻链序列

表14B.可变重链CDR3序列

在随后的示例中，五种抗体在cAMP测定中显示出具有功能性效应：CRTH2-9、CRTH2-27、CRTH2-50、CRTH2-32和CRTH2-42。在图18A-图18B中对这些抗体的结合曲线进行了比较。

实施例8.使用cAMP测定的拮抗剂活性

测定CRTH2R IgG抗体文库以确定PGD2诱导的cAMP信号中的拮抗剂功能。简言之，将细胞用IgG(滴定度1:3)在室温下预孵育1小时。随后，由于CRTH2R是Gα_i偶联的，因此在毛喉素存在下，在37℃下用PGD2(0.59nM)刺激细胞30分钟。

确定了抗体对相对光单位(rlu)的检测信号的影响(数据未示出)。在所测试的最高浓度(300nM)下，一些CRTH2R IgG导致信号向上偏转，表明PGD2刺激诱导的cAMP信号受到抑制。为了比较，条形图显示了对于所测试的三个最高IgG浓度，IgG处理的与对照处理的比率，如图19A所示。图19B中描绘的抗体示出了在33nM导致大于20％的拮抗剂活性的CRTH2RIgG抗体，特别是CRTH2-74、CRTH2-24、CRTH2-28、CRTH2-19、CRTH2-45、CRTH2-9、CRTH2-8、CRTH2-15、CRTH2-42、CRTH2-60和CRTH2-70。

实施例9.PGD2诱导的cAMP信号的别构调节

测定CRTH2R IgG抗体的别构活性。通过测定PGD2诱导的cAMP信号中的CRTH2R IgG抗体来确定别构调节作用。简言之，在没有IgG抗体下或在100nM CRTH2R IgG抗体下重新孵育细胞。随后，在毛喉素存在下用不同浓度的PGD2刺激细胞，然后测定cAMP活性。

cAMP测定的结果见于图20中。PGD2剂量响应曲线右移(且IC50值增加)指示负别构效应。如图20所示，与单独的PGD2相比，五种CRTH2R IgG(CRTH2-9、CRTH2-27、CRTH2-50、CRTH2-32和CRTH2-42)引起>2.0的IC50倍数差异，表明它们是负别构调节剂。

实施例10.PGD2诱导的cAMP信号的激动剂活性

测定CRTH2R IgG抗体的激动剂功能。通过在PGD2诱导的cAMP信号中测定实施例7中描述的CRTH2R IgG抗体来确定激动剂活性。

简言之，在毛喉素存在下，用PGD2或CRTH2R IgG抗体处理细胞。CRTH2R IgG抗体包括CRTH2-74、CRTH2-24、CRTH2-28、CRTH2-39、CRTH2-19、CRTH2-9、CRTH2-8、CRTH2-27、CRTH2-45、CRTH2-35、CRTH2-50、CRTH2-66、CRTH2-57、CRTH2-32、CRTH2-15、CRTH2-25、CRTH2-42、CRTH2-55、CRTH2-60和CRTH2-70。在37℃进行30分钟的处理刺激。然后进行cAMP测定(数据未示出)。

实施例11.显示别构调节剂的对照实验

测定了已知的CRTH2R拮抗剂(小分子OC000459)和两种对照抗体的别构调节。进行类似于实施例9中所述的实验。简言之，用OC000459、比较物CRTH2R AB51抗体或比较物CRTH2R AB52抗体处理细胞。然后在毛喉素存在下用PGD2刺激细胞。

结果示于图21A–图21C中。OC000459导致曲线强烈右移，且IC50值增加到459倍(图21A)。用CRTH2R AB51孵育不会造成IC50值改变(图21B)。用比较物抗体#52孵育造成IC50值下降到之前的1/3.5，表明它是正别构调节剂，即它具有激动作用(图21C)。

实施例12.用于拮抗剂调节的CRTH2Rβ-抑制蛋白募集测定

确定了九种CRTH2R IgG抗体的拮抗剂调节作用。九种CRTH2R IgG抗体包括CRTH2-9、CRTH2-27、CRTH2-50、CRTH2-32、CRTH2-42、CRTH2-74、CRTH2-55、CRTH2-28和CRTH2-39。这九种抗体与OC000459相比的拮抗剂功能是使用PGD2诱导的β-抑制蛋白募集来确定的。包括使用小分子OC000459的阳性对照在内的结果示于图22A-图22D中。

实施例13.用于别构调节的CRTH2Rβ-抑制蛋白募集测定

测定了九种CRTH2R IgG的别构调节。九种CRTH2R IgG包括CRTH2-9、CRTH2-27、CRTH2-50、CRTH2-32、CRTH2-42、CRTH2-74、CRTH2-55、CRTH2-28和CRTH2-39。这九种抗体与OC000459相比的别构调节是使用PGD2诱导的β-抑制蛋白募集来确的。

简言之，将细胞用IgG(100nM)在室温下预孵育1小时，然后在37℃下用PGD2刺激90分钟。数据针对每个图中的第一个数据点(最低PGD2和零Ab)进行归一化。

实施例14.超免疫免疫球蛋白文库

使用类似于实施例4中所述的方法创建超免疫免疫球蛋白(IgG)文库。简言之，超免疫IgG文库是通过对人幼稚和记忆B细胞受体序列数据库的分析生成的，这些序列由来自3名健康供体中每一名的多于3700万个独特的IgH序列组成。从分析中收集并使用类似于实施例1-实施例3的方法单独构建了多于200万个CDRH3序列。在开发过程中经常出现问题的任何重复的CDRH3和潜在责任基序都在文库合成步骤中被移除。然后将这些CDRH3序列多样性以组合形式组装并整合到DP47人框架中，以构建具有1x10¹⁰大小的高功能性抗体Fab文库。设计的示意图可见于图24中。

通过下一代测序(NGS)评估超免疫抗体文库的重链CDR长度分布。CDR长度分布的数据示于图25A-图25B中。通常，可溶性蛋白质靶标的选择经历五轮选择，包括第1轮PBST洗涤三次、第2轮PBST洗涤五次、第3轮PBST洗涤七次、第4轮PBST洗涤九次及第5轮PBST洗涤十二次。使用脱脂牛奶块。参见图26。

对于人TIGIT(hTIGIT)，将1uM生物素化抗原与300ul Dynabead M-280以10mg/mL混合，以产生每100ul 100pmol的浓度。各轮选择的细节见于表15中。

表15.蛋白质淘选选择

经过多轮选择后，对hTIGIT IgG进行分析。数据见于图27A-图27F和表16中。图27A-图27D示出了来自第3轮和第4轮的ELISA数据。图27E-图27F示出了所分析的hTIGITIgG的CDRH3长度、产量(ug)和K_D(nM)的数据。

表16.蛋白质淘选数据

轮次	靶标	抗原	洗涤	KF洗涤	滴度	KF升
							1	hTIGIT	100pmol	3	-	4.40E+06	-
2	hTIGIT	50pmol	5	4	4.40E+07	6.80E+06
							3	hTIGIT	20pmol	7	4	6.00E+08	2.80E+09
4	hTIGIT	10pmol	9	5	5.00E+08	6.00E+08
							5	hTIGIT	10pmol	-	-	-	-

鉴定了十七种不相同的hTIGIT免疫球蛋白，其单价亲和力范围从16nM至超过300nM。这些免疫球蛋白中的大多数表达良好，并在1ml表达体积中产生超过20ug的纯化蛋白质。hTIGIT免疫球蛋白序列见于表17中。

表17.TIGIT序列

进行了人CD3ε(hCD3)和猕猴CD3ε(cCD3)免疫球蛋白的鉴定。各轮选择的细节见于表18中。

表18.蛋白质淘选选择

经过多轮选择后，对CD3ε(CD3ε)IgG进行分析。数据见于图28A-图28L和表19A-表19B中。图28A-图28F示出了来自第4轮和第5轮的ELISA数据。图28G-图28L示出了人CD3ε与猕猴CD3ε免疫球蛋白的交叉反应性的数据。

表19A.蛋白质淘选数据

表19B.

轮次	靶标	抗原	洗涤	输出滴度
					1	hCD3	5ug	4	9.00E+04
2	cCD3	5ug	5	1.40E+05
					3	hCD3	2.5ug	6	3.00E+06
4	cCD3	2.5ug	7	4.00E+06
					5	hCD3	2.5ug	8	2.20E+07

鉴定了十九种不相同的hCD3ε和猕猴CD3ε免疫球蛋白，包括5五种人/猕猴CD3ε交叉反应性免疫球蛋白。人/猕猴CD3ε交叉反应性抗体之一，CD3-56-05分别以67和107nM的亲和力与人和猕猴CD3ε结合。hCD3ε和cCD3ε免疫球蛋白的序列见于表20中。

表20.CD3ε序列

生成了CRTH2R超免疫免疫球蛋白文库。简言之，针对稳定过表达目的靶标的细胞进行了五轮基于细胞的选择。每轮选择使用10⁸个细胞。在对表达靶标的细胞进行选择之前，首先在10⁸个CHO背景细胞上耗尽来自每一轮的噬菌体。通过增加随后几轮选择中的洗涤次数来增加选择的严格性。然后使用胰蛋白酶将细胞从噬菌体中洗脱下来，并且扩增噬菌体以进行下一轮淘选。

评估了CRTH2R免疫球蛋白的结合亲和力和PGD2诱导的cAMP的别构调节剂功能。如图30A-图30F中所见，三种特异性CRTH2R免疫球蛋白被鉴定为对hCRTH2R具有亚纳摩尔至个位数纳摩尔的细胞结合亲和力，并在别构cAMP测定中具有抑制活性。此三种CRTH2R免疫球蛋白CRTH2-48-3、CRTH2-48-21和CRTH2-48-27的序列见于表21中。

表21.CRTH2R序列

实施例15.A2A受体的超免疫免疫球蛋白文库

使用类似于实施例4和实施例14中所述的方法创建超免疫免疫球蛋白(IgG)文库。简言之，超免疫IgG文库是通过对人幼稚和记忆B细胞受体序列数据库的分析生成的，这些序列由来自3名健康供体中每一名的多于3700万个独特的IgH序列组成。从分析中收集并使用类似于实施例1-实施例3的方法单独构建了多于200万个CDRH3序列。将CDRH3序列整合到实施例4中描述的VHH h改组文库中。最终的文库多样性经测定为1.3x10¹⁰。

88个独特克隆中有73个的靶细胞MFI值是亲本细胞的2倍。88个独特克隆中的15个，其靶细胞MFI值是亲本细胞的20倍。腺苷A2A受体变体A2AR-90-007的数据见于图31A-图31B中。

此实施例示出了具有高亲和力和在亚纳摩尔范围内的K_D值的A2AR的VHH文库的生成。

虽然本文已经示出并描述了本公开的优选实施方案，但对于本领域技术人员明显的是，这些实施方案仅以示例的方式提供。在不脱离本公开内容的情况下，本领域技术人员将会想到许多变化、改变和替换。应当理解，在实施本公开时可以采用本文所述本公开的实施方案的各种替代方案。旨在以所附权利要求书限定本公开的范围，并且由此涵盖这些权利要求范围内的方法和结构及其等同物。

Claims

1.一种抗体或抗体片段，其包含：CDRH1，所述CDRH1包含与SEQ ID NO:152或SEQ IDNO:155中所示的氨基酸序列具有至少约90％同一性的氨基酸序列；CDRH2，所述CDRH2包含与SEQ ID NO:153或SEQ ID NO:156中所示的氨基酸序列具有至少约90％同一性的氨基酸序列；以及CDRH3，所述CDRH3包含与SEQ ID NO:154或SEQ ID NO:157中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

2.根据权利要求1所述的抗体或抗体片段，其进一步包含：CDRL1，所述CDRL1包含与SEQID NO:158或SEQ ID NO:161中所示的氨基酸序列具有至少约90％同一性的氨基酸序列；CDRL2，所述CDRL2包含与SEQ ID NO:159或SEQ ID NO:162中所示的氨基酸序列具有至少约90％同一性的氨基酸序列；以及CDRL3，所述CDRL3包含与SEQ ID NO:160或SEQ ID NO:163中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

3.一种治疗癌症的方法，其包括施用根据权利要求1-2中任一项所述的抗体或抗体片段。

4.一种治疗病毒性感染的方法，其包括施用根据权利要求1-2中任一项所述的抗体或抗体片段。

5.一种核酸文库，其包含：多个序列，所述序列包含在翻译时编码抗体或抗体片段的核酸，其中所述多个序列中的每个序列包含编码重链可变区(VH)上的CDR1、CDR2或CDR3或轻链可变区(VL)上的CDR1、CDR2或CDR3的变异序列；其中所述文库包含至少30,000个变异序列；且其中所述抗体或抗体片段以小于100nM的K_D与其抗原结合。

6.根据权利要求5所述的核酸文库，其中所述抗体是单域抗体。

7.根据权利要求6所述的核酸文库，其中所述单域抗体是VHH抗体。

8.根据权利要求5所述的核酸文库，其中所述抗体与TIGIT结合。

9.根据权利要求5所述的核酸文库，其中所述重链可变区在翻译时包含与SEQ ID NO:84-SEQ ID NO:100中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

10.根据权利要求5所述的核酸文库，其中所述轻链可变区在翻译时包含与SEQ ID NO:101-SEQ ID NO:117中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

11.根据权利要求5所述的核酸文库，其中所述重链可变区上的CDR1、CDR2或CDR3包含与SEQ ID NO:67-SEQ ID NO:83或SEQ ID NO:118-SEQ ID NO:128中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

12.根据权利要求5所述的核酸文库，其中所述轻链可变区上的CDR1、CDR2或CDR3包含与SEQ ID NO:129-SEQ ID NO:137中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

13.根据权利要求5所述的核酸文库，其中所述抗体与CD47结合。

14.根据权利要求5所述的核酸文库，其中所述抗体与CD3ε结合。

15.根据权利要求5所述的核酸文库，其中所述重链可变区在翻译时包含与SEQ ID NO:138-SEQ ID NO:141中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

16.根据权利要求5所述的核酸文库，其中所述轻链可变区在翻译时包含与SEQ ID NO:142-SEQ ID NO:145中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

17.根据权利要求5所述的核酸文库，其中所述核酸文库包含至少50,000个变异序列。

18.根据权利要求5所述的核酸文库，其中所述核酸文库包含至少100,000个变异序列。

19.根据权利要求5所述的核酸文库，其中所述核酸文库包含至少10⁵个不相同的核酸。

20.根据权利要求5所述的核酸文库，其中所述核酸文库具有至少10⁹个序列的理论多样性。

21.一种核酸文库，其包含：多个序列，所述序列包含在翻译时编码单域抗体的核酸，其中所述多个序列中的每个序列包含编码重链可变区(VH)上的CDR1、CDR2或CDR3的变异序列；其中所述文库包含至少30,000个变异序列；且其中所述抗体或抗体片段以小于100nM的K_D与其抗原结合。

22.根据权利要求21所述的核酸文库，其中在翻译时所述VH的长度为约90至约100个氨基酸。

23.根据权利要求21所述的核酸文库，其中在翻译时所述VH的长度为约100至约400个氨基酸。

24.根据权利要求21所述的核酸文库，其中所述VH的长度为约270至约300个碱基对。

25.根据权利要求21所述的核酸文库，其中所述VH的长度为约300至约1200个碱基对。

26.根据权利要求21所述的核酸文库，其中所述单域抗体是VHH抗体。

27.根据权利要求21所述的核酸文库，其中所述抗体与TIGIT结合。

28.根据权利要求21所述的核酸文库，其中所述CDR1、CDR2或CDR3包含与SEQ ID NO:67-SEQ ID NO:83或SEQ ID NO:118-SEQ ID NO:128中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

29.根据权利要求21所述的核酸文库，其中所述重链可变区在翻译时包含与SEQ IDNO:84-SEQ ID NO:100中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

30.根据权利要求21所述的核酸文库，其中所述重链可变区上的CDR3包含与SEQ IDNO:101-SEQ ID NO:117中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

31.根据权利要求21所述的核酸文库，其中所述抗体与CD47结合。

32.根据权利要求21所述的核酸文库，其中所述抗体与CD3ε结合。

33.根据权利要求21所述的核酸文库，其中所述重链可变区在翻译时包含与SEQ IDNO:138-SEQ ID NO:141中所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

34.根据权利要求21所述的核酸文库，其中所述核酸文库包含至少50,000个变异序列。

35.根据权利要求21所述的核酸文库，其中所述核酸文库包含至少100,000个变异序列。

36.根据权利要求21所述的核酸文库，其中所述核酸文库包含至少10⁵个不相同的核酸。

37.根据权利要求21所述的核酸文库，其中所述核酸文库具有至少10⁹个序列的理论多样性。

38.一种用于生成编码单域抗体的核酸文库的方法，其包括：

(a)提供编码以下项的预定序列：

i.第一多个多核苷酸，其中所述第一多个多核苷酸中的每个多核苷酸编码至少1000个编码重链上的CDR1的变异序列；

ii.第二多个多核苷酸，其中所述第二多个多核苷酸中的每个多核苷酸编码至少1000个编码重链上的CDR2的变异序列；

iii.第三多个多核苷酸，其中所述第三多个多核苷酸中的每个多核苷酸编码至少1000个编码重链上的CDR3的变异序列；以及

(b)混合第一多个多核苷酸、第二多个多核苷酸和第三多个多核苷酸以形成编码所述单域抗体的变异核酸的所述核酸文库，且其中至少约70％的所述变异核酸编码以小于100nM的K_D与其抗原结合的单域抗体。

39.根据权利要求38所述的方法，其中所述单域抗体包含一个重链可变域。

40.根据权利要求38所述的方法，其中所述单域抗体是VHH抗体。

41.根据权利要求38所述的方法，其中所述单域抗体与TIGIT结合。

42.根据权利要求38所述的方法，其中所述单域抗体包含与SEQ ID NO:84-SEQ ID NO:100或SEQ ID NO:138-SEQ ID NO:141中的任一个所示的氨基酸序列具有至少约90％同一性的氨基酸序列。

43.根据权利要求38所述的方法，其中所述单域抗体与CD47结合。

44.根据权利要求38所述的方法，其中所述核酸文库包含至少50,000个变异序列。

45.根据权利要求38所述的方法，其中所述核酸文库包含至少100,000个变异序列。

46.根据权利要求38所述的方法，其中所述核酸文库包含至少10⁵个不相同的核酸。

47.根据权利要求38所述的方法，其中所述核酸文库包含至少一个编码所述单域抗体的序列，所述单域抗体以小于75nM的K_D与抗原结合。

48.根据权利要求38所述的方法，其中所述核酸文库包含至少一个编码所述单域抗体的序列，所述单域抗体以小于50nM的K_D与抗原结合。

49.根据权利要求38所述的方法，其中所述核酸文库包含至少一个编码所述单域抗体的序列，所述单域抗体以小于25nM的K_D与抗原结合。

50.根据权利要求38所述的方法，其中所述核酸文库包含至少一个编码所述单域抗体的序列，所述单域抗体以小于10nM的K_D与抗原结合。

51.根据权利要求38所述的方法，其中所述核酸文库具有至少10⁹个序列的理论多样性。