CN115175998A

CN115175998A - 分析用大分子的自动化处理及相关设备

Info

Publication number: CN115175998A
Application number: CN202080071684.8A
Authority: CN
Inventors: 蒂莫西·S·伯查姆; 马克·S·朱; 凯文·L·冈德森
Original assignee: Encodia Inc
Current assignee: Encodia Inc
Priority date: 2019-10-18
Filing date: 2020-10-14
Publication date: 2022-10-11
Also published as: US20240042446A1; EP4045646A4; CA3158117A1; WO2021076648A1; EP4045646A1

Abstract

本公开涉及一种用于制备和/或处理大分子例如肽、多肽和蛋白质以供测序和/或分析的设备。提供一种用于执行自动化大分子分析测定的自动化方法，尤其包括将多种试剂中的每一种移动至含有固体载体材料的样本中并将各种试剂与样本一起温育。在一些实施方式中，该设备和自动化方法用于处理和修饰大分子或多种大分子(例如，肽、多肽和蛋白质)以进行采用分子识别事件的条形码和核酸编码、和/或可检测标记的测序和/或分析。

Description

分析用大分子的自动化处理及相关设备

相关申请

本申请要求于2019年10月18日提交的美国临时专利申请No.62/923,406的优先权，其公开和内容出于所有目的通过引用整体并入。

ASCII文本的序列表

本专利申请文件包含一个以计算机可读ASCII文本格式提交的序列表(文件名：4614-2001940_SeqList_ST25.txt，记录日期：2020年10月12日，大小：8,703字节)。序列表文件的内容通过引用整体并入本文。

技术领域

本公开涉及一种用于制备和/或处理大分子例如肽、多肽和蛋白质以供测序和/或其它分析的设备。还提供了一种用于进行大分子分析测定的自动化方法，该方法包括将多种试剂中的每一种运送到含有固定化大分子的样本中并将各种试剂与样本一起温育。在一些实施方式中，所述设备和自动化方法用于处理和/或修饰大分子或多种大分子(例如，肽、多肽和蛋白质)以供测序和/或其它采用分子识别事件的条形码和核酸编码、和/或可检测标记的分析。

背景技术

用于分析诸如蛋白质或肽的大分子的现有技术在几个方面受到限制。蛋白质或肽大分子的分子识别和表征通常使用免疫测定进行，包括例如ELISA、多重ELISA(例如，斑点抗体阵列、液体粒子ELISA阵列)、数字ELISA、反相蛋白质阵列(RPPA)等格式。这些不同的免疫测定平台共同面临相似的挑战，包括开发高亲和力和高特异性或选择性抗体(结合剂)、在样本和分析物水平二者上的多重性能力有限、灵敏度和动态范围有限、以及交叉反应性和背景信号。结合剂无关途径，例如通过肽测序(例如，Edman降解或质谱法)直接表征蛋白质提供了替代途径。然而，这些方法均不是非常并行或高通量的。基于Edman降解的肽测序包括通过一系列化学修饰和下游HPLC分析(后来被质谱分析替代)逐步降解肽上的N端氨基酸。然而，一般而言，Edman降解肽测序慢且通量有限。其它现有的方法包括电喷雾质谱(MS)和LC-MS/MS。然而，MS受限于包括仪器成本高、需要水平高超的用户、定量能力差以及跨蛋白质组动态范围进行测量的能力有限在内的缺点。对于MS，样本通量通常每次运行限于几千个肽，而对于数据独立分析(DIA)，这种通量不足以进行真正自下而上的高通量蛋白质组分析。

因此，需要用于自动化处理和/或制备样本的设备和方法，以实现高度并行化、精确、灵敏和高通量的蛋白质组学技术。本公开满足了这些和其它相关需求。例如，所提供的自动化仪器和方法解决了手动途径制备和处理样本以进行大分子分析测定的相关问题。特别是，通过将大分子分析测定的各个过程步骤自动化，可以实现显著的优势，包括大大降低用户错误、污染和溢出的风险，增加样本处理间的精确度和控制，同时显著增加通量容量。将大分子分析测定的步骤自动化还会减少从业人员所需的培训量，并消除因大量手动应用而造成的身体伤害来源。

参考以下详细描述，本发明的这些和其它方面将显而易见。为此，本文列出了各种参考文献，其更详细地描述了某些背景信息、程序、化合物和/或组成，并且各自通过引用整体并入本文。

发明内容

本概述不旨在用于限制要求保护的主题的范围。从详细描述、包括在附图和所附权利要求中公开的那些方面中，要求保护的主题的其它特征、细节、效用和优点将是显而易见的。

本文提供了一种用于自动化处理含有固定化大分子的样本的设备。所述设备包括：一个或多个容积等于或小于约20mL的非平面样本容器、或被构造用于保持所述样本容器的保持器或空间，其中所述样本容器中的至少一个受到温度控制并被构造成允许流体流过；多个用于包含相应试剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间，其中所述试剂贮器中的至少一个受到温度控制；多个连接在具有上游端和下游端的供应管线中的阀，其中所述阀中的至少一个或每一个可定位以提供从中通过的交替流动路径；以及控制所述一种或多种试剂向所述样本容器递送的控制单元，其中所述一种或多种试剂的递送可单独寻址，所述供应管线将所述试剂贮器与所述样本容器连接并且所述试剂贮器与所述样本容器流体连接，并且至少所述样本容器的温度控制、所述试剂贮器的温度控制、所述阀的定位和/或所述一种或多种试剂向所述样本容器的递送由所述控制单元自动化和控制。

本文中提供了一种自动化处理样本的方法，该方法使用设备进行，并且该方法包括：a)向所述设备提供非平面样本容器，所述容器包含含有大分子例如多肽的样本、以及与固体载体接合的相关记录标签；b)向所述设备的单独的试剂贮器提供结合剂和用于传递信息的试剂，其中所述试剂贮器中的至少一个包含结合剂并且所述试剂贮器中的至少一个包含用于传递信息的试剂；c)将结合剂从所述试剂贮器递送到样本容器，其中所述结合剂包含带有关于所述结合剂的标识信息的代码标签(coding tag)；和d)将所述用于传递信息的试剂从所述试剂贮器递送到样本容器，以将信息从结合剂的代码标签传递到记录标签，从而生成延伸记录标签。在一些实施方式中，所述方法还包括将用于去除多肽末端氨基酸的试剂提供到所述设备的单独的试剂贮器中，并将所述用于去除多肽末端氨基酸的试剂从所述试剂贮器递送到样本容器以去除多肽的末端氨基酸。在一些实施方式中，所述方法还包括将用于用于加帽反应的试剂提供到所述设备的单独的试剂贮器中，并将所述用于用于加帽反应的试剂从所述试剂贮器递送到样本容器。

附图说明

本发明的非限制性实施方式将参考附图为例进行描述，附图是示意性的并且不打算按比例绘制。为了说明的目的，并非在每幅图中都标明了每个成分，在对于本领域普通技术人员理解本发明来说不必要说明的情况下，也没有显示本发明的每个实施方式的每个成分。

图1A-1C示出了用于制备大分子(例如多肽)的示例性系统100。该系统包括n个试剂贮器101，每个都与受控阀102连接，受控阀102可打开或关闭以从每个贮器递送各种试剂。试剂贮器和阀与泵103流体连接，泵103与n个样本容器例如样本盒(cartridges)105连接。样本容器包含在温度控制单元104中。试剂可包括洗涤缓冲液、多肽、核酸、结合剂、酶、用于切割末端氨基酸的化学或酶试剂、和/或用于连接反应或聚合酶介导反应的试剂。如图1A-1C所示，一系列流体连接件107将各试剂101与泵103、各样本容器105和废物容器106连接。在一些实施方式中，样本容器是或包括包含过滤机构或玻璃料的样本盒，用于保留样本同时允许其它材料(例如缓冲液)流过。在一些情况下，样本包含与固体载体接合的大分子(例如多肽)。控制系统108控制系统100的各种组件，包括例如关于试剂分配和流动的阀和泵。在一些实施方式中，控制系统还接收来自所述系统的各种组件、包括阀102、温度控制单元104和/或样本容器105中的一个或多个的反馈。在一些实施方式中，被控制或与控制系统通信的组件用虚线框显示或说明，并且所有电子组件都将与控制系统连接。

图1A中，描绘了一个示例性系统，其中所有试剂阀和样本容器(例如样本盒)阀关闭，泵通过旁路递送到废物容器。图1B中描绘了一个示例性系统，其中泵抽吸一种试剂。图1C中，描绘了一个示例性系统，其中泵将试剂从试剂贮器递送到样本容器(例如样本盒)。

图1D是用于向样本容器(例如样本盒)施加微波能量的示例性微波反应器的图。固态微波发生器用于将微波能量施加到单模谐振腔。在一个优选的方式中，微波发生器以2.45GHz+-0.-.05GHz操作。微波腔的尺寸被设计成能够以集中在位于腔中心的样本盒处的电场激发所述腔的单模以产生驻波。微波腔中的虚曲线指示所述微波腔内单模电场强度的时间平均绝对值。E场的强度在样本盒所在的腔的中心处最大。

图2A是示出使用示例性系统100制备大分子的示例性过程200的流程图。该方法在201开始，其中一个或多个样本和一种或多种试剂(例如在试剂贮器101)放置在示例性系统100的设备中。在一些实施方式中，将样本装入样本容器(例如样本盒)，然后将样本盒放入仪器中。在一些实施方式中，样本包含在201之前制备的多肽，例如将样本中的大分子与固体载体接合、将大分子与核酸(例如记录标签)、消化或片段化的多肽接合、和/或用酶或化学试剂处理样本。一旦在样本容器中、例如在筒中提供样本，过程200就移到202中灌注或冲洗系统并且流体连接，例如通过用缓冲液填充管线。然后系统进行到203以设置包含样本盒的温度控制单元104的温度并在状态204中向样本递送洗涤溶液。执行一个回路，该回路包括n次重复过程205-207后接过程208。在209之前的任何需要去除试剂或洗液的步骤中，可以排出样本容器，使得去除溶液，同时含有大分子(例如与固体载体接合)的样本保留在样本容器中。在209使用任何适当的手段从样本容器中取出样本。在一些实施方式中，在从仪器中取出样本之前或之后，制备样本用于测序和分析。过程200可还包括数据分析(例如使用下一代测序方法)。过程200还可以包括试剂试剂的递送，例如，向样本容器递送用于修饰多肽末端氨基酸的试剂和/或用于用于加帽反应的试剂。

在一些实施方式中，过程205-207或其部分可通过某些步骤的添加、去除和/或转换顺序来修改。例如，过程205中使用的结合剂可以被构造成与如过程207中所述处理的化学修饰的氨基酸结合。在一些工作流程中，过程207的一个或多个步骤(例如末端氨基酸的官能化或修饰)可在进行过程205和/或206之前进行。

图2B是示出在使用示例性系统100制备大分子的过程200内将一种或多种结合剂递送给样本的示例性过程205的流程图。过程205包括在状态205A中设置包含样本盒的温度控制单元104的温度以及在状态205B中将含有一种或多种结合剂的混合物递送到一个或多个样本容器并用所述含有结合剂的混合物温育所述样本。随后是在状态205C和205D中执行的两个洗涤步骤。在一些实施方式中，所述洗涤去除多余的结合剂或非特异性结合。在一些情况下，所述洗涤为信息传递准备记录标签，例如，通过连接或延伸。

图2C是示出在使用示例性系统100制备大分子的过程200内将信息传递给记录标签的示例性过程206的流程图。过程206包括在状态206A中设置包含样本盒的温度控制单元104的温度，并在206B中向样本递送含有用于传递信息到与样本的多肽接合的记录标签(例如酶、核苷酸、缓冲剂等)的试剂(例如通过连接反应或聚合酶介导的反应)的混合物，并用所述混合物温育样本。随后是状态206C、206D和206E中的两个洗涤步骤和设置温度。

图2D是示出在使用示例性系统100制备大分子(例如多肽)的过程200内去除末端氨基酸(例如N端氨基酸)的示例性过程207的流程图。在一些实施方式中，通过与化学或酶试剂接触来除去末端氨基酸。示出了化学去除末端氨基酸的示例性过程207。过程207包括在状态207A中设置包含样本盒的温度控制单元104的温度，该温度与用于修饰末端氨基酸的化学试剂相容，并在207B中递送含有用于修饰(例如官能化)末端氨基酸的化学试剂的混合物，并将样本与所述混合物一起温育。随后是状态207C的洗涤步骤。在状态207D中设置包含样本盒的温度控制单元104的温度，该温度与去除末端氨基酸相容，状态207E递送含有用于去除或切割(例如消除)末端氨基酸的化学试剂的混合物，并将样本与所述混合物一起温育。随后设置包含样本盒的温度控制单元104并在状态207G中进行洗涤。在一些实施方式中，去除未修饰的末端氨基酸。过程207可通过步骤的添加、去除和/或转换顺序来相应地修改。

图2E是示出在使用示例性系统100制备大分子的过程200内给记录标签提供通用引发位置的示例性过程208的流程图。过程208包括在状态208A中设置包含样本盒的温度控制单元104的温度，并在208B中递送含有用于给记录标签提供通用引发位置的试剂的混合物，并将样本与所述混合物一起温育。随后是在状态208C、208D和208E中的两个洗涤步骤和设置温度。所述洗涤步骤可用于去除多余的试剂。

其它制备反应和条件，包括方法或过程中步骤的修改、添加或去除，也被认为在本发明的范围内。本领域技术人员将认识到，不同的试剂、反应溶液、反应时间、反应温度或反应顺序可以，例如，根据本文中的教示，通过在组件的放置或各种试剂的递送之间相对于彼此提供适当的空间和时间关系，来适应在本发明中的使用。

图3A-3B描绘了使用示例性设备处理被测多肽来进行的多肽分析测定(ProteoCode测定)的结果。结果显示了来自用标识氨基酸残基苯丙氨酸的结合剂(F结合剂)进行结合/编码的三个循环的编码效率，其中在每个结合/编码循环之间有用化学试剂处理以去除N端氨基酸(NTAA)的两个循环。图3A显示了在每个编码循环之间进行化学处理的情况下，在三个循环的每一个中观察到的编码效率，图3B显示了在没有任何去除NTAA的化学处理的情况下，在三个循环的每一个中观察到的编码效率。

图4描绘了使用二杂环甲烷亚胺(PMI)化学，在示例性的自动化射流设备上整合的多循环ProteoCode测定的演示(例如，参见PCT/US2020/029969)。示出了ProteoCode测定的五个循环，其中包括四个化学循环和五个用两种结合剂(F结合剂和L结合剂)的组合的结合/和编码循环。ProteoCode珠子由18种不同的肽组成，对从N端起在五个不同位置的F和L残基进行采样。在每个循环后对珠子进行取样，并用NGS测序分析所生成的编码文库。显示了每个循环的10个相关F和L肽中每一个的概要NGS编码数据(仅显示前5个残基)。对于给定循环，来自每个肽的F和L信号对应于在该特定循环下暴露的NTAA。例如，F在第二位的肽(例如AFSGV)在第二个循环中显示来自F结合剂的高编码信号，说明了有效的肽测序。

具体实施方式

本文提供了一种用于制备或处理大分子(例如肽、多肽和蛋白质)的设备。在一些实施方式中，所述设备用于进行大分子分析测定(例如多肽分析测定)中的一个或多个步骤。还提供了一种自动处理包含大分子的样本的方法。在一些实施方式中，在所提供的方法中，使用本文所述的设备使大分子分析测定中的一个或多个步骤自动化。在一些情况下，大分子分析测定包括分子识别事件的核酸编码。在一些情况下，所提供的设备用于处理、制备、修饰来自样本的大分子，用于测序和/或使用条形码进行分析。

现有的分析蛋白质或肽的技术在几个方面受到限制。蛋白质或肽大分子的分子识别和表征通常使用免疫测定进行，包括例如ELISA、多重ELISA(例如斑点抗体阵列、液体粒子ELISA阵列)、数字ELISA、反相蛋白质阵列(RPPA)等格式。这些不同的免疫测定平台共同面临相似的挑战，包括开发高亲和力和高特异性(或选择性)抗体(结合剂)、在样本和分析物水平二者上的多重性能力有限、灵敏度和动态范围有限、以及交叉反应性和背景信号。结合剂无关途径，例如通过肽测序(例如，Edman降解或质谱法)直接表征蛋白质提供了替代途径。然而，这些方法均不是非常并行或高通量的。基于Edman降解的肽测序包括通过一系列化学修饰和下游HPLC分析(后来被质谱分析替代)逐步降解肽上的N端氨基酸。然而，一般而言，Edman降解肽测序慢且通量有限。其它现有的方法包括电喷雾质谱(MS)和LC-MS/MS。然而，MS受限于包括仪器成本高、需要水平高超的用户、定量能力差以及跨蛋白质组动态范围进行测量的能力有限在内的缺点。对于MS，样本通量通常每次运行限于几千个肽，而对于数据独立分析(DIA)，这种通量不足以进行真正自下而上的高通量蛋白质组分析。

因此，需要用于处理和/或制备样本的自动化设备和方法，以实现高度并行化、精确、灵敏和高通量的蛋白质组学技术。本公开满足了这些和其它相关需求。例如，所提供的自动化仪器和方法解决了手动方法制备和处理样本以进行大分子分析测定的相关问题。特别是，通过将大分子分析测定的各个过程步骤自动化，可以实现显著的优势，包括大大降低用户错误、污染和溢出的风险，增加样本处理间的精确度和控制，同时显著增加通量容量。在一些情况下，所述测定(包括设置、步骤、反应、条件等)的自动化可以表现出灵活性并允许对过程进行改变。将大分子分析测定的步骤自动化还会减少从业人员所需的培训量，并消除因大量手动应用而造成的身体伤害来源。

为了提供对本公开的透彻理解，在以下描述中阐述了许多具体细节。这些细节是出于示例的目的而提供的，而所要求保护的主题可以根据权利要求来进行实践，而无需部分或全部的这些具体细节。要理解，在不背离所要求保护的主题的范围的情况下，可以使用其它实施方式并且可以进行结构改变。应该理解，在一个或多个单独的实施方式中描述的各种特征和功能不限于其对描述了它们的特定实施方式的适用性。相反，它们可以单独或以某种组合应用于本公开的一个或多个其它实施方式，无论这样的实施方式是否被描述，以及无论这样的特征是否被呈现为所描述的实施方式的一部分。为了清楚起见，未详细描述与要求保护的主题相关的技术领域中已知的技术材料，以便不会不必要地混淆要求保护的主题。

本申请中提及的所有出版物，包括专利文件、科学论文和数据库，均出于所有目的通过引用整体并入，其程度与每个单独的出版物个别通过引用并入相同。引用这些出版物或文件并不意欲承认它们中的任何是相关的现有技术，也不构成对这些出版物或文件的内容或日期的任何承认。

所有标题都是为了方便读者阅读，不应用来限制标题后面的文本的含义，除非被如此规定。

定义

除非另有定义，否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同的含义。如果本节阐述的定义与通过引用并入本文的专利、申请、已公布的申请和其它出版物中阐述的定义相反或不一致，则本节阐述的定义优先于通过引用并入本文的定义。

如本文所用的不带数量指示的指称物包括复数指称物，除非上下文另有明确规定。因此，例如，提及“肽”包括一种或多种肽，或肽的混合物。此外，除非特别说明或从上下文中显而易见，如本文所用的术语“或”被理解为是包含性并且涵盖“或”与“和”两者。

如本文所用的术语“大分子”包括由较小的亚基构成的大分子。大分子的例子包括但不限于肽、多肽、蛋白质、核酸、碳水化合物、脂质、大环化合物。大分子还包括由两种或多种类型的大分子的组合以共价键连接在一起构成的嵌合大分子(例如，与核酸连接的肽)。大分子还可包括“大分子组装体”，它由两个或多个大分子的非共价复合体构成。大分子组装体可由相同类型的大分子(例如，蛋白质-蛋白质)或两个或更多个不同类型的大分子(例如，蛋白质-DNA)构成。

如本文所用的术语“多肽”包括肽和蛋白质，并且是指包含两个或更多个通过肽键接合的氨基酸的链的分子。在一些实施方式中，多肽包含2至50个氨基酸，例如具有多于20-30个氨基酸。在一些实施方式中，肽不包含二级、三级或更高级结构。在一些实施方式中，多肽是蛋白质。在一些实施方式中，蛋白质包含30或更多个氨基酸，例如具有多于50个氨基酸。在一些实施方式中，除了一级结构外，蛋白质还包含二级、三级或更高级结构。多肽的氨基酸最典型的是L-氨基酸，但也可以是D-氨基酸、修饰的氨基酸、氨基酸类似物、氨基酸模拟物或其任何组合。多肽可以是天然存在的、合成产生的或重组表达的。多肽可以合成产生的、分离的、重组表达的、或通过上述方法的组合产生的。多肽还可以包含修饰氨基酸链的其它基团，例如通过翻译后修饰添加的官能团。所述聚合物可以是直链或支链的，它可包含修饰的氨基酸，并且它可被非氨基酸打断。该术语还包括已天然或通过干预进行修饰的氨基酸聚合物；所述干预例如二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其它操纵或修饰，例如与标记性组分缀合。

如本文所用的术语“氨基酸”是指包含胺基、羧酸基和各氨基酸特定侧链的有机化合物，其作为肽的单体亚基。氨基酸包括20种标准天然存在或经典氨基酸以及非标准氨基酸。标准天然存在氨基酸包括丙氨酸(A或Ala)、半胱氨酸(C或Cys)、天冬氨酸(D或Asp)、谷氨酸(E或Glu)、苯丙氨酸(F或Phe)、甘氨酸(G或Gly)、组氨酸(H或His)、异亮氨酸(I或Ile)、赖氨酸(K或Lys)、亮氨酸(L或Leu)、甲硫氨酸(M或Met)、天冬酰胺(N或Asn)、脯氨酸(P或Pro)、谷氨酰胺(Q或Gln)、精氨酸(R或Arg)、丝氨酸(S或Ser)、苏氨酸(T或Thr)、缬氨酸(V或Val)、色氨酸(W或Trp)、和酪氨酸(Y或Tyr)。氨基酸可以是L-氨基酸或D-氨基酸。非标准氨基酸可以是天然存在或化学合成的修饰氨基酸、氨基酸类似物、氨基酸模拟物、非标准蛋白质氨基酸或非蛋白质氨基酸。非标准氨基酸的例子包括但不限于硒半胱氨酸、吡咯赖氨酸和N-甲酰甲硫氨酸、β-氨基酸、高氨基酸、脯氨酸和丙酮酸衍生物、3-取代丙氨酸衍生物、甘氨酸衍生物、环-取代的苯丙氨酸和酪氨酸衍生物、线性核心氨基酸、N-甲基氨基酸。

如本文所用的术语“翻译后修饰”是指肽或蛋白质在被核糖体完成翻译后发生在其上的修饰。翻译后修饰可以是共价化学修饰或酶促修饰。翻译后修饰的例子包括但不限于酰化、乙酰化、烷基化(包括甲基化)、生物素化、丁酰化、氨甲酰化、羰基化、脱酰胺化、脱亚胺化、白喉酰胺形成、二硫桥键形成、消去化、黄素连接、甲酰化、γ-羧基化、谷氨酰化、甘氨酰化、糖基化、糖基磷脂酰肌醇化、血红素C连接、羟基化、羟腐氨酸(hypusine)形成、碘化、异戊二烯化、脂化、脂酰化、丙二酰化、甲基化、肉豆蔻酰化、氧化、棕榈酰化、PEG化、磷酸泛酰巯基乙胺化(phosphopantetheinylation)、磷酸化、异戊二烯化、丙酰化、亚视黄亚基席夫碱形成、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、硒化、琥珀酰化、亚磺化、泛素化和C端酰胺化。翻译后修饰包括肽的氨基末端和/或羧基末端的修饰。末端氨基的修饰包括但不限于脱氨基、N-低级烷基、N-二低级烷基和N-酰基修饰。末端羧基的修饰包括但不限于酰胺、低级烷基酰胺、二烷基酰胺和低级烷基酯修饰(例如，其中低级烷基是C₁-C₄烷基)。翻译后修饰还包括落在氨基和羧基末端之间的氨基酸的修饰，例如但不限于上述那些。术语翻译后修饰还可以包括包含一种或多种可检测标记的肽修饰。

如本文所用的术语“结合剂”是指与分析物、例如大分子或大分子的组分或特征结合、缔合、联合、标识或合并的核酸分子、肽、多肽、蛋白质、碳水化合物或小分子。结合剂可与分析物、例如大分子或大分子的组分或特征形成共价缔合或非共价缔合。结合剂也可以是由两种或更多种类型的分子构成的嵌合结合剂，例如核酸分子-肽嵌合结合剂或碳水化合物-肽嵌合结合剂。结合剂可以是天然存在的、合成产生的或重组表达的分子。结合剂可与大分子的单个单体或亚基(例如，肽的单个氨基酸)结合，或与大分子的多个相连的亚基(例如，较长的肽、多肽或蛋白质分子的二肽、三肽或更高级肽)结合。结合剂可与线性分子或具有三维结构(也称为构象)的分子结合。例如，抗体结合剂可与线性的肽、多肽或蛋白质结合，或与构象的肽、多肽或蛋白质结合。结合剂可与肽、多肽或蛋白质分子的N端肽、C端肽或中间肽结合。结合剂可与肽分子的N端氨基酸、C端氨基酸或中间氨基酸结合。结合剂可与N端或C端二氨基酸部分结合。例如，结合剂可结合化学修饰或标记的氨基酸，优先于未修饰或未标记的氨基酸。例如，结合剂可结合例如已被乙酰基部分、cbz部分、鸟苷基部分、氨基胍部分、丹磺酰部分、苯基硫代氨基甲酰基(PTC)部分、二硝基苯基(DNP)部分、磺酰硝基苯基(SNP)部分、二杂环甲烷亚胺部分等修饰的氨基酸，优先于不具有所述部分的氨基酸。结合剂可与翻译后修饰的多肽分子结合。结合剂可表现出选择性结合分析物例如大分子的组分或特征(例如，结合剂可选择性结合20种可能的天然氨基酸残基之一，而与其它19种天然氨基酸残基的结合亲和力非常低或完全不结合)。结合剂可能表现出较低的选择性结合，其中结合剂能够结合分析物、例如大分子的多个组分或特征(例如，结合剂可以相似的亲和力结合两种或更多种不同的氨基酸残基)。结合剂可包含代码标签，代码标签可通过接头与结合剂接合。

如本文所用的术语“荧光团”是指在一个波长下吸收电磁能并在另一波长下重新发射能量的分子。荧光团可以是分子或分子的一部分，所述分子包括荧光染料和蛋白质。此外，荧光团可以化学地、基因地或以其它方式连接或融合到另一个分子上，以产生被荧光团“标签”的分子。

如本文所用的术语“接头”是指用于接合两个分子的核苷酸、核苷酸类似物、氨基酸、肽、多肽或非核苷酸化学部分中的一种或多种。接头可用于接合结合剂与代码标签、记录标签与多肽、多肽与固体载体、记录标签与固体载体等。在某些实施方式中，接头通过酶促反应或化学反应(例如，点击化学)接合两个分子。

如本文所用的术语“蛋白质组”可以包括由任何生物体的基因组、细胞、组织或生物体在特定时间表达的整组蛋白质、多肽或肽(包括其缀合物或复合体)。在一个方面，它是给定类型的细胞或生物体、在给定的时间、在给定的条件下表达的该组蛋白质。蛋白质组学是对蛋白质组的研究。例如，“细胞蛋白质组”可包括在特定环境条件设置下，例如暴露于激素刺激下，在特定细胞类型中发现的蛋白质的集合。生物体的完整蛋白质组可包括来自所有的各种细胞蛋白质组的整套蛋白质。蛋白质组也可包括某些亚细胞生物系统中的蛋白质的集合。例如，病毒中的所有蛋白质可以称为病毒蛋白质组。如本文所用的术语“蛋白质组”包括蛋白质组的子集，包括但不限于激酶组；分泌组；受体组(例如，GPCRome)；免疫蛋白质组；营养蛋白质组；由翻译后修饰(例如，磷酸化、泛素化、甲基化、乙酰化、糖基化、氧化、脂化和/或亚硝基化)定义的蛋白质组子集，例如磷酸化蛋白质组(例如，磷酸酪氨酸-蛋白质组、酪氨酸-激酶组和酪氨酸-磷酸酶组)、糖蛋白组等；与组织或器官、发育阶段、或生理或病理状况相关的蛋白质组子集；与细胞过程例如细胞周期、分化(或去分化)、细胞死亡、衰老、细胞迁移、转化或转移相关的蛋白质组子集；或其任何组合。如本文所用的术语“蛋白质组学”是指分析细胞、组织和体液内的蛋白质组，以及蛋白质组在细胞内和组织内的相应空间分布。此外，蛋白质组学研究包括蛋白质组随着生物学和限定的生物或化学刺激而随时间连续变化的动态状态。

在具有游离氨基的肽链一端的末端氨基酸在本文中称为“N端氨基酸”(NTAA)。在具有游离羧基的肽链一端的末端氨基酸在本文中称为“C端氨基酸”(CTAA)。N端二氨基酸可包含所述N端氨基酸和倒数第二个N端氨基酸。C端二氨基酸是对C端的类似定义。构成肽的氨基酸可以按顺序编号，肽的长度为“n”个氨基酸。如本文所用的NTAA被认为是第n个氨基酸(本文中也称为“n NTAA”)。使用该命名法，沿着从N端到C端的肽长度，下一个氨基酸是n-1氨基酸，然后是n-2氨基酸，依此类推。在某些实施方式中，NTAA、CTAA或二者都可以用化学部分官能化。

如本文所用的术语“条形码”是指约2至约30个碱基(例如，2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个碱基)的核酸分子，其为多肽、结合剂、来自结合循环的一组结合剂、样本多肽、一组样本、区室(例如液滴、珠子或单独的位置)内的多肽、一组区室内的多肽、多肽级分、一组多肽级分、空间区域或一组空间区域、多肽文库、或结合剂文库提供唯一标识符标签或来源信息。条形码可以是人工序列或天然存在的序列。在某些实施方式中，条形码群内的每个条形码都是不同的。在其它实施方式中，条形码群内的一部分条形码是不同的。例如，条形码群内至少约10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、97％或99％的条形码是不同的。条形码群可随机生成或非随机生成。在某些实施方式中，条形码群是纠错条形码。条形码可以用于对多重测序数据进行计算去卷积，并标识来自单个多肽、样本、文库等的序列读数。条形码还可以用于对已分布到小区室中的多肽集合进行去卷积，以增强映射。例如，不是将肽映射回蛋白质组，而是将肽映射回其原始蛋白质分子或蛋白质复合体。

“样本条形码”，也称为“样本标签”，用于标识多肽来源于哪个样本。

如本文所用的术语“代码标签”是指具有任何合适长度的多核苷酸，例如约2个碱基至约100个碱基的核酸分子，包括含2和100以及之间的任何整数，其包含其相关结合剂的标识信息。“代码标签”也可由“可测序的聚合物”构成(例如，参见Niu等人，2013，Nat.Chem.5:282-292；Roy等人，2015，Nat.Commun.6:7237；Lutz，2015，Macromolecules48:4759-4767；它们各自通过引用整体并入)。代码标签可包含编码区序列(encodersequence)，其任选在一侧侧接一个间隔区或任选在每侧侧接间隔区。代码标签还可包含任选的UMI和/或任选的结合循环特异性条形码。代码标签可以是单链的或双链的。双链代码标签可包含平端、突出端或二者。代码标签可以指直接附着于结合剂的代码标签、与直接附着于结合剂的代码标签杂交的互补序列(例如，对于双链代码标签)、或存在于延伸记录标签中的代码标签信息。在某些实施方式中，代码标签还可包含结合循环特异性的间隔区或条形码、唯一分子标识符、通用引发位点或其任何组合。

如本文所用的术语“编码区序列”或“编码区条形码”是指长度为约2个碱基至约30个碱基(例如，2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个碱基)的核酸分子，为其相关的结合剂提供标识信息。编码区序列可唯一地标识其相关的结合剂。在某些实施方式中，编码区序列为其相关的结合剂和使用该结合剂的结合循环提供标识信息。在其它实施方式中，编码区序列与代码标签内单独的结合循环特异性条形码合并。或者，编码区序列可将其相关的结合剂标识为属于两种或更多种不同结合剂的组中的成员。在一些实施方式中，这种水平的标识就足以用于分析的目的。例如，在涉及与氨基酸结合的结合剂的一些实施方式中，知道肽在特定位置包含两个可能的氨基酸之一可能就足够了，而不是明确地标识该位置的氨基酸残基。在另一个例子中，共同的编码区序列用于多克隆抗体，它包含标识蛋白质靶标的多于一个表位并且特异性不一的抗体的混合物。在其它实施方式中，在编码区序列标识一组可能的结合剂的情况下，可以使用顺序解码方法来产生每个结合剂的唯一标识。这是通过在重复的结合循环中变动给定结合剂的编码区序列来实现的(参见，Gunderson等人，2004，Genome Res.14:870-7)。来自每个结合循环的部分标识性代码标签信息，当与来自其它循环的编码信息组合时，为结合剂产生唯一标识符，例如，代码标签的特定组合而不是单个代码标签(或编码区序列)提供了结合剂的唯一标识信息。优选地，结合剂文库内的编码区序列具有相同或相似的碱基数量。

如本文所用的术语“结合循环特异性标签”、“结合循环特异性条形码”或“结合循环特异性序列”是指用于标识特定结合循环内使用的结合剂文库的唯一序列。结合循环特异性标签可包含约2个碱基至约8个碱基(例如，2、3、4、5、6、7或8个碱基)的长度。结合循环特异性标签可作为间隔区序列的一部分、编码区序列的一部分、UMI的一部分或作为代码标签内的单独部件并入结合剂的代码标签内。

如本文所用的术语“间隔区”(Sp)是指存在于记录标签或代码标签的末端、长度为约1个碱基至约20个碱基(例如，1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个碱基)的核酸分子。在某些实施方式中，间隔区序列在一端或两端侧接代码标签的编码区序列。在结合剂与多肽结合后，分别在其缔合的代码标签和记录标签上的互补间隔区序列之间退火，使得通过引物延伸反应或与记录标签的连接来传递结合信息。Sp’是指与Sp互补的间隔区序列。优选地，结合剂文库内的间隔区序列具有相同数量的碱基。在结合剂文库中可使用共同的(共享或相同的)间隔区。间隔区序列可具有“循环特异性”序列，以便追踪在特定结合循环中所使用的结合剂。间隔序列(Sp)可以在所有结合循环中不变、对特定的多肽类别具有特异性、或是结合循环数特异性的。多肽类别特异性间隔区允许将来自已完成的结合/延伸循环的延伸记录标签中存在的同源结合剂的代码标签信息退火到在随后的结合循环中通过所述类别特异性间隔区标识相同多肽类别的另一个结合剂的代码标签上。只有顺序结合正确的同源对才能导致相互作用的间隔区元件和有效的引物延伸。间隔序列可包含足够的碱基数量以退火到记录标签中的互补间隔区序列上，从而启动引物延伸(也称为聚合酶延伸)反应、或为连接反应提供“夹板(splint)”、或介导“粘性末端”连接反应。间隔区序列可包含比代码标签内的编码区序列更少数量的碱基。

如本文所用的术语“记录标签”是指部分，例如化学偶联部分、核酸分子或可测序的聚合物分子(例如，参见Niu等人，2013，Nat.Chem.5:282-292；Roy等人，2015，Nat.Commun.6:7237；Lutz，2015，Macromolecules 48:4759-4767；它们各自通过引用整体并入)，可以向其传递代码标签的标识信息、或关于与所述记录标签缔合的大分子的标识信息(例如，UMI信息)可以从其传递到代码标签上。标识信息可以包括表征分子的任何信息，例如与样本、级分、分区、空间位置、相互作用的相邻分子、循环数等有关的信息。此外，存在的UMI信息也可以被归类为标识信息。在某些实施方式中，在结合剂与多肽结合后，来自与结合剂连接的代码标签的信息可以在结合剂与多肽结合的同时传递到与该多肽缔合的记录标签。在其它实施方式中，在结合剂与多肽结合后，来自与多肽缔合的记录标签的信息可以在结合剂与多肽结合的同时传递到与该结合剂连接的代码标签。记录标签可直接与大分子例如多肽连接、通过多功能接头与大分子例如多肽连接、或凭借其在固体载体上的邻近性(或共定位)与大分子、例如多肽缔合。记录标签可通过其5'端或3'端或内部位点连接，只要该连接与用于将代码标签信息传递到记录标签或反之的方法相容即可。记录标签还可包含其它功能组分，例如，通用引发位点、唯一分子标识符、条形码(例如，样本条形码、级分条形码、空间条形码、区室标签等)、与代码标签的间隔区序列互补的间隔区序列、或其任何组合。在使用聚合酶延伸将代码标签信息传递到记录标签的实施方式中，记录标签的间隔区序列优选位于记录标签的3’末端。

如本文所用的术语“引物延伸”，也称为“聚合酶延伸”，是指由核酸聚合酶(例如，DNA聚合酶)催化的反应，由此退火到互补链上的核酸分子(例如，寡核苷酸引物、间隔区序列)被聚合酶使用该互补链作为模板进行延伸。

如本文所用的术语“唯一分子标识符”或“UMI”是指长度为约3至约40个碱基(3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个碱基)的核酸分子，为UMI所连接的每个多肽或结合剂提供唯一标识符标签。多肽UMI可以用于对来自多个延伸记录标签的测序数据进行计算去卷积，以标识源自单个多肽的延伸记录标签。多肽UMI可以通过将NGS读数折叠为唯一的UMI而用于精确计数起源多肽分子。结合剂UMI可以用于标识与特定多肽结合的每个单独分子结合剂。例如，UMI可以用于标识针对特定肽分子出现的单个氨基酸有特异性的结合剂的单独结合事件的数量。

如本文所用的术语“通用引发位点”或“通用引物”或“通用引发序列”是指可用于文库扩增和/或测序反应的核酸分子。通用引发位点可包括但不限于，PCR扩增引发位点(引物序列)、退火到流动细胞表面上的互补寡核苷酸从而在一些下一代测序平台中实现桥式扩增的流动细胞适配序列、测序引发位点、或其组合。通用引发位点可以用于其它类型的扩增，包括通常与下一代数字测序结合使用的扩增。例如，可将延伸记录标签分子进行环化，并使用通用引发位点进行滚环扩增，以形成可以用作测序模板的DNA纳米球(Drmanac等人，2009，Science 327:78-81)。或者，记录标签分子可通过从通用引发位点的聚合酶延伸来直接环化和测序(Korlach等人，2008，Proc.Natl.Acad.Sci.105:1176-1181)。当在关于“通用引发位点”或“通用引物”的语境中使用时，术语“正向”也可称为“5’”或“有义”。当在关于“通用引发位点”或“通用引物”的语境中使用时，术语“反向”也可称为“3’”或“反义”。

如本文所用的术语“延伸记录标签”是指在结合剂与大分子例如多肽结合后，已将至少一种结合剂代码标签(或其互补序列)的信息传递给它的记录标签。代码标签的信息可直接(例如，连接)或间接(例如，引物延伸)地传递给记录标签。代码标签的信息可通过酶法或化学方式传递给记录标签。延伸记录标签可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200个或更多的代码标签的结合剂信息。延伸记录标签的碱基序列可反映由其代码标签标识的结合剂的结合的时间次序和顺序次序、可反映由代码标签标识的结合剂的结合的部分顺序次序、或可不反映由代码标签标识的结合剂的结合的任何次序。在某些实施方式中，延伸记录标签中存在的代码标签信息以至少25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性代表正被分析的多肽序列。在延伸记录标签没有以100％同一性代表被分析的多肽序列的某些实施方式中，错误可能是由于结合剂的脱靶结合、或“遗漏”结合循环(例如，因为结合剂在结合循环期间未能与多肽结合、因为引物延伸反应失败)、或二者兼而有之。

如本文所用的术语“固体载体”、“固体表面”或“固体基体”或“测序基体”或“基体”是指可以通过本领域已知的任何手段、包括共价和非共价相互作用或其任何组合，直接或间接地与多肽缔合的任何固体材料，包括多孔和无孔材料。固体载体可以是二维的(例如，平面表面)或三维的(例如，凝胶基质或珠子)。固体载体可以是任何载体表面，包括但不限于珠子、微珠、阵列、玻璃表面、硅表面、塑性表面、过滤器、膜、尼龙、硅晶片芯片、流通芯片、流通池、包含信号转导电子器件的生物芯片、通道、微量滴定孔、ELISA板、旋转干涉转盘、硝化纤维素膜、基于硝化纤维素的聚合物表面、聚合物基质、纳米粒子、微球。固体载体的材料包括但不限于丙烯酰胺、琼脂糖、纤维素、硝化纤维素、玻璃、金、石英、聚苯乙烯、聚乙烯乙酸乙烯酯、聚丙烯、聚甲基丙烯酸酯、聚乙烯、聚环氧乙烷、聚硅酸盐、聚碳酸酯、特氟隆、氟碳化合物、尼龙、硅橡胶、聚酐、聚乙醇酸、聚乳酸、聚原酸酯、官能化硅烷、聚富马酸丙酯(polypropylfumerate)、胶原蛋白、糖胺聚糖、聚氨基酸、葡聚糖或其任何组合。固体载体还包括薄膜、膜、瓶子、碟、纤维、编织纤维、成型聚合物如管子、粒子、珠子、微球、微粒、或其任何组合。例如，当固体表面是珠子时，珠子可以包括但不限于陶瓷珠、聚苯乙烯珠、聚合物珠、甲基苯乙烯珠、琼脂糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁珠、玻璃珠或可控孔度珠。珠子可以是球形或不规则形状的。珠子或载体可以是多孔的。珠子的尺寸范围可从纳米例如100nm到毫米例如1mm。在某些实施方式中，珠子尺寸范围从约0.2微米至约200微米，或从约0.5微米至约5微米。在一些实施方式中，珠子的直径可以为约1、1.5、2、2.5、2.8、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、15或20μm。在某些实施方式中，“珠子”固体载体可指单个珠子或多个珠子。在一些实施方式中，所述固体表面是纳米粒子。在某些实施方式中，纳米粒子的尺寸范围从直径约1nm至约500nm，例如，直径在约1nm和约20nm之间、约1nm和约50nm之间、约1nm和约100nm之间、约10nm和约50nm之间、约10nm和约100nm之间、约10nm和约200nm之间、约50nm和约100nm之间、约50nm和约150之间、约50nm和约200nm之间、约100nm和约200nm之间、或约200nm和约500之间。在一些实施方式中，纳米粒子的直径可以为约10nm、约50nm、约100nm、约150nm、约200nm、约300nm或约500nm。在一些实施方式中，纳米粒子的直径小于约200nm。

如本文所用的术语“核酸分子”或“多核苷酸”是指含有通过3’-5’磷酸二酯键连接的脱氧核糖核苷酸或核糖核苷酸的单链或双链多核苷酸、以及多核苷酸类似物。核酸分子包括但不限于DNA、RNA和cDNA。多核苷酸类似物可具有不同于天然多核苷酸中发现的标准磷酸二酯键的主链，并且任选地，具有核糖或脱氧核糖之外的修饰的糖部分。多核苷酸类似物含有能够通过Watson-Crick碱基配对与标准多核苷酸碱基进行氢键合的碱基，其中所述类似物主链以允许在寡核苷酸类似物分子和标准多核苷酸碱基之间以序列特异性方式进行这样的氢键合的方式呈递所述碱基。多核苷酸类似物的例子包括但不限于异种核酸(XNA)、桥接核酸(BNA)、乙二醇核酸(GNA)、肽核酸(PNA)、gPNA、吗啉代多核苷酸、锁核酸(LNA)、苏糖核酸(TNA)、2'-O-甲基多核苷酸、2'-O-烷基核糖基取代的多核苷酸、硫代磷酸多核苷酸和硼代磷酸多核苷酸。多核苷酸类似物可具有嘌呤或嘧啶类似物，包括例如，7-脱氮嘌呤类似物，8-卤代嘌呤类似物，5-卤代嘧啶类似物，或可以与任何碱基配对的通用碱基类似物，包括次黄嘌呤、硝基唑、异喹诺酮(isocarbostyril)类似物、唑羧酰胺和芳族三唑类似物，或具有附加官能性、例如用于亲和结合的生物素部分的碱基类似物。在一些实施方式中，所述核酸分子或寡核苷酸是修饰的寡核苷酸。在一些实施方式中，核酸分子或寡核苷酸是具有假互补碱基的DNA、具有受保护碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、gPNA分子或吗啉代DNA，或其组合。在一些实施方式中，核酸分子或寡核苷酸是主链修饰、糖修饰或核碱基修饰的。在一些实施方式中，核酸分子或寡核苷酸具有核碱基保护基团如Alloc、亲电子保护基团如thiranes、乙酰基保护基团、硝基苄基保护基团、磺酸酯保护基团、或传统的碱不稳定性保护基团。

如本文所用的“核酸测序”是指确定核酸分子或核酸分子样本中的核苷酸顺序。

如本文所用的“下一代测序”是指允许岁数百万至数十亿个分子进行并行测序的高通量测序方法。下一代测序方法的例子包括合成测序、连接测序、杂交测序、聚合酶克隆(polony)测序、离子半导体测序和焦磷酸测序(pyrosequencing)。通过将引物连接到固体基体上并将互补序列连接到核酸分子上，核酸分子可以通过引物与固体基体杂交，然后利用聚合酶在固体基体上的分立区域中产生多个拷贝以进行扩增(这些集群有时称为聚合酶克隆(polymerase colonies或polonies))。因此，在测序过程期间，特定位置处的核苷酸可以被多次测序(例如，数百或数千次)——这种覆盖深度被称为“深度测序”。高通量核酸测序技术的例子包括由Illumina、BGI、Qiagen、Thermo-Fisher和Roche提供的平台，包括例如平行珠阵列、合成测序、连接测序、毛细管电泳、电子微芯片、“生物芯片”、微阵列、平行微芯片和单分子阵列的格式，如Service的综述(Science 311:1544-1546，2006)。

如本文所用的“单分子测序”或“第三代测序”是指其中来自单分子测序仪器的读数是通过对单个DNA分子进行测序而产生的下一代测序方法。与依靠扩增而以分阶段的方式并行克隆许多DNA分子进行测序的下一代测序方法不同，单分子测序询问单分子的DNA，不需要扩增或同步。单分子测序包括在每个碱基并入后需要暂停测序反应的方法(“洗涤和扫描”循环)和在读取步骤之间不需要暂停的方法。单分子测序方法的例子包括单分子实时测序(Pacific Biosciences)、基于纳米孔的测序(Oxford Nanopore)、双链体中断(duplexinterrupted)的纳米孔测序、以及使用先进显微镜术的DNA直接成像。

如本文所用的“分析”大分子是指大分子的全部或部分组分的标识、定量、表征、区分或其组合。例如，分析肽、多肽或蛋白质包括确定肽的全部或部分氨基酸序列(连续或非连续的氨基酸序列)。分析大分子还包括部分标识大分子的组分。例如，部分标识大分子蛋白质序列中的氨基酸可以将蛋白质中的氨基酸标识为属于可能的氨基酸的子集。分析通常从分析n NTAA开始，然后进行到肽的下一个氨基酸(即，n-1、n-2、n-3等等)。这是通过切割第n位的NTAA，从而将肽的第(n-1)位氨基酸转变成N端氨基酸(本文中称为“第(n-1)位NTAA”)来实现的。肽的分析还可包括确定肽上的翻译后修饰的存在和频率，这可包括或可不包括关于肽上的翻译后修饰的依次顺序的信息。肽的分析还可包括确定肽中表位的存在和频率，这可包括或可不包括关于肽内表位的依次顺序或位置的信息。肽的分析可包括不同类型分析的组合，例如获得表位信息、氨基酸序列信息、翻译后修饰信息或其任何组合。

如本文所用的术语“区室”是指从大分子样本中分离或隔离大分子子集的物理区域或空间。例如，区室可将单个细胞与其它细胞分开，或将样本蛋白质组的子集与样本蛋白质组的其余部分分开。区室可以是水性区室(例如，微流体液滴)、固体区室(例如，板、管、小瓶、凝胶珠上的皮克量滴定孔或微量滴定孔)，或表面上的分离区域。区室可以包括一个或多个可以固定大分子的珠子。

如本文所用的术语“区室标签”或“区室条形码”是指在一个或多个区室(例如，微流体液滴)内包含对成分(例如，单个细胞的蛋白质组)的标识信息的约4个碱基至约100个碱基(包括4个碱基、100个碱基和其间的任意整数)的单链或双链核酸分子。区室条形码标识已从多个(例如数百万到数十亿)区室中分离到相同的物理区室或区室组中的样本大分子子集，例如蛋白质样本的子集。因此，区室标记可以用于区分来源于一个或多个具有相同区室标签的区室的成分与来源于具有不同区室标签的其它区室中的成分，即使在将所述成分汇集在一起之后也是如此。通过用唯一区室标签标记每个区室内或两个或多个区室的组内的蛋白质和/或肽，可以标识来源于单个区室或区室组内的相同蛋白质、蛋白质复合体或细胞的肽。区室标签包含条形码和任选的通用引物，所述条型码任选在一侧或两侧上侧接间隔区序列。间隔区序列可以与记录标签的间隔区序列互补，从而能够将区室标签信息传递到记录标签。区室标签也可包含通用引发位点、唯一分子标识符(用于提供与其连接的肽的标识信息)或二者，特别是对于其中区室标签包含要用于本文所述的下游肽分析方法中的记录标签的实施方式。区室标签可以包含用于与肽偶联的官能部分(例如，点击化学部分、醛、NHS、mTet、炔烃等)。或者，区室标签可以包含含有蛋白连接酶识别序列的肽，以使区室标签与目的肽连接。区室可以包含单个区室标签、除任选的UMI序列之外的多个相同区室标签、或两个或更多个不同的区室标签。在某些实施方式中，每个区室都包含唯一区室标签(一对一映射)。在其它实施方式中，来自更大区室群体中的多个区室包含相同的区室标签(多对一映射)。区室标签可与区室内的固体载体(例如珠子)接合或与区室本身的表面(例如皮克量滴定孔的表面)接合。或者，区室标签可游离在区室内的溶液中。

如本文所用的术语“分区(partition)”是指将唯一条形码分配给来自样本内的大分子群体中的大分子亚群。在某些实施方式中，进行分区可以通过将大分子分配到区室中来实现。分区可包含单个区室内的大分子或来自区室群的多个区室内的大分子。

如本文所用，“分区标签”或“分区条形码”是指包含对分区的标识信息的约4个碱基至约100个碱基(包括4个碱基、100个碱基、以及之间的任何整数)的单链或双链核酸分子。在某些实施方式中，大分子的分区标签是指由于将大分子划分到标有相同条形码的区室中而产生的相同区室标签。

如本文所用的术语“级分”是指样本内的大分子(例如蛋白质)的子集，其已使用物理或化学分离方法，例如按大小、疏水性、等电点、亲和力等分级分离，从样本的其余部分或细胞器中分选出来。分离方法包括HPLC分离、凝胶分离、亲和分离、细胞分级分离、细胞器分级分离、组织分级分离等。物理性质例如流体流动、磁性、电流、质量、密度等也可以用于分离。

如本文所用的术语“级分条形码”是指级分内包含大分子标识信息的约4个碱基至约100个碱基(包括4个碱基、100个碱基、以及之间的任何整数)的单链或双链核酸分子。

如本文所用的术语“约”是指本技术领域的技术人员容易知道的各个值的通常误差范围。本文中提到“约”某个值或参数包括(并描述了)针对该值或参数本身的实施方式。例如，关于“约X”的描述包括对“X”的描述。

本文中的术语“抗体”以最广义使用，包括多克隆和单克隆抗体，其包括完整抗体和功能性(抗原结合性)抗体片段，所述抗体片段包括片段抗原结合性(Fab)片段、F(ab')2片段、Fab'片段、Fv片段、重组IgG(rIgG)片段、单链抗体片段，单链抗体片段包括单链可变片段(scFv)和单域抗体(例如sdAb、sdFv、纳米抗体(nanobody))片段。该术语涵盖免疫球蛋白的基因工程和/或以其它方式修饰的形式，例如胞内抗体、肽体、嵌合抗体、完全人抗体、人源化抗体和异种偶联抗体(heteroconjugate antibodies)，多特异性例如双特异性的抗体、双体、三体和四体、串联二聚scFv、串联三聚scFv。除非另有说明，否则术语“抗体”应理解为涵盖其功能性抗体片段。该术语也涵盖完整或全长抗体，包括任何类别或亚类的抗体，包括IgG及其亚类、IgM、IgE、IgA和IgD。

“个体”或“对象”包括哺乳动物。哺乳动物包括但不限于驯养动物(例如牛、羊、猫、狗和马)、灵长类动物(例如，人类和非人灵长类动物例如猴子)、兔子、和啮齿动物(例如小鼠和大鼠)。“个体”或“对象”可包括禽类例如鸡、脊椎动物例如鱼和哺乳动物例如小鼠、大鼠、兔子、猫、狗、猪、奶牛、牛、绵羊、山羊、马、猴子和其它非人灵长类动物。在某些实施方式中，个体或对象是人类。

如本文所用的术语“样本”是指可能含有希望进行分析物测定的分析物的任何东西。如本文所用的“样本”可以是溶液、悬浮液、液体、粉末、糊剂、水性的、非水性的或其任何组合。所述样本可以是生物样本，例如生物体液或生物组织。生物流体的例子包括尿液、血液、血浆、血清、唾液、精液、粪便、痰液、脑脊液、泪液、粘液、羊水等。生物组织是细胞、通常是特定种类的细胞与其胞间物质一起形成人类、动物、植物、细菌、真菌或病毒结构的结构材料之一的集合体，包括结缔组织、上皮组织、肌肉组织和神经组织。生物组织的例子也包括器官、肿瘤、淋巴结、动脉和单个细胞。

在一些实施方式中，样本是生物样本。本公开的生物样本包括溶液、悬浮液、液体、粉末、糊剂、水性样本或非水性样本形式的样本。如本文所用的“生物样本”包括从活体或病毒性(或朊病毒)来源或其它来源获得的大分子和生物分子的任何样本，并且包括对象中可以获得核酸、蛋白质和/或其它大分子的任何细胞类型或组织。生物样本可以是直接从生物来源获得的样本或经过处理的样本。例如，经扩增的分离核酸构成生物样本。生物样本包括但不限于来自动物和植物的体液例如血液、血浆、血清、脑脊液、滑液、尿液和汗液、组织和器官样本，以及由此衍生的加工样本。在一些实施方式中，样本可以来源于组织或体液，例如结缔组织、上皮组织、肌肉组织或神经组织；选自脑、肺、肝、脾、骨髓、胸腺、心脏、淋巴、血液、骨、软骨、胰腺、肾、胆囊、胃、肠、睾丸、卵巢、子宫、直肠、神经系统、腺体和内部血管的组织；或选自血液、尿液、唾液、骨髓、精液、腹水及其亚级分例如血清或血浆的体液。

术语“水平”用于指靶标、例如作为疾病或病症病因学的一部分并且可以定性或定量确定的物质或生物体的存在和/或量。靶标水平的“定性”变化是指在从正常对照获得的样本中检测不到或存在于其中的靶标的出现或消失。一个或多个靶标水平的“定量”变化是指当与健康对照相比时，靶标水平的可测量的增加或减少。

应理解，本文描述的本发明的方面和实施方式包括“由方面和实施方式组成”和/或“基本上由方面和实施方式组成”。

在整个本公开中，本发明的各个方面以范围的格式呈现。应当理解，以范围格式进行描述仅仅是为了方便和简洁，不应理解为对本发明范围的刻板的限制。因此，范围的描述应该被认为已经具体公开了所有可能的子范围以及该范围内的个体数值。例如，对例如从1到6的范围的描述应视为已具体公开了例如从1到3、1到4、1到5、2到4、2到6、3到6等的子范围，以及该范围内的单个数字，例如1、2、3、4、5和6。无论范围的广度如何，这都适用。

本发明的其它目的、优点和特征将从以下结合附图的说明中变得显而易见。

I.样本自动化处理设备

本文提供了一种用于制备或处理大分子(例如肽、多肽和蛋白质)的设备。在一些实施方式中，大分子通过接头直接或间接固定在载体上。在一些实施方式中，使用所述设备处理的大分子是固定在基体或载体、例如固体或多孔基体或载体上的多肽或肽。在一些实施方式中，所述设备用于以自动化方式进行大分子分析测定(例如多肽分析测定)中的一个或多个步骤，例如本文所述的方法的任何步骤。大分子分析测定可包括循环的样本处理过程，其中所述过程包括各种重复的步骤。所提供的设备使所述测定的至少一些重复步骤自动化，从而减少了来自用户的实时输入和控制。与不用所述设备进行的手动方法相比，所述设备可减少用户进行大分子分析测定所需的时间量。在一些情况下，大分子分析测定包括分子识别事件的核酸编码。在一些情况下，所提供的设备用于处理、制备和/或修饰来自样本的大分子，用于测序和/或使用条形码进行其它分析。在一些情况下，使用所述设备处理和/或制备大分子使得能够对单个的肽、多肽或蛋白质的序列进行下游分析。所述设备和自动化处理可用于同时处理多个样本。在分析多肽分析物的示例性工作流程中，可以使用本文提供的自动化方法和/或设备处理和分析大量的多肽(例如，5000万-10亿)或更多。在一些实施方式中，所述设备被构造成一体化进行以下反应的任何组合：酶促反应、水相生化反应和/或有机反应。

在一些实施方式中，所述设备用于制备性程序，以处理样本中的大分子用于单分子分析。在一些特定情况下，所述设备不用于观察指示大分子的序列的可检测信号。在一些情况下，使用单独的设备或仪器分析来自所述大分子分析测定的读数。在一些特定实施方式中，所述设备不被构造为感测样本中的单一分子。例如，在一些实施方式中，所述设备不包括单一分析物传感器，其中所述传感器包含分析物响应表面。在一些实施方式中，该设备不处理或加工载玻片上的样本(例如沉积在平面表面例如载玻片上的平面样本)。

在一些实施方式中，所述设备可以用于以自动化方式递送样本或装载样本。样本可以在装载到所述设备上之前进行适当的制备以供分析，所述制备包括消化、化学处理、将蛋白质样本与DNA标签连接以生成肽-DNA嵌合体等)。在一些实施方式中，一个或多个样本被提供给所述设备并由所述设备以自动方式装载到样本容器中。样本容器可包括用于附着样本(附着于肽-DNA嵌合体)的载体。在一些实施方式中，样本由样本提供盒提供，所述盒可以被格式化以自动装入样本容器中。在一些实施方式中，所述设备可被设计和配备用于自动化样本装载的机械和特征，例如用于与样本提供盒的机械接合。在一些这样的情况下，样本提供盒可以提供到设备中与试剂贮器相同或不同的位置。

通过在供应系统中使用适当的试剂，所述设备可以用于使各种过程自动化。在一些实施方式中，该装置可用于使各种循环过程自动化。在一些情况下，自动化的过程可包括设置和/或控制循环反应温度以处理样本容器中的样本。在一些情况下，自动化的过程可包括向样本递送各种试剂并进行洗涤。在一些实施方式中，适当的控制程序可以与所提供的设备一起使用。在一些实施方式中，适当的反应载体可以与所述设备一起使用。在一些实施方式中，可使用所述设备执行额外的步骤以制备用于大分子分析测定的样本或在大分子分析测定之后进一步处理样本。例如，可构造所述设备并用于扩增反应，从而消除了对单独的热循环仪和其它仪器的需要。

所述设备包括一个或多个用于包含相应试剂的试剂贮器。在一些方面，所述设备包括被构造用于保持所述试剂贮器的保持器或空间。例如，如图1A-1C所示的示例性设备包括n个试剂贮器101。在一些实施方式中，试剂贮器中的一个或多个受到温度控制。在一些示例中，试剂贮器可包含以下的任何或全部：缓冲液、洗涤缓冲液、多肽、核酸、结合剂、酶、用于修饰氨基酸的化学试剂、用于切割一个或多个氨基酸的化学试剂、用于切割一个或多个氨基酸的酶试剂、用于连接反应的试剂、用于聚合酶介导反应的试剂、或其任何组合。

所述设备包括一个或多个样本容器以及温度控制单元，所述温度控制单元充当被构造用于保持样本容器(例如，样本盒)的保持器或空间。在一些优选的实施方式中，所述设备被构造成保持多个样本容器。例如，如图1A-1C所示的示例性设备包括n个包含在温度控制单元104中的样本容器105。在一些实施方式中，样本容器是或包括包含过滤机构或玻璃料的盒，用于保留样本同时允许其它材料(例如液体或缓冲液)流过。

在一些实施方式中，所述设备的一个或多个方面由控制单元控制。例如，图1A-1C描绘了控制系统108。在一些情况下，控制系统还接收来自所述系统的各种组件。在一些实施方式中，控制系统与一个或多个阀、一个或多个泵、温度控制单元和/或一个或多个样本容器通信。在一些示例中，控制单元用于执行如图2A-2C所示的过程中的一个或多个步骤。在一些方面，控制单元用于自动化和/或控制样本容器的温度。在一些实施方式中，控制单元用于自动化和/或控制试剂贮器的温度。在一些方面，控制单元用于自动化和/或控制设备中的液体流动(例如，有无流动、阀的位置、流动方向和/或流量等)。在一些方面，控制单元用于自动化和/或控制阀102的定位。在一些情况下，控制单元用于通过泵103的控制来自动化和/或控制和/或递送所述一种或多种试剂到所述样本容器。

在一些实施方式中，受到温度控制的样本容器的温度和受到温度控制的试剂贮器的温度由所述控制单元分别控制。在一些情况下，受到温度控制的样本容器和受到温度控制的试剂贮器被包含在单独的热块中。在一些情况下，受到温度控制的样本容器和受到温度控制的试剂贮器被包含在同一个热块中。

在一些实施方式中，所述设备包括多个连接在具有上游端和下游端的供应管线中的阀，其中所述阀中的至少一个或每个可定位以提供从中通过的交替流动路径。在一些实施方式中，试剂贮器与所述样本容器流体连接。在一些情况下，试剂贮器和样本容器之间的流体连接是连续的。在一些情况下，试剂贮器和样本容器之间的流体连接是不连续的或不完全连续的。在一些实施方式中，从试剂贮器到样本容器形成了封闭的系统。在一些情况下，所述系统从输入(例如，从试剂贮器)到废物是封闭的。在一些实施方式中，一条供应管线将单个试剂贮器与单个样本容器或多个样本容器连接。在一些情况下，一条供应管线将多个试剂贮器与多个样本容器连接。

在示例性设备100中，将样本装载到样本容器(例如样本盒)中，然后将样本盒放入所述仪器中。在一些实施方式中，样本包含在201之前制备的多肽，例如将样本中的大分子与固体载体接合、将大分子与核酸(例如记录标签)、消化或片段化的多肽接合、和/或用酶或化学试剂处理样本。一旦样本提供在样本容器、例如样本盒中，过程200就移动至202中以灌注或冲洗系统并且流体连接，例如通过用缓冲液填充管线。在一些实施方式中，可以用气体冲洗所述设备的一条或多条管线以清理管线和/或从管线中去除试剂。在一些示例中，所述一条或多条管线用空气、氩气或氮气冲洗。在一些方面，所述设备与惰性气体源连接。也可进行一个或多个灌注所述设备的供应管线的步骤，例如通过用试剂灌注供应管线。然后所述系统进行到203以设置包含样本盒的温度控制单元104的温度并在状态204中向样本递送洗涤溶液。执行一个回路，该回路包括n次重复过程205-207后接过程208。在209之前的任何需要去除试剂或洗液的步骤中，可以排出样本容器，使得去除溶液，同时含有大分子(例如与固体载体接合)的样本保留在样本容器中。在209使用任何适当的手段从样本容器中取出样本。在一些实施方式中，在从仪器中取出样本之前或之后，制备样本用于测序和分析。在一些实施方式中，在从样本容器中取出样本之前，可使用所述设备进行扩增反应。在所述设备的设计中，可进一步纳入使用所述备处理的样本的收集机构。例如，所述收集机构可包括用于收集样本或其一部分的连接件和容器。样本或其一部分的收集可在如本文所述的完成记录标签的延伸之后且在分析所述延伸记录标签之前进行。在一些情况下，所述设备被构造成允许收集容器直接或间接地与样本容器中的至少一个连接。

在一些实施方式中，可通过变化反应溶液、温度和/或施加外力来优化执行由所述设备进行的反应所需的时间、温度和/或其它条件。在一些实施方式中，所述设备包括混合机构或结构。在一些情况下，混合机构或结构可以包括流体流动的控制，例如通过控制向前向后移动通过样本盒的液体的量。在一些实施方式中，混合机构或结构可以包括控制使空气或惰性气体鼓泡通过样本容器中的液体。在一些实施方式中，向所述设备添加额外的组件。例如，可以使用诸如振动之类的混合机构。在一些情况下，所述设备可设计成封闭的体系结构，这可减少、最小化或消除蒸发造成的污染和困难。

在一些实施方式中，所述设备被构造为保存试剂。例如，任何试剂贮器均可以由例如通过保护其中包含的试剂免受光、湿气和/或氧气暴露来保存试剂的材料构成。在一些实施方式中，所述设备的管道或其它组件也可由例如通过保护其中包含的试剂免受光、湿气和/或氧气暴露来保存试剂的材料构成。在一些实施方式中，所述设备和/或试剂贮器被构造成例如通过维持试剂贮器中试剂上方或覆盖试剂的干燥惰性气体(例如氮气或氩气)气氛来提供适合试剂的环境。在一些实施方式中，所述设备的管道或其它组件使用表现出对蛋白质低结合性的材料。在一些情况下，所述设备的管道或其它组件的材料对化学物质(例如本文中描述的任何化学处理)惰性，可能是理想的。

本文中还提供了使用所提供的设备和自动化方法的示例性用途和应用。在一些情况下，可以与设备一起提供用于操作设备的说明书。

A.试剂贮器

所提供的设备包含一个或多个用于包含相应的试剂的试剂贮器或被构造用于保持所述试剂贮器的保持器或空间。在一些实施方式中，所述试剂贮器中的至少一个受到温度控制。在一些实施方式中，所述被构造用于保持所述试剂贮器的保持器或空间是温度控制单元。在一些实施方式中，所述设备包括试剂贮器，用于包含可用于大分子分析测定(例如多肽分析测定)的任何试剂。例如，所述试剂贮器可包含以下的任何或全部：缓冲液、洗涤缓冲液、多肽、核酸、结合剂、酶、用于修饰氨基酸的化学试剂、用于切割一个或多个氨基酸的化学试剂、用于切割一个或多个氨基酸的酶试剂、用于连接反应的试剂、用于聚合酶介导反应的试剂、或其任何组合。在一些实施方式中，试剂贮器可包含针对在第II部分提供的方法中使用而描述的任何试剂。在一些实施方式中，使用所述设备执行所述方法(第II部分中描述的任何步骤)的说明书可以以设备随附手册的形式提供。

在一些示例中，所述设备包含至少1、2、3、4、5、6、7、8、9、10、20、30、40、50或更多个试剂贮器。在一些实施方式中，所述设备包含至少一个或多个容积范围为约5μL至约50μL的试剂贮器或被构造用于保持所述容积范围为约5μL至约50μL的试剂贮器的保持器或空间。在一些实施方式中，所述设备包含至少一个或多个容积范围为约50μL至约200μL的试剂贮器或被构造用于保持所述容积范围为约50μL至约200μL的试剂贮器的保持器或空间。在一些实施方式中，所述设备包含至少一个或多个容积范围为约200μL至约1mL的试剂贮器或被构造用于保持所述容积范围为约200μL至约1mL的试剂贮器的保持器或空间。在一些实施方式中，所述设备包含至少一个或多个容积范围为约1mL至约50mL的试剂贮器或被构造用于保持所述容积范围为约1mL至约50mL的试剂贮器的保持器或空间。在一些实施方式中，所述设备包含至少一个或多个容积范围为约50mL至约500mL的试剂贮器或被构造用于保持所述容积范围为约50mL至约500mL的试剂贮器的保持器或空间。在一些实施方式中，所述设备包含至少一个或多个容积范围为约500mL至约1L的试剂贮器或被构造用于保持所述容积范围为约500mL至约1L的试剂贮器的保持器或空间。在一些实施方式中，所述设备包含至少一个或多个容积范围为约1L至约100L的试剂贮器或被构造用于保持所述容积范围为约1L至约100L的试剂贮器的保持器或空间。在一些实施方式中，使用多个容积大于约50mL的试剂贮器储存大量试剂，例如洗涤缓冲液。在一些实施方式中，使用多个容积大于约1的试剂贮器储存大量试剂，例如洗涤缓冲液。例如，所述设备包括至少1、2、3、4、5、6、7、8、9、10、20个或更多个容积大于约50mL的试剂贮器。在其它示例中，所述设备包括至少1、2、3、4、5、6、7、8、9、10、20个或更多个容积大于约100mL的试剂贮器。在一些实施方式中，使用多个容积小于约100mL的试剂贮器储存小量试剂，例如酶或结合剂混合物。例如，所述设备可以包括至少1、2、3、4、5、6、7、8、9、10、20个或更多个容积小于约100mL的试剂贮器。在其它示例中，所述设备可以包括至少1、2、3、4、5、6、7、8、9、10、20个或更多个容积小于约50mL的试剂可构造试剂储器的放置，使得容积较小的试剂贮器的位置比容积较大的试剂贮器更靠近样本容器。。在一些特定示例中，所述设备包括至少1、2、3、4、5、6、7、8、9、10、20个或更多个容积小于约5mL的试剂贮器。在一些情况下，可构造试剂储器的放置，使得容积较小的试剂贮器的位置比容积较大的试剂贮器更靠近样本容器。

试剂可提供在小瓶(例如密封小瓶)、器皿、安瓿、瓶子、广口瓶、软包装(例如密封聚酯薄膜或塑料袋)等中。在一些实施方式中，试剂可提供在可重复使用的容器、一次性容器或可回收容器中。在一些情况下，试剂可以无菌和/或密封格式提供。在一些实施方式中，试剂贮器可由例如通过保护其中所含试剂免受光、湿气和/或氧气暴露来保存试剂的材料构成。在一些实施方式中，试剂贮器被构造成例如通过维持试剂贮器中试剂上方或覆盖试剂的干燥惰性气体(例如氮气或氩气)气氛来提供适合试剂的环境。

在一些方面，试剂可以冻干或其它稳定或惰性的形式提供。例如，以冻干或其它稳定或惰性的形式提供的试剂可在使用前溶解或重悬于溶剂(例如缓冲液)中。在一些情况下，所述设备可用于制备使用试剂，例如通过将试剂与其它组分或与其它试剂混合。例如，所述设备构造有预混合室，用于以控制程序确定的限定比率混合两种或更多种试剂。在一些情况下，一种或多种试剂贮器包含试剂的子组分，其当与试剂的另一子组分合并时变得有活性。这可适用于可能分解但可以作为两种惰性子组分储存的试剂。在一些情况下，然后将所述混合试剂递送到样本容器。在一些情况下，所述设备或控制程序可被构造成调节试剂(或其混合物)的组成。在一些实施方式中，试剂作为子组分提供，并由所述设备混合或合并，以减少对额外贮器的需求或允许原本将需要人工干预的特殊条件。

在一些实施方式中，试剂以被构造成以与整合在所述设备中的试剂贮器一起使用或相容的格式提供，或以与被构造用于保持试剂贮器的保持器或空间相容的格式提供。在一些实施方式中，一种或多种试剂提供在可刺破的包装中。每个试剂贮器可通过将包含试剂的试剂贮器与所述设备的其它组件连接的端口或开口进入。

在一些实施方式中，所述设备包括至少一个包含结合剂的试剂贮器，或被构造用于保持所述包含结合剂的试剂贮器的保持器或空间。在一些情况下，所述容器适合于包含结合剂的混合物，包括任何适当的缓冲剂。

在一些实施方式中，所述设备包括至少一个包含用于传递信息的试剂的试剂贮器，或被构造用于保持所述包含用于传递信息的试剂的试剂贮器的保持器或空间。例如，所述容器适合于包含用于进行连接反应或延伸反应的酶促混合物，包括任何适当的缓冲液。此外，所述容器还可包含dNTP的混合物。在一些实施方式中，所述设备包括至少一个包含用于传递信息的试剂的试剂贮器，其受到温度控制。在一些情况下，被构造用于保持所述包含用于传递信息的试剂的试剂贮器的保持器或空间是受温度控制的。可以包含示例性的Tris-HCl、MgSO4、NaCl、DTT、Tween20、BSA、dNTPs和聚合酶(或其组分的任何组合)的混合物作为将信息从代码标签传递到记录标签的试剂。

在一些实施方式中，所述设备包括至少一个包含用于修饰多肽的一个或多个氨基酸的试剂的试剂贮器，或被构造用于保持所述包含修饰剂的试剂贮器的保持器或空间。例如，所述用于修饰一个或多个氨基酸的试剂是化学试剂。在一些情况下，所述试剂用于修饰末端氨基酸，例如，N端氨基酸或C端氨基酸。在一些实施方式中，所述设备包括至少一个包含用于去除、切割或消除多肽的一个或多个氨基酸的试剂的试剂贮器，或被构造用于保持所述包含用于去除氨基酸的试剂的试剂贮器的保持器或空间。在一些情况下，用于去除一个或多个氨基酸的试剂是化学试剂。在一些情况下，用于去除一个或多个氨基酸的试剂是酶试剂。在一些实施方式中，所述设备既包括酶试剂贮器又包括化学试剂贮器。在一些情况下，所述试剂用于去除末端氨基酸，例如，N端氨基酸或C端氨基酸。在一些实施方式中，所述设备包括至少一个包含用于去除氨基酸的试剂的试剂贮器，其受到温度控制。在一些情况下，被构造用于保持所述包含用于去除氨基酸的试剂的试剂贮器的保持器或空间是受温度控制的。用于修饰和去除氨基酸的其它化学或酶试剂在第II.C.2部分中描述。

在一些实施方式中，所述设备包括至少一个包含用于加帽反应的试剂的试剂贮器，或被构造用于保持所述包含用于加帽反应的试剂的试剂贮器的保持器或空间。例如，所述容器适合于包含用于进行连接反应或延伸反应的酶混合物，包括任何适当的缓冲液，用于进行加帽反应。此外，所述容器还可包含dNTP的混合物。在一些实施方式中，所述设备包括的被构造为包含加帽试剂的试剂贮器或者空间或保持器是受温度控制的。通用引发序列的模板寡核苷酸、Tris-HCl、MgSO4、NaCl、DTT、Tween20、BSA、dNTP和聚合酶(或其组分的任何组合)的示例性混合物可用作加帽试剂。

在一些实施方式中，所述设备包括至少两个包含不同类型试剂的试剂贮器。例如，各试剂贮器包含选自结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂和用于加帽反应的试剂中的试剂，或被构造用于保持试剂贮器的保持器或空间。在一些实施方式中，所述设备包括至少三个包含不同类型试剂的试剂贮器。例如，各试剂贮器包含选自结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂和用于加帽反应的试剂中的试剂，或被构造用于保持试剂贮器的保持器或空间。例如，所述设备包括至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、40、50或100个试剂贮器。在一些特定实施方式中，所述设备被构造成保持至少5个试剂贮器。在一些特定实施方式中，所述设备被构造成保持至少10个试剂贮器。在一些特定实施方式中，所述设备被构造成保持至少20个试剂贮器。

在一些实施方式中，所述设备包括至少一个包含结合剂的试剂贮器、至少一个包含用于传递信息的试剂的试剂贮器、至少一个包含用于去除多肽末端氨基酸的试剂的试剂贮器、以及至少一个包含用于加帽反应的试剂的贮器，或被构造用于保持所述试剂贮器的保持器或空间。

在一些实施方式中，所述设备的包含结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂和用于加帽反应的试剂的试剂贮器中的至少一个、或被构造用于保持试剂贮器的保持器或空间，是受温度控制的。在一些实施方式中，包含结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂和用于加帽反应的试剂的试剂贮器中的至少两个或三个、或被构造用于保持试剂贮器的保持器或空间，是受温度控制的。在一些特定实施方式中，包含结合剂的试剂贮器、包含用于传递信息的试剂的试剂贮器、包含用于去除多肽末端氨基酸的试剂的贮器和包含用于加帽反应的试剂的贮器、或被构造用于保持试剂贮器的保持器或空间，是受到温度控制的。在一些实施方式中，试剂贮器的温度控制适合于维持低温度以维持试剂的有效性。例如，试剂贮器的温度控制适合于维持温度低于约25℃、低于约20℃、低于约15℃、低于约10℃、或低于约5℃。在一些示例中，相应地，试剂贮器受到冷却。在一些示例中，试剂贮器的温度维持在高于0℃或试剂的冰点。

在一些实施方式中，所述设备包括一个或多个包含洗涤溶液或缓冲液的贮器。在一些实施方式中，所述设备包括至少两个各自包含洗涤溶液的贮器。在一些实施方式中，所述设备包括至少三个各自包含洗涤溶液的贮器。在一些实施方式中，所述设备包括至少1、2、3、4、5、6、7、8、9、10个或更多个各自包含洗涤溶液的贮器。例如，洗涤缓冲液或溶液可以选自PBS(4mM磷酸钠，155mM氯化钠)、PBST(4mM磷酸钠，155mM氯化钠(NaCl)、PBF10(10％甲酰胺、4mM磷酸钠、500mM氯化钠和0.1％Tween 20)、氢氧化钠或其任何变体。在一些实施方式中，洗涤溶液含有甲酰胺、磷酸钠、氯化钠、Tween20和/或其它合适的成分。在一些实施方式中，所述设备包括单个包含洗涤缓冲液的试剂贮器。在一些实施方式中，包含洗涤缓冲液的试剂贮器的容积为约5mL至约50mL、约10mL至约100mL、约50mL至500mL、或约100mL至约1L。在一些情况下，包含洗涤缓冲液的试剂贮器被构造成容纳约50mL或更大的体积。在一些实施方式中，所述设备包括多个各自包含不同洗涤缓冲液、例如三种或更多种不同洗涤缓冲液的试剂贮器。

B.样本容器

所提供的设备包含一个或多个样本容器，其中所述样本容器中的至少一个经受温度控制并被构造为允许流体流过。在一些情况下，如图1A-1C所示，所述设备包括在温度控制单元104中包含的n个样本容器105。在一些实施方式中，所述一个或多个样本容器被保持在温度控制的空间中。在一些情况下，所述设备包括被构造用于保持所述样本容器的保持器或空间。在一些实施方式中，样本容器中的至少一个被构造成装载或提供有起始样本液。在一些实施方式中，每个样本容器通过所述设备从输入贮器装载样本。例如，可以将样本装载到设备上，并且所述设备将样本从输入贮器递送到样本容器。在一些实施方式中，样本容器通过供应管线与所述一个或多个输入贮器连接，其中供应管线任选是共用管线。在一些其它情况下，样本盒可以是可从设备上可拆卸的。例如，样本容器可由用户装载含有大分子、例如多肽的样本。

合适的非平面样本容器可由各种材料制成并且可制成各种形状。在一些实施方式中，样本容器对于与包含三维材料(例如，凝胶基质或珠子)的载体一起使用是相容的。样本容器可以装载含有在载体上固定化的大分子的样本。在一些实施方式中，优选使用三维载体(例如，多孔基质或珠子)来固定化样本中的大分子。在一些情况下，样本容器的合乎要求的性质包括对蛋白质的低结合。在一些情况下，期望的是样本容器的材料对化学物质(例如，本文中描述的任何化学处理)是惰性的。在一些特定实施方式中，样本容器由与微波应用相容或对微波应用透明的材料制成。例如，样本容器可以由包含玻璃、玻璃样材料(例如，熔融石英、石英)、聚醚醚酮(PEEK)、聚四氟乙烯(PTFE)、氟烃塑料或其任何组合的材料制成。如本文所述，非平面样本容器可以包括顶部和底部、以及连接顶部和底部的侧壁。

在一些实施方式中，样本容器被构造成在所述设备中使用，使得液体(例如试剂)的递送是通过离散而非连续的流动。在一些情况下，这种离散而非连续的流动有利于交换施加到样本容器的液体和从样本容器中去除试剂。例如，可将第一试剂递送到样本容器中，在温育后，在第二试剂递送到样本容器之前，可以将第一试剂几乎完全从样本容器中排出，从而减少第一和第二试剂之间的混合量。试剂进出样本盒的这种离散递送和去除可在样本容器中产生气隙。在一些实施方式中，样本容器具有排气口或阀。例如，样本容器具有带阀的开口。在一些情况下，样本容器可包含通向大气压的带阀开口。在一些情况下，排气口或阀可用于释放因液体进入样本容器而移位的压力。在一些具体实施方式中，样本容器具有向大气压开放的排气口或阀，使得在将下一个试剂或洗涤缓冲液递送到样本容器之前，可以将试剂从样本盒中牵引出并由空气替换。在其它实施方式中，液体流入样本容器是连续的。样本容器可以承受正压，例如由泵施加的正压。

在一些实施方式中，所述样本容器和设备采用系统设计，其中气体通过试剂供应管线递送并被一直推进到废物容器。例如，样本容器不排气或排气口关闭，气体被递送到样本容器并通过出口排出到废物容器。在一些实施方式中，可能希望用气体冲洗供应管线和/或将气体递送到样本容器以基本上或完全去除或冲洗任何剩余的缓冲液和/或试剂。

在一些实施方式中，包含的样本是密封的样本盒。密封的样本盒和/或系统的一个优点是防止泄漏。在某些情况下，样本容器可以处于负压之下。例如，可以将泵定位在样本容器的下游以向样本筒施加负压。样本盒承受负压的一些益处可包括改善流动特性，尤其是在反应体积为约50μL至约100μL下。在一些方面，其它期望的特征可以是更容易、快速、更好地控制所包含的样本和/或更有效地递送试剂和/或排出。

虽然样本容器的顶部和底部是按直立位置(竖直)描述的，但样本容器也可相对于设备以其侧面放置(水平)。非平面样本容器的特征可以是相对于容器具有显著的高度，该高度实质上不是平的。在一些实施方式中，a平面样本容器的特征在于：a)具有至少一个尺寸(例如长度、宽度或直径)大于其高度；b)高度与最大尺寸(例如，长度、宽度或直径)之间的比率为约1:2至约1:10、约1:2至约1:50、约1:2至约1:100、或约1:2至约1:500；和/或c)厚度或高度等于或小于1mm。在一些实施方式中，被构造为与所提供的设备一起使用的非平面样本容器的特征在于：a)具有至少一个尺寸(例如长度、宽度或直径)大于其高度；b)高度与最大尺寸(例如，长度、宽度或直径)之间的比率为约1:1至约10:1、约1:1至约20:1、约1:1至约50:1、或约1:1至约100:1；和/或c)厚度或高度大于1mm。所提供的设备被构造为与不是平面容器的样本容器一起使用。平面容器在容器顶部和底部之间可具有最小高度(例如深度或厚度)，以允许连续层流。

在一些实施方式中，样本容器的顶部和底部包括用于递送试剂的入口和出口。在一些方面，所述容器的入口还用于将样本初始递送到样本盒。在一些实施方式中，样本容器是样本盒或包含样本盒。在一些实施方式中，每个样本容器都是设备的可拆卸和可更换的组件。在一些实施方式中，样本容器不是用于对核酸样本进行测序的图案化流动池(patterned flow cell)。在一些实施方式中，样本容器不是放置平面样本的载玻片。

在一些实施方式中，所述设备被构造成保持单个样本容器、或保持两个或更多个样本容器。样本容器的温度控制单元可以是任何形状，只要所述单元可以保持样本容器(例如样本盒)、同时提供本公开的某些功能和优点即可。在一些实施方式中，温度控制单元被构造成保持单个样本容器、或保持两个或更多个样本容器。在一些实施方式中，所述设备被构造成保持至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、或100个样本容器。在一些实施方式中，所述设备被构造成保持2至10个样本容器。可以设计所述设备，使得并非设备上能够保持样本容器的所有样本容器槽都必须在任何时候都被装载和使用(例如，有些可以是未用的)。在一些实施方式中，每个样本容器的容积(例如容器的容量)等于或小于约50mL，等于或小于约20mL、等于或小于约10mL、等于或小于约5mL、等于或小于约2mL、等于或小于约1mL、等于或小于约0.5mL或等于或小于约0.25mL。在一些具体实施方式中，每个样本容器的容积等于或小于约20mL。在一些具体实施方式中，每个样本容器的容积等于或小于约10mL。在一些具体实施方式中，每个样本容器的容积等于或小于约1mL。

在一些实施方式中，样本容器中的至少一个和/或试剂贮器中的至少一个受到主动加热。在一些实施方式中，样本容器中的至少一个和/或试剂贮器中的至少一个受到主动冷却。任何合适的用于施加温度控制的机构均可使用。例如，可期望以相对且足够快的方式冷却或加热样本容器，以高效进行处理样本的反应。在一些示例中，样本容器的温度控制使用空气、冷空气、与样本容器接触的表面或液体冷却。在一些情况下，热电冷却或加热用于节制或调整样本的温度。例如，可以使用Peltier冷却器或加热器来节制或调整样本的温度。在一些实施方式中，所提供的设备包括用于监测样本容器中一个或多个的温度并提供温度的反馈控制的机构或结构。在一些实施方式中，所述设备包括用于每个样本容器(每个样本盒)或用于每个热块的单独的传感器和温度控制。在一些方面，监测样本容器内的压力。

在一些实施方式中，所述设备包括多个样本容器、或被构造用于保持样本容器的保持器或空间，其中样本容器中的至少一个受到温度控制并且被构造为允许流体流过。在一些实施方式中，所述设备包括多个受到温度控制并且被构造为允许流体流过的样本容器、或被构造用于保持样本容器的保持器或空间。所述设备可包括一个或多个被个别控制和调制的温度块。

在一些实施方式中，样本容器中的至少一个包括多孔机构或多孔膜以允许液体通过并排出样本容器和/或维持样本例如样本液在样本容器中。在一些情况下，样本容器包括过滤机构或玻璃料，用于保留样本，同时让其它材料(例如缓冲液)流过。在一些实施方式中，所述多孔机构或多孔膜用于保留样本以免通过样本容器的出口排出。同时，试剂和缓冲液可流过样本容器，并通过样本容器的出口排出样本容器。任何合适的多孔材料都可以用作过滤机构。合适的过滤机构可包括期望的特性，包括材料的直径、孔隙尺寸和厚度。在一些情况下，过滤机构包含非反应性材料。在一些情况下，过滤机构包含不与大分子分析测定的组分结合的材料。在一些实施方式中，过滤机构由疏水材料制成。在一些实施方式中，过滤机构由包含聚乙烯(PE)、聚四氟乙烯(PTFE)或类似疏水材料的材料制成。

在一些实施方式中，过滤机构被构造和定位成装配在样本盒中。在一些示例中，过滤机构(例如玻璃料)的孔隙尺寸为约1μm至约500μm。在一些示例中，玻璃料的孔隙尺寸小于约50μm、小于约40μm、小于约30μm、小于约20μm,小于约10μm、小于约5μm,小于约4μm、小于约3μm、小于约2μm、或小于约1μm。在一些具体示例中，过滤机构(例如玻璃料)的孔隙尺寸为约1μm至约5μm。过滤机构(例如，玻璃料)可以具有任何合适的厚度，并且可以基于各种因素、包括使用的材料和期望的过滤效果进行调节。在一些示例中，玻璃料的厚度为约0.1mm至约5mm、约0.1mm至约1mm、约0.1mm至约0.5mm、约0.2mm至约5mm、约0.2mm至约1mm、约0.2mm至约0.5mm。在一些情况下，玻璃料的厚度为约0.5mm。在一些实施方式中，样本容器包含载体，或装载有或准备了载体。例如，样本容器可装有被构造为捕获具有缔合和/或附着的记录标签的大分子的载体(例如珠子)。

在一些示例中，每个样本容器都有用于递送试剂的入口和用于排出试剂的出口。在一些实施方式中，样本容器的出口被构造为将液体从样本容器排放到废物容器。在一些情况下，废物容器直接或间接地与一个或多个样本容器流体连接。在一些示例中，所述设备包含多于一个废物容器。例如，所述设备可包括用于储存特定类型的废物、例如有机废物的废物容器。

在一些实施方式中，样本容器与所述一种或多种试剂贮器连接，见图1A-1C。在一些实施方式中，样本容器通过供应管线与所述一种或多种试剂贮器连接。在一些情况下，供应管线是共用管线。在一些实施方式中，用泵控制流体进出样本容器的运动。

在一些实施方式中，所述设备还包括用于收集从样本容器释放的样本或其一部分的机构。在一些情况下，用于收集样本或其一部分的机构包括直接或间接地与样本容器中的至少一个连接的收集容器。在一些示例中，样本容器通过管道和附加的阀与收集容器连接。在一些实施方式中，样本在收集前用切割试剂处理，使记录标签被释放和收集。样本收集或回收可以是自动化过程。在一些实施方式中，样本的收集或回收过程可包括用于收集样本、洗脱样本、控制参与样本退出的任何阀以及引导样本收集到收集容器或接受器中的流程。

C.控制单元和过程

在一些实施方式中，设备功能的一个或多个方面由控制系统或单元控制。控制单元可用于将使用所述设备进行的一个或多个过程自动化。在一些示例中，控制单元108用于执行例如图2A-2C中所示的过程的一个或多个步骤。在一些方面，控制单元用于自动化和/或控制样本容器的温度。在一些实施方式中，控制单元用于自动化和/或控制试剂贮器的温度。在一些方面，控制单元用于自动化和/或控制设备中液体的流动。在一些方面，控制单元用于自动化和/或控制阀的定位。在一些情况下，控制单元用于自动化和/或控制和/或递送所述一种或多种试剂到所述样本容器。

具有相关电子线路和软件的计算机控制该过程的许多方面，包括以期望的时段打开和关闭阀、改变阀位置的顺序、泵的运动、每种试剂添加到样本或样本容器的适当温育期、并在温育期完成后排出样本容器中的内容物。在一些方面，控制单元用于自动化和/或控制样本容器的温度。在一些实施方式中，控制单元用于自动化和/或控制试剂贮器的温度。在一些方面，控制单元用于自动化和/或控制设备中液体的流动。在一些方面，控制单元用于自动化和/或控制阀的定位。在一些情况下，控制单元用于自动化和/或控制和/或递送所述一种或多种试剂到所述样本容器。例如，图1A-1C描绘了控制单元108，其可用于执行例如图2A-2C中描绘的过程的一个或多个步骤。在一些实施方式中，样本容器的温度控制由控制单元自动化和/或控制。在一些实施方式中，试剂贮器的温度控制由控制单元自动化和/或控制。在一些实施方式中，阀的定位由控制单元自动化和/或控制。在一些实施方式中，一种或多种试剂向所述样本容器的递送由控制单元自动化和/或控制。在一些实施方式中，反应时间和/或反应循环由控制单元自动化和/或控制。

在一些实施方式中，控制系统或单元可由用户编程。协议或控制程序的任何步骤可以被优化。在一些实施方式中，所述设备包括图形用户界面。在一些示例中，用户对控制单元进行编程以确定流体从试剂贮器流向样本容器的顺序和速率。用户可基于所递送的试剂和所进行的过程，根据需要调节控制程序。例如，特定试剂或样本的粘度可能需要较慢的流速。在一些示例中，用户对控制单元进行编程以确定由设备执行的过程的每个步骤中样本容器的温度。在一些实施方式中，控制单元与一个或多个阀通信以确定阀的位置。在一些情况下，样本容器和/或试剂贮器的温度也可以通过向(温度控制单元/热块的)加热器或冷却器以可变的时段供电来控制。

在示例性的系统中，图1A-1C中的图描绘了所述设备中的控制单元或处理器。控制单元108可包括计算机处理器，该计算机处理器可操作以控制阀102，从而允许控制试剂通过可定位阀被送过设备。在一些方面，控制单元可用于控制或自动定位用于移动一种或多种试剂的机构，例如任何泵103。在一些实施方式中，泵是可以产生压差的注射泵或其它泵送装置(例如，真空泵、微型泵等)，其还包括用于移动所述一种或多种试剂、例如一种或多种试剂液的机构。在一些情况下，用于施加或递送气体压力的机构或结构由控制单元控制。在一些实施方式中，所述设备包括单个泵。在一些实施方式中，所述设备包括多个泵。在一些示例中，所述一个或多个泵整合在设备中。在一些实施方式中，泵在设备的外部。在一些实施方式中，可以对样本容器施加正压和/或负压。在一些情况下，可应用负压手段(例如真空)从样本容器去除试剂(洗涤缓冲液)到废物贮器中。所述设备可包括至少两个泵，包括例如，用于递送试剂的注射泵和用于从样本容器抽空试剂的真空泵。在一些情况下，可构造所述设备，使得如果在向样本容器的递送试剂之间需要对泵进行清理，则可以包括旁路，使得在样本容器中的温育步骤期间，该旁路允许在所述温育期间对泵进行清理。在一些实施方式中，泵中的一个或多个包括微型泵。在一些情况下，所需泵的数量可基于样本容器的需求和待处理的样本容器的数量进行调节。例如，设备可以设计成支持96孔板格式的样本容器。

任何合适的可编程语言都可以用于控制程序。在一些情况下，控制单元被构造成使用跨平台语言进行操作。在一些示例中，计算机程序或软件可包括执行功能的任何序列或者人类或机器可辨识的步骤。这样的程序可实际上以任何编程语言或环境呈现，所示编程语言或环境包括，例如，C/C++、C#、Fortran、COBOL、MATLAB^TM、PASCAL、Python、汇编语言、标记语言(例如HTML、SGML、XML、VoXML)、Java^TM(包括J2ME、Java Beans等)、二进制运行时环境(例如BREW)、脚本语言(例如Sh、Bash、Perl)及其任何变体。在一些具体情况下，使用Python操作控制单元。在一些实施方式中，所述设备可包括可编程的或可以修改的控制单元，使得所述系统允许用户创建、更改和调节许多系统设置、各种过程的运行参数以满足各种需要。在一些实施方式中，所述设备可包括为各种过程提供合适的参数和设置的控制单元，使得提供自动化并且需要很少的用户输入。

在一些实施方式中，所述设备与条形码技术相容，使得试剂和/或样本可以与条形码相关联。在一些情况下，可以使用条形码追踪样本和/或过程的任何合适和有用的信息。在一些情况下，条形码发信息内容的例子可包括试剂名称、制造信息例如日期和有效期、任何序号、试剂量、样本类型、协议信息等。在一些实施方式中，所述设备包括机器可读信号的检测器，例如条形码读取器或射频标识(RFID)读取器。在一些进一步的实施方式中，控制单元或处理器可包括关于样本处理信息的数据库或数据库访问。

在一些实施方式中，控制单元可以用于自动化和/或控制所述一种或多种试剂向所述样本容器的递送。在一些方面，一种或多种试剂的递送是可单独寻址的，例如，针对每个样本容器。在一些情况下，控制单元执行单个试剂向单个样本容器或多个样本容器的递送。在一些情况下，控制单元控制多种试剂向多个样本容器的递送。

在一些实施方式中，控制单元可以用于自动化和/或控制阀的位置。图1A中，描绘了一个示例性系统，其中所有试剂阀和样本容器(例如样本盒)阀关闭，泵通过旁路递送到废物容器。图1B中描绘了一个示例性系统，其中泵抽吸一种试剂。图1C中，描绘了一个示例性系统，其中泵将试剂从包含试剂的贮器递送到样本容器(例如样本盒)。作为处理样本容器中的任何样本之前的第一步，可打开适当的阀，以便用来自试剂贮器的所需试剂灌注供应管线。所述设备的阀可以不同的构造(例如，打开或关闭)操作，以将流体释放到路径中、从路径中去除流体、或阻止流体进入路径。在一些实施方式中，所述设备包括两个或更多个阀。在一些情况下，阀中的两个或更多个整合在歧管中。可基于期望的特性、例如小的死体积和/或扫掠体积(swept volume)来选择阀。例如，所述设备可以包括死体积为约0.5-5μL、约1-10μL、约1-5μL、约1-4μL、约1-3μL或约1-2μL的微型阀。例如，所述设备可以包括扫掠体积为约1-10μL、约1-20μL、约1-50μL、约10-20μL、约10-50μL或约20-50μL的微型阀。在一些情况下，所述阀选自旋转阀、电磁阀、选择阀、滑阀、隔膜阀、夹管阀或其它合适的阀。在一些实施方式中，可以使用一个或多个阀(例如四通歧管)来控制从样本容器的流动(例如每个样本容器的退出或排泄)。

在一些实施方式中，控制单元用于自动化和/或控制样本容器的温度。例如，样本容器中的大分子的制备和处理可包括每个所需的反应在不同温度之间循环。控制单元可用于使约4℃(+/-1℃)、8℃(+/-1℃)、25℃(+/-1℃)、30℃(+/-1℃)、40℃(+/-1℃)、60℃(+/-1℃)、80℃(+/-1℃)之间的示例性温度变化以任何顺序或组合自动化。用户可基于每个反应的许多因素，包括与结合剂一起温育、将信息传递到记录标签、修饰氨基酸、以及去除至少一个末端氨基酸(通过化学或酶促处理)，来调节反应的温度设置。

在一些实施方式中，控制单元接收来自所述设备的一个或多个组件的反馈。在一些实施方式中，控制系统接收来自一个或多个阀、温度控制单元和/或一个或多个样本容器的反馈。在一些实施方式中，来自设备监测的反馈提供了关于试剂递送的信息。例如，反馈可以包括来自监测温度、压力、流量、气泡、一个或多个阀的位置、折射率和/或电导的信息。在一些实施方式中，所述设备被构造成向控制程序提供监测的反馈。在一个示例中，阀门的打开或关闭或电位变化由处理器控制，处理器进一步与一个或多个检测器通信，检测器监测上游分离模块内不同路径中的组件。在一些方面，关于阀位置的反馈作为反馈提供给控制单元。来自阀的反馈可以是二进制的或具有位置信息，并且可以取决于组件(例如，使用的阀类型)。

在一些实施方式中，所述设备包括用于检测试剂向样本容器的递送失败的机构。如果检测到试剂递送失败，控制系统可以暂停或停止运行中的过程，并且任选采取任何合适的其它动作来重复试剂递送。可以用任何合适的方式监测试剂的递送，包括使用气泡传感器，例如光电器件。在一些情况下，所述监测在样本容器外进行，不会干扰流向样本容器的流体流。在一些实施方式中，所提供的控制单元或程序可以规定预期的试剂递送是规定量。所述监测可以分辨被吸入和递送的体积量，并设置系统容许的偏差量以及不可接受并且被认为是失败递送事件的偏差量。在一些情况下，监测试剂递送的分辨率可以是亚微升级的。在一个示例中，如果监测的试剂递送小于请求的量的50％，则控制单元将试剂递送事件视为失败，然后可以采取恢复动作，包括将失败的递送移到废物中、重复试剂递送、暂停运行或将运行置于安全状态、和/或规定在完成运行之前容忍失败递送的次数。在一些情况下，质量流量传感器可以测量任何特定步骤中预期试剂增益或损失的体积。

在一些实施方式中，监测样本容器的抽空和/或提供来自被构造成提供关于样本容器抽空信息的传感器的反馈。例如，压力传感器和/或质量流量传感器可以用于检测用于将试剂从样本容器中抽出的真空度、检测抽空的时间和充分的抽空压力。在一些情况下，如果检测到体积低或不足，控制单元可以指示泵调整压力进行补偿，或可以使用不同的泵进行补偿。在一些实施方式中，监测随时间推移的系统性能，以检测任何的功能下降。例如，如果在泵中检测到任何性能下降，则可以将调节器(例如真空调节器)应用于设备。

在一些实施方式中，所述设备包括分析机构以监测设备的功能和性能。如果在设备执行的任何过程的功能中出现差错并且可以进行纠正，则可以使用该监测和反馈来停止过程。在一些实施方式中，所述设备包括照明机构。在一些情况下，所述设备包括用于检测可检测信号、例如荧光信号的机构或传感器。例如，可在一个或多个步骤中进行处理样本，以包括发生特定反应的指示物(例如，荧光指示物)。在一些方面，可检测信号是样本集体产生的质量控制指示物。在一些情况下，可检测信号集体指示样本的特征。在一些情况下，可检测信号不指示个体大分子的序列。在一些实施方式中，所述设备包括收率检测器(yielddetector)。在一些实施方式中，荧光读数可以指示收率，例如由扩增所述延伸记录标签得出的收率。

D.任选的微波发生器

在一些实施方式中，所提供的用于处理样本的设备和方法可包括施加辐射，例如电磁辐射或微波能量(射频，RF)。在一些实施方式中，所描述的化学和物理过程可在微波辐射场内进行，如图1D所示。在一些实施方式中，所述过程的一个或多个步骤可以通过向样本施加微波能量来加速。例如，可向与试剂接触的样本施加微波能量，以对样本中多肽的氨基酸(例如，NTAA)进行官能化或修饰。在一些实施方式中，可向与结合剂接触的样本施加微波能量，所述结合剂能够与样本中的大分子(例如，多肽)结合。在一些方面，可向与试剂接触的样本施加微波能量，以从多肽中去除氨基酸(例如，NTAA)。在一些实施方式中，施加微波能量是由控制单元自动化和控制的。

在一些实施方式中，多肽与样本容器中的试剂(例如，与官能化或修饰试剂、与结合剂、或与去除一个或多个氨基酸的试剂)的接触在与微波辐射源(RF源)通信、暴露于或连接到微波辐射源的腔中进行。在一些示例中，多肽与本文中提供的任何试剂或结合剂的接触在微波室中进行(例如，参见美国专利申请公布No.US 2013/0001221；国际专利公布No.WO 2012/075570)。在一些实施方式中，所提供的方法在单模微波腔中进行。在一些情况下，所提供的方法在多模微波腔中进行。

在本方法中可使用标准类型的设备和试剂。在一个实施方式中，所述方法在样本容器中进行，其中可监测和任选节制温度和/或压力。在一些示例中，使用非侵入性方法、例如红外相机来监测温度。

在一些实施方式中，监测样本容器内样本的温度。在一些实施方式中，样本容器的压力通过样本容器中的压力排放口排出。在一些示例中，控制系统基于样本的吸收功率、温度、压力之类的反馈来控制和调节微波源。在一些实施方式中，在本文提供的方法的任何或所有步骤中监测和/或控制温度。例如，可将温度调节到合适的值或维持在由技术人员确定的合适水平。在一些实施方式中，所述方法在可应用冷却的样本容器中进行。例如，可对样本容器应用主动冷却(例如，空气冷却)。在一些实施方式中，温度控制在约10℃至200℃、约10℃至150℃、约10℃至100℃、约20℃至200℃、约20℃至150℃、约20℃至125℃、约20℃至100℃、或约25℃至125℃的范围内。在一些情况下，节制(例如冷却)温度以使样本容器中的样本迅速冷却。在一些示例中，使用空气、冷空气、与样本容器接触的表面或液体冷却来进行温度节制。在一些情况下，热电冷却或加热用于节制或调整样本的温度。例如，可以使用Peltier冷却器或加热器来节制或调整样本的温度。

在一些实施方式中，调谐可以应用于微波反应。在一些情况下，各种变化，包括样本容器的尺寸、内容物(包括样本和/或试剂的流体性质和任何离子变化)、材料或位置的变化，都可以导致所需或施加的微波能量发生变化。在一些方面，调谐杆或调谐结构可以包括在微波腔中以改变微波能量的场强。如果使用不同的试剂，调谐机制可允许灵活的方式来控制和修改施加的场强。为了监测在给定条件下施加于样本的能量，可以使用频谱分析仪。可以修改调谐杆的各种特性，包括杆的数量或杆的其它特性(例如，Keats等人，IFACMechatronic Systems(2004)37(14):253-258)。

在所提供的方法的一些实施方式中，也可将反应淬灭，例如通过降低总反应温度。有许多参数可以用微波源或微波发生器进行控制和指定。例如，参数可包括时间、温度、压力、冷却、功率、混合、预搅拌、初始功率、溶液的电介质、小瓶类型或材料、和/或吸收。在一些实施方式中，微波仪器可在可以发生对反应快速冷却的条件下提供可控、可重复和快速的能量施加。

在一些实施方式中，微波能量(射频，RF)由固态微波功率放大器产生。在一些示例中，功率放大器可以改变微波功率(例如，0-10W或0-100W或0-1000W)和频率(例如，2.3-2.7GHz)二者。在一些示例中，微波能量施加于单模谐振腔中的样本上。例如，所述腔的尺寸被设计成能够激发腔的单模，以在位于腔中心的样本处产生时间平均电场(E场)最大的单个驻波(例如，参见Koyama等人，Journal of Flow Chemistry(2018)8(3):147-156；Barham等人，Chem Rec(2019)19(1):188-203；Odajima等人Chem rec(2019 19(1):204-211)。在一个优选实施方式中，使用其中微波激发作为单个驻波辐射并且时间平均电场在位于腔中心的包含样本的容器处最大的单模微波辐射系统以均匀加热样本的体积。

在一些实施方式中，微波能量发生器与控制单元通信。在一些实施方式中，暴露于微波能量的电场和/或腔与微波能量发生器和/或控制单元通信。在一些情况下，控制单元和/或微波发生器与电场传感元件和热传感元件通信。在一些实施方式中，微波辐射的功率和频率由来自电场传感元件和热传感元件的反馈自动控制(例如，参见Koyama等人，Journal of Flow Chemistry(2018)8(3):147-156；Barham等人，Chem Rec(2019)19(1):188-203；Odajima等人Chem rec(201919(1):204-211)。由这些反馈元件自动调谐频率特征可以用于调整微波频率以与腔/容器系统谐振模式变化保持一致(例如腔/样本容器的谐振频率随样本容器中的溶液类型即溶液之间的电介质/介电常数差异以及随样本容器的温度变化而变)。

在一些实施方式中，微波能量的波长从约一米至约一毫米，例如，波长从约0.3m至约3mm。在一些情况下，微波能量的频率从约300MHz(1m)至约300GHz(1mm)。在一些实施方式中，微波能量的频率从约1GHz至约100GHz。在一些实施方式中，微波能量的频率从约0.5GHz至500GHz、从约0.5Ghz至100GHz、从约0.5GHz至50GHz、从约0.5GHz至25GHz、从约0.5GHz至10GHz、从约0.5GHz至5GHz、或从约0.5GHz至2.5GHz、2GHz至500GHz、从约2GHz至100GHz、从约2GHz至50GHz、从约2GHz至25GHz、从约2GHz至10GHz、从约2GHz至5GHz、或从约2GHz至2.5GHz。在一个示例中，微波发生器以约902-928MHz操作。在一个优选实施方式中，微波能量的频率从约2.44GHz至2.46GHz。在一个示例中，微波发生器以2.45GHz+-0.2GHz操作。

在一些实施方式中，微波能量的频率为IEEE雷达波段命名的S、C、X、K_u、K或K_a波段。在一些实施方式中，微波能量的光子能量(eV)从约1.24μeV至约1.24meV，例如，为约1.24μeV至约12.4μeV、约12.4μeV至约124μeV、约124μeV至约1.24meV。在一些示例中，施加的微波能量为约5瓦、约10瓦、约15瓦、约20瓦、约25瓦、约30瓦、约35瓦、约40瓦、约45瓦、约50瓦、约60瓦、约70瓦、约80瓦、约90瓦、约100瓦、约110瓦、约120瓦、约130瓦、约140瓦、约150瓦、约300瓦或更高的瓦数，或其子范围。在一些实施方式中，微波由能够递送约0W至10W之间、0W至50W、约0W至100W之间、约0W至200W之间、约0W至300W之间、约0W至400W之间、约0W至500W之间、或约25W至200W之间的放大器生成。微波能量可基于样本的特性、例如样本的体积调整到由技术人员确定的合适的值或水平。

在一些实施方式中，对于本文提供的任何方法的任何或每个步骤，施加微波能量的时间段为约1分钟、2分钟、3分钟、4分钟、5分钟、10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、1小时或更长的时间段或其子范围。在一些实施方式中，在本文提供的任何方法的任何或每个步骤之前或之后将微波能量施加于多肽。在一些实施方式中，以在至少20％、30％、40％、50％、60％、70％、80％、90％或更高百分比的多肽中有效实现修饰、结合和/或去除氨基酸的持续时间来施加微波能量。

在一些实施方式中，微波能量通过非均匀微波场施加。在一些实施方式中，微波能量通过均匀微波场施加，例如，通过微波容积加热(microwave volumetric heating，MVH)施加。

在一些实施方式中，微波能量被均匀地施加或递送到样本容器中的样本。在一些情况下，暴露于微波能量的样本容器包含水性材料和/或有机材料。

在一些实施方式中，在离子液体存在下施加微波能量。例如，将微波能量施加于离子液体中的多肽混合物。

在一些实施方式中，进行本文提供的方法以将反应维持在固定温度下。在一些示例中，进行本文提供的方法以将反应维持在约至少10℃、20℃、30℃、40℃、50℃、60℃、70℃、80℃、90℃或100℃、或其子范围的温度下。在一些情况下，进行本文提供的方法以将反应维持在约30℃、60℃或80℃或其子范围的温度下。固态微波发生器用于将微波能量施加到单模谐振腔。在一个优选的方式中，微波发生器以2.45GHz+-0.-.05GHz操作。微波腔的尺寸被设计成能够以集中在位于腔中心的样本盒处的电场激发所述腔的单模以产生单个驻波，如图1D所示。微波腔中的虚曲线指示微波腔内单模电场强度的时间平均绝对值。E场的强度在样本盒所在的腔的中心处最大。

II.进行大分子分析测定的自动化方法

本文提供了用于自动处理含有大分子(例如，肽、多肽和蛋白质)的样本的方法。在一些实施方式中，用于在大分子分析测定中处理与记录标签缔合的大分子的一个或多个步骤是自动化的。用于所述分析测定的样本制备的一个或多个步骤可以按自动化方式进行。例如，样本中的大分子(例如肽、多肽和蛋白质)的处理可以用各种化学或酶试剂处理以制备样本，例如将大分子与记录标签接合。在一些情况下，可以按自动化方式将制备的样本装载到用于所述测定的设备上。在一些特定实施方式中，将带有缔合和/或附着的记录标签的大分子固定化在载体上并进行多肽分析测定。在一些情况下，进行大分子分析测定以评估大分子、或制备样本以鉴定或确定多肽大分子的至少一部分序列。在一些实施方式中，使用所描述的方法制备多个用于分析的大分子，以实现对单个的肽、多肽或蛋白质的序列的下游分析。如第I部分中所述的设备可用于进行和自动化所提供的方法的任何步骤。在一些实施方式中，本文提供的方法包括将肽序列转化为DNA编码信息的循环过程。例如，多肽分析测定可包括结合多肽的至少一个末端氨基酸、将信息从代码标签传递到记录标签以及以循环方式切割多肽的至少一个末端氨基酸的重复步骤。在一些实施方式中，所述方法包括下列的任何组合：酶促反应、水相生化反应和/或有机反应。

在一些实施方式中，进行大分子分析测定以对大分子的全部或部分组分进行鉴定、定量、表征、辨别或其组合。在一些实施方式中，进行大分子分析测定以分析蛋白质、多肽、肽、核酸分子、碳水化合物、脂质、大环、嵌合大分子或其任何组合。在一些实施方式中，进行大分子分析测定以分析两个或多个大分子。在一些示例中，大分子分析测定包括探针与大分子的结合或接触。在一些实施方式中，用寡核苷酸例如核酸标签标记探针。在一些实施方式中，探针包含小分子。在一些情况下，大分子分析测定包括小分子反应探针。在一些实施方式中，探针与大分子的至少一部分相互作用、反应或结合。在一些实施方式中，探针在反应位点与大分子结合或相互作用。在一些实施方式中，探针与大分子的结合位点结合。在一些实施方式中，探针与酶结合。

在一些实施方式中，大分子分析测定的至少部分可以自动化，例如使用多种结合剂以及酶或化学介导的顺序信息传递的下一代蛋白质测定。在一些情况下，所述分析测定是对同时被两种或更多种同源结合剂(例如抗体)结合的固定化蛋白质分子进行的。在多次同源抗体结合事件之后，使用组合的引物延伸和DNA切口形成步骤将信息从结合抗体的代码标签传递到记录标签。在一些情况下，针对蛋白质上多价表位的多克隆抗体(或单克隆抗体的混合群体)可以用于所述测定。

在一些实施方式中，大分子包含多肽并且方法包括进行多肽分析测定。在一些实施方式中，使用多肽分析测定来确定蛋白质的序列(或其序列的一部分)和/或同一性。在一些实施方式中，大分子可被加工或处理，例如用一种或多种酶和/或试剂。在一些示例中，多肽分析测定包括使用合适的技术或程序来评估多肽的至少部分序列或同一性。例如，可以通过N端氨基酸分析或C端氨基酸分析来评估多肽的至少部分序列。在一些实施方式中，可以使用ProteoCode测定来评估多肽的至少部分序列。在一些示例中，可以通过美国临时专利申请No.62/330,841、62/339,071、62/376,886、62/579,844、62/582,312、62/583,448、62/579,870、62/579,840、and 62/582,916以及国际专利公布No.WO 2017/192633、WO2019/089836、WO 2019/089846、and WO 2019/089851中公开和/或要求保护的技术或程序，来评估多肽的至少部分序列。

在一些实施方式中，所提供的自动化方法用于生成表现大分子结合历史的核酸编码文库。该核酸编码文库可以扩增并使用高通量的下一代数字测序方法进行分析，所述方法每次运行能够分析数百万到数十亿个分子。在另一个方面，创建结合信息的核酸编码文库是有用的，因为它能够通过利用杂交的基于DNA的技术进行富集、扣除和规范化。这些基于DNA的方法易于快速扩展和定制，并且比可用于直接操纵其它类型的大分子文库、例如蛋白质文库的那些方法更具成本效益。因此，结合信息的核酸编码文库可以在测序之前通过一种或多种技术进行处理，以富集和/或减去序列和/或规范化序列的表示。这使得最感兴趣的信息能够从非常大的文库中更为高效、快速和成本效益地提取出来，所述文库的个体成员最初的丰度差异可能有许多个数量级。重要的是，这些用于操纵文库表示的基于核酸的技术与更常规的方法是互不相关的，并且可以与它们组合使用。

在分析肽或多肽的示例性工作流程中，方法通常包括使包含代码标签的结合剂与肽的末端氨基酸(例如，NTAA)接触和结合，并将结合剂的代码标签信息传递到与所述肽缔合的记录标签上，从而产生第一级延伸记录标签。被结合剂结合的末端氨基酸可以是化学标记或修饰的末端氨基酸。在一些实施方式中，从代码标签传递信息后，消除末端氨基酸(例如，NTAA)。消除的末端氨基酸可以是化学标记或修饰的末端氨基酸。通过与酶或化学试剂接触去除NTAA将肽的倒数第二个氨基酸转变为末端氨基酸。多肽分析可以包括一个或多个下述循环：附加结合剂与末端氨基酸结合，信息从附加结合剂传递至所述延伸的核酸从而产生包含来自两个或更多个代码标签的信息的更高级延伸记录标签，以及以循环方式消除末端氨基酸。附加的结合、传递、标记和去除可以如上所述发生，直至n氨基酸，以产生第n级延伸核酸，它们集体表示所述肽。在一些实施方式中，所述示例性方法中包括NTAA的步骤可以用C端氨基酸(CTAA)代替进行。在一些实施方式中，基于降解的肽或多肽测序测定过程中的步骤次序可以颠倒或以各种次序进行。例如，在一些实施方式中，末端氨基酸标记可以在多肽与结合剂结合之前和/或之后进行。在一些实施方式中，工作流程可包括在结合剂结合、信息传递、末端氨基酸的标记或修饰、和/或末端氨基酸的去除之前和/或之后的一个或多个洗涤步骤。

在一些实施方式中，所提供的方法用于自动化处理样本中的大分子，以供使用类似降解的方法进行分析。在一些情况下，该方法使用循环过程，包括将代码标签信息传递到附着于多肽的记录标签上、消除末端氨基酸(例如，消除NTAA)、并以循环方式重复该过程。

在一些实施方式中，多肽直接或间接地附着在固体载体上。例如，多肽通过捕获剂固定在固体载体上。蛋白质或捕获剂都可共定位或被记录标签标记，带有缔合的记录标签的蛋白质直接固定在固体载体上。可以使用任何合适的手段，包括通过连接或引物延伸，将信息从结合的结合剂上的代码标签传递到最接近的记录标签。在所示的一个实施方式中，代码标签包括与记录标签中的间隔区互补的间隔区，并且可以用于启动引物延伸反应以将记录标签信息传递到代码标签。最终的延伸记录标签任选侧接通用引发位点，以促进下游扩增和/或DNA测序。正向通用引发位点(例如，Illumina的P5-S1序列)可以是原始记录标签设计的一部分，而反向通用引发位点(例如，Illumina的P7-S2’序列)可以添加(例如，通过延伸)到最终的延伸记录标签上。该最终步骤的进行可以与结合剂无关。

在包括结合天然或未修饰的末端氨基酸工作流程中，分析方法包括使多肽与附着于DNA代码标签的结合剂接触。在结合剂与多肽的NTAA结合后，代码标签的信息被传递到记录标签上(例如，通过引物延伸或连接)，生成延伸记录标签。通过化学或生物(例如，酶)手段消除该NTAA，暴露出新的NTAA。在包含修饰的末端氨基酸的工作流程中，第一步包括用官能化试剂标记或修饰N端氨基酸(NTAA)，以在后续步骤中能够去除该NTAA；所述官能化试剂产生含有官能化部分(例如，修饰或标记)的NTAA残基。第二步包括使多肽与附着于DNA代码标签的结合剂接触。在一些实施方式中，NTAA的标记或修饰可以在多肽与结合剂接触之前或之后进行。在结合剂与多肽的NTAA结合后，代码标签的信息被传递到记录标签上(例如，通过引物延伸或连接)，生成延伸记录标签。最后，通过化学或生物(例如，酶)手段消除该官能化的NTAA，暴露出新的NTAA。

使用所提供的大分子自动化处理，所描述的循环可以重复“n”次以生成最终的延伸记录标签。在一些实施方式中，基于降解的肽多肽序列测定过程中的步骤次序可以颠倒或来回移动。在一些实施方式中，末端氨基酸官能化可以在多肽与载体结合后进行。在一些方面，分析测定可包括一个或多个附加步骤，例如洗涤步骤和/或用其它试剂处理。在一些实施方式中，可以进行所提供的方法使得C端氨基酸被修饰、标记、接触结合剂和/或从多肽上消除。

在一些实施方式中，所述自动化方法包括：a)向所述设备提供非平面样本容器，所述容器包含含有大分子例如多肽的样本、以及与固体载体接合的相关记录标签；b)向所述设备的单独的试剂贮器提供结合剂和用于传递信息的试剂，其中所述试剂贮器中的至少一个包含结合剂并且所述试剂贮器中的至少一个包含用于传递信息的试剂；c)将结合剂从试剂贮器递送到样本容器，其中所述结合剂包含带有关于所述结合剂的标识信息的代码标签；和d)将用于传递信息的试剂从试剂贮器递送到样本容器，以将信息从结合剂的代码标签传递到记录标签，从而生成延伸记录标签。在一些实施方式中，所述自动化方法还包括在步骤a)中将用于去除多肽末端氨基酸的试剂提供到所述设备的单独的试剂贮器中，以及步骤e)将所述用于去除多肽末端氨基酸的试剂从试剂贮器递送到样本容器以去除末端氨基酸。在一些方面，所述自动化方法还包括在步骤a)中将用于加帽反应的试剂提供到所述设备的单独的试剂贮器中，以及步骤f)将所述用于加帽反应的试剂从试剂贮器递送到样本容器。在一些实施方式中，所述自动化方法还包括在步骤a)中将用于修饰多肽末端氨基酸的试剂提供到所述设备的试剂贮器中，以及将所述用于修饰多肽末端氨基酸的试剂递送到样本容器。

在一些实施方式中，样本的大分子与记录标签缔合。在一些情况下，样本的大分子直接或间接地与固体载体接合。例如，固体载体可以包括三维材料(例如，凝胶基质或珠子)。在一些示例中，给样本容器提供样本的与记录标签缔合的固定化大分子。在一些实施方式中，将试剂递送到样本容器的步骤中的次序可以颠倒或来回移动。在一个示例中，步骤c)、d)和e)依次进行。在一些情况下，步骤f)在步骤b)、c)、d)和e)之后进行。在一些实施方式中，所述自动化方法还包括在进行步骤f)之前重复步骤c)至e)两次或更多次。

在一些实施方式中，所述自动化方法还包括将用于修饰(例如，官能化)多肽末端氨基酸的试剂提供到所述设备的试剂贮器中，以及将所述用于修饰多肽末端氨基酸的试剂递送到样本容器。在一些实施方式中，用于修饰多肽末端氨基酸的试剂包括化学试剂或酶试剂。在一些方面，所述用于修饰多肽末端氨基酸的试剂在步骤c)之前、步骤d)之前、步骤e)之前和/或步骤f)之前递送到样本容器。在一些情况下，所述用于修饰多肽末端氨基酸的试剂在步骤b)之后和步骤c)之前递送到样本容器。在一些情况下，所述用于修饰多肽末端氨基酸的试剂向样本容器的递送重复两次或更多次，每次都在用于去除多肽末端氨基酸的试剂从试剂贮器递送到样本容器以去除末端氨基酸之前。

在一些实施方式中，所述方法还包括在样本容器中进行加帽反应之后收集样本或其一部分。在一些实施方式中，样本或其一部分以自动化方式收集并且所述收集由控制单元控制。例如，在产生最终的延伸记录标签后，将样本用切割试剂处理以使记录标签从样本中的多肽中释放，并收集记录标签。

A.样本

在一些方面，本公开涉及自动化处理样本中的大分子以供分析。大分子可以是由较小亚基构成的大分子。在某些实施方式中，大分子是蛋白质、蛋白质复合体、多肽、肽、核酸分子、碳水化合物、脂质、大环或嵌合大分子。根据本文公开的方法分析的大分子(例如，蛋白质、多肽、肽)可从合适的来源或样本获得。在一些实施方式中，大分子(例如，蛋白质、多肽或肽)是从作为生物样本的样本中获得的。在一些实施方式中，样本包括但不限于哺乳动物或人类细胞、酵母细胞和/或细菌细胞。在一些实施方式中，样本含有来自从多细胞生物体获得的样本中的细胞。例如，样本可以从个体中分离。在一些实施方式中，样本可包含单一细胞类型或多种细胞类型。在一些实施方式中，样本可从哺乳动物生物体或人类获得，例如通过穿刺或其它收集或取样程序获得。在一些实施方式中，样本包含两种或更多种细胞。

在一些实施方式中，生物样本可含有全细胞和/或活细胞和/或细胞碎片。在一些示例中，合适的来源或样本，可包括但不限于：生物样本，例如活检样本、细胞培养物、细胞(原代细胞和培养的细胞系)、包含细胞器或囊泡、组织和组织提取物的样本；几乎任何生物体的。例如，合适的来源或样本，可包括但不限于：活检；粪便物；体液(例如血液、全血、血清、血浆、尿液、淋巴液、胆汁、房水、母乳、耵聍(耳垢)、乳糜、食糜、内淋巴、外淋巴、渗出液、脑脊液、间质液、房水或玻璃体液、初乳、痰液、羊水、唾液、肛门和阴道分泌物、胃酸、胃液、淋巴液、粘液(包括鼻引流物和痰液)、心包液、腹膜液、胸膜液、脓液、稀粘液、唾液、皮脂(皮肤油)、痰、滑液、汗液和精液、漏出液、呕吐物及其一种或多种的混合物、渗出液(例如，从脓肿或任何其它感染或炎症部位获得的流体)或从几乎任何生物体的关节(正常关节或受疾病例如类风湿性关节炎、骨关节炎、痛风或化脓性关节炎影响的关节)获得的流体，其中哺乳动物来源的样本，包括含有微生物组的样本是优选的，人类来源的样本、包括含有微生物组的样本是特别优选的；环境样本(例如空气、农业、水和土壤样本)；微生物样本，包括来源于微生物的生物膜和/或群落的样本，以及微生物孢子；组织样本，包括组织切片，研究样本，包括细胞外液、细胞培养物的细胞外上清液、细菌中的包涵体、包括线粒体和细胞周质在内的细胞组分。在一些实施方式中，生物样本包含体液或来源于体液，其中体液从哺乳动物或人类获得。在一些实施方式中，样本包括体液，或来自体液的细胞培养物。

在一些实施方式中，所述方法包括从单一细胞类型或多种细胞类型中获得和制备大分子(例如，多肽和蛋白质)。在一些实施方式中，样本包含细胞群。在一些实施方式中，大分子(例如，蛋白质、多肽或肽)来自细胞或亚细胞组分、细胞外囊泡、细胞器或其有组织的亚组分。在一些实施方式中，多肽来自一种或多种分子包装(例如，单个细胞的不同组分或从细胞群分离的不同组分，例如细胞器或囊泡)。大分子(例如蛋白质、多肽或肽)可来自细胞器，例如线粒体、细胞核或细胞囊泡。在一个实施方式中，可分离一种或多种特定类型的单细胞或其亚型。在一些实施方式中，样本可包括但不限于细胞器(例如，细胞核、高尔基体、核糖体、线粒体、内质网、叶绿体、细胞膜、囊泡等)。

在某些实施方式中，大分子是蛋白质、蛋白质复合体、多肽或肽。肽、多肽或蛋白质的氨基酸序列信息和翻译后修饰被转导到核酸编码文库中，可以通过下一代测序方法对所述文库进行分析。肽可包含L-氨基酸、D-氨基酸或两者。肽、多肽、蛋白质或蛋白质复合体可包含标准的、天然存在的氨基酸、修饰的氨基酸(例如，翻译后修饰)、氨基酸类似物、氨基酸模拟物或其任何组合。在一些实施方式中，肽、多肽或蛋白质是天然存在的、合成产生的或重组表达的。在任何前述的肽实施方式中，肽、多肽、蛋白质或蛋白质复合体可进一步包含翻译后修饰。标准的天然存在氨基酸包括丙氨酸(A或Ala)、半胱氨酸(C或Cys)、天冬氨酸(D或Asp)、谷氨酸(E或Glu)、苯丙氨酸(F或Phe)、甘氨酸(G或Gly)、组氨酸(H或His)、异亮氨酸(I或Ile)、赖氨酸(K或Lys)、亮氨酸(L或Leu)、甲硫氨酸(M或Met)、天冬酰胺(N或Asn)、脯氨酸(P或Pro)、谷氨酰胺(Q或Gln)、精氨酸(R或Arg)、丝氨酸(S或Ser)、苏氨酸(T或Thr)、缬氨酸(V或Val)、色氨酸(W或Trp)、和酪氨酸(Y或Tyr)。非标准氨基酸包括硒半胱氨酸、吡咯赖氨酸和N-甲酰甲硫氨酸、β-氨基酸、高氨基酸、脯氨酸和丙酮酸衍生物、3-取代丙氨酸衍生物、甘氨酸衍生物、环-取代的苯丙氨酸和酪氨酸衍生物、线性核心氨基酸、N-甲基氨基酸。

肽、多肽或蛋白质的翻译后修饰(PTM)可以是共价修饰或酶促修饰。翻译后修饰的例子包括但不限于酰化、乙酰化、烷基化(包括甲基化)、生物素化、丁酰化、氨甲酰化、羰基化、脱酰胺化、脱亚胺化、白喉酰胺形成、二硫桥键形成、消去化、黄素连接、甲酰化、γ-羧基化、谷氨酰化、甘氨酰化、糖基化(例如，N-连接，O-连接的糖基化、C-连接的糖基化、磷酸糖基化)、糖基磷脂酰肌醇化、血红素C连接、羟基化、羟腐氨酸形成、碘化、异戊二烯化、脂化、脂酰化、丙二酰化、甲基化、肉豆蔻酰化、氧化、棕榈酰化、PEG化、磷酸泛酰巯基乙胺化、磷酸化、异戊二烯化、丙酰化、亚视黄亚基席夫碱形成、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、硒化、琥珀酰化、亚磺化、泛素化和C端酰胺化。翻译后修饰包括肽、多肽或蛋白质的氨基端和/或羧基端的修饰。末端氨基的修饰包括但不限于脱氨基、N-低级烷基、N-二低级烷基和N-酰基修饰。末端羧基的修饰包括但不限于酰胺、低级烷基酰胺、二烷基酰胺和低级烷基酯修饰(例如，其中低级烷基是C₁-C₄烷基)。翻译后修饰还包括落在肽、多肽或蛋白质的氨基和羧基端之间的氨基酸的修饰，例如但不限于上述那些。翻译后修饰可以调节蛋白质在细胞内的“生物学”，例如其活性、结构、稳定性或定位。例如，磷酸化在蛋白质的调节中、特别是在细胞信号传导中起重要作用(Prabakaran等人，2012，Wiley Interdiscip Rev SystBiol Med 4:565-583)。在另一个示例中，向蛋白质添加糖，例如糖基化，已被证明促进蛋白质折叠、改善稳定性、并改变调节功能，脂质与蛋白质相连能够靶向细胞膜。翻译后修饰也可以包括肽、多肽或蛋白质修饰以包括一种或多种可检测标记。

在某些实施方式中，肽、多肽或蛋白质可以是片段化的。可以在将样本加载到设备上之前进行片段化。在一些情况下，可使用所述设备以自动化方式执行片段化。例如，片段化的肽可以通过将来自样本、例如生物样本的蛋白质片段化而获得。肽、多肽或蛋白质可以通过本领域已知的任何手段进行片段化，包括通过蛋白酶或内肽酶进行片段化。在一些实施方式中，通过使用特异性蛋白酶或内肽酶来靶向肽、多肽或蛋白质的片段化。特异性蛋白酶或内肽酶结合并在特定共有序列处切割(例如，TEV蛋白酶)。在其它实施方式中，通过使用非特异性蛋白酶或内肽酶，肽、多肽或蛋白质的片段化是非靶向的或随机的。非特异性蛋白酶可在特定的氨基酸残基而不是共有序列处结合和切割(例如，蛋白酶K是非特异性丝氨酸蛋白酶)。在一些实施方式中，蛋白酶和内肽酶，例如本领域已知的那些，可以用于将蛋白质或多肽切割成较小的肽片段，所述酶包括蛋白酶K、胰蛋白酶、胰凝乳蛋白酶、胃蛋白酶、嗜热菌蛋白酶、凝血酶、因子Xa、弗林蛋白酶、内肽酶、木瓜蛋白酶、胃蛋白酶、枯草杆菌蛋白酶、弹性蛋白酶、肠激酶、Genenase^TMI、内切蛋白酶LysC、内切蛋白酶AspN、内切蛋白酶GluC等(Granvogl等人，2007，Anal Bioanal Chem 389:991-1002)。在某些实施方式中，肽、多肽或蛋白质被蛋白酶K或任选的不耐热型式的蛋白酶K片段化，以实现快速失活。在一些情况下，蛋白酶K变性试剂例如尿素和SDS中稳定，能够消化完全变性的蛋白质。蛋白质和多肽片段化成为肽可以在附连DNA标签或DNA记录标签之前或之后进行。

化学试剂也可以用于将蛋白质消化成肽片段。化学试剂可在特定的氨基酸残基处切割(例如，溴化氰水解蛋氨酸残基C端的肽键)。用于将多肽或蛋白质片段化成较小的肽的化学试剂包括溴化氰(CNBr)、羟胺、肼、甲酸、BNPS-粪臭素[[2-(2-硝基苯基亚硫基)-3-甲基吲哚]、碘代苯甲酸、·NTCB+Ni(2-硝基-5-硫氰基苯甲酸)等。

在某些实施方式中，在酶促或化学切割之后，所生成的肽片段具有大致相同的期望长度，例如，约10个氨基酸至约70个氨基酸、约10个氨基酸至约60个氨基酸、约10个氨基酸至约50个氨基酸、约10至约40个氨基酸、约10至约30个氨基酸、约20个氨基酸至约70个氨基酸、约20个氨基酸至约60个氨基酸、约20个氨基酸至约50个氨基酸、约20至约40个氨基酸、约20至约30个氨基酸、约30个氨基酸至约70个氨基酸、约30个氨基酸至约60个氨基酸、约30个氨基酸至约50个氨基酸、或约30个氨基酸至约40个氨基酸。可通过向蛋白质或多肽样本掺入包含含有蛋白酶或内肽酶切割位点的肽序列的短测试FRET(荧光共振能量传递)肽来监测、优选实时监测切割反应。在完好的FRET肽中，荧光基团和猝灭基团附着在所述含有切割位点的肽序列的任一端，并且猝灭剂和荧光团之间的荧光共振能量传递导致低荧光。在蛋白酶或内肽酶切割测试肽后，猝灭剂和荧光团分离，使荧光大大增加。当达到一定的荧光强度时可以停止切割反应，从而实现可重现的切割终点。

大分子样本(例如，肽、多肽或蛋白质)可以经历蛋白质分级分离方法，其中通过一种或多种性质例如细胞位置、分子量、疏水性、等电点或蛋白质富集方法来分离蛋白质或肽。在一些实施方式中，对样本内的大分子子集(例如蛋白质)进行分级分离，使得从样本的其余部分中分选出大分子子集。例如，样本可以在附着到固体载体之前经历分级分离方法。或者，或另外，可使用蛋白质富集方法来选择特定的蛋白质或肽(例如，参见Whiteaker等人，2007，Anal.Biochem.362:44-54，通过引用整体并入)或选择特定的翻译后修饰(例如，参见Huang等人，2014.J.Chromatogr.A 1372:1-17，通过引用整体并入)。或者，特定类别的蛋白质例如免疫球蛋白、或免疫球蛋白(Ig)同种型例如IgG可以被亲和富集或选择用于分析。在免疫球蛋白分子的情况下，对参与亲和结合的高变序列的序列和丰度或频度的分析是特别令人感兴趣的，特别是因为它们响应疾病进展而变化或与健康、免疫和/或疾病表型相关。也可以使用标准免疫亲和方法从样本中去除过度丰富的蛋白质。对于超过80％的蛋白质成分是白蛋白和免疫球蛋白的血浆样本，去除丰富的蛋白质可能是有用的。有几种商业产品可用于去除血浆样本的过度丰富的蛋白质，包括去除前2-20种血浆蛋白的去除离心柱(Pierce，Agilent)，或PROTIA和PROT20(Sigma-Aldrich)。

在某些实施方式中，可以通过使用标准分级分离方法、包括电泳和液相色谱对蛋白质样本进行分级分离(Zhou等人，2012，Anal Chem 84(2):720-734)、或将级分分隔到装有有限容量蛋白质结合珠/树脂(例如羟基化二氧化硅粒子)的区室(例如液滴)中(McCormick，1989，Anal Biochem 181(1):66-74)并洗脱结合的蛋白质，来调制蛋白质样本的动态范围。每个被区室化的级分中的过量蛋白质被洗掉。电泳方法的例子包括毛细管电泳(CE)、毛细管等电聚焦(CIEF)、毛细管等速电泳(CITP)、自由流动电泳、凝胶洗脱液体级分截留电泳(GELFrEE)。液相色谱蛋白质分离方法的例子包括反相(RP)、离子交换(IE)、尺寸排阻(SE)、亲水相互作用等。区室分区的例子包括乳液、液滴、微孔、平面基体上的物理分离区域等。示例性的蛋白质结合珠/树脂包括用酚基或羟基衍生化的二氧化硅纳米粒子(例如，来自Agilent Technologies的StrataClean树脂、来自LabTech的RapidClean等)。通过限制珠/树脂的结合容量，在给定级分中洗脱的高度丰富的蛋白质将仅部分结合到珠子上，多余的蛋白质被去除。

在一些实施方式中，使用分区条形码，包括将唯一条形码分配给来自样本内的大分子群体二次取样的大分子。该分区条形码可包含通过分隔标有相同条形码的区室(例如带有条形码的珠群，其中多个珠子共用相同的条形码)内的大分子而产生的相同条形码。物理区室的使用有效地对原始样本进行二次取样，以提供分区条形码的分配。例如，提供一组标有10,000个不同区室条形码的珠子。此外，假设在给定的测定中，共100万个珠子用于该测定。平均而言，每个区室条形码有100个珠子(泊松分布)。进一步假设所述珠子捕获了总共1000万个大分子。平均而言，每个珠子有10个大分子，每个区室条形码有100个区室，每个分区条形码有效地有1000个大分子(包含100个不同物理区室的100个区室条形码)。

在另一个实施方式中，对多肽的单分子进行分区和加分区条形码是通过在N或C端或两端用可扩增的DNA UMI标签(例如，记录标签)(化学或酶法)标记多肽来实现的。DNADNA标签通过对反应性氨基酸如赖氨酸的非特异性光标记或特异性化学附着而附着在多肽的主体(内部氨基酸)上。来自附着于肽末端的记录标签的信息通过酶乳液PCR或乳液体外转录/逆转录(IVT/RT)步骤传递到DNA标签(Williams等人，Nat Methods，(2006)3(7):545-550；Schutze等人，Anal Biochem.(2011)410(1):155-157)。在优选的实施方式中，使用纳米乳液，使得平均而言，每个尺寸为50nm-1000nm的乳液微滴有少于单个多肽(Nishikawa等人，J Nucleic Acids.(2012)2012:923214；Gupta等人，Soft Matter.(2016)12(11):2826-41；Sole等人，Langmuir(2006，22(20):8326-8332)。此外，PCR的所有组分都包含在包括引物、dNTP、Mg2+、聚合酶和PCR缓冲液的水性乳液混合物。如果使用IVT/RT，则设计记录标签具有T7/SP6 RNA聚合酶启动子序列，以产生与附着于多肽主体上的DNA标签杂交的转录本(Ryckelynck等人，RNA.(2015)21(3):458-469)。逆转录酶(RT)将信息从所述杂交的RNA分子复制到所述DNA标签上。以这种方式，乳液PCR或IVT/RT可以用于有效地将信息从末端记录标签传递到附着于多肽主体上的多个DNA标签上。

在一些实施方式中，可以处理大分子样本(例如，肽、多肽或蛋白质)进入物理面积或体积，例如，进入区室。在将样本装载到第I部分所述的设备上之前，可对样本进行各种处理和/或标记步骤。在一些实施方式中，区室从大分子样本中隔离或分离出大分子的子集。在一些示例中，区室可以是水性区室(例如，微流体液滴)、固体区室(例如，板、管、小瓶、珠上的皮克量滴定孔或微量滴定孔)，或表面上的分离区域。在一些情况下，区室可包括一个或多个可固定大分子的珠子。在一些实施方式中，区室中的大分子用区室标签包括条形码进行标记。例如，一个区室中的大分子可以用相同的条形码标记，或多个区室中的大分子可以用相同的条形码标记。例如，参见Valihrach等人，Int J Mol Sci.2018 Mar 11；19(3).pii:E807。通过在珠子中的凝胶化来封装细胞内容物是对单细胞分析的有用方法(Tamminen等人，Front Microbiol(2015)6:195；Spencer等人，ISME J(2016)10(2):427-436)。单细胞液滴标条形码使来自单个细胞中的所有组分都能够用相同的标识符进行标记(Klein等人，Cell(2015)161(5):1187-1201；Zilionis等人，Nat Protoc(2017)12(1):44-73；国际专利公布No.WO 2016/130704)。区室标条形码可以通过多种方式完成，包括通过液滴接合将唯一条形码直接并入每个液滴中(Bio-Rad Laboratories)、通过将带条形码的珠子引入液滴中(10X Genomics)、或通过如Gunderson等人所述使用并标记split-pool组合条形码对液滴封装和凝胶化后的组分标组合条形码(国际专利公布No.WO 2016/130704，通过引用整体并入)。类似的组合标记方案也可以应用于细胞核(Vitak等人，Nat Methods(2017)14(3):302-308)。

上述液滴标条形码方法已用于DNA分析，但未用于蛋白质分析。调整上述液滴条形码平台以处理蛋白质需要几个创新步骤。首先是条形码主要包含DNA序列，而该DNA序列信息需要被赋予蛋白质分析物。在DNA分析物的情况下，将DNA信息传递到DNA分析物上相对简单。相比之下，将DNA信息传递到蛋白质上更具挑战性，特别是当蛋白质变性并消化成肽用于下游分析时。这需要每个肽都用区室条形码标记。挑战在于，一旦细胞被包封在液滴中，就很难使蛋白质变性、蛋白酶消化所生成的多肽并同时用DNA条形码标记所述肽。与细胞在液滴中不同，将细胞包封在聚合物形成液滴中并将液滴聚合(凝胶化)成可以带进水性缓冲液中的多孔珠，提供了进行多个不同反应步骤的介质(Tamminen等人，Front Microbiol(2015)6:195；Spencer等人，ISME J(2016)10(2):427-436；国际专利公布No.WO 2016/130704)。优选地，包封的蛋白质与凝胶基质交联，以防止它们后续从凝胶珠中扩散。这种凝胶珠形式允许凝胶内截留的蛋白质被化学或酶法变性、用DNA标签标记、蛋白酶消化、并进行许多其它干预。在一些实施方式中，可以进行凝胶基质中单个细胞包封和裂解。

在一些实施方式中，在进行多肽分析测定之前，将大分子(例如，多肽)接合到载体上。在一些情况下，希望使用具有大承载能力的载体来固定化大量的大分子。在一些实施方式中，优选使用三维载体(例如，多孔基质或珠子)来固定化样本中的大分子。例如，包括将大分子接合到载体上的样本中大分子制备可在将样本装载到所述设备上之前进行。在一些示例中，例如，包括将大分子与记录标签接合的样本中大分子制备可在将样本装载到所述设备上之前或之后进行。在一些特定情况下，可以将制备好的样本(肽-DNA缀合物)加装载到所述设备上进行测定。一旦装载，就进一步使用肽-DNA缀合物样本的DNA标签将样本肽固定化在样本容器中的载体上。在一些实施方式中，在多肽分析测定之前，将多个蛋白质连接到载体上。在一些实施方式中，样本制备步骤，例如将记录标签附着于样本的大分子，可以使用所述设备进行或以自动化方式进行。

载体可以是任何固体或多孔载体，包括但不限于珠子、微珠、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、PTFE膜、尼龙、微量滴定孔、ELISA板、旋转干涉转盘、硝化纤维素膜、基于硝化纤维素的聚合物表面、纳米粒子或微球。固体载体的材料包括但不限于丙烯酰胺、琼脂糖、纤维素、葡聚糖、硝化纤维素、玻璃、金、石英、聚苯乙烯、聚乙烯乙酸乙烯酯、聚丙烯、聚酯、聚甲基丙烯酸酯、聚丙烯酸酯、聚乙烯、聚环氧乙烷、聚硅酸盐、聚碳酸酯、聚乙烯醇(PVA)、特氟隆、氟碳化合物、尼龙、硅橡胶、二氧化硅、聚酐、聚乙醇酸、聚氯乙烯、聚乳酸、聚原酸酯、官能化硅烷、聚富马酸丙酯、胶原蛋白、糖胺聚糖、聚氨基酸或其任何组合。在某些实施方式中，固体载体是珠子，例如聚苯乙烯珠、聚合物珠、聚丙烯酸酯珠、琼脂糖珠、纤维素珠、葡聚糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁珠、玻璃珠、基于二氧化硅的珠或可控孔度珠，或其任何组合。在一些具体实施方式中，固体载体是多孔琼脂糖珠。在一些具体实施方式中，固体载体不是二维载体。

在一些实施方式中，所述载体可包含任何合适的固体材料，包括多孔和无孔材料，大分子例如多肽可以通过本领域已知的任何手段、包括共价和非共价相互作用或其任何组合直接或间接地与其缔合。在一些情况下，合适的固体载体可与第I.B部分中描述的样本容器相容。固体载体可以是二维的(例如，平面表面)或三维的(例如，凝胶基质或珠子)。固体载体可以是任何载体表面，包括但不限于珠子、微珠、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、PTFE膜、PTFE膜、硝化纤维素膜、基于硝化纤维素的聚合物表面、尼龙、微量滴定孔、ELISA板、旋转干涉转盘、聚合物基质、纳米粒子或微球。固体载体的材料包括但不限于丙烯酰胺、琼脂糖、纤维素、葡聚糖、硝化纤维素、玻璃、金、石英、聚苯乙烯、聚乙烯乙酸乙烯酯、聚丙烯、聚酯、聚甲基丙烯酸酯、聚丙烯酸酯、聚乙烯、聚环氧乙烷、聚硅酸盐、聚碳酸酯、聚乙烯醇(PVA)、特氟隆、氟碳化合物、尼龙、硅橡胶、聚酐、聚乙醇酸、聚氯乙烯、聚乳酸、聚原酸酯、官能化硅烷、聚富马酸丙酯、胶原蛋白、糖胺聚糖、聚氨基酸、葡聚糖或其任何组合。固体载体还包括薄膜、膜、瓶子、碟、纤维、编织纤维、成型聚合物如管子、粒子、珠子、微球、微粒或其任何组合。例如，当固体表面是珠子时，珠子可以包括但不限于陶瓷珠、聚苯乙烯珠、聚合物珠、聚丙烯酸酯珠、甲基苯乙烯珠、琼脂糖珠、纤维素珠、葡聚糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁珠、玻璃珠或可控孔度珠、基于二氧化硅发珠、或其任何组合。珠子可以是球形或不规则形状的。珠子或载体可以是多孔的。珠子的尺寸范围可从纳米例如100nm到毫米例如1mm。在某些实施方式中，珠子尺寸范围从约0.2微米至约200微米，或从约0.5微米至约5微米。在一些实施方式中，珠子的直径可以为约1、1.5、2、2.5、2.8、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、15或20μm。在某些实施方式中，“珠子”固体载体可指单个珠子或多个珠子。在一些实施方式中，所述固体表面是纳米粒子。在某些实施方式中，纳米粒子的尺寸范围从直径约1nm至约500nm，例如，直径在约1nm和约20nm之间、约1nm和约50nm之间、约1nm和约100nm之间、约10nm和约50nm之间、约10nm和约100nm之间、约10nm和约200nm之间、约50nm和约100nm之间、约50nm和约150之间、约50nm和约200nm之间、约100nm和约200nm之间、或约200nm和约500之间。在一些实施方式中，纳米粒子的直径可以为约10nm、约50nm、约100nm、约150nm、约200nm、约300nm或约500nm。在一些实施方式中，纳米粒子的直径小于约200nm。

可使用各种反应将多肽附着在载体(例如，固体或多孔载体)上。多肽可以直接或间接附着到载体上。在一些情况下，多肽通过核酸附着到载体上。示例性的反应包括叠氮化物和炔烃形成三唑的铜催化反应(Huisgen 1,3-偶极环加成)、应变促进的叠氮化物炔烃环加成(SPAAC)、二烯和亲双烯体的反应(Diels-Alder)、应变促进的炔烃-硝酮环加成、应变烯烃与叠氮化物、四嗪或四唑的反应、烯烃和叠氮化物[3+2]环加成、烯烃和四嗪逆电子需求(inverse electron demand)Diels-Alder(IEDDA)反应(例如，间四嗪(mTet)或苯基四嗪(pTet)和反式环辛烯(TCO)；或pTet和烯烃)、烯烃和四唑的光致反应、叠氮化物和膦的Staudinger连接、以及各种置换反应，例如通过亲核攻击置换亲电原子上的离去基团(Horisawa 2014，Knall，Hollauf等人2014)。示例性的置换反应包括胺与以下物质的反应：活化酯；N-羟基琥珀酰亚胺酯；异氰酸酯；异硫氰酸酯、醛、环氧化物等。在一些实施方式中，IEDDA点击化学用于将多肽固定化到固体载体上，因为它快速且在低输入浓度下提供高收率。在另一个实施方式中，IEDDA点击化学反应中使用间四嗪而不是四嗪，因为间四嗪具有改善的键稳定性。在另一个实施方式中，在iEDDA点击化学反应中使用苯基四嗪(pTet)。在一种情况下，用双官能的点击化学试剂、例如炔烃-NHS酯(乙炔-PEG-NHS酯)试剂或炔烃-二苯甲酮标记多肽，生成炔烃标记的多肽。在一些实施方式中，炔烃也可以是应变炔烃，如环辛炔，包括二苯并环辛基(DBCO)等。

在多个蛋白质固定化在同一固体载体上的某些实施方式中，蛋白质可以适当间隔开以适应用于评估蛋白质的分析方法。例如，最佳地间隔开蛋白质对于使用于评估和测序蛋白质的基于核酸的方法进行可能是有利的。在一些实施方式中，用于评估和测序蛋白质的方法涉及与蛋白质结合的结合剂，并且所述结合剂包含带有信息的代码标签，该信息被传递到附着于蛋白质的核酸(例如，记录标签)上。在一些情况下，从与一个蛋白质结合的结合剂的代码标签起的信息传递可到达相邻的蛋白质。

在一些实施方式中，固体载体的表面被钝化(封闭)。“钝化的”表面是指已经用外材料层处理过的表面。表面钝化方法包括出自荧光单分子分析文献的标准方法，包括用聚合物如聚乙二醇(PEG)(Pan等人，2015，Phys.Biol.12:045006)、聚硅氧烷(例如，PluronicF-127)、星形聚合物(例如，星形PEG)(Groll等人，2010，Methods Enzymol.472:1-18)、疏水二氯二甲基硅烷(DDS)+自组装Tween-20(Hua等人，2014，Nat.Methods 11:1233-1236)、类金刚石碳(DLC)、DLC+PEG(Stavis等人，2011，Proc.Natl.Acad.Sci.USA 108:983-988)、和两性离子部分(例如，U.S.专利申请公布US 2006/0183863)来钝化表面。除共价表面改性外，也可以使用许多钝化剂，包括表面活性剂如Tween-20、溶液中的聚硅氧烷(Pluronic系列)、聚乙烯醇(PVA)以及蛋白质如BSA和酪蛋白。或者，当将蛋白质、多肽或肽固定化到固体基体上时，可以通过掺入竞争剂或“假”反应分子，来滴定固体基体的表面上或体积内大分子(例如，蛋白质、多肽或肽)的密度。

为了控制固体载体上的蛋白质间距，可以滴定基体表面上用于附着蛋白质的偶联官能团(例如，TCO或羧基基团(COOH))的密度。在一些实施方式中，多个蛋白质在固体载体的表面上或体积内(例如多孔载体)间隔开，使得相邻蛋白质间隔的距离为约50nm至约500nm、或约50nm至约400nm、或约50nm至约300nm、或约50nm至约200nm、或约50nm至约100nm。在一些实施方式中，多个蛋白质在固体载体表面上间隔的平均距离为至少50nm，atleast 60nm、至少70nm、至少80nm、至少90nm、至少100nm、至少150nm、至少200nm、至少250nm、至少300nm、至少350nm、至少400nm、至少450nm、或至少500nm。在一些实施方式中，多个蛋白质在固体载体表面上间隔的平均距离为至少50nm。在一些实施方式中，蛋白质在固体载体的表面上或体积内间隔开，使得根据经验，分子间事件比分子内事件(例如信息传递)的相对频率<1:10；<1:100；<1:1,000；或<1:10,000。

在一些实施方式中，多个蛋白质偶联在固体载体上，两个相邻蛋白质之间间隔的平均距离范围为约50至100nm、约50至250nm、约50至500nm、约50至750nm、约50至1,000nm、约50至1,500nm、约50至2,000nm、约100至250nm、约100至500nm、约200至500nm、约300至500nm、约100至1000nm、约500至600nm、约500至700nm、约500至800nm、约500至900nm、约500至1,000nm、约500至2,000nm、约500至5,000nm、约1,000至5,000nm、或约3,000至5,000nm。

在一些实施方式中，固体载体上多肽的适当间距是通过滴定基体表面上可用的附着分子的比率来实现的。在一些示例中，基体表面(例如，珠子表面)用羧基基团(COOH)官能化，然后用活化剂(例如，活化剂是EDC和Sulfo-NHS)处理。在一些示例中，基体表面(例如，珠子表面)包含NHS部分。在一些实施方式中，向活化的珠子添加mPEG_n-NH₂和NH₂-PEG_n-mTet的混合物(其中n是任何数字，例如1-100)。滴定mPEG₃-NH₂(不可用于偶联)和NH₂-PEG₂₄-mTet(可用于偶联)之间的比率以产生适当密度的可用于将多肽附着在基体表面上的官能部分。在某些实施方式中，固体表面上偶联部分(例如，NH₂-PEG₄-mTet)之间的平均间距为至少50nm、至少100nm、至少250nm、或至少500nm。在一些具体实施方式中，the ratio of NH₂-PEG_n-mTet与mPEG₃-NH₂的比率为约或大于1:1000、约或大于1:10,000，约或大于1:100,000、或约或大于1:1,000,000。在一些进一步的实施方式中，将记录标签附着于NH₂-PEG_n-mTet上。在一些实施方式中，通过控制固体载体上可用的COOH或其它官能团的浓度和/或数量来实现固体载体上多肽的间距。

B.记录标签

如本文所述，大分子(例如，蛋白质或多肽)可用DNA记录标签标记。在一些实施方式中，样本配有多个记录标签。在一些方面，样本中的多个大分子配有记录标签。记录标签可以使用任何合适的手段直接或间接地与大分子缔合或附着。在一些实施方式中，大分子可与一个或多个记录标签缔合。在一些方面，记录标签可以是可以向其传递标识信息(例如，来自一个或多个代码标签的信息)的任何合适的可测序部分。

在一些实施方式中，至少一个记录标签与大分子(例如，多肽)直接或间接缔合或共定位。在一个特定实施方式中，单个记录标签例如通过附着于N或C端氨基酸而附着于多肽。在另一个实施方式中，多个记录标签附着于多肽上，例如附着于赖氨酸残基或肽主链上。在一些实施方式中，用多个记录标签标记的多肽被片段化或消化成较小的肽，每个肽平均标记有一个记录标签。

记录标签可包含DNA、RNA或多核苷酸类似物，包括PNA、gPNA、GNA、HNA、BNA、XNA、TNA或其组合。记录标签可以是单链的，或部分或完全双链的。记录标签可具有平端或突出端。在某些实施方式中，样本内的所有或可观量的大分子(例如，至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)用记录标签标记。在其它实施方式中，样本内大分子的子集用记录标签标记。在一个特定实施方式中，样本中大分子的子集用记录标签进行靶向(分析物特异性)标记。例如，可使用靶蛋白特异性结合剂(例如抗体、适配体等)实现对蛋白质的靶向记录标签标记。在一些实施方式中，将样本提供到固体载体上之前，将记录标签附着在大分子上。在一些实施方式中，将样本提供到固体载体上之后，将记录标签附着在大分子上。

在一些实施方式中，记录标签可包含其它核酸组分。在一些实施方式中，记录标签可包含唯一分子标识符、区室标签、分区条形码、样本条形码、级分条形码、间隔区序列、通用引发位点或其任何组合。在一些实施方式中，记录标签还可以包含其它信息，包括来自大分子分析测定的信息，例如结合剂标识符(例如，来自代码标签)、循环标识符(例如，来自代码标签)等。在一些实施方式中，记录标签可包含封闭基团，例如在记录标签的3’端处。在一些情况下，封闭记录标签的3’端以防止聚合酶延伸所述记录标签。

在一些实施方式中，记录标签可以包括样本标识条形码。样本条形码可用于对单个反应容器中或固定化在单个固体基体或固体基体集合(例如，平面载玻片，单个管或容器中所含的珠群等)上的一组样本进行多重分析。例如，来自许多不同样本的大分子可以用带有样本特异性条形码的记录标签进行标记，然后将所有样本汇集在一起，然后固定化到固体载体上、循环结合结合剂并分析记录标签。或者，可以保持样本分开，直到创建DNA编码文库后，并在DNA编码文库的PCR扩增期间附着样本条形码，然后在测序前混合在一起。在分析不同丰度类别的分析物(例如蛋白质)时，这种方法可能有用。

在某些实施方式中，记录标签包含任选的唯一分子标识符(UMI)，它为与该UMI缔合的每个大分子(例如，多肽)提供唯一标识符标签。UMI可以为约3至约40个碱基、约3至约30个碱基、约3至约20个碱基、或约3至约10个碱基、或约3至约8个碱基。在一些实施方式中，UMI的长度为约3个碱基、4个碱基、5个碱基、6个碱基、7个碱基、8个碱基、9个碱基、10个碱基、11个碱基、12个碱基、13个碱基、14个碱基、15个碱基、16个碱基、17个碱基、18个碱基碱基、19个碱基、20个碱基、25个碱基、30个碱基、35个碱基、或40个碱基。UMI可以用于对来自多个延伸记录标签的测序数据进行去卷积，以标识来自单个大分子的序列读数。在一些实施方式中，在大分子的文库内，每个大分子都与单个记录标签缔合，每个记录标签包含唯一的UMI。在其它实施方式中，记录标签的多个副本与单个大分子缔合，每个记录标签副本包含相同的UMI。在一些实施方式中，UMI具有与结合剂的代码标签内的间隔区序列或编码区序列不同的碱基序列，以便于在序列分析期间区分这些组分。在一些实施方式中，UMI可提供作为位置标识符的功能，还可在大分子分析测定中提供信息。例如，UMI可用于标识传承上相同的分子，因此起源于相同的初始分子。在一些方面，该信息可用于校正扩增中变异，以及检测和校正测序错误。

在一些实施方式中，记录标签包含间隔区聚合物。在某些实施方式中，记录标签在其末端、例如3’端包含间隔区。如本文所用，在记录标签的上下文中提及的间隔区序列包括与关联结合剂相关的间隔区序列相同的间隔区序列，或与关联结合剂相关的间隔区序列互补的间隔区序列。记录标签上的末端、例如3’端间隔区允许在第一个结合循环期间将关联结合剂的标识信息从其代码标签传递到记录标签上(例如，通过互补间隔区序列的退火以进行引物延伸或粘性末端连接)。在一个实施方式中，间隔区序列的长度约1-20个碱基、长度约2-12个碱基、或长度5-10个碱基。间隔区的长度可取决于诸如用于将代码标签信息传递到记录标签的引物延伸反应的温度和反应条件之类的因素。

在一些实施方式中，与多肽文库相关的记录标签共有一个共同的间隔区序列。在其它实施方式中，与多肽文库相关的记录标签具有与关联结合剂的结合循环特异性间隔区序列互补的结合循环特异性间隔区序列。在一些方面，记录标签中的间隔区序列被设计为与记录标签中的其它区域具有最低的互补性；同样，代码标签中的间隔区序列应与代码标签中的其它区域具有最低的互补性。在一些情况下，记录标签和代码标签的间隔区序列应与存在于所述记录标签或代码标签中的组分例如唯一分子标识符、条形码(例如，区室、分区、样本、空间位置条形码)、通用引物序列、编码区序列、循环特异性序列等具有最低的序列互补性。

在某些实施方式中，记录标签包含通用引发位点，例如，正向或5’通用引发位点。通用引发位点是可用于引发文库扩增反应和/或测序的核酸序列。通用引发位点可包括但不限于，PCR扩增引发位点、退火到流动细胞表面上的互补寡核苷酸的流动细胞适配序列(例如Illumina下一代测序)、测序引发位点、或其组合。通用引发位点可以为约10个碱基至约60个碱基。在一些实施方式中，通用引发位点包含Illumina P5引物(5’-AATGATACGGCGACCACCGA-3’–SEQ ID NO:1)或Illumina P7引物(5’-CAAGCAGAAGACGGCATACGAGAT–3’-SEQ ID NO:2)。

在某些实施方式中，记录标签包含区室标签。在一些实施方式中，区室标签是记录标签内的组分。在一些实施方式中，记录标签还可以包括代表区室标签的条形码，其中区室例如固体载体上的液滴、微孔、物理区域等被分配唯一条形码。区室与特定条形码的联合可以通过多种方式实现，例如通过将单个条形码珠包封在区室中，例如，通过直接合并或向区室添加条形码液滴，通过直接打印或向区室注入条形码试剂等区室内的条形码试剂用于向区室内的大分子或其片段加上区室特异性条形码。应用于将蛋白质划分到区室中，所述条形码可以用于将分析的肽映射回到其在区室中的起源蛋白质分子。这可以极大地促进蛋白质标识。区室条形码也可以用于标识蛋白质复合体。在其它实施方式中，可以为代表区室群的子集的多个区室分配代表该子集的唯一条形码。在一些实施方式中，记录标签包含级分条形码，其含有级分内大分子的标识信息。

在一些实施方式中，将所述一个或多个标签或所述一个或多个标签的信息传递到记录标签(例如，通过引物延伸或连接)以延伸所述记录标签。在一些实施方式中，所述标签(例如，区室标签、分区条形码、样本条形码、级分条形码等)中的一个或多个还包含能够与多个蛋白质复合体、蛋白质或多肽上的内部氨基酸、肽主链或N端氨基酸反应的官能部分。在一些实施方式中，所述官能部分是点击化学部分、醛、叠氮化物/炔烃、或马来酰亚胺/硫醇、或环氧化物/亲核试剂、逆电子需求Diels-Alder(iEDDA)基团、或用于Staudinger反应的部分。在一些具体实施方式中，多个区室标签通过将区室标签印刷、点样、喷墨到区室中或其组合而形成。在一些实施方式中，所述标签附着于多肽以通过多肽-多肽连键将所述标签与大分子连接。在一些实施方式中，附有标签的多肽包含蛋白质连接酶识别序列。

在某些实施方式中，肽或多肽大分子可以通过亲和捕获试剂固定化在固体载体上(并任选共价交联)，其中记录标签直接与亲和捕获试剂缔合，或者，大分子可以直接固定化在带有记录标签的固体载体上。在一个实施方式中，大分子附着在与捕获核酸杂交的诱饵核酸上并连接到捕获核酸上，所述捕获核酸包含用于附着固体载体的反应性连接部分。在一些示例中，诱饵或捕获核酸可充当关于多肽的信息可以传递到其上的记录标签。在一些实施方式中，大分子附着于诱饵核酸以形成核酸-大分子嵌合体。在一些实施方式中，所述固定化方法包括通过将诱饵核酸与附着在固体载体上的捕获核酸杂交而使核酸-大分子嵌合体接近固体载体，并将核酸-大分子嵌合体共价偶联到固体载体上。在一些情况下，核酸-大分子嵌合体与固体载体间接偶联，例如通过接头偶联。在一些实施方式中，多个核酸-大分子嵌合体偶联在固体载体上，并且任何相邻偶联的核酸-大分子嵌合体以约50nm或更大的平均距离彼此间隔开。

在一些实施方式中，控制或滴定带有记录标签的大分子的密度或数量。在一些示例中，可通过提供稀释或受控的记录标签数量来滴定样本中记录标签的期望的间距、密度和/或量。在一些示例中，记录标签的期望的间距、密度和/或量可通过当提供、缔合和/或附着记录标签时掺入竞争分子或“假”竞争分子来实现。在一些情况下，“假”竞争分子以与缔合或附着于样本中大分子的记录标签相同的方式进行反应，但竞争分子不充当记录标签。在一些具体示例中，如果期望的密度是样本中每1,000个用于连接的可用位点1个功能记录标签的话，则采用每1,000个“假”竞争分子掺入1个功能记录标签来达到期望的间距。在一些示例中，基于功能记录标签的反应速率与竞争分子的反应速率的比较来调整功能记录标签的比率。

在一些示例中，使用标准胺偶联化学方法对带有记录标签的大分子进行标记。例如，取决于反应的pH值，e-氨基基团(例如，赖氨酸残基的氨基基团)和N端氨基基团可能容易被胺反应性偶联剂标记(Mendoza等人，Mass Spectrom Rev(2009)28(5):785-815)。在一个特定实施方式中，记录标签包含反应性部分(例如，用于与固体表面、多功能接头或大分子缀合)、接头、通用引发序列、条形码(例如，区室标签、分区条形码、样本条形码、级分条形码、或其任何组合)、任选的UMI、和间隔区(Sp)序列，用于促进与代码标签之间的信息传递。在另一个实施方式中，可以先用通用DNA标签标记蛋白质，然后通过酶促或化学偶联步骤将条形码-Sp序列(表示样本、区室、载玻片上的物理位置等)附着在所述蛋白质上。通用DNA标签包含用于标记蛋白质或多肽大分子并且可以用作条形码(例如区室标签、记录标签等)的附着点的短核苷酸序列。例如，记录标签可在其末端包含与通用DNA标签互补的序列。在某些实施方式中，通用DNA标签是通用引发序列。在标记的蛋白质上的通用DNA标签与记录标签(例如与珠子结合的记录标签)中的互补序列杂交后，退火的通用DNA标签可通过引物延伸进行延伸，将记录标签信息传递给带有DNA标签的蛋白质。在一个特定实施方式中，蛋白质在被蛋白酶消化成肽之前用通用DNA标签标记。然后可以将来自消化的标记肽上的通用DNA标签转化为信息性的且有效的记录标签。

记录标签可包含针对存在于靶标大分子、例如靶蛋白上的同源反应性部分的反应性部分(例如，点击化学标记、光亲和标记)。例如，记录标签可包含与炔烃衍生化蛋白质相互作用的叠氮化物部分，或记录标签可包含与天然蛋白质等相互作用的二苯甲酮。靶蛋白特异性结合剂与靶蛋白结合后，记录标签和靶蛋白通过其相应的反应性部分偶联。在靶蛋白被记录标签标记后，可通过消化与靶蛋白特异性结合剂连接的DNA捕获探针来去除靶蛋白特异性结合剂。例如，DNA捕获探针可设计成含有尿嘧啶碱基，然后用尿嘧啶特异性切除试剂(例如USERTM)靶向消化该尿嘧啶碱基，并可从靶蛋白上分离靶蛋白特异性结合剂。在一些实施方式中，可以使用杂交之外的其它类型的连接将记录标签与大分子连接。合适的接头可以附着于记录标签的各个位置，例如3'端、内部位置或在附着于记录标签5'端的接头内。

C.代码标签信息向记录标签的循环传递

在一些实施方式中，大分子分析测定(例如，多肽分析测定)包括通过将标识信息从一个或多个代码标签传递到记录标签来延伸与大分子、例如多肽相关的记录标签。在本文所述的方法中，在结合剂与大分子、例如蛋白质或肽结合后，其连接的代码标签的标识信息被传递到与所述多肽或肽缔合的记录标签，从而生成延伸记录标签。在一些实施方式中，记录标签还包括条形码和/或其它核酸组分。在特定的实施方式中，来自结合剂的代码标签的标识信息被传递到记录标签或添加到附着于记录标签上的任何现有条形码(或其它核酸组分)。标识信息的传递可使用延伸或连接来进行。在一些实施方式中，在记录标签的末端添加间隔区，所述间隔区包含能够与代码标签上的序列杂交的序列，以促进来自代码标签的标识信息的传递。在一些实施方式中，来自代码标签的标识信息包含关于结合剂结合的肽或多肽上的所述一个或多个氨基酸的身份的信息。

在一些实施方式中，以循环的方式，标记每个多肽或肽的末端氨基酸(例如，N端氨基酸)(例如，苯基硫代氨基甲酰基(PTC)、修饰-PTC、Cbz、二硝基苯基(DNP)部分、磺酰基硝基苯基(SNP)、乙酰基、胍基、氨基胍基、杂环甲亚胺标记)。在一些情况下，末端氨基酸(例如，N端氨基酸)的标记可以在结合剂与肽或多肽结合之前或之后进行。每个固定化多肽或肽的N端氨基酸(或标记的N端氨基酸，例如PTC-NTAA、Cbz-NTAA、DNP-NTAA、SNP-NTAA、乙酰基-NTAA、胍基化-NTAA、氨基胍基-NTAA、杂环甲亚胺-NTAA)被附着在代码标签上的同源NTA结合剂结合，并且来自与结合的NTAA结合剂缔合的代码标签的标识信息被传递到与固定化的多肽或肽分析物缔合的诱饵或捕获核酸，从而产生含有来自代码标签的信息的延伸核酸。

在一些实施方式中，在来自结合剂的代码标签的标识信息被传递到记录标签之后，结合的结合剂从多肽上释放。在一些实施方式中，在来自结合剂的代码标签的标识信息被传递到记录标签之后，从多肽上去除所述一种或多种结合剂。在一些方面，在来自结合剂的代码标签的标识信息传递到记录标签之后，进行洗涤步骤。

在一些实施方式中，结合剂与代码标签和其它任选的核酸成分缔合。与结合剂缔合的代码标签是或包含任何合适长度的多核苷酸，例如约2个碱基至约100个碱基的核酸分子，包括含2和1002和100之间以及其间的任何整数，其包含其缔合的结合剂的标识信息。“代码标签”也可由“可测序的聚合物”构成(例如，参见Niu等人，2013，Nat.Chem.5:282-292；Roy等人，2015，Nat.Commun.6:7237；Lutz，2015，Macromolecules 48:4759-4767；它们各自通过引用整体并入)。代码标签可包含编码区序列或带有标识信息的序列，其任选在一侧侧接一个间隔区或任选在每侧侧接间隔区。代码标签还可包含任选的UMI和/或任选的结合循环特异性条形码。代码标签可以是单链的或双链的。双链代码标签可包含平端、突出端或二者。代码标签可以指直接附着于结合剂的代码标签、与直接附着于结合剂的代码标签杂交的互补序列(例如，对于双链代码标签)、或存在于记录标签上的延伸核酸中的代码标签信息。在某些实施方式中，代码标签还可包含结合循环特异性的间隔区或条形码、唯一分子标识符、通用引发位点或其任何组合。

可使用多种方法将与特异性结合剂缔合的代码标签信息传递到记录标签。在任何前述实施方式中，标识信息的传递(例如，从代码标签到记录标签)可以通过连接(例如，酶促或化学连接、夹板连接、粘性末端连接、单链(ss)连接例如ssDNA连接、或其任何组合)、聚合酶介导的反应(例如，单链核酸或双链核酸的引物延伸)、或其任何组合来实现。

在某些实施方式中，代码标签的信息通过引物延伸传递到记录标签(例如，参见Chan等人(2015)CurrOpin Chem Biol 26:55-61)。记录标签或延伸记录标签的3’端上的间隔区序列与代码标签3’端的互补间隔区序列一起退火，聚合酶(例如链置换聚合酶)使用退火的代码标签作为模板来延伸所述记录标签序列。在一些实施方式中，与代码标签编码区序列和5’间隔区互补的寡核苷酸可以预退火到代码标签上，以防止代码标签与存在于延伸记录标签中的内部编码区和间隔区序列杂交。代码标签上的3’端间隔区保持单链，优选与记录标签上的3’端间隔区结合。在其它实施方式中，新生的记录标签可以用单链结合蛋白包被，以防止代码标签退火到内部位点。或者，新生的记录标签也可以用RecA(或相关的同源物，例如uvsX)包被，以促进3’端侵入完全双链的代码标签中(Bell等人，2012，Nature491:274-278)。这种构造防止双链代码标签与内部记录标签元件相互作用，但容易受到所述延伸记录标签的RecA包被的3'尾部的链侵入(Bell等人，2015，Elife 4:e08646)。单链结合蛋白的存在可以促进链置换反应。

在一些实施方式中，用于引物延伸的DNA聚合酶具有链置换活性，并且3'-5外切核酸酶活性有限或缺乏。许多这样的聚合酶的例子中的几个包括Klenow exo-(DNA Pol 1的Klenow片段)、T4 DNA聚合酶exo-、T7 DNA聚合酶exo(Sequenase 2.0)、Pfu exo-、Ventexo-、Deep Vent exo-、Bst DNA聚合酶大片段exo-、Bca Pol、9°N Pol和Phi29 Pol exo-。在一个优选实施方式中，DNA聚合酶在室温并直至45℃下是活性的。在另一个实施方式中，采用“热启动”形式的嗜热聚合酶，使得聚合酶在约40℃-50℃下活化和使用。示例性的热启动聚合酶是Bst 2.0 Warm Start DNA聚合酶(New England Biolabs)。

可用于链置换复制的添加剂包括：细菌、病毒或真核生物来源的许多单链DNA结合蛋白(SSB蛋白)中的任何一种，例如大肠杆菌(E.coli)的SSB蛋白、噬菌体T4基因32产物、噬菌体T7基因2.5蛋白、噬菌体Pf3 SSB、复制蛋白ARPA32和RPA14亚基(Wold，Annu.Rev.Biochem.(1997)66:61-92)；其它DNA结合蛋白，例如腺病毒DNA结合蛋白、单纯疱疹病毒蛋白ICP8、BMRF1聚合酶辅助亚基、疱疹病毒UL29 SSB样蛋白；已知参与DNA复制的许多复制复合体蛋白中的任何一种，例如噬菌体T7解旋酶/引物酶、噬菌体T4基因41解旋酶、大肠杆菌Rep解旋酶、大肠杆菌recBCD解旋酶、recA、大肠杆菌和真核拓扑异构酶(Annu RevBiochem.(2001)70:369-413)。

错误引发或自引发事件，例如当记录标签的末端间隔区序列引发自延伸时的该类事件，可通过在引物延伸反应中包含单链结合蛋白(T4基因32，大肠杆菌SSB等)、DMSO(1-10％)、甲酰胺(1-10％)、BSA(10-100ug/ml)、TMACl(1-5mM)、硫酸铵(10-50mM)、甜菜碱(1-3M)、甘油(5-40％)或乙二醇(5-40％)来最小化。

大多数A型聚合酶缺乏3'外切核酸酶活性(内源性的或工程去除的)，例如Klenowexo-、T7 DNA聚合酶exo-(Sequenase 2.0)，而Taq聚合酶催化核苷酸、优选非模板添加腺苷碱基(取决于序列环境，G碱基的添加程度较低)到双链扩增产物的3’平端。对于Taq聚合酶，3’嘧啶(C>T)最小化非模板腺苷添加，而3’嘌呤核苷酸(G>A)有利于非模板腺苷添加。在一些实施方式中，使用Taq聚合酶进行引物延伸，在远离结合剂的间隔区序列和相邻条形码序列(例如，编码区序列或循环特异性序列)之间的代码标签中放置胸苷碱基适应在记录标签的间隔区序列的3'端零星包含非模板腺苷核苷酸。以这种方式，与固定化的肽缔合的延伸记录标签(有或没有非模板腺苷碱基)可以退火到代码标签上并经历引物延伸。

或者，可以通过使用其中非模板末端转移酶活性已因一个或多个尤其是在O-螺旋区中的点突变而大大降低的突变聚合酶(嗜温或嗜热)(见US专利7,501,237)(Yang等人，Nucleic Acids Res.(2002)30(19):4314–4320)，来减少非模板碱基的添加。Pfu exo-是3’外切酶缺陷的并具有链置换能力，也没有非模板末端转移酶活性。

在一些实施方式中，所述方法的一个或多个步骤的各种条件可由本领域技术人员为了自动化或为了与设备兼容使用来酌情修改。例如，可以增加或降低结合剂与大分子接触的温度或记录标签和代码标签上的间隔区序列杂交的温度，以改动相互作用的特异性或严格性。在一些实施方式中，为了最小化溶液中代码标签标记的结合剂与固定化蛋白质的核酸的非特异性相互作用，可以向结合反应添加与含有间隔区序列的核酸(例如，在记录标签上)互补的竞争(也称为封闭性)寡核苷酸，以最小化非特异性相互作用。在一些实施方式中，封闭性寡核苷酸含有与附着于结合剂的代码标签或其一部分互补的序列。在一些实施方式中，封闭性寡核苷酸相对较短。在一些实施方式中，封闭性寡核苷酸直接或间接附着于代码标签上。在一些示例中，代码标签包含发夹核酸，并且所述发夹包括与代码标签的间隔区和/或条形码互补的序列。在引物延伸之前，从结合反应洗掉多余的竞争寡核苷酸，这有效地将退火的竞争寡核苷酸与记录标签上的所述核酸分离，尤其是当暴露于略微升高的温度(例如，30-50℃)时。在一些实施方式中，封闭性寡核苷酸可在其3'端包含终止子核苷酸以防止引物延伸。

在某些实施方式中，记录标签上的间隔区序列退火到代码标签上的互补间隔区序列在引物延伸反应条件下是亚稳定的(即退火Tm与反应温度相似)。这允许代码标签的间隔区序列取代退火到记录标签(或其延伸物)的间隔区序列的任何封闭性寡核苷酸。

通过延伸记录标签的末端间隔区序列与该延伸记录标签的内部区域自退火而引起的自引发/错误引发事件可通过在所述记录标签/延伸记录标签中包含伪互补碱基来最小化(Lahoud等人，Nucleic Acids Res.(2008)36:3409-3419)、(Hoshika等人，Angew ChemInt Ed Engl(2010)49(32):5554-5557)。伪互补碱基由于存在化学修饰，显示出彼此形成双链体的杂交亲和力显著降低。然而，许多伪互补修饰碱基可以与天然DNA或RNA序列形成强碱基对。在某些实施方式中，代码标签间隔区序列包含多个A和T碱基，并利用亚磷酰胺寡核苷酸合成将可商购的伪互补碱基2-氨基腺嘌呤和2-硫代胸腺嘧啶并入记录标签中。额外的伪互补碱基可以在引物延伸期间通过向反应添加伪互补核苷酸而并入延伸记录标签中(Gamper等人，Biochemistry.(2006)45(22):6978-6986)。

与特异性结合剂缔合的代码标签信息可通过连接传递到与固定化多肽或肽缔合的记录标签上的核酸。连接可以是平端连接或粘性末端连接。连接可以是酶促连接反应。连接酶的例子包括但不限于CV DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、T3 DNA连接酶、TaqDNA连接酶、大肠杆菌DNA连接酶、9°N DNA连接酶、

(例如，参见美国专利公布No.US20140378315)。或者，连接可以是化学连接反应。如国际专利公布No.WO 2017/192633所说明，通过使用“记录辅助”序列与代码标签上的分支杂交来完成无间隔区连接。退火的互补体序列使用标准化学连接或“点击化学”进行化学连接(Gunderson等人，GenomeRes(1998)8(11):1142-1153；Peng等人，European J Org Chem(2010)(22):4194-4197；El-Sagheeret al.，Proc Natl Acad Sci USA(2011)108(28):11338-11343；El-Sagheer等人，Org Biomol Chem(2011)9(1):232-235；Sharma等人，Anal Chem(2012)84(14):6104-6109；Roloff等人，Bioorg Med Chem(2013)21(12):3458-3464；Litovchick等人，Artif DNA PNAXNA(2014)5(1):e27896；Roloff等人，Methods Mol Biol(2014)1050:131-141)。

在另一个实施方式中，PNA的传递可以使用已发表的技术以化学连接来完成。PNA的结构是这样的，它具有5’N端胺基团和非反应性的3’C端酰胺。PNA的化学连接需要将末端修饰为具有化学活性。这通常通过用半胱氨酰部分来衍生化5'N端和用硫酯部分来衍生化3'C端完成。这样修饰的PNA容易使用标准的天然化学连接条件进行偶联(Roloff等人，(2013)Bioorgan.Med.Chem.21:3458-3464)。

在一些实施方式中，代码标签信息可以使用拓扑异构酶传递。拓扑异构酶可以用于将记录标签(或其延伸物或任何附着的核酸)上带拓扑电荷的3'磷酸酯连接到代码标签或其互补体的5'端(Shuman等人，1994，J.Biol.Chem.269:32678-32684)。

延伸记录标签可以是包含与其缔合的多肽的标识信息的任何核酸分子或可测序聚合物分子(例如，参见Niu等人，2013，Nat.Chem.5:282-292；Roy等人，2015，Nat.Commun.6:7237；Lutz，2015，Macromolecules 48:4759-4767；它们各自通过引用整体并入)。在一些示例中，延伸记录标签可包含唯一分子标识符、区室标签、分区条形码、样本条形码、级分条形码、间隔区序列、通用引发位点或其任何组合。在某些实施方式中，在结合剂与多肽结合后，来自与结合剂连接的记录标签的信息可以在结合剂与多肽结合的同时传递到与所述多肽缔合的核酸上。在一些示例中，含有来自一种或多种结合剂的信息的最终延伸记录标签任选侧接通用引发位点以便于下游扩增和/或DNA测序。正向通用引发位点(例如，Illumina的P5-S1序列)可以是记录标签原始设计的一部分，而反向通用引发位点(例如，Illumina的P7-S2'序列)可以作为核酸延伸中的最终步骤添加。在一些实施方式中，正向和反向引发位点的添加可以与结合剂无关地进行。

与具有来自代码标签的标识信息的大分子、例如肽缔合的延伸核酸，可包含来自结合剂的代码标签的信息，所述信息表示所进行的每个结合循环。然而，在一些情况下，延伸的核酸也可经历“错过”的结合循环，例如，因为代码标签丢失、损坏或有缺陷、因为引物延伸反应失败，结合剂未能与多肽结合。即使发生结合事件，来自代码标签的信息传递也可能不完整或准确度低于100％，例如，因为代码标签损坏或有缺陷、因为在引物延伸反应中引入了错误)。因此，延伸的核酸可表示其缔合的多肽上发生的结合事件的100％、或高达95％、90％、85％、80％、75％、70％、65％、60％、65％、55％、50％、45％、40％、35％、30％、或其任何子范围。而且，延伸核酸中存在的代码标签信息可与相应代码标签具有至少30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、或100％同一性。

在某些实施方式中，与固定化多肽或肽缔合的延伸记录标签可包含来自多个代码标签的信息，所述信息表示多个连贯的结合事件。在这些实施方式中，与固定化肽缔合的单一的串联延伸记录标签可以代表单一多肽。如本文所述，将代码标签信息传递到与固定化肽缔合的记录标签还包括传递到延伸记录标签，这在涉及多个连续结合事件的方法中会发生。

在某些实施方式中，结合事件信息以循环的方式从代码标签传递到与固定化多肽或肽缔合的记录标签。通过要求标识两个或更多个独立的结合事件的至少两个不同的代码标签映射到同一类结合剂(与特定蛋白质同源)，可以在测序后从信息上过滤掉交叉反应结合事件。除一个或多个间隔区序列之外，所述代码标签还可含有任选的UMI序列。与固定化肽缔合的记录标签上的延伸核酸中也可包含通用引发序列，用于扩增和NGS测序。

1.结合剂

在某些实施方式中，本公开提供的用于大分子例如蛋白质或多肽分析测定的自动化方法包括一个或多个结合循环，其中多肽与多种结合剂接触，结合剂的连续结合将历史结合信息以基于核酸的代码标签的形式传递到与所述多肽缔合的至少一种核酸(例如，记录标签)。以这种方式，以核酸形式生成包含有关多个结合事件信息的历史记录。

本文所述的方法使用能够与大分子例如多肽结合的结合剂。结合剂可以是能够与多肽的组分或特征结合的任何分子(例如，肽、多肽、蛋白质、核酸、碳水化合物、小分子等)。结合剂可以是天然存在的、合成产生的或重组表达的分子。在一些实施方式中，用于工程改造结合剂的支架可以来自任何物种，例如人类、非人类、转基因。结合剂可与多肽的单个单体或亚基(例如，单个氨基酸)结合，或与多肽的多个相连的亚基(例如，较长的多肽分子的二肽、三肽或更高级肽)结合。

在某些实施方式中，结合剂可被设计成共价结合。共价结合可被设计成有条件的或有利于与正确的部分结合。例如，NTAA及其关联的NTAA特异性结合剂可各自反应性基团进行修饰，使得一旦NTAA特异性结合剂与关联的NTAA结合，就会进行偶联反应以在二者之间产生共价连键。结合剂与缺乏关联反应性基团的其它位置的非特异性结合不会导致共价连接。在一些实施方式中，多肽包含能够与结合剂形成共价键的配体。在一些实施方式中，该多肽包含官能化的NTAA，其包括能够与结合剂共价结合的配体基团。结合剂与其靶标之间的共价结合可允许使用更严格的洗涤来去除非特异性结合的结合剂，从而增加所述测定的特异性。

在某些实施方式中，结合剂可以是选择性结合剂。如本文所用，选择性结合是指相对于与不同配体(例如氨基酸或氨基酸类别)的结合而言，结合剂优先结合特异性配体(例如氨基酸或氨基酸类别)的能力。选择性通常被称为在与结合剂的复合物中一种配体被另一种配体置换的反应的平衡常数。通常，这样的选择性与配体的空间几何形态和/或配体与结合剂结合的方式和程度例如通过氢键合、疏水结合和范德华力(非共价相互作用)或通过与结合剂的可逆或不可逆共价连接有关。还应该理解，选择性可能是相对的，并且与绝对的相反，不同的因素可以影响它，包括配体浓度。因此，在一个示例中，结合剂选择性地结合二十种标准氨基酸之一。在一些示例中，结合剂与N端氨基酸残基、C端氨基酸残基或内部氨基酸残基结合。

在一些实施方式中，结合剂是部分特异性或选择性的。在一些方面，结合剂优先结合一种或多种氨基酸。在一些示例中，结合剂可结合或能够结合二十种标准氨基酸中的两种或更多种。例如，结合剂可优先结合氨基酸A、C和G胜过其它氨基酸。在一些其它示例中，结合剂可以选择性地或特异性地结合多于一种氨基酸。在一些方面，结合剂还可偏好从末端氨基酸起第二、第三、第四、第五位等处的一种或多种氨基酸。在一些情况下，结合剂优先结合特定末端氨基酸和倒数第二个氨基酸。例如，结合剂可优先结合AA、AC和AG，或者结合剂可优先结合AA、CA和GA。在一些具体示例中，具有不同特异性的结合剂可以共有相同的代码标签。在一些实施方式中，结合剂可在靶标的一些或所有位置中表现出靶标结合偏好的灵活性和可变性。在一些示例中，结合剂可对一种或多种特定的靶末端氨基酸具有偏好，并且对倒数第二位的靶标具有灵活的偏好。在一些其它示例中，结合剂可对倒数第二个氨基酸位置的一种或多种特定靶氨基酸具有偏好，并且对末端氨基酸位置的靶标具有灵活的偏好。在一些实施方式中，结合剂对包含大分子的末端氨基酸和其它组分的靶标具有选择性。在一些示例中，结合剂对包含肽主链的末端氨基酸和至少一部分肽主链的靶标具有选择性。在一些特定示例中，结合剂对包含末端氨基酸和酰胺肽主链的靶标具有选择性。在一些情况下，肽主链包含天然肽主链或翻译后修饰。在一些实施方式中，结合剂表现出变构结合。

在本文公开的方法的实践中，结合剂选择性结合大分子、例如多肽的特征或组分的能力只需要足以允许其代码标签信息传递到与所述多肽缔合的记录标签上。因此，选择性只需要相对于多肽所暴露的其它结合剂而言。还应理解，结合剂的选择性不必是对特定氨基酸绝对的，而可以是对一类氨基酸的选择性，例如对具有极性或非极性侧链、或带有(正或负)电荷的侧链、或带有芳族侧链、或带有某些特定类别或大小的侧链的氨基酸等。在一些实施方式中，结合剂选择性结合大分子的特征或组分的能力通过比较结合剂的结合能力来表征。例如，可以将结合剂对靶标的结合能力与结合不同靶标的结合剂的结合能力进行比较，例如，将对一类氨基酸具有选择性的结合剂与对不同类别的氨基酸具有选择性的结合剂进行比较。在一些示例中，将对非极性侧链具有选择性的结合剂与对极性侧链具有选择性的结合剂进行比较。在一些实施方式中，对肽的特征、组分或一种或多种氨基酸具有选择性的结合剂，与对不同的肽特征、组分或一种或多种氨基酸具有选择性的结合剂相比，表现出至少1X、至少2X、至少5X、至少10X、至少50X、至少100X、或至少500X更高的结合。

在一个特定实施方式中，结合剂对目的大分子、例如多肽具有高亲和力和高选择性。特别是，高结合亲和力伴低解离率对于代码标签和记录标签之间的信息传递可能是有效的。在某些实施方式中，结合剂的Kd为约<500nM、<200nM、<100nM、<50nM、<10nM、<5nM、<1nM、<0.5nM、或<0.1nM。在一个特定实施方式中，结合剂以>1X、>5X、>10X、>100X或>1000X其Kd的浓度添加到多肽中以驱动结合完成。例如，抗体与单一蛋白质分子的结合动力学在Chang等人，J Immunol Methods(2012)378(1-2):102-115中描述。

在某些实施方式中，结合剂可结合肽分子的NTAA、CTAA、中间氨基酸、二肽(二氨基酸序列)、三肽(三氨基酸序列)、或更高级肽。在一些实施方式中，结合剂文库中的每种结合剂选择性地结合特定氨基酸，例如二十种标准天然存在的氨基酸中的一种。标准天然存在氨基酸包括丙氨酸(A或Ala)、半胱氨酸(C或Cys)、天冬氨酸(D或Asp)、谷氨酸(E或Glu)、苯丙氨酸(F或Phe)、甘氨酸(G或Gly)、组氨酸(H或His)、异亮氨酸(I或Ile)、赖氨酸(K或Lys)、亮氨酸(L或Leu)、甲硫氨酸(M或Met)、天冬酰胺(N或Asn)、脯氨酸(P或Pro)、谷氨酰胺(Q或Gln)、精氨酸(R或Arg)、丝氨酸(S或Ser)、苏氨酸(T或Thr)、缬氨酸(V或Val)、色氨酸(W或Trp)、和酪氨酸(Y或Tyr)。在一些实施方式中，结合剂与未修饰的或天然的(例如，自然的)氨基酸结合。在一些示例中，结合剂与肽分子的未修饰或天然二肽(二氨基酸序列)、三肽(三氨基酸序列)或更高级的肽结合。可以对结合剂进行工程改造，使其对天然或未修饰的NTAA具有高亲和力、对天然或未修饰的NTAA具有高特异性、或二者兼而有之。在一些实施方式中，可以通过使用噬菌体展示，定向进化有希望的亲和支架来开发结合剂。

在某些实施方式中，结合剂可结合氨基酸的翻译后修饰。在一些实施方式中，肽包含一个或多个可相同或不同的翻译后修饰。肽的NTAA、CTAA、中间氨基酸或其组合可被翻译后修饰。对氨基酸的翻译后修饰包括酰化、乙酰化、烷基化(包括甲基化)、生物素化、丁酰化、氨甲酰化、羰基化、脱酰胺化、脱亚胺化、白喉酰胺形成、二硫桥键形成、消去化、黄素连接、甲酰化、γ-羧基化、谷氨酰化、甘氨酰化、糖基化、糖基磷脂酰肌醇化、血红素C连接、羟基化、羟腐氨酸形成、碘化、异戊二烯化、脂化、脂酰化、丙二酰化、甲基化、肉豆蔻酰化、氧化、棕榈酰化、PEG化、磷酸泛酰巯基乙胺化、磷酸化、异戊二烯化、丙酰化、亚视黄亚基席夫碱形成、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、硒化、琥珀酰化、亚磺化、泛素化和C-末端酰胺化。(也参见，Seo和Lee，2004，J.Biochem.Mol.Biol.37:35-44)。

在某些实施方式中，凝集素用作检测蛋白质、多肽或肽的糖基化状态的结合剂。凝集素是碳水化合物结合蛋白，可以选择性识别游离碳水化合物或糖蛋白的聚糖表位。识别各种糖基化状态(例如，核心岩藻糖、唾液酸、N-乙酰基-D-乳糖胺、甘露糖、N-乙酰基葡萄糖胺)的凝集素名录包括：A，AAA，AAL，ABA，ACA，ACG，ACL，AOL，ASA，BanLec，BC2L-A，BC2LCN，BPA，BPL，Calsepa，CGL2，CNL，Con，ConA，DBA，Discoidin，DSA，ECA，EEL，F17AG，Gal1，Gal1-S，Gal2，Gal3，Gal3C-S，Gal7-S，Gal9，GNA，GRFT，GS-I，GS-II，GSL-I，GSL-II，HHL，HIHA，HPA，I，II，Jacalin，LBA，LCA，LEA，LEL，Lentil，Lotus，LSL-N，LTL，MAA，MAH，MAL_I，Malectin，MOA，MPA，MPL，NPA，Orysata，PA-IIL，PA-IL，PALa，PHA-E，PHA-L，PHA-P，PHAE，PHAL，PNA，PPL，PSA，PSL1a，PTL，PTL-I，PWM，RCA120，RS-Fuc，SAMB，SBA，SJA，SNA，SNA-I，SNA-II，SSA，STL，TJA-I，TJA-II，TxLCI，UDA，UEA-I，UEA-II，VFA，VVA，WFA，WGA(参见，Zhang等人，2016，MABS 8:524-535)。

在一些实施方式中，结合剂可结合天然的或未修饰的或未标记的末端氨基酸。而且，在一些情况下，这些天然氨基酸结合剂不识别N端标记。aaRS支架的定向进化可以用于生成在N端标记的环境下识别N端氨基酸的更高亲和力、更高特异性结合剂。在另一个示例中，Havranak等人(美国专利公布No.US 2014/0273004)将工程氨酰tRNA合成酶(aaRSs)描述为特异性NTAA结合剂。aaRSs的氨基酸结合袋具有结合关联氨基酸的内在能力，但通常表现出结合亲和力和特异性差。而且，这些天然氨基酸结合剂不识别N端标记。aaRS支架的定向进化可以用于生成在N端标记的环境下识别N端氨基酸的更高亲和力、更高特异性结合剂。

在某些实施方式中，结合剂可结合修饰或标记的末端氨基酸(例如，已被官能化或修饰的NTAA)。在一些实施方式中，结合剂可结合化学或酶促修饰的末端氨基酸。修饰或标记的NTAA可以是用下列进行官能化的NTAA：异硫氰酸苯酯，PITC，1-氟-2,4-二硝基苯(Sanger试剂，DNFB)，苄氧羰基氯或羧基苯甲酰氯(Cbz-Cl)，N-(苄氧羰氧基)琥珀酰亚胺(Cbz-OSu或Cbz-O-NHS)，丹磺酰氯(DNS-Cl，或1-二甲氨基萘-5-磺酰氯)，4-磺酰-2-硝基氟苯(SNFB)，N-乙酰基-衣托酸酐，衣托酸酐，2-吡啶甲醛，2-甲酰基苯基硼酸，2-乙酰苯基硼酸，1-氟-2,4-二硝基苯，琥珀酸酐，4-氯-7-硝基苯并呋咱，五氟苯基异硫氰酸酯，4-(三氟甲氧基)-苯基异硫氰酸酯，4-(三氟甲基)-苯基异硫氰酸酯，3-(羧酸)-苯基异硫氰酸酯，3-(三氟甲基)-苯基异硫氰酸酯，1-萘基异硫氰酸酯，N-硝基咪唑-1-甲脒，

乙酰化试剂，胍基化试剂，硫代酰化试剂，硫代乙酰化试剂，或硫代苄基化试剂，或二杂环甲亚胺试剂。在一些示例中，结合剂结合通过与试剂接触或使用如国际专利公布No.WO 2019/089846所述的方法而被标记的氨基酸。在一些情况下，结合剂结合被胺修饰试剂标记的氨基酸。

在一些实施方式中，结合剂结合化学修饰的N端氨基酸残基或化学修饰的C端氨基酸残基。为了增加结合剂对肽的N端小氨基酸(NTAA)的亲和力，可用“免疫原性”半抗原、例如二硝基苯酚(DNP)修饰NTAA。这可以使用将DNP基团附着到NTAA的胺基团上的Sanger试剂，即二硝基氟苯(DNFB)，以循环测序方法实现。商业抗DNP抗体在低nM范围内(～8nM，LO-DNP-2)具有亲和力(Bilgicer等人，J Am Chem Soc(2009)131(26):9361-9367)；因此，有理由认为应该有可能工程改造出对许多用DNP(通过DNFB)修饰的NTAA具有高亲和力并同时实现对特定NTAA的良好结合选择性的结合剂。在另一个示例中，可使用4-磺酰基-2-硝基氟苯(SNFB)用磺酰基硝基苯酚(SNP)修饰NTAA。用替代性NTAA修饰剂，例如乙酰基或脒基(胍基)基团，也可实现类似的亲和力增强。

在某些实施方式中，结合剂可以是适配体(例如，肽适配体、DNA适配体或RNA适配体)、拟肽、抗体或其特异性结合片段、氨基酸结合蛋白或酶、抗体结合片段、抗体模拟物、肽、肽模拟物、蛋白质或多核苷酸(例如，DNA、RNA、肽核酸(PNA)、gPNA、桥连核酸(BNA)、异种核酸(XNA)、甘油核酸(GNA)、或苏糖核酸(TNA)、或其变体。

如本文所用的术语抗体以广义使用，不仅包括完整的抗体分子，例如但不限于免疫球蛋白A、免疫球蛋白G、免疫球蛋白D、免疫球蛋白E和免疫球蛋白M，还包括抗体分子或其部分的与至少一个表位免疫特异性结合的任何免疫反应性组分。抗体可以是天然存在的、合成产生的或重组表达的。抗体可以是融合蛋白。抗体可以是抗体模拟物。抗体的例子包括但不限于，Fab片段、Fab'片段、F(ab')₂片段、单链抗体片段(scFv)、微型抗体、纳米抗体、双抗体、交联抗体片段、Affibody^TM、纳米抗体、单域抗体、DVD-Ig分子、α抗体(alphabodies)、affimers、affitins、环肽(cyclotides)、分子等。使用抗体工程或蛋白质工程技术衍生的免疫反应性产物也明确地在术语抗体的含义内。抗体和/或蛋白质工程的详细描述，包括相关方案，可以在J.Maynard和G.Georgiou，2000，Ann.Rev.Biomed.Eng.2:339-76；《抗体工程》(Antibody Engineering)，R.Kontermann和S.Dubel主编，Springer Lab Manual，Springer Verlag(2001)；美国专利No.5,831,012；和S.Paul，《抗体工程方案》(AntibodyEngineering Protocols)，Humana Press(1995)等中找到。

与抗体一样，特异性识别大分子、例如肽或多肽的核酸和肽适配体可以使用已知的方法产生。适配体以高度特异性、构象依赖性方式结合靶分子，通常具有非常高的亲和力，但如果希望，可以选择结合亲和力较低的适配体。已显示适配体基于非常小的结构差异、例如甲基或羟基基团的存在与否来区分靶标，并且某些适配体可以区分D-和L-对映异构体。已获得结合小分子靶标的适配体，小分子靶标包括药物、金属离子和有机染料、肽、生物素和蛋白质，蛋白质包括但不限于链霉亲和素、VEGF和病毒蛋白质。适配体已显示出在生物素化、荧光素标记之后以及当附着在玻璃表面和微球上时保持功能活性(例如，参见Jayasena，1999，Clin Chem 45:1628-50；Kusser2000，J.Biotechnol.74:27-39；Colas，2000，Curr Opin Chem Biol 4:54-9)。特异性结合精氨酸和AMP的适配体也有描述(参见，Patel和Suri，2000，J.Biotech.74:39-60)。与特定氨基酸结合的寡核苷酸寡核苷酸在Gold等人(1995，Ann.Rev.Biochem.64:763-97)中公开。还描述了结合氨基酸的RNA适配体(Ames和Breaker，2011，RNA Biol.8；82-89；Mannironi等人，2000，RNA 6:520-27；Famulok，1994，J.Am.Chem.Soc.116:1698-1706)。

可以通过基因工程修饰天然或合成产生的蛋白质以在氨基酸序列中引入一个或多个突变从而产生与多肽的特定组分或特征(例如，NTAA、CTAA、或翻译后修饰的氨基酸或肽)结合的工程化蛋白质，来制造结合剂。例如，可以修饰外肽酶(例如氨肽酶、羧肽酶)、外切蛋白酶(exoproteases)、突变的外切蛋白酶、突变的抗运载蛋白(anticalins)、突变的ClpS、抗体或tRNA合成酶以产生选择性结合特定NTAA的结合剂。在另一个示例中，可以修饰羧肽酶以产生选择性结合特定CTAA的结合剂。还可以设计或修饰和利用结合剂以特异性结合修饰的NTAA或修饰的CTAA，例如具有翻译后修饰的(例如磷酸化NTAA或磷酸化CTAA)，或用标记(例如，PTC、1-氟-2,4-二硝基苯(使用Sanger试剂，DNFB)、丹磺酰氯(使用DNS-Cl、或1-二甲氨基萘-5-磺酰氯)、或使用硫代酰化试剂、硫代乙酰化试剂、乙酰化试剂、酰胺化(胍基化)试剂或硫代苄基化试剂)修饰的。蛋白质定向进化的策略是本领域已知的(例如，Yuan等人，2005，Microbiol.Mol.Biol.Rev.69:373-392)，并包括噬菌体展示、核糖体展示、mRNA展示、CIS展示、CAD展示、乳液、细胞表面展示法、酵母表面展示、细菌表面展示等。

在一些实施方式中，可以利用选择性结合标记的或官能化的NTAA的结合剂。例如，NTAA可与苯基异硫氰酸酯(PITC)反应而形成苯基硫代氨基甲酰基-NTAA衍生物。以这种方式，可定制结合剂选择性结合苯基硫代氨基甲酰基部分的苯基基团以及NTAA的α-碳R基团二者。以这种方式使用PITC，允许后续通过如下所述的Edman降解消除NTAA。在另一个实施方式中，NTAA可与Sanger试剂(DNFB)反应，生成DNP标记的NTAA。任选地，DNFB与高度溶解DNFB的离子液体例如1-乙基-3-甲基咪唑双[(三氟甲基)磺酰]亚胺([emim][Tf2N])一起使用。以这种方式，可工程改造结合剂以选择性结合DNP和NTAA上R基团的组合。DNP部分的添加为结合剂与NTAA的相互作用提供了更大的“操纵杆”，并应导致更高的亲和力相互作用。

在又一个实施方式中，结合剂可以是修饰的氨肽酶。在一些实施方式中，结合剂可以是经工程改造以识别DNP-标记的NTAA的修饰的氨肽酶，提供对肽的氨肽酶降解的循环控制。一旦DNP标记的NTAA被消除，就进行另一个DNFB衍生化循环，以结合并消除新暴露的NTAA。在优选的特定实施方式中，氨肽酶是单体金属蛋白酶，例如被锌激活的氨肽酶(Calcagno等人，Appl Microbiol Biotechnol.(2016)100(16):7091-7102)。在另一个示例中，结合剂可选择性地与例如通过使用4-磺酰基-2-硝基氟苯(SNFB)而被磺酰基硝基苯酚(SNP)修饰的NTAA结合。可用于NTAA官能化的其它试剂包括异硫氰酸三氟乙酯、异硫氰酸烯丙酯和二甲基氨基偶氮苯异硫氰酸酯，或如国际专利公布No.WO 2019/089846中所述的试剂。

可以对结合剂进行工程改造，使其对修饰的NTAA具有高亲和力、对修饰的NTAA具有高特异性、或二者兼而有之。在一些实施方式中，可以通过使用噬菌体展示，定向进化有希望的亲和支架来开发结合剂。

在另一个示例中，文献中也描述了高度选择性的工程化ClpS。Emili等人描述了通过噬菌体展示来定向进化大肠杆菌ClpS蛋白，产生了四种能够选择性结合天冬氨酸、精氨酸、色氨酸和亮氨酸残基的NTAA的不同变体(美国专利公布9,566,335，通过引用整体并入)。在一个实施方式中，结合剂的结合部分包含参与天然N端蛋白识别和结合的进化上保守的ClpS衔接蛋白家族的成员，或其变体(例如，参见Schuenemann等人，(2009)EMBOReports 10(5)；Roman-Hernandez等人，(2009)PNAS 106(22):8888-93；Guo等人，(2002)JBC277(48):46753-62；Wang等人，(2008)Molecular Cell 32:406-414)。在一些实施方式中，修饰Schuenemann等人鉴定的ClpS疏水结合袋的对应氨基酸残基，以产生具有期望的选择性的结合部分。

在一个实施方式中，结合部分包含UBR框识别序列家族的成员，或UBR框识别序列家族的变体。UBR识别框在Tasaki等人，(2009)，JBC 284(3):1884-95中描述。例如，结合部分可包含UBR1、UBR2或其突变体、变体或同源物。

在某些实施方式中，除结合部分之外，结合剂还包含一种或多种可检测标记，例如荧光标记。在一些实施方式中，结合剂不包含多核苷酸，例如代码标签。任选地，结合剂包含合成或天然抗体。在一些实施方式中，结合剂包含适配体。在一个实施方式中，结合剂包含多肽例如ClpS衔接蛋白家族的修饰成员、例如大肠杆菌ClpS结合多肽的变体，和可检测标记。在一个实施方式中，可检测标记是光学可检测的。在一些实施方式中，可检测标记包括荧光部分、颜色编码的纳米粒子、量子点或其任何组合。在一个实施方式中，标记包括包含型芯染料分子的聚苯乙烯染料，所述型芯染料例如FluoSphere^TM、尼罗红、荧光素、罗丹明、衍生罗丹明染料例如TAMRA、磷光体、polymethadine染料、荧光亚磷酰胺、TEXAS RED、绿色荧光蛋白、吖啶、花青、花青5染料、花青3染料、5-(2'-氨基乙基)-氨基萘-1-磺酸(EDANS)、BODIPY、120ALEXA、或上前述任何一种的衍生物或修饰物。在一个实施方式中，可检测标记具有抗光致退色性，同时在唯一且易于检测的波长下产生大量信号(如光子)，具有高信噪比。

在一个特定实施方式中，对抗运载蛋白进行工程改造以对标记的NTAA(例如PTC、修饰的PTC、Cbz、DNP、SNP、乙酰基、胍基、氨基胍基、杂环甲亚胺等标记)具有高亲和力和高特异性。某些种类的抗运载蛋白支架由于其β桶状结构而具有适合结合单个氨基酸的形状。N端氨基酸(无论有或没有修饰)都可能适合这个“β桶状”桶并被其识别。具有工程化新结合活性的高亲和力抗运载蛋白已有描述(Skerra，2008，FEBS J.275:2677-2683中的综述)。例如，已经工程改造了对荧光素和洋地黄毒苷具有高亲和力结合(低nM)的抗运载蛋白(Gebauer等人，2012，Methods Enzymol 503:157-188.)。用于新结合功能的替代支架的工程也已由Banta等人综述(2013，Annu.Rev.Biomed.Eng.15:93-113)。

给定单价结合剂的功能性亲和力(亲合力)可通过使用该单价结合剂的二价或更高阶多聚体而增加至少一个数量级(Vauquelin等人，2013，Br J Pharmacol 168(8):1771-1785.2013)。亲合力是指多重、同时、非共价结合相互作用的累积强度。单一结合相互作用可能容易分离。然而，当多个结合相互作用同时存在时，单一结合相互作用的短暂分离不会使结合蛋白散开，结合相互作用可能被修复。增加结合剂亲合力的替代方法是在附着于结合剂的代码标签和与多肽缔合的记录标签中包括互补序列。

在一些实施方式中，结合剂源自于生物的、天然存在的、非天然存在的或合成的来源。在一些示例中，结合剂源自于从头蛋白质设计(Huang等人，(2016)537(7620):320-327)。在一些示例中，结合剂具有根据第一原理设计的结构、序列和/或活性。

在一些实施方式中，可以采用选择性结合修饰的C端氨基酸(CTAA)的结合剂。羧肽酶是切割/消除含有游离羧基基团的末端氨基酸的蛋白酶。许多羧肽酶表现出氨基酸偏好，例如，羧肽酶B优先在碱性氨基酸、例如精氨酸和赖氨酸处切割。可以修饰羧肽酶以产生选择性结合特定氨基酸的结合剂。在一些实施方式中，羧肽酶可以被工程改造以选择性地结合修饰部分以及CTAA的α-碳R基团二者。因此，工程化的羧肽酶可特异性识别20种代表C端标记环境中的标准氨基酸的不同CTAA。通过使用仅在标记存在下才具有活性(例如，结合活性或催化活性)的工程化羧肽酶，实现了对从肽的C端起逐步降解的控制。在一个示例中，CTAA可被对硝基苯胺或7-氨基-4-甲基香豆素基基团修饰。

可以被工程改造以产生用于本文所述方法的结合剂的其它潜在支架包括：抗运载蛋白，脂质运载蛋白，氨基酸tRNA合成酶(aaRS)，ClpS，

Adnectin^TM，T细胞受体，锌指蛋白，硫氧还蛋白，GST A1-1，DARPin，affimer，affitin，α抗体，avimer，monobody，抗体，单域抗体，纳米抗体，EETI-II，HPSTI，内抗体，PHD指，V(NAR)LDTI，evibody，Ig(NAR)，扭结菌素(knottin)，maxibody，微体(microbody)，新制癌菌素，pVIII，淀粉酶抑肽(tendamistat)，VLR，蛋白A支架，MTI-II，大肠杆菌素(ecotin)，GCN4，Im9，kunitz结构域，PBP，trans-body，四连蛋白，WW结构域，CBM4-2，DX-88，GFP，iMab，Ldl受体结构域A，Min-23，PDZ-结构域，禽胰多肽，卡律蝎毒素(charybdotoxin)/10Fn3，结构域抗体(Dab)，a2p8锚蛋白重复序列，昆虫防御A肽，设计的AR蛋白，C型凝集素结构域，葡萄球菌核酸酶，Src同源结构域3(SH3)，或Src同源结构域2(SH2)。例如，参见El-Gebali等人，(2019)Nucleic AcidsResearch 47:D427–D432和Finn等人，(2013)Nucleic Acids Res.42(数据库专辑):D222–D230。在一些实施方式中，结合剂源自于结合一种或多种氨基酸的酶(例如氨肽酶)。在某些实施方式中，结合剂可以源自于抗运载蛋白或Clp蛋白酶衔接蛋白(ClpS)。

与未修饰或未标记的氨基酸相比，结合剂可优选结合通过化学或酶促手段修饰或标记的氨基酸(例如，已被试剂(例如，化合物)官能化的氨基酸)。例如，结合剂可优选与被乙酰基部分、Cbz部分、鸟苷基部分、丹磺酰基部分、PTC部分、DNP部分、SNP部分、二杂环甲亚胺部分等官能化的氨基酸结合，胜过与不具有所述部分的氨基酸结合。在一些实施方式中，结合剂可优选与已如国际专利公布No.WO 2019/089846所述被官能化或修饰的氨基酸结合。在一些情况下，结合剂可结合翻译后修饰的氨基酸。因此，在某些实施方式中，与多肽相关的延伸核酸包含与所述多肽的氨基酸序列和翻译后修饰有关的代码标签信息。在一些实施方式中，内部翻译后修饰的氨基酸(例如，磷酸化、糖基化、琥珀酰化、泛素化、S-亚硝基化、甲基化、N-乙酰化、脂化等)的检测在检测和消除末端氨基酸(例如，NTAA或CTAA)之前完成。在一个示例中，将肽与针对PTM修饰的结合剂接触，并将缔合的代码标签信息传递到与固定化肽缔合的记录标签上。一旦与氨基酸修饰相关的代码标签信息的检测和传递完成，就可以在使用N端或C端降解方法检测和传递初级氨基酸序列的代码标签信息之前去除PTM修饰基团。因此，所生成的延伸核酸指示肽序列中存在的翻译后修饰，尽管不是依次的顺序，以及一级氨基酸序列信息。

在一些实施方式中，内部翻译后修饰氨基酸的检测可与一级氨基酸序列的检测同时发生。在一个示例中，NTAA(或CTAA)与对翻译后修饰的氨基酸特异性的结合剂接触，所述结合剂是单独的或作为结合剂文库(例如，由20种标准氨基酸和选定的翻译后修饰的氨基酸的结合剂组成的文库)的一部分。接下来是末端氨基酸消除和与结合剂(或结合剂文库)接触的接连循环。因此，与固定化肽缔合的记录标签上生成的延伸核酸表明在一级氨基酸序列的环境下翻译后修饰的存在和顺序。

在某些实施方式中，大分子，例如多肽，也与非关联结合剂接触。如本文所用的非关联结合剂是指对与所考虑的特定多肽不同的多肽特征或组分具有选择性的结合剂。例如，如果n NTAA是苯丙氨酸，并且肽分别与对苯丙氨酸、酪氨酸和天冬酰胺具有选择性的三种结合剂接触，则对苯丙氨酸有选择性的结合剂将是能够选择性结合第n位NTAA(即苯丙氨酸)的第一结合剂，而其它两种结合剂将是该肽的非关联结合剂(因为它们对苯丙氨酸以外的NTAA有选择性)。然而，酪氨酸和天冬酰胺结合剂可以是对样本中其它肽的关联结合剂。如果然后从肽中切割出n NTAA(苯丙氨酸)，从而将肽的n-1氨基酸转化为n-1NTAA(例如，酪氨酸)，然后将肽与相同的三种结合剂接触，则对酪氨酸有选择性的结合剂是能够选择性结合n-1NTAA(即酪氨酸)的第二结合剂，而另外两种结合剂将是非关联结合剂(因为它们对酪氨酸以外的NTAA有选择性)。

因此，应当理解，剂是结合剂还是非关联结合剂将取决于当前可用于结合的特定多肽特征或组分的性质。此外，如果在多重反应中分析多种多肽，则一种多肽的结合剂可以是另一种多肽的非关联结合剂，反之亦然。因此，应当理解，以下关于结合剂的描述适用于本文所述的任何类型的结合剂(即关联和非关联结合剂二者)。

所描述的任何结合剂都包含含有关于该结合剂的标识信息的代码标签。代码标签是约3个碱基至约100个碱基的核酸分子，其为其相关结合剂提供唯一标识信息。代码标签可包含约3至约90个碱基、约3至约80个碱基、约3至约70个碱基、约3至约60个碱基、约3个碱基至约50个碱基、约3个碱基至约40个碱基、约3个碱基至约30个碱基、约3个碱基至约20个碱基、约3个碱基至约10个碱基、或约3个碱基至约8个碱基。在一些实施方式中，代码标签的长度为约3个碱基、4个碱基、5个碱基、6个碱基、7个碱基、8个碱基、9个碱基、10个碱基、11个碱基、12个碱基、13个碱基、14个碱基、15个碱基、16个碱基、17个碱基、18个碱基、19个碱基、20个碱基、25个碱基、30个碱基、35个碱基、40个碱基、55个碱基、60个碱基、65个碱基、70个碱基、75个碱基、80个碱基、85个碱基、90个碱基、95个碱基或100个碱基。代码标签可由DNA、RNA、多核苷酸类似物或其组合构成。多核苷酸类似物包括PNA、gPNA、BNA、GNA、TNA、LNA、吗啉代多核苷酸、2’-O-甲基多核苷酸、烷基核糖基取代的多核苷酸、硫代磷酸酯多核苷酸和7-脱氮嘌呤类似物。

代码标签包含提供关于相关结合剂的标识信息的编码区序列。编码区序列为约3个碱基至约30个碱基、约3个碱基至约20个碱基、约3个碱基至约10个碱基、或约3个碱基至约8个碱基。在一些实施方式中，编码区序列的长度为约3个碱基、4个碱基、5个碱基、6个碱基、7个碱基、8个碱基、9个碱基、10个碱基、11个碱基、12个碱基、13个碱基、14个碱基、15个碱基、20个碱基、25个碱基或30个碱基。编码区序列的长度决定了可以生成的唯一编码区序列的数量。较短的编码序列产生较少数量的唯一编码序列，这在使用少量结合剂时可能是有用的。在一个具体的实施方式中，结合剂文库使用一组>50个唯一编码区序列。

在一些实施方式中，结合剂文库内的每种唯一结合剂具有唯一编码区序列。例如，20个唯一编码区序列可用于与20种标准氨基酸结合的20种结合剂的文库。额外的代码标签序列可用于标识修饰的氨基酸(例如，翻译后修饰的氨基酸)。在另一个示例中，30个唯一编码区序列可用于与20种标准氨基酸和10种翻译后修饰氨基酸(例如，磷酸化氨基酸、乙酰化氨基酸、甲基化氨基酸)结合的30种结合剂的文库。在其它实施方式中，两种或更多种不同的结合剂可以共有相同的编码区序列。例如，各自与不同的标准氨基酸结合的两个结合剂可共有相同的编码区序列。

在某些实施方式中，代码标签还在一端或两端包含间隔区序列。间隔区序列为约1个碱基至约20个碱基、约1个碱基至约10个碱基、约5个碱基至约9个碱基、或约4个碱基至约8个碱基。在一些实施方式中，间隔区的长度为约1个碱基、2个碱基、3个碱基、4个碱基、5个碱基、6个碱基、7个碱基、8个碱基、9个碱基、10个碱基、11个碱基、12个碱基、13个碱基、14个碱基、15个碱基或20个碱基。在一些实施方式中，代码标签内的间隔区比编码区序列短，例如，比编码区序列短至少1个碱基、2个碱基、3个碱基、4个碱基、5个碱基、6个碱基、7个碱基、8个碱基、9个碱基、10个碱基、11个碱基、12个碱基、13个碱基、14个碱基、15个碱基、20个碱基、或25个碱基。在其它实施方式中，代码标签内的间隔区与编码区序列的长度相同。在某些实施方式中，间隔区是结合剂特异性的，因此来自先前结合循环的间隔区仅与来自当前结合循环中的适当结合剂的间隔区相互作用。例子将是关联抗体对，它们含有的间隔区序列仅在这两种抗体相继与多肽结合的情况下才允许信息传递。间隔区序列可用作引物延伸反应的引物退火位点，或连接反应中的夹板或粘性末端。代码标签上的5’间隔区可任选含有对记录标签上3’间隔区的伪互补碱基以增加T_m(Lehoud等人，2008，Nucleic AcidsRes.36:3409-3419)。在其它实施方式中，结合剂文库内的代码标签不具有结合循环特异性的间隔区序列。

在一个示例中，两种或更多种各自与不同靶标结合的结合剂具有共有相同间隔区的相关代码标签。在一些情况下，与两种或更多种结合剂相关的代码标签共有具有相同序列或其一部分的代码标签。

在一些实施方式中，结合剂的集合内的代码标签共有用于测定的共同间隔区序列(例如多结合循环方法中使用的整个结合剂文库在其代码标签中具有共同的间隔区)。在另一个实施方式中，代码标签包含标识特定结合循环的结合循环标记。在其它实施方式中，结合剂文库内的代码标签具有结合循环特异性的间隔区序列。在一些实施方式中，代码标签包含一个结合循环特异性间隔区序列。例如，用于第一个结合循环中的结合剂的代码标签包含“循环1”特异性间隔区序列，用于第二个结合循环中的结合剂的代码标签包含“循环2”特异性间隔区序列，依此类推直至“n”个结合循环。在其它实施方式中，用于第一个结合循环中的结合剂的代码标签包含“循环1”特异性间隔区序列和“循环2”特异性间隔区序列，用于第二个结合循环中的结合剂的代码标签包含“循环2”特异性间隔区序列和“循环3”特异性间隔区序列，依此类推直至“n”个结合循环。在一些实施方式中，间隔区序列包含足够数量的碱基以退火到记录标签或延伸记录标签中的互补间隔区序列上，以启动引物延伸反应或粘性末端连接反应。

在一些实施方式中，与在交替循环中用于结合的结合剂相关的代码标签包含不同的结合循环特异性间隔区序列。例如，用于第一个结合循环中的结合剂的代码标签包含“循环1”特异性间隔区序列，用于第二个结合循环中的结合剂的代码标签包含“循环2”特异性间隔区序列，用于第三个结合循环中的结合剂的代码标签也包含“循环1”特异性间隔区序列，用于第四个结合循环中的结合剂的代码标签包含“循环2”特异性间隔区序列。以这种方式，不需要每个循环都有循环特异性间隔区。

当记录标签群与多肽缔合时，也可以使用循环特异性间隔区序列将代码标签的信息串联到单个记录标签上。第一个结合循环将信息从代码标签传递到随机选择的记录标签，随后的结合循环可以使用循环依赖性间隔区序列来仅引发延伸记录标签。更具体地说，用于第一个结合循环中的结合剂的代码标签包含“循环1”特异性间隔区序列和“循环2”特异性间隔区序列，用于第二个结合循环中的结合剂的代码标签包含“循环2”特异性间隔区序列和“循环3”特异性间隔区序列，依此类推直至“n”个结合循环。来自第一个结合循环的结合剂的代码标签能够通过互补的循环1特异性间隔区序列退火到记录标签上。在将代码标签信息传递到记录标签后，循环2特异性间隔区序列在结合循环1完成时位于延伸记录标签的3’端。来自第二个结合循环的结合剂的代码标签能够通过互补的循环2特异性间隔区序列退火到延伸记录标签上。在将代码标签信息传递到延伸记录标签后，循环3特异性间隔区序列在结合循环2完成时位于所述延伸记录标签的3'端，以此类推直至“n个”结合循环。该实施方式提供了在多个结合循环之中的特定结合循环中的结合信息传递将仅发生在已经历了之前结合循环的(延伸的)记录标签上。然而，有时结合剂可能未能与关联多肽结合。在每个结合循环之后作为“追赶(chase)”步骤的包含结合循环特异性间隔区的寡核苷酸可以用于保持结合循环同步，即使在结合循环失败事件的情况下也是如此。例如，如果关联结合剂在结合循环1期间未能与多肽结合，则在结合循环1之后使用包含循环1特异性间隔区、循环2特异性间隔区和“无效”编码区序列的寡核苷酸来添加追赶步骤。“无效”编码区序列可以是编码区序列不存在，或优选地，正确标识“无效”结合循环的特异性条形码。“无效”寡核苷酸能够通过循环1特异性间隔区退火到记录标签上，并将循环2特异性间隔区转移到记录标签上。因此，尽管结合循环1事件失败，来自结合循环2的结合剂仍能够通过循环2特异性间隔区退火到延伸记录标签上。“无效”寡核苷酸在延伸记录标签内将结合循环1标记为失败结合事件。

在一个实施方式中，代码标签中使用结合循环特异性编码区序列。结合循环特异性编码区序列可通过使用完全唯一的分析物(例如，NTAA)结合循环编码区条形码或通过组合使用接合到循环特异性条形码的分析物(例如，NTAA)编码区序列来实现。使用组合方法的优点是需要设计的条形码总数较少。对于在10个循环中使用的一组20种分析物结合剂，只需要设计20个分析物编码区序列条形码和10个结合循环特异性条形码。相反，如果将结合循环直接嵌入到结合剂编码区序列中，则可能需要设计总共200个独立的编码区条形码。将结合循环信息直接嵌入编码区序列的优点是，当使用纠错条形码时，代码标签的总长度可以最小化。使用容错条形码允许使用更容易出错的测序平台和方法进行高准确度的条形码标识，而且具有其它优点，例如分析速度快、成本较低和/或更便携的仪器。

在一些实施方式中，代码标签在第二最靠近结合剂的(3’)间隔区序列内包含可切割或可切口的DNA链。例如，3’间隔区可具有一个或多个可以被尿嘧啶特异性切除试剂(USER)切口的尿嘧啶碱基。USER在尿嘧啶的位置处产生单核苷酸缺口。在另一个示例中，3’间隔区可包含用于仅水解双链体的一条链的切口核酸内切酶的识别序列。优选地，用于切割或切口3’间隔区序列的酶仅作用于一条DNA链(代码标签的3’间隔区)，使得双链体内属于(延伸的)记录标签的另一条链保持完整。这些实施方式在分析天然构象的蛋白质的测定中特别有用，因为它允许在引物延伸发生后从(延伸的)记录标签中无变性地去除结合剂，并在延伸记录标签上留下可用于后续结合循环的单链DNA间隔区序列。

代码标签也可设计成包含回文序列。将回文序列包含到代码标签中允许新生的、生长的、延伸记录标签在代码标签信息传递时自身折叠。延伸记录标签折叠成更紧凑的结构，有效减少了不希望的分子间结合和引物延伸事件。

延伸记录标签可以使用包含分析物特异性间隔区和编码区序列的代码标签从一系列结合事件中构建。在一个实施方式中，第一结合事件使用具有代码标签的结合剂，所述代码标签包含通用3’间隔区引物序列和在5'端用于下一个结合循环的分析物特异性间隔区序列；然后后续的结合循环使用具有编码的分析物特异性3’间隔区序列的结合剂。该设计导致仅从一系列正确的关联结合事件创建可扩增的文库元件。脱靶和交叉反应性结合相互作用将导致不可扩增的延伸记录标签。在一个示例中，在两个结合循环中使用特定多肽分析物的一对关联结合剂来标识所述分析物。第一个关联结合剂含有的代码标签包含用于在记录标签的通用间隔区序列上引发延伸的通用间隔区3’序列、以及在5’'端的将在下一结合循环中使用的编码的分析物特异性间隔区。对于匹配的关联结合剂对，第二结合剂的3’分析物特异性间隔区与第一结合剂的5’分析物特异性间隔区匹配。以这种方式，只有关联结合剂对的正性结合才会产生可扩增的延伸记录标签。交叉反应性结合剂将不能在记录标签上引发延伸，并且不会产生可扩增的延伸记录标签产物。这种方法极大地增强了本文公开的方法的特异性。相同的原理可以应用于三联体结合剂组，其中使用了3个结合循环。在第一个结合循环中，记录标签上的通用3’Sp序列与结合剂代码标签上的通用间隔区相互作用。引物延伸将包括分析物特异性5’间隔区在内的代码标签信息传递到记录标签。随后的结合循环使用在结合剂的代码标签上的分析物特异性间隔区。

在某些实施方式中，代码标签还可包含与代码标签连接的结合剂的唯一分子标识符。

代码标签可包括在3’间隔区序列的3’端并入的终止子核苷酸。结合剂与多肽结合并且它们的相应代码标签和记录标签通过互补的间隔区序列退火后，引物延伸可以将信息从代码标签传递到记录标签，或将信息从记录标签传递到代码标签。在代码标签的3’端添加终止子核苷酸防止记录标签信息传递到代码标签。应理解，对于本文所述的涉及产生延伸的代码标签的实施方式，可优选在记录标签的3’端包括终止子核苷酸以防止代码标签信息传递到记录标签。

代码标签可以是单链分子、双链分子或部分双链的。代码标签可包含平端、突出端或各一个。在一些实施方式中，代码标签是部分双链的，这防止代码标签退火到增长中的延伸记录标签中的内部编码区和间隔区序列上。在一些实施方式中，代码标签包括发夹结构。在某些实施方式中，发夹结构包含通过核酸链连接的相互互补的核酸区域。在一些实施方式中，核酸发夹结构也可以进一步包含从双链的茎段延伸的3'和/或5'单链区域。在一些示例中，发夹结构包含单链核酸。

在一些实施方式中，代码标签序列可以针对特定的测序分析平台进行优化。在一个特定实施方式中，测序平台是纳米孔测序。在一些实施方式中，测序平台的每碱基错误率>1％、>5％、>10％、>15％、>20％、>25％、或>30％。例如，如果要使用纳米孔测序仪器分析延伸的核酸，则可以将条形码序列(例如，包含来自代码标签的标识信息的序列)设计成在穿过纳米孔的运送中可最佳以电学方式区分。

在一些实施方式中，代码标签可包括在3'间隔区序列的3’端并入的终止子核苷酸。结合剂与大分子结合并且它们的相应代码标签和记录标签通过互补的间隔区序列退火后，引物延伸可以将信息从代码标签传递到记录标签，或将信息从记录标签传递到代码标签。在代码标签的3’端添加终止子核苷酸防止记录标签信息传递到代码标签。应理解，对于本文所述的涉及产生延伸的代码标签的实施方式，可优选在记录标签的3’端包括终止子核苷酸以防止代码标签信息传递到记录标签。

代码标签可以通过本领域已知的任何手段，包括共价和非共价相互作用，直接或间接地与结合剂接合。在一些实施方式中，代码标签可以酶促或化学方式与结合剂接合。在一些实施方式中，代码标签可以通过连接法与结合剂连接合。在其它实施方式中，代码标签通过亲和结合对(例如，生物素和链霉亲和素)与结合剂接合。在一些情况下，代码标签可以与非天然氨基酸的结合剂接合，例如通过与非天然氨基酸的共价相互作用接合。

在一些实施方式中，结合剂通过SpyCatcher-SpyTag相互作用与代码标签接合。SpyTag肽通过自发的异肽键与SpyCatcher蛋白形成不可逆的共价键，从而提供了一种基因编码方式来产生抵抗力和苛刻条件的肽相互作用(Zakeri等人，2012，Proc.Natl.Acad.Sci.109:E690-697；Li等人，2014，J.Mol.Biol.426:309-317)。结合剂可表达为包含SpyCatcher蛋白的融合蛋白。在一些实施方式中，SpyCatcher蛋白附加在结合剂的N端或C端。SpyTag肽可以使用标准缀合化学与代码标签偶联(BioconjugateTechniques，G.T.Hermanson，Academic Press(2013))。

在一些实施方式中，使用基于酶的策略将结合剂与代码标签接合。例如，可以使用甲酰甘氨酸(FGly)生成酶(FGE)将结合剂与代码标签接合。在一个示例中，使用蛋白质、例如SpyLigase将结合剂与代码标签接合(Fierer等人，Proc Natl Acad Sci U S A.2014；111(13):E1176–E1181)。

在其它实施方式中，结合剂通过SnoopTag-SnoopCatcher肽-蛋白质相互作用与代码标签接合。SnoopTag肽与SnoopCatcher蛋白形成异肽键(Veggiani等人，Proc.Natl.Acad.Sci.USA，2016，113:1202-1207)。结合剂可表达为包含SnoopCatcher蛋白的融合蛋白。在一些实施方式中，SnoopCatcher蛋白附加在结合剂的N端或C端。SnoopTag肽可以使用标准缀合化学与代码标签偶联

在别的其它实施方式中，结合剂通过

蛋白融合标签及其化学配体与代码标签接合。HaloTag是一种经过修饰的卤代烷脱卤酶，旨在与合成配体共价结合(HaloTagligands)(Los等人，2008，ACS Chem.Biol.3:373-382)。合成配体包含与多种有用分子相连的氯代烷接头。HaloTag和氯代烷接头之间形成了高度特异性的共价键，该共价键在生理条件下迅速发生，并且基本上是不可逆的。

在一些情况下，结合剂通过使用酶、例如分选酶介导的标记进行附着(缀合)而与代码标签接合(例如，参见Antos等人，CurrProtoc Protein Sci.(2009)第15章：15.3单元；国际专利公布No.WO2013003555)。分选酶催化转肽反应(例如，参见Falck et al，Antibodies(2018)7(4):1-19)。在一些方面，结合剂用一个或多个N端或C端甘氨酸残基修饰或与所述残基相连。

在一些实施方式中，使用半胱氨酸生物缀合方法将结合剂与代码标签接合。在一些实施方式中，使用π-钳介导法半胱氨酸生物缀合将结合剂与代码标签接合。(例如，参见Zhang等人，Nat Chem.(2016)8(2):120-128)。在一些情况下，使用3-芳基丙腈(APN)介导的加标签将结合剂与代码标签接合(例如Koniev等人，Bioconjug Chem.2014；25(2):202-206)。

在一些实施方式中，结合剂直接或间接地与多聚化结构域联接。因此，本文提供了包含一种或多种结合剂的单体、二聚和更高级(例如，3、4、5或更多)多聚多肽。在一些具体实施方式中，结合剂是二聚的。在一些示例中，本发明的两个多肽可以共价或非共价地彼此相连以形成二聚体。

在一些实施方式中，第一结合剂和第二结合剂与多肽以及任选的任何其它结合剂(例如，第三结合剂、第四结合剂、第五结合剂等)的接触同时进行。例如，第一结合剂和第二结合剂、以及任选的任何其它顺序的结合剂，可以汇集在一起，例如形成结合剂文库。在另一个示例中，将第一结合剂和第二结合剂，以及任选的任何其它顺序的结合剂，并不汇集在一起，而是同时添加到多肽中。在一个实施方式中，结合剂文库包含至少20种结合剂，其选择性地结合20种标准的天然存在氨基酸。在一些实施方式中，结合剂文库可包含选择性结合修饰氨基酸的结合剂。

在其它实施方式中，将第一结合剂和第二结合剂，以及任选的任何其它顺序的结合剂，各自在单独的结合循环中与多肽接触，以相继的次序添加。在某些实施方式中，多种结合剂同时并行使用。这种并行方法节省了时间并减少了非关联结合剂与关联结合剂所结合的位点的非特异性结合(因为结合剂有竞争)。

在某些实施方式中，控制溶液中结合剂的浓度以减少测定的背景和/或假阳性结果。

在一些实施方式中，结合剂的浓度可以是任何合适的浓度，例如，为约0.0001nM、约0.001nM、约0.01nM、约0.1nM、约1nM、约2nM、约5nM、约10nM、约20nM、约50nM、约100nM、约200nM、约500nM，或约1,000nM。在其它实施方式中，所述测定中使用的可溶性缀合物的浓度在约0.0001nM和约0.001nM之间、约0.001nM和约0.01nM之间、约0.01nM和约0.1nM之间、约0.1nM和约1nM之间、约1nM和约2nM之间、约2nM和约5nM之间、约5nM和约10nM之间、约10nM和约20nM之间、约20nM和约50nM之间、约50nM和约100nM之间、约100nM和约200nM之间、约200nM和约500nM之间、约500nM和约1000nM之间，或大于约1,000nM。

在一些实施方式中，可溶性结合剂分子与固定化大分子、例如多肽之间的比率可以在任何合适的范围，例如为约0.00001:1、约0.0001:1、约0.001:1、约0.01:1、约0.1:1、约1:1、约2:1、约5:1、约10:1、约15:1、约20:1、约25:1、约30:1、约35:1、约40:1、约45:1、约50:1、约55:1、约60:1、约65:1、约70:1、约75:1、约80:1、约85:1、约90:1、约95:1、约100:1、约104:1、约105:1、约106:1或更高，或上述比率之间的任何比率。可溶性结合剂分子与固定化多肽和/或核酸之间的较高比率可以用于驱动结合和/或代码标签信息传递完成。这对于检测和/或分析样本中的低丰度多肽可能特别有用。

在一些实施方式中，结合剂与用于大分子分析测定的温度相容。结合剂可表现出期望的特性，例如稳定性、溶解性以及与大分子分析测定的其它组分的相容性。在一些示例中，结合剂与(直接或间接地)接合大分子(例如，多肽)的表面相容。在一些实施方式中，结合剂表现出与表面的非特异性结合低。

2.氨基酸切割

在一些实施方式中，在标识信息从代码标签传递到记录标签之后，从肽中去除、切割或消除至少一个末端氨基酸。在一些实施方式中，所述至少一个去除的末端氨基酸包括修饰的氨基酸。在一些实施方式中，所述至少一个去除的末端氨基酸包括未修饰的氨基酸。在涉及使用基于降解的方式分析肽或多肽的方法的实施方式中，在第一结合剂与n个氨基酸的肽的N端氨基酸(例如，NTAA)接触和结合并将第一结合剂的代码标签信息传递到与所述肽相关的核酸上、从而产生第一级延伸核酸(例如，在记录标签上)之后，如本文所述消除或去除NTAA。通过与酶和/或化学试剂接触去除N-标记的NTAA将肽的n-1氨基酸转化为N端氨基酸，其在本文中称为n-1NTAA。第二结合剂与肽接触并与n-1NTAA结合，将第二结合剂的代码标签信息传递到第一级延伸核酸，从而产生第二级延伸核酸(例如，用于生成代表所述肽的串联的第n级核酸核酸)。消除n-1标记NTAA的将肽的n-2氨基酸转化为N端氨基酸，在本文中称为n-2NTAA。附加的结合、传递、标记和去除可以如上所述发生，直至n氨基酸，以产生第n级延伸核酸或n个单独的延伸核酸，它们集体表示所述肽。如本文所用的n“级”，当涉及结合剂、代码标签或延伸核酸使用时，是指其中使用结合剂及其相关的代码标签的n结合循环或其中产生延伸核酸(例如在记录标签上)的n结合循环。在一些实施方式中，所述示例性方法中包括NTAA的步骤可以用C端氨基酸(CTAA)代替进行。

在涉及分析肽的某些实施方式中，在末端氨基酸(N端或C端氨基酸)被结合剂结合并将代码标签信息传递到记录标签后，从肽中去除或切割所述末端氨基酸以暴露新的末端氨基酸。在一些实施方式中，末端氨基酸是NTAA。在其它实施方式中，末端氨基酸是CTAA。末端氨基酸的切割可以通过许多已知的技术、包括化学切割和酶切割来完成。在一些实施方式中，对样本(例如多肽)施加微波能量可加速从肽上去除末端氨基酸的反应。在一些情况下，在大分子分析方法的一个或多个步骤期间施加微波能量可减少所述测定的总循环时间。

在一些实施方式中，使用催化标记的末端氨基酸去除的工程酶或促进标记的末端氨基酸去除的试剂。例如，末端氨基酸用PTC、修饰的PTC、Cbz、DNP、SNP、乙酰基、胍基、氨基胍基或杂环亚胺(例如杂环甲亚胺)标记。在一些实施方式中，使用如国际专利公布No.WO2019/089846所述的任何方法去除或消除末端氨基酸。

末端氨基酸的酶促切割可通过氨肽酶或其它肽酶(例如，羧肽酶、二肽基肽酶、二肽基氨肽酶或其变体、突变体或修饰的蛋白质)来完成。氨基肽酶天然作为单体和多聚体酶存在，并且可以是金属或ATP依赖性的。在一些情况下，天然氨肽酶的特异性非常有限，通常以进行性方式切割N端氨基酸，即一个接一个地切去氨基酸(Kishor等人，2015，Anal.Biochem.488:6-8)。对于在此描述的方法，氨肽酶(例如，金属酶氨肽酶)可被工程改造成只有在用N端标记修饰时才具有对NTAA的特异性结合或催化活性。例如，可以对氨肽酶进行工程改造，使其如果被诸如PTC、修饰的PTC、Cbz、DNP、SNP、乙酰基、胍基、氨基胍基、杂环甲亚胺等基团修饰的话，仅切割N端氨基酸。以这种方式，氨肽酶一次只从N端切割单个氨基酸，并允许控制降解循环。在一些实施方式中，修饰的氨肽酶对氨基酸残基身份没有选择性，而对N端标记是选择性的。在其它实施方式中，修饰的氨肽酶对氨基酸残基身份和N端标记均有选择性。结合并切割单个标记的(生物素化)NTAA或其小基团的工程化氨肽酶突变体已有描述(参见，国际专利公布No.WO2010/065322)。在一些情况下，已鉴定出残基特异性氨肽酶(Eriquez等人，J.Clin.Microbiol.1980，12:667-71；Wilce等人，1998，Proc.Natl.Acad.Sci.USA 95:3472-3477；Liao等人，2004，Prot.Sci.13:1802-10)。通过使用仅在标记存在下才具有活性(例如，结合活性或催化活性)的工程化氨肽酶，可实现对肽的N端的逐步降解的控制。

在某些实施方式中，氨肽酶可被工程改造为非特异性的，使其不会选择性识别一种特定的氨基酸胜过其它，而是只识别标记的N末端。在又一个实施方式中，循环切割是通过使用工程化酰基肽水解酶(APH)切割乙酰化NTAA而达成的。在又一个实施方式中，采用NTAA的酰胺化(胍基化)来实现使用NaOH温和切割标记的NTAA(Hamada，(2016)Bioorg MedChem Lett 26(7):1690-1695)。

对于涉及CTAA结合剂的实施方式，从肽中切割CTAA的方法也是本领域已知的。例如，美国专利6,046,053公开了一种将肽或蛋白质与烷基酸酐反应以将羧基端转化为恶唑酮、通过与酸和醇或与酯反应释放C端氨基酸的方法。CTAA的酶切割也可通过羧肽酶完成。几种羧肽酶表现出氨基酸偏好，例如，羧肽酶B优先在碱性氨基酸、例如精氨酸和赖氨酸处切割。如上所述，羧肽酶也可按与氨基肽酶相同的方式进行修饰，以工程改造与具有C端标记的CTAA特异性结合的羧肽酶。以这种方式，羧肽酶一次只从C端切割单个氨基酸，并允许控制降解循环。在一些实施方式中，修饰的羧肽酶对氨基酸残基身份没有选择性，而对N端标记是选择性的。在其它实施方式中，修饰的羧肽酶对氨基酸残基身份和C标记均有选择性。

在一些实施方式中，去除的氨基酸是修饰的氨基酸。例如，试剂可包含酶或化学试剂以去除一个或多个末端氨基酸。例如，在一些情况下，用于消除官能化的NTAA的试剂是羧肽酶、或氨基肽酶、或二肽基肽酶、二肽基氨肽酶或其变体、突变体或修饰蛋白；水解酶或其变体、突变体或修饰蛋白；温和Edman降解；Edmanase酶；TFA，碱；或其任何组合。在一些情况下，去除试剂包括三氟乙酸或盐酸。在一些示例中，去除试剂包括酰基肽水解酶(APH)。在一些实施方式中，去除试剂包括羧肽酶或氨基肽酶或其变体、突变体或修饰蛋白；水解酶或其变体、突变体或修饰蛋白；温和Edman降解试剂；Edmanase酶；无水TFA，碱；或其任何组合。在一些实施方式中，温和Edman降解使用二氯或一氯酸；温和Edman降解使用TFA、TCA或DCA；或温和Edman降解使用三乙胺、三乙醇胺或三乙基乙酸铵(Et₃NHOAc)。

用于去除一种或多种氨基酸的化学试剂可与所述测定中使用的材料相容，例如与核酸记录标签相容。在一些情况下，使用的化学试剂或处理是温和的，并且条件对于核酸记录标签而言在一个或多个处理循环间是稳定的。

在一些情况下，去除氨基酸的试剂包括碱。在一些实施方式中，碱是氢氧化物、烷基化胺、环胺、碳酸盐缓冲剂、磷酸三钠缓冲剂或金属盐。在一些示例中，氢氧化物是氢氧化钠；烷基化胺选自甲胺、乙胺、丙胺、二甲胺、二乙胺、二丙胺、三甲胺、三乙胺、三丙胺、环己胺、苄胺、苯胺、二苯胺、N,N-二异丙基乙胺(DIPEA)、和二异丙基氨基锂(LDA)；环胺选自吡啶、嘧啶、咪唑、吡咯、吲哚、哌啶、吡咯烷、1,8-二氮杂双环[5.4.0]十一碳-7-烯(DBU)、和1,5-二氮杂双环[4.3.0]壬-5-烯(DBN)；碳酸盐缓冲剂包括碳酸钠、碳酸钾、碳酸钙、碳酸氢钠、碳酸氢钾或碳酸氢钙；金属盐包括银；或金属盐是AgClO₄。

在一些实施方式中，所述方法还包括使多肽与肽偶联试剂接触。在一些实施方式中，肽偶联试剂是碳二亚胺化合物。在一些示例中，碳二亚胺化合物是二异丙基碳二亚胺(DIC)或1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)。

III.处理和分析

第I部分中描述的设备和第II部分中的自动化方法可以用于执行大分子分析测定的一个或多个生成延伸记录标签的步骤。在一些实施方式中，生成的延伸记录标签包含来自一个或多个代码标签的标识信息。在一些实施方式中，在确定延伸记录标签的至少一部分序列之前，扩增和/或复制延伸记录标签(或其一部分)。在一些实施方式中，在分析延伸记录标签之前，将延伸记录标签(或其一部分)从大分子(例如，多肽)中释放。在一些实施方式中，所述方法包括收集延伸记录标签。在一些实施方式中，延伸记录标签的扩增、释放、处理和/或收集可以自动化方式进行(例如，通过使用所描述的设备)。在一些情况下，样本在收集前用切割试剂处理。例如，在收集之前从大分子上切割延伸记录标签或其一部分。在一些实施方式中，在使用第I部分的设备或第II部分的方法执行的步骤之后进行延伸记录标签的分析。在一些情况下，所述分析不使用第I部分中描述的设备进行。例如，在分析步骤之前，从设备中移除含有延伸记录标签的样本或其一部分。

通过本文所述的方法产生的最终延伸的核酸(例如，在延伸记录标签上)的长度取决于多种因素，包括代码标签(例如，编码区序列和间隔区)的长度和任何其它核酸的长度(例如，在记录标签上，任选包含任何唯一分子标识符、间隔区、通用引发位点、条形码或其组合)、进行的传递循环数、以及来自每个结合循环的代码标签是否被传递到相同的延伸核酸还是多个延伸核酸。

在一些实施方式中，记录标签从5’到3’方向包含通用正向(或5’)引发序列、UMI和间隔区序列。在一些实施方式中，记录标签从5’到3’方向包含通用正向(或5’)引发序列、任选的UMI、条形码(例如，样本条形码、分区条形码、区室条形码、空间条形码或其任何组合)和间隔区序列。在一些其它实施方式中，记录标签从5’到3’方向包含通用正向(或5’)引发序列、条形码(例如，样本条形码、分区条形码、区室条形码、空间条形码或其任何组合)、任选的UMI和间隔区序列。

在将最终的标签信息从代码标签传递到延伸记录标签之后，可以通过连接、引物延伸或本领域已知的其它方法添加通用反向引发位点来对标签进行加帽(例如，如实施例I中所述的封端)。在一些实施方式中，核酸中的通用正向引发位点(例如，在记录标签上)与附加到最终的延伸核酸的通用反向引发位点相容。在一些实施方式中，通用反向引发位点是Illumina P7引物(5’-CAAGCAGAAGACGGCATACGAGAT–3’-SEQ ID NO:2)或Illumina P5引物(5’-AATGATACGGCGACCACCGA-3’–SEQ ID NO:1)。取决于来自代码标签的标识信息被传递到的核酸的链意义，可附加正义或反义P7。在一些实施方式中，加帽序列可以与代码标签一起包含。例如，加帽步骤可以作为最终编码步骤的一部分进行。延伸核酸文库可以直接从固体载体(例如珠子)上切割或扩增，并用于传统的下一代测序测定和方案。在一些实施方式中，在释放或收集延伸记录标签之前，以自动方式在所述设备上进行加帽反应作为最后一步。

在一些实施方式中，对单链延伸核酸(例如，在记录标签上延伸)的文库进行引物延伸反应以复制其互补链。引物延伸可在从设备上的样本容器中取出样本之前或之后进行。在一些实施方式中，肽测序测定(例如，ProteoCode测定)，以循环的进程包括几个化学和酶促步骤。在一些情况下，单分子测定的一个优点是稳健地减少或最小化各个循环的化学/酶促步骤中的低效率。在一些实施方式中，使用存在于代码标签序列中的循环特异性条形码可能是有利的。

延伸核酸(例如，延伸记录标签)可以使用多种核酸测序方法进行处理和分析。在一些实施方式中，处理和分析含有来自一个或多个代码标签和任何其它核酸组分的信息的延伸记录标签。在一些实施方式中，延伸的记录的集合可以串联。在一些实施方式中，延伸记录标签可以在确定序列之前扩增。延伸记录标签的处理可以在从样本容器中取出样本之前或之后进行。

核酸(例如，延伸核酸)的文库可用多种方式扩增。核酸(例如，包含来自一个或多个探针标签的信息的记录标签)的文库经历指数式扩增，例如，通过PCR或乳液PCR。已知乳液PCR产生更一致的扩增(Hori，Fukano等人，BiochemBiophys Res Commun(2007)352(2):323-328)。或者，核酸(例如，延伸的核酸)的文库可经历进行线性扩增，例如，通过使用T7RNA聚合酶对模板DNA进行体外转录。核酸(例如，延伸的核酸)的文库可以使用与其中所含的通用正向引发位点和通用反向引发位点相容的引物进行扩增。核酸(例如，记录标签)的文库也可以使用加尾引物进行扩增，以向延伸核酸的5’-末端、3’-末端或两端添加序列。可以添加到延伸核酸的末端的序列包括允许在单次测序运行中对多个文库的文库特异性标记序列、接头序列、读取引物序列或用于使延伸核酸的文库与测序平台相容的任何其它序列多路复用。为下一代测序准备的文库扩增的例子如下：使用从～1mg珠子洗脱的延伸核酸文库(～10ng)、200μM dNTP、正向和反向扩增引物各1μM、0.5μl(1U)的Phusion Hot Start酶(New England Biolabs)建立20μl PCR反应体积并经受以下循环条件：98℃下30秒，随后是20个循环的98℃下10秒、60℃下30秒、72℃下30秒，随后是72℃下7分钟，然后保持在4℃。

在某些实施方式中，在扩增之前、期间或之后，核酸(例如，延伸的核酸)的文库可以进行靶标富集。在一些实施方式中，靶标富集可以用于在测序前从延伸核酸的文库中选择性捕获或扩增表示目的大分子(例如多肽)的延伸核酸。在一些方面，用于蛋白质测序的靶标富集具有挑战性，因为成本高并且难以产生靶蛋白的高特异性结合剂。在一些情况下，众所周知，抗体是非特异性的并且难以在数千种蛋白质中大规模产生。在一些实施方式中，本公开的方法通过将蛋白质代码转换成核酸代码来规避这个问题，核酸代码则可以使用各种各样可用于DNA文库的靶向DNA富集策略。在一些情况下，目的肽可以通过富集其相应的延伸核酸而在样本中富集。靶向富集方法是本领域已知的，并且包括杂交捕获测定、基于PCR的测定例如TruSeq custom Amplicon(Illumina)、锁式探针(也称为分子倒置探针)等(参见，Mamanova等人，(2010)Nature Methods 7:111-118；Bodi等人，J.Biomol.Tech.(2013)24:73-86；Ballester等人，(2016)Expert Review of Molecular Diagnostics357-372；Mertes等人，(2011)Brief Funct.Genomics 10:374-386；Nilsson等人，(1994)Science 265:2085-8；它们各自通过引用整体并入本文)。

在一个实施方式中，核酸(例如，延伸核酸)的文库通过基于杂交捕获的测定进行富集。在基于杂交捕获的测定中，延伸核酸的文库与标有亲和标签(例如生物素)的靶标特异性寡核苷酸杂交。与靶标特异性寡核苷酸杂交的延伸核酸通过它们的使用亲和配体的亲和标签(例如链霉亲和素包被的珠子)被“拉下”，并且背景(非特异性)延伸核酸被洗掉。然后获得富集的延伸核酸(例如，延伸核酸)用于正富集(例如，从珠子上洗脱)。在一些实施方式中，与目的肽的相应延伸核酸文库表示互补的寡核苷酸可以用于杂交捕获测定。在一些实施方式中，也可以用相同或不同的诱饵组进行连续轮次或其富集。

为了在表示其片段(例如肽)的延伸核酸文库中富集全长的多肽，可以在该蛋白的整个核酸表示上设计“铺砌的(tiled)”诱饵寡核苷酸。

在另一个实施方式中，基于引物延伸和连接介导的扩增富集(AmpliSeq、PCR、TruSeq TSCA等)可以用于选择和模块化富含表示多肽子集的文库元件的比例。竞争性寡核苷酸也可以用于调整引物延伸、连接或扩增的程度。在最简单的实施中，这可以通过具有包含通用引物尾部的靶标特异性引物和缺乏5’通用引物尾部的竞争引物的混合物来实现。初始引物延伸后，只有出具有5'通用引物序列的引物才可以扩增。有和没有通用引物序列的引物的比率控制扩增的靶标的比例。在其它实施方式中，包含杂交性但非延伸性引物可以用于调整经历引物延伸、连接或扩增的文库元件的比例。

靶向富集方法也可用于负选择模式，以在测序前选择性地从文库中去除延伸核酸。可以去除的不合需要的延伸核酸的例子是那些代表过于丰富的多肽种类例如蛋白质、白蛋白、免疫球蛋白等的核酸。

与靶标杂交但缺少生物素部分的竞争寡核苷酸诱饵也可以用于杂交捕获步骤，以调整所富集的任何特定基因座的比例。竞争寡核苷酸诱饵与标准生物素化诱饵竞争与靶标的杂交，从而有效地调整富集期间拉下的靶标的比例。使用这种竞争性抑制方法，蛋白质表达的十级动态范围可以压缩几级，尤其是对于过于丰富的物种例如白蛋白。因此，对于给定基因座捕获的文库元件相对于标准杂交捕获的比例可以从100％调整到0％富集。

另外，可以使用文库规范化(library normalization)技术从延伸核酸文库中去除过度丰富的物种。这种方法最适用于由位点特异性蛋白酶消化例如胰蛋白酶、LysC、GluC等产生的肽起源的规定长度的文库。在一个示例中，规范化可以通过使双链文库变性并允许文库元件再退火来完成。由于双分子杂交动力学的二级速率常数，丰富的文库元件比不太丰富的元件更迅速地再退火(Bochman，Paeschke等人2012)。可以使用本领域已知的方法，例如在羟磷灰石柱上的色谱法(VanderNoot等人，2012，Biotechniques 53:373-380)或用来自堪察加(Kamchatka)蟹的破坏dsDNA文库元件的双链体特异性核酸酶(DSN)处理文库(Shagin等人，(2002)Genome Res.12:1935-42)，将ssDNA文库元件与丰富的dsDNA文库元件分离。

多肽在附着到固体载体之前和/或所生成的延伸核酸文库的分级分离、富集和扣除方法的任何组合可以节省测序读数并改善低丰度物种的测量。在一些实施方式中，核酸(例如，延伸核酸)的文库通过连接或末端互补PCR进行串联，以产生包含多个不同的延伸记录标签的长DNA分子(Du等人，(2003)BioTechniques 35:66-72；Muecke等人，(2008)Structure 16:837-841；美国专利No.5,834,252，各自通过引用整体并入)。该实施方式对于通过纳米孔测序装置来分析长链DNA的纳米孔测序是优选的。

在一些实施方式中，对包含来自一个或多个代码标签的信息的记录标签或延伸记录标签进行分析和/或测序。在一些情况下，记录标签或延伸记录标签的分析和/或测序使用单独的仪器进行。在一些情况下，从所述设备中取出含有记录标签或延伸记录标签的样本或其部分之后，进行分析和/或测序。在一些实施方式中，对核酸(例如，延伸核酸)进行直接单分子分析(例如，参见Harris等人，(2008)Science 320:106-109)。核酸(例如，延伸核酸)可以在固体载体、例如流动池或与加载到流动池表面(任选图案化的微型池)相容的珠子上直接分析，其中流动池或珠子可以与用单分子测序仪或单分子解码仪整合。对于单分子解码，可以使用几轮混合荧光标记的解码寡核苷酸Gunderson等人，(2004)GenomeRes.14:970-7)的杂交来确定延伸核酸内(例如，在记录标签上)的代码标签的身份和顺序。(在一些实施方式中，结合剂可用如上所述的循环特异性代码标签进行标记(也参见，Gunderson等人，(2004)Genome Res.14:970-7)。

在一些示例中，标记可以使用传统的基于阵列或序列的方法读取。本文所述的方法可以与多种测序技术结合使用。在一些实施方式中，确定靶核酸的核苷酸序列的过程可以是自动化过程。测序方法的例子包括但不限于：链终止测序(Sanger测序)；下一代测序方法，例如合成测序、连接测序、杂交测序、聚合酶克隆测序、离子半导体测序和焦磷酸测序；和第三代测序方法，例如单分子实时测序、基于纳米孔的测序、双链体中断测序、以及使用先进显微镜对DNA直接成像。在一些实施方式中，供本发明使用的测序方法包括但不限于：杂交测序、合成技术测序(例如，HiSeq^TMand Solexa^TM，Illumina)，SMRT^TM(单分子实时)技术(Pacific Biosciences)，真正单分子测序(例如，HeliScope^TM，Helicos Biosciences)，大规模并行下一代测序(例如，SOLiD^TM，Applied Biosciences；Solexa and HiSeq^TM，Illumina)，大规模并行半导体测序(例如，Ion Torrent)，焦磷酸测序技术(例如，GS FLXand GS Junior Systems，Roche/454)，纳米孔序列(例如，Oxford NanoporeTechnologies)。

下一代测序方法的例子包括合成测序、连接测序、杂交测序、聚合酶克隆测序、离子半导体测序和焦磷酸测序。通过将引物连接到固体基体上并将互补序列连接到核酸分子上，核酸分子可以通过引物与固体基体杂交，然后利用聚合酶在固体基体上的分立区域中产生多个拷贝以进行扩增(这些集群有时称为聚合酶克隆)。因此，在测序过程期间，特定位置处的核苷酸可以被多次测序(例如，数百或数千次)——这种覆盖深度被称为“深度测序”。高通量核酸测序技术的例子包括由Illumina、BGI、Qiagen、Thermo-Fisher和Roche提供的平台，包括例如平行珠阵列、合成测序、连接测序、毛细管电泳、电子微芯片、“生物芯片”、微阵列、平行微芯片和单分子阵列的格式，如Service的综述(Science(2006)311:1544-1546)。

本文所述的测序方法的一些实施方案包括合成测序(SBS)技术，例如焦磷酸测序技术。焦磷酸测序检测在特定的核苷酸并入到新生链中时无机焦磷酸盐(PPi)的释放(Ronaghi等人，Analytical Biochemistry 242(1):84-9(1996)；Ronaghi，M.GenomeRes.11(1):3-11(2001)；Ronaghi等人，Science 281(5375):363(1998)；美国专利No.6,210,891；美国专利No.6,258,568和美国专利No.6,274,320，各自通过引用整体并入)。

在另一种示例性SBS类型中，循环测序是通过逐步添加可逆终止子核苷酸来完成的，所述终止子核苷酸含有例如可切割或可光漂白的染料标记，如例如美国专利No.7,427,67、美国专利No.7,414，1163和美国专利No.7,057,026所述，所述美国专利各自通过引用整体并入。这种正在被Illumina Inc.商业化的方法，也在国际专利申请公布No.WO 91/06678和WO 07/123744中描述，所述国际专利申请公布各自通过引用整体并入。其中终止可以被逆转且荧光标记可以被切割的荧光标记终止子的可用性，促进了有效循环的可逆终止(CRT)测序。聚合酶也可以被共同工程改造以有效并入这些修饰的核苷酸和由这些修饰的核苷酸延伸。

可以与本文所述的方法和组成一起使用的其它示例性SBS系统和方法在美国专利申请公布No.2007/0166705、美国专利申请公布No.2006/0188901、美国专利No.7057026、美国专利申请公布No.2006/0240439、美国专利申请公布No.2006/0281109、国际专利公布No.WO 05/065814、美国专利申请公布No.2005/0100900、国际专利公布No.WO 06/064199和国际专利公布No.WO 07/010251中描述，所述文献各自通过引用整体并入。

本文所述的测序技术的一些实施方式可以利用连接测序技术。这样的技术利用DNA连接酶来并入核苷酸并鉴定这样的核苷酸的并入。可与本文所述的组成和方法一起使用的示例性SBS系统和方法描述于美国专利No 6,969,488、美国专利No.6,172,218和美国专利No.6,306,597中，所述美国专利各自通过引用整体并入。

本文所述的测序方法可以有利地以多重格式进行，以便同时操作多个不同的靶核酸。在特定的实施方式中，不同的靶核酸可以在共同的反应容器中或在特定基体的表面上处理。这允许以多重方式方便地递送测序试剂、去除未反应的试剂和检测并入事件。在使用表面结合的靶核酸的实施方式中，靶核酸可以是阵列格式。在阵列格式中，靶核酸通常可以按空间可区分的方式与表面偶联。例如，靶核酸可以通过直接共价连接、附着到珠子或其它粒子上或与附着于表面的聚合酶或其它分子缔合来结合。阵列可以在每个位点(也称为特征)处包含单个靶核酸拷贝，或在每个位点或特征处可以存在多个具有相同序列的拷贝。多个拷贝可以通过如本文其它具体内容描述的扩增方法、例如桥式扩增或乳液PCR产生。

在一些实施方式中，任何标记(例如，在延伸记录标签中)或其任何部分(例如，通用引物、间隔区、UMI、条形码)的序列信息分析，都可以使用单分子测序方法、例如基于纳米孔的测序技术来完成。在一个方面，单分子测序法是一种直接单分子测序法。关于示例性的基于纳米孔测序的某些方面，参见国际专利申请公布No WO 2017/125565，其内容通过引用整体并入。DNA和RNA的纳米孔测序可通过DNA和RNA的链测序和/或外测序来实现。链测序包括在样本多核苷酸模板的核苷酸穿过纳米孔时直接确定所述多核苷酸链的核苷酸碱基的方法。或者，多核苷酸链的链测序通过确定并入与样本模板链互补的生长链中的核苷酸来间接确定模板的序列。

在一些实施方式中，DNA，例如单链DNA，可通过在加标签的核苷酸被聚合酶并入与酶-聚合物复合体中的聚合酶相关的模板的链互补的链中时检测从所述核苷酸碱基释放的核苷酸的标签来进行测序。例如，国际专利申请公布No WO2014/074727中描述了使用加标签的核苷酸的基于单分子纳米孔的合成测序(Nano-SBS)技术，所述文献通过引用整体并入。因此，在一些实施方式中，可以附着于插入的纳米孔的酶-多核苷酸复合体可以是DNA聚合酶-DNA复合体。在一些实施方式中，DNA聚合酶-DNA复合体可附着于野生型或变体单体纳米孔。在一些实施方式中，DNA聚合酶-DNA复合体可附着于野生型、变体、或修饰的变体同质寡聚纳米孔。在一些实施方式中，DNA聚合酶-DNA复合体可附着于野生型、变体、或修饰的变体异质寡聚纳米孔。在一些实施方式中，DNA聚合酶-DNA复合体可附着于野生型、变体、或修饰的变体aHL纳米孔。在其它实施方式中，DNA聚合酶-DNA复合体可附着于野生型OmpG纳米孔或其变体。

在其它实施方式中，酶-多核苷酸复合体可以是RNA聚合酶-RNA复合体。RNA聚合酶-RNA复合体可以附着于野生型或变体寡聚或单体纳米孔。在一些实施方式中，RNA聚合酶-RNA复合体附着于野生型或变体OmpG纳米孔。在其它实施方式中，RNA聚合酶-RNA复合体附着于野生型或变体aHL纳米孔。在别的其它实施方式中，酶-多核苷酸复合体可以是逆转录酶-RNA复合体。逆转录酶-RNA复合体可以附着于野生型或变体寡聚或单体纳米孔。在一些实施方式中，逆转录酶-RNA复合体附着于野生型或变体OmpG纳米孔。在其它实施方式中，逆转录酶-RNA复合体附着于野生型或变体aHL纳米孔。在一些实施方式中，单个的核酸可通过进行性外切核酸酶释放核苷5'-单磷酸时对它们进行鉴定来测序(Astier等人，2006，JAm Chem Soc 128:1705-1710)。因此，在一些实施方式中，可以附着于插入的纳米孔的酶-多核苷酸复合体可以是外切核酸酶-多核苷酸复合体。在一些实施方式中，外切核酸酶-多核苷酸复合体可附着于野生型或变体单体纳米孔。在一些实施方式中，外切核酸酶-多核苷酸复合体可附着于野生型或变体同质寡聚纳米孔。在一些实施方式中，外切核酸酶-多核苷酸复合体可附着于野生型或变体异质寡聚纳米孔。在一些实施方式中，外切核酸酶-多核苷酸复合体可附着于野生型aHL纳米孔或其变体。在其它实施方式中，外切核酸酶-多核苷酸复合体可附着于野生型OmpG纳米孔或其变体。

在一些实施方式中，非核酸聚合物也可穿过纳米孔并被测序。例如，蛋白质和多肽可以穿过纳米孔，并且使用纳米孔对蛋白质或多核苷酸的测序可以通过控制蛋白质通过纳米孔的解折叠和转运来进行。受控的解折叠和随后的转运可以通过与待测序的蛋白质偶联的解折叠酶的作用来实现(例如，参见Nivala等人，2013，Nature Biotechnol31:247-250)。在一些实施方式中，附着于膜中纳米孔上的酶-聚合物复合体可以是酶-多肽复合体，例如解折叠酶-蛋白质复合体。在一些实施方式中，解折叠酶-蛋白质复合体可附着于野生型或变体单体纳米孔。在一些实施方式中，解折叠酶-蛋白质复合体可附着于野生型或变体同质寡聚纳米孔。在一些实施方式中，解折叠酶-蛋白质复合体可附着于野生型或变体异质寡聚纳米孔。在一些实施方式中，解折叠酶-蛋白质复合体可附着于野生型aHL纳米孔或其变体。在其它实施方式中，解折叠酶-蛋白质复合体可附着于野生型OmpG纳米孔或其变体。

在一些实施方式中，也可以对其它非核酸聚合物进行测序，例如通过穿过纳米孔。例如，WO 1996013606 A1描述了糖类材料、例如多糖包括硫酸乙酰肝素(HS)和肝素的外切测序(exo-sequencing)，而US 8,846,363 B2公开了可以应用(例如协同地)于多糖、例如肝素衍生的寡糖的外切测序的酶(例如来自肝素黄杆菌(Flavobacterium heparinum)的硫酸酯酶)。这两篇专利文献出于所有目的通过引用整体并入本文。

在一些实施方式中，对延伸记录标签的至少一部分的分析(例如，测序)的信息可以用于将确定的序列与对应多肽关联并与蛋白质组比对。在一些情况下，在对核酸文库(例如，延伸核酸的文库)测序后，所生成的序列可以通过它们的UMI折拢，然后与它们相应的多肽相关联，并与整个蛋白质组比对。在一些情况下，所生成的序列也可以通过它们的区室标签折拢并与其相应的区室蛋白质组相关联，所述蛋白质组在一个特定的实施方式中仅包含单个或数量非常有限的蛋白质分子。在一些实施方式中，蛋白质鉴定和定量都可以从这种数字肽信息中获得。

本文公开的方法可以用于制备和处理大分子以同时分析包括检测、定量和/或测序多个大分子(多路复用)。如本文所用的多路复用是指在同一测定中分析多个大分子(例如多肽)。多个大分子可以源自于相同的样本或不同的样本。多个大分子可以源自于相同的对象或不同的对象。被分析的多个大分子可以是不同的大分子，或源自于不同样本的相同大分子。多个大分子包括2或更多个大分子、5或更多个大分子、10或更多个大分子、50或更多个大分子、100或更多个大分子、500或更多个大分子、1000或更多个大分子、5,000或更多个大分子、10,000或更多个大分子、50,000或更多个大分子、100,000或更多个大分子、500,000或更多个大分子、或1,000,000或更多个大分子。

iV.示例性用途和应用

本文提供了处理和制备用于分析测定的大分子的示例性方法。在一些实施方式中，所提供方法的一个或多个步骤可用自动化方式进行并且可用于进行高通量样本处理。在一些实施方式中，所述设备和/或自动化方法被构造成将水相生化反应和有机化学反应整合为循环的过程，例如，将多肽或肽序列转化为用于NGS分析的DNA文库的循环过程。本文所述的设备和方法可以产生与用DNA测序仪、例如通用DNA测序仪(NGS)进行分析相容的输出样本(例如，包含DNA文库或编码文库的输出样本)。使用本文所述的用于处理和制备大分子的设备实现了对单一分子、例如单个肽、多肽或蛋白质的序列的下游分析。

在一些实施方式中，使用本文提供的设备允许更好的温度控制。在一些方面，所述集成系统为执行大分子分析测定的步骤提供了封闭的环境。所述集成系统可以提供某些优点。例如，温度控制可以更精确，温度变化可以更准确高效，并可以更均匀地控制温度(例如样本之间)。

在一些实施方式中，处理和制备用于分析测定的大分子的设备和/或自动化方法可在没有实时控制或没有精确实时控制下操作。例如，与进行大分子分析测定的手动方法相比，使用所述设备和/或自动化方法，可以在单一操作中进行不同的过程，而在整个过程中无需用户干预。在一些实施方式中，自动化可通过使用由所述设备的控制单元运行的控制程序按顺序执行期望的反应来实现。例如，控制程序以循环的方式将试剂递送到样本容器和从样本容器中移出。在一些情况下，所述程序将样本与各种试剂的反应/温育温度设置为预定或期望的时间量。对于所述方法的重复步骤，可以执行全部或部分程序的各种回路。控制程序和设备的使用允许以需要来自用户的最少的输入和物理动作来制备和处理样本。例如，用户可能能够用适当的试剂和样本装载设备，并允许自动执行其余的过程。

在一些实施方式中，进行步骤a)向所述设备提供非平面样本容器，所述容器包含含有大分子例如多肽的样本、以及与固体载体接合的相关记录标签，是由控制单元自动化和/或控制的。在一些实施方式中，进行步骤b)向所述设备的单独的试剂贮器提供试剂是由控制单元自动化和/或控制，例如，提供结合剂、用于传递信息的试剂、任选地提供用于去除多肽末端氨基酸的试剂、用于用于加帽反应的试剂、和/或用于修饰多肽末端氨基酸的试剂。在一些实施方式中，进行步骤c)将结合剂从试剂贮器递送到样本容器，其中所述结合剂包含带有关于结合剂的标识信息的代码标签，是由控制单元自动化和/或控制的。在一些实施方式中，进行步骤d)将用于传递信息的试剂从试剂贮器递送到样本容器以将信息从结合剂的代码标签传递到记录标签从而生成延伸记录标签，是由控制单元自动化和/或控制的。在一些实施方式中，进行步骤e)将用于去除多肽末端氨基酸的试剂从试剂贮器递送到样本容器以去除末端氨基酸是由控制单元自动化和/或控制的。在一些实施方式中，进行步骤f)将用于加帽反应的试剂从试剂贮器递送到样本容器是由控制单元自动化和/或控制的。在一些实施方式中，将用于修饰多肽末端氨基酸的试剂递送到样本容器是由控制单元自动化和/或控制的。在一些情况下，步骤c)-f)中的至少一个以一种或多种受控的流速进行。在一些实施方式中，步骤c)-f)中的两个或多个由控制单元控制。在一些示例中，步骤a)-f)中的两个、三个、四个、五个或全部是自动化的。在一些实施方式中，任何步骤c)至f)都包括将样本与所提供的试剂一起温育。在一些示例中，任何步骤c)至f)都包括将样本与所提供的试剂一起温育并调节温育期间样本容器的温度。.

在一些实施方式中，使用本文提供的设备和自动化方法给予递送试剂和洗涤缓冲液的优势。在一些情况下，可能希望进行更严格的洗涤(例如，去除结合剂或其它试剂)，从而增加所述测定的特异性。在一些情况下，使用本文提供的设备和自动化方法允许更可再现的样本处理、更精细的递送体积控制、和流速控制。控制程序还允许将更复杂的对样本容器的洗涤或试剂递送进行编程。例如，可按照控制程序的控制按顺序应用各种流速。

在一些实施方式中，与处理和制备用于大分子分析测定的样本的手动方法相比，使用所提供的设备和方法可以并行处理更多数量的样本。在一些实施方式中，所提供的设备和方法能够以更好的控制、再现性和稳健性实现高通量样本处理。在一些方面，当以自动化方式进行时，大分子分析测定的制约较少。例如，如果需要的时间不是所述测定的限制因素，则过程可延长或重复。在一些情况下，当以自动化方式或使用所提供的仪器进行所述测定时，也可以减少样本间的变差。在一些情况下，用户还可以对样本加条形码并组合样本以实现更大的通量。

V.示例性实施方式

所提供的实施方式包括：

1.一种用于自动化处理含有固定化大分子的样本的设备，所述设备包括：

一个或多个容积等于或小于约20mL的非平面样本容器、或被构造用于保持所述样本容器的保持器或空间，其中所述样本容器中的至少一个受到温度控制并被构造成允许流体流过；

多个用于包含相应试剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间，其中所述试剂贮器中的至少一个受到温度控制；

多个连接在具有上游端和下游端的供应管线中的阀，其中所述阀中的至少一个或每一个可定位以提供从中通过的交替流动路径；和

控制所述一种或多种试剂向所述样本容器递送的控制单元，

其中：

所述一种或多种试剂的递送可单独寻址，

所述供应管线将所述试剂贮器与所述样本容器连接并且所述试剂贮器与所述样本容器流体连接，并且

至少所述样本容器的温度控制、所述试剂贮器的温度控制、所述阀的定位和/或所述一种或多种试剂向所述样本容器的递送由所述控制单元自动化和控制。

2.实施方式1所述的设备，其中所述样本容器中的至少一个和/或所述试剂贮器中的至少一个受到主动加热和/或主动冷却。

3.实施方式1或2所述的设备，其中所述受到温度控制的样本容器的温度和所述受到温度控制的试剂贮器的温度由所述控制单元分别控制。

4.实施方式3所述的设备，其中所述受到温度控制的样本容器和所述受到温度控制的试剂贮器被容纳在分别的热块中。

5.实施方式1-4中任一项所述的设备，其还包含用于移动所述一种或多种试剂、例如所述一种或多种试剂液的机构。

6.实施方式5所述的设备，其中所述用于移动一种或多种试剂或试剂液的机构包括单个泵。

7.实施方式5所述的设备，其中所述用于移动一种或多种试剂或试剂液的机构包括多个泵。

8.实施方式6或7所述的设备，其中所述泵整合在所述设备中。

9.实施方式1-8中任一项所述的设备，其还包括废物出口和/或废物容器。

10.实施方式9所述的设备，其中所述设备包含多于一个废物容器。

11.实施方式1-10中任一项所述的设备，其中所述设备被构造成保持以下一种或多种：：

容积范围从约5μL至约50μL的试剂贮器；

容积范围从约50μL至约200μL的试剂贮器；

容积范围从约200μL至约1mL的试剂贮器；

容积范围从约1mL至约50mL的试剂贮器；

容积范围从约50mL至约500mL的试剂贮器；

容积范围从约500mL至约1L的试剂贮器；和/或

容积范围从约1L至约100L的试剂贮器。

12.实施方式1-11中任一项所述的设备，其中所述设备被构造成保持至少5个试剂贮器。

13.实施方式1-11中任一项所述的设备，其中所述设备被构造成保持至少10个试剂贮器。

14.实施方式1-11中任一项所述的设备，其中所述设备被构造成保持至少20个试剂贮器。

15.实施方式1-14中任一项所述的设备，其中所述样本容器中至少一个的容积等于或小于约10mL。

16.实施方式1-15中任一项所述的设备，其中所述设备被构造成保持单个样本容器、或保持两个或更多个样本容器。

17.实施方式1-16中任一项所述的设备，其中所述样本容器具有用于递送试剂的入口和用于排出试剂的出口。

18.实施方式17所述的设备，其中所述样本容器的出口被构造用于将液体从所述样本容器排放到废物容器。

19.实施方式10-18中任一项所述的设备，其中所述废物容器直接或间接地与一个或多个样本容器流体连接。

20.实施方式1-19中任一项所述的设备，其中所述样本容器中的至少一个包括多孔机构或多孔膜以允许液体通过并排出所述样本容器和/或维持样本例如样本液在所述样本容器中。

21.实施方式1-20中任一项所述的设备，其中所述样本容器中的至少一个包括过滤机构或过滤器，其被定位和构造成最小化或阻止样本、例如样本液从所述样品容器中逃逸。

22.实施方式20或21所述的设备，其中所述多孔机构或过滤机构包括玻璃料。

23.实施方式22所述的设备，其中所述玻璃料的孔隙尺寸为约1μm至约500μm。

24.实施方式22所述的设备，其中所述玻璃料的孔隙尺寸为约小于50μm。

25.实施方式21-24中任一项所述的设备，其中所述过滤机构或过滤器包含聚四氟乙烯(PTFE)或聚乙烯(PE)或由聚四氟乙烯(PTFE)或聚乙烯(PE)制成。

26.实施方式1-25中任一项所述的设备，其中所述样本容器中的至少一个对大气压开放。

27.实施方式1-26中任一项所述的设备，其中将所述试剂贮器与所述样本容器连接的供应管线是共用管线。

28.实施方式1-27中任一项所述的设备，其中所述样本容器中的至少一个被构造成装载起始样本、例如起始样本液。

29.实施方式1-28中任一项所述的设备，其中所述阀中的两个或更多个整合在歧管中。

30.实施方式1-29中任一项所述的设备，其还包括用于在至少一个所述样本容器中加速反应的机构。

31.实施方式30所述的设备，其中所述用于加速反应的机构被构造成施加微波能量以加速至少一个所述样本容器中的反应。

32.实施方式1-31中任一项所述的设备，其还包括处理机构和控制程序，所述处理机构被构造成操作所述控制程序以控制所述样本容器的温度、所述试剂贮器的温度、所述阀的定位、所述一种或多种试剂向所述样本容器的递送、和/或所述样本容器的内容物的排出。

33.实施方式1-32中任一项所述的设备，其还包括显示器和用户输入机构。

34.实施方式1-33中任一项所述的设备，其还包括用于监测所述设备的机构。

35.实施方式34所述的设备，其中所述监测机构被构造成监测温度、压力、流量、气泡、一个或多个阀的位置、折射率和/或电导。

36.实施方式32-35中任一项所述的设备，其被构造成向所述控制程序提供所述监测的反馈。

37.实施方式1-36中任一项所述的设备，其还包括照明机构。

38.实施方式1-37中任一项所述的设备，其还包括用于检测可检测信号例如荧光信号的机构或传感器。

39.实施方式1-38中任一项所述的设备，其还包括用于检测机器可读信号的检测器，例如条形码读取器。

40.实施方式1-39中任一项所述的设备，其还包括用于收集所述或其一部分的机构。

41.实施方式40所述的设备，其中所述用于收集样本或其一部分的机构包括直接或间接地与所述样本容器中的至少一个连接的收集容器。

42.实施方式1-41中任一项所述的设备，其包括经受温度控制并被构造用于允许流体流过的单个样本容器，或被构造用于保持所述单个样本容器的保持器或空间。

43.实施方式1-41中任一项所述的设备，其包括多个样本容器、或被构造用于保持所述样本容器的保持器或空间，其中所述样本容器中的至少一个受到温度控制并被构造用于允许流体流过。

44.实施方式1-41中任一项所述的设备，其包括经受温度控制并被构造用于允许流体流过的多个样本容器，或被构造用于保持所述多个样本容器的保持器或空间。

45.实施方式1-44中任一项所述的设备，其中单个试剂贮器受到温度控制。

46.实施方式1-44中任一项所述的设备，其中多个试剂贮器受到温度控制。

47.实施方式1-46中任一项所述的设备，其中单个阀可定位以提供从中通过的交替流动路径。

48.实施方式1-46中任一项所述的设备，其中多个阀可定位以提供从中通过的交替流动路径。

49.实施方式1-48中任一项所述的设备，其中所述控制单元控制单个试剂向单个样本容器的递送。

50.实施方式1-48中任一项所述的设备，其中所述控制单元控制单个试剂向多个样本容器的递送。

51.实施方式1-48中任一项所述的设备，其中所述控制单元控制多种试剂向多个样本容器的递送。

52.实施方式1-51中任一项所述的设备，其中单个试剂的递送可单独寻址。

53.实施方式1-51中任一项所述的设备，其中多个试剂的递送可单独寻址。

54.实施方式1-53中任一项所述的设备，其中一条供应管线将单个试剂贮器与单个样本容器连接。

55.实施方式1-53中任一项所述的设备，其中一条供应管线将单个试剂贮器与多个样本容器连接。

56.实施方式1-53中任一项所述的设备，其中一条供应管线将多个试剂贮器与单个样本容器连接。

57.实施方式1-53中任一项所述的设备，其中一条供应管线将多个试剂贮器与多个样本容器连接。

58.实施方式1-57中任一项所述的设备，其中所述样本容器的温度控制、所述试剂贮器的温度控制、所述阀的定位和/或所述一种或多种试剂向所述样本容器的递送中的至少两项或三项由所述控制单元自动化和控制。

59.实施方式1-57中任一项所述的设备，其中所述样本容器的温度控制、所述试剂贮器的温度控制、所述阀的定位和/或所述一种或多种试剂向所述样本容器的递送由所述控制单元自动化和控制。

60.实施方式1-59中任一项所述的设备，其包括至少一个包含结合剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间。

61.实施方式1-60中任一项所述的设备，其包括至少一个包含用于传递信息的试剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间。

62.实施方式1-61中任一项所述的设备，其包括至少一个包含用于去除多肽末端氨基酸的试剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间。

63.实施方式1-62中任一项所述的设备，其包括至少一个包含用于加帽反应的试剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间。

64.实施方式1-63中任一项所述的设备，其包括至少两个试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间，所述试剂贮器包含不同类型的试剂，并且各试剂贮器包含选自结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂和用于加帽反应的试剂中的试剂。

65.实施方式1-63中任一项所述的设备，其包括至少三个试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间，所述试剂贮器包含不同类型的试剂，并且各试剂贮器包含选自结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂和用于加帽反应的试剂中的试剂。

66.实施方式1-63中任一项所述的设备，其包括至少一个包含结合剂的试剂贮器、至少一个包含用于传递信息的试剂的试剂贮器、至少一个包含用于去除多肽末端氨基酸的试剂的试剂贮器和至少一个包含用于加帽反应的试剂的贮器，或被构造用于保持所述试剂贮器的保持器或空间。

67.实施方式60-66中任一项所述的设备，其中所述包含结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂以及用于加帽反应的试剂的试剂贮器中的至少一个是受温度控制的。

68.实施方式60-66中任一项所述的设备，其中所述包含结合剂、用于转移信息的试剂、用于去除多肽末端氨基酸的试剂以及用于加帽反应的试剂的试剂贮器中的至少两个或三个是受温度控制的。

69.实施方式60-66中任一项所述的设备，其中所述包含结合剂、用于转移信息的试剂、用于去除多肽末端氨基酸的试剂以及用于加帽反应的试剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间是受温度控制的。

70.实施方式1-69中任一项所述的设备，其中所述试剂贮器中的至少一个包含洗涤缓冲液。

71.实施方式70所述的设备，其包括单个包含洗涤缓冲液的试剂贮器。

72.实施方式70所述的设备，其包括多个包含不同洗涤缓冲液、例如三种或更多种不同洗涤缓冲液的试剂贮器。

73.实施方式70-72中任一项所述的设备，其中所述包含洗涤缓冲液的试剂贮器被构造成容纳约50mL或更大的体积。

74.实施方式1-73中任一项所述的设备，其中所述样本容器装载含有大分子、例如多肽的样本。

75.实施方式74所述的设备，其中所述大分子是蛋白质。

76.实施方式74所述的设备，其中所述大分子是肽。

77.实施方式74所述的设备，其中所述样本包含许多多肽，例如多种蛋白质或肽。

78.实施方式76所述的设备，其中所述肽是通过将蛋白质、例如来自生物样本的蛋白质片段化而获得的。

79.实施方式74-78中任一项所述的设备，其中所述大分子与记录标签缔合或接合。

80.实施方式79所述的设备，其中所述记录标签是DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子或其组合。

81.实施方式79或80所述的设备，其中所述记录标签包含通用引发序列。

82.实施方式79-81中任一项所述的设备，其中所述大分子、所述缔合的或接合的记录标签、或二者，与固体载体共价接合。

83.实施方式82所述的设备，其中所述固体载体是三维载体(例如，多孔基质或珠子)。

84.实施方式82所述的设备，其中所述固体载体是聚苯乙烯珠、聚丙烯酸酯珠、聚合物珠、琼脂糖珠、纤维素珠、葡聚糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁珠、玻璃珠、可控孔度珠、基于二氧化硅的珠、或其任何组合。

85.实施方式60-84中任一项所述的设备，其中所述结合剂是多肽或蛋白质。

86.实施方式85所述的设备，其中所述结合剂是修饰的氨肽酶、修饰的氨酰基tRNA合成酶、修饰的抗运载蛋白、或抗体或其结合片段。

87.实施方式60-86中任一项所述的设备，其中所述结合剂被构造成结合包含多肽的单个氨基酸残基、二肽、三肽或翻译后修饰的靶标。

88.实施方式87所述的设备，其中所述结合剂被构造成结合包含多肽的N端氨基酸残基、C端氨基酸残基或内部氨基酸残基的靶标。

89.实施方式88所述的设备，其中所述结合剂被构造成结合包含多肽的修饰的N端氨基酸残基、修饰的C端氨基酸残基或修饰的内部氨基酸残基的靶标。

90.实施方式87所述的设备，其中所述结合剂被构造成结合包含多肽的N端肽、C端肽或内部肽的靶标。

91.实施方式60-90中任一项所述的设备，其中所述结合剂包含具有关于所述结合剂的标识信息的代码标签。

92.实施方式91所述的设备，其中所述代码标签是DNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子或其组合。

93.实施方式91或实施方式92所述的设备，其中所述代码标签包含编码区序列。

94.实施方式91-93中任一项所述的设备，其中所述代码标签还包含间隔区、结合循环特异性序列、唯一分子标识符、通用引发位点或其组合。

95.实施方式91-94中任一项所述的设备，其中所述结合剂和所述代码标签通过接头接合。

96.实施方式79-95中任一项所述的设备，其还包括用于扩增所述记录标签的试剂。

97.实施方式61-96中任一项所述的设备，其中所述用于传递信息的试剂包含酶。

98.实施方式97所述的设备，其中所述用于传递信息的试剂用于进行引物延伸或连接反应。

99.实施方式97或98所述的设备，其中所述用于传递信息的试剂受到温度控制。

100.实施方式63-99中任一项所述的设备，其中所述用于加帽反应的试剂包含加帽核酸。

101.实施方式100所述的设备，其中所述加帽核酸包含通用引发序列。

102.实施方式100或101所述的设备，其中所述用于加帽反应的试剂包含酶。

103.实施方式102所述的设备，其中所述加帽试剂用于进行延伸或连接反应。

104.实施方式100-103中任一项所述的设备，其中所述用于加帽反应的试剂受到温度控制。

105.实施方式62-104中任一项所述的设备，其中所述用于去除多肽末端氨基酸的试剂包括化学试剂或酶试剂。

106.实施方式1-105中任一项所述的设备，其还包括：

a)用于修饰多肽末端氨基酸的试剂；或

b)包含用于修饰多肽末端氨基酸的试剂的试剂贮器。

107.实施方式106所述的设备，其中所述用于修饰多肽末端氨基酸的试剂包括化学剂或酶剂。

108.实施方式1-107中任一项所述的设备，其中所述阀中至少一个的死体积为约0.5μL至约5μL，例如约1μL至约2μL。

109.实施方式1-108中任一项所述的设备，其中所述控制单元被构造成使用跨平台语言、例如python进行操作。

110.实施方式1-109中任一项所述的设备，其被构造成在没有实时控制或没有精确实时控制下操作。

111.实施方式1-110中任一项所述的设备，其中具有较小容积的试剂贮器中的至少一个位于比具有较大容积的试剂贮器更靠近所述样本容器的位置。

112.实施方式111所述的设备，其中所述包含结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂和/或用于加帽反应的试剂的试剂贮器中的至少一个位于比包含洗涤缓冲液的试剂贮器更靠近所述样本容器的位置。

113.实施方式1-112中任一项所述的设备，其被构造成将水相生化反应和有机化学反应整合为循环过程，例如，将肽序列转化为用于NGS分析的DNA文库的循环过程。

114.实施方式1-113中任一项所述的设备，其被构造成生成输出样本，例如，包含DNA文库或编码文库的输出样本，所述输出样本被构造成通过DNA测序仪、例如通用DNA测序仪(NGS)进行分析。

115.实施方式1-114中任一项所述的设备，其被构造成执行高通量样本处理。

116.实施方式1-115中任一项所述的设备，其被构造成执行多肽无关或蛋白质无关的分析。

117.一种自动化处理样本的方法，所述方法使用实施方式1-116任一项所述的设备进行，并且所述方法包括：

a)向所述设备提供非平面样本容器，所述容器包含含有大分子例如多肽的样本、以及与固体载体接合的相关记录标签；

b)向所述设备的单独的试剂贮器提供结合剂和用于传递信息的试剂，其中所述试剂贮器中的至少一个包含结合剂并且所述试剂贮器中的至少一个包含用于传递信息的试剂；

c)将所述结合剂从所述试剂贮器递送到所述样本容器，其中所述结合剂包含带有关于所述结合剂的标识信息的代码标签；和

d)将所述用于传递信息的试剂从所述试剂贮器递送到所述样本容器，以将信息从所述结合剂的代码标签传递到所述记录标签，从而生成延伸记录标签。

118.实施方式117所述的方法，其还包括重复步骤c)和d)两次或更多次。

119.实施方式117或实施方式118所述的方法，其中所述样本容器装有体积等于或小于约20mL的样本。

120.实施方式117或实施方式118所述的方法，其中所述样本容器装有体积等于或小于约10mL的样本。

121.实施方式117-120中任一项所述的方法，其中所述记录标签是DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子或其组合。

122.实施方式121所述的方法，其中所述记录标签包含通用引发序列。

123.实施方式117-122中任一项所述的方法，其中所述大分子、所述缔合的或接合的记录标签、或二者，与固体载体共价接合。

124.实施方式123所述的方法，其中所述固体载体是三维载体(例如，多孔基质或珠子)。

125.实施方式124所述的方法，其中所述固体载体是聚苯乙烯珠、聚丙烯酸酯珠、聚合物珠、琼脂糖珠、纤维素珠、葡聚糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁珠、玻璃珠、可控孔度珠、基于二氧化硅的珠、或其任何组合。

126.实施方式117-125中任一项所述的方法，其中将所述代码标签的信息传递到所述记录标签是由DNA连接酶介导的。

127.实施方式117-126中任一项所述的方法，其中将所述代码标签的信息传递到所述记录标签是由DNA聚合酶介导的。

128.实施方式117-126中任一项所述的方法，其中将所述代码标签的信息传递到所述记录标签是由化学连接介导的。

129.实施方式117-128中任一项所述的方法，其还包括在步骤a)中将用于去除多肽末端氨基酸的试剂提供到所述设备的单独试剂贮器中以及下述步骤：

e)将所述用于去除多肽末端氨基酸的试剂从试剂贮器递送到所述样本容器以去除末端氨基酸。

130.实施方式129所述的方法，其中步骤e)在步骤a)和步骤b)之后进行。

131.实施方式129或实施方式130所述的方法，其还包括重复步骤c)至e)两次或更多次。

132.实施方式117-131中任一项所述的方法，其还包括在步骤a)中将用于加帽反应的试剂提供到所述设备的单独试剂贮器中以及下述步骤：

f)将所述用于加帽反应的试剂从试剂贮器递送到所述样本容器。

133.实施方式132所述的方法，其中步骤f)在步骤a)至e)之后进行。

134.实施方式132或实施方式133所述的方法，其中所述用于加帽反应的试剂包含通用引发序列和用于延伸或连接反应的试剂。

135.实施方式117-134中任一项所述的方法，其还包括在步骤a)中将用于修饰多肽末端氨基酸的试剂提供到所述设备的试剂贮器中并将所述用于修饰多肽末端氨基酸的试剂递送到所述样本容器。

136.实施方式135所述的方法，其中所述用于修饰多肽末端氨基酸的试剂包括化学剂或酶剂。

137.实施方式135或实施方式136所述的方法，其中在步骤c)之前、步骤d)之前、步骤e)之前和/或步骤f)之前将所述用于修饰多肽末端氨基酸的试剂递送到所述样本容器。

138.实施方式117-137中任一项所述的方法，其还包括从所述样本容器释放和收集样样本或其一部分。

139.实施方式117-138中任一项所述的方法，其还包括扩增所述延伸记录标签。

140.实施方式117-139中任一项所述的方法，其中执行任何步骤c)-f)都包括调节所述样本容器的温度。

141.实施方式129-140中任一项所述的方法，其中执行步骤e)包括将所述样本容器的温度调节到约25℃至约60℃之间的温度。

142.实施方式117-141中任一项所述的方法，其还包括将洗涤缓冲液从所述试剂贮器递送到所述样本容器。

143.实施方式142所述的方法，其中所述洗涤缓冲液在步骤c)之前、步骤d)之前、步骤e)之前和/或步骤f)之前递送。

144.实施方式142或实施方式143所述的方法，其包括将单个洗涤缓冲液从所述试剂贮器递送到所述样本容器。

145.实施方式142或实施方式143所述的方法，其包括将多种洗涤缓冲液、例如2至10种洗涤缓冲液从所述试剂贮器递送到所述样本容器。

146.实施方式117-145中任一项所述的方法，其中步骤c)-f)中的至少一个以一种或多种受控的流速进行。

147.实施方式117-146中任一项所述的方法，其中步骤c)-f)中的至少一个由所述控制单元控制。

148.实施方式147所述的方法，其中步骤c)-f)中的两个、三个或全部由所述控制单元控制。

149.实施方式117-148中任一项所述的方法，其中步骤a)-f)中的至少一个是自动化的。

150.实施方式149所述的方法，其中步骤a)-f)中的两个、三个、四个、五个或全部是自动化的。

151.实施方式117-150中任一项所述的方法，其还包括在直接或间接地与至少一个所述样本容器连接的收集容器中收集所述样本或其一部分。

152.实施方式151所述的方法，其中在所述收集容器中收集所述样本或其一部分之前，用切割试剂处理所述样本。

153.实施方式151或实施方式152所述的方法，其中所述收集由所述控制单元自动化和/或控制。

154.实施方式117-153中任一项所述的方法，其中所述控制单元使用跨平台语言、例如python进行操作。

155.实施方式117-154中任一项所述的方法，其在没有实时控制或没有精确实时控制下操作。

156.实施方式117-155中任一项所述的方法，其将水相生化反应和有机化学反应整合为循环过程，例如，将肽序列转化为用于NGS分析的DNA文库的循环过程。

157.实施方式117-156中任一项所述的方法，其生成输出样本，例如，包含DNA文库或编码文库的输出样本，所述样本由DNA测序仪、例如通用DNA测序仪(NGS)进行分析。

158.实施方式117-157中任一项所述的方法，其旨在进行高通量样本处理。

159.实施方式117-158中任一项所述的方法，其旨在进行多肽无关或蛋白质无关的分析。

VI.实施例

提供以下实施例是为了说明而不是限制本文所提供的方法、组成和用途。

实施例1：通过在自动化设备上进行的多循环编码评估多肽序列

该实验描述了使用用于包括多循环编码的ProteoCode测定的示例性仪器对多肽进行的处理。实验包括以下步骤：结合/编码→化学处理→结合/编码→化学处理→结合/编码→封端。使用化学处理结合、编码、切割和进行封端反应的程序化自动化过程由与所述仪器连接的控制单元执行，结合/编码和切割过程使用受控回路重复。在以下过程中描述的其它功能之中，用于本实验的仪器具有两个7通旋转阀和一个带四个口的微型阀。所使用的仪器可以装载最多14种试剂和2个受到主动加热和冷却的样本盒。

样本装载和预洗涤

将两个样本盒插入仪器上的温控热块中。向每个样本盒添加100μL的肽，所述肽用在基体上固定化的DNA记录标签标记。每个样本装入包含50,000个珠子的样本盒中，将用DNA记录标签标记的肽以受控的密度加载到多孔珠上，所述密度为一个用于附着肽-记录标签嵌合体的活化官能部分/100,000个钝化(封闭)分子(1:100K)。各样本盒包含PTFE玻璃料(直径为5.1mm，厚度为3mm，孔隙尺寸为3μm)，使得含有固定化在珠子上的多肽的样本保留在样本盒中，而被递送到样本盒的液体、洗涤溶液和试剂可以通过对样本盒施加的正压力来去除。整合在仪器上的泵和阀用于控制所述系统上试剂的分配和流动，以及试剂向样本盒中样本的递送。从样本盒中去除的流过物物被分配到废物容器中。

在所述测定中测试的示例性肽包括具有N端氨基FS的肽(FS-肽，SEQ ID NO:3中展示的FSGVAMPGAEDDVVGSGSK)；具有N端氨基AFS的肽(AFS-肽，SEQ ID NO:4中展示的AFSGVAMPGAEDDVVGSGSK)，和具有N端氨基AEFS的肽((AEFS-肽，SEQ ID NO:5中展示的AEFSGVAMPGAEDDVVGSGSK)。在第一次结合和编码过程开始之前，将所述珠子在样本盒中用200μL PBF10(10％甲酰胺，4mM磷酸钠，500mM氯化钠和0.1％Tween 20)预洗涤，然后用200μL PBST(4mM磷酸钠，155mM氯化钠(NaCl)和0.1％Tween 20)洗涤4次以去除非特异性结合的肽和未在珠子上固定化的DNA。

一个结合和编码循环

每个结合/编码循环使用所述仪器和示例性编程的自动化结合和编码过程如下进行。将热块设定为25℃(+/-1℃)。一旦达到设定温度，就将200μL当苯丙氨酸是N端氨基酸残基时结合该苯丙氨酸的示例性结合剂(F-结合剂)递送到样本盒中的珠子并温育30分钟。所述结合剂与含有关于该结合剂信息的代码标签寡核苷酸缀合。在结合剂结合其相应的靶标后，将代码标签的N端F氨基酸、即3’-间隔区与同肽联接的记录标签寡核苷酸的3'-间隔区杂交。温育30分钟后，将珠子用200μL Binder洗涤缓冲液(BWH，4mM磷酸钠，500mM氯化钠，0.1％Tween 20)洗涤4次并用200μL Custom Encoding缓冲液(CB，50mM Tris-HCl pH7.5，2mM MgSO4，50mM NaCl，1mM DTT，0.1％Tween20，100μg/mL BSA)洗涤1次。为了将信息从代码标签递送到记录标签，将总共400μL(2x200μL)的Encoding Master Mix(EMM，50mM Tris-HCl pH7.5，2mM MgSO4，50mM NaCl，1mM DTT，0.1％Tween20，100μg/mL BSA，0.125mMdNTPs，0.125U/μL Klenow片段(3’->5’exo-)(MCLAB，USA))递送给所述珠子并在25℃下温育5分钟。如果结合剂与其靶标结合，则与多肽有关的记录标签通过延伸复制代码标签而被延长，并将信息从与所述F结合剂相关的代码标签传递到与所述肽联接的记录标签(从而形成延伸记录标签)。温育5分钟后，将珠子用200μL PBF10洗涤5次、用200μL含0.1％Tween 20的0.1M氢氧化钠洗涤5次、用200μL PBF10洗涤5次、并用200μL PBST洗涤5次。

一个化学处理循环

每个化学循环使用仪器和示例性自动化编程过程如下进行。在如上所述的一个结合和编码循环之后，将热块设定为40℃(+/-1℃)。在加热块升温至设定温度的同时，用4×200μL的N端氨基酸官能化试剂预洗涤珠子。一旦热块达到40℃，就将200μL的官能化试剂递送到珠子中，并温育30分钟以使珠子上的N端氨基酸(NTAA)官能化。将珠子洗涤多次，然后用4×200μL用于消除或切割NTAA的试剂进行预洗涤，并与相同的试剂一起温育以去除官能化的NTAA。将温度设定为30℃(+/-10℃)并在温育60分钟后，用1mL PBST洗涤珠子5次。

作为对照，未用切割NTAA的试剂处理的样本用PBST溶液代替官能化试剂和消除NTAA的试剂进行处理。

封端

下面描述使用示例性自动编程的封端过程在所述仪器上进行的封端过程。一旦完成最后一轮编码(第三个编码循环)，就将200μL封端溶液(CAP，400nM加帽寡核苷酸，50mMTris-HCl pH7.5，2mM MgSO4，50mM NaCl，1mM DTT，0.1％Tween20，100μg/mL BSA，0.125mMdNTPs，0.125U/μL Klenow exo-)递送给珠子。在此步骤中提供的加帽寡核苷酸含有通用引发序列，该序列使用延伸反应添加到记录标签中，以生成用于NGS读数的最终产物。将珠子在封端溶液中于25℃温育10分钟，然后用200μL PBF10洗涤5次、用200μL含0.1％Tween 20的0.1M氢氧化钠洗涤5次、用200μL PBF10洗涤5次并用200μL PBST洗涤5次。

在封端反应之后，从所述仪器中取出样本盒，并从样本盒中取出每个样品(例如，固定化在带有延伸记录标签的珠子上的多肽)。

样本处理和分析

将所述测定的延伸记录标签进行PCR扩增并通过下一代测序(NGS)进行分析。NGS结果表明化学处理的样本(图3A)在循环1(实心条)、循环2(空心条)和循环3(带线的条)处显示出循环特异性的F-肽编码。在图3A所示的化学处理样本中，F-结合剂在第1个循环中检测到FS-肽中的N-末端苯丙氨酸(F)，在第2个循环中一旦通过化学处理去除了原来的N端丙氨酸(A)就检测到AFS-肽中的N-末端苯丙氨酸(F)，在第三个循环中一旦通过两轮化学处理各自分别去除丙氨酸(A)和谷氨酸(E)氨基酸后就检测到AEFS-肽中的N端F氨基酸。相反，未暴露于化学处理以官能化或去除NTAA的对照样样本(图3B)没有显示对被测肽的第2位或第3位F氨基酸的显著编码。总之，使用所述示例性仪器处理多肽导致成功处理和加工多肽并形成包含多肽信息的延伸记录标签，所述多肽信息可用于评估所处理的多肽的氨基酸序列。

实施例2：在自动化设备上使用PMI化学以及F和L结合剂池的aa池(aa pool)进行五循环的ProteoCode测定

本实施例演示了在自动化设备上进行的ProteoCode测定，包括修饰(例如，官能化)和消除用二杂环甲亚胺(PMI)处理的肽的N端氨基酸(NTAA)(参见例如，PCT/US2020/029969)。结合剂与修饰的NTAA结合以及通过将信息从与结合剂缔合的代码标签传递到与肽缔合的记录标签进行编码，由此产生延伸的记录标签，也如图4所示进行。结合和编码使用识别修饰的NTAA(“mod”)的结合剂(苯丙氨酸(F)和亮氨酸(L)结合剂)池进行。

在固定化有18种不同肽的ProteoCode珠子上进行五个循环的ProteoCode化学(SEQ ID NO:6-23)。在每个循环后对珠子进行取样，并用NGS测序分析所生成的编码文库。在图4中，显示了每个循环的10个相关F和L肽中每一个的总结性NGS编码数据(仅显示前5个残基)。对以mod-F-结合剂和mod-L结合剂检测的总结性循环依赖性编码效率作图。F和L肽组包含在1-5位具有“梯状”F和L残基的肽。随着在随后的Edman-Lite循环中去除每个连续的残基，暴露出新的NTAA。例如，在第5位带有F的肽在第五个循环通过F-结合剂编码而被解码。

用DNA记录标签标记的肽被固定化在基体上(肽序列如SEQ ID NO:6-23中所展示)。进行了多达四个消除继以结合和编码的循环。例如，用示例性二杂环甲亚胺作为NTAA官能化试剂处理肽。对于官能化处理，将测定珠与150μL的15mM二-(4-三氟甲基-吡唑-1-基)甲亚胺、200mM MOPS、pH7.6、50％DMA一起在40℃温育30分钟。将珠子用200μL PBST洗涤3次。官能化后，，将测定珠用150μL含7％盐酸肼的PBS，pH 7.0，在40℃下处理30分钟。在3×PBST洗涤后，通过将测定珠与150μL 1M磷酸铵，pH 6.0一起，在95℃下温育30分钟来进行消除处理。然后用200μL PBST洗涤珠子3次。在任何肼处理和消除处理之前进行第一个循环的F和L-结合剂与官能化NTAA((4-三氟甲基吡唑-l-基甲脒基)-肽)的结合和编码(图4)。一组18个不同的用DNA记录标签标记的肽在基体上固定化(肽序列在SEQ ID NO:6-23中展示)。进行了多达五个循环的ProteoCode测定，包括官能化、结合和编码、以及消除。如所示的后续循环的F和L-结合剂结合/编码是在官能化后在0、1、2、3或4个消除循环后进行的。

例如，用示例性二杂环甲亚胺作为NTAA官能化试剂处理所述肽。对于官能化处理，将测定珠与150μL的15mM二-(4-三氟甲基-吡唑-1-基)甲亚胺、200mM MOPS、pH7.6、50％DMA一起在40℃下温育30分钟。用200μL PBST洗涤珠子3次。官能化后，用150μL含7％酸肼的PBS，pH 7.0在40℃下处理所述测定珠30分钟。在3×PBST洗涤后，通过将所述测定珠与150μL 1M磷酸铵、pH 6.0一起在95℃下温育30分钟进行消除处理。然后用200uL PBST洗涤珠子3次。在任何肼处理和消除处理之前进行第一个循环的F和L-结合剂与官能化NTAA((4-三氟甲基吡唑-l-基甲脒基)-肽)结合和编码(图4)。

将所述测定的延伸记录标签进行PCR扩增并通过下一代测序(NGS)进行分析。图4显示了用mod-F-结合剂和mod-L结合剂检测对具有所指示的5个N端残基的肽的化学循环依赖性编码效率。显示了十个含有F和L的肽的数据，其中F或L残基逐步通过肽的前5位。随着每个相继的残基被消除，N端修饰的F或L残基暴露在珠子上的一个肽上，并被相应的带有伴随的DNA编码的mod-F或mod-L结合剂检出。如所示，依据编码水平升高所示，观察到修饰的NTAA的官能化和结合。还观察到实现了消除，因为每种结合剂在消除其它残基暴露F或L残基后的适当循环中都检测到相应的修饰残基。总之，观察到官能化(NTF)后F-结合剂和L-结合剂编码的增加并检测到消除(NTE)，证明了示例性二杂环甲亚胺在编码测定中用于消除NTAA和用作所示的示例性结合剂识别的修饰的用途。

本公开不意欲将范围限于特定公开的实施方式，提供这些实施方式是为了例如说明本发明的各个方面。从本文的描述和教示中，对所描述的组成和方法的各种修改将变得显而易见。这样的变化可在不背离本公开的真实范围和精神的情况下实践并且意欲落入本公开的范围内。根据以上详细描述，可以对实施方式做出这些和其它改变。一般而言，在所附权利要求中，所使用的术语不应被解释为将权利要求限制于说明书和权利要求中公开的具体实施方式，而应被解释为包括所有可能的实施方式以及此类权利要求所享有的等价物的全部范围。因此，权利要求不受本公开的限制。

序列表

SEQ ID NO	序列(5'-3')	描述
			1	AATGATACGGCGACCACCGA	P5引物
2	CAAGCAGAAGACGGCATACGAGAT	P7引物
			3	FSGVAMPGAEDDVVGSGSK	FS-肽
4	AFSGVAMPGAEDDVVGSGSK	AFS-肽
			5	AEFSGVAMPGAEDDVVGSGSK	AEFS-肽

序列表

<110> Encodia 公司

蒂莫西·S·伯查姆

马克·S·朱

凯文·L·冈德森

<120> 用于分析的大分子的自动化处理及相关设备

<130> 4614-2001940

<150> US 62/923,406

<151> 2019-10-18

<160> 23

<170> PatentIn version 3.5

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P5引物

<400> 1

aatgatacgg cgaccaccga 20

<210> 2

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> P7引物

<400> 2

caagcagaag acggcatacg agat 24

<210> 3

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> FS-肽

<400> 3

Phe Ser Gly Val Ala Met Pro Gly Ala Glu Asp Asp Val Val Gly Ser

1 5 10 15

Gly Ser Lys

<210> 4

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> AFS-肽

<400> 4

Ala Phe Ser Gly Val Ala Met Pro Gly Ala Glu Asp Asp Val Val Gly

1 5 10 15

Ser Gly Ser Lys

20

<210> 5

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> AEFS-肽

<400> 5

Ala Glu Phe Ser Gly Val Ala Met Pro Gly Ala Glu Asp Asp Val Val

1 5 10 15

Gly Ser Gly Ser Lys

20

<210> 6

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (22)..(22)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 6

Tyr Ala Glu Ala Leu Ala Glu Ser Ala Phe Ser Gly Val Ala Arg Gly

1 5 10 15

Asp Val Arg Gly Gly Lys

20

<210> 7

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (21)..(21)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 7

Ala Glu Ala Leu Ala Glu Ser Ala Phe Ser Gly Val Ala Arg Gly Asp

1 5 10 15

Val Arg Gly Gly Lys

20

<210> 8

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (20)..(20)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 8

Glu Ala Leu Ala Glu Ser Ala Phe Ser Gly Val Ala Arg Gly Asp Val

1 5 10 15

Arg Gly Gly Lys

20

<210> 9

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (19)..(19)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 9

Ala Leu Ala Glu Ser Ala Phe Ser Gly Val Ala Arg Gly Asp Val Arg

1 5 10 15

Gly Gly Lys

<210> 10

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (18)..(18)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 10

Leu Ala Glu Ser Ala Phe Ser Gly Val Ala Arg Gly Asp Val Arg Gly

1 5 10 15

Gly Lys

<210> 11

<211> 17

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (17)..(17)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 11

Ala Glu Ser Ala Phe Ser Gly Val Ala Arg Gly Asp Val Arg Gly Gly

1 5 10 15

Lys

<210> 12

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (16)..(16)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 12

Glu Ser Ala Phe Ser Gly Val Ala Arg Gly Asp Val Arg Gly Gly Lys

1 5 10 15

<210> 13

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (15)..(15)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 13

Ser Ala Phe Ser Gly Val Ala Arg Gly Asp Val Arg Gly Gly Lys

1 5 10 15

<210> 14

<211> 14

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (14)..(14)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 14

Ala Phe Ser Gly Val Ala Arg Gly Asp Val Arg Gly Gly Lys

1 5 10

<210> 15

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (13)..(13)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 15

Phe Ser Gly Val Ala Arg Gly Asp Val Arg Gly Gly Lys

1 5 10

<210> 16

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (12)..(12)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 16

Ser Gly Val Ala Arg Gly Asp Val Arg Gly Gly Lys

1 5 10

<210> 17

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (21)..(21)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 17

Leu Ala Gly Glu Leu Ala Gly Glu Leu Ala Gly Glu Ile Arg Gly Asp

1 5 10 15

Val Arg Gly Gly Lys

20

<210> 18

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (22)..(22)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 18

Glu Leu Ala Gly Glu Leu Ala Gly Glu Leu Ala Gly Glu Ile Arg Gly

1 5 10 15

Asp Val Arg Gly Gly Lys

20

<210> 19

<211> 23

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (23)..(23)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 19

Gly Glu Leu Ala Gly Glu Leu Ala Gly Glu Leu Ala Gly Glu Ile Arg

1 5 10 15

Gly Asp Val Arg Gly Gly Lys

20

<210> 20

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (24)..(24)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 20

Ala Gly Glu Leu Ala Gly Glu Leu Ala Gly Glu Leu Ala Gly Glu Ile

1 5 10 15

Arg Gly Asp Val Arg Gly Gly Lys

20

<210> 21

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (19)..(19)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 21

Phe Ala Phe Ala Gly Val Ala Met Pro Arg Gly Ala Glu Asp Val Arg

1 5 10 15

Gly Gly Lys

<210> 22

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (13)..(13)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 22

Phe Leu Ala Glu Ile Arg Gly Asp Val Arg Gly Gly Lys

1 5 10

<210> 23

<211> 28

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (1)..(1)

<223> N端二甲基基团

<220>

<221> MISC_FEATURE

<222> (28)..(28)

<223> 在侧链上有叠氮化物取代的C端赖氨酸

<400> 23

Ala Glu Ser Ala Glu Ser Ala Ser Arg Phe Ser Gly Val Ala Met Pro

1 5 10 15

Gly Ala Glu Asp Asp Val Val Gly Ser Gly Ser Lys

20 25

Claims

控制所述一种或多种试剂向所述样本容器递送的控制单元，

其中：

所述一种或多种试剂的递送可单独寻址，

2.根据权利要求1所述的设备，其中所述样本容器中的至少一个和/或所述试剂贮器中的至少一个受到主动加热和/或主动冷却。

3.根据权利要求1或2所述的设备，其中所述受到温度控制的样本容器的温度和所述受到温度控制的试剂贮器的温度由所述控制单元分别控制。

4.根据权利要求3所述的设备，其中所述受到温度控制的样本容器和所述受到温度控制的试剂贮器被容纳在分离的热块中。

5.根据权利要求1-4中任一项所述的设备，其还包含用于移动所述一种或多种试剂、例如所述一种或多种试剂液的机构。

6.根据权利要求5所述的设备，其中所述用于移动一种或多种试剂或试剂液的机构包括单个泵。

7.根据权利要求5所述的设备，其中所述用于移动一种或多种试剂或试剂液的机构包括多个泵。

8.根据权利要求6或7所述的设备，其中所述泵整合在所述设备中。

9.根据权利要求1-8中任一项所述的设备，其还包括废物出口和/或废物容器。

10.根据权利要求9所述的设备，其中所述设备包含多于一个废物容器。

11.根据权利要求1-10中任一项所述的设备，其中所述设备被构造成保持以下一种或多种：：

容积范围从约5μL至约50μL的试剂贮器；

容积范围从约50μL至约200μL的试剂贮器；

容积范围从约200μL至约1mL的试剂贮器；

容积范围从约1mL至约50mL的试剂贮器；

容积范围从约50mL至约500mL的试剂贮器；

容积范围从约500mL至约1L的试剂贮器；和/或

容积范围从约1L至约100L的试剂贮器。

12.根据权利要求1-11中任一项所述的设备，其中所述设备被构造成保持至少5个试剂贮器。

13.根据权利要求1-11中任一项所述的设备，其中所述设备被构造成保持至少10个试剂贮器。

14.根据权利要求1-11中任一项所述的设备，其中所述设备被构造成保持至少20个试剂贮器。

15.根据权利要求1-14中任一项所述的设备，其中所述样本容器中至少一个的容积等于或小于约10mL。

16.根据权利要求1-15中任一项所述的设备，其中所述设备被构造成保持单个样本容器、或保持两个或更多个样本容器。

17.根据权利要求1-16中任一项所述的设备，其中所述样本容器具有用于递送试剂的入口和用于排出试剂的出口。

18.根据权利要求17所述的设备，其中所述样本容器的出口被构造用于将液体从所述样本容器排放到废物容器。

19.根据权利要求10-18中任一项所述的设备，其中所述废物容器直接或间接地与一个或多个样本容器流体连接。

20.根据权利要求1-19中任一项所述的设备，其中所述样本容器中的至少一个包括多孔机构或多孔膜以允许液体通过并排出所述样本容器和/或维持样本例如样本液在所述样本容器中。

21.根据权利要求1-20中任一项所述的设备，其中所述样本容器中的至少一个包括过滤机构或过滤器，其被定位和构造成最小化或阻止样本、例如样本液从所述样品容器中逃逸。

22.根据权利要求20或21所述的设备，其中所述多孔机构或过滤机构包括玻璃料。

23.根据权利要求22所述的设备，其中所述玻璃料的孔隙尺寸为约1μm至约500μm。

24.根据权利要求22所述的设备，其中所述玻璃料的孔隙尺寸为约小于50μm。

25.根据权利要求21-24中任一项所述的设备，其中所述过滤机构或过滤器包含聚四氟乙烯(PTFE)或聚乙烯(PE)或由聚四氟乙烯(PTFE)或聚乙烯(PE)制成。

26.根据权利要求1-25中任一项所述的设备，其中所述样本容器中的至少一个对大气压开放。

27.根据权利要求1-26中任一项所述的设备，其中将所述试剂贮器与所述样本容器连接的供应管线是共用管线。

28.根据权利要求1-27中任一项所述的设备，其中所述样本容器中的至少一个被构造成装载起始样本、例如起始样本液。

29.根据权利要求1-28中任一项所述的设备，其中所述阀中的两个或更多个整合在歧管中。

30.根据权利要求1-29中任一项所述的设备，其还包括用于在至少一个所述样本容器中加速反应的机构。

31.根据权利要求30所述的设备，其中所述用于加速反应的机构被构造成施加微波能量以加速至少一个所述样本容器中的反应。

32.根据权利要求1-31中任一项所述的设备，其还包括处理机构和控制程序，所述处理机构被构造成操作所述控制程序以控制所述样本容器的温度、所述试剂贮器的温度、所述阀的定位、所述一种或多种试剂向所述样本容器的递送、和/或所述样本容器的内容物的排出。

33.根据权利要求1-32中任一项所述的设备，其还包括显示器和用户输入机构。

34.根据权利要求1-33中任一项所述的设备，其还包括用于监测所述设备的机构。

35.根据权利要求34所述的设备，其中所述监测机构被构造成监测温度、压力、流量、气泡、一个或多个阀的位置、折射率和/或电导。

36.根据权利要求32-35中任一项所述的设备，其被构造成向所述控制程序提供所述监测的反馈。

37.根据权利要求1-36中任一项所述的设备，其还包括照明机构。

38.根据权利要求1-37中任一项所述的设备，其还包括用于检测可检测信号例如荧光信号的机构或传感器。

39.根据权利要求1-38中任一项所述的设备，其还包括用于检测机器可读信号的检测器，例如条形码读取器。

40.根据权利要求1-39中任一项所述的设备，其还包括用于收集所述或其一部分的机构。

41.根据权利要求40所述的设备，其中所述用于收集样本或其一部分的机构包括直接或间接地与所述样本容器中的至少一个连接的收集容器。

42.根据权利要求1-41中任一项所述的设备，其包括经受温度控制并被构造用于允许流体流过的单个样本容器，或被构造用于保持所述单个样本容器的保持器或空间。

43.根据权利要求1-41中任一项所述的设备，其包括多个样本容器、或被构造用于保持所述样本容器的保持器或空间，其中所述样本容器中的至少一个受到温度控制并被构造用于允许流体流过。

44.根据权利要求1-41中任一项所述的设备，其包括经受温度控制并被构造用于允许流体流过的多个样本容器、或被构造用于保持所述多个样本容器的保持器或空间。

45.根据权利要求1-44中任一项所述的设备，其中单个试剂贮器受到温度控制。

46.根据权利要求1-44中任一项所述的设备，其中多个试剂贮器受到温度控制。

47.根据权利要求1-46中任一项所述的设备，其中单个阀可定位以提供从中通过的交替流动路径。

48.根据权利要求1-46中任一项所述的设备，其中多个阀可定位以提供从中通过的交替流动路径。

49.根据权利要求1-48中任一项所述的设备，其中所述控制单元控制单个试剂向单个样本容器的递送。

50.根据权利要求1-48中任一项所述的设备，其中所述控制单元控制单个试剂向多个样本容器的递送。

51.根据权利要求1-48中任一项所述的设备，其中所述控制单元控制多种试剂向多个样本容器的递送。

52.根据权利要求1-51中任一项所述的设备，其中单个试剂的递送可单独寻址。

53.根据权利要求1-51中任一项所述的设备，其中多个试剂的递送可单独寻址。

54.根据权利要求1-53中任一项所述的设备，其中一条供应管线将单个试剂贮器与单个样本容器连接。

55.根据权利要求1-53中任一项所述的设备，其中一条供应管线将单个试剂贮器与多个样本容器连接。

56.根据权利要求1-53中任一项所述的设备，其中一条供应管线将多个试剂贮器与单个样本容器连接。

57.根据权利要求1-53中任一项所述的设备，其中一条供应管线将多个试剂贮器与多个样本容器连接。

58.根据权利要求1-57中任一项所述的设备，其中所述样本容器的温度控制、所述试剂贮器的温度控制、所述阀的定位和/或所述一种或多种试剂向所述样本容器的递送中的至少两项或三项由所述控制单元自动化和控制。

59.根据权利要求1-57中任一项所述的设备，其中所述样本容器的温度控制、所述试剂贮器的温度控制、所述阀的定位和/或所述一种或多种试剂向所述样本容器的递送由所述控制单元自动化和控制。

60.根据权利要求1-59中任一项所述的设备，其包括至少一个包含结合剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间。

61.据权利要求1-60中任一项所述的设备，其包括至少一个包含用于传递信息的试剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间。

62.根据权利要求1-61中任一项所述的设备，其包括至少一个包含用于去除多肽末端氨基酸的试剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间。

63.根据权利要求1-62中任一项所述的设备，其包括至少一个包含用于加帽反应的试剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间。

64.根据权利要求1-63中任一项所述的设备，其包括至少两个试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间，所述试剂贮器包含不同类型的试剂，并且各试剂贮器包含选自结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂和用于加帽反应的试剂中的试剂。

65.根据权利要求1-63中任一项所述的设备，其包括至少三个试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间，所述试剂贮器包含不同类型的试剂，并且各试剂贮器包含选自结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂和用于加帽反应的试剂中的试剂。

66.根据权利要求1-63中任一项所述的设备，其包括至少一个包含结合剂的试剂贮器、至少一个包含用于传递信息的试剂的试剂贮器、至少一个包含用于去除多肽末端氨基酸的试剂的试剂贮器和至少一个包含用于加帽反应的试剂的贮器、或被构造用于保持所述试剂贮器的保持器或空间。

67.根据权利要求60-66中任一项所述的设备，其中所述包含结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂以及用于加帽反应的试剂的试剂贮器中的至少一个是受温度控制的。

68.根据权利要求60-66中任一项所述的设备，其中所述包含结合剂、用于转移信息的试剂、用于去除多肽末端氨基酸的试剂以及用于加帽反应的试剂的试剂贮器中的至少两个或三个是受温度控制的。

69.根据权利要求60-66中任一项所述的设备，其中所述包含结合剂、用于转移信息的试剂、用于去除多肽末端氨基酸的试剂以及用于加帽反应的试剂的试剂贮器、或被构造用于保持所述试剂贮器的保持器或空间是受温度控制的。

70.根据权利要求1-69中任一项所述的设备，其中所述试剂贮器中的至少一个包含洗涤缓冲液。

71.根据权利要求70所述的设备，其包括单个包含洗涤缓冲液的试剂贮器。

72.根据权利要求70所述的设备，其包括多个包含不同洗涤缓冲液、例如三种或更多种不同洗涤缓冲液的试剂贮器。

73.根据权利要求70-72中任一项所述的设备，其中所述包含洗涤缓冲液的试剂贮器被构造成容纳约50mL或更大的体积。

74.根据权利要求1-73中任一项所述的设备，其中所述样本容器装载含有大分子、例如多肽的样本。

75.根据权利要求74所述的设备，其中所述大分子是蛋白质。

76.根据权利要求74所述的设备，其中所述大分子是肽。

77.根据权利要求74所述的设备，其中所述样本包含许多多肽，例如多种蛋白质或肽。

78.根据权利要求76所述的设备，其中所述肽是通过将蛋白质、例如来自生物样本的蛋白质片段化而获得的。

79.根据权利要求74-78中任一项所述的设备，其中所述大分子与记录标签缔合或接合。

80.根据权利要求79所述的设备，其中所述记录标签是DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子或其组合。

81.根据权利要求79或80所述的设备，其中所述记录标签包含通用引发序列。

82.根据权利要求79-81中任一项所述的设备，其中所述大分子、所述缔合的或接合的记录标签、或二者，与固体载体共价接合。

83.根据权利要求82所述的设备，其中所述固体载体是三维载体(例如，多孔基质或珠子)。

84.根据权利要求82所述的设备，其中所述固体载体是聚苯乙烯珠、聚丙烯酸酯珠、聚合物珠、琼脂糖珠、纤维素珠、葡聚糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁珠、玻璃珠、可控孔度珠、基于二氧化硅的珠、或其任何组合。

85.根据权利要求60-84中任一项所述的设备，其中所述结合剂是多肽或蛋白质。

86.根据权利要求85所述的设备，其中所述结合剂是修饰的氨肽酶、修饰的氨酰基tRNA合成酶、修饰的抗运载蛋白、或抗体或其结合片段。

87.根据权利要求60-86中任一项所述的设备，其中所述结合剂被构造成结合包含多肽的单个氨基酸残基、二肽、三肽或翻译后修饰的靶标。

88.根据权利要求87所述的设备，其中所述结合剂被构造成结合包含多肽的N端氨基酸残基、C端氨基酸残基或内部氨基酸残基的靶标。

89.根据权利要求88所述的设备，其中所述结合剂被构造成结合包含多肽的修饰的N端氨基酸残基、修饰的C端氨基酸残基或修饰的内部氨基酸残基的靶标。

90.根据权利要求87所述的设备，其中所述结合剂被构造成结合包含多肽的N端肽、C端肽或内部肽的靶标。

91.根据权利要求60-90中任一项所述的设备，其中所述结合剂包含具有关于所述结合剂的标识信息的代码标签。

92.T根据权利要求91所述的设备，其中所述代码标签是DNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子或其组合。

93.根据权利要求91或权利要求92所述的设备，其中所述代码标签包含编码区序列。

94.根据权利要求91-93中任一项所述的设备，其中所述代码标签还包含间隔区、结合循环特异性序列、唯一分子标识符、通用引发位点或其组合。

95.根据权利要求91-94中任一项所述的设备，其中所述结合剂和所述代码标签通过接头接合。

96.根据权利要求79-95中任一项所述的设备，其还包括用于扩增所述记录标签的试剂。

97.根据权利要求61-96中任一项所述的设备，其中所述用于传递信息的试剂包含酶。

98.根据权利要求97所述的设备，其中所述用于传递信息的试剂用于进行引物延伸或连接反应。

99.根据权利要求97或98所述的设备，其中所述用于传递信息的试剂受到温度控制。

100.根据权利要求63-99中任一项所述的设备，其中所述用于加帽反应的试剂包含加帽核酸。

101.根据权利要求100所述的设备，其中所述加帽核酸包含通用引发序列。

102.根据权利要求100或101所述的设备，其中所述用于加帽反应的试剂包含酶。

103.根据102所述的设备，其中所述加帽试剂用于进行延伸或连接反应。

104.根据权利要求100-103中任一项所述的设备，其中所述用于加帽反应的试剂受到温度控制。

105.根据权利要求62-104中任一项所述的设备，其中所述用于去除多肽末端氨基酸的试剂包括化学或酶试剂。

106.根据权利要求1-105中任一项所述的设备，其还包括：

a)用于修饰多肽末端氨基酸的试剂；或

b)包含用于修饰多肽末端氨基酸的试剂的试剂贮器。

107.根据权利要求106所述的设备，其中所述用于修饰多肽末端氨基酸的试剂包括化学剂或酶剂。

108.根据权利要求1-107中任一项所述的设备，其中所述阀中至少一个的死体积为约0.5μL至约5μL，例如约1μL至约2μL。

109.根据权利要求1-108中任一项所述的设备，其中所述控制单元被构造成使用跨平台语言、例如python进行操作。

110.根据权利要求1-109中任一项所述的设备，其被构造成在没有实时控制或没有精确实时控制下操作。

111.根据权利要求1-110中任一项所述的设备，其中具有较小容积的试剂贮器中的至少一个位于比具有较大容积的试剂贮器更靠近所述样本容器的位置。

112.根据权利要求111所述的设备，其中所述包含结合剂、用于传递信息的试剂、用于去除多肽末端氨基酸的试剂和/或用于加帽反应的试剂的试剂贮器中的至少一个位于比包含洗涤缓冲液的试剂贮器更靠近所述样本容器的位置。

113.根据权利要求1-112中任一项所述的设备，其被构造成将水相生化反应和有机化学反应整合为循环过程，例如，将肽序列转化为用于NGS分析的DNA文库的循环过程。

114.根据权利要求1-113中任一项所述的设备，其被构造成生成输出样本，例如，包含DNA文库或编码文库的输出样本，所述输出样本被构造成通过DNA测序仪、例如通用DNA测序仪(NGS)进行分析。

115.根据权利要求1-114中任一项所述的设备，其被构造成执行高通量样本处理。

116.根据权利要求1-115中任一项所述的设备，其被构造成执行多肽无关或蛋白质无关的分析。

117.一种自动化处理样本的方法，所述方法使用根据权利要求1-116任一项所述的设备进行，并且所述方法包括：

118.根据权利要求117所述的方法，其还包括重复步骤c)和d)两次或更多次。

119.根据权利要求117或根据权利要求118所述的方法，其中所述样本容器装有体积等于或小于约20mL的样本。

120.根据权利要求117或根据权利要求118所述的方法，其中所述样本容器装有体积等于或小于约10mL的样本。

121.根据权利要求117-120中任一项所述的方法，其中所述记录标签是DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子或其组合。

122.根据权利要求121所述的方法，其中所述记录标签包含通用引发序列。

123.根据权利要求117-122中任一项所述的方法，其中所述大分子、所述缔合的或接合的记录标签、或二者，与固体载体共价接合。

124.根据权利要求123所述的方法，其中所述固体载体是三维载体(例如，多孔基质或珠子)。

125.根据权利要求124所述的方法，其中所述固体载体是聚苯乙烯珠、聚丙烯酸酯珠、聚合物珠、琼脂糖珠、纤维素珠、葡聚糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁珠、玻璃珠、可控孔度珠、基于二氧化硅的珠、或其任何组合。

126.根据权利要求117-125中任一项所述的方法，其中将所述代码标签的信息传递到所述记录标签是由DNA连接酶介导的。

127.根据权利要求117-126中任一项所述的方法，其中将所述代码标签的信息传递到所述记录标签是由DNA聚合酶介导的。

128.根据权利要求117-126中任一项所述的方法，其中将所述代码标签的信息传递到所述记录标签是由化学连接介导的。

129.根据权利要求117-128中任一项所述的方法，其还包括在步骤a)中将用于去除多肽末端氨基酸的试剂提供到所述设备的单独试剂贮器中以及下述步骤：

130.根据权利要求129所述的方法，其中步骤e)在步骤a)和步骤b)之后进行。

131.根据权利要求129或权利要求130所述的方法，其还包括重复步骤c)至e)两次或更多次。

132.根据权利要求117-131中任一项所述的方法，其还包括在步骤a)中将用于加帽反应的试剂提供到所述设备的单独试剂贮器中以及下述步骤：

133.根据权利要求132所述的方法，其中步骤f)在步骤a)至e)之后进行。

134.根据权利要求132或权利要求133所述的方法，其中所述用于加帽反应的试剂包含通用引发序列和用于延伸或连接反应的试剂。

135.根据权利要求117-134中任一项所述的方法，其还包括在步骤a)中将用于修饰多肽末端氨基酸的试剂提供到所述设备的试剂贮器中以及将所述用于修饰多肽末端氨基酸的试剂递送到所述样本容器。

136.根据权利要求135所述的方法，其中所述用于修饰多肽末端氨基酸的试剂包括化学剂或酶剂。

137.根据权利要求135或权利要求136所述的方法，其中在步骤c)之前、步骤d)之前、步骤e)之前和/或步骤f)之前将所述用于修饰多肽末端氨基酸的试剂递送到所述样本容器。

138.根据权利要求117-137中任一项所述的方法，其还包括从所述样本容器释放和收集样样本或其一部分。

139.根据权利要求117-138中任一项所述的方法，其还包括扩增所述延伸记录标签。

140.根据权利要求117-139中任一项所述的方法，其中执行任何步骤c)-f)都包括调节所述样本容器的温度。

141.根据权利要求129-140中任一项所述的方法，其中执行步骤e)包括将所述样本容器的温度调节到约25℃至约60℃之间的温度。

142.根据权利要求117-141中任一项所述的方法，其还包括将洗涤缓冲液从所述试剂贮器递送到所述样本容器。

143.根据权利要求142所述的方法，其中所述洗涤缓冲液在步骤c)之前、步骤d)之前、步骤e)之前和/或步骤f)之前递送。

144.根据权利要求142或权利要求143所述的方法，其包括将单个洗涤缓冲液从所述试剂贮器递送到所述样本容器。

145.根据权利要求142或权利要求143所述的方法，其包括将多种洗涤缓冲液、例如2至10种洗涤缓冲液从所述试剂贮器递送到所述样本容器。

146.根据权利要求117-145中任一项所述的方法，其中步骤c)-f)中的至少一个以一种或多种受控的流速进行。

147.根据权利要求117-146中任一项所述的方法，其中步骤c)-f)中的至少一个由所述控制单元控制。

148.根据权利要求147所述的方法，其中步骤c)-f)中的两个、三个或全部由所述控制单元控制。

149.根据权利要求117-148中任一项所述的方法，其中步骤a)-f)中的至少一个是自动化的。

150.根据权利要求149所述的方法，其中步骤a)-f)中的两个、三个、四个、五个或全部是自动化的。

151.根据权利要求117-150中任一项所述的方法，其还包括在直接或间接地与至少一个所述样本容器连接的收集容器中收集所述样本或其一部分。

152.根据权利要求151所述的方法，其中在所述收集容器中收集所述样本或其一部分之前，用切割试剂处理所述样本。

153.根据权利要求151或权利要求152所述的方法，其中所述收集由所述控制单元自动化和/或控制。

154.根据权利要求117-153中任一项所述的方法，其中所述控制单元使用跨平台语言、例如python进行操作。

155.根据权利要求117-154中任一项所述的方法，其在没有实时控制或没有精确实时控制下操作。

156.根据权利要求117-155中任一项所述的方法，其将水相生化反应和有机化学反应整合为循环过程，例如，将肽序列转化为用于NGS分析的DNA文库的循环过程。

157.根据权利要求117-156中任一项所述的方法，其生成输出样本，例如，包含DNA文库或编码文库的输出样本，所述样本由DNA测序仪、例如通用DNA测序仪(NGS)进行分析。

158.根据权利要求117-157中任一项所述的方法，其旨在进行高通量样本处理。

159.根据权利要求117-158中任一项所述的方法，其旨在进行多肽无关或蛋白质无关的分析。