CN114072499B

CN114072499B - 用于制备分析物的方法和相关试剂盒

Info

Publication number: CN114072499B
Application number: CN202080031904.4A
Authority: CN
Inventors: 马克·S·朱; 凯文·L·冈德森; 村中德仁; 布莱恩·T·韦纳特
Original assignee: Encodia Inc
Current assignee: Encodia Inc
Priority date: 2019-04-30
Filing date: 2020-04-10
Publication date: 2024-08-06
Anticipated expiration: 2040-04-10
Also published as: AU2020267119A1; JP7582676B2; JP2022530966A; EP3963070A4; US11634709B2; CA3138367A1; CN114072499A; US20230279386A1; WO2020223000A1; EP3963070A1; US20220049246A1

Abstract

本文提供了用于制备和处理用于分析的分析物(例如，一个大分子或多个大分子、肽、多肽和蛋白质)的方法。在一些实施例中，在包含使用诱饵和捕获核酸、固体支持物和包含所述诱饵和捕获核酸的反应混合物的方法中制备和处理分析物。在一些实施例中，分析物与固体支持物偶联。还提供了含有组分的试剂盒，其用于执行所提供的用于制备分析物的方法。在一些实施例中，所述方法用于制备用于测序的分析物。本文提供了用于制备和处理用于分析的分析物(例如，一个大分子或多个大分子、肽、多肽和蛋白质)的方法。在一些实施例中，在包含使用诱饵和捕获核酸、固体支持物和包含所述诱饵和捕获核酸的反应混合物的方法中制备和处理分析物。在一些实施例中，分析物与固体支持物偶联。还提供了含有组分的试剂盒，其用于执行所提供的用于制备分析物的方法。在一些实施例中，所述方法用于制备用于测序的分析物。

Description

用于制备分析物的方法和相关试剂盒

相关申请的交叉引用

本申请要求于2019年4月30日提交的美国临时专利申请第62/840,675号的优先权，所述美国临时专利申请的公开内容出于所有目的通过引用整体并入本文。

关于联邦资助研究的声明

本发明是在美国国立卫生研究院国家癌症研究所授予的政府支持下完成的，授权号为R44CA203629。根据该授予，美国政府对本发明享有某些权利。

ASCII文本上的序列表

本专利或申请文件含有以计算机可读ASCII文本格式提交的序列表(文件名：4614-2001540_20200410_SeqList_ST25.txt，记录时间：2020年4月10日，大小：15,601字节)。序列表文件的内容通过引用整体并入本文。

技术领域

本公开涉及用于制备和处理用于分析的分析物(例如，一个大分子或多个大分子、肽、多肽和蛋白质)的方法。在一些实施例中，在使用诱饵和捕获核酸、固体支持物和包含所述诱饵和捕获核酸的反应混合物的方法中制备和处理分析物。在一些实施例中，分析物与固体支持物偶联。还提供了试剂盒，其含有用于执行所提供的用于制备分析物的方法的组分。在一些实施例中，所述方法和试剂盒用于制备用于测序的分析物。

背景技术

本公开涉及制备和处理用于评估的分析物的方法，例如制备用于分析(例如，测序)的蛋白质。根据现有方法，DNA-蛋白质缀合物的DNA定向固定已被用于固定抗体(Kim等人,《传感器(Sensors)》(Basel)(2008)8(10):6605-6641；Dahotre等人,《美国科学院院报(PNAS)》(2018)115(17):4357-4362；Jung等人,《分析化学(Anal.Chem)》(2007)79(17):6534-6541)。其它杂交方法包含使用核酸作为探针来杂交和检测目标核酸(美国专利公开号5,770,365)。

然而，需要用于有效制备分析物的方法以生成与蛋白质分析(例如，蛋白质测序)相容的核酸分析物缀合物格式。例如，制备分析物的理想方法可以与基于降解的多肽测序分析相容。此外，可能是有利的是，将分析物固定在固体支持物上，使得组分保持附着并且可用于涉及各种化学和/或酶促反应的蛋白质分析测定。在一些实施例中，测定可以涉及用化学试剂和/或酶进行的多个循环和处理。在一些情况下，分析物和核酸被制备成使得核酸组分可用于基于核酸的测定。

因此，仍然需要与制备用于分析和/或测序的分析物相关的改进技术或新技术，其应用到蛋白质测序和/或分析，以及用于实现这些的产品、方法和试剂盒。需要以允许分析物评估的格式捕获分析物的有效方法，例如，基于核酸的测定。本公开满足了这些和其它相关需求。

参考以下详细描述，本发明的这些方面和其它方面将变得显而易见。为此，本文阐述了各种参考文献，这些参考文献更详细地描述了某些背景信息、程序、化合物和/或组合物，并且各自通过引用整体并入本文。

发明内容

发明内容并不旨在用于限制所要求保护的主题的范围。根据包含附图和所附权利要求书中公开的那些方面在内的详细描述，所要求保护的主题的其它特征、细节、效用和优点将变得显而易见。

本文提供了一种用于处理分析物的方法，所述方法包含将分析物附着到诱饵核酸上以生成核酸-分析物嵌合体；通过使所述核酸-分析物嵌合体中的所述诱饵核酸与附着在固体支持物上的捕获核酸杂交，使所述核酸-分析物嵌合体接近所述固体支持物；以及将所述核酸-分析物嵌合体共价偶联到所述固体支持物上；其中多个所述核酸-分析物嵌合体偶联在所述固体支持物上，并且任何相邻偶联的核酸-分析物嵌合体以约50nm或更大的平均距离彼此间隔开。

本文提供了通过以下步骤生成的核酸-分析物缀合物：将分析物附着到诱饵核酸上以生成核酸-分析物嵌合体；通过使所述核酸-分析物嵌合体中的所述诱饵核酸与附着在固体支持物上的捕获核酸杂交，使所述核酸-分析物嵌合体接近所述固体支持物；以及将所述核酸-分析物嵌合体共价偶联到所述固体支持物上；其中多个核酸-分析物嵌合体偶联在所述固体支持物上，并且任何相邻偶联的核酸-分析物嵌合体以约50nm或更大的平均距离间隔开。

本文提供了试剂盒，所述试剂盒含有多个诱饵核酸，所述诱饵核酸中的每一个被配置成附着于分析物；以及包括多个附着的捕获核酸的固体支持物，所述捕获核酸中的每一个包括与对应的诱饵核酸互补的序列，其中任何相邻附着的捕获核酸以约50nm或更大的平均距离在所述固体支持物上间隔开。

附图说明

将参考附图通过举例描述本发明的非限制性实施例，附图是示意性的并且不旨在按比例绘制。为了说明的目的，未在每个图中标记每个组分，也未示出本发明的每个实施例的每个组分，其中说明对于本领域的普通技术人员理解本发明来说不是必需的。

图1A-1D描绘了用于将分析物附着到诱饵核酸上并将核酸-分析物嵌合体偶联到珠子上的示例性方法。在一些实例中，分析物直接或间接(例如，通过接头)附着到诱饵核酸。在图1A中，分析物附着到诱饵核酸的内部位置，并且核酸-分析物嵌合体附着到捕获核酸的3'端。在图1B中，分析物附着到诱饵核酸的3'端，并且核酸-分析物嵌合体附着到捕获核酸的3'端。在图1C中，分析物附着到诱饵核酸的内部位置，并且核酸-分析物嵌合体附着到捕获核酸的5'端。在图1D中，分析物附着到诱饵核酸的5'端，并且核酸-分析物嵌合体附着到捕获核酸的5'端。在一些实施例中，诱饵核酸与捕获核酸的附着是通过连接进行的。

图2A-C描绘了用于蛋白质分析物的光亲和标记和固定的方法。具有光敏二苯甲酮部分的诱饵核酸用于在暴露于UV365 nm光时随机标记蛋白质，从而形成核酸-分析物嵌合体(图2A)。该过程也可以使用炔烃-二苯甲酮和叠氮化物-低聚物分两步完成。核酸-分析物嵌合体通过其诱饵核酸与具有反应性补骨脂素部分的互补捕获核酸衍生的表面杂交(图2B)。该复合物在暴露于UV光时与补骨脂素共价交联(图2C)。

图3-7描绘了用于在固体支持物上形成核酸-分析物缀合物的示例性步骤和配置，包含任选地添加条形码序列。在一些情况下，条形码序列可以包含样品条形码、级分条形码、空间条形码、隔室标签或其任何组合。使用类似的方法，可以添加UMI或其它功能性核酸组分，例如通用引发位点、与附着到另一核酸部分的间隔子序列互补的间隔子序列或其任何组合。

图3描绘了用于固定分析物的以下步骤：条形码模板(BC')与核酸-分析物嵌合体杂交；使用延伸反应将诱饵核酸的3'端延伸至包含条形码序列；通过将诱饵核酸(带有分析物和条形码)与附着在固体支持物上的捕获核酸杂交，使带有新扩展的条形码的核酸-分析物嵌合体接近固体支持物；核酸-分析物嵌合体通过附着(例如，通过连接)捕获核酸和诱饵核酸而共价偶联至固体支持物。

图4描绘了用于固定分析物的以下步骤：通过将诱饵核酸(带有分析物)与附着在固体支持物上的捕获核酸杂交，使核酸-分析物嵌合体接近固体支持物；核酸-分析物嵌合体通过附着(例如，通过连接)捕获核酸和诱饵核酸而共价偶联至固体支持物；使用条形码模板(BC')进行延伸反应，以将诱饵核酸的3'端延伸至包含来自模板的条形码序列；使用消化反应从偶联在固体支持物上的核酸分析物缀合物中释放条形码模板。

图5描绘了用于固定分析物的以下步骤：使用连接反应将诱饵核酸附着到条形码上；通过将诱饵核酸(带有分析物和条形码)与附着在固体支持物上的捕获核酸杂交，使带有附着的条形码的核酸-分析物嵌合体接近固体支持物；核酸-分析物嵌合体通过附着(例如，通过连接)捕获核酸和诱饵核酸而共价偶联至固体支持物。在一些实施例中，使用带夹板核酸链，其中夹板通过杂交将诱饵核酸和条形码桥接并且能够实现有效的连接或化学偶联。在一些实施例中，夹板核酸与诱饵核酸分开。

图6和7描绘了条形码到捕获核酸的3'端的附着(例如，通过连接)以及核酸-分析物嵌合体通过将诱饵核酸附着(例如，通过连接)到5'捕获核酸而偶联至固体支持物。在图6中，条形码与核酸-分析物嵌合体的一个区域杂交，并且通过将嵌合体的诱饵核酸与附着在固体支持物上的捕获核酸杂交，使两者接近固体支持物；核酸-分析物嵌合体通过将捕获核酸的5'端附着(例如，通过连接)到诱饵核酸而共价偶联至固体支持物；条形码附着到捕获核酸的3'端(例如，通过连接)。在图7中，通过将嵌合体的诱饵核酸与附着在固体支持物上的捕获核酸的5'端杂交，使核酸-分析物嵌合体接近固体支持物，并且捕获核酸包含条形码序列。

图8描绘了将条形码和任选的其它核酸组分安装到诱饵核酸上的步骤。使核酸-分析物嵌合体与含有多个dU、UMI、条形码和/或间隔子序列的核酸模板杂交；在反应中进行引物延伸(例如，在25℃下包含Klenow片段(exo-))，以将来自模板条形码的UMI、条形码和/或间隔子安装到诱饵核酸上(附着到分析物)；将所得dsDNA用USER酶处理以消化dU位点，并加热以去除经消化的片段。在一些情况下，诱饵核酸包含通用引发位点或其一部分。

图9描绘了使用逆转录将条形码和任选的其它核酸组分安装到诱饵核酸上的步骤。使用含有UMI、条形码和/或间隔子序列的RNA条形码模板，并在反应中用逆转录酶(RNase H-)在约50℃下进行逆转录，持续约1小时，以将UMI、条形码和/或间隔子序列安装到诱饵核酸上)；将所得RNA/DNA杂交体用RNase处理以消化RNA条形码模板。在一些情况下，诱饵核酸包含通用引发位点或其一部分。

图10是在示例性肽分析测定中评估的各种肽的编码效率的总结，所述测定使用F-结合剂用于经修饰的N端苯丙氨酸。

具体实施方式

本文提供了用于制备分析物(例如，一个大分子或多个大分子、肽、多肽和蛋白质)的方法和试剂盒。在一些实施例中，所述方法和试剂盒用于处理分析物以准备测序和/或分析。在一些实施例中，所述方法包含将分析物附着到固体支持物上。在一些实施例中，固定化核酸-分析物嵌合体被配置用于分析分析物，例如，其中所述分析采用分子识别事件和/或可检测标记的条形编码和核酸编码。在一些实施例中，所述方法包含将分析物附着到诱饵核酸上以生成核酸-分析物嵌合体；通过使所述核酸-分析物嵌合体中的所述诱饵核酸与附着在固体支持物上的捕获核酸杂交，使所述核酸-分析物嵌合体接近所述固体支持物；以及将所述核酸-分析物嵌合体共价偶联到所述固体支持物上，其中多个所述核酸-分析物嵌合体偶联在所述固体支持物上，并且任何相邻偶联的核酸-分析物嵌合体以50nm或更大的平均距离彼此间隔开。在一些实施例中，所述分析物获自生物样品。在一些实施例中，所述分析物是蛋白质。在一些实施例中，所述分析物是肽，例如，从样品获得的片段化蛋白质生成的肽。还提供了通过本文提供的任何方法生成的核酸-分析物缀合物。

还提供了含有组分和/或试剂的试剂盒，其用于执行所提供的处理和制备分析物以供测序和/或分析的方法。在一些实施例中，所述试剂盒还包含用于使用试剂盒执行本文提供的用于制备或处理分析物的任何方法的说明书。

用于固定和捕获分析物的现有方法包含DNA-蛋白质缀合物的DNA定向固定，包含用于将抗体固定在固体表面上(Kim等人,《传感器》(Basel).(2008)8(10):6605-6641；Dahotre等人,《美国科学院院报》(2018)115(17):4357-4362；Jung等人,《分析化学)》(2007)79(17):6534-6541)。其它已知的杂交方法包含使用核酸作为探针来杂交和检测目标核酸(美国专利号5,770,365)。

然而，需要用于有效制备分析物的方法以生成与蛋白质分析(例如，蛋白质测序)相容的核酸分析物缀合物格式。例如，可能是有利的是，将分析物固定在固体支持物上，使得分析物和核酸组分在涉及各种化学和/或酶促反应的整个蛋白质分析测定中保持附着和/或固定。在一些实施例中，测定可以涉及用化学试剂和/或酶进行的多个循环和处理。在一些情况下，分析物和/或核酸与固体支持物偶联，使得在蛋白质分析测定期间(包含通过测定的多个循环)，两者都是可用的并且保持可用。在一些情况下，分析物和核酸被制备成使得核酸组分可用于基于核酸的分析物测定。例如，所使用的核酸可以包含用于下游分析的组分，如用于下游DNA测序的组分。

因此，仍然需要与制备用于分析和/或测序的分析物相关的改进技术，其应用到蛋白质测序和/或分析，以及用于实现这些的产品、方法和试剂盒。需要以允许分析物评估的格式捕获分析物的有效方法，例如，使用基于核酸的测定。本公开满足了这些和其它相关需求。在一些实施例中，本公开部分提供了用于制备分析物的方法，以与高度平行、高通量的数字大分子(例如，多肽)表征和定量方法一起使用，其中直接应用于蛋白质和肽的表征和测序。

在一些实施例中，本文提供了用于处理分析物的方法，所述方法包含将分析物附着到诱饵核酸上以生成核酸-分析物嵌合体；通过使所述核酸-分析物嵌合体中的所述诱饵核酸与附着在固体支持物上的捕获核酸杂交，使所述核酸-分析物嵌合体接近所述固体支持物；以及将所述核酸-分析物嵌合体共价偶联到所述固体支持物上；其中多个所述核酸-分析物嵌合体偶联在所述固体支持物上，并且任何相邻偶联的核酸-分析物嵌合体以约50nm或更大的平均距离彼此间隔开。还提供了通过以下步骤生成的核酸分析物缀合物：将分析物附着到诱饵核酸上以生成核酸-分析物嵌合体；通过使所述核酸-分析物嵌合体中的所述诱饵核酸与附着在固体支持物上的捕获核酸杂交，使所述核酸-分析物嵌合体接近所述固体支持物；以及将所述核酸-分析物嵌合体共价偶联到所述固体支持物上；其中多个所述核酸-分析物嵌合体以间隔开的方式偶联在所述固体支持物上，并且任何相邻偶联的核酸-分析物嵌合体以50nm或更大的平均距离彼此间隔开。在一些实施例中，分析物包括从样品获得的多个大分子，例如，蛋白质、多肽、肽或其片段。在一些实施例中，样品是从受试者获得的。在一些实施例中，分析物直接或间接偶联至诱饵核酸。在一些实施例中，分析物直接或间接偶联至固体支持物。

在一些实施例中，分析物附着到诱饵核酸的3'端。在一些实施例中，分析物附着到诱饵核酸的5'端。在一些实施例中，分析物附着到诱饵核酸的内部位置。在一些方面，捕获核酸、核酸-分析物嵌合体和/或诱饵核酸进一步包括条形码。在一些情况下，用于制备和处理分析物的方法进一步包括在核酸-分析物嵌合体偶联至固体支持物之后将条形码附着到所述核酸-分析物嵌合体上。在一些实例中，条形码包括隔室条形码、分区条形码、样品条形码、级分条形码或其任何组合。

在一些实施例中，核酸-分析物缀合物与基于核酸的分析物测序测定相容。在一些实施例中，在将诱饵核酸-分析物嵌合体缀合至固体支持物之后，诱饵核酸的5'端可用于反应。在一些实施例中，在将诱饵核酸-分析物嵌合体缀合至固体支持物之后，捕获核酸的5'端可用于反应。在一些实施例中，在将诱饵核酸-分析物嵌合体缀合至固体支持物之后，诱饵核酸的3'端可用于反应。在一些实施例中，在将诱饵核酸-分析物嵌合体缀合至固体支持物之后，捕获核酸的3'端可用于反应。在一些实例中，核酸可用于延伸反应(例如，PCR延伸反应)和/或连接反应。

在一些实施例中，本文描述的用于处理分析物的方法适用于使用包含以下步骤的测定来分析分析物：使分析物与能够结合所述分析物的结合剂接触，其中所述结合剂包括带有关于所述结合剂的标识信息的编码标签；以及将编码标签的标识信息转移到诱饵核酸或捕获核酸。在一些实例中，在固体支持物上生成核酸-分析物缀合物，使得在偶联后，核酸和分析物均可用于包含以下步骤的测定：使分析物与能够结合所述分析物的结合剂接触，其中所述结合剂包括带有关于所述结合剂的标识信息的编码标签；以及将编码标签的标识信息转移到诱饵核酸或捕获核酸。在一些实例中，固体支持物上的核酸-分析物缀合物与测序测定相容，所述测序测定包含与结合剂接触和转移标识信息的一个或多个循环。

本文提供了一种试剂盒，其包括(a)多个诱饵核酸，所述诱饵核酸中的每一个被配置成附着于分析物；以及(b)包括多个附着的捕获核酸的固体支持物，所述捕获核酸中的每一个包括与对应的诱饵核酸互补的序列，其中任何相邻附着的捕获核酸以约50nm或更大的平均距离在所述固体支持物上间隔开。在一些实施例中，提供了试剂盒，所述试剂盒包括(a)多个诱饵核酸，所述诱饵核酸中的每一个被配置成附着于分析物；以及(b)多个捕获核酸，所述捕获核酸中的每一个包括与对应的诱饵核酸互补的序列。

许多具体细节陈述于以下描述中以提供对本公开的充分理解。提供这些细节用于实例的目的，并且在没有这些具体细节中的一些或全部的情况下，可以根据权利要求实践所要求保护的主题。应理解，在不背离所要求保护的主题的范围的情况下，可以使用其它实施例并且可以进行结构变化。应当理解，一个或多个单独实施例中描述的各种特征和功能不会将所述特征和功能的适用范围限制于描述所述特征和功能的特定实施例。相反，所述特征和功能可以单独地或以某种组合应用于本公开的一个或多个其它实施例，不管此类实施例是否被描述，并且不管此类特征是否是作为所述实施例的一部分来呈现。出于清楚的目的，没有详细描述与所要求保护的主题相关的技术领域中已知的技术材料，使得所要求保护的主题不会不必要地含糊不清。

本申请中提及的所有出版物，包含专利文件、科学文章和数据库，出于所有目的通过引用整体并入本文，其程度与每个单独出版物通过引用分别并入的程度相同。引用出版物或文件并不意味着承认它们中的任何一个都是相关的现有技术，也不构成对这些出版物或文件的内容或日期的任何承认。

所有标题都为了方便读者，并且除非如此规定，否则不应当用于限制在标题后的文本的含义。

定义

除非另有定义，否则本文所使用的所有技术术语和科学术语均具有与本公开所属领域的普通技术人员通常所理解的含义相同的含义。如果本章节中陈述的定义与在通过引用并入本文的专利、申请、公开的申请和其它出版物中陈述的定义相反或在其它方面不一致，则在本章节中陈述的定义优先于通过引用并入本文的定义。

如本文所使用的，除非上下文另有明确指示，否则单数形式“一个/种(a/an)”和“所述(the)”包含复数指示物。因此，例如，提及“肽”包含一种或多种肽，或肽的混合物。提及“分析物”包含一种或多种分析物，或分析物的混合物。而且，除非在本文中使用特别说明或从上下文显而易见，否则术语“或”应理解为是包括性的，并且涵盖“或”和“与”两者。

如本文所使用的，术语“约”是指本技术领域的技术人员容易知道的各个值的通常误差范围。本文中对“约”值或参数的提及包含(并描述)针对该值或参数本身的实施例。例如，提及“约X”的描述包含对“X”的描述。

如本文所使用的，术语“大分子”涵盖由较小亚基组成的大分子。大分子的实例包含但不限于肽、多肽、蛋白质、核酸、碳水化合物、脂质、大环化合物。大分子还包含由共价连接在一起的两种或更多种类型的大分子的组合组成的嵌合大分子(例如，与核酸连接的肽)。大分子还可以包含“大分子组合体”，其由两个或更多个大分子的非共价复合物组成。大分子组合体可以由相同类型的大分子(例如，蛋白质-蛋白质)或由两种以上不同类型的大分子(例如，蛋白质-DNA)组成。

如本文所使用的，术语“多肽”涵盖肽和蛋白质，并且是指包括通过肽键连接的两个或更多个氨基酸的链的分子。在一些实施例中，多肽包括2到50个氨基酸，例如，具有多于20到30个氨基酸。在一些实施例中，肽不包括二级、三级或更高级结构。在一些实施例中，多肽是蛋白质。在一些实施例中，蛋白质包括30个或更多个氨基酸，例如，具有多于50个氨基酸。在一些实施例中，除一级结构外，蛋白质还包括二级，三级或更高级结构。多肽的氨基酸最典型地是L-氨基酸，但也可以是D-氨基酸、经修饰的氨基酸、氨基酸类似物、氨基酸模拟物或其任何组合。多肽可以是天然存在的、合成产生的或重组表达的。多肽可以合成产生、分离、重组表达或通过上述方法的组合产生。多肽还可以包括修饰氨基酸链的额外基团，例如，通过翻译后修饰添加的官能团。聚合物可以是直链或支链的，其可以包括经修饰的氨基酸，并且其可以被非氨基酸中断。所述术语还涵盖已天然或通过干预修饰的氨基酸聚合物；例如，二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其它操作或修饰，如与标记组分缀合。

如本文所使用的，术语“氨基酸”是指包括胺基、羧酸基和对每个氨基酸特异的侧链的有机化合物，其用作肽的单体亚基。氨基酸包含20种标准氨基酸、天然氨基酸或规范氨基酸以及非标准氨基酸。标准的天然氨基酸包含丙氨酸(A或Ala)、半胱氨酸(C或Cys)、天冬氨酸(D或Asp)、谷氨酸(E或Glu)、苯丙氨酸(F或Phe)、甘氨酸(G或Gly)、组氨酸(H或His)、异亮氨酸(I或Ile)、赖氨酸(K或Lys)、亮氨酸(L或Leu)、蛋氨酸(M或Met)、天冬酰胺(N或Asn)、脯氨酸(P或Pro)、谷氨酰胺(Q或Gln)、精氨酸(R或Arg)、丝氨酸(S或Ser)、苏氨酸(T或Thr)、缬氨酸(V或Val)、色氨酸(W或Trp)和酪氨酸(Y或Tyr)。氨基酸可以是L-氨基酸或D-氨基酸。非标准氨基酸可以是天然存在或化学合成的经修饰的氨基酸、氨基酸类似物、氨基酸模拟物、非标准蛋白原氨基酸或非蛋白原氨基酸。非标准氨基酸的实例包含但不限于硒代半胱氨酸、吡咯赖氨酸和N-甲酰基甲硫氨酸、β-氨基酸、同位氨基酸(Homo-amino acids)、脯氨酸和丙酮酸衍生物、3-取代的丙氨酸衍生物、甘氨酸衍生物、环-取代的苯丙氨酸和酪氨酸衍生物、线性核心氨基酸、N-甲基氨基酸。

如本文所使用的，术语“翻译后修饰”是指在被核糖体完成翻译后在肽上发生的修饰。翻译后修饰可以是共价化学修饰或酶修饰。翻译后修饰的实例包含但不限于酰化、乙酰化、烷基化(包含甲基化)、生物素化、丁酰化、氨基甲酰化、羰基化、脱酰胺基、脱亚氨基、二苯甲酰胺形成、二硫键形成、消除、黄素附着、甲酰化、γ-羧化、谷氨酰化、糖基化(glycylation)、糖基化(glycosylation)、糖基磷脂酰肌醇化(glypiation)、血红素C附着、羟基化、乙酰化形成、碘化、异戊二烯基化、脂质化、脂酰化、丙二酰化、甲基化、肉豆蔻酰化、氧化、棕榈酰化、聚乙二醇化、磷酸戊二烯酰化、再磷酸化、预甲基化席夫碱形成、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、硒化、琥珀酰化、硫化、泛素化和C端酰胺化。翻译后修饰包含肽的氨基末端和/或羧基末端的修饰。末端氨基的修饰包含但不限于脱氨基、N-低级烷基、N-二-低级烷基和N-酰基修饰。末端羧基的修饰包含但不限于酰胺、低级烷基酰胺、二烷基酰胺和低级烷基酯修饰(例如，其中低级烷基为C₁-C₄烷基)。翻译后修饰还包含落在氨基和羧基末端之间的氨基酸的修饰，如但不限于上述修饰。术语翻译后修饰还可以包含包括一种或多种可检测标记的肽修饰。

如本文所使用的，术语“结合剂”是指与分析物(例如，多肽或多肽的组分或特征)结合、关联、联合、识别所述分析物或与其组合的核酸分子、肽、多肽、蛋白质、碳水化合物或小分子。结合剂可以与分析物(例如，多肽或多肽的组分或特征)形成共价缔合或非共价缔合。结合剂也可以是由两种或更多种类型的分子组成的嵌合结合剂，如核酸分子-肽嵌合结合剂或碳水化合物-肽嵌合结合剂。结合剂可以是天然存在的、合成产生的或重组表达的分子。结合剂可以结合多肽的单个单体或亚基(例如，多肽的单个氨基酸)或结合多肽的多个连接的亚基(例如，较长肽、多肽或蛋白质分子的二肽、三肽或更高阶肽)。结合剂可以结合线性分子或具有三维结构(也被称为构象)的分子。例如，抗体结合剂可以结合线性肽、多肽或蛋白质，或结合构象肽、多肽或蛋白质。结合剂可以结合至肽、多肽或蛋白质分子的N端肽、C端肽或中间肽。结合剂可以结合肽分子的N端氨基酸、C端氨基酸或中间氨基酸。结合剂可以结合至N端或C端二氨基酸部分。相对于未经修饰或未标记的氨基酸，结合剂可优选地结合经化学修饰或标记的氨基酸(例如，已被试剂(例如，化合物)官能化的氨基酸)。例如，结合剂可以优选地结合已经用乙酰基部分、Cbz部分、鸟苷基部分、丹磺酰基部分、PTC部分、DNP部分、SNP部分、二杂环甲胺部分等官能化的氨基酸，而不结合不具有所述部分的氨基酸。结合剂可以结合肽分子的翻译后修饰。结合剂可表现出与多肽组分或特征的选择性结合(例如，结合剂可选择性地结合20种可能的天然氨基酸残基之一，并以非常低的亲和力结合其它19种天然氨基酸残基或根本不与所述其它19种天然氨基酸残基结合)。结合剂可以表现出较少的选择性结合，其中结合剂能够结合多肽的多种组分或特征(例如，结合剂可以以相似的亲和力结合至两个或更多个不同的氨基酸残基)。结合剂包括编码标签或附着于所述编码标签，所述编码标签可以通过接头(linker)与结合剂连接。

如本文所使用的，术语“接头”是指用于连接两个分子的核苷酸、核苷酸类似物、氨基酸、肽、多肽或非核苷酸化学部分中的一个或多个。接头可用于将结合剂与编码标签连接、将诱饵核酸与多肽连接、将多肽与固体支持物连接、将捕获核酸与固体支持物连接等。在某些实施例中，接头通过酶促反应或者化学反应(例如，点击化学)连接两个分子。

如本文所使用的，术语“蛋白质组”可以包含由任何生物体的基因组、细胞、组织或生物体在某个时间表达的蛋白质、多肽或肽(包含其缀合物或复合物)的完整集合。在一方面，它是在给定时间，在给定条件下在给定类型的细胞或生物体中表达的蛋白质的集合。蛋白质组学是对蛋白质组的研究。例如，“细胞蛋白质组”可以包含在特定的一组环境条件下(例如暴露于激素刺激下)在特定细胞类型中发现的蛋白质的集合。生物体的完整蛋白质组可以包含来自所有各种细胞蛋白质组的蛋白质的完整集合。蛋白质组还可以包含某些亚细胞生物系统中的蛋白质的集合。例如，病毒中的所有蛋白质都可以被称为病毒蛋白质组。如本文所使用的，术语“蛋白质组”包含蛋白质组的子集，包含但不限于激酶组；分泌组；受体组(例如，GPCRome)；免疫蛋白质组；营养蛋白质组；通过翻译后修饰(例如，磷酸化、泛素化、甲基化、乙酰化、糖基化、氧化、脂质化和/或亚硝基化)定义的蛋白质组子集，如磷酸化蛋白质组(例如，磷酸酪氨酸蛋白质组、酪氨酸蛋白质组和酪氨酸磷酸化蛋白质组)、糖蛋白组等；与组织或器官、发育阶段或生理或病理状况相关的蛋白质组子集；与细胞过程(如细胞循环、分化(或去分化)、细胞死亡、衰老、细胞迁移、转化或转移)有关的蛋白质组子集；或其任何组合。如本文所使用的，术语“蛋白质组学”是指分析细胞、组织和体液内的蛋白质组，以及细胞内和组织内蛋白质组的相应空间分布。在一些实施例中，分析可以包含定量和/或定性分析。此外，蛋白质组学研究还包含蛋白质组的动态状态，其随生物学和特定的生物学或化学刺激而不断变化的时间。

在肽链的一端具有游离氨基的末端氨基酸在本文中被称为“N端氨基酸”(NTAA)。在链的另一端具有游离羧基的末端氨基酸在本文中被称为“C端氨基酸”(CTAA)。N端二氨基酸由N端氨基酸和倒数第二个N端氨基酸组成。C端二氨基酸类似地定义为C端。构成肽的氨基酸可以按顺序编号，其中肽的长度为“n”个氨基酸。如本文所使用的，NTAA被认为是第n个氨基酸(在本文中也称为“n NTAA”)。使用此命名法，下一个氨基酸是n-1氨基酸，然后是n-2氨基酸，依此类推，即从N端到C端沿着肽段的长度递减。在某些实施例中，NTAA、CTAA或两者可以用化学部分官能化。

如本文所使用的，术语“条形码”是指约2个到约30个碱基(例如，2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个碱基)的核酸分子，其提供多肽、结合剂、来自结合循环的结合剂集合、样品多肽、样品集合、隔室内的多肽(例如，液滴、珠子或分开的位置)、隔室集合内的多肽、多肽级分(fraction)、多肽级分集合、空间区域或空间区域集合、多肽文库或结合剂文库的唯一标识符标签或来源信息。条形码可以是人工序列或自然存在的序列。在某些实施例中，条形码群中的每个条形码是不同的。在其它实施例中，条形码群中的一部分条形码是不同的，例如，在条形码群中至少约10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、97％或99％的条形码是不同的。条形码的数量可以是随机生成的，也可以是非随机生成的。在某些实施例中，条形码群是纠错条形码。条形码可用于分析和鉴定衍生自单个多肽、样品、文库等的序列读段。条形码还可用于对已分布到小隔室中的多肽集合进行解卷积以增强映射。例如，并非将肽映射回蛋白质组，而是将肽映射回其起源的蛋白质分子或蛋白质复合物。BC'是指与条形码(BC)互补的间隔子序列。

“样品条形码”，也被称为“样品标签”，标识多肽衍生自哪个样品。

“空间条形码”鉴定多肽源自的2-D或3-D组织切片的哪个区域。空间条形码可用于组织切片上的分子病理学。空间条形码允许对来自组织切片的多个样品或文库进行多路复用测序。

如本文所使用的，术语“结合循环特异性标签”、“结合循环特异性条形码”或“结合循环特异性序列”是指用于鉴定在特定结合循环内使用的结合剂的文库的唯一序列。结合循环特异性标签的长度可以包括约2个碱基到约8个碱基(例如，2个、3个、4个、5个、6个、7个或8个碱基)。结合循环特异性标签可以作为间隔子序列的一部分、编码器序列的一部分、UMI的一部分或作为编码标签内的单独组分而并入结合剂的编码标签内。

如本文所使用的，术语“间隔子”(Sp)是指长度为约1个碱基到约20个碱基(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个碱基)的核酸分子，其存在于核酸(例如，诱饵核酸或捕获核酸)或编码标签的末端。在某些实施例中，间隔子序列在一端或两端侧接编码标签的编码器序列。在结合剂与多肽结合后，编码标签上和诱饵或捕获核酸上的互补间隔子序列之间的退火允许通过引物延伸反应或连接将结合信息转移到核酸构建体(例如，诱饵或捕获核酸)。Sp'是指与Sp互补的间隔子序列。优选地，结合剂文库内的间隔子序列具有相同数目的碱基。可以在结合剂文库中使用通用(共享或相同)的间隔子。间隔子序列可以具有“循环特异性”序列，以便追踪在特定结合循环中使用的结合剂。间隔子序列(Sp)在所有结合循环中可以是恒定的，对于特定类别的多肽是特异性的，或者可以是结合循环数特异性的。多肽类别特异性间隔子允许存在于来自完整的结合/延伸循环的扩展型核酸中的同源结合剂的编码标签信息退火至在后续结合循环中通过类别特异性间隔子识别相同类别多肽的另一结合剂的编码标签。只有正确的同源对的顺序结合才能导致相互作用的间隔子元件和有效的引物延伸。间隔子序列可以包括足够数量的碱基，以退火至来自编码标签的标识信息将被转移到的核酸中的互补间隔子序列(例如，在诱饵或捕获核酸上)，从而启动引物延伸(也被称为聚合酶延伸)反应，或为连接反应提供“夹板(splint)”，或介导“粘性末端”的连接反应。间隔子序列可以包括比编码标签内的编码器序列数量更少的碱基。

如本文所使用的，术语“引物延伸”，也被称为“聚合酶延伸”，是指由核酸聚合酶(例如，DNA聚合酶)催化的反应，由此退火至互补链的核酸分子(例如，寡核苷酸引物、间隔子序列)以互补链为模板通过聚合酶延伸。

如本文所使用的，术语“唯一分子标识符”或“UMI”是指长度为约3个到约40个碱基(3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个碱基)的核酸分子，其为UMI连接到的每种多肽或结合剂提供唯一的标识符标签。多肽UMI可用于对来自多个扩展型核酸的测序数据进行计算解卷积(computationally deconvolute)，以鉴定来自单个多肽的扩展型核酸。通过将NGS读段折叠为唯一的UMI，可以使用多肽UMI准确地计数起源的多肽分子。结合剂UMI可用于鉴定与特定多肽结合的每个单独的分子结合剂。例如，UMI可用于鉴定对于特定肽分子发生的对单个氨基酸具有特异性的结合剂的单个结合事件的数目。应当理解，当在结合剂或多肽的上下文中均提及UMI和条形码时，条形码指的是除单个结合剂或多肽的UMI以外的标识信息(例如，样品条形码、隔室条形码、结合循环条形码)。

如本文所使用的，术语“通用引发位点”或“通用引物”或“通用引发序列”是指可以用于文库扩增和/或用于测序反应的核酸分子。通用引发位点可以包含但不限于用于PCR扩增的引发位点(引物序列)、退火至可在某些下一代测序平台中进行桥扩增的流通池表面上的互补寡核苷酸的流通池衔接子序列、测序引发位点或其组合。通用引发位点可用于其它类型的扩增，包含通常与下一代数字测序结合使用的扩增。例如，扩展型核酸分子可以被环化(circularized)，并且通用引发位点用于滚环扩增以形成可用作测序模板的DNA纳米球(Drmanac等人,2009,《科学(Science)》327:78-81)。可替代地，核酸分子可通过从通用引发位点通过聚合酶延伸直接环化并直接测序(Korlach等人,2008,《美国国家科学院院刊(Proc.Natl.Acad.Sci.)》105:1176-1181)。当与“通用引发位点”或“通用引物”一起使用时，术语“正向”也可以被称为“5'”或“有义”。当与“通用引发位点”或“通用引物”一起使用时，术语“反向”也可以被称为“3'”或“反义”。

如本文所使用的，术语“固体支持物”、“固体表面”或“固体底物”或“测序底物”或“底物”是指任何固体材料，包含多孔和无孔材料，多肽可以通过本领域已知的任何方式(包含共价和非共价相互作用，或其任何组合)直接或间接地与所述固体材料缔合。固体支持物可以是二维的(例如，平面表面)或三维的(例如，凝胶基质或珠子)。固体支持物可以是任何支持物表面，包含但不限于珠子、微珠、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、PTFE膜、PTFE膜、硝酸纤维素膜、基于硝酸纤维素的聚合物表面、尼龙、硅晶片芯片、流通芯片、流通池、包含信号转换电子器件的生物芯片、通道、微量滴定孔、ELISA板、旋转干涉盘、聚合物基质、纳米颗粒或微球。用于固体支持物的材料包含但不限于丙烯酰胺、琼脂糖、纤维素、葡聚糖、硝酸纤维素、玻璃、金、石英、聚苯乙烯、聚乙烯醋酸乙烯酯、聚丙烯、聚酯、聚甲基丙烯酸酯、聚丙烯酸酯、聚乙烯、聚环氧乙烷、聚硅酸盐、聚碳酸酯、聚乙烯醇(PVA)、特氟隆、碳氟化合物、尼龙、硅橡胶、聚酐、聚乙醇酸、聚氯乙烯、聚乳酸、聚原酸酯、官能化硅烷、聚富马酸丙酯、胶原蛋白、糖胺聚糖、聚氨基酸、葡聚糖或其任何组合。固体支持物进一步包含薄膜、膜、瓶、盘、纤维、编织纤维、成型聚合物，如管、颗粒、珠子、微球、微粒或其任何组合。例如，当固体表面是珠子时，珠子可以包含但不限于陶瓷珠、聚苯乙烯珠、聚合物珠、聚丙烯酸酯珠、甲基苯乙烯珠、琼脂糖珠、纤维素珠、葡聚糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁珠、玻璃珠或受控孔珠、基于二氧化硅的珠子或其任何组合。珠子可以是球形的或不规则形状的。珠子或支持物可以是多孔的。珠子的尺寸范围可以在纳米级(例如，100nm)到毫米级(例如，1mm)的范围内。在某些实施例中，珠子的尺寸范围为约0.2微米到约200微米，或约0.5微米到约5微米。在一些实施例中，珠子的直径可以为约1、1.5、2、2.5、2.8、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、15或20μm。在某些实施例中，“珠子”固体支持物可以指单个珠子或多个珠子。在一些实施例中，固体表面是纳米颗粒。在某些实施例中，纳米颗粒的尺寸范围为直径约1nm到约500nm、例如，介于约1nm和约20nm之间、介于约1nm和约50nm之间、介于约1nm和约100nm之间、介于约10nm和约50nm之间、介于约10nm和约100nm之间、介于约10nm和约200nm之间、介于约50nm和约100nm之间、介于约50nm和约150之间、介于约50nm和约200nm之间、介于约100nm和约200nm之间或介于约200nm和约500nm之间。在一些实施例中，纳米颗粒的直径可以为约10nm、约50nm、约100nm、约150nm、约200nm、约300nm或约500nm。在一些实施例中，纳米颗粒的直径小于约200nm。

如本文所使用的，术语“核酸”、“核酸分子”或“多核苷酸”是指含有通过3'-5'磷酸二酯键连接的脱氧核糖核苷酸或核糖核苷酸的单链或双链多核苷酸，以及多核苷酸类似物。核酸分子包含但不限于DNA、RNA和cDNA。多核苷酸类似物可以具有除天然多核苷酸中发现的标准磷酸二酯连接以外的主链，以及任选地具有除核糖或脱氧核糖以外的经修饰的一个或多个糖部分。多核苷酸类似物含有能够通过Watson-Crick碱基配对与标准多核苷酸碱基氢键合的碱基，其中类似物主链以允许在寡核苷酸类似分子和标准多核苷酸中的碱基之间以序列特异性方式形成这种氢键的方式呈现碱基。多核苷酸类似物的实例包含但不限于异种核酸(XNA)、桥连核酸(BNA)、二醇核酸(GNA)、肽核酸(PNA)、γPNA、吗啉代多核苷酸、锁核酸(LNA)、苏糖核酸(TNA)、2'-O-甲基多核苷酸、2'-O-烷基核糖基取代的多核苷酸、硫代磷酸酯多核苷酸和硼酸磷酸酯多核苷酸。多核苷酸类似物可以具有嘌呤或嘧啶类似物、包含例如7-脱氮嘌呤类似物、8-卤代嘌呤类似物、5-卤代嘧啶类似物或可与任何碱基配对的通用碱基类似物，包含次黄嘌呤、硝基唑、异卡比丁酮类似物、唑羧酰胺和芳香族三唑类似物或具有额外功能的碱基类似物，如用于亲和结合的生物素部分。在一些实施例中，核酸分子或寡核苷酸是经修饰的寡核苷酸。在一些实施例中，核酸分子或寡核苷酸是具有伪互补碱基的DNA、具有受保护碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子或吗啉代DNA或其组合。在一些实施例中，核酸分子或寡核苷酸是主链修饰的、糖修饰的或核碱基修饰的。在一些实施例中，核酸分子或寡核苷酸具有核碱基保护基团(如Alloc)、亲电保护基团(如硫烷)、乙酰基保护基团、硝基苄基保护基团、磺酸酯保护基团或传统的碱基不稳定的保护基团。

如本文所使用的，“核酸测序”是指确定核酸分子或核酸分子样品中核苷酸的顺序。

如本文所使用的，“下一代测序”是指允许并行测序数百万至数十亿个分子的高通量测序方法。下一代测序方法的实例包含合成测序、连接测序、杂交测序、polony测序、离子半导体测序和焦磷酸测序。通过将引物附着至固体底物并将互补序列附着至核酸分子，可以通过引物将核酸分子与固体底物杂交，然后可以使用聚合酶扩增在固体底物的离散区域中生成多个拷贝(这些分组有时被称为聚合酶菌落或克隆)。因此，在测序过程中，可以对特定位置的核苷酸进行多次测序(例如数百或数千次)–这种覆盖深度称为“深度测序”。高通量核酸测序技术的实例包含Illumina、BGI、Qiagen、Thermo-Fisher和Roche提供的平台，包含如平行微珠阵列、合成测序、连接测序、毛细管电泳、电子微芯片、“生物芯片”、微阵列、平行微芯片和单分子阵列等格式，由Service审查(《科学》311:1544-1546,2006)。

如本文所使用的，“单分子测序”或“第三代测序”是指下一代测序方法，其中通过对单个DNA分子进行测序来生成来自单分子测序仪器的读段。与依靠扩增来并行克隆许多DNA分子以分阶段进行测序的下一代测序方法不同，单分子测序可以询问DNA的单分子，并且不需要扩增或同步。单分子测序包含在每个碱基并入后需要暂停测序反应的方法(“洗涤和扫描”循环)和不需要在读取步骤之间停止的方法。单分子测序方法的实例包含单分子实时测序(Pacific Biosciences)、基于纳米孔的测序(Oxford Nanopore)、双链体中断纳米孔测序以及使用高级显微镜对DNA进行直接成像。

如本文所使用的，“分析”分析物(例如，多肽)是指对分析物(例如，多肽)的全部或部分组分进行鉴定、检测、定量、表征、区分或其组合。例如，分析肽、多肽或蛋白质包含确定肽的全部或部分氨基酸序列(连续或非连续)。分析多肽还包含对多肽的组分的部分鉴定。例如，多肽蛋白质序列中氨基酸的部分鉴定可以鉴定蛋白质中的氨基酸属于可能的氨基酸的子集。分析通常从对n NTAA的分析开始，然后进行到肽的下一个氨基酸(即n-1、n-2、n-3等)。这是通过消除n NTAA，从而将肽的n-1氨基酸转化为N端氨基酸(在本文中被称为“n-1NTAA”)来实现的。分析肽还可以包含确定肽上翻译后修饰的存在和频率，其可以包含或可以不包含关于肽上翻译后修饰的序列顺序的信息。分析肽还可以包含确定肽中表位的存在和频率，其可以包含或可以不包含关于表位在肽内的序列顺序或位置的信息。分析肽可以包含组合不同类型的分析，例如获得表位信息、氨基酸序列信息、翻译后修饰信息或其任何组合。

如本文所使用的，术语“隔室”是指从多肽样品中分离(separate或isolate)分析物(例如，多肽)子集的物理区域或体积。例如，隔室可以将单个细胞与其它细胞分开，或者将样品蛋白质组的子集与样品蛋白质组的其余部分分开。隔室可以是水性隔室(例如，微流体液滴)、固体隔室(例如，板、管、小瓶、凝胶珠子上的可滴定孔(picotiter well)或微量滴定孔(microtiter well))、珠子表面、多孔珠子内部或表面上的分开区域。隔室可以包括一个或多个可固定多肽的珠子。

如本文所使用的，术语“隔室标签”或“隔室条形码”是指约4个碱基到约100个碱基(包含4个碱基、100个碱基以及其间的任何整数)的单链或双链核酸分子，其包括一个或多个隔室(例如，微流体液滴、珠子表面)内的成分(例如，单个细胞的蛋白质组)的标识信息。隔室条形码鉴定已经从多个(例如，数百万到数十亿个)隔室被分成相同的物理隔室或隔室组的样品中的多肽的子集。因此，即使在将成分汇集在一起之后，隔室标签也可用于区分源自具有相同隔室标签的一个或多个隔室的成分以及具有不同隔室标签的另一隔室中的成分。通过用唯一的隔室标签标记每个隔室内或两个或更多个隔室内的蛋白质和/或肽，可以鉴定出来自单个隔室或隔室组内相同蛋白质、蛋白质复合物或细胞的肽。隔室标签包括条形码和任选的通用引物，所述条形码任选地在一侧或两侧侧接间隔子序列。间隔子序列可以与来自编码标签的标识信息被转移到的核酸的间隔子序列互补，从而能够将隔室标签信息转移到核酸。隔室标签还可以包括通用引发位点、唯一分子标识符(用于提供与其附着的肽的标识信息)或两者，特别是对于其中隔室标签包括将在本文所述的下游肽分析方法中使用的诱饵或捕获核酸的实施例。隔室标签可以包括用于偶联至肽的功能性部分(例如，醛、NHS、mTet、炔烃等)。可替代地，隔室标签可以包括肽，所述肽包括蛋白质连接酶的识别序列，以允许隔室标签与所关注的肽连接。隔室可以包括单个隔室标签、针对任选的UMI序列保存的多个相同的隔室标签、或两个或更多个不同的隔室标签。在某些实施例中，每个隔室包括唯一的隔室标签(一对一映射)。在其它实施例中，来自较大隔室群的多个隔室包括相同的隔室标签(多对一映射)。隔室标签可以与隔室内的固体支持物(例如，珠子)连接，或者可以与隔室本身的表面(例如，可滴定孔的表面)连接。可替代地，隔室标签可以在隔室内的溶液中游离。

如本文所使用的，术语“分区”是指将唯一条形码分配给来自样品内分析物(例如，肽)群体的分析物亚群。条形码的分配可以是随机的。在某些实施例中，可以通过将分析物分配到隔室中来实现分区。分区可以由单个隔室内的分析物或来自一组隔室的多个隔室内的分析物组成。

如本文所使用的，“分区标签”或“分区条形码”是指约4个碱基到约100个碱基(包含4个碱基、100个碱基以及其间的任何整数)的单链或双链核酸分子，其包括分区的标识信息。在某些实施例中，多肽的分区标签是指由将多肽分隔成用相同条形码标记的一个或多个隔室而产生的相同的隔室标签。

如本文所使用的，术语“级分”是指样品内的分析物(例如，多肽)子集，已使用物理或化学分离方法将其从样品或细胞器的其余部分中分选，如按大小、疏水性、等电点、亲和力等进行分级。分离方法包含HPLC分离、凝胶分离、亲和分离、细胞分级，细胞器分级、组织分级等。如流体流动、磁性、电流、质量、密度等物理性质也可以用于分离。

如本文所使用的，术语“级分条形码”是指约4个碱基到约100个碱基(包含4个碱基、100个碱基以及其间的任何整数)的单链或双链核酸分子，其包括级分内的分析物(例如，多肽)的标识信息。

如本文所使用，术语“编码标签”是指具有任何合适的长度(例如，约2个碱基到约100个碱基的核酸分子，包含包括2和100以及其间数字的任何整数)的多核苷酸，所述多核苷酸包括其相关联的结合剂的标识信息。“编码标签”也可以由“可测序的聚合物”制成(参见例如，Niu等人,2013,《自然化学(Nat.Chem.)》5:282-292；Roy等人,2015,《自然通讯(Nat.Commun.)》6:7237；Lutz,2015,《大分子(Macromolecules)》48:4759-4767；所述参考文献中的每一个均通过引用整体并入)。编码标签可以包括编码器序列，其任选地在一侧上侧接一个间隔子，或者任选地在每一侧上侧接间隔子。编码标签还可以包括任选的UMI和/或可任的结合循环特异性条形码。编码标签可以是单链或双链的。双链编码标签可以包括平末端、悬垂末端或两者。编码标签可以指直接附着于结合剂的编码标签，指与直接附着于结合剂的编码标签杂交的互补序列(例如，用于双链编码标签)，或指存在于扩展型记录标签中的编码标签信息。在某些实施例中，编码标签可以进一步包括结合循环特异性间隔子或条形码、唯一分子标识符、通用引发位点或其任何组合。

应理解，本文所述的本发明的方面和实施例包含“由方面和实施例组成”和/或“基本上由方面和实施例组成”。

贯穿本公开，此发明的各个方面均以范围格式呈现。应当了解，采用范围格式的描述仅为了方便和简洁起见，并且不应当被解释为是对本发明的范围的固定限制。因此，应当将范围的描述视为已明确公开所有可能的子范围以及该范围内的单独数值。例如，对诸如1至6的范围的描述应当被视为已经明确公开如1到3、1到4、1到5、2到4、2到6、3到6等子范围，以及该范围内的单独数字，例如1、2、3、4、5和6。无论范围的广度如何，这都适用。

根据以下结合附图的说明，本发明的其它目标、优点和特征将变得显而易见。

I.制备分析物和生成核酸-分析物缀合物的方法

本文提供了用于制备分析物(例如，一个大分子或多个大分子、肽、多肽和蛋白质)的方法和试剂盒。在一些实施例中，所述方法和试剂盒用于处理分析物以准备测序和/或分析。在一些实施例中，所述方法包含将分析物附着到固体支持物上。在一些实施例中，核酸-分析物缀合物被配置用于分析分析物，例如，其中所述分析采用分子识别事件和/或可检测标记的条形编码和核酸编码。在一些实施例中，所述方法包含将分析物附着到诱饵核酸上以生成核酸-分析物嵌合体。在一些方面，所述方法进一步包括通过使核酸-分析物嵌合体中的诱饵核酸与附着在固体支持物上的捕获核酸杂交，使所述核酸-分析物嵌合体接近所述固体支持物，并将所述核酸-分析物嵌合体共价偶联至所述固体支持物。在一些实施例中，多个核酸-分析物嵌合体偶联在固体支持物上并且任何相邻偶联的核酸-分析物嵌合体以约50nm或更大的平均距离彼此间隔开。相邻偶联的核酸-分析物或相邻偶联的核酸-分析物嵌合体可以指在二维空间中在任何方向上彼此相邻的分子。在一些情况下，相邻偶联的核酸-分析物或相邻偶联的核酸-分析物嵌合体可以指在三维空间中在任何方向上彼此相邻的分子。在一些实施例中，分析物包括从生物样品获得的多种分析物(例如，两种或更多种)。在一些实施例中，所述分析物是蛋白质。在一些实施例中，所述分析物是肽，例如，从样品获得的片段化蛋白质生成的肽。还提供了根据本文所述的任何方法生成的核酸-分析物缀合物。在一些实施例中，本文所述的方法和缀合物用于制备与蛋白质分析相容的分析物，所述蛋白质分析采用分子识别事件和/或可检测标记的条形编码和核酸编码。

A.分析物和样品

在一方面，本公开涉及分析物(例如，包含蛋白质、多肽和肽的大分子)的制备和处理。在一些情况下，大分子是由较小的亚基组成的任何大分子。在某些实施例中，大分子是蛋白质、蛋白质复合物、多肽、肽、核酸分子、碳水化合物、脂质、大环或嵌合大分子。在某些实施例中，蛋白质分析物通过共价偶联附着至固体支持物。

在任何提供的实施例的一些实施例中，根据本文公开的试剂盒和方法制备或处理的分析物(例如，大分子、蛋白质、多肽、肽)可以从合适的来源或样品获得，包含但不限于：生物样品，如细胞(原代细胞和培养的细胞系)、细胞裂解物或提取物、细胞器或囊泡，包含外泌体、组织和组织提取物；活检；粪便；体液(如血液、全血、血清、血浆、尿液、淋巴液、胆汁、脑脊液、间质液、房水或玻璃体液、初乳、痰、羊水、唾液、肛门和阴道分泌物、汗液和精液、渗出液、渗出液(例如，从脓肿或任何其它感染或炎症部位获得的液体)或从几乎任何生物体的关节(正常关节或受类风湿性关节炎、骨关节炎、痛风或化脓性关节炎等疾病影响的关节)获得的液体，其中哺乳动物来源的样品，包含含有微生物组的样品，是优选的，而人类来源的样品，包含含有微生物组的样品，是特别优选的；环境样品(如空气、农业、水和土壤样品)；微生物样品，包含来自微生物生物膜和/或群落的样品，以及微生物孢子；研究样品，包含细胞外液、来自细胞培养物的细胞外上清液、细菌中的包涵体、细胞和亚细胞隔室(包含线粒体隔室和细胞周质)。在一些情况下，分析物从多个样品中获得，并且多个样品被汇集。

在某些实施例中，分析物是蛋白质、蛋白质复合物、多肽或肽。例如，分析物的评估可以包含通过生成可通过下一代测序方法分析的核酸编码文库来确定肽、多肽或蛋白质的氨基酸序列信息和翻译后修饰。肽、多肽、蛋白质或蛋白质复合物可以包括标准的、天然存在的氨基酸、经修饰的氨基酸(例如，翻译后修饰)、氨基酸类似物、氨基酸模拟物或其任何组合。在一些实施例中，肽、多肽或蛋白质是天然存在的、合成产生的或重组表达的。在任何前述实施例中，肽、多肽、蛋白质或蛋白质复合物可以进一步包括翻译后修饰。

肽、多肽或蛋白质的翻译后修饰(PTM)可以是共价修饰或酶促修饰。翻译后修饰的实例包含但不限于酰化、乙酰化、烷基化(包含甲基化)、生物素化、丁酰化、氨基甲酰化、羰基化、脱酰胺基、脱亚氨基、二苯甲酰胺形成、二硫键形成、消除、黄素附着、甲酰化、γ-羧化、谷氨酰化、糖基化(glycylation)、糖基化(例如，N-连接、O-连接、C-连接、磷酸糖基化)、糖基磷脂酰肌醇化(glypiation)、血红素C附着、羟基化、乙酰化形成、碘化、异戊二烯基化、脂质化、脂酰化、丙二酰化、甲基化、肉豆蔻酰化、氧化、棕榈酰化、聚乙二醇化、磷酸戊二烯酰化、再磷酸化、预甲基化席夫碱形成、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、硒化、琥珀酰化、硫化、泛素化和C端酰胺化。翻译后修饰包含肽、多肽或蛋白质的氨基末端和/或羧基末端的修饰。末端氨基的修饰包含但不限于脱氨基、N-低级烷基、N-二-低级烷基和N-酰基修饰。末端羧基的修饰包含但不限于酰胺、低级烷基酰胺、二烷基酰胺和低级烷基酯修饰(例如，其中低级烷基为C1-C4烷基)。翻译后修饰还包含落在肽、多肽或蛋白质的氨基和羧基末端之间的氨基酸的修饰，如但不限于上述修饰。翻译后修饰可以调节细胞内蛋白质的“生物学”，例如其活性、结构、稳定性或定位。磷酸化是最常见的翻译后修饰，并且在蛋白质的调节中(尤其是在细胞信号传导中)起重要作用(Prabakaran等人,(2012)《威利跨学科综述-系统生物学和医学(Wiley Interdiscip Rev Syst Biol Med)》4:565-583)。已显示向蛋白质中添加糖(例如糖基化)可促进蛋白质折叠、提高稳定性并改变调节功能。脂质对蛋白质的附着使得能够靶向细胞膜。翻译后修饰还可以包含肽、多肽或蛋白质修饰以包含一种或多种可检测标记。

在某些实施例中，分析物(例如，肽、多肽或蛋白质)可以是片段化的。例如，片段化的肽可以通过从样品(如生物样品)中片段化蛋白质来获得。肽、多肽或蛋白质可以通过本领域已知的任何方式片段化，包含通过蛋白酶或内肽酶片段化。例如，分析物(例如，肽、多肽或蛋白质)用胰蛋白酶、LysN或LysC处理。

在一些实施例中，肽、多肽或蛋白质分析物的片段化是通过使用特定蛋白酶或内肽酶来靶向的。特定的蛋白酶或内肽酶在特定的共有序列处结合并切割(例如，对ENLYFQ\S共有序列具有特异性的TEV蛋白酶)。在其它实施例中，通过使用非特异性蛋白酶或内肽酶，肽、多肽或蛋白质的片段化是非靶向的或随机的。非特异性蛋白酶可在特定氨基酸残基而非共有序列处结合和切割(例如，蛋白酶K是非特异性丝氨酸蛋白酶)。蛋白酶和内肽酶是本领域已知的，可用于将蛋白质或多肽切割成更小的肽片段的蛋白酶和内切酶的实例包含蛋白酶K、胰蛋白酶、糜蛋白酶、胃蛋白酶、嗜热菌蛋白酶、凝血酶、因子Xa、弗林蛋白酶、内肽酶、木瓜蛋白酶、胃蛋白酶、枯草杆菌蛋白酶、弹性蛋白酶、肠激酶、GenenaseTMI、内切蛋白酶LysC、内切蛋白酶AspN、内切蛋白酶GluC等。(Granvogl等人,2007,《分析和生物分析化学(Anal Bioanal Chem)》389:991-1002)。在某些实施例中，肽、多肽或蛋白质被蛋白酶K或任选地蛋白酶K的不耐热形式片段化以能够快速失活。蛋白酶K在变性试剂(如尿素和SDS)中非常稳定，从而能够消化完全变性的蛋白质。蛋白质和多肽片段化成肽可以在附着到诱饵核酸或其它核酸组分之前或之后进行。

化学试剂可用于将蛋白质消化成肽片段。化学试剂可在特定氨基酸残基处切割(例如，溴化氰水解甲硫氨酸残基C端的肽键)。用于将多肽或蛋白质片段化为较小肽段的化学试剂包含溴化氰(CNBr)、羟胺、肼、甲酸、BNPS-粪臭素[2-(2-硝基苯基亚磺酰基)-3-甲基吲哚]、碘代苯甲酸、NTCB+Ni(2-硝基-5-硫代氰基苯甲酸)等。

在一些实施例中，附着到诱饵核酸的分析物包括片段化的蛋白质或肽。在某些实施例中，在酶促或化学切割后，所得肽片段具有大致相同的所需长度，例如，约10个氨基酸到约70个氨基酸、约10个氨基酸到约60个氨基酸、约10个氨基酸到约50个氨基酸、约10到约40个氨基酸、约10到约30个氨基酸、约20个氨基酸到约70个氨基酸、约20个氨基酸到约60个氨基酸、约20个氨基酸到约50个氨基酸、约20到约40个氨基酸、约20到约30个氨基酸、约30个氨基酸到约70个氨基酸、约30个氨基酸到约60个氨基酸、约30个氨基酸到约50个氨基酸或约30个氨基酸到约40个氨基酸。可以例如通过用包括含有蛋白酶或内肽酶切割位点的肽序列的短测试FRET(荧光共振能量转移)肽掺入蛋白质或多肽样品来实时监测切割反应。在完整的FRET肽中，荧光基团和淬灭基团附着到含有裂解位点的肽序列的任一端，并且淬灭基团和荧光团之间的荧光共振能量转移导致低荧光。在通过蛋白酶或内肽酶切割测试肽后，猝灭剂和荧光团被分离，从而导致荧光大幅增加。当达到一定的荧光强度时，可以停止切割反应，从而实现可重现的切割终点。

在某些实施例中，多种蛋白质分析物附着于固体支持物。例如，从生物样品中获得蛋白质样品并进行片段化。在一些实施例中，通过执行本文提供的任何方法，将多个片段化蛋白质附着至固体支持物(例如，多个固体支持物)。在一些实施例中，多个片段化的肽附着到珠子上。在一些情况下，附着于固体支持物(例如，珠子)的片段化蛋白质是总片段化蛋白质的随机部分。在一些情况下，附着在固体支持物上的分析物的身份是未知的。在一些实施例中，附着于固体支持物的分析物不是靶向的。在一些实施例中，附着在固体支持物上的分析物具有未知的身份，并且本文提供的方法生成核酸-分析物缀合物以与分析方法一起使用，所述分析方法可用于对分析物进行表征、评估、鉴定、分析和/或测序。

在一些实施例中，分析物是从样品中获得的，并且分析物可以在附着到诱饵核酸之前经历蛋白质分级方法。在一些实施例中，分析物是从样品中获得的，并且分析物可以在附着到诱饵核酸之后经历蛋白质分级方法。在一些实施例中，分析物是从样品中获得的，并且分析物可以在附着到固体支持物之前经历蛋白质分级方法。在一些实施例中，分析物是从样品中获得的，并且分析物可以在附着到固体支持物之后经历蛋白质分级方法。

在一些实施例中，使用一种或多种性质(如细胞位置、分子量、疏水性或等电点)或蛋白质富集方法来分离分析物(例如，蛋白质或肽)。可替代地，或另外，蛋白质富集方法可用于选择特定蛋白质或肽(参见例如，Whiteaker等人,2007,《分析生物化学(Anal.Biochem.)》362:44-54，其通过引用整体并入)或选择特定的翻译后修饰(参见例如，Huang等人,2014.《色谱杂志(J.Chromatogr.A)》1372:1-17，其通过引用整体并入)。可替代地，一个或多个特定类别的蛋白质(如免疫球蛋白或免疫球蛋白(Ig)同种型，如IgG)可被亲和富集或选择用于分析。就免疫球蛋白分子而言，对序列的分析和参与亲和结合的高变序列的丰度或频率是特别感兴趣的，特别当它们响应于疾病进展而变化或与健康、免疫和/或疾病表型相关时。也可以使用标准免疫亲和方法从样品中扣除过度丰富的蛋白质。消耗丰富的蛋白质对于血浆样品很有用，因为血浆样品中超过80％的蛋白质成分是白蛋白和免疫球蛋白。有几种商业产品可用于去除蛋白质含量过高的血浆样品，如PROTIA和PROT20(Sigma-Aldrich)。

在某些实施例中，分析物包括蛋白质或多肽。在一个实施例中，蛋白质或多肽分析物附着于核酸聚合物(例如，诱饵核酸)。在一些实施例中，分析物直接附着到诱饵核酸。在一些实施例中，分析物间接附着到诱饵核酸(例如，通过接头)。各种接头在本领域中是已知的，并且可以任选地用于将分析物附着至诱饵核酸。在一些实施例中，将蛋白质或多肽用反应性偶联部分(如胺反应性偶联剂)标记，以附着至诱饵核酸。例如，将蛋白质或多肽的赖氨酸残基用反应性偶联部分标记。

在一些实施例中，分析物和/或诱饵核酸包括反应性偶联部分。诱饵核酸可以以任何合适的位置和配置附着到分析物，只要该附着与用于在蛋白质测序或分析测定中将编码标签信息转移到核酸的方法相容。在一些实施例中，分析物在诱饵核酸的不同位置处(如在诱饵核酸的3'端或5'端)附着到诱饵核酸(直接或使用合适的接头)。在一些实施例中，分析物在诱饵核酸的内部位置处附着至诱饵核酸(直接或使用合适的接头)。

在一些实施例中，诱饵核酸包括经修饰的碱基(例如，i5-辛二炔基dU)。例如，经修饰的碱基包括炔，或者经修饰的碱基被配置用于将反应性偶联部分(例如，炔)插入诱饵核酸。在一些实例中，反应性偶联部分用于将诱饵核酸附着至分析物。在一些实施例中，使用化学连接将分析物附着至诱饵核酸。可以使用一个或多个接头将诱饵核酸附着至分析物。

在特定的实施例中，诱饵核酸包括反应性偶联部分(例如，用于与分析物缀合)、接头、通用引发序列、条形码(例如，隔室标签、分区条形码、样品条形码、级分条形码或其任何组合)、任选的UMI和间隔子(Sp)序列。在一些实施例中，诱饵核酸包括用于促进信息从另一核酸聚合物转移的间隔子序列。

B.通过诱饵核酸和捕获核酸的杂交将分析物偶联到固体支持物上

在一些方面，本文提供的方法和缀合物包括处理分析物，包含将分析物附着到诱饵核酸上以生成核酸-分析物嵌合体，以及通过使核酸-分析物嵌合体中的诱饵核酸与附着在固体支持物上的捕获核酸杂交，使所述核酸-分析物嵌合体接近所述固体支持物。在一些实施例中，捕获核酸、核酸-分析物嵌合体和/或诱饵核酸中的一种或多种进一步包括条形码或其它核酸组分。在一些情况下，所提供的方法包含在偶联至固体支持物之前将条形码附着至固体支持物上的偶联核酸-分析物嵌合体。

在一些实施例中，核酸组分和核酸标签(例如，诱饵或捕获核酸、条形码、UMI)可以包含DNA或RNA链、或嵌合DNA-RNA链、或核酸样化合物(如肽核酸)。在一些实施例中，核酸链还可以包含经修饰的DNA或RNA碱基，如本领域已知的那些。

在一些实施例中，诱饵核酸包括用于与捕获核酸杂交的单链区域。在一些实施例中，诱饵核酸包括至少一个与捕获核酸基本互补的核酸区域。在一些实例中，诱饵核酸包括选择性地结合捕获核酸序列的核苷酸序列。在一些实施例中，捕获核酸包括与诱饵核酸基本互补的单链区域。“基本互补”是指在所采用的条件下能够与靶核酸序列杂交的序列。在优选的实施例中，“基本互补”的单链区域与靶核酸序列完全互补。例如，与诱饵核酸互补的捕获核酸的单链区域可以具有至少5个碱基、至少6个碱基、至少7个碱基、至少8个碱基、至少9个碱基、至少10个碱基、至少12个碱基、至少14个碱基、至少16个碱基、至少20个碱基、至少24个碱基、至少30个碱基或至少34个碱基。在一些实施例中，与诱饵核酸互补的捕获核酸的单链区域具有少于40个碱基、少于30个碱基或少于25个碱基。

在一些情况下，诱饵核酸与捕获核酸的杂交包括8个或更多个互补碱基、16个或更多个互补碱基、18个或更多个互补碱基、24个或更多个互补碱基、34个或更多个互补碱基的杂交。在一个实施例中，诱饵核酸与捕获核酸的杂交包括16个或更多个互补碱基的杂交。在一个实施例中，诱饵核酸与捕获核酸的杂交包括18个或更多个互补碱基的杂交。在一个实施例中，诱饵核酸与捕获核酸的杂交包括20个或更多个互补碱基的杂交。在一个实施例中，诱饵核酸与捕获核酸的杂交包括24个或更多个互补碱基的杂交。本领域技术人员可以选择碱基数量足以在诱饵核酸和捕获核酸之间形成稳定杂交区域的互补区域。在一些实施例中，用于与诱饵核酸杂交的捕获核酸的区域定位在捕获核酸的3'端或5'端。

在一些实施例中，捕获核酸包括夹板核酸链，其中夹板通过杂交将捕获核酸和诱饵桥接并且能够实现有效的连接或化学偶联。在一些实施例中，夹板核酸与捕获核酸分开。在一些实施例中，诱饵核酸包括夹板核酸链，其中夹板通过杂交将捕获核酸和诱饵桥接并且能够实现有效的连接或化学偶联。在一些实施例中，夹板核酸与诱饵核酸分开。

在一些提供的实施例中，诱饵核酸与捕获核酸偶联。在一些实例中，诱饵核酸与捕获核酸的偶联是通过共价偶联进行的。在一些实例中，诱饵核酸的5'端与捕获核酸的3'端偶联。在一些情况下，诱饵核酸的3'端与捕获核酸的5'端偶联。例如，分析物-诱饵核酸偶联物与核酸-分析物嵌合体杂交并附着到捕获核酸的5'端(图1C-1D)。

在一些情况下，捕获核酸直接或间接地固定在固体支持物上。在一些实施例中，在使诱饵核酸与捕获核酸杂交之前，将捕获核酸附着到固体支持物上。诱饵和捕获核酸的杂交提高了固定的效率，如与化学偶联相比。在一些实施例中，捕获核酸包括反应性偶联部分。在一些实施例中，固体支持物包括反应性偶联部分。在一些实施例中，在将固体支持物附着到捕获核酸之前或同时，将反应性偶联部分附着到所述固体支持物。

在一些实施例中，捕获和/或诱饵核酸包括反应性偶联部分。例如，反应性偶联部分用于共价偶联诱饵和捕获核酸。在一些实施例中，使用化学连接将诱饵核酸与捕获核酸偶联。可以使用标准化学连接或“点击化学”将诱饵核酸与捕获核酸偶联(Gunderson等人,《基因组研究(Genome Res.)》(1998)8(11):1142-1153；Peng等人,《欧洲有机化学杂志(European J Org Chem)》(2010)(22):4194-4197；El-Sagheer等人,《美国国家科学院院刊》(2011)108(28):11338-11343；El-Sagheer等人,《有机和生物分子化学(Org BiomolChem)》(2011)9(1):232-235；Sharma等人,《分析化学》(2012)84(14):6104-6109；Roloff等人,《生物有机与药物化学(Bioorg Med Chem)》(2013)21(12):3458-3464；Litovchick等人,《人工DNA PNA XNA(Artif DNA PNA XNA)》(2014)5(1):e27896；Roloff等人,《分子生物学方法(Methods Mol Biol)》(2014)1050:131-141)。在一些实施例中，使用光活化或光活化连接(例如，光交联)将诱饵核酸与捕获核酸偶联。本领域技术人员可以确定将各种连接部分与诱饵核酸偶联的方法。例如，诱饵核酸或核酸-分析物嵌合体包括光活性部分。在一些实施例中，可以对细胞系进行工程化以产生用于附着的特定部分。在一些实施例中，将光敏二苯甲酮部分添加到诱饵核酸中。在一些具体情况下，使用炔-二苯甲酮和叠氮化物-寡核苷酸将光敏二苯甲酮部分附着至诱饵核酸。在一些实例中，附着至固体支持物的捕获核酸包括反应性补骨脂素部分。在一些实施例中，通过诱饵核酸与互补捕获核酸的杂交，将分析物固定到由互补捕获核酸衍生的表面。捕获核酸可以包括反应性补骨脂素部分，并且暴露于UV光会共价偶联诱饵核酸和捕获核酸(图2A-2C)。

在一个实施例中，诱饵和捕获核酸不包括核酸发夹。在一些实施例中，杂交的诱饵和捕获核酸形成双链核酸结构。在一个实施例中，诱饵核酸与捕获核酸杂交，并且核酸-分析物嵌合体直接或间接附着于固体支持物。

在一些情况下，使用连接将诱饵核酸附着至捕获核酸。对于DNA的酶促连接，需要捕获核酸的5'磷酸酯与诱饵核酸的3'羟基连接。在一些其它情况下，需要诱饵核酸的5'磷酸酯与捕获核酸的3'羟基连接。在任何提供的实施例中的一些实施例中，附着可以是附着到诱饵或捕获核酸的额外的核酸序列(例如，条形码、UMI、间隔子)。

在一个实施例中，诱饵或捕获核酸包括夹板核酸链，其中夹板通过杂交将诱饵和捕获核酸桥接并且能够实现有效的连接或化学偶联。在一些实施例中，捕获核酸包括夹板核酸链。在一些实施例中，夹板核酸链是暂时使用的。在一些实施例中，在诱饵核酸-分析物嵌合体通过捕获核酸附着或偶联至固体支持物(珠子)之后去除夹板核酸链。在另一个实施例中，诱饵或捕获核酸包括核酸发夹(参见例如，Riccelli等人,《核酸研究(Nucleic AcidsRes.)》(2001)29(4):996–1004)。核酸发夹是一种含有单分子核酸的结构，其包括至少两个相互互补的核酸区域，从而可以形成至少一个分子内双链体(参见例如美国专利公开号5,770,365)。在某些实施例中，相互互补的核酸区域通过核酸链连接。在一些实例中，发夹包括单链核酸。

在一些具体实例中，捕获核酸的发夹形成至少一个分子内双链体，其长度为至少2个碱基对、至少4个碱基对、至少8个碱基对、至少16个碱基对、至少24个碱基对，至少32个碱基对和至少40个碱基对。本领域技术人员将能够调整双链体区域中碱基对的大小、数量和配置以实现双链体形成的任何所需的相对稳定性。在一些实施例中，分子内双链体包括小于约40个碱基对、小于30个碱基对或小于20个碱基对的长度。在一些实例中，捕获核酸的发夹形成至少一个分子内双链体，其包括16个碱基对的长。

在一些实施例中，捕获核酸包括连接相互互补区域的区域，在本文中被称为“环”或“接头”。在优选的实施例中，环包括核酸链或经修饰的核酸链。在一些实例中，核酸环包括2-20个核苷酸，如3-8个核苷酸。在其它实施例中，环包括不基于核酸的接头区域。适用于环区域的各种非核酸接头是本领域已知的，包含例如烷基链(参见例如，Doktycz等人(1993)《生物聚合物(Biopolymers)》33:1765)。在一些实施例中，选择环或接头的大小、组成和配置以允许相互互补的区域形成分子内双链体。在一些情况下，发夹能够形成多于一个环。

在一些实施例中，诱饵核酸中的至少一种进一步包括条形码。在一些实施例中，诱饵核酸中的至少一种进一步包括唯一分子标识符(UMI)。在一些实施例中，捕获核酸中的至少一种进一步包括条形码。在一些实施例中，捕获核酸中的至少一种进一步包括唯一分子标识符(UMI)。在一些实施例中，条形码包括UMI。在一些实施例中，条形码包括样品条形码、级分条形码、空间条形码、隔室标签或其任何组合。在一些实例中，条形码和/或UMI包括DNA分子、具有伪互补碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、非核酸可测序聚合物，例如多糖、多肽、肽或聚酰胺，或其组合。

UMI可以是每种分析物(例如，大分子、蛋白质、多肽、肽)的唯一标识符标签。UMI可以为约3个到约40个碱基、约3个到约30个碱基、约3个到约20个碱基、或约3个到约10个碱基、或约3个到约8个碱基。在一些实施例中，UMI的长度为约3个碱基、4个碱基、5个碱基、6个碱基、7个碱基、8个碱基、9个碱基、10个碱基、11个碱基、12个碱基、13个碱基、14个碱基、15个碱基、16个碱基、长度为17个碱基、18个碱基、19个碱基、20个碱基、25个碱基、30个碱基、35个碱基或40个碱基。UMI可用于对来自用于确定分析物序列的方法的测序数据进行解卷积，以鉴定来自单个分析物的序列读段。在一些实施例中，在分析物的文库内，每种分析物与单个唯一UMI相关联。在其它实施例中，分析物可能被片段化，并且分析物的多个部分可能与相同的UMI相关联。在一些实施例中，UMI具有与间隔子或其它条形码序列不同的碱基序列，以有助于在序列分析期间区分这些组分。

在一些实施例中，一个或多个条形码被附着到诱饵核酸、捕获核酸和/或核酸-分析物缀合物。在一些其它实施例中，一个或多个条形码被附着或安装到与固体支持物偶联的核酸-分析物缀合物。在一些实施例中，核酸-分析物嵌合体可以用核酸标签(如条形码)标记，如在偶联至固体支持物之前。在一些实例中，核酸-分析物嵌合体可以首先用通用DNA标签进行标记。在一些情况下，条形码可以包括代表样品、隔室、物理位置、空间条形码等的信息。参见例如，国际专利公开号WO 2014/201273。在一些情况下，条形码或其它核酸标签通过酶促或化学偶联步骤附着到蛋白质。

在一些实施例中，捕获核酸包含发夹，所述发夹可以包含用于各种类型的标识信息的一个或多个条形码序列。例如，捕获核酸可以包含带有关于固定多肽的支持物(例如，珠子)的信息的条形码。在一些实施例中，诱饵核酸可以包含用于各种类型的标识信息的一个或多个条形码序列。例如，诱饵核酸可以包含样品条形码和/或用于鉴定对照肽的条形码。除了一个或多个条形码序列之外，捕获核酸和/或诱饵核酸可以含有任选的UMI序列。

在一些实施例中，本文提供的用于制备分析物的方法进一步包括将一个或多个条形码附着至诱饵核酸。在一些实施例中，本文提供的用于制备分析物的方法进一步包括将一个或多个条形码附着至捕获核酸。一个或多个条形码的附着包括酶促或化学方法。在一些实施例中，使用核酸延伸(例如，PCR延伸)来附着条形码。在一些实施例中，使用连接反应将条形码附着到诱饵或捕获核酸。在一些实例中，将两个或更多个条形码附着到诱饵核酸。在一些实例中，将两个或更多个条形码附着到捕获核酸。

在一些实施例中，将条形码附着到诱饵核酸的5'端。在一些实施例中，将条形码附着到诱饵核酸的3'端。在一些实施例中，将条形码附着到捕获核酸的5'端。在一些实施例中，将条形码附着到捕获核酸的3'端。在一些实施例中，将条形码附着到核酸-分析物嵌合体的5'端。在一些实施例中，将条形码附着到核酸-分析物嵌合体的3'端。在一些实施例中，将条形码附着到与固体支持物偶联的核酸-分析物缀合物的5'端。在一些实施例中，将条形码附着到与固体支持物偶联的核酸-分析物缀合物的3'端。在一些具体实施例中，条形码的5'端被磷酸化。

在一些实施例中，本文提供的方法用于制备固体支持物，所述固体支持物与附有分析物的诱饵核酸偶联，使得分析物被条形编码。在一些实施例中，固体支持物与与每种分析物相关联的多个核酸偶联，并且所使用的条形码包括多种条形码序列。

可以使用包括与诱饵核酸互补的核酸序列的条形码模板(BC')来添加条形码。在一些实施例中，条形码模板是或包括DNA。在一些实施例中，条形码模板是或包括RNA。在一些实施例中，用于将条形码附着到诱饵或捕获核酸的条形码模板被配置成与诱饵或捕获核酸杂交。在一些实施例中，用于附着条形码的方法可以进一步包括消化反应。在一些实施例中，在条形码已经从条形码模板转移之后进行消化反应。在一些实施例中，在将分析物附着至诱饵核酸之前将条形码附着至诱饵核酸。在一些实施例中，在将分析物附着至诱饵核酸之后将条形码附着至诱饵核酸。在一些实例中，可以使用延伸、引物延伸或连接进行条形码的附着。在一些实施例中，将带有新安装的条形码的核酸-分析物嵌合体洗涤、用消化酶处理和/或加热处理。

图3-9是描绘用于将条形码附着到偶联至固体支持物的诱饵核酸、捕获核酸、核酸-分析物嵌合体或核酸-分析物缀合物的示例性方法的示意图。

在一些具体的实施例中，分析物附着于诱饵核酸；条形码模板(BC')与核酸-分析物嵌合体杂交；使用延伸反应将诱饵核酸的3'端延伸至包含条形码序列；通过将诱饵核酸(带有分析物和条形码)与附着在固体支持物上的捕获核酸杂交，使带有新扩展的条形码的核酸-分析物嵌合体接近固体支持物；核酸-分析物嵌合体通过附着(例如，通过连接)捕获核酸和诱饵核酸而共价偶联至固体支持物(图3)。

在一些具体的实施例中，分析物附着于诱饵核酸；通过将诱饵核酸(带有分析物)与附着在固体支持物上的捕获核酸杂交，使核酸-分析物嵌合体接近固体支持物；核酸-分析物嵌合体通过附着(例如，通过连接)捕获核酸和诱饵核酸而共价偶联至固体支持物；使用条形码模板(BC')将诱饵核酸的3'端延伸至包含条形码序列；使用消化反应从偶联在固体支持物上的核酸分析物缀合物中释放条形码模板(图4)。

在一些方面，附着条形码可以包括引物延伸。在一些实例中，通过在25℃-37℃下与包括Klenow片段(exo-)和模板条形码的反应溶液一起孵育来进行引物延伸，使得条形码被安装在诱饵核酸上。在一些实例中，条形码模板包括含有dU的核酸。在一些实施例中，在安装条形码之后执行洗涤步骤。在一些方面，捕获核酸包括与条形码模板互补的核酸序列。在一些情况下，诱饵或捕获核酸被配置成允许与条形码模板杂交。在一些实例中，通过以下步骤执行延伸反应：将偶联至固体支持物的核酸分析物缀合物与包含Klenow片段(exo-)的反应溶液在25℃-37℃下一起孵育5分钟，以扩展诱饵核酸，从而安装条形码。在一些实施例中，将带有通过延伸安装的条形码的核酸-分析物缀合物被洗涤，并用USER酶(新英格兰生物实验室(New England Biolabs))处理以去除任何经消化的链，从而进行测定。

在一些具体的实施例中，分析物附着于诱饵核酸；使用连接反应将诱饵核酸附着到条形码上；通过将诱饵核酸(带有分析物和条形码)与附着在固体支持物上的捕获核酸杂交，使带有附着的条形码的核酸-分析物嵌合体接近固体支持物；核酸-分析物嵌合体通过附着(例如，通过连接)捕获核酸和诱饵核酸而共价偶联至固体支持物。在一个实施例中，诱饵核酸包括夹板核酸链，其中夹板通过杂交将诱饵核酸和条形码桥接并且能够实现有效的连接或化学偶联。(图5)。

图6和7描绘了条形码到捕获核酸的3'端的附着以及核酸-分析物嵌合体通过将诱饵核酸附着到5'捕获核酸而偶联至固体支持物。在一些具体的实施例中，分析物附着到诱饵核酸；通过将诱饵核酸与附着在固体支持物上的捕获核酸杂交，使核酸-分析物嵌合体接近固体支持物；核酸-分析物嵌合体通过附着(例如，通过连接)捕获核酸的5'端和诱饵核酸的3'端而共价偶联至固体支持物；条形码附着到捕获核酸的3'端(例如，通过连接)(图6)。在一些实施例中，核酸-分析物嵌合体的诱饵核酸附着到附着在固体支持物上的捕获核酸的5'端，并且捕获核酸包含条形码序列(图7)。

在一些方面，附着条形码可以包括使用含有dU的核酸条形码模板。在一些方面，附着条形码可以进一步包括用USER酶处理诱饵核酸、捕获核酸或核酸-分析物嵌合体。在一些方面，所提供的用于附着或安装条形码的方法包括用USER酶处理带有安装的条形码的核酸。例如，嵌合体与含有多个dU、UMI、条形码和/或间隔子序列的核酸条形码模板杂交；在25℃-37℃下在包含Klenow片段(exo-)的反应中进行引物延伸，以将来自模板的UMI、条形码和/或间隔子安装到诱饵核酸上(附着到分析物)；将所得dsDNA用USER酶(新英格兰生物实验室)处理以消化dU位点，并加热以去除经消化的片段(图8)。

在一些方面，附着条形码可以包括使用RNA条形码模板。例如，可以使用逆转录反应将条形码安装到诱饵核酸上。在一些方面，条形码模板可以包含使用含有UMI、条形码和/或间隔子序列的RNA模板。例如，在含有逆转录酶(RNase H-)的反应中进行逆转录，以将UMI、条形码和/或间隔子序列安装到诱饵核酸上。在一些情况下，可以加热处理与逆转录酶的反应以灭活逆转录酶。在一些情况下，将所得RNA/DNA杂交体用RNase A和T1混合物(Thermo Fisher)和RNase H处理，以消化RNA条形码模板(图9)。在一些实施例中，然后通过将诱饵核酸(带有分析物和条形码)与附着在固体支持物上的捕获核酸杂交，使带有新安装的条形码的核酸-分析物嵌合体接近固体支持物；核酸-分析物嵌合体通过附着(例如，通过连接)捕获核酸和诱饵核酸而共价偶联至固体支持物。

诱饵核酸和/或捕获核酸可以进一步包括其它功能性组分，例如通用引发位点、与附着到另一核酸部分的间隔子序列互补的间隔子序列或其任何组合。在一些实施例中，捕获核酸包括用于下游测序步骤的衔接子序列(例如，退火至流动池表面上的互补寡核苷酸以用于下一代测序平台的流动池衔接子序列)。在某些实施例中，通用DNA序列是通用引发序列。在经标记的蛋白质上的通用序列与诱饵或捕获核酸(例如，结合到珠子)的互补序列杂交时，退火的通用序列可以通过引物延伸而扩展。在一些实施例中，通用引发位点包括用于扩增、测序或两者的引发位点。在一些实施例中，通用反向引发位点是Illumina P7引物(5'-CAAGCAGAAGACGGCATACGAGAT-3'-SEQ ID NO:2)或Illumina P5引物(5'-AATGATACGGCGACCACCGA-3'-SEQ ID NO:1)。在一些实施例中，所使用的通用引发位点包括序列5'-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'(SEQ ID NO:32)和5'-GACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'(SEQ ID NO:33)。

在一些实施例中，下游测序步骤可以使用连接到记录标签核酸的一端或两端的衔接子。测序可以通过任何可商购的测序仪器或通过任何已知方法来实现。在一些实例中，捕获核酸包括索引序列、衔接子序列、与附着于表面的测序平台寡核苷酸特异性结合的核酸结构域，或其任何组合。在一个实例中，衔接子包含在捕获核酸中并且被设计成与Illumina测序机一起使用。所关注的测序平台可以包含但不限于来自的HiSeq^TM、MiSeq^TM和Genome Analyzer^TM测序系统；来自Ion Torrent^TM的Ion PGM^TM和Ion Proton^TM测序系统；来自Pacific Biosciences的PACBIO RS II测序系统、来自Life Technologies^TM的SOLiD测序系统、来自Roche的454GS FLX+和GS Junior测序系统，或任何其它测序平台。

在一些实施例中，诱饵核酸在其5'末端和/或3'末端包括间隔子聚合物。在一些实施例中，捕获核酸在其5'末端和/或3'末端包括间隔子聚合物。在一些实例中，间隔子序列位于诱饵核酸的3'端。在一些实例中，间隔子序列位于诱饵核酸的5'端。在一些实施例中，间隔子序列被配置成允许使用聚合酶延伸将核酸信息转移到诱饵或捕获核酸。在一些实施例中，间隔子序列被配置成允许使用聚合酶延伸将核酸信息转移到与固体支持物偶联的核酸-分析物缀合物。

在一些实施例中，间隔子聚合物包括至少1个核苷酸、至少2个核苷酸、至少3个核苷酸、至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少15个核苷酸或至少20个或更多个核苷酸。间隔子聚合物可以包括任何合适的核酸，例如，DNA分子、具有伪互补碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子；非核酸可测序聚合物，例如多糖、多肽、肽或聚酰胺，或其组合。

在一些特定的实施例中，诱饵核酸在其5'端或3'端进一步包括以下内容：用于PCR反应的通用引物位点、UMI、样品条形码和间隔子(通用序列)。在一些特定的实施例中，捕获核酸在其5'端或3'端进一步包括以下内容：间隔子(通用序列)、样品条形码、UMI和用于PCR反应的通用引物位点。在一些方面，核酸组分的顺序可以以各种方式组合。在一些优选的实施例中，间隔子序列优选位于核酸的3'端，在其中聚合酶延伸用于将编码标签信息转移到与分析物相关的核酸的实施例中，来自结合剂的标识信息被转移到所述核酸的3'端。

固体支持物可以是任何支持物表面，包含但不限于珠子、微珠、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、PTFE膜、尼龙、硅晶片芯片、流通芯片、流通池、包含信号转换电子器件的生物芯片、通道、微量滴定孔、ELISA板、旋转干涉盘、硝酸纤维素膜、基于硝酸纤维素的聚合物表面、聚合物基质、纳米颗粒或微球。用于固体支持物的材料包含但不限于丙烯酰胺、琼脂糖、纤维素、葡聚糖、硝酸纤维素、玻璃、金、石英、聚苯乙烯、聚乙烯醋酸乙烯酯、聚丙烯、聚酯、聚甲基丙烯酸酯、聚丙烯酸酯、聚乙烯、聚环氧乙烷、聚硅酸盐、聚碳酸酯、聚乙烯醇(PVA)、特氟隆、碳氟化合物、尼龙、硅橡胶、二氧化硅、聚酐、聚乙醇酸、聚氯乙烯、聚乳酸、聚原酸酯、官能化硅烷、聚富马酸丙酯、胶原蛋白、糖胺聚糖、聚氨基酸或其任何组合。在某些实施例中，固体支持物是珠子，例如，聚苯乙烯珠、聚合物珠、聚丙烯酸酯珠、琼脂糖珠、纤维素珠、葡聚糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁珠、玻璃珠、基于二氧化硅的珠子或受控孔珠，或其任何组合。

在一些实施例中，捕获核酸被衍生化或包括允许与固体支持物结合的部分(例如，反应性偶联部分)。在一些实施例中，捕获核酸包括允许与诱饵核酸结合的部分(例如，反应性偶联部分)。在一些其它实施例中，诱饵核酸被衍生化或包括允许与固体支持物结合的部分(例如，反应性偶联部分)。使核酸衍生化以结合固体支持物的方法和用于实现该方法的试剂是本领域已知的。为此，可以使用任何优选快速且基本上不可逆的反应将核酸附着到固体支持物上。捕获核酸可以通过共价键或非共价键结合到固体支持物上。在优选的实施例中，捕获核酸与生物素共价结合以形成生物素化缀合物。然后将生物素化缀合物结合至固体表面，例如，通过结合至用抗生物素蛋白或链霉抗生物素蛋白衍生的固体、不溶性支持物。通过在环区域中并入经修饰的核酸，可以将捕获核酸衍生化，以结合固体支持物。在其它实施例中，捕获部分在环区域以外的区域中衍生化。

示例性反应包含叠氮化物和炔烃的铜催化反应形成三唑(Huisgen 1,3-偶极环加成)、应变促进的叠氮化物炔烃环加成(SPAAC)、二烯和亲二烯体的反应(狄尔斯-阿尔德)、应变促进的炔-硝酮环加成、应变的烯烃与叠氮化物、四嗪或四唑的反应、烯烃和叠氮化物[3+2]环加成、烯烃和四嗪的逆电子需求狄尔斯-阿尔德(IEDDA)反应(例如，间四嗪(mTet)或苯基四嗪(pTet)和反式环辛烯(TCO)；或pTet和烯烃)、烯烃和四唑的光反应、叠氮化物和膦的施陶丁格连接，以及各种置换反应，如通过对亲电子原子进行亲核攻击来置换离去基团(Horisawa 2014,Knall,Hollauf等人2014)。示例性置换反应包含胺与以下物质的反应：活化酯；N-羟基琥珀酰亚胺酯；异氰酸酯；异硫氰酸酯、醛、环氧化物等。

在一些实施例中，iEDDA点击化学用于将多肽固定到固体支持物上，因为它在低输入浓度下是快速的并且提供高产率。在另一个实施例中，在iEDDA点击化学反应中使用间四嗪而不是四嗪，因为间四嗪具有改进的键稳定性。在另一个实施例中，在iEDDA点击化学反应中使用苯基四嗪(pTet)。

在一些实施例中，多个捕获核酸与固体支持物偶联。在一些情况下，与捕获核酸上的诱饵核酸互补的序列区域在多个捕获核酸中是相同的。在一些情况下，附着到各种分析物的诱饵核酸包括与捕获核酸相同的互补序列。

在一些实施例中，固体支持物的表面被钝化(阻断)。“钝化”表面是指已经用外层材料处理过的表面。使表面钝化的方法包含来自荧光单分子分析文献的标准方法，包含用以下聚合物使表面钝化：如聚乙二醇(PEG)(Pan等人,2015,《生物物理学(Phys.Biol.)》12:045006)、聚硅氧烷(例如，Pluronic F-127)、星形聚合物(例如，星形PEG)(Groll等人,2010,《酶学方法(Methods Enzymol.)》472:1-18)、疏水性二氯二甲基硅烷(DDS)+自组装Tween-20(Hua等人,2014,《自然方法》11:1233-1236)、类金刚石碳(DLC)、DLC+PEG(Stavis等人,2011,《美国国家科学院院刊》108:983-988)和两性离子部分(例如，美国专利申请公开US 2006/0183863)。除了共价表面改性外，还可以使用许多钝化剂，包含表面活性剂，如Tween-20、溶液中的聚硅氧烷(Pluronic系列)、聚乙烯醇(PVA)，以及蛋白质，如BSA和酪蛋白。可替代地，当将蛋白质、多肽或肽固定到固体底物上时，可以通过掺入竞争剂或“虚拟”反应性分子，在固体底物的表面上或体积内滴定分析物(例如，蛋白质、多肽或肽)的密度。在一些实施例中，各种分子量的PEG也可用于约300Da到50kDa或更大的分子量的钝化。

在多个核酸-分析物嵌合体固定在同一固体支持物上的某些实施例中，核酸-分析物嵌合体可以适当间隔以适应用于评估蛋白质的分析方法。例如，可能有利的是，将核酸-分析物嵌合体质隔开以最佳地允许用于评估和测序分析物的基于核酸的方法。在一些实施例中，用于评估和测序分析物的方法涉及与分析物结合的结合剂，并且结合剂包括具有信息的编码标签，所述信息被转移至附着于分析物的核酸(例如，诱饵或捕获核酸)。在一些情况下，从与一个分析物结合的结合剂的编码标签转移的信息可能会到达邻近的分析物。

为了控制固体支持物上的分析物(例如，蛋白质、多肽或肽间距)或核酸-分析物嵌合体间距，可以在底物表面上滴定功能性偶联基团(例如，TCO)的密度。在一些实施例中，相邻偶联的分析物或核酸-分析物嵌合体在固体支持物(例如，多孔支持物)的表面上或体积内以约50nm到约500nm、或约50nm到约400nm、或约50nm到约300nm、或约50nm到约200nm、或约50nm到约100nm的平均距离彼此间隔开。在一些实施例中，相邻偶联的分析物或核酸-分析物嵌合体在固体支持物的表面上以至少50nm、至少60nm、至少70nm、至少80nm、至少90nm、至少100nm、至少150nm、至少200nm、至少250nm、至少300nm、至少350nm、至少400nm、至少450nm或至少500nm的平均距离彼此间隔开。在一些实施例中，相邻偶联的分析物或核酸-分析物嵌合体在固体支持物的表面上以至少50nm的平均距离彼此间隔开。在一些实施例中，相邻偶联的分析物或核酸-分析物嵌合体在固体支持物的表面上或体积内彼此间隔开，使得根据经验，分子间到分子内事件(例如信息转移)的相对频率<1:10；<1:100；<1:1,000；或<1:10,000。

在一些实施例中，多个核酸-分析物嵌合体偶联在固体支持物上，使得任何相邻偶联的核酸-分析物嵌合体以约50到100nm、约50到250nm、约50到500nm、约50到750nm、约50到1000nm、约50到1500nm、约50到2000nm、约100到250nm、约100到500nm、约200到500nm、约300到500nm、约100到1000nm、约500到600nm、约500到700nm、约500到800nm、约500到900nm、约500到1000nm、约500到2000nm、约500到5000nm、约1000到5000nm或约3000到5000nm的平均距离彼此间隔开。

在一些实施例中，固体支持物上分析物的间距是通过控制固体支持物上的捕获核酸的浓度和/或数量来实现的。在一些实施例中，任何相邻偶联的捕获核酸在固体支持物(例如，多孔支持物)的表面上或体积内以约50nm到约500nm、或约50nm到约400nm、或约50nm到约300nm、或约50nm到约200nm、或约50nm到约100nm的距离彼此间隔开。在一些实施例中，任何相邻偶联的捕获核酸在固体支持物的表面上以至少50nm、至少60nm、至少70nm、至少80nm、至少90nm、至少100nm、至少150nm、至少200nm、至少250nm、至少300nm、至少350nm、至少400nm、至少450nm或至少500nm的平均距离彼此间隔开。在一些实施例中，任何相邻偶联的捕获核酸在固体支持物的表面上以至少50nm的平均距离彼此间隔开。在一些实施例中，任何相邻偶联的捕获核酸在固体支持物的表面上或体积内彼此间隔开，使得根据经验，分子间到分子内事件(例如信息转移)的相对频率<1:10；<1:100；<1:1,000；或<1:10,000。

合适的间隔频率可以使用功能测定凭经验确定并且可以通过稀释和/或通过掺入竞争底物表面上的附着位点的“虚拟”间隔分子来实现。例如，PEG-5000(MW～5000)用于阻断底物表面(例如，珠子表面)上肽之间的间隙空间。此外，肽与功能性部分偶联，所述功能性部分也附着于PEG-5000分子。在一些实施例中，功能性部分是醛、叠氮化物/炔、或马来酰亚胺/硫醇、或环氧化物/亲核试剂、或逆电子需求狄尔斯-阿尔德(iEDDA)基团、或用于施陶丁格反应(Staudinger reaction)的部分。在一些实施例中，功能性部分是醛基。

在优选的实施例中，这通过将NHS-PEG-5000-TCO+NHS-PEG-5000-甲基的混合物与胺衍生的珠子偶联来实现。滴定两种PEG之间的化学计量比(TCO对比甲基)以在底物表面上生成适当密度的功能性偶联部分(TCO基团)；甲基-PEG对偶联呈惰性。可以通过测量表面TCO基团的密度来计算TCO基团之间的有效间距。在某些实施例中，固体表面上偶联部分(例如，TCO)之间的平均间距为至少50nm、至少100nm、至少250nm或至少500nm。在珠子的PEG5000-TCO/甲基衍生化之后，将表面上过量的NH₂基团用反应性酸酐(例如乙酸或琥珀酸酐)淬灭。

在一些实施例中，所述间距是通过在底物表面上滴定可用附着分子的比率来实现的。在一些实例中，将底物表面(例如，珠子表面)用经活化剂(例如，活化剂是EDC和Sulfo-NHS)处理的羧基(COOH)官能化。在一些实例中，底物表面(例如，珠子表面)包括NHS部分。在一些实施例中，将mPEG_n-NH₂和NH₂-PEG_n-mTet的混合物加入到活化的珠子中(其中n是任何数字，例如，从n＝1到n＝100或更大的任何数字)。在一个实例中，滴定mPEG₃-NH₂(不可用于偶联)和NH₂-PEG₄-mTet(可用于偶联)之间的比率，以生成适当密度的功能性部分，其可用于将分析物附着至底物表面。在某些实施例中，固体表面上偶联部分(例如，NH₂-PEG₄-mTet)之间的平均间距为至少50nm、至少100nm、至少250nm或至少500nm。在一些具体实施例中，NH₂-PEG_n-mTet与mPEG_n-NH₂的比率为约1:1000或大于1:1000、约1:10,000或大于1:10,000、约1:100,000或大于1:100,000或约1:1,000,000或大于1:1,000,000。在一些另外的实施例中，捕获核酸附着至NH₂-PEG_n-mTet。

在一些实施例中，固体支持物上分析物的间距是通过控制固体支持物上的可用捕获核酸的浓度和/或数量来实现的。在一些实施例中，固体支持物上分析物的间距是通过控制固体支持物上可用COOH或其它官能团的浓度和/或数量来实现的。在一些具体实例中，可以通过结合未附着到分析物的诱饵核酸来使捕获核酸不可用。在一些情况下，可用和不可用的捕获核酸的比率被滴定和确定。

II.制备或处理的分析物在蛋白质分析测定中的示例性用途

本文提供了处理分析物和以适合分析的格式固定分析物的方法。例如，固定在固体支持物上的制备的分析物是与基于降解的多肽测序测定相容的格式。在一些情况下，与支持物偶联的核酸-分析物缀合物的格式可用于添加其它大分子。添加的大分子可以有含关于分析物(或其一部分)的序列的信息。在一些实例中，添加的大分子是添加到诱饵或捕获核酸的核酸。在一些具体的实施例中，为此目的，与固体支持物偶联的核酸-分析物缀合物的核酸组分能够保持、复制或存储信息。

一些实施例中，分析方法用于确定分析物(例如，多肽或肽)的至少一部分的序列。在一些情况下，分析方法可以包含执行如以下文献中所述的任何方法：国际专利公开号WO2017/192633、WO 2019/089836、WO 2019/089846和WO 2019/089851。在一些情况下，通过构建表示多肽序列的扩展型核酸序列来分析多肽的序列，如诱饵或捕获核酸上的扩展型核酸(或任何额外的条形码或附着于其上的标签)。在一些情况下，本文提供的用于处理分析物的方法可应用于ProteoCode测定或与ProteoCode测定组合使用。

在一些实施例中，令人期望的是，组分(核酸和分析物)保持附着或固定并且可用于涉及各种化学和/或酶促反应的蛋白质分析测定。在一些实施例中，测定可以涉及用化学试剂和/或酶进行的多个循环和处理。

在一些实施例中，本文提供的用于处理分析物的方法进一步包括使分析物与能够结合所述分析物的结合剂接触，其中所述结合剂包括带有关于所述结合剂的标识信息的编码标签；以及将编码标签的标识信息转移到诱饵核酸或捕获核酸。在一些实施例中，将标识信息转移到诱饵或捕获核酸会形成扩展型核酸。这种扩展型核酸也可以附着到珠子上(例如，间接地)。在一些情况下，所述方法包含重复一次或多次的另外的步骤：使分析物与能够结合所述分析物的额外的结合剂接触，其中所述额外的结合剂包括带有关于所述额外的结合剂的标识信息的编码标签；以及将关于所述额外的结合剂的编码标签的标识信息转移到诱饵核酸或捕获核酸(或其延伸物)。在一些实例中，编码标签的标识信息向诱饵核酸或捕获核酸的转移由连接酶(例如，DNA连接酶)介导。在一些实例中，编码标签的标识信息向诱饵核酸或捕获核酸的转移由聚合酶(例如，DNA聚合酶)介导。在一些实例中，编码标签的标识信息向诱饵核酸或捕获核酸的转移由化学连接介导。

A.通过氨基酸识别、信息转移和氨基酸去除的循环轮次表征多肽

在用于分析多肽分析物的示例性工作流程中，如下所述对多肽进行处理和分析：将来自蛋白水解消化物的大量多肽(例如，5000万-10亿或更多)附着至诱饵核酸以形成核酸-分析物嵌合体，并将核酸-分析物嵌合体以适当的分子内间距随机固定在单个分子测序底物(例如，珠子)上。使用章节I中描述的任何方法将肽分析物固定到珠子上。以循环方式，标记每种肽分析物的末端氨基酸(例如，N端氨基酸)(例如，PTC、经修饰的PTC、Cbz、DNP、SNP、乙酰基、胍基、二杂环甲胺)。在一些情况下，末端氨基酸的标记可作为后续步骤进行。每个固定化肽的N端氨基酸(或经标记的N端氨基酸，例如，PITC-NTAA、Cbz-NTAA、DNP-NTAA、SNP-NTAA、乙酰基-NTAA、胍基-NTAA、二杂环甲胺修饰的NTAA)被附着至编码标签的同源NTAA结合剂结合，并且来自与结合的NTAA结合剂相关联的编码标签的标识信息被转移至与固定化肽分析物相关联的诱饵或捕获核酸，从而生成含有来自编码标签的信息的扩展型核酸。在一些实施例中，一种或多种结合剂从多肽中去除或释放。通过酶促或化学方法去除经标记的NTAA。可以进行标记、与结合剂接触、转移标识信息和去除末端氨基酸的一个或多个循环。

如本文所述，来自编码标签的标识信息被转移到的核酸可以是诱饵核酸、捕获核酸或其一部分。在一些实施例中，来自编码标签的标识信息被转移到附着于诱饵或捕获核酸的条形码或其它核酸组分。在一些实施例中，来自编码标签的标识信息被转移到诱饵或捕获核酸上的扩展型核酸，所述扩展型核酸是诱饵或捕获核酸的一部分。在一些实施例中，诱饵核酸或捕获核酸(包含任何额外的条形码，或与其附着的其它核酸组分)，或其一部分，可以充当“记录标签”。“记录标签”或包括用作记录标签的核酸序列的诱饵或捕获核酸的部分是指或可以是编码标签的标识信息可以被转移到其中的部分，例如，化学偶联部分、核酸分子、多核苷酸序列或可测序的聚合物分子(参见例如，Niu等人,2013,《自然化学》5:282-292；Roy等人,2015,《自然通讯》6:7237；Lutz,2015,《大分子》48:4759-4767；所述参考文献中的每一个均通过引用整体并入)。记录标签可以包括DNA、RNA或多核苷酸类似物，包含PNA、gPNA、GNA、HNA、BNA、XNA、TNA或其组合。编码标签的标识信息可以转移到还含有其它核酸组分的诱饵或捕获核酸。标识信息可以包括表征分子的任何信息，如与身份、样品、级分、分区、空间位置、相互作用的相邻分子、循环数等有关的信息。此外，UMI信息的存在也可以归类为标识信息。在某些实施例中，在结合剂与多肽结合之后，来自与结合剂连接的编码标签的信息在结合剂与多肽结合之时可被转移至与该多肽相关联的诱饵或捕获核酸(或其一部分)。在其它实施例中，在结合剂与多肽结合之后，来自与多肽相关联的记录标签的信息在结合剂与多肽结合之时可被转移至与结合剂连接的编码标签。在一些实施例中，在聚合酶延伸用于转移编码标签信息的实施例中，编码标签的标识信息被转移到诱饵或捕获核酸的3'端。

与结合剂相关联的编码标签是或包括具有任何合适的长度(例如，约2个碱基到约100个碱基的核酸分子，包含包括2和100以及其间数字的任何整数)的多核苷酸，所述多核苷酸包括其相关联的结合剂的标识信息。“编码标签”也可以由“可测序的聚合物”制成(参见例如，Niu等人,2013,《自然化学》5:282-292；Roy等人,2015,《自然通讯》6:7237；Lutz,2015,《大分子》48:4759-4767；所述参考文献中的每一个均通过引用整体并入)。编码标签可以包括编码器序列或具有标识信息的序列，其任选地在一侧上侧接一个间隔子，或者任选地在每一侧上侧接间隔子。编码标签还可以包括任选的UMI和/或可任的结合循环特异性条形码。编码标签可以是单链或双链的。双链编码标签可以包括平末端、悬垂末端或两者。编码标签可以指直接附着于结合剂的编码标签，指与直接附着于结合剂的编码标签杂交的互补序列(例如，用于双链编码标签)，或指存在于诱饵或捕获核酸上的扩展型核酸中的编码标签信息。在某些实施例中，编码标签可以进一步包括结合循环特异性间隔子或条形码、唯一分子标识符、通用引发位点或其任何组合。

在一些实施例中，基于降解的肽或多肽测序测定的过程中的步骤顺序可以颠倒或以各种顺序进行。例如，在一些实施例中，末端氨基酸标记可以在多肽与结合剂结合之前和/或之后进行。

在一些实施例中，来自编码标签的标识信息包括关于由结合剂结合的分析物上的氨基酸的身份的信息。

在一些实例中，含有来自一种或多种结合剂的信息的最终扩展型核酸(诱饵或捕获核酸，包含其附着的任何额外条形码)任选地侧接序列(例如，衔接子序列和/或通用引发位点)，以促进下游扩增和/或DNA测序。正向通用引发位点(例如，Illumina的P5-S1序列)可以是诱饵或捕获核酸的初始设计的一部分，而反向通用引发位点(例如，Illumina的P7-S2'序列)可以作为核酸延伸的最后一步添加。在一些实施例中，所使用的通用引发位点包含SEQ ID NO:1、2、32和33中列出的序列中的任何一种。在一些实施例中，正向和反向引发位点的添加可以独立于结合剂进行。

在本文所述的方法中，一旦结合剂与多肽分析物结合，其连接的编码标签的标识信息就会被转移至与该多肽分析物相关联的核酸，从而生成扩展型核酸。与多肽分析物相关的核酸可以是章节I中描述的诱饵核酸或捕获核酸。在一些实施例中，诱饵核酸或捕获核酸进一步包括条形码和/或其它核酸组分。在特定的实施例中，来自结合剂的编码标签的标识信息被转移至诱饵核酸或捕获核酸或被添加到其附着的任何现有条形码(或其它核酸组分)。可以使用延伸或连接将编码标签的标识信息转移到与分析物相关的核酸。在一些实施例中，间隔子被添加到捕获或诱饵核酸的末端，并且间隔子包括能够与编码标签上的序列杂交以促进标识信息的转移的序列。

被配置为用作记录标签的诱饵或捕获核酸或其一部分可以是编码标签的标识信息可以被转移到其中的部分，例如，化学偶联部分、核酸分子或可测序的聚合物分子(参见例如，Niu等人,2013,《自然化学》5:282-292；Roy等人,2015,《自然通讯》6:7237；Lutz,2015,《大分子》48:4759-4767；所述参考文献中的每一个均通过引用整体并入)，可以将编码标签的标识信息转移至所述记录标签，或者可以将关于与记录标签相关联的大分子的标识信息(例如，UMI信息)从所述记录标签转移至编码标签。在某些实施例中，在结合剂结合多肽之后，来自与结合剂连接的编码标签的信息在结合剂与多肽结合之时可被转移至与该多肽相关联的核酸。

与具有来自编码标签的标识信息的分析物相关的扩展型核酸可以包括来自结合剂的编码标签的信息，所述信息表示所进行的每个结合循环。然而，在一些情况下分析，扩展型核酸也可能经历“缺失”的结合循环，例如，在结合剂未能与多肽分析物结合的情况下，这是由于因引物延伸反应失败导致的编码标签缺失、损坏或有缺陷。即使发生结合事件，来自编码标签的信息的转移也可能不完整或低于100％准确，例如，因为编码标签已损坏或有缺陷，这是由于在引物延伸反应中引入了错误)。因此，扩展型核酸可以表示已在其相关多肽上发生的结合事件的100％，或至多95％、90％、85％、80％、75％、70％、65％、60％、65％、55％、50％、45％、40％、35％、30％或其任何子范围。此外，存在于扩展型核酸中的编码标签信息可以具有对应的编码标签的至少30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％同一性。

在某些实施例中，与固定化肽分析物相关的诱饵或捕获核酸上的扩展型核酸可以包括来自多个编码标签的信息，所述信息表示多个连续结合事件。在这些实施例中，与固定化肽分析物相关的诱饵或捕获核酸上的单个、连接的扩展型核酸可以表示单个多肽。如本文所指，将编码标签信息转移至与固定化肽分析物相关的诱饵或捕获核酸还包含转移至诱饵或捕获核酸上的扩展型核酸，如在涉及多个连续结合事件的方法中会发生的。

在某些实施例中，结合事件信息以循环方式从编码标签转移至与固定化肽分析物相关的诱饵或捕获核酸。通过要求至少两个不同的编码标签(鉴定两个或多个独立的结合事件)映射到同一类结合剂(与特定蛋白质同源)，可以在测序后从信息上过滤掉交叉反应性结合事件。除了一个或多个间隔子序列之外，编码标签可以含有任选的UMI序列。通用引发序列也可以包含在与固定化肽分析物相关的诱饵或捕获核酸上的扩展型核酸中，用于扩增和NGS测序。

可以使用多种方法转移与特定结合剂相关联的编码标签信息。在某些实施例中，编码标签的信息通过引物延伸被转移到与固定化肽分析物相关的诱饵或捕获核酸上的核酸(Chan等人,2015,《化学生物学的最新观点(Curr Opin Chem Biol.)》26:55-61)。通过使用退火的编码标签作为模板，诱饵或捕获核酸的3'末端或附着于诱饵或捕获核酸的核酸上的间隔子序列与编码标签的3'末端上的互补间隔子序列退火，并且聚合酶(例如，链置换聚合酶)扩展诱饵或捕获核酸上的核酸序列。在一些实施例中，与编码标签编码器序列和5'间隔子互补的寡核苷酸可以预退火至编码标签，以防止编码标签与存在于扩展型核酸中的内部编码器和间隔子序列杂交。编码标签上的3'末端间隔子保持单链，优选地与诱饵或捕获核酸(或任何条形码或其它核酸组分)上的末端3'间隔子结合。在其它实施例中，与固定化肽分析物相关的诱饵或捕获核酸上的新生核酸可以用单链结合蛋白包被，以防止编码标签退火至内部位点。可替代地，新生核酸也可以用RecA(或相关的同源物，如uvsX)包被，以促进3'末端浸入完全双链的编码标签中(Bell等人,2012,《自然》491:274-278)。该配置防止双链编码标签与位于与固定化肽分析物相关的诱饵或捕获核酸上的内部核酸元件相互作用，但是易于受到扩展型核酸的RecA包被的3'尾的链入侵(Bell等人,2015,《Elife》4:e08646)。单链结合蛋白的存在可以促进链置换反应。

在一些实施例中，用于引物延伸的DNA聚合酶具有链置换活性并且具有有限的3'-5外切核酸酶活性或缺乏3'-5外切核酸酶活性。此类聚合酶的许多实例中的几个实例包含Klenow exo-(DNA Pol 1的Klenow片段)、T4 DNA聚合酶exo-、T7 DNA聚合酶exo(测序酶2.0)、Pfu exo-、Vent exo-、Deep Vent exo-、Bst DNA聚合酶大片段exo-、Bca Pol、9°NPol和Phi29Pol exo-。在优选的实施例中，DNA聚合酶在室温和至多45℃下是有活性的。在另一个实施例中，采用嗜热聚合酶的“热启动”形式，使得聚合酶被活化并在约40℃-50℃下使用。示例性的热启动聚合酶是Bst 2.0热启动DNA聚合酶(新英格兰生物实验室)。

用于链置换复制的添加剂包含细菌、病毒或真核来源的多种单链DNA结合蛋白(SSB蛋白)中的任一种，如大肠杆菌的SSB蛋白、噬菌体T4基因32产物、噬菌体T7基因2.5蛋白、噬菌体Pf3 SSB、复制蛋白A RPA32和RPA14亚基(Wold,1997)；其它DNA结合蛋白，如腺病毒DNA结合蛋白、单纯疱疹蛋白ICP8、BMRF1聚合酶辅助亚基、疱疹病毒UL29SSB样蛋白；已知参与DNA复制的多种复制复合蛋白中的任一种，如噬菌体T7解旋酶/引物酶、噬菌体T4基因41解旋酶、大肠杆菌Rep解旋酶、大肠杆菌recBCD解旋酶、recA、大肠杆菌和真核拓扑异构酶(《生物化学年鉴》(2001)70:369-413)。

错误引发或自引发事件，如当重新编码标签的末端间隔子序列引发延伸时，通过在引物延伸反应中包含单链结合蛋白(T4基因32、大肠杆菌SSB等)、DMSO(1-10％)、甲酰胺(1-10％)、BSA(10-100ug/ml)、TMACl(1-5mM)、硫酸铵(10-50mM)、甜菜碱(1-3M)、甘油(5-40％)或乙二醇(5-40％)，可以使自扩增最小化。

大多数A型聚合酶都缺乏3'核酸外切酶活性(内源性或工程去除)，如Klenow外切酶、T7 DNA聚合酶外切酶(测序酶2.0)，而Taq聚合酶则催化非模板化的核苷酸添加，优选地，双链体扩增产物的3'钝端的腺苷碱基(较小程度的G碱基，取决于序列背景)。对于Taq聚合酶，3'嘧啶(C>T)可最大限度地减少非模板化的腺苷添加，而3'嘌呤核苷酸(G>A)有利于非模板化的腺苷添加。在使用Taq聚合酶进行引物延伸的一些实施例中，将胸苷碱基放置在远离结合剂的间隔子序列和相邻的条形码序列(例如，编码器序列或循环特异性序列)之间的编码标签中，可在诱饵或捕获核酸的间隔子序列的3'末端零星地包含非模板化腺苷核苷酸。以这种方式，与固定化肽分析物相关的诱饵或捕获核酸上的扩展型核酸(带有或不带有非模板化腺苷碱基)可以退火至编码标签，并经历引物延伸。

可替代地，可以通过采用突变型聚合酶(嗜温或嗜热)减少非模板碱基的添加，其中非模板化末端转移酶活性由于一个或多个点突变而大大降低，尤其是在O-螺旋区域(参见美国专利7,501,237)(Yang等人,《核酸研究》(2002)30(19):4314-4320)。Pfu exo-，缺乏3'外切核酸酶并具有链置换能力，也没有非模板化的末端转移酶活性。

在另一个实施例中，聚合酶延伸缓冲液由40-120mM缓冲剂(如pH值为6-9的Tris-乙酸盐、Tris-HCl、HEPES等)组成。

通过在诱饵或捕获核酸(或附着的扩展型核酸)上的核酸中包含伪互补碱基，可以最大程度地减少由扩展型核酸的末端间隔子序列与扩展型核酸的内部区域的自退火引发的自引发/错误引发事件(Lahoud等人,《核酸研究》(2008)36:3409-3419)、(Hoshika等人,《应用化学国际英文版(Angew Chem Int Ed Engl.)》(2010)49(32):5554-5557)。伪互补碱基显示由于化学修饰的存在而彼此形成双链体的杂交亲和力显著降低。然而，许多伪互补修饰碱基可以与天然DNA或RNA序列形成强碱基对。在某些实施例中，编码标签间隔子序列由多个A和T碱基组成，并且使用亚磷酰胺寡核苷酸合成将市售的伪互补碱基2-氨基腺嘌呤和2-硫胸腺嘧啶并入诱饵或捕获核酸中。通过向反应中添加伪互补核苷酸，可以在引物延伸期间将额外的伪互补碱基并入扩展型核酸中(Gamper等人,《生物化学(Biochemistry.)》(2006)45(22):6978-86)。

在一些实施例中，为了使溶液中的编码标签标记的结合剂与固定化蛋白质分析物的核酸的非特异性相互作用最小化，与含有间隔子序列的核酸(例如，在诱饵或捕获核酸或其延伸物上)互补的竞争剂(也被称为阻断的)寡核苷酸可以被添加到结合反应中，以最大限度地减少非特异性相互作用。在一些实施例中，阻断的寡核苷酸含有与附着于结合剂的编码标签或其一部分互补的序列。例如，阻断的寡核苷酸含有与编码标签的间隔子和/或条形码序列互补的序列。在一些实施例中，阻断的寡核苷酸相对较短。多余的竞争剂寡核苷酸在引物延伸之前从结合反应中被洗掉，这有效地将退火的竞争剂寡核苷酸与诱饵或捕获核酸上的核酸分离，尤其是在暴露于略微升高的温度(例如，30-50℃)时。阻断的寡核苷酸可在其3'端包括终止子核苷酸以防止引物延伸。

在某些实施例中，在引物延伸反应条件下，诱饵或捕获核酸上的间隔子序列与编码标签上的互补间隔子序列的退火是亚稳态的(即，退火Tm类似于反应温度)。这允许编码标签的间隔子序列取代退火至诱饵或捕获核酸的间隔子序列(或其延伸物)的任何阻断的寡核苷酸。

与特定结合剂相关的编码标签信息也可以通过连接转移至与固定化肽分析物相关的诱饵或捕获核酸上的核酸。连接可以是平末端连接或粘性末端连接。连接可以是酶连接反应。连接酶的实例包含但不限于CV DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、T3 DNA连接酶、Taq DNA连接酶、大肠杆菌DNA连接酶、9°N DNA连接酶、(参见例如，美国专利公开号US20140378315)。可替代地，连接可以是化学连接反应。在国际专利公开号WO2017/192633中说明的一些实施例中，无间隔子连接是通过使用“记录辅助”序列与编码标签上的臂的杂交来实现的。退火的补体序列使用标准化学连接或“点击化学”进行化学连接(Gunderson等人,《基因组研究》(1998)8(11):1142-1153；Peng等人,《欧洲有机化学杂志(European J Org Chem)》(2010)(22):4194-4197；El-Sagheer等人,《美国国家科学院院刊》(2011)108(28):11338-11343；El-Sagheer等人,《有机和生物分子化学(Org BiomolChem)》(2011)9(1):232-235；Sharma等人,《分析化学》(2012)84(14):6104-6109；Roloff等人,《生物有机与药物化学(Bioorg Med Chem)》(2013)21(12):3458-3464；Litovchick等人,《人工DNA PNA XNA(Artif DNA PNA XNA)》(2014)5(1):e27896；Roloff等人,《分子生物学方法(Methods Mol Biol)》(2014)1050:131-141)。

在另一个实施例中，可以使用公开的技术通过化学连接实现PNA的转移。PNA的结构使得其具有5'N端胺基和非反应性的3'C端酰胺基。PNA的化学连接需要将末端修饰为具有化学活性。这通常是通过使用半胱氨酰部分衍生5′N端和使用硫酯部分衍生3′C端来完成的。使用标准天然化学连接条件，这种经修饰的PNA很容易偶联(Roloff等人,(2013)《生物有机与药物化学》21:3458-3464)。

在一些实施例中，可以使用拓扑异构酶转移编码标签信息。拓扑异构酶可用于将诱饵或捕获核酸(或其延伸物或任何附着的核酸)上的带拓扑电荷的3'磷酸连接到编码标签(或其互补物)的5'端(Shuman等人,1994,《生物化学杂志(J.Biol.Chem.)》269:32678-32684)。

如本文所述，结合剂可以结合翻译后修饰的氨基酸。因此，在某些实施例中，与分析物相关的扩展型核酸包括与多肽分析物的氨基酸序列和翻译后修饰相关的编码标签信息。在一些实施例中，在检测和消除末端氨基酸(例如，NTAA或CTAA)之前完成对内部翻译后修饰的氨基酸(例如，磷酸化、糖基化、琥珀酰化、泛素化、S-硝基化、甲基化、N-乙酰化、脂化等)的检测。在一个实例中，肽与结合剂接触以进行PTM修饰，并且相关的编码标签信息被转移至与固定化肽分析物相关的诱饵或捕获核酸上的核酸。一旦完成与氨基酸修饰有关的编码标签信息的检测和转移，就可以使用N端或C端降解方法在检测和转移初级氨基酸序列的编码标签信息之前去除PTM修饰基团。因此，得到的扩展型核酸表明肽序列中存在翻译后修饰，尽管不是序列顺序，以及初级氨基酸序列信息。

在一些实施例中，内部翻译后修饰的氨基酸的检测可以与初级氨基酸序列的检测同时进行。在一个实例中，NTAA(或CTAA)与对翻译后修饰的氨基酸具有特异性的结合剂接触，单独或作为结合剂文库(由用于20种标准氨基酸和选定的翻译后修饰氨基酸的结合剂组成的文库)的一部分。随后进行末端氨基酸消除和与结合剂(或结合剂文库)接触的连续循环。因此，在与固定化肽分析物相关的诱饵或捕获核酸上得到的扩展型核酸表明在初级氨基酸序列的上下文中翻译后修饰的存在和顺序。

在某些实施例中，诱饵或捕获核酸上的核酸集合可用于每种多肽以提高编码标签信息转移的整体稳健性和效率。使用与给定多肽相关的核酸集合而不是单个核酸可以提高文库构建的效率。

对于涉及分析变性分析物(包含蛋白质、多肽和肽)的实施例，可以在转移标识信息(例如，引物延伸)后通过使用高度变性条件(例如，0.1-0.2N NaOH、6M尿素、2.4M异硫氰酸胍、95％甲酰胺等)去除结合的结合剂和退火的编码标签。

在涉及分析肽的某些实施例中，在结合剂的结合和编码标签信息的转移之后，将末端氨基酸从肽中去除或切割，以暴露新的末端氨基酸。在一些实施例中，末端氨基酸是NTAA。在其它实施例中，末端氨基酸是CTAA。末端氨基酸的切割可以通过许多已知技术完成，包含化学切割和酶促切割。

在一些实施例中，使用催化的工程化酶或促进去除经修饰的或标记的N端氨基酸的试剂。在一些实施例中，使用如国际专利公开号WO 2019/089846或美国临时专利申请第62/841,171号中所述的任何方法去除或消除末端氨基酸。在一些实施例中，末端氨基的切割使用羧肽酶、氨肽酶、二肽基肽酶、二肽基氨肽酶或其变体、突变体或修饰的蛋白质；水解酶或其变体、突变体或修饰的蛋白质；温和的埃德曼(Edman)降解试剂；埃德曼酶；无水TFA、碱；或其任何组合。

在一些实施例中，温和的埃德曼降解使用二氯或一氯酸；温和的埃德曼降解使用TFA、TCA或DCA；或温和的埃德曼降解使用三乙胺、三乙醇胺或三乙铵乙酸盐(Et₃NHOAc)。在一些情况下，用于去除氨基酸的试剂包括碱。在一些实施例中，碱是氢氧化物、烷基化胺、环胺基、碳酸盐缓冲液、磷酸三钠缓冲液或金属盐。在一些实例中，氢氧化物是氢氧化钠；烷基化胺选自甲胺、乙胺、丙胺、二甲胺、二乙胺、二丙胺、三甲胺、三乙胺、三丙胺、环己胺、苄胺、苯胺、二苯胺、N,N-二异丙基乙胺(DIPEA)和二异丙基酰胺锂(LDA)；环胺基选自吡啶、嘧啶、咪唑、吡咯、吲哚、哌啶、脯氨酸、1,8-二氮杂双环[5.4.0]十一碳-7-烯(DBU)和1,5-二氮杂双环[4.3.0]非-5-烯(DBN)；碳酸盐缓冲液包括碳酸钠、碳酸钾、碳酸钙、碳酸氢钠、碳酸氢钾或碳酸氢钙；金属盐包括银；或金属盐为AgClO₄。

在一些情况下，NTAA的酶促切割解可以通过氨肽酶或其它肽酶来完成。氨肽酶天然地以单体和多聚体酶形式存在，并且可以是金属或ATP依赖性的。天然氨肽酶具有非常有限的特异性，并且通常以连续方式切割N端氨基酸，一个接一个地切割一个氨基酸。对于本文描述的方法，氨肽酶(例如，金属酶氨肽酶)可以被工程化为仅在用N端标记修饰时才对NTAA具有特异性结合或催化活性。例如，如果氨肽酶被如PTC、经修饰的PTC、Cbz、DNP、SNP、乙酰基、胍基、二杂环甲胺等基团修饰，则氨肽酶可以被工程化为仅切割N端氨基酸。以这种方式，氨肽酶一次只从N端切割一个氨基酸，并允许控制降解循环。在一些实施例中，经修饰的氨肽酶对于氨基酸残基同一性是非选择性的，而对于N端标记是选择性的。在其它实施例中，经修饰的氨肽酶对氨基酸残基同一性和N端标记均具有选择性。

在一些实施例中，所述方法进一步包括在步骤(b)之前在适合切割N端脯氨酸的条件下使多肽与脯氨酸氨肽酶接触。在一些实例中，脯氨酸氨肽酶(PAP)是能够从多肽中特异性地切割N端脯氨酸的酶。切割N端脯氨酸的PAP酶也被称为脯氨酸亚氨基肽酶(PIP)。已知的单体PAP包含来自凝结芽孢杆菌(B.coagulans)、德氏乳杆菌(L.delbrueckii)、淋病奈瑟菌(N.gonorrhoeae)、脑膜炎黄杆菌(F.meningosepticum)、粘质沙雷氏菌(S.marcescens)、嗜酸热原体菌(T.acidophilum)、植物乳杆菌(L.plantarum)的家族成员(MEROPS S33.001)Nakajima等人,《细菌学杂志(J Bacteriol.)》(2006)188(4):1599-606；Kitazono等人,《细菌学(Bacteriol)》(1992)174(24):7919-7925)。已知的多聚体PAP包含汉斯德巴氏酵母菌(D.hansenii)(Bolumar等人,(2003)86(1-2):141-151)和来自其它物种的类似同源物(Basten等人,《分子遗传学与基因组学(Mol Genet Genomics)》(2005)272(6):673-679)。可以采用PAP的天然或工程化变体/突变体。

对于涉及CTAA结合剂的实施例，从肽切割CTAA的方法也是本领域已知的。例如，美国专利6,046,053公开了一种使肽或蛋白质与烷基酸酐反应以将羧基末端转化为噁唑酮、通过与酸和醇或与酯反应释放C端氨基酸的方法。CTAA的酶促切割也可以通过羧肽酶来完成。几种羧肽酶表现出氨基酸优先性，例如，羧肽酶B优先在如精氨酸和赖氨酸等碱性氨基酸处切割。如上所述，还可以以与氨肽酶相同的方式修饰羧肽酶，以对与具有C端标记的CTAA特异性结合的羧肽酶进行工程化。以这种方式，羧肽酶一次只从C端切割一个氨基酸，并允许控制降解循环。在一些实施例中，经修饰的羧肽酶对于氨基酸残基同一性是非选择性的，而对于C端标记是选择性的。在其它实施例中，经修饰的羧肽酶对氨基酸残基同一性和C端标记均具有选择性。

B.用于氨基酸识别的结合剂

在某些实施例中，本公开提供的用于分析多肽的方法包括多个结合循环，其中多肽分析物与多种结合剂接触，并且结合剂的连续结合以基于核酸的编码标签的形式将历史结合信息转移至与多肽相关的至少一种核酸(例如，诱饵或捕获核酸)。以这种方式，以核酸格式生成了含有关于多个结合事件的信息的历史记录。

在一些实施例中，结合剂可以是分析物或分析物的任何部分的同源结合剂。在某些实施例中，结合剂可以结合肽分子的表位、NTAA、CTAA、介于中间的氨基酸、二肽(两个氨基酸的序列)、三肽(三个氨基酸的序列)或更高阶的肽。在一些实施例中，结合剂文库中的每种结合剂选择性地结合特定氨基酸，例如二十种标准天然存在的氨基酸之一。标准的天然氨基酸包含丙氨酸(A或Ala)、半胱氨酸(C或Cys)、天冬氨酸(D或Asp)、谷氨酸(E或Glu)、苯丙氨酸(F或Phe)、甘氨酸(G或Gly)、组氨酸(H或His)、异亮氨酸(I或Ile)、赖氨酸(K或Lys)、亮氨酸(L或Leu)、蛋氨酸(M或Met)、天冬酰胺(N或Asn)、脯氨酸(P或Pro)、谷氨酰胺(Q或Gln)、精氨酸(R或Arg)、丝氨酸(S或Ser)、苏氨酸(T或Thr)、缬氨酸(V或Val)、色氨酸(W或Trp)和酪氨酸(Y或Tyr)。在一些实施例中，结合剂结合未经修饰的或天然的氨基酸。在一些实施例中，结合剂结合肽分子的未经修饰的或天然的二肽(两个氨基酸的序列)、三肽(三个氨基酸的序列)或更高阶的肽。结合剂可以被设计成对天然或未经修饰的NTAA具有高亲和力，对天然或未经修饰的NTAA具有高特异性，或两者兼有。在一些实施例中，可以使用噬菌体展示通过有前景的亲和支架的定向进化来开发结合剂。

结合剂可以结合至肽、多肽或蛋白质分子的N端肽、C端肽或中间肽。结合剂可以结合肽分子的N端氨基酸、C端氨基酸或中间氨基酸。结合剂可以结合至N端或C端二氨基酸部分。结合剂可以优选结合经化学修饰或标记的氨基酸。例如，结合剂可以优选地结合已经用乙酰基部分、Cbz部分、鸟苷基部分、丹磺酰基部分、PTC部分、DNP部分、SNP部分、杂环甲胺部分等官能化的氨基酸，而不结合不具有所述部分的氨基酸。经修饰或标记的NTAA可以是用异硫氰酸苯酯、PITC、1-氟-2,4-二硝基苯(桑格试剂，DNFB)、苄氧羰基氯或羧基氯(Cbz-Cl)、N-(苄氧羰基氧基)琥珀酰亚胺(Cbz-OSu或Cbz-O-NHS)、丹磺酰氯(DNS-Cl或1-二甲氨基萘-5-磺酰氯)、4-磺酰基-2-硝基氟苯(SNFB)、N-乙酰基-靛红酸酐、靛红酸酐、2-吡啶甲醛、2-甲酰基苯基硼酸、2-乙酰苯基硼酸、1-氟-2,4-二硝基苯、琥珀酸酐、4-氯-7-硝基苯并呋喃、五氟苯基异硫氰酸酯、4-(三氟甲氧基)-苯基异硫氰酸酯、4-(三氟甲基)-苯基异硫氰酸酯、3-(羧酸)-苯基异硫氰酸酯、3-(三氟甲基)-苯基异硫氰酸酯、1-萘基异硫氰酸酯、N-硝基咪唑-1-羧基咪酰胺、N,N,≤-双(新戊酰基)-1H-吡唑-1-甲脒、N,N,≤-双(苄氧羰基)-1H-吡唑-1-甲脒、乙酰化试剂、胍基化试剂、硫代酰化试剂、硫代乙酰化试剂、或硫代苄基化试剂、或二杂环甲胺试剂功能化的NTAA。在一些实例中，结合剂通过与试剂接触或使用如国际专利公开号WO 2019/089846或美国临时专利申请第62/841,171号中所述的方法结合经标记的氨基酸。在一些情况下，结合剂结合由胺修饰试剂标记的氨基酸。

在一些实施例中，结合剂是部分特异性或选择性的。在一些方面，结合剂优先结合一个或多个氨基酸。例如，相比其它氨基酸，结合剂可以优先结合氨基酸A、C和G。在一些其它实例中，结合剂可以选择性地或特异性地结合多于一个氨基酸。在一些方面，结合剂还可优选来自所述末端氨基酸的第二、第三、第四、第五等位置处的一个或多个氨基酸。在一些情况下，结合剂优先结合特定的末端氨基酸和一个或多个倒数第二的氨基酸。在一些情况下，结合剂优先结合一个或多个特定的末端氨基酸和一个倒数第二的氨基酸。例如，结合剂可以优先结合AA、AC和AG，或者结合剂可以优先结合AA、CA和GA。在一些具体实例中，具有不同特异性的结合剂可以共享相同的编码标签。

在某些实施例中，控制溶液中结合剂的浓度以减少测定的本底和/或假阳性结果。

在一些实施例中，结合剂的浓度可以处于任何合适的浓度，例如，约0.0001nM、约0.001nM、约0.01nM、约0.1nM、约1nM、约2nM、约5nM、约10nM、约20nM、约50nM、约100nM、约200nM、约500nM或约1000nM。在其它实施例中，用于测定的可溶性缀合物的浓度介于约0.0001nM和约0.001nM之间、介于约0.001nM和约0.01nM之间、介于约0.01nM和约0.1nM之间、介于约0.1nM和约1nM之间、介于约1nM和约2nM之间、介于约2nM和约5nM之间、介于约5nM和约10nM之间、介于约10nM和约20nM之间、介于约20nM和约50nM之间、介于约50nM和约100nM之间、介于约100nM和约200nM之间、介于约200nM和约500nM之间、介于约500nM和约1000nM之间或大于约1000nM。

在一些实施例中，可溶性结合剂分子与固定多肽和/或(例如，核酸-分析物缀合物的)核酸之间的比率可以在任何合适的范围内，例如，约0.00001:1、约0.0001:1、约0.001:1、约0.01:1、约0.1:1、约1:1、约2:1、约5:1、约10:1、约15:1、约20:1、约25:1、约30:1、约35:1、约40:1、约45:1、约50:1、约55:1、约60:1、约65:1、约70:1、约75:1、约80:1、约85:1、约90:1、约95:1、约100:1、约10⁴:1、约10⁵:1、约10⁶:1或更高，或以上所列比率之间的任何比率。可溶性结合剂分子与固定多肽和/或(例如，核酸-分析物缀合物的)核酸之间的较高比率可用于驱动结合和/或编码标签信息转移完成。这对于检测和/或分析样品中的低丰度多肽可能特别有用。

在某些实施例中，结合剂的K_d为约500nM或小于约500nM、约200nM或小于约200nM、约100nM或小于约100nM、约50nM或小于约50nM、约10nM或小于约10nM、约5nM或小于约5nM、约1nM或小于约1nM、约0.5nM或小于约0.5nM或约0.1nM或小于约0.1nM。在特定的实施例中，将结合剂以其K_d>10×、>100×或>1000×的浓度添加至大分子以驱动结合至完成。具体地说，具有低解离速率的高的结合亲和力对于编码标签和记录标签之间的信息转移可能是有效的。

在涉及使用基于N端降解的方法分析肽或多肽的方法的实施例中，在第一结合剂与n个氨基酸的肽的n NTAA接触并结合后，将第一结合剂的编码标签信息转移至与肽相关的核酸，从而生成一阶扩展型核酸(例如，在诱饵或捕获核酸上)，如本文所述消除n NTAA。通过与酶或化学试剂接触去除n标记的NTAA，将肽的n-1氨基酸转化为N端氨基酸，其在本文中被称为n-1NTAA。使第二结合剂与肽接触并与n-1NTAA结合，并且将第二结合剂的编码标签信息转移至一阶扩展型核酸，从而生成二阶扩展型核酸(例如，用于生成表示肽的连接的第n阶扩展型核酸)。消除n-1标记的NTAA将肽的n-2氨基酸转化为N端氨基酸，其在本文中被称为n-2NTAA。可以如上所述对至多n个氨基酸进行额外的结合、转移、标记和去除，以生成第n阶扩展型核酸或n个单独的扩展型核酸，这些核酸共同表示肽。如本文所使用的，当用于指结合剂、编码标签或扩展型核酸时，n“阶”是指其中使用结合剂及其相关的编码标签的n个结合循环，或其中创建扩展型核酸(例如在诱饵或捕获核酸上)的n个结合循环。在一些实施例中，可以用C端氨基酸(CTAA)代替执行在所述示例性方法中包含NTAA的步骤。

在一些实施例中，第一结合剂和第二结合剂与多肽分析物以及任选的任何其它结合剂(例如，第三结合剂、第四结合剂、第五结合剂等)的接触在同一时间进行。例如，可以将第一结合剂和第二结合剂，以及任选的任何其它阶的结合剂汇集在一起，例如以形成结合剂的文库。在另一个实例中，第一结合剂和第二结合剂，以及任选的任何其它阶的结合剂，不是被汇集在一起，而是被同时添加到多肽中。在一个实施例中，结合剂文库包括至少20种结合剂，其选择性结合20种标准的天然存在的氨基酸。在一些实施例中，结合剂文库可以包括选择性地结合经修饰的氨基酸的结合剂。

在其它实施例中，使第一结合剂和第二结合剂，以及任选的任何其它阶的结合剂，以单独的结合循环分别与多肽接触，并按序列顺序加入。在某些实施例中，并行地同时使用多种结合剂。这种并行方法节省了时间并减少了非同源结合剂对同源结合剂结合的位点的非特异性结合(因为结合剂处于竞争状态)。

通过本文描述的方法生成的最终扩展型核酸(例如，在诱饵或捕获核酸上)的长度取决于多种因素，包含编码标签(例如，编码器序列和间隔子)的长度、核酸(例如，在诱饵或捕获核酸上，任选地包含任何唯一分子标识符、间隔子、通用引发位点、条形码或其组合)的长度、进行的结合循环的数目以及来自每个结合循环的编码标签是否是被转移至相同的扩展型核酸或多个扩展型核酸。在一些实例中，如果编码标签具有5个碱基的编码器序列，其两侧各有5个碱基的间隔子，则表示肽的结合剂历史的最终扩展型核酸的编码标签信息为10个碱基x循环数。

在最终结合循环之后以及将最终结合剂的编码标签信息转移至扩展型核酸(例如，在诱饵或捕获核酸上)之后，可以通过经由连接、引物延伸或本领域已知的其它方法添加通用反向引发位点来进行封端。在一些实施例中，核酸(例如，在诱饵或捕获核酸上)中的通用正向引发位点与附加到最终扩展型核酸上的通用反向引发位点相容。在一些实施例中，在最终转移到扩展型核酸之后，可以在添加通用反向引发位点的情况下引入封端条形码。在一些情况下，可以将任选的UMI添加到扩展型核酸中。在一些实施例中，通用反向引发位点是Illumina P7引物(5'-CAAGCAGAAGACGGCATACGAGAT-3'-SEQ ID NO:2)或IlluminaP5引物(5'-AATGATACGGCGACCACCGA-3'-SEQ ID NO:1)或SEQ ID NO:32或33中列出的序列。可以附加有义或反义P7，这取决于来自编码标签的标识信息被转移至的核酸的有义链。扩展型核酸文库可以直接从固体支持物(例如，珠子)上切割或扩增，并用于传统的下一代测序测定和方案。

在一些实施例中，引物延伸反应在单链扩展型核酸(例如，在诱饵或捕获核酸上扩展)的文库上进行以复制其互补链。在一些实施例中，肽测序测定(例如，ProteoCode测定)包括循环进程中的几个化学和酶促步骤。在一些情况下，单分子测定的一个优点是对各种循环化学/酶促步骤中的低效率具有稳健性。在一些实施例中，编码标签序列中存在的循环特异性条形码的使用允许该测定的优点。

C.标签的加工和分析

与具有来自一个或多个编码标签和表示所关注多肽的任何其它标签(条形码、UMI等)的标识信息的分析物相关联的扩展型核酸可以被加工，并且使用多种核酸测序方法进行分析。在一些实施例中，所述方法包含分析关于转移至诱饵核酸或捕获核酸的结合剂的标识信息。测序方法的实例包含但不限于链终止测序(桑格测序)；下一代测序方法，如合成测序、连接测序、杂交测序、polony测序、离子半导体测序和焦磷酸测序；以及第三代测序方法，如单分子实时测序、基于纳米孔的测序、双链体中断测序以及使用高级显微镜对DNA进行直接成像。

用于本发明的合适的测序方法包含但不限于杂交测序、合成测序技术(例如，HiSeq^TM和Solexa^TM，Illumina)、SMRT^TM(单分子实时)技术(Pacific Biosciences)、真正的单分子测序(例如，HeliScope^TM，Helicos Biosciences)、大规模并行下一代测序(例如，SOLiD^TM、Applied Biosciences；Solexa和HiSeq^TM，Illumina)、大规模并行半导体测序(例如，Ion Torrent)、焦磷酸测序技术(例如，GS FLX和GS Junior Systems，Roche/454)和纳米孔序列(例如，Oxford Nanopore Technologies)。

可以以多种方式扩增核酸(例如，扩展型核酸)的文库。核酸(例如，扩展型核酸)的文库经历指数扩增，例如，通过PCR或乳液PCR。已知乳液PCR可产生更均匀的扩增(Hori,Fukano等人,《生物化学与生物物理研究交流(Biochem Biophys Res Commun)》(2007)352(2):323-328)。可替代地，核酸(例如，扩展型核酸)的文库可以经历线性扩增，例如，通过使用T7 RNA聚合酶的模板DNA的体外转录。可以使用与包含在其中的通用正向引发位点和通用反向引发位点相容的引物来扩增核酸(例如，扩展型核酸)的文库。扩展型核酸(例如，在诱饵或捕获核酸上)的文库也可以使用加尾引物进行扩增，以将序列添加到扩展型核酸的5'端、3'端或两端。可添加到扩展型核酸末端的序列包含文库特异性索引序列以允许在单次测序运行中多路复用多个文库、衔接子序列、读取引物序列或用于使扩展型核酸文库与测序平台兼容的任何其它序列。为下一代测序做准备的文库扩增的实例如下：使用从～1mg珠子(～10ng)、200μM dNTP、1μM正向和反向扩增引物、0.5μl(1U)Phusion热启动酶(新英格兰生物实验室)洗脱的扩展型核酸文库设置20μl PCR反应体积，并使其经受以下循环条件：98℃持续30秒，然后是98℃持续10秒、60℃持续30秒、72℃持续30秒的20个循环，然后是72℃持续7分钟，然后保持在4℃。

在某些实施例中，在扩增之前、期间或之后，可以对核酸(例如，扩展型核酸)的文库进行靶标富集。在一些实施例中，靶标富集可用于在测序之前从扩展型核酸的文库中选择性地捕获或扩增表示所关注多肽的扩展型核酸。在一些方面，用于蛋白质测序的靶标富集是具有挑战性的，因为产生针对靶蛋白的高特异性结合剂的成本高且困难。在一些情况下，众所周知，抗体是非特异性的，并且很难在数千种蛋白质中进行规模生产。在一些实施例中，本公开的方法通过将蛋白质密码转换为核酸密码来规避该问题，所述核酸密码然后可以利用可用于DNA文库的广泛的靶向DNA富集策略。在一些情况下，所关注的肽可以通过富集其对应的扩展型核酸而在样品中富集。靶向富集的方法是本领域已知的，并且包含杂交捕获测定、基于PCR的测定，如TruSeq定制扩增子(Illumina)、挂锁探针(也被称为分子倒置探针)等(参见，Mamanova等人,(2010)《自然方法》7:111-118；Bodi等人,《生物分子技术杂志(J.Biomol.Tech.)》(2013)24:73-86；Ballester等人,(2016)《分子诊断专家意见(Expert Review of Molecular Diagnostics)》357-372；Mertes等人,(2011)《功能基因组学简介(Brief Funct.Genomics)》10:374-386；Nilsson等人,(1994)《科学》265:2085-8；所述文献中的每一个均通过引用整体并入本文)。

在一个实施例中，通过基于杂交捕获的测定富集核酸(例如，扩展型核酸)的文库。在基于杂交捕获的测定中，扩展型核酸的文库与用亲和标签(例如，生物素)标记的靶标特异性寡核苷酸杂交。与靶标特异性寡核苷酸杂交的扩展型核酸使用亲和配体(例如，链霉亲和素包被的珠子)通过其亲和标签“下拉”，并洗去本底(非特异性)扩展型核酸。然后获得富集的扩展型核酸(例如，扩展型核酸)用于阳性富集(例如，从珠子中洗脱)。在一些实施例中，与所关注的肽的对应扩展型核酸文库表示互补的寡核苷酸可用于杂交捕获测定。在一些实施例中，也可以使用相同或不同的诱饵组进行连续的轮次或富集。

为了在表示其片段(例如，肽)的扩展型核酸文库中富集多肽的全长，可以跨蛋白质的整个核酸表示设计“平铺”诱饵寡核苷酸。

在另一个实施例中，可以使用引物延伸和基于连接的介导的扩增富集(AmpliSeq、PCR、TruSeq TSCA等)对富含表示多肽子集的文库元件的级分进行选择和模块化。竞争性寡核苷酸也可用于调节引物延伸、连接或扩增的程度。在最简单的实施中，这可以通过混合包括通用引物尾的靶标特异性引物和缺少5'通用引物尾的竞争性引物来实现。在初始引物延伸后，仅具有5'通用引发序列的引物可以被扩增。具有和不具有通用引物序列的引物的比率控制扩增的靶标的级分。在其它实施例中，包含杂交但非延伸的引物可用于调节经历引物延伸、连接或扩增的文库元件的级分。

靶向富集方法也可用于负选择模式，以在测序前从文库中选择性地去除扩展型核酸。可以去除的不需要的扩展型核酸的实例是表示过度丰富的多肽种类(例如，蛋白质、白蛋白、免疫球蛋白等)的核酸。

与靶标杂交但缺乏生物素部分的竞争剂寡核苷酸诱饵也可用于杂交捕获步骤，以调节任何特定基因座富集的级分。竞争剂寡核苷酸诱饵与标准生物素化的诱饵竞相与靶标杂交，从而有效调节富集期间下拉的靶标的级分。可以使用这种竞争性抑制方法将蛋白质表达的十个动态范围压缩几个数量级，特别是对于如白蛋白等过度丰富的种类而言。因此，相对于标准杂交捕获，针对给定基因座捕获的文库元件的级分可以从100％调节到低至0％富集。

此外，文库归一化技术可用于从扩展型核酸文库中去除过度丰富的种类。这种方法最适合于确定长度的文库，所述文库来源于通过位点特异性蛋白酶消化生成的肽，如胰蛋白酶、LysC、GluC等。在一个实例中，可以通过使双链文库变性并允许文库元件再退火来实现归一化。由于双分子杂交动力学的二级速率常数，丰富的文库元件比不丰富的文库元件更快地再退火(Bochman、Paeschke等人2012)。可以使用本领域已知的方法，如在羟基磷灰石柱上进行色谱法(VanderNoot等人,2012,《生物技术(Biotechniques)》53:373-380)或用来自堪察加蟹(Kamchatka crab)的双链特异性核酸酶(DSN)处理文库，所述双链体特异性核酸酶破坏dsDNA文库元件(Shagin等人,(2002)《基因组研究》12:1935-42)，将ssDNA文库元件与丰富的dsDNA文库元件分离。

附着于固体支持物之前的多肽和/或所得扩展型核酸文库的分级、富集和扣除方法的任何组合可以节约测序读段并改进低丰度种类的测量。

在一些实施例中，核酸(例如，扩展型核酸)的文库通过连接或末端互补PCR连接，以产生分别包括多个不同的扩展型记录标签、扩展型编码标签或双标签的长DNA分子(Du等人,(2003)《生物技术》35:66-72；Muecke等人,(2008)《结构(Structure)》16:837-841；美国专利第5,834,252号，所述文献中的每一个均通过引用整体并入本文)。对于通过纳米孔测序装置分析DNA的长链的纳米孔测序，该实施例是优选的。

在一些实施例中，对核酸(例如，扩展型核酸)进行直接的单分子分析(参见例如，Harris等人,(2008)《科学》320:106-109)。可以直接在固体支持物上对核酸(例如，扩展型核酸)进行分析，所述固体支持物如适合负载到流动池表面(任选地微池图案化)的流动池或珠子，其中所述流动池或珠子可以与单分子测序仪或单分子解码仪集成在一起。对于单分子解码，几轮汇集的荧光标记的解码寡核苷酸的杂交(Gunderson等人,(2004)《基因组研究》14:970-7)可用于确定扩展型核酸内(例如，在诱饵或捕获核酸上)的编码标签的身份和顺序。在一些实施例中，结合剂可以用如上所述的循环特异性编码标签进行标记(另参见，Gunderson等人,(2004)《基因组研究》14:970-7)。循环特异性编码标签对代表单个多肽的单个连接的扩展型核酸或代表单个多肽的扩展型核酸的集合都起作用。

在对核酸文库(例如，扩展型核酸)进行测序之后，所得序列可以被其UMI折叠，然后与其对应的多肽相关联并与蛋白质组的整体比对。所得序列也可以通过其隔室标签折叠并与其对应的隔室蛋白质组相关联，在特定的实施例中，所述隔室蛋白质组仅含有单个或数量非常有限的蛋白质分子。蛋白质鉴定和定量都可以很容易地根据所述数字肽信息得出。

在一些实施例中，可以针对特定的测序分析平台优化编码标签序列。在特定的实施例中，测序平台是纳米孔测序。在一些实施例中，测序平台的每碱基错误率>1％、>5％、>10％、>15％、>20％、>25％或>30％。例如，如果要使用纳米孔测序仪器分析扩展型核酸，则可以将条形码序列(例如，包括来自编码标签的标识信息的序列)设计成在通过纳米孔的过程中在电学上可最佳区分。此外，一种被称为双链体中断纳米孔测序(DI)的技术可用于纳米孔链测序，而无需分子马达，这大大简化了系统设计(Derrington等人,《美国国家科学院院刊》(2010)107(37):16060-16065)。通过DI纳米孔测序读出扩展型核酸需要将连接的扩展型核酸文库中的间隔子元件与互补寡核苷酸退火。本文使用的寡核苷酸可以包括LNA，或其它经修饰的核酸或类似物以增加所得双链体的有效Tm。当用这些双链体间隔子区域装饰的单链扩展型核酸通过孔时，双链区将在收缩区暂时停滞，从而能够读出与双链体区域相邻的大约三个碱基的电流。在DI纳米孔测序的特定实施例中，包括来自编码标签的标识信息的编码器序列以这样的方式设计，即与间隔子元件相邻的三个碱基产生最大程度的电可区分纳米孔信号(Derrington等人《美国国家科学院院刊》(2010)107(37):16060-16065)。作为无马达DI测序的替代方案，间隔子元件可以被设计成采用二级结构，如G-四重体，当扩展型核酸通过纳米孔时，其会暂时停止扩展型核酸，从而能够读出相邻的编码器序列(Shim等人,《核酸研究》(2009)37(3):972-982；Zhang等人,《mAbs》(2016)8,524–535)。在经过停止之后，下一个间隔子将再次做出暂时停止，从而能够读出下一个编码器序列，依此类推。

本文公开的方法可用于同时对多种多肽分析物进行分析，包含检测、鉴定、定量和/或测序(多路复用)。如本文所使用的，多路复用是指在同一测定中分析多种多肽。多种多肽可以衍生自相同的样品或不同的样品。多种多肽可以衍生自相同的受试者或不同的受试者。被分析的多种多肽可以是不同的多肽，或者是衍生自不同样品的相同多肽。多种多肽包含2个或更多种多肽、5个或更多种多肽、10个或更多种多肽、50个或更多种多肽、100个或更多种多肽、500个或更多种多肽、1000个或更多种多肽、5,000个或更多种多肽、10,000个或更多种多肽、50,000个或更多种多肽、100,000个或更多种多肽、500,000个或更多种多肽或1,000,000个或更多种多肽。

样品多路复用可以通过与多肽样品相关的核酸(例如，诱饵或捕获核酸)的预先条形编码来实现。每个条形码表示一个不同的样品，并且可以在进行循环结合测定或序列分析之前汇集样品。在一些实施例中，将固定在同一珠子上的多肽用珠条形码进行条形编码。例如，捕获核酸可以包含珠条形码，其允许组合和加工具有不同珠条形码的样品，以用于蛋白质分析测定的一些或所有步骤。通过这种方式，可以在单个管中同时加工许多条形码标记的样品。所述方法是对在反相蛋白质阵列(RPPA)上进行免疫测定的一项重大改进(Akbani等人,《分子与细胞蛋白质组学(Mol Cell Proteomics)》(2014)13(7):1625-1643；Creighton等人,《药物设计开发与治疗(Drug Des Devel Ther)》(2015)9:3519-3527；Nishizuka等人,《药物代谢与药代动力学(Drug Metab Pharmacokinet)》(2016)31(1):35-45)。以这种方式，本公开实质上以简单的工作流程提供了高度数字化的样品和分析物多路复用替代方案以替代RPPA测定。

III.试剂盒、组分和制品

本文提供了包括用于处理或制备分析物的组分的试剂盒和制品。在一些实施例中，所述试剂盒包括被配置成附着于分析物的多个诱饵核酸以及包括多个附着的捕获核酸的固体支持物，所述捕获核酸中的每一个包括与对应的诱饵核酸互补的序列，其中任何相邻附着的捕获核酸以约50nm或更大的平均距离在所述固体支持物上间隔开。在一些实施例中，所述试剂盒还包含用于使用用于制备和处理分析物的组分的说明书。在一些实施例中，本文提供的试剂盒用于处理包括肽、多肽和蛋白质的分析物以进行测序和/或分析。在一些实施例中，本文提供的试剂盒用于制备用于蛋白质分析的分析物，所述蛋白质分析采用分子识别事件和/或可检测标记的条形编码和核酸编码。在一些实施例中，试剂盒还包含用于处理多肽和分析多肽的其它组分，包含用于多肽分析的其它试剂。

在一方面，本文提供了用于制备反应混合物的组分。在优选的实施例中，反应混合物是溶液。在一些优选的实施例中，反应混合物包含以下中的一种或多种：捕获核酸(例如，附着至固体或不溶性支持物)和诱饵核酸。在一些实施例中，试剂盒用于制备从样品(如章节IA中描述的任何样品)获得的多种分析物。在一些实施例中，捕获核酸以适合执行ProteoCode测定的格式提供在固体支持物上。

在任何提供的实施例中的一些实施例中，试剂盒包括多个诱饵核酸和多个捕获核酸。在一些实施例中，试剂盒包括章节I中描述的任何诱饵核酸。在一些实施例中，诱饵核酸被配置成允许分析物附着到诱饵核酸的3'端。在一些实施例中，诱饵核酸被配置成允许分析物附着到诱饵核酸的5'端。在一些情况下，诱饵核酸被配置成允许分析物附着到诱饵核酸的内部位置。在一些实施例中，诱饵核酸包括反应性偶联部分。在一些实例中，通过施加光能、化学试剂或酶试剂来使反应性偶联部分活化。

在一些实施例中，试剂盒包括章节I中描述的任何捕获核酸。在一些实施例中，在固体支持物上提供捕获核酸。在一些实施例中，捕获核酸包括用于下游测序的一种或多种组分，包含通用引发位点和/或衔接子序列。捕获核酸可以以能够使固体支持物上的分析物(例如，呈核酸-分析物嵌合体形式的分析物)具有所需间隔的格式提供。在试剂盒的一些实施例中，可以在底物表面上滴定捕获核酸的浓度。例如，捕获核酸被配置成将分析物偶联到固体支持物上，使得任何相邻偶联的分析物(例如，呈核酸-分析物嵌合体形式的分析物)以≥60nm、≥70nm、≥80nm、≥90nm、≥100nm、≥200nm、≥300nm、≥400nm、≥500nm或≥1000nm的平均距离在固体支持物上彼此间隔开。在一些情况下，捕获核酸被配置成将分析物偶联到固体支持物上，使得任何相邻偶联的分析物(例如，呈核酸-分析物嵌合体形式的分析物)以范围为约50到100nm、约50到250nm、约50到500nm、约50到750nm、约50到1000nm、约50到1500nm、约50到2000nm、约100到250nm、约100到500nm、约200到500nm、约300到500nm、约100到1000nm、约500到600nm、约500到700nm、约500到800nm、约500到900nm、约500到1000nm、约500到2000nm、约500到5000nm、约1000到5000nm或约3000到5000nm的平均距离在固体支持物上彼此间隔开。在一些优选的实施例中，捕获核酸被配置成将分析物偶联到固体支持物上，使得任何相邻偶联的分析物(例如，呈核酸-分析物嵌合体形式的分析物)以范围为约50到500nm的平均距离在固体支持物上彼此间隔开。

在一些实施例中，任何相邻偶联的捕获核酸在固体支持物(例如，多孔支持物)的表面上或体积内以约50nm到约500nm、或约50nm到约400nm、或约50nm到约300nm、或约50nm到约200nm、或约50nm到约100nm的距离彼此间隔开。在一些实施例中，任何相邻偶联的分析物(例如，呈核酸-分析物嵌合体形式的分析物)在固体支持物的表面上以至少50nm、至少60nm、至少70nm、至少80nm、至少90nm、至少100nm、至少150nm、至少200nm、至少250nm、至少300nm、至少350nm、至少400nm、至少450nm或至少500nm的平均距离彼此间隔开。在一些实施例中，任何相邻偶联的分析物(例如，呈核酸-分析物嵌合体形式的分析物)在固体支持物的表面上以至少50nm的平均距离彼此间隔开。

在一些实施例中，试剂盒包括附着有捕获核酸的底物或固体支持物。固体支持物可以选自由以下组成的组：珠子、多孔珠、磁珠、顺磁珠、多孔基质、阵列、表面、玻璃表面、硅表面、塑料表面、载玻片、过滤器、尼龙、芯片、硅晶片芯片、流通芯片、包含信号转导电子器件的生物芯片、孔、微量滴定孔、板、ELISA板、盘、旋转干涉盘、膜、PTFE膜、硝酸纤维素膜、基于硝酸纤维素的聚合物表面、纳米颗粒(例如，包括金属，如磁性纳米颗粒(Fe₃O₄)、金纳米颗粒和/或银纳米颗粒)、量子点、纳米壳、纳米笼、微球或其任何组合。在一些实施例中，试剂盒包括多个底物。在一些情况下，固体支持物的表面包括反应性偶联部分。在一些实施例中，捕获核酸包括反应性偶联部分。

在一些实施例中，试剂盒和制品进一步包括多个条形码。条形码可以包含隔室条形码、分区条形码、样品条形码、级分条形码或其任何组合。在一些情况下，条形码包括唯一分子标识符(UMI)。在一些实例中，条形码包括DNA分子、具有伪互补碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、非核酸可测序聚合物，例如，多糖、多肽、肽或聚酰胺，或其组合。

在一些实施例中，试剂盒中的条形码附着于诱饵核酸和/或附着于捕获核酸。在一些实施例中，试剂盒中的条形码附着至附着于固体支持物(例如，珠子)的捕获核酸。在一些情况下，条形码被配置成附着到诱饵核酸或捕获核酸。在某些实施例中，每个核酸种类群体在单独的容器中。例如，条形码被提供在单独的容器中，其中每个容器保持多个相同的条形码。条形码还可以以任何合适的材料或结构提供有隔室，使得各种条形码在空间上彼此分离。例如，微孔板用于提供96个条形码，每个孔含有多个相同的条形码。可以使用用于提供条形码的任何合适的容器，包含但不限于具有6个、24个、96个、384个、1536个、3456个或9600个孔的微孔板。在一些实施例中，试剂盒和制品进一步包括多个UMI(例如，包括UMI的多核苷酸)。

在一些实施例中，试剂盒和制品进一步包括偶联试剂。例如，偶联试剂可以是酶或化学偶联试剂。所述试剂可用于将诱饵核酸附着至捕获核酸、将诱饵核酸附着至固体支持物、将分析物附着至诱饵核酸和/或附着任何两种或更多种核酸组分。试剂盒可以进一步包括活化偶联试剂所需的任何相关组分。在一些具体的实施例中，试剂盒进一步包括连接酶。

在一些实施例中，该试剂盒进一步包括用于处理分析物的试剂。可以进行分析物的分级、富集和扣除方法的任何组合。例如，试剂可用于片段化或消化分析物。在一些情况下，试剂盒包括对分析物进行分级、分离、扣除、富集的试剂和组分。在一些实例中，试剂盒进一步包括蛋白酶，如胰蛋白酶、LysN或LysC。

在一些实施例中，试剂盒还包括发生任何期望反应所必需的一种或多种缓冲液或反应流体。包含洗涤缓冲液、反应缓冲液和结合缓冲液、洗脱缓冲液等的缓冲液是本领域技术人员或普通技术人员已知的。在一些实施例中，试剂盒进一步包含缓冲液和其它组分以伴随本文所述的其它试剂。试剂、缓冲液和其它组分可以在小瓶(如密封小瓶)、器皿、安瓿、瓶子、广口瓶、软包装(例如，密封聚酯薄膜或塑料袋)等中提供。试剂盒的任何组分都可以被消毒和/或密封。

在一些实施例中，试剂盒包含用于核酸序列分析的一种或多种试剂。在一些实例中，用于序列分析的试剂用于合成测序、连接测序、杂交测序、polony测序、离子半导体测序、焦磷酸测序、单分子实时测序、基于纳米孔的测序或使用先进的显微镜对DNA进行直接成像，或其任何组合。

在一些实施例中，试剂盒或制品可以进一步包括关于本文所述方法和用途的说明书。在一些实施例中，说明书涉及制备和处理多肽的方法。本文所述的试剂盒还可以包含从商业和用户的角度来看令人期望的其它材料，包含其它缓冲剂、稀释剂、过滤器、注射器和具有本文所述的任何方法的执行说明的包装插页。

任何上述试剂盒组分，以及任何分子、分子复合物或缀合物、试剂(例如，化学或生物试剂)、药剂、结构(例如，支持物、表面、颗粒或珠子)、反应中间体、反应产物、结合复合物或在示例性试剂盒和方法中公开和/或使用的任何其它制品可以单独提供或以任何合适的组合提供以形成试剂盒。

IV.示例性实施例

所提供的实施例包括：

1.一种用于处理分析物的方法，所述方法包括：

将分析物附着到诱饵核酸上以生成核酸-分析物嵌合体；

通过使所述核酸-分析物嵌合体中的所述诱饵核酸与附着在固体支持物上的捕获核酸杂交，使所述核酸-分析物嵌合体接近所述固体支持物；以及

将所述核酸-分析物嵌合体共价偶联到所述固体支持物上；

其中多个所述核酸-分析物嵌合体偶联在所述固体支持物上，并且任何相邻偶联的核酸-分析物嵌合体以约50nm或更大的平均距离彼此间隔开。

2.根据实施例1所述的方法，其中将所述分析物附着到所述诱饵核酸的3'端。

3.根据实施例1所述的方法，其中将所述分析物附着到所述诱饵核酸的5'端。

4.根据实施例1所述的方法，其中将所述分析物附着到所述诱饵核酸的内部位置。

5.根据实施例1到4中任一项所述的方法，其中任何相邻偶联的核酸-分析物嵌合体以约≥60nm、≥70nm、≥80nm、≥90nm、≥100nm、≥200nm、≥300nm、≥400nm、≥500nm或≥1000nm的平均距离间隔开。

6.根据实施例1到4中任一项所述的方法，其中任何相邻偶联的核酸-分析物嵌合体以范围为约50到100nm、约50到250nm、约50到500nm、约50到750nm、约50到1000nm、约50到1500nm、约50到2000nm、约100到250nm、约100到500nm、约200到500nm、约300到500nm、约100到1000nm、约500到600nm、约500到700nm、约500到800nm、约500到900nm、约500到1000nm、约500到2000nm、约500到5000nm、约1000到5000nm或约3000到5000nm的平均距离间隔开。

7.根据实施例1到4中任一项所述的方法，其中任何相邻偶联的核酸-分析物嵌合体以范围为约50到500nm的平均距离间隔开。

8.根据实施例1到7中任一项所述的方法，其中所述捕获核酸、所述核酸-分析物嵌合体和/或所述诱饵核酸进一步包括条形码。

9.根据实施例1到8中任一项所述的方法，其进一步包括将条形码附着到所述偶联的核酸-分析物嵌合体。

10.根据实施例8或实施例9所述的方法，其中所述条形码包括隔室条形码、分区条形码、样品条形码、级分条形码或其任何组合。

11.根据实施例8到10中任一项所述的方法，其中所述条形码包括唯一分子标识符(UMI)。

12.根据实施例1到11中任一项所述的方法，其中所述捕获核酸、所述核酸-分析物嵌合体、所述诱饵核酸和/或所述偶联的核酸-分析物嵌合体进一步包括唯一分子标识符(UMI)。

13.根据实施例9到12中任一项所述的方法，其中所述条形码包括DNA分子、具有伪互补碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、非核酸可测序聚合物，例如，多糖、多肽、肽或聚酰胺，或其组合。

14.根据实施例1到13中任一项所述的方法，其中将所述核酸-分析物嵌合体直接或间接共价偶联至所述固体支持物。

15.根据实施例1到14中任一项所述的方法，其中将所述诱饵核酸与所述捕获核酸共价偶联。

16.根据实施例15所述的方法，其中使用连接试剂进行所述共价偶联。

17.根据实施例15或实施例16所述的方法，其中将所述诱饵核酸的5'端与所述捕获核酸的3'端偶联。

18.根据实施例15或实施例16所述的方法，其中将所述诱饵核酸的3'端与所述捕获核酸的5'端偶联。

19.根据实施例1到18中任一项所述的方法，其中所述捕获核酸包括核酸发夹。

20.根据实施例1到19中任一项所述的方法，其中所述捕获核酸包括夹板核酸。

21.根据实施例20所述的方法，其中所述夹板核酸包括与所述捕获核酸和/或所述诱饵核酸互补的序列。

22.根据实施例1到21中任一项所述的方法，其中所述捕获核酸包括反应性偶联部分。

23.根据实施例22所述的方法，其中所述捕获核酸通过所述反应性偶联部分附着到所述固体支持物。

24.根据实施例22所述的方法，其中所述捕获核酸通过所述反应性偶联部分附着到所述诱饵核酸。

25.根据实施例1到24中任一项所述的方法，其中所述分析物获自生物样品。

26.根据实施例1到25中任一项所述的方法，其中所述诱饵核酸与所述捕获核酸的杂交包括8个或更多个互补碱基、16个或更多个互补碱基、24个或更多个互补碱基、34个或更多个互补碱基的杂交。

27.根据实施例1到26中任一项所述的方法，其中所述诱饵核酸与所述捕获核酸的杂交包括18个或更多个互补碱基的杂交。

28.根据实施例1到27中任一项所述的方法，其中所述分析物是多肽。

29.根据实施例28所述的方法，其中所述分析物是蛋白质或肽。

30.根据实施例29所述的方法，其中所述肽是通过使蛋白质(例如，来自生物样品的蛋白质)片段化而获得的。

31.根据实施例30所述的方法，其中通过使所述蛋白质与蛋白酶接触来进行所述片段化。

32.根据实施例31所述的方法，其中所述蛋白酶是胰蛋白酶、LysN或LysC。

33.根据实施例1到32中任一项所述的方法，其中所述分析物包括来自多个汇集的样品的分析物。

34.根据实施例1到33中任一项所述的方法，其中所述分析物和/或诱饵核酸包括反应性偶联部分。

35.根据实施例1到34中任一项所述的方法，其中使用化学连接将所述分析物附着至所述诱饵核酸。

36.根据实施例1到35中任一项所述的方法，其中将所述分析物直接或间接附着至所述诱饵核酸。

37.根据实施例1到36中任一项所述的方法，其中在将所述核酸-分析物嵌合体偶联至所述固体支持物之后：

所述诱饵核酸的5'端可用于反应；

所述捕获核酸的5'端可用于反应；

所述诱饵核酸的3'端可用于反应；和/或

所述捕获核酸的3'端可用于反应。

38.根据实施例37所述的方法，其中所述核酸可用于延伸反应(例如，PCR延伸反应)和/或连接反应。

39.根据实施例1到38中任一项所述的方法，其中所述诱饵核酸和/或捕获核酸进一步包括间隔子聚合物。

40.根据实施例39所述的方法，其中所述间隔子聚合物包括至少1个核苷酸、至少2个核苷酸、至少3个核苷酸、至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少15个核苷酸或至少20个或更多个核苷酸。

41.根据实施例39和实施例40所述的方法，其中所述间隔子聚合物包括DNA分子、具有伪互补碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、非核酸可测序聚合物，例如，多糖、多肽、肽或聚酰胺，或其组合。

42.根据实施例39到41中任一项所述的方法，其中所述诱饵核酸在其5'末端和/或3'末端包括所述间隔子聚合物。

43.根据实施例39到41中任一项所述的方法，其中所述捕获核酸在其5'末端和/或3'末端包括所述间隔子聚合物。

44.根据实施例1到43中任一项所述的方法，其中所述诱饵核酸和/或捕获核酸进一步包括通用引发位点。

45.根据实施例44所述的方法，其中所述通用引发位点包括用于扩增、测序或两者的引发位点。

46.根据实施例1到45中任一项所述的方法，其中所述捕获核酸包括用于测序的衔接子核酸序列。

47.根据实施例46所述的方法，其中所述衔接子核酸序列与Illumina测序平台或Pacific Biosciences of California测序平台一起使用。

48.根据实施例1到47中任一项所述的方法，其中所述固体支持物是珠子、多孔珠、多孔基质、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、PTFE膜、尼龙、硅晶片芯片、流通芯片、包含信号转导电子器件的生物芯片、微量滴定孔、ELISA板、旋转干涉盘、硝酸纤维素膜、基于硝酸纤维素的聚合物表面、纳米颗粒或微球。

49.根据实施例48所述的方法，其中所述固体支持物包括聚苯乙烯珠、聚丙烯酸酯珠、聚合物珠、琼脂糖珠、纤维素珠、葡聚糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁珠、玻璃珠、受控孔珠、基于二氧化硅的珠子或其任何组合。

50.根据实施例1到49中任一项所述的方法，其进一步包括：

使所述分析物与能够结合所述分析物的结合剂接触，其中所述结合剂包括带有关于所述结合剂的标识信息的编码标签；以及

将所述编码标签的所述标识信息转移到所述诱饵核酸或捕获核酸。

51.根据实施例50所述的方法，其进一步包括重复以下步骤一次或多次：

使所述分析物与能够结合所述分析物的额外的结合剂接触，其中所述额外的结合剂包括带有关于所述额外的结合剂的标识信息的编码标签；以及

将关于所述额外的结合剂的所述编码标签的所述标识信息转移到所述诱饵核酸或捕获核酸。

52.根据实施例50或实施例51所述的方法，其中将所述编码标签的所述标识信息转移至所述诱饵核酸或捕获核酸是由DNA连接酶介导的。

53.根据实施例50或实施例51所述的方法，其中将所述编码标签的所述标识信息转移至所述诱饵核酸或捕获核酸是由DNA聚合酶介导的。

54.根据实施例50或实施例51所述的方法，其中将所述编码标签的所述标识信息转移至所述诱饵核酸或捕获核酸是由化学连接介导的。

55.根据实施例50到54中任一项所述的方法，其中所述编码标签进一步包括间隔子、结合循环特异性序列、唯一分子标识符、通用引发位点或其任何组合。

56.一种通过以下步骤生成的核酸-分析物缀合物：

将分析物附着到诱饵核酸上以生成核酸-分析物嵌合体；

将所述核酸-分析物嵌合体共价偶联到所述固体支持物上；

其中多个核酸-分析物嵌合体偶联在所述固体支持物上，并且任何相邻偶联的核酸-分析物嵌合体以约50nm或更大的平均距离间隔开。

57.根据实施例56所述的核酸-分析物缀合物，其中所述分析物附着到所述诱饵核酸的3'端。

58.根据实施例56所述的核酸-分析物缀合物，其中所述分析物附着到所述诱饵核酸的5'端。

59.根据实施例56所述的核酸-分析物缀合物，其中所述分析物附着到所述诱饵核酸的内部位置。

60.根据实施例56到59中任一项所述的核酸-分析物缀合物，其中任何相邻偶联的核酸-分析物嵌合体以约≥60nm、≥70nm、≥80nm、≥90nm、≥100nm、≥200nm、≥300nm、≥400nm、≥500nm或≥1000nm的平均距离间隔开。

61.根据实施例56到60中任一项所述的核酸-分析物缀合物，其中任何相邻偶联的核酸-分析物嵌合体以范围为约50到100nm、约50到250nm、约50到500nm、约50到750nm、约50到1000nm、约50到1500nm、约50到2000nm、约100到250nm、约100到500nm、约200到500nm、约300到500nm、约100到1000nm、约500到600nm、约500到700nm、约500到800nm、约500到900nm、约500到1000nm、约500到2000nm、约500到5000nm、约1000到5000nm或约3000到5000nm的平均距离间隔开。

62.根据实施例56到61中任一项所述的核酸-分析物缀合物，其中任何相邻偶联的核酸-分析物嵌合体以范围为约50到500nm的平均距离间隔开。

63.根据实施例56到62中任一项所述的核酸-分析物缀合物，其中所述捕获核酸、所述核酸-分析物嵌合体和/或所述诱饵核酸进一步包括条形码。

64.根据实施例56到63中任一项所述的核酸-分析物缀合物，其中所述偶联的核酸-分析物嵌合体进一步包括条形码。

65.根据实施例64所述的核酸-分析物缀合物，其中所述条形码包括隔室条形码、分区条形码、样品条形码、级分条形码或其任何组合。

66.根据实施例62到64中任一项所述的核酸-分析物缀合物，其中所述条形码包括唯一分子标识符(UMI)。

67.根据实施例56到66中任一项所述的核酸-分析物缀合物，其中所述捕获核酸、所述核酸-分析物嵌合体、所述诱饵核酸和/或所述偶联的核酸-分析物嵌合体进一步包括唯一分子标识符(UMI)。

68.根据实施例64到67中任一项所述的核酸-分析物缀合物，其中所述条形码包括DNA分子、具有伪互补碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、非核酸可测序聚合物，例如，多糖、多肽、肽或聚酰胺，或其组合。

69.根据实施例56到68中任一项所述的核酸-分析物缀合物，其中所述核酸-分析物嵌合体直接或间接共价偶联至所述固体支持物。

70.根据实施例56到69中任一项所述的核酸-分析物缀合物，其中所述诱饵核酸与所述捕获核酸共价偶联。

71.根据实施例70所述的核酸-分析物缀合物，其中使用连接试剂进行所述共价偶联。

72.根据实施例70或实施例71所述的核酸-分析物缀合物，其中所述诱饵核酸的5'端与所述捕获核酸的3'端偶联。

73.根据实施例70或实施例71所述的核酸-分析物缀合物，其中所述诱饵核酸的3'端与所述捕获核酸的5'端偶联。

74.根据实施例56到73中任一项所述的核酸-分析物缀合物，其中所述捕获核酸包括核酸发夹。

75.根据实施例56到74中任一项所述的核酸-分析物缀合物，其中所述捕获核酸包括夹板核酸。

76.根据实施例75所述的核酸-分析物缀合物，其中所述夹板核酸包括与所述捕获核酸和/或所述诱饵核酸互补的序列。

77.根据实施例56到76中任一项所述的核酸-分析物缀合物，其中所述捕获核酸包括反应性偶联部分。

78.根据实施例77所述的核酸-分析物缀合物，其中所述捕获核酸通过所述反应性偶联部分附着到所述固体支持物。

79.根据实施例77所述的核酸-分析物缀合物，其中所述捕获核酸通过所述反应性偶联部分附着到所述诱饵核酸。

80.根据实施例56到79中任一项所述的核酸-分析物缀合物，其中所述分析物获自生物样品。

81.根据实施例56到80中任一项所述的核酸-分析物缀合物，其中所述诱饵核酸与所述捕获核酸的杂交包括8个或更多个互补碱基、16个或更多个互补碱基、24个或更多个互补碱基、34个或更多个互补碱基的杂交。

82.根据实施例56到80中任一项所述的核酸-分析物缀合物，其中所述诱饵核酸与所述捕获核酸的杂交包括16个或更多个互补碱基的杂交。

83.根据实施例56到82中任一项所述的核酸-分析物缀合物，其中所述分析物是多肽。

84.根据实施例82所述的核酸-分析物缀合物，其中所述分析物是蛋白质或肽。

85.根据实施例84所述的核酸-分析物缀合物，其中所述肽是通过使蛋白质(例如，来自生物样品的蛋白质)片段化而获得的。

86.根据实施例85所述的核酸-分析物缀合物，其中通过使所述蛋白质与蛋白酶接触来进行所述片段化。

87.根据实施例86所述的核酸-分析物缀合物，其中所述蛋白酶是胰蛋白酶、LysN或LysC。

88.根据实施例56到87中任一项所述的核酸-分析物缀合物，其中所述分析物包括来自多个汇集的样品的分析物。

89.根据实施例56到88中任一项所述的核酸-分析物缀合物，其中所述分析物和/或诱饵核酸包括反应性偶联部分。

90.根据实施例56到89中任一项所述的核酸-分析物缀合物，其中使用化学连接将所述分析物附着至所述诱饵核酸。

91.根据实施例56到90中任一项所述的核酸-分析物缀合物，其中将所述分析物直接或间接附着至所述诱饵核酸。

92.根据实施例56到91中任一项所述的核酸-分析物缀合物，其中在将所述核酸-分析物嵌合体偶联至所述固体支持物之后：

所述诱饵核酸的5'端可用于反应；

所述捕获核酸的5'端可用于反应；

所述诱饵核酸的3'端可用于反应；和/或

所述捕获核酸的3'端可用于反应

93.根据实施例92所述的核酸-分析物缀合物，其中所述核酸可用于延伸反应(例如，PCR延伸反应)和/或连接反应。

94.根据实施例54到93中任一项所述的核酸-分析物缀合物，其中所述诱饵核酸和/或捕获核酸进一步包括间隔子聚合物。

95.根据实施例94所述的核酸-分析物缀合物，其中所述间隔子聚合物包括至少1个核苷酸、至少2个核苷酸、至少3个核苷酸、至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少15个核苷酸或至少20个或更多个核苷酸。

96.根据实施例94或实施例95所述的核酸-分析物缀合物，其中所述间隔子聚合物包括DNA分子、具有伪互补碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、非核酸可测序聚合物，例如，多糖、多肽、肽或聚酰胺，或其组合。

97.根据实施例94到96中任一项所述的核酸-分析物缀合物，其中所述诱饵核酸在其5'末端和/或3'末端包括所述间隔子聚合物。

98.根据实施例94到96中任一项所述的核酸-分析物缀合物，其中所述捕获核酸在其5'末端和/或3'末端包括所述间隔子聚合物。

99.根据实施例56到98中任一项所述的核酸-分析物缀合物，其中所述诱饵核酸和/或捕获核酸进一步包括通用引发位点。

100.根据实施例99所述的核酸-分析物缀合物，其中所述通用引发位点包括用于扩增、测序或两者的引发位点。

101.根据实施例56到100中任一项所述的核酸-分析物缀合物，其中所述捕获核酸包括用于测序的衔接子核酸序列。

102.根据实施例101所述的核酸-分析物缀合物，其中所述衔接子核酸序列与Illumina测序平台或Pacific Biosciences of California测序平台一起使用。

103.根据实施例56到102中任一项所述的核酸-分析物缀合物，其中所述固体支持物是珠子、多孔珠、多孔基质、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、PTFE膜、尼龙、硅晶片芯片、流通芯片、包含信号转导电子器件的生物芯片、微量滴定孔、ELISA板、旋转干涉盘、硝酸纤维素膜、基于硝酸纤维素的聚合物表面、纳米颗粒或微球。

104.根据实施例103所述的核酸-分析物缀合物，其中所述固体支持物包括聚苯乙烯珠、聚丙烯酸酯珠、聚合物珠、琼脂糖珠、纤维素珠、葡聚糖珠、丙烯酰胺珠、实心珠、多孔珠、顺磁珠、玻璃珠、受控孔珠、基于二氧化硅的珠子或其任何组合。

105.一种试剂盒，其包括：

(a)多个诱饵核酸，所述诱饵核酸中的每一个被配置成附着于分析物；

(b)包括多个附着的捕获核酸的固体支持物，所述捕获核酸中的每一个包括与对应的诱饵核酸互补的序列，其中任何相邻附着的捕获核酸以约50nm或更大的平均距离在所述固体支持物上间隔开。

106.根据实施例105所述的试剂盒，其中所述诱饵核酸中的至少一个被配置成允许所述分析物附着到所述诱饵核酸的3'端。

107.根据实施例105所述的试剂盒，其中所述诱饵核酸中的至少一个被配置成允许所述分析物附着到所述诱饵核酸的5'端。

108.根据实施例105所述的试剂盒，其中所述诱饵核酸中的至少一个被配置成允许所述分析物附着到所述诱饵核酸的内部位置。

109.根据实施例105到108中任一项所述的试剂盒，其中任何相邻附着的捕获核酸被配置成将所述分析物偶联到所述固体支持物，在所述固体支持物上以约≥60nm、≥70nm、≥80nm、≥90nm、≥100nm、≥200nm、≥300nm、≥400nm、≥500nm或≥1000nm的平均距离间隔开。

110.根据实施例105到109中任一项所述的试剂盒，其中任何相邻附着的捕获核酸被配置成将所述分析物偶联到所述固体支持物，在所述固体支持物上以范围为约50到100nm、约50到250nm、约50到500nm、约50到750nm、约50到1000nm、约50到1500nm、约50到2000nm、约100到250nm、约100到500nm、约200到500nm、约300到500nm、约100到1000nm、约500到600nm、约500到700nm、约500到800nm、约500到900nm、约500到1000nm、约500到2000nm、约500到5000nm、约1000到5000nm或约3000到5000nm的平均距离间隔开。

111.根据实施例105到109中任一项所述的试剂盒，其中任何相邻附着的捕获核酸被配置成将所述分析物偶联到所述固体支持物，在所述固体支持物上以范围为约50到500nm的平均距离间隔开。

112.根据实施例105到111中任一项所述的试剂盒，其进一步包括多个条形码。

113.根据实施例112所述的试剂盒，其中所述条形码附着到所述诱饵核酸或所述捕获核酸，或

所述条形码被配置成附着到所述诱饵核酸或所述捕获核酸。

114.根据实施例112或实施例113所述的试剂盒，其中所述条形码包括隔室条形码、分区条形码、样品条形码、级分条形码或其任何组合。

115.根据实施例112到114中任一项所述的试剂盒，其中所述条形码包括唯一分子标识符(UMI)。

116.根据实施例105到115中任一项所述的试剂盒，其中所述捕获核酸中的至少一个和/或所述诱饵核酸中的至少一个进一步包括唯一分子标识符(UMI)。

117.根据实施例109到116中任一项所述的试剂盒，其中所述条形码包括DNA分子、具有伪互补碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、非核酸可测序聚合物，例如，多糖、多肽、肽或聚酰胺，或其组合。

118.根据实施例105到117中任一项所述的试剂盒，其中所述诱饵核酸中的至少一个包括反应性偶联部分。

119.根据实施例105到118中任一项所述的试剂盒，其中所述固体支持物的所述表面包括反应性偶联部分。

120.根据实施例105到119中任一项所述的试剂盒，其中所述捕获核酸中的至少一个包括反应性偶联部分。

121.根据实施例118到120中任一项所述的试剂盒，其中所述反应性偶联部分被配置成通过施加光能、化学试剂或酶试剂而被活化。

122.根据实施例121所述的试剂盒，其中所述酶试剂是连接酶。

123.根据实施例105到122中任一项所述的试剂盒，其进一步包括偶联试剂。

124.根据实施例123所述的试剂盒，其中所述偶联试剂是酶偶联试剂或化学偶联试剂。

125.根据实施例124所述的试剂盒，其中所述酶偶联试剂是连接酶。

126.根据实施例105到125中任一项所述的试剂盒，其进一步包括蛋白酶。

127.根据实施例126所述的试剂盒，其中所述蛋白酶是胰蛋白酶、LysN或LysC。

128.根据实施例105到127中任一项所述的试剂盒，其中所述捕获核酸中的至少一个包括核酸发夹。

129.根据实施例105到128中任一项所述的试剂盒，其中所述捕获核酸包括夹板核酸。

130.根据实施例129所述的试剂盒，其中所述夹板核酸包括与所述捕获核酸和/或所述诱饵核酸互补的序列。

131.根据实施例105到130中任一项所述的试剂盒，其中所述诱饵核酸中的至少一个与所述捕获核酸中的至少一个的互补序列包括8个或更多个互补碱基、16个或更多个互补碱基、24个或更多个互补碱基、34个或更多个互补碱基的杂交。

132.根据实施例105到130中任一项所述的试剂盒，其中所述诱饵核酸中的至少一个与所述捕获核酸中的至少一个的互补序列包括16个或更多个互补碱基。

133.根据实施例105到132中任一项所述的试剂盒，其进一步包括化学连接试剂。

134.根据实施例105到133中任一项所述的试剂盒，其中所述诱饵核酸中的至少一个和/或所述捕获核酸中的至少一个进一步包括间隔子聚合物。

135.根据实施例134所述的试剂盒，其中所述间隔子聚合物包括DNA分子、具有伪互补碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、非核酸可测序聚合物，例如，多糖、多肽、肽或聚酰胺，或其组合。

136.根据实施例105到135中任一项所述的试剂盒，其中所述诱饵核酸中的至少一个和/或所述捕获核酸中的至少一个进一步包括通用引发位点。

137.根据实施例136所述的试剂盒，其中所述通用引发位点包括用于扩增、测序或两者的引发位点。

138.根据实施例105到137中任一项所述的试剂盒，其中所述捕获核酸包括用于测序的衔接子核酸序列。

139.根据实施例138所述的试剂盒，其中所述衔接子核酸序列与Illumina测序平台或Pacific Biosciences测序平台一起使用。

140.根据实施例134到139中任一项所述的试剂盒，其中所述诱饵核酸中的至少一个在其5'末端和/或3'末端包括所述间隔子聚合物。

141.根据实施例134到140中任一项所述的试剂盒，其中所述捕获核酸中的至少一个在其5'末端和/或3'末端包括所述间隔子聚合物。

142.根据实施例105到141中任一项所述的试剂盒，其中所述固体支持物是珠子、多孔珠、多孔基质、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、PTFE膜、尼龙、硅晶片芯片、流通芯片、包含信号转导电子器件的生物芯片、微量滴定孔、ELISA板、旋转干涉盘、硝酸纤维素膜、基于硝酸纤维素的聚合物表面、纳米颗粒或微球。

V.实例

提供以下实例以说明而非限制本文所提供的方法、组合物和用途。

实例1：使用核酸杂交和偶联至固体支持物来评估分析物的固定

本实例描述了用于将核酸-肽分析物嵌合体偶联到固体支持物和使用固定分析物评估编码测定的示例性方法。

在基于杂交的固定方法中，将核酸-肽嵌合体杂交并连接到化学固定在磁珠上的发夹捕获DNA。使用基于反式环辛烯(TCO)和甲基四嗪(mTet)的点击化学将捕获核酸缀合到珠子上。将经TCO修饰的短发夹捕获核酸(16个碱基对茎、5个碱基环、24个碱基5'突出端)与mTet包被的磁珠反应。将磷酸化的核酸-肽嵌合体(10nM)在5x SSC、0.02％SDS中退火至附着在珠子上的发夹DNA，并在37℃下孵育30分钟。将珠子用PBST洗涤一次，并用T4DNA连接酶重新悬浮在1x快速连接溶液(新英格兰生物实验室，美国)中。在25℃下孵育30分钟后，将珠子用PBST洗涤两次并重新悬浮在50μL的PBST中。将包含氨基FA末端肽(FAGVAMPGAEDDVVGSGSK；SEQ ID NO:3)、氨基AFA末端肽(AFAGVAMPGAEDDVVGSGSK；SEQ IDNO:4)和氨基AA末端肽(AAGVAMPGAEDDVVGSGSK；SEQ ID NO:5)的总固定化核酸-肽嵌合体使用特定引物组通过qPCR进行量化。为了进行比较，使用不涉及连接步骤的基于非杂交的方法将肽固定到珠子上。通过将30μM经TCO修饰的DNA标记肽(包含氨基FA末端肽、氨基AFA末端肽和氨基AA末端肽)与mTet包被的磁珠在25℃下一起孵育过夜来进行所述基于非杂交的方法。

如表1所示，在具有1:100,000接枝密度的非杂交制备方法和具有1:10,000接枝密度的基于杂交的制备方法中观察到相似的Ct值。与非杂交制备方法相比，基于杂交的制备方法的DNA标记肽的负载量为1/3000。一般而言，观察到基于杂交的固定方法需要较少的起始材料。

此外，使用ProteoCode测定法将如上所述制备和固定的肽用于肽测序。如上述两种方法(杂交和非杂交)所述，将肽固定在底物上。在该测定中测试的示例性肽包含氨基FA末端肽(FAGVAMPGAEDDVVGSGSK；SEQ ID NO:3)、氨基AFA末端肽(AFAGVAMPGAEDDVVGSGSK；SEQ ID NO:4)和氨基AA末端肽(AAGVAMPGAEDDVVGSGSK；SEQ ID NO:5)。未附着肽的寡核苷酸也作为对照进行了测试。

当苯丙氨酸为N端氨基酸残基时结合苯丙氨酸的示例性结合剂与编码标签(F-结合剂)缀合。对于该测定，将与编码标签缀合的F-结合剂与固定有核酸-肽嵌合体的珠子一起在37℃下孵育30分钟。PBST洗涤后，将珠子与含有50mM Tris-HCl、pH7.5、2mM MgSO₄、50mM NaCl、1mM DTT、0.1％Tween 20、0.1mg/mL BSA、0.125mM dNTP、0.125单位/μL Klenow片段(3'->5'exo-)(MCLAB，美国)的编码混合物一起在37℃下孵育5分钟。将珠子用PBST+10％甲酰胺洗涤一次，用0.1M NaOH洗涤一次，并用含有10％甲酰胺的PBST洗涤一次。将所得珠子重新悬浮在PBST中。在测试肽的N端氨基酸与F结合剂成功结合后，将编码标签的信息转移到附着在固定化肽上的核酸(扩展型记录标签)。对该测定的扩展型记录标签进行PCR扩增并通过下一代测序(NGS)进行分析。

在基于杂交和非杂交的制备方法中，在附着至氨基FA末端肽的记录标签上观察到高编码效率，这表明编码标签的信息被转移到对应于N端F结合的重新编码标签中。与使用非杂交方法制备的样品相比，在使用基于杂交的方法制备的样品中观察到对氨基FA末端肽的更高编码效率。此外，在使用基于杂交的方法制备的样品上观察到AA和AFA阴性对照肽的较低编码效率。使用基于杂交的方法制备的样品的信噪比(FA编码百分比/AA编码百分比)为34。

实例2：评估使用各种方法制备和条形编码的分析物的编码功能

本实例描述了用于将核酸-分析物缀合物偶联至固体支持物的示例性方法以及用于将条形码、UMI或其它核酸标签或组分附着至诱饵或捕获核酸的各种方法。在此实例中，用于固定肽分析物的测试格式包含选自表3的核酸序列。

执行并测试了用于安装条形码序列和固定肽的五种不同方法。在下文描述的方法中，安装了条形码序列和间隔子序列。在一些情况下，唯一分子标识符(UMI)可以被包含在诱饵或反向诱饵核酸中，或者可以与条形码一起添加。在所进行的一些示例性方法中，通用引发位点(或其一部分)被包含在诱饵核酸中或与条形码序列一起添加。在本实例中描述的方法中，基于杂交的肽固定基本上如实例1中所述进行，不同的是，在方法1、2和3中，将珠子在连接后洗涤三次(PBST、NaOH和PBST)。

在使用图3中一般描绘的方案的方法1中，将氨基FA肽(FAGVAMPGAEDDVVGSGSK；SEQID NO:3)附着至诱饵核酸(SEQ ID NO:6)。在包含1X定制缓冲液(新英格兰生物实验室，美国)、0.125mM dNTP、1μM诱饵核酸-肽嵌合体、1.5μM条形码模板(CACTCAGTCCATTAACNNNNNNNNNNCTAGTGTCGCGGACUACGCAUTACUGAGAAC UTG；SEQ ID NO:12)和0.125单位/μL Klenow片段(3'->5'exo-)(MCLAB，USA)的50μL条形编码混合物中在37℃下进行条形编码，持续5分钟。条形码模板各自含有四个dU位点。在通过延伸将条形码转移到诱饵核酸(附有肽)上后，通过在37℃下用2.5单位的USER酶(新英格兰生物实验室，美国)孵育30分钟来消化条形编码模板。将EDTA以50mM加入反应中以淬灭聚合酶。将所得带条形码的诱饵核酸(附有肽)稀释至10nM，用于基于杂交的肽固定和与捕获核酸的附着(如SEQ ID NO:8中列出的序列)。

在使用图4中一般描绘的方案的方法2中，将氨基FA肽(FAGVAMPGAEDDVVGSGSK；SEQID NO:3)附着至诱饵核酸(SEQ ID NO:6)。将诱饵核酸-肽嵌合体负载到附有捕获核酸的珠子上。珠子上的捕获核酸包含位于捕获核酸的5'端的条形码模板(CACTCAGTCCATTAACNNNNNNNNNNCTAGTGTCGCGGACUACGCATTACTGAGAAGC TTGCTAGTCGACGTGGTCCTT/iAmMC6T/TTGGACCACGTCGACTAG；SEQ ID NO:9)。条形码模板各自含有一个dU位点。使用基于杂交的固定和偶联将诱饵核酸-肽嵌合体附着至捕获核酸。使用定位在捕获核酸的5'端的条形码模板，使用珠子上的延伸进行条形编码。使用包含1X定制缓冲液(新英格兰生物实验室，美国)、0.125mM dNTP和0.125单位/μL Klenow片段(3'->5'exo-)(MCLAB，美国)的50μL条形编码混合物，并将反应在37℃下孵育5分钟。通过延伸将条形码转移到诱饵核酸上后，将珠子用PBST洗涤两次。通过在37℃下用2.5单位的USER酶(新英格兰生物实验室，美国)孵育30分钟来消化用于延伸的捕获核酸上的条形码模板。在该方法中，如果在未附有诱饵核酸-肽嵌合体的捕获核酸上发生延伸，则形成Hind III限制性位点。将包含1X定制缓冲液和2.5单位Hind III(新英格兰生物实验室，美国)的50μL限制性内切酶溶液添加到样品中，并在37℃下孵育30分钟，以消化这些带有条形码但未附有诱饵核酸-肽嵌合体的捕获核酸。如果诱饵核酸肽嵌合体附着到捕获核酸并且通过延伸到诱饵核酸上而发生条形编码，则不会形成Hind III位点。将所得珠子用PBST洗涤一次，用0.1M NaOH洗涤一次，并用PBST洗涤一次。

在使用图5中一般描绘的方案的方法3中，将氨基FA肽(FAGVAMPGAEDDVVGSGSK；SEQID NO:3)附着至诱饵核酸(SEQ ID NO:6)。使用含有与诱饵核酸的一部分和条形码的一部分互补的序列的夹板DNA，通过杂交桥接诱饵核酸和条形码。在包含1X快速连接酶缓冲液(新英格兰生物实验室，美国)、1.5μM夹板DNA(CCATTAACCTAGTGTCGC；SEQ ID NO:14)、2μM条形码(/5Phos/GTTAATGGACTGAGTG；SEQ ID NO:15)、1μM诱饵核酸标记肽和2.5单位快速连接酶(新英格兰生物实验室，美国)的50μL条形编码混合物中在25℃下进行条形编码，持续5分钟。将条形码附着到诱饵核酸-肽嵌合体的诱饵核酸上后，将50mM EDTA加入反应中以淬灭连接酶，并用NaOH洗掉夹板DNA。使用基于杂交的方法将所得带条形码的诱饵核酸-肽嵌合体稀释至10nM，并附着至捕获核酸(如SEQ ID NO:8中列出的序列)。

在使用图6中一般描绘的方案的方法4中，将氨基FA肽(FAGVAMPGAEDDVVGSGSK；SEQID NO:3)附着至诱饵核酸(反向；SEQ ID NO:7)。将诱饵核酸-肽嵌合体(10nM)与5nM条形码(/5Phos/CAAGTTCTCAGTAATGCGTAGTCCGCGACACTAGNNNNNNNNNNGTTAATGGACTGAGTG；SEQ IDNO:13)混合在包含5x SSC、0.02％SDS的50μL退火溶液中，并与固定有磷酸化捕获核酸(SEQID NO:10)的珠子一起在37℃下孵育30分钟。将珠子用PBST洗涤一次，并用T4 DNA连接酶重新悬浮在1x快速连接溶液(新英格兰生物实验室，美国)中，以将核酸-肽嵌合体和条形码连接到捕获核酸。在25℃下孵育30分钟后，将珠子用PBST洗涤两次并重新悬浮在50μl的PBST中。

在使用图7中一般描绘的方案的方法5中，将氨基FA肽(FAGVAMPGAEDDVVGSGSK；SEQID NO:3)附着至诱饵核酸(反向；SEQ ID NO:7)。在5x SSC、0.02％SDS中，将诱饵核酸-肽嵌合体(10nM)退火至磷酸化捕获核酸，所述磷酸化捕获核酸包含固定在珠子上的条形码序列(SEQ ID NO:11)，并在37℃下孵育30分钟。将珠子用PBST洗涤一次，并用T4 DNA连接酶重新悬浮在1x快速连接溶液(新英格兰生物实验室，美国)中，以将诱饵核酸-肽嵌合体附着至到捕获核酸。在25℃下孵育30分钟后，将珠子用PBST洗涤两次并重新悬浮在50μl的PBST中。

将固定化肽用于使用基本上如上所述的ProteoCode测定法进行肽测序，所述测定法使用示例性结合剂(带有附着的编码标签)，当苯丙氨酸是N端氨基酸残基时，所述结合剂结合苯丙氨酸。使用具有氨基FA末端的示例性肽(FAGVAMPGAEDDVVGSGSK；SEQ ID NO:3)。未附着肽的寡核苷酸也作为对照进行了测试。对该测定的扩展型记录标签进行PCR扩增并通过下一代测序(NGS)进行分析。如表4所示，所有用于固定肽和安装条形码的测试方法均导致编码。

实例3：评估具有功能化N端氨基酸的肽的编码

本实例描述了用于评估固定化肽的示例性编码测定，使用识别肽上的官能化(例如，经修饰的)N端氨基酸的结合剂进行。

将核酸-肽嵌合体(连接到诱饵核酸的肽)与发夹捕获DNA杂交并连接，所述发夹捕获DNA基本上如实例1中所述那样化学固定在琼脂糖珠上。对于该实验，发夹捕获DNA含有与诱饵核酸的一部分互补的杂交序列。与诱饵核酸连接后，发夹捕获DNA诱饵核酸含有用于下游测序分析的衔接子序列(通用正向引发位点)。在编码测定中测试了如SEQ ID NO:25-31所示的各种肽，每种肽与表5中指定的核酸序列相关，这些核酸序列在测定中用作记录标签(RT)。

在该示例性模型系统中，使用被配置成结合固定化肽上经修饰的N端苯丙氨酸残基(F)的同源结合剂。通过将信息从与结合剂相关的编码标签转移到与肽相关的记录标签来进行编码，从而生成扩展型记录标签。对于编码测定，将200nM的识别经修饰的NTAA的苯丙氨酸(F)示例性结合剂与用示例性化学试剂处理以修饰NTAA的肽一起在室温下孵育30分钟。用PBST缓冲液快速洗涤以去除多余的结合剂后，将混合物与0.125单位/μL Klenow片段(3'->5'exo-)(MCLAB，美国)、dNTP混合物(每个125μM)、50mM Tris-HCl(pH，7.5)、2mMMgSO₄、50mM NaCl、1mM DTT、0.1％Tween 20和0.1mg/mL BSA一起在室温下孵育5分钟。在洗涤和用包含通用反向引发位点的DNA序列(SEQ ID NO:34-45)封端后，对测定法的扩展型记录标签进行PCR扩增并通过下一代测序(NGS)进行分析。在该实验中，每个孔中的样品都用含有条形码的封端DNA进行封端，所述条形码允许在稍后的步骤中确定样品孔的身份，也允许将来自不同孔的样品汇集起来进行加工。

图10示出了使用F-结合剂对测试的肽(包含具有N端苯丙氨酸和其它N端氨基酸的肽)的编码效率。还使用了与肽无关的仅记录标签(仅RT)对照。总之，检测到编码以N端苯丙氨酸结尾的肽的F-结合剂的增加，这证明了在编码测定中使用基于杂交的肽和示例性核酸的固定。

本公开的范围不旨在限于特定的所公开实施例，所述实施例例如是为了说明本发明的各个方面而提供的。根据本文的描述和教导，对所描述的组合物和方法的各种修改将变得显而易见。可以在不脱离本公开的真实范围和精神的情况下实践此类改变，并且此类改变旨在落入本公开的范围内。鉴于以上的详细说明，可以对实施例做出这些和其它改变。总之，在以下权利要求书中，所使用的术语不应当被解释为将权利要求书限制于本说明书和权利要求书中所公开的特定实施例，而是应当被解释为包含所有可能的实施例连同此类权利要求有权获得的等效物的整个范围。相应地，权利要求书并不受本公开的限制。

序列表

<110> Encodia公司（Encodia, Inc.）

GUNDERSON, Kevin L.

MURANAKA, Norihito

WEINERT, Brian T.

CHEE, Mark S.

<120> 用于制备分析物的方法和相关试剂盒

<130> 4614-2001540

<150> US 62/840,675

<151> 2019-04-30

<160> 45

<170> PatentIn 3.5版

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P5引物

<400> 1

aatgatacgg cgaccaccga 20

<210> 2

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> P7引物

<400> 2

caagcagaag acggcatacg agat 24

<210> 3

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> FA末端肽

<400> 3

Phe Ala Gly Val Ala Met Pro Gly Ala Glu Asp Asp Val Val Gly Ser

1 5 10 15

Gly Ser Lys

<210> 4

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> AFA末端肽

<400> 4

Ala Phe Ala Gly Val Ala Met Pro Gly Ala Glu Asp Asp Val Val Gly

1 5 10 15

Ser Gly Ser Lys

20

<210> 5

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> AA末端肽

<400> 5

Ala Ala Gly Val Ala Met Pro Gly Ala Glu Asp Asp Val Val Gly Ser

1 5 10 15

Gly Ser Lys

<210> 6

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 诱饵DNA

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'磷酸化

<220>

<221> misc_feature

<222> (22)..(22)

<223> n是内部5'-辛二炔基dU

<400> 6

caagttctca gtaatgcgta gnccgcgaca ctag 34

<210> 7

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 反向诱饵DNA

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5' C3（三碳）间隔子

<220>

<221> misc_feature

<222> (7)..(7)

<223> n是内部5'-辛二炔基dU

<400> 7

ctagtgncgc ggactacg 18

<210> 8

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> 捕获DNA

<220>

<221> misc_feature

<222> (43)..(43)

<223> n是内部氨基修饰剂C6 dT

<400> 8

ggactacgca ttactgagaa cttgctagtc gacgtggtcc ttnttggacc acgtcgacta 60

g 61

<210> 9

<211> 98

<212> DNA

<213> 人工序列

<220>

<223> 捕获DNA

<220>

<221> misc_feature

<222> (17)..(26)

<223> n是a、c、g或t

<220>

<221> misc_feature

<222> (80)..(80)

<223> n是内部氨基修饰剂C6 dT

<400> 9

cactcagtcc attaacnnnn nnnnnnctag tgtcgcggac uacgcattac tgagaagctt 60

gctagtcgac gtggtccttn ttggaccacg tcgactag 98

<210> 10

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 捕获DNA

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<220>

<221> misc_feature

<222> (35)..(35)

<223> n是内部5'-氨基修饰剂C6 dT

<400> 10

cattactgag aacttgctag tcgacgtggt ccttnttgga ccacgtcgac tag 53

<210> 11

<211> 81

<212> DNA

<213> 人工序列

<220>

<223> 捕获DNA

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<220>

<221> misc_feature

<222> (19)..(19)

<223> n是内部5'-氨基修饰剂C6 dT

<220>

<221> misc_feature

<222> (56)..(65)

<223> n是a、c、g或t

<400> 11

ctagtcgacg tggtccttnt tggaccacgt cgactagcgt agtccgcgac actagnnnnn 60

nnnnngttaa tggactgagt g 81

<210> 12

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 条形码模板

<220>

<221> misc_feature

<222> (17)..(26)

<223> n是a、c、g或t

<400> 12

cactcagtcc attaacnnnn nnnnnnctag tgtcgcggac uacgcautac ugagaacutg 60

<210> 13

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 条形码

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<220>

<221> misc_feature

<222> (35)..(44)

<223> n是a、c、g或t

<400> 13

caagttctca gtaatgcgta gtccgcgaca ctagnnnnnn nnnngttaat ggactgagtg 60

<210> 14

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 夹板DNA

<400> 14

ccattaacct agtgtcgc 18

<210> 15

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 条形码模板

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<400> 15

gttaatggac tgagtg 16

<210> 16

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 捕获发夹DNA

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-(5'脱硫生物素-TEG和内部18-原子六乙二醇间隔子)

<220>

<221> misc_feature

<222> (36)..(36)

<223> n是内部5'-氨基修饰剂C6 dT

<220>

<221> misc_feature

<222> (37)..(38)

<223> 插入中间的C3（三碳）间隔子

<400> 16

agatcggaag agcgtcgtgt agggaaagag tgtttntaca ctctttccct aca 53

<210> 17

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 记录标签

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<220>

<221> misc_feature

<222> (10)..(10)

<223> n是内部5'-氨基修饰剂C6 dT

<220>

<221> misc_feature

<222> (18)..(20)

<223> n是a、c、g或t

<400> 17

cgacgctctn ccgatctnnn ccaaactgag tg 32

<210> 18

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 记录标签

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<220>

<221> misc_feature

<222> (10)..(10)

<223> n是内部氨基修饰剂C6 dT

<220>

<221> misc_feature

<222> (18)..(20)

<223> n是a、c、g或t

<400> 18

cgacgctctn ccgatctnnn actaactgag tg 32

<210> 19

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 记录标签

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<220>

<221> misc_feature

<222> (10)..(10)

<223> n是内部氨基修饰剂C6 dT

<220>

<221> misc_feature

<222> (18)..(20)

<223> n是a、c、g或t

<400> 19

cgacgctctn ccgatctnnn aagtactgag tg 32

<210> 20

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 记录标签

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<220>

<221> misc_feature

<222> (10)..(10)

<223> n是内部氨基修饰剂C6 dT

<220>

<221> misc_feature

<222> (18)..(20)

<223> n是a、c、g或t

<400> 20

cgacgctctn ccgatctnnn tatgactgag tg 32

<210> 21

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 记录标签

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<220>

<221> misc_feature

<222> (10)..(10)

<223> n是内部氨基修饰剂C6 dT

<220>

<221> misc_feature

<222> (18)..(20)

<223> n是a、c、g或t

<400> 21

cgacgctctn ccgatctnnn cataactgag tg 32

<210> 22

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 记录标签

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<220>

<221> misc_feature

<222> (10)..(10)

<223> n是内部氨基修饰剂C6 dT

<220>

<221> misc_feature

<222> (18)..(20)

<223> n是a、c、g或t

<400> 22

cgacgctctn ccgatctnnn gattactgag tg 32

<210> 23

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 记录标签

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<220>

<221> misc_feature

<222> (10)..(10)

<223> n是内部氨基修饰剂C6 dT

<220>

<221> misc_feature

<222> (18)..(20)

<223> n是a、c、g或t

<400> 23

cgacgctctn ccgatctnnn ttagactgag tg 32

<210> 24

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 记录标签

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5'-磷酸化

<220>

<221> misc_feature

<222> (10)..(10)

<223> n是内部氨基修饰剂C6 dT

<220>

<221> misc_feature

<222> (18)..(20)

<223> n是a、c、g或t

<400> 24

cgacgctctn ccgatctnnn gtaaactgag tg 32

<210> 25

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (21)..(21)

<223> C端酰胺

<220>

<221> MISC_FEATURE

<222> (21)..(21)

<223> 赖氨酸侧链上的叠氮基取代基

<400> 25

Leu Ala Gly Glu Leu Ala Gly Glu Leu Ala Gly Glu Ile Arg Gly Asp

1 5 10 15

Val Arg Gly Gly Lys

20

<210> 26

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (19)..(19)

<223> C端酰胺

<220>

<221> MISC_FEATURE

<222> (19)..(19)

<223> 赖氨酸侧链上的叠氮基取代基

<400> 26

Phe Ala Gly Val Ala Met Pro Gly Ala Glu Asp Asp Val Val Gly Ser

1 5 10 15

Gly Ser Lys

<210> 27

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (13)..(13)

<223> 赖氨酸侧链上的叠氮基取代基

<400> 27

Phe Leu Ala Glu Ile Arg Gly Asp Val Arg Gly Gly Lys

1 5 10

<210> 28

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (12)..(12)

<223> C端酰胺

<220>

<221> MISC_FEATURE

<222> (12)..(12)

<223> 赖氨酸侧链上的叠氮基取代基

<400> 28

Ser Gly Val Ala Arg Gly Asp Val Arg Gly Gly Lys

1 5 10

<210> 29

<211> 28

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (1)..(1)

<223> N端二甲基

<220>

<221> MISC_FEATURE

<222> (28)..(28)

<223> 赖氨酸侧链上的叠氮基取代基

<400> 29

Ala Glu Ser Ala Glu Ser Ala Ser Arg Phe Ser Gly Val Ala Met Pro

1 5 10 15

Gly Ala Glu Asp Asp Val Val Gly Ser Gly Ser Lys

20 25

<210> 30

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (13)..(13)

<223> C端酰胺

<220>

<221> MISC_FEATURE

<222> (13)..(13)

<223> 赖氨酸侧链上的叠氮基取代基

<400> 30

Phe Ser Gly Val Ala Arg Gly Asp Val Arg Gly Gly Lys

1 5 10

<210> 31

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> 测定肽

<220>

<221> MISC_FEATURE

<222> (18)..(18)

<223> C端酰胺

<220>

<221> MISC_FEATURE

<222> (18)..(18)

<223> 赖氨酸侧链上的叠氮基取代基

<400> 31

Leu Ala Glu Ser Ala Phe Ser Gly Val Ala Arg Gly Asp Val Arg Gly

1 5 10 15

Gly Lys

<210> 32

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 正向引发位点

<400> 32

acactctttc cctacacgac gctcttccga tct 33

<210> 33

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 反向引发位点

<400> 33

gactggagtt cagacgtgtg ctcttccgat ct 32

<210> 34

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> 3'-C3（三碳）间隔子

<400> 34

gactggagtt cagacgtgtg ctcttccgat ctttctactc ttctcactca gt 52

<210> 35

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> 3'-C3（三碳）间隔子

<400> 35

gactggagtt cagacgtgtg ctcttccgat cttcttactc ttctcactca gt 52

<210> 36

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> 3'-C3（三碳）间隔子

<400> 36

gactggagtt cagacgtgtg ctcttccgat cttggtactc ttctcactca gt 52

<210> 37

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> 3'-C3（三碳）间隔子

<400> 37

gactggagtt cagacgtgtg ctcttccgat cttaatactc ttctcactca gt 52

<210> 38

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> 3'-C3（三碳）间隔子

<400> 38

gactggagtt cagacgtgtg ctcttccgat ctctttactc ttctcactca gt 52

<210> 39

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> 3'-C3（三碳）间隔子

<400> 39

gactggagtt cagacgtgtg ctcttccgat ctccgtactc ttctcactca gt 52

<210> 40

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> 3'-C3（三碳）间隔子

<400> 40

gactggagtt cagacgtgtg ctcttccgat ctcgctactc ttctcactca gt 52

<210> 41

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> 3'-C3（三碳）间隔子

<400> 41

gactggagtt cagacgtgtg ctcttccgat ctgtgtactc ttctcactca gt 52

<210> 42

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> 3'-C3（三碳）间隔子

<400> 42

gactggagtt cagacgtgtg ctcttccgat ctgcctactc ttctcactca gt 52

<210> 43

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> C'-C3（三碳）间隔子

<400> 43

gactggagtt cagacgtgtg ctcttccgat ctggttactc ttctcactca gt 52

<210> 44

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> 封端DNA

<400> 44

gactggagtt cagacgtgtg ctcttccgat ctatatactc ttctcactca gt 52

<210> 45

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 封端DNA

<220>

<221> misc_feature

<222> (52)..(52)

<223> 3'-C3（三碳）间隔子

<400> 45

gactggagtt cagacgtgtg ctcttccgat ctaattactc ttctcactca gt 52

Claims

1.一种用于处理多肽分析物的方法，所述方法包括：

将所述多肽分析物附着到诱饵核酸上以生成核酸-分析物嵌合体，其中诱饵核酸与多肽分析物共价连接以产生核酸-分析物嵌合体；

将所述核酸-分析物嵌合体共价偶联到所述固体支持物上；

其中多个所述核酸-分析物嵌合体偶联在所述固体支持物上，并且偶联在所述固体支持物上的相邻的核酸-分析物嵌合体以50 nm或更大的平均距离彼此间隔开；

使共价偶联在所述固体支持物上的所述多肽分析物与能够结合所述多肽分析物的结合剂接触，其中所述结合剂包括带有关于所述结合剂的标识信息的编码标签；以及

将来自所述编码标签的关于所述结合剂的标识信息转移到附着有所述多肽分析物的所述诱饵核酸或捕获核酸。

2.根据权利要求1所述的方法，其中将所述多肽分析物附着到所述诱饵核酸的3'端。

3.根据权利要求1所述的方法，其中将所述多肽分析物附着到所述诱饵核酸的内部位置。

4. 根据权利要求1所述的方法，其中偶联在所述固体支持物上的相邻的核酸-分析物嵌合体以大于100 nm的平均距离间隔开。

5.根据权利要求1所述的方法，其进一步包括将条形码附着到所述偶联的核酸-分析物嵌合体，其中所述条形码包括隔室条形码、分区条形码、样品条形码、级分条形码或其任何组合。

6.根据权利要求5所述的方法，其中所述条形码包括唯一分子标识符（UMI）。

7. 根据权利要求1所述的方法，其中将所述诱饵核酸与所述捕获核酸共价偶联，并使用 DNA 连接酶进行共价偶联。

8.根据权利要求1所述的方法，其中所述捕获核酸包括夹板核酸，并且夹板核酸包含与捕获核酸和/或诱饵核酸互补的序列。

9.根据权利要求1所述的方法，其中所述诱饵核酸和/或分析物包括配置为偶联诱饵核酸和多肽分析物的反应性偶联部分。

10.根据权利要求9所述的方法，其中所述捕获核酸包含被配置用于附着的反应性偶联部分被附着到固体支持物上的诱饵核酸。

11.根据权利要求10所述的方法，其中所述诱饵核酸与所述捕获核酸的杂交包括8个或更多个互补碱基的杂交。

12.根据权利要求1所述的方法，其中所述多肽分析物是通过将生物样品中的蛋白质片段化而获得的。

13.根据权利要求1到12中任一项所述的方法，其中使用化学连接将所述多肽分析物附着至所述诱饵核酸。

14.根据权利要求1到12中任一项所述的方法，其中所述诱饵核酸和/或捕获核酸进一步包括通用引发位点，其中通用引发位点包括用于扩增、测序或两者的引发位点。

15.根据权利要求1到12中任一项所述的方法，其中所述固体支持物是珠子、纳米颗粒或微球。

16. 根据权利要求1所述的方法，其进一步包括重复以下步骤一次或多次：

使所述多肽分析物与能够结合所述多肽分析物的额外的结合剂接触，其中所述额外的结合剂包括带有关于所述额外的结合剂的标识信息的编码标签；以及

17.根据权利要求16所述的方法，其中将所述编码标签的所述标识信息转移至所述诱饵核酸或捕获核酸是由DNA连接酶或DNA聚合酶介导的。

18.一种核酸-分析物组合物，其包含多个核酸-分析物嵌合体和多个附着于固相支持物的捕获核酸，该核酸-分析物组合物通过以下步骤产生：

将多肽分析物附着到诱饵核酸上以生成核酸-分析物嵌合体，其中诱饵核酸与多肽分析物共价连接以产生核酸-分析物嵌合体；

将所述核酸-分析物嵌合体共价偶联到所述固体支持物上；

其中多个核酸-分析物嵌合体偶联在所述固体支持物上，并且偶联在所述固体支持物上的相邻的核酸-分析物嵌合体以50 nm或更大的平均距离间隔开；

19.根据权利要求18所述的核酸-分析物组合物，其中所述多肽分析物附着到所述诱饵核酸的3'端或所述诱饵核酸的5'端。

20. 根据权利要求18所述的核酸-分析物组合物，其中偶联在所述固体支持物上的相邻的核酸-分析物嵌合体以大于100 nm的平均距离间隔开。

21.根据权利要求18所述的核酸-分析物组合物，其中所述捕获核酸、所述核酸-分析物嵌合体和/或所述诱饵核酸进一步包括条形码。

22.根据权利要求21所述的核酸-分析物组合物，其中所述条形码包括唯一分子标识符（UMI）。

23.根据权利要求18所述的核酸-分析物组合物，其中所述捕获核酸、所述核酸-分析物嵌合体、所述诱饵核酸和/或所述偶联的核酸-分析物嵌合体进一步包括唯一分子标识符（UMI）。

24. 根据权利要求18所述的核酸-分析物组合物，其中所述诱饵核酸与所述捕获核酸共价偶联，并使用 DNA 连接酶进行共价偶联。

25.根据权利要求18所述的核酸-分析物组合物，其中所述捕获核酸包括核酸发夹。

26.根据权利要求18所述的核酸-分析物组合物，其中所述捕获核酸包括夹板核酸，并且夹板核酸包含与捕获核酸和/或诱饵核酸互补的序列。

27.根据权利要求18所述的核酸-分析物组合物，其中所述诱饵核酸和/或多肽分析物包含被配置为偶联诱饵核酸和多肽分析物的反应性偶联部分。

28.根据权利要求18所述的核酸-分析物组合物，其中所述捕获核酸包含配置用于连接诱饵核酸的反应性偶联部分。

29.根据权利要求18所述的核酸-分析物组合物，其中所述诱饵核酸与所述捕获核酸的杂交包括8个或更多个互补碱基的杂交。

30.根据权利要求18所述的核酸-分析物组合物，其中所述多肽分析物是通过将生物样品中的蛋白质片段化而获得的。

31.根据权利要求18到30中任一项所述的核酸-分析物组合物，其中使用化学连接将所述多肽分析物附着至所述诱饵核酸。

32.根据权利要求18到30中任一项所述的核酸-分析物组合物，其中所述诱饵核酸和/或捕获核酸进一步包括间隔子聚合物。

33.根据权利要求18到30中任一项所述的核酸-分析物组合物，其中所述诱饵核酸和/或捕获核酸进一步包括通用引发位点，其中通用引发位点包括用于扩增、测序或两者的引发位点。

34.根据权利要求18到30中任一项所述的核酸-分析物组合物，其中所述捕获核酸包括用于测序的衔接子核酸序列。

35.根据权利要求18到30中任一项所述的核酸-分析物组合物，其中所述固体支持物是珠子、纳米颗粒或微球。

36. 一种用于多肽分析的试剂盒，其包括：

（a）多个诱饵核酸，诱饵核酸中的每一个被配置成共价连接至多肽分析物；和

（b）包括多个附着的捕获核酸的固体支持物，所述捕获核酸中的每一个包括与对应的诱饵核酸互补的序列并且被配置为将多肽分析物共价连接至固体支持物上，其中附着在所述固体支持物上的相邻的捕获核酸以50 nm或更大的平均距离在所述固体支持物上间隔开；和

（c）一种或更多种能够结合所述多肽分析物的结合剂，其中每种结合剂包括带有关于所述结合剂的标识信息的编码标签，并且其中所述编码标签被配置为允许将关于所述结合剂的标识信息转移到附着有固定在固体支持物上的所述多肽分析物的所述诱饵核酸或捕获核酸。

37.根据权利要求36所述的试剂盒，其中所述诱饵核酸中的至少一个被配置成允许所述多肽分析物附着到所述诱饵核酸的3'端或所述诱饵核酸的5'端。

38.根据权利要求36所述的试剂盒，其中所述诱饵核酸中的至少一个被配置成允许所述多肽分析物附着到所述诱饵核酸的内部位置。

39. 根据权利要求36所述的试剂盒，其中附着在所述固体支持物上的相邻的捕获核酸在所述固体支持物上以大于100 nm的平均距离间隔开。

40.根据权利要求36所述的试剂盒，其进一步包括多个条形码，其中条码附着在诱饵核酸或捕获核酸上，或者条码被配置为附着在诱饵核酸或捕获核酸上。

41.根据权利要求40所述的试剂盒，其中所述多个条形码中的至少一个条形码包括唯一分子标识符（UMI）。

42.根据权利要求36所述的试剂盒，其中所述捕获核酸中的至少一个和/或所述诱饵核酸中的至少一个进一步包括唯一分子标识符（UMI）。

43.根据权利要求36到42中任一项所述的试剂盒，其中所述诱饵核酸中的至少一个包括反应性偶联部分配置为连接到多肽分析物或至少一种捕获核酸。

44.根据权利要求36到42中任一项所述的试剂盒，其中每个诱饵核酸被配置为与多肽分析物共价连接。

45.根据权利要求36到42中任一项所述的试剂盒，其进一步包括偶联试剂，其中偶联剂是酶偶联剂或化学偶联剂。

46.根据权利要求36到42中任一项所述的试剂盒，其进一步包括蛋白酶。

47.根据权利要求36到42中任一项所述的试剂盒，其中所述捕获核酸中的至少一个包括核酸发夹。

48.根据权利要求36到42中任一项所述的试剂盒，其中所述捕获核酸包括夹板核酸，其中夹板核酸包含与捕获核酸和/或诱饵核酸互补的序列。

49.根据权利要求36到42中任一项所述的试剂盒，其中与相应诱饵核酸互补的序列包括8个或更多个互补碱基。

50.根据权利要求36到42中任一项所述的试剂盒，其中所述诱饵核酸中的至少一个和/或所述捕获核酸中的至少一个进一步包括间隔子聚合物。

51.根据权利要求36到42中任一项所述的试剂盒，其中所述诱饵核酸中的至少一个和/或所述捕获核酸中的至少一个进一步包括通用引发位点，其中通用引发位点包括用于扩增、测序或两者的引发位点。

52.根据权利要求36到42中任一项所述的试剂盒，其中所述固体支持物是珠子、纳米颗粒或微球。