CN117980319A

CN117980319A - 单分子蛋白质和肽测序

Info

Publication number: CN117980319A
Application number: CN202280063695.0A
Authority: CN
Inventors: 丹尼尔·马桑·埃斯坦迪安; 爱德华·斯图尔特·博伊登; 雅各布·乔舒亚·利·罗德里格斯
Original assignee: Massachusetts Institute of Technology
Current assignee: Massachusetts Institute of Technology
Priority date: 2021-09-22
Filing date: 2022-09-21
Publication date: 2024-05-03
Also published as: WO2023049177A1; EP4387979A1; US20230104998A1

Abstract

本说明书提供了用于对肽进行线性扩展的方法、测定和试剂。本文中所述的方法和/或经线性扩展肽具有数种用途，例如但不限于肽(蛋白质)测序、蛋白质组的高分辨率研究，以及能够实现对疾病的早期检测至关重要的超灵敏诊断。

Description

单分子蛋白质和肽测序

相关申请

本申请根据35U.S.C.§119(e)要求于2021年9月22日提交的美国临时申请序列号63/247,011的权益，其公开内容通过引用整体并入本文。

政府支持

本发明是在国立卫生研究院(National Institutes ofHealth，NIH)授予的基金No.HG008525的政府支持下完成的。政府享有本发明的某些权利。

背景技术

蛋白质在所有活生物体的细胞水平上起着关键的结构和动态功能作用。理解蛋白质对生物学功能的贡献至关重要，并且依赖于具有用于定量和鉴定的合适技术。分子生物学的中心法则，即从DNA到RNA到蛋白质的信息流，已经研究了数十年，因为这些分子对细胞功能和多样性至关重要。核酸的聚合酶链反应(polymerase chain reaction，PCR)扩增的出现对于在全基因组和转录组水平上推进DNA和RNA的高通量分子研究和分析是关键的。相反，研究蛋白质在技术上已落后，因为没有PCR的等同方案来扩增和检测低拷贝数蛋白质。相比之下，蛋白质测序和鉴定方法已依赖于来自许多细胞的整体测量，这掩盖了细胞与细胞的变化。尽管一些研究人员已转向转录组学，其作为细胞内蛋白质组成的代替物，但关键是要注意，由于不同mRNA翻译效率的变化以及mRNA与蛋白质寿命之间的差异，因此转录组水平上的基因表达与蛋白质组谱弱相关。另外，翻译后修饰还导致蛋白质丰度及其一级序列相对于转录组的显著变化。重要的生物过程，例如突触可塑性、代谢信号传导途径和干细胞分化，都取决于蛋白质表达。许多疾病也源自遗传突变，该遗传突变进而被翻译为单个异常蛋白质或一组异常蛋白质。疾病(例如癌症和神经退行性变)往往已引发来源不明的突变和多基因相互作用。它们可在蛋白质组水平上得到最好的理解和解决，因为其病理状况与细胞水平上被破坏的蛋白质稳态直接相关。

蛋白质组学的进展已经落后，而DNA测序快速推进了基因组学的研究，这主要是由于允许用于高通量测序的技术。目前用于研究蛋白质的方法包括质谱、Edman测序和免疫组织化学(Immunohistochemistry，IHC)。

质谱能够基于肽片段的质量/电荷比进行蛋白质鉴定和定量，这可生物信息学地映射回到基因组数据库。尽管该技术已经取得了显著进展，但其仍对来自生物系统的全部蛋白质组进行定量。该技术对整体蛋白质表现出阿摩尔(attomole)检测灵敏度，并在分级之后表现出亚阿摩尔(subattomole)灵敏度。质谱的灵敏度是限制性的，因为占约10％哺乳动物蛋白质表达的低拷贝数蛋白质仍未被检测到，并且低拷贝数蛋白质尽管丰度低但在功能上是重要的。

用于蛋白质测序的另一种方法是Edman降解反应。Edman降解允许顺序和选择性地除去单一N末端氨基酸，随后通过高效液相色谱(High-Performance LiquidChromatography，HPLC)进行鉴定。Edman蛋白质测序是已证实的用于鉴定的选择性除去第一个N末端氨基酸的方法，其中异硫氰酸苯酯(phenyl isothiocyanate，PITC)用于与N末端氨基酸缀合，然后在酸和热处理之后，除去经PITC标记的N末端氨基酸。尽管Edman测序可具有98％效率，但主要缺点是其固有的低通量，需要单一高度纯化的蛋白质，并且不适用于系统范围的生物学。Edman降解和质谱二者都可对蛋白质进行测序，但缺乏单分子灵敏度，并且不提供细胞背景下蛋白质的空间信息。

关于空间信息，免疫组织化学是这样的蛋白质鉴定方法，其允许我们对蛋白质的细胞定位进行可视化，但不提供序列信息。免疫组织化学涉及通过用荧光团缀合的抗体进行识别来鉴定蛋白质。该方法排除了蛋白质序列信息，但可鉴定蛋白质及其相应的位置。主要的限制是可扩展性，因为即使是为蛋白质组中的每种蛋白质完美构建特异性抗体，也需要约25,000种抗体和约6250轮四色成像。任何1对1的蛋白质标记方案都将可能无法使整个蛋白质组规模化。

蛋白质测序中的主要障碍是缺乏在肽上探测氨基酸的天然酶和生物分子。例如，不存在类似于用于核酸的PCR的蛋白质扩增过程，因此通过单分子策略进行测序的方法是合适的，需要检测单独的氨基酸。

目前提出的单分子蛋白质测序方法依赖于通过肽或蛋白质残基的共价化学修饰的荧光读出、用N末端特异性氨基酸结合剂(N-terminal-specific amino-acid binder，NAAB)探测或者在跨膜施加电压的情况下通过纳米孔来易位肽。内部肽链上氨基酸的化学修饰可容易因相邻化学标记引起的空间位阻而导致低效率，并且可用的反应性氨基酸和用于标记所有20种氨基酸的化学物质的数量也有限。使用纳米孔进行蛋白质测序的主要问题可归因于氨基酸残基的不均匀电荷分布，以及对电记录进行去卷积以区分氨基酸的分析挑战。

缺乏用于高分辨率蛋白质水平分析的技术代表在推进重要生物学研究上的显著差距。

发明内容

本发明提供了用于对肽进行线性扩展的方法。如本文中所用，对肽进行线性扩展意指提高(扩展)肽的氨基酸之间的距离同时保持肽序列。术语“经扩展肽(expandedpeptide)”或“经线性扩展肽(linearly expanded peptide)”在本文中可互换使用来指通过本文中所述的任何方法产生的任何肽。

在一些实施方案中，所述方法包括使肽与结合元件(本文中也称为“元件”)接触，所述结合元件与肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物，使元件-肽复合物系链至基底；从肽切割元件-肽复合物，从而提供与基底结合的元件-氨基酸复合物。在一些实施方案中，元件包含接头，其中接头为肽的下一个氨基酸提供连接点。在一些实施方案中，所述方法包括将接头与元件-氨基酸复合物中的元件连接，其中接头为肽的下一个氨基酸提供连接点。“肽的下一个氨基酸”现在是末端氨基酸并且可与元件接触以形成元件-氨基酸复合物。两个或更多个元件-氨基酸复合物可通过接头连接。在一个实施方案中，使肽附接至基底。

在一些实施方案中，所述方法重复一次或更多次。例如，在肽的末端氨基酸已被除去之后，再次使肽与元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物；使所述另外的元件-肽复合物系链至先前的元件的接头；以及从肽切割另外的元件-肽复合物。在一些实施方案中，元件包含接头，其中接头为肽的下一个氨基酸提供连接点。在一些实施方案中，将另外的接头与所述另外的元件-氨基酸复合物连接。接头为在肽的下一个氨基酸上使用所述方法提供连接点。“肽的下一个氨基酸”现在是末端氨基酸并且可与元件接触以形成元件-氨基酸复合物。两个或更多个元件-氨基酸复合物可通过接头连接。在一些实施方案中，重复所述方法直至肽的一部分被扩展。在一些实施方案中，重复所述方法直至整个肽被扩展。在一些实施方案中，所述方法还包括使一个或更多个另外的肽与结合元件接触(使得两个或更多个肽与其接触)，所述结合元件与肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物；使元件-肽复合物系链至基底；以及从肽切割元件-肽复合物，得到与基底结合的元件-氨基酸复合物；从而对两个或更多个肽进行线性扩展。在一些实施方案中，在接触步骤之前，使两个或更多个肽独立地附接至基底。在一些实施方案中，两个或更多个肽是彼此不同的。

本发明还提供了用于对两个或更多个肽进行线性扩展的方法。例如可扩展(提高)样品中两个或更多个肽的氨基酸之间的距离同时保持两个或更多个肽的序列(即，氨基酸的顺序)。在一些实施方案中，所述方法包括使两个或更多个肽独立地附接至基底；使肽与结合元件接触，所述结合元件与每个肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物，使元件-肽复合物系链至基底；从肽切割元件-肽复合物，从而提供与基底结合的元件-氨基酸复合物。在一些实施方案中，元件包含接头，其中接头为肽的下一个氨基酸提供连接点。在一些实施方案中，所述方法包括将接头与元件-氨基酸复合物中的元件连接，其中接头为肽的下一个氨基酸提供连接点。“肽的下一个氨基酸”现在是末端氨基酸并且可与元件接触以形成元件-氨基酸复合物。两个或更多个元件-氨基酸复合物可通过接头连接。

本发明还提供了用于对肽的至少一部分进行线性扩展的方法。在一些实施方案中，所述方法包括使肽与结合元件接触，所述结合元件与肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物，使元件-肽复合物系链至基底；从肽切割元件-肽复合物以形成与基底结合的元件-氨基酸复合物，其中元件包含为肽的下一个氨基酸提供连接点的接头，或者将这样的接头添加至元件-氨基酸复合物中的元件上；再次使肽与结合元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物，使所述另外的元件-肽复合物系链至先前的元件-氨基酸复合物的接头；以及从肽切割元件-肽复合物，从而提供与基底结合的连接的元件-氨基酸复合物；其中氨基酸之间的距离已提高。在一些实施方案中，另外的元件-氨基酸复合物的元件包含接头，其中接头为肽的下一个氨基酸提供连接点。在一些实施方案中，所述方法包括将接头与另外的元件-氨基酸复合物中的元件连接，其中接头为肽的下一个氨基酸提供连接点。“肽的下一个氨基酸”现在是末端氨基酸并且可与元件接触以形成元件-氨基酸复合物。两个或更多个元件-氨基酸复合物可通过接头连接。在一些实施方案中，将所述方法重复一次或更多次。在一些实施方案中，所述方法包括对肽的全部氨基酸进行线性扩展。在一些实施方案中，所述方法还包括对一个或更多个另外的肽的至少一部分进行线性扩展(在本文中也称为对两个或更多个肽的至少一部分进行扩展)，其包括使一个或更多个另外的肽与结合元件接触，所述结合元件与肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物，使元件-肽复合物系链至基底；从肽切割元件-肽复合物以形成与基底结合的元件-氨基酸复合物，其中元件包含为肽的下一个氨基酸提供连接点的接头，或者将这样的接头添加至元件-氨基酸复合物中的元件上；使肽与结合元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物，使所述另外的元件-肽复合物系链至元件-氨基酸复合物的接头；以及从肽切割元件-肽复合物，从而提供与基底结合的连接的元件-氨基酸复合物；其中肽中氨基酸之间的距离提高，从而对两个或更多个肽的至少一部分进行线性扩展。在一些实施方案中，所述方法还包括在一个或更多个另外的肽上进行前述方法的步骤，从而对两个或更多个肽的至少一部分进行线性扩展。

本发明还提供了用于对样品中的独立地附接至基底上的连接点之两个或更多个肽的至少一部分进行线性扩展的方法。在一些实施方案中，所述方法包括使两个或更多个肽与结合元件接触，所述结合元件与每个肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物，使元件-肽复合物系链至基底；从肽切割元件-肽复合物以形成与基底结合的元件-氨基酸复合物，其中元件包含为肽的下一个氨基酸提供连接点的接头，或者将这样的接头添加至元件-氨基酸复合物中的元件上；再次使肽与结合元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物，使所述另外的元件-肽复合物系链至先前的与基底结合的元件-氨基酸复合物的接头；以及从肽切割元件-肽复合物，从而提供与基底结合的连接的元件-氨基酸复合物；其中氨基酸之间的距离提高。“肽的下一个氨基酸”现在是末端氨基酸并且可与元件接触以形成元件-氨基酸复合物。两个或更多个元件-氨基酸复合物可通过接头连接。

在一些实施方案中，另外的元件-氨基酸复合物的元件包含接头，其中接头为肽的下一个氨基酸提供连接点。在一些实施方案中，所述方法包括将接头与另外的元件-氨基酸复合物中的元件连接，其中接头为肽的下一个氨基酸提供连接点。“肽的下一个氨基酸”现在是末端氨基酸并且可与元件接触以形成元件-氨基酸复合物。两个或更多个元件-氨基酸复合物可通过接头连接。在一些实施方案中，将所述方法重复一次或更多次。在一些实施方案中，所述方法包括对肽的全部氨基酸进行线性扩展。

一旦肽的一部分或肽的全部氨基酸已通过本文中所述的任何方法扩展，则可通过本领域已知的任何合适的方法对经扩展肽进行测序。用于蛋白质测序的检测方法包括但不限于纳米孔、离子电流纳米孔、隧穿电流纳米孔、原子力显微术、蛋白质结合剂、适配体结合剂、多聚体结合剂、DNA-paint和化学缀合。

本发明还提供了元件-氨基酸复合物。在一些实施方案中，元件-氨基酸复合物包含与20种天然蛋白原性氨基酸(proteinogetic amino acid)中的一种结合的结合元件；与经翻译后修饰的氨基酸结合的结合元件；或者与肽的氨基酸衍生物结合的结合元件。

本发明还提供了元件-氨基酸复合物结合剂。在一些实施方案中，元件-氨基酸复合物结合剂包含与和元件复合的20种天然蛋白原性氨基酸中的一种或亚组结合的结合剂；与和元件复合的经翻译后修饰的氨基酸中的一种或亚组结合的结合剂；或者与肽的氨基酸衍生物结合的结合剂。

在一些实施方案中，元件-氨基酸复合物结合剂包含与和元件复合的20种天然蛋白原性氨基酸中的一种结合的结合剂；与和元件复合的经翻译后修饰的氨基酸结合的结合剂；或者与肽的氨基酸衍生物结合的结合剂。

在本文中所述的任何前述化合物、组合物和/或方法的某些实施方案中，结合元件为如本文中所述的ClickT化合物。

根据本发明的一个方面，提供了用于对肽进行线性扩展的方法，所述方法包括：使肽与结合元件接触，所述结合元件与肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物；使元件-肽复合物系链至基底；以及从肽切割元件-肽复合物，得到与基底结合的元件-氨基酸复合物。在一些实施方案中，所述方法还包括在一个或更多个另外的肽上进行所述方法从而对两个或更多个肽进行线性扩展。在某些实施方案中，两个或更多个肽是彼此不同的。根据本发明的另一个方面，提供了用于对两个或更多个肽进行线性扩展的方法，所述方法包括：使两个或更多个肽与结合元件接触，所述结合元件与两个或更多个肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物；使元件-肽复合物系链至基底；以及从肽切割元件-肽复合物，得到与基底结合的元件-氨基酸复合物。在本发明的任一前述方面的一些实施方案中，结合元件包含为肽的下一个氨基酸提供连接点的接头。在本发明的任一前述方面的方法的一些实施方案中，下一个氨基酸是在已从元件-氨基酸复合物切割肽之后该肽的末端氨基酸。在某些实施方案中，本发明的任一前述方面的方法还包括在从元件-肽复合物切割肽之后将结合元件接头与肽的下一个氨基酸连接，导致肽的下一个氨基酸成为元件-氨基酸复合物的一部分。在本发明的任一前述方面的方法的某些实施方案中，结合元件包含接头。在本发明的任一前述方面的方法的一些实施方案中，所述方法还包括将接头与另外的元件-氨基酸复合物中的元件连接，其中所述接头为肽的下一个氨基酸提供连接点。在本发明的任一前述方面的方法的一些实施方案中，肽的下一个氨基酸是在从元件-肽复合物切割肽之后该肽的末端氨基酸。在本发明的任一前述方面的方法的一些实施方案中，肽的下一个氨基酸是元件-氨基酸复合物的一部分。在本发明的任一前述方面的方法的某些实施方案中，所述方法还包括将接头与已从元件-肽复合物切割的肽的下一个氨基酸连接，导致肽的下一个氨基酸成为元件-氨基酸复合物的一部分。在本发明的任一前述方面的方法的某些实施方案中，结合元件与肽的N末端氨基酸或N末端氨基酸衍生物结合以形成元件-肽复合物。在本发明的任一前述方面的方法的某些实施方案中，结合元件与肽的C末端氨基酸或C末端氨基酸衍生物结合以形成元件-肽复合物。在本发明的任一前述方面的方法的一些实施方案中，在系链和/或切割之前洗去过量和/或未结合的结合元件。在本发明的任一前述方面的方法的一些实施方案中，所述方法重复一次或更多次。在本发明的任一前述方面的方法的某些实施方案中，针对肽的全部氨基酸重复所述方法。在本发明的任一前述方面的方法的某些实施方案中，所述方法的步骤重复一次或更多次。在本发明的任一前述方面的方法的一些实施方案中，针对肽的全部氨基酸重复接触、系链、切割以及将接头与另外的元件-氨基酸复合物中的元件连接的步骤，其中所述接头为肽的下一个氨基酸提供连接点。在本发明的任一前述方面的方法的一些实施方案中，在接触步骤之前，使肽附接至基底。在本发明的任一前述方面的方法的某些实施方案中，在接触步骤之前，使两个或更多个肽独立地附接至基底。在本发明的任一前述方面的方法的某些实施方案中，两个或更多个肽是彼此相同的。在本发明的任一前述方面的方法的一些实施方案中，两个或更多个肽中的至少两个是彼此不同的。在本发明的任一前述方面的方法的一些实施方案中，两个或更多个肽的全部都是彼此不同的。在本发明的任一前述方面的方法的某些实施方案中，肽通过肽的C’末端羧基或侧链官能团附接至基底。在本发明的任一前述方面的方法的一些实施方案中，肽通过肽的N’末端羧基或侧链官能团附接至基底。在本发明的任一前述方面的方法的一些实施方案中，肽共价附接至基底。在本发明的任一前述方面的方法的某些实施方案中，基底是光学透明的。在本发明的任一前述方面的方法的某些实施方案中，基底包含官能化表面。在本发明的任一前述方面的方法的一些实施方案中，官能化表面选自经叠氮化物官能化表面、经硫醇官能化表面，炔烃、DBCO、马来酰亚胺、琥珀酰亚胺、四嗪、TCO、乙烯基、甲基环丙烯、伯胺表面、羧酸表面、DBCO表面、炔烃表面和醛表面。在本发明的任一前述方面的方法的一些实施方案中，所述方法还包括在一个或更多个另外的肽上重复接触、系链、切割、以及连接接头的步骤，从而对两个或更多个肽进行线性扩展。在本发明的任一前述方面的方法的一些实施方案中，所述方法还包括对经线性扩展肽进行测序。在本发明的任一前述方面的方法的某些实施方案中，所述方法还包括将肽序列与参考蛋白质序列数据库进行比较。在本发明的任一前述方面的方法的某些实施方案中，所述方法还包括比较每个肽的序列、对相似肽序列进行分组以及对每个相似肽序列的出现次数进行计数。在本发明的任一前述方面的方法的一些实施方案中，肽或者两个或更多个肽来自样品。在本发明的任一前述方面的方法的一些实施方案中，样品包括生物流体、细胞提取物、组织提取物、或者合成的合成肽的混合物。在本发明的任一前述方面的方法的一些实施方案中，样品是哺乳动物样品。在本发明的任一前述方面的方法的某些实施方案中，样品是人样品。在本发明的任一前述方面的方法的某些实施方案中，结合元件是ClickT化合物。

根据本发明的另一个方面，提供了用于对肽的至少一部分进行线性扩展的方法，所述方法包括：使肽与结合元件接触，所述结合元件与肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物；使元件-肽复合物系链至基底；从肽切割元件-肽复合物以形成与基底结合的元件-氨基酸复合物，其中元件包含为肽的下一个氨基酸提供连接点的接头，或者将这样的接头添加至元件-氨基酸复合物中的元件上；使肽与结合元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物，使所述另外的元件-肽复合物系链至元件-氨基酸复合物的接头；以及从肽切割元件-肽复合物，从而提供与基底结合的连接的元件-氨基酸复合物；从而提高肽的氨基酸之间的距离。在一些实施方案中，所述方法还包括在一个或更多个另外的肽上进行前述方法的步骤，从而对两个或更多个肽的至少一部分进行线性扩展。根据本发明的另一个方面，提供了用于对两个或更多个肽的至少一部分进行线性扩展的方法，所述方法包括：使两个或更多个肽与结合元件接触，以形成元件-肽复合物，所述结合元件与肽的末端氨基酸或末端氨基酸衍生物相互作用，使元件-肽复合物系链至基底；从肽切割元件-肽复合物以形成与基底结合的元件-氨基酸复合物，其中元件包含为肽的下一个氨基酸提供连接点的接头，或者将这样的接头添加至元件-氨基酸复合物中的元件上；使两个或更多个肽与结合元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物，使所述另外的元件-肽复合物系链至来自同一肽的(c)中元件-氨基酸复合物的接头；以及从肽切割元件-肽复合物，从而提供与基底结合的连接的元件-氨基酸复合物；其中氨基酸之间的距离已提高。在本发明的任一前述方面的方法的一些实施方案中，结合元件包含为肽的下一个氨基酸提供连接点的接头。在本发明的任一前述方面的方法的一些实施方案中，下一个氨基酸是在已从元件-肽复合物切割肽之后该肽的末端氨基酸。在本发明的任一前述方面的方法的某些实施方案中，结合元件包含接头。在本发明的任一前述方面的方法的一些实施方案中还包括在从元件-肽复合物切割肽之后将结合元件接头与肽的下一个氨基酸连接，导致肽的下一个氨基酸成为元件-氨基酸复合物的一部分。在本发明的任一前述方面的方法的一些实施方案中，肽的下一个氨基酸是在从元件-肽复合物切割肽之后该肽的末端氨基酸。在本发明的任一前述方面的方法的一些实施方案中，肽的下一个氨基酸是元件-氨基酸复合物的一部分。在本发明的任一前述方面的方法的某些实施方案中还包括将接头与已从元件-肽复合物切割的肽的下一个氨基酸连接，导致肽的下一个氨基酸成为元件-氨基酸复合物的一部分。在本发明的任一前述方面的方法的一些实施方案中，结合元件与肽的N末端氨基酸或N末端氨基酸衍生物结合以形成元件-肽复合物。在本发明的任一前述方面的方法的某些实施方案中，结合元件与肽的C末端氨基酸或C末端氨基酸衍生物结合以形成元件-肽复合物。在本发明的任一前述方面的方法的某些实施方案中，在使元件-肽复合物系链至基底的步骤和/或从肽切割元件-肽复合物的步骤之前，洗去过量和/或未结合的结合元件。在本发明的任一前述方面的方法的一些实施方案中，将以下步骤重复一次或更多次：使肽与结合元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物；使所述另外的元件-肽复合物系链至元件-氨基酸复合物的接头；以及从肽切割元件-肽复合物。在本发明的任一前述方面的方法的一些实施方案中，针对肽的全部氨基酸重复以下步骤：使肽与结合元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物；使所述另外的元件-肽复合物系链至元件-氨基酸复合物的接头；以及从肽切割元件-肽复合物。在本发明的任一前述方面的方法的某些实施方案中，在使肽与初始结合元件接触之前，使肽附接至基底。在本发明的任一前述方面的方法的某些实施方案中，在使两个或更多个肽与初始结合元件接触之前，使两个或更多个肽独立地附接至基底。在一些实施方案中，两个或更多个肽是彼此相同的。在一些实施方案中，两个或更多个肽中的至少两个是彼此不同的。在某些实施方案中，两个或更多个肽中的全部都是彼此不同的。在一些实施方案中，肽和/或两个或更多个肽通过肽的C’末端羧基或侧链官能团附接至基底。在一些实施方案中，肽和/或两个或更多个肽通过肽的N’末端羧基或侧链官能团附接至基底。在本发明的任一前述方面的方法的一些实施方案中，使肽共价附接至基底。在本发明的任一前述方面的方法的一些实施方案中，基底是光学透明的。在本发明的任一前述方面的方法的一些实施方案中，基底包含官能化表面。在本发明的任一前述方面的方法的一些实施方案中，官能化表面选自经叠氮化物官能化表面、经硫醇官能化表面，炔烃、DBCO、马来酰亚胺、琥珀酰亚胺、四嗪、TCO、乙烯基、甲基环丙烯、伯胺表面、羧酸表面、DBCO表面、炔烃表面和醛表面。在本发明的任一前述方面的方法的一些实施方案中，所述方法还包括对经线性扩展肽进行测序。在本发明的任一前述方面的方法的一些实施方案中，所述方法还包括将肽序列与参考蛋白质序列数据库进行比较。在本发明的任一前述方面的方法的一些实施方案中，所述方法还包括对每个肽的序列进行比较、对相似肽序列进行分组以及对每个相似肽序列的出现次数进行计数。在本发明的任一前述方面的方法的一些实施方案中，肽或者两个或更多个肽来自样品。在本发明的任一前述方面的方法的一些实施方案中，样品包括生物流体、细胞提取物、组织提取物、或者合成的合成肽的混合物。在本发明的任一前述方面的方法的一些实施方案中，样品是哺乳动物样品。在本发明的任一前述方面的方法的一些实施方案中，样品是人样品。在本发明的任一前述方面的方法的一些实施方案中，结合元件是ClickT化合物。

根据本发明的另一个方面，提供了元件-氨基酸复合物，并且其包含：与20种天然蛋白原性氨基酸中的一种结合的结合元件；与经翻译后修饰的氨基酸结合的结合元件；或者与20种天然的蛋白原性氨基酸中的一种的衍生物结合的结合元件或者与经翻译后修饰的氨基酸的衍生物结合的结合元件。

根据本发明的另一个方面，提供了元件-氨基酸复合物结合剂并且其包含与和结合元件复合的20种天然蛋白原性氨基酸的亚组结合的结合剂；与和结合元件复合的经翻译后修饰的氨基酸的亚组结合的结合剂；或者与20种天然蛋白原性氨基酸的亚组的衍生物或经翻译后修饰的氨基酸的亚组的衍生物结合的结合剂。在一些实施方案中，元件-氨基酸复合物结合剂还包含可检测标记。

根据本发明的另一个方面，提供了元件-氨基酸复合物结合剂并且其包含与和结合元件复合的20种天然蛋白原性氨基酸中的一种结合的结合剂；与和结合元件复合的经翻译后修饰的氨基酸结合的结合剂；或者与20种天然蛋白原性氨基酸中的一种的衍生物结合的结合剂或与经翻译后修饰的氨基酸的衍生物结合的结合剂。在一些实施方案中，元件-氨基酸复合物结合剂还包含可检测标记。

附图说明

根据以下对如附图中所示的本发明的优选实施方案的更具体的描述，本发明的上述和其他目的、特征以及优点将变得明显，其中，贯穿不同的附图，相似的附图标记指代相同的部分。附图不一定按比例绘制，而是将重点放在举例说明本发明的原理上。

图1示出了使用ClickT来对肽的氨基酸之间的距离进行线性扩展的工作流程。本文中所述的方法允许对肽的一些或全部氨基酸之间的距离进行线性扩展同时保持肽的序列。

图2A和图2B。图2A示出了分子内扩展。图2B示出了分子内扩展如何优化用于扩增和检测的各个氨基酸周围的环境。

图3A和图3B。图3A示出了肽中两个氨基酸的键合。本文中使用的“肽”定义为蛋白质和/或具有肽键的两个或更多个氨基酸串(string)。氨基酸之间的化学距离定义为一个氨基酸的氨基与相邻氨基酸的羧基之间的化学键的量。在天然蛋白质和肽中，该距离是1，因为每个氨基酸之间存在连接氨基和羧基的单个化学键。

图3B示出了本发明要求保护的方法如何将化学键距离提高至大于1同时仍然保持部分或整个肽的氨基酸顺序。X＝一个氨基酸的基团与另一个氨基酸的胺基之间任何经化学缀合的元件。

具体实施方式

本说明书提供了可用于对肽进行线性扩展的化合物、组合物、方法、测定和试剂。已通过本文中所述方法扩展的肽被称为“经线性扩展肽”或简称为“经扩展肽”。本文中使用的对肽进行线性扩展是指提高(扩展)肽的氨基酸之间的距离。经线性扩展肽具有与经扩展肽前体(pre-expanded peptide)相同的氨基酸序列，不同之处在于氨基酸之间的距离已提高。本文中使用的“肽”定义为蛋白质和/或通过肽键连接在一起的两个或更多个氨基酸的串。

在一个方面中，所述方法可用于对单一肽或单一肽的多个分子进行线性扩展。在一个方面中，所述方法可用于对多个、不同的肽进行线性扩展。

在一个方面中，所述方法可用于对多个单一肽同时进行线性扩展。

这样的一个或更多个经线性扩展肽可用作大规模平行测序技术的基础。本文中使用的对肽进行“测序”在广义上涉及观察氨基酸的合理身份和顺序。在一些实施方案中，测序涉及观察肽的氨基酸的确切身份和顺序。

另外，所述方法可用于对多个不同肽同时进行线性扩展。例如，包含不同肽(包括蛋白质)的混合物的样品可根据本文中所述的方法进行扩展。

在一些实施方案中，经扩展肽然后可用于例如产生样品中的关于各个肽的序列信息。

在一些实施方案中，经扩展肽然后可用于例如复杂样品中的蛋白质表达谱分析。例如，经扩展肽可用于产生样品中包含的肽(包括蛋白质)的定量(频率)数据和定性(序列)数据二者。

在一个实施方案中，本发明允许对蛋白质进行测序。本文中所述的方法和试剂可用于蛋白质组的高分辨率研究并且能够实现对疾病的早期检测至关重要的超灵敏诊断。

本文中使用的术语“结合元件”(本文中也称为“元件”)是指包含以下的任何试剂：末端氨基酸反应性基团和任选地切割基团；可系链基团，以及允许连接另外的元件的连接点。

在一些实施方案中，结合元件包含以下：反应性基团，与肽的末端氨基酸结合；系链基团，使元件-肽复合物固定至物理基底；切割基团，从肽中除去元件和结合的末端氨基酸，产生元件-氨基酸复合物；以及接头基团的连接点，允许另外的元件结合的氨基酸(即，另外的元件-氨基酸复合物)连接。在一些实施方案中，元件包含接头基团。在一些实施方案中，在元件与末端氨基酸结合之后，接头被添加至连接点。在一些实施方案中，接头被添加至元件-氨基酸复合物的元件的连接点。

末端氨基酸反应性基团与肽的末端氨基酸或末端氨基酸衍生物反应并与肽的末端氨基酸或末端氨基酸衍生物结合。当用于对N末端氨基酸进行线性扩展时，结合元件的末端氨基酸反应性基团包含伯胺反应性基团，该伯胺反应性基团在肽的N末端与游离胺缀合以形成元件-肽复合物。当用于对C末端氨基酸进行线性扩展时，结合元件的末端氨基酸反应性基团包含C末端反应性基团，该C末端反应性基团在肽的C末端与经修饰或未经修饰的羧基缀合以形成元件-肽复合物。

在一些实施方案中，末端氨基酸反应性基团是伯胺反应性基团。在一个实施方案中，伯胺反应性基团包括但不限于异硫氰酸酯、异硫氰酸苯酯(PITC)、异氰酸酯、酰基叠氮化物、N-羟基琥珀酰亚胺酯(NHS酯)、磺酰氯、醛、乙二醛、环氧化物、环氧乙烷、碳酸酯、芳基卤化物、酰亚胺酯、碳二亚胺、酸酐和氟苯基酯。在一个实施方案中，试剂是异硫氰酸苯酯(PITC)。

在一些实施方案中，N末端氨基酸或其衍生物以及结合元件可在允许N末端氨基酸与结合元件的伯胺反应性基团缀合的条件下接触以形成复合物。

在一些实施方案中，末端氨基酸反应性基团是C末端反应性基团。在一个实施方案中，C末端反应性基团包括但不限于异硫氰酸酯、四丁基铵异硫氰酸酯、二苯基磷酰基异硫氰酸酯、乙酰氯、溴化氰、异硫氰酸酯、硫氰酸钠、硫氰酸铵和羧肽酶。

在一些实施方案中，C末端氨基酸或其衍生物以及结合元件可在允许C末端氨基酸与结合元件的C末端反应性基团缀合的条件下接触以形成复合物。

在一些实施方案中，结合元件还包含切割基团。在一些实施方案中，切割基团与末端氨基酸反应性基团相同。在一些实施方案中，与胺反应和从肽切割末端氨基酸的功能可由伯胺反应性基团来进行。在一些实施方案中，具有这两种功能的伯胺反应性基团包括但不限于异硫氰酸酯、异硫氰酸苯酯(PITC)。在一个实施方案中，伯胺反应性基团是异硫氰酸苯酯(PITC)。在一个实施方案中，伯胺反应性基团是异硫氰酸酯。在一些实施方案中，与C末端反应和切割氨基酸的功能可由同一化学基团来进行。在一个实施方案中，C末端切割基团参与从肽中化学除去末端氨基酸以形成ClickT-氨基酸复合物。在一个实施方案中，切割基团是异硫氰酸酯、四丁基铵异硫氰酸酯或二苯基磷酰基异硫氰酸酯。

在一些实施方案中，末端切割基团参与从肽中化学除去末端氨基酸。在一个实施方案中，末端切割基团参与从肽中化学除去末端氨基酸以形成元件-氨基酸复合物。在一些实施方案中，切割基团是PITC或异硫氰酸酯。在一个实施方案中，切割基团由工程化酶或野生型酶(例如肽酶或蛋白酶)辅助。

在一些实施方案中，元件-氨基酸复合物是与从肽切割之后的氨基酸缀合的结合元件。在一个实施方案中，元件-氨基酸复合物可化学衍生为抗原性的。在一个实施方案中，元件-氨基酸复合物可以是但不限于以下衍生形式：噻唑酮(thiazolone)、乙内酰硫脲或硫代氨基甲酰基。

在一些实施方案中，系链基团包括但不限于异硫氰酸酯、四丁基铵异硫氰酸酯、二苯基磷酰基异硫氰酸酯、叠氮化物、炔烃、二苯并环辛炔(Dibenzocyclooctyne，DBCO)、马来酰亚胺、琥珀酰亚胺、硫醇-硫醇二硫键、四嗪、TCO、乙烯基、甲基环丙烯、伯胺、羧酸、炔烃、丙烯酰基、烯丙基和醛。

在允许缀合的条件下，系链基团可与官能化的基底(例如官能化的玻璃表面)缀合或者整合到聚合物网络中，从而使元件-肽复合物固定在基底上。在从肽切割末端氨基酸之后；系链基团保持元件-氨基酸复合物与基底结合。

在一个实施方案中，结合元件可直接系链至基底的官能化表面。例如，如果官能化表面是包含叠氮化物的表面，则结合元件包含与叠氮化物(例如炔烃)缀合的基团，并且可直接系链至表面。炔烃-叠氮化物键的以铜催化(Cu+)为条件的点击化学是生物正交的，具有适合于在复杂的生物环境中分离靶分子的高反应特异性和高产率。

结合元件复合物或结合元件复合物-基底复合物中的组分的接触和结合可在溶剂中发生，所述溶剂包括但不限于水性溶剂(例如水)或有机溶剂(例如二氧六环、DMSO、THF、DMF、甲苯、乙腈)。

在一些实施方案中，结合元件与肽的末端氨基酸缀合以形成元件-肽复合物。然后使元件-肽复合物局部系链至物理基底。随后从肽切割元件-肽复合物，产生与基底结合的元件-氨基酸复合物。在切割之后，另外的元件-氨基酸复合物可任选地与和基底结合的元件-氨基酸复合物连接，以允许随后对肽的氨基酸进行连续轮的线性扩展。

在一些实施方案中，结合元件-氨基酸复合物是抗原性的。在一些实施方案中，结合元件-氨基酸复合物的一部分是抗原性的。

在本文中所述的任何化合物、组合物和/或方法的一些实施方案中，结合元件具有式I结构：

A是末端氨基酸反应性和切割基团；

B是可系链基团；

C是接头或接头的连接点；并且

其中n为0至500中的任一数字。在一个实施方案中，n为0至250中的任一数字。在一个实施方案中，n为0至100中的任一数字。在一个实施方案中，n为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50。在一个实施方案中，n为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25。在一个实施方案中，n为0、1、2、3、4、5、6、7、8、9或10。在一个实施方案中，n为1、2、3、4或5。在一个实施方案中，n为1。

式I化合物在本文中也称为“ClickT”。

式II示出了不含接头基团的ClickT化合物的一个实施方案的一部分。接头基团可以是ClickT化合物的一部分或者可稍后添加接头以允许连接另外的ClickT-氨基酸复合物。

图1示出了结合元件与肽的末端氨基酸结合以形成元件-肽复合物的一个实例的工作流程。系链基团与元件-肽复合物缀合至基底。然后切割元件结合的末端氨基酸，留下与基底单独结合的元件-氨基酸复合物。然后与基底结合的经切割的元件末端氨基酸复合物可用作起点以用于结合肽的另外的元件结合的氨基酸，提高肽的氨基酸之间的距离。

在元件包含为肽的下一个氨基酸提供连接点的接头，或者将这样的接头添加至元件-氨基酸复合物中的元件上的一些实施方案中，再次使肽与结合元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物。然后使所述另外的元件-肽复合物系链至先前的与基底结合的元件-氨基酸复合物的接头并随后从肽切割，从而提供与基底结合的连接的元件-氨基酸复合物；其中氨基酸之间的距离已提高。

从肽分离末端氨基酸允许更具选择性和/或更高亲和力地结合不受肽的剩余部分影响的氨基酸。接头，其在接触肽之前作为元件的一部分或被添加至经切割的元件末端氨基酸复合物，允许另外的迭代轮的线性化。这允许一个元件-氨基酸复合物与下一个元件-氨基酸复合物的顺序系链同时无限地保持氨基酸在线性链中的顺序并为独立检测和鉴定提供氨基酸之间的间隔。

本方法通过用带电荷分子提高蛋白质的氨基酸的分子内间距来内部破坏蛋白质的分子内性质以使单分子蛋白质测序变得成功能够实现。这种分子内扩展策略，用带电荷接头或类似中间体使氨基酸远离彼此。更具体地，本发明在检测之前(时间分离)或在链中的全部氨基酸之间(空间分离)一次一个地将带电荷接头与氨基酸进行内部连接，以克服和破坏氨基酸之间固有的分子内相互作用。在此，电荷破坏了形成蛋白质结构的主要的疏水和静电相互作用，甚至提供了跨整个蛋白质的可及性。另外，由分离提供的另外的氨基酸与氨基酸的间距将提高分子内间隔并降低结合剂之间的空间阻断。

本发明提供了用于对肽进行线性扩展的方法。本文中使用的对肽进行线性扩展意指提高(扩展)肽的氨基酸之间的距离同时保持肽序列。在一些实施方案中，所述方法包括使肽与结合元件(本文中也称为“元件”)接触，所述结合元件与肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物，使元件-肽复合物系链至基底；从肽切割元件-肽复合物，从而提供与基底结合的元件-氨基酸复合物。在一些实施方案中，元件包含接头，其中接头为肽的下一个氨基酸提供连接点。在一些实施方案中，所述方法包括将接头与元件-氨基酸复合物中的元件连接，其中接头为肽的下一个氨基酸提供连接点。“肽的下一个氨基酸”现在是末端氨基酸并且可与元件接触以形成元件-氨基酸复合物。两个或更多个元件-氨基酸复合物可通过接头连接。在一个实施方案中，使肽附接至基底。

在一些实施方案中，将所述方法重复一次或更多次。例如，在已除去肽的末端氨基酸之后，再次使肽与元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物；使所述另外的元件-肽复合物系链至先前元件的接头；以及从肽切割另外的元件-肽复合物。在一些实施方案中，元件包含接头，其中接头为肽的下一个氨基酸提供连接点。在一些实施方案中，将另外的接头与所述另外的元件-氨基酸复合物连接。接头为在肽的下一个氨基酸上使用所述方法提供连接点。“肽的下一个氨基酸”现在是末端氨基酸并且可与元件接触以形成元件-氨基酸复合物。两个或更多个元件-氨基酸复合物可通过接头连接。在一些实施方案中，重复所述方法直至肽的一部分被扩展。在一些实施方案中，重复所述方法直至整个肽被扩展。

本发明还提供了用于对两个或更多个肽进行线性扩展的方法。例如，样品中两个或更多个肽的氨基酸之间的距离可被扩展(提高)同时保持两个或更多个肽的序列(即，氨基酸的顺序)。在一些实施方案中，所述方法包括使两个或更多个肽独立地附接至基底；使肽与结合元件接触，所述结合元件与每个肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物，使元件-肽复合物系链至基底；从肽切割元件-肽复合物，从而提供与基底结合的元件-氨基酸复合物。在一些实施方案中，元件包含接头，其中接头为肽的下一个氨基酸提供连接点。在一些实施方案中，所述方法包括将接头与元件-氨基酸复合物中的元件连接，其中接头为肽的下一个氨基酸提供连接点。“肽的下一个氨基酸”现在是末端氨基酸并且可与元件接触以形成元件-氨基酸复合物。两个或更多个元件-氨基酸复合物可通过接头连接。

本发明还提供了用于对肽的至少一部分进行线性扩展的方法。在一些实施方案中，所述方法包括使肽与结合元件接触，所述结合元件与肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物，使元件-肽复合物系链至基底；从肽切割元件-肽复合物以形成与基底结合的元件-氨基酸复合物，其中元件包含为肽的下一个氨基酸提供连接点的接头，或者将这样的接头添加至元件-氨基酸复合物中的元件上；再次使肽与结合元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物，使所述另外的元件-肽复合物系链至先前的元件-氨基酸复合物的接头；以及从肽切割元件-肽复合物，从而提供与基底结合的连接的元件-氨基酸复合物；其中氨基酸之间的距离已提高。在一些实施方案中，所述另外的元件-氨基酸复合物的元件包含接头，其中接头为肽的下一个氨基酸提供连接点。在一些实施方案中，所述方法包括将接头与所述另外的元件-氨基酸复合物中的元件连接，其中接头为肽的下一个氨基酸提供连接点。“肽的下一个氨基酸”现在是末端氨基酸并且可与元件接触以形成元件-氨基酸复合物。两个或更多个元件-氨基酸复合物可通过接头连接。在一些实施方案中，将所述方法重复一次或更多次。在一些实施方案中，所述方法包括对肽的全部氨基酸进行线性扩展。

本发明还提供了用于对样品中的独立地附接至基底上的连接点之两个或更多个肽的至少一部分进行线性扩展的方法。在一些实施方案中，所述方法包括使两个或更多个肽与结合元件接触，所述结合元件与每个肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物，使元件-肽复合物系链至基底；从肽切割元件-肽复合物以形成与基底结合的元件-氨基酸复合物，其中元件包含为肽的下一个氨基酸提供连接点的接头，或者将这样的接头添加至元件-氨基酸复合物中的元件上；再次使肽与结合元件接触，以与肽的下一个、当前末端氨基酸形成另外的元件-肽复合物，使所述另外的元件-肽复合物系链至先前的与基底结合的元件-氨基酸复合物的接头；以及从肽切割元件-肽复合物，从而提供与基底结合的连接的元件-氨基酸复合物；其中氨基酸之间的距离已提高。

在一些实施方案中，另外的元件-氨基酸复合物的元件包含接头，其中接头为肽的下一个氨基酸提供连接点。在一些实施方案中，所述方法包括将接头与所述另外的元件-氨基酸复合物中的元件连接，其中接头为肽的下一个氨基酸提供连接点。“肽的下一个氨基酸”现在是末端氨基酸并且可与元件接触以形成元件-氨基酸复合物。两个或更多个元件-氨基酸复合物可通过接头连接。在一些实施方案中，将所述方法重复一次或更多次。在一些实施方案中，所述方法包括对肽的全部氨基酸进行线性扩展。在本发明的一些实施方案中，结合元件包含接头，所述接头在已从元件-肽复合物切割肽之后为肽的下一个氨基酸提供连接点。在一些实施方案中，所述方法还包括将接头与元件-氨基酸复合物中的元件连接，并且接头在已从元件-肽复合物切割肽之后为肽的下一个氨基酸提供连接点。因此，称为下一个氨基酸的氨基酸是在已从元件-肽复合物切割肽之后该肽的末端氨基酸。在一些实施方案中，本发明的方法还包括在已从元件-肽复合物切割肽之后将肽的下一个氨基酸与接头连接。作为结果，肽的下一个氨基酸是元件-氨基酸复合物的一部分。

在本文中公开的任何方法的实施方案中，所述方法任选地包括在从肽切割元件-肽复合物的步骤之前洗去过量和/或未结合的结合元件。一旦肽的一部分或肽的全部氨基酸已通过本文中所述的任何方法扩展，则可通过本领域已知的任何合适的方法对经扩展肽进行测序。用于蛋白质测序的检测方法包括但不限于纳米孔、离子电流纳米孔、隧穿电流纳米孔、原子力显微术、蛋白质结合剂、适配体结合剂，多聚体结合剂、DNA-paint和化学缀合。

在一个实施方案中，检测和/或鉴定元件-氨基酸复合物的氨基酸包括使元件-氨基酸复合物与元件-氨基酸复合物结合剂接触，其中元件-氨基酸复合物结合剂与元件-氨基酸复合物或元件-氨基酸复合物的亚组结合；以及检测与元件-氨基酸复合物结合的元件-氨基酸复合物结合剂。检测结合剂与元件-氨基酸复合物的结合允许鉴定肽的末端氨基酸。

在一个实施方案中，检测和/或鉴定元件-氨基酸复合物的氨基酸包括使元件-氨基酸复合物与多个元件-氨基酸复合物结合剂接触，其中每个元件-氨基酸复合物结合剂优先与特定元件-氨基酸复合物或元件-氨基酸复合物的亚组结合；以及检测与元件-氨基酸复合物结合的元件-氨基酸复合物结合剂。通过检测与元件-氨基酸复合物结合的元件-氨基酸复合物结合剂允许鉴定肽的末端氨基酸或氨基酸亚组。在一些实施方案中，每个元件-氨基酸复合物结合剂优先与特定元件-氨基酸复合物结合。在一些实施方案中，每个元件-氨基酸复合物结合剂与元件-氨基酸复合物的亚组结合。

已经确定本文中所述的结合元件和元件-氨基酸复合物结合剂可用于通过鉴定肽的末端氨基酸来产生序列信息。本发明人还确定了通过首先使肽分子附接至基底，可通过迭代地检测在基底上相同位置的元件-氨基酸复合物来确定经固定肽的序列。

在一个实施方案中，检测和/或鉴定元件-氨基酸复合物的氨基酸可包括通过光波长的直接检测。在一个实施方案中，检测来自单一元件-氨基酸复合物的拉曼光谱(Ramanspectrum)来鉴定复合物。在一个实施方案中，表面增强的拉曼光谱术用于检测和/或鉴定元件-氨基酸复合物。在一个实施方案中，每个元件-氨基酸复合物的拉曼光谱可彼此区分。在一个实施方案中，每个元件-氨基酸复合物的拉曼光谱可部分地彼此区分。在一些实施方案中，金或银可沉积在基底上作为用于拉曼光谱术的表面增强形式。在一个实施方案中，用于拉曼光谱术的表面增强是与元件-氨基酸复合物相互作用的纳米粒。在一个实施方案中，纳米粒与元件-氨基酸复合物的相互作用是共价、亲水或疏水相互作用，但不限于此。

在本文中公开的任何化合物、组合物和/或方法的一些实施方案中，结合元件是ClickT化合物。

本文中使用的术语“肽”、“多肽”或“蛋白质”在本文中可互换使用并且是指通过肽键连接在一起的两个或更多个氨基酸。术语“肽”、“多肽”或“蛋白质”包括在来源上是合成的或天然存在的肽。本文中使用的“肽的至少一部分”是指肽的两个或更多个氨基酸。在一些实施方案中，肽的一部分包含肽的完整氨基酸序列或肽的全部氨基酸序列的连续的或带空位的至少2、3、4、5、6、7、8、9、10、15、20、30或50(包括2至50之间的任一整数)个氨基酸。

短语“N末端氨基酸”是指具有游离胺基并且仅通过肽中的肽键与另一个氨基酸连接的氨基酸。短语“N末端氨基酸衍生物”是指经化学修饰(例如在体外通过Edman试剂或其他化学物质或者在细胞内通过天然翻译后修饰(例如磷酸化)机制)的N末端氨基酸残基或者合成氨基酸。

短语“C末端氨基酸”是指具有游离羧基并且仅通过肽中的肽键与另一个氨基酸连接的氨基酸。短语“C末端氨基酸衍生物”是指经化学修饰(例如在体外通过化学试剂或在细胞内通过天然翻译后修饰(例如磷酸化)机制)的C末端氨基酸残基或者合成氨基酸。

短语“元件-氨基酸复合物的亚组”是指由相同的元件-氨基酸复合物结合剂结合的一组氨基酸。在最广泛的含义中，氨基酸或亚组的身份编码在结合剂中。如果结合剂对一种氨基酸不是特异性的，则可例如以某种统计学规律与两种或三种氨基酸结合。这种类型的信息仍然与蛋白质鉴定相关，因为缩小了氨基酸的可能性仍然与数据库检索相关。氨基酸身份和结合变化是基于可影响结合剂特异性的特征如极性、结构、官能团和电荷。总的来说，该组是基于结合剂特异性及其代表的内容。结合剂可等同地或以不同的置信度结合两种或更多种氨基酸，仍然提供序列信息。

本文中使用的结合剂与元件-氨基酸复合物或元件-氨基酸复合物的亚组结合是指结合剂与元件-氨基酸复合物之间的任何共价或非共价相互作用。在一个实施方案中，结合是共价的。在一个实施方案中，结合是非共价的。

本文中使用的“对肽进行测序”是指确定肽的氨基酸序列。该术语还指确定肽的区段的序列或确定肽的部分序列信息。对肽进行部分测序在映射回可用数据库时仍然是强大的并且足以区分蛋白质身份。例如，可通过对蛋白质的六(6)个连续末端氨基酸进行测序，独特地鉴定90％的人蛋白质组。在元件-氨基酸复合物结合剂与元件-氨基酸复合物的亚组结合的情况下，结合剂可不提供末端氨基酸的确切身份，而是提供合理的亚组身份。当映射回可用数据库时，合理的序列身份信息仍然是强大的并且足以区分蛋白质身份。

本文中使用的“附接”是指肽与基底之间的连接，该连接使得肽的至少一部分与基底保持物理邻近度。术语“附接”或“系链”涵盖间接或直接连接二者，并且可以是可逆或不可逆的，例如，连接任选地是共价键或非共价键。

在一个实施方案中，基底是平坦的平面表面。在另一个实施方案中，基底是三维的并且表现出表面特征。在一个实施方案中，表面是官能化表面。在一些实施方案中，基底是化学衍生的载玻片或二氧化硅晶片。在一个实施方案中，基底可以是肽本身。

本文中使用的“切割肽的N末端氨基酸或N末端氨基酸衍生物”是指化学和/或酶促反应，凭借其从肽除去N末端氨基酸或N末端氨基酸衍生物，而肽的剩余部分保持附接至基底。

本文中使用的“切割肽的C末端氨基酸或C末端氨基酸衍生物”是指化学和/或酶促反应，凭借其从肽除去C末端氨基酸或C末端氨基酸衍生物，而肽的剩余部分保持附接至基底。

本文中使用的术语“样品”包括包含一种或更多种多肽的任何材料。样品可以是生物样品，例如活检、血液、血浆、器官、细胞器、细胞提取物、分泌物、尿液或黏液、组织提取物以及其他天然来源或合成来源的流体的生物样品。术语“样品”还包括单一细胞。样品可来源于已暴露于分析物(例如药物)或者经受环境条件、遗传扰动、或其组合的细胞、组织、生物体或个体。生物体或个体可包括但不限于哺乳动物，例如人或小动物(例如大鼠和小鼠)。在一些实施方案中，样品是来自植物的生物样品。

在一个实施方案中，官能化表面上的连接点是空间分辨的。本文中使用的术语“空间分辨的”是指两种或更多种多肽在基底上的排列，其中在一种多肽处发生的化学或物理事件可与在第二多肽处发生的那些区分开。例如，如果来自与多肽中的一种结合的可检测标记的信号可在基底上的特定位置被明确地分配至多肽中的一种，则附接在基底上两种多肽是空间分辨的。

在一个实施方案中，使待测序的肽附接至基底。在一些实施方案中，基底由例如玻璃、石英、二氧化硅、塑料、金属、水凝胶、复合材料(composite)、或其组合的材料制成。在一个实施方案中，基底是平坦的平面表面。在另一个实施方案中，基底是三维的。在一些实施方案中，基底是化学衍生的载玻片或二氧化硅晶片。

在一个实施方案中，基底由基本上不影响本文中所述测序试剂和测定的材料制成。在一个实施方案中，基底对用于Edman降解的碱性和酸性pH、化学物质和缓冲剂具有抗性。基底还可覆盖有涂层。在一些实施方案中，涂层对Edman降解中使用的化学反应和条件具有抗性。在一些实施方案中，涂层提供用于使多肽附接至基底和/或排斥非特异性探针吸附的连接点。在一些实施方案中，涂层提供用于系链元件-肽复合物的连接点。

在一些实施方案中，基底的表面对多肽或碎片的非特异性黏附具有抗性，以在检测探针时使背景信号最小化。

在一个实施方案中，基底由光学透明的材料制成。本文中使用的“光学透明”是指这样的材料，其允许光穿过材料。在一个实施方案中，基底是最小自体荧光的或非自体荧光的。

在一个实施方案中，使肽附接至基底。在一个实施方案中，使肽附接至基底，使得肽的N末端或C末端是游离的，以允许结合元件的结合。因此，在一些实施方案中，肽通过肽的N末端或C末端、肽的N末端胺或C末端羧酸基团附接至基底。在一些实施方案中，基底包含一个或更多个允许肽待附接至基底的连接点。

在一个实施方案中，使肽附接至基底，使得肽的C末端是游离的，以允许结合元件的结合。因此，在一些实施方案中，肽通过肽的N末端、肽的N末端胺基或侧链官能团附接至基底。在一些实施方案中，基底包含一个或更多个允许多肽待附接至基底的连接点。

在一些实施方案中，肽通过共价键附接至表面。例如，基底的表面可包含聚乙二醇(polyethylene glycol，PEG)或基于碳水化合物的涂层，并且肽通过N-羟基琥珀酰亚胺(N-hydroxysuccinimide，NHS)酯PEG接头附接至表面。

用于将接头和肽与基底连接的多种不同的化学物质是本领域已知的，例如，但并非旨在限制，通过使用包含醛硅烷、环氧硅烷或其他受控反应部分的专用涂层。在一个实施方案中，将基底用硅烷或相关试剂玻璃涂覆，并且多肽通过暴露的赖氨酸残基通过席夫碱(Schiff’s base)键联附接至基底。

在一些实施方案中，肽非共价附接至基底。例如，在一个实施方案中，肽的C末端与生物素缀合，并且基底包含亲和素或相关分子。在另一个实施方案中，肽的C末端与和基底表面上的抗体结合的抗原缀合。在另一个实例中，肽的N末端与生物素缀合，并且基底包含亲和素或相关分子。在另一个实施方案中，肽的N末端与和基底表面上的抗体结合的抗原缀合。

本领域已经描述了适合于使多肽附接至基底的另外的偶联剂(参见例如AthenaL.Guo和X.Y.Zhu.The Critical Role of Surface Chemistry In Protein Microarraysin Functional Protein Microarrays in Drug Discovery)。

在一个实施方案中，提供了优先与特定元件-氨基酸复合物或元件-氨基酸复合物的亚组结合的元件-氨基酸复合物结合剂。本文中使用的短语“优先与特定ClickT-氨基酸复合物或元件-氨基酸复合物的亚组结合”是指与其他特定元件-氨基酸复合物或元件-氨基酸复合物的亚组相比对特定元件-氨基酸复合物或元件-氨基酸复合物的亚组具有更大亲和力的结合剂。如果结合剂与特定元件-氨基酸复合物或元件-氨基酸复合物的亚组的结合存在可检测的相对提高，则元件-氨基酸复合物结合剂优先结合靶元件-氨基酸复合物或元件-氨基酸复合物的亚组。

在一个实施方案中，优先与特定元件-氨基酸复合物或元件-氨基酸复合物的亚组结合的结合剂用于鉴定肽的N末端氨基酸。在一个实施方案中，优先与特定元件-氨基酸复合物或元件-氨基酸复合物的亚组结合的结合剂用于对肽进行测序。在一些实施方案中，结合剂是可检测的并具有单分子灵敏度。

在一个实施方案中，优先与特定元件-氨基酸复合物或元件-氨基酸复合物的亚组结合的结合剂用于鉴定肽的C末端氨基酸。在一个实施方案中，优先与特定元件-氨基酸复合物或元件-氨基酸复合物的亚组结合的结合剂用于对肽进行测序。在一些实施方案中，结合剂是可检测的并具有单分子灵敏度。

在一个实施方案中，提供了选择性地与元件-氨基酸复合物或元件-氨基酸衍生物复合物结合的结合剂。本文中使用的短语“选择性地与特定元件-氨基酸复合物结合”是指与其他元件-氨基酸复合物相比，对特定元件-氨基酸复合物具有更大亲和力的结合剂。如果结合剂与特定元件-氨基酸复合物的结合存在可检测的相对提高，则元件-氨基酸复合物结合剂选择性地结合靶元件-氨基酸复合物。

在一个实施方案中，选择性地与元件-氨基酸复合物或元件-氨基酸衍生物复合物结合的结合剂用于鉴定肽的N末端氨基酸和/或本发明的经扩展肽中的任何氨基酸。在一个实施方案中，选择性地与元件-氨基酸复合物或元件-氨基酸衍生物复合物结合的结合剂用于对多肽进行测序。在一些实施方案中，结合剂是可检测的并具有单分子灵敏度。

在一个实施方案中，选择性地与元件-氨基酸复合物或元件-氨基酸衍生物复合物结合的结合剂用于鉴定肽的C末端氨基酸和/或本发明的经扩展肽中的任何氨基酸。在一个实施方案中，选择性地与元件-氨基酸复合物或元件-氨基酸衍生物复合物结合的结合剂用于对肽进行测序。在一些实施方案中，结合剂是可检测的并具有单分子灵敏度。

靶向并识别特定元件-氨基酸复合物或元件-氨基酸复合物的亚组的元件-氨基酸结合剂可以是蛋白质或肽、核酸、化学物质或组合。结合剂还可包含含有非经典氨基酸和合成核苷酸的组分。在一个实施方案中，蛋白质结合剂可以是但不限于抗体或酶，例如肽酶、蛋白酶、氨酰基tRNA合成酶、肽或转运蛋白(如脂质运载蛋白)。在一个实施方案中，抗体是多克隆抗体。在一个实施方案中，抗体是单克隆抗体。在一个实施方案中，核酸结合剂可以是但不限于适配体DNA、RNA或合成核苷酸的混合物。适配体是具有结合特性的DNA/RNA。在一个实施方案中，化学结合剂可以是但不限于氨基酸反应性化学物质(例如马来酰亚胺和NHS酯)、具有2个或更多个不同官能团的杂官能化学物质、或非共价结合超分子化学。

在一个实施方案中，多种结合剂可包含20种结合剂，其各自选择性地与20种天然蛋白原性氨基酸中的一种结合。在另一个实施方案中，结合剂包含20种结合剂，其各自选择性地与和结合元件复合的20种天然蛋白原性氨基酸中的一种结合。在一个实施方案中，衍生物为苯基硫代氨基甲酰基衍生物。在另一个实施方案中，结合剂包含选择性地与和结合元件复合的经翻译后修饰的氨基酸或其衍生物结合的结合剂。在一个实施方案中，结合剂包含选择性地与和结合元件复合的合成氨基酸或其衍生物结合的结合剂。

检测与元件-氨基酸复合物结合的结合剂可通过本领域技术人员已知的任何检测方法来完成。

在一个实施方案中，结合剂包含可检测标记。适合于本发明使用的可检测标记包括但不限于可作为单分子检测的标记。

在一个实施方案中，通过使结合剂与结合剂特异性抗体接触来检测结合剂，并随后检测结合剂特异性抗体。

在一些实施方案中，使用磁脉冲或信号或者电脉冲或信号来检测结合剂或标记。

在一些实施方案中，结合剂上的标记是寡核苷酸。寡核苷酸标记通过本领域技术人员已知的任何方法读出。

在一个实施方案中，通过生物或合成纳米孔经由电脉冲或信号来检测结合剂。

在一个实施方案中，标记是光学可检测的，例如包含荧光部分的标记。光学可检测标记的实例包括但不限于包含聚苯乙烯壳的荧光染料，所述聚苯乙烯壳涵盖核心染料例如FluoSpheres^TM、尼罗红(Nile Red)、荧光素、罗丹明(rhodamine)、衍生的罗丹明染料(例如TAMRA)、磷光体、polymethadine染料、荧光亚磷酰胺、德克萨斯红(TEXAS RED)、绿色荧光蛋白、吖啶、花青、花青5染料、花青3染料、5-(2’-氨基乙基)-氨基萘-1-磺酸(EDANS)、BODIPY、120ALEXA或任一前述衍生物或修饰。另外的可检测的标记包括颜色编码的纳米粒、或量子点或FluoSpheres^TM。在一个实施方案中，可检测标记对光漂白具有抗性同时在独特并且易检测的波长下产生大量信号(例如光子)，具有高信噪比。

使用本领域技术人员已知的技术可将一种或更多种可检测标记与本文中所述的结合剂试剂缀合。在一个实施方案中，将特定的可检测标记(或标记的组合)与相应的结合试剂缀合，从而通过检测标记来鉴定结合试剂。例如，一种或更多种可检测标记可直接或间接地与本文中所述的结合试剂缀合。

检测与附接至基底的元件-氨基酸复合物结合的结合剂，从而鉴定多肽或蛋白质的末端氨基酸。在一个实施方案中，通过检测与结合剂缀合的可检测标记(或标记的组合)来鉴定结合剂。因此，适合于检测本文中所述结合剂的方法取决于所述方法中使用的可检测标记的性质。

在一个实施方案中，在基底上使用高分辨率光栅激光/扫描仪跨预定网格、独特位置或路径在该位置重复检测结合剂或标记。这些方法可用于在本文中所述方法的每个测序循环期间在相同坐标处精确且重复检测信号。在一些实施方案中，使多肽随机地附接至基底，并且探针的检测通过重复扫描基底来进行，以鉴定与附接至基底的多肽结合之探针的坐标和身份。

在一个实施方案中，检测结合剂包括超灵敏检测系统，其能够重复检测来自基底上精确相同坐标的信号，从而将检测的序列信息分配至附接在该坐标处的独特多肽分子。

在一个实施方案中，使用光学检测系统来检测结合剂。光学检测系统包括电荷耦合装置(charge-coupled device，CCD)、近场扫描显微术、远场共聚焦显微术、宽场落射照明(wide-field epi-illumination)、光散射、暗场显微术、光转换、单和/或多光子激发、光谱波长区分、荧光团鉴定、倏逝波照明(evanescent wave illumination)、全内反射荧光(total internal reflection fluorescence，TIRF)显微术、超分辨率荧光显微术和单分子定位显微术。一般来说，方法涉及使用有时称为高效光子检测系统的配备有相机的显微镜来检测激光激活的荧光。合适的光子检测系统包括但不限于光电二极管和增强型CCD相机。

在一个实施方案中，适合于荧光探针的单分子检测的技术的实例包括共聚焦激光(扫描)显微术、宽场显微术、近场显微术、荧光寿命成像显微术、荧光相关光谱术、荧光强度分布分析、测量由荧光的猝灭/去猝灭或荧光能量转移引起的亮度变化。

在一个实施方案中，从肽切割结合元件复合物。在一个实施方案中，切割暴露肽上的下一个、相邻氨基酸的末端，相邻氨基酸凭借该末端可用于与结合元件反应。任选地，肽被顺序切割直至肽中的最后氨基酸。

在一些实施方案中，C末端氨基酸共价附接至基底并且不从基底切割。在一个实施方案中，切割暴露肽上相邻氨基酸的N末端，相邻氨基酸凭借该N末端可用于与结合元件反应。任选地，肽被顺序切割直至肽中的最后氨基酸(C末端氨基酸)。

在一些实施方案中，N末端氨基酸共价附接至基底并且不从基底切割。在一个实施方案中，切割暴露肽上相邻氨基酸的C末端，相邻氨基酸凭借该C末端可用于与结合元件反应。任选地，肽被顺序切割直至肽中的最后氨基酸(N末端氨基酸)。

在一个实施方案中，使用顺序末端降解来切割肽的N末端氨基酸。在一个实施方案中，使用顺序末端降解来切割肽的C末端氨基酸。降解通常包括两个步骤，偶联步骤和切割步骤。这些步骤可反复重复，每次除去肽的暴露的末端氨基酸残基。

在一个实施方案中，末端降解通过在升高的pH下使肽与合适的试剂(例如PITC或PITC类似物)接触来进行以形成N末端苯基硫代氨基甲酰基衍生物。降低pH(例如通过添加三氟乙酸)导致从多肽切割N末端氨基酸苯基硫代戊基衍生物以形成游离的苯胺基硫唑啉酮(anilinothiozolinone，ATZ)衍生物。该ATZ衍生物可被检测。在一个实施方案中，ATZ衍生物可通过暴露于酸而转化为苯基乙内酰硫脲(phenylthiohydantoin，PTH)衍生物。该PTH衍生物可被检测。在一个实施方案中，ATZ衍生物和PTH衍生物可通过暴露于还原剂而转化为苯基硫代氨基甲酰基(phenylthiocarbamyl，PTC)衍生物。该PTC衍生物可被检测。在一个实施方案中，控制基底环境的pH以控制管理偶联和切割步骤的反应。

在一些实施方案中，末端降解通过在用乙酸酐活化之后使肽与合适的试剂(例如硫氰酸铵)接触的方式进行，以形成C末端肽基乙内酰硫脲衍生物。用路易斯酸(LewisAcid)降低pH，通过从多肽产生烷基化乙内酰硫脲(alkylated thiohydantoin，ATH)离去基团以形成游离的乙内酰硫脲衍生物而导致切割C末端氨基酸肽基乙内酰硫脲衍生物。该ATH衍生物可被检测。在一个实施方案中，ATH衍生物可通过暴露于酸而转化为乙内酰硫脲衍生物。该乙内酰硫脲衍生物可被检测。在一个实施方案中，控制基底环境的pH以控制管理偶联和切割步骤的反应。

在一个实施方案中，重复以下步骤以便对肽的氨基酸之间的距离进行线性扩展：使肽与ClickT化合物接触，其中ClickT化合物与N末端氨基酸或N末端氨基酸衍生物结合以形成ClickT-肽复合物；使ClickT-肽复合物系链至基底；从肽切割ClickT-肽复合物，产生与基底结合的ClickT-氨基酸复合物。任选地，将所述步骤重复至少2、5、10、20、30、50、或大于50次，以便对肽的一部分或完整肽进行线性扩展。

在一个实施方案中，重复以下步骤以便对肽的氨基酸之间的距离进行线性扩展：使肽与ClickT化合物接触，其中ClickT化合物与C末端氨基酸或C末端氨基酸衍生物结合以形成ClickT-肽复合物；使ClickT-肽复合物系链至基底；从肽切割ClickT-肽复合物，产生与基底结合的ClickT-氨基酸复合物。任选地，将所述步骤重复至少2、5、10、20、30、50、或大于50次，以便对肽的一部分或完整肽进行线性扩展。

在一个实施方案中，所述方法还包括在以下中的任一个步骤之前或之后洗涤或冲洗基底：附接基底、使肽与结合元件接触、使元件-肽复合物系链至基底；或者从肽切割元件-肽复合物。洗涤或冲洗基底除去基底上可干扰所述方法下一步骤的废产物例如碎片或先前未使用的试剂。

本文中所述的方法允许在单个基底或一系列基底上对大量肽分子进行测序。因此，本发明的一个方面提供了对最初存在于样品中的多个所附接肽进行测序。在一个实施方案中，样品包含细胞提取物或组织提取物。在一些实施方案中，本文中所述的方法可用于分析单个细胞中包含的肽。在另一个实施方案中，样品可包含生物流体，例如血液、尿液或黏液。土壤、水或含有混合生物体群落的其他环境样品也适合于分析。

在一个实施方案中，样品包含合成的合成肽的混合物。

在本说明书的一个实施方案中，所述方法包括将每个肽的序列与参考蛋白质序列数据库进行比较。在一些实施方案中，包含10至20个或更少所测序的氨基酸残基的小片段可用于检测样品中肽的身份。

在一个实施方案中，所述方法包括肽的从头测序，以产生关于肽的序列信息。在另一个实施方案中，所述方法包括确定部分序列或氨基酸模式，并随后将部分序列或氨基酸模式与序列数据库中包含的参考序列或模式进行匹配。

在一个实施方案中，所述方法包括将由所述方法产生的序列数据用作分子指纹或用于在其他生物信息学程序中，以鉴定样品的特征，例如细胞类型、组织类型或生物体身份。

另外，由于附接至基底的每个肽被任选地单独监测，因此所述方法可用于蛋白质表达的定量分析。例如，在一些实施方案中，所述方法包括对每个肽的序列进行比较、对相似肽序列进行分组以及对每个相似肽序列的出现次数进行计数。因此，本文中所述的方法可用于对样品中肽的数目或样品中肽的特定种类进行定量或分子计数。

在另一个实施方案中，使用本文中所述的方法对交联肽进行测序。例如，可使交联蛋白质附接至基底，并随后结合两个或更多个N末端氨基酸并进行测序。检出的重叠信号对应于在该位置各自结合两个或更多个末端氨基酸的结合剂。在一个实施方案中，可通过计算算法和DB检索来推导或去卷积两个多路复用/混合序列。

在另一个实施方案中，本文中所述的方法可用于磷肽的分析和测序。例如，通过金属螯合物化学将包含磷肽的样品中的多肽附接至基底。并随后根据本文中所述的方法对磷多肽进行测序，从而提供磷蛋白组的序列和定量信息。

另外的多路复用单分子读出和荧光扩增方案可涉及将结合剂与DNA条码缀合以及用杂交链反应(hybridized chain reaction，HCR)扩增。HCR涉及包含荧光团的DNA纳米结构的引发的自组装，并提供具有高信号与背景的多路复用、等温、无酶的分子信号扩增。HCR和分支DNA扩增可允许大量荧光团以单一条码精度被靶标。

实施例

实施例1：用于氨基酸识别的试剂(ClickT-氨基酸复合物的“结合剂”)

单分子肽或蛋白质序列固有地涉及阐明氨基酸组成和顺序。所有氨基酸都是包含胺(-NH2)和羧基(-COOH)官能团的有机小分子化合物，通过其各自的侧链(R基团)进行区分。鉴定所有20种氨基酸的能力需要一组能够以高特异性区分其分子结构的试剂或方法。

基于ClickT的氨基酸分离解决了“局部环境”问题，其被定义为由于相邻氨基酸的可变性而干扰结合剂与特定末端氨基酸结合的能力。通过用ClickT除去局部环境问题，结合剂旨在靶向ClickT-氨基酸复合物而不是末端氨基酸。

为了获得更具选择性的结合剂，ClickT-氨基酸复合物的部分可用作用于开发具有高亲和力和特异性之抗体的小分子。

在一种方法中，可将ClickT-氨基酸复合物注射到兔中，以引发针对该化合物的免疫应答，并从而引发与ClickT-氨基酸复合物结合的抗体的产生。

在下游，将对通过兔杂交瘤技术产生的单克隆抗体的亲和力、特异性和交叉反应性进行测试。将使用酶联免疫吸附测定(enzyme-linked immunosorbent assay，ELISA)29对由不同克隆分泌的抗体针对交叉反应性进行测定，并将使用用于测量蛋白质-配体相互作用动力学的无标记法生物层干涉术(BioLayer Interferometry，BLI)30针对亲和力进行测量。

如果抗体对ClickT结合的氨基酸没有表现出稳健的亲和力或特异性，则可使用定向进化方法用于提高抗体的亲和力和特异性。可使用酵母展示将抗体结合剂进行工程化以靶向用ClickT分离的每个氨基酸，酵母展示是这样的蛋白质工程技术，其使用并入到酵母细胞壁中的重组蛋白质的表达来筛选和进化高亲和力配体。酵母展示已被用于成功地使靶向具有高亲和力的小分子的抗体工程化。从兔杂交瘤产生的克隆可用于在酵母中构建抗体文库。该文库已经具有对ClickT靶标的偏倚，因此通过诱变的定向进化可引入具有改善特性的新的抗体变体。酵母展示还能够进行阴性选择，这有助于除去与其他靶标发生交叉反应的抗体。阴性选择将涉及用与非靶标抗原缀合的磁珠来孵育表达抗体文库的酵母并将其从溶液中拉出。例如，当靶向与一种特定氨基酸结合的ClickT时，可针对其他19种氨基酸进行阴性选择以提高高特异性结合剂的几率。

并行地，在杂交瘤技术没有产生任何靶向ClickT结合的氨基酸的抗体的情况下，可探索其他结合剂例如酶或核酸适配体。存在20种识别其各自氨基酸的氨酰基-tRNA合成酶。氨酰基-tRNA合成酶或自然界中的任何其他氨基酸结合蛋白可用作酵母展示上的支架蛋白，并进行定向进化以针对各自ClickT结合的氨基酸的特异性和亲和力进行选择。DNA/RNA适配体是能够以高特异性和亲和力来结合多种分子的单链寡核苷酸。确定了RNA能够形成针对游离氨基酸的特异性结合位点并且已经进化出RNA适配体以通过随机RNA库的重复轮次的体外选择扩增技术来改变其结合特异性。

抗体结合剂可简单地具有缀合的荧光团，或与一抗结合的荧光团缀合的二抗，增强了荧光强度。

在产生用于靶向ClickT结合的氨基酸的结合剂之后，将对肽、蛋白质和细胞裂解物实施测序方案和成像平台。

实施例2：蛋白质组的成像和规模化

可通过整合N末端氨基酸的ClickT分离的全部组分、用ClickT-氨基酸特异性结合剂进行标记、成像和随后的氨基酸鉴定的循环来鉴定氨基酸。足够的氨基酸鉴定循环将提供蛋白质测序信息。

将首先使肽固定至基底。例如，在N末端测序中，将首先使肽通过C末端以羧基交联化学进行固定。接下来，ClickT与肽的N末端氨基酸结合并系链至官能化基底。在N末端切割之后，用结合剂标记经分离的ClickT结合的氨基酸并进行成像。

尽管已经参照本发明的优选实施方案具体示出和描述了本发明，但是本领域技术人员将理解，可在不脱离由所附权利要求书涵盖的本说明书的范围的情况下对其中的形式和细节进行多种改变。

Claims

1.用于对肽进行线性扩展的方法，其包括：

(a)使所述肽与结合元件接触，所述结合元件与所述肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物；

(b)使所述元件-肽复合物系链至基底；以及

(c)从所述肽切割所述元件-肽复合物，产生与所述基底结合的元件-氨基酸复合物。

2.用于对两个或更多个肽进行线性扩展的方法，其包括：

(a)使所述两个或更多个肽与结合元件接触，所述结合元件与所述两个或更多个肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物；

(b)使所述元件-肽复合物系链至所述基底；以及

3.根据权利要求1或2所述的方法，其中所述结合元件包含为所述肽的下一个氨基酸提供连接点的接头。

4.根据权利要求1或2所述的方法，其还包括(d)将接头与另外的元件-氨基酸复合物中的元件连接，其中所述接头为所述肽的下一个氨基酸提供连接点。

5.根据权利要求3或4所述的方法，其中所述肽的下一个氨基酸是元件-氨基酸复合物的一部分。

6.根据权利要求1至5中任一项所述的方法，其中所述结合元件与所述肽的N末端氨基酸或N末端氨基酸衍生物结合以形成元件-肽复合物。

7.根据权利要求1至5中任一项所述的方法，其中所述结合元件与所述肽的C末端氨基酸或C末端氨基酸衍生物结合以形成元件-肽复合物。

8.根据权利要求1至7中任一项所述的方法，其中在步骤(b)或(c)之前洗去过量和/或未结合的结合元件。

9.根据权利要求3所述的方法，其中步骤(a)至(c)重复一次或更多次。

10.根据权利要求9所述的方法，其中针对所述肽的全部氨基酸重复步骤(a)至(c)。

11.根据权利要求4所述的方法，其中步骤(a)至(d)重复一次或更多次。

12.根据权利要求11所述的方法，其中针对所述肽的全部氨基酸重复步骤(a)至(d)。

13.根据权利要求1所述的方法，其中，在(a)之前，使所述肽附接至基底。

14.根据权利要求2所述的方法，其中，在(a)之前，使所述两个或更多个肽独立地附接至基底。

15.根据权利要求14所述的方法，其中所述两个或更多个肽是相同的。

16.根据权利要求14所述的方法，其中所述两个或更多个肽是不同的。

17.根据权利要求13至16中任一项所述的方法，其中所述肽通过所述肽的C’末端羧基或侧链官能团附接至所述基底。

18.根据权利要求13至16中任一项所述的方法，其中所述肽通过所述肽的N’末端羧基或侧链官能团附接至所述基底。

19.根据权利要求13至18中任一项所述的方法，其中所述肽共价附接至所述基底。

20.根据权利要求1至19中任一项所述的方法，其中所述基底是光学透明的。

21.根据权利要求1至20中任一项所述的方法，其中所述基底包含官能化表面。

22.根据权利要求21所述的方法，其中所述官能化表面选自经叠氮化物官能化表面、经硫醇官能化表面，炔烃、DBCO、马来酰亚胺、琥珀酰亚胺、四嗪、TCO、乙烯基、甲基环丙烯、伯胺表面、羧酸表面、DBCO表面、炔烃表面和醛表面。

23.用于对肽的至少一部分进行线性扩展的方法，其包括：

(b)使所述元件-肽复合物系链至基底；

(c)从所述肽切割所述元件-肽复合物以形成与所述基底结合的元件-氨基酸复合物，其中所述元件包含为所述肽的下一个氨基酸提供连接点的接头，或者将这样的接头添加至所述元件-氨基酸复合物中的元件上；

(d)使所述肽与结合元件接触，以与所述肽的下一个、当前末端氨基酸形成另外的元件-肽复合物，

(e)使所述另外的元件-肽复合物系链至(c)中元件-氨基酸复合物的接头；以及

(f)从所述肽切割所述元件-肽复合物，从而提供与所述基底结合的连接的元件-氨基酸复合物；

其中氨基酸之间的距离已提高。

24.用于对两个或更多个肽的至少一部分进行线性扩展的方法，其包括：

(a)使所述两个或更多个肽与结合元件接触，所述结合元件与所述肽的末端氨基酸或末端氨基酸衍生物相互作用以形成元件-肽复合物；

(b)使所述元件-肽复合物系链至所述基底；

(d)使所述两个或更多个肽与结合元件接触，以与所述肽的下一个、当前末端氨基酸形成另外的元件-肽复合物，

(e)使所述另外的元件-肽复合物系链至来自同一肽的(c)中元件-氨基酸复合物的接头；以及

其中氨基酸之间的距离已提高。

25.根据权利要求23或24所述的方法，其中所述结合元件包含为所述肽的下一个氨基酸提供连接点的接头。

26.根据权利要求23或24所述的方法，其还包括(d)将接头与所述另外的元件-氨基酸复合物中的元件连接，其中所述接头为所述肽的下一个氨基酸提供连接点。

27.根据权利要求23或24所述的方法，其中所述肽的下一个氨基酸是元件-氨基酸复合物的一部分。

28.根据权利要求23至27中任一项所述的方法，其中所述结合元件与所述肽的N末端氨基酸或N末端氨基酸衍生物结合以形成元件-肽复合物。

29.根据权利要求23至27中任一项所述的方法，其中所述结合元件与所述肽的C末端氨基酸或C末端氨基酸衍生物结合以形成元件-肽复合物。

30.根据权利要求23至29中任一项所述的方法，其中在步骤(b)或(c)之前洗去过量和/或未结合的结合元件。

31.根据权利要求23至30中任一项所述的方法，其中步骤(d)至(f)重复一次或更多次。

32.根据权利要求31所述的方法，其中针对所述肽的全部氨基酸重复步骤(d)至(f)。

33.根据权利要求23所述的方法，其中，在(a)之前，使所述肽附接至基底。

34.根据权利要求24所述的方法，其中，在(a)之前，使所述两个或更多个肽独立地附接至基底。

35.根据权利要求34所述的方法，其中所述两个或更多个肽是相同的。

36.根据权利要求34所述的方法，其中所述两个或更多个肽是不同的。

37.根据权利要求33至36中任一项所述的方法，其中所述肽通过所述肽的C’末端羧基或侧链官能团附接至所述基底。

38.根据权利要求33至36中任一项所述的方法，其中所述肽通过所述肽的N’末端羧基或侧链官能团附接至所述基底。

39.根据权利要求33至38中任一项所述的方法，其中所述肽共价附接至所述基底。

40.根据权利要求23至39中任一项所述的方法，其中所述基底是光学透明的。

41.根据权利要求23至40中任一项所述的方法，其中所述基底包含官能化表面。

42.根据权利要求41所述的方法，其中所述官能化表面选自经叠氮化物官能化表面、经硫醇官能化表面，炔烃、DBCO、马来酰亚胺、琥珀酰亚胺、四嗪、TCO、乙烯基、甲基环丙烯、伯胺表面、羧酸表面、DBCO表面、炔烃表面和醛表面。

43.根据任一前述权利要求所述的方法，其还包括对经线性扩展肽进行测序。

44.根据权利要求43所述的方法，其还包括将所述肽的序列与参考蛋白质序列数据库进行比较。

45.根据权利要求43所述的方法，其还包括对每个肽的序列进行比较、对相似肽序列进行分组以及对每个相似肽序列的出现次数进行计数。

46.根据权利要求2或24所述的方法，其中所述两个或更多个肽来自样品。

47.根据权利要求46所述的方法，其中所述样品包含生物流体、细胞提取物、组织提取物、或者合成的合成肽的混合物。

48.根据任一前述权利要求所述的方法，其中所述结合元件是ClickT化合物。

49.元件-氨基酸复合物，其包含：

(a)与20种天然蛋白原性氨基酸中的一种结合的结合元件；

(b)与经翻译后修饰的氨基酸结合的结合元件；或者

(c)与(a)或(b)的衍生物结合的结合元件。

50.元件-氨基酸复合物结合剂，其包含：

(a)结合剂，其与和该结合元件复合的20种天然蛋白原性氨基酸的亚组结合；

(b)结合剂，其与和该结合元件复合的经翻译后修饰的氨基酸的亚组结合；或者

(c)与(a)或(b)的衍生物结合的结合剂。

51.元件-氨基酸复合物结合剂，其包含：

(a)结合剂，其与和该结合元件复合的20种天然蛋白原性氨基酸中的一种结合；

(b)结合剂，其与和该结合元件复合的经翻译后修饰的氨基酸结合；或者

(c)与(a)或(b)的衍生物结合的结合剂。

52.根据权利要求50或51所述的结合剂，其还包含可检测标记。