CN101517416A

CN101517416A - 基于鉴定羧基端肽分析蛋白质样品的方法

Info

Publication number: CN101517416A
Application number: CNA2007800341019A
Authority: CN
Inventors: R·霍夫曼
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2006-09-14
Filing date: 2007-09-03
Publication date: 2009-08-26
Also published as: WO2008032235A3; RU2009113801A; US20100298153A1; JP2010503852A; EP2069797A2; BRPI0716767A2; WO2008032235A2

Abstract

本发明涉及用于基于分离和分析蛋白质的羧基端肽而鉴定一个或多个样品中蛋白质的方法。分离的肽得到纯化并通过质谱法分析。母蛋白的鉴定以所述羧基端肽的质量结合额外的物理化学参数为基础。本发明还涉及计算机切割蛋白质的羧基端肽的注释数据库，所述的注释数据库包含羧基端肽的质量及其一种或多种物理化学性质。

Description

基于鉴定羧基端肽分析蛋白质样品的方法

发明领域

本发明涉及使用质谱法同时分析蛋白质样品的方法，所述方法允许从切割的蛋白质混合物选择性分离肽。本发明进一步涉及纯化肽的技术和质谱数据的数据分析。

发明背景

在过去数十年，已经发展使用质谱法(MS)鉴定蛋白质的不同方法。在所谓的指纹法中，蛋白质被分离并切割成肽片段。通过比较所产生肽的质量和切割的蛋白质的计算机(in silico)数据库，可以鉴定母蛋白而无需进一步测定序列。

然而，本发明的目的在于使用鸟枪法在单次试验中研究样品中存在的不同蛋白质。常常通过选择性地分离含有内部半胱氨酸的肽来降低肽样品的复杂度。因为半胱氨酸并不是存在于每一种蛋白质中，所以开发可选策略来特异性地从产生的肽混合物中分离氨基端肽或羧基端肽。这样，每种蛋白质由一个肽代表。例如，在US 6,156,527(Schmidt)和US2002/0106700(Foote)中描述了基于分离羧基端肽的方法的实例。这种方法不允许基于鉴定来源于相同蛋白质的不同肽的经典指纹法。然而，它的优点在于能够确定地鉴定肽(并且因此鉴定其母蛋白(parent protein))，而没必要进行MS/MS肽测序。

US6,846,679(Schmidt)披露了一种选择羧基端肽并将这些肽的质量与羧基端肽的数据库进行比较的方法。该专利的实施例显示对于一组约1800个羧基端Lys-C肽，仅对于约45％的这些肽，可以明确地将质量与产生的Lys-C肽计算机数据库中的单一肽相关。

US2005/0092910(Geromanos)披露了一种确定在MS上肽的质量和该肽的另一物理化学性质的方法。该方法允许区分具有相同质量的肽。然而，考虑到分析完整样品的事实，仍然产生了具有相同质量及相同物理化学性质的众多不同肽，从而这样的肽不能归因于单一母蛋白。

因此，仍然需要其中复杂蛋白质样品可以通过MS来分析而无需对MS/MS上所产生的肽进行测序的高通量方法。

发明概述

本发明涉及基于切割蛋白质以及从其中分离和分析羧基端肽来分析蛋白质(包括存在于复杂蛋白质混合物中的蛋白质)的方法。在本发明的方法中，对分离的羧基端肽进行一个或多个肽纯化步骤并进行MS分析。在纯化过程期间或其后，收集纯化的肽的物理化学性质而不是其质量。通过MS确定纯化的羧基端肽的质量。基于与数据库的比较来鉴定肽，其中所述的数据库合并有羧基端肽的质量和一种或多种物理化学特性。在具体实施方案中，2种、3种、4种、5种或至多到10种额外物理化学特性用来注释该数据库。本发明的方法允许以高精确度确定地鉴定羧基端肽(及因此其相应的母蛋白)而无需在MS/MS上的从头测序。

选择羧基端肽的所述方法的优点在于每一种蛋白质在蛋白酶剪切后仅由单一肽代表，从而引起待分析样品以及含有这些肽的信息的相应数据库的复杂度大大降低。

所提出方法的另一个优点在于全部蛋白质的羧基端肽对于其基因组已经测序的生物是已知的，如人、小鼠和大鼠，并且还有低等生物例如果蝇(Drosophila)、秀丽隐杆线虫(C.elegans)和酵母。可以预测这些肽的精确分子量，预计这会支持作为所测得质谱信号基础的所述肽的鉴定。这对于目前可用的高效能质谱技术(如FT-ICR)尤其如此，该技术可以实现＞500,000数量级的分辨率，并且可以达到＜1ppm的质量精确度。

此外，由于从基因组序列的计算机分析已知预期羧基端肽的性质，产生合成肽文库并且可以确定制备过程期间每种肽的精确特性(例如在不同的层析材料上的保留时间、在ESI/MALDI-TOF中的表现)，并进行比较以鉴定来自所述复杂蛋白质混合物的肽。这显著地提高正确鉴定蛋白质的置信度。

本发明的又一优点在于羧基端肽在本发明的方法中保持未修饰状态(没有蛋白质组学中常见并干扰通过质谱法对肽作下游分析的烷基化和乙酰化)。因此，干扰使肽蒸发成气相的电离过程是不太可能的。

本发明方法的另一个优点是至少一部分的现存剪切变体，也即在蛋白质氨基端侧出现的那些剪接变体，可以通过其中分离并鉴定了较不可变的羧基端的本发明方法来定位。

本发明的具体和优选方面在后续的独立权利要求和从属权利要求中阐述。来自从属权利要求的特征可以与任意独立权利要求的特征以及视情况其它从属权利要求的特征组合，而不仅如所述权利要求中明确阐述那样。

本发明的第一方面提供用于鉴定蛋白质样品中蛋白质的方法。这些方法一般包括步骤：

a)修饰所述蛋白质样品中蛋白质的羧基，

b)使用切割剂将所述蛋白质样品中的蛋白质切割成肽，

c)从切割的肽中分离羧基端肽，从而除去氨基端肽及内部肽，

d)对分离的羧基端肽进行一个或多个肽纯化步骤，以获得纯化的羧基端肽，

e)确定或计算所述纯化羧基端肽的除质量以外的至少一种其它物理化学性质，

f)在MS上确定羧基端肽的质量，

g)将所述纯化羧基端肽的质量和所述至少一种其它物理化学性质与包含通过切割剂产生的全部羧基端肽的质量和一种或多种物理化学性质的数据库进行比较，以鉴定所述纯化羧基端肽的母蛋白。

根据本发明方法的一个实施方案，步骤(g)包括对于每种纯化的羧基端肽，鉴定在所述数据库中具有与所述纯化的羧基端肽相对应的质量的一种或多种羧基端肽，并且，当鉴定所述数据库中多于一种肽与一种纯化的羧基端肽相对应时，则将所述纯化羧基端肽的至少一种其它物理化学参数与所述数据库中鉴定到的所述多于一种肽的物理化学参数进行比较，从而明确地鉴定到所述数据库中的相应羧基端肽。

根据本发明这方面的方法的一个实施方案，所述蛋白质样品来自一个物种，并且所述数据库包含通过切割剂所产生的该物种全部羧基端肽的质量和一种或多种其它物理化学性质。

本发明方法的具体实施方案包括同时鉴定两个或多个样品中蛋白质的方法，并且所述方法因此包括以下附加特征：

-用一组差异性标记试剂中的一种差异性标记试剂在步骤(a)中进行修饰，所述试剂对每种所述样品是不同的，

-在步骤(d)之前收集所述两个或多个样品的额外步骤，

-在步骤(g)前鉴定所述分离肽的标记物的性质，从而鉴定所述肽从其中来源的样品，和

-在步骤(g)中将所述纯化羧基端肽的质量和至少一种其它物理化学性质与包含通过切割剂产生的全部羧基端肽的质量和至少一种其它物理化学性质的数据库进行比较，从而鉴定所述羧基端肽。

根据本发明方法的具体实施方案，所述至少一种物理化学性质在一个或多个肽纯化步骤期间确定。

根据本发明方法的具体实施方案，所述至少一种物理化学性质选自在反相层析法中的pI、保留时间以及在280nm和214nm处的UV吸收比。

在本发明方法的具体实施方案中，使用与伯胺的碳二亚胺反应来进行步骤(a)中的修饰。

在本发明方法的具体实施方案中，在步骤(c)中分离羧基端肽包括使氨基端肽及内部肽的羧基通过碳二亚胺介导的反应与携带伯胺基的修饰的生物素发生反应的步骤。

本发明的另一方面提供从蛋白质样品中分离羧基端肽的方法，所述方法包括步骤：

a)使样品中(完整的)蛋白质的羧基通过碳二亚胺与伯胺反应，

b)用切割剂将所述(完整的)蛋白质切割成肽，

c)使氨基端肽及内部肽的羧基通过碳二亚胺与携带伯胺基的亲和标签反应，

d)使所述带标签的肽与亲和基质结合，并收集未结合的肽(所述未结合的肽是未标记的肽)，由此从在(b)所获得的肽中将羧基端肽与氨基端肽及内部肽分离。

根据本发明此方面的具体实施方案，所述亲和标签是生物素。

本发明的另一方面涉及通过切割剂以计算机方式切割的生物蛋白质的羧基端肽的数据库，其中每种肽由蛋白质标识符、氨基酸组成、质量和一种或多种其它物理化学性质进行表征。

在具体实施方案中，该数据库中所述羧基端肽的一种或多种物理化学性质选自在反相层析法中的计算保留时间、在给定pH上的净电荷以及所述羧基端肽的等电点。

在具体实施方案中，该数据库是以计算机方式切割的人体蛋白质的数据库。

在进一步的具体实施方案中，该数据库基于用切割剂胰蛋白酶切割蛋白质。

在具体实施方案中，该数据库中的肽包括由所述切割剂不完全切割、由此丢失一个切割位置而产生的羧基端肽。

本发明的又一方面涉及数据库在用于鉴定蛋白质的如上所述方法中的应用。

本发明的又一方面提供一种基于蛋白质的羧基端肽来鉴定一个或多个样品中的蛋白质的设备(100)，所述设备特征在于，其包括至少一个样品源(101)、具有至少一个相应的修饰剂/标记物源(103)的修饰/标记单元(102)、切割单元(104)、羧基端肽分离单元(105)、具有用于确定和/或寄存纯化的肽的一种或多种物理化学性质的分析单元(107)的肽分离单元(106)、质谱仪单元(108)连接于读出单元(110)的控制电路和数据分析单元(109)。更具体而言，本发明的设备包括与数据库(111)的连接，所述数据库(111)包括使用切割剂计算机切割的蛋白质的全部羧基端肽的质量，该数据库以羧基端肽的物理化学性质进行注释。

附图简述

本发明的上述及其它特性、特性和优点将因以下详细描述并结合以举例方式说明本发明原理的附图而变得显而易见。此描述说明的目的仅为举例，而不限制本发明的范围。以下引用的参考图是指所附带的图。

图1显示根据具体实施方案用于分离羧基端肽的方法。1：蛋白质变性；2：蛋白质烷基化；3：蛋白质乙酰化；4：羧基的EDC活化；5：EDC活化的羧基与伯胺的反应；6：蛋白质切割成氨基端肽(a)、内部肽(b)和羧基端肽(c)；7：将氨基端肽及内部肽的自由羧基连接至纯化单元；8：留在溶液中的羧基端肽(c)的亲和分离。

图2显示根据本发明具体实施方案，碳二亚胺介导在分子1的羧基与分子2的伯胺基之间的反应。

图3显示根据本发明具体实施方案的用伯胺基修饰的生物素的结构，其中所述的伯胺基适于碳二亚胺介导的与羧基的反应。

图4显示根据本发明具体实施方案的用于分离和分析2个蛋白质样品中羧基端肽的设备(100)，所述设备(100)包括两个样品源(101)、具有相应修饰剂/标记物源(103)的修饰/标记单元(102)、切割单元(104)、羧基端肽分离单元(105)、肽分离单元(106)、质谱仪单元(108)和连接至读出单元(110)的控制电路与数据分析单元(109)。分离单元(106)包括两个依次连接的分离系统(1106)和(2106)。质谱仪单元(108)包括分离肽的同位素形式的单元。单元107是用于确定和/或寄存在(106)中纯化的肽的物理化学性质的分析单元。单元111是羧基端肽的注释数据库。(虚线表示采集实验性数据和计算机数据)。

实施方案的详细说明

在不同的图中，相同的参考标记表示相同或类似的元件。

本发明将就具体实施方案并参照某些附图加以描述，但是本发明不限于此，而仅由权利要求书限制。权利要求书中的任何参考标记不应当解释为限制范围。所描述的附图仅为示意性而非限制性的。在附图中，出于说明目的，一些元件的尺寸可以放大并且不是按比例尺描绘。在术语“包括”在本说明书和权利要求书中使用的情况下，此术语不排除其它元件或步骤。在使用不定冠词或定冠词指示单数名词(例如，“一个(a)”或“一个(an)”、″所述″)的情况下，这包括该名词的复数，除非另外具体说明。

此外，说明书和权利要求中所用的术语“第一”、“第二”、“第三”等用于区分相似元件并且不必定用于描述次序或时间顺序。应当理解如此使用的术语在适宜条件下是可互换的，并且本文中所述的本发明实施方案能够按照除本文中描述或说明之外的其它顺序进行操作。

提供以下术语或定义，其目的仅在于帮助理解本发明。除非详细说明，否则这些定义不应该解释为具有比本领域技术人员所理解范围更小的范围。

本文中所用的术语“多肽”或“蛋白质”是指通过肽键连接的多个天然或修饰的氨基酸。多肽的长度可以是2个至数千个氨基酸(因此，该术语也包括通常所谓的寡肽)。在本术语范围内包括这样的多肽，其包括通过体内翻译后修饰(例如糖基化、磷酸化等)而修饰的一个或多个氨基酸和/或包含在体外已经用蛋白质修饰剂(例如烷化剂)修饰的一个或多个氨基酸。

如本文中所用的术语“多肽片段”或“肽”指蛋白质或多肽的酶切后所获得的氨基酸序列。对多肽片段或肽的大小或性质没有限制。

当指肽时，术语“内部的”、“氨基端的”和“羧基端的”在本文中用来指肽在蛋白质或多肽中的相应位置。例如，在蛋白质NH₂-X₁-K-X₂-R-X₃-K-X₄-COOH(其中X₁、X₂、X₃和X₄是长度不重要的不含赖氨酸(K)或精氨酸(R)的肽序列)的胰蛋白酶酶切中，氨基端肽是NH₂-X₁-K-COOH，内部肽是NH₂-X₂-R-COOH和NH₂-X₃-K-COOH，并且C-末端肽是NH₂-X₄-COOH。

术语“母蛋白”表示从其中产生切割的肽的未切割的蛋白质。

如本文中所用的术语“蛋白质切割”涉及水解多肽中两个氨基酸之间的肽键。在生理过程中，蛋白质切割也称为“酶促水解”、“蛋白酶解加工”和“蛋白质熟化”。因此，术语“切割剂”是指能够水解多肽或肽中两个氨基酸之间的肽键的化合物。

如本文中所用的术语“片段化”指破坏一个或多个化学键和随后释放分子的一个或多个部分，其中所述的部分例如在串联质谱法(MS)或MS/MS分析中通过碰撞诱导解离(CID)而获得。在某些实施方案中，所述键是肽键，但其不限于此。

术语“质量”在本发明中表示质荷比(m/z)。缩写m/z用来表示通过离子的质量数除以其电荷数所形成的无量纲量。“单同位素质量”指仅含有最丰富同位素的离子的质量。“平均质量”指使用每种元素的原子量所计算的给定经验式的粒子或分子的质量。

如本文中所用的术语“标记物”指这样的化合物或分子，其可以共价连接于或者并入肽或多肽，并且是基于其特殊性质可由光学设备或其它设备(例如质谱仪)检测的。在所述标物记可以共价结合于肽或多肽的情况下，这可以通过标记试剂中存在的蛋白质/肽反应基得以保证。虽然术语“标记物”广泛地用于本领域，然而可以在能够结合官能团的标记物(如与蛋白质或肽结合)和标记试剂(包含与所述蛋白质或肽结合之前的该标记物的分子)之间进行区分。本发明设想利用不同类型的标记物，例如荧光标记物或同位素标记物。

如本文中所用的术语″同位素标记物″指这样的一组标记，其具有相同化学式但彼此在一个或多个原子存在的同位素的数量和/或类型方面不同，从而导致MS上的质量存在差异。因此，用不同的同位素标记物来标记的相同肽可以基于质量差异如在MS上得到区分。

如本文中所用的术语“蛋白质/肽反应基(PRG)”指在化合物上能够与蛋白质或肽的氨基酸上的官能团发生反应，从而导致该化合物与此氨基酸结合(非共价或共价)的化学官能团。

如本文中所用的术语“官能团”指在氨基酸上可用于与化合物结合(通常共价结合)的化学官能团。官能团可以存在于氨基酸的侧链上，或存在于多肽或肽的氨基端或羧基端。该术语包括天然存在于肽或多肽上的官能团和通过例如使用蛋白质修饰剂的化学反应所引入的那些官能团。

本发明描述了基于确定相应羧基端肽的质量和根据需要基于该羧基端肽的其它物理化学参数而鉴定母蛋白的方法。

本发明的方法和工具在分析一组需要同时进行分析的样品中是特别有意义的。这样一组样品可以是但不限于：来自同一患者的在不同时间点上采集的样品、疾病的不同临床形式的样品、不同患者的样品等。本发明因此提供用于鉴定疾病进展标志、用于区别诊断并且还用于生物化学或生理学测定法中多重分析的方法和工具。

本发明的方法和工具涉及蛋白质样品的分析。如本文中所用的术语′样品′不意图必定在进行本发明方法之前包括或排除任何处理步骤。该样品可以是粗制的未加工的样品、提取的蛋白质级分、纯化的蛋白质级分等。根据一个实施方案，该蛋白质样品是通过丰富蛋白质的免疫耗竭法预处理。

适于用本发明方法分析的蛋白质样品包括病毒、原核生物、细菌、真核生物、真菌、酵母、植物、无脊椎动物、脊椎动物、哺乳动物和人类来源的样品。样品可以是完整的生物体，例如秀丽隐杆线虫、果蝇或鼠胚胎的匀浆物，或者可以是生物体的组织或器官。样品制备根据所研究的生物、组织或器官而不同，但是标准方法通常是可获得的，并且为专家所知。就哺乳动物和人类蛋白质样品而言，这包括培养细胞分离物、激光微解剖细胞、体组织、体液或其它相关的目的样品。就样品中蛋白质的分级而言，细胞切割是细胞分级和蛋白质纯化的第一步。众多技术可用于破坏细胞，包括物理法、酶法和基于去污剂的方法。历史上，物理切割法已经成为所择用于细胞破坏的方法(均化法、渗透切割法、超声波细胞破坏法)，然而，它往往需要昂贵、笨重的设备，并且包括因设备的变化而有时难以重复的方案(例如，与紧密固定的均化杵相比较的松弛固定的均化杵)。近年来，基于去污剂的切割法已经因容易使用、成本低和方案高效而变得颇受欢迎。

哺乳动物细胞具有质膜，这是一种形成将细胞内容物与胞外环境隔开的屏障的蛋白质-脂质双层。组成所述质膜的脂质是两亲性的，具有自发联合以形成封闭双分子层的亲水性部分和疏水性部分。膜蛋白嵌入所述脂质双层，由覆盖疏水核心的一个或多个结构域固定就位。此外，外周蛋白通过与整合膜蛋白或与极性脂质头部基团相互作用而结合所述双层的内表面或外表面。脂质和蛋白质内容物的性质随细胞类型而不同。很明显，对于选择用于破坏细胞的技术而言，无论是物理的技术或基于去污剂的技术，必须考虑正在检测的细胞或组织的来源以及破坏它们的外层的固有难易。此外，该方法必须与待处理材料的量以及预期下游应用相适应。

在具体实施方案中，蛋白质提取也包括源于不同区室的细胞蛋白(例如胞外蛋白、膜蛋白、胞质蛋白、核蛋白、线粒体蛋白)的预分级。其它预分级方法基于物理性质例如等电点、电荷和分子量分离。

根据一种具体实施方案，所述样品在修饰或切割前进行预处理，从而使用适宜药剂(例如胍氯化物、尿素、酸(例如0.1％三氟酸)、碱(例如50％吡啶)和离子去污剂或非离子去污剂)对蛋白质变性以便最佳地接近试剂或蛋白酶。

因此，本发明方法任选地包括样品的预处理，其可以在包括如上所列一个或多个样品制备步骤中的预处理步骤中进行。因此，适用于本发明方法的设备任选地包括这样的样品制备单元，其包括一个或多个适于样品制备的设备，例如超声处理设备、层析系统(亲和系统、凝胶过滤系统)、超滤单元、离心机、具有用于缓冲剂、酶、去污剂等的递送系统的温控反应小瓶。

本发明的方法可以应用于单一样品或用于比较分析的两个或多个样品，从而这些样品中的羧基端肽配有可以区分源于不同样品的相同肽的标记物。在同时分析两个或多个样品的情况下，样品的汇集可以在所述方法中的不同时间点上进行(如下文详述)，前提是所述收集在差异性标记各自样品后进行。

在本发明方法的一个步骤中，其中所述步骤在本发明方法的大多数实施方案中是第一步，样品中蛋白质的羧基端以及Asp和Glu的侧链受到修饰。

适宜的羧基修饰剂是例如导致形成羧酸酯的化合物(例如甲醇或其它脂族或脂环族醇、重氮甲烷、甲基碘、Me₃SiCHN₂、Me₂C(OMe)₂、CH₃OCH₂Cl、CH₃SCH₂Cl、CH₃OCH₂CH₂OCH₂Cl、PhCH₂OCH₂Cl、Me₃SiCl、Et₃SiCl和Me₂PhSiCl)、酰胺(例如甲酰胺、乙胺、Me₂NH、吡咯烷、哌啶)和酰肼衍生物(例如苯肼)衍生物。羧酸酯衍生物的产生可以包括用良好离去基团活化羧酸酯，然后用合适的亲核试剂置换，或者对烷基卤或磺酸盐进行羧酸酯的亲核试剂置换。在某些实施方案中，所述修饰剂是甲基碘。在其它实施方案中，对羧基的修饰包括在与合适保护剂反应之前的碳二亚胺活化(例如用盐酸1-乙基3-[3-二甲氨基-丙基]碳二亚胺(EDC))。例如，适用于与碳二亚胺活化的羧基起反应的保护剂是脂族胺(NH₂-R)。在一个实施方案中，该脂族胺是甲胺或乙胺。

在具体实施方案中，半胱氨酸也通过例如烷基化进行修饰和/或赖氨酸通过例如乙酰化进行修饰。可以进行赖氨酸的修饰来调节胰蛋白酶的特异性或避免如下文继续详解的对赖氨酸中胺基的标记。

在本发明方法的另一步骤中，其中所述步骤通常是上述修饰步骤之后的步骤，样品中羧基修饰的蛋白质由切割剂切割。

如下详述，使用质谱法(MS)开展本发明方法中对样品的最终分析。在MS中使用至多到约50个氨基酸长度的肽获得最佳结果。另外，就肽的分离而言，大多数层析系统对肽具有比对于蛋白质而言更高的分辨率。因此，本发明的方法包括切割步骤，因而将大的蛋白质减小为氨基端肽、羧基端肽和内部肽。

在本发明方法中的蛋白质切割可以使用化学法和酶法进行。

化学切割法包括使用切割剂，所述切割剂例如是，但不限于BNPS-3-甲基吲哚[2-(2-(硝基苯亚硫基)-3-甲基吲哚]、CNBr、甲酸、羟胺(NH₂OH)和亚碘酰苯甲酸和NTCB+Ni(2-硝基-5-硫氰苯甲酸)。

酶切割法包括用酶切割剂消化，所述的酶切割剂例如是，但不限于Asp-N内肽酶、Arg-C内肽酶、胱天蛋白酶1、2、3、4、5、6、7、8、9或10、胰凝乳蛋白酶、梭菌蛋白酶、肠激酶、Xa因子、谷氨酰内肽酶、粒酶B、LysC赖氨酰内肽酶、胃蛋白酶、脯氨酸-内肽酶、蛋白酶K、葡萄球菌肽酶I、嗜热菌蛋白酶凝血酶、胰蛋白酶。参数(例如温育时间、酶/底物比、pH和缓冲剂)可以影响某些蛋白酶的特异性。

出于本发明目的，一般选择具有特异性和高效率的切割法和/或切割剂。如下文进一步详解释，本发明的方法一般依赖于实验性切割数据与计算机切割数据的比较。因此，重要的是样品的理论切割模式尽可能与实验性数据匹配。例如，使用CNBr以羧基端方式切割甲硫氨酸还可以导致以羧基端方式切割色氨酸。偏好性地以羧基端方式切割芳香族氨基酸的胰凝乳蛋白酶也会以羧基端方式切割其它疏水性氨基酸，这取决于温育时间和样品中酶的浓度。

所产生肽的平均大小也是重要的。肽越短，来自不同蛋白质的肽具有相同质量、甚至相同序列并且在纯化和分析法中以相同方式表现的机会越大。因此，根据样品的性质和复杂度，可以优选具有较少出现的切割位点的酶。

根据具体实施方案，考虑到其高特异性和高效率，用胰蛋白酶进行本发明方法中的切割步骤。或者，在Lys和Arg处的切割产生过短肽的情况下，可以使用其它酶，例如内切蛋白酶Arg-C(精氨酸特异性)、内切蛋白酶Lys-C(赖氨酸特异性)、金黄色葡萄球菌(S.aureus)V8蛋白酶(Asp/Glu特异性)。或者，赖氨酸的侧链由乙酰化作用修饰，以限制对精氨酸残基(以及被修饰成高精氨酸并变成胰蛋白酶底物的半胱氨酸)的胰蛋白酶切割。

在本发明方法的另一步骤中，样品的复杂度通过分离出羧基端肽而降低。

蛋白质在如上所述的切割步骤中切割为肽则具有如下缺点：样品中可能存在的大量蛋白质转变为数目更高的肽，其中所述的肽在原则上均需要分析以鉴定样品中存在的全部蛋白质以及在这些蛋白质上已经发生的潜在的蛋白质加工过程。以这种方式，获得冗余信息，因为相同蛋白质的众多肽受到分析。已经描述了降低肽样品复杂度的不同方法。例如，可以使用这样的标记试剂分离仅包含半胱氨酸的肽，其中所述试剂对还原性半胱氨酸的硫醇基反应并携带标签以分离包含所述标记半胱氨酸的肽。然而，一些蛋白质完全没有半胱氨酸，而另一些蛋白质则具有多于一个半胱氨酸。因此，半胱氨酸标记法仅可以有限程度地降低样品的复杂度至每个蛋白质一个肽而不丢失信息。

根据本发明，通过从切割的蛋白质的混合物中选出羧基端肽来实现将一个或多个样品的复杂度降低到每个蛋白质一个肽。羧基端肽的选择具有某些优点。氨基端比羧基端更易受体内蛋白酶解处理，这使得难以预测哪些氨基端肽会存在于切割的蛋白质样品中。另外，氨基端的众多不同修饰在体内存在，或者因操作蛋白质样品而存在，例如，通过乙酰化、甲酰化和修饰成焦谷氨酸。尽管存在对氨基端甲硫氨酸加工的预测法(“氨基端法则”)，然而该方法并不总是预测蛋白质的真实氨基端氨基酸。此外，氨基端经常含有信号序列(例如跨膜转运序列)，这些信号序列是保守的并使得氨基端肽的序列比羧基端的序列提供更少的信息。另外，因可变剪接所致的蛋白质序列差异在蛋白质的氨基端部分比羧基端部分更经常地出现。

因此，本发明的方法包括选择样品中的已切割蛋白质的羧基端肽的步骤。在切割修饰的蛋白质时，该蛋白质的氨基端肽和全部内部肽获得新羧基，而原始蛋白质的羧基则在所述切割之前的修饰步骤中受到修饰。新产生的羧基用于从所述混合物中除去氨基端肽及内部肽，或者通过将这些肽经羧基与基质直接结合，或者通过使所述羧基与亲和标记物反应，然后在亲和性基质上分离所述的亲和标记肽。用于分离羧基端肽的方法例如在US6,156,527(Schmidt)，US2006/134724(Fisher)和US2002/0106700(Foote)中描述。利用与修饰的羧基端肽在电荷方面的差异，氨基端肽及内部肽可以通过离子交换剂上的羧基逆向地结合。或者，所述的氨基端肽及内部肽结合至用羧基反应基加以官能化的基质，所述羧基反应基例如是在以上的本发明羧基修饰步骤(第一方法步骤)的中描述的那些羧基反应基。本发明方法中分离羧基端肽的另一种可选实施方案包括将亲和标签与所述氨基端肽和内部肽的羧基共价或非共价地结合。合适的亲和标签包括但是不限于d-生物素或基于结构性修饰的生物素的试剂、1，2-二酚、半抗原例如二硝基苯基或与过渡金属结合的配体，例如六组氨酸或谷胱甘肽。

在本发明方法的具体实施方案中，试剂碳二亚胺EDC用来使包含NH₂基的生物素分子(例如图3中绘出)与所述内部肽和氨基端肽的羧基发生反应。

在本发明方法的另一步骤中，对一个样品或两个或多个汇集的样品中分离的羧基端肽开展一项或多项肽分离技术。

使得复杂肽样品分离成多个级分的合适分离技术是本领域技术人员已知的，并且包括但不限于等电聚焦法、阴离子交换层析法或阳离子交换层析法、反相HPLC、离子对反相层析法、亲和层析法等。尽管原则上适用，然而，技术如SDS PAGE、双向凝胶电泳、大小排阻层析法较不适合分离通常长度有限的羧基端肽(如本发明方法中分离的那些羧基端肽)。

已经描述了分离肽消化物的几种技术，包括反相(RP)-HPLC和双向液相层析。对于从蛋白酶解消化物获得的肽样品而言，2D-LC法特别适用于分离，该方法还提供自动化和通量方面的显著优点。同样，毛细管电泳(CE)也是适于分离肽的方法。

2D-LC通常使用与按照系列循环运行的在线连接于反相柱的离子交换柱(通常为强阳离子交换，SCX)。在每个循环中，在所述离子交换柱中提高盐浓度，旨在根据其离子电荷将肽洗脱至所述反相系统中。在本文中，根据疏水性，例如通过使用含CH₃CN的梯度而分离肽。

众多参数影响分辨力，继而影响可由LC-MS显示的蛋白质的数量。通常，建立第一方向分离技术(SCX)和第二方向RP-HPLC分离方法之间的″在线″布局用于样品分级。可以通过以递增盐浓度的逐步洗脱法或通过盐梯度来进行离子交换层析。一般，SCX在例如存在至多达30％乙腈下进行，旨在使SCX层析期间疏水性相互作用最小化。在例如C18柱上进行反相层析法前，除去有机溶剂(如乙腈)，或者通过例如蒸发大大减少有机溶剂。

如上详述，本发明的方法可以对单个样品进行，或者可用于同时分析两个或多个蛋白质样品，以避免因不同处理步骤、更具体因如上所述的肽分离方法而引起的变异性。为了区分源于不同样品的相同肽，设想了不同选项。

根据本发明方法的第一种实施方案，使用本发明第一步骤中对完整蛋白质的羧基的修饰作为差异性标记步骤，这通过使蛋白质的羧基端与可检测标记物反应进行。一旦进行不同样品的蛋白质的差异性标记，则可以汇集样品并且对汇集的样品进一步加工。或者，可以分别加工样品，并在分析前汇集样品。然而，在两个或多个差异性标记的切割蛋白质样品的比较性蛋白质组分析中，在所述方法中理想地尽可能早地汇集样品，以限制样品之间因肽分离技术引入的变异性。随后相同肽的差异性标记形式在MS上一起进行分析，以准确地比较不同样品之间各种肽的浓度。

不同标记物可以用来区分具有相同氨基酸序列的肽。然而，为促进分离和MS分析后鉴定相应肽并避免不得不产生复杂数据库，有意义的是使用化学结构相同的标记物，从而差异性标记的肽将在层析分离系统中相似地表现，同时在MS中产生差异性信号。

在本发明方法的具体实施方案中，不同蛋白质样品用同位素标记物来标记。同位素标记物具有相同的化学结构，从而经同位素标记的相同肽在蛋白质纯化系统中基本上表现相同，但在MS中表现不同。

适宜的同位素标记物的实例包括如Gygi等(1999)Nat.Biotechnol.17，994-999和US 6,852,544中所述的称为ICAT试剂的标记物。目前，两种不同的标记试剂是市售可得的，其具有SH反应性并且含有生物素亲和标签。US6,852,544公开与同位素标记基团连接的COOH反应基组合，所述的COOH反应基组合适用于在COOH末端处标记未切割的蛋白质。在本发明中无需亲和标签，如生物素标签。肽的选择基于氨基端肽及内部肽的羧基进行。

或者，可以伴随修饰步骤而确保对蛋白质样品的差异性标记。根据这个实施方案，包含一种或多种同位素如²H、¹³C、¹⁵N、¹⁷O、¹⁸O或³⁴S的如上所述用于修饰羧基的试剂也适用于同位素标记。所述试剂的实例包括甲胺和甲胺-(d3)或乙胺和乙胺-(d5)。

根据又一个实施方案，将本发明方法中蛋白质样品的差异性标记作为对切割时所生成的羧基端肽的新生氨基端的标记过程进行。为避免同时对(内部)赖氨酸标记，所述蛋白质可以在切割之前用例如烷基化剂(如酸酐)进行修饰。根据这个实施方案，样品的差异性标记在切割步骤后，并且任选地在分离羧基端肽后进行。

适用于氨基端标记的标记基团包括2-叔丁氧基-羰基氨基-2-苯乙腈[BOC-ON]-(d0)或-(d9)乙酰氯-(d0)或-(d3)，苯甲酰氯-(d0)或(d5)或乙酸酐-(d0)或-(d6).

同等地，在US 6,852,544中披露的具有或通常没有亲和标记物的全部NH₂反应性ICAT标记试剂适用于本发明中所分离羧基端肽的同位素标记。

羧基端肽的氨基端标记可以在所述羧基端肽分离之前或之后进行，因为这不干扰基于氨基端肽及内部肽的羧基端的纯化法。然而，当标记在分离之前进行时，没有羧基可以存在于标记试剂中。

本发明的方法包括以关于肽的物理化学特性数据与肽数据库中那些数据的比较为基础的鉴定步骤。

因此，对于在本发明方法的一个或多个分离步骤中获得的每种肽级分而言，收集并存储涉及肽在一个或多个分离步骤中(例如层析期间)行为的数据。此类数据包括例如进行纯化时的pH、从反相柱洗脱肽的有机溶剂的百分比、在给定pH从离子交换基质洗脱肽的盐浓度、在给定pH肽与某种树脂的结合(或不结合)等。

额外地或可选地，对每种肽可以收集从本发明方法的肽分离和纯化步骤中无法直接获得的其它数据。因此，对于每种肽，可以存储一部分分离的肽以开展测定法来确定在纯化期间未确定的性质。此类测定法例如包括，但不限于测定溶解度，在水/有机溶剂系统中的分配系数、检测特定的氨基酸侧基(例如-OH、-SH、-NH₂)。

在本发明的其它步骤中，通过质谱法分析已经如上所述进行分离的羧基端肽级分。在同时分析两个或多个样品的情况下，所述肽级分可能含有被差异性标记的相同羧基端肽。或者，在一个或多个样品中的相关蛋白质已经接受体内蛋白酶水解过程的情况下，则可以在不同级分中洗脱与相同母蛋白相对应的羧基端肽，其中所述的不同级分在MS上分别分析。

与样品中存在的母蛋白相对应的羧基端肽的鉴定由高分辨率质谱仪的高质量精确度实现。光谱测量法测量质量通过分析物电离成气相来进行。确定电离分子的质荷比并且对每个单独的m/z值计数离子数目。因此，质谱中的每个特性由两个值：m/z和所检测离子数目的量值定义。

在本发明方法的其它步骤中，将羧基端肽的实验测定质量与数据库中计算机生成的肽的质量比较。

肽的质量与氨基酸组成其相关。然而仅基于质量，则不可能总是确定地鉴定肽。例如，单独的质量将不提供具有相同氨基酸组成但具有不同序列的肽(A1-A2-A3-A4-A5与A5-A1-A2-A3-A4)之间的区分。此外，某些质量可能对应于具有不同序列的一组肽。例如，具有带较长侧链的氨基酸的短肽可能具有与较长肽相同的质量，其中所述的较长肽具有带较短侧链的氨基酸。

当对所切割蛋白质的肽不作选择时，胰蛋白酶消化肽的质量与某种生物体的蛋白质组的计算机消化物的全部质量相关。

使用如本发明中所述的羧基端肽分离，从蛋白质样品中获得的肽数目大大减少。因此，计算机胰蛋白酶消化肽数据库仅需要含有羧基端肽(故称作羧基端数据库)。

现存蛋白质数据库及序列数据库可以作为基础用来产生与任意生物体的蛋白质组相对应的数据库。对于日益增加的生物，完整基因组和从其中推导出来的蛋白质组是已知的(www.ncbi.nlm.nih.gov/genomes)。因此，可以生成其中模拟蛋白质切割和肽分离的计算机肽数据库。根据切割剂的效率，该数据库可以含有其中切割作用是不完全的肽。

在本发明中适用的羧基端数据库中，每个条目包括母蛋白名称和相应羧基端肽的质量。对于每个条目，氨基酸组成对计算质量差异也是重要的，其中所述的质量差异由天然翻译后修饰(例如在丝氨酸、苏氨酸和酪氨酸上的磷酸化)、样品处理(例如天冬酰胺和谷氨酰胺的脱酰胺作用)或在蛋白质的修饰/标记和羧基端肽分离期间引入的修饰引起。对于每种蛋白水解酶，使用包含非修饰羧基端肽的质量的单一主数据库来根据切割之前或之后所引入的修饰的类型而再次计算质量。此外，通过计算数据库中的肽的质量考虑了可能存在或可能不存在的潜在翻译后修饰。此外，在设想使用标记物的情况下，可以合并考虑该标记物对每种肽的质量的影响。

尽管如此，如US6,846,679中对一小组流感病毒所示，实验性羧基端肽的质量可以对应于相应羧基端数据库中的不同肽。因此，这种数据库没有提供足够信息以仅仅依赖该肽的质量而鉴定羧基端肽的母蛋白。因此，本发明提供不仅基于m/z比，还包括额外特性如长度(氨基酸数目)、氨基酸序列、重量、疏水性、等电点等而鉴定羧基端肽。

根据本发明的具体实施方案，羧基端肽的数据库与特定切割剂的蛋白质组相对应，并且对于给定物种，所述切割剂与样品来源相对应。这种肽数据库还包括注释的剪接变体。在本发明方法中所用的计算机肽数据库包括羧基端肽的计算特性如氨基酸长度、氨基酸序列、分子量、疏水性、等电点等。

如上所示，还考虑了体内来源的蛋白质往往如通过乙酰基、甲酰基或焦谷氨酸残基而经翻译后修饰，所有这些基团均影响质谱中测定的m/z。因此，在本发明的一个实施方案中，使用合成的羧基端肽作为参考标准以验证计算机计算的肽特性。

来自这种合成肽文库的信息用来促进鉴定质谱肽峰的性质，因而任选地避免从头测序。这种鉴定将基于与计算机肽文库中存贮的可用信息相比较的以下特性，如HPLC保留时间、等电点和质谱m/z值。

考虑了不同类型的物理化学数据，其中所述的物理化学数据与羧基端肽的m/z数据联合时提供对母蛋白的确定性鉴定。

所设想的一种类型数据是从序列信息中预测到和/或可以在肽纯化步骤及MS期间测量到的数据，如等电点、在不同pH值上的净电荷、在RP HPLC中的保留时间，在214nm和280nm处的UV吸收、在给定pH和盐浓度从离子交换柱洗脱的趋势、疏水性和亲水性。

疏水性可以例如通过Bull和Breese.(1974)Arch.Biochem.Biophys.161，665-670的算法计算。等电点可以例如在www.expasy.ch/tools/pi_tool.html上计算。在反相柱上的保留时间例如根据Krohkin等(2004)Mol.Cell.Proteomics 3，908-919的方法进行预测。

如上所示，本发明中所用的数据库额外地或可选地包含在其它实验中所获得且不是直接来自肽纯化的数据，例如是但不限于涉及溶解度、在水/有机溶剂双相系统上的分配作用、用于检测蛋白质反应基(OH、NH₂、SH)[电离势、偶极矩、成氢键能力和在气相中的离子迁移率]的测定法。

因此，基于与注释的羧基端数据库的比较而提供鉴定的本发明方法允许以提高的精确度鉴定相应母蛋白。

任选地，本发明中所用的羧基端肽数据库还包含涉及母蛋白表达模式等方面的信息，所述信息进一步帮助鉴定所述母蛋白。当母蛋白在除其末端肽之外的氨基酸序列上不同的情况下，在注释的羧基端肽数据库中的相应条目将表示具有相同质量和相同物理化学性质的羧基端肽。然而，以涉及母蛋白在生物发育或组织特异性表达期间可能差异性表达方面的细节进一步注释条目则可以允许将正确的母蛋白指派至分离的羧基端肽。实际上，根据蛋白质样品的来源，有可能从不同的可能母蛋白中选出其表达与样品表达相匹配的母蛋白。

在本发明的方法中，通过与注释的羧基端肽数据库比较而计算每种肽的质量。因此，选择这样的一些条目，其具有与分离肽的测量质量相对应的计算质量。根据MS设备和样品类型，以单同位素质量或以平均质量开展比较。

当使用单同位素质量时，一般包含0.1质量单位的测量误差以选择来自数据库的条目。当使用平均质量时，一般包含1Da的测量误差以选择来自该数据库的条目。当测量质量仅与该数据库中一个条目对应时，立即鉴定到母蛋白。

当测量质量与该数据库中多于一个条目相对应时，选择全部这些条目作为亚组。基于所述分离肽的物理化学参数与数据库中条目亚组的那些物理化学参数的比较，进行进一步鉴定。一般而言，首先考虑可以从肽纯化步骤中得到的那些物理化学参数。根据具体实施方案，考虑至少三种物理化学特性并且基于“最佳拟合”分析进行鉴定。当仅考虑一个额外参数时，参数的选择主要取决于该参数在羧基端数据库中具有相同质量的肽群体范围内的区别能力。例如，若羧基端数据库中的肽具有区别量的芳族氨基酸，则可以使用在214nm和280nm处的UV吸收作为选择标准。在另一个实例中，在数据库中具有相同m/z比的3种肽中，若全部这些肽具有相同的净电荷，但是电荷分布不同(例如一种肽没有带电荷的氨基酸，另一种肽具有一个Arg和一个Asp并且另一个具有两个Arg和两个Asp)，则可以使用离子交换特性作为标准以使所述的分离肽与数据库亚组内的一种特定肽关联。

本发明的另一方面提供适于实施本发明方法的设备和仪器。

在MS分析之前，本发明的方法包括众多蛋白质加工步骤(蛋白质修饰、蛋白质切割)和分离与纯化步骤(羧基端肽分离，分开分离的肽)。因此，适于实施本发明方法的设备包含适宜的反应室，具有试剂(修饰试剂、切割剂)的相应来源和分开与分离单元(一般是层析法单元)。由于各种羧基端肽的适宜分离往往要求连续分离技术，适于开展本发明方法的设备可选地含有一个或两个分离仪器或与之连接，所述的分离仪器例如是电泳仪、层析仪(如但不限于毛细管电泳(CE)器)、反相(RP)-HPLC仪和/或双向液相层析仪等。

本发明方法的重要特性是确定分离的羧基端肽的质量。因此，用于开展本发明方法的设备包含质谱仪。常用质谱仪由3个部件组成：旨在气化目的分子的离子源、测量电离分子的质荷比(m/z)的质量分析仪以及寄存和计数每一m/z值的离子数目的传感器。质谱中的每种特性由以下两种值定义：m/z和抵达该仪器的探测器的离子数目的量值。

一般通过电喷雾电离法(ESI)或基质辅助激光解吸/电离法(MALDI)在分光计中使蛋白质或肽电离用于质量分析。在ESI过程期间，分析物直接从溶液中电离，并且ESI因而常常与液相层析分离工具(例如反相HPLC)直接偶联。MALDI通过激光脉冲使干燥样品气化，其中所述的干燥样品与吸收激光能量的有机小分子混合以使气化过程更有效。

质量分析仪是质谱仪的关键部件，其重要参数是灵敏度、分辨率和质量精确度。存在5种目前在蛋白质组学中使用的质量分析仪。这些质量分析仪包括离子阱、时间飞行(TOF)、四级杆、轨道阱和傅里叶变换-离子回旋(FTICR-MS)分析仪。串联MS或MS/MS可以按时间(离子阱)和按位置(用全部杂合仪器如例如LTQ-FTICR、LTQ-轨道阱、Q-TOF、TOF-TOF、三级四极式和杂合三级四极杆/线性离子阱质谱仪(QTRAP))开展。

本发明的具体实施方案涉及用于分离和分析蛋白质样品中羧基端肽的设备(100)，该设备包括至少两个样品源(101)、具有至少一个相应修饰剂/标记物源(103)的修饰/标记单元(102)、羧基端肽分离单元(105)、肽分离单元(106)、质谱仪单元(108)和控制电路与连接于读出单元(110)的数据分析单元(109)。该设备可以设置成确保在切割步骤前汇集样品(汇集的样品进入切割单元)或在切割步骤后汇集样品(样品分别通过切割单元)。在具体实施方案中，分离单元(106)包括两个依次连接的分离系统(1106)和(2106)，其中第一分离系统(1106)是例如阳离子交换层析系统与分离系统，并且第二分离系统(2106)一般是HPLC反相系统。质谱仪单元(108)由分离肽的同位素形式的单元组成。

本发明设备的具体实施方案还包括其中测定和/或寄存纯化的肽的一种或多种物理化学性质的分析单元(107)。有关肽的实验质量及其物理化学性质的数据与羧基端肽的注释数据库(111)进行比较(由图4中虚线标出)，其中所述的数据在纯化期间获得、并且任选地在该分析单元中获得。

实施例

实施例1：分离羧基端肽

分离羧基端肽的流程图在图1中简述。

使用标准方法从组织中分离蛋白质提取物。将半胱氨酸的侧链烷基化并且将氨基端处的胺和赖氨酸的侧链乙酰化。在下一个步骤中，根据如Grabarek和Gergely(1990)Anal Biochem.185，131-135中所示方法，通过盐酸1-乙基-3-[3-二甲基氨基-丙基]碳二亚胺(EDC)或1-乙基-3(3-二甲基-氨基丙基)-碳二亚胺(EDAC)活化羧基端氨基酸的游离羧基(以及谷氨酸和天冬氨酸上的反应性羧基)。

EDC与蛋白质(图2中的分子1)上的羧基反应，形成胺-反应性O-酰基异脲中间体。这个中间体可以与NH-R(图2中的分子2)上的胺反应，产生由稳定酰胺键连接的这两个分子的缀合物。然而，该中间体也易于水解，这使其在水溶液中不稳定和存在短暂。添加硫代NHS(5mM)则通过将所述胺反应性中间体转化成胺反应性硫代NHS酯而使其稳定，因而提高EDC介导的偶联反应的效率。所述胺反应性硫代NHS酯中间体具有足够稳定性以提供双步骤交联过程，其中所述双步骤交联过程使一种蛋白质上的羧基保持不变。EDC-活化的COOH基与含氨基的分子NH₂-R偶联。NH₂-R可以是通过羧基端肽电离过程期间容易地吸引正电荷而改进该过程的分子。另一方面，此反应性分子不得含有任何其它羧基。在本实施例中，NH₂-R是可以进行同位素标记的乙胺。

随后，将蛋白质样品用胰蛋白酶进行酶促消化以产生肽混合物。

消化物中的氨基端肽及内部肽含有游离的羧基端氨基酸，而羧基端肽具有由上述反应修饰的羧基。

内部肽及氨基端肽的游离羧基端羧基通过生物素亲和层析法分离。这个步骤导致分离出内部肽及氨基端肽并且将羧基端肽留在溶液内。此反应由上述的碳二亚胺介导反应进行，其中R-NH₂是如图3中所示的修饰生物素。

肽消化物中除这些羧基端肽之外的全部肽通过选择性亲和耗尽这些肽而从所述溶液中除去。溶液中存在的羧基端肽进一步通过(多)双向液相层析法进行分级，然后进行质谱分析。

实施例2：鉴定具有相似质量的肽

本实施例显示需要用额外参数补充肽的质量数据。从Prosite(ScanProsite on www.expasy.org/prosite)上的基序搜索中，选择了具有潜在临床关联的人蛋白质的含8个氨基酸的羧基端胰蛋白酶消化肽，即Exostosin 2的序列SFPNIGSL[SEQ ID NO：1]。

使用SEQ ID NO：1的计算平均质量(833.94)来鉴定具有理论值1Da范围内的计算质量的Profound(prowl.rockefeller.edu)肽。通过开展不允许部分切割且不选择大量肽的计算机法胰酶消化人蛋白质法(见表1)进行该计算，其中所述的肽是羧基端肽。

表1.具有相关质量的羧基端肽的质量和物理化学参数

	1	2	3	4	5	6	7
	1	2	3	4	5	6	7		质量	序列[SEQID NO：]	pI	芳香性(YFW)	疏水性(VILMYFW)	亲水性(STDEQN)	RT
Extostosin 2	833.94	SFPNIGSL[SEQ ID NO：1]	5.24	1	2	2	22.6		质量	序列[SEQID NO：]	pI	芳香性(YFW)	疏水性(VILMYFW)	亲水性(STDEQN)	RT
Extostosin 2	833.94	SFPNIGSL[SEQ ID NO：1]	5.24	1	2	2	22.6	膜内蛋白酶MP5	833.95	SMSTQAPL[SEQ ID NO：2]	5.24	-	2	4	18.6
HCN3蛋白	832.97	GLQLSANM[SEQ ID NO：3]	5.52	-	3	3	20.0	膜内蛋白酶MP5	833.95	SMSTQAPL[SEQ ID NO：2]	5.24	-	2	4	18.6
HCN3蛋白	832.97	GLQLSANM[SEQ ID NO：3]	5.52	-	3	3	20.0	FLJ00242蛋白	834.93	FQALNSVG[SEQ ID NO：4]	5.52	1	2	3	19.9
联苯水解酶样蛋白	834.92	LAEDFLQ[SEQ ID NO：5]	3.67	1	3	3	22.5	FLJ00242蛋白	834.93	FQALNSVG[SEQ ID NO：4]	5.52	1	2	3	19.9

1、3)平均质量和pI在www.expasy.ch/tools/pi_tool.html上计算

4)芳族氨基酸数目

5)疏水性氨基酸数目

6)亲水性氨基酸数目

7)肽在反相中的保留时间在http://hs2.proteome.ca/SSRCalc/SSRCalc.html上计算(参数a＝10和B＝0.48)

通常，通过离子交换层析法和反相HPLC的组合分离肽。使用其中盐浓度提高的离子交换柱，肽根据其等电点被洗脱。基于上述肽的pI，它们将洗脱为三种级分(SEQ ID NO：1和SEQ ID NO：2、SEQ ID NO：3和SEQ ID NO：4以及SEQ ID NO：5)，其中首先洗脱其pI与缓冲液的pH最接近的肽。当反向层析时，SEQ ID NO：1和SEQ ID NO：2将在不同位置处洗脱，因为它们具有不同量的亲水性氨基酸和疏水性氨基酸。基于在280nm和214nm处的UV吸收，也极容易将SEQ ID NO：1与SEQ ID NO：2区分并且将SEQ ID NO：3与SEQ IDNO：4区分，其中所述的UV吸收常用于在RP-HPLC中检测蛋白质。容易识别具有SEQ ID NO：2和3的肽，因为它们在280nm处几乎不吸收UV光。

Claims

1.用于鉴定蛋白质样品中的蛋白质的方法，包括步骤：

a)修饰该蛋白质样品中的蛋白质的羧基，

b)用切割剂将该蛋白质样品中的蛋白质切割成肽，

c)从所述肽中将羧基端肽与氨基端肽及内部肽分离，

d)对分离的羧基端肽进行一个或多个肽纯化步骤，从而获得纯化的羧基端肽，

e)确定或计算所述纯化的羧基端肽的除质量以外的至少一种其它物理化学性质，

f)在MS上测定该纯化的羧基端肽的质量，

g)将所述纯化的羧基端肽的质量和所述至少一种其它物理化学性质与包含由所述切割剂生成的全部羧基端肽的质量和一种或多种物理化学性质的数据库比较，从而鉴定所述纯化的羧基端肽的母蛋白。

2.权利要求1的方法，其中步骤(g)包括对每种纯化的羧基端肽鉴定在所述数据库中具有与所述纯化的羧基端肽相对应的质量的一种或多种羧基端肽，并且当对于一种纯化的羧基端肽鉴定到多于一种肽时，将所述纯化的羧基端肽的物理化学参数与该数据库中鉴定到的所述多于一种肽的物理化学参数进行比较。

3.权利要求1的方法，其中所述的蛋白质样品来自一个物种，并且所述数据库包含由所述切割剂生成的该物种的全部羧基端肽的质量和物理化学性质。

4.根据权利要求1的方法，其中同时在两个或多个样品中鉴定所述的蛋白质，并且其中所述方法包括

-在步骤(a)中用一组差异性标记试剂进行修饰，

-在步骤(d)之前汇集所述两个或多个样品的额外步骤，

-在步骤(f)之前鉴定所述标记物的性质，从而鉴定所述肽来源的样品，

-在步骤(g)中将该纯化的羧基端肽的质量和至少一种其它物理化学性质与包含由所述切割剂生成的全部羧基端肽的质量和物理化学性质的数据库比较，从而鉴定鉴定所述羧基端肽。

5.根据权利要求1的方法，其中在一个或多个肽纯化步骤中确定所述的至少一种物理化学性质。

6.根据权利要求1的方法，其中所述的至少一种物理化学性质选自pI、反向层析期间的保留时间和在280nm和214nm处的UV吸收比。

7.权利要求1的方法，其中利用与伯胺的碳二亚胺反应进行步骤a)中的修饰。

8.权利要求1的方法，其中步骤c)中分离羧基端肽包括使氨基端肽及内部肽的羧基通过碳二亚胺介导的反应与携带伯胺基的修饰生物素反应的步骤。

9.用于从蛋白质样品中分离羧基端肽的方法，包括步骤：

a)使完整蛋白质的羧基通过碳二亚胺与伯胺反应，

b)用切割剂将所述的完整蛋白质切割成肽，

d)将所述带标签的肽结合至亲和基质并收集不结合的肽，所述的不结合肽是无标签的肽，因而从(b)所获得的肽中将所述羧基端肽与氨基端肽及内部肽分离。

10.根据权利要求9的方法，其中所述的亲和标签是生物素。

11.由切割剂以计算机切割的生物体的蛋白质的羧基端肽的数据库，其中每种肽由下列条目表征

-蛋白质标识符、

-氨基酸组成、

-质量和

-一种或多种物理化学性质。

12.根据权利要求11的数据库，其中所述羧基端肽的一种或多种物理化学性质选自该羧基端肽在反向层析中的计算的保留时间、在给定pH的净电荷、和等电点。

13.根据权利要求11的数据库，其中所述的生物体是人。

14.根据权利要求11的数据库，其中所述切割剂是胰蛋白酶。

15.根据权利要求11的数据库，其中所述的肽包括因所述切割剂不完全切割从而错过一个切割位置而产生的羧基端肽。

16.根据权利要求11的数据库用于鉴定蛋白质的应用。

17.基于蛋白质的羧基端肽而鉴定一个或多个样品中的蛋白质的设备(100)，所述设备包括至少一个样品源(101)、具有至少一个相应修饰剂/标记物源(103)的修饰/标记单元(102)，切割单元(104)、羧基端肽分离单元(105)、肽分离单元(106)、用于确定和/或寄存纯化的肽的一种或多种物理化学性质的分析单元(107)、质谱仪单元(108)、控制电路与数据分析单元(109)以及与数据库(111)的连接，其中所述的数据库(111)包含使用切割剂以计算机方式切割的蛋白质的全部羧基端肽的质量，该数据库以所述羧基端肽的物理化学性质进行注释。