CN101535316A - 芳基硼酸在蛋白质标记中的应用 - Google Patents

芳基硼酸在蛋白质标记中的应用 Download PDF

Info

Publication number
CN101535316A
CN101535316A CNA2007800412067A CN200780041206A CN101535316A CN 101535316 A CN101535316 A CN 101535316A CN A2007800412067 A CNA2007800412067 A CN A2007800412067A CN 200780041206 A CN200780041206 A CN 200780041206A CN 101535316 A CN101535316 A CN 101535316A
Authority
CN
China
Prior art keywords
peptide
protein
histidine
group
reagent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800412067A
Other languages
English (en)
Inventor
R·霍夫曼
H·休梅尔
V·韦勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Philips Intellectual Property and Standards GmbH
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN101535316A publication Critical patent/CN101535316A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6806Determination of free amino acids
    • G01N33/6812Assays for specific amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07FACYCLIC, CARBOCYCLIC OR HETEROCYCLIC COMPOUNDS CONTAINING ELEMENTS OTHER THAN CARBON, HYDROGEN, HALOGEN, OXYGEN, NITROGEN, SULFUR, SELENIUM OR TELLURIUM
    • C07F5/00Compounds containing elements of Groups 3 or 13 of the Periodic Table
    • C07F5/02Boron compounds
    • C07F5/025Boronic and borinic acid compounds
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/531Production of immunochemical test materials
    • G01N33/532Production of labelled immunochemicals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • G01N33/6851Methods of protein analysis involving laser desorption ionisation mass spectrometry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/13Tracers or tags

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Food Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Optics & Photonics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及用芳基硼酸标签化试剂标签化多肽中的组氨酸。本发明进一步描述了通过从一种蛋白质样品或蛋白质样品库中分离和鉴定含组氨酸肽从而鉴定样品中蛋白质的方法和装置。本发明进一步描述了来自in silico断裂的蛋白质的含组氨酸肽的数据库以及它们在蛋白质鉴定中的用途。

Description

芳基硼酸在蛋白质标记中的应用
技术领域
本发明涉及使用质谱法同时分析蛋白质样品的方法,其允许从断裂的蛋白质的混合物中选择性分离肽。本发明进一步涉及用于纯化肽和质谱数据的数据分析的技术。
背景技术
对于通过蛋白质组学方法分析复杂蛋白质样品(组织样品或体液如血清,或尿)而言,样品通常被断裂成肽,分离肽并通过质谱法分析。在这样的“鸟枪(shotgun)”法中需要克服的最大问题是降低断裂的肽的混合物的复杂性。为了提供适合于通过现行质谱仪器(这些机器的最佳分析范围约为2000-4000m/z)分析的碎片,通过用蛋白酶消化蛋白质,与原始样品相比,待分析分子的数目显著增加。断裂之后由于混合物中的不同的肽来源于相同亲本蛋白质,所以对所有这些肽进行分析有时可能是多余的。另一方面,在亲本蛋白质鉴定中,对相应于相同蛋白质的数种肽进行分析可用作进一步的确认。
然而,在某些分析中,并不需要分析所有来源于蛋白质的肽。通常,一种或几种肽就足以确认样品中某种蛋白质的存在。为减少断裂后肽的数目,已使用氨基酸的不同官能团来选择性分离或标记特定的肽。已被描述适合于该目的的官能团是半胱氨酸的巯基,天冬氨酸、谷氨酸和羧基端的羧基,赖氨酸和肽自身的氨基端的胺基团。
在蛋白质组学中半胱氨酸常用作用于选择性分离或标记肽的官能团。其在所有蛋白质中的约85%中出现,并在多肽中平均以约2-3%的频率出现。因此,仅分析蛋白质样品的含半胱氨酸肽被认为就足够代表整个蛋白质库。此外,半胱氨酸的巯基不在任何其他氨基酸中出现,因此得以进行特异性标签化或标记。然而,一个缺点在于蛋白质中的半胱氨酸残基通常形成二硫桥键,其有助于蛋白质的三级或四级结构并因此常成对存在。因此,使用半胱氨酸标记肽通常标记来自同一蛋白质的至少两个肽,导致产生冗余信息。此外,半胱氨酸残基常位于有助于蛋白质结构的蛋白质结构域内。在具有不同功能的蛋白质之间,这样的结构域通常是保存的(conserved)。因此,基于其含半胱氨酸肽而明确地鉴定蛋白质可能是困难的。半胱氨酸的另一个缺点是虽然半胱氨酸在蛋白质中的出现率相对高,但其分布有些不均。尽管存在许多富半胱氨酸蛋白质,但并非所有蛋白质都含有半胱氨酸(如核糖体蛋白)。因此,通过半胱氨酸导向的标签化或标记某些蛋白质会被忽略,与此同时其他蛋白质则会过度表现。最后,在样品操作期间,半胱氨酸残基可能被氧化。这样被氧化的氨基酸不再能被用于巯基特异性标签化或标记。
组氨酸的咪唑基团,另一种蛋白质中的独特的官能团,基于其针对金属所固有的亲和力,被广泛用于亲和层析,但很少用作用于蛋白质修饰的靶点。
通常包含6组氨酸残基尾部的组氨酸标签化的生物分子通过固定化金属离子亲和层析(immobilised metal ion affinity chromatography,IMAC)被纯化。以正确构型存在的具有人工添加或天然存在的包含多个组氨酸、半胱氨酸或色氨酸的序列的蛋白质可结合于含有共价结合的螯合金属离子的柱基质。最常见的是,Ni螯合物层析在亲和层析中用作基质来纯化已被表达为在蛋白质的N-或C-端具有一个或多个His6标签的融合蛋白质的重组蛋白质。通常,镍离子通过次氮基三乙酸基团连到柱基质并与标签化的蛋白质中的组氨酸残基发生相互作用以交换水。使用增加的咪唑浓度梯度或以步进方式来进行洗脱。除Ni2+之外,其他金属离子也适用于IMAC,例如Cu2+、Zn2+、Co2+、Fe3+、Hg2+
在Mirzaei & Regnier(2005)J.Chrom.B 817,23-34中综述了使用IMAC从胰蛋白酶消化物中选择含组氨酸肽。WO2006064451中描述了使用芳基硼酸通过咪唑基团将诊断骨架(diagnostic shells)偶联至抗体,其基于Collman等(2001)J.Org.Chem.66,1528-1531中描述的铜催化的反应(参见图1)。硼酸(boronic acid)已知在医药领域中作为在高于pH8.0下与糖的顺式二醇基团共价结合的试剂。硼酸修饰的肽的用途被描述为用于抑制丝氨酸蛋白酶。
发明内容
本发明提供了在将含组氨酸肽应用于随后的分析之前,用于共价标签化和任选地标记含组氨酸肽以及从复杂的蛋白质混合物中选择性分离含组氨酸肽的工具和方法,所述随后的分析通过分离技术如液相色谱法继之以谱质量分析(spectrometric mass analysis)进行。
本发明的方法和工具所提供的一个优点是通过在蛋白质样品的蛋白水解断裂(proteolytic cleavage)后分离含组氨酸肽,每种蛋白质都由数目有限的肽代表,使得待分析样品的复杂性大大降低,但不丢失与原始蛋白质样品的蛋白质内容物(protein content)相关的重要信息。
本发明的方法和工具的另一个优点是对于那些已测序基因组的生物体(例如人和多种模型生物体如小鼠和大鼠),蛋白质组的所有蛋白质的含组氨酸肽都是已知的(或可推出)。可预测这些肽的精确的分子量,其可用于支持在MS中产生信号的肽的鉴定以及任选的亲本蛋白质(parent protein)的鉴定。
本发明特定的和优选的方面列于所附的独立和从属权利要求中。来自属权利要求的特征在适当时可与独立权利要求的特征和与其它从属权利要求的特征合并,而不仅仅是如权利要求中所明示的那样。
本发明的第一方面涉及一种共价连接亲和标签至含组氨酸的蛋白质或肽的方法。该方法包括在铜催化剂存在下将蛋白质或肽与标签化试剂接触的步骤,所述标签化试剂是具有结构通式(I)的化合物:
Figure A200780041206D00101
其中A是亲和标签,B是硼和L是任选的连接体(linker)。
根据该方法的一个实施方案,具有结构通式(I)的化合物在芳环进一步为卤素、烷氧基或烷基所取代。
在本发明方法的特定实施方案中,亲和标签A是生物素(biotin)。
根据该方法的一个具体实施方案,标签化试剂是这样的化合物,其是具有式(II)的分子:
根据该方法的另一个具体实施方案,标签化试剂是具有式(III)的化合物:
Figure A200780041206D00112
根据本发明方法的又一个具体实施方案,具有通式(I)的标签化试剂,更具体而言具有相应于(II)或(III)的结构通式的标签化试剂,进一步包含标记物(label)。根据一个具体实施方案,存在于标签化试剂上的标记物由一个或多个重原子同位素组成。
本发明的另一方面涉及一种用于从蛋白质样品或合并的蛋白质样品的混合物中分离含组氨酸肽的方法,包括步骤:(a)用断裂剂(cleavingagent)将蛋白质样品中完整的蛋白质断裂成肽,(b)在铜催化剂存在下将蛋白质样品与具有结构通式(I)的芳基硼标签化试剂(arylboronic taggingreagent)接触,
其中A是亲和标签,B是硼和L是任选的连接体,从而使芳基硼标签化试剂与存在于肽中的组氨酸(如果存在的话)反应;(c)通过所述亲和标签使标签化的肽与亲和基质(affinity matrix)结合;和(d)从亲和基质上除去结合的标签化的肽以获得分离的含组氨酸肽。
根据本发明该方面的方法的具体实施方案,在步骤(a)之前进行步骤(b),并将芳基硼标签化试剂与样品中未断裂的蛋白质接触,使存在于蛋白质中的组氨酸(如果存在的话)标签化。
本发明的另一方面提供了用于同时分析不同样品中一种或多种含组氨酸蛋白质的出现的方法,其包括步骤:
a)任选地,用断裂剂将样品中的完整的蛋白质断裂成肽,
b)在铜催化剂存在下将每种样品与一组芳基硼酸标记试剂中的一种接触,其中芳基硼酸标记试剂具有结构通式(I),
Figure A200780041206D00121
其中A是亲和标签,B是硼和L是任选的连接体,以及其中芳基硼酸试剂组中的每种试剂进一步包含标记物,其是同位素或同量异序标记物(isotopic or isobaric label),使得每种标记试剂的结构基本上相同,
c)合并不同的样品以获得多肽或肽样品混合物,
d)通过亲和标签从多肽或肽样品混合物中选择性分离标记的多肽或肽,和
e)通过质谱法分析分离的标记的多肽或肽,从而确定每种标记的多肽的出现。其中标记的多肽的出现代表了样品中相应蛋白质的出现。
本发明的又一方面提供了用于鉴定蛋白质样品中蛋白质的存在的方法,包括步骤:
a)在铜催化剂存在下通过将蛋白质与具有结构通式(I)的标签化试剂接触,修饰蛋白质样品中的蛋白质的组氨酸的胺官能:
Figure A200780041206D00122
其中A是亲和标签,B是硼和L是任选的连接体,
b)用断裂剂将蛋白质样品中的蛋白质断裂成肽,
c)通过亲和标签从这些肽中分离含组氨酸肽,
d)通过一个或多个肽纯化步骤纯化分离的含组氨酸肽,从而获得纯化的含组氨酸肽,
e)测定或计算纯化的含组氨酸肽除质量之外的至少一种物理化学性质,
f)在MS上测定分离和纯化的含组氨酸肽的质量,和
g)对于每种分离和纯化的含组氨酸肽,将所述质量和所述至少一种其他物理化学性质与包含通过断裂剂产生的所有含组氨酸肽的质量和一种或多种物理化学性质的数据库进行比较,从而鉴定纯化的含组氨酸肽的相应亲本蛋白质,由此鉴定蛋白质样品中亲本蛋白质的存在。
根据该方法的一个实施方案,步骤(g)包括对于每种分离和纯化的含组氨酸肽,鉴定数据库中质量相应于该分离和纯化的含组氨酸肽的质量的一种或多种含组氨酸肽,以及对于一种分离和纯化的含组氨酸肽当鉴定出多于一种的肽时,比较该分离和纯化的含组氨酸肽和数据库中被鉴定的多于一种的肽的至少一种其他物理化学参数。
根据该方法的另一个实施方案,蛋白质样品来自物种(species)以及数据库包含通过断裂剂产生的该物种的所有含组氨酸肽的质量和至少一种其他物理化学性质。
根据一个实施方案,上述方法用于在两种或更多种样品中同时鉴定蛋白质,并且该方法包括:
-在步骤(a)中用一组包含差异化标记物组分的标签化试剂中的一种对每种样品进行修饰,
-在步骤(d)之前合并两种或多种样品的附加的步骤,
-在步骤(f)之前,鉴定标记物的性质从而鉴定肽所来源的样品的步骤。
根据上述方法的具体实施方案,在一个或多个肽纯化步骤过程中测定至少一种物理化学性质。
更具体而言,本发明提供了上述方法的实施方案,其中所述至少一种物理化学性质选自pI、反相层析过程中的保留时间和在280和214nm处的UV吸收比值。
本发明的又一方面提供了用于标签化蛋白质或肽中的组氨酸的标签化试剂,具有结构通式(I)的化合物:
其中A是亲和标签,选自生物素或生物素衍生的分子、麦芽糖(maltose)、凝集素(lectin)、结合到半抗原特异性抗体的半抗原和谷胱甘肽,B是硼和L是任选的连接体。
在标签化试剂的具体实施方案中,结构(I)的芳环进一步为卤素、烷氧基或烷基所取代。
在另一个实施方案中,化合物上的亲和标签A是生物素。
在一个具体的实施方案中,本发明的标签化试剂具有式(II)的结构:
Figure A200780041206D00142
在另一个具体的实施方案中,本发明的标签化试剂具有式(III)的结构:
Figure A200780041206D00143
本发明标签化试剂的具体实施方案进一步包含标记组分,更具体而言,由一个或多个重同位素组成的标记组分。更具体而言,标签化试剂具有结构通式(I),其中亲和标签和芳基硼基团之间连接体(L)中的一个或多个碳原子和/或一个或多个氢原子分别为13C或氘所取代。在另一个具体的实施方案中,本发明的标签化试剂具有结构通式(III),其中生物素基团和芳基硼基团之间连接体中的一个或多个碳原子和/或一个或多个氢原子分别为13C或氘所取代。
本发明的又一方面涉及一组用于多肽质谱分析的标记试剂,其中组中的所有标记试剂都具有所描述的相同的化学结构(I),以及其中组中的每种标记试剂都具有独特的同位素标记物组分。
在本发明标记试剂组的一个实施方案中,该组的各个标记试剂具有根据式(III)的结构:
其中生物素基团和芳基硼基团之间连接体中的一个或多个碳原子和/或一个或多个氢原子分别为13C或氘所取代。
本发明的另一方面涉及上述标签化试剂和组合的标签化和标记试剂用于标签化和(差异化)标记蛋白质的用途。
本发明的另一方面提供了通过断裂剂以in silico方式断裂的生物体蛋白质的含组氨酸肽的数据库,其中每种肽以蛋白质标识符(proteinidentifier)、其氨基酸组成和其质量来表征,其中该质量为未修饰的肽的质量或修饰或标记后的肽的质量。
在本发明中提供的数据库的一个实施方案中,具有不同序列和相同质量的数据库中的肽进一步以所述肽除其质量之外的至少一种物理化学参数来表征。
在另一个实施方案中,本发明的数据库是通过断裂剂以in silico方式断裂的生物体蛋白质的含组氨酸肽的数据库,所述断裂剂是胰蛋白酶。
本发明的又一个方面涉及上述数据库用于鉴定蛋白质的用途。
本发明的又一个方面涉及一种用于蛋白质样品多路标记(multiplexlabelling)和分析的装置(100),包含至少一个样品源(101)、标签化和标记单元(103)和用于本发明芳基硼试剂的相应的标签化/标记试剂源(104),蛋白质断裂单元(105)、亲和分离单元(106)、分离单元(107)、质谱仪单元(109)和与in silico断裂的含组氨酸肽的注释的数据库(112)连接的数据分析单元(110)。
在一个实施方案中,该装置进一步包含样品制备单元(102)和/或用于测定在分离单元(107)中纯化的肽的一种或多种物理化学性质的分析单元(108)。
结合附图从举例说明本发明原理的以下详细描述,本发明的上述和其他特点、特征和优点将得以显而易见。所给说明仅为举例,并不限制本发明的范围。以下所引用的参考图是指附图。
附图说明
图1显示了根据上述引用的Collman等,在铜催化剂存在下芳基硼酸与咪唑的反应。
图2显示了根据本发明的一个具体实施方案,如实施例2中所举例说明的芳基硼标签化试剂与多肽中存在的组氨酸的铜催化的反应。
图3显示了根据本发明一个具体实施方案,一种用于从蛋白质溶液中选择性分离含组氨酸肽的方法。(1):蛋白质变性;(2):蛋白水解断裂成N-端(a),内部(b)和C-端(c)肽;(3):与组氨酸反应性标签化试剂反应;(4)用捕捉试剂(capture reagent)(黑箭头)通过亲和标签(灰箭头)将标签化的肽偶联至固体支持体(support)。
图4显示了根据本发明的具体实施方案,使用包含同位素标记物组分的组氨酸反应性标记试剂同时分析多个样品。
图5显示了根据本发明的一个具体实施方案,一种用于4种蛋白质样品多路分析的装置(100),包含至少四个样品源(101)、样品制备单元(102)、带有标记试剂源(104)的标记单元(103)、蛋白质断裂单元(105)、亲和纯化单元(106)(如抗生物素蛋白亲和层析系统)、包含两个连续相连的分析系统(1107)和(2107)的分离单元(107)、质谱仪单元(109)以及与读出系统(112)连接的控制和分析电路和数据分析单元(111)。单元(108)是用于测定单元(107)中纯化的肽的物理化学性质的分析单元,以及单元(110)包含含组氨酸肽的注释的数据库(点线表示实验和in silico数据的获取)。
图6显示了根据本发明一个具体实施方案,基于如实施例1中所举例说明的NHS官能化生物素与间氨基苯基硼酸的反应的标签化试剂的合成。
图7显示了根据本发明的一个具体实施方案,在实施例1所述的合成中反应物和反应混合物的IR光谱。
图8在A面显示了根据本发明的一个具体实施方案,EDC介导的生物素与间氨基苯基硼酸的偶联,以及B面显示了A面中所示出的一般反应的详细反应图解,其中生物素基团被黑圆替换。
图9显示了根据本发明的一个具体实施方案,实施例2中所举例说明的铜催化的标签化试剂与含组氨酸肽的反应。
具体实施方式
本发明将关于具体的实施方案以及参考某些附图进行描述,但本发明不受限于此而仅为权利要求所限制。权利要求中的任何附图标记不应视为对范围的限制。所描述的附图仅是示意性的,并且是非限制性的。在附图中,为了说明目的某些元件的尺寸可能是夸大的且没有按比例绘制。在术语“包含”用于本说明书和权利要求书之处,其不排除其它要素或步骤。在不定冠词或定冠词使用之处,当涉及单数名词如“a”或“an”、“the”时,除非另有特定说明,否则其包括多个该名词。
此外,说明书和权利要求书中的术语第一、第二、第三等等用于区分相似要素,但并不一定用于描述序贯顺序或时间顺序。应当明白在合适的环境下这样使用的术语是可交换的,并且在此描述的本发明的实施方案能以不同于在此描述或说明的其他顺序操作。
以下术语或定义只提供用于帮助理解本发明。这些定义不应解释为具有小于本领域普通技术人员所理解范围的范围。
当在本文中使用时,术语“多肽”或“蛋白质”指通过肽键连接的多个天然或修饰的氨基酸。多肽的长度可在2至几千个氨基酸范围内改变(因此该术语还包括通常所称的寡肽)。包括在该范围内的是包含一个或多个通过体内翻译后修饰如糖基化、磷酸化等所修饰的氨基酸,和/或包含一个或多个已在体外用蛋白质修饰剂(如烷化剂)修饰的氨基酸的多肽。
当在本文中使用时,术语“多肽片段”或“肽”用于指蛋白质或多肽断裂后获得的氨基酸序列。多肽片段或肽大小或性质均不受限。
术语“内部”、“氨基端”和“羧基端”当涉及肽时,在本文中用于指肽在蛋白质或多肽中相应的位置。例如,在胰蛋白酶断裂蛋白质NH2-X1-K-X2-R-X3-K-X4-COOH(其中X1、X2、X3和X4为不含赖氨酸(K)或精氨酸(R)的长度不重要(indifferent length)的肽序列)中,氨基端肽为NH2-X1-K-COOH,内部肽为NH2-X2-R-COOH和NH2-X3-K-COOH以及羧基端肽为NH2-X4-COOH。
当在本文中使用时,术语“蛋白质断裂”涉及多肽中两个氨基酸之间肽键的水解。其包括化学或酶水解。因此,当在本文中使用时,术语“断裂剂”指能水解多肽或肽中两个氨基酸之间的肽键的化合物。
术语“亲本蛋白质”指断裂的肽所来源的未被断裂的蛋白质。
当在本文中使用时,术语“碎裂”指一个或多个化学键破裂并随后释放一个或多个分子部分,如例如在串联质谱法(MS)或MS/MS分析中通过碰撞诱导解离(CID)所获得的。在某些实施方案中,所述键为肽键,但其不限于此。
当在本文中使用时,术语“蛋白质/肽反应基团(PRG)”指化合物(如标记试剂)上能与蛋白质或肽的氨基酸上的官能团反应、导致所述化合物结合(非共价或共价)到氨基酸的化学官能。本发明提供了作为与氨基酸组氨酸的官能团起反应的蛋白质/肽反应基团的根据下述结构的芳基硼酸分子。
当在本文中使用时,术语“标签”或“亲和标签”指可被共价连接至肽或多肽,以及基于其与另一化学结构的特定相互作用,可用于从混合物中分离其所结合的肽或多肽的化学结构。因此,当在本文中使用时,术语“标签化试剂”在与蛋白质或肽反应前包含未结合的标签,和包含用于将标签共价结合至蛋白质或肽的蛋白质/肽反应基团。在本发明的标签化试剂中,蛋白质/肽反应基团(PRG)是与组氨酸起反应的芳基硼酸。
当在本文中使用时,术语“标记物”指这样的化学结构,其共价连接至或可被共价连接至肽或多肽以及其基于其特定性质在质谱仪上或通过光学方法是可检测的。一般而言,术语“标记物”将用于指存在于多肽或肽上的分子,以及术语“标记试剂”用于指标记物组分和蛋白质/肽反应基团的组合。标记物组分(即产生标记物的标记试剂的部分)可掺入标记试剂的蛋白质/肽反应基团中,或可以是独立的化学结构,处于蛋白质反应基团中或结合在蛋白质反应基团上。当根据本发明的标签化试剂包含标记物组分时,该试剂可被用作标记试剂并将被称为标记试剂。
在本发明中,术语“质量”指质荷比(m/z)。缩写m/z用于表示通过将离子的质量数除以其电荷数产生的无量纲量。“单一同位素质量”指仅含有最丰同位素的离子的质量。“平均质量”指对于具有给定经验式的粒子或分子使用每种元素的原子量计算的质量。
当在本文中使用时,术语“同位素标记物”和“同位素标记试剂”指一组标记物和标记试剂,其具有相同化学式但彼此在存在一个或多个原子的同位素的数量和/或类型方面不同,导致MS上质量的不同。因此,可基于质量差异在MS上就此区分用不同的同位素标记物标记的相同的肽。在本发明中,虽然同量异序标记物(参见下文)原则上构成特定类型的同位素标记物,但是术语同位素标记物将用于指这样的标记物:其是非同量异序的,但是可基于它们的分子量无需碎裂而就此被区分。
当在本文中使用时,术语“同量异序标记物”和“同量异序标记试剂”指一组具有相同结构和相同质量的标记物,对于该组所有的同量异序标记物其在碎裂时释放具有相同结构的特定碎片,其由于同量异序标记物中同位素的差异分布在该组的单独同量异序标记物之间质量上有差异。同量异序标记物通常包含报告基团(RG)(其是相对小的碎片)以及平衡基团(BG)。一组同量异序标记物的“组合质量”指对于该组同量异序标记报告基团和平衡基团的总质量。
当在本文中使用时,术语“官能团”指可用于结合(一般地共价结合)化合物的氨基酸上的化学官能。官能团可存在于氨基酸的侧链上或多肽或肽的氨基端或羧基端上。该术语包括天然存在于肽或多肽上的官能团以及那些通过例如使用蛋白质修饰剂的化学反应引入的官能团。
本发明的一个方面涉及标签化试剂,其是包含与组氨酸的咪唑官能团起反应的蛋白质反应基团以及包含亲和标签的化合物。更具体而言,与组氨酸起反应的PRG是取代或未取代的芳基硼酸。
本发明的试剂通常是指具有结构通式(I)的取代的芳基硼酸:
其中A是亲和标签,B是硼和L是任选的连接体。
苯上的A-(L)-基团可相对于B(OH)2处于邻、间或对位。
在本发明试剂的具体实施方案中,苯基团的其余位置为一个或多个独立选自烷基(如甲基、乙基、丙基)、卤素(如F)、烷氧基(如甲氧基)或官能团如羧基、氨基或巯基(thiol)的取代基所取代。
根据用于制备蛋白质标记试剂的有机化学中通常已知的方法实施本发明的试剂的制备。通常,这通过让包含附加官能团(如氨基)的芳基硼酸(或烷基芳基硼酸)与携带有能与芳基硼酸上的官能团起反应从而产生共价键的官能团的亲和标签或连接体反应来确保。在实施例部分中举例说明了多种化合物的制备。本发明的标签化试剂确保将亲和标签(A)结合到蛋白质或肽,该标签可用于选择性分离该标签所结合的蛋白质或肽。
本发明化合物和方法中的亲和标签的性质并不关键。众所周知的亲和标签的典型实例包括d-生物素(或生物素衍生的分子)、麦芽糖和其他糖/糖结合、结合到半抗原特异性抗体的半抗原以及谷胱甘肽。在本发明中有用的亲和标签的另外实施方案详述如下。
亲和标签可以是大体积的,并可能需要在PRG和该亲和标签之间存在连接体L。连接体L可以是仅服务于该目的(即分隔亲和标签和蛋白质反应基团以避免干扰)的分子结构或可同时包含所有或部分标记物组分(详述如下)。另外或可选地,连接体可提供亲和标签和化合物剩余部分之间的可断裂的键(也详述如下)。
本发明的一个具体实施方案提供了如上所述的标签化试剂,其另外包含标记物组分。更具体而言,提供了一组两种或更多种的标签化试剂,该组中每种标签化试剂包含用于在质谱法中差异标记蛋白质或肽的一组标记物组分中的一种。根据该实施方案,本发明的标签化试剂被称为标记试剂。
根据一个实施方案,本发明的标记试剂包含基团作为标记物组分,该基团可通过光学方法如吸收可见光或紫外光或发荧光或磷光检测。
然而,根据具体的实施方案,本发明的标记试剂包含其是同位素标记物组分的标记物组分(即属于一组同位素标记物组分的标记物组分)。因此,使用这样的同位素标记试剂使得能鉴定合并的肽混合物中差异标记的肽。
根据一个实施方案,本发明同位素标记试剂中的同位素标记物组分包含相同的分子结构,其中在每个标记物组分中,一个或多个原子为稳定同位素所取代,从而产生两种或更多种具有相同化学式但基于它们的质量差异是同位素可区分的化合物。例如,同位素标记物组分中的任何一个或多个氢、氮、氧或硫原子可分别为它们的同位素稳定的(isotopically stable)同位素2H、13C、15N、17O、18O或34S所取代。例如,氢为氘所取代或碳12C为13C所取代。使用一种或多种上述同位素,可产生2、3、4、5、6、7、8种或甚至更多数量的同位素标记物组分,每种都具有相同的结构但具有不同的Mr。如上所述,一旦每种标记试剂结合到不同样品中的相同多肽上,这些标记物组分的Mr差异就反映在从其产生的多肽或肽所得到的Mr上。
通过差异引入一个或多个同位素从而可起同位素标记物组分作用的基团的实例包括但不限于醚、聚醚、醚二胺、聚醚二胺、二胺、酰胺、聚酰胺、聚硫醚、二硫化物、甲硅烷基醚、烷基或烯基链(直链、支链或具有环状部分)、芳基、二芳基或烷基芳基。在具体的实施方案中,存在于本发明标记试剂的同位素组分中的芳基包含一个或多个杂原子(如N、O或S原子)。
根据一个具体的实施方案,标记试剂的同位素标记物组分是这样的,其在(MS)n分析过程中不经历与肽类似的碎裂(peptide-likefragmentation)。为促进离子化(ionization),同位素标记物组分以及更具体而言其中的同位素基团可包含例如以下的基团或部分:酸性或碱性基团,如COOH,SO3H,伯、仲或叔氨基,氮-杂环,醚或这些基团的组合。在具体的实施方案中,同位素标记物组分包含具有永久电荷的基团,如鏻基团、季铵基团、锍基团、螯合的金属离子、四烷基或四芳基硼酸盐(tetralky or tetraryl borate)或稳定的负碳离子(carbanions)。
本发明标记试剂的同位素标记物组分可以是分子的单独部分或可掺入蛋白质反应基团中或与之结合。根据后一实施方案,同位素标记物组分的同位素可掺入芳基硼酸的芳基中,掺入在该芳环上的取代基中,或当连接芳基硼酸和亲和标签的连接体(L)存在时,掺入连接体(L)中。
根据本发明该实施方案的同位素标记试剂的制备类似于US6,852,544实施例中所披露的同位素标记试剂的制备,其中蛋白质反应基为芳基硼酸(arylboronic acid)。
根据另一个实施方案,本发明的标记试剂包含同量异序标记物组分作为标记物组分。类似于包含同位素标记物组分的试剂,使用同量异序标记试剂使得能鉴定合并的肽混合物中差异标记的肽。
在本发明中使用的同量异序标记组分在本领域中已有描述。如以上详述的那样,同量异序标记物组分包含报告基团(RG)(其是相对小的碎片)以及平衡基团(BG),其中对于组中所有同量异序标记物组分,报告基团和平衡基团的组合质量都相等,而对于组中每种同量异序标记物组分,RG的质量则是不同的并被用于区分鉴定相同的肽。
在其中存在同量异序标记物的那些实施方案中,亲和标签通常置于其不影响碰撞诱导解离(CID)后报告基团释放的位置。
本发明标记试剂的同量异序标记组分可以是独立的结构。可选地,报告基团和平衡基团通常是连接体的一部分或连接体的取代基。在具体的实施方案中,芳环及其上的取代基用于掺入同位素并作为平衡基团。在非常具体的实施方案中,可被认为是连接体的连接亲和标签与组氨酸反应基团的结构作为同量异序标记组分,其中该连接体的主结构是平衡基团并且报告基团位于该连接体的侧链上。在另一个非常具体的实施方案中,通过在连接体的指定(dedicated)区域中同位素的特定分布并邻接报告基团提供易于通过CID断裂用于释放该报告基团的键,使得平衡基团和报告基团都是连接体的一部分。
在一个实施方案中,根据本发明该方面的同量异序标记试剂的制备相应于WO2004070352的实施例中披露的同量异序标记试剂的制备,其中蛋白质反应基团是(烷基)芳基硼酸。
如上所述,在本发明的标签化和标记试剂中亲和标签的存在,允许将标签化的和任选地标记的肽或多肽,共价或非共价地且以高亲和性选择性地结合到捕捉试剂(CR)。通常,亲和标签与捕捉试剂的结合是强的,使得其抗多种溶液的任何一种或组合的大量和/或多次洗涤,其确保非特异性结合到捕捉试剂的肽或多肽被除去。通常,在MS分析过程中亲和标签并不经历与肽类似的碎裂。
如上所述,以及更具体而言对于用在本发明方法中,亲和标签的性质并不关键,只要其允许选择性结合到捕捉试剂(CR)并任选地从其中除去,而不影响结合到该亲和标签的肽或多肽即可。
因此,亲和标签(A)和捕捉试剂(CR)对的非限制实例包括:
-d-生物素或结构上修饰的基于生物素的试剂,包括d-亚氨基生物素,其结合抗生物素蛋白/链霉抗生物素蛋白(streptavidin)(例如链霉抗生物素蛋白-琼脂糖、低聚的抗生物素蛋白-琼脂糖或单体的抗生物素蛋白-琼脂糖),
-麦芽糖,其结合麦芽糖结合蛋白;或其它糖/糖结合蛋白对,或更一般地说,任何遵从上述亲和标签标准的配体/配体结合蛋白对,
-半抗原,例如二硝基苯基基团,其结合相应的抗-半抗原抗体如抗-二硝基苯基-IgG,
-谷胱甘肽,其结合谷胱甘肽-S-转移酶。
在本发明的具体实施方案中,在MS分析之前进行标记的肽或多肽的亲和纯化。因此,由于结合的肽或多肽需要进一步分析,所以需要从捕捉试剂上除去或从肽上解离亲和标签。这可用不同的方法来得以确保。
在具体的实施方案中,亲和标签通过可断裂的键(例如但不限于酸不稳定、硫醇不稳定、碱不稳定、高碘酸盐不稳定或羟胺不稳定的键)连接于标记试剂。
在进一步的具体实施方案中,亲和标签和标记试剂之间的键还可以是通过化学、热或光化学反应可断裂的。适合的光可断裂基团为1-(2-硝基苯基)-乙基。热不稳定的键为例如在加热下会离解的双链核酸、核酸与肽核酸的双链或双链肽核酸链。可断裂的基团还包括具有二硫键(disulfide bonds)的那些,酸或碱不稳定基团,高碘酸盐不稳定的或羟胺不稳定的基团,尤其包括二芳基甲基或三甲基芳基甲基基团,甲硅烷基醚,氨基甲酸酯/盐(carbamates),氧酯(oxyesters),硫酯(thiesters),硫代酯(thionoesters)以及α-氟化酰胺和酯。酶可断裂的基团是例如蛋白酶敏感的酰胺或酯、β-内酰胺酶敏感的β-内酰胺类似物和核酸酶或糖苷酶可断裂的键。
根据该实施方案,可通过用适当的试剂处理标记的蛋白质或肽除去亲和标签。由于其它原因亲和标签的除去可能也是理想的,例如避免肽的分析中如MS中的干扰。通常,在标记的肽或多肽的亲和分离之后断解掉亲和标签。
可选地,亲和标签可存在于本发明的标签化和标记试剂中,通过不可断裂的键连接到蛋白质/肽反应基团。为了确保亲和纯化的肽能被回收,如果亲和标签不是可除去的,则使用以某种方式可以从捕捉试剂(CR)解离的亲和标签。在具体的实施方案中,使用生物素和基于生物素的亲和标签。尤其感兴趣的是结构修饰的生物素,例如d-亚氨基生物素,其在与ESI-MS分析相容的溶剂条件(例如含10-20%有机溶剂的稀酸)下会从抗生物素蛋白或链霉抗生物素蛋白柱上洗脱下来。已确认d-亚氨基生物素标签化的化合物会在低于pH4的溶剂中洗脱。
另外地或可选地,置换配体(DL)被用于从捕捉试剂(CR)中置换亲和标签(A)(以及结合在其上的肽或蛋白质)。当用DL洗脱时,至少一小部分该DL会存在于包含目的肽的洗脱液中。在具体的实施方案中,本发明的方法可包含使用这样的DL,其是在MS分析过程中不经历与肽类似的碎裂的分子,以及其在样品中的存在不明显抑制标签化的肽、底物或反应产物缀合物(conjugates)的离子化。特别地,可选择这样的置换配体,使得在质谱仪分析过程中其自身被最低程度地离子化并且由DL簇(clusters)组成的离子的形成是最小限度的。
合适的置换配体(DL)的性质取决于使用的A和CR的性质。一般而言,选择以合理的时间尺度从CR置换A的DL,至多在添加它的一周内,但更优选在几分钟之内或至多1小时。DL对CR的亲和力应与含A的标签化的化合物对CR的亲和力相当或更强。此外,DL应可溶于在含亲和标签A的标签化的化合物从CR上洗脱过程中所使用的溶剂中。在具体的实施方案中,DL相应于游离的亲和标签A或A的衍生物或结构修饰物。因此,置换配体的实例包括d-生物素或d-生物素衍生物。
如上所述,在本发明的某些实施方案中,标签化或标记试剂包含位于亲和标签和组氨酸反应基团(芳基硼酸)之间的连接体。该连接体可以是(烷基)芳基硼酸和亲和标签之间反应的剩余物(remainder)。所述连接体还可用于将(体积庞大的)亲和标签与蛋白质反应基团物理分离,从而防止该亲和标签干扰试剂与肽的结合。如上所述,在本发明的标记试剂中,连接体可任选地掺入同位素或作为用于光学标记物组分或用于同量异序标记物组分的报告基团的支架(scaffold)。如上所述,在非常具体的实施方案中,连接体作为平衡基团以及报告基团位于该连接体的侧链上。在另一个非常具体的实施方案中,通过同位素在连接体的指定区域中的特异性分布并提供易于通过CID断裂用于释放报告基团的邻接此报告基团的键,平衡基团和报告基团都是连接体的一部分。
在本发明的具体实施方案中,存在于标签化或标记试剂中的亲和标签是生物素。在进一步的具体的实施方案中,芳基硼酸是苯基硼酸。在一个非常具体的实施方案中,本发明的化合物是具有式(II)的分子:
Figure A200780041206D00251
其中该一般结构额外包含作为标记组分的一个或多个‘重’同位素。
在另一个具体的实施方案中,本发明的标记试剂是具有式(III)的分子。
Figure A200780041206D00252
其中任选地生物素基团和芳基硼基团之间连接体中的一个或多个碳原子和/或一个或多个氢原子分别为13C或氘所取代。
上述标签化和标记试剂通过允许选择性分离含组氨酸肽可用于降低蛋白质样品的复杂性。
对于标签化和/或标记试剂,为确保选择性分离代表性数目的肽,该试剂理想地靶向样品中的几乎每一种蛋白质以获得样品中蛋白质组的最大覆盖。与此同时,当考虑到每一个单独的蛋白质时,蛋白质中与所述试剂起反应的官能团的数目理想地是低的,从而降低分析的复杂性(来自样品中该蛋白质的待分析肽的数量仅有一个或是有限的数目)。
在本发明的工具和方法中,组氨酸被用作用于标签化和/或标记的官能团。组氨酸标记化提供了在最大覆盖(标记样品中每一种蛋白质)和最小复杂性(样品中每一种蛋白质仅标记一次或有限次数)之间的可接受的折衷。在多肽序列中组氨酸以2-3%的频率出现(每30-50个氨基酸中出现1个)。此外,用组氨酸标记不会修饰蛋白质的其他部分,而标记出现在赖氨酸和氨基端的胺基团或标记出现在天冬氨酸、谷氨酸和羧基端的羧基则通常会这样。
因此,本发明试剂的应用涉及将芳基硼酸标签化或标记试剂共价结合至多肽中组氨酸的咪唑(参见图2-尽管该图显示了包含六组氨酸的肽,但根据本发明对于通过与芳基硼基团反应进行标签化,不需要存在多个组氨酸)。
在铜催化剂如[Cu(OH)TMEDA]2Cl2存在下,芳基硼酸与咪唑在pH值4.6-9.0之间在水性环境中的反应披露于Collman等(2001),J.Org.Chem.66,1528-1531中并示意于图1中。然而,考虑到本发明的应用,该反应通常在低于8的pH值下进行以避免标签化或标记试剂与糖基化多肽的反应。在本发明的方法中,尽管通常在水性环境中进行芳基硼标签化或标记试剂与蛋白质样品的接触,但是如在Collman等(2001)J.Org.Chem.66,7892-7897中披露的那样,该反应还可在有机溶剂的存在下进行或甚至完全在有机溶剂如CH2Cl2中进行。
因此,本发明的另一方面涉及具有相应于上述式(I)的通式结构的标签化试剂用于共价标签化含组氨酸肽的用途。
更具体地说,本发明提供了用于将亲和标签共价连接至含组氨酸蛋白质的方法,包括步骤:在铜催化剂存在下将该蛋白质与具有结构通式(I)的化合物接触:
Figure A200780041206D00261
其中A是亲和标签和L是任选的连接体。
本发明的特定实施方案提供了用于从蛋白质样品中分离含组氨酸肽的方法,包括步骤:用断裂剂将蛋白质样品中的完整蛋白质断裂成肽,并在铜催化剂存在下将该蛋白质样品与具有上述结构通式(I)的芳基硼标签化试剂接触,从而使芳基硼标签化试剂与存在于肽中的组氨酸(如果存在的话)反应。然后,通过亲和标签将标签化的肽结合至亲和基质,并从亲和基质上除去结合的标签化的肽以获得分离的肽。本发明方法的特定实施方案涉及使用在此描述的特定标签化试剂,以及在适当情况下,取决于亲和标签的性质以及是否其用可断裂的键被连接在标签化试剂中以及连接在肽上,使用合适的方法除去亲和方法结合的肽,如以上详述的那样。
本发明的又一个方面涉及本发明标记试剂在不同的蛋白质样品的同时质谱分析中的用途。同时分析样品避免了分析方法中的技术变动性(technical variability)。
因此,本发明该方面的方法和工具在一种或要求比较分析的一组两种或更多种样品的分析中是特别令人感兴趣的。这样的一组样品可以是但不限于:来自患者的在不同时间点采样的样品、疾病不同临床版本的样品、不同患者的样品等。因此,本发明提供了用于鉴定疾病进展标志物、用于鉴别诊断以及此外用于生物化学或生理学测定中多路分析的方法和工具。
根据本发明的该方面,提供了方法和测定法,其中使用本发明标记试剂标记两种或更多种样品,从而使得可以用MS进行同时分析。
根据本发明该方面的方法包含标记步骤,其中通过在铜催化剂存在下将蛋白质与上述的包含标记物组分的具有结构通式(I)的化合物接触,用(一组)标记试剂的一种对每种样品在组氨酸上进行标记。在本发明方法中使用的一组标记试剂具有相同或基本上相同的化学结构。更具体而言,它们包含作为标记物组分的同位素或同量异序标记物组分。
在根据本发明该方面的方法中,除了使用本发明的标记试剂的标记步骤(其导致每种样品中蛋白质的差异化标记)之外,将不同的样品合并。通过合并不同的样品,获得多肽样品混合物。这允许在分析中对不同样品进行直接比较。
在标记之后的步骤中,分离并分析标记的肽。最常见的是在肽分离前合并样品。然而,可以考虑在一个或多个纯化或分离步骤后进行样品合并。
如以下详述的那样,通常对单个样品或合并的样品混合物进行肽分离步骤,以允许在MS上对单个肽进行分析。因此,在所述方法包含用根据本发明的同位素或同量异序标记试剂标记两种或更多种样品的步骤的情况下,对于一组标记试剂中的所有试剂而言,所得到的在肽上的同量异序或同位素标记物的化学结构相同或基本上相同,使得在不同标记的相同的肽之间,在(多向)色谱技术中存在于肽上的标记物在性质上不会产生显著差异。因此,被差异化标记的具有相同氨基酸序列的肽在这些分离方法中会具有相同的行为。在差异化标记的样品业已合并的情况下,差异化标记的相同的肽被一起分离。
本发明的方法和工具涉及分析蛋白质样品。当在本文中使用时,术语‘样品’并不意在必定包括或排除任何在进行本发明方法之前的处理步骤。所述样品可以是粗的未经处理的样品、提取的蛋白质级分、纯化的蛋白质级分等。根据一个实施方案,通过免疫耗竭丰量蛋白质(immunodepletion of abundant proteins)来预处理蛋白质样品。
适合于用本发明的标签化或标记试剂和方法分析的蛋白质样品包括病毒、原核生物、细菌、真核生物、真菌、酵母、植物、无脊椎动物、脊椎动物、哺乳动物和人类来源的样品。样品的制备取决于所研究的生物体、组织或器官而不同,但是标准方法通常是可获得的并且是本领域技术人员已知的。对于哺乳动物和人蛋白质样品,它涵盖培养的细胞、激光微解剖的细胞、身体组织、体液或其他感兴趣的相关样品的分离。对于样品中蛋白质的分级,细胞溶解(lysis)是细胞分级和蛋白质纯化中的第一步骤。许多技术可用于破坏细胞,包括基于物理、酶和洗涤剂的方法。历史上,物理溶解是所选择的用于细胞破坏的方法;(匀质化、渗透溶解、超声细胞破坏)然而,它通常需要昂贵的、笨重的设备,并且由于仪器中的变化性(例如,松散装配的与紧密装配的匀质化钵锤的比较)而涉及有时难以重复的方案。近年来,洗涤剂基溶解(使用例如Poppers试剂(Pierce Chemicals))由于容易使用、低成本和高效的方案变得非常受欢迎。
哺乳动物细胞具有质膜,一种形成分隔细胞内含物和细胞外环境的屏障的蛋白-脂质双分子层(protein-lipid bilayer)。构成质膜的脂质是两亲性的,具有亲水性和疏水性部分,其自发地缔合来形成闭合的双分子片层。膜蛋白包埋在所述脂质双分子层中,通过跨越疏水核心的一个或多个结构域(domains)保持就位。此外,外周蛋白(peripheral protein)通过与整合膜蛋白(integral membrane protein)或与极性脂质头部基团的相互作用来结合双分子层的内部或外部表面。脂质和蛋白质内容物的性质根据细胞类型而变化。明显地,选择用于破坏细胞的技术,无论是基于物理的还是基于洗涤剂的,都必需考虑被检查的细胞或组织的来源,以及在破坏它们的外层方面的固有的容易度或难度。此外,所述方法必需与要加工的材料的数量和预期的下游应用相适合。
在特定的实施方式中,蛋白质提取还包括来源于不同区室的细胞蛋白质(例如,细胞外蛋白、膜蛋白、细胞胞浆蛋白(cytosolic proteins)、核蛋白(nuclear proteins)、线粒体蛋白(mitochondrial proteins))的预分级。其他预分级方法根据物理性质例如等电点、电荷和分子量来分离蛋白质。
根据一个特定的实施方式,利用合适的试剂(例如,盐酸胍盐(guanidinium chloride)、尿素、酸(例如,0.1% trifluoric acid)、碱(例如,50%吡啶)和离子或非离子洗涤剂)在标签化/标记或断解之前预处理所述样品,以便使蛋白质变性以实现优化试剂或蛋白酶接近。用还原剂例如(二硫苏糖醇(DTT)、2-巯基乙醇和2-巯基乙胺,以及是膦类和它们的衍生物,例如三(羧乙基)膦(TCEP)或三(2-羧乙基)膦盐酸盐的那些)还原半胱氨酸残基。
在具体的实施方案中,本发明的方法可包括一个或多个步骤,其中在本发明的标签化或标记方法之前,用蛋白质修饰剂不可逆地或可逆地修饰氨基酸(除组氨酸以外)的一个或多个官能团。实例是用于修饰半胱氨酸的巯基、用甲硅烷基化试剂修饰丝氨酸和苏氨酸的羟基、乙酰化赖氨酸的胺基团、修饰天冬氨酸和谷氨酸的羧基的步骤。这样的修饰的具体实例详述于下:
-硫醇反应基团与半胱氨酸的侧链反应。硫醇反应基团包括环氧化物、α-卤素酰基基团、腈、磺化的烷基或芳基硫醇、卤代烷、芳基酰胺和马来酰亚胺类。特定的实例是碘乙酰胺(iodoacetamide)或其衍生物。
-氨基反应基团与赖氨酸的侧链的ε胺基团反应,或与在多肽的N-末端处的胺反应。氨基反应基团结合蛋白质中的氨基,包括磺酰卤、异氰酸酯、异硫氰酸酯、活性酯,包括四氟苯基酯、五氟苯基酯、N-羟基琥珀酰亚胺基酯、N-羟基磺基琥珀酰亚胺基酯、2-硝基苯基酯、4-硝基苯基酯、2,4-二硝基苯基酯和2,4-二卤代苯基酯、酰基卤、和酸酐和混合酸酐。此外,氨基反应基团包括醛或酮,在存在或不存在NaBH4或NaCNBH3的情况下。
-羧酸反应基团与天冬氨酸和谷氨酸的侧链反应,或与多肽的C-末端反应。羧酸反应基团包括胺或醇,在存在偶联剂例如二环己基碳二亚胺、或三氟乙酸2,3,5,6-四氟苯基酯的情况下,以及在存在或不存在偶联催化剂例如4-二甲基氨基吡啶的情况下;和过渡金属-二胺络合物,包括Cu(II)菲咯啉。
-酯反应基团包括胺,例如,其与高丝氨酸内酯反应。甲硫氨酸在CNBr断解期间转化成高丝氨酸内酯。
-磷酸酯反应基团(phosphate reactive group)与磷酸化的氨基酸例如磷酸丝氨酸、磷酸苏氨酸和磷酸酪氨酸反应。磷酸酯反应基团包括螯合的金属,其中金属是例如Fe(III)或Ga(III),螯合到例如次氮基三乙酸(nitrilotriacetiac acid)或亚氨基二乙酸。这些试剂与磷酸化的氨基酸反应(例如,磷酸丝氨酸、磷酸苏氨酸和磷酸酪氨酸)。
-醛或酮反应基团包括胺加NaBH4或NaCNBH3,或首先用高碘酸盐处理碳水化合物之后产生醛或酮的这些试剂。
-羟基反应基团与丝氨酸和苏氨酸反应。羟基反应基团包括三苯甲基卤化物或甲硅烷基卤化物反应部分,其是被取代的或未被取代的。
根据具体的实施方案,本发明的标签化和标记方法包括断裂步骤,由此一种或多种蛋白质样品的蛋白质被加工成肽。该断裂步骤可发生在标签化/标记步骤之前或之后。通常进行该断裂步骤以使得能够分析更小的肽而非全长蛋白质。与蛋白质相比,肽易于在高通量系统如LC上分离,并易于在MS/MS中解析来自肽的序列数据。
可通过不同的断裂剂实现肽的断裂。
用于蛋白质断裂的适合的化学物质包括溴化氰(CNBr)、BNPS甲基吲哚(BNPS skatole)(2-(2′-硝基苯基磺酰基)-3-甲基-3-溴假吲哚)、甲酸、羟胺、碘苯甲酸、NTCB+Ni(2-硝基-5-氰硫基(thiocyano)苯甲酸)。适合的蛋白水解酶包括Asp-N内肽酶、半胱氨酸蛋白酶(caspase)1、2、3、4、5、6、7、8、9或10、糜蛋白酶;梭菌蛋白酶、肠激酶、因子Xa、谷氨酰内肽酶(glutamyl endopeptidase)、Granzyme B、LysC赖氨酰内肽酶、木瓜蛋白酶、胃蛋白酶、脯氨酸内肽酶、蛋白酶K、葡萄球菌的肽酶I、嗜热菌蛋白酶、凝血酶、胰蛋白酶。
取决于蛋白质样品的类型,联合进行化学和酶断裂或进行双酶消化。
根据一个具体的实施方案,使用胰蛋白酶进行蛋白质的断裂,其是具有最高特异性(赖氨酸和精氨酸)和效率的酶。在脊椎动物中,赖氨酸以7.4%的频率以及精氨酸以4.2%的频率存在于蛋白质中。因此,胰蛋白酶消化产生平均长度为9个氨基酸的肽。可选地,在赖氨酸已被修饰而不再作为胰蛋白酶底物的情况下,通过胰蛋白酶断裂产生平均长度为25个氨基酸的肽。这样的肽非常适合于色谱和MS技术。
因此,本发明的一个具体实施方案提供了包含在断裂步骤之前的标签化/标记步骤的方法,其中用胰蛋白酶消化标签化的/标记的蛋白质。根据一个更具体的实施方案,在消化前,用乙酰化剂处理标记的蛋白质以在进行胰蛋白酶消化前修饰赖氨酸的侧链。经修饰的赖氨酸将不再被识别为胰蛋白酶的底物。然而,应当考虑到未被修饰的半胱氨酸残基,当与乙酰化试剂如乙酸酐反应时形成高精氨酸,会变成为胰蛋白酶的底物。因此,这些方法更进一步的具体实施方案包括其中在赖氨酸修饰之前半胱氨酸残基被修饰的步骤。此外,应当注意,由于用乙酰化试剂处理多肽,因此多肽的氨基端也会被乙酰化。如果肽的氨基端被考虑进行例如进一步的标记步骤(如在涉及双标记的方法中,见下文),则这样的乙酰化可能是需要考虑的。
在本发明的方法中,存在于蛋白质样品中的含组氨酸蛋白质,其在标签化/标记步骤中被标签化/标记,但其不包含蛋白质断裂位点,将就此在分析的剩余过程中和其他肽一样地被加工。因此,不包含组氨酸的蛋白质或肽在本发明方法的亲和纯化步骤中被从样品除去并在分析中不予考虑。
利用了本文描述的标签化和标记试剂的标签化和/或标记方法通常可用于使用MS分析蛋白质样品的情况中。使用MS进行蛋白质样品分析通常需要在实际的MS之前通过一种或多种肽分离技术纯化单个肽。因此,在待分析蛋白质样品复杂的情况下,本发明的方法通常包含一个或多个肽分离步骤,其中对一种样品或合并的样品混合物进行一种或多种肽分离技术以从多肽样品混合物中选择性分离标签化的/标记的多肽或肽。能将复杂的蛋白质或肽样品分离成两个或更多个、直至众多级分(在分离标记的或标签化的肽的情况下)的适合的分离技术为本领域技术人员所熟知,并且包括但不限于等电聚焦(isoelectric focusing)、SDSPAGE、两维凝胶电泳、尺寸排阻层析、离子交换层析、反相HPLC、亲和层析,...等。
当样品由较大的肽(例如,Mr3000和100,000之间)组成时,可以使用2D GE。对于从例如蛋白水解消化获得的肽样品,2D LC方法更适合于分离,并且自动化和处理量显著更好。已经描述了通过液相层析分离蛋白质/肽消化物的几种技术,反相(RP)-HPLC,和2-维液相层析。毛细管电泳(CE)也是适合于分离肽的方法。
2D-LC一般利用离子交换柱(通常,强阳离子交换,SCX),在线与反相柱连接,以一系列的循环来运行。在每个循环中,盐浓度在离子交换柱中提高,以根据肽的离子电荷将它们洗脱到反相系统中。在此,肽根据疏水性被分离,通过例如CH3CN梯度。
许多参数影响分辨能力和随后的可以被LC-MS显示的蛋白质数量。通常,设置第一维分离技术(SCX)和第二维RP-HPLC分离方法之间的“在线”构造用于样品分级。离子交换层析可以通过利用不断提高的盐浓度的分步洗脱进行、或通过盐梯度进行。一般地,SCX在存在例如最高达30%乙腈的情况下进行,以最小化SCX层析期间的疏水相互作用。在实施在例如C18柱上的反相层析之前,除去有机溶剂例如乙腈,或通过例如蒸发来强烈地减少。
以下通过下述代表性方案说明本发明的标签化和标记方法。
图3举例说明了本发明方法的一个实施方案,其中例示了使用硼酸标签化试剂标签化蛋白质样品,该硼酸标签化试剂带有通过包含二硫(disulfide)的连接体连接的生物素亲和标签。
在第一步骤中,细胞溶解产物中的蛋白质被变性,并通过采用碘乙酰胺进行的羧甲基化修饰半胱氨酸。在下一步骤中,用胰蛋白酶将蛋白质断裂成肽。此后,用组氨酸反应性标签化试剂标记带有组氨酸的肽。将标签化的肽结合至带有作为捕捉试剂的抗生物素蛋白的基质,组氨酸标签化的肽结合至该捕捉试剂。在除去未结合的肽之后,用还原剂(如二硫苏糖醇)将肽从亲和基质上除去,该还原剂从结合的亲和标签断裂所述肽。随后通过一维或二维层析分离洗脱的肽并通过MS进行分析。
图4中举例说明了本发明方法的另一个实施方案。该图4中举例说明的标记方案包括使用根据本发明的标记试剂标记4种蛋白质样品,所述根据本发明的标记试剂包含蛋白质反应基团(PRG),其是本文中所描述的组氨酸反应基团。
在预处理步骤中,样品被变性、还原,并随后通过羧甲基化修饰所有半胱氨酸并修饰所有赖氨酸的胺。标记方案的不同步骤包括:
-各自用根据本发明一个实施方案的一组标记试剂中的一种标记试剂标记4种蛋白质样品,其中每种标记试剂具有不同的同位素标记物组分,以及其中所述标记试剂包含通过含有二硫基团的连接体连接到PRG的生物素亲和标签。
-标记后,合并所有样品并作为一个反应混合物进行处理,其减少了由于单个样品的操作所产生的变化。
-用胰蛋白酶消化如此获得的组氨酸标记的合并样品混合物。
-为减少进行进一步分析的肽的数目,通过经标记试剂引入的肽上的生物素亲和标签分离标记的肽。该分离使用(链霉)抗生物素蛋白亲和技术进行。通过在还原条件中培育它们,将亲和标签从标记的肽上除去。
在亲和步骤后,每个分离的肽均包含被修饰的组氨酸并携带有同位素标记物。因此,在通过MS分析时每个肽都供给信息。该方法进一步包括以下步骤,其中:
-通过例如液相色谱法分离合并的肽。在此,相同的但来源于不同样品并因此被差异化标记的肽具有基本上相同的行为方式。尽管来源于不同样品的相同的肽上存在不同的同位素标记物,但是由于每一标记组中不同的标记物具有相同化学式或基本上相同的化学式,因此这将不会影响它们的洗脱。
-通过MS分析每一分离的肽级分,其应当产生四种具有不同质量的信号,相应于“较轻的”或“较重的”同位素标记物组分的存在。
以上举例说明的本发明方法的具体实施方案使用了具有4种不同同位素标记物的一组标记试剂。当使用其中更多数量的不同同位素组合可行的一组标记试剂时,可同时分析更多数量的样品。可选地,可使用同量异序标记试剂。
上述示范性的标记方案适合于测定例如不同样品中单个蛋白质表达水平上的差异。取决于具体应用,考虑了不同的可选方案。
本发明的方法可用于检测生物标志物,如在疾病的情况下。当比较疾病样品时(如疾病vs.对照),取决于样品,存在大数目的蛋白质并因此不得不通过MS和MS/MS分析大数目的肽。该量可高达几百甚至大于一千。然而,对于它们中的许多而言,在不同样品中的存在和相对量都将是相同的。然而,对于与病况有关的有限数目的肽,在不同样品中可观察到存在和相对量的显著差异。
通过序列分析或如下所述通过与数据库进行比较,分析获得自这些样品的含组氨酸肽使得能够确定所述肽所来源的蛋白质。当对于来自相同蛋白质的不同肽观察到检测到相同的表达水平时,该分析将会甚至更可靠。
应当理解,本发明的标记方法可适用于蛋白质组学、蛋白质表达分布分析、生物标志物发现以及靶点发现。
本发明的方法的一些实施方案所获得的高多路性容许在一个单一实验中分析许多不同的条件。所述方法对于研究获自不同疾病状态的样品的表达分布是特别有用的。被分析的样品来自以下的一个或多个:健康的人、患有良性病症(benign disorder)的人、患有恶性病症(malignant disorder)的人(缓和的或侵略性的)、来自响应于或不响应于治疗的人、来自患有在身体的不同部分显现的病症的人、来自治疗之前、期间和之后的人、来自接受不同的治疗方法的人、和来自具有一种或多种病症症状不然就健康的人。在本发明的情境中考虑的病症包括细菌或病毒感染,免疫学病症,心血管病症和癌症。
上述实施方案说明了本发明提供的标签化和标记试剂的最直接应用以及使用它们的示范性方法。应当指出,本发明的标签化和标记试剂还可用于更复杂的应用中,如与保证通过不同于组氨酸的肽的官能团(更具体而言,断裂后处于肽的N-或C-端的氨基或羧基)标记的其他标记试剂组合。因此,本发明还设想这样的方法,其中使用本发明的标签化试剂标签化蛋白质样品的肽,以及在可发生于该标签化步骤之前或之后的标记步骤中,所述肽与试剂例如反应。本发明的组氨酸特异性标记试剂还适合于双标记方法,其中用本发明的标记试剂在组氨酸上进行第一标记,以及在蛋白质或肽中另一官能团上进行第二标记。根据一个实施方案,首先对样品中的蛋白质在组氨酸上进行标记,然后断裂蛋白质。接着在N-端或C-端(即存在于所有断裂的肽上的官能团)上标记断裂的肽。可在第二标记步骤之前或之后进行含组氨酸肽的分离。根据另一个实施方案,样品中的蛋白质首先被断裂,然后标记N-端或C-端。之后用本发明的标记试剂对这些标记的肽在组氨酸上进行进一步的标记。此后通过亲和纯化分离双标记的肽。
在上述双标记方法中,第二标记试剂的性质将取决于使用的根据本发明标记试剂的性质(反之亦然)。通常,使用同量异序和同位素试剂的组合,由此本发明的组氨酸反应性标记试剂可具有同位素标记物或同量异序标记物组分。在一个非常具体的实施方案中,用包含同量异序标记物的组氨酸反应性标记试剂进行一次标记,而另一次标记则通过蛋白酶(如胰蛋白酶)介导的在断裂的肽的C-端的一个或两个18O同位素的掺入来进行。如Heller等(2003)J.Am.Soc.Mass Spectrom.14(7),704-718和Schnolzer等(1996)Electrophoresis17,945-953中所描述的那样进行蛋白酶介导的18O标记。
本发明的另一方面提供了用于鉴定样品中蛋白质的方法,该方法基于如以上对标签化试剂所描述的那样选择性标签化和分离含组氨酸肽、标签化的含组氨酸肽的质量的测定以及分离的含组氨酸肽的鉴定,基于与含组氨酸肽数据库的比较。更具体而言,本发明的鉴定方法包括将样品的蛋白质断裂成肽,使用本发明的芳基硼酸标签化试剂选择性标签化含组氨酸肽,接着选择性分离它们,并进一步进行纯化,测定分离的含His肽的质量以及将所述分离的含His肽的质量和任选的一种或多种其他物理化学性质与含His肽的数据库进行比较。因此,本发明的该方面涉及通过MS测定来自混合物的纯化的含组氨酸肽的质量以及通过将所鉴定的质量与质量数据库进行比较来鉴定所述肽。本发明的方法使得能够以高准确度而不需要在MS/MS上进行从头序列测定而鉴定含组氨酸肽(因此,以及它们相应的亲本蛋白质)。
所提出的程序的一个优点是对于基因组已测序的生物体(例如人、小鼠和大鼠以及低等生物如果蝇、线虫和酵母)而言所有蛋白质的含组氨酸肽都是已知的。可以预测这些肽的精确分子量,其可用于支持作为测量的质谱信号的基础的肽的鉴定。对于目前可用的高性能质谱技术如FT-ICR来说尤其是这样,其可达到大约>500,000的分辨率和<1ppm的质量准确度。
此外,由于从基因组序列的in silico分析中已知预期的含组氨酸肽的本性,所以可产生合成肽的库,并可测定制备过程期间每种肽的精确特性(如在不同色谱材料上的保留时间、在ESI/MALDI-TOF中的行为)并与来自复杂的蛋白质混合物的鉴定的肽进行比较。这明显改善了正确蛋白质鉴定中的置信度。
因此,所述数据库通常是包含所有含组氨酸肽的质量的数据库,所述所有含组氨酸肽是当断裂特定生物体的蛋白质组时由特定断裂剂产生的。更具体而言,这样的数据库包含通过肽标识符鉴定的这些肽的质量并包括关于肽所来源的一种或多种亲本蛋白质的信息。将分离的肽的质量与数据库进行比较使得可以鉴定亲本蛋白质。
注意到在芳基硼酸与肽中的组氨酸反应后,至少苯甲基变得附着于肽上。该基团吸收紫外光并对于每一个被修饰的组氨酸增加至少78的肽质量。因此,在MS分析时以及相应地在与数据库进行比较时,就应当考虑该重量变化(以及可能地其他性质变化)。在不除去亲和标签的情况下,或添加额外的标记组分的情况下,分离和纯化的标签化的肽的质量可能会进一步增加。任选地,对数据库中提供的质量,可以对于其中存在的每一个组氨酸,对具有或不具有标签或标记物的苯甲基的存在进行校正。
根据本发明,样品中蛋白质的鉴定任选地包括考虑含组氨酸肽的一种或多种其它物理化学性质。任选地,在分离的肽的质量相应于数据库中多于一种的肽的情况下,在比较中可考虑所述的一种或多种物理化学性质,以允许进行明确鉴定(positive identification)。
通常,根据本发明该方面的鉴定样品中蛋白质存在的方法包括步骤:在铜催化剂存在下,通过让蛋白质与具有在此描述的结构通式(I)的标签化试剂接触,修饰蛋白质样品中含组氨酸蛋白质,从而选择性标签化蛋白质样品中所有的组氨酸。之后,该方法进一步包括步骤:用断裂剂将蛋白质样品中的蛋白质断裂成肽,并通过亲和标签从这些产生的肽中分离那些含组氨酸的肽。在更进一步的步骤中,通过一个或多个肽纯化步骤纯化分离的含组氨酸肽,从而获得纯化的含组氨酸肽。此外,或在这些肽纯化步骤期间,测定纯化的含组氨酸肽的除质量外的至少一种物理化学性质。可选地,基于在肽纯化步骤过程中获得的信息可计算所述至少一种额外的物理化学性质。在下一步骤中,在MS上测定分离和纯化的含组氨酸肽的质量。最后,对于每种分离和纯化的含组氨酸肽,将所述质量和至少一种其他物理化学性质与如上所述包含所有含组氨酸肽的质量和一种或多种物理化学性质的数据库进行比较。
为了确保使用数据库准确鉴定肽,样品的断裂剂理论断裂模式应尽可能接近地相应于实验情况。例如,可能必须考虑对于断裂甲硫氨酸的C-端使用CNBr还可能导致断裂色氨酸的C-端。取决于培育时间和样品中酶的浓度,优先断裂芳香氨基酸C-端的糜蛋白酶还会断裂其他疏水氨基酸的C-端。
同样,为了允许使用数据库明确鉴定肽(即为了使数据库包括最大数目的不同的肽以及来源于不同亲本蛋白质的最小数目的相同的肽),所产生的肽的平均大小具有重要意义。肽越短,则来自不同蛋白质的肽具有相同质量和甚至具有相同序列并将在纯化和分析方法中表现相同的几率就越大。因此,取决于样品的性质和复杂性,可优选具有较少常现断裂位点的酶。
任选地,本发明的鉴定方法包括在样品分析过程中(内对照)或在测试运行(test run)中分析对照肽。
在该实施方案中,产生一种或多种直至一个库的合成含组氨酸肽,并在制备过程中测定每种肽的精确特性(如在不同色谱材料上的保留时间、在ESI/MALDI-TOF中的行为)。在所产生的肽与产生自蛋白质样品的特定肽相同的情况下,产生自合成肽的信息可用来与天然肽获得的数据进行比较。预计这能明显改善正确鉴定的置信度。
如在上述标签化和标记方法的情景中所描述的,本发明鉴定方法的具体实施方案包括鉴于胰蛋白酶的高特异性和效率而使用其的断裂步骤。可选地,当在Lys和Arg两者处断裂时产生的肽太短的情况下,可使用其他酶,例如蛋白内切酶(endoproteinase)Arg-C(精氨酸特异性)、蛋白内切酶Lys-C(赖氨酸特异性)、金黄色葡萄球菌(S.aureus)V8蛋白酶(Asp/Glu特异性)。可选地,如上所述,通过乙酰化修饰赖氨酸的侧链以限制对精氨酸残基的胰蛋白酶断裂(以及任选地未修饰的半胱氨酸,其被乙酰化为高精氨酸并变成胰蛋白酶的底物,参见以上所述)。
本发明的鉴定方法包括鉴定步骤,其基于将关于肽的物理化学性质的数据与肽数据库的那些进行比较。
因此,对于在本发明方法的一个或多个分离步骤中获得的每一肽级分,收集并存储在分离方法中如层析过程中关于肽的行为的数据。这样的数据包括例如纯化进行时的pH、肽从反相柱上洗脱时有机溶剂的百分比、在给定pH下肽从离子交换基质上洗脱时的盐浓度、在给定pH下肽与某种树脂的结合(或不结合)等。
另外地或可选地,对每种肽可收集不是直接获得自本发明方法中肽分离和纯化步骤的进一步的数据。因此,对于每种肽,可存储分离的肽的级分来实施测量以测定在纯化过程中没被测定的性质。这样的测量包括例如测定溶解度、在水/有机溶剂体系中的分配系数、特定氨基酸侧基(如-OH、-SH、-NH2)的检测等。
在本发明鉴定方法的一个进一步的步骤中,通过质谱法分析已按如上所述分离的含组氨酸肽的级分。
应当指出,本发明的鉴定方法可用于鉴定一种样品中的蛋白质或用于鉴定合并的样品混合物中的蛋白质。在后一种情况下,除标签化样品中含组氨酸的蛋白质之外,还对样品进行差异化标记以允许鉴定纯化的标签化的肽的来源。根据一个具体的实施方案,使用允许同时标签化和标记含组氨酸肽的本发明的标记试剂确保差异化标记。因此,在两种或更多种样品作为合并的样品混合物被同时分析的情况下,肽级分可能含有被差异化标记的相同的含组氨酸肽。
通过高分辨质谱仪的高质量精度,实现了在MS谱中含组氨酸肽质量的精确测定,其使得能够与in silico数据库进行比较用于鉴定。通过将分析物电离成气相来进行通过谱方法实现的质量测量。测定离子化分子的质荷比(m/z)并对每一单独m/z值计数离子数目。因此,MS谱中的每一特征通过两个值来限定—m/z和检测到的离子数目的测量值。
如上所述,在本发明鉴定方法的一个进一步的步骤中,将实验测定的含组氨酸肽的质量与数据库中in silico产生的肽的质量进行比较。
肽质量与其氨基酸组成相关。然而,只基于质量,并不总能肯定地鉴定肽。例如,单独使用质量将无法区分具有相同氨基酸组成但序列不同的肽(A1-A2-A3-A4-A5对A5-A1-A2-A3-A4)。此外,某些质量可相应于一组具有不同序列的肽。例如,具有带较长侧链氨基酸的短肽的质量可与具有带较短侧链氨基酸的较长的肽相同。
与通过样品酶消化所产生的肽的总数相比,利用本发明中所描述的含组氨酸肽的标签化和分离,大大减少了由蛋白质样品所产生的肽的数目。因此,该供鉴定使用的in silico胰蛋白酶肽数据库也只需包含含组氨酸的肽(所谓的含组氨酸肽数据库)。
现有的蛋白质和序列数据库可用作基础以产生相应于任意生物体的蛋白质组的含组氨酸肽数据库。对于不断增加的生物体列表,已知完整基因组以及从其推断出的蛋白质组(www.ncbi.nlm.nih.gov/genomes)。因此,可产生其中模拟蛋白质断裂和肽分离的in silico含组氨酸肽数据库。取决于断裂剂的效率,该数据库可含有其中断裂不完全的肽。
在适合于本发明该方面情景的含组氨酸肽数据库中,每条记录均包括亲本蛋白质的名称和相应的含组氨酸肽的质量。对于每条记录,氨基酸组成同样是重要的,以计算由以下导致的质量差异:天然翻译后修饰(如丝氨酸、苏氨酸和酪氨酸上的磷酸化)、样品处理(如天冬酰胺和谷氨酰胺的脱酰胺)或在蛋白质的修饰/标记和含组氨酸肽分离期间引入的修饰,特别是由于用芳基硼酸标记而通过至少苯环所引起的质量增加。
然而,实验的含组氨酸肽的质量可相应于相应的含组氨酸肽数据库中的不同的肽。因而,对于特定的样品,例如几乎不存在关于蛋白质预期性质的信息的样品,这样的数据库仅根据肽的质量可能无法给出足够的信息来鉴定含组氨酸肽的亲本蛋白质。因此,本发明鉴定方法的特定实施方案提供了不仅基于m/z比,还通过考虑到一种或多种额外特性如长度(氨基酸数目)、氨基酸序列、重量、疏水性、等电点等来鉴定含组氨酸肽的相应亲本蛋白质。
根据本发明的一个具体实施方案,含组氨酸肽的数据库相应于特定断裂剂的蛋白质组,而其对于给定物种则相应于样品来源。这样的肽数据库还包括注释的剪接变体(splice variant)。用于本发明方法中的insilico肽数据库包括计算的含组氨酸肽的特性如氨基酸长度、氨基酸序列、分子量、疏水性、等电点等。
必须考虑到体内来源的蛋白质通常是翻译后修饰的,如通过乙酰基、甲酰基或焦谷氨酸残基修饰,它们都会对质谱中测定的m/z产生影响。因此,在本发明的一个实施方案中,合成的含组氨酸肽被用作参比标准来验证in silico计算的肽特性。
来自合成肽库的信息被用于帮助鉴定质谱法肽峰的性质,由此任选地避免了从头测序。所述鉴定将基于把存储于in silico肽库中的可用信息与测量的特性如HPLC保留时间、等电点以及质谱m/z值进行比较。
根据本发明的方法,考虑不同类型的物理化学数据,当与数据库比较时,其与含组氨酸肽的m/z数据相结合任选地允许进一步明确鉴定亲本蛋白质。
设想的一种类型的数据是这样的数据,其从序列信息预测和/或其可在肽纯化步骤和MS过程中测量,例如等电点、在不同pH值下的净电荷、在RP HPLC上的假定(hypothetical)保留时间、在214和280nm处的UV吸收、在给定pH和盐浓度下从离子交换柱上洗脱的倾向、疏水性、亲水性。
可例如通过Bull和Breese.(1974)Arch.Biochem.Biophys.161,665-670的算法计算疏水性。可例如在www.expasy.ch/tools/pi_tool.html上计算等电点。例如根据Krohkin等(2004)Mol.Cell.Proteomics 3,908-919的方法预测在反相柱上的保留时间。
另外地或可选地,在本发明鉴定方法情景中使用的数据库包含在附加实验中获得的且不是直接来源于肽纯化的数据,例如但不限于关于以下的数据:溶解度、在水/有机溶剂双相体系中的分配、用于检测蛋白质反应基团(OH、NH2、SH)的测定结果、电离势、偶极矩、氢键结合能力(hydrogen bonding capacity)以及气相中的离子淌度(ion mobility)。
因此,本发明的方法,其提供基于与“注释的”含组氨酸肽数据库(即包括可用于鉴定目的的额外物理化学性质)进行比较的鉴定,允许以增加的准确度鉴定相应的亲本蛋白质。
任选地和另外地或可选地,除上述额外物理化学参数以外,在本发明情景中使用的含组氨酸肽数据库进一步包含关于亲本蛋白质表达模式等的信息,其进一步有助于鉴定亲本蛋白质。在亲本蛋白质除保守肽序列(conserved peptide sequence)之外氨基酸序列不同,而所述保守肽序列碰巧是蛋白质中唯一的含组氨酸的序列的情况下,在注释的含组氨酸肽数据库中这些肽的相应记录会显示具有相同的质量和相同的物理化学性质的含组氨酸肽。尽管如此,带有关于生物体发育期间亲本蛋白质可能的差异表达或组织特异性表达的细节的这些记录的进一步注释可允许将正确的亲本蛋白质指认到分离的含组氨酸肽。实际上,取决于蛋白质样品的来源,有可能从不同的可能亲本蛋白质中选择表达与样品的表达匹配的亲本蛋白质。
在本发明的鉴定方法中,对于每种肽均测定质量并与注释的含组氨酸肽数据库进行比较。因此,选择那些计算质量相应于分离的肽的测量质量的数据库记录。取决于MS装置以及样品类型,采用单一同位素质量或平均质量进行比较。
当使用单一同位素质量时,通常0.1质量单位的测量误差被包括在内来从数据库中选择记录。当使用平均质量时,通常1Da的测量误差被包括在内来从数据库中选择记录。当测量的质量仅与数据库中的一条记录相应时,亲本蛋白质就立刻得以鉴定。
根据具体的实施方案,当测量的质量相应于数据库中多于一条的记录时,所有这些记录都被选择作为子集。基于将分离的肽的物理化学参数与数据库中记录子集的那些物理化学参数进行比较,进行进一步的鉴定。通常,首先考虑那些能直接来源于肽纯化步骤的物理化学参数。根据一个具体实施方案,考虑至少3种物理化学性质并基于“最佳拟合(bestfit)”分析进行鉴定。当仅考虑一个额外参数时,该参数的选择在很大程度上取决于在具有相同质量的含组氨酸数据库中的肽的组中该参数的鉴别力。例如,如果质量相应于实验测定的肽质量的含组氨酸肽数据库中的不同的肽具有不同数量的芳香氨基酸,则在214和280nm处的UV吸收可用作选择标准。然而,应当指出通过利用本发明的芳基硼酸标签化或标记试剂,芳环被掺入每个含组氨酸的肽中。在另一实例中,如果数据库中具有相同m/z比的一组3种肽,这些肽全都具有相同的净电荷,但电荷分布不同(如一种肽不具有带电荷的氨基酸、另一种肽具有一个Arg和一个Asp以及再一种肽具有两个Arg和两个Asp),则离子交换行为可用作标准将所述分离的肽与该数据库子集中一种特定的肽关联起来。
本发明的另一方面提供了用于分析单个蛋白质样品或同时鉴定和/或定量不同样品中的蛋白质的工具和装置。如以上详述的那样,本发明方法的具体实施方案涉及通过质谱法分析分离的、标记的多肽或肽的相对出现,然后鉴定肽。
因此,用于实施本发明方法的装置包含一台或多台质谱仪。
通过将分析物电离成气相进行谱学质量测量。典型的质谱仪由3个组件组成:从目的分子产生离子的离子源,测定离子化分子质荷比(m/z)的质量分析器以及对每一单独m/z值进行记录并计数离子数目的探测器。MS谱中的每一特征都通过两个值来限定—m/z和到达仪器探测器的离子数目的测量值。
通常通过电喷雾离子化(ESI)或基质辅助激光解吸/离子化(MALDI)实施用于质谱仪中质量分析的蛋白质或肽的离子化。
在ESI过程中,分析物被直接电离出溶液,因此ESI通常直接偶联到液相色谱分离工具(如反相HPLC)。MALDI通过激光脉冲汽化与小有机分子混合的干样品,所述小有机分子如肉桂酸吸收激光能量以使该过程更加有效。
质量分析器是质谱仪的关键组件;重要的参数是灵敏度、分辨率和质量准确度。目前有5种基本类型的质量分析器在蛋白质组学中使用。这些包括离子阱、飞行时间(TOF)、四极杆(quadrupole)、Orbitrap和傅里叶变换离子回旋(FTICR-MS)分析器。串联MS或MS/MS可在时间上(in time)(离子阱)和空间上(in place)(所有混合型的仪器如LTQ-FTICR、LTQ-Orbitrap、Q-TOF、TOF-TOF、三重四极杆(triple quad)和混合型三重四极杆/线性离子阱(QTRAP))进行。
使用本发明的标签化方法进行蛋白质样品的分析任选地包括通过MS/MS进一步鉴定所产生的肽。可选地,可使用基于与数据库进行比较的本发明的鉴定方法以避免MS/MS分析。
在本发明的方法涉及分析同位素标记的肽的合并混合物的情况下,对于已经从分离的标记的肽混合物分离的一种这样标记的肽,在质谱仪上产生的谱含有一组峰,所述一组峰具有不同同位素标记物组分之间的特征质量差,其中所述肽已经用所述不同同位素标记物组分差异化标记(如果其中所述多肽所存在的蛋白质根本不在样品之一中表达,则峰的数目会更少)。可选地,在用于差异化标记的标记物组分是同量异序的情况下,在MS上产生单峰。通过在MS/MS中对该峰进行CID,具有相同质量的相应的肽被进一步分级以释放出同量异序标记物组分的报告基团用于鉴定相应的差异化标记的肽的存在。基于多肽的Mr、氨基酸组成或氨基酸序列,测定单个肽的身份。
适合于实施本发明方法的装置任选地包含或连接于一个或多个适合的分离设备,例如电泳设备,色谱设备,例如但不限于毛细管电泳(CE)设备,反相(RP)-HPLC设备和/或两维液相色谱设备...等。
如上详述,本发明的方法任选地包含样品的预处理,其可在包含一种或多种以上列出的样品制备方法的预处理步骤中进行。因此,适合于本发明方法的装置任选地包含样品制备单元,其包含一个或多个适合于样品制备的装置如超声处理装置、色谱系统(亲和、凝胶过滤)、超滤单元、离心机、带有用于缓冲液、酶、洗涤剂等的递送系统的控温反应瓶。
本发明该方面的一个具体实施方案涉及一种用于蛋白质样品的单路或多路分析的装置(100),包含一个或多个样品源(101)、带有相应的标签化/标记物源(104)的标签化/标记单元(103)、蛋白质断裂单元(105)、亲和分离单元(106)、肽分离单元(107)、质谱仪单元(109)以及控制电路和数据分析单元(110)。在具体的实施方案中,分离单元(107)包含两个连续相连的分离系统(1107)和(2107),其中第一分离系统(1107)是例如2D凝胶电泳系统或阳离子交换层析系统和分离系统,以及第二分离系统(2107)通常是HPLC反相系统。质谱仪元件(109)是分离同位素形式的MS或MS/MS谱仪。从头使用MS/MS使得能够从头测序肽并在使用的情况下使得能差异化检测同量异序标记物的报告基团。可使用2种根本上不同的仪器进行MS/MS分析。在第一种类型的仪器中,其中进行MS/MS分析的离子阱是进行MS的同一离子阱,但MS/MS是按时间进行(阱被填充,除目的离子之外的所有离子都被喷射出来并进行CID和扫描碎片离子。其他碎裂肽的适合方法包括CAD(碰撞活化解离)、ETD(电子转移解离)、ECD(电子俘获解离)、IRMPD(红外多光子解离)和BIRD(黑体红外辐射解离)。
第二种类型的仪器—混合型仪器(三重四极杆、q-tof、ltq-ftms、ltq-orbitrap),在空间上分离MS/MS。例如在第一质量分析器中进行母体选择并在第二质量分析器中扫描碎片。
所述装置可进一步包含多个任选的部件,例如其中例如发生样品溶解和免疫耗竭的样品制备单元(102),或带有相应的修饰试剂源的额外蛋白质/肽修饰单元。并入本发明装置中作为质谱仪单元和分离单元的适合单元描述如上。
所述装置可进一步包含其中测定纯化的肽的一种或多种物理化学性质的分析单元(108)。将关于肽的实验质量和在纯化过程中获得的以及任选地在分析单元中获得的该肽的物理化学性质的数据与C-端肽的注释数据库(112)进行比较(图5中由点线表示)。
应当理解,本发明的标签化和标记试剂以及方法可用于蛋白质组学、蛋白质表达分布分析、生物标志物发现以及靶点发现。
对于本领域技术人员而言,体现本发明的系统和方法的其他布置是显而易见的。
应当明白,对于根据本发明的装置,尽管在此业已讨论了优选的实施方案、具体的结构和构造以及材料,但是在形式和细节上可以进行各种改变或变化而不背离本发明的范围和精神。
实施例
实施例1:硼酸修饰的生物素的合成
a:sNHS-生物素+m-APBA
在室温下将500μl的10mM sNHS-生物素(磺基-N-羟基琥珀酰亚胺基-生物素)溶液、25μl的10mM m-APBA(间氨基苯基硼酸)溶液、60μl的10 x PBS储液(stock solution)以及60μl水混合两小时。
反应方案图解说明于图6中。图7显示了反应物磺基-NHS-生物素(顶部)和间氨基苯基硼酸(中间)以及包含反应产物(即具有式(II)的化合物)的搅拌后未纯化的反应混合物(底部)的IR光谱。底部的光谱显示处于约1685cm-1(图7中箭头所示)的额外振动,其可归因于生物素和间氨基苯基硼酸之间形成的酰胺键。
b:EDC介导的生物素+m-APBA偶联
通过EDC介导的偶联进行生物素与m-APBA的反应,其根据厂商(Pierce Chemical,IL,USA)说明书进行。反应方案示于图8中。
实施例2:将组氨酸-寡肽偶联至硼酸修饰的生物素
将500μl的实施例1中获得的硼酸修饰的生物素10mM溶液与250μl的10mM FITC-Ahx-His6(异硫氰酸荧光素-6-氨基己酸-六组氨酸(Fluorescein isothiocyanate-6-Aminohexacarboxylic acid-hexahistidine))溶液、25μl的10mM[Cu(OH)TMEDA]2Cl2溶液、90μl的10 x PBS储液以及35μl水混合。在氧气氛中搅拌混合物过夜。
反应方案图解说明于图9中。虽然该图显示了包含六组氨酸的肽,但根据本发明对于通过与芳基硼基团反应进行标签化,并不需要存在多个组氨酸。

Claims (32)

1.共价连接亲和标签至含组氨酸蛋白质的方法,该方法包括在铜催化剂存在下将蛋白质与具有通式结构(I)的化合物接触的步骤:
Figure A200780041206C00021
其中A是亲和标签,B是硼和L是任选的连接体。
2.根据权利要求1的方法,其中所述化合物在芳环进一步被卤素、烷氧基或烷基取代。
3.根据权利要求1的方法,其中亲和标签A为生物素。
4.根据权利要求1的方法,其中所述化合物相应于具有式(II)的分子:
Figure A200780041206C00022
5.根据权利要求1的方法,其中所述化合物进一步包含标记物。
6.根据权利要求5的方法,其中所述标记物由一个或多个重原子同位素组成。
7.根据权利要求1的方法,其中所述化合物相应于具有式(III)的分子:
Figure A200780041206C00023
8.用于从蛋白质样品或合并的蛋白质样品的混合物中分离含组氨酸肽的方法,包括步骤:
a)用断裂剂将蛋白质样品中完整的蛋白质断裂成肽,
b)在铜催化剂存在下将蛋白质样品与具有结构通式(I)的芳基硼标签化试剂接触,
Figure A200780041206C00031
其中A是亲和标签,B是硼和L是任选的连接体,从而使芳基硼标签化试剂与存在于肽中的组氨酸,如果存在的话,得以反应,
c)通过所述亲和标签使标签化的肽与亲和基质结合,和
d)从亲和基质上除去结合的标签化的肽以获得分离的含组氨酸肽。
9.根据权利要求8的方法,其中在步骤a)之前进行步骤b),将芳基硼标签化试剂与样品中未断裂的蛋白质接触,使存在于蛋白质中的组氨酸,如果存在的话,标签化。
10.用于同时分析在不同样品中一种或多种含组氨酸的蛋白质的出现的方法,其包括步骤:
a)任选地,用断裂剂将样品中的完整的蛋白质断裂成肽,
b)在铜催化剂存在下将每种样品与一组芳基硼酸标记试剂中的一种接触,其中硼酸标记试剂具有结构通式(I),
Figure A200780041206C00032
其中A是亲和标签,B是硼和L是任选的连接体,并且进一步包含标记物,其是同位素或同量异序标记物,使得每种标记试剂的结构基本上相同,
c)合并不同的样品以获得多肽或肽样品混合物,
d)通过所述亲和标签从多肽或肽样品混合物中选择性分离标记的多肽或肽,和
e)通过质谱法分析分离的标记的多肽或肽的出现。
11.用于鉴定蛋白质样品中蛋白质的存在的方法,包括步骤:
a)在铜催化剂存在下通过将蛋白质与具有通式结构(I)的标签化试剂接触,修饰蛋白质样品中的蛋白质的组氨酸:
Figure A200780041206C00041
其中A是亲和标签,B是硼和L是任选的连接体,
b)用断裂剂将蛋白质样品中的蛋白质断裂成肽,
c)通过所述亲和标签从所述肽中分离含组氨酸肽,
d)通过一个或多个肽纯化步骤纯化分离的含组氨酸肽,从而获得纯化的含组氨酸肽,
e)测定或计算纯化的含组氨酸肽除质量之外的至少一种物理化学性质,
f)在MS上测定分离和纯化的含组氨酸肽的质量,和
g)对于每种分离和纯化的含组氨酸肽,将所述质量和所述至少一种其他物理化学性质与包含通过所述断裂剂产生的所有含组氨酸肽的质量和一种或多种物理化学性质的数据库进行比较,从而鉴定纯化的含组氨酸肽的相应亲本蛋白质,由此鉴定蛋白质样品中亲本蛋白质的存在。
12.权利要求11的方法,其中步骤(g)包括对于每种分离和纯化的含组氨酸肽,鉴定质量相应于该分离和纯化的含组氨酸肽的质量的数据库中的一种或多种含组氨酸肽,以及当对于一种分离和纯化的含组氨酸肽鉴定出多于一种的肽时,将该分离和纯化的含组氨酸肽的至少一种其他物理化学参数和数据库中被鉴定的多于一种的肽的那些进行比较。
13.权利要求12的方法,其中蛋白质样品来自物种以及数据库包含通过所述断裂剂产生的该物种的所有含组氨酸肽的质量和至少一种其他物理化学性质。
14.根据权利要求11的方法,其中在两种或更多种样品中同时鉴定蛋白质,其中该方法包括:
-在步骤(a)中用一组包含差异化标记物组分的标签化试剂中的一种对每种样品进行修饰,
-在步骤(d)之前合并两种或更多种样品的附加的步骤,和
-在步骤(f)之前,鉴定标记物的性质从而鉴定肽所来源的样品的步骤。
15.根据权利要求11的方法,其中在所述一个或多个肽纯化步骤过程中测定所述至少一种物理化学性质。
16.根据权利要求11的方法,其中所述至少一种物理化学性质选自pI、反相色谱过程中的保留时间和在280和214nm处的UV吸收比值。
17.用于标签化蛋白质或肽中的组氨酸的化合物,该化合物具有通式结构(I):
Figure A200780041206C00051
其中A是亲和标签,选自生物素或生物素衍生的分子、麦芽糖、凝集素、结合到半抗原特异性抗体的半抗原和谷胱甘肽,B是硼和L是任选的连接体。
18.根据权利要求17的化合物,其中所述芳环进一步被卤素、烷氧基或烷基取代。
19.根据权利要求17的化合物,其中所述亲和标签A是生物素。
20.根据权利要求17的化合物,具有式(II)
21.根据权利要求17的化合物,进一步包含标记组分。
22.根据权利要求21的化合物,其中所述标记组分由一个或多个重同位素组成。
23.根据权利要求22的化合物,具有式(III)
Figure A200780041206C00061
其中生物素基团和芳基硼基团之间连接体中的一个或多个碳原子和/或一个或多个氢原子分别被13C或氘取代。
24.一组用于多肽质谱分析的标记试剂,其中组中的所有标记试剂都具有相同的根据权利要求17的化学结构,以及其中组中的每种标记试剂都具有独特的同位素标记物组分。
25.一组试剂,其中所述组的各个标记试剂具有根据式(III)的结构:
Figure A200780041206C00062
其中生物素基团和芳基硼基团之间连接体中的一个或多个碳原子和/或一个或多个氢原子分别被13C或氘取代。
26.权利要求17的化合物或权利要求24的标记试剂组用于蛋白质标记的用途。
27.通过断裂剂以in silico方式断裂的生物体蛋白质的含组氨酸肽的数据库,其中每种肽以以下来表征:
-蛋白质标识符,
-其氨基酸组成,
-其质量,
其中所述质量为未修饰的肽的质量或修饰或标记后的肽的质量。
28.根据权利要求27的数据库,其中具有不同序列和相同质量的肽进一步通过所述肽的除其质量之外的至少一种物理化学参数来表征。
29.根据权利要求27的数据库,其中断裂剂为胰蛋白酶。
30.根据权利要求27的数据库用于鉴定蛋白质的用途。
31.用于蛋白质样品多路标记和分析的装置(100),包含至少一个样品源(101)、标记单元(103)和相应的芳基硼标记试剂源(104)、蛋白质断裂单元(105)、亲和分离单元(106)、分离单元(107)、质谱仪单元(109)和与以in silico方式断裂的含组氨酸肽的注释数据库(112)连接的数据分析单元(110)。
32.根据权利要求31的装置,进一步包含样品制备单元(102)和/或用于测定在分离单元(107)中纯化的肽的物理化学性质的分析单元(108)。
CNA2007800412067A 2006-11-06 2007-10-26 芳基硼酸在蛋白质标记中的应用 Pending CN101535316A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP06123496.9 2006-11-06
EP06123496A EP1921081A1 (en) 2006-11-06 2006-11-06 Use of arylboronic acids in protein labelling

Publications (1)

Publication Number Publication Date
CN101535316A true CN101535316A (zh) 2009-09-16

Family

ID=37909740

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800412067A Pending CN101535316A (zh) 2006-11-06 2007-10-26 芳基硼酸在蛋白质标记中的应用

Country Status (7)

Country Link
US (1) US8097463B2 (zh)
EP (2) EP1921081A1 (zh)
JP (1) JP2010509569A (zh)
CN (1) CN101535316A (zh)
BR (1) BRPI0717854A2 (zh)
RU (1) RU2009121557A (zh)
WO (1) WO2008056290A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2108957A1 (en) * 2008-04-07 2009-10-14 Koninklijke Philips Electronics N.V. Compounds and methods for the labelling and affinity-selection of proteins
KR101061601B1 (ko) 2009-07-01 2011-09-02 주식회사 올메디쿠스 보론산이 수식된 전극을 이용한 당화단백질의 전기화학적 측정방법
CN113304708B (zh) * 2021-06-11 2023-03-21 天津医科大学 介孔分子筛硼亲和表面印迹的糖蛋白微反应器的制备方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0310361A3 (en) * 1987-09-30 1989-05-24 Beckman Instruments, Inc. Tridentate conjugate and method of use thereof
CZ220196A3 (en) * 1994-01-28 1996-12-11 Prolinx Inc Bioconjugate complexes
US6670194B1 (en) 1998-08-25 2003-12-30 University Of Washington Rapid quantitative analysis of proteins or protein function in complex mixtures
AU2002314957A1 (en) * 2001-06-06 2002-12-16 Proteologics, Inc. Methods and compositions related to tagging of membrane surface proteins
EP1456227B1 (en) * 2001-07-16 2005-10-05 President And Fellows Of Harvard College Non-affinity based isotope tagged peptides and methods for using the same
ES2296996T3 (es) * 2001-09-14 2008-05-01 Electrophoretics Limited Marcaje de moleculas.
US7195751B2 (en) 2003-01-30 2007-03-27 Applera Corporation Compositions and kits pertaining to analyte determination
BRPI0518952A2 (pt) * 2004-12-17 2008-12-16 Koninkl Philips Electronics Nv mÉtodo para a produÇço de um agente de contraste marcador ou um agente terapÊutico, agentes de contraste marcadores, e, uso dos agentes de contraste marcadores ou dos agentes terapÊuticos de marcaÇço

Also Published As

Publication number Publication date
JP2010509569A (ja) 2010-03-25
EP1921081A1 (en) 2008-05-14
WO2008056290A1 (en) 2008-05-15
EP2086984A1 (en) 2009-08-12
BRPI0717854A2 (pt) 2013-10-29
RU2009121557A (ru) 2010-12-20
US8097463B2 (en) 2012-01-17
WO2008056290A9 (en) 2008-09-12
US20100041162A1 (en) 2010-02-18

Similar Documents

Publication Publication Date Title
Calderón‐Celis et al. Standardization approaches in absolute quantitative proteomics with mass spectrometry
CN101313223B (zh) 用于包含2,6‑二甲基‑哌啶‑1‑基‑亚甲基或嘧啶‑2‑基硫代亚甲基质量标记部分以及琥珀酰亚胺基‑氧‑羰基活性官能团的生物分子的质量标记物
Müller et al. Isotope-tagged cross-linking reagents. A new tool in mass spectrometric protein interaction analysis
CN1427953B (zh) 质量标记物
Seebacher et al. Protein cross-linking analysis using mass spectrometry, isotope-coded cross-linkers, and integrated computational data processing
US6818454B2 (en) Phosphoprotein binding agents and methods of their use
EP1918714A1 (en) Compounds and methods for double labelling of polypeptides to allow multiplexing in mass spectrometric analysis
US20100021881A1 (en) Peptide combos and their uses
Lu et al. Ionic reagent for controlling the gas-phase fragmentation reactions of cross-linked peptides
EP2115475A2 (en) Mass spectrometric quantitation
US9835629B2 (en) Methods and reagents for biomolecule labeling, enrichment and gentle elution
CN1749269A (zh) 用于串联质谱从头测序的肽的连续衍生化
CA2528370A1 (en) Capture and release based isotope tagged peptides and methods for using the same
US20100167262A1 (en) Method and reagent for the specific identification and quantification of one or more proteins in a sample using in particular inductively coupled plasma-mass spectrometry
CN101535316A (zh) 芳基硼酸在蛋白质标记中的应用
CN101517416A (zh) 基于鉴定羧基端肽分析蛋白质样品的方法
US20050042676A1 (en) Characterising polypeptides
EP1916526A1 (en) Method for diagnostic and therapeutic target discovery by combining isotopic and isobaric labels
Stefanowicz et al. Derivatization of peptides for improved detection by mass spectrometry
Fedjaev et al. Quantitative analysis of a proteome by N‐terminal stable‐isotope labelling of tryptic peptides
Mirzaei Selection and identification of oxidized proteins and their oxidation sites

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20090916