CN1149398C - 多肽测序的方法和试剂盒 - Google Patents

多肽测序的方法和试剂盒 Download PDF

Info

Publication number
CN1149398C
CN1149398C CNB008029490A CN00802949A CN1149398C CN 1149398 C CN1149398 C CN 1149398C CN B008029490 A CNB008029490 A CN B008029490A CN 00802949 A CN00802949 A CN 00802949A CN 1149398 C CN1149398 C CN 1149398C
Authority
CN
China
Prior art keywords
polypeptide
peptide
group
acidic
digestion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB008029490A
Other languages
English (en)
Other versions
CN1340162A (zh
Inventor
Tw
T·W·基奥
R·S·杨古斯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Procter and Gamble Ltd
Original Assignee
Procter and Gamble Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Procter and Gamble Ltd filed Critical Procter and Gamble Ltd
Publication of CN1340162A publication Critical patent/CN1340162A/zh
Application granted granted Critical
Publication of CN1149398C publication Critical patent/CN1149398C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/12General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by hydrolysis, i.e. solvolysis in general
    • C07K1/128General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by hydrolysis, i.e. solvolysis in general sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • G01N33/6824Sequencing of polypeptides involving N-terminal degradation, e.g. Edman degradation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • G01N33/6851Methods of protein analysis involving laser desorption ionisation mass spectrometry

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Urology & Nephrology (AREA)
  • Immunology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Food Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Optics & Photonics (AREA)
  • Genetics & Genomics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开提供了用于多肽测序的方法和试剂盒。该方法涉及多肽或其产生的肽的N-末端的衍生化。一种或多种产生的衍生分析物的质谱分析提供了本领域普通技术人员能用所熟知的技术进行翻译的质谱。本文还公开还描述了能提高该增强方法方便实施的试剂盒。

Description

多肽测序的方法和试剂盒
发明领域
本发明涉及用质谱技术对多肽进行测序的方法和试剂盒。本方法和试剂盒对鉴定高分子量多肽,用于生物学、药物学、个人清洁和织物清洁领域特别有用。
发明背景
近来,对于高灵敏度肽和多肽测序用途已开发了基质辅助激光解吸离子化(MALDI)质谱分析和电子喷雾离子化。见例如Spengler等,“通过基质辅助激光解吸离子质谱分析进行肽测序(Peptide Sequncing by Matrix-assistedLaser-desorption Mass Spectrometry)”,Rapid Communication in MassSpectrometry,Vol.6,pp.105-108(1992);Spengler等,“基质辅助激光解吸离子质谱分析中源后衰变的基本形式(Fundamental Aspects of PostsourceDecay in Matrix-Assisted Laser Desorption Mass Spectrometry)”,Journalof Physical Chemistry,Vol.96,pp.9678-9684(1992);Kaufman等,“通过采用基质辅助激光解吸离子化在反射飞行时间中的产物离子分析进行线性肽的质谱分析测序(Mass Spectrometry Sequncing of Linear Peptides byProduct-ion Analysis in a Reflection Time-of-flight Mass SpectrometerUsing Matrix-assisted Laser Desorption Ionization)”,RapidCommunication in Mass Spectrometry,Vol.7,pp.902-910(1993);Kaufmann等“在飞行时间质谱仪中的肽测序:基质辅助激光解吸离子化(MALDI)后源后衰变的评估(Sequencing of Peptides in a Time-of-flight Mass Spectrometer:Evaluation of Postsource Decay Following Matrix-assisted LaserDesorption Ionisation(MALDI)),International Journal of MassSpectrometry and Ion Process,Vol.131,pp.355-385(1994):Kaufmann等,“基质辅助激光解吸/离子化-反射飞行时间质谱分析中的源后衰变和迟发提取(Post-source Decay and Delayed Extraction in Matrix-assisted LaserDesorption/Ionisation-Reflection Time-of-flight Mass Spectrometry)”,Rapid Communications in Mass Spectrometry,Vol.10,pp.1199-1208(1996);和Spengler,“生物分子的基质辅助激光解吸/离子化质谱分析中的源后衰变分析(Post-source Decay Analysis in Matrix-assisted LaserDesorption/Ionization Mass Spectrometry of Biomolecules)”,Journal ofMass Spectrometry,Vol.32,pp.1019-1036(1997);Carr等,“分析生物技术中质谱分析的集合(Integration of Mass Spectrometry in AnalyticalBiotechnology)”,Analytical Chemistry,Vol.68,pp.2802-2824(1991);YatesIII等,“用MS探索基因组(Mining Genomes With MS)”,AnalyticalChemistry,Vol.68,pp.534A-540A,(1996);Morris等,“新颖四极/直角加速飞行时间质谱仪上的高灵敏度碰撞激活的分解串联质谱分析(HighSensitivity Collisionally Activated Decompostion Tandem MassSpectrometry on a Novel Quadrupole/Orthagonal Acceleration Time-of-flight Mass Spectrometer)”,Rapid Communications in Mass Spectrometry,Vol.10,889-896(1996)。
MALDI在质谱分析领域提供了几个进步。例如,MALDI比常规电喷三重四极设备灵敏度高。当与飞行时间质谱分析仪联用时,MALDI还能用于比用三重四极设备分析的肽质量更大的肽。MALDI还可用于分析样品纯化最低的复杂混合物。另一方面,电喷离子化易于和强效分离技术(包括液相层析(LC)和各种形式的毛细电泳(CE))接合。当使用LC和CE作为样品纯化和引入装置时,可以实现高度自动化分析。
然而,目前MALDI和在较低的程度上电喷离子化质谱法,不能充分提供可预测的串联质谱片段化图式。例如,通常观察到多个离子系列(包括a-离子、b-离子和y-离子),导致MALDI发送后衰变谱太复杂,不能有效翻译和测序。电喷离子化产生的带多个电荷的前体离子形成了多种离子系列(b-和y-离子),加上中间片段以及带单个或多个电荷的离子,得到的串联质谱也常常难于从头翻译。因此,片段化的问题已限制了用质谱分析快速测序多肽的能力。结果,质谱分析特别是MALDI质谱分析在该领域中价值有限。
几个研究小组已尝试通过使用化学衍生技术,改进质谱分析在多肽测序领域中的实用性。已利用这些技术在肽的MSMS谱中促进和指导片段化,目标是提高灵敏度和降低得到的质谱的复杂性。这些已知技术大多提供了阳离子衍生物。见例如Kidwell等,“用二级离子质谱分析进行肽测序(Sequencing ofPeptides by Secondary Ion Mass Spectrometry)”Journal of the AmericanChemical Society,Vol.106,pp.2219-2220(1984)(用季铵基团衍生,用静态SIMS离子化法分析(在MALDI和电喷离子化开发之前))。使用MALDI和电喷离子化与低能碰撞活化这些技术证明一般无效。
最近,研究人员已利用其它衍生技术,尝试用质谱分析法改进肽/多肽测序。例如,已显示氧化存在于胰蛋白酶肽(用胰蛋白酶消化产生的肽)中的半胱氨酸残基可改进电喷串联质谱的片段化。见例如Gaskell等,“气相肽离子的低能量分解中质子化位点的作用(Role of the Site of Protonation in theLow-Energy Decompositions of Gas-Phase peptide Ions)”,Journal of theAmerican Society of mass Spectrometry,Vol.7,pp.522-531(1996)和Gaskell等,“半胱氨酸氧化成磺基丙氨酸对质子化肽的碰撞激活分解的影响:内部离子化相互作用的证据(Influence of Cysteine to Cysteic Acid Oxidationon the Collision-Activated Decomposition of Protonated Peptides:Evidence for intraionic Interactions)”,Journal of the American Societyof Mass Spectrometry,Vol.3,pp,337-344(1992)。特别是促进了y-离子片段化。然而,该技术有几个局限之处。例如,该技术不能延伸至MALDI方法。该技术还仅限于分析在待分析的序列中存在的那些具有半胱氨酸残基的多肽。事实上,半胱氨酸很少存在于天然多肽中,导致该技术实用性上的严重局限。
因此,需要提供一种简单有效,可广泛应用于野生型和突变型多肽的多肽测序的质谱方法。本发明提供了一种使用质谱分析技术的高灵敏度多肽测序方法。本发明人发现,具有相对强的酸性基团的多肽和从其衍生的肽可提供近乎专一的y-离子片段化,得到能从头易于翻译的质谱。本发明还涉及用于方便实施本方法的试剂盒。
发明简述
本发明涉及特别用于多肽测序的质谱分析方法和试剂盒。该方法涉及测定多肽的氨基酸序列,步骤包括:
(a)用一种或多种当和多肽或肽偶联时,电离常数pKa小于2的酸性基团衍生该多肽的N-末端或该多肽产生的一条或多条肽的N-末端,提供一种或多种衍生的分析物;
(b)用质谱分析技术分析一种或多种衍生的分析物,提供片段化模式;和
(c)翻译该片段化模式。
本发明的试剂盒含有一种或多种酸性基团试剂,当与多肽偶联时,它提供电离常数pKa小于2的酸性基团;和衍生该多肽N-末端或该多肽产生的一0条或多条肽的N-末端的容器。本发明的试剂盒和实施该方法相结合特别有用。
发明详述
本发明的方法和试剂盒用于多肽测序,包括野生型、突变型和/或合成多肽。该方法和试剂盒特别用于鉴定用于例如生物学、药物学、个人清洁和织物清洁领域的高分子量多肽。
本发明的方法和试剂盒具有广泛的实用性。用途包括但不限于:促进需要迅速测定肽或多肽序列的生物学研究;鉴定蛋白质中的翻译后修饰和鉴定变体蛋白质中的氨基酸修饰,如用于商业洗涤和清洁产品的那些;帮助设计基因克隆的寡核苷酸探针;迅速确定定向进化研究中形成的产物的特征;组合化学和肽文库的鉴定;和蛋白组学。
该方法涉及在多肽或通过切割该多肽形成的一条或多条肽的N-末端加上一个或多个较强的酸性基团,然后用于质谱分析。不希望受理论限制,相信得到的带负电的衍生物有利于低能带电位点引发的片段化。这在多肽或其衍生肽的C-末端是碱性或疏水残基优选碱性残基时特别有效。另外,不受理论所限,相信在质谱分析中质子化一碱性残基时,较强的酸性基团将被去质子化,它反向平衡了碱性残基处的正电荷。离子化该衍生物的另一个质子将基本上“自由”的随机离子化多肽/肽骨架的酰氨基团,因为最碱性的残基已被质子化。另外,不受理论所限,相信当在多肽/肽中掺入第二个较强的酸性基团时,两个酸基团都将去质子化,提供了两个基本上“自由”的质子,来随机离子化多肽/肽的骨架酰氨基团。
利用本方法,提供了显著增加的片段化效率。另外,对于具有相同序列的衍生肽与非衍生肽相比,观察到片段离子信噪比增大。得到的样品PSD MALDI和电喷串联质谱可按常规从头翻译。
在该公开中参考了出版物和专利。所有本文引用的参考文献在此引入以供参考。
本文所用的所有百分数、比率和比例是以重量计的,除非另作说明。
本文所用的缩写将被用来描述氨基酸。下文表I描述了这些缩写。表I中的其它描述是平均氨基酸残基质量,用于实施本发明。
                            表I
    氨基酸     三字母缩写     一字母缩写   平均氨基酸残基质量(Da)
    丙氨酸     Ala     A   71.1
    精氨酸     Arg     R   156.2
    天冬酰胺     Asn     N   114.1
    天冬氨酸     Asp     D   115.1
    半胱氨酸     Cys     C   103.1
    谷氨酰胺     Gln     Q   128.1
    谷氨酸     Glu     E   129.1
    甘氨酸     Gly     G   57.1
    组氨酸     His     H   137.1
    异亮氨酸     Ile     I   113.2
    亮氨酸     Leu     L   113.2
    赖氨酸     Lys     K   128.2
    甲硫氨酸     Met     M   131.2
    苯丙氨酸     Phe     F   147.2
    脯氨酸     Pro     P   97.1
    丝氨酸     Ser     S   87.1
    苏氨酸     Thr     T     101.1
    色氨酸     Trp     W     186.2
    酪氨酸     Tyr     Y     163.2
    缬氨酸     Val     V     99.1
定义
本文所用的术语“解吸离子化”指分析物作为离子从固相转移到气相。
本文所用的术语“解吸”指分析物从表面分离和/或分析物进入气相。
本文所用的术语“离子化”指在分析物上产生或维持一种电荷的过程,该电荷等于加上或减去一个或多个电子单位。
本文所用的术语“MALDI”指基质辅助激光解吸离子化。
本文所用的术语“基质”(参见“MALDI”)指可以与感兴趣的多肽或其产生的肽在溶液中混合的小酸性光吸收性化学物质,混合的方式是在样品阶段干燥后,晶状的包埋在基质中的分析物可在激光照射后成功解吸或离子化,从固相中进入气相或液相。另外,可将多肽或其产生的肽的溶液加到样品阶段预先干燥的合适基质上。合适基质的非限制性例子包括烟酸、芥子酸、阿巍酸、血凝酸、a-氰基-4-羟基肉桂酸,以及混有硝基纤维素的a-氰基-4-羟基肉桂酸。
本文所用的术语“电喷离子化”指将溶液在高压下从毛细电极向接地的相反电极静电喷射,从溶液产生离子的过程。该定义同时包括电喷离子化和气动辅助电喷离子化,也指离子喷雾。本文所用的术语“电喷离子化”用于所有液体流速并包括微米喷雾和纳米喷雾实验。另外,该定义将用于分析注入离子源而不分开的肽,用于分析在电子喷雾离子化之前已分开的肽或肽混合物。合适的在线分离方法包括但不限于:HPLC、毛细HPLC和毛细电泳。可用各种质谱分析仪进行电喷离子化实验,包括但不限于:三重四极透镜、离子收集器、正交加速飞行时间分析仪和Fourier Trandform Ion CyclotronResonance仪。
本文所用的术语“多肽”指具有两个或多个氨基酸残基的分子。本发明的方法适用于高分子量多肽的序列鉴定。
本文所用的术语“野生型”指非突变生物体产生的多肽。
本文所用的术语“突变型”指具有与野生型多肽的氨基酸序列不同的多肽。
本发明的方法
本发明方法用于测定多肽的氨基酸序列。本发明使用词组“测定氨基酸序列”不意味着限于测定给定多肽的整个序列,而是指测定序列的一部分、多个部分和/或整个序列。
本方法涉及在一条多肽或其一条或多条肽的N-末端加上一个或多个较强的酸性基团,以产生一个或多个供质谱分析的衍生的分析物。然后用质谱分析技术分析多肽/肽,以提供片段化模式。翻译得到的片段化模式,从而实现多肽的测序。
本发明人已发现衍生基团的酸性对得到的质谱有很深刻的作用。令人惊异的是,当电离常数pKa小于2的酸性基团与多肽或其产生的肽偶联时,将产生易于翻译的片段化模式,而提供所需的序列信息。本领域普通技术人员完全能用本领域已知的标准方法测量本文所述的电离常数pKa值。这些方法0的非限制性例子包括例如:滴定法和电化学方法。测量电离常数pKa值的优选方法是通过滴定。
本发明的方法可如下实施:
多肽和/或多肽产生的肽的衍生
本发明的一个重要特征是用一个或多个较强的酸性基团(即当与多肽或该多肽产生的肽偶联时,电离常数pKa小于2,优选小于0,更优选小于-2的酸性基团)衍生感兴趣的多肽或该多肽产生的肽。“多肽产生的肽”在本文中意味着多肽被消化或切割(本文笼统称为“消化”等)成两条或多条肽。将得到的肽按照本方法衍生。“当……偶联时”意味着酸性基团的电离常数pKa定义为与多肽或其产生的肽共价键结合后测量的。
可用任何方法产生多肽或其产生的肽。例如,如需要,可分离感兴趣的多肽用于分析。可采用几个分离程序,包括一维和两维凝胶电泳。作为另一个实施例,可通过本领域熟知的组合化学方法合成多肽。
消化可通过许多方法发生,包括凝胶内或在膜上,优选在凝胶内,见例如Shevchenko等,“对来自银染色的聚丙烯酰胺凝胶的蛋白质进行质谱测序(Mass Spectrometric Sequncing of Proteins from Silver-StrainedPolyacrylamide Gels)”,Analytical Chemisty,Vol.68,pp.850-858(1996)。然而,可以用酶或化学方法消化多肽,优选用酶。最优选是采用一种消化方法,该方法在产生的肽的C-末端或附件产生碱性或疏水性残基,最优选碱性残基。“在”字在本文中指碱性或疏水性残基是肽的C-末端残基。“附近”在本文中指碱性或疏水性残基优选距该肽C-末端约40个氨基酸残基,较优选约30个残基,更优选约20个残基和最优选约10个氨基酸残基之内。
虽然该过程中可采用许多方法,但优选用酶消化多肽,使用例如胰蛋白酶、内切蛋白酶LysC、内切蛋白酶ArgC或胰凝乳蛋白酶,优选胰蛋白酶、内切蛋白酶LysC和内切蛋白酶ArgC,最优选胰蛋白酶。胰蛋白酶、内切蛋白酶Lys C和内切蛋白酶Arg C是优选的,因为得到的多肽产生的肽通常将在C-末端以精氨酸或赖氨酸残基(碱性残基)结束,当然除了该多肽原来的C-末端。胰凝乳蛋白酶也是消化优选的,它通常切断疏水性氨基酸残基。还可用化学消化。例如用氰化溴消化。
本发明的方法可按照Patterson等,美国专利号5,821,063,授予PerSeptive Biosystems,Inc.,1998年10月13日提交,特别是其中所述的消化技术来修改。例如,可采用多个具有不同试剂和多肽比的样品并按照本发明予以衍生。
然而,不总是需要消化,特别是当测序(但当然不限于)小型多肽时。本文所用的“小型”多肽包括那些优选少于50个氨基酸残基,较优选少于40个残基,更优选少于30个,还要优选少于20个残基和最优选少于10个氨基酸残基的多肽。
例如,可用熟知方法,包括组合化学法(“合成多肽”)合成的那些将确定特征的多肽。就此,最优选合成在得到的多肽C-末端或附近具有碱性或疏水性残基,优选碱性残基的多肽。
用一个或多个电离常数pKa小于2,优选小于0,最优选小于-2(当和多肽或肽偶联时)的酸性基团衍生多肽(如果多肽足够“小”,如本文定义的)或该多肽产生的肽,以提供衍生的分析物。通过和酸性基团试剂偶联制备了该衍生的分析物的酸性基团。酸性基团试剂不受限制,只要该多肽或其产生的肽上的酸性基团具有本文所述的电离常数pKa。可用于偶联的酸性基团试剂的非限制性例子包括例如:二硫二(丙酸磺基琥珀酰亚氨)、S-乙酰基巯基琥珀酸酐、2-亚氨基硫烷(还可称作Traut’s试剂)、二硫二乙二醇酐、四氟琥珀酸酐、六氟戊二酸酐、磺基琥珀酸酐、2-磺基苯甲酸环酐、氯化磺酰基乙酰氯和1,3-丙磺酸内酯。使用例如S-乙酰基巯基琥珀酸酐、2-亚氨基硫烷和二硫二乙二醇酐等试剂需要在衍生肽后氧化产生酸性基团。不需要氧化步骤的酸性基团试剂包括例如:四氟琥珀酸酐、六氟戊二酸酐、磺基琥珀酸酐、2-磺基苯甲酸环酐和氯磺酰基乙酰氯。这些试剂通常是优选的,因为更有效的合成和/或在多肽或其产生的肽中没有不稳定剩余物的复杂氧化。将酸性基团试剂与含半胱氨酸的肽的N端偶联,然后氧化半胱氨酸的半胱巯基,是一种产生含有两个酸性基团(磺酸)的多肽的方法。
酸性基团最优选是磺酸。在这些中间,更优选的酸性基团包括2-磺基乙酰基、3-磺基丙基和2-磺基苯甲酰基。
还优选使用二磺酸衍生物。使用二磺酸衍生物优选在靠近肽N-末端产生两个磺酸基团。例如将一酸性基团试剂与含半胱氨酸的肽的N端偶联,然后将半胱氨酸巯基氧化成磺基丙氨酸,是一种产生含有两个酸性基团(磺酸)的肽的方法。
本领域普通技术人员有能力进行本发明所需的较简单的偶联方法。然而为了方便,如下说明了衍生感兴趣多肽或该多肽产生的肽的非限制性例子:
                           实施例1
在使用之前,制备了浓度为0.1M的2-磺基苯甲酸环酐(从Aldrich ChemicalCo.,Milwaukee,WI购得)的无水四氢呋喃溶液。将多肽ASHLGLAR(1nmol,购自Sigma Chemical Co.,St.Louis MO)(SEQID NO:1)稀释于20微升0.05M的三甲胺。加入2-磺苯甲酸环酐溶液(2微升),旋转反应混合物30秒。反应在室温下进行约2分钟,然后稀释得到的衍生分析物并作质谱分析。当衍生更小的数量时,该酸性基团试剂的浓度降低100倍。
                          实施例2
将ASHLGLAR(1nmol,从Sigma Chemical Co.,St.Louis MO购得)(SEQ IDNO:1)与2微升0.02M的磺基乙酸混合,后者是通过将2微升纯氯化磺酰基乙酰氯(购自Aldrich Chemical Co.,Milwaukee,WI)和500微升水混合形成的。干燥该混合物,然后在20微升四氢呋喃∶二异丙基乙基胺(4∶1,v∶v)中重建。加入0.1M氯化磺基乙酰氯(2微升,购自Aldrich Chemical Co.,Milwaukee,WI)的无水四氢呋喃溶液,旋转振荡混合物30秒。衍生反应在环境温度下进行约2分钟。干燥衍生的分析物,重建于20微升水中,并进一步稀释,然后作质谱分析。氯磺基乙酰氯也是一种衍生2D凝胶分离物的有用试剂,但修改的合成程序提供了更一致的产物产率。实施例14讨论了该修改的程序。
                            实施例3
Figure C0080294900132
制备了0.1M的S-乙酰基巯基琥珀酸酐(从Aldrich Chemical Co.,Milwaukee,WI商品购得)的无水四氢呋喃溶液,然后使用。将ASHLGLAR(1nmol,购自Sigma Chemical Co.,St.Louis MO)(SEQ ID NO:1)稀释于20微升0.05M的三甲胺中。加入S-乙酰基巯基琥珀酸酐溶液(5微升),旋转振荡反应混合物30秒。反应在室温下进行约2分钟,然后用10微升19∶1的甲酸(88%)∶H2O2(30%)氧化。氧化在室温下进行16小时,干燥样品,然后稀释并作质谱分析。当衍生更小的数量时,该酸性基团试剂的浓度降低100倍。
                            实施例4
Figure C0080294900141
在ASHLGLAR(1nmol,购自Sigma Chemical Co.,St.Louis MO)(SEQ ID NO:1)的0.1M三甲胺(20微升)溶液中加入2-亚氨基硫烷(Traut’s试剂,购自AldrichChemical Co.,Milwaukee,WI)(3微升,0.1M溶于去离子水)。反应在室温下进行约5分钟。用3微升19∶1的甲酸(88%)∶H2O2(30%)氧化产物。氧化在室温下进行5分钟,干燥衍生的分析物,然后进行质谱分析。
                            实施例5
通过混合1-5nM的多肽(于5-20微升水)于10微升19∶1的甲酸(88%)∶H2O2(30%),氧化该多肽CDPGYIGSER(购自Sigma Chemical Co.,St.Louis,MO)(SEQ ID NO:2)。氧化在室温下进行30分钟,干燥衍生的分析物,然后进行质谱分析。
                            实施例6
将二硫二(磺基琥珀酰亚酰氨丙酸酯,DTSSP)(购自Pieree Chemical Co.,Rockford,IL)以50nM/20微升溶于磷酸缓冲液中,用1N NaOH调节pH到7.7。将1微升的肽HLGLAR(以1nM/微升)(SEQ ID NO:3)加到该溶液(20微升)中,使之反应30分钟。用三羟甲基氨基甲烷(0.1M,20微升)淬灭反应。除去样品中的盐分,用10微升19∶1的甲酸(88%)∶H2O2(30%)氧化。氧化在室温下进行30分钟,干燥衍生的分析物,然后进行质谱分析。
                          实施例7
Figure C0080294900151
将二硫二乙醇酸(0.93克,5.1mmol,购自Sigma Chemical Co.St.LouisMO)(另外,可用其酸酐(环状或非环状)的聚合物)溶于二氯甲烷(20ml)中并置于惰性气氛下。在一部分中加入二环己基碳二亚胺(1.05克,5.1mmol)。96小时后,过滤出去沉淀,真空浓缩滤液。将得到的物质溶于乙醚并过滤。再次真空浓缩滤液,得到二硫二乙醇酸酐。
在使用前,制备了浓度为0.1M的二硫二乙醇酸酐(该实施例中显示为环状形式)的无水四氢呋喃溶液。将ASHLGLAR(1nmol)(SEQ ID NO:1)稀释于20微升0.05M的三甲胺中。加入二硫二乙醇酸酐溶液(5微升),旋转振荡反应产物30秒。反应在室温下进行约2分钟。用2微升比率为19∶1的甲酸(88%)∶H2O2(30%)氧化所得到的产物。氧化过程在室温下进行30分钟,干燥衍生的分析物,然后作质谱分析。当衍生更小的数量时,该酸性基团试剂的浓度降低100倍。
                             实施例8
在使用之前,制备了浓度为0.1M的3-磺基丙酸酐的无水四氢呋喃溶液。将ASHLGLAR(1nmol)(SEQ ID NO:1)稀释于20微升四氢呋喃∶二异丙基乙基胺4∶1(v∶v)中。加入3-磺基丙酸酐溶液(2微升),旋转振荡反应混合物30秒。反应在室温下进行约2分钟,然后稀释并进行质谱分析。当衍生更小的数量时,该酸性基团试剂的浓度降低100倍。
                            实施例9
Figure C0080294900161
在使用之前,制备了浓度为0.1M的四氟琥珀酸酐的无水四氢呋喃溶液。将ASHLGLAR(1nmol)(SEQ ID NO:1)稀释于20微升0.05M的三甲胺中。加入四氟琥珀酸酐溶液(2微升),旋转振荡反应混合物30秒。反应在室温下进行约2分钟,然后稀释并进行质谱分析。当衍生更小的数量时,该酸性基团试剂的浓度降低100倍。
实施例10
Figure C0080294900162
将多肽CDPGYIGSR(购自Sigma Chemical Company,St.Louis,MO)(SEQ IDNO:2)与2微升0.02M的磺基乙酸(将2微升纯氯化磺酰基乙酰氯(商品购自Aldrich Chemical Co.,Milwaukee,WI)和500微升水混合形成)混合。干燥混合物,在20微升四氢呋喃∶二异丙基乙基胺(4∶1v/v)中重建。加入0.1M氯化磺酰基乙酰氯(2微升)的无水四氢呋喃溶液,旋转反应混合物30秒。衍生反应在环境温度下进行约2分钟。干燥衍生的分析物,在10微升水中重建。在该溶液中加入10微升19∶1的甲酸(88%)∶H2O2(30%)。氧化在室温下进行5分钟,产生在N-末端附近具有两个磺酸基团的衍生肽。
用质谱分析技术分析
衍生后,用质谱技术分析多肽或该多肽产生的一条或多条肽。虽然所用的技术不受限制,但优选的技术是源后衰变(PSD)基质辅助激光解吸离子化(MALDI)和电喷离子化串联质谱分析。见例如Spengler等,“通过基质辅助激光解吸离子质谱分析进行肽测序(Peptide Sequncing by Matrix-assistedLaser-desorption Mass Spectrometry)”,Rapid Communication in MassSpectrometry,Vol.6,pp.105-108(1992):Spengler等,“基质辅助激光解吸离子质谱分析中源后衰变的基本形式(Fundamental Aspects of PostsourceDecay in Matrix-Assisted Laser Desorption Mass Spectrometry)”,Journalof Physical Chemistry,Vol.96,pp.9678-9684(1992);Kaufman等,“通过采用基质辅助激光解吸离子化在反射飞行时间中的产物离子分析进行线性肽的质谱分析测序(Mass Spectrometry Sequncing of Linear Peptides byProduct-ion Analysis in a Reflection Time-of-flight Mass SpectrometerUsing Matrix-assisted Laser Desorption Ionization)”,RapidCommunication in Mass Spectrometry,Vol.7,pp.902-910(1993);Kaufmann等“在飞行时间质谱仪中的肽测序:基质辅助激光解吸离子化(MALDI)后源后衰变的评估(Sequencing of Peptides in a Time-of-flight Mass Spectrometer:Evaluation of Postsource Decay Following Matrix-assisted LaserDesorption Ionisation(MALDI)),International Journal of MassSpectrometry and Ion Process,Vol.131,pp.355-385(1994):Kaufmann等,“基质辅助激光解吸/离子化-反射飞行时间质谱分析中的源后衰变和迟发提取(Post-source Decay and Delayed Extraction in Matrix-assisted LaserDesorption/Ionisation-Reflection Time-of-flight Mass Spectrometry)”,Rapid Communications in Mass Spectrometry,Vol.10,pp.1199-1208(1996);和Spengler,“生物分子的基质辅助激光解吸/离子化质谱分析中的源后衰变分析(Post-source Decay Analysis in Matrix-assisted LaserDesorption/Ionization Mass Spectrometry of Biomolecules)”,Journal ofMass Spectrometry,Vol.32,pp.1019-1036(1997);Carr等,“分析生物技术中质谱分析的集合(Integration of Mass Spectrometry in AnalyticalBiotechnology)”,Analytical Chemistry,Vol.68,pp.2802-2824(1991);YatesIII等,“用MS探索基因组(Mining Genomes With MS)”,AnalyticalChemistry,Vol.68,pp.534A-540A,(1996);Morris等,“新颖四极/直角加速飞行时间质谱仪上的高灵敏度碰撞激活的分解串联质谱分析(HighSensitivity Collisionally Activated Decompostion Tandem MassSpectrometry on a Novel Quadrupole/Orthagonal Acceleration Time-of-flight Mass Spectrometer)”,Rapid Communications in Mass Spectrometry,Vol.10,889-896(1996)。最优选的,所用的技术是正离子模型PSD MALDI和电喷离子化串联质谱。为了方便起见,下文实施例11和12说明了可用于分析多肽或其产生的肽的质谱分析技术。
如本发明人惊奇的发现,恰当衍生的肽或该多肽产生的肽提供了主要特征的y-离子的MSMS谱。如本领域熟知的,y-离子表明离子化片段含有多肽或肽的原来C-末端。本文所用的术语“y-离子”也包括(y-NH3)离子;为了说明,非完全消化产物含有第二个碱性(比方说)残基,常常产生大量(y-NH3)离子。优选该方法产生的谱基本没有a-离子和b-离子。a-离子和b-离子是通过在骨架羰基任何一侧切断而形成的。重要的是,具有a-离子和b-离子的N-末端片段仍保留了电荷。本文所用的,关于a-离子和/或b-离子的术语“基本没有”指与占优势的y-离子系列相比,a-离子系列和b-离子系列的集合性相对丰度小于约20%,优选小于约10%,最优选约小于5%。
根据本发明的方法,不需要分析和/或鉴定所有消化产物,来鉴定其多肽,特别是如果多肽的序列存在于序列数据库中。
实施例11-PSD MALDI测序技术
在该实施例中,在装备了N2激光器(337nm,3nsec脉冲宽度,20Hz重现率)的Voyager DE-RP或Voyager DE-STR(PerSeptive Biosystems Inc.,Framingham,MA)(或合适的等价物)上进行质谱分析技术。在反射模式中用衰变抽提获得质谱。用低质量肽标准物进行外部质量标定,质量测量的准确度通常是±0.3Da。将衍生的多肽或其产生的肽稀释到约10μpM/μL于0.1%三氟乙酸(TFA)溶液中。然后将样品以a-氰基-4-羟基肉桂酸(αCN,通过将10mg溶于1mL含0.1%TFA的50%乙腈水溶液中制备)稀释5-10倍。见例如,Beavis等,“作为基质辅助激光解吸离子质谱分析的基质的α-氰基-4-羟基肉桂酸(a-Cyano-4-hydroxycinnamic Acid as a Matrix for Matrix-assisted LaserDesorption Mass Spectrometry)”,Organic Mass Spectrometry,Vol.27,pp.156-158(1992)。分析了用快速蒸发方法制备的a-氰基-4-羟基肉桂酸/硝基纤维素(αCN/NC)的薄膜表面上的凝胶分离物,见例如,Arnott等,“一种蛋白库分析的集合方法:与心脏肥大有关的蛋白质的鉴定(An IntegratedApproach to Proteome Analysis;Identification of Proteins Associatedwith Cardiac Hypertrophy)”,Analytical Biochemistry,Vol.258,pp.1-18(1998)。
在用定时离子选择分离合适的前体离子后,得到供衍生分析物的PSD MALDI串联质谱。可用许多MALDI基质(包括但不限于αCN、αCN/NC和2,5-二羟基苯甲酸(DHB))分析衍生的分析物。通过逐步改变施加在反射器上的电压将片段化离子重新聚焦在最终探头上。通常可用的电压比如下:1.0000(前体离子区段)、0.9126、0.6049、0.4125、0.2738、0.1975和0.1213(片段化区段)。用从PerSpetive Biosystems,Framingham,MA购得的软件合并(或如该领域常用的,“缝合在一起”)这些独立的区段(从分析窗口选择“PSD”)。在低激光功率(可变阻尼=1450)<256激光脉冲下得到所有前体离子区段,以避免探头饱和。对于PSD MALDI收藏的所有剩余的区段,增大激光器功率(可变阻尼=1650)。通常对各片段化离子区段达到了256激光脉冲。以20MHz的数字化率获得该数据。
实施例12-电喷离子化串联质谱测序技术
在该实施例中,采用了与装有自建的显微电喷源(μES)的LCQ离子捕获质谱仪(ThermoQuest,San Jose,CA)连接的毛细LC系统(Perkin ElmerBiosystems,Foster City,CA)获得质谱。以5μl/min的流速使用0.5×150mmC18LC柱(Perkin Elmer Biosystems,Foster City,CA)。LC流动相是水和乙腈,各含有0.02%的TFA。典型的梯度是15%乙腈5分钟,然后是15-60%乙腈40分钟以上。通过在LC柱后放置一分离三通(1/16”,0.25mm孔径,Valco,Houston,TX),实现了对于μES源,流速是0.5μl/min,对于UV探头是4.5μl/min。将衍生的肽或多肽样品用自动进样器(ALCOTT,719型,Norcross,GA)注射入LC柱。将μES源放在X,Y,Z测微计(New Focus,Inc.,Santa Clara,CA)上,固定于该仪器的前端。显微电喷针是PicoTip(FS360-50-15-D),来自NewObjective(Cambridge,MA)。
用下列仪器条件获得的电喷串联质谱:喷射针电压1.5kV,加热的毛细管温度200℃,和碰撞能量35eV。在每个完全-MS扫描中使用300-2000m/z的质量范围。用数据依赖性扫描在“三次重演”模式获得了电喷串联质谱,它由3种连续显微扫描构成:1)作完全MS扫描,2)在所选离子上作图像电子放大以确定带电状态,和3)在选自图像电子放大扫描的合适离子上作MS/MS扫描。通过LC运行重复这三次扫描活动。
翻译片段化模式
翻译质谱分析所产生的片段化模式,从而对多肽测序。质谱领域的普通技术人员将能从头手工翻译小型多肽的片段化模型,而无需商品购得的软件或序列数据库的帮助。类似的,技术人员还能从头对该多肽产生的肽(消化产物)进行测序。另外,技术人员可使用进行翻译的已知辅助工具,例如可商品购得的软件或序列数据库。
例如,用本发明产生的y-离子片段化模式能有效并准确的测定多肽或其产生的肽的序列。通过测量y-离子系列中用毗邻成员之间的质量差异,可从头完成各氨基酸残基的鉴定。然后通过将测量的质量差异与已知的氨基酸残基质量(见上文表I)比较,完成鉴定。例如,测量的71.1Da的质量差异对应于丙氨酸。还可从质谱直接建立阅读方向。如果测量是从低质量到高质量,则方向从C-末端到N-末端。如果测量从高质量到低质量,阅读方向则是从N-末端到C-末端。
还可采用接受质谱片段化数据(未翻译的y-离子系列质量或从y-离子质量衍生得到的序列标记)作为序列数据库检索的输入的软件,有效而准确的测定多肽和其产生的肽的序列。这些技术人员常使用的检索软件包括但不限于“Protein Prospector”(从加州大学旧金山分校或http://prospector.ucsf.edu购得)和“Peptide Search”(从European Molecular Biology Laboratory atHeidelberg,Germany或http://www.mann.embl-heidelberg.de购得)。
可针对许多序列数据库检索本发明产生的片段化模式,包括但不限于NCBI非冗余数据库(ncbi.nlm.nih.gov/blast/db.nr.z),SWISPROT(ncbi.nlm.gov/repository/SWISSPROT/sprot33.dat.z),EMBL(FTP://ftp.ebi.ac.uk/pub/database/peptidesearch),OWL(ncbi.nlm.nih.gov/repostory/dbEST.weekly.fasta.mmddyy.z),dbEST(ncbi.nlm.gov/repository/dbEST/dbEST.weekly.fasta.mmddyy.z)和Genebank(ncbi.nlm.nih.gov/genebank/genpept.fsa.z)。通常可从序列数据库中通过检索一个或多个用本发明的方法形成的相关肽衍生物产生的片段化数据,重新获得感兴趣多肽的完整序列。
当然,当使用数据库检索技术时,最有效的是通过限定仅检索y-离子或(y-NH3)离子能被片段化,来限制检索,因为y-和(y-NH3)离子是在采用本发明方法的片段化模式中观察到的最主要种类。其他片段化离子类型,如a-、b-、(b+H2O)、(b-H2O)、(b-NH3)和内部切割离子可被剔除,因为它们在用本发明方法衍生的肽谱图中不占优势。本发明形成的衍生物提供了简单的片段化模式,常常产生比用相同肽不经衍生的质谱获得的更大的检索特异性。
在下面的非限制性实施例中进一步说明了本发明的方法。在这些实施例中,本领域普通技术人员将认识到产生的“候选蛋白”数目可以和本文公开的不同,因为在数据库中一直在加入新的蛋白质。
实施例13
用氧化的胰岛素B-链FVNQHLC(SO3H)GERGFFYTPKA(SEQ ID NO:4)演示了高质量多肽的PSD MALDI串联质谱(MM计算值=3495.9Da)(从Sigma Chmical Co.,St.Louis,MO购得)。该多肽的质量远远超过了大部分常规三重四极仪器的上限。天然多肽的串联质谱显示基本由y-离子构成的较强的离子系列。不难观察到所有在y9和y24之间的y-离子。明确该分子的N-末端的序列特异性片段y25至y29在谱图中不存在。
用酸性基团试剂磺基苯甲酸环酸酐(购自Aldrich Chemical Co.,St.Louis,MO)衍生,改善该多肽的谱图。衍生的多肽显示从该分子N-末端区衍生的y-离子显著增强(y25、y26、y27、y28和y29)。衍生后,观察到了从y8至y29的完整的y-离子系列。未检测到占优势的b-离子。
实施例14
用胰蛋白酶在凝胶内消化以二维凝胶电泳分离的一个多肽。通过MALDI,该肽显示了几个强MH+信号,包括m/z1060.8、1090.8、1271.0、1299.0、1312.0、1344.0、1399.1、1450.1、1460.1和1794.4处的离子。用Protein Prospector软件对NCBI蛋白质序列文库中的记载进行数据库检索,得到一张41个候选蛋白的表,匹配5个或以上输入的胰蛋白酶消化肽的质量(检索参数:MW范围1,000-150,000,等电点3.0-10.0,作为副反应,得到氧化的Met,保守性质量容许误差+/-0.6Da)。
可用前述实施例中讨论的数种试剂之一衍生该多肽产生的肽。它们包括但不限于2-磺基苯甲酸环酸酐、3-磺基丙酸酐或氯磺酰基乙酰氨。在该实施例中,用氯磺酰基乙酰氯作为酸性基团试剂。修饰从2D凝胶电泳分离的低水平肽的衍生程序,以改进再现性和衍生物产率。通常将2D凝胶的肽抽提物在加速真空泵上浓缩至近乎干燥(5-10微升)。用15微升0.1%的TFA酸化浓缩物,并用商品购得的C18小柱(ZipTipTM,MilliporeCorporation,Bedford,MA01730)纯化。纯化的样品在加速真空泵上干燥,并重建于10微升碱(THF∶DIEA 19∶1v/v)中。在该实施例中,加入2微升氯磺酰基乙酰氯溶液(2微升纯液体于1毫升THF中),反应在室温下进行1-2分钟。再次在加速真空泵上干燥衍生样品,并重建于10微升0.1%TFA中,然后分析。在该阶段,可将样品与MALDI基质混合,并将一部分加到样品平台上,用于分析,或再用商品购得的C18小柱(ZipTipTM,MilliporeCorporation,Bedford,MA01730)纯化。然后从ZipTip上直接洗脱出纯化的样品,加到MALDI样品平台上,体积为含有10mg/mlMALDI基质的1-2微升的乙腈∶0.1%TFA(1∶1 v/v)。该程序能将所有回收的衍生物加到MALDI样品平台上用于分析,从而改进该方法的整体灵敏度。对衍生的重量约1572Da的肽进行了PSD MALDI串联质谱分析。获得的序列标记具有m/z574.5、661.7、875.9、1003.8、1103.9、1204.6、1304.1的y-离子和m/z1451.0的MH+衍生物离子。)对蛋白质序列数据库检索该质谱,返回了6个候选蛋白(所有线粒体天冬氨酸氨基转移酶)(检索参数:MW范围1,000-150,000,亲代离子质量容许误差+/-0.6Da,片段化离子质量容许误差+/-2.5Da,Par(mi)Frag(av),允许丢失的离子数目=1)。获得该水平的特异性是因为数据库检索被约束于将y-离子看作唯一的允许片段。这种检索约束是可能的,因为在这些衍生物的串联质谱中,N-末端和内部切割离子不占优势(因为按照本发明衍生)。当对整个文库检索这相同的串联质谱时,获得了小得多的特异性(返回了239个候选蛋白),并获得了所有片段离子类型(a、b、(b+H2O)、(b-NH3)、(b-H2O)、内部和y)。该肽被鉴定为FVTVQTISGTGALR(SEQ ID NO:5)。
PSD MALDI查找证实了该蛋白质的身份,衍生物重量约1916Da。图谱除了质子化的前体离子外,含有7个m/z为724.6、1154.2、1299.3、1439.0、1551.9、1665.5和1779.2的片段。假定片段是y-离子,就该质谱检索了数据库。该检索没有返回线粒体天冬氨酸氨基转移酶或任何其他候选蛋白质。检索数据库使y和(y-NH3)离子都返回了16个候选蛋白质,其中10个是线粒体天冬酰胺氨基转移酶。该后一项检索证实了该蛋白质的身份。这种特别检索要求包括(y-NH3)离子作为可能片段是因为该肽是一种不完全的胰蛋白酶消化产物(ILIRPLYSNPPLNGAR)(SEQ ID NO:6),它含有第二个精氨酸残基。如本文上述,衍生的不完全消化产物常常在PSD串联质谱中显示(y-NH3)片段离子。
实施例15
用LC电喷串联质谱在LCQ离子捕获装置上,在如本文的实施例14那样衍生后分析从2D凝胶电泳分离的其蛋白质的凝胶内胰蛋白酶消化物。可用“三次运行”顺序的显微扫描以自动化数据依赖性模式,无须照管而获得所有质谱。一衍生的胰蛋白酶消化肽(MH+=971.5)的串联质量谱显示了几种y-型产物离子,包括m/z401.1、538.3、651.3、750.4。将测量得到的y-离子作为输入,与未衍生的胰蛋白酶消化肽(971.5-122=849.5)的MH+质量一起用于数据库检索。用Protein Prospector软件对NCBI蛋白质序列文库进行数据库检索,返回3个候选蛋白质(检索参数:MW范围全部,亲代离子容许误差+/-0.6Da;片段离子容许误差+/-1.0Da,单一同位素型亲代和片段离子,不允许丢失的离子)。从数据库检索返回的全部三个候选蛋白是触珠蛋白。该肽被鉴定为VVLHPER(SEQ ID NO:7)。
采用第二条衍生肽(衍生物的MH+=771.4Da)产生的串联质谱检索数据库,获得了对该蛋白质身份的肯定。质谱显示有几个离子,包括m/z322.1、436.2和535.3处的y-型离子。使用上述相同检索参数,三条肽序列和电喷串联质谱的输入数据相符。三条肽序列之一与触珠蛋白相对应。该肽被鉴定为NVNFR(SEQ ID NO:8)。该结果证实了该蛋白质的身份。
实施例16
本发明的方法不难用于鉴定各种多肽。酶分离物的胰蛋白酶消化物的MALDI质谱显示许多与商品蛋白酶Savinase(商品购自Novo Nordisk,Copenhagen,Denmark)的胰蛋白酶解肽质量相同的质量。在质谱中没有预期的胰蛋白酶解肽GVLVVAASGNSGASISYPAR(MH+=1933Da)(SEQ ID NO:9),并在m/z1963处观察到未知的离子。这提示分离物是Savinase变异型。11个不同的单氨基酸改变可解释观察到的+30Da的质量漂移(4G→S,4A→T,和3V→E)。如本文实施例2那样衍生后,获得了PSD MALDI串联质谱。对于21个氨基酸的肽,观察到了完整的y-离子系列。该质谱证实14位残基甘氨酸转变为丝氨酸。测量了该质谱中所有y-离子的质量。用包括在PerSeptive BiosystemsMALDI数据系统中的肽序列梯测序程序自动翻译了该质谱。
实施例17
通过比较按照实施例5和实施例10衍生的CDPGYIGSR(SEQ ID NO:2)产生的MALDI PSD图谱,证明了含有两个磺酸基团都靠近该肽N-末端的二磺酸衍生物的用途。用PSD MALDI从α-氰基-4-羟基肉桂酸的基质分析半胱氨酸残基(实施例5)的巯基过甲酸氧化形成的衍生物。得到的PSD谱主要是y7片段离子,它是通过切割不稳定的Asp-Pro酰胺键形成的。质量较小的y-型离子显示较低的丰度。例如,y3和y4离子的丰度相对于y7离子仅分别为8%和5%(峰高比)。不希望受理论所限制,相信“运动”离子化质子优先位于碱性Asp-Pro酰胺氮原子上,因为Pro酰胺氮比其他骨架酰胺基团更具碱性。认为这种电荷定位优先使Asp和质子化Pro之间的酰胺键片段化。按照实施例10,在该肽的N-末端附近加入第二个磺酸基团,使该问题最小化。加入第二个磺酸基团需要加入第二个“运动”质子,来产生用于MALDI PSD分析的带正电离子。另外,不受理论限制,相信这第二个质子能自由的离子化其他骨架酰胺基团,因为较碱性的Pro基团已被离子化了。其他骨架酰胺基团的质子化导致那些基团的片段化增强,并增大了相应的y-离子在MALDI PSD质谱中的丰度。按照实施例10形成的衍生物的PSD质谱中,y3和y4离子的丰度相对于y7离子,分别增加到约41%和57%(峰高比)。
本发明的试剂盒
本发明的另一个实施例是可用于测定多肽的氨基酸序列的试剂盒。该试剂盒包括:
(a)一种或多种酸性基团试剂,当与多肽或该多肽产生的一种或多种肽偶联时,提供了电离常数pKa小于约2的酸性基团;和
(b)用一种或多种酸性基团试剂衍生该多肽的N-末端或该多肽产生的一条或多条肽的N-末端的容器。
本发明的试剂盒适合质谱分析仪,其样式类似于Patterson(美国专利号5,827,659,授予PerSeptive Biosystems,Inc,1998年10月27日发布)描述的样品容器。
可任选的,该试剂盒还可包括要测试质谱分析技术准确性的一条或多条验证肽。还可任选的包括参考的质谱数据。
上文描述了可包含在试剂盒中的酸性基团试剂。
尤其优选的衍生设备包括那些能使分析人员或其他对获得衍生的多肽或肽感兴趣的人员能方便使用的衍生设备。特别优选的衍生设备包括一种或多种容器装置,含有例如酸性基团试剂和最终的感兴趣的多肽/肽。
合适的容器包括例如:小管、试管、移液器头(pipette tip)、板、样品容器和多孔板。提供了可任选的方便,如在容器中存在酸性基团试剂,因而它不需要由分析人员加入。例如,酸性基团试剂可存在于移液器头的内部,并随着用合适的缓冲液将多肽或肽推入移液器头时被激活。密封装置最优选一次性的,但不必需。
酸性基团试剂还可与一固相载体结合。例如,试剂在移液器头内可以与载体结合。可将感兴趣的多肽和肽溶于合适的缓冲系统中,并可反复吸取该结合试剂。反应后,可将合适量的衍生多肽或肽直接加到MALDI质谱的样品阶段,或注射入电喷离子化质谱装置中。
可在本发明的试剂盒中包括用于促进衍生的一种或多种缓冲液系统。适合包含的缓冲系统取决于所含酸性基团试剂。在上文的衍生实施例中公开了优选的缓冲系统的例子。具体的优选缓冲系统包括但不限于叔胺溶液(水或非水溶液(例如溶于四氢呋喃))和纯叔胺。特别优选的叔胺包括三甲基胺、三乙基胺和二异丙基乙基胺。
本发明试剂盒还可包含一种或多种消化辅助剂,如本文上述的那些。消化辅助剂可以是化学性或酶性的。作为消化辅助剂,可包含例如胰蛋白酶、内切蛋白酶Lys C、内切蛋白酶Arg C、和/或胰凝乳蛋白酶,优选胰蛋白酶、内切蛋白酶Lys C、内切蛋白酶Arg C,最优选胰蛋白酶。也可在其中含有化学消化辅助剂,如氰化溴。
                                  序列表
<110>Keough,Thomas W.
     Youngquist,Robert S.
<120>多肽测序的方法和试剂盒
<130>测序多肽的方法/试剂盒
<140>7379P2
<141>1999-09-29
<160>9
<170>PatentIn Ver.2.0
<210>1
<211>8
<212>PRT
<213>合成构建物
<400>1
Ala Ser His Leu Gly Leu Ala Arg
  1               5
<210>2
<211>9
<212>PRT
<213>合成构建物
<400>2
Cys Asp Pro Gly Tyr Ile Gly Ser Arg
  1               5
<210>3
<211>6
<212>PRT
<213>合成构建物
<400>3
His Leu Gly Leu Ala Arg
  1               5
<210>4
<211>30
<212>PRT
<213>牛胰岛素
<400>4
Phe Val Asn Gln His Leu Xaa Gly Ser His Leu Val Glu Ala Leu Tyr
  1              5                   10                   15
Leu Val Xaa Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala
             20                  25                   30
<210>5
<211>14
<212>PRT
<213>前脂肪细胞
<400>5
Phe Val Thr Val Gln Thr Ile Ser Gly Thr Gly Ala Leu Arg
  1               5                  10
<210>6
<211>16
<212>PRT
<213>前脂肪细胞
<400>6
Ile Leu Ile Arg Pro Leu Tyr Ser Asn Pro Pro Leu Asn Gly Ala Arg
  1               5                  10                  15
<210>7
<211>7
<212>PRT
<213>大鼠淋巴
<400>7
Val Val Leu His Pro Glu Arg
  1               5
<210>8
<211>5
<212>PRT
<213>大鼠淋巴
<400>8
Asn Val Asn Phe Arg
  1               5
<210>9
<211>21
<212>PRT
<213>未知
<400>9
Gly Val Leu Val Val Ala Ala Ser Gly Asn Ser Gly Ala Gly Ser Ile
  1              5                    10                 15
Ser Tyr Pro Ala Arg
             20

Claims (23)

1.一种测定多肽的氨基酸序列的方法,其特征在于,该方法包括:
(a)用一种或多种当与多肽或肽偶联时,电离常数pKa小于2的酸性基团试剂衍生该多肽的N-末端或该多肽产生的一条或多条肽的N-末端,以提供一种或多种衍生分析物;
(b)用质谱分析技术分析一种或多种衍生的分析物,以提供一种片段化模式;和
(c)翻译该片段化模式。
2.如权利要求1所述的方法,其特征在于,所述酸性基团的电离常数pKa小于0。
3.如权利要求2所述的方法,其特征在于,所述酸性基团的电离常数pKa小于-2。
4.如权利要求1所述的方法,其特征在于,所述片段化模式中在骨架羰基任何一侧切断形成的离子系列的集合性相对丰度小于20%。
5.如权利要求1所述的方法,其特征在于,所述片段化模式中在骨架羰基任何一侧切断形成的离子系列的集合性相对丰度小于10%。
6.如权利要求1所述的方法,其特征在于,所述片段化模式中在骨架羰基任何一侧切断形成的离子系列的集合性相对丰度5%。
7.如权利要求1所述的方法,其特征在于,所述质谱分析技术是源后衰变基质辅助激光解析离子化质谱。
8.如权利要求7所述的方法,其特征在于,所述质谱分析技术是阳离子模式源后衰变基质辅助激光解析离子化。
9.如权利要求7所述的方法,其特征在于,所述质谱分析技术是电喷离子化串联质谱。
10.如权利要求9所述的方法,其特征在于,所述电喷离子化串联质谱是串联电喷离子化质谱。
11.如权利要求1所述的方法,其特征在于,片段化模式的翻译包括使用可商品购得的软件程序或数据库。
12.如权利要求1所述的方法,其特征在于,所述多肽是一种合成的多肽。
13.如权利要求1所述的方法,其特征在于,所述多肽产生的肽是通过消化产生的。
14.如权利要求13所述的方法,其特征在于,所述消化是化学消化。
15.如权利要求14所述的方法,其特征在于,所述化学消化是氰化溴消化。
16.如权利要求13所述的方法,其特征在于,所述消化是酶消化。
17.如权利要求16所述的方法,其特征在于,所述酶消化选自内切蛋白酶LysC消化、内切蛋白酶Arg C消化,胰蛋白酶消化和胰凝乳蛋白酶消化。
18.如权利要求1所述的方法,其特征在于,所述酸性基团是一个或多个磺酸或二磺酸衍生物。
19.如权利要求18所述的方法,其特征在于,所述酸性基团是2-磺基乙酰基,3-磺基丙酰基、或2-磺基苯甲酰基。
20.一种用于测定多肽的氨基酸序列的试剂盒,其特征在于,该试剂盒含有:
(a)一种或多种酸性基团试剂,当与多肽或该多肽产生的一条或多条肽偶联时,该试剂提供电离常数pKa小于2的一种或多种酸性基团;和
(b)用一种或多种酸性基团试剂,衍生该多肽的N-末端或该多肽产生的一条或多条肽的N-末端的容器。
21.如权利要求20所述的试剂盒,其特征在于,所述酸性基团试剂位于所述容器内。
22.如权利要求21所述的试剂盒,其特征在于,所述容器还含有缓冲液系统。
23.如权利要求20所述的试剂盒,其特征在于,所述试剂盒还含有一种或多种消化辅助剂。
CNB008029490A 1999-01-20 2000-01-12 多肽测序的方法和试剂盒 Expired - Fee Related CN1149398C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US11650299P 1999-01-20 1999-01-20
US60/116,502 1999-01-20
US15667799P 1999-09-29 1999-09-29
US60/156,677 1999-09-29

Publications (2)

Publication Number Publication Date
CN1340162A CN1340162A (zh) 2002-03-13
CN1149398C true CN1149398C (zh) 2004-05-12

Family

ID=26814315

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB008029490A Expired - Fee Related CN1149398C (zh) 1999-01-20 2000-01-12 多肽测序的方法和试剂盒

Country Status (12)

Country Link
EP (1) EP1145012B1 (zh)
JP (1) JP2002535659A (zh)
CN (1) CN1149398C (zh)
AT (1) ATE274190T1 (zh)
AU (1) AU757356B2 (zh)
CA (1) CA2359163C (zh)
DE (1) DE60013093T2 (zh)
DK (1) DK1145012T3 (zh)
ES (1) ES2223463T3 (zh)
IL (2) IL144129A0 (zh)
NO (1) NO20013563L (zh)
WO (1) WO2000043792A2 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1290450A2 (en) * 2000-06-09 2003-03-12 MDS Proteomics, Inc. Labeling of proteomic samples during proteolysis for quantitation and sample multiplexing
US20060141632A1 (en) * 2000-07-25 2006-06-29 The Procter & Gamble Co. New methods and kits for sequencing polypeptides
US7045296B2 (en) * 2001-05-08 2006-05-16 Applera Corporation Process for analyzing protein samples
WO2002095419A2 (en) * 2001-05-23 2002-11-28 Amersham Biosciences Ab Peptide analysis using a solid support
US7074570B2 (en) 2001-05-23 2006-07-11 Ge Healthcare Bio-Sciences Ab Peptide fragmentation
JP3534191B1 (ja) 2002-12-26 2004-06-07 日本電気株式会社 質量分析法を利用するペプチドc末端アミノ酸配列解析方法
US7371514B2 (en) 2004-07-16 2008-05-13 Agilent Technologies, Inc. Serial derivatization of peptides for de novo sequencing using tandem mass spectrometry
JP4543929B2 (ja) * 2005-01-04 2010-09-15 日本電気株式会社 タンパク質の解析方法
GB0503411D0 (en) * 2005-02-18 2005-03-30 Shimadzu Res Lab Europe Ltd Mass spectrometry precursor ion selection
HRP20100044B1 (hr) * 2010-01-25 2016-11-18 Institut Ruđer Bošković Metoda identifikacije proteina spektrometrijom masa
CA2836114C (en) * 2011-05-18 2016-10-25 Rudjer Boskovic Institute Method of detection of amino acid sequence and/or identification of peptides and proteins, by use of a new derivatization reagent and synthesis of 5-formyl-benzene-1,3-disulphonicacid as derivatization reagent
CN103852513B (zh) * 2012-11-29 2016-01-06 中国科学院计算技术研究所 一种基于hcd与etd质谱图的肽段从头测序方法及系统
CN108440740B (zh) * 2018-02-14 2020-05-05 苏州大学 一种可逆自修复环氧树脂及其制备与回收重塑方法

Also Published As

Publication number Publication date
DE60013093T2 (de) 2005-09-01
ES2223463T3 (es) 2005-03-01
CA2359163C (en) 2004-07-20
NO20013563L (no) 2001-09-18
WO2000043792A2 (en) 2000-07-27
EP1145012A2 (en) 2001-10-17
JP2002535659A (ja) 2002-10-22
WO2000043792A3 (en) 2000-11-30
IL144129A (en) 2006-12-31
CA2359163A1 (en) 2000-07-27
ATE274190T1 (de) 2004-09-15
IL144129A0 (en) 2002-05-23
AU2848700A (en) 2000-08-07
DK1145012T3 (da) 2004-12-13
CN1340162A (zh) 2002-03-13
DE60013093D1 (de) 2004-09-23
EP1145012B1 (en) 2004-08-18
AU757356B2 (en) 2003-02-20
NO20013563D0 (no) 2001-07-18

Similar Documents

Publication Publication Date Title
CN1308690C (zh) 多肽测序的新方法和试剂盒
CN1149398C (zh) 多肽测序的方法和试剂盒
Formolo et al. Determination of the NISTmAb primary structure
CN1118580C (zh) 对多肽的特性分析
Kinter et al. Protein sequencing and identification using tandem mass spectrometry
CN1411555A (zh) 通过切割和质谱确定多肽特征
Tran et al. Comprehensive glycosylation profiling of IgG and IgG-fusion proteins by top-down MS with multiple fragmentation techniques
CN1427953A (zh) 质量标记物
Silverman et al. Practical considerations for amino acid isotope analysis
AU2001273568A1 (en) Methods and kits for sequencing polypeptides
CN1766636A (zh) 用于衍生多肽的串联质谱从头测序的锁定质量离子
Cejkov et al. Electron transfer dissociation parameter optimization using design of experiments increases sequence coverage of monoclonal antibodies
EP3633383A1 (en) Fast protein sequencing
Vecchi et al. Identification and sequencing of N-terminal peptides in proteins by LC-fluorescence-MS/MS: An approach to replacement of the Edman degradation
CN1474944A (zh) 利用亲和捕获串联质谱分析表征分子间作用的方法
CN1502116A (zh) 亲和捕获串联质谱分析设备和方法
Kinumi et al. Characterization and Value Assignment of a Monoclonal Antibody Reference Material, NMIJ RM 6208a, AIST-MAB
CN1891690A (zh) 用于质谱法的电离修饰剂
CN1695055A (zh) 使用激光烧蚀技术的蛋白质分析方法
JP2879661B2 (ja) タンパク質あるいはペプチドのアミノ酸配列を決定する方法
CN1304845C (zh) 一种新型含碘树脂衍生物用在基于质谱的蛋白组学研究中的方法
US20240053359A1 (en) Native microfluidic ce-ms analysis of antibody charge heterogeneity
Stöcklin et al. Proteomics of venom peptides
Lee et al. Proteomic study of micro-algae: sample preparation for two-dimensional gel electrophoresis and de novo peptide sequencing using MALDI-TOF MS
Commodore Mass Spectrometry Studies of Peptides Cationized by Trivalent Metal Ions

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee