JP2013531225A - タンデム質量分析を用いるペプチド試料ストリームの分析のための方法およびシステム - Google Patents

タンデム質量分析を用いるペプチド試料ストリームの分析のための方法およびシステム Download PDF

Info

Publication number
JP2013531225A
JP2013531225A JP2013510458A JP2013510458A JP2013531225A JP 2013531225 A JP2013531225 A JP 2013531225A JP 2013510458 A JP2013510458 A JP 2013510458A JP 2013510458 A JP2013510458 A JP 2013510458A JP 2013531225 A JP2013531225 A JP 2013531225A
Authority
JP
Japan
Prior art keywords
sample
peptide sequence
peptide
peptides
related peptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2013510458A
Other languages
English (en)
Inventor
オレグ ブイ. クローキン
ヴィク スパイサー
Original Assignee
ユニバーシティ オブ マニトバ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユニバーシティ オブ マニトバ filed Critical ユニバーシティ オブ マニトバ
Publication of JP2013531225A publication Critical patent/JP2013531225A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/04Preparation or injection of sample to be analysed
    • G01N2030/042Standards
    • G01N2030/045Standards internal
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • G01N2030/8809Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
    • G01N2030/8813Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials
    • G01N2030/8831Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials involving peptides or proteins

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Electron Tubes For Measurement (AREA)

Abstract

本開示は、タンデム質量分析を用いてクロマトグラフィーカラムからのペプチド試料ストリームを分析するための方法およびシステムに関する。第1の時間間隔における試料ストリームの分析は、該試料ストリームに含まれるペプチド、例えばトリプシン消化ペプチドを同定するために行われる。次に、同定されたペプチド配列を含む1つまたは複数のタンパク質配列を同定するためおよび該ペプチド配列とは異なるタンパク質配列に含まれる関連ペプチド配列を同定するために、データベース検索が行われる。関連ペプチドの保持時間は、予測ペプチドの疎水性に基づき、かつ標準ペプチドで試料をスパイクすることにより、推定される。関連ペプチドに関する情報は、その後、該関連ペプチドに対応するイオンを検出または無視するよう質量分析装置を第2の時間間隔内に設定するのに使用することができる。

Description

関連出願:
本願は、2010年5月20日出願の米国仮特許出願第61/346,678号の恩典を主張し、その全内容をすべての目的のために参照により本明細書に組み入れる。
発明の分野:
本開示は、質量分析を用いる試料ストリームの分析のための方法およびシステム、より詳細にはタンデム質量分析におけるクロマトグラフィー試料ストリームの分析のための方法およびシステムに関する。
発明の背景:
プロテオミクスの分野は、1980年代後半の2つのソフトイオン化技術:マトリックス支援レーザー脱離イオン化(M. Karas, F. Hillenkamp, Analytical Chemistry 1988 60:2299-301(非特許文献1))およびエレクトロスプレーイオン化(J.B. Fenn, M. Mann, S.F. Wong and C.M Whitehouse, Science 1989 246:64-71(非特許文献2))の開発によって登場した。生物学的化学物質(ペプチドおよびタンパク質)の質量分析ベースの分析は、今ではありふれたものとなっている。
タンパク質試料は、典型的にはタンパク質分解消化に供され、それによってそれらは取り扱い可能なサイズのペプチドまで小型化される。数種のタンパク質の混合物は、簡素な質量分析装置を用いて分析することができ;それらのタンパク質は、複数のメンバーペプチドの質量により同定することができ、この手法はペプチドマスフィンガープリンティングとして公知である。より高度な機器では、その後に親ペプチドイオンを(個々に)質量分析装置内で衝突誘起解離(CID)に供し、それらをアミノ酸結合点に沿ってフラグメントに分解することができる。得られるタンデム(MS/MS)質量スペクトルは、多くの場合、フラグメントイオンの質量間の差からペプチドのアミノ酸配列を推定するのに十分な情報を含んでいる。
これらの混合物中のすべての成分を分解するための質量分析は、生物学的試料の複雑性が高まったことにより、早々に限界に達している。複雑な試料から亜成分を得る方法は存在する。これらの中で最も一般的なものは、ゲル電気泳動および逆相高速液体クロマトグラフィー(HPLC)である。
エレクトロスプレーイオン化を介したHPLCとMS(MS/MS)のオンライン接続は、高スループットのプロテオミクスおよびシステムバイオロジーにおいて重要なツールであるが、実施上の制約がいくつかある。質量分析システムは、HPLC分離プロセスによってリアルタイムでデータを取得するため;機器が親を選択してこれらの親に対してCIDを実施する時間は限られる。現在の方法論では、与えられたMSスペクトルから最大強度の親しかMS/MS用に選択されないが、典型的にはこれらのスペクトルの< 50 %が信頼性の高いペプチドをもたらすとされる。
観察されるペプチドの適用範囲を改善するための1つのアプローチは、同一試料に対して2つの同一機器を稼働させることである。第1の実施から得られたペプチド配列の結果は、第2の実施において仮説に基づく分析により親MSエントリを事前選択または除外するのに使用することができる。これは、時間のかかる作業であり、試料の量に制限がある場合は非現実的であるかもしれない。
代替法は、ペプチドをほぼリアルタイムで同定し、その後の親の選択(または除外)をすでに同定されているものからの情報に基づいて行うことである。
OverneyとRoark(米国特許第7,498,568号(特許文献1))は、コントローラを含む質量分析システムについて記載しており、該コントローラは、該質量分析装置に対して、既定の評価基準を満たすかどうかによる前駆イオンスペクトルのリアルタイム分析に基づきプロダクトイオンスペクトルを収集するよう指令する。
Wu et al.(RT-PSM, a real-time program for peptide-spectrum matching with statistical significance Rapid Commun. Mass Spectrom. 2006;20(8):1199-208(非特許文献3))は、タンデム質量分析データ取得のリアルタイム制御の実現のためのリアルタイムペプチド同定アルゴリズムについて記載している。Wu et al.は、タンデム質量分析データ取得のリアルタイム制御のためにペプチドを除外リストに掲載するためのクロマトグラフィー保持時間の予測については記載していない。
クロマトグラフィーを質量分析に接続して用いる複雑な生物学的試料の分析のための新規の方法およびシステムに対する要望が依然として存在している。
米国特許第7,498,568号
M. Karas, F. Hillenkamp, Analytical Chemistry 1988 60:2299-301 J.B. Fenn, M. Mann, S.F. Wong and C.M Whitehouse, Science 1989 246:64-71 Wu et al., RT-PSM, a real-time program for peptide-spectrum matching with statistical significance Rapid Commun. Mass Spectrom. 2006;20(8):1199-208
1つの局面において、本開示は、クロマトグラフィーおよびタンデム質量分析を用いてペプチドを含む試料を分析するための方法およびシステムを提供する。本開示はまた、液体クロマトグラフィーおよびタンデム質量分析を用いて生成されたペプチド試料ストリームの質量スペクトルの分析のための方法およびシステムを提供する。
1つの局面において、第1の時間間隔内にクロマトグラフィー試料ストリーム中のペプチドを分析して、第2の時間間隔内に該試料ストリーム中の関連ペプチドの存在を予測する。1つの局面において、関連ペプチド配列の保持時間が予測される。試料は、任意で、標準ペプチドによりスパイクし、関連ペプチド試料の予測保持時間を決定する。1つの態様において、予測保持時間は、各関連ペプチド配列に関して算出された疎水性指標の値ならびに標準ペプチドの観察された保持時間および既知の特性に基づき決定される。質量分析装置は、イオンを選択的に通過させるもしくは妨害するようまたは第2の時間間隔における関連ペプチドに対応する解離のための親イオンを選択するよう設定され得る。
1つの局面において、関連ペプチド配列に関する情報は、質量分析装置を、第2の時間間隔内に試料ストリームの質量分析データの収集に最適化するよう設定するのに使用することができる。1つの態様において、質量分析装置は、第2の時間間隔内に、イオン強度に基づく親イオンの選択以外の手段で試料ストリームに含まれるペプチドおよび/またはタンパク質を同定するための情報を豊富に含む可能性が高い親イオンを選択するよう設定され得る。1つの態様において、質量分析装置は、第1または以前の時間間隔における試料ペプチドの分析に基づき、高い確実性ですでに同定されているタンパク質に属すると予測される1次イオンを無視またはフィルターで除去するよう設定され得る。
したがって、1つの態様において、クロマトグラフィーおよびタンデム質量分析を用いて試料を分析する方法であって、
(a) 1つまたは複数の試料ペプチドを含む試料を提供する工程、
(b) 1つまたは複数の標準ペプチドを該試料に添加して試験試料を形成する工程であって、各標準ペプチドのアミノ酸配列および疎水性指標が既知である、工程、
(c) 該試験試料をクロマトグラフィーカラムに投入し、該クロマトグラフィーカラムからタンデム質量分析装置へと試験試料ストリームを溶出させる工程、
(d) 第1の時間間隔内の試験試料ストリームに含まれる複数のペプチドについての第1の時間間隔の質量スペクトルおよび関連する保持時間を取得する工程であって、第1の時間間隔内の試験試料ストリームが少なくとも1つの標準ペプチドを含む、工程、
(e) 第1の時間間隔の質量スペクトルと質量スペクトル参照データベースを比較して、第1の時間間隔内の試料ストリームに含まれる試料ペプチドに基づき同定された試料ペプチド配列セットを形成する工程、
(f) 少なくとも1つの同定された試料ペプチド配列について、タンパク質配列参照データベースを検索して、該同定された試料ペプチド配列を含む1つまたは複数のタンパク質配列を同定および抽出する工程、
(g) 工程(f)で抽出された1つまたは複数のタンパク質配列を分析することにより関連ペプチド配列セットを生成して、1つまたは複数の関連ペプチド配列を同定する工程であって、該同定された試料ペプチド配列と該関連ペプチド配列とは異なっておりかつ両方が該タンパク質配列内に含まれる、工程、
(h) 工程(d)で取得された1つまたは複数の標準ペプチドの保持時間に基づき、少なくとも1つの関連ペプチド配列についての予測保持時間を決定する工程、ならびに
(i) 該関連ペプチド配列セット中の該少なくとも1つの関連ペプチド配列および工程(h)で決定された予測保持時間に基づき、いくつかのイオンを通過させその他のイオンをフィルターで除去するよう該タンデム質量分析装置を設定することによって、第2の時間間隔内の試験試料ストリームについての第2の時間間隔の質量スペクトルおよび関連する保持時間を取得する工程
を含む、方法が提供される。
1つの態様において、関連ペプチド配列セットおよび予測保持時間は試料の溶出の間に2回以上決定され、タンデム質量分析装置は、さらなる第2の時間間隔内に質量スペクトルを取得するようさらに設定される。1つの態様において、上記の工程(d)から(i)は、クロマトグラフィーカラムからの試験試料ストリームの溶出の間に2回以上反復され得る。1つの態様において、クロマトグラフィーカラムは、逆相高速液体クロマトグラフィー(RP-HPLC)カラムである。1つの態様において、この方法は、RP-HPLC-ESI-MS/MSを使用する。
1つの態様において、試験試料を形成するために複数の標準ペプチドを試料に添加する。1つの態様において、少なくとも1つの関連ペプチド配列についての予測保持時間は、複数の標準ペプチドについての複数の保持時間に基づき決定される。
1つの態様において、質量スペクトルは、第1の時間間隔内に、2次イオンへの解離のための親イオンを該親イオンの観察された強度に基づき選択することにより、取得される。1つの態様において、質量スペクトルは、第2の時間間隔内に、第1の時間間隔からの質量スペクトルを分析することにより生成される関連ペプチド配列セットおよび保持時間に基づき2次イオンへの解離のための親イオンを選択することにより、取得される。
1つの態様において、タンデム質量分析装置は、質量分析器および検出器を含み、第2の時間間隔内に、質量分析器は、関連ペプチド配列の1つまたは複数の特徴、例えば保持時間またはm/Zに基づき、該関連ペプチド配列のイオンまたは2次イオンを検出器へと通過させるかまたはその通過を妨害するかのいずれかとなるよう設定される。
1つの態様において、関連ペプチドセットに含まれる関連ペプチド配列は、2次イオンへの解離のための親イオンとして選択または除外される。
1つの態様において、この方法は、複数の関連ペプチド配列の保持時間を算出する工程を含む。1つの態様において、関連ペプチド配列の保持時間に関する情報は、いくつかのイオンを通過させその他のイオンをフィルターで除去するよう質量分析装置を設定するのに使用される。
1つの態様において、関連ペプチド配列の保持時間は、その関連ペプチド配列についての疎水性指標(HI)に基づき算出される。1つの態様において、関連ペプチド配列についての疎水性指標は、当技術分野で公知のペプチド配列に基づき算出される。関連ペプチドの保持時間は、標準ペプチドについて観察される保持時間および既知の疎水性指標に基づき算出され得る。標準ペプチドは、試料ストリームを溶出させるクロマトグラフィーカラムの動作特性(operational characteristics)の特徴決定を行うのに有用である。1つの態様において、動作特性には、T0および/または線形溶媒傾斜理論(linear solvent slope theory)に関連する特性が含まれる。1つの態様において、標準ペプチドは、
Figure 2013531225
からなる群より選択される1つまたは複数のペプチドを含む。
任意で、関連ペプチド配列の疎水性指標は、当技術分野で公知の方法、例えば、すべて参照により本明細書に組み入れられるKrokhin et al. Molecular and Cellular Proteomics 2004 Sep;3(9):908-19; Krokhin Anal. Chem., 2006, 78 (22), pp 7785-7795; およびSpicer et al. Anal. Chem., 2007, 79 (22), pp 8762-8768に記載のSSRCalcを用いて算出される。1つの態様において、各関連ペプチドの保持時間は、次式にしたがって算出される:
TP = HIP/ (グラジエント傾斜度) + T0
式中、TPは該ペプチドの保持時間であり、HIPは該ペプチドの疎水性指標であり、T0は1つまたは複数の標準ペプチドの観察された保持時間に基づいて算出される。1つの態様において、T0は、ペプチド溶出の参照「開始時間(start time)」であり、それは実験ごとに測定される。1つの態様において、グラジエント傾斜度は、グラジエント溶出液体クロマトグラフィー下でのクロマトグラフィーカラムからの試料の溶出についての既知の動作パラメータである。
別の態様において、この方法は、関連ペプチド配列の各々の質量(m)および/またはエレクトロスプレーイオン電荷状態(Z)を算出する工程をさらに含む。質量分析装置は、その後、関連ペプチド配列セット中の少なくとも1つの関連ペプチド配列の質量および/またはエレクトロスプレー電荷状態に基づきいくつかのイオンを通過させその他のイオンをフィルターで除去するよう設定され得る。1つの態様において、質量分析装置は、関連ペプチド配列の算出された保持時間に基づきいくつかのイオンを通過させその他のイオンをフィルターで除去するよう設定される。任意で、各関連ペプチド配列のエレクトロスプレーイオン電荷状態(Z)は、関連ペプチド配列の塩基性アミノ酸(K、RおよびH)の数を合計することによって算出され得る。
1つの態様において、本明細書に記載される方法によって分析される試料は、より小さなペプチドへと断片化されたタンパク質を当初から含んでいるものである。1つの態様において、タンパク質は、酵素トリプシンまたは別の配列特異的なプロテアーゼに暴露することによってペプチドへと断片化される。1つの態様において、試料ペプチドは、トリプシン消化ペプチドであり、関連ペプチド配列セットは、そのタンパク質配列を分析してトリプシン消化ペプチドに相当する関連ペプチド配列を同定することによって、生成される。当業者は、当技術分野で公知のように、タンパク質の配列中のトリプシン消化切断部位を同定することによって容易にトリプシン消化ペプチドを予測することができることを理解しているであろう。1つの態様において、トリプシン消化ペプチドは、トリプシン消化切断ミス(missed cleavage)を0、1、2または3つ有し得る。
1つの態様において、1つまたは複数の翻訳後修飾を含む関連ペプチド配列が同定される。例えば、関連ペプチド配列は、1つまたは複数の翻訳後修飾、例えばN末端環化、脱アミド化、またはメチオニン酸化を含み得る。したがって、関連ペプチド配列セットは、翻訳後修飾の存在に関してのみ異なるペプチドを含み得る。1つの態様において、関連ペプチド配列は、グリコシル化またはリン酸化の点で相違し得る。
さらなる局面において、本開示は、タンデム質量分析装置を制御し該タンデム質量分析装置からデータを受信するためのコンピュータ制御システムを提供する。1つの態様において、このコンピュータ制御システムは、
(a) 該タンデム質量分析装置からデータを受信するための制御・通信モジュールであって、該データが、1つまたは複数の試料ペプチドおよび1つまたは複数の標準ペプチドを含む試料ストリームについて第1の時間間隔内に収集された第1の質量スペクトルセットおよび関連する保持時間を含み、各標準ペプチドのアミノ酸配列および疎水性指標が既知である、制御・通信モジュール;
(b)(i) 第1の質量スペクトルセットと質量スペクトル参照データベースを比較して、同定された試料ペプチド配列セットを形成することによって、試料ストリームに含まれる該1つまたは複数の試料ペプチドのアミノ酸配列を同定するため、および
(ii) 少なくとも1つの同定された試料ペプチド配列について、タンパク質配列参照データベースを検索して、該同定された試料ペプチド配列を含む1つまたは複数のタンパク質配列を同定および抽出するため
の、検索モジュール;ならびに
(c) 該検索モジュールによって同定された該1つまたは複数のタンパク質配列を受信するため、および該1つまたは複数のタンパク質配列を分析して1つまたは複数の関連ペプチド配列を同定することによって関連ペプチド配列セットを生成するための分析モジュールであって、同定された試料ペプチド配列および関連ペプチド配列の両方が該タンパク質配列内に含まれ、かつ、該分析モジュールが、該1つまたは複数の標準ペプチドの保持時間に基づき少なくとも1つの関連ペプチド配列についての予測保持時間を決定するようにさらに動作可能である、分析モジュール
を提供するよう設定された少なくとも1つのプロセッサおよびメモリを含む。
1つの態様において、制御・通信モジュールは、タンデム質量分析装置と通信するように、かつ関連ペプチド配列セット中の少なくとも1つの関連ペプチド配列および予測保持時間に基づきいくつかのイオンを通過させその他のイオンをフィルターで除去するよう該タンデム質量分析装置を設定するようにさらに動作可能である。
1つの態様において、制御・通信モジュールは、タンデム質量分析装置と通信するように、かつ関連ペプチド配列セットに含まれる1つまたは複数の関連ペプチドを2次イオンへの解離のための親イオンとして選択または除外するよう該タンデム質量分析装置を設定するようにさらに動作可能である。1つの態様において、制御・通信モジュールは、質量分析装置の動作パラメータを設定するように動作可能である。
1つの態様において、コンピュータ制御システムは、1つまたは複数の選択基準を受信するように動作可能であるユーザインターフェースをさらに含み、プロセッサは、該ユーザインターフェースで受信した該基準に基づき関連ペプチド配列を関連ペプチド配列セットに含めるよう分析モジュールを設定するようにさらに動作可能である。選択基準の例には、特定の配列的特徴を含むかまたは特定タンパク質もしくはタンパク質ファミリー由来であることが既知であるペプチドを選択する基準が含まれる。選択基準の他の例には、保持時間、親イオン強度、質量(m)および電荷(Z)が含まれる。選択基準には、既知ペプチドの包含または除外(inclusion or exclusion)リストも含まれ得る。
1つの態様において、分析モジュールは、少なくとも1つの関連ペプチド配列についての予測保持時間を、1つまたは複数の標準ペプチドの保持時間および少なくとも1つの関連ペプチド配列の疎水性指標に基づき決定するよう設定される。
1つの態様において、分析モジュールは、少なくとも1つの関連ペプチド配列についての予測保持時間を複数の標準ペプチドについての保持時間に基づき決定するようにさらに動作可能である。
1つの態様において、このシステムは、親イオンを選択するように動作可能である第1の質量分析器、親イオンを解離させて1つまたは複数の2次イオンを生成するように動作可能である衝突セル、2次イオンを選択するように動作可能である第2の質量分析器、および検出器を含む、タンデム質量分析装置を含む。1つの態様において、質量分析装置は、試料ストリーム中の分子をイオン化するためのイオン化源を含む。1つの態様において、検出器は、試料ストリーム中のイオンの量または相対量を検出するように動作可能である。1つの態様において、試料を最初にクロマトグラフィーカラムに投入した時間が記録され、検出器は試料ストリーム中の分子の保持時間を検出するよう設定される。
別の態様において、このシステムはクロマトグラフィーカラムを含み、タンデム質量分析装置はクロマトグラフィーカラムからの1つまたは複数の試料ペプチドを含む試料ストリームを受け取るよう適合されている。1つの態様において、クロマトグラフィーカラムは、逆相HPLCクロマトグラフィーカラムである。
さらなる態様には、本明細書に記載される方法にしたがい、タンデム質量分析データを分析するためおよび/またはタンデム質量分析装置を制御するための指令を含むプログラム可能な媒体が含まれる。
本明細書に記載される態様のさらなる局面および利点は、以下の説明と添付の図面から明らかとなろう。
本開示は図面を参照することでより詳細に説明されるであろう。
本発明の1つの態様にしたがうHPLC-ESI-TOF MS(MS/MS)システムを示す概略図である。 毎分0.375 %のグラジエント下での2時間のHPLC-ESI-TOF試料の全イオン電流スペクトルを示しており、標準ペプチドP2〜P5の溶出により定義される時間領域(R0、R1、R2およびR3)が示されている。 本発明の1つの態様にしたがう準リアルタイムデータ取得の動作ワークフローを示す概略図である。 潜在的なQ14974ペプチドの質量スペクトルを示しており[MELITILEK +2];これは56.9分に溶出すると予測されるものであり;実施例4に記載されるように、59.2分に(低強度の)MSスペクトルが観察された。 実施例5に記載される総細胞溶解産物(WCL)試料中のペプチドの疎水性指標(HI)および保持時間(RT)のプロットを示している。GPUペプチドIDエンジンは、GPMによっては確認されないが合理的なHI対RTの相関を有するペプチド配列を報告し、これによってそれらの同定の妥当性がさらに支持されている。 図5に記載されるWCL試料についてのペプチド検索の結果を示す円グラフであり;GPMまたはMascotの結果と85 %一致しており;11 %はGPM結果なしであり;3 %は潜在的な誤同定である。 質量分析装置を制御し該質量分析装置からデータを受信するためのコンピュータ制御システムの1つの態様を表す配置図である。
発明の詳細な説明:
定義
本明細書において使用される場合、「試料」という用語は、1つまたは複数のペプチドを含むまたは含むと考えられる任意の試料を表す。「試料」という用語には、トリプシン消化ペプチドを生成するようトリプシン処理されたタンパク質を含む試料も含まれる。
本明細書において使用される場合、「試料ストリーム」は、クロマトグラフィーカラムから出てくる試料および溶出物の連続的な流れを表す。
本明細書において使用される場合、「ペプチド」という用語は、2つまたは複数のアミノ酸がペプチド結合によって連結されたものを表し、合成および天然ペプチドならびに修飾されたペプチドが含まれる。
本明細書において使用される場合、「タンパク質」は、自然界で観察されるまたはタンパク質配列参照データベース上で見出される、複数のアミノ酸がペプチド結合によって連結されたものを表す。典型的には、「タンパク質」は、複数の短い「ペプチド」へと断片化され得る。
本明細書において使用される場合、「標準ペプチド」は、そのアミノ酸配列および疎水性指標が既知であるペプチドを表す。標準ペプチドは、クロマトグラフィーカラムの動作特性を実験的に決定するのに使用される。
本明細書において使用される場合、「保持時間」という用語は、試料が最初にクロマトグラフィーカラムに投入されてから、ペプチドが該クロマトグラフィーカラムから溶出した後に検出器により検出されるまでに要する時間を表す。
本明細書において使用される場合、「質量スペクトル参照データベース」は、特定のペプチド配列に関連する質量スペクトルデータを含むデータベースを表す。「タンパク質配列参照データベース」は、複数のタンパク質の配列情報および関連する識別子を含むデータベースを表す。タンパク質配列参照データベースの例には、当技術分野で公知のSwiss-ProtおよびUniProtが含まれる。参照データベースは、インターネットを用いてもしくはコンピュータネットワークを通じてクエリーを入力することによってアクセスされ得るものであるか、またはローカルでの使用のためにコンピュータもしくはコンピュータシステム上に作製またはダウンロードされるものであり得る。
本明細書において使用される場合、「親イオン」または「前駆イオン」は、試料ストリーム中の分子をイオン化することによって生成され、その後に「2次イオン」または「プロダクトイオン」へのフラグメンテーションのために選択されるイオンを表す。
本明細書において使用される場合、「2次イオン」または「プロダクトイオン」は、親イオンの解離を通じて生成されるイオンを表す。1つの態様において、2次イオンは、親イオンの衝突誘起解離(CID)によって、または当技術分野で公知の他のイオン生成方法、例えばマトリックス支援レーザー脱離(MALDI)もしくはエレクトロスプレーイオン化(ESI)によって、生成される。
本明細書において使用される場合、「設定する」または「質量分析装置を設定する」という用語は、イオンのイオン化、選択、解離、または検出を支援するよう質量分析装置の動作パラメータを変更することを表す。例えば、質量分析装置を設定することには、イオンまたは特定の質量電荷(m/Z)比を選択するよう質量分析装置のパラメータを制御することが含まれ得る。
本開示の1つの態様において、試料中のペプチドの配列を同定するために、ペプチドを含む試料ストリームのタンデム質量スペクトルを第1の時間間隔について分析する。試料ストリーム中のペプチドフラグメントの配列は、観察されたタンデム質量スペクトルに基づき、当技術分野で公知の方法、例えばペプチドマスフィンガープリンティングおよび質量スペクトル参照データベース検索により決定される。
1つの態様において、データベース検索を実行して、同定されたペプチドフラグメントの配列を含むタンパク質配列を同定する。その後、得られたタンパク質配列を分析して、すでに同定されているペプチドフラグメントの配列と異なるタンパク質配列中に含まれる任意の関連ペプチドの配列を同定する。例えば、試料ストリームがトリプシン消化ペプチドを含む場合、そのタンパク質配列を分析して、可能性のある任意のさらなるトリプシン消化ペプチドフラグメントの配列を決定することができる。関連ペプチドの多くは、第1の時間間隔内には試料ストリーム中に溶出せず、検出もされていないと考えられ、これは、第2の(後の)時間間隔内に試料ストリーム中に溶出し得る「未来の(future)」予測ペプチドを表す。
1つの態様において、参照データベースは、分類学(taxonomy)または試料のその他の既知の特性、例えば種の同一性に基づき限定される。
1つの態様において、関連ペプチドに関する情報は、第2の時間間隔内に、関連ペプチドイオンのセットを検出するようにまたはフィルターで除去するようにタンデム質量分析装置を設定するのに使用され得る。例えば、関連ペプチドは、タンデム質量分析装置により、2次イオンへの解離のための前駆イオンとして選択または除外され得る。関連ペプチドに関する情報は、タンデム質量分析における強度ベースの親イオン選択と置き換えるまたはそれを補完するのに使用され得る。これにより、関心対象であるがそのほかの点では強度主導式のスペクトル取得モードでは親選択に値しないほど微弱であり得る親イオンの、選択および分析が可能となる。
1つの局面において、関連ペプチド配列についての予測保持時間を決定し、第2の時間間隔におけるタンデム質量分析装置の設定を支援するのに使用する。本明細書に記載されるように、関連ペプチドの予測保持時間は、関連ペプチド配列について算出された疎水性指標(HI)の値および試料ストリームを生成するクロマトグラフィーカラムの動作特性に基づき決定することができる。1つの態様において、クロマトグラフィーカラムの動作特性は、試料を標準ペプチドセットでスパイクし、1つまたは複数の標準ペプチドの保持時間を検出することによって決定される。
1つの局面において、タンデム質量分析装置を制御し、該タンデム質量分析装置からのデータを受信するよう設定されたコンピュータ制御システムが提供される。コンピュータ制御システムの1つの態様は、図7に示されている。図7を参照すると、コンピュータ制御システム(10)は、制御・通信モジュール(15)、検索モジュール(20)、分析モジュール(25)およびユーザインターフェース(30)を含んでいる。制御・通信モジュールは、質量スペクトルおよび保持時間を含むデータを質量分析装置(50)から受信するように動作可能である。検索モジュール(20)は、観察された質量スペクトルを質量スペクトル参照データベース(100)と比較することによって試料ストリームに含まれる1つまたは複数の試料ペプチドのアミノ酸配列を同定して、同定された試料ペプチド配列セットを形成するように動作可能である。検索モジュール(20)は、タンパク質配列参照データベース(100)を検索して、同定された試料ペプチド配列を含む1つまたは複数のタンパク質配列を同定および抽出するように動作可能である。
分析モジュール(25)は、検索モジュール(20)によって同定された1つまたは複数のタンパク質配列を受信するように動作可能である。1つの態様において、分析モジュール(25)は、試料ストリーム中の1つまたは複数の標準ペプチドの保持時間を含むデータを受信するように動作可能である。分析モジュール(20)は、1つまたは複数のタンパク質配列を分析することによって関連ペプチド配列セットを生成して、同定された試料ペプチド配列と異なる、該タンパク質配列中に含まれるペプチド配列を同定するように動作可能である。分析モジュール(25)はまた、1つまたは複数の標準ペプチドの保持時間および関連ペプチド配列の特性、例えば疎水性に基づき少なくとも1つの関連ペプチド配列についての予測保持時間を決定するように動作可能である。任意で、関連ペプチド配列はトリプシン消化ペプチドであり、分析モジュールはタンパク質配列のトリプシン消化により生成されるトリプシン消化ペプチドを予測するよう設定される。
1つの態様において、関連ペプチド配列セットへの包含のために関連ペプチド配列を選択する基準は、ユーザインターフェース(30)を通じてユーザにより指定される。分析モジュール(25)は、1つまたは複数の関連ペプチド配列の疎水性指標および/または保持時間を算出するように動作可能である。任意で、分析モジュールは、1つまたは複数の関連ペプチド配列の質量および/またはエレクトロスプレーイオン電荷状態を算出するように動作可能である。
ユーザは、ユーザインターフェース(30)を通じて参照データベース(100)を検索するための基準またはパラメータを指定することができる。例えば、ユーザは、既知の分類学または試料の種別に基づき検索モジュール(100)により検索するための限定データベースセットを選択することができる。
制御・通信モジュール(15)は、質量分析装置(50)と通信しかつこれを設定するように動作可能である。質量分析装置は、分析モジュール(25)により生成された関連ペプチド配列セットに基づき設定され得る。例えば、制御・通信モジュール(15)は、関連ペプチドセットの少なくとも1つの関連ペプチドに基づき、いくつかのイオンを通過させその他のイオンをフィルターで除去するよう質量分析装置(50)を設定することができる。
1つの態様において、プロダクトイオンへと解離させるための試料ストリーム中の親前駆イオンを選択することによる、タンデム質量分析データの取得のためのシステムおよび方法が提供される。1つの態様において、これは、第1の時間間隔内に収集された質量スペクトルについての限定的なデータベースに対する並列検索を用いるペプチド配列決定と、先に同定されたペプチドに基づく「未来の」関連ペプチドの質量、電荷、および疎水性値の予測ならびに/または予測保持時間との組み合わせによって、達成される。得られたデータは、関心対象のペプチドのリストもしくはセットを形成するために、または第2の時間間隔内に対応する関連ペプチドのイオンを検出もしくは無視するのを支援するようタンデム質量分析装置を設定するために使用することができる。1つの態様において、関心対象のペプチドに関するデータを取得するように質量分析装置を設定するために、関連ペプチドの保持時間が決定されかつ使用される。
1つの態様において、本明細書に記載される方法およびシステムは、並列検索アルゴリズムを用いるペプチドの高速同定を実現するように動作可能である。1つの態様において、本明細書に記載される方法およびシステムは、すべて参照により本明細書に組み入れられるKrokhin et al. Molecular and Cellular Proteomics 2004 Sep;3(9):908-19; Krokhin Anal. Chem., 2006, 78 (22), pp 7785-7795; およびSpicer et al. Anal. Chem., 2007 79 (22), pp 8762-8768に記載されるような、ペプチドのクロマトグラフィー保持時間を正確に予測する方法を使用する。
本開示は、例えば解離用の親イオンの選択を制御するために、第2の時間間隔においてタンデム質量分析装置の動作パラメータを制御可能にするタンデム質量スペクトルデータを、第1の時間間隔内に分析する方法を提供する。出願人は、この作業を1サイクルあたり数秒で実行することができるソフトウェアシステムを設計し、シミュレート試験した。1つの態様において、この分析は、クロマトグラフィー分離全体にわたり等間隔で行われ、その後の時間間隔におけるタンデム質量分析装置の動作パラメータの情報を提供する。1つの態様において、試料は、分析プロセスのトリップポイント(trip point)としての、およびクロマトグラフィーカラムの動作特性を決定するための較正用の2つの役割を担う、標準較正ペプチドでスパイクされる。同定および前方予測分析は、実験実施(典型的には1〜3時間)の間に1回実行され得るか、または2回以上、すなわち4または5回実行され得る。
1つの態様において、本明細書に記載される方法は、その時点で試料ストリーム中に溶出していない関連ペプチドを、試料ストリームのタンデム質量分析時の親イオンとして包含または除外するために同定するのに有用である。
例えば、1つの態様において、本明細書に記載される方法およびシステムは、例えば、メンバータンパク質のペプチド適用範囲が最大であることにより比率スコアリングが強化される、ITRAQ(相対・絶対定量用同重体標識)ベースの定量実験のための親イオンとして、関連ペプチドを選択するために有用である。この方法およびシステムは、強度主導式の取得モードではMS/MSに値しないほど親強度が微弱であり得る翻訳後修飾(PTM)を追跡するのにも有用である(例えば、Schmidt et. al, Molecular & Cellular Proteomics, 2008 7:2138-2150を参照のこと)。1つの態様において、PTMを含む関連ペプチドは、特定のタンパク質またはペプチドについての既知のPTMに関する生化学データに基づき同定される。
別の態様において、本明細書に記載される方法およびシステムは、タンデム質量分析中に関連ペプチドを親イオンとして除外するのに有用である。例えば、一般的な混入物質(例えば、ケラチン)を同定して、その後にケラチン関連ペプチドを親イオンとしての選択から除外す得る。1つの態様において、この方法およびシステムは、非常に豊富に存在するタンパク質、例えば植物におけるRuBisCOならびに哺乳動物由来の血漿におけるアルブミンおよびIgG由来のペプチドを除外するのに使用することができる。次にタンデム質量分析装置の動作パラメータを、それよりも豊富ではないが潜在的により高い関心が持たれる親イオンの選択および検出を可能にするよう制御することができる。
図1は、本明細書に記載される方法を実施するためのシステムの1つの態様を示している。図1を参照すると、トリプシン消化ペプチドと、クロマトグラフィー分離および質量分析特性が十分に特徴決定された標準ペプチドセット(P1〜P6)とを含む試験試料を、逆相クロマトグラフィー(RP-HPLC)カラムに投入する。次に、このカラムから溶出する試料ストリームがエレクトロスプレーイオン化(ESI)によりイオン化され、その後に1次イオンおよび2次イオン両方を生成することができるタンデム質量分析装置に投入される。任意で、タンデム質量分析装置は、質量選択のための第1の質量分析器、選択された親イオンの衝突誘起解離(CID)のためのセル、およびCIDセルにおいて生成された2次イオンを選択および検出するための質量分析器/検出器、を含む。図1に示されるように、質量分析装置は、除外/包含エンジンと通信状態にある機器制御モジュールにより設定され得る。1つの態様において、機器制御モジュールおよび除外/包含エンジンは、タンデム質量分析装置を制御し、該タンデム質量分析装置からデータ受信する、コンピュータ制御システムである。
1つの態様において、機器は、第1の時間間隔内に、質量選択およびCIDセグメントが本質的にすべてのイオンを通過させるMSモードで質量スペクトルを収集する。一定時間後、蓄積されたMSスペクトル中で最も強度の高いイオンが親として選択される。機器はMS/MSモードに切り替わり;質量選択セグメントは、解離させる親イオンを個別に選択し、そしてCIDセグメントの動作パラメータは各親の最適なフラグメンテーションのために設定される。フラグメントスペクトルが収集される。機器は次に、再びMSモードに切り替わる。このモード間の切り替えは自動化することができ、数秒毎に行われる場合がある。
本開示の1つの局面において、この第1の時間間隔内に収集された質量スペクトルを、機器によるデータ取得と同時に分析して、関連ペプチド配列を同定し、かつ第2の時間間隔内のタンデム質量分析装置の動作制御の情報を得ることができる。1つの態様において、分析は、以下の工程を含む:
(1) 経過した第1の時間間隔内に収集された2次イオンスペクトルのペプチド配列を、データベース検索を用いて同定する。観察されたMS/MSフラグメントイオンを、データベースペプチドからの仮定のイオンパターンと比較する。この第1次通過では、典型的には2百万未満のメンバーを含む、分類学上の限定を加えた非重複で切断ミスゼロのトリプシン消化ペプチドの小さな集合が使用される。
(2) 任意で、同定されたペプチド配列の保持時間を予測して、ペプチド配列の同定をさらに確証するために、観察された保持時間と比較する。
(3) 同定されたペプチド配列を用いて、該同定されたペプチド配列を含むタンパク質配列についてタンパク質配列データベースを検索する。次いで、該同定されたペプチド配列と異なるタンパク質配列中に含まれるさらなるペプチドについて該タンパク質配列を分析することにより、関連ペプチド配列を同定する。例えば、試料がトリプシン消化ペプチドを含む場合、関連ペプチド配列は、すでに同定されているペプチド配列と異なるタンパク質配列中のトリプシン消化ペプチドを検出することにより同定される。翻訳後修飾(PTM)を含む関連ペプチド配列もまた、既知のPTMの生化学データまたは特定のペプチドもしくはタンパク質に関連するPTMのデータベースに基づき同定することができる。
(4) 次いで、関連ペプチドの保持時間を、それらの算出された疎水性指標の値に基づき決定する。関連ペプチド配列の疎水性値は、任意で、すべて参照により本明細書に組み入れられるKrokhin et al. Molecular and Cellular Proteomics 2004 Sep;3(9):908-19; Krokhin Anal. Chem., 2006, 78 (22), pp 7785-7795; およびSpicer et al. Anal. Chem., 2007, 79 (22), pp 8762-8768に記載されるSSRCalculatorを用いて算出される。任意で、参照により本明細書に組み入れられるSpicer et al. Predicting Retention Time Shifts Associated with Variation of the Gradient Slope in Peptide RP-HPLC Anal. Chem., 2010, 82 (23), pp 9678-9685に記載されるようなペプチドの線形溶媒強度理論の傾斜値の算出に基づき、実験的HPLCグラジエント傾斜度の変化の影響も、予測保持時間に組み込むことができる。
(5) 任意で、関連ペプチドイオンのエレクトロスプレー電荷状態(Z)および/または質量(m)を、関連ペプチド配列に基づき算出する。
(6) 次いで、関連ペプチド配列セットを生成する。次いで、タンデム質量分析装置の動作パラメータを、第1の時間間隔の後の第2の時間間隔内に該関連ペプチドセットに対応するピークを追跡または無視するよう調節してもよい。機器は、MSモードとMS/MSモードの間の切り替えを続けるが、この追加情報は、第1の時間間隔内に使用された強度ベースの親選択を補うかこれに取って代わるものである。任意で、次の標準ペプチドPnがMSスペクトルにおいて検出された場合、分析が工程(1)に戻される。
1つの態様において、分析は、例えば7個のCPPUコアおよび14個のスレッドに分散されたデータセグメント化並列同定を用いて実施することができる。1つの態様において、分析は、高並列演算群において疎行列ベクトル処理を用いる、連続した一連の単一スペクトル同定により実施することができる。典型的には、このアプローチは、高性能製品レベルのビデオカードに見られる多数のグラフィックプロセッサユニット(GPU)を利用するものである[例えば、Baskaran & Bordawekar, Research Report RC24704, International Business Machines Corp, April 2009を参照のこと]。
本明細書において引用されているすべての刊行物、特許および特許出願は、各個別の刊行物、特許または特許出願の全体が参照により組み入れられることが具体的かつ個別に示されているものとして、それらの全体が参照により組み入れられる。
以下の非限定的な実施例は、本開示を例示するものである。
実施例1:HPLC-MS/MS分析における親ペプチドの除外/包含のためのカスタムペプチドおよびシステム
試料をスパイクして、HPLCカラムの動作特性を決定しかつカラムから溶出していないペプチドの溶出時間を予測するのを支援するために、カスタム標準ペプチドを使用することができる。標準ペプチドP2〜P6は、ギ酸イオン対形成モディファイヤ条件下、以下の疎水性指標(HI;アセトニトリル濃度)値で溶出する。
(表1)試料をスパイクするのに使用した標準ペプチドの特性
Figure 2013531225
ペプチドは、トリプシン消化ペプチドに典型的なACN%値に均一に広がるよう設計した。コンピュータシミュレーションにより、ギ酸溶出条件下、800〜3200ダルトンのペプチド質量範囲において、Swissprot Human配列データベース内のタンパク質の約55%が、P2より前の間隔で溶出する切断ミスゼロのペプチドを少なくとも2つ含み、該タンパク質の約85%が、P3より前の間隔で溶出する切断ミスゼロのペプチドを少なくとも2つ有することが示され、これによりこのアプローチからの潜在的利益が実証されている。
本実験のHPLC成分は、溶出するにつれて、P2〜P6のMSまたはMS/MS検出と分かれて較正され得る。典型的なグラジエント傾斜度である毎分0.375 %において、これらのペプチド間の時間間隔は約13分であり;計算工程は、1サイクルあたり< 5秒を要するか、または潜在的に総取得時間の< 1パーセントを占める。図2は、本明細書に記載される分析によるP2〜P6の溶出時期および対応する経過した時間間隔の例を示している。
HPLCシステムのグラジエント傾斜度が既知の場合、すべてのペプチドのHIと溶出時間の間の較正は、まずは次式に従う。
TP2 = HIP2/(グラジエント傾斜度) + T0 (I)
P3〜P6が溶出するにつれて、それらの保持時間の値を用いてそれらのHI値に対する線形回帰を行い、これによって、より正確な(グラジエント傾斜度)およびT0の値を得ることができる。クロマトグラフィーカラムに特徴的な保持時間および関連する値はまた、当技術分野で公知であり参照により本明細書に組み入れられるSpicer et al. Anal. Chem., 2010, 82 (23), pp 9678-9685に記載されている線形溶媒傾斜理論にしたがい算出され得る。
機器制御ソフトウェアは、MS/MSスペクトルをMascot Generic Format(MGF)の文書ファイルで報告する[D.N. Perkins, D.J.C. Pappin, D.M. Creasy, J.S. Cotterell, Electrophoresis 1999, 20(18) 3551-3567]。このファイルは、典型的には単位時間セグメントあたり5〜10メガバイトである。時間領域R0では、機器は、除外/包含リストを有しておらず;そのMS/MS親選択は、MSイオン強度のみに基づいている。時間領域R1〜R4は、それよりも前の時間領域または間隔で行われるペプチド同定からの利益を享受するであろう。
MGFファイルは、ネットワーク接続を通じて除外/包含エンジンコンピュータに転送される。CPU対応版のコードにおいて、削減プログラムは、利用可能なプロセッサ数に基づき、このファイルをN個の等サイズのセグメントに分割する(このモデルではN=14)。これはまた、各MS/MSスペクトルエントリ中のフラグメントイオン数を、このレベルの同定に十分な、上位50個の高強度のメンバーに削減する。図3は、MGF形式のMS/MSスペクトルデータの入力および入力スペクトルと非重複(NR)ペプチドデータベースとの比較に基づき予測トリプシン消化ペプチドの「発見予告(pre found)」リストの出力を示す動作フローチャートを提供する。
複数のCPUを含むシステムでは、N個の検索エンジンの各々が、以下で概説される工程を実行する。逆に、単一のCPUを含む(任意で、複数のGPUを有する)システムは、最新のMGFファイル全体に対して以下の工程を実施する。
第1に、システムは、共通のNRペプチドデータベースをメモリにロードし、ペプチド質量の整数値に基づきリスト位置のインデックスを作製する。各データベースエントリは、ペプチドのモノアイソトピック+水素の質量、ソースタンパク質のアクセッション番号およびペプチド配列を含む。このNRデータベースは、実験実施前に生成される。この実験で使用したデータベースは、Swissprot HumanおよびSwissprot Mammalsデータベースの連結から得た。この工程は、試料中の物質の予備知識から分類学の点で利益を得るが、これは典型的にはほとんどの試料について知られている。
第2に、以下の工程をループで実行する:
(i) 最新のMS/MSスペクトルのMGFエントリをロードする。
(ii) 観察された親の質量/電荷と仮定のペプチド質量の間の質量許容値(mass tolerance)(本発明者らの場合は40 PPM)に基づき、潜在ペプチドのリストを構築する。
(iii) 各潜在ペプチド配列について、参照により本明細書に組み入れられるD. Fenyo, R.C. Beavis, Analytical Chemistry 2003 75(4) 768-74に記載されるX!tandemハイパースコアリングアルゴリズムに基づくコンセプトを用い、最新のMS/MSスペクトルにおけるbおよびyイオン(+1および+2の両方)の存在についてスコアリングする。
(iv) 最高スコアの潜在ペプチド配列について、その他のすべての候補との距離を評価し、期待値を割り当てる。この期待値がプリセットのカットオフを下回る場合、最高スコアのペプチド配列をこの質量スペクトルに割り当てる。
システムは、そのファイルの末尾に至るまで、MGFスペクトルエントリのロードおよび同定を継続する。
この検索で同定された全ペプチド配列を次に、それらのHI値を算出するSequence-Specific Retention Calculator(SSRCalc)アルゴリズムに投入する(参照により本明細書に組み入れられるSpicer et al. Anal Chem. 2007 Nov 15;79(22):8762-8;およびKrokhin Anal Chem. 2006 Nov 15;78(22):7785-95を参照のこと)。これはCPUコアにおいて並列で実行され(典型的には2〜16スレッド)、これらの複数の計算の結果は単一ファイルにまとめられる。観察された保持時間が想定の保持時間Tpep = HIpep/(グラジエント傾斜度) + T0から有意に外れているペプチドを、その後の使用から除外し;残りを、以下に示されるような実験の総合ペプチドリストに追加する。
次に、総合ペプチドリストを、メモリにロードする。U個の同定されたペプチド(この実施例では、U >= 2)を含む任意のタンパク質が、試料中に潜在的に存在しているとみなされる。タンパク質の配列を抽出し、インシリコトリプシン消化を実施する(切断ミス1つ)。得られた仮定の関連ペプチドはまた、翻訳後修飾、例えば、N末端環化、脱アミド化、およびメチオニン酸化に供されてもよい。次に、仮定のトリプシン消化ペプチドリストを、N個の等サイズのエントリに分割して;それらのペプチドのHI値を、再度SSRCalcを用いて、N個の処理スレッドにわたり並列で算出する。これらの結果を、再度単一ファイルに集める。
次に、各関連ペプチドにおいて最も可能性のあるエレクトロスプレーイオン電荷状態(Z)が、塩基性アミノ酸(K、RおよびH)の数を合計することにより算出され;そのm/Z値が、予測溶出時間と共にデータ取得ソフトウェアにより使用され、親イオンが選択され得る。
次に、その後のCID用のMS/MS親候補を選択または除外するのに使用するために、TPnより保持時間の長いエントリのペプチドイオンパラメータ(m、Z、保持時間、タンパク質および配列)を、取得コンピュータに戻す。
総合ペプチドリストのサイズは、後続のサイクルを通じて肥大化するため、検索で同定された各ペプチドおよび仮定のトリプシン消化ペプチドのHI値の算出が、潜在的な処理のボトルネックとなる。切断ミス1つのペプチドをインシリコ生成するためのコードにより、毎秒750個超のタンパク質配列を処理することができ;必要な場合、アルゴリズムのこの部分も並列化され得る。
実施例2:8つのトリプシン消化ペプチドの混合物の分析
以下の8つのトリプシン消化したヒトタンパク質の比較的単純な混合物を、実施例1に記載のシステムおよび方法を用いて分析した:SwissProtタンパク質データベースアクセッション番号P02788(ラクトトランスフェリン)、P02787(セロトランスフェリン)、P02768(血清アルブミン)、P00739(ハプトグロビン関連タンパク質)、P02671(フィブリノゲンα)、P02675(フィブリノゲンβ)、P02679(フィブリノゲンγ)およびP02751(フィブリノネクチン)。
この実験から得られたMGFファイルは、1291個のMS/MSスペクトルを含んでおり、これは、スコアリング閾値EV < 0のGPMにより、355個の非修飾で切断ミス1つのペプチドの同定をもたらした。GPMとは、R. Graig, J.P. Cortens, R.C. Beavis, Journal of Proteome Research, 2004 3(6) 1234-1242に記載された、タンデム(MS/MS)質量スペクトルをペプチド配列のデータベースに照合してタンパク質の同定および検証を可能にするソフトウェアツール一式である。
30分弱で、ペプチドP2が溶出した。次に、ペプチドP2溶出までに得られた、それを含むMGFエントリを、除外/包含エンジンに供した。
間隔R0内の146個のMS/MSスペクトルから、データベース検索によって21個の信頼性の高いペプチド配列が得られ、表2に示されているように、これらは2つまたはそれ以上のメンバーペプチドを基準にして8つの既知の試料タンパク質のうちの6つに属するものであった。システムは次いで、これらのタンパク質に属する642個の潜在的な未来のペプチドを予測した:これらの潜在ペプチドのうちの215個は、実際に、強度ベースの親選択において機器により追跡されていたものであった。この作業のCPU版は約2秒を要し、GPU版は、デュアルコアAMDベースのシステムにおいて、約1秒を要した。
これと同じ試料の実験を、時間領域R0において収集したデータに基づき、準リアルタイム取得モードを用いて実行した場合、機器は、
A)強度ベースの取得においてCIDに供するには強度が低すぎる親を用いて追加の427個のペプチドを追跡する(642個の予測ペプチド - 215個が実際に追跡された)ことによってタンパク質適用範囲を最大にすることができたか;
または
B)その時点でこれらのタンパク質に属することが予め分かっていた、強度ベースの取得により選択された少なくとも215個の親ピークを除外でき、これにより、215個のより関心対象となるペプチドを機器が追跡する時間を確保できたであろう。
さらに、このシステムはまた、これらの2つの両極端の間の任意の組み合わせを、実験開始前に制御システムに実装された選択基準により決定して実行するよう設定することもできた。次にR1で同定されるペプチド(それ自体がR0の同定に基づく)は、その後、R2で収集されるMS/MSスペクトルの選択に適用されること等に注目されたい。
(表2)2つまたはそれ以上のメンバーペプチドに基づき間隔R0[T = 20 ... 30分]の溶出で見出された8種の混合試料のタンパク質のデータ
Figure 2013531225
実施例3:ヒト総細胞溶解産物の分析
実施例1に記載されるコンピュータによる親イオンの除外/包含を用いる分析に非定型的な複合的試料を提供するため、ヒト総細胞溶解産物(WCL)の試料を分析した。この分析は、2086個のMS/MSスペクトルを含むMGFファイルを用いて行い、そのうちの1055個についてGPM検索(Global Proteome Machine Organizationデータベース;http://www.thegpm.org)からペプチドを得た。
時間領域R0において除外/包含ソフトウェアにより同定された94個のペプチドのうち、表3に示されているように、それらの23個から、11個の未来のタンパク質(各々2つまたはそれ以上のペプチド)を得た。機器は、得られた潜在ペプチドのうち、強度ベースの取得においてこれら557個のうちの74個を追跡した。この数は、試料の複雑さのため;機器が他のタンパク質由来の高強度イオンを追跡したため、実施例2の数から大きく減少している(557個のうちの74個 対 642個のうちの215個)。
R0同定から想定された11個のタンパク質がGPM結果に示された。GPMにより322個のタンパク質が同定され、そのうちの206個が2つまたはそれ以上のペプチドを含むものであった。
WCLの除外/包含分析により、R0以降に74個のペプチドが除外されるか、または、強度ベースの取得のもとで追跡するには親強度が低すぎる483個の追加のペプチドを機器が追跡することが可能になる。このシステムはまた、これらの2つの両極端の間の任意の状況でCIDのための親選択を実行するよう設定され得る。
(表3)2つまたはそれ以上のメンバーペプチドに基づき間隔R0の溶出で見出された総細胞溶解産物(WCL)試料のタンパク質のデータ
Figure 2013531225
実施例4:質量および保持時間に基づく包含の評価
実施例3のWCL MSスペクトルを、予測質量、電荷および保持時間に基づき潜在的なペプチドピークを探索するさらなるソフトウェアを用いて試験した。シグナル・ノイズ比5、質量許容値40 PPM、および保持時間差+-4分の下で、この検索は、557個の可能性のあるエントリの集合から120個のペプチドピークを同定した(図4に一例が示されている)。この結果、強度ベースの取得と比較して、間隔R0溶出以降で利用可能な可能性のあるペプチドが46個増加した。これらのピークに関するMS/MSの確認はこの時点では行っていないので、これらのペプチドの正体は、想定されたものではない可能性がある。
MSスペクトルにおける前方予測ピークの存在はおそらく想定されたもののうち約20 %であるが、この包含アプローチは、複合的な試料を知的な方法でより深く洞察しかつペプチド適用範囲を改善する可能性を有することが、これにより示唆される。
しかし、これらのピークの多くは強度が低いことから(平均で、強度ベースの方法により選択されたものの強度の約半分である)、これらが合理的な取得時間内に有用なMS/MSスペクトルをもたらすことができるかどうかを確認するため、さらに研究する必要がある。
実施例5:ペプチド同定アルゴリズムの性能
WCL試料に関して、溶出時間55分未満(R3の最後)の838個のペプチドを同定した。4サイクルの同定・予測計算を実行するのに要した合計時間はCPU版で約17秒、GPU版を用いて約10秒であった。
GPMは947個のペプチドを同定し;これらのうちの763個は本発明者らの結果と一致している(約80%重複)。潜在的な偽陽性(GPMが同定しなかったペプチド)のうち、9つを除くすべてがそれらのタンパク質内のシングレットである。9つのペプチドは、表4に示されるような4つの偽予測タンパク質を生成する可能性がある。これらの配列のHI-RTプロットは図5のように線形の性質を示したことから、この結果をもたらしたと考えられる根本的メカニズムを調査した。
これらのペプチドの割り当ては、GPMがペプチド配列を割り当てなかったMS/MSスペクトルに由来するものであり、このことは、簡易スコアリングアルゴリズムが、GPMよりもペプチド同定に熟達していないだけでなく、GPMが却下するスペクトルに対してもペプチドを割り当てていることを示している。これらのスペクトルをMascotのMS/MS同定ツール[D.N. Perkins, D.J.C. Pappin, D.M. Creasy, J.S. Cotterell, Electrophoresis 1999, 20(18) 3551-3567]に供し、それによって9つのペプチド配列を確認した。次に、75個の不一致のMS/MSエントリを供すると、Mascotは、図6に示されるように、本発明者らのアルゴリズムにより提案された75個の配列のうちの44個を確認した。これらの観察は、このペプチド同定アルゴリズムが、複合的な試料を扱うのに十分な堅牢さを有していることを示している。
(表4)総細胞溶解産物(WCL)試料から、GPMの結果には見られないペプチドが同定され、これは、4つの偽予測タンパク質を示唆している。これらのペプチドは、後にMascot MS/MSスペクトル分析ソフトウェアを用いて確認した。
Figure 2013531225
上記の詳細な説明には多くの例示の態様が含まれているが、当業者には目下、多くの改変物、置換物、変更物および等価物が想起されるであろう。したがって添付の特許請求の範囲は、そのような改変物および変更物のすべてを網羅することが意図されていると理解されるべきである。
すべての刊行物、特許および特許出願は、各個別の刊行物、特許または特許出願の全体が参照により組み入れられることが具体的かつ個別に示されているものとして、それらの全体が参照により本明細書に組み入れられる。

Claims (23)

  1. クロマトグラフィーおよびタンデム質量分析を用いて試料を分析する方法であって、
    (a) 1つまたは複数の試料ペプチドを含む試料を提供する工程、
    (b) 1つまたは複数の標準ペプチドを該試料に添加して試験試料を形成する工程であって、各標準ペプチドのアミノ酸配列および疎水性指標が既知である、工程、
    (c) 該試験試料をクロマトグラフィーカラムに投入し、該クロマトグラフィーカラムからタンデム質量分析装置へと試験試料ストリームを溶出させる工程、
    (d) 第1の時間間隔内の試験試料ストリームに含まれる複数のペプチドについての第1の時間間隔の質量スペクトルおよび関連する保持時間を取得する工程であって、第1の時間間隔内の試験試料ストリームが少なくとも1つの標準ペプチドを含む、工程、
    (e) 第1の時間間隔の質量スペクトルと質量スペクトル参照データベースを比較して、第1の時間間隔内の試料ストリームに含まれる試料ペプチドに基づき同定された試料ペプチド配列セットを形成する工程、
    (f) 少なくとも1つの同定された試料ペプチド配列について、タンパク質配列参照データベースを検索して、該同定された試料ペプチド配列を含む1つまたは複数のタンパク質配列を同定および抽出する工程、
    (g) 工程(f)で抽出された1つまたは複数のタンパク質配列を分析することにより関連ペプチド配列セットを生成して、1つまたは複数の関連ペプチド配列を同定する工程であって、該同定された試料ペプチド配列と該関連ペプチド配列とは異なっておりかつ両方が該タンパク質配列内に含まれる、工程、
    (h) 工程(d)で取得された1つまたは複数の標準ペプチドの保持時間に基づき、少なくとも1つの関連ペプチド配列についての予測保持時間を決定する工程、ならびに
    (i) 該関連ペプチド配列セット中の該少なくとも1つの関連ペプチド配列および工程(h)で決定された予測保持時間に基づき、いくつかのイオンを通過させその他のイオンをフィルターで除去するよう該タンデム質量分析装置を設定することによって、第2の時間間隔内の試験試料ストリームについての第2の時間間隔の質量スペクトルおよび関連する保持時間を取得する工程
    を含む、方法。
  2. 前記質量分析装置が、質量分析器および検出器を含み、かつ工程(i)が、前記少なくとも1つの関連ペプチド配列のイオンまたは2次イオンを該検出器へと通過させるよう該質量分析器を設定する工程をさらに含む、請求項1記載の方法。
  3. 前記質量分析装置が、質量分析器および検出器を含み、かつ工程(i)が、前記少なくとも1つの関連ペプチド配列のイオンまたは2次イオンが該検出器へと通過するのを妨害するよう該質量分析器を設定する工程をさらに含む、請求項1記載の方法。
  4. 工程(i)が、前記関連ペプチド配列セットに含まれる関連ペプチド配列を、2次イオンへの解離のための親イオンとして選択または除外することを含む、請求項1記載の方法。
  5. 前記試験試料を形成するために複数の標準ペプチドが前記試料に添加され、かつ前記少なくとも1つの関連ペプチド配列についての予測保持時間が工程(d)で取得された複数の標準ペプチドについての複数の保持時間に基づき決定される、請求項1記載の方法。
  6. 工程(h)が、前記少なくとも1つの関連ペプチド配列についての疎水性指標(HI)を算出することを含み、かつ該少なくとも1つの関連ペプチド配列についての保持時間が、該関連ペプチド配列の疎水性指標ならびに前記1つまたは複数の標準ペプチドの保持時間および疎水性指標に基づき算出される、請求項1記載の方法。
  7. 各関連ペプチド配列についての疎水性指標が、SSRCalcを用いて算出される、請求項6記載の方法。
  8. 前記保持時間が、式
    TP = HIP/ (グラジエント傾斜度) + T0
    にしたがって算出され、式中、TPは前記関連ペプチド配列の保持時間であり、HIPは該関連ペプチド配列の疎水性指標であり、T0は前記1つまたは複数の標準ペプチドの観察された保持時間に基づいて算出される、請求項6記載の方法。
  9. 工程(h)で決定された1つまたは複数の関連ペプチド配列の各々について質量(m)および/またはエレクトロスプレーイオン電荷状態(Z)を算出する工程をさらに含み、工程(i)は、前記関連ペプチド配列セット中の少なくとも1つの関連ペプチド配列の質量および/またはエレクトロスプレー電荷状態に基づきいくつかのイオンを通過させその他のイオンをフィルターで除去するよう前記タンデム質量分析装置を設定することをさらに含む、請求項1記載の方法。
  10. 各関連ペプチド配列のエレクトロスプレーイオン電荷状態(Z)が、該関連ペプチド配列の塩基性アミノ酸の数を合計することによって算出される、請求項9記載の方法。
  11. 前記塩基性アミノ酸が、リジン、アルギニンおよびヒスチジンである、請求項10記載の方法。
  12. 第1の時間間隔内に、2次イオンへの解離のための親イオンを該親イオンの観察された強度に基づき選択することによって、質量スペクトルが取得される、請求項1記載の方法。
  13. 前記試料ペプチドがトリプシン消化ペプチドであり、かつ工程(g)が、前記タンパク質配列を分析して、トリプシン消化ペプチドに相当する関連ペプチド配列を同定することを含む、請求項1記載の方法。
  14. 前記トリプシン消化ペプチドが、トリプシン消化切断ミスを0、1、2または3つ有する、請求項13記載の方法。
  15. 工程(g)が、1つまたは複数の翻訳後修飾を含む関連ペプチド配列を同定することをさらに含む、請求項1記載の方法。
  16. 前記1つまたは複数の翻訳後修飾が、N末端環化、脱アミド化、またはメチオニン酸化を含む、請求項15記載の方法。
  17. 前記標準ペプチドが、LGGGGGGDFR、LLGGGGDFR、LLLGGDFR、LLLLDFR、およびLLLLLDFRからなる群より選択される1つまたは複数のペプチドを含む、請求項1記載の方法。
  18. タンデム質量分析装置を制御し該タンデム質量分析装置からデータを受信するためのコンピュータ制御システムであって、
    (a) 該タンデム質量分析装置からデータを受信するための制御・通信モジュールであって、該データが、1つまたは複数の試料ペプチドおよび1つまたは複数の標準ペプチドを含む試料ストリームについて第1の時間間隔内に収集された第1の質量スペクトルセットおよび関連する保持時間を含み、各標準ペプチドのアミノ酸配列および疎水性指標が既知である、制御・通信モジュール;
    (b)(i) 第1の質量スペクトルセットと質量スペクトル参照データベースを比較して、同定された試料ペプチド配列セットを形成することによって、試料ストリームに含まれる該1つまたは複数の試料ペプチドのアミノ酸配列を同定するため、および
    (ii) 少なくとも1つの同定された試料ペプチド配列について、タンパク質配列参照データベースを検索して、該同定された試料ペプチド配列を含む1つまたは複数のタンパク質配列を同定および抽出するため
    の、検索モジュール;
    (c) 該検索モジュールによって同定された該1つまたは複数のタンパク質配列を受信するため、および該1つまたは複数のタンパク質配列を分析して1つまたは複数の関連ペプチド配列を同定することによって関連ペプチド配列セットを生成するための分析モジュールであって、同定された試料ペプチド配列および関連ペプチド配列の両方が該タンパク質配列内に含まれ、かつ、該分析モジュールが、該1つまたは複数の標準ペプチドの保持時間に基づき少なくとも1つの関連ペプチド配列についての予測保持時間を決定するようにさらに動作可能である、分析モジュール
    を提供するよう設定された少なくとも1つのプロセッサおよびメモリを含み、
    該制御・通信モジュールが、該タンデム質量分析装置と通信するように、かつ該関連ペプチド配列セット中の少なくとも1つの関連ペプチド配列および該予測保持時間に基づきいくつかのイオンを通過させその他のイオンをフィルターで除去するよう該タンデム質量分析装置を設定するようにさらに動作可能である、
    コンピュータ制御システム。
  19. 前記制御・通信モジュールが、前記タンデム質量分析装置と通信するように、かつ前記関連ペプチド配列セットに含まれる1つまたは複数の関連ペプチドを2次イオンへの解離のための親イオンとして選択または除外するよう該タンデム質量分析装置を設定するようにさらに動作可能である、請求項18記載のシステム。
  20. 前記コンピュータ制御システムが、1つまたは複数の選択基準を受信するように動作可能であるユーザインターフェースをさらに含み、前記プロセッサが、該ユーザインターフェースで受信した該基準に基づき関連ペプチド配列を関連ペプチド配列セットに含めるよう前記分析モジュールを設定するようにさらに動作可能である、請求項18記載のシステム。
  21. 前記分析モジュールが、少なくとも1つの関連ペプチド配列についての前記予測保持時間を複数の標準ペプチドについての保持時間に基づき決定するようにさらに動作可能である、請求項18記載のシステム。
  22. 親イオンを選択するように動作可能である第1の質量分析器、親イオンを解離させて1つまたは複数の2次イオンを生成するように動作可能である衝突セル、2次イオンを選択するように動作可能である第2の質量分析器、および検出器を含むタンデム質量分析装置をさらに含む、請求項18記載のシステム。
  23. クロマトグラフィーカラムをさらに含み、前記タンデム質量分析装置が、該クロマトグラフィーカラムからの1つまたは複数の試料ペプチドを含む前記試料ストリームを受け取るよう適合されている、請求項22記載のシステム。
JP2013510458A 2010-05-20 2011-05-20 タンデム質量分析を用いるペプチド試料ストリームの分析のための方法およびシステム Withdrawn JP2013531225A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US34667810P 2010-05-20 2010-05-20
US61/346,678 2010-05-20
PCT/CA2011/000586 WO2011143760A1 (en) 2010-05-20 2011-05-20 Methods and systems for analysis of peptide sample streams using tandem mass spectroscopy

Publications (1)

Publication Number Publication Date
JP2013531225A true JP2013531225A (ja) 2013-08-01

Family

ID=44991130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013510458A Withdrawn JP2013531225A (ja) 2010-05-20 2011-05-20 タンデム質量分析を用いるペプチド試料ストリームの分析のための方法およびシステム

Country Status (5)

Country Link
US (1) US20130090862A1 (ja)
EP (1) EP2572191A1 (ja)
JP (1) JP2013531225A (ja)
CA (1) CA2799571A1 (ja)
WO (1) WO2011143760A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019196989A (ja) * 2018-05-10 2019-11-14 株式会社島津製作所 分析方法、処理装置、分析装置およびプログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2596369A4 (en) * 2010-07-22 2014-01-22 Univ Georgetown MASS SPECTROMETRY METHODS FOR QUANTIFICATION OF NPY 1-36 AND NPY 3-36
US9720001B2 (en) * 2014-05-21 2017-08-01 Thermo Finnigan Llc Methods for mass spectrometric biopolymer analysis using optimized weighted oligomer scheduling
WO2016145331A1 (en) * 2015-03-12 2016-09-15 Thermo Finnigan Llc Methods for data-dependent mass spectrometry of mixed biomolecular analytes
CN106248844B (zh) * 2016-10-25 2018-05-04 中国科学院计算技术研究所 一种肽段液相色谱保留时间预测方法及系统
US10429364B2 (en) * 2017-01-31 2019-10-01 Thermo Finnigan Llc Detecting low level LCMS components by chromatographic reconstruction
US9905405B1 (en) 2017-02-13 2018-02-27 Thermo Finnigan Llc Method of generating an inclusion list for targeted mass spectrometric analysis

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019196989A (ja) * 2018-05-10 2019-11-14 株式会社島津製作所 分析方法、処理装置、分析装置およびプログラム
JP7205077B2 (ja) 2018-05-10 2023-01-17 株式会社島津製作所 分析方法、処理装置、分析装置およびプログラム

Also Published As

Publication number Publication date
CA2799571A1 (en) 2011-11-24
WO2011143760A1 (en) 2011-11-24
EP2572191A1 (en) 2013-03-27
US20130090862A1 (en) 2013-04-11

Similar Documents

Publication Publication Date Title
JP4932834B2 (ja) 保持時間整合を行うための方法および装置
JP5011283B2 (ja) 化学分析のためのポリペプチド関連情報のカタログの発生および使用
JP4988884B2 (ja) 質量分析システム
JP5199101B2 (ja) 生体分子の検定を開発するための方法
JP2013531225A (ja) タンデム質量分析を用いるペプチド試料ストリームの分析のための方法およびシステム
US9435778B2 (en) Methods and systems for experimental set-up and data analysis in targeted proteomics applications
JP2005091344A (ja) 質量分析システム
EP2279260A1 (en) Techniques for performing retention-time matching of precursor and product ions and for constructing precursor and product ion spectra
RU2768497C2 (ru) Способы определения абсолютного количества полипептидов, присутствующих в небольшом количестве, с применением масс-спектрометрии
Wu et al. An integrated top-down and bottom-up strategy for characterization of protein isoforms and modifications
Addona et al. De novo peptide sequencing via manual interpretation of MS/MS spectra
JP2009168695A (ja) 立体構造予測方法,立体構造予測プログラム及び質量分析装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140805