JP6020315B2 - 質量分析データ処理方法及び質量分析データ処理装置 - Google Patents

質量分析データ処理方法及び質量分析データ処理装置 Download PDF

Info

Publication number
JP6020315B2
JP6020315B2 JP2013078841A JP2013078841A JP6020315B2 JP 6020315 B2 JP6020315 B2 JP 6020315B2 JP 2013078841 A JP2013078841 A JP 2013078841A JP 2013078841 A JP2013078841 A JP 2013078841A JP 6020315 B2 JP6020315 B2 JP 6020315B2
Authority
JP
Japan
Prior art keywords
peak
mass
peaks
data processing
mass spectrometry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013078841A
Other languages
English (en)
Other versions
JP2013231715A5 (ja
JP2013231715A (ja
Inventor
ジンウェン ヤオ
ジンウェン ヤオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Publication of JP2013231715A publication Critical patent/JP2013231715A/ja
Publication of JP2013231715A5 publication Critical patent/JP2013231715A5/ja
Application granted granted Critical
Publication of JP6020315B2 publication Critical patent/JP6020315B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Description

本発明は、質量分析により得られたデータを処理する質量分析データ処理方法及び質量分析データ処理装置に関する。
飛行時間型質量分析装置などの質量分析装置では、様々な化合物由来のイオンが質量電荷比m/zに応じて分離された上で検出され、それによって得られるプロファイルスペクトルデータに基づいて、横軸に質量電荷比m/z、縦軸に信号強度をとったマススペクトルが作成される。
なお、本明細書では、質量分析装置により収集されセントロイド処理がなされていない生のデータを「プロファイルスペクトルデータ」と呼び、このデータに基づいて作成されたセントロイド処理がなされる前のいわゆるプロファイルスペクトルを「マススペクトル」と呼ぶこととする。したがって、マススペクトル上において各ピークは質量電荷比軸に沿った方向に山状に現れる。また、マススペクトルは、通常の質量分析(MS1分析)により得られるMS1スペクトルと後述するMSn分析(ここでnは2以上の整数)により得られるMSnスペクトルの両方を含むものとする。
多くの場合、質量分析装置がもつ質量分解能が或る程度以上のレベルであると、或る一つの化合物由来のイオンはマススペクトル上で、同位体ピーククラスタ、つまり元素組成が同一であってイオン中の同位体組成の相違によって異なる質量電荷比を示す複数本のピークからなる一連のピーク群、として観測される(例えば非特許文献1参照)。逆に、マススペクトル上に同位体ピーククラスタであると推定される一連のピーク群が存在すれば、その化合物には同位体元素が含まれると推測することができる。
図1(a)及び(b)は、それぞれ或るペプチド由来のイオンについて実測により得られたマススペクトルの例である。図1(a)及び(b)に示したマススペクトル上で観測される複数のピークは同定対象である目的化合物由来のイオンの同位体分布を表している。これら図から分かるように、質量分解能が十分に高ければ、同位体ピーククラスタに属する複数のピークは規則的な質量電荷比間隔で以て分離される(例えば非特許文献2参照)。質量電荷比軸方向に隣接するピークの間隔は図1(b)の例では約1Daであり、図1(a)の例では約0.3Daである。隣接ピークの質量電荷比差は質量差を価数で除したものであるから、図1(a)の例では目的化合物由来のイオンの価数は+3であり、図1(b)の例では目的化合物由来のイオンの価数は+1、つまり単電荷であると推定することができる。
一般に、上記のようにマススペクトル上で或る化合物に由来する同位体ピーククラスタが見つかれば、各元素の主同位体のみから構成されるモノアイソトピックイオン(Mono-Isotopic Ion)を特定し、そのイオンの質量電荷比から目的化合物の精密な質量(モノアイソトピック質量)を求めることができる。また、それだけでなく、生成されたイオンの荷電状態を判定することも容易に行える(例えば非特許文献3参照)。
近年、未知のタンパク質やペプチドを同定する、つまりアミノ酸配列を推定するために、質量分析、特にイオンに対する衝突誘起解離(CID=Collision-Induced Dissociation)を伴う質量分析、つまりはMSn分析が広く利用されるようになっている。MSn分析を用いたペプチド同定においては、元のペプチドから生成された分子イオンやこれに由来する複数のプロダクトイオンの質量電荷比及び信号強度の情報が収集され、同定のための解析処理に供される。このとき、マススペクトル上で観測されるイオンピークの質量電荷比値が同定のための特に重要な手掛かりとなる。そのため、通常、イオンピークの質量電荷比値の精度が高いほど、同定の信頼性も結果的に高くなる。
マススペクトル上においてイオンピークの質量電荷比値を正確に求めるためには、マススペクトルからピークを検出する過程で、ノイズピーク等を除去して真にイオン由来であるピークを最大限に見出すのみならず、見出されたピークの中で同位体ピーククラスタをできるだけ正確に識別し、モノアイソトピックイオンピークを特定することが重要である。何故なら、多くの場合、モノアイソトピックイオンは目的化合物つまりタンパク質又はペプチドの質量やそれらの解離により生じた断片(プロダクトイオン)の質量を正確に表すからである。しかしながら、タンパク質やペプチドなど、分子量が大きな化合物の場合、分子量が小さな化合物と比較して、同位体ピーククラスタやモノアイソトピックイオンピークの特定はかなり困難である。その理由は次の通りである。
一般に、質量が小さい化合物の場合、モノアイソトピックイオンピークは、同位体ピーククラスタに属する複数のイオンピークの信号強度の変化を示す同位体分布包絡線(カーブ)の中で質量電荷比が最小である第1ピークであって、最大の信号強度値を示す。化合物の質量が増えるに伴い、同位体分布中の他の同位体ピークに対するモノアイソトピックイオンピークの信号強度の比率は低くなり、化合物の質量が十分に大きくなると、モノアイソトピックイオンピークの信号強度はマススペクトル上で観測できない程度にまで低くなってしまう。タンパク質の分子量は通常、かなり大きいため、タンパク質を測定対象とした場合、マススペクトル上でモノアイソトピックイオンピークが観測できないという現象はしばしばみられる。このようにモノアイソトピックイオンピークが観測できない場合には、通常、同位体分布から計算される質量平均値がモノアイソトピック質量の代わりに使用されるが、その精度が低下することは避けられない。
一方、目的化合物についての理論同位体分布が判明すれば、これに基づく計算により、モノアイソトピック質量を提示可能なピークの位置についての情報や、同位体分布包絡線内の複数のピークの信号強度の関係についての情報を得ることが可能である。これによれば、上述のような理由でモノアイソトピックイオンピークが実際上殆ど観測されないような場合であっても、モノアイソトピック質量を求めることができる。
或る化合物に対する同位体ピーククラスタに属するイオンピークの理論同位体分布は、その化合物の化学式(元素組成)が判明していれば、該化合物に含まれる元素についての既知の天然存在比を利用して計算することが可能である。例えば、ペプチドはアミノ酸から構成されるので、その構成元素は主として、炭素C、水素H、窒素N、酸素O、及び硫黄Sである。ペプチドの質量電荷比が1552.7Daであり、化学式がC6710918021Sである場合、そのイオンピークの同位体分布を質量分解能5000の条件の下で計算すると、その結果は図2に示すようになる。ここで計算されたイオンピークの同位体分布は、図1(b)に示した実測マススペクトル上で観測される各イオンピークの質量電荷比に対応するものである。
ただし、或る化合物の理論同位体分布を求めるためには、その化合物を構成する各元素の正確な個数の情報が必要である。一般に或る化合物のマススペクトルを取得しても、該マススペクトル上で検出されたイオンの質量電荷比が判明するだけであって、そのイオンの元素組成が判明するわけではない。また、多くの場合、同定しようとする化合物の元素組成は未知であり、それこそが、マススペクトルを解析することによって求めたい情報の一つにほかならない。
上述したように、モノアイソトピックイオンピークを用いて目的化合物の質量を正確に求める上で重要なプロセスの一つは、所与の質量分解能の下での目的化合物の理論同位体分布をできるだけ正確に求めることである。そのためにはその化合物の元素組成の情報が必要であるものの、通常、その情報は与えられていない。
これに対し、従来、「THRASH」と呼ばれるソフトウェアプログラムにおいて、タンパク質データベースにおけるアミノ酸の統計解析に基づく「アベラジン(Averagine)」モデル(非特許文献4参照)により求められた平均的な元素組成を利用して理論同位体分布を求め、これにマススペクトル上で観測された同位体ピーククラスタをフィッティングする試みがなされている。上記文献では、この方法により、高質量分解能であるマススペクトル上で高質量のタンパク質やペプチドに由来するイオンの電荷状態の判別が実施されている。
ただし、「アベラジン」モデルで導出される元素組成の近似の精度はあまり高くない。タンパク質のような分子量が非常に大きな化合物を測定する場合には、近似により得られた元素組成の誤差はモノアイソトピック質量の算出や同位体分布の特定にそれほど大きな影響を与えない。しかしながら、元素組成推定対象である化合物の質量がより小さい場合、即ち、ペプチドやペプチドが分解して生じた断片(プロダクトイオン)を測定する場合には、理論同位体分布のより正確なモデルが必要とされ、「アベラジン」モデルで得られる元素組成の精度では、そうした正確な理論同位体分布を求めるには不十分である。
また特に、後述するようにマススペクトル上で異なるイオンの同位体ピーククラスタの一部が重なった状態にある同位体ピーククラスタを識別する際には、同位体分布に対応する質量電荷範囲内の複数のイオンピークの信号強度値の関係にはより高い精度が求められる。こうした要求にも応え得るような、より精度の高い理論同位体分布を計算することが可能な方法が必要とされているものの、こうした方法は従来提供されていない。
また、マススペクトル上でモノアイソトピックイオンピークが観測され得る状況であって理論同位体分布が或る程度正確に求まっていたとしても、同位体ピーククラスタやモノアイソトピックイオンの特定には次のような問題がある。
上述したように、一般に、モノアイソトピックイオンピークは同位体ピーククラスタの中の第1ピークであり、その同位体ピーククラスタは実測により得られたマススペクトル上で検出される同位体分布包絡線に基づいて特定される。具体的には、マススペクトル上で例えば同位体ピーククラスタであると推定される同位体分布包絡線が抽出されると、該同位体分布包絡線上の各データ点と理論同位体分布上のデータ点とについて数学的逐点フィッティング法が適用され、その結果に基づいて同位体ピーククラスタであるか否かが判定される。こうした手法は技術的には確立されたものであるが、マススペクトル上のピークプロファイルの形状があまり良好でない、つまりは理論的なモデルとの差異が大きすぎる場合には、あまり有効ではない。
例えば、質量分析装置の質量分解能が不足していると、マススペクトル上で同一の同位体ピーククラスタに属する複数のピークが図1に示したようには十分に分離されない場合がある。こうした場合、一部のピークだけが分離され、それ以外のピークはピークとしての識別ができない程度に重なり合ってしまっているようなピークプロファイル波形がマススペクトルに現れることがある。このようなピークプロファイル形状の場合には、仮に理論同位体分布が正確であったとしても、従来のフィッティング手法によって同位体ピーククラスタを特定することはかなり困難である。その結果、モノアイソトピックイオンピークの特定も難しい。同位体ピークを十分に分離できない低質量分解能の質量分析装置のデータは元より、高価な高質量分解能の質量分析装置においても実測データの質量分解能が低下する場合があるため、質量分解能が低いマススペクトルであっても理論同位体分布への適切なフィッティングが可能であるような新たなデータ処理手法が望まれている。
さらにまた、或る一つの化合物由来のイオンが解離して生じた複数のプロダクトイオンの質量電荷比が近い場合などには、マススペクトル上で同位体ピーククラスタの一部の重なりがしばしば起こる。こうした場合、重なった一方又は両方のイオンのモノアイソトピックイオンピークの特定は困難である。上述したように、ペプチドの同定を行う際には、できるだけ多くの種類のプロダクトイオンの質量電荷比値及び信号強度値を解析処理に供することが望ましく、一部のイオンについてのモノアイソトピックイオンピークの情報の欠如は同定精度を低下させるおそれがある。そのため、同位体ピーククラスタの一部が重なっている場合にその重なりを正確に識別するとともに、その場合でもそれぞれのモノアイソトピックイオンピークを特定できる新たな手法が望まれている。
イェルゲイ(Yergey, J. A.)、「ア・ジェネラル・アプローチ・トゥ・カリキュレイティング・アイソトピック・ディストリビューションズ・フォー・マス・スペクトロメトリ(A gneral approach to calculating isotopic distributions for mass spectrometry)」、インターナショナル・ジャーナル・マス・スペクトロメトリ・イオン・フィジックス(International Journal Mass Spectrometry Ion Physics)、1983年、52、pp.337-349 ホーン(Horn, D. M.)ほか2名、「オートメイテッド・リダクション・アンド・インタープリテイション・オブ・ハイ・リゾリューション・エレクトロスプレー・マス・スペクトラ・オブ・ラージ・モレキュルズ(Automated reduction and interpretation of high resolution electrospray mass spectra of large molecules)」、ジャーナル・オブ・ジ・アメリカン・ソサイエティ・フォー・マス・スペクトロメトリ(Journal of the American Society for Mass Spectrometry)、2000年、11、pp.320-332 リ・チェン(Li Chen)ほか1名、「オートメイテッド・チャージ・ステート・デターミネイション・オブ・コンプレックス・アイソトピック-リゾルブド・マス・スペクトラ・バイ・ピーク-ターゲット・フーリエ・トランスフォーム(Automated charge state determination of complex isotope-resolved mass spectra by peak-target Fourier transform)」、ジャーナル・オブ・ジ・アメリカン・ソサイエティ・フォー・マス・スペクトロメトリ(Journal of the American Society for Mass Spectrometry)、2008年、19(1)、pp.46-54. センコ(Michel W. Senko)ほか、「デターミネイション・オブ・モノアイソトピック・マシズ・アンド・イオン・ポピュレイションズ・フォー・ラージ・バイオモレキュルズ・フロム・リゾルブド・アイソトピック・ディストリビューションズ (Determination of monoisotopic masses and ion populations for large biomolecules from resolved isotopic distributions)」、ジャーナル・オブ・ジ・アメリカン・ソサイエティ・フォー・マス・スペクトロメトリ(Journal of the American Society for Mass Spectrometry)、1995年、6、pp.229-233
本発明は上記課題を解決するためになされたものであり、その主たる目的は、目的化合物や該化合物由来のイオンの理論同位体分布を正確に求めることができ、該理論同位体分布を利用してマススペクトル上においてモノアイソトピックイオンピークを正確に特定し、それによってそのイオンの質量電荷比や目的化合物の質量を正確に求めることができる質量分析データ処理方法及び質量分析データ処理装置を提供することにある。
また本発明の他の目的は、質量分析装置で得られるマススペクトルの質量分解能が低い場合であっても、モノアイソトピックイオンピークを正しく特定して正確な質量電荷比や質量を求めることができる質量分析データ処理方法及び質量分析データ処理装置を提供することにある。
また本発明のさらに他の目的は、マススペクトル上で異なるイオンの同位体ピーククラスタの一部が重なっている場合であっても、その重なりを正確に識別し、それぞれのモノアイソトピックイオンピークを特定することができる質量分析データ処理方法及び質量分析データ処理装置を提供することにある。
上記課題を解決するためになされた本発明に係る質量分析データ処理方法は、試料に対する質量分析を行うことで収集されたプロファイルスペクトルデータを処理する質量分析データ処理方法であって、
a)前記プロファイルスペクトルデータから目的化合物由来であると推定されるイオンピークを抽出し、そのピークに対応する実測質量を求める対象ピーク設定ステップと、
b)目的化合物と主要な元素が共通する同じカテゴリーに属する1又は複数の化合物の既知の質量と元素組成とから導出された質量と元素組成との近似的な関係に基づいて、前記対象ピーク設定ステップにおいて得られた実測質量に対応する元素組成を推定する組成推定ステップと、
c)前記組成推定ステップにおいて得られた元素組成に基づき、各元素の既知の同位体比を用いて理論同位体分布を導出する理論同位体分布導出ステップと、
d)前記対象ピーク設定ステップにおいて抽出されたイオンピークが含まれる所定の質量電荷比範囲内に存在する複数のピーク又はそれらピークを含む曲線を前記理論同位体分布導出ステップにおいて得られた理論同位体分布にフィッティングし、その結果に基づいて、前記抽出されたイオンピークが単一の化合物から発生した同位体ピーククラスタ中のモノアイソトピックイオンピークであるか否かを判定する、及び/又は、前記抽出されたイオンピークが前記所定の質量電荷比範囲内に存在する複数の化合物から発生した複数の同位体ピーククラスタが重畳して構成されたピーククラスタ中のピークであるか否かを判定する判定処理ステップと、
を有することを特徴としている。
また上記課題を解決するためになされた本発明に係る質量分析データ処理装置は、上記本発明に係る質量分析データ処理方法をコンピュータ上で実現する装置であって、試料に対する質量分析を行うことで収集されたプロファイルスペクトルデータを処理する質量分析データ処理装置において、
a)前記プロファイルスペクトルデータから目的化合物由来であると推定されるイオンピークを抽出し、そのピークに対応する実測質量を求める対象ピーク設定部と、
b)目的化合物と主要な元素が共通する同じカテゴリーに属する1又は複数の化合物の既知の質量と元素組成とから導出された質量と元素組成との近似的な関係に基づいて、前記対象ピーク設定部により得られた実測質量に対応する元素組成を推定する組成推定部と、
c)前記組成推定部により得られた元素組成に基づき、各元素の既知の同位体比を用いて理論同位体分布を導出する理論同位体分布導出部と、
d)前記対象ピーク設定部により抽出されたイオンピークが含まれる所定の質量電荷比範囲内に存在する複数のピーク又はそれらピークを含む曲線を前記理論同位体分布導出部により得られた理論同位体分布にフィッティングし、その結果に基づいて、前記抽出されたイオンピークが単一の化合物から発生した同位体ピーククラスタ中のモノアイソトピックイオンピークであるか否かを判定する、及び/又は、前記抽出されたイオンピークが前記所定の質量電荷比範囲内に存在する複数の化合物から発生した複数の同位体ピーククラスタが重畳して構成されたピーククラスタ中のピークであるか否かを判定する判定処理部と、
を備えることを特徴としている。
本発明に係る質量分析データ処理方法及び質量分析データ処理装置による処理対象であるプロファイルスペクトルデータを収集するための質量分析装置は、特に限定されず、例えば飛行時間型質量分析装置、四重極型質量分析装置、イオントラップ型質量分析装置などが考えられる。また、特定のイオンをCID等により解離させ、それにより生成されたプロダクトイオンを質量分析するタンデム型又はMSn型の質量分析装置であってもよい。
本発明に係る質量分析データ処理装置において、対象ピーク設定部は、質量分析装置により収集されたプロファイルスペクトルデータが与えられると、該プロファイルスペクトルデータに基づいて横軸が質量電荷比、縦軸が信号強度であるマススペクトルを作成する。そして、そのマススペクトル上で、試料に含まれる目的化合物に由来すると推定されるイオンピークを抽出し、その抽出したピークに対応する実測質量値を求める。組成推定部はその実測質量値に対応する元素組成を推定するが、その際に、目的化合物と主要な元素が共通する同じカテゴリーに属する1又は複数の化合物の質量と元素組成とから導出された質量と元素組成の近似的な関係を利用する。
ここでいう「主要な元素が共通する一つのカテゴリー」の例としては、主要元素が炭素C、水素H、窒素N、及び酸素Oである、タンパク質、該タンパク質の分解生成物であるペプチド、又は核酸が挙げられる。即ち、例えばペプチドにはアミノ酸配列が異なる多種のものが知られているが、これらは全てペプチドという一つのカテゴリーに属するとみなすことができる。
また、ここでいう「質量と元素組成との近似的な関係」とは例えば、元素毎に、化合物の質量と当該元素の個数との関係を近似的に表した近似式やテーブルなどである。上記ペプチドの例でいえば、様々なペプチドに含まれる炭素Cや水素Hなどの各元素の個数とそれぞれのペプチドの質量との関係が近似的に表された式やテーブルなどを用いることができる。後述するように、ペプチドの場合には、ペプチド質量と各元素の個数との関係は近似的に線形関係となるため、簡単な式で表現することができる。もちろん、多項式などのより複雑な式が必要となる場合もあり得る。
ただし、上記の質量と元素組成との関係はあくまでも近似的な関係であるため、この関係から導出された元素組成をもつ化合物の質量が実測質量値に適合するとは限らない。そこで、好ましくは、上記組成推定部は、質量と元素組成との近似的な関係を利用して、対象ピーク設定部により得られた実測質量値に対応する元素組成を初期的に推定し、その推定された元素組成から計算される質量と実測質量値との差を求め、この差が所定の閾値以下に収まるように元素組成を修正することで最も確からしい元素組成を求めるようにするとよい。
具体的には例えば、推定された元素組成に含まれる各元素の個数を1個又は複数個減らす又は増やすことで元素組成を修正し、修正された元素組成に対応する質量を計算し、その計算された質量と実測質量値との差が所定の閾値以下に収まるまで、元素の個数の増減と質量差の計算及び確認を繰り返すことで、最終的に最も確からしい元素組成を求めるようにすることができる。このように、近似的に求められたおおよその元素組成から出発して該元素組成を修正してゆくことで、実効的に有意である処理時間で以て、真の元素組成又はそれにきわめて近い元素組成を見出すことができる。
また、目的化合物のカテゴリーが例えばタンパク質やペプチドであるとき、元素の一つとして硫黄を含む場合がある。そこで、目的化合物のカテゴリーが例えばペプチドである場合には、上記組成推定ステップは、炭素、水素、窒素、及び酸素からなる元素組成を初期的に推定し、その推定された元素組成から計算される質量と実測質量値との差が所定の閾値以下に収まらない場合に、硫黄を加えて元素組成を推定するようにしてもよい。
上述したように対象ピーク設定部で抽出されたイオンピークの実測質量値に対応する元素組成が推定されたならば、理論同位体分布導出部は、各元素についての既知の同位体比を用いて理論同位体分布を導出する。推定された元素組成の精度が高いので、正確な理論同位体分布を導出することができる。
続いて判定処理部は、プロファイルスペクトルデータに基づいて抽出されたイオンピークが含まれる所定の質量電荷比範囲内に存在する複数のピークを、上記理論分布導出部により得られた理論同位体分布にフィッティングする。そして、例えばそのフィッティングの程度を示す評価値に基づいてフィッティングが適切に行われているか否かを判定し、フィッティングが適切に行われていると結論付けられた場合には、上記所定の質量電荷比範囲内に存在する複数のピークが一つの同位体ピーククラスタを構成するものと判断する。また、対象ピーク設定部で抽出されたイオンピークがその一つの同位体ピーククラスタの中の1番目のピーク(第1ピーク)であれば、そのイオンピークがモノアイソトピックイオンピークであると判定する。これにより、マススペクトル上で同位体ピーククラスタを特定したりモノアイソトピックイオンピークを特定したりすることができる。
なお、本発明に係る質量分析データ処理装置において、上記対象ピーク設定部は、プロファイルスペクトルデータから同一の元素組成を有するイオンに対応すると推測される複数のピークからなる同位体分布包絡線を求め、該同位体分布包絡線内で質量電荷比が最小である第1ピークを前記目的化合物由来であると推定されるイオンピークとして抽出すればよい。
また本発明に係る質量分析データ処理装置の一実施態様として、上記判定処理部は、
上記プロファイルスペクトルデータからの所定の質量電荷比範囲内に存在する複数のピークの頂点を取得するとともに、理論同位体分布からも複数のピークの頂点を取得し、
その理論同位体分布から取得した複数のピークの頂点の質量電荷比値及び信号強度値をそれぞれ相対化して求めた複数のデータ点に対しカーブフィッティングを行うことで近似曲線を取得し、
上記プロファイルスペクトルデータによる複数のピークの頂点の質量電荷比値及び信号強度値をそれぞれ相対化して求めた複数のデータ点を上記近似曲線にフィッティングし、その結果に基づいて、プロファイルスペクトルデータから取得した複数のピークが一つの同位体ピーククラスタを構成するか否かを判定する構成とすることができる。
上述したように、質量分解能が低い質量分析装置で測定が行われた場合、マススペクトル上で一つの同位体ピーククラスタ内でのピークの分離が悪くなり、隣接するピークのリーディングとテーリングの重なりによってピーク頂点の間の曲線形状が悪化する。これに対し、上記構成では、プロファイルスペクトルデータに基づいて作成される実測のマススペクトル上のピークプロファイル波形の曲線そのものを理論同位体分布にフィッティングさせるのではなく、理論同位体分布に現れる複数のピークの頂点の情報に基づいて近似的に形成された曲線に対し、実測のマススペクトル上のピークプロファイル波形で観測される複数のピークの頂点の情報をフィッティングさせる。そのため、マススペクトル上において隣接するピークのリーディングとテーリングとの重なりによるピーク頂点の間の曲線形状は、理論同位体分布へのフィッティング結果には反映されず、質量分解能の低いマススペクトルであっても、同位体ピーククラスやモノアイソトピックイオンピークの特定の精度が向上する。
また、上述したように、化合物の質量が比較的小さい場合には、同位体ピーククラスタ又は同位体分布包絡線内で質量電荷比が最小である第1ピークが常に信号強度が最大であるピークである。換言すれば、最大強度を示すピークが第1ピーク以外(通常は第2ピーク)に存在する場合であって、そのピークの信号強度と第1ピークの信号強度との比が装置の測定誤差などを考慮した裕度を見込んだ範囲を逸脱している場合には、一つの同位体ピーククラスタであるとの推定の下に取得された複数のピーク又はそれに対応する同位体分布包絡線内に他のイオン由来の同位体ピーククラスタが重畳している可能性があることを示唆している。
そこで、本発明に係る質量分析データ処理装置においては、上記対象ピーク設定部により抽出されたイオンピークが含まれる所定の質量電荷比範囲内に存在する複数のピークの中で、該抽出されたイオンピークと該ピークを除き信号強度が最大である他のピークとの信号強度比を算出し、該信号強度比に基づいて、それら複数のピークが一つの同位体ピーククラスタを構成するものであるか否かを判定するオーバーラップ判定部をさらに備える構成とすることができる。
より具体的には、上記オーバーラップ判定部は、上記所定の質量電荷比範囲内に存在する複数のピークの中で、質量電荷比が最小である第1ピークを上記抽出されたイオンピークとし、該ピークを除き信号強度が最大である他のピークとして第1ピークに隣接する第2ピークを選択し、その第1ピークと第2ピークの信号強度比に基づいて、上記複数のピークが一つの同位体ピーククラスタを構成するものであるか否かを判定し、一つの同位体ピーククラスタを構成しないと判定された場合に、第1ピーク及び第2ピークをそれぞれ異なるモノアイソトピックイオンピークであると特定するようにすることができる。
なお、後述するように、ペプチドにおいては、第1ピークと第2ピークとの信号強度比と、イオンピークの質量電荷比との関係が直線的に近似できるため、予め求めておいた近似関係に基づいて質量電荷比に対応した判定閾値を定め、この判定閾値に照らして異なるイオン由来の同位体分布のオーバーラップの有無を判定すればよい。
これにより、異なるイオンが質量電荷比軸上で近接して存在している場合でも、それら異なるイオンの同位体分布の重なりを正確に把握して、それぞれのモノアイソトピックイオンピークを特定することができる。これは、特に、多数のプロダクトイオンピークが観測されるMSnスペクトルにおいてモノアイソトピックイオンピークをできるだけ漏れなく見出すのに有用である。例えばペプチドイオンに対するMS2分析を行った場合、ペプチドの構造によって、アンモニア(−17Da)と水(−18Da)とがそれぞれニュートラルロスとして脱離したプロダクトイオンが観測されることがある。これらプロダクトイオンの質量電荷比差は僅か1Daであるから、MS2スペクトル上でそれらイオンの同位体ピーククラスタはオーバーラップすることになる。上記構成によれば、こうした場合でも、それぞれのイオンのモノアイソトピックイオンピークを特定することができる。
本発明に係る質量分析データ処理方法及び質量分析データ処理装置によれば、元素組成が未知である目的化合物や該化合物由来のイオンの元素組成を高い精度で以て推定し、その推定結果に基づいて理論同位体分布を正確に求めることができる。そして、この理論同位体分布を利用することで、マススペクトル上において目的化合物由来のイオンのモノアイソトピックイオンピークを正確に特定することができ、そのイオンの質量電荷比や目的化合物の質量を正確に求めることができる。
例えば本発明に係る質量分析データ処理方法及び質量分析データ処理装置をペプチド等の同定に利用すれば、同定のための解析に供するイオンの質量電荷比値の精度が向上するので、同定の精度向上が期待できる。
また、本発明に係る質量分析データ処理方法及び質量分析データ処理装置であって、特に、上述したピーク頂点のみを考慮したフィッティング手法を組み合わせた構成によれば、質量分解能が低く、同位体分布包絡線内でピークが十分に分離できないようなマススペクトルであっても、モノアイソトピックイオンピークを正しく特定して、イオンの質量電荷比や目的化合物の質量を正確に求めることができる。
さらにまた、本発明に係る質量分析データ処理方法及び質量分析データ処理装置であって、特に、オーバーラップ判定ステップ或いはこれを実施するオーバーラップ判定部を有する構成によれば、マススペクトル上で異なるイオンの同位体ピーククラスタの重なりを正確に識別できるとともに、それぞれのモノアイソトピックイオンピークを特定することができる。それによって、例えばペプチド同定の際の解析処理に供するピーク情報が充実し、ペプチド同定の精度の向上が期待できる。
ペプチド由来イオンについての実測マススペクトルの例を示す図。 計算により得られた理論同位体分布の例を示す図。 本発明に係る質量分析データ処理方法における特徴的なモノアイソトピックピーク特定処理の一例を示すフローチャート。 元素組成推定及び理論同位体分布算出の処理の詳細フローチャート。 ペプチドの質量と各ペプチドに含まれる元素C、H、N及びOの個数との関係を示す図。 低質量分解能のマススペクトル上で観測される同位体分布の一例を示す図。 実測による同位体分布包絡線と理論同位体分布とのフィッティング処理の詳細フローチャート。 理論同位体分布から求まるピーク頂点と実測マススペクトルから得られるピーク頂点とについての質量換算値と相対強度との関係性を示す図。 実測マススペクトル上で観測される同位体分布の一例、及び、同位体分布に現れるピーク頂点に対する変換処理の説明図。 質量電荷比が1903Da及び2798Daであるイオンの同位体分布の計算結果を示す図。 複数の同位体ピーククラスタがオーバーラップしている状態を説明するためのマススペクトルを示す図。 オーバーラップしている同位体分布内の複数のイオンの識別処理の手順を示すフローチャート。 ペプチドイオンの質量電荷比と同位体ピーククラスタ内の第1ピークに対する第2ピークの強度比との関係を示す図。 本発明に係る質量分析データ処理装置を備えたMSn型質量分析装置の要部の構成図。 図14に示したMSn型質量分析装置における特徴的なデータ処理及びその処理結果を利用した制御のフローチャート。
以下、本発明の一実施例である質量分析データ処理方法について添付図面を参照して詳細に説明し、さらにこの質量分析データ処理方法を実行する質量分析データ処理装置を備えたMSn型質量分析装置の構成及び動作について説明する。
図3は、本発明に係る質量分析データ処理方法における特徴的なピーク検出処理の一例の概略フローチャートである。
処理の手順としては、まず、試料に対する質量分析を実行した結果として例えばハードディスク等の記憶装置に格納されている、所定の質量電荷比範囲に対応するプロファイルスペクトルデータが読み出される(ステップS1)。前述のように、このプロファイルスペクトルデータは質量分析装置で収集された生の、つまりはセントロイド処理されていないデータである。
このプロファイルスペクトルデータに対して所定のピーク検出処理が実行されることで、一つの化合物由来である同位体ピーククラスタが識別されるとともに、その同位体ピーククラスタ毎にモノアイソトピックイオンピークが抽出される(ステップS2)。また、図3には示していないが、ステップS2の処理は用意されたプロファイルスペクトルデータの全体について繰り返し実施され、プロファイルスペクトルデータに基づいて作成されるマススペクトル上で観測される全てのイオンに対するモノアイソトピックイオンピークが抽出される。そして、抽出された全てのモノアイソトピックイオンピークの情報、つまりはその質量電荷比及び信号強度値が含まれるピークリストが作成され、これが処理結果として出力される(ステップS3)。
即ち、マススペクトル上で或る一つの化合物由来イオンの同位体ピーククラスタが特定された場合には、その同位体ピーククラスタの中のモノアイソトピックイオンピークの質量電荷比の値が、その同位体ピーククラスタに含まれる複数のイオンピークの代表値としてピークリストに掲載されることになる。
ステップS2のピーク検出処理においては、プロファイルスペクトルデータが与えられると、このデータに対し所定のアルゴリズムに従ってピークを抽出し、抽出した各ピークの頂点の位置における質量電荷比値を取得する(ステップS21)。また、抽出されたピークを含む所定の質量電荷比範囲内に存在する複数のピークの質量電荷比値の間隔などを利用して、一つのイオンによる同位体分布であると推定される同位体分布包絡線を抽出する(ステップS22)。
分子量がそれほど大きくない場合には、同位体分布の中で質量電荷比が最小である第1ピークがモノアイソトピックイオンピークである。そこで、一つのイオンによるものと推測される同位体分布包絡線内において第1ピークを抽出し、このイオンピークの実測の質量電荷比値から導出される実測質量値を用い、後述する特徴的なデータ処理によって、そのイオンの元の化合物の元素組成、つまり化学式を推定する(ステップS23)。元素組成が得られたならば、各元素の既知の同位体比を用いて理論同位体分布を計算する(ステップS24)。元素組成の推定が高精度であれば、この理論同位体分布の精度も高い。
その後、ステップS22で得られた実測マススペクトルに基づく同位体分布包絡線を理論同位体分布にフィッティングさせ、そのフィッティングの適合度を評価する(ステップS25)。このフィッティング手法も本発明に特徴的なものであり、あとで詳しく説明する。フィッティングの適合度が高ければ、提示された同位体分布包絡線は一つの同位体ピーククラスタに対応していると判断できるから、それによって同位体分布或いは同位体ピーククラスタが特定される。また、典型的には同位体ピーククラスタの中の第1ピークがモノアイソトピックイオンピークであるから、モノアイソトピックイオンピークが特定される(ステップS26)。同位体ピーククラスタが特定されれば、それを構成する複数のピークの間隔からそのイオンに対する荷電状態、つまりは価数も特定されることになる。なお、図3において、ステップS25からステップS23へと戻る経路は、ステップS25においてフィッティングが適切に行われなかった場合に、化学式推定を最初からやり直す際に辿る経路である。
また、ここでは本発明と直接関連しないので詳しい説明を省略するが、ピーク検出処理においては、一般に実施されているノイズピーク除去やスムージングなどのデータ処理を組み合わせることで、偽のピークの検出を回避してピークリストの質を向上させることができる。
次に、図3中の元素組成推定処理について図4により詳細に説明する。図4は、図3中のステップS23及びS24の処理を含む詳細フローチャートである。
まず、上述したようにプロファイルスペクトルデータから抽出された一つのピークの頂点に対応した実測質量値が与えられると(S231)、次に述べるような元素組成推定モデルに基づいて、実測質量値に対応する化学式(元素組成を表す組成式)を推定する(ステップS232)。
上記元素組成推定モデルは、分析対象である化合物のカテゴリー毎に予め構築される。ここでは、分析対象である化合物がペプチドである場合を考える。この場合、カテゴリーはペプチド(又はタンパク質及びペプチド)である。
周知のように、ペプチドはアミノ酸が結合したものであり、アミノ酸は、基本的に、炭素C、水素H、窒素N、及び酸素Oを構成元素としている。また、一部のアミノ酸(システインCys及びメチオニンMet)は上記四元素以外に、硫黄Sを構成元素としている。そこで、元素組成が既知である複数のペプチドについてそれぞれ、ペプチドの質量と該ペプチドに含まれる各元素の個数との関係を求め、ペプチドの質量と各元素の個数との関係の近似式を規定しておく。
図5(a)及び(b)は、一般的な質量分析装置で取得可能な質量範囲におけるペプチドの質量と各ペプチドに含まれる元素C、H、N及びOの個数との関係を示す図である。図5中に■等で示すプロットが実際のペプチド質量と元素個数との関係である。図5から分かるように、元素毎に、質量(x)と元素個数(y)とはほぼ線形の関係となる。したがって、この質量と元素個数との関係はそれぞれ一次式で近似的に表すことができ、この例では、その式は図5中に記載したように、元素Cでは、y=0.0398x+6.8906、元素Hでは、y=0.054x+25.931、元素Nでは、y=0.0118x1−0.1987、元素Oでは、y=0.0138x+0.9427、となる。ここでは、この元素C、H、N及びOについての四つの近似式が元素組成推定モデルであるが、式ではなく、質量と元素個数とが対応付けられたテーブル等とすることもできる。
なお、上記のような近似式算出のために利用するペプチドの数に制約はないものの、近似の精度を上げるためには或る程度多くの数のペプチドの情報が必要であることは容易に推測し得る。また、ここでは、分析対象の化合物がペプチドであるため、同じカテゴリーに属するペプチドを用いて近似式を求めたが、分析対象の化合物の種類に応じて異なるカテゴリーに属する化合物を用いて近似式を求めることが必要である。場合によっては、一次式で近似できるとは限らず、その場合には多項式を用いるか上述したテーブルを用いるとよい。
図4に戻って説明を続ける。上述したように元素組成の近似式である元素組成推定モデルに基づいて実測質量値に対応する化学式が推定されたならば、次に、その推定された化学式に対応した質量を計算する(ステップS233)。このとき計算に使用される各元素の質量は、H:1.0078、C:12.0000、N:14.0031、O:15.9949、S:31.9721である。図5に示した近似式は実際のペプチドの質量と元素個数との関係から導かれたものであるが、あくまでも近似である。そのため、最初に推定された化学式から計算される質量(以下「推定質量」という)は実測質量値と一致する可能性はあまり高くない。そこで、最初に推定された化学式を正確な推定のための初期値として利用し、試行錯誤的な繰り返し処理によって最も確度の高い化学式を推定する。
即ち、推定質量と実測質量とを比較するために、両者の差ΔMを算出する(ステップS234)。化学式の推定が正確である場合には差ΔMは小さい筈である。そこで、算出された差ΔMが予め定めた閾値Tv以下であるか否かを判定する(ステップS235)。一般的に、閾値Tvは例えば1Daよりも小さい値とするが、条件によっては1Da以上の値とすることもできる。差ΔMが閾値Tv以下である(ステップS235でYesである)場合には、推定された化学式が、ステップS231で与えられたピークに対応するペプチドの元素組成であると判断する(S236)。
一方、差ΔMが閾値Tvを超えている(ステップS235でNoである)場合には、推定された化学式は未だ正しくないと判断できる。そこで、その差ΔMの極性及び大きさに応じて、推定された化学式に一個又は複数個の元素を追加する又は削除することによって化学式を修正する(ステップS237)。具体的には、推定質量が実測質量よりも小さい場合には、その差ΔMの大きさに応じた適宜の元素を一個又は複数個追加する。逆に、推定質量が実測質量よりも大きい場合には、その差ΔMの大きさに応じた適宜の元素を一個又は複数個削除する。また、図5に示したペプチド質量と元素個数との関係には含まれてないが、上述した二つのアミノ酸は硫黄を含むため、推定化学式を修正する際には、追加又は削除する元素として上記四元素のみならず硫黄も含めるようにする。そうして、元素の追加又は削除によって推定化学式を修正したならば、質量を再度計算し(ステップS238)、ステップS234へと戻る。
したがって、差ΔMが閾値Tv以下に収束するまで、ステップS234→S235→S237→S218→S214→…の処理が繰り返され、最終的な推定質量と実測質量と差はごく僅かなものとなる。そうして推定された化学式に基づいて理論同位体分布を計算する(ステップS24)。図4中のステップS24は図3中のステップS24と同じ処理である。元素組成が確定すれば、既知である各元素の同位体比に基づいて理論同位体分布を計算可能であることはすでに述べた通りである。
以上のようにして、本実施例の質量分析データ処理装置では、或るイオンの実測質量が与えられたときに、その実測質量に対する精度の高い理論同位体分布が計算される。
次に、図3中のステップS25の処理について図6〜図9を参照して詳細に説明する。
上述したように、ステップS25では、実測のマススペクトル上で検出される同位体分布包絡線を理論同位体分布にフィッティングさせ、そのフィッティングの適合度を判定することによって同位体分布包絡線が本当に同位体ピーククラスタによるものか否かを確認する。このフィッティングに際して、マススペクトル上で隣接するピークが図1に示したように十分に分離されていれば、ピークプロファイル波形そのものを用いたフィッティングを実施しても適切に適合度を求めることができるが、隣接ピークは常にこのように十分に分離されているわけではない。
図6は、一般的なMALDI-TOFMSで得られるマススペクトル上でよく観測される同位体分布の一例である。図中の縦棒は一般的なピーク検出及びセントロイド処理により得られたピークである。ピーク検出処理は全てのピークを特定するように試みられるが、ピークプロファイルが低質量分解能であるために、本来検出されるべき一部のピーク(m/z1884-1885の間に存在するピーク)が検出漏れとなっていることが分かる。このように、通常、質量分解能の低さは同位体分布のフィッティングを行う際に障害となる。これに対し、本実施例で採用されているフィッティング手法によれば、このような低質量分解能のピークプロファイル波形に対しても確度の高いフィッティングが可能である。
図7は、図3中のステップS25及びS26の処理を含む詳細フローチャートである。
この手法で特徴的であるのは、実測マススペクトルから得られる同位体分布包絡線の曲線そのものに基づくフィッティングを行うのではなく、同位体分布包絡線及び理論同位体分布におけるピークの頂点のみを考慮したフィッティングを行うことである。
即ち、理論同位体分布には複数のピークが存在し、実測マススペクトルに基づく同位体分布包絡線内にも複数のピークが現れる。ただし、それら複数のピークの頂点の位置、つまり質量電荷比値は必ずしも一致しない。そこで、複数のピークの頂点の質量電荷比値及び信号強度値を求め、さらにその複数のピークの質量電荷比値及び信号強度値を相対的に比較可能であるように相対化(例えば規格化)する。そうして得られるピーク頂点に対応したデータ点を繋ぎ合わせる曲線を考える。
同位体分布包絡線内における複数のピーク頂点に対応したデータ点と理論同位体分布におけるピーク頂点に対応したデータ点とが完全に一致していれば、それぞれの複数のデータ点を繋ぎ合わせて形成される2本の曲線は一致する筈である。逆に、その2本の曲線の不一致性はデータ点のずれ、つまりはピーク頂点の質量電荷比及び/又は信号強度のずれを示している。このような一種の変換処理を行うことで、実測マススペクトルから得られた同位体分布包絡線を理論同位体分布へフィッティングさせるという作業は、実測マススペクトル上の同位体分布包絡線内の各ピークの頂点に対応したデータ点を、理論同位体分布における各ピークの頂点に対応したデータ点から求まる近似曲線にフィッティングさせるという作業に置き換えることができる。なお、各ピークの頂点に対応するデータ点から曲線を近似的に形成する際には、多項式近似を利用すればよく、図6に示した程度の分離性の悪さであれば、3次多項式で十分な近似が行える。
具体的な処理手順としては、上述したようにステップS24の処理により理論同位体分布が求まると、まず、その理論同位体分布に現れるピークの頂点の質量電荷比値及び信号強度値を取得する(ステップS251)。その後、実測マススペクトルから得られた所定質量電荷範囲の同位体分布包絡線内に存在するピークの数と同数のピークを理論同位体分布から選択する(ステップS252)。
次に、理論同位体分布中のピークの中で選択された複数のピークの頂点の質量電荷比値及び信号強度値を、それぞれ相対的に比較できるような値に変換する。ここでは、図9中に示すように、信号強度値については、その複数のピーク頂点の信号強度値の中の最大値、つまり最大信号強度値を基準として他の信号強度値を規格化している。一方、質量電荷比値については、理論同位体分布の質量電荷比幅の中心となる質量電荷比値を求め、これを基準のゼロとして他の質量電荷比値を所定範囲に収まるように換算している。このような値の変換によって、或る質量電荷比値と信号強度値を示す一つのピーク頂点は、換算質量値と規格化強度値を持つ一つのデータ点に対応付けられる。そうして得られた複数のデータ点に対し、多項式を用いたカーブフィッティングを行うことで近似曲線を求める(ステップS253)。上述のように、一般的には多項式として3次式を用いれば、十分な近似が可能である。
なお、このような近似曲線を得るためには、例えば、1組の入力点に対する非線形回帰の解を取得することが可能である汎用的なコンピュータプログラムを用い、1組の入力点として、ピーク頂点に対応する複数のデータ点を与えるようにすればよい。
次いで、例えば図9に示したような実測マススペクトルに基づく同位体分布包絡線内の複数のピークについても、各ピークの頂点を上述した変換手法によってそれぞれデータ点に対応付ける。そうして得られたデータ点を上記近似曲線にフィッティングさせる。このフィッティングが適切であるか否かを判断するために、ここでは次の(1)〜(3)式において定義される適合度Rを用いる(ステップS254)。
R=1−(rt/rm) …(1)
ここで、rtは実測マススペクトルに基づく各データ点の最良適合曲線(上記近似曲線)からの偏差の2乗の和であり、与えられた質量における理想的な同位体分布を表す。即ち、rtは(2)式で表される。
t=Σ(yi−yt2 …(2)
(2)式において、ytは理論同位体分布からの規格化強度値、yiは実測マススペクトル(同位体分布包絡線)からの規格化強度値である。
また、(1)式におけるrmは各点yiと平均値ymとの間の距離の2乗の和である。即ち、rmは(3)式で表される。
m=Σ(yi−ym2 …(3)
なお、(2)、(3)式ともに、Σはi=1からNまでの総和であり、Nは使用されたピークの個数である。
図8(a)及び8(b)は、理論同位体分布から求まるピーク頂点に対応するデータ点(図中の「モデルデータ」)と、実測マススペクトルから得られるデータ点(図中の「実測データ」)とについて、横軸を換算質量値、縦軸を規格化強度値とした関係性を示す図である。図中、実線で示した曲線がモデルデータに対してカーブフィッティングにより得られた近似曲線である。図8において(a)と(b)は、互いに異なる質量電荷比範囲内のイオンについての結果である。図8(a)は、実測マススペクトルから取得した複数の同位体ピークが、所与の質量のイオンについての理論同位体分布に対し良好にフィッティングされていることを示している。他方、図8(b)は、図8(a)に比べてフィッティングの適合度が劣る例である。
一般に、上記(1)式で定義される適合度Rの値は1未満であって、適合度Rが1に近づくほど、実測マススペクトルから得られるピーク頂点のフィッティングは良好であると判断できる。図8(a)の例ではこの適合度Rは0.95を超えており、図8(b)の例では適合度Rは約0.7である。図8(b)ではフィッティングがあまり良好でないようにみえるものの、実際には、この程度の適合度が得られれば良好な適合であると結論付けることができる。一方、最良適合曲線からの偏差が強度平均値からの変化よりも大きいような場合には、上記適合度Rが負の値になることもあり得る。そうなった場合、推定された理論同位体分布は、実測マススペクトルから選択されたピークが一つの同位体ピーククラスタに含まれるか否かの判定に適さないものと判断できる。
そこで、上述のようにしてフィッティングの適合度Rが計算されたならば、この適合度が予め決めた許容範囲内であるか否かを判定する(ステップS255)。そして、適合度Rが許容範囲内である(ステップS255でYesである)場合には、与えられた同位体分布包絡線が一つの同位体ピーククラスタによるものと判断し(ステップS256)、その同位体分布包絡線内の第1ピークがモノアイソトピックイオンピークであると特定する(ステップS26)。
一方、適合度Rが許容範囲を逸脱している(ステップS255でNoである)場合には、フィッティングに使用した理論同位体分布自体が不適当であると判断できる(ステップS257)。この場合には、理論同位体分布を計算する元となった元素組成自体が適切でなく、その元素組成推定のために最初に与えられたピーク自体が適切でない可能性がある。そこで、例えば図4中のステップS231へ戻り、実測マススペクトルから抽出される別のピークを処理の開始点として、再度処理をやり直す。例えば、実測マススペクトル上で最初に選択された質量電荷比範囲内において1番目のピークから処理が開始され、このピークに基づく適合度Rが予め定めた許容範囲内に入らない場合には、上記質量電荷比範囲内において2番目のピークが選択されて同様の処理が実施される、というような繰り返しが可能である。
或いは、ステップS255でNoとなるのは理論同位体分布が不適当なのではなく、マススペクトル上で2以上の異なるイオンによる同位体分布がオーバーラップしているために同位体分布包絡線の形状が大きく変化していることに起因する可能性もある。したがって、後述する同位体分布のオーバーラップを考慮した処理へ移行し、これを実行するようにしてもよい。いずれにしても、適合度Rを評価尺度として適切なフィッティングが行えるまで処理を繰り返すことで、実測マススペクトル上で一又は複数の同位体ピーククラスタを見出し、その中でモノアイソトピックイオンピークを特定することができる。
なお、図7に示したフローチャートによる一連の処理は、コンピュータ上の実際のソフトウエアにおいては、次のように二段構えで逐次実行されるフローによって実現されるものとすることができる。即ち、第一段階として、ステップS257の工程を「化合物の化学式推定へ戻る」として実行し、上述したように元素組成推定の元となるピークを質量電荷比範囲内の1番目のピークから順に走査していって、適合度Rが許容範囲内となる(ステップS255でYesである)結果が得られればその時点でピークの走査を終了する。設定した質量電荷比範囲内で対象となる全ピークについて適合度Rが許容範囲内とならなれば、第二段階としてステップS257の工程を「同位体分布のオーバーラップ識別処理」として実行し、今度は上述したようにオーバーラップを考慮した判定を実施する。もちろん、第一段階と第二段階の処理内容を逆にしてもよい。
上述したように、化合物の質量が増大するに伴い、通常、同位体分布内で質量電荷比が最も小さいモノアイソトピックイオンピークは、その同位体分布内で最大強度を示すピークでなくなる。図10(a)及び(b)はそれぞれ、質量電荷比が1903Da及び2798Daであるイオンの同位体分布の計算結果を示す図である。この図10は、分子の質量が増えると、一つの同位体ピーククラスタに属する複数のピークの信号強度の関係が変化する傾向を明確に示している。
しかしながら、所与の質量電荷比範囲内の所与の質量電荷比値において同位体分布包絡線が検出され、最大強度を示すピークが第1ピークではないときには、複数の同位体ピーククラスタの一部がオーバーラップしている可能性も排除できない。図11は複数の同位体ピーククラスタがオーバーラップする例を示すMS2スペクトルである。このMS2スペクトルにおいて、理論同位体分布内の第1ピークの質量電荷比は1533.7Daである。このピークは図中に実線で示したように、同位体分布内で信号強度が最大のピークになる筈である。しかしながら、質量が1Daだけ大きな1534.7Daであるイオンもプロダクトイオンとして現れる場合には、このプロダクトイオンのモノアイソトピックイオンピークの出現位置において、モノアイソトピックイオンの質量電荷比が1533.7Daであるイオンの同位体分布内の第2ピークとほぼ重なることになる。
図11中に、モノアイソトピックイオンの質量電荷比が1534.7Daであるイオンの理論同位体分布を点線で示している。質量電荷比が1533.7Daであるイオンに、質量電荷比が1534.7Daであるイオンがオーバーラップした場合、実際に観測される同位体分布は、図11中で実線と点線との二つ理論同位体分布を加算したものとなる。そうした同位体分布が得られたとき、一つの同位体分布に見える同位体分布包絡線内の1533.7Daの第1ピークのみをモノアイソトピックイオンピークとしてピークリストに登録してしまうと、実際には別の同位体ピーククラスタに属し、該クラスタにおけるモノアイソトピックイオンピークである1534.7Daのイオンピークがピークリストから欠落してしまうことになる。このようなピークリストからのモノアイソトピックイオンピークの欠落は、目的ペプチドを同定する上で不利になる。
そこで、次のような特徴的な処理によって、互いにオーバーラップしている同位体分布内に存在する複数のモノアイソトピックイオンピークを正しく特定する。
図12はこのオーバーラップ識別処理の手順を示すフローチャートである。
このオーバーラップ識別処理を実施するに先立って、構造が既知である複数のペプチドに基づいて、同位体分布包絡線内の複数のピーク間の信号強度値の比が計算される。図13は、質量が比較的大きな(1700〜3000Da)ペプチドにおけるピークの信号強度比の計算結果を示す図である。この信号強度比は、同位体分布包絡線内に存在する複数のピークの中で第1ピークの信号強度値に対する第2ピークの信号強度値の比である。図13に示している質量電荷比範囲においては、観測可能であるモノアイソトピックイオンピーク(第1ピーク)は通常、最大強度を示すピークではなく、第2ピークが最大強度を示すピークである。つまり、ここでは、第1ピークの信号強度値に対する第2ピークの信号強度値の比が、プロファイルスペクトルデータから抽出されたイオンピークと該ピークを除き信号強度が最大である他のピークとの信号強度比に相当する。この図13から、ペプチドの質量と信号強度比との関係はほぼ線形となることが分かる。また、ここでは示していないが、同位体分布包絡線内の第3ピーク、第4ピークなど、他のピークの信号強度比も同様の関係を示す。
上記のような線形な関係は近似であるとともに、装置の精度誤差や分析条件に応じたばらつきなどの余裕度を見込む必要がある。そこで、上記のように求めたペプチド質量と信号強度比との線形な関係を基準とし、その上下に所定の余裕度を見込んだ判定の閾値を定め、この閾値を用いて実測により得られた同位体分布包絡線内の複数のピークの信号強度比を判定することで、その同位体分布包絡線内で同位体分布のオーバーラップがあるか否かを判定する。
図12に従って具体的に説明する。まず、実測マススペクトルから抽出された同位体分布包絡線内の第1ピークを選択し、この第1ピークの頂点の質量電荷比値と信号強度値とを取得する(ステップS51)。次に、第1ピークに隣接するピーク(第2ピーク)を抽出し、この第2ピークの頂点の質量電荷比値と信号強度値とを取得し、第1ピークの信号強度値に対する第2ピークの信号強度値の比を計算する。また、併せて質量電荷比の差も計算する(ステップS52)。一つの同位体ピーククラスタに属するピーク間の質量電荷比差は、価数に応じて、1Da、1/2Da、1/3Daなど規則的な値になる筈である。
次に、一つにみえる同位体分布包絡線が実は複数の同位体分布がオーバーラップしたものであるか否かを判定する(ステップS53)。この例では、まず、ステップS52において計算された強度比(=第2ピークの信号強度値/第1ピークの信号強度値)が予め定めた閾値Tc(i)を超えているか否かを判定し、強度比が閾値Tc(i)を超えている場合には、オーバーラップの可能性があると判断する。閾値Tc(i)は質量電荷比範囲がiであるときの閾値を表し、これは上述したようにペプチド質量と信号強度比との線形な関係に基づいて予め決められる。さらに、同位体分布包絡線内で複数の同位体分布がオーバーラップしていれば、同位体分布包絡線内の第1ピークに対する第3ピーク、第4ピーク等の信号強度も変化する。そこで、それらの信号強度比も利用することで、複数の同位体分布がオーバーラップしているとの判断が適切かどうかを確認するようにしてもよい。
複数の同位体分布がオーバーラップしている場合には、上記の隣接するピーク同士はそれぞれ別のイオン由来のものである可能性が高い。そこで、同位体分布がオーバーラップしていることと判定された(ステップS53でYesである)場合には、同位体分布包絡線内の第1ピークだけでなく、これに隣接するピークもモノアイソトピックイオンピークであると判断できる。そこで、第1ピークとともにそれに隣接するピーク、つまりは第2ピークに関する情報も記録し(ステップS54)、その両者をともにピークリストに登録する(ステップS55)。なお、この際に、モノアイソトピックイオンピークであると特定されたピークの質量電荷比値や強度値とともに、ステップS52で得られた質量電荷比差から推定される価数もピーク情報として記録する。
一方、ステップS53においてオーバーラップがないと判定された場合には、第1ピークに隣接するピークはモノアイソトピックイオンピークではなく、同位体イオンピークであると判定する。したがって、同位体分布包絡線内の第1ピークのみをモノアイソトピックイオンピークであるとして記録し(ステップS56)、これのみをピークリストに登録する(ステップS55)。
上記ステップS51〜S56の処理は、例えば図7に示したステップS255でNoと判定された場合にのみ実行されるようにしてもよいし、それとは別に、マススペクトルから抽出可能な全ての同位体分布包絡線に対して実施されるようにしてもよい。いすれにしても、このオーバーラップ識別処理が実施された場合には、その実行後にピークリストに登録されているピーク情報がその実測マススペクトルに対して得られるモノアイソトピックイオンピークの情報となる。
上記オーバーラップ識別処理を図11に例示したマススペクトルに適用する場合について、具体的に説明する。上述したように、図11は実線で示される質量電荷比が1533.7Daであるモノアイソトピックイオンの同位体分布と、点線で示される質量電荷比が1534.7Daであるアイソトピックイオンの同位体分布とがオーバーラップする例である。実測により得られるマススペクトルには、実線と点線で示す2つの同位体分布の和の形状の同位体分布包絡線が現れる。
ステップS51においてマススペクトルから抽出された同位体分布包絡線内の同位体ピーク(例えば第1ピークから第5ピーク)が検出されると、次にステップS52において、各ピークの質量電荷比値が検査されるとともに、第1ピークと第2ピーク、第2ピークと第3ピークなど、隣接する同位体ピーク間の信号強度比が計算される。ここでいま、第1ピークの信号強度I1に対する第2ピークの信号強度I2の比I2/I1をTとする。図13に示すような、異なる質量電荷比範囲における同位体イオンのピーク間の信号強度比の標準的な値に基づいて、各信号強度比に対する閾値Tc(i)が選択される。この例の場合、同位体分布のオーバーラップがなければ、信号強度比は1以下になる筈である。何故なら、質量電荷比が1534Da付近である場合には、同位体分布内でモノアイソトピックイオンピークが必ず最大の信号強度を持つピークとなるからである。
図11中の実線及び点線で示す2つの同位体分布の和である波形がマススペクトルに現れた場合、同位体分布包絡線内における第1ピークと第2ピークとの信号強度比Tは1を十分に超え、閾値Tc(i)より大きくなる。そのため、ステップS53からS54へと進み、同位体分布包絡線内の第1ピーク及び第2ピークが共にモノアイソトピックイオンピークとしてピークリストに残される。一方、仮に図11中に点線で示す同位体分布が存在せず、実線で示す同位体分布のみがマススペクトル上に存在した場合には、信号強度比は閾値Tc(i)未満となる筈である。したがって、この場合には、同位体分布包絡線内の第1ピークのみがピークリストに残される。このようにして、異なるイオンの同位体分布がオーバーラップしている場合であっても、それぞれのイオンのモノアイソトピックイオンピークを漏れなく特定することが可能となる。
以上説明したように、本発明の一実施例である質量分析データ処理方法によれば、実測のマススペクトルから抽出されたピークの質量電荷比が与えられると、上述した特徴的な処理によって、そのピークに対応するイオンの元素組成を導出することができる。そして、このように導出される元素組成の結果を利用して所与のイオンの理論同位体分布を求め、これに基づいて実測マススペクトル上で観測されるモノアイソトピックイオンピークを特定することができる。
また、推定される元素組成に基づく理論同位体分布と上述した特徴的なフィッティング手法とを組み合わせることで、高質量分解能のプロファイルスペクトルデータのみならず、同位体分布において隣接ピークを完全には分離できないような低質量分解能のプロファイルスペクトルデータに対してもモノアイソトピックイオンピークの特定が可能である。
また、上述したプロファイルスペクトルデータ上の同位体分布包絡線内のピークの信号強度比を利用した特徴的なオーバーラップ識別処理を実施することによって、異なるイオンによる同位体分布がオーバーラップしている場合でも、オーバーラップがあることを確実に識別しそれぞれのイオンに対するモノアイソトピックイオンピークを漏れなく特定することができる。
次に、上述した本発明に係る質量分析データ処理方法をMS2分析におけるプリカーサイオンの質量修正に利用した、本発明に係る質量分析データ処理装置を備えた質量分析システムの一実施例について説明する。このシステムは、タンパク質を消化酵素等を利用して断片化することで調製されたペプチド混合物である試料を測定し、試料中のペプチドを同定するためのものである。図14はこの質量分析システムの要部の構成図、図15はこの質量分析システムにおける特徴的なデータ処理のフローチャートである。このデータ処理には、モノアイソトピックイオンピークを特定するための上述した特徴的なデータ処理が組み込まれている。
図14に示すように、本実施例の質量分析システムは、試料に含まれる化合物であるペプチドをイオン化するイオン源10と、イオン源10で生成されたイオンを一時的に保持し、必要に応じて特定の質量電荷比を有するイオンを選択したり、さらにそのイオンをCID等により解離させたりするイオントラップ11と、イオントラップ11から放出されたイオンを質量電荷比に応じて分離して検出する飛行時間型の質量分析器12と、質量分析器12により分離されたイオンを順次検出する検出器13と、これら各部の動作をそれぞれ制御する分析制御部14と、検出器13で得られたデータを処理するデータ処理部15と、を備える。
データ処理部15は、収集された所定の質量電荷比範囲に亘るプロファイルスペクトルデータを格納するデータ格納部151、プロファイルスペクトルデータに基づいてマススペクトル(MS1スペクトル、MS2スペクトル)を作成するスペクトル作成部152、マススペクトル上で観測されるペプチド由来の(厳密にはペプチド由来であると推定される)イオンピークの情報(質量電荷比値、信号強度など)を収集するピーク情報収集部153、実測されたプリカーサイオンの質量を修正する質量修正処理部154と、ピーク情報収集部153で収集されたピーク情報に基づくピークリストを作成するピークリスト作成部155、作成されたピークリストに基づいてペプチドを同定する同定処理部156、などの機能ブロックを含む。質量修正処理部154に、上述した質量分析データ処理方法を実行する質量分析データ処理装置が用いられている。
なお、分析制御部14及びデータ処理部15の機能の少なくとも一部は、パーソナルコンピュータをハードウエア資源とし、該コンピュータに予めインストールされた専用の処理・制御ソフトウエアを該コンピュータ上で実行することにより、実現することができる。即ち、上述した本発明に係る質量分析データ処理方法は例えばデジタルシグナルプロセッサのような専用のハードウエアで実現することもできるが、汎用的なコンピュータにおいて所定のソフトウエアを動作させることでも実現することができる。
同定処理部156は、例えば既知であるペプチドの化学式、化学構造などの情報が登録されたデータベースを利用してペプチドを同定するものであり、その同定を実施するための情報として同定対象のペプチドについて得られたピークリストが提供される。同定の際には各イオンの質量が重要な手掛かりとなるため、その質量の精度は同定精度に大きく影響する。例えばMS1分析により得られたMS1スペクトル上で観測されるピークの中で特定の基準に適合する(例えば信号強度が所定閾値以上である等)ピークを自動的に選択して、そのピークをプリカーサイオンとしてMS2分析を実行するような場合、MS2分析結果、つまりMS2分析によるプロファイルスペクトルデータが格納されるファイルには、分析条件の一つとしてプリカーサイオンの質量電荷比値も格納される。しかしながら、このときに格納される質量電荷比値は十分な精度とはいえず、これがそのままピークリストに登録されると同定精度に影響を与える可能性がある。本実施例のシステムでは、質量修正処理部154が以下のような処理によって、このプリカーサイオンの質量電荷比値を修正する。
即ち、本実施例の質量分析システムでは、分析制御部14による制御の下に、イオン源10、イオントラップ11、質量分析器12、及び検出器13が動作することでMS1分析が実行され、さらに、MS1分析により得られたMS1スペクトル上で観測される一又は複数のイオンをプリカーサイオンとしたMS2分析が引き続き実行される。それにより、所定の質量電荷比範囲に亘るMS1プロファイルスペクトルデータ、及びMS2プロファイルスペクトルデータがデータ格納部151に格納される(ステップS61)。
こうしてデータ格納部151に格納されているデータに基づくペプチド同定処理が開始されると、スペクトル作成部152はデータ格納部151からMS2プロファイルスペクトルデータを読み出してMS2スペクトルを作成し、ピーク情報収集部153はMS2スペクトルに対してピーク検出を実施し、該スペクトル上で観測される各種プロダクトイオンピークの情報を収集する(ステップS62)。
実質的にステップS62の処理と並行して、質量修正処理部154はデータ格納部151からMS2プロファイルスペクトルデータを取得する際にターゲットとなったプリカーサイオンの質量電荷比値Mpを読み出す(ステップS63)。さらに並行して、スペクトル作成部152はデータ格納部151からMS1プロファイルスペクトルデータを読み出してMS1スペクトルを作成して質量修正処理部154へと渡す(ステップS64)。質量修正処理部154は、受け取ったMS1スペクトルにおいて、プリカーサイオンの質量電荷比値Mpを含む所定の質量電荷比範囲内に現れる複数のピークを含む同位体分布包絡線を抽出する(ステップS65)。このときの質量電荷比範囲は、MS1スペクトルにおいて一つの同位体ピーククラスタに含まれる全ての利用可能な(通常観測され得る)ピークを含むように設定されることが好ましい。
実測のMS1スペクトル上で処理対象の同位体分布包絡線が得られたならば、質量修正処理部154は、前述したような特徴的な一連のデータ処理を実行することにより、その同位体分布包絡線内における一つ又は複数のモノアイソトピックイオンピークを特定する。また、必要に応じて、そのイオンの荷電状態(価数)も判定する(ステップS66)。この特定されたモノアイソトピックイオンピークが示す質量電荷比値は、質量電荷比値がMpであるとして記録されていたプリカーサイオンのより精密な質量電荷比値である。
上述したようにステップS62の処理により、MS2スペクトルからプロダクトイオンピークの情報が得られているから、ピークリスト作成部155は、このピーク情報とステップS66で判明したプリカーサイオンの高精度の質量電荷比値とを併せてピークリストを作成する(ステップS67)。同定処理部156は、作成されたピークリストに基づくデータベース検索などの解析処理を実行することにより、プリカーサイオンの元であるペプチドを同定する。或いは、該当すると推定されるペプチドの候補を挙げる(ステップS68)。
上述したように、同定の重要な手掛かりであるプリカーサイオンの質量電荷比値の精度は従来よりも向上するため、同定の精度も向上し、例えば従来であれば同定できなかったペプチドが同定できるようになる、或いは、複数の候補の中で正解である候補のランクが上がる、といった効果が得られる。
なお、ステップS62において、MS2スペクトル上で観測される各種プロダクトイオンピークの質量電荷比値を求める際にも、プリカーサイオンの精密な質量電荷比値を求めたのと同様の手法を用いて、各プロダクトイオンピークの精密な質量電荷比値を算出することが好ましい。
また、分析条件等によって、記録されるプリカーサイオンの質量電荷比値Mpとプリカーサイオンの真の質量電荷比値との差が大きい場合と、それほど差が大きくない場合とがあるが、上述した特徴的な質量分析データ処理方法によれば、その差が大きい場合には質量電荷比値はより正確な値に修正されるし、差が大きくない場合には元の正確さが維持されることになる。
また、上記説明は、MS1スペクトルで観測されるプリカーサイオンの質量電荷比値を修正する場合の例であるが、同様の手法を用いて、MS2スペクトルで観測されるイオンの中からプリカーサイオンを選択してMS3分析を実行した際のプリカーサイオンの質量電荷比値の修正や、MS3スペクトルで観測されるイオンの中からプリカーサイオンを選択してMS4分析を実行した際のプリカーサイオンの質量電荷比値の修正など、任意のMSn分析におけるプリカーサイオンの質量電荷比値を修正するために本発明に係る質量分析データ処理方法を適用することができる。さらにまた、この処理によって、各プリカーサイオンの荷電状態、つまりは価数を判定したり確認したりすることもできる。
また、図14の構成はイオントラップと飛行時間型質量分析器とを組み合わせたイオントラップ飛行時間型質量分析装置であるが、それ以外の任意の構成・構造のMSn型質量分析装置で得られたプロファイルスペクトルデータに対し上記データ処理を適用可能であることは明らかである。具体的には、例えば三連四重極型質量分析装置やイオントラップ自体で質量分離を実行するイオントラップ質量分析装置などにも本発明を適用可能であることは当然である。
さらにまた、本発明に係る質量分析データ処理方法及び質量分析データ処理装置では、モノアイソトピックイオンピークの特定が可能であるが、その特定は必ずしもそのイオンの正確な質量電荷比値を求めることを目的とするものでなくてもよい。
さらにまた、上記実施例は単に本発明の一例にすぎず、本発明の趣旨に沿った範囲で適宜変形や修正、追加を行っても本願特許請求の範囲に包含されることは明らかである。
10…イオン源
11…イオントラップ
12…質量分析器
13…検出器
14…分析制御部
15…データ処理部
151…データ格納部
152…スペクトル作成部
153…ピーク情報収集部
154…質量修正処理部
155…ピークリスト作成部
156…同定処理部

Claims (20)

  1. 試料に対する質量分析を行うことで収集されたプロファイルスペクトルデータを処理する質量分析データ処理方法であって、
    a)前記プロファイルスペクトルデータから目的化合物由来であると推定されるイオンピークを抽出し、そのピークに対応する実測質量を求める対象ピーク設定ステップと、
    b)目的化合物と主要な元素が共通する同じカテゴリーに属する1又は複数の化合物の既知の質量と元素組成とから導出された質量と元素組成との近似的な関係に基づいて、前記対象ピーク設定ステップにおいて得られた実測質量に対応する元素組成を推定する組成推定ステップと、
    c)前記組成推定ステップにおいて得られた元素組成に基づき、各元素の既知の同位体比を用いて理論同位体分布を導出する理論同位体分布導出ステップと、
    d)前記対象ピーク設定ステップにおいて抽出されたイオンピークが含まれる所定の質量電荷比範囲内に存在する複数のピーク又はそれらピークを含む曲線を前記理論同位体分布導出ステップにおいて得られた理論同位体分布にフィッティングし、その結果に基づいて、前記抽出されたイオンピークが単一の化合物から発生した同位体ピーククラスタ中のモノアイソトピックイオンピークであるか否かを判定する、及び/又は、前記抽出されたイオンピークが前記所定の質量電荷比範囲内に存在する複数の化合物から発生した複数の同位体ピーククラスタが重畳して構成されたピーククラスタ中のピークであるか否かを判定する判定処理ステップと、
    を有することを特徴とする質量分析データ処理方法。
  2. 請求項1に記載の質量分析データ処理方法であって、
    前記カテゴリーは、タンパク質、該タンパク質の分解生成物であるペプチド、又は核酸のいずれかあり、前記主要な元素は、炭素、水素、窒素、及び酸素であることを特徴とする質量分析データ処理方法。
  3. 請求項1又は2に記載の質量分析データ処理方法であって、
    前記組成推定ステップは、前記質量と元素組成との近似的な関係を利用して、前記対象ピーク設定ステップにおいて得られた実測質量値に対応する元素組成を初期的に推定し、その推定された元素組成から計算される質量と実測質量値との差を求め、この差が所定の閾値以下に収まるように元素組成を修正することで最も確からしい元素組成を求めることを特徴とする質量分析データ処理方法。
  4. 請求項3に記載の質量分析データ処理方法であって、
    前記主要な元素は、炭素、水素、窒素、及び酸素であり、前記組成推定ステップは、炭素、水素、窒素、及び酸素からなる元素組成を初期的に推定し、その推定された元素組成から計算される質量と実測質量値との差が所定の閾値以下に収まらない場合に、硫黄を加えて元素組成を推定することを特徴とする質量分析データ処理方法。
  5. 請求項3に記載の質量分析データ処理方法であって、
    前記組成推定ステップは、推定された元素組成に含まれる各元素の個数を1個又は複数個減らす又は増やすことで元素組成を修正し、修正された元素組成に対応する質量を計算し、その計算された質量と実測質量値との差が所定の閾値以下に収まるまで、元素の個数の増減と質量差の計算及び確認を繰り返すことで、最終的に最も確からしい元素組成を求めることを特徴とする質量分析データ処理方法。
  6. 請求項1〜5のいずれかに記載の質量分析データ処理方法であって、
    前記組成推定ステップにおいて利用される、前記質量と元素組成との近似的な関係は、元素毎に、化合物の質量と該化合物に含まれる当該元素の個数との関係を近似的に表したものであることを特徴とする質量分析データ処理方法。
  7. 請求項1〜6のいずれかに記載の質量分析データ処理方法であって、
    前記対象ピーク設定ステップは、前記プロファイルスペクトルデータから同一の元素組成を有するイオンに対応すると推測される複数のピークからなる同位体分布包絡線を求め、該同位体分布包絡線内で質量電荷比が最小である第1ピークを前記目的化合物由来であると推定されるイオンピークとして抽出することを特徴とする質量分析データ処理方法。
  8. 請求項1〜7のいずれかに記載の質量分析データ処理方法であって、
    前記判定処理ステップは、
    前記プロファイルスペクトルデータからの前記所定の質量電荷比範囲内に存在する複数のピークの頂点を取得するとともに、前記理論同位体分布からも複数のピークの頂点を取得し、
    前記理論同位体分布から取得した複数のピークの頂点の質量電荷比値及び信号強度値をそれぞれ相対化して求めた複数のデータ点に対しカーブフィッティングを行うことで近似曲線を取得し、
    前記プロファイルスペクトルデータによる複数のピークの頂点の質量電荷比値及び信号強度値をそれぞれ相対化して求めた複数のデータ点を前記近似曲線にフィッティングし、その結果に基づいて、前記プロファイルスペクトルデータから取得した複数のピークが一つの同位体ピーククラスタを構成するか否かを判定することを特徴とする質量分析データ処理方法。
  9. 請求項1〜のいずれかに記載の質量分析データ処理方法であって、
    前記対象ピーク設定ステップにおいて抽出されたイオンピークが含まれる所定の質量電荷比範囲内に存在する複数のピークの中で、該抽出されたイオンピークと該ピークを除き信号強度が最大である他のピークとの信号強度比を算出し、該信号強度比に基づいて、それら複数のピークが一つの同位体ピーククラスタを構成するものであるか否かを判定するオーバーラップ判定ステップをさらに有することを特徴とする質量分析データ処理方法。
  10. 請求項に記載の質量分析データ処理方法であって、
    前記オーバーラップ判定ステップは、前記所定の質量電荷比範囲内に存在する複数のピークの中で、質量電荷比が最小である第1ピークを前記抽出されたイオンピークとし、該ピークを除き信号強度が最大である他のピークとして第1ピークに隣接する第2ピークを選択し、その第1ピークと第2ピークの信号強度比に基づいて、前記複数のピークが一つの同位体ピーククラスタを構成するものであるか否かを判定し、一つの同位体ピーククラスタを構成しないと判定された場合に、前記第1ピーク及び第2ピークをそれぞれ異なるモノアイソトピックイオンピークであると特定することを特徴とする質量分析データ処理方法。
  11. 試料に対する質量分析を行うことで収集されたプロファイルスペクトルデータを処理する質量分析データ処理装置において、
    a)前記プロファイルスペクトルデータから目的化合物由来であると推定されるイオンピークを抽出し、そのピークに対応する実測質量を求める対象ピーク設定部と、
    b)目的化合物と主要な元素が共通する同じカテゴリーに属する1又は複数の化合物の既知の質量と元素組成とから導出された質量と元素組成との近似的な関係に基づいて、前記対象ピーク設定部により得られた実測質量に対応する元素組成を推定する組成推定部と、
    c)前記組成推定部により得られた元素組成に基づき、各元素の既知の同位体比を用いて理論同位体分布を導出する理論同位体分布導出部と、
    d)前記対象ピーク設定部により抽出されたイオンピークが含まれる所定の質量電荷比範囲内に存在する複数のピーク又はそれらピークを含む曲線を前記理論同位体分布導出部により得られた理論同位体分布にフィッティングし、その結果に基づいて、前記抽出されたイオンピークが単一の化合物から発生した同位体ピーククラスタ中のモノアイソトピックイオンピークであるか否かを判定する、及び/又は、前記抽出されたイオンピークが前記所定の質量電荷比範囲内に存在する複数の化合物から発生した複数の同位体ピーククラスタが重畳して構成されたピーククラスタ中のピークであるか否かを判定する判定処理部と、
    を備えることを特徴とする質量分析データ処理装置。
  12. 請求項11に記載の質量分析データ処理装置であって、
    前記カテゴリーは、タンパク質、該タンパク質の分解生成物であるペプチド、又は核酸のいずれかあり、前記主要な元素は、炭素、水素、窒素、及び酸素であることを特徴とする質量分析データ処理装置。
  13. 請求項11又は12に記載の質量分析データ処理装置であって、
    前記組成推定部は、前記質量と元素組成との近似的な関係を利用して、前記対象ピーク設定部により得られた実測質量値に対応する元素組成を初期的に推定し、その推定された元素組成から計算される質量と実測質量値との差を求め、この差が所定の閾値以下に収まるように元素組成を修正することで最も確からしい元素組成を求めることを特徴とする質量分析データ処理装置。
  14. 請求項13に記載の質量分析データ処理装置であって、
    前記主要な元素は、炭素、水素、窒素、及び酸素であり、前記組成推定部は、炭素、水素、窒素、及び酸素からなる元素組成を初期的に推定し、その推定された元素組成から計算される質量と実測質量値との差が所定の閾値以下に収まらない場合に、硫黄を加えて元素組成を推定することを特徴とする質量分析データ処理装置。
  15. 請求項13に記載の質量分析データ処理装置であって、
    前記組成推定部は、推定された元素組成に含まれる各元素の個数を1個又は複数個減らす又は増やすことで元素組成を修正し、修正された元素組成に対応する質量を計算し、その計算された質量と実測質量値との差が所定の閾値以下に収まるまで、元素の個数の増減と質量差の計算及び確認を繰り返すことで、最終的に最も確からしい元素組成を求めることを特徴とする質量分析データ処理装置。
  16. 請求項11〜15のいずれかに記載の質量分析データ処理装置であって、
    前記組成推定部において利用される、前記質量と元素組成との近似的な関係は、元素毎に、化合物の質量と該化合物に含まれる当該元素の個数との関係を近似的に表したものであることを特徴とする質量分析データ処理装置。
  17. 請求項11〜16のいずれかに記載の質量分析データ処理装置であって、
    前記対象ピーク設定部は、前記プロファイルスペクトルデータから同一の元素組成を有するイオンに対応すると推測される複数のピークからなる同位体分布包絡線を求め、該同位体分布包絡線内で質量電荷比が最小である第1ピークを前記目的化合物由来であると推定されるイオンピークとして抽出することを特徴とする質量分析データ処理装置。
  18. 請求項11〜17のいずれかに記載の質量分析データ処理装置であって、
    前記判定処理部は、
    前記プロファイルスペクトルデータからの前記所定の質量電荷比範囲内に存在する複数のピークの頂点を取得するとともに、前記理論同位体分布からも複数のピークの頂点を取得し、
    前記理論同位体分布から取得した複数のピークの頂点の質量電荷比値及び信号強度値をそれぞれ相対化して求めた複数のデータ点に対しカーブフィッティングを行うことで近似曲線を取得し、
    前記プロファイルスペクトルデータによる複数のピークの頂点の質量電荷比値及び信号強度値をそれぞれ相対化して求めた複数のデータ点を前記近似曲線にフィッティングし、その結果に基づいて、前記プロファイルスペクトルデータから取得した複数のピークが一つの同位体ピーククラスタを構成するか否かを判定することを特徴とする質量分析データ処理装置。
  19. 請求項11〜18のいずれかに記載の質量分析データ処理装置であって、
    前記対象ピーク設定部により抽出されたイオンピークが含まれる所定の質量電荷比範囲内に存在する複数のピークの中で、該抽出されたイオンピークと該ピークを除き信号強度が最大である他のピークとの信号強度比を算出し、該信号強度比に基づいて、それら複数のピークが一つの同位体ピーククラスタを構成するものであるか否かを判定するオーバーラップ判定部をさらに備えることを特徴とする質量分析データ処理装置。
  20. 請求項19に記載の質量分析データ処理装置であって、
    前記オーバーラップ判定部は、前記所定の質量電荷比範囲内に存在する複数のピークの中で、質量電荷比が最小である第1ピークを前記抽出されたイオンピークとし、該ピークを除き信号強度が最大である他のピークとして第1ピークに隣接する第2ピークを選択し、その第1ピークと第2ピークの信号強度比に基づいて、前記複数のピークが一つの同位体ピーククラスタを構成するものであるか否かを判定し、一つの同位体ピーククラスタを構成しないと判定された場合に、前記第1ピーク及び第2ピークをそれぞれ異なるモノアイソトピックイオンピークであると特定することを特徴とする質量分析データ処理装置。
JP2013078841A 2012-04-27 2013-04-04 質量分析データ処理方法及び質量分析データ処理装置 Expired - Fee Related JP6020315B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261639757P 2012-04-27 2012-04-27
US61/639,757 2012-04-27

Publications (3)

Publication Number Publication Date
JP2013231715A JP2013231715A (ja) 2013-11-14
JP2013231715A5 JP2013231715A5 (ja) 2015-08-13
JP6020315B2 true JP6020315B2 (ja) 2016-11-02

Family

ID=49678264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013078841A Expired - Fee Related JP6020315B2 (ja) 2012-04-27 2013-04-04 質量分析データ処理方法及び質量分析データ処理装置

Country Status (1)

Country Link
JP (1) JP6020315B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11211237B2 (en) * 2019-01-30 2021-12-28 Bruker Daltonik Gmbh Mass spectrometric method for determining the presence or absence of a chemical element in an analyte

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9754774B2 (en) 2014-02-14 2017-09-05 Perkinelmer Health Sciences, Inc. Systems and methods for automated analysis of output in single particle inductively coupled plasma mass spectrometry and similar data sets
CN109991151B (zh) * 2014-02-14 2021-11-16 珀金埃尔默健康科学公司 用于自动分析光谱数据的系统及方法
CA2950859A1 (en) * 2014-06-02 2015-12-10 Dh Technologies Development Pte. Ltd. Method for converting mass spectral libraries into accurate mass spectral libraries
JP6595922B2 (ja) * 2016-01-22 2019-10-23 日本電子株式会社 マススペクトル解析装置、マススペクトル解析方法、質量分析装置、およびプログラム
JP6718694B2 (ja) * 2016-02-10 2020-07-08 日本電子株式会社 マススペクトル解析装置、マススペクトル解析方法、および質量分析装置
JP7144302B2 (ja) * 2018-12-12 2022-09-29 日本電子株式会社 マススペクトル解析装置及び方法
CN111751576B (zh) * 2019-03-27 2023-07-11 台湾积体电路制造股份有限公司 原子探针分析方法、装置及记录媒体
WO2021240576A1 (ja) * 2020-05-25 2021-12-02 株式会社島津製作所 クロマトグラフ質量分析データ処理方法、クロマトグラフ質量分析装置、及びクロマトグラフ質量分析データ処理用プログラム
US20230178348A1 (en) * 2020-05-28 2023-06-08 Shimadzu Corporation Chromatograph mass spectrometry data processing method, chromatograph mass spectrometer, and chromatograph mass spectrometry data processing program
CN111638264B (zh) * 2020-06-22 2023-08-01 郑州轻工业大学 一种基于离子峰谱线的faims图谱特征提取方法
KR20230017350A (ko) 2020-07-17 2023-02-03 주식회사 히타치하이테크 질량 분석 방법 및 질량 분석 장치

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005069891A2 (en) * 2004-01-15 2005-08-04 Cedars-Sinai Medical Center System and method for expression proteomics based on isotope ratio modification
JP4720254B2 (ja) * 2005-03-31 2011-07-13 日本電気株式会社 分析方法、分析システム、及び分析プログラム
JP4821400B2 (ja) * 2006-03-28 2011-11-24 株式会社島津製作所 構造解析システム
JP5704917B2 (ja) * 2007-06-02 2015-04-22 セルノ・バイオサイエンス・エルエルシー 質量分析のための自己較正アプローチ
JP5246026B2 (ja) * 2009-05-11 2013-07-24 株式会社島津製作所 質量分析データ処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11211237B2 (en) * 2019-01-30 2021-12-28 Bruker Daltonik Gmbh Mass spectrometric method for determining the presence or absence of a chemical element in an analyte

Also Published As

Publication number Publication date
JP2013231715A (ja) 2013-11-14

Similar Documents

Publication Publication Date Title
JP6020315B2 (ja) 質量分析データ処理方法及び質量分析データ処理装置
JP4818270B2 (ja) 選択されたイオンクロマトグラムを使用して先駆物質および断片イオンをグループ化するシステムおよび方法
US8193485B2 (en) Method and apparatus for identifying proteins in mixtures
US8067729B2 (en) Mass analysis data analyzing apparatus and program thereof
JP6115288B2 (ja) 質量分析におけるピーク検出方法及びそのシステム
EP2909618B1 (en) Accurate and interference-free multiplexed quantitative proteomics using mass spectrometry
JPWO2009081446A1 (ja) 質量分析システム
JP6191486B2 (ja) 質量分析装置及び質量分析方法
JP4821400B2 (ja) 構造解析システム
JP5751126B2 (ja) 質量分析データ解析方法及び解析装置
JP4857872B2 (ja) 質量分析を利用したアミノ酸配列解析システム
US10504711B2 (en) Mass spectrometric method and MALDI-TOF mass spectrometer
JP5696592B2 (ja) 質量分析データ解析方法及び解析装置
JP2007278712A5 (ja)
Haskins et al. MRCQuant-an accurate LC-MS relative isotopic quantification algorithm on TOF instruments
US11600359B2 (en) Methods and systems for analysis of mass spectrometry data
US11378581B2 (en) Monoisotopic mass determination of macromolecules via mass spectrometry
Chen et al. Random Forest model for quality control of high resolution mass spectra from SILAC labeling experiments
JP7364086B2 (ja) 質量分析装置の機差補正方法
US20230298876A1 (en) Systems and methods for charge state assignment in mass spectrometry
JP2014115087A (ja) ペプチド構造解析方法及び装置
Shinkawa et al. A software program for more reliable precursor ion assignation from LC-MS analysis using LTQ ultra zoom scan
LaMarche Methods for comparing metaproteomic data in the absence of metagenomic information
Hsi Peptide identification of tandem mass spectrometry from quadrupole time-of-flight mass spectrometers

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160919

R151 Written notification of patent or utility model registration

Ref document number: 6020315

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees