JP2008107305A

JP2008107305A - タンパク質相対定量方法、そのプログラム及びそのシステム

Info

Publication number: JP2008107305A
Application number: JP2006292930A
Authority: JP
Inventors: Satoru Miyano; 悟宮野; Masao Nagasaki; 正朗長崎; Ayumu Saito; あゆむ斉藤
Original assignee: University of Tokyo NUC
Current assignee: University of Tokyo NUC
Priority date: 2006-10-27
Filing date: 2006-10-27
Publication date: 2008-05-08
Anticipated expiration: 2026-10-27
Also published as: JP4876253B2

Abstract

【課題】タンパク質の相対定量を行うのに適したＭＳデータを選出する。
【解決手段】同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物をＬＣ／ＭＳ／ＭＳ装置に供することにより得られたＭＳデータに基づくタンパク質の相対定量を、コンピュータソフトウェアを用いて行う。具体的には、ペプチド断片を決定する際に用いられたＭＳデータを暫定基準ＭＳデータとし（Ｓ３１０）、そのＬＣ保持時間の前後所定の範囲に存在するＭＳデータの各々につき明確性指標を算出し、その最も大きな値を基準値とする（Ｓ３１５〜Ｓ３４０）。その基準値の算出に用いられたＭＳデータ（基準ＭＳデータ）のＬＣ保持時間の前後に存在するＭＳデータの各々につき明確性指標を算出し、算出した明確性指標と基準値とに基づいてタンパク質の相対定量に用いるＭＳデータを選出する。
【選択図】図４

Description

本発明は、タンパク質相対定量方法、そのプログラム及びそのシステムに関する。

近年の質量分析技術の進展に伴い、液体クロマトグラフィ（ＬＣ）装置とタンデム型の質量分析（ＭＳ）装置とを連結させたＬＣ／ＭＳ／ＭＳ装置が使用されるようになった。ＭＳスペクトルデータはノイズを含め複数のピークを有する非常に複雑なスペクトルデータである。また、ＬＣ装置と連結したことにより、大量のスペクトルデータが容易に得られるようになったが、これらのスペクトルデータを解析する手法は手作業で行われている。この作業は熟練した技術と多くの手間が必要となるため、データ解析の自動化・高速化が求められており、従来よりスペクトルを解析する手法が開発されてきた。例えば、特許文献１に記載された解析手法では、ＭＳスペクトルデータが与えられたときに、自動でピークを同定することができる。
特開２００６−１７０７１０号公報

ところで、ＬＣ／ＭＳ／ＭＳを用いてタンパク質の相対定量を行うためには、ＬＣ／ＭＳ／ＭＳスペクトル測定で得られるスペクトルデータはＬＣ保持時間毎に連続するデータであるため、従来の手法で精度よく相対定量を行うためには、どのＬＣ保持時間のＭＳスペクトルを解析するかをユーザ自身が選出し、その選出したＭＳスペクトルデータのそれぞれについてスペクトル解析を行う必要がある。なぜなら、ＬＣ／ＭＳ／ＭＳスペクトル測定で得られるデータは、連続したスペクトルデータであり、精度の高い解析を行うためには、個々のスペクトルデータだけでなく前後のスペクトルデータをも合わせた総合的な解析を行う必要があるためである。しかしながら、既に述べたように、ＭＳスペクトルデータは非常に複雑なデータであるため、連続する大量のデータを解析するのは、非常に手間のかかる作業である。

本発明は、このような課題に鑑みてなされたものであり、分析装置により得られたＭＳデータのうちタンパク質相対定量を行うのに適したＭＳデータを選出するタンパク質相対定量方法、そのプログラム及びそのシステムを提供することを目的の一つとする。また、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質の量比を容易に求めることができるタンパク質相対定量方法、そのプログラム及びそのシステムを提供することを目的の一つとする。

本発明は、上述の目的の少なくとも一つを達成するために以下の手段を採った。

本発明のタンパク質相対定量方法は、
同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物をＬＣ装置とＭＳ装置とを含む分析装置に供することにより得られたＭＳデータに基づく前記タンパク質の相対定量を、コンピュータソフトウェアを用いて行うタンパク質相対定量方法であって、
（ａ）前記ペプチド断片を決定する際に用いられたＭＳデータを暫定基準ＭＳデータとして選出するステップと、
（ｂ）前記暫定基準ＭＳデータのＬＣ保持時間の前後所定の範囲に存在するＭＳデータの各々につき、所定のｍ／ｚ領域の全範囲の強度の積分値Ｌｔｏｔａｌを求めると共に同じアミノ酸配列のペプチド断片であって異なる質量の同位体が導入されたもののピーク強度の積分値の合計ΣＰを求め、両者の比Ｌｒａｔｅ（＝ΣＰ／Ｌｔｏｔａｌ）を明確性指標として算出し、該明確性指標のうち最も大きな値を明確性指標の基準値ｅｍａｘとするステップと、
（ｃ）前記基準値ｅｍａｘの算出に用いられたＭＳデータを基準ＭＳデータとし、該基準ＭＳデータのＬＣ保持時間の前後に存在するＭＳデータの各々につき前記明確性指標を算出し、算出した明確性指標と基準値ｅｍａｘとに基づいて前記タンパク質の相対定量に用いるＭＳデータを選出するステップと
を含むものである。

このタンパク質相対定量方法では、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物をＬＣ装置とマススペクトル装置とを含む分析装置に供することにより得られたＭＳデータの中から、そのタンパク質の相対定量に用いるのに相応しいＭＳデータを選出するが、前提として、そのタンパク質を構成する各ペプチド断片がどのようなアミノ酸配列を有しているかは分析装置から得られたＭＳデータに基づいて予め予測されているものとする。さて、このタンパク質相対定量方法では、まず、ペプチド断片を予測する際に用いられたＭＳデータを暫定基準ＭＳデータとして選出する。次いで、選出した暫定基準ＭＳデータのＬＣ保持時間の前後所定の範囲に存在するＭＳデータの各々につき明確性指標を算出し、該明確性指標のうち最も大きな値を明確性指標の基準値ｅｍａｘとする。そして、この基準値ｅｍａｘの算出に用いられたＭＳデータを基準ＭＳデータとし、該基準ＭＳデータのＬＣ保持時間の前後に存在するＭＳデータの各々につき明確性指標を算出し、算出した明確性指標と基準値ｅｍａｘとに基づいてタンパク質の相対定量に用いるＭＳデータを選出する。こうすることにより、非常に複雑で膨大なＭＳデータの中からタンパク質の相対定量を行うに適したＭＳデータを人手を介することなく適切かつ迅速に得ることができる。また、人手を介する場合にはその人の意思を排除できないため誰が作業をするかによって選出されるＭＳデータが変わり、それがタンパク質の相対定量の精度低下の一因となっていたが、そのような精度低下を招くこともない。

なお、同位体としては、安定同位体が好ましく、例えば炭素原子であれば¹²Ｃと¹³Ｃ、窒素原子であれば¹⁴Ｎと¹⁵Ｎ、酸素原子であれば¹⁶Ｏと¹⁸Ｏが好ましい。

本発明のタンパク質相対定量方法において、前記ステップ（ｂ）では、前記暫定基準ＭＳデータのＬＣ保持時間の前後所定の範囲に存在するＭＳデータを、ＬＣ保持時間の長さ順に並べた前記ＭＳデータのうち前記暫定基準ＭＳデータのＬＣ保持時間を中心とした前後所定数のＭＳデータとしてもよい。こうすれば、明確性指標の基準値ｅｍａｘを算出するためのＭＳデータを容易に選出することができる。なお、前後所定の範囲とは、特に限定するものではないが、例えば前後３個の範囲から前後１０個の範囲までの中から適宜決めてもよい。

本発明のタンパク質相対定量方法において、前記ステップ（ｂ）では、前記同じアミノ酸配列のペプチド断片であって異なる同位体が導入されたもののピークの強度の積分値を求めるにあたり、天然同位体の存在も考慮して該ピークの強度の積分値を求めてもよい。こうすれば、天然同位体の存在を考慮しない場合に比べて明確性指標の値の信頼性が高くなり、ひいてはタンパク質の相対定量の精度が高くなる。

本発明のタンパク質相対定量方法において、前記ステップ（ｃ）では、前記算出した明確性指標と基準値ｅｍａｘとに基づいて前記タンパク質の相対定量に用いるＭＳデータを選出するにあたり、前記算出した明確性指標が基準値ｅｍａｘに予め定められた１未満の係数を乗じた値を閾値とし該閾値を超えるか又は該閾値以上のときに該明確性指標の算出に用いたＭＳデータを前記タンパク質の相対定量に用いるＭＳデータとして選出してもよい。こうすれば、タンパク質の相対定量を行うに相応しいＭＳデータを容易に選出することができる。

本発明のタンパク質相対定量方法において、前記ステップ（ｃ）では、前記タンパク質の相対定量に用いるＭＳデータを選出するにあたり、前記基準ＭＳデータのＬＣ保持時間の前後所定の範囲に存在するＭＳデータを超えて選出しないようにしてもよい。こうすれば、不必要に多くのＭＳデータを対象として明確性指標を算出することがなくなるため、処理時間が短くなる。ここで、前後所定の範囲は、例えばある範囲を超えたＭＳデータの明確性指標については基準値ｅｍａｘとの関係からしてタンパク質の相対定量に用いるＭＳデータとして選出する必要がほとんどゼロであるということが経験的に判明している場合には、その範囲を所定の範囲として設定すればよい。

本発明のタンパク質相対定量方法は、前記ステップ（ａ）〜（ｃ）に加えて、（ｄ）前記ステップ（ｃ）で選出した前記タンパク質の相対定量に用いるＭＳデータの各々につき、同じアミノ酸配列を持つが異なる同位体が導入された二以上のペプチド断片のピークの強度の積分値の比を同位体比として算出し、該同位体比に基づいて前記タンパク質の量比を求めるステップを含んでいてもよい。こうすれば、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質の量比を容易に求めることができる。この態様を採用した本発明のタンパク質相対定量方法において、前記ステップ（ｄ）では、前記同位体比に基づいて前記タンパク質の相対定量を行うにあたり、前記タンパク質を構成する各ペプチド断片について前記同位体比を算出し該算出した同位体比に統計的な処理を施した値（例えば平均値など）を前記タンパク質の量比としてもよい。

本発明のタンパク質相対定量方法において、前記分析装置は、ＬＣ装置と該ＬＣ装置で分離された成分が供されるタンデム型のＭＳ／ＭＳ装置とで構成されるＬＣ／ＭＳ／ＭＳ装置であり、前記ＭＳデータは、前記タンデム型のＭＳ／ＭＳ装置の一つ目の質量分析計で得られるＭＳデータであってもよい。ＬＣ／ＭＳ／ＭＳ装置の一つ目の質量分析計で得られるＭＳデータは膨大な量であることが多いため、本発明を適用する意義が高い。また、本発明は、後述する実施形態で説明するＳｔａｂｌｅＩｓｏｔｏｐｅＬａｂｅｌｉｎｇｂｙＡｍｉｎｏＡｃｉｄｓｉｎＣｅｌｌＣａｌｔｕｒｅ法（ＳＩＬＡＣ法）のほか、ＩＣＡＴ（ＵｎｉｖｅｒｓｉｔｙｏｆＷａｓｈｉｎｇｔｏｎ社の登録商標）法やｉＴＲＡＱ（ＡｐｐｌｅｒａＣｏｒｐｏｒａｔｉｏｎ社の登録商標）法、ａｎａｐｐｒｏａｃｈｂａｓｅｄｏｎｔｈｅｕｓｅｏｆｃｕｌｔｕｒｅ−ｄｅｒｖｅｄｉｓｏｔｏｐｅｔａｇｓ法（ＣＤＩＴ法）などに適用可能である。

本発明のプログラムは、上述したいずれかのタンパク質相対定量方法を１又は複数のコンピュータに実行させるためのプログラムである。このプログラムは、コンピュータが読み取り可能な記録媒体（例えばハードディスク、ＲＯＭ、ＦＤ、ＣＤ、ＤＶＤなど）に記録されていてもよいし、伝送媒体（インターネットやＬＡＮなどの通信網）を介してあるコンピュータから別のコンピュータへ配信されてもよいし、その他どのような形で授受されてもよい。このプログラムを一つのコンピュータに実行させるか又は複数のコンピュータに各ステップを分担して実行させれば、上述したいずれかのタンパク質相対定量方法と同様の効果が得られる。

本発明のタンパク質相対定量システムは、
同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物をＬＣ装置とＭＳ装置とを含む分析装置に供することにより得られたＭＳデータに基づく前記タンパク質の相対定量を行うタンパク質相対定量システムであって、
前記ペプチド断片を決定する際に用いられたＭＳデータを暫定基準ＭＳデータとして選出する暫定基準データ選出手段と、
前記暫定基準ＭＳデータのＬＣ保持時間の前後所定の範囲に存在するＭＳデータの各々につき、所定のｍ／ｚ領域の全範囲の強度の積分値Ｌｔｏｔａｌを求めると共に同じアミノ酸配列のペプチド断片であって異なる質量の同位体が導入されたもののピーク強度の積分値の合計ΣＰを求め、両者の比Ｌｒａｔｅ（＝ΣＰ／Ｌｔｏｔａｌ）を明確性指標として算出し、該明確性指標のうち最も大きな値を明確性指標の基準値ｅｍａｘとする基準値算出手段と、
前記基準値ｅｍａｘの算出に用いられたＭＳデータを基準ＭＳデータとし、該基準ＭＳデータのＬＣ保持時間の前後に存在するＭＳデータの各々につき、前記明確性指標を算出し、算出した明確性指標と基準値ｅｍａｘとに基づいて前記タンパク質の相対定量に用いるＭＳデータを選出する相対定量用データ選出手段と、
を備えたものである。

このタンパク質相対定量システムでは、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物をＬＣ装置とＭＳ装置とを含む分析装置に供することにより得られたＭＳデータの中から、そのタンパク質の相対定量に用いるのに相応しいＭＳデータを選出するが、前提として、そのタンパク質を構成する各ペプチド断片がどのようなアミノ酸配列を有しているかは分析装置から得られたＭＳデータに基づいて予め予測されているものとする。さて、このタンパク質相対定量システムでは、まず、ペプチド断片を予測する際に用いられたＭＳデータを暫定基準ＭＳデータとして選出する。次いで、選出した暫定基準ＭＳデータのＬＣ保持時間の前後所定の範囲に存在するＭＳデータの各々につき明確性指標を算出し、該明確性指標のうち最も大きな値を明確性指標の基準値ｅｍａｘとする。そして、この基準値ｅｍａｘの算出に用いられたＭＳデータを基準ＭＳデータとし、該基準ＭＳデータのＬＣ保持時間の前後に存在するＭＳデータの各々につき明確性指標を算出し、算出した明確性指標と基準値ｅｍａｘとに基づいてタンパク質の相対定量に用いるＭＳデータを選出する。こうすることにより、非常に複雑で膨大なＭＳデータの中からタンパク質の相対定量に用いるＭＳデータを人手を介することなく適切かつ迅速に得ることができる。また、人手を介する場合にはその人の意思を排除できないため誰が作業をするかによって選出されるＭＳデータが変わり、それがタンパク質の相対定量の精度低下の一因となっていたが、そのような精度低下を招くこともない。

本発明のタンパク質定量システムは、更に、前記タンパク質の相対定量に用いるＭＳデータの各々につき、同じアミノ酸配列を持つが異なる同位体が導入された二以上のペプチド断片のピーク強度の積分値の比を同位体比として算出し、該同位体比に基づいて前記タンパク質の量比を求める量比算出手段を備えていてもよい。こうすれば、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質の量比を容易に求めることができる。このとき、量比算出手段は、前記同位体比に基づいて前記タンパク質の相対定量を行うにあたり、前記タンパク質を構成する各ペプチド断片について前記同位体比を算出し該算出した同位体比の平均値を前記タンパク質の量比としてもよい。

次に、本発明の実施形態を図面に基づいて説明する。図１は、本発明の一実施形態であるタンパク質相対定量化システム２０の概略を表す構成図である。本実施形態のタンパク質相対定量化システム２０は、各種処理プログラムを実行するＣＰＵ２２と、各種処理プログラムを記憶したＲＯＭ２３と、一時的に生じる中間データなどを記憶するＲＡＭ２４と、入出力データなどを記憶したハードディスクドライブ２５と、ユーザからの指令を入力する入力装置２６と、結果を表示する表示装置２７と、外部機器との情報のやりとりを行う入出力インターフェース（入出力Ｉ／Ｆ）２８と、外部からの外部ネットワークとの情報のやりとりを行う通信制御インターフェイス（通信制御Ｉ／Ｆ）２９とを備えており、バス２１を介してそれぞれが接続されている。ＲＯＭ２３には、各種Ｉ／Ｆを制御するためのプログラム等が記憶されている。ＲＡＭ２４には、ＣＰＵ２２が各種処理プログラムを実行する過程で一時的に生じる中間データなどが記憶される。ハードディスクドライブ２５には、質量分析測定によって得られたスペクトルデータなどの入力データや後述するメイン処理ルーチンなどの各種処理プログラム、解析結果の出力データなどが記憶される。入力装置２６は、マウスやキーボードであり、入出力Ｉ／Ｆ２８を介して、外部からの指令を入力する。表示装置２７は、液晶ディスプレイであり、ＣＰＵ２２が各種処理プログラムを実行した結果を表示する。このタンパク質相対定量化システム２０には、ＬＣ／ＭＳ／ＭＳ装置１０で測定されたＭＳ／ＭＳスペクトルデータが入出力Ｉ／Ｆ２８を介して入力されるほか、インターネット等の通信ネットワーク上に公開されたＭＳ／ＭＳスペクトルデータが通信制御Ｉ／Ｆ２９を介して入力され、ハードディスクドライブ２５に記憶される。

ＬＣ／ＭＳ／ＭＳ装置１０は、ＬＣ装置１０ａと２つの質量分離部が結合したタンデム型のＭＳ／ＭＳ装置１０ｂとを連結したものである。このＬＣ／ＭＳ／ＭＳ装置１０では、制限酵素で消化されたペプチド断片をＬＣ装置１０ａで分離し、分離したペプチド断片のそれぞれについて、ＭＳ／ＭＳ装置１０ｂでスペクトルを測定する。ＬＣ装置１０ａは、固定層に網目構造のゲル粒子を、移動層に液体を用いる。固定層のゲル粒子は表面から内部に向かって狭くなる多孔質の素材でできているため、多孔質のサイズが問題になるほど巨大な分子の場合、固定相内部まで分散侵入することができない。言い換えると小分子は担体内部にまで拡散できるが、大分子は担体の外部を流れ去るだけである。このように試料のサイズにより見かけの固定相容積が異なるので、巨大分子が先に、小分子が後に流出してくる。タンデム型のＭＳ／ＭＳ装置１０ｂは、第一のＭＳ装置の質量分離部をＱフィルタ型にし、第二のＭＳ装置の質量分離部にＴＯＦ型を配した、Ｑｑ−ＴＯＦＭＳ／ＭＳ装置である。なお、Ｑフィルタ型のＭＳ装置は、平衡に並べた４本の円柱電極を用いて、その間に直流電流と交流電流とを印加して得られる四重極電場により、イオンを質量分離する方式のＭＳ装置である。四重極にかける電圧を変動させてスキャンすることにより質量分析スペクトルが得られ、電圧を固定させることにより、特定のｍ／ｚの値を有するイオンだけを通過、いわゆるマスフィルタさせることができる。一方、ＴＯＦ型のＭＳ装置は、イオンのｍ／ｚの値の違いによって、イオンが一定の長さの真空分析管を通過するのに必要な時間が異なることを利用した、イオンを質量分離する方式のＭＳ装置である。また、以下の説明において第一のＭＳ装置で得られた測定データ（生データ）をＭＳ−１、第二のＭＳ装置で得られた測定データ（生データ）をＭＳ−２という。

本実施形態のＬＣ／ＭＳ／ＭＳ装置１０で測定する試料はＳＩＬＡＣ法により調製したものを用いることとする。具体的には、炭素原子を人為的に安定同位体で置換したアルギニン（¹³Ｃ６¹⁴Ｎ４−Ａｒｇ）、炭素原子と窒素原子を人為的に安定同位体で置換アルギニン（¹³Ｃ６¹⁵Ｎ４−Ａｒｇ）、人為的に安定同位体を導入していないアルギニン（¹²Ｃ６¹⁴Ｎ４−Ａｒｇ）をそれぞれ含む３種類の培地でそれぞれ細胞を培養する。この細胞はアルギニンを細胞内で合成することができないため、成長過程においてアルギニンを細胞内に取り込むことになる。細胞内で取り込まれたアルギニンは、タンパク質合成に用いられるため、タンパク質を安定同位体で容易に標識することができる。このようにして3種類の培地で培養したそれぞれの細胞に、薬剤をそれぞれ添加し、薬剤添加後０分後に¹²Ｃ６¹⁴Ｎ４−Ａｒｇを含む培地で培養した細胞からタンパク質を抽出し、薬剤添加後１分後に¹³Ｃ６¹⁴Ｎ４−Ａｒｇを含む培地で培養した細胞からタンパク質を抽出し、薬剤添加後５分後に¹³Ｃ６¹⁵Ｎ４−Ａｒｇを含む培地で培養した細胞からタンパク質を抽出する。次に、抽出したそれぞれのタンパク質を混合し、制限酵素を用いて断片化する。こうすることで、薬剤添加後の経過時間が異なる細胞に由来したペプチド断片を得ることができる。これらのペプチド断片は、同一のアミノ酸配列でありながら、安定同位体の有無により質量の異なるものである。このため、こうして得られた試料を測定すると、ＬＣ装置によってペプチド断片毎に分離され、そのそれぞれのペプチド断片毎にＭＳ／ＭＳスペクトルを得ることができる。このように、タンパク質を安定同位体で容易に標識すること、混合後に制限酵素を用いて断片化することで制限酵素による断片化率の差異を考慮する必要がないこと、それぞれのペプチド断片比からタンパク質の比率、さらには細胞内におけるタンパク質の発現量の比率を求めることができること、がＳＩＬＡＣ法の特徴である。なお、制限酵素とは、例えば、アルギニンやリジンのＣ末側を特異的に切断するトリプシンのように、タンパク質の特定部位を認識して特異的に切断する酵素のことをいい、タンパク質の発現量とは、細胞内でタンパク質がどれだけ合成されているかを示す値のことをいう。また、以下の説明において、２価イオンにイオン化されたペプチド由来のスペクトルデータを例示して説明するが、ペプチドのイオン化が２価に限定されるものでないことは言うまでもない。

ここで、タンパク質相対定量化システム２０に入力されるデータについて説明する。タンパク質相対定量化システム２０に入力されるデータはＬＣ／ＭＳ／ＭＳ装置１０で測定された生データファイル及び生データから生成されるＭａｓｃｏｔＨＴＭＬファイルの２種類のファイルである。ＭａｓｃｏｔＨＴＭＬファイルとは、ＭａｔｒｉｘＳｃｉｅｎｃｅ社の製品であるＭａｓｃｏｔによって生成される出力ファイルである。また、ＭａｓｃｏｔとはＮＣＢＩｎｒやＳＷＩＳＳ−ＰＲＯＴ等のインターネット上に公開されている配列データベースに含まれるデータより予測したＭＳ／ＭＳスペクトルの測定結果と実測したＭＳ／ＭＳスペクトルデータとを比較し、確率論に基づいて実測したデータのアミノ酸配列を予測し、予測結果やその予測結果の蓋然性指標等を出力するソフトであり、現在タンパク質のＭＳ／ＭＳ測定で得られたデータを解析するにあたり、標準的に使用されているソフトである。

次に、こうして構成された本実施形態のタンパク質相対定量化システム２０の動作の概要について説明する。図２は、ＣＰＵ２２により実行されるメイン処理ルーチンの一例を表すフローチャートである。このメイン処理ルーチンはハードディスクドライブ２５に記憶され、ユーザが入力装置２６を介してタンパク質相対定量の実行を指令することにより、ＣＰＵ２２によって実行される。

メイン処理ルーチンが開始されると、図２に示すように、ＣＰＵ２２はハードディスクドライブ２５に記憶されているＭａｓｃｏｔＨＴＭＬファイルを読み込み、ＭａｓｃｏｔＨＴＭＬファイルより必要な情報を抽出する（ステップＳ１００）。ここで、ＭａｓｃｏｔＨＴＭＬファイルより抽出するデータは、測定を行ったタンパク質及びそのペプチド断片の総数、そのペプチド断片のｍ／ｚの値、Ｍａｓｃｏｔがペプチド断片の配列を予測するために使用したスペクトルのデータ番号、Ｍａｓｃｏｔが予測したペプチド断片の配列に関する情報である。なお、測定を行ったタンパク質には１番から順に番号が付されているものとし、測定を行ったペプチド断片にも１番から順に番号が付されているものとする。ここで、ペプチド断片の配列に関する情報について説明する。図３は、ＭａｓｃｏｔＨＴＭＬファイルのペプチド断片情報部分からＬＣ保持時間の取得を取得する流れ及びペプチド断片の配列に関する情報の一例を示す説明図である。ペプチド断片の配列に関する情報とは、図３中のＰｅｐｔｉｄｅの欄に記載された情報であり、配列情報に加えて、その配列中に安定同位体を含むときには、その旨の情報も記載されている。例えば、図３中のＰｅｐｔｉｄｅの欄に記載の「Ａｒｇｉｎｉｎｅ−１３Ｃ６（Ｒ−１３Ｃ６）」は炭素原子を安定同位体（¹³Ｃ）に置換したものであることを意味し、「Ａｒｇｉｎｉｎｅ−１３Ｃ６１５Ｎ４（Ｒ−ｆｕｌｌ）」は、炭素原子と窒素原子をそれぞれ安定同位体（¹³Ｃ及び¹⁵Ｎ）に置換したものであることを意味している。次に、ＣＰＵ２２は、タンパク質の番号を示す変数ｍに値１を代入し（ステップＳ１１０）、ペプチド断片の番号を示す変数ｎに値１を代入する（ステップＳ１１５）。次に、ＣＰＵ２２はハードディスクドライブ２５に記憶されている生データより、ｍ番目のタンパク質のｎ番目のペプチド断片に対応するスペクトル情報を抽出し、ＲＡＭ２４に記憶する（ステップＳ１２０）。

次に、ＣＰＵ２２は、基準スペクトルデータ選出処理を行う（ステップＳ１３０）。具体的には、後述する基準スペクトルデータ選出処理ルーチンを実行し、最も明確性指標の高いスペクトルデータを基準スペクトルデータとして選出するとともに、該スペクトルデータにおける同位体比Ｒ１及び同位体比Ｒ２を算出する。ここで、明確性指標とは、後述する明確性指標算出処理ルーチンで算出されるスペクトルデータの明確性を表す指標であり、同位体比Ｒ１とは、炭素原子のみを人為的に安定同位体で置換したアミノ酸を含むペプチド断片（以下、同位体ペプチド断片ｐ１）由来のピークの占める強度の積分値が人為的に安定同位体を導入していないアミノ酸を含むペプチド断片（以下、天然体ペプチド断片ｐ０）由来のピークの占める強度の積分値に対する割合であり、同位体比Ｒ２とは、炭素原子と窒素原子の両方を人為的に安定同位体で置換したアミノ酸を含むペプチド断片（以下、同位体ペプチド断片ｐ２）由来のピークの占める強度の積分値が天然体ペプチド断片ｐ０由来のピークの占める強度の積分値に対する割合のことである。ＭＳスペクトル測定で得られる波形データは横軸に分子量に準ずる量に相当するｍ／ｚを、縦軸に分子数に準ずる量に相当する相対存在量を表したスペクトルとして得られるため、ピークの占める強度の積分値は相対質量を表す。このため、それぞれのペプチド断片ｐ０，ｐ１，ｐ２に由来するピークが占める強度の積分値の割合を算出することで、ペプチド断片ｐ０，ｐ１，ｐ２の相対定量を行うことができる。なお、ピークの占める強度の積分値とはピークに含まれるそれぞれのｍ／ｚの値に対応する強度の値の総和である。

ここで、基準スペクトルデータ選出処理ルーチンについて詳しく説明する。図４は基準スペクトルデータ選出処理ルーチンの一例を表すフローチャートである。図４に示すように、このルーチンが開始されると、ＣＰＵ２２は、ステップＳ１００で抽出したＭａｓｃｏｔが今回のペプチド断片の配列を予測するために使用したデータの情報からそのペプチド断片に対応するＭＳ−２のスペクトルデータのＬＣ保持時間とＭＳ−１時のｍ／ｚの値を読み取り、生データであるＭＳ−１の中から、読み取ったＬＣ保持時間に最も近いＬＣ保持時間に相当するデータを暫定基準スペクトルデータとして選択し、該暫定基準スペクトルデータのスペクトル番号の値を変数ｉの値に代入する（ステップＳ３１０）。具体的には、図３に示すように、Ｍａｓｃｏｔが今回のペプチド断片の配列を予測するために使用したデータのＱｕｅｒｙの項目内に記憶されているＳｃａｎＮｕｍｂｅｒとＦｕｎｃｔｉｏｎＮｕｍｂｅｒを読み取る。例えば、Ｍａｓｃｏｔが今回のペプチド断片の配列を予測するために使用したデータのＱｕｅｒｙが「１４４」であるとすると、これに対応するフロート情報の中にＳｃａｎＮｕｍｂｅｒとＦｕｎｃｔｉｏｎＮｕｍｂｅｒが存在するのでそれを読み取る。ここでは、読み取ったＳｃａｎＮｕｍｂｅｒを「２３５」、ＦｕｎｃｔｉｏｎＮｕｍｂｅｒを「２」とする。ＦｕｎｃｔｉｏｎＮｕｍｂｅｒが「２」である場合、該データのＳｃａｎＮｕｍｂｅｒはＭＳ−２からのデータであることを示すため、生データであるＭＳ−２の中から、ＳｃａｎＮｕｍｂｅｒが「２３５」であるデータブロックを検索する。ＭＳ−２のデータブロックには、このデータがＭＳ−２であることを表すＦｕｎｃｔｉｏｎＮｕｍｂｅｒ２のほか、ＳｃａｎＮｕｍｂｅｒ，ＲｅｔｅｎｔｉｏｎＴｉｍｅ，ＳｅｔＭａｓｓなどが含まれている。そして、検索されたＳｃａｎＮｕｍｂｅｒが「２３５」のＭＳ−２のデータブロックからＲｅｔｅｎｔｉｏｎＴｉｍｅ「６３．１７１」を読み取り、生データであるＭＳ−１の中から、この値に最も近いＲｅｔｅｎｔｉｏｎＴｉｍｅを持つデータに最も近いＬＣ保持時間を持つデータを検索する。その結果、ＲｅｔｅｎｔｉｏｎＴｉｍｅが「６３．３８」のデータが得られたとする。このデータを暫定基準スペクトルデータとして選択し、暫定基準スペクトルデータのスペクトル番号である「２６７７」を変数ｉの値に代入する。なお、暫定基準スペクトルデータには、このデータがＭＳ−１であることを表すＦｕｎｃｔｉｏｎＮｕｍｂｅｒ１のほか、ＳｃａｎＮｕｍｂｅｒ，ＲｅｔｅｎｔｉｏｎＴｉｍｅ，ＳａｍｐｌｅＳｉｚｅなどが含まれ、更に各ピークのｍ／ｚの値とその強度とが対応づけて記述されている。

続いて、ＣＰＵ２２は、変数ｊの値に変数ｉ−３の値を代入し（ステップＳ３１５）、スペクトル番号ｊのスペクトルデータの明確性指標を後述する明確性指標算出処理ルーチンを用いて算出し（ステップＳ３２０）、ＲＡＭ２４に記憶する。続いて、ＣＰＵ２２は、変数ｊの値に値１を加算し（ステップＳ３２５）、変数ｊの値と変数ｉ＋３の値とを比較し（ステップＳ３３０）、変数ｊの値が変数ｉ−３の値以下であるときは、ステップＳ３２０を実行する。

一方、ステップＳ３３０で、変数ｊの値が変数ｉ−３の値より大きいときには、ＲＡＭ２４に合計７つの明確性指標が記憶されているため、ＣＰＵ２２は、これら７つの明確性指標の値を比較し、それらのうち最も大きな値を基準値ｅｍａｘとしてＲＡＭ２４に記憶すると共にその値を持つＭＳ−１を基準スペクトルデータとしてＲＡＭ２４に記憶する（ステップＳ３４０）。図５は、ＭＳ−１の一例を示す説明図である。例えば、図３に示すＭＳ−１が今回の暫定基準データだったとすると、変数ｉの値に「２６７７」が代入され、これを含む前後７つのデータつまりスキャン番号「２６７４」から「２６８０」までのデータについて明確性指標を算出し、算出した７つの明確性指標のうち最も大きな値を基準値ｅｍａｘとすると共にその値を持つＭＳ−１を基準スペクトルデータとすることになる。続いて、ＣＰＵ２２は、後述する明確性指標算出処理ルーチンで算出した、ＭＳ／ＭＳ測定で検出された天然体ペプチド断片ｐ０、同位体ペプチド断片ｐ１及び同位体ペプチド断片ｐ２のそれぞれのピークの強度の積分値Ｐ０，Ｐ１，Ｐ２から、基準スペクトルとして選択したデータの同位体比Ｒ１及び同位体比Ｒ２を計算し、ＲＡＭ２４に基準同位体比Ｒ１及び基準同位体比Ｒ２としてそれぞれ記憶し（ステップＳ３５０）、基準スペクトルデータ選出処理ルーチンを終了する。

ここで、明確性指標算出処理ルーチンについて詳しく説明する。図６は明確性指標算出処理ルーチンの一例を表すフローチャートである。図６に示すように、このルーチンが開始されると、ＣＰＵ２２は、ステップＳ１００で抽出した、Ｍａｓｃｏｔがペプチド断片の配列に予測するために使用したＭＳ−１時のｍ／ｚの値を読み取る（ステップＳ４１０）。続いて、ＣＰＵ２２は、ステップＳ４１０で読み取ったｍ／ｚの値が、同位体ペプチド断片ｐ１由来であるか否かをＭａｓｃｏｔが予測したペプチド断片の配列情報より判定する（ステップＳ４２０）。具体的には、図３中のＰｅｐｔｉｄｅの欄に「Ａｒｇｉｎｉｎｅ−１３Ｃ６（Ｒ−１３Ｃ６）」の記載があるときに、ステップＳ４１０で読み取ったｍ／ｚの値が同位体ペプチド断片ｐ１由来であると判定する。続いて、ＣＰＵ２２が、ステップＳ４１０で読み取ったｍ／ｚの値が同位体ペプチド断片ｐ１によるものであると判定したときは、ステップＳ４１０で読み取ったｍ／ｚの値を基準として、ＭＳ−１より同位体ペプチド断片ｐ１のピークの強度の積分値Ｐ１を算出し、ＲＡＭ２４に記憶する（ステップＳ４３０）。ここで、同位体ペプチド断片ｐ１のピークの強度の積分値Ｐ１とは、ステップＳ４１０で読み取ったｍ／ｚの値を基準とする一定の範囲（例えば、±０．１）の強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算したものである。天然に存在する同位体由来のピークの強度の積分値とは、基準としたｍ／ｚの値から＋１Ｄａ及び＋２Ｄａシフトした値を中心に一定の範囲（例えば、±０．１）の強度の積分値を加算したものである。このように天然に存在する同位体由来のピーク強度の積分値を加算することで、最終的に行うタンパク質の相対定量の精度が向上する。なお、本実施例では、２価にイオン化したイオンを例に挙げて説明しているため、１Ｄａ分のシフト量は０．５となる。

続いて、ＣＰＵ２２は、ＭＳ−１より同位体ペプチド断片ｐ２由来のピークの強度の積分値Ｐ２を算出し、ＲＡＭ２４に記憶する（ステップＳ４４０）。同位体ペプチド断片ｐ２のピークの強度の積分値Ｐ２とは、ステップＳ４１０で読み取ったｍ／ｚの値から＋４Ｄａ分シフトしたｍ／ｚの値を基準とする一定の範囲（例えば、±０．１）の強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算した値である。ここで、ピークシフトについて説明する。図７は、ＭＳスペクトルデータのグラフを表す一例である。図７に示すように、同位体ペプチド断片ｐ２（図７中の¹³Ｃ６¹⁵Ｎ４−Ａｒｇ）由来のピークは、同位体ペプチド断片ｐ１（図７中の¹³Ｃ６¹⁴Ｎ４）由来のピークに比べて＋４Ｄａ分シフトする。その理由は以下のとおりである。すなわち、同位体ペプチド断片ｐ２は、同位体ペプチド断片ｐ１に比べて、アルギニン中の窒素原子が¹⁵Ｎで置換されている分だけ質量が大きくなる。また、アルギニン中には窒素が４原子含まれる。このため、同位体ペプチド断片ｐ２由来のピークは、同位体ペプチド断片ｐ１由来のピークに比べて、¹⁴Ｎと¹⁵Ｎの質量の差１とアルギニン中に含まれる窒素原子の数４を乗じた値である＋４Ｄａ分シフトすることになるのである。

続いて、ＣＰＵ２２は、ＭＳ−１より天然体ペプチド断片ｐ０由来のピークの強度の積分値Ｐ０を算出し、ＲＡＭ２４に記憶する（ステップＳ４５０）。天然体ペプチド断片ｐ０のピークの強度の積分値Ｐ０とは、ステップＳ４１０で読み取ったｍ／ｚの値から−６Ｄａ分シフトしたｍ／ｚの値を基準とする一定の範囲（例えば、±０．１）のピークの強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算した値である。図７に示すように、天然体ペプチド断片ｐ０（図７中の¹²Ｃ６¹⁴Ｎ４−Ａｒｇ）由来のピークは、同位体ペプチド断片ｐ１（図７中の¹³Ｃ６¹⁴Ｎ４）由来のピークに比べて−６Ｄａ分シフトする。その理由は以下のとおりである。すなわち、天然体ペプチド断片ｐ０は、同位体ペプチド断片ｐ１に比べて、アルギニン中の窒素原子が¹²Ｃで置換されている分だけ質量が小さくなる。また、アルギニン中には炭素が６原子含まれる。このため、天然体ペプチド断片ｐ０由来のピークは、同位体ペプチド断片ｐ１由来のピークに比べて、¹³Ｃと¹²Ｃの質量の差（１）とアルギニン中に含まれる炭素原子の数（６）を乗じた値である−６Ｄａ分シフトすることになるのである。

続いて、ＣＰＵ２２は、ステップＳ４３０、ステップＳ４４０、ステップＳ４５０で算出したそれぞれのピーク強度の積分値Ｐ０，Ｐ１，Ｐ２の和ΣＰを算出し、ＲＡＭ２４に記憶する（ステップＳ４６０）。続いて、ＣＰＵ２２は、ステップＳ４６０で算出した和ΣＰをステップＳ４１０で読み取ったｍ／ｚの値から一定の領域（例えば、読み取ったｍ／ｚの値の±５の領域）の全範囲の強度の積分値Ｌｔｏｔａｌで除算して比Ｌｒａｔｅ（＝ΣＰ／Ｌｔｏｔａｌ）を算出し、これを明確性指標としてハードディスクドライブ２５に記憶し（ステップＳ４７０）、このルーチンを終了する。

一方、ステップＳ４２０で、ステップＳ４１０で読み取ったｍ／ｚの値が同位体ペプチド断片ｐ１によるものでないと判定したときには、ＣＰＵ２２は、ステップＳ４１０で読み取ったｍ／ｚの値が、同位体ペプチド断片ｐ２に由来するものであるか否かをＭａｓｃｏｔが予測したペプチド断片の配列情報より判定する（ステップＳ４２５）。具体的には、図３中のＰｅｐｔｉｄｅの欄に「Ａｒｇｉｎｉｎｅ−１３Ｃ６１５Ｎ４（Ｒ−ｆｕｌｌ）」の記載があるときに、ステップＳ４１０で読み取ったｍ／ｚの値が同位体ペプチド断片ｐ１由来であると判定する。続いて、ステップＳ４２５で、ステップＳ４１０で読み取ったｍ／ｚの値が同位体ペプチド断片ｐ２によるものであると判定したときは、ＣＰＵ２２は、ステップＳ４１０で読み取ったｍ／ｚの値を基準として、ＭＳ−１よりペプチド断片２由来のピークの強度の積分値Ｐ２を計算し、ＲＡＭ２４に記憶する（ステップＳ４３５）。ここで、同位体ペプチド断片ｐ２のピークの強度の積分値Ｐ２とは、ステップＳ４１０で読み取ったｍ／ｚを基準とする一定の範囲（例えば、±０．１）のピークの強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算したものである。続いて、ＣＰＵ２２は、ＭＳ−１より同位体ペプチド断片ｐ１由来のピークの強度の積分値Ｐ１を算出し、ＲＡＭ２４に記憶する（ステップＳ４４５）。ここで、同位体ペプチド断片ｐ２から同位体ペプチド断片ｐ１までのｍ／ｚの値の差は、図７に示すように、−４Ｄａであるため、同位体ペプチド断片ｐ１のピークの強度の積分値Ｐ１は、ステップＳ４１０で読み取ったｍ／ｚの値から−４Ｄａ分シフトしたｍ／ｚの値を求め、その値を基準とする一定の範囲（例えば、±０．１）のピークの強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算した値となる。続いて、ＣＰＵ２２は、ＭＳ−１より天然体ペプチド断片ｐ０由来のピークの強度の積分値Ｐ０を算出し、ＲＡＭ２４に記憶する（ステップＳ４５５）。ここで、同位体ペプチド断片ｐ２から天然体ペプチド断片ｐ０までのｍ／ｚの差は、図７に示すように、−１０Ｄａであるため、天然体ペプチド断片ｐ０由来のピークの強度の積分値Ｐ０は、基準ｍ／ｚから−１０Ｄａ分シフトしたｍ／ｚを基準とする一定の範囲（例えば、±０．１）のピークの強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算した値となる。続いて、ＣＰＵ２２は、ステップＳ４３５、ステップＳ４４５、ステップＳ４５５で算出したそれぞれのピークの強度の積分値Ｐ０，Ｐ１，Ｐ２の和ΣＰを算出し、ＲＡＭ２４に記憶する（ステップＳ４６５）。続いて、前述したステップＳ４７０を実行し、このルーチンを終了する。

一方、ステップＳ４２５で、ステップＳ４１０で読み取ったｍ／ｚが同位体ペプチド断片ｐ２によるものでないと判定したときは、何ら処理を行うことなく明確性指標算出処理ルーチンを終了する。このように、明確性指標はピーク部分の占める強度の積分値の割合を表しているため、この値が大きいほどピーク部分の占める強度の積分値の割合が大きいと言える。言い換えると、明確性指標の高いＬＣ保持時間のスペクトルデータはノイズ部分の割合が少ないスペクトルデータである。

さて、図２に戻り、ステップＳ１３０で基準スペクトルデータ選出処理を行ったあと、ＣＰＵ２２は平均同位体比算出処理を行い（ステップＳ１４０）、該スペクトルデータの同位体比Ｒ１及び同位体比Ｒ２のそれぞれの平均値を算出する（ステップＳ１４０）。この同位体比の平均値は、各ペプチド断片における平均同位体比に相当する。ここで、平均同位体比算出処理ルーチンについて詳しく説明する。図８は平均同位体比算出処理ルーチンの一例を表すフローチャートである。図８に示すように、ＣＰＵ２２は、基準スペクトルデータ選出処理ルーチンで選出した基準スペクトルのデータ番号、基準値ｅｍａｘ、基準同位体比Ｒ１、基準同位体比Ｒ２をそれぞれＲＡＭ２４より読み取り、基準スペクトルのデータ番号を変数ｋの値に代入する（ステップＳ５１０）。続いて、ＣＰＵ２２は、変数ｋの値から値１を減算し（ステップＳ５１５）、ＭＳ−１より基準スペクトルのデータ番号の値がｋであるスペクトルデータを選択し、前述した明確性指標算出処理ルーチンにより、明確性指標を算出し、ＲＡＭ２４に記憶する（ステップＳ５２０）。続いて、ＣＰＵ２２は、基準値ｅｍａｘに予め定められた１未満の係数（例えば、０．８）を乗じた値を閾値に設定し、ステップＳ５２０で算出した明確性指標とこの閾値とを比較し（ステップＳ５３０）、算出した明確性指標が閾値以上であるとき、同位体比Ｒ１及び同位体比Ｒ２のそれぞれの値を算出してＲＡＭ２４に記憶し（ステップＳ５４０）、変数ｋの値から値１を減算し（ステップＳ５４５）、ステップＳ５２０に戻る。

一方、ステップＳ５３０で、ステップＳ５２０で算出した明確性指標の値が前出の閾値未満であるときには、ＣＰＵ２２は、変数ｋの値にＭＳ−１より読み取った基準スペクトルデータの番号を代入する（ステップＳ５５０）。続いて、ＣＰＵ２２は、変数ｋの値に値１を加算し（ステップＳ５５５）、ＭＳ−１より基準スペクトルのデータ番号の値がｋであるスペクトルデータを選択し、前述した明確性指標算出処理ルーチンにより、明確性指標を算出し、ＲＡＭ２４に記憶する（ステップＳ５６０）。続いて、ＣＰＵ２２は、ステップＳ５６０で算出した明確性指標と前出の閾値とを比較し（ステップＳ５７０）、算出した明確性指標の値が閾値以上であるとき、同位体比Ｒ１及び同位体比Ｒ２のそれぞれの値を算出してＲＡＭ２４に記憶し（ステップＳ５８０）、変数ｋの値に値１を加算し（ステップＳ５８５）、ステップＳ５６０に戻る。

ステップＳ５７０で、ステップＳ５６０で算出した明確性指標の値が前出の閾値未満であるときには、ＣＰＵ２２は、ステップＳ５４０及びステップＳ５８０で算出した同位体比Ｒ１及び同位体比Ｒ２の値のそれぞれの平均値を算出し、それぞれの値を平均同位体比ＡＲ１、平均同位体比ＡＲ２としてハードディスクドライブ２５に記憶し（ステップＳ５９０）、平均同位体比算出処理ルーチンを終了する。なお、平均同位体比ＡＲ１，ＡＲ２は後述するようにタンパク質の相対定量に用いられることから、ＭＳ−１のスペクトルデータのうち明確性指標が閾値以上のものはタンパク質の相対定量に用いられるスペクトルデータといえる。図９は図５と同様のＭＳ−１の一例を表す説明図である。例えば、図９に示すように、最も大きな明確性指標の値を持つＭＳ−１のスペクトルデータのスキャン番号が「２６７８」だったとすると、ＭＳ−１のうちスキャン番号が「２６７８」よりも小さいものにつき順次明確性指標を算出し、その明確性指標が閾値以上のものをタンパク質の相対定量に用いるスペクトルデータとして選出する。また、スキャン番号が「２６７８」よりも大きいものについても順次明確性指標を算出し、その明確性指標が閾値以上のものをタンパク質の相対定量に用いるスペクトルデータとして選出する。

さて、図２に戻り、ステップＳ１４０で平均同位体算出処理を行ったあと、ＣＰＵ２２は、変数ｎの値に値１を加算し（ステップＳ１５０）、ｎ番目のペプチド断片のデータがＭａｓｃｏｔＨＴＭＬファイルに存在するか否かを判定する（ステップＳ１６０）。ステップＳ１６０で、ｎ番目のペプチド断片のデータがあるときには、ｎ番目のペプチド断片のデータに対して、ステップＳ１２０〜Ｓ１５０の処理を行う。一方、ステップＳ１６０で、ｎ番目のペプチド断片のデータがないときには、ＣＰＵ２２は、ステップＳ１４０で算出した各ペプチド断片毎の平均同位体比ＡＲ１，ＡＲ２の平均値ＡＶＡＲ１，ＡＶＡＲ２及び平均同位体比ＡＲ１，ＡＲ２の標準偏差値σＡＲ１，σＡＲ２を算出し、ハードディスクドライブ２５に記憶する（ステップＳ１７０）。

次に、ＣＰＵ２２は、変数ｍの値に値１を加算し（ステップＳ１８０）、ｍ番目のタンパク質のデータがＭａｓｃｏｔＨＴＭＬファイルに存在するか否かを判定する（ステップＳ１９０）。ステップＳ１８０で、ｍ番目のタンパク質のデータがあるときには、ｍ番目のタンパク質のデータに対して、ステップＳ１１５〜Ｓ１８０の処理を行う。一方、ステップＳ１８０で、ｍ番目のタンパク質のデータがないときには、ステップ１７０で算出した各タンパク質の平均質量比ＡＶＡＲ１，ＡＶＡＲ２及び標準偏差値σＡＲ１，σＡＲ２をハードディスクドライブ２５に記憶し、表示装置２７に表示する（ステップＳ２００）。これにより、データに含まれる全てのタンパク質のそれぞれについて、安定同位体を人為的に導入したタンパク質の割合及び標準偏差を自動で算出することができる。

本実施形態では、前述のとおり、３種類の細胞に薬剤をそれぞれ添加し、０分、１分、５分後のそれぞれの時間経過後の細胞から抽出したタンパク質由来のペプチド断片を用いて、ＬＣ／ＭＳ／ＭＳを行っている。このため、メイン処理ルーチンを実行することにより、０分、１分、５分後のそれぞれの時間におけるタンパク質の割合を算出することができる。つまり、薬剤の添加により細胞内のタンパク質の発現量が経時的にどのような割合に変化しているかを算出することができるため、薬剤のタンパク質に対する作用効果を知ることができる。

ここで、本実施形態の構成要素と本発明の構成要素との対応関係について説明する。本実施形態のステップＳ３１０が本発明のステップ（ａ）及び本発明の暫定基準データ選出手段の処理に相当し、ステップＳ３１５〜Ｓ３４０がステップ（ｂ）及び基準値算出手段の処理に相当し、ステップＳ５１０〜Ｓ５９０がステップ（ｃ）及び相対定量用データ選出手段の処理に相当し、ステップＳ１７０がステップ（ｄ）及び量比算出手段の処理に相当する。

以上詳述した本実施形態のタンパク質相対定量化システム２０によれば、非常に複雑で膨大なＭＳデータの中からタンパク質の相対定量を行うに適したＭＳデータを人手を介することなく適切かつ迅速に得ることができる。また、人手を介する場合にはその人の意思を排除できないため誰が作業をするかによって選出されるＭＳデータが変わり、それがタンパク質の相対定量の精度低下の一因となっていたが、そのような精度低下を招くこともない。

また、暫定基準ＭＳデータのＬＣ保持時間の前後所定の範囲に存在するＭＳデータを、ＬＣ保持時間の長さ順に並べたＭＳデータのうち暫定基準ＭＳデータのＬＣ保持時間を中心として前後７つのＭＳデータとしているため、明確性指標の基準値ｅｍａｘを算出するためのＭＳデータを容易に選出することができる。

更に、同じアミノ酸配列のペプチド断片であって異なる同位体が導入されたもののピークの強度の積分値を求めるにあたり、天然同位体の存在も考慮して該ピークの強度の積分値を求めているため、天然同位体の存在を考慮しない場合に比べて明確性指標の値の信頼性が高くなり、ひいてはタンパク質の相対定量の精度を高くすることができる。

更にまた、算出した明確性指標と基準値ｅｍａｘとに基づいてタンパク質の相対定量に用いるＭＳデータを選出するにあたり、算出した明確性指標が基準値ｅｍａｘに予め定められた値０．８を乗じた値を閾値とし該閾値以上のときに該明確性指標の算出に用いたＭＳデータを前記タンパク質の相対定量に用いるＭＳデータとして選出しているため、タンパク質の相対定量を行うに相応しいＭＳデータを容易に選出することができる。

そしてまた、タンパク質の相対定量に用いるＭＳデータの各々につき、同じアミノ酸配列を持つが異なる同位体が導入された二以上のペプチド断片のピークの強度の積分値の比を同位体比として算出し、該同位体比に基づいてタンパク質の量比を求めているため、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質の量比を容易に求めることができる。また、同位体比に基づいてタンパク質の相対定量を行うにあたり、タンパク質を構成する各ペプチド断片について同位体比を算出し該算出した同位体比の平均値を前記タンパク質の量比としているため、ペプチド断片毎の誤差による精度低下を防ぐことができる。

なお、本発明は上述した実施形態に何ら限定されることはなく、本発明の技術的範囲に属する限り、種々の様態で実施し得ることは言うまでもない。

例えば、上述した実施形態では、３種類の細胞由来のタンパク質の相対定量を行うものとしたが、あらかじめこれらのタンパク質のうちの１種類のタンパク質を他の方法で定量して標準サンプルとし、その標準サンプルに基づいて他のタンパク質の定量を行うものであってもよい。こうすれば、相対定量だけでなくタンパク質の絶対定量を行うことができる。

上述した実施形態の平均同意体比算出処理ルーチンにおいて、ステップＳ５３０のあとに該ステップＳ５３０で繰り返し肯定判定された回数が一定回数（例えば１０回）以下であるか否かを判定し、一定回数以下のときにはステップＳ５４０以降の処理を実行し、一定回数を超えたときにはステップＳ５５０へ進むようにし、また、ステップＳ５７０のあとに該ステップＳ５７０で繰り返し肯定判定された回数が一定回数（例えば１０回）以下であるか否かを判定し、一定回数以下のときにはステップＳ５８０以降の処理を実行し、一定回数を超えたときにはステップＳ５９０へ進むようにしてもよい。こうすれば、不必要に多くのＭＳデータを対象として明確性指標を算出することがなくなるため、処理時間を短くできる。ここで、一定の回数とは、例えばある範囲を超えたＭＳデータの明確性指標については基準値ｅｍａｘとの関係からしてタンパク質の相対定量に用いるＭＳデータとして選出する必要性がほとんどゼロであるということが経験的に判明している場合には、その範囲を所定の範囲として設定すればよい。

上述した実施形態の明確性指標算出処理ルーチンにおいて、天然に存在する同位体由来のピークの強度の積分値を算出するときに、天然に存在する同位体由来のピークを基準となるピークのｍ／ｚから＋１Ｄａ及び＋２Ｄａシフトした位置であるとし、該当するｍ／ｚの値から一定の範囲（例えば、±０．１）の強度の積分値を算出することとしたが、それぞれのｍ／ｚから＋１Ｄａ及び＋２Ｄａの値付近の強度を探索し、最も強度の高い位置から一定の範囲（例えば、±０．１）の強度の積分値を算出することとしてもよい。こうすれば、ピークのずれを補正することができ、より精度よく解析することができる。

上述した実施形態の明確性指標算出処理ルーチンにおいて、天然に存在する同位体由来のピークの強度の積分値を算出するときに、天然に存在する同位体由来のピークを＋１Ｄａ及び＋２Ｄａシフトした２種類のみを選択し、それぞれの強度の積分値を加算することとしたが、３種類以上の天然に存在する同位体由来のピークを選択し、それぞれの強度の積分値を加算することにしてもよい。こうすれば、３種類以上の同位体が天然に存在する場合であっても、より精度よく解析することができる。

上述した実施形態では、タンパク質の相対比を計算するときにおいて、複数のペプチドから求めた量比の平均値を用いているが、中央値などのロバスト推定法やペプチドのスコアによる加重平均値を用いてもよい。こうすれば、より精度よく解析することができる。

上述した実施形態では、ＬＣ／ＭＳ／ＭＳ装置１０で測定したデータを直接タンパク質相対定量化システム２０に入力し、結果を表示装置２７に表示することにしたが、通信制御Ｉ／Ｆ２９を介して、インターネット等のネットワークから入力し、通信制御Ｉ／Ｆ２９を介して、インターネット等のネットワークで接続された先に出力してもよい。こうすれば、タンパク質相対定量化システム２０をインターネット等のネットワークを介して場所を選ぶことなく使用することができる。また、持ち運び可能な記憶媒体（ＣＤ−ＲＯＭやＦＤなどのリムーバルディスク）を介して入力してもよい。こうすれば、他者が公開したデータや過去のデータなどについても解析することができる。

上述した実施形態では、入力するデータはＳＩＬＡＣ法を用いて調製した３種類の細胞由来の試料を用いて測定したＬＣ／ＭＳ／ＭＳスペクトルデータとしたが、由来となる細胞は３種類に限定されるものではない。２種類の細胞由来の試料を用いてもよいし、４種類以上の細胞由来の試料を用いてもよい。

上述した実施形態では、入力するデータはＳＩＬＡＣ法を用いて調製した３種類の細胞由来の試料を用いて測定したＬＣ／ＭＳ／ＭＳスペクトルデータとしたが、ＳＩＬＡＣ法に限定されるものではなく、同一のアミノ酸配列を有し質量数の異なるタンパク質を含む試料を用いて測定したＬＣ／ＭＳ／ＭＳスペクトルデータであればよい。例えば、化学修飾等を施したタンパク質を含む試料を測定したＬＣ／ＭＳ／ＭＳスペクトルデータであってもよい。こうすれば、安定同位体を導入することができない細胞におけるタンパク質の発現量変化を観察することができる。

タンパク質相対定量化システム２０の構成の概略を示す構成図。メイン処理ルーチンの一例を示すフローチャート。ＭａｓｃｏｔＨＴＭＬファイルからの情報抽出の一例を示す説明図。基準スペクトルデータ選出処理ルーチンの一例を示すフローチャート。ＭＳ−１の一例を示す説明図。明確性指標算出処理ルーチンの一例を示すフローチャート。ＭＳスペクトルデータの一例を表すグラフ。平均同位体比算出処理ルーチンの一例を示すフローチャート。ＭＳ−１の一例を示す説明図。

符号の説明

１０ＬＣ／ＭＳ／ＭＳ装置、１０ａＬＣ装置、１０ｂＭＳ／ＭＳ装置、２０タンパク質相対定量化システム、２１バス、２２ＣＰＵ、２３ＲＯＭ、２４ＲＡＭ、２５ハードディスクドライブ、２６入力装置、２７表示装置、２８入出力Ｉ／Ｆ、２９通信制御Ｉ／Ｆ。

Claims

同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物を液体クロマトグラフィ（ＬＣ）装置とマススペクトル（ＭＳ）装置とを含む分析装置に供することにより得られたＭＳデータに基づく前記タンパク質の相対定量を、コンピュータソフトウェアを用いて行うタンパク質相対定量方法であって、
（ａ）前記ペプチド断片を決定する際に用いられたＭＳデータを暫定基準ＭＳデータとして選出するステップと、
（ｂ）前記暫定基準ＭＳデータのＬＣ保持時間の前後所定の範囲に存在するＭＳデータの各々につき、所定のｍ／ｚ領域の全範囲の強度の積分値Ｌｔｏｔａｌを求めると共に同じアミノ酸配列のペプチド断片であって異なる同位体が導入されたもののピーク強度の積分値の合計ΣＰを求め、両者の比Ｌｒａｔｅ（＝ΣＰ／Ｌｔｏｔａｌ）を明確性指標として算出し、該明確性指標のうち最も大きな値を明確性指標の基準値ｅｍａｘとするステップと、
（ｃ）前記基準値ｅｍａｘの算出に用いられたＭＳデータを基準ＭＳデータとし、該基準ＭＳデータのＬＣ保持時間の前後に存在するＭＳデータの各々につき前記明確性指標を算出し、算出した明確性指標と基準値ｅｍａｘとに基づいて前記タンパク質の相対定量に用いるＭＳデータを選出するステップと
を含むタンパク質相対定量方法。
前記ステップ（ｂ）では、前記暫定基準ＭＳデータのＬＣ保持時間の前後所定の範囲に存在するＭＳデータを、ＬＣ保持時間の長さ順に並べた前記ＭＳデータのうち前記暫定基準ＭＳデータのＬＣ保持時間を中心とした前後所定数のＭＳデータとする、
請求項１に記載のタンパク質相対定量方法。
前記ステップ（ｂ）では、前記同じアミノ酸配列のペプチド断片であって異なる同位体が導入されたもののピーク強度の積分値を求めるにあたり、天然同位体の存在も考慮して該ピーク強度の積分値を求める、
請求項１又は２に記載のタンパク質相対定量方法。
前記ステップ（ｃ）では、前記算出した明確性指標と基準値ｅｍａｘとに基づいて前記タンパク質の相対定量に用いるＭＳデータを選出するにあたり、前記算出した明確性指標が基準値ｅｍａｘに予め定められた１未満の係数を乗じた値を閾値とし該閾値を超えるか又は該閾値以上のときに該明確性指標の算出に用いたＭＳデータを前記タンパク質の相対定量に用いるＭＳデータとして選出する、
請求項１〜３のいずれかに記載のタンパク質相対定量方法。
前記ステップ（ｃ）では、前記タンパク質の相対定量に用いるＭＳデータを選出するにあたり、前記基準ＭＳデータのＬＣ保持時間の前後所定の範囲に存在するＭＳデータを超えて選出しない、
請求項１〜４のいずれかに記載のタンパク質相対定量方法。
請求項１〜５のいずれかに記載のタンパク質相対定量方法であって、
（ｄ）前記ステップ（ｃ）で選出した前記タンパク質の相対定量に用いるＭＳデータの各々につき、同じアミノ酸配列を持つが異なる同位体が導入された二以上のペプチド断片のピーク強度の積分値の比を同位体比として算出し、該同位体比に基づいて前記タンパク質の量比を求めるステップ
を含むタンパク質相対定量方法。
前記ステップ（ｄ）では、前記同位体比に基づいて前記タンパク質の相対定量を行うにあたり、前記タンパク質を構成する各ペプチド断片について前記同位体比を算出し該算出した同位体比に統計的な処理を施した値を前記タンパク質の量比とする、
請求項６に記載のタンパク質相対定量方法。
前記分析装置は、ＬＣ装置と該ＬＣ装置で分離された成分が供されるタンデム型のＭＳ／ＭＳ装置とで構成されるＬＣ／ＭＳ／ＭＳ装置であり、前記ＭＳデータは、前記タンデム型のＭＳ／ＭＳ装置の一つ目の質量分析計で得られるＭＳデータである、
請求項１〜７のいずれかに記載のタンパク質相対定量方法。
請求項１〜８のいずれかに記載のタンパク質相対定量方法を１又は複数のコンピュータに実行させるためのプログラム。
同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物を液体クロマトグラフィ（ＬＣ）装置とマススペクトル（ＭＳ）装置とを含む分析装置に供することにより得られたＭＳデータに基づく前記タンパク質の相対定量を行うタンパク質相対定量システムであって、
前記ペプチド断片を決定する際に用いられたＭＳデータを暫定基準ＭＳデータとして選出する暫定基準データ選出手段と、
前記暫定基準ＭＳデータのＬＣ保持時間の前後所定の範囲に存在するＭＳデータの各々につき、所定のｍ／ｚ領域の全範囲の強度の積分値Ｌｔｏｔａｌを求めると共に同じアミノ酸配列のペプチド断片であって異なる同位体が導入されたもののピークの強度の積分値の合計ΣＰを求め、両者の比Ｌｒａｔｅ（＝ΣＰ／Ｌｔｏｔａｌ）を明確性指標として算出し、該明確性指標のうち最も大きな値を明確性指標の基準値ｅｍａｘとする基準値算出手段と、
前記基準値ｅｍａｘの算出に用いられたＭＳデータを基準ＭＳデータとし、該基準ＭＳデータのＬＣ保持時間の前後に存在するＭＳデータの各々につき、前記明確性指標を算出し、算出した明確性指標と基準値ｅｍａｘとに基づいて前記タンパク質の相対定量に用いるＭＳデータを選出する相対定量用データ選出手段と、
を備えたタンパク質相対定量システム。
請求項１０に記載のタンパク質定量システムであって、
前記タンパク質の相対定量に用いるＭＳデータの各々につき、同じアミノ酸配列を持つが異なる同位体が導入された二以上のペプチド断片のピークの強度の積分値の比を同位体比として算出し、該同位体比に基づいて前記タンパク質の量比を求める量比算出手段
を備えたタンパク質相対定量システム。