JP4106444B2 - 生体高分子自動同定方法 - Google Patents
生体高分子自動同定方法 Download PDFInfo
- Publication number
- JP4106444B2 JP4106444B2 JP2004534155A JP2004534155A JP4106444B2 JP 4106444 B2 JP4106444 B2 JP 4106444B2 JP 2004534155 A JP2004534155 A JP 2004534155A JP 2004534155 A JP2004534155 A JP 2004534155A JP 4106444 B2 JP4106444 B2 JP 4106444B2
- Authority
- JP
- Japan
- Prior art keywords
- mass
- procedure
- mass value
- calibration
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 56
- 229920001222 biopolymer Polymers 0.000 title claims description 24
- 238000005259 measurement Methods 0.000 claims description 25
- 230000009897 systematic effect Effects 0.000 claims description 13
- 238000004949 mass spectrometry Methods 0.000 claims description 8
- 238000010187 selection method Methods 0.000 claims description 5
- 150000002500 ions Chemical class 0.000 description 18
- 108090000765 processed proteins & peptides Proteins 0.000 description 11
- 239000000203 mixture Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 102000008100 Human Serum Albumin Human genes 0.000 description 2
- 108091006905 Human Serum Albumin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010812 external standard method Methods 0.000 description 2
- 239000011261 inert gas Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000589 high-performance liquid chromatography-mass spectrometry Methods 0.000 description 1
- 238000010813 internal standard method Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0009—Calibration of the apparatus
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10T—TECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
- Y10T436/00—Chemistry: analytical and immunological testing
- Y10T436/14—Heterocyclic carbon compound [i.e., O, S, N, Se, Te, as only ring hetero atom]
- Y10T436/142222—Hetero-O [e.g., ascorbic acid, etc.]
- Y10T436/143333—Saccharide [e.g., DNA, etc.]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10T—TECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
- Y10T436/00—Chemistry: analytical and immunological testing
- Y10T436/24—Nuclear magnetic resonance, electron spin resonance or other spin effects or mass spectrometry
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Description
本発明は、質量分析方法を用いた生体高分子同定技術に関する。より詳しくは、質量分析方法によって得られる質量データの精度向上を目的とする生体高分子自動同定方法に関する。
質量分析方法は、試料分子をイオン化した後、これを質量/電荷の比(m/z)に従って分離し検出を行う機器分析法であって、得られた質量スペクトルから定性を、イオン量から定量を行うことができる。
この分子質量の測定に用いる質量分析計(以下、「MS」(mass spectrometer)と称する。)は、大別すると、試料のイオン化を行うための「イオン化部(イオン源)」と、イオンを質量/電荷の比であるm/z(m:質量、z:電荷数)に従って分離するための「アナライザー」と、分離されたイオンの「検出部(検出器)」及び「データ解析部」と、から構成されている。
前記質量分析計を用いて試料分子の質量分析に当たっては、測定開始前に質量分析計の校正(キャリブレーション)を行う必要がある。具体的には、温度変化や電圧の精度、電気回路ノイズ等の原因により、質量分析計の測定に誤差が発生する場合があるので、測定開始前には、クロマトグラフ等を質量分析計から一旦取り外した上で、質量分析計に所定の質量校正用標準物質を導入して実測質量値を得、この実測質量と既知の理論質量値と比較することによって、質量値に系統誤差が発生しないように予め装置を調整する校正作業(外部標準法によるキャリブレーション作業)を行う必要がある。
更に、高精度の質量値を得るためには前記外部標準法によるキャリブレーション作業に加え、既知物質を試料に混合して質量測定し、その質量値にもとづいて実測質量値を調整する校正作業(内部標準法によるキャリブレーション作業)を行う必要がある。
そして、一般に、この質量分析計(タンデム質量分析計を含む。以下同様。)を用いて行うペプチドやタンパク質等の生体高分子同定方法においては、質量分析によって得られる未知試料分子の実測質量値を、10万種程度の分子の一次構造又は配列が予め格納されているデータベース(ライブラリー)と照合させて検索(サーチ)し、構造から算出した予想リファレンス(標準)スペクトルの中から測定対象の未知試料分子のスペクトルと類似したものを順位(スコア)付けして選び出していく手順、即ちデータベース検索(又はライブラリーサーチ)を行って、候補分子をリストアップして絞り込み、最終的に未知試料分子の同定を行う。
しかしながら、上記した質量分析計の校正作業(キャリブレーション作業)は、非常に作業が面倒であって、調整時間もかかることから、従来の質量測定作業における作業効率を低下させる主原因であった。即ち、従来は、質量分析計の連続運転(校正作業なしの運転)による効率の良い測定作業を実施することができなかった。また、複数台の質量分析計を用いた測定系においては、各装置について外部標準による校正作業(キャリブレーション作業)を行ったとしても、各装置の精度、信頼性を一元化することは極めて困難であるという問題があった。
外部標準キャリブレーションの場合、従来の上記データベース検索の手順では、外部環境の影響によって発生する質量分析計自体の誤測定による影響を測定データから排除することはできなかった。特に測定環境の微妙な温度変化(0.2℃ぐらいの変化)で生じる測定誤差も時として無視できないものとなっていた。
また、従来の内部標準キャリブレーションによって複雑な生体高分子混合物を測定する場合は、内部標準物質と試料由来のイオンシグナルが重なってしまい、そのイオンを分析できないため、内部標準として試料に入れる物質の種類や濃度の選択はとても難しかった。高い質量精度を広い質量範囲で実現するためには、何点もの内部標準物質を導入する必要があった。
更には、従来は、同定の信頼性が低かったので、その結果を一つ一つ人間が確認しなければならかった。ところが、近年の質量分析計の発達により、より複雑な生体高分子混合物の直接分析が可能になってきたため、データが大量化し、一つ一つのデータを人間が目で確認することが困難になってきたことから、複雑な生体高分子混合物を分析対象とする信頼性の高い自動同定手法の開発が要請されていた。
この分子質量の測定に用いる質量分析計(以下、「MS」(mass spectrometer)と称する。)は、大別すると、試料のイオン化を行うための「イオン化部(イオン源)」と、イオンを質量/電荷の比であるm/z(m:質量、z:電荷数)に従って分離するための「アナライザー」と、分離されたイオンの「検出部(検出器)」及び「データ解析部」と、から構成されている。
前記質量分析計を用いて試料分子の質量分析に当たっては、測定開始前に質量分析計の校正(キャリブレーション)を行う必要がある。具体的には、温度変化や電圧の精度、電気回路ノイズ等の原因により、質量分析計の測定に誤差が発生する場合があるので、測定開始前には、クロマトグラフ等を質量分析計から一旦取り外した上で、質量分析計に所定の質量校正用標準物質を導入して実測質量値を得、この実測質量と既知の理論質量値と比較することによって、質量値に系統誤差が発生しないように予め装置を調整する校正作業(外部標準法によるキャリブレーション作業)を行う必要がある。
更に、高精度の質量値を得るためには前記外部標準法によるキャリブレーション作業に加え、既知物質を試料に混合して質量測定し、その質量値にもとづいて実測質量値を調整する校正作業(内部標準法によるキャリブレーション作業)を行う必要がある。
そして、一般に、この質量分析計(タンデム質量分析計を含む。以下同様。)を用いて行うペプチドやタンパク質等の生体高分子同定方法においては、質量分析によって得られる未知試料分子の実測質量値を、10万種程度の分子の一次構造又は配列が予め格納されているデータベース(ライブラリー)と照合させて検索(サーチ)し、構造から算出した予想リファレンス(標準)スペクトルの中から測定対象の未知試料分子のスペクトルと類似したものを順位(スコア)付けして選び出していく手順、即ちデータベース検索(又はライブラリーサーチ)を行って、候補分子をリストアップして絞り込み、最終的に未知試料分子の同定を行う。
しかしながら、上記した質量分析計の校正作業(キャリブレーション作業)は、非常に作業が面倒であって、調整時間もかかることから、従来の質量測定作業における作業効率を低下させる主原因であった。即ち、従来は、質量分析計の連続運転(校正作業なしの運転)による効率の良い測定作業を実施することができなかった。また、複数台の質量分析計を用いた測定系においては、各装置について外部標準による校正作業(キャリブレーション作業)を行ったとしても、各装置の精度、信頼性を一元化することは極めて困難であるという問題があった。
外部標準キャリブレーションの場合、従来の上記データベース検索の手順では、外部環境の影響によって発生する質量分析計自体の誤測定による影響を測定データから排除することはできなかった。特に測定環境の微妙な温度変化(0.2℃ぐらいの変化)で生じる測定誤差も時として無視できないものとなっていた。
また、従来の内部標準キャリブレーションによって複雑な生体高分子混合物を測定する場合は、内部標準物質と試料由来のイオンシグナルが重なってしまい、そのイオンを分析できないため、内部標準として試料に入れる物質の種類や濃度の選択はとても難しかった。高い質量精度を広い質量範囲で実現するためには、何点もの内部標準物質を導入する必要があった。
更には、従来は、同定の信頼性が低かったので、その結果を一つ一つ人間が確認しなければならかった。ところが、近年の質量分析計の発達により、より複雑な生体高分子混合物の直接分析が可能になってきたため、データが大量化し、一つ一つのデータを人間が目で確認することが困難になってきたことから、複雑な生体高分子混合物を分析対象とする信頼性の高い自動同定手法の開発が要請されていた。
そこで、本発明は、測定開始前の質量分析計の校正作業、あるいはサンプルに予め内部標準を添加することを不要とするとともに、データ処理のみに基づいた高精度で信頼性の高い生体高分子自動同定方法を提供することを目的とする。
上記技術課題を解決するために、本発明では、以下の(1)〜(7)の手順を少なくとも備える生体高分子自動同定方法を提供する。
(1)試料中の生体高分子の質量を質量分析方法に基づいて測定する質量測定手順。(2)前記質量測定手順によって得られる実測質量値を所定のデータベースと照合させることによって候補分子を検索するデータベース検索手順。(3)類似順位スコアの高い任意数の候補分子を選び出す候補分子選出手順。(4)候補分子を内部標準として用いて実測質量値を校正する質量値校正手順。(5)前記手順により得られた候補分子の校正質量値と理論質量値の相対誤差を算出し、該相対誤差の標準偏差を求める手順。(6)該標準偏差から前記データベース検索手順の許容誤差を求める手順。(7)前記許容誤差に基づき再度前記データベース検索手順。なお、上記「データベース」は、分子構造あるいは配列データベースを意味する。
ここで、上記(4)の質量値校正手順は、候補分子選出手順で選び出された候補分子の実測質量値と理論質量値の相対誤差を算出し、理論質量値と相対誤差のプロットに対する最小二乗直線(「y=a×M+b」の式で示される直線。Mは理論質量値。)を作成して実測質量値の系統誤差を見積もる手順と、この系統誤差を全実測値から差し引くことで、実測質量値を校正する手順を採用することができる。
例えば、飛行時間型質量分析計の場合において、候補分子の系統誤差を上記最小二乗直線から求める。この系統誤差を全実測値から差し引く。具体的には、(Xc−M)/M=(X−M)/M−(aM+b)[Xは実測質量値、Xcは校正質量値、Mは理論質量値]からなる式を変形し、式:Xc=X−M(aM+b)を得る。
ここで、理論質量値Mは、候補分子については与えられているが、全ての実測値について与えられている訳ではない。このため、全実測値を校正するためには、上記式のM(aM+b)の項を実測値で近似させる必要がある。a,bの値は、一般にX、Xcと比較して非常に小さいため、M(aM+b)≒Xc(aX+b)とできる。これを上記式に代入して、Xc=X−Xc(aX+b)を得る。これを変形し、Xc=X/(1+(aX+b))なる式を得て、この式を用いて、全ての実測値を質量校正する。
上記した本発明に係る生体高分子自動同定方法によれば、複雑な生体高分子混合物を対象として、データ処理のみにより、非常に高精度な質量値を得ることができる。得られる質量値の精度が高いと、より一義的に生体高分子を特定、同定することが可能となる。即ち、本発明は、複雑な生体高分子混合物を分析対象とする信頼性の高い自動同定手法を提供できる。
次に本発明では、コンピュータシステムを利用することにより前記生体高分子自動同定方法を構成する各手順を実行できるプログラム情報が格納されているCD−ROMその他の情報記録媒体を提供する。
上記した手段によれば、測定開始前の質量分析計の校正作業、あるいはサンプルに予め内部標準を添加することを不要とすることができる。また、データ処理のみに基づいた高精度で信頼性の高い生体高分子自動同定方法を実施することができる。
上記技術課題を解決するために、本発明では、以下の(1)〜(7)の手順を少なくとも備える生体高分子自動同定方法を提供する。
(1)試料中の生体高分子の質量を質量分析方法に基づいて測定する質量測定手順。(2)前記質量測定手順によって得られる実測質量値を所定のデータベースと照合させることによって候補分子を検索するデータベース検索手順。(3)類似順位スコアの高い任意数の候補分子を選び出す候補分子選出手順。(4)候補分子を内部標準として用いて実測質量値を校正する質量値校正手順。(5)前記手順により得られた候補分子の校正質量値と理論質量値の相対誤差を算出し、該相対誤差の標準偏差を求める手順。(6)該標準偏差から前記データベース検索手順の許容誤差を求める手順。(7)前記許容誤差に基づき再度前記データベース検索手順。なお、上記「データベース」は、分子構造あるいは配列データベースを意味する。
ここで、上記(4)の質量値校正手順は、候補分子選出手順で選び出された候補分子の実測質量値と理論質量値の相対誤差を算出し、理論質量値と相対誤差のプロットに対する最小二乗直線(「y=a×M+b」の式で示される直線。Mは理論質量値。)を作成して実測質量値の系統誤差を見積もる手順と、この系統誤差を全実測値から差し引くことで、実測質量値を校正する手順を採用することができる。
例えば、飛行時間型質量分析計の場合において、候補分子の系統誤差を上記最小二乗直線から求める。この系統誤差を全実測値から差し引く。具体的には、(Xc−M)/M=(X−M)/M−(aM+b)[Xは実測質量値、Xcは校正質量値、Mは理論質量値]からなる式を変形し、式:Xc=X−M(aM+b)を得る。
ここで、理論質量値Mは、候補分子については与えられているが、全ての実測値について与えられている訳ではない。このため、全実測値を校正するためには、上記式のM(aM+b)の項を実測値で近似させる必要がある。a,bの値は、一般にX、Xcと比較して非常に小さいため、M(aM+b)≒Xc(aX+b)とできる。これを上記式に代入して、Xc=X−Xc(aX+b)を得る。これを変形し、Xc=X/(1+(aX+b))なる式を得て、この式を用いて、全ての実測値を質量校正する。
上記した本発明に係る生体高分子自動同定方法によれば、複雑な生体高分子混合物を対象として、データ処理のみにより、非常に高精度な質量値を得ることができる。得られる質量値の精度が高いと、より一義的に生体高分子を特定、同定することが可能となる。即ち、本発明は、複雑な生体高分子混合物を分析対象とする信頼性の高い自動同定手法を提供できる。
次に本発明では、コンピュータシステムを利用することにより前記生体高分子自動同定方法を構成する各手順を実行できるプログラム情報が格納されているCD−ROMその他の情報記録媒体を提供する。
上記した手段によれば、測定開始前の質量分析計の校正作業、あるいはサンプルに予め内部標準を添加することを不要とすることができる。また、データ処理のみに基づいた高精度で信頼性の高い生体高分子自動同定方法を実施することができる。
第1図は、実施例1において同定した質量値(m/z)と誤差の関係を示す図である。
第2図は、実施例2において質量校正を行う前の同定結果を示す図である。
第3図は、実施例2において質量校正を行った後の同定結果を示す図である。
第4図は、実施例2において同定した質量値(m/z)と誤差の関係を示す図である。
第2図は、実施例2において質量校正を行う前の同定結果を示す図である。
第3図は、実施例2において質量校正を行った後の同定結果を示す図である。
第4図は、実施例2において同定した質量値(m/z)と誤差の関係を示す図である。
本発明に係る生体高分子自動同定方法の好適な一実施形態について説明する。なお、本発明は、以下の実施形態に限定されることはない。
まず、試料中の未知生体高分子の質量を、目的に応じた慣用の質量分析方法に基づいて測定し、実測質量値Xを得る。質量分析方法は、例えば、タンデム質量計を用いることができる。タンデム質量分析計は、アナライザーをタンデムに複数台結合した構成を備える質量分析計であって、詳しくは、最初のアナライザーで混合物中の特定のイオン(親イオン)を選択し、次のアナライザーで選択したイオンと不活性気体との衝突解離を行い、最後のアナライザーで解離した内部構造情報を示すイオン(生成イオン)を質量分析する構成を備える。
前記質量測定手順によって得られた実測質量値Xを、慣用のデータベース検索エンジンが読み込める形式(2値ファイル。質量値と強度。)に変換した上で、その質量値既知の分子が多数記録されたデータベースと照合させて、前記未知生体高分子に該当する可能性のある候補分子の検索を行う。
なお、上記する実測質量値Xの形式変換は、質量分析計メーカーから一般に提供されている慣用のMasslynx(Micromass社)等のソフトウェアを適宜用いることによって行うことができ、データベース検索は、市販のMascot(Matrix Science社)等のデータベースソフトウェアを用いて好適に行うことができる。
前記データベース検索手順の結果から、類似順位スコアの高い任意数の候補分子(のセット)を選び出す。なお、セットの大きさnは、統計的処理が出来る程度の任意数である。
続いて、前記した候補分子選出手順によって選び出されてきた各候補分子の実測質量値Xと理論質量値Mの相対誤差Eを、次式(1)に従って算出する。
E=(X−M)/M・・・・・(1)
続いて、前記手順によって得られた相対誤差Eの平均値mEを次式(2)に基づいて算出する。
mE=Σ(E)/n・・・・・(2)
また、前記相対誤差Eの標準偏差sEを次式(3)に基づいて算出する。この標準偏差により、候補分子を内部標準として用いることが妥当かどうかを判定する。なお、sE<mEであれば、校正は有効である。
sE={Σ(E−mE)2/(n−1)}(1/2)・・・・・(3)
次に系統誤差の大きさを見積もり、これを実測質量値Xから差し引くことにより、校正質量値Xcを得る。例えば、飛行時間型質量分析計の場合において、候補分子の相対系統誤差は、以下の手順で理論質量値と相対誤差のプロットに対する「最小二乗直線y=ax+b」から求めることができる。候補分子の校正後の相対誤差Ec=(Xc−M)/Mとすると、Ec=E−(aM+b)。したがって、
(Xc−M)/M=(X−M)/M−(aM+b)・・・・・(4)
[Xは実測質量値、Xcは校正質量値、Mは理論質量値]
具体的には、上記(4)式を変形して、次式(5)を得る。
Xc=X−M(aM+b)・・・・・(5)
ここで、理論質量値は、候補分子については与えられているが、全ての実測値について与えられている訳ではない。このため、全実測値を校正するためには、上記式(5)の「M(aM+b)」の項を実測値で近似させる必要がある。a,bの値は、一般にX、Xcと比較して非常に小さいので、M(aM+b)≒Xc(aX+b)とできるから、これを上記式(6)に代入して、次式(6)を得る。
Xc=X−Xc(aX+b)・・・・・(6)
この式(6)を変形式である次式(7)に基づいて、全ての実測値を質量校正する。
Xc=X/(1+(aX+b))・・・・・(7)
なお、前記最小二乗直線における「b」と「a」は、それぞれ次式(8)、(9)によって求めることができる。
b=Σ{(M−mM)×(E−mE)}/Σ{(M−mM)^2}・・(8)
a=mE−b×mM・・・・・(9)
さらに、mMは、候補分子の理論質量値Mの平均値であって、次式(10)によって求めることができる。
mM=Σ(M)/n・・・・・(10)
質量校正後の質量値Xcと理論質量値Mの相対誤差Ecは、次式(11)によって求めることができる。
Ec=E−(aM+b)・・・・・(11)
続いて、候補分子について得られた相対誤差Ec=(Xc−M)/Mの平均値mEc及び標準偏差SEcを、それぞれ次式(12)、(13)に基づいて求める。
mEc=Σ(Ec)/n・・・・・(12)
SEc={Σ(E−mEc)2/(n−1)}(1/2)・・・・・(13)
求めた平均値mEcから校正を評価する。理想的にはmEc=0となる。求めた標準偏差SEcからデータベース検索に用いる許容誤差Tcを次式(14)に基づいて算出することによって、一連の校正(キャリブレーション)手順を完了する。
Tc=K×SEc・・・・・(14)
[K=1.5〜3.0]
なお、Kは、質量値の信頼区間を指定するための経験的な定数を示す。このK値は、データベース検索に用いるソフトウェアの精度に応じて適宜決定できる。データベース検索ソフトウェアの同定性能が高いほど、99.7%の信頼区間であるK=3に近づけることが出来る。なお、Mascot(Matrix Science社)のデータベースソフトウェアの場合では、経験的にK=1.5を採用できる。
得られた前記許容誤差Tc(Tc1)に基づいて、再度同様のデータベース検索を行う。必要に応じて、上記した一連の校正及びデータベース検索を複数回繰り返すことによって、許容誤差Tcの範囲を徐々に狭めていき(T→Tc1→Tc2→・・・)、候補分子の選出精度を高める。なお、前記Tc1は一回目の校正作業によって得られた許容誤差を示し、Tc2は二回目の校正作業によって得られた許容誤差を示す。
これにより、候補分子同定の確度を高めていくことができる。即ち、未知試料分子の同定精度を向上させることができる。
以上説明した手順を所望のコンピュータプログラム情報に加工し、このプログラム情報をCD−ROM、フロッピー(登録商標)ディスクなどの各種情報記録媒体、コンピュータハードウエア、サーバ等に格納し、所望のコンピュータシステムやコンピュータネットワーク(情報通信技術)を介して、該プログラムを実行可能に工夫することができる。
まず、試料中の未知生体高分子の質量を、目的に応じた慣用の質量分析方法に基づいて測定し、実測質量値Xを得る。質量分析方法は、例えば、タンデム質量計を用いることができる。タンデム質量分析計は、アナライザーをタンデムに複数台結合した構成を備える質量分析計であって、詳しくは、最初のアナライザーで混合物中の特定のイオン(親イオン)を選択し、次のアナライザーで選択したイオンと不活性気体との衝突解離を行い、最後のアナライザーで解離した内部構造情報を示すイオン(生成イオン)を質量分析する構成を備える。
前記質量測定手順によって得られた実測質量値Xを、慣用のデータベース検索エンジンが読み込める形式(2値ファイル。質量値と強度。)に変換した上で、その質量値既知の分子が多数記録されたデータベースと照合させて、前記未知生体高分子に該当する可能性のある候補分子の検索を行う。
なお、上記する実測質量値Xの形式変換は、質量分析計メーカーから一般に提供されている慣用のMasslynx(Micromass社)等のソフトウェアを適宜用いることによって行うことができ、データベース検索は、市販のMascot(Matrix Science社)等のデータベースソフトウェアを用いて好適に行うことができる。
前記データベース検索手順の結果から、類似順位スコアの高い任意数の候補分子(のセット)を選び出す。なお、セットの大きさnは、統計的処理が出来る程度の任意数である。
続いて、前記した候補分子選出手順によって選び出されてきた各候補分子の実測質量値Xと理論質量値Mの相対誤差Eを、次式(1)に従って算出する。
E=(X−M)/M・・・・・(1)
続いて、前記手順によって得られた相対誤差Eの平均値mEを次式(2)に基づいて算出する。
mE=Σ(E)/n・・・・・(2)
また、前記相対誤差Eの標準偏差sEを次式(3)に基づいて算出する。この標準偏差により、候補分子を内部標準として用いることが妥当かどうかを判定する。なお、sE<mEであれば、校正は有効である。
sE={Σ(E−mE)2/(n−1)}(1/2)・・・・・(3)
次に系統誤差の大きさを見積もり、これを実測質量値Xから差し引くことにより、校正質量値Xcを得る。例えば、飛行時間型質量分析計の場合において、候補分子の相対系統誤差は、以下の手順で理論質量値と相対誤差のプロットに対する「最小二乗直線y=ax+b」から求めることができる。候補分子の校正後の相対誤差Ec=(Xc−M)/Mとすると、Ec=E−(aM+b)。したがって、
(Xc−M)/M=(X−M)/M−(aM+b)・・・・・(4)
[Xは実測質量値、Xcは校正質量値、Mは理論質量値]
具体的には、上記(4)式を変形して、次式(5)を得る。
Xc=X−M(aM+b)・・・・・(5)
ここで、理論質量値は、候補分子については与えられているが、全ての実測値について与えられている訳ではない。このため、全実測値を校正するためには、上記式(5)の「M(aM+b)」の項を実測値で近似させる必要がある。a,bの値は、一般にX、Xcと比較して非常に小さいので、M(aM+b)≒Xc(aX+b)とできるから、これを上記式(6)に代入して、次式(6)を得る。
Xc=X−Xc(aX+b)・・・・・(6)
この式(6)を変形式である次式(7)に基づいて、全ての実測値を質量校正する。
Xc=X/(1+(aX+b))・・・・・(7)
なお、前記最小二乗直線における「b」と「a」は、それぞれ次式(8)、(9)によって求めることができる。
b=Σ{(M−mM)×(E−mE)}/Σ{(M−mM)^2}・・(8)
a=mE−b×mM・・・・・(9)
さらに、mMは、候補分子の理論質量値Mの平均値であって、次式(10)によって求めることができる。
mM=Σ(M)/n・・・・・(10)
質量校正後の質量値Xcと理論質量値Mの相対誤差Ecは、次式(11)によって求めることができる。
Ec=E−(aM+b)・・・・・(11)
続いて、候補分子について得られた相対誤差Ec=(Xc−M)/Mの平均値mEc及び標準偏差SEcを、それぞれ次式(12)、(13)に基づいて求める。
mEc=Σ(Ec)/n・・・・・(12)
SEc={Σ(E−mEc)2/(n−1)}(1/2)・・・・・(13)
求めた平均値mEcから校正を評価する。理想的にはmEc=0となる。求めた標準偏差SEcからデータベース検索に用いる許容誤差Tcを次式(14)に基づいて算出することによって、一連の校正(キャリブレーション)手順を完了する。
Tc=K×SEc・・・・・(14)
[K=1.5〜3.0]
なお、Kは、質量値の信頼区間を指定するための経験的な定数を示す。このK値は、データベース検索に用いるソフトウェアの精度に応じて適宜決定できる。データベース検索ソフトウェアの同定性能が高いほど、99.7%の信頼区間であるK=3に近づけることが出来る。なお、Mascot(Matrix Science社)のデータベースソフトウェアの場合では、経験的にK=1.5を採用できる。
得られた前記許容誤差Tc(Tc1)に基づいて、再度同様のデータベース検索を行う。必要に応じて、上記した一連の校正及びデータベース検索を複数回繰り返すことによって、許容誤差Tcの範囲を徐々に狭めていき(T→Tc1→Tc2→・・・)、候補分子の選出精度を高める。なお、前記Tc1は一回目の校正作業によって得られた許容誤差を示し、Tc2は二回目の校正作業によって得られた許容誤差を示す。
これにより、候補分子同定の確度を高めていくことができる。即ち、未知試料分子の同定精度を向上させることができる。
以上説明した手順を所望のコンピュータプログラム情報に加工し、このプログラム情報をCD−ROM、フロッピー(登録商標)ディスクなどの各種情報記録媒体、コンピュータハードウエア、サーバ等に格納し、所望のコンピュータシステムやコンピュータネットワーク(情報通信技術)を介して、該プログラムを実行可能に工夫することができる。
飛行時間型質量分析計は、一定距離Lをイオンが飛行する時間を測定し、次の式(15)で表される質量mと飛行時間Tの関係から、質量を測定する装置である。
T=L・(2eV)^(−1/2)・(m/z)^(1/2)・・・・・(15)
(ここで、eは電気素量、zは電荷数である。)
この装置の測定質量精度は、Lと加速電圧Vに依存する。Lは装置に固有の値であるが、主に温度により膨張収縮することにより変動し、Vは電源電圧のドリフトにより変動する。測定条件によっては、これらの変動により100ppm以上の系統的な質量誤差が生じることがある。しかし、一方、質量誤差同士のばらつき(質量分析計の性能を反映)は、系統的な誤差の平均値と比較して小さい。これを利用して、系統的な誤差だけを取り去ることができる。
以下に、実際に本発明の方法により同定精度が向上した例を示す。
T=L・(2eV)^(−1/2)・(m/z)^(1/2)・・・・・(15)
(ここで、eは電気素量、zは電荷数である。)
この装置の測定質量精度は、Lと加速電圧Vに依存する。Lは装置に固有の値であるが、主に温度により膨張収縮することにより変動し、Vは電源電圧のドリフトにより変動する。測定条件によっては、これらの変動により100ppm以上の系統的な質量誤差が生じることがある。しかし、一方、質量誤差同士のばらつき(質量分析計の性能を反映)は、系統的な誤差の平均値と比較して小さい。これを利用して、系統的な誤差だけを取り去ることができる。
以下に、実際に本発明の方法により同定精度が向上した例を示す。
人血清アルブミンのトリプシン消化物100fmolをHPLC−MS/MSで測定し、市販のデータベース検索ソフトMascotを用いてMS/MS ions searchによりデータベース検索を行った。(検索パラメータ、Peptide Tolerance 250ppm,MS/MS tolerance 0.5Da)
検索結果の中から最もスコアが高い20個のイオンについて同定された理論m/zとの相対誤差E((X−M)/M、単位ppm)を求め、これを理論m/zに対してプロットし、第1図に示した。第1図に見られるように、元の相対誤差E(第1図◆印)の平均値は約170ppmであるが、Eのばらつきは150−175ppmの範囲に収まり、E自体の値と比較すると小さかった。
このイオン群に対する最小自乗直線を求め、これを各イオンの誤差から差し引くことで質量を校正した。校正後の相対誤差Ec(第1図■印)も同様にプロットし、第1図に示した。このEcのばらつき(標準偏差で代表)から求めたデータベース検索パラメータは、Peptide Tolerance 18ppm,MS/MS tolerance 0.080Daであった。この質量校正により、検索時の許容誤差が250→18ppm、0.5→0.080Daとそれぞれ約14倍、6倍狭めることができ、同定の信頼性が向上した。
検索結果の中から最もスコアが高い20個のイオンについて同定された理論m/zとの相対誤差E((X−M)/M、単位ppm)を求め、これを理論m/zに対してプロットし、第1図に示した。第1図に見られるように、元の相対誤差E(第1図◆印)の平均値は約170ppmであるが、Eのばらつきは150−175ppmの範囲に収まり、E自体の値と比較すると小さかった。
このイオン群に対する最小自乗直線を求め、これを各イオンの誤差から差し引くことで質量を校正した。校正後の相対誤差Ec(第1図■印)も同様にプロットし、第1図に示した。このEcのばらつき(標準偏差で代表)から求めたデータベース検索パラメータは、Peptide Tolerance 18ppm,MS/MS tolerance 0.080Daであった。この質量校正により、検索時の許容誤差が250→18ppm、0.5→0.080Daとそれぞれ約14倍、6倍狭めることができ、同定の信頼性が向上した。
次に、本発明の質量校正法により、実際に誤同定を訂正できることを以下に示す。
質量データを用いたデータベース検索により、誤同定しやすいことが知られているペプチドSRLDQELKを定法により合成した。このペプチド100fmolを上記の人血清アルブミンのトリプシン消化物100fmolと混合し、同様に実験を行った。通常の検索条件(検索パラメータ、Peptide Tolerance 250ppm,MS/MS tolerance 0.5Da)では、合成ペプチドは第2図に示すように誤同定した。
次に、上記の通り質量校正をしたところ、第3図に示すように、正しいペプチドを同定することができた。
このペプチドのMS/MSスペクトル中の各イオンを同定したそれぞれのペプチド(EKLTQELKとSRLDQELK)の理論的な生成イオン(b、yイオン系列)にアサインし、その系統誤差をm/zに対してプロットし、第4図に示した。SRLDQELK(第4図◆印)ではすべてのイオンの相対誤差が狭い範囲に収まるのに対し、EKLTQELK(第4図■印)では2つの異なった分布を示した。このように、データ処理により質量精度を向上することで、よく似た質量を持ち、c末端部分の配列が同一のペプチドを区別し、正しく同定することが可能となった。
質量データを用いたデータベース検索により、誤同定しやすいことが知られているペプチドSRLDQELKを定法により合成した。このペプチド100fmolを上記の人血清アルブミンのトリプシン消化物100fmolと混合し、同様に実験を行った。通常の検索条件(検索パラメータ、Peptide Tolerance 250ppm,MS/MS tolerance 0.5Da)では、合成ペプチドは第2図に示すように誤同定した。
次に、上記の通り質量校正をしたところ、第3図に示すように、正しいペプチドを同定することができた。
このペプチドのMS/MSスペクトル中の各イオンを同定したそれぞれのペプチド(EKLTQELKとSRLDQELK)の理論的な生成イオン(b、yイオン系列)にアサインし、その系統誤差をm/zに対してプロットし、第4図に示した。SRLDQELK(第4図◆印)ではすべてのイオンの相対誤差が狭い範囲に収まるのに対し、EKLTQELK(第4図■印)では2つの異なった分布を示した。このように、データ処理により質量精度を向上することで、よく似た質量を持ち、c末端部分の配列が同一のペプチドを区別し、正しく同定することが可能となった。
本発明によれば、測定開始前の質量分析計の校正作業、あるいはサンプルに予め内部標準を添加することを不要とすることができるので、質量分析計の連続運転(校正作業による中断のない運転)が可能となる。その結果、作業者は煩わしい装置調整作業から開放され、分子同定作業の効率を向上させることができる。
また、質量分析計自体の誤差の影響を排除し、データ処理のみに基づいた高精度で信頼性の高い生体高分子自動同定方法を実施することができ、そして、複数台の質量分析計を用いた測定系では、各質量分析計から得られるデータ精度の一元化を達成できるので、未知試料分子の誤同定を確実に防止することができる。
また、質量分析計自体の誤差の影響を排除し、データ処理のみに基づいた高精度で信頼性の高い生体高分子自動同定方法を実施することができ、そして、複数台の質量分析計を用いた測定系では、各質量分析計から得られるデータ精度の一元化を達成できるので、未知試料分子の誤同定を確実に防止することができる。
Claims (3)
- 試料中の生体高分子の質量を質量分析方法に基づいて測定する質量測定手順と、
前記質量測定手順によって得られる実測質量値を所定のデータベースと照合させることによって候補分子を検索するデータベース検索手順と、
類似順位スコアの高い任意数の候補分子を選び出す候補分子選出手順と、
候補分子を内部標準として用いて実測質量値を校正する質量値校正手順と、
前記手順により得られた候補分子の校正質量値と理論質量値の相対誤差を算出し、該相対誤差の標準偏差を求める手順と、
該標準偏差から前記データベース検索手順の許容誤差を求める手順と、
前記許容誤差に基づき再度前記データベース検索手順と、を行うことを特徴とする生体高分子自動同定方法。 - 前記質量値校正手順は、前記候補分子選出手順で選び出された候補分子の実測質量値と理論質量値の相対誤差を算出し、
理論質量値と相対誤差のプロットに対する最小二乗直線を作成して実測質量値の系統誤差を見積もる手順と、
この系統誤差を全実測値から差し引くことにより実測質量値を校正する手順と、からなることを特徴とする請求の範囲第1項に記載の生体高分子自動同定方法。 - コンピュータシステムを利用することにより、請求の範囲第1項又は第2項に記載の生体高分子自動同定方法を構成する各手順を実行できるプログラム情報が格納されたことを特徴とする情報記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002259737 | 2002-09-05 | ||
JP2002259737 | 2002-09-05 | ||
PCT/JP2003/011298 WO2004023132A1 (ja) | 2002-09-05 | 2003-09-04 | 生体高分子自動同定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2004023132A1 JPWO2004023132A1 (ja) | 2005-12-22 |
JP4106444B2 true JP4106444B2 (ja) | 2008-06-25 |
Family
ID=31973080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004534155A Expired - Lifetime JP4106444B2 (ja) | 2002-09-05 | 2003-09-04 | 生体高分子自動同定方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7680609B2 (ja) |
EP (1) | EP1542002B1 (ja) |
JP (1) | JP4106444B2 (ja) |
AU (1) | AU2003261930A1 (ja) |
WO (1) | WO2004023132A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0308278D0 (en) * | 2003-04-10 | 2003-05-14 | Micromass Ltd | Mass spectrometer |
US7202473B2 (en) * | 2003-04-10 | 2007-04-10 | Micromass Uk Limited | Mass spectrometer |
JP4922819B2 (ja) * | 2007-05-10 | 2012-04-25 | 日本電子株式会社 | タンパク質データベース検索法および記録媒体 |
US8306758B2 (en) * | 2009-10-02 | 2012-11-06 | Dh Technologies Development Pte. Ltd. | Systems and methods for maintaining the precision of mass measurement |
WO2013097058A1 (zh) * | 2011-12-31 | 2013-07-04 | 深圳华大基因研究院 | 一种蛋白质组的鉴定方法 |
US12013402B2 (en) | 2019-03-28 | 2024-06-18 | The Regents Of The University Of California | Concurrent analysis of multiple analytes |
JP7390270B2 (ja) * | 2020-09-11 | 2023-12-01 | 日本電子株式会社 | 質量分析システム及び変換式補正方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10132786A (ja) * | 1996-10-30 | 1998-05-22 | Shimadzu Corp | 質量分析装置 |
US6963807B2 (en) | 2000-09-08 | 2005-11-08 | Oxford Glycosciences (Uk) Ltd. | Automated identification of peptides |
-
2003
- 2003-09-04 JP JP2004534155A patent/JP4106444B2/ja not_active Expired - Lifetime
- 2003-09-04 EP EP03794226A patent/EP1542002B1/en not_active Expired - Lifetime
- 2003-09-04 AU AU2003261930A patent/AU2003261930A1/en not_active Abandoned
- 2003-09-04 US US10/526,464 patent/US7680609B2/en not_active Expired - Fee Related
- 2003-09-04 WO PCT/JP2003/011298 patent/WO2004023132A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP1542002B1 (en) | 2012-08-15 |
WO2004023132A1 (ja) | 2004-03-18 |
US20060100792A1 (en) | 2006-05-11 |
EP1542002A4 (en) | 2006-09-06 |
US7680609B2 (en) | 2010-03-16 |
EP1542002A1 (en) | 2005-06-15 |
JPWO2004023132A1 (ja) | 2005-12-22 |
AU2003261930A1 (en) | 2004-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12033839B2 (en) | Data independent acquisition of product ion spectra and reference spectra library matching | |
Spengler | De novo sequencing, peptide composition analysis, and composition-based sequencing: a new strategy employing accurate mass determination by fourier transform ion cyclotron resonance mass spectrometry | |
US7781729B2 (en) | Analyzing mass spectral data | |
JP4818270B2 (ja) | 選択されたイオンクロマトグラムを使用して先駆物質および断片イオンをグループ化するシステムおよび方法 | |
US7197402B2 (en) | Determination of molecular structures using tandem mass spectrometry | |
JP4857000B2 (ja) | 質量分析システム | |
JP5510011B2 (ja) | 質量分析方法及び質量分析装置 | |
JP4106444B2 (ja) | 生体高分子自動同定方法 | |
EP4078600B1 (en) | Method and system for the identification of compounds in complex biological or environmental samples | |
JP4811466B2 (ja) | 質量分析方法及び質量分析装置 | |
GB2572319A (en) | Methods and systems for analysis | |
US20240355604A1 (en) | Data independent acquisition of product ion spectra and reference spectra library matching | |
JP2006113034A (ja) | タンパク質データの分析 | |
JP2005055370A (ja) | 液体クロマトグラフ質量分析データ解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4106444 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |