JP2005528609A - 質量分析 - Google Patents
質量分析 Download PDFInfo
- Publication number
- JP2005528609A JP2005528609A JP2004509407A JP2004509407A JP2005528609A JP 2005528609 A JP2005528609 A JP 2005528609A JP 2004509407 A JP2004509407 A JP 2004509407A JP 2004509407 A JP2004509407 A JP 2004509407A JP 2005528609 A JP2005528609 A JP 2005528609A
- Authority
- JP
- Japan
- Prior art keywords
- peak
- amino acid
- mass
- difference
- acid sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Cell Biology (AREA)
- Medical Informatics (AREA)
- Microbiology (AREA)
- Evolutionary Biology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Peptides Or Proteins (AREA)
Abstract
Description
tandem mass spectrometry;(MS)n)(時間/空間的に関してタンデムである)によって得られたデータを直接利用することはできない。なぜならば、そのような分析法によれば、非常に大量の序列的生成物イオンのデータが得られ、それらは非常に複雑であるために、データベースと比較することができない。さらに、従来法では、質量分析データ、特に高度に複雑化した(MS)nスペクトルから直接的に実際の配列を得ることは不可能である。現在の(MS)n装置としては、MS/MS(タンデム型、すなわち、n=2)質量分析装置、およびKratos
Axima QIT TOF質量分析装置などのような装置が挙げられる。
従って、非特許文献2の教示に従っても、以下に詳細に示すような本発明の結論に到達することはできない。非特許文献2は、MS/MS(すなわち、MS2)スペクトルのみについて考察したものであり、n>2のMSnについては言及していないことにも注目すべきである。
マトリックス・サイエンス(MatrixScirnce)社;パーキンス(Perkins)ら、Electrophoresis. 1990年12月;20(18): 3551-67;PMID: 10612281 パパヤノポウロス(Papayannopoulos)IA,「ペプチドの衝突誘導性解裂タンデム質量スペクトルの解析(Theinterpretation of collision-induced dissociation tandem mass spectra ofpeptides)」, Mass Spectrom. Rev., 1995,14(1)49-73
(i)前記部分分解サンプルポリペプチドのソフトイオン化質量スペクトルを得て、該部分分解サンプルポリペプチドから得られるイオン種の一組のm/zピークを与える工程;
(ii)工程(i)で得られた一組のm/zピークに基づき、m/zピーク候補の複数のセットを選定する工程であって、各m/zピーク候補セット中の各m/zピークが、少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっているようにする工程;
(iii)工程(ii)で得られた各m/zピーク候補セットについて、各m/zピークと少なくとも1つの近隣のピークとの間の質量差の配列を求め、さらに、質量差配列を逆の順序にすると、別のm/zピーク候補セットの質量差配列の少なくとも一部を形成しないようなm/zピーク候補セットを除外する工程;
(iv)残りのm/zピークセットの中から「差異セット(Difference
Sets)」を選別する工程;
(v)残りのm/zピーク候補セットについて、別のm/zピーク候補セットの連続的部分列であるようなm/zピーク候補セットを選別して除外する工程;さらに、
(vi)残りのm/zピーク候補セットの各々について推定アミノ酸配列を決定する工程であって、各アミノ酸配列は、各m/zピークとその少なくとも1つの近隣のピークとの間の質量差に対応しているアミノ酸によって構成されており、各推定アミノ酸配列は、前記サンプルポリペプチドの推定アミノ酸配列の少なくとも一部を含むようにする工程。
或るm/zピークの「少なくとも1つの近隣のピーク」とは、当該m/zピークの値より大きいおよび/または小さいような、最も近いm/z値のものを意味する。例えば、仮にm/z値が375、300、347、372および331であるようなm/zピークのセットにおいては、ピーク値331は、2つの近隣ピーク、すなわち、300と347を有することになる。
ソフトイオン化質量スペクトルにより、少なくとも3個のm/zピークが得られ、例えば、4、5、6、7、8、9、10、15、20、25、30、40、50、75または100個のm/zピークが得られる。
本発明により、これまで解析不可能であると考えられてきた、質量スペクトルからのアミノ酸の候補配列の作成が可能になった。これは、工程(iii)において逆配列を使用することによって達成され、そのようなことはこれまで考えられていなかった。サンプルポリペプチドから得られるm/zピークに対応する質量ピークセットについて、考え得る全ての可能性のある候補を作成することにより、考え得る全ての可能性のある候補配列について確実に考慮することもできる。帰納的および/または演繹的過程を利用して差異セット(Difference
Sets)を選別する(identify)ことと併せて、本発明に従えば、サンプルポリペプチドの新規な配列決定(デノボシークエンス)を行うことができ、これは、従来技術に対する有意な効果である。
Ion Clusters)を生成することも可能である。N−末端イオン種(すなわち、a、b−およびc−娘イオン)は、それぞれ、娘イオンから末端NH2基(16ドルトン)の質量を差引いた質量を有するハイブリッドイオンを生成することができる。
例示配列NH2−CHR1−CO−NH−CHR2−CO−NH−CHR3−COOHにおいては、各CHR−CO−NHによってabcクラスター(すなわち、c−イオンはb−イオンよりも17ドルトン重く、b−イオンはa−イオンよりも28ドルトン重い)が生成し、同様に対応するxyzクラスターも生成する。タンパク質中の隣接するアミノ酸に由来するイオンおよびイオンのクラスターは、当該アミノ酸の質量分だけ異なっている。
Ions)」および「差異セット(Difference
Sets)」を構成し、それらは、いろいろな方法でm/zピーク候補セット(複数)の中から選別する(見分ける:identify)ことができる。「差異セット」には、候補のイオン系列(Series)(例えば、a−、b−、c−、x−、y−およびz−イオンなど)を選別することができる「変位セット(Displacement
Sets)」、およびアミノ酸に関する情報を提供することができる「ニュートラルロスセット(中性消失セット:Neutral
Loss Sets)」が含まれる。
例えば、本発明においては、エンドペプチダーゼであるトリプシンを用いることができる。その他の有用なエンドペプチダーゼ類は当該分野において既知であり、当業者においては自明である。
(a)工程(i)で得られたx個のピークを有する一組のm/zピークから、2〜x個のメンバーから成るm/zピーク候補セットの可能性のある全てを選別し;さらに、
(b)任意の1つのm/zピークとその近隣の少なくとも1つのピークとの間の質量差がアミノ酸1個の質量と等しくないようなm/zピーク候補セットを全て排除する。
例えば、段階(b)において、各m/zピーク候補セットについて、各m/zピークとその近隣の少なくとも1つのピークとの間の質量差を求め、次いで、アミノ酸の質量とは異なる質量差を有するm/zピーク候補セットを全て排除する。
mass difference sequence)が存在しない場合には、当該m/zピーク候補セットを除外する。この工程により、m/zピーク候補のセット群(すなわち、アミノ酸配列候補群)から不適当な娘イオンを含むm/zピーク候補セットが除去される。例えば、m/zピークセット中の各ピークは、アミノ酸の質量分だけ異なっているが、該セットは多数のb−娘イオンとともにx−娘イオンを含んでいることもある。ピークセットがb−娘イオンピークのみによって構成されている場合には、同等の質量差分離れているy−娘イオンピークから成る相補的なセットが存在しているはずであり、その場合には、候補配列を除外しない。しかしながら、b−娘イオンおよびx−娘イオンから成るセットの場合には、質量ピークの相補的セットは、y−娘イオンおよびa−娘イオンから成るセットを含んでいると考えられ、質量差はそれらのアミノ酸の質量差に対応していないか、または、不正確であり、従って、x−娘イオンを含む候補配列を除外する。本明細書においては、「少なくとも部分的に」とは、別のアミノ酸の質量差配列との質量差が少なくとも2、3、4、5、6、7、8、9、10、15、20または25であることを意味している。比較対象となる2つの配列に関しては、一方が他方の連続的部分列でなければならない。
(a)残りのm/zピーク候補セットの各々を比較する段階;
(b)比較段階(a)の結果を相関させて(相互関係を明らかにして)、前記m/zピーク候補セットのうちの第一のセットを含む「差異セット」を選別する段階であって、該第一のセットは、前記m/zピーク候補セットのうちの第二のセットであって、−17u、−18u、−34uまたは−48u変位しているものの少なくとも一部を形成しているようにする段階;さらに、
(c)−17u「差異セット」のメンバーは、アスパラギン、グルタミン、リジンおよびアルギニンからなる群より選択されるアミノ酸を含むことが推定されるものとして分類し(ラベルし)、−18u「差異セット」のメンバーは、セリン、スレオニン、グルタミン酸およびチロシンからなる群より選択されるアミノ酸を含むことが推定されるものとして分類し、−34u「差異セット」のメンバーは、システインを含むことが推定されるものとして分類し、−48u「差異セット」のメンバーは、メチオニンを含むことが推定されるものとして分類し、 各「差異セット」のうちの質量の軽いメンバーは、ニュートラルロスm/zピーク候補セットとして分類する段階。
そのような差異セットを分類する(ラベルする)ときには、含有が推定されている上述のアミノ酸に従ってm/zピーク候補の第一および第二のセットの両方についてラベルする。
(a)残りのm/zピーク候補セットの各々を比較する段階;
(b)比較段階(a)の結果を相関させて、前記m/zピーク候補セットのうちの第一のセットを含む「差異セット」を選定する工程であって、該第一のセットは、前記m/zピーク候補セットのうちの第二のセットであって、+28u、+17uまたは−26u変位しているものの少なくとも一部を形成しているようにする段階;さらに、
(c)+28u「差異セット」のうちの重いものと軽いものをそれぞれ推定b−およびa−差異セットとして分類し(ラベルし)、−26u「差異セット」のうちの重いものと軽いものをそれぞれ推定x−およびy−差異セットとして分類し、+17u「差異セット」のうちの重いものと軽いものをそれぞれ推定c−およびb−差異セットとして分類する段階。
m/zピーク候補セットによって表されるアミノ酸配列は、アミノ酸質量と照合しながら、m/zピーク値の間の質量差を調べることにより簡単に決定することができる。かくして、m/zピーク値の或る組合せ(セット)を直ちにアミノ酸配列に翻訳することができる。この操作は、最も重いm/zピーク値から、または最も軽いm/zピーク値から、あるいはその他の任意の順序で開始することができる。しかしながら、得られた配列には、方向性を定める必要が残されている。配列決定に起因するイオン種が、a−、b−またはc−イオンである場合には、これらは、m/zピーク値の重い方から軽い方に向かって、CからN方向にアミノ酸配列を与える。これとは別に、配列決定に起因するイオン種が、x−、y−またはz−イオンである場合には、m/zピーク値の重い方から軽い方に向かって、NからC方向にアミノ酸配列を与える。一般的に、アミノ酸配列はNからC方向に表され、a−、b−およびc−イオン種に由来する配列は、x−、y−およびz−イオン種に由来する配列と混同してはならない。
Predicate)」ということができる。或るm/zピークセットがa−、b−、c−、x−、y−またはz−系列である(特に、b−またはy−系列である)ことが確認されると(したがって、それらの方向性が判定されると)、その系列由来の「差異セット」を選別し、スコアリングに使用することができる(以下を参照)。
従って、別の方法としては、あるいは、追加の方法として、「差異セット」は次のような段階に従って選定することもできる:
(a)残りのm/zピーク候補セットについて、m/zピーク候補セットの各々の中で最も重いm/z値と前記サンプルポリペプチドのプリカーサー質量との差を計算し;
(b)当該差をアミノ酸の質量と、さらにはアミノ酸の質量+18uとを比較し;
(c)比較段階(b)の結果を相関させて、差が或るアミノ酸の質量と等しい場合には、C−末端に当該アミノ酸を有するy−系列「差異セット」であることが示唆され、また、差が或るアミノ酸の質量+18uと等しい場合には、N−末端に当該アミノ酸を有するb−系列「差異セット」であることが示唆されるものとする。
特に、上記3つの演繹的方法を組み合わせて「差異セット」を選別することにより、サンプルポリペプチドに対する推定アミノ酸配列を決定することができるような重要な情報が得られる。
values)」〔すなわち、変位質量(Displacement
Masses)〕の数を数え、さらに、この数を対応する適切な系列(例えば、b−またはy−系列)内のm/z値の数と比較することによりスコアを算出することができる。そして、系列(例えば、b−またはy−系列)内のm/z値の数に対して変位m/z値の可能性があるものの数が多ければ多いほど、配列が正しい可能性が高く、故に、適切なスコアを与えることができる。
Series)について変位m/z値(変位質量)の数を数え、この数を主要系列内のm/z値の数で割り、各変位系列について1以下の数値を与えることにより、スコアを算出することができる。かくして、例えば、主要b−系列が5つの質量を有しており、b−18系列が3つの質量を有する場合、3/5(0.6)というスコアが得られる。
b−系列の場合、b−系列のスコアには、a−系列の「変位質量」も含まれ得る。従って、b−系列については、b−17、b−18、a、a−17およびa−18からなる「変位系列」メンバーが含まれ、これらは、それぞれ、−17、−18、−28、−45および−46という「変位質量」に対応している。
y−系列の場合には、y−系列のスコアには、y−系列の「変位質量」のみが含まれている。従って、y−系列には、y−17およびy−18から成る変位系列メンバーが含まれ、これらは、−17および−18という「変位質量」に対応している。
詳細については表7に示す。
(a)前記主要系列から得ることができる各変位系列中の「変位」m/z値の数を求め;
(b)段階(a)の結果を主要系列中のm/z値の数と相関させ;さらに、
(c)相関段階(b)の結果から求められたスコアを主要系列に割り当てる。
特に、この方法は主要系列であるb−またはy−系列に対して有効である。
b−系列については、系列中の最大質量をb−系列中の最大質量または二番目に大きい質量として類別することに基づき、さらなるスコア因子が計算できる。y−系列については、最大質量は、プロトン付加されたプリカーサーイオン質量のそれと同じであることから、最大質量はy−系列の二番目に大きい質量としてのみ類別される。y−系列中の最大質量がこの規準に合致しない場合には、系列中の最小質量をy1イオンとして類別を行う。b−またはy−系列についていずれかの規準が合致する場合には、スコアを増して(例えば、1.0)複合スコア(composite score)が得られる。複合スコアリング法は図6に図示されている。
従って、n>2であるようなMSnスペクトルを使用することにより、樹木状(free-like)データ構造(すなわち、通常の再帰的ナビゲーションが可能である)が得られ、解析すべきスペクトルは木の幹(n=2)に作成され、ハイブリッドスペクトルは各枝に作成される。可能性のあるスペクトルに対するこのような再帰的反復およびスペクトルの「樹木状」構造の作成については、図8〜13に示す。
そのようなスペクトルおよびハイブリッドスペクトルの作成については、以下に説明する。
サンプルポリペプチドの推定アミノ酸配列を決定するための上述の方法は、演繹的方法から成るものと考えられる。しかしながら、本発明は、帰納的方法を使用するよう範囲を拡げて、推定アミノ酸配列を決定する。特に、MSおよび(MS)nデータから推定配列を決定することを目的として、監視機械学習アルゴリズム(supervised
machine learning algorithms)を使用することができる。
(a)差異セットを選別するようにトレーニングされている監視学習アルゴリズム用のコンピューター実行プログラムコードへのインプットとして、m/zピーク候補セットを通過させ;さらに、
(b)残りのm/zピーク候補セットから選別された「差異セット」をコンピューターからアウトプット(出力)する。
本発明において有用な監視学習アルゴリズムとしては、k−NN〔T.M.ミッチェル(Mitchell)、「機械学習(Machine Learning)」、マグロウヒル国際版(McGraw-Hill
iInternational Editions)、1997年〕、C4.5〔J.R.キンラン(Quinlan)、「C4.5:機械学習用プログラム(C4.5: Programs for Machine Learning)」、モーガン・カウフマン(Morgan Kaufmann)社、1993年〕、CN2〔P.クラーク(Clark)およびT.ニブレット(Niblett)、「CN2帰納的アルゴリズム(The CN2 induction
algorithm)」、Machine Learning,
3(4): 261-283, 1989;P.クラーク(Clark)およびR.ボスウェル(Boswell)、「CN2を用いた規則帰納:最新の進歩(Rule induction with CN2: some recent improvements)」、ECML'91の要旨集、pp. 151-163、1991年);R.ラコトマララ(Rakotomalala)、D.ジグヘッド(Zighed)、F.フェシェット(Feschet)、「規則帰納過程における規則特性付けの実験的評価(Empirical evaluation of rule characterization in rule
induction process)」、第14回サイバネティクスおよびシステム研究に関するヨーロッパ会議(the Fourteenth European Meeting on Cybernetics and System
Research)の要旨集、pp. 779-804、1998年)、RBF(ラジアルベースファンクション(Radial Base Function)ニューラルネットワーク〕、およびOC1〔マーシー(Murthy), SKら、「斜め決定木誘導のためのシステム(A System for Induction of Oblique Decision Trees)」、Journal of Artificial Intelligence Research 2(1994)1-32〕などが挙げられる。
data)を生成する。このアルゴリズムは、利用可能なテストの質を判断することを目的として、エントロピーに基づく測定を採用している。しかしながら、このアルゴリズム単独ではテストに偏りがあり、それによってクラスの不確定性のレベルが低下するため、測定方法を一部修正し、偏りのない結果を多くもたらすことを確実にする。このアルゴリズムが他のアルゴリズムよりも優れている点は、予測可能なエラーに基づいたプルーニングをサポートしているので、オーバーフィッティングによる性能の低下がないことである。
term)を追加するか、または論理和項(disjunctive
term)を削除するか、のいずれかを行う。適切な複素数を発見すると、CN2アルゴリズムはトレーニングセット(training
set)に含まれている例を除去し、さらに、「複素数」を加え、規則リストの最後の「クラス」を予測する。このプロセスは、複素数をそれ以上リストに追加できなくなったときに、それぞれクラス単位で終了する。
function)が自明の恒等関数であること以外は、RBFネットワークは多層識別(Multilayer perception: MLP)と類似した構造をとっている。隠れた層は、ガウスの幅および位置などを用いた如何なる関数に対しても適切なパラメーターを有する。
decisions)と称する〕。OC1は決定に際して属性の線形結合を利用するので、全ての属性が数値的であることを必要とする。
(i)前記部分分解サンプルポリペプチドのソフトイオン化質量スペクトルを得て、部分分解サンプルポリペプチドから得られたイオン種の一組のm/zピークを与える工程;
さらに、前記コンピューターを用い、
(ii)工程(i)で得られた一組のm/zピークに基づき、m/zピーク候補の複数のセットを選定する工程であって、各m/zピーク候補セットの中の各m/zピークが、少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっているようにする工程;
(iii)工程(ii)で得られた各m/zピーク候補セットについて、各m/zピークと少なくとも1つの近隣のピークとの間の質量差の配列を求め、さらに、質量差配列を逆の順序にすると、別のm/zピーク候補セットの質量差配列の少なくとも一部を形成しないようなm/zピーク候補セットを除外する工程;
(iv)残りのm/zピークセットの中から「差異セット」を選別する工程し;
(v)残りのm/zピーク候補セットについて、別のm/zピーク候補セットの連続的部分列であるようなm/zピーク候補セットを選別して除外する工程;さらに、
(vi)残りのm/zピーク候補セット各々について推定アミノ酸配列を決定する工程であって、各アミノ酸配列は、各m/zピークとその少なくとも1つの近隣のピークとの間の質量差に対応しているアミノ酸によって構成されており、各推定アミノ酸配列は、前記サンプルポリペプチドの推定アミノ酸配列の少なくとも一部を含むようにする工程。
質量スペクトルは、手元にまたは遠方に設置された質量分析計からデータセットとして簡単に供給され、例えば、コンピューターデータベースまたはその他の保存媒体に保存することができる。
コンピューターは、その結果を任意の所望する様式(例えば、少なくとも1つの推定配列としてなど)でフィードバックすることができ、さらに、少なくとも1つの推定アミノ酸配列に関して、上述したような任意のスコアを与えたり、または、例えば、統計的データなどを伴うようにしてもよい。
(a)機械への以下の命令を記憶するメモリー、
(i)前記部分分解サンプルポリペプチドのソフトイオン化質量スペクトルから得られ、該部分分解サンプルポリペプチド由来のイオン種の一組のm/zピークに基づき、m/zピーク候補の複数のセットを選定して、各m/zピーク候補セットの中の各m/zピークが、少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっているようにする;
(ii)工程(i)で得られた各m/zピーク候補セットについて、各m/zピークと少なくとも1つの近隣のピークとの間の質量差の配列を求め、さらに、質量差配列を逆の順序にすると、別のm/zピーク候補セットの質量差配列の少なくとも一部を形成しないようなm/zピーク候補セットを除外する;
(iii)残りのm/zピークセットの中から「差異セット」を選別する;
(iv)残りのm/zピーク候補セットについて、別のm/zピーク候補セットの連続的部分列であるようなm/zピーク候補セットを選別して除外する;さらに、
(v)残りのm/zピーク候補セット各々について推定アミノ酸配列を決定して、各アミノ酸配列が、各m/zピークとその少なくとも1つの近隣のピークとの間の質量差に対応しているアミノ酸によって構成されており、各推定アミノ酸配列が、前記サンプルポリペプチドの推定アミノ酸配列の少なくとも一部を含むようにする。
(b)および、前記メモリーに接続されたプロセッサーであって、前記機械命令を実行することによって前記サンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定するプロセッサー。
(i)前記一組のm/zピークから、m/zピーク候補の複数のセットを選定して、各m/zピーク候補セットの中の各m/zピークが、少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっているようにするためのプログラムコード;
(ii)工程(i)で得られた各m/zピーク候補セットから、各m/zピークと少なくとも1つの近隣のピークとの間の質量差の配列を求め、さらに、質量差配列を逆の順序にすると、別のm/zピーク候補セットの質量差配列の少なくとも一部を形成しないようなm/zピーク候補セットを除外するためのプログラムコード;
(iii)残りのm/zピークセットの中から「差異セット」を選別するためのプログラムコード;
(iv)残りのm/zピーク候補セットから、別のm/zピーク候補セットの連続的部分列であるようなm/zピーク候補セットを選別して除外するためのプログラムコード;さらに、
(v)残りのm/zピーク候補セット各々について推定アミノ酸配列を決定して、各アミノ酸配列が、各m/zピークとその少なくとも1つの近隣のピークとの間の質量差に対応しているアミノ酸によって構成されており、各推定アミノ酸配列は、前記サンプルポリペプチドの推定アミノ酸配列の少なくとも一部を含むようにするためのプログラムコード。
aj−aj-1=aaj
xj−xj-1=aan-j+1
bj−bj-1=aaj
yj−yj-1=aan-j+1
cj−cj-1=aan-j+1
zj−zj-1=aan-j+1
Equations)」と称する。
bj−aj=[CO]=28
bj−cj=[NH3]=17
yj−xj=[H2]−[CO]=−26
yj−zj=[H2]+[NH]=17
プリカーサーイオン質量の相関性は、次の式で求めることもできる:
bj式およびyj式を加え、さらに、[N末端]=[H]および[C末端]=[OH]と仮定することにより、以下の結果が得られる:
エレクトロスプレー二重荷電イオンの相関性は、次のようにして求めることができ、
通常、エレクトロスプレーサンプルは、強力な二重荷電ピークを有する。
1≦j≦n−1のとき、以下の式が導かれる:
すなわち、[プリカーサーイオン]−[yn-1]=aa2
かくして、mDNセットは、セット内の各要素(メンバー)は、少なくともひとつの近隣のメンバーとアミノ酸1個分の質量が相異していなければならないという述語(「質量差異述語(Mass
Difference Predicate)」)を用いて演繹される(推測される)。このことは、(上述の)差分方程式を満たす。既述のように、述語に用いられるアミノ酸の質量セットは、標準的なアミノ酸の質量を用いることができ、または、所望する場合には、ふつうではないもしくは修飾(変性)されたアミノ酸の質量を含むことができ、あるいは、ある種のアミノ酸を除外することもできる。そのような質量を採用し、どのような質量を除外するのかについての決定は、サンプルポリペプチドに関して入手可能な情報に基づいて行うことができ、例えば、サンプルポリペプチドを産生した微生物の培養条件などが挙げられ、これは例えば、サンプルポリペプチド内に同位体元素ラベルしたアミノ酸が含まれている可能性があることなどを意味している。
diff set(HROOTMASS,[HROOTMASS|TAILMASSES],[],X),NEXTROOTSEQUENCE),
contact(NEXTROOTSEQUENCE,ACCUMSEQUENCE,NEWAWQUENCE),
amino
generator(TAILMASSES,NEWAWQUENCE.RESULT).
ここで、HROOTMASS=配列内の次の根元質量
TAILMASSES=残っている質量
ACCUMSEQUENCE=現在の解セット
RESULT=最終結果を受け取るから(空)の計算変数
amino diff set=Prologのゴール
X=一般的な未知の変数
NEXTROOTSEQUENCE=新規に発見された系列
NEWSEQUENCE=解の最新リスト
かくして、本発明により決定された少なくとも1つの推定アミノ酸配列は、サンプルポリペプチドに対して少なくとも2つの推定部分配列を含む。
しかしながら、リスト内にはさらに14個の正しくない(または「誤」)系列が存在する。さらなる工程を経て誤系列を削除するが、これらの工程が、フィルター掛け工程とみなされるものである。このようなフィルター掛け工程を用いることにより、表1の「系列」欄内に与えられている情報から、イオン系列を類別することもできる。
フィルター掛けには2つのメカニズムがある。第一のフィルター掛けメカニズムは、「反射述語」を用いるものであり、mDN対に適用する。アミノ酸の配列は、a−、b−およびc−イオンとx−、y−およびz−イオンとの間では逆向きである。この特性は、差分方程式内で数学的に示される。すなわち、C−末端イオン(x−、y−およびz−)はaan-j+1項を有し、他方、N−末端イオンはaaj項を有する。2つのmDNセット内における質量の分離に関する反転的または反射的性質は、図2に図示されており、y質量イオンセットは配列EGGAIFE(配列番号2)によって分離され、bイオンセットは配列FIAGGER(配列番号3)によって分離されおり、これは、部分的にyセットの逆である。
b jおよびy j欄は、隣接する質量との差を表している。差異を求める操作は分化(differenciation)と称され、連続したデータの分化によって得られた個々のデータアナログである。表3においては、順序が逆になっている。配列は、分化した系列から得られたものである。両系列は、部分配列YLKGE(配列番号4のアミノ酸番号2〜6)を共有していることがわかる。
Rj m DNはk m DNの連続的部分列である。
ここで、jm DNは質量差のベクトル、すなわちmDNの一次微分を表す。Rは逆対角行列を示し、例えば、3行3列の行列では次のようになる:
001
010
100
そのような反射対はmRとして表される。正常なサブセット条件は次のようになる:
∀mR∈mDN∈M
すなわち、各mRセットはmDNセットのサブセットであり、mDNはMのサブセットである。
「反射述語フィルター(Reflective Predicate Filter)」によるフィルター掛けに続き、さらにフィルター掛けを実施して「置換イオン(Displacement Ions)」を選別する。この場合には「ニュートラルロス述語(Neutral Loss Predicate)」であり、これは演繹的方法の1つである。その他の場合として、または帰納的述語に加えて、「監視機械学習(Supervised Machine
Learning)アルゴリズム」などのような帰納的方法を用いてm/zピーク候補セット(複数)をフィルター掛けし、および/または類別することもできる。ニュートラルロス述語は、上述した「質量差異述語(Mass Differene
Predicate)」と同様に作動するが、ある種のイオン種に生じ得るニュートラルロスに基づいている。ニュートラルロスの特性は、イオン自身の性質によって定められ、従って、ニュートラルロスを選別(確認)することによりイオン種に関する情報を判断することができる。例えば、特定のアミノ酸には特定のニュートラルロスを受ける。したがって、ニュートラルロスを有するイオン種は、特異的なアミノ酸を含むものとして、または、アミノ酸セットのうちのひとつを有するものと判断することができる。ニュートラルロスはイオン種の末端から生じることから、特定のアミノ酸の位置、またはニュートラルロスに関与しているアミノ酸セットのうちの一つの位置を判断することもできる。
アミノ酸について生じるニュートラルロスの詳細については図3に示す。ニュートラルロスの例としては、18(H2O)、17(NH3)および34(H2S)などが挙げられる。
かくして、このフィルター掛けのメカニズムは、既知の「置換質量(Displacement Masses)」によって分けられた2つまたはそれ以上のピークを有するセットの対を選択することによって機能する。「差分方程式」から次のことがわかる:bj−aj=28
「質量差異述語」は、フィルター掛けメカニズムを提供すると共に、a−およびb−系列のみは28ドルトンで変位されることから、系列の類別にも用いることができる。系列の類別については以下にさらに記載している。
「質量差異述語」は、b−およびc−系列の間にも適用できる。この場合には質量差はNH3分(17ドルトン)である。同様に、y−およびz−系列イオンは17ドルトンで変位される。
∀mDN-28∈mDN∈M
いくつかの場合においては、質量差異述語は、反射的フィルター掛けを行った系列のサブセットにも適用することができ、その場合には、次の条件を有する:
∀mDN-28∈mR∈mDN∈M
残りのm/zピーク候補セットについては、追加の工程を実施することにより、他のものの連続的部分列であるm/zピーク候補セット(すなわち、そのメンバーが別のセット(単数または複数)のサブセットを形成はしないが、別のセット(単数または複数)の連続的部分列を形成するm/zピーク候補セット)を除外する。
例えば、図2には、配列REGGAIFE(配列番号1)およびEFIAGGER(配列番号16)に対応する2つのm/zピーク候補セットが示されているが、方向性については示していないが、上述の工程を経ることによってm/zピーク候補セットに方向付けがなされる。
或るm/zピーク候補セットがb−系列であるのかy−系列であるのかを判断することを目的として、bjおよびyjの式から次の式が導かれる:
従って、次のようになる:
bn=[プリカーサーイオン(Precursor ion)+H+]+18 (式3)
式1〜式3において設定した条件を最も大きい質量に当てはめた場合、多数の異なるシナリオが得られ、それらはすなわち:
1.系列は、y−およびb−系列として曖昧に類別される;
2.系列は、y−系列ではなくb−系列として類別される;
3.系列は、b−系列ではなくy−系列として類別される;
4.系列は、b−系列にもy−系列にも類別されない;
b−およびy−系列と考えられるものは、反射述語を満たす対(pairs)として見出される。これらの対に対して、上記の式を用いて対内の各系列の類別を行う。対内の各系列に対して4つのシナリオが存在することから、16個の結果が得られ、これらは行列(マトリックス)で表すことができる。類別に関する決定は、図7に示すように、カルノー図に基づく論理を用いて行うことができる。
16個のシナリオ条件のうち、6個は類別エラーの可能性がある。類別エラーが生じた場合、「差異系列(Difference Series)」を計算して、−28(a−系列)、−45(a−17系列)および−46(a−18系列)から成る差異値を求める。系列1および系列2について、a−系列およびそれらのニュートラルロス変位の総数を比較し、大きい方の系列をb−系列と類別する。この類別法は、a−系列が一般的であり、x−系列は稀であるという仮定に基づいている。
既にさらなるニュートラルロスおよびa−系列を、類別済みのb−およびy−系列について計算することができる。変位値−17、−18、−28、−45および−46を用い、類別済みのb−系列からb−17、b−18、a、a−17およびa−18変位系列をそれぞれ計算することができる。同様に、変位値−17および−18を用い、類別済みのy−系列からy−17およびy−18「変位系列(Displacement Series)」をそれぞれ算出することができる。b−およびy−系列とプリカーサー質量との関係は次の式で表される:
bj+yn-j=[プリカーサーイオン]+1 (式4)
この式から、次のようにして、y−系列からa−系列を計算し、また、b−系列からy−系列を計算することができる:
aj+yn-j=[プリカーサーイオン]−27 (式5)
bj+y−17n-j=[プリカーサーイオン]−16 (式6)
b−17、b−18、a−17およびa−18イオン系列質量を有するy−系列イオン質量とプリカーサーイオン質量とを含む同様の式は、式5の−27を−16、−17、−44および−45に置き換えることによって導くことができる。y−18を有するb−系列イオン質量とプリカーサーイオン質量とを含む同様の関係式は、式6の−16を−17に置き換えることによって導くことができる。
a−18CTerm;および
a−18NTerm
次に、2つのセットを合わせ、合わせたセットが「質量差異述語」を満たす場合には、2つのセットは互いに交換して使用することができる。「質量差異述語」を満たさない場合には、2つのセットは別々に記録する。
従って、
a−18combined=a−18CTerm+∪a−18NTerm
yn-1=[プリカーサー+H+]−aa2 (式7)
である。
C−末端がOHである場合には、以下のようになる:
y1=aan+[C−末端]+[H]+[H+]=aan+19 (式8)
b−およびy−系列に関するスコアは、各系列に対する可能な「変位質量(Displacement Masses)」の数を合計することによって計算する。他のすべての系列に対しては、スコアは0とする。可能な「変位質量」および相殺値(オフセット)を表7に示す。可能な各変位系列に対する「変位質量」の総数を、適宜、b−またはy−系列内の質量の数で除算する(割る)ことにより、≦1の値が得られる。表7には、b−またはy−系列に対して使用した「変位系列(Displacement Masses)」を示している。b−系列は5つの「変位系列」が可能であり、最大置換スコアは5である。y−系列は2つの「変位系列」が可能であり、最大スコアは2である。
b−系列に関しては、b−系列内の最大質量または二番目に大きい質量に従って系列内の最大質量を類別することに基づき、さらなる評価因子(スコアリング因子)を計算する。y−系列に関しては、最大質量は、y−系列の二番目に大きい質量に対してのみ類別されるが、これは、y−系列内の最大質量がプリカーサーイオン質量のそれと等しいからである。これらの最大質量条件は、式1〜3で表される。
y−系列の最大質量がこの規準に合致しない場合には、系列内の最小質量(y1イオン)類別する試みを行う。y−系列内の最小質量は、式10の条件に適合する場合には、y1イオンとして類別される。記述されている規準がb−系列にもy−系列にも適合しない場合には、変位スコアに1.0を加え、合成スコア(複合スコア)を得る。このようなスコア調整に関する論理は図6のフローチャートに示している。図6のチャートにおいては、10が「Yes」であり、20が「No」である。チャートのその他の部分は以下の通りである:
30:btop=[プリカーサー+H+]−18
40:btop-1=[プリカーサー+H+]−18−[アミノ酸質量]
50:badjusted score=変位スコア
60:badjusted score=変位スコア+1
70:ytop-1=[プリカーサー+H+]−[アミノ酸質量]
80:yadjusted score=badjusted score+1
90:ybottom=[アミノ酸質量]+19
100:yadjusted score=badjusted score
上述したように、本発明はn>2の場合の(MS)nデータを用いることができる。図8は、複合(ms)n樹木状データ構造用に得られた複数の経路を示す。4つの経路すべてに共通して(ms)2スペクトルがあるが、各経路は別異の(ms)3スペクトルを有する。図9から12は、4つの質量経路をそれぞれどのように解析したかを示している。点線で示した質量は、複合(ms)nスペクトルの構築には使用しない。すなわち、ms1スペクトルからは、単一のプリカーサーイオンm/zピークのみを採用する。後続の(ms)nスペクトルに関しては、プリカーサーイオンのm/z値よりも大きいかまたは等しいm/z値を有する全てのピークを使用する。従って、更なる(ms)nスペクトルが得られない場合には、最終スペクトル内の全てのピークを使用する。経路から得られた各質量系列を推定系列述語へのインプットとして使用する。次に、b−y系列他を選定することを目的として、各推定系列を他の述語へのインプットとして使用する。各経路から決定されたアミノ酸配列は、異なっている場合もあれば同一の場合もある。配列が同一である場合にはそれらを結合する。スコアリングも行い、また、配列に合成スコアを導入する。合成スコアは、上述に従って求められた個々の配列のスコアを総計することによって計算される。
図2は、理想的な状況において、隣接の系列質量を差し引くことにより配列を決定する手法を示したものである。N−末端系列およびC−末端系列由来の配列を結合する場合、多数の異なるシナリオが可能になる。そのようなシナリオについては、配列を結合(スプライス)するメカニズムと共に図14に示している。図14においては、各円は、GまたはAなどのような配列内の1個のアミノ酸を表している。斜線を付けた円は長い方の系列(配列)を表しており、べた黒の円は短い方の系列(配列)を表している。斜線とべた黒とが半々の円は、長い方の系列および短い方の系列の共通部分、すなわち、オーバラップ(重複)セグメントを示している。
この情報と共に、サンプルポリペプチドに対して少なくとも1つの推定アミノ酸配列を決定した。
上述の実施例は発明を限定するためのものではなく、当業者であれば容易に考えつくような多数の変形も、請求項に定義された発明の範囲を超えることなく実施することができる。
Claims (22)
- 部分分解されたサンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定する方法であって、
(i)前記部分分解サンプルポリペプチドのソフトイオン化質量スペクトルを得て、該部分分解サンプルポリペプチドから得られるイオン種の一組のm/zピークを与える工程;
(ii)工程(i)で得られた一組のm/zピークに基づき、m/zピーク候補の複数のセットを選定する工程であって、各m/zピーク候補セット中の各m/zピークが、少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっているようにする工程;
(iii)工程(ii)で得られた各m/zピーク候補セットについて、各m/zピークと少なくとも1つの近隣のピークとの間の質量差の配列を求め、さらに、質量差配列を逆の順序にすると、別のm/zピーク候補セットの質量差配列の少なくとも一部を形成しないようなm/zピーク候補セットを除外する工程;
(iv)残りのm/zピークセットの中から「差異セット」を選別する工程;
(v)残りのm/zピーク候補セットについて、別のm/zピーク候補セットの連続的部分列であるようなm/zピーク候補セットを選別して除外する工程;さらに、
(vi)残りのm/zピーク候補セットの各々について推定アミノ酸配列を決定する工程であって、各アミノ酸配列は、各m/zピークとその少なくとも1つの近隣のピークとの間の質量差に対応しているアミノ酸によって構成されており、各推定アミノ酸配列は、前記サンプルポリペプチドの推定アミノ酸配列の少なくとも一部を含むようにする工程;
を含むことを特徴とする方法。 - 請求項1に従い、サンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定する方法であって、「差異セット」の選定が、
(a)残りのm/zピーク候補セットの各々を比較する段階;
(b)比較段階(a)の結果を相関させて、前記m/zピーク候補セットのうちの第一のセットを含む「差異セット」を選別する段階であって、該第一のセットは、前記m/zピーク候補セットのうちの第二のセットであって−17u、−18u、−34uまたは−48u変位しているものの少なくとも一部を形成しているようにする段階;さらに、
(c)−17u「差異セット」のメンバーは、アスパラギン、グルタミン、リジンおよびアルギニンからなる群より選択されるアミノ酸を含むことが推定されるものとして分類し、−18u「差異セット」のメンバーは、セリン、スレオニン、グルタミン酸およびチロシンからなる群より選択されるアミノ酸を含むことが推定されるものとして分類し、−34u「差異セット」のメンバーは、システインを含むことが推定されるものとして分類し、−48u「差異セット」のメンバーは、メチオニンを含むことが推定されるものとして分類し、 各差異セットのうちの質量の軽いメンバーは、ニュートラルロスm/zピーク候補セットとして分類する段階;
を含むことを特徴とする方法。 - 請求項1または2に従い、サンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定する方法であって、「差異セット」の選定が、
(a)残りのm/zピーク候補セットの各々を比較する段階;
(b)比較段階(a)の結果を相関させて、前記m/zピーク候補セットのうちの第一のセットを含む差異セットを選定する工程であって、該第一のセットは、前記m/zピーク候補セットのうちの第二のセットであって+28u、+17uまたは−26u変位しているものの少なくとも一部を形成しているようにする段階;さらに、
(c)+28u「差異セット」のうちの重いものと軽いものをそれぞれ推定b−およびa−「差異セット」として分類し、−26u「差異セット」のうちの重いものと軽いものをそれぞれ推定x−およびy−「差異セット」として分類し、+17u「差異セット」のうちの重いものと軽いものをそれぞれ推定c−およびb−「差異セット」として分類する段階。
を含むことを特徴とする方法。 - 請求項1〜3のいずれかに従い、サンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定する方法であって、「差異セット」の選定が、
(a)残りのm/zピーク候補セットについて、m/zピーク候補セットの各々の中で最も重いm/z値と前記サンプルポリペプチドのプリカーサー質量との差を計算し;
(b)当該差をアミノ酸の質量と、さらにはアミノ酸の質量+18uとを比較し;
(c)比較段階(b)の結果を相関させて、差が或るアミノ酸の質量と等しい場合には、C−末端に当該アミノ酸を有するy−系列「差異セット」であることが示唆され、また、差が或るアミノ酸の質量+18uと等しい場合には、N−末端に当該アミノ酸を有するb−系列「差異セット」であることが示唆されるものとする;
ことによって行なわれることを特徴とする方法。 - 請求項1〜4のいずれかに従い、サンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定する方法であって、「差異セット」の選定が、
(a)「差異セット」を選別するようにトレーニングされる監視学習アルゴリズム用のコンピューター実行プログラムコードへのインプットとして、残りのm/zピーク候補セットを通過させ;さらに、
(b)残りのm/zピーク候補セットから選別された「差異セット」をコンピューターからアウトプットする;
ことによって行なわれることを特徴とする方法。 - 請求項5に従い、サンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定する方法であって、前記監視学習アルゴリズムが、k−NN、C4.5、CN2、RBFおよびOC1より成る群から選択されることを特徴とする方法。
- 請求項5または6に従い、サンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定する方法であって、前記監視学習アルゴリズムは、a−、b−、c−、x−、y−およびz−「差異セット」より成る群から選択された「差異セット」を表すトレーニングデータを用いてトレーニングされることを特徴とする方法。
- 請求項5〜7のいずれかに従い、サンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定する方法であって、前記監視学習アルゴリズムは、ニュートラルロス「差異セット」を表すトレーニングデータを用いてトレーニングされることを特徴とする方法。
- 請求項1〜8のいずれかに従う方法であって、前記サンプルポリペプチドは、エクソペプチダーゼおよびエンドペプチダーゼより成る群から選択される酵素を用いて部分分解されていることを特徴とする方法。
- 請求項9に従う方法であって、前記サンプルポリペプチドがエンドペプチダーゼであるトリプシンを用いて部分分解されていることを特徴とする方法。
- 請求項1〜10のいずれかに従う方法であって、複数のm/zピーク候補セットの選別が、
(a)工程(i)で得られたx個のピークを有する一組のm/zピークから、2〜x個のメンバーから成るm/zピーク候補セットの可能性のある全てを選別し;さらに、
(b)任意の1つのm/zピークとその近隣の少なくとも1つのピークとの間の質量差がアミノ酸1個の質量と等しくないようなm/zピーク候補セットを全て排除する;
ことによって行なわれることを特徴とする方法。 - 請求項1〜11のいずれかに従う方法であって、質量差を比較するアミノ酸質量が化学的および翻訳後修飾されたアミノ酸より成る群から選択されるアミノ酸の質量であることを特徴とする方法。
- 請求項1〜12のいずれかに前記質量スペクトルが(MS)nスペクトルであり、nは少なくとも2であることを特徴とする方法。
- 請求項1〜13のいずれかに従う方法であって、前記サンプルポリペプチドのプリカーサー質量を測定する工程を追有することを特徴とする方法。
- 請求項1〜14のいずれかに従う方法であって、m/zピーク候補セットの残りのうちの少なくともひとつについて方向性を決定する工程を追有することを特徴とする方法。
- 請求項1〜15のいずれかに従う方法であって、主要a−、b−、c−、x−、y−およびz−系列を含む残りのm/zピーク候補の各々にスコアを割り当てることを含み、該スコアの計算が、
(a)前記主要系列から得ることができる各変位系列中の「変位」m/z値の数を求め;
(b)段階(a)の結果を主要系列中のm/z値の数と相関させ;さらに、
(c)相関段階(b)の結果から求められたスコアを主要系列に割り当てる。
ことによって行なわれることを特徴とする方法。 - 請求項1〜16のいずれかに従う方法であって、前記サンプルポリペプチドに対して決定された少なくとも1つの推定アミノ酸配列が、前記サンプルポリペプチドの推定部分配列を少なくとも2つ含むことを特徴とする方法。
- コンピューターを用いて、部分分解されたサンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定する方法であって、
(i)前記部分分解サンプルポリペプチドのソフトイオン化質量スペクトルを得て、部分分解サンプルポリペプチドから得られたイオン種の一組のm/zピークを与える工程;
さらに、前記コンピューターを用い、
(ii)工程(i)で得られた一組のm/zピークに基づき、m/zピーク候補の複数のセットを選定する工程であって、各m/zピーク候補セットの中の各m/zピークが、少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっているようにする工程;
(iii)工程(ii)で得られた各m/zピーク候補セットについて、各m/zピークと少なくとも1つの近隣のピークとの間の質量差の配列を求め、さらに、質量差配列を逆の順序にすると、別のm/zピーク候補セットの質量差配列の少なくとも一部を形成しないようなm/zピーク候補セットを除外する工程;
(iv)残りのm/zピークセットの中から「差異セット」を選別する工程;
(v)残りのm/zピーク候補セットについて、別のm/zピーク候補セットの連続的部分列であるようなm/zピーク候補セットを選別して除外する工程;さらに、
(vi)残りのm/zピーク候補セット各々について推定アミノ酸配列を決定する工程であって、各アミノ酸配列は、各m/zピークとその少なくとも1つの近隣のピークとの間の質量差に対応しているアミノ酸によって構成されており、各推定アミノ酸配列は、前記サンプルポリペプチドの推定アミノ酸配列の少なくとも一部を含むようにする工程;
を含むことを特徴とする方法。 - サンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定するための装置であって、
(a)機械への以下の命令を記憶するメモリー、
(i)前記部分分解サンプルポリペプチドのソフトイオン化質量スペクトルから得られ、該部分分解サンプルポリペプチド由来のイオン種の一組のm/zピークに基づき、m/zピーク候補の複数のセットを選定して、各m/zピーク候補セットの中の各m/zピークが、少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっているようにする;
(ii)工程(i)で得られた各m/zピーク候補セットについて、各m/zピークと少なくとも1つの近隣のピークとの間の質量差の配列を求め、さらに、質量差配列を逆の順序にすると、別のm/zピーク候補セットの質量差配列の少なくとも一部を形成しないようなm/zピーク候補セットを除外する;
(iii)残りのm/zピークセットの中から「差異セット」を選別する;
(iv)残りのm/zピーク候補セットについて、別のm/zピーク候補セットの連続的部分列であるようなm/zピーク候補セットを選別して除外する;さらに、
(v)残りのm/zピーク候補セット各々について推定アミノ酸配列を決定して、各アミノ酸配列が、各m/zピークとその少なくとも1つの近隣のピークとの間の質量差に対応しているアミノ酸によって構成されており、各推定アミノ酸配列が、前記サンプルポリペプチドの推定アミノ酸配列の少なくとも一部を含むようにする;
(b)および、前記メモリーに接続されたプロセッサーであって、前記機械命令を実行することによって前記サンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定するプロセッサー、
を含むことを特徴とする装置。 - 部分分解されたサンプルポリペプチドに対する少なくとも1つの推定アミノ酸配列を決定するためのコンピュータープログラムであって、該サンプルポリペプチドのソフトイオン化質量スペクトルが得られており、該部分分解されたサンプルポリペプチド由来のイオン種の一組のm/zピークが与えられており、:
(i)前記一組のm/zピークから、m/zピーク候補の複数のセットを選定して、各m/zピーク候補セットの中の各m/zピークが、少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっているようにするためのプログラムコード;
(ii)工程(i)で得られた各m/zピーク候補セットから、各m/zピークと少なくとも1つの近隣のピークとの間の質量差の配列を求め、さらに、質量差配列を逆の順序にすると、別のm/zピーク候補セットの質量差配列の少なくとも一部を形成しないようなm/zピーク候補セットを除外するためのプログラムコード;
(iii)残りのm/zピークセットの中から「差異セット」を選別するためのプログラムコード;
(iv)残りのm/zピーク候補セットから、別のm/zピーク候補セットの連続的部分列であるようなm/zピーク候補セットを選別して除外するためのプログラムコード;さらに、
(v)残りのm/zピーク候補セット各々について推定アミノ酸配列を決定して、各アミノ酸配列が、各m/zピークとその少なくとも1つの近隣のピークとの間の質量差に対応しているアミノ酸によって構成されており、各推定アミノ酸配列は、前記サンプルポリペプチドの推定アミノ酸配列の少なくとも一部を含むようにするためのプログラムコード;
を含むことを特徴とするコンピュータープログラム。 - 請求項20に従うコンピュータープログラムであって、残りのm/zピーク候補セットの中から「差異配列」を選別するためのプログラムコードが、論理プログラミング言語で書かれていることを特徴とするコンピュータープログラム。
- サンプルポリペプチドに対して少なくともひとつの推定アミノ酸配列を決定するためのコンピュータープログラム製品であって、請求項20または21のいずれかに従う、コンピューターで読みとり可能なプログラムコードを含有しコンピューターで使用可能な媒体から成ることを特徴とするコンピュータープログラム製品。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB0212470.9A GB0212470D0 (en) | 2002-05-30 | 2002-05-30 | Mass spectrometry |
PCT/GB2003/002353 WO2003102572A2 (en) | 2002-05-30 | 2003-05-30 | Mass spectrometry |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005528609A true JP2005528609A (ja) | 2005-09-22 |
JP4512486B2 JP4512486B2 (ja) | 2010-07-28 |
Family
ID=9937700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004509407A Expired - Fee Related JP4512486B2 (ja) | 2002-05-30 | 2003-05-30 | 質量分析 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8620588B2 (ja) |
EP (1) | EP1508046B1 (ja) |
JP (1) | JP4512486B2 (ja) |
AU (1) | AU2003240060A1 (ja) |
GB (1) | GB0212470D0 (ja) |
WO (1) | WO2003102572A2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006189277A (ja) * | 2005-01-04 | 2006-07-20 | Nec Corp | タンパク質の解析方法 |
JP2007278712A (ja) * | 2006-04-03 | 2007-10-25 | Shimadzu Corp | 質量分析を利用したアミノ酸配列解析システム |
JP2008145221A (ja) * | 2006-12-08 | 2008-06-26 | Shimadzu Corp | 質量分析を用いたアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体 |
JP2009513954A (ja) * | 2005-10-28 | 2009-04-02 | エムディーエス アナリティカル テクノロジーズ, ア ビジネス ユニット オブ エムディーエス インコーポレイテッド | 特定のニュートラルディファレンスと関連する反応対の特定な同定のための方法、システムおよびコンピュータソフトウェア製品 |
JP2013160595A (ja) * | 2012-02-03 | 2013-08-19 | Shimadzu Corp | アミノ酸配列解析方法及び装置 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0503411D0 (en) * | 2005-02-18 | 2005-03-30 | Shimadzu Res Lab Europe Ltd | Mass spectrometry precursor ion selection |
JP4517925B2 (ja) * | 2005-04-13 | 2010-08-04 | 株式会社島津製作所 | 還元性物質を用いるタンパク質又はペプチドの構造解析手法 |
US7297940B2 (en) * | 2005-05-03 | 2007-11-20 | Palo Alto Research Center Incorporated | Method, apparatus, and program product for classifying ionized molecular fragments |
US7230235B2 (en) * | 2005-05-05 | 2007-06-12 | Palo Alto Research Center Incorporated | Automatic detection of quality spectra |
US20130204582A1 (en) * | 2010-05-17 | 2013-08-08 | Dh Technologies Development Pte. Ltd | Systems and Methods for Feature Detection in Mass Spectrometry Using Singular Spectrum Analysis |
EP2638563B1 (en) * | 2010-11-08 | 2022-10-05 | DH Technologies Development Pte. Ltd. | Systems and methods for rapidly screening samples by mass spectrometry |
GB2501821B (en) * | 2012-04-05 | 2016-09-14 | Univ British Columbia | MS/MS analysis using ECD or ETD fragmentation |
CN104813324B (zh) * | 2012-08-09 | 2017-09-05 | 珀金埃尔默健康科学公司 | 用于从质谱法输出识别聚合物物种的方法及设备 |
WO2014057484A1 (en) * | 2012-10-09 | 2014-04-17 | Ramot At Tel-Aviv University Ltd. | Peptides for the treatment of neurodegenerative diseases |
US10317412B1 (en) * | 2017-12-27 | 2019-06-11 | Shimadzu Corporation | Method and device for analyzing protein or peptide |
WO2021172946A1 (ko) * | 2020-02-28 | 2021-09-02 | ㈜베르티스 | 펩타이드 특성 학습 기반 액체 크로마토그래프 질량 분석에서 펩타이드 생성이온의 스펙트럼 양상을 예측하는 시스템 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07507394A (ja) * | 1992-05-29 | 1995-08-10 | ザ ロックフェラー ユニバーシティ | 質量スペクトロメータを用いてペプチドの配列決定を行う為の方法及び物質 |
JP2004505248A (ja) * | 2000-07-25 | 2004-02-19 | ザ プロクター アンド ギャンブル カンパニー | ポリペプチドの配列決定のための新しい方法及びキット |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5470753A (en) * | 1992-09-03 | 1995-11-28 | Selectide Corporation | Peptide sequencing using mass spectrometry |
EP1317765A2 (en) | 2000-09-08 | 2003-06-11 | Oxford GlycoSciences (UK) Limited | Automated identification of peptides |
US6963807B2 (en) * | 2000-09-08 | 2005-11-08 | Oxford Glycosciences (Uk) Ltd. | Automated identification of peptides |
US6829539B2 (en) | 2001-04-13 | 2004-12-07 | The Institute For Systems Biology | Methods for quantification and de novo polypeptide sequencing by mass spectrometry |
-
2002
- 2002-05-30 GB GBGB0212470.9A patent/GB0212470D0/en not_active Ceased
-
2003
- 2003-05-30 US US10/515,955 patent/US8620588B2/en not_active Expired - Fee Related
- 2003-05-30 AU AU2003240060A patent/AU2003240060A1/en not_active Abandoned
- 2003-05-30 WO PCT/GB2003/002353 patent/WO2003102572A2/en active Application Filing
- 2003-05-30 EP EP03732675.8A patent/EP1508046B1/en not_active Expired - Fee Related
- 2003-05-30 JP JP2004509407A patent/JP4512486B2/ja not_active Expired - Fee Related
-
2013
- 2013-12-30 US US14/143,575 patent/US20140222348A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07507394A (ja) * | 1992-05-29 | 1995-08-10 | ザ ロックフェラー ユニバーシティ | 質量スペクトロメータを用いてペプチドの配列決定を行う為の方法及び物質 |
JP2004505248A (ja) * | 2000-07-25 | 2004-02-19 | ザ プロクター アンド ギャンブル カンパニー | ポリペプチドの配列決定のための新しい方法及びキット |
Non-Patent Citations (1)
Title |
---|
JPN6009040117, Ioannis A. Papayannopoulos, "The interpretation of collision−induced dissociation tandem mass spectra of peptides", Mass Spectrometry Reviews, 1995, Volume 14, Issue 1, 49−73 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006189277A (ja) * | 2005-01-04 | 2006-07-20 | Nec Corp | タンパク質の解析方法 |
JP4543929B2 (ja) * | 2005-01-04 | 2010-09-15 | 日本電気株式会社 | タンパク質の解析方法 |
JP2009513954A (ja) * | 2005-10-28 | 2009-04-02 | エムディーエス アナリティカル テクノロジーズ, ア ビジネス ユニット オブ エムディーエス インコーポレイテッド | 特定のニュートラルディファレンスと関連する反応対の特定な同定のための方法、システムおよびコンピュータソフトウェア製品 |
JP2007278712A (ja) * | 2006-04-03 | 2007-10-25 | Shimadzu Corp | 質量分析を利用したアミノ酸配列解析システム |
JP2008145221A (ja) * | 2006-12-08 | 2008-06-26 | Shimadzu Corp | 質量分析を用いたアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体 |
JP2013160595A (ja) * | 2012-02-03 | 2013-08-19 | Shimadzu Corp | アミノ酸配列解析方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
EP1508046B1 (en) | 2013-09-04 |
AU2003240060A8 (en) | 2003-12-19 |
JP4512486B2 (ja) | 2010-07-28 |
US20140222348A1 (en) | 2014-08-07 |
EP1508046A2 (en) | 2005-02-23 |
WO2003102572A3 (en) | 2004-03-04 |
GB0212470D0 (en) | 2002-07-10 |
US20060172365A1 (en) | 2006-08-03 |
WO2003102572A2 (en) | 2003-12-11 |
AU2003240060A1 (en) | 2003-12-19 |
US8620588B2 (en) | 2013-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20140222348A1 (en) | Mass Spectrometry | |
Colinge et al. | OLAV: Towards high‐throughput tandem mass spectrometry data identification | |
US8271203B2 (en) | Methods and systems for sequence-based design of multiple reaction monitoring transitions and experiments | |
US7409296B2 (en) | System and method for scoring peptide matches | |
Li et al. | A Bayesian approach to protein inference problem in shotgun proteomics | |
Arnold et al. | A machine learning approach to predicting peptide fragmentation spectra | |
Andreotti et al. | Antilope—A Lagrangian Relaxation approach to the de novo peptide sequencing problem | |
US7979214B2 (en) | Peptide identification | |
Zhou et al. | A machine learning approach to explore the spectra intensity pattern of peptides using tandem mass spectrometry data | |
Ng et al. | Algorithms for de-novo sequencing of peptides by tandem mass spectrometry: a review | |
US8137982B2 (en) | Mass spectrometry precursor ion selection | |
Datta et al. | Spectrum fusion: using multiple mass spectra for de novo peptide sequencing | |
Zou et al. | Charge state determination of peptide tandem mass spectra using support vector machine (SVM) | |
Xu et al. | Complexity and scoring function of MS/MS peptide de novo sequencing | |
Gao et al. | A programmable fragmentation analysis of proteins by in-source decay in MALDI-TOF mass spectrometry | |
Kennedy | Refinement and Validation of Multi-Source Blood Detection for Operational Use | |
Fang et al. | Feature selection in validating mass spectrometry database search results | |
Grover et al. | Context-sensitive markov models for peptide scoring and identification from tandem mass spectrometry | |
Yan et al. | PRIME: A Mass Spectrum Data Mining Tool for De Nova Sequencing and PTMs Identification | |
Kramer | Quantitative Label-Free Comparative Proteomic Analyses of Eukaryotic Tissues via Mass Spectrometry | |
Murad et al. | Polynomial-time disulfide bond determination using mass spectrometry data | |
Oh et al. | Peptide identification by tandem mass spectra: an efficient parallel searching | |
Loukil | Tandem mass intensity estimation for de novo peptide sequencing | |
Oh et al. | A Two-way Parallel Searching for Peptide Identification via Tandem Mass Spectrometry. | |
Yang | Development of amyloidosis typing method and data acquisition strategies using tandem mass spectrometry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090811 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20091109 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20091116 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20091209 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20091216 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100108 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100420 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100510 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
LAPS | Cancellation because of no payment of annual fees |