JP2014052331A - アミノ酸配列解析方法及び装置 - Google Patents

アミノ酸配列解析方法及び装置 Download PDF

Info

Publication number
JP2014052331A
JP2014052331A JP2012198301A JP2012198301A JP2014052331A JP 2014052331 A JP2014052331 A JP 2014052331A JP 2012198301 A JP2012198301 A JP 2012198301A JP 2012198301 A JP2012198301 A JP 2012198301A JP 2014052331 A JP2014052331 A JP 2014052331A
Authority
JP
Japan
Prior art keywords
amino acid
acid sequence
partial
candidates
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012198301A
Other languages
English (en)
Other versions
JP5874587B2 (ja
Inventor
Akiyasu Yoshizawa
明康 吉沢
Takayuki Yoshimori
孝行 吉森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP2012198301A priority Critical patent/JP5874587B2/ja
Publication of JP2014052331A publication Critical patent/JP2014052331A/ja
Application granted granted Critical
Publication of JP5874587B2 publication Critical patent/JP5874587B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

【課題】データベースを要しないデノボシーケンシングを利用したアミノ酸配列の推定精度を向上させ、特に正解である一つ又は少数の配列の提示を可能とする。
【解決手段】切断部位の相違する複数の酵素でそれぞれ断片化して得られた複数の試料をそれぞれ質量分析し、その結果に対しデノボシーケンシングを実行して各種断片に対する部分配列候補を推定する(S1、S2)。酵素に応じて切断部位に特定のアミノ酸残基が現れることを利用し、多数の部分配列候補の中で元のアミノ酸の末端を含むものを抽出する(S6)。また、末端を含むもの以外の部分配列候補の中でオーバーラップ部が存在するものを探索して結合する作業を繰り返す(S7、S8)。デノボシーケンシングにより誤って推定された配列の場合、矛盾なく多くの配列候補が結合可能である可能性は殆どないから、末端を含む配列候補を加え(S9)、最終的に生成されるアミノ酸配列は正解である可能性が高いものとなる(S10、S11)。
【選択図】図2

Description

本発明は、ペプチド混合物を含む目的試料を質量分析し、これにより得られたマススペクトルデータを用いて目的試料中のペプチドのアミノ酸配列を推定するためのアミノ酸配列解析方法及び装置に関する。
近年、ポストゲノム研究としてタンパク質の構造や機能の解析が急速に進められている。このようなタンパク質の構造・機能解析手法(プロテオーム解析)の一つとして、質量分析装置を用いたタンパク質の発現解析や一次構造解析が広く行われるようになってきており、特定のイオンの選択・捕捉と衝突誘起解離(CID)等によるイオンの開裂操作とを行う、MSn分析(nは2以上の整数)が威力を発揮している。一般にMS2(=MS/MS)分析では、まず、分析対象物から特定の質量電荷比m/zを有するイオンをプリカーサイオンとして選別し、該プリカーサイオンをCIDによって開裂させる。その後、開裂によって生成した各種イオン(プロダクトイオン)を質量分析することによって、目的とするイオンの質量や化学構造についての情報を得る。
MSn分析によってタンパク質のアミノ酸配列を同定する場合には、まず、タンパク質を適当な消化酵素を用い消化することでアミノ酸配列の結合を切断してペプチド断片の混合物としてから、該ペプチド混合物を質量分析に供する。このとき、各ペプチドを構成する元素には質量の異なる安定同位体が存在するため、同一のアミノ酸配列から成るペプチドであっても、その同位体組成の相違によって質量電荷比の異なる複数のピークが観測される。該複数のピークは、天然存在比が最大である同位体のみで構成されたイオン(主イオン)のピークと、それ以外の同位体を含むイオン(同位体イオン)のピークとから成り、これらはイオンの価数が1の場合には1Da間隔で並んだ複数本のピークから成る同位体ピーク群を形成する。
続いて、上記のようなペプチド混合物に対するマススペクトルデータの中から、単一のペプチドに由来する一組の同位体ピーク群をプリカーサイオンとして選択し、該プリカーサイオンを開裂させて得られたイオン(プロダクトイオン)の質量分析(MS2分析)を行う。また、1回の開裂操作では十分に小さな断片に開裂しない場合には、開裂操作を複数回行うことも考えられる。
以上のようにして得られたプロダクトイオンのマススペクトルパターンや上記プリカーサイオンのマススペクトルパターンを基に、例えばマトリックスサイエンス社が提供しているマスコット(MASCOT)等の検索エンジンを利用してアミノ酸配列同定用データベース検索を実行する。具体的には、実測により得られた各ピークの質量電荷比と、データベースに登録されているタンパク質から計算によって求まるプロダクトイオンの質量電荷比とを比較し、最もよく一致するタンパク質を探索する。それによって、被検ペプチドのアミノ酸配列を決定することができる。
しかしながら、上記方法では、データベースに未登録である新規なタンパク質を同定することはできない。そこで、こうした場合には、デノボ(De Novo)シーケンシングと呼ばれる方法が採られることが多い。簡単に言うと、デノボシーケンシングは、マススペクトルに現れる複数のピークの間の質量電荷比差に一致する質量電荷比を持つアミノ酸を探索することで、被検ペプチドのアミノ酸配列を推定する方法である。具体的な探索のアルゴリズムについては従来より各所で検討されており、グラフ理論を利用した方法、動的計画法を利用した方法(特許文献1、非特許文献1参照)など、様々な方法が提案されている。
例えば特許文献1に記載の手法は非特許文献1に記載の手法を改良したものであり、マススペクトルデータに基づいてアミノ酸配列候補を選定する際に、その信頼度を示すスコアを最大化するアミノ酸配列候補を見い出す問題を、一方向の軸がアミノ酸配列上の位置、他方向の軸がマススペクトルの質量電荷比である2次元的な非巡回的グラフ上の最長路問題として定式化する。そして、被検ペプチドに由来するピークの質量電荷比と信号強度とを集めたピークリストに基づいて経路探索を実行しながら信号強度を加算したスコアを求めてゆき、経路末端に達したならば、スコアの大きな経路を選択して該経路を逆に辿りながら各アミノ酸を特定することによりアミノ酸配列を求めるようにする。
上記動的計画法は、初めに経路探索を行う際に最大のスコアを与える経路だけでなくスコアの大きな経路をいくつか選択して該経路を逆に辿ってアミノ酸配列を求めることにより、複数のアミノ酸配列を候補として挙げることができる。そうして多数のアミノ酸配列候補を挙げることで、候補の中に正解のアミノ酸配列が含まれない検出漏れをなくすことが可能である。ところが、本願発明者の検討によれば、精度が高いスコアを計算しても、正解であるアミノ酸配列が必ずしも上位にランキングできない場合があり、アミノ酸配列解析に有用な情報をユーザに提供する上で必ずしも性能が十分でないという課題があった。
上記のような課題を解決するために、本願発明者は、特願2012−021819号において、デノボシーケンシングによるアミノ酸配列推定の新規アルゴリズムを提案している。この新規の手法では、アミノ酸分析装置など別の方法により得られた測定対象物のアミノ酸組成情報とアミノ酸配列候補条件を指定したうえで、アミノ酸配列を推定する。このため、アミノ酸配列候補を見出す問題を、深さk番目の頂点にk個のアミノ酸で構成されるアミノ酸配列を設置した木構造の有向グラフ上最長路問題として定式化し、いわゆる分枝限定法を利用してアミノ酸配列を求める。この方法でも、正解のアミノ酸配列を必ず含む複数の配列候補が出力され、通常、正解であるアミノ酸配列のスコアは高いことが強く期待される。
特開2008−145221号公報
ビン・マ(Bin Ma)ほか、「アン・エフェクティブ・アルゴリズム・フォー・ザ・ペプチド・デ・ノボ・シーケンシング・フロム・エムエス/エムエス・スペクトラム(An Effective Algorithm for the Peptide De Novo Sequencing from MS/MS Spectrum)」、シンポジウム・コンビナトリアル・パターン・マッチング(Symp. Comb. Pattern Matching)、2003年、pp.266-277 サンガー(F.Sanger)ほか、「ニュークレオチド・シークエンス・オブ・バクテリオファージ・ラムダ・ディーエヌエー(Nucleotide Sequence of Bacteriophage lambda DNA)」、ジャーナル・オブ・モレキュラー・バイオロジー(Journal of Molecular Biology)、1982年、Vol.162、pp.729-773 マイヤーズ(E.W.Myers)、「トゥワード・シンプリファイイング・アンド・アキュレイトリー・フォーミュレイティング・フラグメント・アセンブリ(Toward Simplifying and Accurately Formulating Fragment Assembly)」、ジャーナル・オブ・コンピューテイショナル・バイオロジー(Journal of Computational Biology)、1995年、Vol.2、pp.275-290 バンデイラ(N. Bandeira)ほか、「ショットガン・プロテイン・シーケンシング(Shotgun Protein Sequencing)」、モレキュラー・アンド・セルラー・プロテオミクス(Molecular & Cellular Proteomics)、2007年、pp.1123-1134 マッツチェリ(G. Mazzucchelli)ほか、「エフィシェント・アンド・ラピッド・マルチエンザイマティック・リミテッド・ダイジェッション(MELD)・メソッド・フォー・コンプリート・プロテイン・キャラクタリゼイション・アンド・ボトムアップ・デ・ノボ・シークエンシング(Efficient and rapid multienzymatic limited digestion(MELD) method for complete protein characterization and bottom-up de novo sequencing)」、ナインティーンス・インターナショナル・マス・スペクトロメトリー・カンファレンス(19th International Mass Spectrometry Conference, 第19回国際質量分析学会)予稿、2012年、ポスター発表PMo-038
一方、デノボシーケンシングによる配列推定の別のアプローチとして、多数決アルゴリズムを利用した方法が知られている。この方法は、核酸配列を決定するために考案され、さらに改良が進められてきたものであり、その基本は、DNAシーケンサによって決定された短い塩基配列中の部分的な配列をオーバーラップさせることで多数の配列を重ね合わせ、コンセンサスをとる(多数決をとる)ことによって、塩基配列の信頼性を上げるものである。この手法は、サンガーらが、その実験手法と該手法に則って決定された遺伝子の核酸配列とを非特許文献2において公表したのが最初である。その後、マイヤーズは、上記手法に基づくコンピュータを用いたアルゴリズムを提案し(非特許文献3)、セレラ・アセンブラ(Celera Assembler)として知られる核酸配列のアセンブルプログラムもこれに基づくものである。
上記アルゴリズムはDNA(又はRNA)塩基配列を仮定したアルゴリズムであったが、これをデノボシーケシング法で求められたアミノ酸配列に対して適用する提案もなされている。例えば非特許文献4には、測定時に特有である結果の揺らぎをカバーし、デノボシーケシングによる推定自体の信頼性、特に修飾されたアミノ酸配列の推定の信頼性を向上させるために、アミノ酸配列を推定する前に、マススペクトルから抽出したピークを重ね合わせる(非特許文献4中の「Spectral alignment」)ことでマススペクトル自体の信頼性を上げ、それに対してデノボシーケシングによるアミノ酸配列推定を行っている。
図9は、非特許文献4に開示されている「Spectral alignment」の例を示す図である。(a)は測定対象のペプチドの正解であるアミノ酸配列、(b)は当該ペプチド試料について複数回の測定を行い、各測定で得られたマススペクトルから抽出されるbイオン(b-ion)ピーク間の質量電荷比差を示している。測定回によっては特定のbイオンが観測されないことがあるが、測定回数を増やして結果を重ねることで、存在しているアミノ酸に対応するbイオンを確認することができる。また、測定回によって異なる結果が得られている場合、つまり、図9(b)の例ではメチオニンに相当するbイオンと酸化メチオニンに相当するbイオンとが得られている場合には、コンセンサスをとる手法により、メチオニンに相当するbイオンを採用することができる。
しかしながら、上述したようにデノボシーケシングによるアミノ酸配列推定に多数決アルゴリズムを採用しても、必ずしも期待するほど効果が上がらない。これは次のような理由による。
例えばDNAにおいては、塩基はアデニン、グアニン、チミン、シトシンの4種類のみであり、マイヤーズらが提案したような塩基配列の推定にオーバーラップを利用した再構成手法の場合、塩基配列を誤る原因は専ら測定時の誤差である。測定誤差は大きいほど発生確率が低くなるから、測定回数を増やして多数である解を採用することによって、誤った配列を排除し、正解である配列を推定することが可能である。
これに対し、質量分析により得られた結果に基づきデノボシーケシングによりアミノ酸配列を推定する場合、配列推定を誤る原因は主として次の二つである。
(1)測定(質量分析)を実行した際に、測定すべきイオンが発生せず測定漏れとなる。
(2)測定結果であるマススペクトル上のピークから配列を推定する段階で、動的計画法等のアルゴリズムの制約のために正解が廃棄される。
(1)の原因による誤った配列推定は、測定回数を増やすことで軽減することができる。しかしながら、(2)の原因は確率論的なものではないので、測定回数を増やしたとしても(2)の原因による配列推定誤りを減らせる保証はない。
また、非特許文献5には、一種のタンパク質である目的試料に対し、複数の消化酵素を同時に使用して断片化処理を行った後に質量分析を実行し、得られたマススペクトルに対してデノボシーケンシングを行うことにより、目的試料のタンパク質のアミノ酸配列推定を行う、という技術が開示されている。しかしながら、該文献で述べられているのは主に、酵素による消化時間を調節することによって、missed cleavage、即ち「酵素消化が不充分で、切断部位であるにも拘わらず実際には切断が行われない部位」を意図的に導入して、消化後のペプチドの全長を調節する方法についてであって、得られたマススペクトルに対する具体的なデノボシーケンシングによるアミノ酸配列推定方法は開示されていない。
本発明は上記課題に鑑みて成されたものであり、質量分析結果に対しデノボシーケンシングを実行しアミノ酸配列を推定するアミノ酸配列解析方法及び装置において、オーバーラップを用いた再構成手法を適切に利用することにより、アミノ酸配列推定の信頼性を向上させることを主たる目的としている。
上記課題を解決するために成された第1発明は、ポリペプチドである目的試料を酵素により断片化して得られたペプチド断片混合物を質量分析することで収集したマススペクトルデータに基づいて、目的試料のアミノ酸配列を推定するアミノ酸配列解析方法であって、
a)目的試料に対する単一種類の酵素による断片化を、複数種類の酵素についてそれぞれ実行して得られた複数種類のペプチド断片混合物をそれぞれ質量分析することにより収集されたマススペクトルデータに対し、デノボシーケンシングを用いた配列推定により各断片に対する部分アミノ酸配列候補を求める部分配列推定ステップと、
b)断片化に用いられた酵素の種類の情報、及び、前記部分配列推定ステップにより求まる部分アミノ酸配列候補、を収集するデータ収集ステップと、
c)前記部分アミノ酸配列候補及び酵素情報に基づき、酵素の種類に応じて既知である特異的な部位で切断が生じることを利用して、元のポリペプチドのN末端又はC末端を含む部分アミノ酸配列を抽出する末端配列抽出ステップと、
d)前記部分アミノ酸配列候補の中でN末端又はC末端を含む配列候補を除き、部分アミノ酸配列候補に含まれる共通の一部配列をオーバーラップさせて矛盾が生じない部分アミノ酸配列候補のみを選択して結合する作業を繰り返すことにより、アミノ酸配列を延伸させてゆき、最終的に前記末端配列抽出ステップにおいて抽出された末端を含む部分アミノ酸配列を結合させることでアミノ酸配列候補を導出する結合処理実行ステップと、
e)前記結合処理実行ステップにより生成されたアミノ酸配列候補の全てについて、それぞれ結合に用いられた前記部分アミノ酸配列候補の数を求め、その数に基づいて、複数のアミノ酸配列候補を選別する又はその序列を決める結果検証ステップと、
f)前記結果検証ステップによって選別されたアミノ酸配列候補又は序列付けされたアミノ酸配列候補を目的試料のアミノ酸配列推定結果として提示する結果提示ステップと、
を有することを特徴としている。
また第2発明に係るアミノ酸配列解析装置は、上記第1発明に係るアミノ酸配列解析方法をコンピュータ上で実現するための装置であって、ポリペプチドである目的試料に対する単一種類の酵素による断片化を、複数種類の酵素についてそれぞれ実行して得られた複数種類のペプチド断片混合物をそれぞれ質量分析することにより収集されたマススペクトルデータに基づいて、目的試料のアミノ酸配列を推定するためのアミノ酸配列解析装置であって、
a)前記複数種類のペプチド断片混合物についてそれぞれ得られたマススペクトルデータに対し、デノボシーケンシングを用いた配列推定により各断片に対する部分アミノ酸配列候補を求める部分配列推定手段と、
b)断片化に用いられた酵素の種類の情報、及び、前記部分配列推定手段により求まる部分アミノ酸配列候補、を収集するデータ収集手段と、
c)前記部分アミノ酸配列候補及び酵素情報に基づき、酵素の種類に応じて既知である特異的な部位で切断が生じることを利用して、元のポリペプチドのN末端又はC末端を含む部分アミノ酸配列を抽出する末端配列抽出手段と、
d)前記部分アミノ酸配列候補の中でN末端又はC末端を含む配列候補を除き、部分アミノ酸配列候補に含まれる共通の一部配列をオーバーラップさせて矛盾が生じない部分アミノ酸配列候補のみを選択して結合する作業を繰り返すことにより、アミノ酸配列を延伸させてゆき、最終的に前記末端配列抽出手段により抽出された末端を含む部分アミノ酸配列を結合させることでアミノ酸配列候補を導出する結合処理実行手段と、
e)前記結合処理実行手段により生成されたアミノ酸配列候補の全てについて、それぞれ結合に用いられた前記部分アミノ酸配列候補の数を求め、その数に基づいて、複数のアミノ酸配列候補を選別する又はその序列を決める結果検証手段と、
f)前記結果検証手段によって選別されたアミノ酸配列候補又は序列付けされたアミノ酸配列候補を目的試料のアミノ酸配列推定結果として提示する結果提示手段と、
を備えることを特徴としている。
第2発明に係るアミノ酸配列解析装置により具現化される第1発明に係るアミノ酸配列解析方法を適用するに際しては、単一種類の消化酵素による目的試料のポリペプチドの断片化を、複数種類の消化酵素についてそれぞれ実行することで複数種類のペプチド断片混合物を調製し、それをそれぞれ質量分析することでマススペクトルデータを収集する。消化酵素には様々なものがあるが、酵素によってアミノ酸配列中の特定の結合部位、具体的にはアミノ酸残基のカルボキシル基側又はアミノ基側のペプチド結合で切断が生じることが知られている。したがって、複数種の酵素でそれぞれ断片化した試料を質量分析することにより、目的試料のアミノ酸配列中の様々な部位でアミノ酸結合が切断された異なるペプチド断片に対応するイオン強度データが得られる。なお、本明細書中において「ポリペプチド」との用語は、タンパク質又はペプチドの総称として使用するものとする。
第1発明に係るアミノ酸配列解析方法では、部分配列推定ステップにおいて、上述したようなマススペクトルデータに対し、デノボシーケンシングを用いた配列推定により各ペプチド断片に対する部分アミノ酸配列候補を求める。この部分アミノ酸配列推定の際には、誤った推定による偽の候補が含まれていても構わないが、正解の部分アミノ酸配列が必ず含まれている必要がある。そこで、ここでは特に、正解の部分アミノ酸配列の推定漏れを起こすことがない(又は少ない)アルゴリズムを用いる必要がある。本願発明者らの検討によれば、上述した特願2012−021819号で提案しているアルゴリズムに則ったデノボシーケシングを実行することにより、複数の部分アミノ酸配列候補の中に正解である部分アミノ酸配列が必ず含まれるような推定が可能であることが確認できている。
上述したように酵素の種類によってアミノ酸配列中で切断される結合部位が異なり、且つその結合部位は既知である。そこで、末端配列抽出ステップにおいては、収集された酵素情報と上記既知の情報とを利用して、収集された部分アミノ酸配列候補の中で元の(切断される前の)ポリペプチドのC末端又はN末端を含むものを識別する。具体的には、例えば、或る酵素でアミノ酸配列を切断したときに、該酵素による切断部位に現れる筈のアミノ酸残基が部分アミノ酸配列の端部に現れていなければ、その部分アミノ酸配列候補は末端を含む可能性が高いと判断できる。また、特異的な切断部位が相違する複数種の酵素で断片化した結果を比較したときに、部分アミノ酸配列の端部のアミノ酸残基が揃っていれば、そこは末端である可能性が高いと判断できる。
部分アミノ酸配列候補には、様々な部位で切断されたペプチド断片に対する部分アミノ酸配列が含まれるから、正解である所定の二つの部分アミノ酸配列中の一部は一致する、つまりオーバーラップ部が存在する筈である。そこで、この部分配列をオーバーラップさせて二つの部分アミノ酸配列を結合することが可能である。二つの部分アミノ酸配列がいずれも正しく配列推定されたものである場合、両者は矛盾なくオーバーラップ可能である。これに対し、一方又は双方の部分アミノ酸配列が正解ではなく誤って配列推定されたものである場合、偶然にオーバーラップ可能となる確率は低いものの、その確率は無視できる程度に低くはない。しかしながら、より多数の部分アミノ酸配列候補を結合させて元のポリペプチド全長に亘るアミノ酸配列を求める場合、上記のようなオーバーラップ部の探索とオーバーラップ部が存在する部分アミノ酸配列候補の結合とを繰り返すことで、誤った配列推定されたものが偶然に結合される可能性を極めて低くすることができる。何故なら、一部配列をオーバーラップさせて二つ部分アミノ酸配列候補を結合させる毎に、誤って推定された配列が偶然にオーバーラップ可能となる確率は指数関数的に下がるからである。
結合処理実行ステップでは、上記のような部分アミノ酸配列候補を結合する作業を繰り返し、最終的には、末端を含む部分アミノ酸配列を同様に結合させることで、目的試料のポリペプチドの全長に対応したアミノ酸配列の候補を導出する。この候補が複数得られる場合もあるが、上記観点から、結合された部分アミノ酸配列候補の数が多いほうが、正解である確率が高いといえる。そこで、結果検証ステップでは、結合処理により得られたアミノ酸配列候補の全てについて、それぞれ結合に用いられた部分アミノ酸配列候補の数を求め、その数に基づいて、アミノ酸配列候補を選別したり順位付けを行ったりする。具体的には、例えば結合数が所定個数以上のものを選別したり、結合数の多い順にランクを付け所定個数で足切りしたりすればよい。そして、結果提示ステップでは、選別されたアミノ酸配列候補又は序列付けされたアミノ酸配列候補を目的試料のアミノ酸配列推定結果として表示部の画面上に表示する等、提示する。
第1発明及び第2発明において特徴的な点は、デノボシーケシングにより推定されたアミノ酸配列のコンセンサスを求めるのではなく、複数の部分アミノ酸配列候補のオーバーラップ部を探索し結合することで元の(切断される前の)ポリペプチドのアミノ酸配列を再構成する過程で、「正解である部分アミノ酸配列のみで再構成が可能となる」ことを利用しているという点である。即ち、部分アミノ酸配列候補の一部配列をオーバーラップさせて結合を繰り返す過程で、誤って推定された偽の配列候補は排除されていき、最終的に最も正解である確率の高いアミノ酸配列が再構成結果として残ることになる。
なお、第1発明に係るアミノ酸配列解析方法において好ましくは、結果検証ステップで、前記結合処理実行ステップにより生成されたアミノ酸配列候補から求まるアミノ酸組成と既知である前記目的試料のアミノ酸組成情報とに基づいて、アミノ酸配列候補の絞り込みを行うようにするとよい。
ここで、既知である前記目的試料のアミノ酸組成情報とは、例えば、質量分析装置又は別の分析装置を用いて目的試料であるポリペプチドを分析した結果により得られた、アミノ酸の組成、つまりアミノ酸の種類と個数とに関する情報である。目的試料の質量を非常に高い精度で計測することが可能な質量分析装置であれば、その質量からアミノ酸組成情報を計算することが可能である。また、例えば島津製作所製、LC/MS高速アミノ酸分析システム「UF-Amino Station」等の分析装置により、アミノ酸組成情報を得ることも可能である。
元のアミノ酸配列中に特定配列の繰り返しが存在した場合、上記結合処理実行ステップでは、その配列の繰り返しのためにオーバーラップ部の長さを誤って判断する可能性がある。これに対し、上記のようにアミノ酸組成情報を利用することで、その誤りに基づく推定配列を排除することができ、アミノ酸配列の推定精度を一層向上させることができる。
第1発明に係るアミノ酸配列解析方法及び第2発明に係るアミノ酸配列解析装置によれば、タンパク質やペプチドのアミノ酸配列の推定精度を向上させることができる。特に、正解のアミノ酸配列を含む複数の候補を提示するのではなく、最も正解である可能性の高い一つ又はごく少数のアミノ酸配列候補を提示することができるので、従来のこの種の相違に比べて、より有用な情報を分析者に提供することができる。また、この第1及び第2発明では、基本的に配列推定にはデノボシーケンシングを利用しているので、検索用データベースに未登録である未知のタンパク質やペプチドであってもアミノ酸配列の推定が可能である。
本発明の一実施例によるアミノ酸配列解析装置のブロック構成図。 本実施例のアミノ酸配列解析装置において実施されるアミノ酸配列解析方法の作業及び処理の手順を示すフローチャート。 本実施例のアミノ酸配列解析方法における部分アミノ酸配列候補の結合方法の概念図。 部分アミノ酸配列候補を結合することにより検証を繰り返しながら試料のポリペプチドのアミノ酸配列を再構成する方法の具体的な説明図。 本実施例のアミノ酸配列解析方法における部分アミノ酸配列候補の入力書式の一例を示す図。 本実施例のアミノ酸配列解析方法において、データ処理対象である消化酵素と部分アミノ酸配列候補との一例を示す図。 本実施例のアミノ酸配列解析方法におけるC末端を含む部分アミノ酸配列抽出処理の説明図。 本実施例のアミノ酸配列解析方法におけるC/N末端を含まない部分アミノ酸配列の結合処理の説明図。 非特許文献4に開示されている「Spectral alignment」の例を示す図。
以下、本発明に係るアミノ酸配列解析方法を用いたアミノ酸配列解析装置の一実施例について添付図面を参照して説明する。
図1は本実施例によるアミノ酸配列解析装置のブロック構成図である。
本実施例のアミノ酸配列解析装置は、スペクトルデータ記憶部21、スペクトル処理部22、デノボ配列推定部23、部分配列候補収集部24、末端配列候補識別部25、配列結合処理部26、配列結果検証部27、表示処理部28、を含む解析処理部2と、該解析処理部2に接続された入力部3と、表示部4と、から成る。質量分析計1は例えばMALDI−イオントラップ型TOFMSなどのMSn(nは2以上の整数)型質量分析装置であり、目的とする被検ペプチドを含む試料から調製されたペプチド断片混合物に対し質量分析(MS分析)を実行して得られたマススペクトルデータが、スペクトルデータ記憶部21に保存される。解析処理部2では、このマススペクトルデータを用いた解析処理により被検ペプチドのアミノ酸配列が推定される。ここで、質量分析計1は少なくともMS2分析が可能である質量分析装置であればよい。
本装置の実体はコンピュータであって、アミノ酸配列解析用プログラムを記録した、例えばCD−ROM(CD−R、CD−RW)、MO、DVD−RAM、メモリカードなどの着脱自在の記録媒体、HDDなどの一般的に着脱自在ではない記録媒体など、様々な記録媒体をコンピュータで読み取らせることで取得したプログラム、又は通信回線等を通して外部から取り込んだプログラムを外部から当該コンピュータ上で実行することにより具現化されるものである。
図2は本実施例のアミノ酸配列解析装置を用いて試料のアミノ酸配列を推定する際の、の作業及び処理の手順を示すフローチャートである。
質量分析計1により質量分析を実行する際に試料は適当な消化酵素を用いて断片化されるが、本実施例によるアミノ酸配列推定を行う場合には、種類が相違する複数の酵素A、酵素B、…を用いた断片化処理により、それぞれペプチド断片混合物を調製し、その一つ一つについて質量分析を実行する(ステップS1)。本発明において利用可能な消化酵素は例えば、特定のアミノ酸のカルボキシル基側又はアミノ基側のペプチド結合を特異的又は優先的に切断する、基質特異性の高いエンドペプチダーゼ(endopeptidase)である。具体的には、トリプシン、Lys-C、Asp-N、V8などが挙げられる。上記分析の結果、スペクトルデータ記憶部21には、用いられた酵素毎にマススペクトルデータが保存される。
以下の説明では、未知である試料がインスリン(Insulin)であり、消化酵素として、トリプシン(Trypsin)、Lys-C、Asp-N、V8(リン酸ナトリウム緩衝液下)の4種類を用いた場合を例に挙げる。酵素が異なると断片化の際に切断される結合部位が異なる。そのため、酵素毎に収集されるマススペクトルデータは全く異なるものとなる。
次に、スペクトル処理部22はスペクトルデータ記憶部21に格納されているマススペクトルデータを酵素毎に読み出し、マススペクトルを作成してピーク検出を実行する。そして、デノボ配列推定部23は、得られた各ピークの質量電荷比の情報を用い、デノボシーケンシングを実行することにより、ペプチド断片に対応した部分アミノ酸配列を推定し、これを部分アミノ酸配列候補とする(ステップS2)。
デノボシーケシングによる部分アミノ酸配列推定の際には、本願発明者らが特願2012−021819号において提案している新規の手法を用いると都合がよい。
この新規の手法では、アミノ酸配列候補を見出す問題を、深さk番目の節点にk個のアミノ酸で構成されるアミノ酸配列を設置し、ピークリスト中でアミノ酸に対応したピーク強度を枝とした木構造の有向グラフ上における最長路問題として定式化する。その際に、配置されるアミノ酸について、試料に関する既知のアミノ酸組成情報を拘束条件として課す。そして、いわゆる分枝限定法を利用してアミノ酸配列を求める。
具体的には、木構造の有向グラフにおいて、最上位の節点に布置される配列では一方の末端に一つのアミノ酸を配置し、木構造の層が一層ずつ深くなる毎に両末端交互に配列内方に向かって順次アミノ酸を配置する。この際に、アミノ酸組成情報から得られるアミノ酸の種類及び個数に応じた制約を付けることで枝分かれを限定する。また、枝に割り当てられた強度からスコアを計算してゆくが、探索途中で残りのアミノ酸から最終スコアを予測し、スコアが小さい場合には探索を中止することで枝切りする。それによって、探索経路を減らしながら正しい配列候補が漏れることを回避することができる。
なお、上記手法では、マススペクトルデータのほかに、アミノ酸分析装置等で得られたアミノ酸組成情報を入力する必要がある。アミノ酸組成は、例えば島津製作所製、LC/MS高速アミノ酸分析システム「UF-Amino Station」などの分析装置を用いることで求めることが可能である。そのほか、非常に高い質量精度を持つ質量分析装置で得られた被検ペプチドの質量電荷比から計算により求めることも可能である。
もちろん、推定される複数の配列候補の中に正解である配列が高い確率で含まれることが保証されるような手法であれば、デノボシーケンシングにより部分アミノ酸配列候補を求める手法は上記手法に限らない。
次に、部分配列候補収集部24は、上記のようにデノボシーケンシングによる推定結果である部分アミノ酸配列候補を、その推定の元となったマススペクトルデータに対応した酵素毎に読み込む。そのために、まず消化酵素名を指定し(ステップS3)、続いてその酵素に対応したマススペクトルデータから得られた部分アミノ酸配列候補をデノボ配列推定部23から受け取る(ステップS4)。そして、全ての配列推定結果を受け取ったか否かを確認し(ステップS5)、まだ配列推定結果が残っている場合にはステップS3へと戻り、別の酵素に対応した配列推定結果を受け取る。アミノ酸配列のデータ表記形式として図5に例示したmultiFASTA形式を用いる場合には、全ての部分アミノ酸配列候補を1回で読み込むことが可能である。
図6はステップS3〜S5の処理で読み込んだ全部分アミノ酸配列候補の一例を示す。図6の上から、トリプシン、Lys-C、Asp-N、V8を使用した場合に得られた部分アミノ酸配列候補である。以下の説明では、図6に示しているように、一つのマススペクトルについて部分アミノ酸配列候補が2個ずつ得られた場合について説明する。
末端配列候補識別部25は、部分アミノ酸配列候補の中で、消化酵素で断片化する前の試料のアミノ酸配列のN末端を含む部分アミノ酸配列候補とC末端を含むアミノ酸配列候補とを抽出する(ステップS6)。そのために、ここでは酵素に応じて特異的に切断される部位に関する情報を利用する。具体的には、次の二つの条件に基づいて、部分アミノ酸配列中に元の配列の末端が存在するか否かを決定する。
<条件1>本発明において使用される消化酵素はアミノ酸配列の中の特定のアミノ酸残基を認識して、特定のアミノ酸残基のカルボキシル基側又はアミノ基側のペプチド結合を優先的に又は特異的に切断する、という特徴を有する。そこで、或る一つの酵素を用いてアミノ酸配列を切断してペプチド断片を得た場合に、その酵素によってペプチド断片のアミノ酸配列のC末端側又はN末端側の端部に必ず現れる筈であるアミノ酸残基が該端部に現れていない場合には、その部分(つまり部分アミノ酸配列の端部)が試料のアミノ酸配列の末端であると判断する。
<条件2>特異的な切断部位が異なる複数の消化酵素を用いてアミノ酸配列を切断したペプチド断片混合物由来の部分アミノ酸配列候補同士を比較したとき、その部分アミノ酸配列の端部の配列が一致していれば、その部分(つまり部分アミノ酸配列の端部)が試料のアミノ酸配列の末端であると判断する。
図7(A)は上記<条件1>を満たす場合の一例であり、図6に示した全ての部分アミノ酸配列候補の中から、使用された消化酵素による特異的な切断部位に現れるアミノ酸残基とは異なるアミノ酸残基が、その部分アミノ酸配列のC末端側に現れているケースである。
即ち、消化酵素としてトリプシンを用いた場合には、リシン(K)又はアルギニン(R)残基のC末端側でポリペプチド鎖が切断されるため、切断されたペプチド断片のC末端側、つまり右端にK又はRが現れる筈である。しかしながら、一つのマススペクトルに対する二つの部分アミノ酸配列候補[GIVEQCCTSICSLYQLENYCN]、[GIVEQCCTSICSLYQLENCNY]の右端には、KでもRでもないアミノ酸残基(NとY)が現れており、これらは試料のアミノ酸配列のC末端である可能性がある。
同様に、消化酵素としてLys-Cを用いた場合には、部分アミノ酸配列のC末端側、つまり右端にリシン(K)が現れる筈である。そこで、それとは異なる二つの部分アミノ酸配列候補[RGIVEQCCTSICSLYQLENYCN]、[RGIVEQCCTSICSLYQLENCNY]が試料のアミノ酸配列のC末端である可能性がある。
また、消化酵素としてリン酸ナトリウム緩衝液下においてV8を用いた場合には、部分アミノ酸配列のC末端側、つまり右端にアスパラギン酸(D)又はグルタミン酸(E)が現れる筈である。そこで、それとは異なる二つの部分アミノ酸配列候補[NYCN]、[NCYN]が試料のアミノ酸配列のC末端である可能性がある。
一方、消化酵素としてAsp-Nを用いた場合には、部分アミノ酸配列のN末端側、つまり左端にアスパラギン酸(D)が現れる、という特徴を持つが、C末端側ではないので、ここではとりあえず無視することとする。
図7(B)及び(C)は、<条件1>に基づいて抽出された部分アミノ酸配列について、<条件2>に基づいて、試料のアミノ酸配列の末端を含む部分アミノ酸配列を判断する場合の一例である。図7(B)は、上述したように抽出した6個の部分アミノ酸配列候補のC末端側、つまり右端が、試料のアミノ酸配列のC末端であると仮定して、全ての部分アミノ酸配列候補を右揃えとした結果である。これら部分アミノ酸配列候補について、右端部の4文字(4個のアミノ酸残基)の並び方をみると、各行の右方に記したように(a)、(b)、(c)の三つのパターンの配列が存在することが判る。即ち、(a)は[NYCN]、(b)は[NCNY]、(c)は[NCYN]である。
これらに共通するものを、最も長い部分アミノ酸配列候補にそれぞれ吸収した結果が図7(C)である。即ち、最上位行の部分アミノ酸配列候補[RGIVEQCCTSICSLYQLENYCN]は、行の右方に[]内の数値で示したように、3個の部分アミノ酸配列候補を合一した結果である。つまり、別の2個の部分アミノ酸配列候補を吸収した結果である。2行目の部分アミノ酸配列候補[RGIVEQCCTSICSLYQLENCNY]は、同様に、2個の部分アミノ酸配列候補を合一した結果、つまり、別の1個の部分アミノ酸配列候補を吸収した結果である。さらに、最下行のアミノ酸配列候補[NCYN]は、他のどの部分アミノ酸配列候補とも合一されなかった配列である。これら3種類の配列が試料のアミノ酸配列のC末端を含む部分アミノ酸配列候補であり、合一された部分アミノ酸配列候補の個数が最も多い、即ち、この例では、3個の部分アミノ酸配列候補を合一した、最上位上の[RGIVEQCCTSICSLYQLENYCN]が、試料のアミノ酸配列のC末端を含む部分アミノ酸配列として正解である可能性が最も高いと判断する。
次に、図7(C)に示した3個の部分アミノ酸配列候補と一致する部分が存在する部分アミノ酸配列(これらのうちのいずれかの配列を全て包含するか、又は逆にこれらのうちのいずれかの配列に全体が包含されるようなアミノ酸配列)を、残りの、つまりこれまでに考慮されていない全ての部分アミノ酸配列候補の中から探索する。この例では、上述したように、トリプシン、Lys-C、V8という3種の消化酵素に対応した部分アミノ酸配列候補の中からC末端を含む可能性のある配列が既に選出されているので、消化酵素としてAsp-Nを用いて得られた断片に対応する部分アミノ酸配列候補の中から一致部分が存在する部分アミノ酸配列を探すことになる。
図7(D)において、最下行に追加された部分アミノ酸配列候補[DLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN]は、図7(C)において最も重複度が高かった部分アミノ酸配列[RGIVEQCCTSICSLYQLENYCN]を右端に含んでいる。Asp-Nによる切断断片に対応した部分アミノ酸配列候補の中には、類似したアミノ酸配列で[DLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSISCLYQLENYCN]という配列もあるが、こちらは図7(C)に示したいずれの配列とも一致しない。図7(D)中の最上位行に示した部分アミノ酸配列候補は最下位行に示した部分アミノ酸配列候補と合一可能であるから、最終的には、図7(E)に示したような3種類の部分アミノ酸配列候補が試料のアミノ酸配列の末端を含む部分アミノ酸配列候補として残る。この中では、重複度が4である[DLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN]が、正解に近いといえる。
末端配列候補識別部25は、上記のようなC末端を含む部分アミノ酸配列候補の抽出と同様に、試料のアミノ酸配列のN末端を含むと考えられる部分アミノ酸配列候補を抽出する。
次に、配列結合処理部26は、それ以外の、つまり試料のアミノ酸配列のN末端及びC末端を含まない部分のアミノ酸配列を、2個の部分アミノ酸配列候補におけるオーバーラップ部の探索とオーバーラップ部で重ね合わせた結合処理との繰り返し作業によって推定する(ステップS7)。図3は部分アミノ酸配列候補の結合方法の概念図、図4は部分アミノ酸配列候補を結合することにより検証を繰り返しながら試料のポリペプチドのアミノ酸配列を再構成する方法の具体的な説明図であり、図8はそうした配列再構成の過程の一例である。図8(A)中の(a)〜(f)において、図7に示した部分アミノ酸配列候補のうち、(a)及び(b)がトリプシン、(c)及び(d)がAsp-N、(e)及び(f)がV8のそれぞれの消化酵素を用いたペプチド断片に対応して推定された部分アミノ酸配列候補(末端を含まない)である。
アミノ酸配列候補を結合するには、C末端又はN末端を含む部分アミノ酸配列候補であると判定された配列候補を除いて、或る一つの消化酵素に対応した部分アミノ酸配列候補と一部の配列が一致する、つまりオーバーラップ部が存在する部分アミノ酸配列候補を、別の消化酵素に対応した部分アミノ酸配列候補の中で探索する。そして、オーバーラップ部が存在したならば、その部分をいわば「糊代」として二つの部分アミノ酸配列候補を結合し、それらよりも長い配列の新たな部分アミノ酸配列候補を生成する(図3参照)。
ただし、図3では、理解を容易にするために、一つの「糊代」と別の「糊代」との間の配列にはオーバーラップがない状態であるが、実際には、使用する消化酵素の種類を増やすことによって、「糊代」だけでなく、より長い配列で、場合によっては全長でオーバーラップを生じさせることができる。図4は、Pa、Pb、Pc、Pdなる4種類の消化酵素を使用する場合について全長でオーバーラップを生じさせた場合の一例である。
図中、縦方向に延伸する実線、点線、一点鎖線等は酵素Pa、Pb、Pc、Pdによる切断位置を示している。この図4に示すように、消化酵素が異なると試料のアミノ酸配列の切断位置も異なる。この例では、酵素Paと酵素Pbの切断位置には重なっている部分があるが、これは例えば、KとRの右側で切断するトリプシンと、Rの右側のみで切断するArg-CやKの右側のみで切断するLys-Cの関係に相当する。図4(a)に示すように、酵素Paは試料のポリペプチドのアミノ酸配列全体を5個に分割するが、中央部の点線で示した部分の断片はイオン化が不充分で測定できないことを示す。また図中、それぞれ塗りつぶしパターンで示した部分は、矛盾のない配列部分のみが整列できることを示す。
このように、各酵素による消化断片混合物に対して測定できない断片が多数存在している場合であっても、酵素の種類を適切な数まで増やすことによって、元のポリペプチドの全長に亘って複数個(少なくとも2個)の断片がオーバーラップさせることができる。そのため、元のポリペプチドの全長に亘り、複数の配列候補を重ね合わせることによって「正解」の断片のみを選び出すことができる。即ち、図3に示したような「糊代」となる部分だけでなく、それ以外の部分についてもオーバーラップを利用して正解のみを抽出することができる。こうした目的のために、使用される酵素の数は4種に限定されるものではなく、元のポリペプチドの全長について、少なくとも2個以上がオーバーラップするペプチド断片が得られるように、元のポリペプチドの長さや酵素の種類などによって適宜選択することができ、2種以上、好ましくは3種以上とするとよい。
具体例で説明すると、図8(A)の例では、まず、部分アミノ酸配列候補(a)及び(b)と一致する配列を備えている部分アミノ酸配列候補を、別の消化酵素に対応する部分アミノ酸配列候補(c)及び(d)から探索すると、[DPAAAFVNQHLCGSHLVEALYLVCGER]という配列が一致することが判る。その一致部分をいわば「糊代」として、部分アミノ酸配列候補(a)と別の部分アミノ酸配列候補(c)とを結合することができる。同様に、部分アミノ酸配列候補(a)はさらに別の部分アミノ酸配列候補(d)とも結合可能である。一方、部分アミノ酸配列候補(b)には上記のような糊代がなく、部分アミノ酸配列候補(c)、(d)のいずれとも結合し得ない。この結果、図8(B)に示すように、2個の部分アミノ酸配列候補(a)、(c)を結合した新たな部分アミノ酸配列候補(a+c)と、2個の部分アミノ酸配列候補(a)、(d)を結合した新たな部分アミノ酸配列候補(a+d)が生成される。この二つの部分アミノ酸配列候補(a+c)、(a+d)は共に、2個の部分アミノ酸配列候補を結合した結果であるので、いずれも重複度は2となる。
次いで、配列が延伸した部分アミノ酸配列候補について、上記と同様に、別の部分アミノ酸配列候補との間でオーバーラップ部を探索し(ステップS8)、オーバーラップ部が存在したならば、ステップS7へと戻って結合処理を行う。この作業を繰り返し、次第に配列を伸ばしてゆく。
図8(B)の例では、上述した結合によって得られた部分アミノ酸配列候補(a+c)、(a+d)がさらに別の部分アミノ酸配列候補(e)、(f)と結合可能か否かを調べると、部分アミノ酸配列候補(a+c)は部分アミノ酸配列候補(e)を完全に含み得ることが判明する。したがって、図8(C)に示すように、部分アミノ酸配列候補(a+c)に部分アミノ酸配列候補(e)を結合して生成された(ただし、実質的に配列に変更はない)部分アミノ酸配列候補(a+c+e)は重複度3となる。これに対し、それ以外の部分アミノ酸配列候補には変化がない。
このように部分アミノ酸配列候補のオーバーラップ部の探索と結合処理とを繰り返すことにより、重複度が高い部分アミノ酸配列候補を選出し、重複度が高いほど正しく推定できた結果であると推断する。このような推断が可能であるのは、デノボシーケンシングにより誤って推定された部分アミノ酸配列がタンパク質全長に亘ってランダムに且つ矛盾なく生じるという可能性は極めて低い、との推定が高い確度で成り立つからである。即ち、例えば或る2個の部分アミノ酸配列候補を結合するだけであれば、その一方又は両方が誤って推定された配列であっても偶然に結合可能となる可能性は皆無ではない。しかしながら、誤って推定された配列である場合、3個、4個、…とさらに矛盾なく結合が可能である確率は指数関数的に下がっていき、例えば数個程度の結合を考えた場合、実質的に誤って推定された配列が混じる確率はほぼゼロになると見込める。
結合が可能である部分アミノ酸配列候補が見つからなくなったならば(ステップS8でYes)、配列結合処理部26は、最終的に、末端配列候補識別部25において抽出されたC末端を含む部分アミノ酸配列候補及びN末端を含む部分アミノ酸配列候補を、オーバーラップ部を糊代として、繰り返し結合によって得られた部分アミノ酸配列候補の両端に結合することにより、消化酵素の切断部位情報を用いて確定した両末端の配列と矛盾が生じないようなアミノ酸配列を求める(ステップS10)。
配列結果検証部27は、最終的に推定された1乃至複数のアミノ酸配列について、結合に使用された部分アミノ酸配列候補の数を示す重複度に基づいてアミノ酸配列を選び出したり、或いは順位付けを行う。例えば、複数のアミノ酸配列が求まったときに、最も重複度が高いもののみが「正しく推定された結果」であると判断して選出する。
なお、このとき、生成された各アミノ酸配列からアミノ酸組成を求め、これを試料のアミノ酸組成情報と比較し、アミノ酸組成が一致するアミノ酸配列を正解であると判断してもよい。アミノ酸配列中に同一の部分配列の繰り返しが存在する場合、その繰り返しの有無や繰り返し回数は不明であるため、ステップS7において糊代部分の長さを誤る可能性がある。ただし、その場合でも、上述したように既知のアミノ酸組成情報と矛盾がないかどうか検証することによって、誤った推定結果を排除するこことができる。これによって、消去法により、最終的に最も妥当な結果を選出することもできる。
そうして表示処理部28は、最終的に得られたアミノ酸配列を試料のアミノ酸配列であるとして表示部4の画面上に表示し、分析者に提示する(ステップS11)。もし、アミノ酸配列を一つに絞れない場合には、ステップS10で付された順位と併せて表示すればよい。
以上のようにして、本実施例のアミノ酸配列解析装置によれば、単に正解のアミノ酸配列が含まれる多数の候補を分析者に提示するのではなく、正解である一つのアミノ酸配列又は高い確度で順位付けされた少数の候補を分析者に提示することができる。
なお、上記実施例は本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加等を行っても本願特許請求の範囲に包含されることは当然である。
1…質量分析計
2…解析処理部
21…スペクトルデータ記憶部
22…スペクトル処理部
23…デノボ配列推定部
24…部分配列候補収集部
25…末端配列候補識別部
26…配列結合処理部
27…配列結果検証部
28…表示処理部
3…入力部
4…表示部

Claims (4)

  1. ポリペプチドである目的試料を酵素により断片化して得られたペプチド断片混合物を質量分析することで収集したマススペクトルデータに基づいて、目的試料のアミノ酸配列を推定するアミノ酸配列解析方法であって、
    a)目的試料に対する単一種類の酵素による断片化を、複数種類の酵素についてそれぞれ実行して得られた複数種類のペプチド断片混合物をそれぞれ質量分析することにより収集されたマススペクトルデータに対し、デノボシーケンシングを用いた配列推定により各断片に対する部分アミノ酸配列候補を求める部分配列推定ステップと、
    b)断片化に用いられた酵素の種類の情報、及び、前記部分配列推定ステップにより求まる部分アミノ酸配列候補、を収集するデータ収集ステップと、
    c)前記部分アミノ酸配列候補及び酵素情報に基づき、酵素の種類に応じて既知である特異的な部位で切断が生じることを利用して、元のポリペプチドのN末端又はC末端を含む部分アミノ酸配列を抽出する末端配列抽出ステップと、
    d)前記部分アミノ酸配列候補の中でN末端又はC末端を含む配列候補を除き、部分アミノ酸配列候補に含まれる共通の一部配列をオーバーラップさせて矛盾が生じない部分アミノ酸配列候補のみを選択して結合する作業を繰り返すことにより、アミノ酸配列を延伸させてゆき、最終的に前記末端配列抽出ステップにおいて抽出された末端を含む部分アミノ酸配列を結合させることでアミノ酸配列候補を導出する結合処理実行ステップと、
    e)前記結合処理実行ステップにより生成されたアミノ酸配列候補の全てについて、それぞれ結合に用いられた前記部分アミノ酸配列候補の数を求め、その数に基づいて、複数のアミノ酸配列候補を選別する又はその序列を決める結果検証ステップと、
    f)前記結果検証ステップによって選別されたアミノ酸配列候補又は序列付けされたアミノ酸配列候補を目的試料のアミノ酸配列推定結果として提示する結果提示ステップと、
    を有することを特徴とするアミノ酸配列解析方法。
  2. 請求項1に記載のアミノ酸配列解析方法であって、
    前記結果検証ステップにおいて、前記結合処理実行ステップにより生成されたアミノ酸配列候補から求まるアミノ酸組成と既知である前記目的試料のアミノ酸組成情報とに基づいて、アミノ酸配列候補の絞り込みを行うことを特徴とするアミノ酸配列解析方法。
  3. ポリペプチドである目的試料に対する単一種類の酵素による断片化を、複数種類の酵素についてそれぞれ実行して得られた複数種類のペプチド断片混合物をそれぞれ質量分析することにより収集されたマススペクトルデータに基づいて、目的試料のアミノ酸配列を推定するためのアミノ酸配列解析装置であって、
    a)前記複数種類のペプチド断片混合物についてそれぞれ得られたマススペクトルデータに対し、デノボシーケンシングを用いた配列推定により各断片に対する部分アミノ酸配列候補を求める部分配列推定手段と、
    b)断片化に用いられた酵素の種類の情報、及び、前記部分配列推定手段により求まる部分アミノ酸配列候補、を収集するデータ収集手段と、
    c)前記部分アミノ酸配列候補及び酵素情報に基づき、酵素の種類に応じて既知である特異的な部位で切断が生じることを利用して、元のポリペプチドのN末端又はC末端を含む部分アミノ酸配列を抽出する末端配列抽出手段と、
    d)前記部分アミノ酸配列候補の中でN末端又はC末端を含む配列候補を除き、部分アミノ酸配列候補に含まれる共通の一部配列をオーバーラップさせて矛盾が生じない部分アミノ酸配列候補のみを選択して結合する作業を繰り返すことにより、アミノ酸配列を延伸させてゆき、最終的に前記末端配列抽出手段により抽出された末端を含む部分アミノ酸配列を結合させることでアミノ酸配列候補を導出する結合処理実行手段と、
    e)前記結合処理実行手段により生成されたアミノ酸配列候補の全てについて、それぞれ結合に用いられた前記部分アミノ酸配列候補の数を求め、その数に基づいて、複数のアミノ酸配列候補を選別する又はその序列を決める結果検証手段と、
    f)前記結果検証手段によって選別されたアミノ酸配列候補又は序列付けされたアミノ酸配列候補を目的試料のアミノ酸配列推定結果として提示する結果提示手段と、
    を備えることを特徴とするアミノ酸配列解析装置。
  4. 請求項3に記載のアミノ酸配列解析装置であって、
    前記結果検証手段は、前記結合処理実行手段により生成されたアミノ酸配列候補から求まるアミノ酸組成と既知である前記目的試料のアミノ酸組成情報とに基づいて、アミノ酸配列候補の絞り込みを行うことを特徴とするアミノ酸配列解析装置。
JP2012198301A 2012-09-10 2012-09-10 アミノ酸配列解析方法及び装置 Active JP5874587B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012198301A JP5874587B2 (ja) 2012-09-10 2012-09-10 アミノ酸配列解析方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012198301A JP5874587B2 (ja) 2012-09-10 2012-09-10 アミノ酸配列解析方法及び装置

Publications (2)

Publication Number Publication Date
JP2014052331A true JP2014052331A (ja) 2014-03-20
JP5874587B2 JP5874587B2 (ja) 2016-03-02

Family

ID=50610918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012198301A Active JP5874587B2 (ja) 2012-09-10 2012-09-10 アミノ酸配列解析方法及び装置

Country Status (1)

Country Link
JP (1) JP5874587B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016147839A1 (ja) * 2015-03-17 2016-09-22 アサヒビール株式会社 ハイドロフォビンの定量方法及び発泡麦芽飲料の噴き性予測方法
CN109073655A (zh) * 2016-02-04 2018-12-21 安口生物公司 鉴定和分析蛋白的氨基酸序列的方法
US11285210B2 (en) 2016-02-03 2022-03-29 Outlook Therapeutics, Inc. Buffer formulations for enhanced antibody stability
CN116465992A (zh) * 2023-04-19 2023-07-21 上海快序生物科技有限公司 一种检测蛋白末端氨基酸序列的方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005062034A1 (ja) * 2003-12-19 2005-07-07 Nec Corporation 質量分析法を利用するタンパク質の同定方法
JP2007322293A (ja) * 2006-06-02 2007-12-13 Hitachi High-Technologies Corp デノボシーケンス解析方法,解析ソフト,解析ソフトを記憶した記憶媒体,試薬キット
US20080138845A1 (en) * 2005-03-08 2008-06-12 Postech Foundation Method of De Novo Sequencing of Peptide Using the Maldi Mass Spectrometry, Method and Apparatus for Preparing Sample for Maldi Mass Spectrometry
JP2008145221A (ja) * 2006-12-08 2008-06-26 Shimadzu Corp 質量分析を用いたアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体
JP2008532490A (ja) * 2005-02-15 2008-08-21 アポロ ライフ サイエンシズ リミテッド 分子およびそのキメラ分子
JP2009531062A (ja) * 2006-03-23 2009-09-03 ミリポア・コーポレイション タンパク質イソ型の識別及びその定量
JP2013528387A (ja) * 2010-06-02 2013-07-11 ジョンズ ホプキンズ ユニバーシティ 微生物の薬物耐性を判定するシステムおよび方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005062034A1 (ja) * 2003-12-19 2005-07-07 Nec Corporation 質量分析法を利用するタンパク質の同定方法
JP2008532490A (ja) * 2005-02-15 2008-08-21 アポロ ライフ サイエンシズ リミテッド 分子およびそのキメラ分子
US20080138845A1 (en) * 2005-03-08 2008-06-12 Postech Foundation Method of De Novo Sequencing of Peptide Using the Maldi Mass Spectrometry, Method and Apparatus for Preparing Sample for Maldi Mass Spectrometry
JP2009531062A (ja) * 2006-03-23 2009-09-03 ミリポア・コーポレイション タンパク質イソ型の識別及びその定量
JP2007322293A (ja) * 2006-06-02 2007-12-13 Hitachi High-Technologies Corp デノボシーケンス解析方法,解析ソフト,解析ソフトを記憶した記憶媒体,試薬キット
JP2008145221A (ja) * 2006-12-08 2008-06-26 Shimadzu Corp 質量分析を用いたアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体
JP2013528387A (ja) * 2010-06-02 2013-07-11 ジョンズ ホプキンズ ユニバーシティ 微生物の薬物耐性を判定するシステムおよび方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
19TH INTERNATIONAL MASS SPECTROMETRY CENFERENCE, JPN7015003577, 2012, pages 038, ISSN: 0003220680 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016147839A1 (ja) * 2015-03-17 2016-09-22 アサヒビール株式会社 ハイドロフォビンの定量方法及び発泡麦芽飲料の噴き性予測方法
US11285210B2 (en) 2016-02-03 2022-03-29 Outlook Therapeutics, Inc. Buffer formulations for enhanced antibody stability
CN109073655A (zh) * 2016-02-04 2018-12-21 安口生物公司 鉴定和分析蛋白的氨基酸序列的方法
JP2019507341A (ja) * 2016-02-04 2019-03-14 オンコバイオロジクス,インコーポレイティド タンパク質のアミノ酸配列の同定及び分析方法
JP7224914B2 (ja) 2016-02-04 2023-02-20 アウトルック セラピューティクス,インコーポレイティド タンパク質のアミノ酸配列の同定及び分析方法
CN116465992A (zh) * 2023-04-19 2023-07-21 上海快序生物科技有限公司 一种检测蛋白末端氨基酸序列的方法
CN116465992B (zh) * 2023-04-19 2024-02-09 上海快序生物科技有限公司 一种检测蛋白末端氨基酸序列的方法

Also Published As

Publication number Publication date
JP5874587B2 (ja) 2016-03-02

Similar Documents

Publication Publication Date Title
Giese et al. A study into the collision-induced dissociation (CID) behavior of cross-linked peptides
JP5024390B2 (ja) 質量分析システム
JP2005091344A (ja) 質量分析システム
JP5874587B2 (ja) アミノ酸配列解析方法及び装置
Gao et al. Protein analysis by shotgun proteomics
JP6136770B2 (ja) 質量分析データ解析装置及び解析方法
JP5655758B2 (ja) 質量分析装置
KR100805775B1 (ko) 변형된 폴리펩티드(Modifiedpolypeptide)의 서열 및 변형 정보를 분석하는방법
JP4841414B2 (ja) 質量分析を用いたアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体
JP5751126B2 (ja) 質量分析データ解析方法及び解析装置
JP5776443B2 (ja) 質量分析を用いた修飾タンパク質同定方法及び同定装置
US20160275237A1 (en) Amino acid sequence analyzing method and system
JP2015230262A (ja) 質量分析データ解析方法及び装置
JP5821670B2 (ja) アミノ酸配列解析方法及び装置
JP5983371B2 (ja) ペプチド構造解析方法及び装置
JP2017096668A (ja) 生体由来物質の同定支援方法及び同定支援装置
JP6003842B2 (ja) タンパク質の同定方法及び同定装置
Xu et al. A hierarchical MS2/MS3 database search algorithm for automated analysis of phosphopeptide tandem mass spectra
JP5181908B2 (ja) 質量分析データ解析装置
JP2019185224A (ja) 内在性修飾ペプチドの同定品質評価方法及び装置
JP2017129368A (ja) アミノ酸配列解析方法及びアミノ酸配列解析システム
JP6962273B2 (ja) 内在性ペプチド同定用スペクトルライブラリ作成方法、内在性ペプチド同定方法、及び内在性ペプチド同定装置
JP4855780B2 (ja) 質量分析を用いたペプチド同定方法及び同定装置
US20140357501A1 (en) Method and system for analyzing protein or peptide
KR20060036322A (ko) 아미노산 서열 분석 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160104

R151 Written notification of patent or utility model registration

Ref document number: 5874587

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151