JP4055772B2 - タンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体 - Google Patents
タンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体 Download PDFInfo
- Publication number
- JP4055772B2 JP4055772B2 JP2004501972A JP2004501972A JP4055772B2 JP 4055772 B2 JP4055772 B2 JP 4055772B2 JP 2004501972 A JP2004501972 A JP 2004501972A JP 2004501972 A JP2004501972 A JP 2004501972A JP 4055772 B2 JP4055772 B2 JP 4055772B2
- Authority
- JP
- Japan
- Prior art keywords
- protein
- information
- dimensional structure
- target protein
- fragmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
- G01N33/6851—Methods of protein analysis involving laser desorption ionisation mass spectrometry
Description
本発明は、タンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体に関し、特に計算手法により求めたタンパク質の立体構造データを生化学的な実験手法により求めたデータにより補完することができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体に関する。
背景技術
ヒトを始め多くの生物種において全ゲノム配列解析が進められ、その配列情報がデータベース化されている(Gerardo Jimenez−Sanchez,Nature 409,853−855(2001))。ここで、ゲノム配列より、遺伝子の機能を特定、予測することがある程度可能であるが、配列情報のみでは機能を予測できない遺伝子が非常に多く存在する。遺伝子は、そのDNA配列から翻訳されたタンパク質が実際に機能を担っている。機能未知の遺伝子の場合においては、まずタンパク質のアミノ酸配列の相同性の高い機能既知のタンパク質を探し出すことにより、その機能を予測することが行われている。しかしながら、機能既知のタンパク質が存在しない場合が多くある。その場合は、立体構造の類似性の高いタンパク質を探し出し、または、新たに(de novo)立体構造を予測し、機能予測をすることが可能である。
タンパク質が機能を発揮するためには、それにふさわしい立体構造を有していることが不可欠である。従って、アミノ酸配列の相同性を比較するよりも、立体構造の相同性を比較したほうが、より精密な機能推定をすることができる。
立体構造未知のタンパク質アミノ酸配列から、その立体構造を予測する方法としては、ホモロジーモデリング法が一般的である。これは主に次の4つのステップよりなる計算科学的手法である。
(1)任意のアミノ酸配列(目的配列)が与えられたとき、目的配列と類似の配列を有するタンパク質(参照タンパク質)をPDB(Protein Data Bank)のような立体構造データベースから、単数もしくは複数検索(ホモロジー検索)し、目的配列と類似配列の間のアライメント(配列を並置したもの)を与える。
このデータベース検索、アライメントを行うためには、FASTA、PSI−BLAST、LIBRAなどのコンピュータソフトがある。FASTAは20種類の天然アミノ酸を意味する20種のアルファベット文字配列のマッチングを行うプログラムであり、高ホモロジー(アミノ酸の一致度約30%以上FASTAのe値では約0.01以下に相当)の参照タンパク質に対して立体構造構築をすると、信頼性の高いモデルが構築出来るとされている。
また、PSI−BLASTでは、同じように文字配列のマッチングを行うが、文字が一致しているか否かの情報ではなく、プロファイルと呼ばれる文字の一致の度合いを類縁タンパク質の文字配列上部位ごとの置換行列として算出し、更に繰り返し計算を行うことによりアライメントを最適化する性質を持っている。
また、LIBRAは3D−1D法(threading法ともいう)に基づくプログラムであり、既知立体構造をプローブにして類似配列を検索するため、FASTAやPSI−BLASTとは検索アルゴリズムが明らかに異なる。そのため、FASTAやPSI−BLASTとは異なる種類の配列間類似性を指摘できる場合がある。
(2)FASTA、PSI−BLAST、LIBRAなどにより算出したアライメントを用いれば、目的配列と類似配列間のアミノ酸ごとの対応関係が決まるので、この関係に基づき、参照タンパク質の3次元座標から目的配列上のアミノ酸ごとの3次元座標を作成する。
(3)目的配列側に対応するアミノ酸が存在しない場合には、参照タンパク質側のその位置のアミノ酸座標は用いず、逆に参照タンパク質側に対応するアミノ酸が存在しない場合には、その位置の目的配列上のアミノ酸座標は、予め用意しておいたタンパク質断片座標データベースから適切なものを検索して作成する。
(4)上述の(2)および(3)によるタンパク質座標の構築ではアミノ酸残基間に構造的に不適切な隙間や衝突や歪みが生じることがあるので、エネルギー極小化計算により、これらの構造的な歪みを解消する。モデリングソフトによっては、この構造的な歪みの解消をスムーズに行うため、(2)〜(4)の計算及び検索処理をタンパク質全原子に対して同時に行うのではなく、段階的に行うものもある。即ち、まずタンパク質の骨格を形成するα炭素原子について行い、次いでα炭素原子を含む主鎖原子について行い、最後に側鎖原子を含むタンパク質原子全体について行うものである。
以上により、目的配列に対するアライメントが得られれば、その立体構造を予測構築することができる。
しかしながら、計算科学によりIn Silicoで構築されたタンパク質の立体構造は実験による検証が全くなされていない。ここで、タンパク質の立体構造情報を実験的に測定する方法としてはX線結晶構造解析、電子顕微鏡、NMRなどがあるが、いずれの方法も構造を求めるためには、技術的に困難な上に、時間と労力を要する作業を必要とする。
ここで、近年、水素−重水素(H/D)交換反応と質量分析(MS)を用いて、タンパク質の立体構造情報を得る方法が報告されている。例えば、H/D交換反応を用いた技術は、特許出願WO00/39326(Methods for quantifying heavy hydrogen levels atspecific peptide amide linkages in protein and peptide)、および、文献(Zhang,Z.and Smith,D.L.,(1993)Protein Sci.,2,522−531.)により開示されている。
これらの方法は、重水から調製した溶液に溶解したタンパク質を経時的にサンプリングし、これを酸性溶液中でペプシン消化を行い、得られたペプチドをLC/MSで測定することにより、ペプチドの質量変化速度より、重水素化速度を算出する。これにより、重水素化速度が速いところは溶媒接触率が高いか揺らぎが大きい部位であり、遅いところは溶媒接触率が低い部位であることがわかる。
しかしながら、この方法においても、多数のサンプリングの実施と測定時間の長いLC/MSを行わなくてはならないという問題点がある。また、ペプシン消化及びLC/MS測定時において、タンパク質の立体構造が著しく変化し、これによりペプチド内、ペプチド間のH/Dスクランブリングが生じる可能性が高いという問題点もある。後者の問題点については、近年、FTICR−MS(フーリエ変換イオンサイクロトロン型質量分析計)による断片化法であるキャピラリースキマーCID法を用いて、ペプシンの代わりにタンパク質を断片化し、H/D交換と併せてタンパク質−タンパク質相互作用部位情報を得たという報告がある(Akashi,S.,and Takio,K.,(2000)Protein Sci,9,2497−2505.、明石知子「第48回 質量分析総合討論会 要旨集」p.208(2000))が、依然として多数のサンプリングの実施が必要であるという問題点が存在している。
また、山田らは、FTICR−MSによる断片化法、水素−重水素交換法(H/D交換法)とアフィニティークロマトグラフィーを組み合わせた方法により、タンパク質−タンパク質相互作用部位情報を得た報告がなされた(Yamada N.,Suzuki E.,Hirayama K.,(2002)Rapid Commun.Mass Spectrom.,16,293−299.)。この方法では少ないサンプリングで相互作用部位情報を得ることができる。
前述のように、従来のタンパク質立体構造予測においては、アミノ酸配列から計算機を利用して立体構造を構築していくが、あくまでも仮想構造であり、実験による検証がされていないため、予測構造を実際の立体構造と比べて評価するためには、X線結晶構造解析やNMRなどを用いて構造解析を行わなくてはならない。そのためには、大量のタンパク質の調製や、結晶化、安定同位体ラベル化等を行わなければならず、非常に手間と時間を要する。
またMSとH/D交換反応とを組み合わせる方法は、精度は低いが高感度でタンパク質の立体構造情報を得ることができる手法であるが、依然として実験の手間と時間のかかる方法である。
従って、本発明は、立体構造予測結果の評価や、構造予測に有用な構造情報の提供が可能であり、高感度かつ迅速な立体構造情報の実測技術を提供することを目的としている。
発明の開示
本発明者は、上記課題を解決するために、タンパク質の立体構造情報を迅速にかつ高感度で取得する方法を開発すべく、質量分析(MS)による断片化技術とそこから得られる構造情報について詳細に検討した。その結果、H/D交換反応による従来法は、多数のサンプリングが必要であること、および、H/Dのスクランブリングが生じること等の課題がまだあった。
そこで、MSによるフラグメンテーションについて、Hexapole assisted capillary skimmer CID法(以下、「ヘキサポールCID法」という。)と赤外多光子解離(Infrared multiphoton dissociation)法(以下、「IRMPD法」という。)の測定法の検討と、その手法により得られる断片化スペクトルを鋭意検討した結果、タンパク質の2次構造、3次構造、揺らぎ等を反映した断片化が生じていることがわかった。
すなわち、タンパク質の構造のうちαヘリックスやβストランドなどの2次構造をもつ強固な部分は断片化が起こりにくく、ループなど運動性の高い部位は断片化が生じやすいことが見出された
さらに、立体構造を知りたいタンパク質のアミノ酸配列から、3D−1D法を用いて順位付けをした立体構造既知の候補タンパク質の2次構造と比較することにより、立体構造予測に利用する候補タンパク質を絞り込むことができた。
また、計算手法による予測構造にMSによるタンパク質の断片化データを照会することにより、予測構造を評価することができた。
これらの各種の知見に基づいて本発明が完成されるに到った。
上述した目的を達成するため、本発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、立体構造を予測する対象タンパク質について断片化して断片化スペクトルを測定する断片化スペクトル測定ステップ(断片化スペクトル測定手段)と上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)により測定された上記断片化スペクトルに基づいて、上記対象タンパク質のアミノ酸配列に対する上記断片化イオンの帰属情報を決定する帰属情報決定ステップ(帰属情報決定手段)と、上記帰属情報決定ステップ(帰属情報決定手段)により決定された上記断片化イオンの上記帰属情報により、上記対象タンパク質の上記アミノ酸配列において上記断片化イオンに断片化された箇所を特定し、当該箇所に従って上記対象タンパク質の上記アミノ酸配列における切断容易領域情報を決定する切断容易領域情報決定ステップ(切断容易領域情報決定手段)と、上記対象タンパク質について立体構造を予測する立体構造予測ステップ(立体構造予測手段)と、上記立体構造予測ステップ(立体構造予測手段)により予測された立体構造予測データと上記切断容易領域情報決定ステップ(切断容易領域情報決定手段)により決定された上記切断容易領域情報とを対応させて出力する処理結果出力ステップ(処理結果出力手段)とを含む(備える)ことを特徴とする。
この方法、装置、および、プログラムによれば、立体構造を予測する対象タンパク質についてエレクトロスプレーイオン化法などによりイオン化したイオンをヘキサポールCID法などにより断片化イオンに断片化し、断片化スペクトルを測定し、測定された断片化スペクトルに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定し、決定された断片化イオンの帰属情報により、対象タンパク質のアミノ酸配列において断片化イオンに断片化された箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における切断容易領域情報を決定し、対象タンパク質について立体構造を予測し、予測された立体構造予測データと決定された切断容易領域情報とを対応させて出力する(例えば、グラフィック表示、テーブルによる一覧表示など)ので、立体構造未知のタンパク質(これをコードする遺伝子を含む)の立体構造予測を行う場合、実測した立体構造情報を加味することにより、精度の高い予測を行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記処理結果出力ステップ(処理結果出力手段)は、上記立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または、空間充填モデルのうちいずれかのモデルによりグラフィック表示し、上記切断容易領域情報を対応する上記立体構造予測データの表示部分に関連付けて表示することを特徴とする。
これは処理結果出力の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または、空間充填モデルのうちいずれかのモデルによりグラフィック表示し、切断容易領域情報を対応する立体構造予測データの表示部分に関連付けて表示する(例えば、リンクを設定、モデル上に表示、モデル上に切断容易領域情報に対応する網掛けや斜線などの特定のパターン模様を表示など)ので、これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構造予測データの信頼性を直感的に判断することができるようになる。
つぎの発明にかかるタンパク質構造解析方法タンパク質構造解析装置、および、プログラムは上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記処理結果出力ステップ(処理結果出力手段)は、上記切断容易領域情報に従って対応する上記立体構造予測データの表示部分を色分けして表示することを特徴とする。
これは処理結果出力の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、グラフィック表示やテーブル表示を行う際に、切断容易領域情報に従って対応する上記立体構造予測データの表示部分を色分けして表示するので、これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構造予測データの信頼性を直感的に判断することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記立体構造予測ステップ(立体構造予測手段)により予測された立体構造予測データと、上記切断容易領域情報決定ステップ(切断容易領域情報決定手段)により決定された上記切断容易領域情報とを比較して、上記切断容易領域情報により特定された切断容易領域に対応する予測構造部分について評価を行い予測構造評価情報を決定する予測構造評価情報決定ステップ(予測構造評価情報決定手段)と、上記予測構造評価情報決定ステップ(予測構造評価情報決定手段)により決定された予測構造評価情報を出力する予測構造評価情報出力ステップ(予測構造評価情報出力手段)とをさらに含む(備える)ことを特徴とする。
この方法、装置、および、プログラムによれば、予測された立体構造予測データと、決定された切断容易領域情報とを比較して、切断容易領域情報により特定された切断容易領域に対応する予測構造部分について評価を行い予測構造評価情報を決定し、決定された予測構造評価情報を出力するので、計算機により予測された予測構造を生化学実験データに基づいて評価を行うことができるようになり、予測精度を著しく向上させることができるようになる。
また、これにより、ゲノム配列解析、DNAチップを用いた発現プロファイリング解析、プロテオーム解析などで見つかった興味深い遺伝子・タンパク質の機能解析を行う場合、立体構造を基準とした機能予測の精度が格段に向上するようになり、またゲノム配列解析においては、機能未知の遺伝子・タンパク質の立体構造を考慮した機能予測を行うことにより効率的に機能を推定することができるようになる。さらに、これにより、阻害剤などのドラッグデザインや蛋白質工学による活性向上や機能改変体のデザインを効率的に行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記対象タンパク質について基準振動計算を行う基準振動計算ステップ(基準振動計算手段)をさらに含み(備え)、上記処理結果出力ステップ(処理結果出力手段)は、上記基準振動計算ステップ(基準振動計算手段)による計算結果を対応する上記立体構造予測データの表示部分に関連付けて表示することを特徴とする。
この方法、装置、および、プログラムによれば、対象タンパク質について基準振動計算を行い、基準振動計算結果(例えば、揺らぎの情報など)を対応する立体構造予測データの表示部分に関連付けて表示する(例えば、立体構造モデル上にベクトル表示を行う)ので、切断容易領域として揺らぎの情報を考慮することができるようになる。すなわち、基準振動計算結果により揺らぎ情報を求め、MS実測データと比較することにより予測モデルの評価を行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)は、ヘキサポールCID法、ノズルスキマーCID法、キャピラリースキマーCID法、SORI−CID法、および、マルチポールストアー補助キャピラリースキマーCID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)法、表面誘起解離(SID)法、ECD法、および、BIRD法のうち少なくとも一つの方法により上記対象タンパク質について断片化イオンに断片化し上記断片化スペクトルを測定することを特徴とする。
これは断片化スペクトル測定の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、立体構造を予測する対象タンパク質についてヘキサポールCID法、ノズルスキマーCID法、キャピラリースキマーCID法、SORI−CID法、および、マルチポールストアー補助キャピラリースキマーCID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)法、表面誘起解離(SID)法、ECD法、および、BIRD法のうち少なくとも一つの方法により上記対象タンパク質について断片化イオンに断片化し上記断片化スペクトルを測定するので、対象タンパク質の立体構造を反映した断片化イオンを効率的に作成することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)は、酵素反応により上記対象タンパク質について断片化を行い上記断片化スペクトルを測定することを特徴とする。
これは断片化スペクトル測定の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、酵素反応により対象タンパク質について断片化を行い断片化スペクトルを測定するので、対象タンパク質の立体構造を反映した断片化を効率的に行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、立体構造を予測する対象タンパク質について断片化して断片化スペクトルを測定する断片化スペクトル測定ステップ(断片化スペクトル測定手段)と、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)により測定された上記断片化スペクトルに基づいて、上記対象タンパク質のアミノ酸配列に対する上記断片化イオンの帰属情報を決定する帰属情報決定ステップ(帰属情報決定手段)と、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)により測定された上記断片化スペクトル、および、上記帰属情報決定ステップ(帰属情報決定手段)により決定された上記断片化イオンの上記帰属情報に従って、上記対象タンパク質の上記アミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って上記対象タンパク質の上記アミノ酸配列における溶媒接触残基情報を決定する溶媒接触残基情報決定ステップ(溶媒接触残基情報決定手段)と、上記対象タンパク質について立体構造を予測する立体構造予測ステップ(立体構造予測手段)と、上記立体構造予測ステップ(立体構造予測手段)により予測された立体構造予測データと、上記溶媒接触残基情報決定ステップ(溶媒接触残基情報決定手段)により決定された上記溶媒接触残基情報とを対応させて出力する処理結果出力ステップ(処理結果出力手段)とを含む(備える)ことを特徴とする。
この方法、装置、および、プログラムによれば、立体構造を予測する対象タンパク質について断片化し、断片化スペクトルを測定し、測定された断片化スペクトルに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定し、対象タンパク質について立体構造を予測し、予測された立体構造予測データと決定された溶媒接触残基情報とを対応させて出力する(例えば、グラフィック表示テーブルによる一覧表示など)ので、立体構造未知のタンパク質(これをコードする遺伝子を含む)の立体構造予測を行う場合、実測した立体構造情報を加味することにより、精度の高い予測を行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記処理結果出力ステップ(処理結果出力手段)は、上記立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または、空間充填モデルのうちいずれかのモデルによりグラフィック表示し、上記溶媒接触残基情報を対応する上記立体構造予測データの表示部分に関連付けて表示することを特徴とする。
これは処理結果出力の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または、空間充填モデルのうちいずれかのモデルによりグラフィック表示し、溶媒接触残基情報を対応する立体構造予測データの表示部分に関連付けて表示する(例えば、リンクを設定、モデル上に表示、モデル上に溶媒接触領域情報に対応する網掛けや斜線などの特定のパターン模様を表示など)ので、これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構造予測データの信頼性を直感的に判断することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記処理結果出力ステップ(処理結果出力手段)は、上記溶媒接触残基情報に従って対応する上記立体構造予測データの表示部分を色分けして表示することを特徴とする。
これは処理結果出力の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、グラフィック表示やテーブル表示を行う際に溶媒接触残基情報に従って対応する上記立体構造予測データの表示部分を色分けして表示するので、これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構造予測データの信頼性を直感的に判断することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記立体構造予測ステップ(立体構造予測手段)により予測された立体構造予測データと、上記溶媒接触残基情報決定ステップ(溶媒接触残基情報決定手段)により決定された上記溶媒接触残基情報とを比較して、上記溶媒接触残基情報により特定された溶媒接触残基に対応する予測構造部分について評価を行い予測構造評価情報を決定する予測構造評価情報決定ステップ(予測構造評価情報決定手段)と、上記予測構造評価情報決定ステップ(予測構造評価情報決定手段)により決定された予測構造評価情報を出力する予測構造評価情報出力ステップ(予測構造評価情報出力手段)とをさらに含む(備える)ことを特徴とする。
この方法、装置、および、プログラムによれば、予測された立体構造予測データと、決定された溶媒接触残基情報とを比較して、溶媒接触残基情報により特定された溶媒接触残基に対応する予測構造部分について評価を行い予測構造評価情報を決定し、決定された予測構造評価情報を出力するので、計算機により予測された予測構造を生化学実験データに基づいて評価を行うことができるようになり、予測精度を著しく向上させることができるようになる。
また、これにより、ゲノム配列解析、DNAチップを用いた発現プロファイリング解析、プロテオーム解析などで見つかった興味深い遺伝子・タンパク質の機能解析を行う場合、立体構造を基準とした機能予測の精度が格段に向上するようになり、また、ゲノム配列解析においては、機能未知の遺伝子・タンパク質の立体構造を考慮した機能予測を行うことにより効率的に機能を推定することができるようになる。さらに、これにより、阻害剤などのドラッグデザインや蛋白質工学による活性向上や機能改変体のデザインを効率的に行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記対象タンパク質について基準振動計算を行う基準振動計算ステップ(基準振動計算手段)をさらに含み(備え)、上記処理結果出力ステップ(処理結果出力手段)は、上記基準振動計算ステップ(基準振動計算手段)による計算結果を対応する上記立体構造予測データの表示部分に関連付けて表示することを特徴とする。
この方法、装置、および、プログラムによれば、対象タンパク質について基準振動計算を行い、基準振動計算結果(例えば、揺らぎの情報など)を対応する立体構造予測データの表示部分に関連付けて表示する(例えば、立体構造モデル上にベクトル表示を行う)ので、溶媒接触領域として揺らぎの情報を考慮することができるようになる。すなわち、基準振動計算結果により揺らぎ情報を求め、MS実測データと比較することにより予測モデルの評価を行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)は、上記対象タンパク質について水素−重水素交換反応を行った後、断片化し上記断片化スペクトルを測定し、上記溶媒接触残基情報決定ステップ(溶媒接触残基情報決定手段)は、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)により測定された上記断片化スペクトル、および、上記帰属情報決定ステップ(帰属情報決定手段)により決定された上記断片化イオンの上記帰属情報に従って、上記対象タンパク質の上記アミノ酸配列中の各アミノ酸残基における重水素化速度を決定し、当該重水素化速度に従って上記対象タンパク質の上記アミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って上記対象タンパク質の上記アミノ酸配列における溶媒接触残基情報を決定することを特徴とする。
これは断片化スペクトル測定の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、対象タンパク質について水素−重水素交換反応を行った後、断片化し断片化スペクトルを測定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列中の各アミノ酸残基における重水素化速度を決定し、当該重水素化速度に従って対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質の上記アミノ酸配列における溶媒接触残基情報を決定するので、効率的に溶媒接触情報を求めることができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)は、上記対象タンパク質について化学修飾を行った後、断片化し上記断片化スペクトルを測定し、上記溶媒接触残基情報決定ステップ(溶媒接触残基情報決定手段)は、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)により測定された上記断片化スペクトル、および、上記帰属情報決定ステップ(帰属情報決定手段)により決定された上記断片化イオンの上記帰属情報に従って、上記対象タンパク質の上記アミノ酸配列中の各アミノ酸残基における化学修飾部分を決定し、当該化学修飾部分に従って上記対象タンパク質の上記アミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って上記対象タンパク質の上記アミノ酸配列における溶媒接触残基情報を決定することを特徴とする。
これは断片化スペクトル測定の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、対象タンパク質について化学修飾を行った後、断片化し断片化スペクトルを測定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って対象タンパク質のアミノ酸配列中の各アミノ酸残基における化学修飾部分を決定し、当該化学修飾部分に従って対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定するので、効率的に溶媒接触情報を求めることができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)は、ヘキサポールCID法、ノズルスキマーCID法、キャピラリースキマーCID法、SORI−CID法、および、マルチポールストアー補助キャピラリースキマーCID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)法、表面誘起解離(SID)法、ECD法、および、BIRD法のうち少なくとも一つの方法により上記対象タンパク質について断片化イオンに断片化し上記断片化スペクトルを測定することを特徴とする。
これは断片化スペクトル測定の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、立体構造を予測する対象タンパク質についてヘキサポールCID法、ノズルスキマーCID法、キャピラリースキマーCID法、SORI−CID法、および、マルチポールストアー補助キャピラリースキマーCID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)法、表面誘起解離(SID)法、ECD法、および、BIRD法のうち少なくとも一つの方法により上記対象タンパク質について断片化イオンに断片化し上記断片化スペクトルを測定するので、対象タンパク質の立体構造を反映した断片化イオンを効率的に作成することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)は、酵素反応により上記対象タンパク質について断片化を行い上記断片化スペクトルを測定することを特徴とする。
これは断片化スペクトル測定の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、酵素反応により対象タンパク質について断片化を行い、H/D交換法や化学修飾法を組み合わせることにより、溶媒接触部位情報等を効率的に得ることができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、立体構造を予測する対象タンパク質と化合物との複合体について断片化し、断片化スペクトルを測定する断片化スペクトル測定ステップ(断片化スペクトル測定手段)と上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)により測定された上記断片化スペクトルに基づいて、上記対象タンパク質および/または上記化合物に対する断片化イオンの帰属情報を決定する帰属情報決定ステップ(帰属情報決定手段)と、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)により測定された上記断片化スペクトル、および、上記帰属情報決定ステップ(帰属情報決定手段)により決定された上記断片化イオンの上記帰属情報に従って、上記対象タンパク質および/または上記化合物に関する相互作用界面情報を決定する相互作用界面情報決定ステップ(相互作用界面情報決定手段)と、上記対象タンパク質および/または上記化合物について立体構造を予測する立体構造予測ステップ(立体構造予測手段)と上記立体構造予測ステップ(立体構造予測手段)により予測された立体構造予測データと、上記相互作用界面情報決定ステップ(相互作用界面情報決定手段)により決定された上記相互作用界面情報とを対応させて出力する処理結果出力ステップ(処理結果出力手段)とを含む(備える)ことを特徴とする。
この方法、装置、および、プログラムによれば、立体構造を予測する対象タンパク質と化合物(例えば、タンパク質や低分子化合物や核酸など)との複合体について断片化し、断片化スペクトルを測定し、測定された断片化スペクトルに基づいて、対象タンパク質および/または化合物に対する断片化イオンの帰属情報を決定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質および/または化合物に関する相互作用界面情報を決定し、対象タンパク質および/または化合物について立体構造を予測し、予測された立体構造予測データと決定された相互作用界面情報とを対応させて出力する(例えば、グラフィック表示、テーブルによる一覧表示など)ので、立体構造未知のタンパク質(これをコードする遺伝子を含む)の立体構造予測を行う場合、実測した立体構造情報を加味することにより、精度の高い予測を行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記処理結果出力ステップ(処理結果出力手段)は、上記立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または、空間充填モデルのうちいずれかのモデルにより上記対象タンパク質および/または上記化合物についてグラフィック表示し、上記相互作用界面情報を対応する上記立体構造予測データの表示部分に関連付けて表示することを特徴とする。
これは処理結果出力の一例を一層具体的に示すものである。この方法、装置および、プログラムによれば、立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または空間充填モデルのうちいずれかのモデルにより対象タンパク質および/または化合物についてグラフィック表示(例えば、ドッキングシミュレーションなども含む)し、相互作用界面情報を対応する立体構造予測データの表示部分に関連付けて表示する(例えば、リンクを設定、モデル上に表示、モデル上に相互作用界面情報に対応する網掛けや斜線などの特定のパターン模様を表示など)ので、これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構造予測データの信頼性を直感的に判断することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記処理結果出力ステップ(処理結果出力手段)は上記相互作用界面情報に従って上記対象タンパク質および/または上記化合物の対応する上記立体構造予測データの表示部分を色分けして表示することを特徴とする。
これは処理結果出力の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、グラフィック表示やテーブル表示を行う際に、相互作用界面情報に従って対象タンパク質および/または化合物の対応する上記立体構造予測データの表示部分を色分けして表示するので、これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構造予測データの信頼性を直感的に判断することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記立体構造予測ステップ(立体構造予測手段)により予測された立体構造予測データと上記相互作用界面情報決定ステップ(相互作用界面情報決定手段)により決定された上記相互作用界面情報とを比較して、上記相互作用界面情報により特定された相互作用界面に対応する予測構造部分について評価を行い予測構造評価情報を決定する予測構造評価情報決定ステップ(予測構造評価情報決定手段)と、上記予測構造評価情報決定ステップ(予測構造評価情報決定手段)により決定された予測構造評価情報を出力する予測構造評価情報出力ステップ(予測構造評価情報出力手段)とをさらに含む(備える)ことを特徴とする。
この方法、装置、および、プログラムによれば、予測された立体構造予測データと、決定された相互作用界面情報とを比較して、相互作用界面情報により特定された相互作用界面に対応する予測構造部分について評価を行い予測構造評価情報を決定し、決定された予測構造評価情報を出力するので、計算機により予測された予測構造を生化学実験データに基づいて評価を行うことができるようになり、予測精度を著しく向上させることができるようになる。
また、これにより、ゲノム配列解析、DNAチップを用いた発現プロファイリング解析、プロテオーム解析などで見つかった興味深い遺伝子・タンパク質の機能解析を行う場合、立体構造を基準とした機能予測の精度が格段に向上するようになり、また、ゲノム配列解析においては、機能未知の遺伝子・タンパク質の立体構造を考慮した機能予測を行うことにより効率的に機能を推定することができるようになる。さらに、モデル構造と活性部位(相互作用部位)情報から、阻害剤などのドラッグデザインや蛋白質工学による活性向上、機能改変体のデザインが可能となる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、およびプログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記対象タンパク質および/または上記化合物について基準振動計算を行う基準振動計算ステップ(基準振動計算手段)をさらに含み(備え)、上記処理結果出力ステップ(処理結果出力手段)は、上記基準振動計算ステップ(基準振動計算手段)による計算結果を対応する上記立体構造予測データの表示部分に関連付けて表示することを特徴とする。
この方法、装置、および、プログラムによれば、対象タンパク質および/または化合物について基準振動計算を行い、基準振動計算結果(例えば、揺らぎの情報など)を対応する立体構造予測データの表示部分に関連付けて表示する(例えば、立体構造モデル上にベクトル表示を行う)ので、相互作用界面領域として揺らぎの情報を考慮することができるようになる。すなわち、基準振動計算結果により揺らぎ情報を求め、MS実測データと比較することにより予測モデルの評価を行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)は、上記対象タンパク質と上記化合物との上記複合体について水素−重水素交換反応を行った後、断片化し上記断片化スペクトルを測定し、上記相互作用界面情報決定ステップ(相互作用界面情報決定手段)は、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)により測定された上記断片化スペクトル、および、上記帰属情報決定ステップ(帰属情報決定手段)により決定された上記断片化イオンの上記帰属情報に従って、上記対象タンパク質および/または上記化合物における重水素化速度を決定し、当該重水素化速度に従って上記対象タンパク質および/または上記化合物において相互作用界面を特定し、当該相互作用界面に従って上記対象タンパク質および/または上記化合物における相互作用界面情報を決定することを特徴とする。
これは断片化スペクトル測定の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、対象タンパク質と化合物との複合体について水素−重水素交換反応を行った後、断片化し上記断片化スペクトルを測定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質および/または化合物における重水素化速度を決定し、当該重水素化速度に従って対象タンパク質および/または化合物において相互作用界面を特定し、当該相互作用界面に従って対象タンパク質および/または化合物における相互作用界面情報を決定するので、効率的に相互作用界面情報を求めることができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)は、上記対象タンパク質と上記化合物との上記複合体について化学修飾を行った後、断片化し上記断片化スペクトルを測定し、上記相互作用界面情報決定ステップ(相互作用界面情報決定手段)は、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)により測定された上記断片化スペクトル、および、上記帰属情報決定ステップ(帰属情報決定手段)により決定された上記断片化イオンの上記帰属情報に従って、上記対象タンパク質および/または上記化合物における化学修飾部分を決定し、当該化学修飾部分に従って上記対象タンパク質および/または上記化合物において相互作用界面を特定し、当該相互作用界面に従って上記対象タンパク質および/または上記化合物における相互作用界面情報を決定することを特徴とする。
これは断片化スペクトル測定の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、対象タンパク質と化合物との複合体について化学修飾を行った後、断片化し断片化スペクトルを測定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質および/または化合物における化学修飾部分を決定し、当該化学修飾部分に従って対象タンパク質および/または化合物において相互作用界面を特定し、当該相互作用界面に従って対象タンパク質および/または化合物における相互作用界面情報を決定するので、効率的に相互作用界面情報を求めることができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)は、ヘキサポールCID法、ノズルスキマーCID法、キャピラリースキマーCID法、SORI−CID法、および、マルチポールストアー補助キャピラリースキマーCID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)法、表面誘起解離(SID)法、ECD法、および、BIRD法のうち少なくとも一つの方法により上記対象タンパク質と上記化合物との上記複合体について断片化イオンに断片化し上記断片化スペクトルを測定することを特徴とする。
これは断片化スペクトル測定の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、立体構造を予測する対象タンパク質についてヘキサポールCID法、ノズルスキマーCID法、キャピラリースキマーCID法、SORI−CID法、および、マルチポールストアー補助キャピラリースキマーCID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)法、表面誘起解離(SID)法、ECD法、および、BIRD法のうち少なくとも一つの方法により対象タンパク質と化合物との複合体について断片化イオンに断片化し上記断片化スペクトルを測定するのでの対象タンパク質の立体構造を反映した断片化イオンを効率的に作成することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムは、上記に記載のタンパク質構造解析方法、タンパク質構造解析装置、および、プログラムにおいて、上記断片化スペクトル測定ステップ(断片化スペクトル測定手段)は、酵素反応により上記対象タンパク質と上記化合物の上記複合体について断片化を行い上記断片化スペクトルを測定することを特徴とする。
これは断片化スペクトル測定の一例を一層具体的に示すものである。この方法、装置、および、プログラムによれば、酵素反応により対象タンパク質と化合物の複合体について断片化を行い、H/D交換法や化学修飾法を組み合わせることにより、相互作用界面情報等を効率的に得ることができるようになる。
また本発明は記録媒体に関するものであり、本発明かかる記録媒体は、上記に記載されたプログラムをコンピュータに実行させるための記録媒体であることを特徴とする。
この記録媒体によれば、当該記録媒体をコンピュータに読み取らせて実行することによって、上記に記載されたプログラムをコンピュータを利用して実現することができ、これら各プログラムと同様の効果を得ることができる。
発明を実施するための最良の形態
以下に、本発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
特に、以下の実施の形態においては、本発明を、インターロイキン−6等に適用した例について説明するが、この場合に限られず、全てのタンパク質において、同様に適用することができる。
[本発明の概要]
以下、本発明の概要について説明し、その後、本発明の構成および処理等について詳細に説明する。図1は本発明の基本原理を示す原理構成図である。
本発明は、概略的に、以下の基本的特徴を有する。まず、立体構造を予測する対象の立体構造予測対象タンパク質(以下、「対像タンパク質」という。)について、MSによる各種の断片化法や酵素消化法などにより断片化し、断片化スペクトルを測定する。
対象タンパク質のMSによる測定は、エレクトロスプレーイオン化法、レーザースプレーイオン化法、ソニックスプレーイオン化法、大気圧化学イオン化法等のスプレー方式のイオン化法、MALDI法、およびその他これらに相当するイオン化法のうち少なくともひとつの手法によりイオン化した後、当該生成したイオンをヘキサポール(hexapole)CID法(ノズルスキマーCID法、キャピラリースキマーCID法、マルチポールストアー補助キャピラリースキマーCID法と類似の手法である)、SORI−CID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)、表面誘起解離(SID)法、ECD(電子補足解離)法、BIRD(黒体赤外放射解離)法、およびその他これらに相当する断片化法のうち少なくとも一つの手法により対象タンパク質について断片化イオンに断片化し、断片化スペクトルを測定してもよく、また、ペプシンやトリプシンなどを用いた酵素消化法により対象タンパク質について断片化を行い断片化スペクトルを測定してもよい。
キャピラリースキマーCID法は、イオン化とイオン導入部にあるキャピラリーとスキマー間の電圧を利用して断片化を誘起するインソースフラグメンテーション法である(S.Akashi,Anal.Chem.,71,4974−4980(1999)参照)。
また、ヘキサポールCID法はさらにヘキサポールにイオンを一定時間溜め込むことにより、キャピラリースキマーCID法の効率を向上させる方法である(K.A.,Sannes−Lowery,J.Am.Soc.Mass Spectrom.,11,1−9(2000)参照)。
また、IRMPD法は、イオンに炭酸ガスレーザーを照射することにより、フラグメンテーションを誘起する方法である(C.P.Dufresne,J.Am.Soc.Mass Spectrom.,9,1222−1225(1998)参照)。
そして、上記手法を用いて得られた断片化スペクトルにおいて、各フラグメントの帰属を行う。すなわち、測定された断片化スペクトルに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定する。ここで、対象タンパク質のアミノ酸配列は、PDBに格納されている場合にはその配列を用いてもよく、また、MALDI−TOF−MSやMS/MSなどによるアミノ酸配列同定手法を用いることにより対象タンパク質のアミノ酸配列を同定してもよい。
そして、決定された断片化イオンの帰属情報により、対象タンパク質のアミノ酸配列において断片化イオンに断片化された箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における切断容易領域情報を決定する。
ここで、図6は、ヒトのインターロイキン−6(IL−6)について断片化イオンの帰属情報を求め切断容易領域情報を決定する際の概念図である。図6において、IRMPD法により断片化を行った際の断片化イオンのフラグメントを点線で、ヘキサポールCID法により断片化を行った際の断片化イオンのフラグメントを実線で表している。また、これらの断片化イオンの切断部位に基づいて求めた切断容易領域情報を斜線で表している。
そして、対象タンパク質について立体構造を予測する。ここで、立体構造予測は、ホモロジーモデリング法、分子シミュレーション法、アブイニシオ法、二次構造予測法、3D−1D法、スレッディング法などの既存の立体構造予測方法のいずれを用いてもよい。以下に、配列の相同性に基づく立体構造予測手法を一例に説明する。
ここで、立体構造予測対象タンパク質のアミノ酸配列(遺伝子の場合は、DNA配列から得られるアミノ酸配列)と、類似のアミノ酸配列を有する既知立体構造の検索等には、FASTA(Pearson WR,Methods Enzymol,266,227−258,1996)、PSI−BLAST(Schaffer AA,Wolf YI,Ponting CP,Koonin EV,Aravind L and Altschul SF,Bioinformatics,12,1000−1011,1999)、LIBRA(Ota,M.and Nishikawa,K.,Protein Engineering,10,339−351,1997)、RBS−BLAST(Schaffer AA,Wolf YI,Ponting CP,Koonin EV,Aravind L and Altschul SF,Bioinformatics,12,1000−1011,1999)、IMPALA(A.A.Schaffeet al.,Bioinformatics,15(12),1000−1011,1999)、HMMER(R.Durbin,S.Eddy,A.Krogh,and G.Mitchison,Cambridge University Press,1998,S.R.Eddy.Bioinformatics,14,755−763,1998)、または、ClustalW(Thomopson,J.D.,D.G.Higgins,and T.J.Gibson,Nucleic Acids Res.22,4673−4680,1994)等などのコンピュータプログラムを用いてもよい。
検索対象には、予めPDB(Protein Data Base)を加工したデータベースを用いることが好ましい。加工データベースはPDBに登録された全てのタンパク質配列を配列相同性(ホモロジー)95%以上のクラスに分類し、各クラスの中で最も実験精度の高いものを代表配列として抽出する操作によって作成する。この加工データベースを用いることで、ホモロジー検索の効率が増大するとともに、検索件数を制限した場合でも検索される立体構造の多様性・バラエティを確保できる。
検索プログラムによる出力結果から、立体構造予測対象タンパク質と参照タンパク質配列とのペアワイズアライメントを検索件数分だけ個々に作成する。ペアワイズアライメントごとに、参照タンパク質の立体構造における2次構造領域を同定し、参照タンパク質配列上に照会する。なお、立体構造予測対象タンパク質と複数の参照タンパク質配列とに基づいて、マルチプルアライメントを行ってもよい。
そして、2次構造情報を表示したアライメント結果に、MSの断片化データにより求めた切断容易領域情報を照会する。すなわち、MSで得られた断片化イオンの両端は容易に切断されやすい部位であり、立体構造上においては運動性の高いループ部分に相当する可能性が高いと考えられる部位である。一方、MSで得られた断片化イオンの両端に挟まれた部分は、断片化が起こりにくい部位であることから、αヘリックスやβストランドなどの2次構造を有している部位に相当する可能性が高いと考えられる部位である。
そして、すべての断片化イオンの情報を加味して、候補タンパク質の評価(ランク付け)を行う。
続いて、評価の高い候補タンパク質の立体構造を基盤として、予測対象タンパク質の立体構造予測をホモロジーモデリング法により行う。ここで、立体構造予測プログラムとしては、「FAMS」(Ogata,K.and Umeyama,H.,J.Mol.Graphics Mod.18,258−272,2000)、Swiss−Model(Peitsch MC.,Biochem.Soc.Trans.24,274−279,1996)、CPHmodels(O.Lund,K.Frimand,J.Gorodkin,H.Bohr,J.Bohr,J.Hansen,and S.Brunak.,Protein Engineering,10,1241−1248,1997)、「SAM−T98」(J.Park,K.Karplus,C.Barrett,R.Hughey,D.Haussler,T.Hubbard,and C.Chothia,JMB 284(4),1201−1210,1998)、「MODELLER」(A.Sali,L.Potterton,F.Yuan,H.van Vlijmen,and M.Karplus,Proteins,23,318−326,1995)などを採用してもよい。また、Daniel Fischerら「CAFASP2 The Second Critical Assessment of Fully Automated Structure Prediction Methods、PROTEINS、5;171−183(2001)」において開示または参照された各種の立体構造予測プログラムを用いてもよい。
そして、候補タンパク質について、予測された立体構造予測データと決定された切断容易領域情報とを対応させて出力する(例えば、グラフィック表示、テーブルによる一覧表示など)。例えば、立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または、空間充填モデルのうちいずれかのモデルによりグラフィック表示し、切断容易領域情報を対応する立体構造予測データの表示部分に関連付けて表示(例えば、リンクを設定、モデル上に表示、モデル上に切断容易領域情報に対応する網掛けや斜線などの特定のパターン模様を表示など)してもよく、またグラフィック表示やテーブル表示を行う際に、切断容易領域情報に従って対応する上記立体構造予測データの表示部分を色分けして表示してもよい。
予測された立体構造予測データと、決定された切断容易領域情報とを比較して、切断容易領域情報により特定された切断容易領域に対応する予測構造部分について評価を行い予測構造評価情報を決定し、決定された予測構造評価情報を出力する。すなわち、得られた予測構造とMSの断片化データを照会し、予測構造を評価する。
また、例えばホモロジーが高い候補タンパク質については、断片化スペクトルをMSで測定し、立体構造予測対象タンパク質の断片化スペクトルと比較することにより、さらに精度が高い評価を行うことが可能である。
さらに本発明は、立体構造を予測する対象タンパク質または複合体について水素−重水素交換反応を行い、断片化イオンに断片化し、断片化スペクトルを測定する。
ここで、図19は、ヒトのインターロイキン−6(IL−6)と、抗IL−6抗体との複合体(complex)について、水素−重水素交換反応を行い、エレクトロスプレーイオン化法により断片化イオンに断片化し、断片化スペクトルを測定する際の概念図である。
そして、測定された断片化スペクトルに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列中の各アミノ酸残基における重水素化速度を決定する。
ここで、図20は、水素−重水素交換反応を行ったヒトのIL−6の断片化スペクトルから重水素化速度を求める際の概念図である。図20に示すように、水素−重水素交換反応を行ったヒトのIL−6の断片化スペクトル(上段)と、水素−重水素交換反応を行わない場合のヒトのIL−6の断片化スペクトル(下段)の重心値の変化から重水素化率(D化率)を決定し、経時的に求めた重水素化率から重水素化速度を計算する。
そして、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定する。溶媒接触残基情報は、例えば水素−重水素交換していないコントロール実験と比較して重水素化速度が遅くなっている部位を溶媒接触残基情報として決定してもよい。
また、複合体の場合には、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列における相互作用界面情報を決定する。相互作用界面情報は、例えば、複合体を形成していない単独時に測定した場合と比較して、重水素化速度が遅くなっている部位を相互作用界面情報として決定してもよい。また水素−重水素交換していないコントロール実験と比較して重水素化速度が遅くなっている部位を相互作用界面情報として決定してもよい。
このようにして、決定した溶媒接触残基情報および相互作用界面情報を、予測データとともに出力したり、予測構造評価情報を決定したりする際に利用する。すなわち、予測された立体構造予測データと決定された溶媒接触残基情報や相互作用界面情報とを対応させて出力し(例えば、グラフィック表示、テーブルによる一覧表示など)、また予測された立体構造予測データと、決定された溶媒接触残基情報や相互作用界面情報とを比較して、溶媒接触残基情報により特定された溶媒接触残基や相互作用界面情報により特定された相互作用界面に対応する予測構造部分について評価を行い予測構造評価情報を決定し、決定された予測構造評価情報を出力する。
ここで、図12は、ヒトのインターロイキン−6(IL−6)について、立体構造予測データをリボンモデルによりグラフィック表示し、切断容易領域情報に従って対応する上記立体構造予測データの表示部分を色分けして表示する場合の表示画面の一例を示す図である。図12において、切断容易領域情報を黒色で、また相互作用界面情報を灰色で示している。
また図17は、処理結果についてテーブルによる一覧表示を行う場合の表示画面の一例を示す図である。この図に示すように処理結果一覧表示画面は、例えば、タンパク質のアミノ酸残基番号を表示するための表示領域MA−1、本発明により決定された切断容易領域を表示するための表示領域MA−2、本発明により決定された溶媒接触残基情報を表示するための表示領域MA−3、本発明により決定された相互作用界面情報を表示するための表示領域MA−4、構造予測手法による立体構造予測データ(例えば、二次構造など)を表示するための表示領域MA−5、本発明により決定された立体構造予測データに対する予測構造評価情報を表示するための表示領域MA−6などを含んで構成されている。本図に示すように、タンパク質のアミノ酸残基毎にこれらの情報をテーブル形式で一覧表示してもよい。また、相互作用界面情報を表示する場合には、1対多数の相互作用を区別して表示することが望ましい(例えば、A,B,C,,,,,という表示方法を採用してもよい)。
また、切断容易領域や、H/D交換しやすい領域が生じる要因としては、揺らぎの情報も含んでいると考えられる。従って、また本発明は、揺らぎ情報として基準振動計算を実行し、基準振動計算結果とMSデータとを比較して、モデルの評価等をすることも可能である。よって、本発明は、対象タンパク質について各種の既知のコンピュータプログラム(例えば、富士通株式会社(商標)の分子軌道計算プログラムMOPAC(製品名)等)などを用いて基準振動計算を行い、基準振動計算結果(例えば、揺らぎの情報)を対応する立体構造予測データの表示部分に関連付けて表示する(例えば、立体構造モデル上にベクトル表示を行う)ので、切断容易領域として揺らぎの情報を考慮することができるようになる。すなわち、基準振動計算結果により揺らぎ情報を求め、MS実測データと比較することにより予測モデルの評価を行うことができるようになる。
[システム構成]
まず、本システムの構成について説明する。図2は本発明が適用される本システムの構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。本システムは、概略的に、タンパク質構造解析装置100と配列情報等に関する外部データベースやホモロジー検索等の外部プログラム等を提供する外部システム200とを、ネットワーク300を介して通信可能に接続して構成されている。また、タンパク質構造解析装置100は、質量分析装置400の断片化スペクトル情報などが入力装置112またはネットワーク300などを介して取得可能に構成されている。
図2においてネットワーク300は、タンパク質構造解析装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。
図2において外部システム200は、ネットワーク300を介して、タンパク質構造解析装置100と相互に接続され、利用者に対して配列情報等に関する外部データベースやホモロジー検索やモチーフ検索等の外部プログラムを実行するウェブサイトを提供する機能を有する。
ここで、外部システム200は、WEBサーバやASPサーバ等として構成してもよく、そのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成してもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。
図2において質量分析装置400は、ヘキサポールCID法、ノズルスキマーCID法、キャピラリースキマーCID法、SORI−CID法、および、マルチポールストアー補助キャピラリースキマーCID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)法、表面誘起解離(SID)法、ECD法、または、BIRD法などの方法により断片化イオンに断片化し、断片化スペクトルを測定する。
図2においてタンパク質構造解析装置100は概略的に、タンパク質構造解析装置100の全体を統括的に制御するCPU等の制御部102、通信回線等に接続されるルータ等の通信装置(図示せず)に接続される通信制御インターフェース部104、入力装置112や出力装置114に接続される入出力制御インターフェース部108、および、各種のデータベースやテーブルなどを格納する記憶部106を備えて構成されており、これら各部は任意の通信路を介して通信可能に接続されている。さらに、このタンパク質構造解析装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク300に通信可能に接続されている。
記憶部106に格納される各種のデータベースやファイルやテーブル(断片化スペクトルデータファイル106a〜処理結果データファイル106f)は固定ディスク装置等のストレージ手段であり、各種処理に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
これら記憶部106の各構成要素のうち、断片化スペクトルデータファイル106aは、質量分析装置400から取得した断片化スペクトルデータを格納する断片化スペクトルデータ格納手段である。
また、切断容易領域情報ファイル106bは、切断容易領域情報等を格納する切断容易領域情報格納手段である。
また、溶媒接触残基情報/相互作用界面情報ファイル106cは、溶媒接触残基情報および相互作用界面情報等を格納する相互作用界面情報格納手段である。
また、立体構造予測データファイル106dは、立体構造予測処理により予測された立体構造予測データ等を格納する立体構造予測データ格納手段である。
また、予測構造評価情報ファイル106eは、予測構造評価情報等を格納する予測構造評価情報格納手段である。
また、処理結果データファイル106fは、処理結果に関する情報等を格納する処理結果データ格納手段である。
また、その他の情報として、タンパク質構造解析装置100の記憶部106には、タンパク質のアミノ酸配列情報や構造情報を格納したタンパク質情報データベース等が記録されていてもよい。このタンパク質情報データベースはPDB等のインターネットを経由してアクセスする外部のデータベースであってもよく、また、これらのデータベースをコピーしたり、オリジナルの配列情報等を格納したり、さらに独自のクラスタリング情報やアノテーション情報等を付加したりして作成したインハウスデータベースであってもよい。
また図2において、通信制御インターフェース部104は、タンパク質構造解析装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
また、図2において、入出力制御インターフェース部108は、入力装置112や出力装置114の制御を行う。ここで、出力装置114としては、モニタ(家庭用テレビを含む)の他、スピーカを用いることができる(なお、以下においては出力装置114をモニタとして記載する場合がある)。また入力装置112としては、キーボード、マウス、および、マイク等を用いることができる。また、モニタも、マウスと協働してポインティングデバイス機能を実現する。
また、図2において、制御部102は、OS(Operating System)等の制御プログラム、各種の処理手順等を規定したプログラム、および所要データを格納するための内部メモリを有し、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、断片化スペクトルデータ取得部102a、帰属情報決定部102b、切断容易領域情報決定部102c、溶媒接触残基情報決定部102d、相互作用界面情報決定部102e、立体構造予測処理部102f、予測構造評価情報決定部102g、処理結果出力部102h、予測構造評価情報出力部102i、重水素化速度決定部102j、および、基準振動計算処理部102kを備えて構成されている。
このうち、断片化スペクトルデータ取得部102aは、立体構造を予測する対象タンパク質についてMSや酵素などを用いて断片化し、その断片化スペクトルを測定した質量分析装置400から断片化スペクトルデータを取得する断片化スペクトルデータ取得手段である。
また、帰属情報決定部102bは、断片化スペクトルデータ取得手段により取得された断片化スペクトルデータに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定する帰属情報決定手段である。
また、切断容易領域情報決定部102cは、帰属情報決定手段により決定された断片化イオンの帰属情報により、対象タンパク質のアミノ酸配列において断片化イオンに断片化された箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における切断容易領域情報を決定する切断容易領域情報決定手段である。
また、溶媒接触残基情報決定部102dは、重水素化速度決定手段にて決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定する溶媒接触残基情報決定手段である。
また、相互作用界面情報決定部102eは、重水素化速度決定手段にて決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列における相互作用界面情報を決定する相互作用界面情報決定手段である。
また、立体構造予測処理部102fは、ホモロジーモデリング法、分子シミュレーション法、アブイニシオ法、二次構造予測法、3D−1D法、スレッディング法などの既存の立体構造予測方法を用いて、対象タンパク質や候補タンパク質について立体構造を予測する立体構造予測手段である。
また、予測構造評価情報決定部102gは、立体構造予測手段により予測された立体構造予測データと、切断容易領域情報決定手段により決定された切断容易領域情報とを比較して、切断容易領域情報により特定された切断容易領域に対応する予測構造部分について評価を行い予測構造評価情報を決定する予測構造評価情報決定手段、立体構造予測手段により予測された立体構造予測データと、溶媒接触残基情報決定手段により決定された溶媒接触残基情報とを比較して、溶媒接触残基情報により特定された溶媒接触残基に対応する予測構造部分について評価を行い予測構造評価情報を決定する予測構造評価情報決定手段、立体構造予測手段により予測された立体構造予測データと相互作用界面情報決定手段により決定された相互作用界面情報とを比較して、相互作用界面情報により特定された相互作用界面に対応する予測構造部分について評価を行い予測構造評価情報を決定する予測構造評価情報決定手段である。
また、処理結果出力部102hは、立体構造予測手段により予測された立体構造予測データと、切断容易領域情報決定手段により決定された切断容易領域情報とを対応させて出力する処理結果出力手段、立体構造予測手段により予測された立体構造予測データと溶媒接触残基情報決定手段により決定された溶媒接触残基情報とを対応させて出力する処理結果出力手段、立体構造予測手段により予測された立体構造予測データと、相互作用界面情報決定手段により決定された相互作用界面情報とを対応させて出力する処理結果出力手段である。
また、予測構造評価情報出力部102iは、予測構造評価情報決定手段により決定された予測構造評価情報を出力する予測構造評価情報出力手段である。
また、重水素化速度決定部102jは、断片化スペクトルデータ取得手段により測定された断片化スペクトルデータ、および、帰属情報決定手段により決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列中の各アミノ酸残基における重水素化速度を決定する重水素化速度決定手段である。
また、基準振動計算処理部102kは、対象タンパク質について基準振動計算を行う基準振動計算手段である。なお、これら各部によって行なわれる処理の詳細については、後述する。
[システムの処理]
次に、このように構成された本実施の形態における本システムの処理の一例について、以下に図3などを参照して詳細に説明する。
[メイン処理]
まず、メイン処理の詳細について図3を参照して説明する。図3は、本実施形態における本システムのメイン処理の一例を示すフローチャートである。
まず、対象タンパク質について質量分析装置400により断片化スペクトルを測定する(ステップSA−1)。すなわち、対象タンパク質溶液をシリンジポンプで質量分析装置400に連続注入し、ヘキサポールCID法などにより対象タンパク質を断片化イオンに断片化し、断片化スペクトルの測定を行う。
ここで、図4は、本実施形態におけるヘキサポールCID法により断片化スペクトルを測定する場合の一例を示すフローチャートである。
まず、キャピラリー出口の電圧を上げる(ステップSB−1)。
そして、断片化の効率を向上させるため、ヘキサポール内でのイオンのトラップ時間を長くしてもよい(ステップSB−2)。
そして、タンパク質が断片化するように、MSイオン化と検出のパラメータ(例えば、キャピラリー電圧、ヘキサポール内トラップ時間など)を調整する(ステップSB−3)。
そして、MSによる断片化スペクトルの取り込みと保存を行う(ステップSB−4)。
また、図5は、本実施形態におけるIRMPD法により断片化スペクトルを測定する場合の一例を示すフローチャートである。
まず、MS内に存在する(例えば、ヘキサポール内、イオントラップ内)イオンに対して、IRレーザー(10.9um)を照射する(ステップSC−1)。
そして、断片化の効率を向上させるため、ヘキサポール内でのイオンのトラップ時間を長くしてもよい(ステップSC−2)。
そして、タンパク質が断片化するように、MSイオン化と検出のパラメータ(例えば、キャピラリー電圧、ヘキサポール内トラップ時間、IRレーザーのエネルギー、IRレーザーの照射時間など)を調整する(ステップSC−3)。
そして、MSによる断片化スペクトルの取り込みと保存を行う(ステップSC−4)。
その他のノズルスキマーCID法、キャピラリースキマーCID法、マルチポールストアー補助キャピラリースキマーCID法、ECD法、BIRD法、または、SORI−CID法などにより断片化スペクトルを取得してもよい。
再び、図3に戻り、タンパク質構造解析装置100は、断片化スペクトルデータ取得部102aの処理により、質量分析装置400から入力装置112またはネットワーク300を経由して断片化スペクトルデータを取得し、断片化スペクトルデータファイル106aに格納する(ステップSA−2)。
ついで、タンパク質構造解析装置100は、帰属情報決定部102bの処理により、測定された断片化スペクトルに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定し、また、切断容易領域情報決定部102cの処理により、決定された断片化イオンの帰属情報により、対象タンパク質のアミノ酸配列において断片化イオンに断片化された箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における切断容易領域情報を決定する(ステップSA−3)。
ついで、タンパク質構造解析装置100は、切断容易領域情報決定部102cの処理により、切断容易領域情報を切断容易領域情報ファイル106bに格納する(ステップSA−4)。
また対象タンパク質やその複合体について、水素−重水素交換法による断片化スペクトルの測定を行う(ステップSA−5)。
ここで、図7は、本実施形態における水素−重水素交換法により断片化スペクトルを測定する場合の一例を示すフローチャートである。
まず、対象タンパク質を緩衝液に溶解または重水素置換する(ステップSD−1)。
そして、経時的にサンプリングを行いながら、緩衝液を酸性にして温度を下げ、H/D交換反応速度を下げる(ステップSD−2)。
そして、酸性条件下で対象タンパク質をペプシン消化する(ステップSD−3)。
そして、ペプチド消化物を抽出し(ステップSD−4)、MALDI−TOF−MS、または、LC/MS/MSを行う(ステップSD−5)。
また図8は、本実施形態における水素−重水素交換法によりタンパク質をそのままMSで断片化し断片化スペクトルを測定する場合の一例を示すフローチャートである。
まず、対象タンパク質を緩衝液に溶解または重水素置換する(ステップSE−1)。
そして、ESI−MSで断片化スペクトルの測定を行う(ステップSE−2)。
そして、経時的にサンプリングを行いながら、断片化スペクトルを取り込み保存する(ステップSE−3)。
また、図9は、本実施形態における水素−重水素交換法によりタンパク質の複合体を断片化し断片化スペクトルを測定する場合の一例を示すフローチャートである。
まず、タンパク質の複合体を緩衝液に溶解または重水素置換する(ステップSF−1)。
そして、経時的にサンプリングを行いながら、緩衝液を酸性にして温度を下げ、H/D交換反応速度を下げる(ステップSF−2)。
そして、酸性条件下で対象タンパク質をペプシン消化する(ステップSF−3)。
そして、ペプチド消化物を抽出し(ステップSF−4)、MALDI−TOF−MS、または、LC/MS/MSを行う(ステップSF−5)。
また、図10は、本実施形態における水素−重水素交換法によりタンパク質AとBの複合体を断片化し断片化スペクトルを測定する場合の一例を示すフローチャートである。
まず、タンパク質AとBを別々に緩衝液に溶解または重水素置換し、一定時間(t1)放置する(ステップSG−1)。
そして、タンパク質AとBを混合し複合体を形成して一定時間(t2)放置する(ステップSG−2)。
そして、軽水緩衝液に置換、または、希釈する(ステップSG−3)。
そして、一定時間(T=t1+t2)放置し、H/Dの逆交換反応(オフチェンジ)を行う(ステップSG−4)。
そして、ESI−MSで断片化スペクトルの測定を行う(ステップSG−5)。
再び、図3に戻り、タンパク質構造解析装置100は、断片化スペクトルデータ取得部102aの処理により、質量分析装置400から入力装置112またはネットワーク300を経由して断片化スペクトルデータを取得し、断片化スペクトルデータファイル106aに格納する(ステップSA−6)。
ついで、タンパク質構造解析装置100は、帰属情報決定部102bの処理により、測定された断片化スペクトルに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定し、また、重水素化速度決定部102jの処理により、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列中の各アミノ酸残基における重水素化速度を決定する。
ここで、重水素化速度は、以下により求める。まず、帰属情報決定部102bがペプチドの帰属情報を決定すると、重水素化速度決定部102jは、各アミノ酸残基について、質量増加分を交換性プロトン数で割ることにより重水素化率を求める。そして、重水素化速度決定部102jは、重水素化率に基づいて、各ペプチド配列のアミノ酸残基の重水化速度を決定する。
そして、溶媒接触残基情報決定部102dは、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定し(ステップSA−7)、溶媒接触残基情報/相互作用界面情報ファイル106cに格納する(ステップSA−8)。溶媒接触残基情報は、例えば、水素−重水素交換していないコントロール実験と比較して重水素化速度が遅くなっている部位を溶媒接触残基情報として決定してもよい。
また、相互作用界面情報決定部102eは、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列における相互作用界面情報を決定し(ステップSA−7)、溶媒接触残基情報/相互作用界面情報ファイル106cに格納する(ステップSA−8)。相互作用界面情報は、例えば、複合体を形成していない単独時に測定した場合と比較して、重水素化速度が遅くなっている部位を相互作用界面情報として決定してもよい。また、水素−重水素交換していないコントロール実験と比較して重水素化速度が遅くなっている部位を相互作用界面情報として決定してもよい。
また、タンパク質構造解析装置100は、立体構造予測処理部102fの処理により、対象タンパク質について立体構造を予測し(ステップSA−9)、予測した立体構造予測データを立体構造予測データファイル106dに格納する(ステップSA−10)。
そして、タンパク質構造解析装置100は、このようにして決定した切断容易領域情報、溶媒接触残基情報および相互作用界面情報を、予測データとともに出力したり、予測構造評価情報を決定したりする際に利用する。
すなわち、処理結果出力部102hは、予測された立体構造予測データと決定された切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを対応させて出力する(ステップSA−11)。
また、予測構造評価情報決定部102gは、予測された立体構造予測データと、決定された切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを比較して(ステップSA−12)、切断容易領域情報により特定された切断容易領域や溶媒接触残基情報により特定された溶媒接触残基や相互作用界面情報により特定された相互作用界面に対応する予測構造部分について評価を行い予測構造評価情報を決定する(ステップSA−13)。
また、予測構造評価情報出力部102iは、決定された予測構造評価情報を出力する(ステップSA−14)。これにて、メイン処理が終了する。
[実施例1]
次に、本発明の実施例1の詳細について図13等を参照して説明する。図13は、本発明における本システムの実施例1の一例を示すフローチャートである。
まず、対象タンパク質(または複合体)について質量分析装置400により断片化スペクトルの測定を行う(ステップSJ−1)。また、対象タンパク質(または複合体)について水素−重水素交換反応を行いながら、断片化スペクトルの測定を行ってもよい。そして、タンパク質構造解析装置100は、断片化スペクトルデータ取得部102aの処理により、質量分析装置400から入力装置112またはネットワーク300を経由して断片化スペクトルデータを取得し、断片化スペクトルデータファイル106aに格納する。
ついで、タンパク質構造解析装置100は、帰属情報決定部102bの処理により、測定された断片化スペクトルに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定し(ステップSJ−2)、また、タンパク質構造解析装置100は、切断容易領域情報決定部102cの処理により、決定された断片化イオンの帰属情報により、対象タンパク質のアミノ酸配列において断片化イオンに断片化された箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における切断容易領域情報を決定する。
また、水素−重水素交換反応を行っている場合には、タンパク質構造解析装置100は、重水素化速度決定部102jの処理により、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列中の各アミノ酸残基における重水素化速度を決定する。そして、溶媒接触残基情報決定部102dは、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定し、溶媒接触残基情報/相互作用界面情報ファイル106cに格納する。また、相互作用界面情報決定部102eは、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列における相互作用界面情報を決定し、溶媒接触残基情報/相互作用界面情報ファイル106cに格納する。
また、タンパク質構造解析装置100は、立体構造予測処理部102fの処理により、対象タンパク質についてPDBなどのタンパク質データベースを用いて相同性検索を行い、雛型の立体構造となる構造既知のタンパク質を抽出する(ステップSJ−3)。
そして、立体構造予測処理部102fは、3D−1D法などの手法により、対象タンパク質と雛型の構造既知タンパク質とのアライメントを実行し(ステップSJ−4)、対象タンパク質の立体構造モデルのデータである立体構造予測データを作成し、立体構造予測データファイル106dに格納する(ステップSJ−5)。
そして、処理結果出力部102hは、予測された立体構造予測データと決定された切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを対応させて出力する(ステップSJ−6)。
また、予測構造評価情報決定部102gは、予測された立体構造予測データと、決定された切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを比較して、切断容易領域情報により特定された切断容易領域や溶媒接触残基情報により特定された溶媒接触残基や相互作用界面情報により特定された相互作用界面に対応する予測構造部分について評価を行い予測構造評価情報を決定する。また、予測構造評価情報出力部102iは、決定された予測構造評価情報を出力する(ステップSJ−7)。これにて、実施例1の処理が終了する。
[実施例2]
次に、本発明の実施例2の詳細について図14等を参照して説明する。図14は、本発明における本システムの実施例2の一例を示すフローチャートである。
まず、対象タンパク質(または複合体)について質量分析装置400により断片化スペクトルの測定を行う(ステップSK−1)。また、対象タンパク質(または複合体)について水素−重水素交換反応を行いながら、断片化スペクトルの測定を行ってもよい。そして、タンパク質構造解析装置100は、断片化スペクトルデータ取得部102aの処理により、質量分析装置400から入力装置112またはネットワーク300を経由して断片化スペクトルデータを取得し、断片化スペクトルデータファイル106aに格納する。
ついで、タンパク質構造解析装置100は、帰属情報決定部102bの処理により、測定された断片化スペクトルに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定し(ステップSK−2)、また、タンパク質構造解析装置100は、切断容易領域情報決定部102cの処理により、決定された断片化イオンの帰属情報により、対象タンパク質のアミノ酸配列において断片化イオンに断片化された箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における切断容易領域情報を決定する。
また、水素−重水素交換反応を行っている場合には、タンパク質構造解析装置100は、重水素化速度決定部102jの処理により、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列中の各アミノ酸残基における重水素化速度を決定する。そして、溶媒接触残基情報決定部102dは、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定し、溶媒接触残基情報/相互作用界面情報ファイル106cに格納する。また、相互作用界面情報決定部102eは、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列における相互作用界面情報を決定し、溶媒接触残基情報/相互作用界面情報ファイル106cに格納する。
また、タンパク質構造解析装置100は、立体構造予測処理部102fの処理により、対象タンパク質についてPDBなどのタンパク質データベースを用いて相同性検索を行い、雛型の立体構造となる構造既知のタンパク質を抽出する(ステップSK−3)。
ここで、雛形のタンパク質を抽出できなかった場合には、立体構造予測処理部102fは、分子シミュレーション法などの手法により、対象タンパク質の立体構造モデルのデータである立体構造予測データを作成し、立体構造予測データファイル106dに格納する(ステップSK−4)。
そして、処理結果出力部102hは、予測された立体構造予測データと決定された切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを対応させて出力する(ステップSK−5)。
また、予測構造評価情報決定部102gは、予測された立体構造予測データと、決定された切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを比較して、切断容易領域情報により特定された切断容易領域や溶媒接触残基情報により特定された溶媒接触残基や相互作用界面情報により特定された相互作用界面に対応する予測構造部分について評価を行い予測構造評価情報を決定する。また、予測構造評価情報出力部102iは、決定された予測構造評価情報を出力する(ステップSK−6)。これにて、実施例2の処理が終了する。
[実施例3]
次に、本発明の実施例3の詳細について図15等を参照して説明する。図15は、本発明における本システムの実施例3の一例を示すフローチャートである。
まず、対象タンパク質(または複合体)について質量分析装置400により断片化スペクトルの測定を行う(ステップSL−1)。また、対象タンパク質(または複合体)について水素−重水素交換反応を行いながら、断片化スペクトルの測定を行ってもよい。そして、タンパク質構造解析装置100は、断片化スペクトルデータ取得部102aの処理により、質量分析装置400から入力装置112またはネットワーク300を経由して断片化スペクトルデータを取得し、断片化スペクトルデータファイル106aに格納する。
ついで、タンパク質構造解析装置100は、帰属情報決定部102bの処理により、測定された断片化スペクトルに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定し(ステップSL−2)、また、タンパク質構造解析装置100は、切断容易領域情報決定部102cの処理により、決定された断片化イオンの帰属情報により、対象タンパク質のアミノ酸配列において断片化イオンに断片化された箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における切断容易領域情報を決定する。
また、水素−重水素交換反応を行っている場合には、タンパク質構造解析装置100は、重水素化速度決定部102jの処理により、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列中の各アミノ酸残基における重水素化速度を決定する。そして、溶媒接触残基情報決定部102dは、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定し、溶媒接触残基情報/相互作用界面情報ファイル106cに格納する。また、相互作用界面情報決定部102eは、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質のアミノ酸配列における相互作用界面情報を決定し、溶媒接触残基情報/相互作用界面情報ファイル106cに格納する。
また、タンパク質構造解析装置100は、立体構造予測処理部102fの処理により、対象タンパク質についてPDBなどのタンパク質データベースを用いて相同性検索を行い、雛型の立体構造となる構造既知のタンパク質の候補タンパク質を抽出する(ステップSL−3)。
そして、立体構造予測処理部102fは、3D−1D法などの手法により、対象タンパク質と候補タンパク質とのアライメントを実行する(ステップSL−4)。
そして、処理結果出力部102hは、候補タンパク質のアミノ酸配列や構造データと、決定された切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを対応させて出力する(ステップSL−5)。
また、予測構造評価情報決定部102gは、候補タンパク質の構造データと、決定された切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを比較して、切断容易領域情報により特定された切断容易領域や溶媒接触残基情報により特定された溶媒接触残基や相互作用界面情報により特定された相互作用界面に対応する予測構造部分について評価を行い予測構造評価情報を決定する。また予測構造評価情報出力部102iは、決定された予測構造評価情報を出力する。これにより、各候補タンパク質の構造データと対象タンパク質の実験データとの一致性を順位付けることができ、さらに最も評価の高い候補タンパク質を絞り込むことができる(ステップSL−6)。
ついで、立体構造予測処理部102fは、最も評価の高い候補タンパク質を雛型のタンパク質として対象タンパク質の立体構造モデルのデータである立体構造予測データを作成し、立体構造予測データファイル106dに格納する(ステップSL−7)。
そして、実施例1のステップSJ−6およびステップSJ−7と同様の方法により、モデル構造の評価などを行う(ステップSL−8)。これにて、実施例3の処理が終了する。
[実施例4]
次に、本発明の実施例4の詳細について図16等を参照して説明する。図16は、本発明における本システムの実施例4の一例を示すフローチャートである。
まず、タンパク質構造解析装置100は、立体構造予測処理部102fの処理により、対象タンパク質についてPDBなどのタンパク質データベースを用いて相同性検索を行い、雛型の立体構造となる構造既知のタンパク質を抽出する(ステップSM−1)。
ここで、雛形のタンパク質を抽出できなかった場合には、立体構造予測処理部102fは、分子シミュレーション法などの手法により、対象タンパク質の立体構造モデルのデータである立体構造予測データを作成し、立体構造予測データファイル106dに格納する(ステップSM−2〜ステップSM−3)。
そして、対象タンパク質(または複合体)および雛型タンパク質について質量分析装置400により断片化スペクトルの測定を行う(ステップSM−1およびステップSM−4)。また、対象タンパク質(または複合体)および雛型タンパク質について水素−重水素交換反応を行いながら、断片化スペクトルの測定を行ってもよい。そして、タンパク質構造解析装置100は、断片化スペクトルデータ取得部102aの処理により、質量分析装置400から入力装置112またはネットワーク300を経由して断片化スペクトルデータを取得し、断片化スペクトルデータファイル106aに格納する。
ついで、タンパク質構造解析装置100は、帰属情報決定部102bの処理により、測定された断片化スペクトルに基づいて、対象タンパク質および雛型タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定し(ステップSM−2)、またタンパク質構造解析装置100は、切断容易領域情報決定部102cの処理により、決定された断片化イオンの帰属情報により、対象タンパク質および雛型タンパク質のアミノ酸配列において断片化イオンに断片化された箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における切断容易領域情報を決定する。
また、水素−重水素交換反応を行っている場合には、タンパク質構造解析装置100は、重水素化速度決定部102jの処理により、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質および雛型タンパク質のアミノ酸配列中の各アミノ酸残基における重水素化速度を決定する。そして、溶媒接触残基情報決定部102dは、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質および雛型タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定し、溶媒接触残基情報/相互作用界面情報ファイル106cに格納する。また、相互作用界面情報決定部102eは、決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、対象タンパク質および雛型タンパク質のアミノ酸配列における相互作用界面情報を決定し、溶媒接触残基情報/相互作用界面情報ファイル106cに格納する。
そして、処理結果出力部102hは、対象タンパク質および雛型タンパク質の予測された立体構造予測データと決定された切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを対応させて出力する(ステップSM−5)。
また、予測構造評価情報決定部102gは、予測された立体構造予測データと、決定された切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを比較して、切断容易領域情報により特定された切断容易領域や溶媒接触残基情報により特定された溶媒接触残基や相互作用界面情報により特定された相互作用界面に対応する予測構造部分について評価を行い予測構造評価情報を決定する。また、予測構造評価情報出力部102iは、決定された予測構造評価情報を出力する(ステップSM−6)。これにて、実施例4の処理が終了する。
なお、実施例4においては、ステップSM−2における相同性検索において雛型タンパク質が抽出できない場合を一例に説明したが、相同性検索において雛型タンパク質が抽出できた場合には、その雛型タンパク質についてステップSM−4において実験値が収集される。
[実施例5]
次に、本発明の実施例5の詳細について図11および図18等を参照して説明する。
(1)リコンビナント・ヒトインターロイキン−6(IL−6)の調製
IL−6は文献の方法により、大腸菌を用いて発現、精製を行った(D.Ejima,Biotechnol.Bioeng.,62,301−10(1999)参照)。
(2)IL−6のFTICR−MS測定
すべての測定は、gas assisted dynamic trapping(GADT)法で行った。GADT法は、イオンを測定セル内に捕捉する際に、一時的にトラップ電圧を高くしてかつイオンの運動エネルギーを低下させるためにアルゴンガスをトラップガスとしてパルスでセル内に導入する方法である。これにより効率よくイオンをセル内に捕捉することが可能となり、感度が向上する。
測定機器及び分析条件等は下記の通りである。
・質量分析計:7T セルフシールド超伝導マグネットフーリエ変換型質量分析計Apex II(ブルカー・ダルトニクス社製);
・流速:60μl/h;
・乾燥ガス(Dring gas):20psi、150℃;
・Nebulizing gas:30psi;
・アルゴンガス圧:7.8Toor;
・ヘキサポール内蓄積時間:1秒;
・キャピラリー出口電圧:106.5kV(MSスペクトル)、150kV(IRMPD)、220kV(ヘキサポールCID);及び
・データ取り込みポイント数:512K。
(3)IRMPD法及びヘキサポールCID法によるIL−6の断片化
IRMPD法は、イオンサイクロトロンセル内に閉じ込めたイオンに対して、300ミリ秒間炭酸ガスレーザーを照射した。また、ヘキサポールCID法は、通常の測定と同じパルスシークエンスを用いて、キャピラリー出口電圧を上げることとヘキサポール内蓄積時間を1−3秒にすることで断片化を誘起することができた。FTICR−MSスペクトルは全て、装置に付属のソフトウエアであるXmassを用いて解析を行った。断片化イオンの帰属は、ソフトウエアFrag−Pro(msmssoft社製)を用いた。
(4)3D−1D法及びPSI−BLASTによるホモロジー検索
ヒトインターロイキン−6(IL6)のアミノ酸配列は、PIR(タンパク質アミノ酸配列データベース)より取得した。プレ配列を含むアミノ酸残基数は212残基であった。LIBRAを用いて3D−1D法によるホモロジー検索を行った結果、上位30件のPDBファイルリストとして、1alu,1lki,1au1_A,1nf1_A,1qkm_A,1jnk,1pme,1dg9_A,1b5l,1bgc,1yrg_A,1euv_A,2tps_B,1bg0,1ial_A,2cnd,1cjs_A,1wer,7odc_A,1eqf_A,1f6f_A,1dxy,1edt,1gse_A,1qr2_A,1llp,1qi7_A,2bid_A,2ljr_A,1c3j_Aを得た
また、PSI−BLASTを用いて、e値が0.01以下の条件によるホモロジー検索を行った結果、PDBファイルリストとして、1IL6,1ALU,1GNC,1BGE_B,1BGC,1RHG_C,1I1R_Bを得た。この場合、上位6件はIL6自身またはIL6と立体構造の類似性が既に指摘されているタンパク質であるGCSF(Granulocyte Colony Stimulating Factor)であるため、いずれの参照タンパク質についても立体構造予測の候補になり得ることが確認できた。
(5)アライメントに対する2次構造情報とMSの断片化データの照会
そこで、LIBRAによるホモロジー検索によって得られた30種類の各アライメントに対して、参照タンパク質の2次構造情報とMSの断片化データを同時に照会するプログラムを作成し、結果をアライメントごとに表示した。図18は、実施例5における処理結果の一例を示す図である(本図においてAの後にBが結合する)。この図に示すように処理結果の表示画面は、例えば、対象タンパク質のアミノ酸配列を表示するための表示領域MB−1、雛型タンパク質のアミノ酸配列を表示するための表示領域MB−2、立体構造予測データの一例である二次立体構造予測データを表示するための表示領域MB−3、および、実験データの断片化イオンのフラグメントを表示するための表示領域MB−4を含んで構成されている。図18において、MB−3における2次構造の表示は、「1」はαヘリックス、「2」はβストランド、「4」はループ領域を示している。
(6)候補タンパク質の評価
2次構造情報と全ての断片化データの情報からアライメントごとに、候補タンパク質の評価(ランク付け)を行うプログラムを作成し、これを検証した結果、IL6の立体構造予測に対して最も有効な候補タンパク質はIL6自身(1alu)であること、次いで有効な候補タンパク質は、IL6と立体構造の類似性が既に指摘されているタンパク質であるGCSF(1bgc)であることが確認できた。
ここで、図11は、本実施例において断片化スペクトルを解析する場合の一例を示すフローチャートである。
まず、帰属情報決定部102bは、断片化スペクトルデータファイル106aに格納された断片化スペクトルを参照して、断片化スペクトルにおける各イオンのm/zや、価数の情報(分解能が低い場合、価数はわからない場合もある)を取得する(ステップSH−1)。
そして、帰属情報決定部102bは、各断片化イオンのアミノ酸配列への帰属を求め、各イオンのm/z(+価数)に基づいて、候補ペプチド断片を検索・抽出・表示する(ステップSH−2)。
そして、切断容易領域情報決定部102cは、切断が容易な部位を抽出して切断容易領域情報として切断容易領域情報ファイル106bに格納する(ステップSH−3)。
そして、処理結果出力部102hは、上述した図12に示すように、立体構造表示ソフトを用いて切断容易領域情報に基づいて切断部位の色を変えるように制御して表示する(ステップSH−4)。これにて、実施例5の処理が終了する。
[実施例6]
次に、本発明の実施例6の詳細について図26等を参照して説明する。
(1)ユビキチンのFTICR−MSによる断片化スペクトルの測定と帰属
ウシ由来ユビキチン(シグマ社製コードNo.U6253)を5pmol/μLになるように1%酢酸−50%メタノール水溶液に溶解したサンプルを使用した。全ての測定は、GADT法で行った
測定機器及び分析条件等は下記の通りである。
・質量分析計:ナノエレクトロスプレーイオン源を装着した7T セルフシールド超伝導マグネットフーリエ変換型質量分析計 Apex II(ブルカー・ダルトニクス社製);
・流速:200nl/min;
・乾燥ガス:5psi、200℃;
・ヘキサポール内蓄積時間:0.6秒;
・キャピラリー電圧:1800V;
・キャピラリー出口電圧:90V;及び
・データ取り込みポイント数:512K。
本実施例において、高いキャピラリー出口電圧によるノイズスキマーCID法を用いて、ユビキチンの断片化を誘起することができた。FTICR−MSスペクトルの解析と断片化イオンの帰属は、実施例5と同じ方法で行った。アミノ酸配列はPIRより取得した。
(2)立体構造とMS断片化データの照会
ユビキチンは既に立体構造が明らかとなっている。PDB(タンパク質立体構造データバンク)より、ユビキチンの構造ファイル(PDBファイル;1UBI.pdb)を取得し、立体構造表示ソフト「ViewerLite(製品名)」(Accelrys(会社名)製)を用いて、図26に示すようにユビキチンの立体構造をリボンモデルで表示した。図26は、本発明における本システムの実施例6におけるウシ由来ユビキチンの立体構造の一例を示す図である。図26において、αヘリックスを赤、βストランドを水色で表示し、更にMSで得られた断片化部位を黄色で表示した。その結果、αヘリックスの末端やβストランドの断片化が生じ易く、2次構造を有するαヘリックス内部やβストランド内部では生じにくい傾向にあることがわかった。これにて、実施例6の説明が終了する。
[実施例7]
次に、本発明の実施例7の詳細について図27等を参照して説明する。
(1)アルコール脱水素酵素のFTICR−MSによる断片化スペクトルの測定と帰属
酵母由来アルコール脱水素酵素(シグマ社製コードNo.)を5pmol/μLになるように1%酢酸−50%メタノール水溶液に溶解したサンプルを使用した。全ての測定は、GADT法で行った
測定機器及び分析条件等は下記の通りである。
・質量分析計:ナノエレクトロスプレーイオン源を装着した7T セルフシールド超伝導マグネットフーリエ変換型質量分析計 Apex II(ブルカー・ダルトニクス社製);
・流速:200nl/min;
・乾燥ガス:5psi、200℃;
・ヘキサポール内蓄積時間:1秒;
・キャピラリー電圧:1750V;
・キャピラリー出口電圧:170V;及び
・データ取り込みポイント数:512K。
本実施例において、キャピラリー出口の電圧を上げることによるヘキサポールCID法を用いて、アルコール脱水素酵素の断片化を誘起することができた。FTICR−MSスペクトルの解析と断片化イオンの帰属は、実施例5と同じ方法で行った。アミノ酸配列はPIRより取得した
(2)アルコール脱水素酵素のモデリングとMS断片化データの照会
全自動タンパク質モデリングソフトFAMSを用いて、アルコール脱水素酵素の立体構造モデルを作成した。立体構造表示ソフト「ViewerLite(製品名)」(Accelrys(会社名)製)を用いて、図27に示すようにアルコール脱水素酵素の立体構造をリボンモデルで表示した。図27は、本発明における本システムの実施例7における酵母由来アルコール脱水素酵素の立体構造の一例を示す図である。図27において、αヘリックスを赤、βストランドを水色で表示し、更にMSで得られた断片化部位を黄色で表示した。その結果、モデル構造上、αヘリックスやβストランドの末端に断片化部位が多く、αヘリックス内部やβストランド内部で少ない傾向にあることが視覚的に容易にわかり、モデル構造が実験データとよく一致した。これにて、実施例7の説明が終了する。
[実施例8;実験結果により興味の対象となったタンパク質の立体構造表示]
次に、本発明の実施例8の詳細について図21〜図25等を参照して説明する。
図21は、本発明における本システムの実施例8の一例を示すフローチャートである。
本実施例は、図21に示すように、DNAマイクロアレイ等によるmRNA発現プロファイリング等の発現解析結果や、プロテオーム解析で得られたMSによる同定結果(例えば、Mascot、SEQUEST等)や、比較ゲノム解析の結果や、タンパク質相互作用解析(例えば、酵母2ハイブリッド(yeast two−hybrid)法やTAP法(Anuj Kumer,,Nature、415,123−124(2002)))の結果や、例えばKEGG等の代謝パスウエイマップやシグナル伝達マップ上で興味深い遺伝子のアクセッション番号等の識別番号を指定(例えば、画面上でクリック等)することにより、立体構造データベース(例えば、PDB等)やモデル構造データベース(例えば、FAMSBase等)から立体構造データを検索・抽出し、立体構造表示プログラム(例えば、RasMol等)を用いて表示する。
以下に、Anabaena sp.PCC7120株のゲノムについて、転写量の増減と立体構造との相関を表す場合を一例に説明する。本実施例は、DNAマイクロアレイによるmRNA転写の量転写量をマッピングしたデータと立体構造データベースとをリンクさせることにより、転写量の増減と立体構造との相関を明確化することを目的とする表示プログラムである。
図22は、DNAマイクロアレイによる発現量の違いを色別に表示した表示画面の一例を示す図である。本画面中の小さなマスは、遺伝子一つ一つを示し、「赤」、「青」、「緑」は転写量の「増」、「減」、「不変」をそれぞれ表し、色の「濃」、「淡」は立体構造データベース(例えば、PDB等)との配列的な相同性の「有」、「無」を表す。
ここで、利用者が興味深い遺伝子に対応するマスの一つをクリックすると、図23に示すように、SCOP(Stuructural Classification of Proteins)の分類番号と、鋳型のPDB等のID(識別番号)が示され、さらに、ホモロジーの高いPDBデータ(本図の例では上位五位)を示すクリックボタン(図23においてアンダーライン表示された部分)が表示される。
利用者がクリックボタンをクリックすると、図24に示すようなアライメントの表示画面や図25に示すようなRasMol等のグラフィックソフトウェアによる立体構造の表示画面を表示することができる。
本実施例によると、DNAマイクロアレイ等によるトランスクリプトーム解析や、プロテオーム解析(MSによるタンパク同定結果など)や、ゲノム解析(バイオインフォマティクス)等によりディスプレイ上に表示された注目すべき遺伝子・蛋白質の識別番号(アクセッション番号等)をクリックすると、立体構造および構造予測データベースから、その立体構造を引き出して3D表示をすることができるようになる。これにて、実施例8の処理が終了する。
[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
例えば、タンパク質構造解析装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、タンパク質構造解析装置100とは別筐体で構成されるクライアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するように構成してもよい。
また、上述した実施例においては、溶媒接触残基や相互作用部位界面情報等を水素−重水素交換法を用いて得る場合を一例に説明したが、本発明はこのような場合に限定されるものではなく、例えば、化学修飾法などを用いて得てもよい。例えば、トランスグルタミナーゼを用いてタンパク質のグルタミン残基に安定同位体15Nを選択的に導入することができる(N.Shimba,N.Yamada,K.Yokoyama,E.Suzuki,Anal.Biochem.,301,123−127(2002))。この方法を上述した実施の形態と組み合わせることにより、グルタミン残基ごとの溶媒接触度の違いをラベル化率から求めることができるので、溶媒接触残基や相互作用部位界面情報等を水素−重水素交換法を用いる場合と同様に得ることができるようになる。
また、上述した実施例においては、MSにより断片化を行う場合を一例に説明したが、本発明はこのような場合に限定されるものではなく、例えば、酵素消化法などを用いて得てもよい。すなわち、ペプシンやトリプシンなどの消化酵素などを用いた酵素反応によりタンパク質を断片化してもよい。
また、立体構造予測処理部102fは、タンパク質構造解析装置100に備える予測プログラムを用いて予測してもよく、また外部システム200に備える予測プログラムを用いて立体構造予測データを作成し、その立体構造予測データをネットワーク300経由で取得してもよい。
また、実施形態において説明した各処理のうち、自動的に行なわれるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行なわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
また、タンパク質構造解析装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
例えば、タンパク質構造解析装置100の各部または各装置が備える処理機能、特に制御部102にて行なわれる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現することができ、あるいは、ワイヤードロジックによるハードウェアとして実現することも可能である。なお、プログラムは、後述する記録媒体に記録されており、必要に応じてタンパク質構造解析装置100に機械的に読み取られる。
すなわち、ROMまたはHDなどの記憶部106などには、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAM等にロードされることによって実行され、CPUと協働して制御部102を構成する。またこのコンピュータプログラムは、タンパク質構造解析装置100に対して任意のネットワーク300を介して接続されたアプリケーションプログラムサーバに記録されてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
また、本発明にかかるプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD等の任意の「可搬用の物理媒体」や、各種コンピュータシステムに内蔵されるROM、RAM、HD等の任意の「固定用の物理媒体」、あるいはLAN、WAN、インターネットに代表されるネットワークを介してプログラムを送信する場合の通信回線や搬送波のように、短期にプログラムを保持する「通信媒体」を含むものとする。
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
記憶部106に格納される各種のデータベース等(断片化スペクトルデータファイル106a〜処理結果データファイル106f)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
また、タンパク質構造解析装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理端末等の情報処理装置にプリンタやモニタやイメージスキャナ等の周辺装置を接続し、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
さらに、タンパク質構造解析装置100の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷等に応じた任意の単位で、機能的または物理的に分散・統合して構成することができる。例えば、各データベースを独立したデータベース装置として独立に構成してもよく、また、処理の一部をCGI(Common Gateway Interface)を用いて実現してもよい。また、例えば、タンパク質構造解析装置100は、質量分析装置400と一体として構成してもよい。
また、ネットワーク300は、タンパク質構造解析装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネットや、イントラネットや、LAN(有線/無線の双方を含む)や、VANや、パソコン通信網や、公衆電話網(アナログ/デジタルの双方を含む)や、専用回線網(アナログ/デジタルの双方を含む)や、CATV網や、IMT2000方式、GSM方式またはPDC/PDC−P方式等の携帯回線交換網/携帯パケット交換網や、無線呼出網や、Bluetooth等の局所無線網や、PHS網や、CS、BSまたはISDB等の衛星通信網等のうちいずれかを含んでもよい。すなわち、本システムは、有線・無線を問わず任意のネットワークを介して、各種データを送受信することができる。
以上詳細に説明したように、本発明によれば、立体構造を予測する対象タンパク質についてエレクトロスプレーイオン化法などによりイオン化したイオンをヘキサポールCID法などにより断片化イオンに断片化し、断片化スペクトルを測定し、測定された断片化スペクトルに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定し、決定された断片化イオンの帰属情報により、対象タンパク質のアミノ酸配列において断片化イオンに断片化された箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における切断容易領域情報を決定し、対象タンパク質について立体構造を予測し、予測された立体構造予測データと決定された切断容易領域情報とを対応させて出力する(例えば、グラフィック表示、テーブルによる一覧表示など)ので、立体構造未知のタンパク質(これをコードする遺伝子を含む)の立体構造予測を行う場合、実測した立体構造情報を加味することにより、精度の高い予測を行うことができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または、空間充填モデルのうちいずれかのモデルによりグラフィック表示し、切断容易領域情報を対応する立体構造予測データの表示部分に関連付けて表示する(例えば、リンクを設定、モデル上に表示、モデル上に切断容易領域情報に対応する網掛けや斜線などの特定のパターン模様を表示など)ので、これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構造予測データの信頼性を直感的に判断することができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、グラフィック表示やテーブル表示を行う際に、切断容易領域情報に従って対応する上記立体構造予測データの表示部分を色分けして表示するので、これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構造予測データの信頼性を直感的に判断することができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、予測された立体構造予測データと、決定された切断容易領域情報とを比較して、切断容易領域情報により特定された切断容易領域に対応する予測構造部分について評価を行い予測構造評価情報を決定し、決定された予測構造評価情報を出力するので、計算機により予測された予測構造を生化学実験データに基づいて評価を行うことができるようになり、予測精度を著しく向上させることができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、これにより、ゲノム配列解析、DNAチップを用いた発現プロファイリング解析、プロテオーム解析などで見つかった興味深い遺伝子・タンパク質の機能解析を行う場合、立体構造を基準とした機能予測の精度が格段に向上するようになり、また、ゲノム配列解析においては、機能未知の遺伝子・タンパク質の立体構造を考慮した機能予測を行うことにより効率的に機能を推定することができるようになる。さらに、これにより、阻害剤などのドラッグデザインや蛋白質工学による活性向上や機能改変体のデザインを効率的に行うことができるようになる。
また、本発明によれば、対象タンパク質について基準振動計算を行い、基準振動計算結果(例えば、揺らぎの情報など)を対応する立体構造予測データの表示部分に関連付けて表示する(例えば、立体構造モデル上にベクトル表示を行う)ので、切断容易領域として揺らぎの情報を考慮することができるようになる。すなわち、基準振動計算結果により揺らぎ情報を求め、MS実測データと比較することにより予測モデルの評価を行うことができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、立体構造を予測する対象タンパク質についてヘキサポールCID法、ノズルスキマーCID法、キャピラリースキマーCID法、SORI−CID法、および、マルチポールストアー補助キャピラリースキマーCID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)法、表面誘起解離(SID)法、ECD法、およびBIRD法のうち少なくとも一つの方法により上記対象タンパク質について断片化イオンに断片化し上記断片化スペクトルを測定するので、対象タンパク質の立体構造を反映した断片化イオンを効率的に作成することができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、酵素反応により対象タンパク質について断片化を行い断片化スペクトルを測定するので、対象タンパク質の立体構造を反映した断片化を効率的に行うことができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、立体構造を予測する対象タンパク質について断片化し、断片化スペクトルを測定し、測定された断片化スペクトルに基づいて、対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定し、対象タンパク質について立体構造を予測し、予測された立体構造予測データと決定された溶媒接触残基情報とを対応させて出力する(例えば、グラフィック表示、テーブルによる一覧表示など)ので、立体構造未知のタンパク質(これをコードする遺伝子を含む)の立体構造予測を行う場合、実測した立体構造情報を加味することにより、精度の高い予測を行うことができるタンパク質構造解析方法。タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、予測された立体構造予測データと、決定された溶媒接触残基情報とを比較して、溶媒接触残基情報により特定された溶媒接触残基に対応する予測構造部分について評価を行い予測構造評価情報を決定し、決定された予測構造評価情報を出力するので、計算機により予測された予測構造を生化学実験データに基づいて評価を行うことができるようになり、予測精度を著しく向上させることができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、対象タンパク質について水素−重水素交換反応を行った後、断片化し断片化スペクトルを測定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列中の各アミノ酸残基における重水素化速度を決定し、当該重水素化速度に従って対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質の上記アミノ酸配列における溶媒接触残基情報を決定するので、効率的に溶媒接触情報を求めることができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、対象タンパク質について化学修飾を行った後、断片化し断片化スペクトルを測定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列中の各アミノ酸残基における化学修飾部分を決定し、当該化学修飾部分に従って対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し、当該箇所に従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定するので、効率的に溶媒接触情報を求めることができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および記録媒体を提供することができる。
また、本発明によれば、立体構造を予測する対象タンパク質と化合物(例えば、タンパク質や低分子化合物や核酸など)との複合体について断片化し、断片化スペクトルを測定し、測定された断片化スペクトルに基づいて、対象タンパク質および/または化合物に対する断片化イオンの帰属情報を決定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質および/または化合物に関する相互作用界面情報を決定し、対象タンパク質および/または化合物について立体構造を予測し、予測された立体構造予測データと、決定された相互作用界面情報とを対応させて出力する(例えば、グラフィック表示、テーブルによる一覧表示など)ので、立体構造未知のタンパク質(これをコードする遺伝子を含む)の立体構造予測を行う場合、実測した立体構造情報を加味することにより、精度の高い予測を行うことができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または、空間充填モデルのうちいずれかのモデルにより対象タンパク質および/または化合物についてグラフィック表示(例えば、ドッキングシミュレーションなども含む)し、相互作用界面情報を対応する立体構造予測データの表示部分に関連付けて表示する(例えば、リンクを設定、モデル上に表示、モデル上に相互作用界面情報に対応する網掛けや斜線などの特定のパターン模様を表示など)ので、これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構造予測データの信頼性を直感的に判断することができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、グラフィック表示やテーブル表示を行う際に、相互作用界面情報に従って対象タンパク質および/または化合物の対応する上記立体構造予測データの表示部分を色分けして表示するので、これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構造予測データの信頼性を直感的に判断することができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、予測された立体構造予測データと、決定された相互作用界面情報とを比較して、相互作用界面情報により特定された相互作用界面に対応する予測構造部分について評価を行い予測構造評価情報を決定し、決定された予測構造評価情報を出力するので、計算機により予測された予測構造を生化学実験データに基づいて評価を行うことができるようになり、予測精度を著しく向上させることができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、対象タンパク質と化合物との複合体について水素−重水素交換反応を行った後、断片化し上記断片化スペクトルを測定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質および/または化合物における重水素化速度を決定し、当該重水素化速度に従って対象タンパク質および/または化合物において相互作用界面を特定し、当該相互作用界面に従って対象タンパク質および/または化合物における相互作用界面情報を決定するので、効率的に相互作用界面情報を求めることができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
また、本発明によれば、対象タンパク質と化合物との複合体について化学修飾を行った後、断片化し断片化スペクトルを測定し、測定された断片化スペクトル、および、決定された断片化イオンの帰属情報に従って、対象タンパク質および/または化合物における化学修飾部分を決定し、当該化学修飾部分に従って対象タンパク質および/または化合物において相互作用界面を特定し、当該相互作用界面に従って対象タンパク質および/または化合物における相互作用界面情報を決定するので、効率的に相互作用界面情報を求めることができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
さらに、本発明によれば、酵素反応により対象タンパク質と化合物の複合体について断片化を行い断片化スペクトルを測定するので、対象タンパク質の立体構造を反映した断片化を効率的に行うことができるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体を提供することができる。
産業上の利用可能性
以上のように、本発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体は、計算手法により求めたタンパク質の立体構造データを生化学的な実験手法により求めたデータにより補完することができる。
これにより、本発明にかかるタンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体は、タンパク質の質量分析や立体構造などの解析を行うバイオインフォマティクス分野において極めて有用である。
本発明は、産業上多くの分野、特に医薬品、食品、化粧品、医療、遺伝子発現解析等の分野で広く実施することができ、極めて有用である。
【図面の簡単な説明】
第1図は、本発明の基本原理を示す原理構成図であり、第2図は、本発明が適用される本システムの構成の一例を示すブロック図であり、第3図は本実施形態における本システムのメイン処理の一例を示すフローチャートであり、第4図は、本実施形態におけるヘキサポールCID法により断片化スペクトルを測定する場合の一例を示すフローチャートであり、第5図は、本実施形態におけるIRMPD法により断片化スペクトルを測定する場合の一例を示すフローチャートであり、第6図は、ヒトのインターロイキン−6(IL−6)について断片化イオンの帰属情報を求め切断容易領域情報を決定する際の概念図であり、第7図は、本実施形態における水素−重水素交換法により断片化スペクトルを測定する場合の一例を示すフローチャートであり、第8図は、本実施形態における水素−重水素交換法によりタンパク質をそのままMSで断片化し断片化スペクトルを測定する場合の一例を示すフローチャートであり、第9図は、本実施形態における水素−重水素交換法によりタンパク質の複合体を断片化し断片化スペクトルを測定する場合の一例を示すフローチャートであり、第10図は、本実施形態における水素−重水素交換法によりタンパク質AとBの複合体を断片化し断片化スペクトルを測定する場合の一例を示すフローチャートであり、第11図は、本実施例において断片化スペクトルを解析する場合の一例を示すフローチャートであり、第12図は、ヒトのインターロイキン−6(IL−6)について、立体構造予測データをリボンモデルによりグラフィック表示し、切断容易領域情報に従って対応する上記立体構造予測データの表示部分を色分けして表示する場合の表示画面の一例を示す図であり、第13図は、本発明における本システムの実施例1の一例を示すフローチャートであり、第14図は、本発明における本システムの実施例2の一例を示すフローチャートであり、第15図は、本発明における本システムの実施例3の一例を示すフローチャートであり、第16図は、本発明における本システムの実施例4の一例を示すフローチャートであり、第17図は、処理結果についてテーブルによる一覧表示を行う場合の表示画面の一例を示す図であり、第18図は、実施例5における処理結果の一例を示す図であり、第19図は、ヒトのインターロイキン−6(IL−6)と、抗IL−6抗体との複合体(complex)について、水素−重水素交換反応を行い、エレクトロスプレーイオン化法により断片化イオンに断片化し、断片化スペクトルを測定する際の概念図であり、第20図は、水素−重水素交換反応を行ったヒトのIL−6の断片化スペクトルから重水素化速度を求める際の概念図であり、第21図は、本発明における本システムの実施例8の一例を示すフローチャートであり、第22図は、本発明における本システムの実施例8のDNAマイクロアレイによる発現量の違いを色別に表示した表示画面の一例を示す図であり、第23図は、本発明における本システムの実施例8の利用者が選択した遺伝子情報を表示する画面であり、第24図は、本発明における本システムの実施例8のアライメントの表示画面であり、第25図は、本発明における本システムの実施例8のグラフィックソフトウェアによる立体構造の表示画面であり、第26図は、本発明における本システムの実施例6におけるウシ由来ユビキチンの立体構造の一例を示す図であり、第27図は、本発明における本システムの実施例7における酵母由来アルコール脱水素酵素の立体構造の一例を示す図である。
Claims (21)
- 立体構造を予測する対象タンパク質について断片化して断片化スペクトルを測定する断片化スペクトル測定ステップと、
上記断片化スペクトル測定ステップにより測定された上記断片化スペクトルに基づいて、上記対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定する帰属情報決定ステップと、
上記帰属情報決定ステップにより決定された上記断片化イオンの上記帰属情報により、上記対象タンパク質の上記アミノ酸配列において上記断片化イオンに断片化された箇所を特定し、当該箇所に従って上記対象タンパク質の上記アミノ酸配列における切断容易領域情報を決定する切断容易領域情報決定ステップと、
上記対象タンパク質について立体構造を予測する立体構造予測ステップと、
上記立体構造予測ステップにより予測された立体構造予測データと、上記切断容易領域情報決定ステップにより決定された上記切断容易領域情報とを対応させて出力する処理結果出力ステップと、
を含むことを特徴とするタンパク質構造解析方法。 - 上記処理結果出力ステップは、
上記立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または、空間充填モデルのうちいずれかのモデルによりグラフィック表示し、上記切断容易領域情報を対応する上記立体構造予測データの表示部分に関連付けて表示すること、
を特徴とする請求の範囲第1項に記載のタンパク質構造解析方法。 - 上記処理結果出力ステップは、
上記切断容易領域情報に従って対応する上記立体構造予測データの表示部分を色分けして表示すること、
を特徴とする請求の範囲第1項または第2項に記載のタンパク質構造解析方法。 - 上記立体構造予測ステップにより予測された立体構造予測データと、上記切断容易領域情報決定ステップにより決定された上記切断容易領域情報とを比較して、上記切断容易領域情報により特定された切断容易領域に対応する予測構造部分について評価を行い予測構造評価情報を決定する予測構造評価情報決定ステップと、
上記予測構造評価情報決定ステップにより決定された予測構造評価情報を出力する予測構造評価情報出力ステップと、
をさらに含むことを特徴とする請求の範囲第1項から第3項のいずれか一つに記載のタンパク質構造解析方法。 - 上記対象タンパク質について基準振動計算を行う基準振動計算ステップ、
をさらに含み、
上記処理結果出力ステップは、
上記基準振動計算ステップによる計算結果を対応する上記立体構造予測データの表示部分に関連付けて表示すること、
を特徴とする請求の範囲第1項から第4項のいずれか一つに記載のタンパク質構造解析方法。 - 上記断片化スペクトル測定ステップは、
ヘキサポールCID法、ノズルスキマーCID法、キャピラリースキマーCID法、SORI−CID法、および、マルチポールストアー補助キャピラリースキマーCID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)法、表面誘起解離(SID)法、ECD法、および、BIRD法のうち少なくとも一つの方法により上記対象タンパク質について断片化イオンに断片化し上記断片化スペクトルを測定すること、
を特徴とする請求の範囲第1項から第5項のいずれか一つに記載のタンパク質構造解析方法。 - 上記断片化スペクトル測定ステップは、
酵素反応により上記対象タンパク質について断片化を行い上記断片化スペクトルを測定すること、
を特徴とする請求の範囲第1項から第6項のいずれか一つに記載のタンパク質構造解析方法。 - 立体構造を予測する対象タンパク質について断片化し、その断片化スペクトルを測定した質量分析装置から断片化スペクトルデータを取得する断片化スペクトルデータ取得手段と、
上記断片化スペクトルデータ取得手段により取得された上記断片化スペクトルデータに基づいて、上記対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定する帰属情報決定手段と、
上記帰属情報決定手段により決定された上記断片化イオンの上記帰属情報により、上記対象タンパク質の上記アミノ酸配列において上記断片化イオンに断片化された箇所を特定し、当該箇所に従って上記対象タンパク質の上記アミノ酸配列における切断容易領域情報を決定する切断容易領域情報決定手段と、
上記対象タンパク質について立体構造を予測する立体構造予測手段と、
上記立体構造予測手段により予測された立体構造予測データと、上記切断容易領域情報決定手段により決定された上記切断容易領域情報とを対応させて出力する処理結果出力手段と、
を備えたことを特徴とするタンパク質構造解析装置。 - 上記処理結果出力手段は、
上記立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または、空間充填モデルのうちいずれかのモデルによりグラフィック表示し、上記切断容易領域情報を対応する上記立体構造予測データの表示部分に関連付けて表示すること、
を特徴とする請求の範囲第8項に記載のタンパク質構造解析装置。 - 上記処理結果出力手段は、
上記切断容易領域情報に従って対応する上記立体構造予測データの表示部分を色分けして表示すること、
を特徴とする請求の範囲第8項または第9項に記載のタンパク質構造解析装置。 - 上記立体構造予測手段により予測された立体構造予測データと、上記切断容易領域情報決定手段により決定された上記切断容易領域情報とを比較して、上記切断容易領域情報により特定された切断容易領域に対応する予測構造部分について評価を行い予測構造評価情報を決定する予測構造評価情報決定手段と、
上記予測構造評価情報決定手段により決定された予測構造評価情報を出力する予測構造評価情報出力手段と、
をさらに備えたことを特徴とする請求の範囲第8項から第10項のいずれか一つに記載のタンパク質構造解析装置。 - 上記対象タンパク質について基準振動計算を行う基準振動計算手段、
をさらに備え、
上記処理結果出力手段は、
上記基準振動計算手段による計算結果を対応する上記立体構造予測データの表示部分に関連付けて表示すること、
を特徴とする請求の範囲第8項から第11項のいずれか一つに記載のタンパク質構造解析装置。 - 上記断片化スペクトルデータは、
ヘキサポールCID法、ノズルスキマーCID法、キャピラリースキマーCID法、SORI−CID法、および、マルチポールストアー補助キャピラリースキマーCID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)法、表面誘起解離(SID)法、ECD法、および、BIRD法のうち少なくとも一つの手法により上記対象タンパク質について断片化イオンに断片化することにより取得した上記断片化スペクトルに関するデータであること、
を特徴とする請求の範囲第8項から第12項のいずれか一つに記載のタンパク質構造解析装置。 - 上記断片化スペクトルデータは、
酵素反応により上記対象タンパク質について断片化を行うことにより取得した上記断片化スペクトルに関するデータであること、
を特徴とする請求の範囲第8項から第13項のいずれか一つに記載のタンパク質構造解析装置。 - 立体構造を予測する対象タンパク質について断片化し、その断片化スペクトルを測定した質量分析装置から断片化スペクトルデータを取得する断片化スペクトルデータ取得ステップと、
上記断片化スペクトルデータ取得ステップにより取得された上記断片化スペクトルデータに基づいて、上記対象タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定する帰属情報決定ステップと、
上記帰属情報決定ステップにより決定された上記断片化イオンの上記帰属情報により、上記対象タンパク質の上記アミノ酸配列において上記断片化イオンに断片化された箇所を特定し、当該箇所に従って上記対象タンパク質の上記アミノ酸配列における切断容易領域情報を決定する切断容易領域情報決定ステップと、
上記対象タンパク質について立体構造を予測する立体構造予測ステップと、
上記立体構造予測ステップにより予測された立体構造予測データと、上記切断容易領域情報決定ステップにより決定された上記切断容易領域情報とを対応させて出力する処理結果出力ステップと、
を含むタンパク質構造解析方法をコンピュータに実行させることを特徴とするプログラム。 - 上記処理結果出力ステップは、
上記立体構造予測データを針金モデル、リボンモデル、パイプモデル、ボールアンドスティックモデル、または、空間充填モデルのうちいずれかのモデルによりグラフィック表示し、上記切断容易領域情報を対応する上記立体構造予測データの表示部分に関連付けて表示すること、
を特徴とする請求の範囲第15項に記載のプログラム。 - 上記処理結果出力ステップは、
上記切断容易領域情報に従って対応する上記立体構造予測データの表示部分を色分けして表示すること、
を特徴とする請求の範囲第15項または第16項に記載のプログラム。 - 上記立体構造予測ステップにより予測された立体構造予測データと、上記切断容易領域情報決定ステップにより決定された上記切断容易領域情報とを比較して、上記切断容易領域情報により特定された切断容易領域に対応する予測構造部分について評価を行い予測構造評価情報を決定する予測構造評価情報決定ステップと、
上記予測構造評価情報決定ステップにより決定された予測構造評価情報を出力する予測構造評価情報出力ステップと、
をさらに含むことを特徴とする請求の範囲第15項から第17項のいずれか一つに記載のプログラム。 - 上記対象タンパク質について基準振動計算を行う基準振動計算ステップ、
をさらに含み、
上記処理結果出力ステップは、
上記基準振動計算ステップによる計算結果を対応する上記立体構造予測データの表示部分に関連付けて表示すること、
を特徴とする請求の範囲第15項から第18項のいずれか一つに記載のプログラム。 - 上記断片化スペクトルデータは、
ヘキサポールCID法、ノズルスキマーCID法、キャピラリースキマーCID法、SORI−CID法、および、マルチポールストアー補助キャピラリースキマーCID法を含む衝突活性化解離(CID)法、IRMPD法、インソース分解(ISD)法、ポストソース分解(PSD)法、表面誘起解離(SID)法、ECD法、および、BIRD法のうち少なくとも一つの手法により上記対象タンパク質について断片化イオンに断片化することにより取得した上記断片化スペクトルに関するデータであること、
を特徴とする請求の範囲第15項から第19項のいずれか一つに記載のプログラム。 - 上記断片化スペクトルデータは、
酵素反応により上記対象タンパク質について断片化を行うことにより取得した上記断片化スペクトルに関するデータであること、
を特徴とする請求の範囲第15項から第20項のいずれか一つに記載のプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002127399 | 2002-04-26 | ||
JP2002127399 | 2002-04-26 | ||
PCT/JP2003/005344 WO2003091720A1 (fr) | 2002-04-26 | 2003-04-25 | Technique d'analyse de la structure d'une proteine, analyseur de structure de proteine, programme et support d'enregistrement |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007273069A Division JP2008076406A (ja) | 2002-04-26 | 2007-10-19 | タンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2003091720A1 JPWO2003091720A1 (ja) | 2005-09-02 |
JP4055772B2 true JP4055772B2 (ja) | 2008-03-05 |
Family
ID=29267649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004501972A Expired - Fee Related JP4055772B2 (ja) | 2002-04-26 | 2003-04-25 | タンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20090319234A1 (ja) |
EP (1) | EP1500927A4 (ja) |
JP (1) | JP4055772B2 (ja) |
AU (1) | AU2003231525A1 (ja) |
WO (1) | WO2003091720A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5214607B2 (ja) * | 2006-08-25 | 2013-06-19 | サーモ フィニガン リミテッド ライアビリティ カンパニー | 質量分析計での解離型のデータ依存式選択 |
JP4819657B2 (ja) * | 2006-11-24 | 2011-11-24 | 大陽日酸株式会社 | Fabms測定の前処理方法 |
JP5164621B2 (ja) * | 2008-03-18 | 2013-03-21 | 株式会社日立ハイテクノロジーズ | 質量分析装置、質量分析方法および質量分析用プログラム |
GB201019337D0 (en) * | 2010-11-16 | 2010-12-29 | Micromass Ltd | Controlling hydrogen-deuterium exchange on a spectrum by spectrum basis |
TW202311746A (zh) | 2018-02-02 | 2023-03-16 | 美商再生元醫藥公司 | 用於表徵蛋白質二聚合之系統及方法 |
CN114927165B (zh) * | 2022-07-20 | 2022-12-02 | 深圳大学 | 泛素化位点的识别方法、装置、系统和存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6428956B1 (en) * | 1998-03-02 | 2002-08-06 | Isis Pharmaceuticals, Inc. | Mass spectrometric methods for biomolecular screening |
US7167819B1 (en) * | 1999-05-26 | 2007-01-23 | Chiron Corporation | Method of determining the three-dimensional shape of a macromolecule |
WO2000072004A2 (en) * | 1999-05-26 | 2000-11-30 | The Regents Of The University Of California | Method of determining the three-dimensional shape of a macromolecule |
JP2002372517A (ja) * | 2001-05-31 | 2002-12-26 | Inst Of Physical & Chemical Res | 質量分析法によるタンパク質の構造解析方法 |
-
2003
- 2003-04-25 WO PCT/JP2003/005344 patent/WO2003091720A1/ja active Application Filing
- 2003-04-25 JP JP2004501972A patent/JP4055772B2/ja not_active Expired - Fee Related
- 2003-04-25 AU AU2003231525A patent/AU2003231525A1/en not_active Abandoned
- 2003-04-25 EP EP03725679A patent/EP1500927A4/en not_active Withdrawn
-
2004
- 2004-10-26 US US10/973,096 patent/US20090319234A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP1500927A1 (en) | 2005-01-26 |
AU2003231525A1 (en) | 2003-11-10 |
WO2003091720A1 (fr) | 2003-11-06 |
EP1500927A4 (en) | 2008-03-05 |
JPWO2003091720A1 (ja) | 2005-09-02 |
US20090319234A1 (en) | 2009-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nesvizhskii | Protein identification by tandem mass spectrometry and sequence database searching | |
JP3195358B2 (ja) | 質量分析法によるヌクレオチド、アミノ酸又は炭水化物の同定 | |
Biron et al. | The pitfalls of proteomics experiments without the correct use of bioinformatics tools | |
Blueggel et al. | Bioinformatics in proteomics | |
US20100137151A1 (en) | Protein Expression Profile Database | |
US20060269945A1 (en) | Constellation mapping and uses thereof | |
US20030187587A1 (en) | Database | |
Becker et al. | Recent developments in quantitative proteomics | |
Krug et al. | Mass spectrometry at the interface of proteomics and genomics | |
WO2008008919A2 (en) | Methods and systems for sequence-based design of multiple reaction monitoring transitions and experiments | |
Na et al. | Computational methods in mass spectrometry-based structural proteomics for studying protein structure, dynamics, and interactions | |
Webb-Robertson et al. | Current trends in computational inference from mass spectrometry-based proteomics | |
JP4055772B2 (ja) | タンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体 | |
Cristoni et al. | Bioinformatics in mass spectrometry data analysis for proteomics studies | |
US20060003460A1 (en) | Method for comparing proteomes | |
Binz et al. | The molecular scanner: concept and developments | |
WO2006129401A1 (ja) | プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 | |
EP1820133B1 (en) | Method and system for identifying polypeptides | |
JP2008076406A (ja) | タンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体 | |
Ramachandran et al. | A frequency-based approach to predict the low-energy collision-induced dissociation fragmentation spectra | |
Wright et al. | Recent developments in proteome informatics for mass spectrometry analysis | |
Hubbard | Computational approaches to peptide identification via tandem MS | |
US7603240B2 (en) | Peptide identification | |
Beavis et al. | Finding protein sequences using PROWL | |
Wojtkiewicz et al. | Proteomic database search and analytical quantification for mass spectrometry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070417 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070821 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071203 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101221 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101221 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101221 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111221 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111221 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |