JP4054574B2 - 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体 - Google Patents

相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体 Download PDF

Info

Publication number
JP4054574B2
JP4054574B2 JP2001392802A JP2001392802A JP4054574B2 JP 4054574 B2 JP4054574 B2 JP 4054574B2 JP 2001392802 A JP2001392802 A JP 2001392802A JP 2001392802 A JP2001392802 A JP 2001392802A JP 4054574 B2 JP4054574 B2 JP 4054574B2
Authority
JP
Japan
Prior art keywords
secondary structure
structure prediction
prediction
program
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001392802A
Other languages
English (en)
Other versions
JP2003196576A (ja
Inventor
静司 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celestar Lexico Sciences Inc
Original Assignee
Celestar Lexico Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico Sciences Inc filed Critical Celestar Lexico Sciences Inc
Priority to JP2001392802A priority Critical patent/JP4054574B2/ja
Publication of JP2003196576A publication Critical patent/JP2003196576A/ja
Application granted granted Critical
Publication of JP4054574B2 publication Critical patent/JP4054574B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体に関し、特に、局所部位のフラストレーションに基づいて相互作用部位を予測する相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体に関する。
【0002】
【従来の技術】
タンパク質が働くため、すなわちタンパク質が一定の機能を表すためには他のタンパク質や基質等となんらかの相互作用をすることが必要である。したがって、タンパク質の相互作用部位を決定することは、創薬等の分野においては極めて重要な研究テーマであり、従来より、バイオインフォマティクス分野などにおいて、タンパク質の一次配列情報(アミノ酸配列情報)に対してモチーフ検索を実行するなどの手法によりタンパク質の相互作用部位を解析する技術が開発されている。すなわち、既知の相互作用部位に特異的に存在するアミノ酸配列を探索することにより、タンパク質の相互作用部位を予測している。
【0003】
【発明が解決しようとする課題】
しかしながら、従来のモチーフ検索などによる相互作用部位の解析手法は、既知の相互作用部位については解析することができるが、未知の相互作用部位については解析することができないというシステム構造上の基本的問題点を有していた。以下、この問題点の内容について、一層具体的に説明する。
【0004】
すなわち、従来の相互作用部位の解析手法は、予め判明している相互作用部位に特異的な一次配列をモチーフデータベースなどに登録し、その情報を用いて相互作用部位の予測を行うものであるため、今までに発見されていない相互作用部位については、その解析をすることができなかった。従って、今まで発見されていない未知の相互作用部位をバイオインフォマティクス技術を用いてコンピュータ上で予測する際には、まったく別の手法を用いる必要があるが、有効な手法は未だ確立していない。
【0005】
ところで、タンパク質のネイティブの立体構造は、できるだけアミノ酸間の相互作用にフラストレーションが無いような構造に形作られている。すなわち、タンパク質のエネルギー曲面はフラストレーションが無いような全体構造(ネイティブ構造)へ向かって漏斗状に設計されていると言われている(foldingfunnel)。ここで、ネイティブ構造はフラストレーションが少ない構造ではあるが、要素間に働く相互作用の複雑さ、自由度の大きさ、進化的な経緯などの点から、フラストレーションが完全に無くなっているわけではない。
【0006】
最近の計算機実験では、進化の産物であるタンパク質の漏斗状のエネルギー面は本質的に等方的ではなく、フラストレーションの大きい方向と小さな方向が存在している(異方性を持つ)ことがわかってきた(anisotropic funnel)。これは構造的に言うならば、局所的な構造にはフラストレーションの大きい構造と小さい構造があることを示している。そして、フラストレーションの大きい局所構造部位は、全体構造の安定化のために犠牲になっている構造部位であり、この部分は、全体構造の安定化のために歪んだ構造を取らざるを得ない状況下に置かれており、いわば全体構造の中における不安定部位であることを示している。
【0007】
一方、タンパク質の相互作用は二つの安定な全体構造をもつタンパク質同士が作用することにより、さらに安定化する過程であるといえる。タンパク質が相互作用する際の構造の変化について更に説明すると、タンパク質AとBとが相互作用する際には、タンパク質Aの一部分の構造とタンパク質Bの一部分の構造に変化が起こり結合する。
【0008】
変化が起こる一部分の構造として考えられる部位について考察すると、まず、局所的に見ても、かつ全体的に見ても安定な局所構造は、それ以上安定化する必要性がない。一方、全体的に見れば安定であるが局所的に見ると不安定である部分は、他のタンパク質等と結合することによりその部分が安定化し、さらに結合することにより全体もさらに安定化するという状況が考えられる。すなわち、局所的に不安定な構造領域は、タンパク質相互作用部位である可能性が比較的高いと考えることができる。このように局所的に不安定な部位を一次配列から予測することにより、相互作用部位の候補を挙げることができるようになる可能性がある。
【0009】
また、タンパク質の二次構造予測は、一次配列から局所的に安定な構造のパターンを予測するものである。この予測方法には、様々なものが考えられている。古くはアミノ酸の二次構造帰属情報に基づくChou−Fasmanの方法から、現在では3rd generationと呼ばれる進化的に関係のある配列をも考慮して構造予測を行う方法として、(1)neural networkを使う手法や、(2)linear statisticsを用いる手法や、(3)nearest neighbor methodを用いる手法などが考案されており、種々の異なる手法を用いて二次構造予測を行うことができる。
【0010】
これらの二次構造予測手法は、基本的には一次配列情報のうち一部の局所配列を見て予測を行うが、二次構造はタンパク質の全体の構造との関係で最終的に決定されるので、全体と局所部分との間に整合性が取れない部位、すなわちフラストレーションが大きい局所的部位では二次構造予測結果は外れる場合が多い(二次構造予測の限界)。
【0011】
ここで、このようなフラストレーションの大きい局所部位の二次構造予測においては、上述した様々な手法における処理の仕方の差が大きいといえるだろう。すなわち、種々の手法による誤差が大きくなる、すなわち精度の悪くなる部位等が、フラストレーションの大きい局所部位である可能性が高いといえる。よって、様々な手法における二次構造予測の結果比較を通して、フラストレーションの比較的大きな局所部位の予測が可能になると考えることができる。
【0012】
また、タンパク質の立体構造データが分かっている場合、すなわち、既存のPDBなどに立体構造データが登録されているタンパク質は、その全体構造が既知であるため、様々な二次構造予測手法の予測結果とその実際の構造との差を見ることにより、より明確にフラストレーションのある局所部位(相互作用部位になっている確率の高い部位)を見つけることが可能になると考えられる。
【0013】
本発明は上記問題点に鑑みてなされたもので、タンパク質の一次配列情報においてフラストレーションのある局所部位を発見することにより相互作用部位を効果的に予測することのできる、相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体を提供することを目的としている。
【0014】
【課題を解決するための手段】
このような目的を達成するため、請求項1に記載の相互作用部位予測装置は、制御装置と記憶装置を少なくとも備えた相互作用部位予測装置であって、上記記憶装置は、目的のタンパク質の一次配列情報を記憶する目的配列格納手段、を備え、上記制御装置は、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する、複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各二次構造予測プログラムの二次構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行手段と、上記二次構造予測プログラム実行手段にて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果を比較する予測結果比較手段と、上記目的配列データの先頭から最後までの上記予測結果比較手段による比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算手段と、を備え、上記フラストレーション・スコアは、上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、結果が異なる上記二次構造予測プログラムの数に応じて増減、または、上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、アミノ酸配列のエネルギー量を求め当該エネルギー量を用いて計算したスコアである、
ことを特徴とする。
【0015】
この装置によれば、目的のタンパク質の一次配列情報を入力し、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する二次構造予測プログラムに対して入力された一次配列情報の二次構造予測シミュレーションを実行させ、二次構造予測プログラムの二次構造予測結果を比較し、比較結果に基づいて、目的のタンパク質の一次配列情報の局所部分のフラストレーションを計算し、計算された局所部分のフラストレーションにより目的のタンパク質の相互作用部位を予測するので、タンパク質の一次配列情報においてフラストレーションのある局所部位を発見することにより相互作用部位を効果的に予測することができる。
【0016】
また、請求項2に記載の相互作用部位予測装置は、制御装置と記憶装置を少なくとも備えた相互作用部位予測装置であって、上記記憶装置は、目的のタンパク質の一次配列情報を記憶する目的配列格納手段と、上記目的のタンパク質の二次構造データを記憶する二次構造データ格納手段と、を備え、上記制御装置は、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各二次構造予測プログラムの二次構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行手段と、上記二次構造予測プログラム実行手段にて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果と、上記二次構造データ格納手段にて記憶された対応する上記二次構造データとを比較する予測結果比較手段と、上記目的配列データの先頭から最後までの上記予測結果比較手段による比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算手段と、を備え、上記フラストレーション・スコアは、上記二次構造データと異なる上記二次構造予測結果を出力した上記二次構造予測プログラムの数に応じて増減したスコアである、ことを特徴とする。
【0017】
この装置によれば、目的のタンパク質の一次配列情報を入力し、目的のタンパク質の二次構造データを取得し、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する二次構造予測プログラムに対して入力された一次配列情報の二次構造予測シミュレーションを実行させ、二次構造予測プログラムの二次構造予測結果と、取得した二次構造データとを比較し、比較結果に基づいて、目的のタンパク質の一次配列情報の局所部分のフラストレーションを計算し、計算された局所部分のフラストレーションにより目的のタンパク質の相互作用部位を予測するので、二次構造予測プログラムの予測結果と目的のタンパク質の実際の二次構造との差を見ることにより、より明確にフラストレーションのある局所部位(相互作用部位になっている確率の高い部位)を見つけることが可能になる。
【0018】
また、請求項3に記載の相互作用部位予測装置は、請求項1または2に記載の相互作用部位予測装置において、上記記憶装置は、上記二次構造予測プログラムの上記二次構造予測結果に対する確信度を示す確信度情報を記憶する確信度情報格納手段、をさらに備え、上記フラストレーション計算手段は、上記二次構造予測結果の比較結果が異なる場合に、上記確信度情報格納手段により記憶された対応する上記確信度情報を参照し、上記フラストレーション・スコアを増減することを特徴とする。
【0019】
これはフラストレーション計算の一例を一層具体的に示すものである。この装置によれば、二次構造予測プログラムの二次構造予測結果に対する確信度を示す確信度情報を設定し、設定された確信度情報および比較結果に基づいて、局所部分のフラストレーションを計算するので、確信度情報が高い(すなわち、シミュレーションの精度の高い)プログラムによる二次構造予測結果データに対する重みを高くすることにより、フラストレーション計算においてシミュレーション結果に対する確信度を反映させることができるようになる。
【0020】
また、本発明は相互作用部位予測方法に関するものであり、請求項4に記載の相互作用部位予測方法は、制御装置と記憶装置を少なくとも備えた相互作用部位予測装置において実行される相互作用部位予測方法であって、上記記憶装置は、目的のタンパク質の一次配列情報を記憶する目的配列格納手段、を備え、上記制御装置にて実行される、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する、複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各二次構造予測プログラムの二次構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行ステップと、上記二次構造予測プログラム実行ステップにて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果を比較する予測結果比較ステップと、上記目的配列データの先頭から最後までの上記予測結果比較ステップによる比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算ステップと、を含み、上記フラストレーション・スコアは、上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、結果が異なる上記二次構造予測プログラムの数に応じて増減、または、上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、アミノ酸配列のエネルギー量を求め当該エネルギー量を用いて計算したスコアである、ことを特徴とする。
【0021】
この方法によれば、目的のタンパク質の一次配列情報を入力し、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する二次構造予測プログラムに対して入力された一次配列情報の二次構造予測シミュレーションを実行させ、二次構造予測プログラムの二次構造予測結果を比較し、比較結果に基づいて、目的のタンパク質の一次配列情報の局所部分のフラストレーションを計算し、計算された局所部分のフラストレーションにより目的のタンパク質の相互作用部位を予測するので、タンパク質の一次配列情報においてフラストレーションのある局所部位を発見することにより相互作用部位を効果的に予測することができる。
【0022】
また、請求項5に記載の相互作用部位予測方法は、制御装置と記憶装置を少なくとも備えた相互作用部位予測装置において実行される相互作用部位予測方法であって、上記記憶装置は、目的のタンパク質の一次配列情報を記憶する目的配列格納手段と、上記目的のタンパク質の二次構造データを記憶する二次構造データ格納手段と、を備え、上記制御装置にて実行される、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各断片構造予測プログラムの断片構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行ステップと、上記二次構造予測プログラム実行ステップにて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果と、上記二次構造データ格納手段にて記憶された対応する上記二次構造データとを比較する予測結果比較ステップと、上記目的配列データの先頭から最後までの上記予測結果比較ステップによる比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算ステップと、を含み、上記フラストレーション・スコアは、上記二次構造データと異なる上記二次構造予測結果を出力した上記二次構造予測プログラムの数に応じて増減したスコアである、ことを特徴とする。
【0023】
この方法によれば、目的のタンパク質の一次配列情報を入力し、目的のタンパク質の二次構造データを取得し、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する二次構造予測プログラムに対して入力された一次配列情報の二次構造予測シミュレーションを実行させ、二次構造予測プログラムの二次構造予測結果と、取得した二次構造データとを比較し、比較結果に基づいて、目的のタンパク質の一次配列情報の局所部分のフラストレーションを計算し、計算された局所部分のフラストレーションにより目的のタンパク質の相互作用部位を予測するので、二次構造予測プログラムの予測結果と目的のタンパク質の実際の二次構造との差を見ることにより、より明確にフラストレーションのある局所部位(相互作用部位になっている確率の高い部位)を見つけることが可能になる。
【0024】
また、請求項6に記載の相互作用部位予測方法は、請求項4または5に記載の相互作用部位予測方法において、上記記憶装置は、上記二次構造予測プログラムの上記二次構造予測結果に対する確信度を示す確信度情報を記憶する確信度情報格納手段、をさらに備え、上記フラストレーション計算ステップは、上記二次構造予測結果の比較結果が異なる場合に、上記確信度情報格納手段により記憶された対応する上記確信度情報を参照し、上記フラストレーション・スコアを増減することを特徴とする。
【0025】
これはフラストレーション計算の一例を一層具体的に示すものである。この方法によれば、二次構造予測プログラムの二次構造予測結果に対する確信度を示す確信度情報を設定し、設定された確信度情報および比較結果に基づいて、局所部分のフラストレーションを計算するので、確信度情報が高い(すなわち、シミュレーションの精度の高い)プログラムによる二次構造予測結果データに対する重みを高くすることにより、フラストレーション計算においてシミュレーション結果に対する確信度を反映させることができるようになる。
【0026】
また、本発明はプログラムに関するものであり、請求項7に記載のプログラムは、制御装置と記憶装置を少なくとも備えた相互作用部位予測装置において実行されるプログラムであって、上記記憶装置は、目的のタンパク質の一次配列情報を記憶する目的配列格納手段、を備え、上記制御装置にて実行される、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する、複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各二次構造予測プログラムの二次構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行ステップと、上記二次構造予測プログラム実行ステップにて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果を比較する予測結果比較ステップと、上記目的配列データの先頭から最後までの上記予測結果比較ステップによる比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算ステップと、を含み、上記フラストレーション・スコアは、上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、結果が異なる上記二次構造予測プログラムの数に応じて増減、または、上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、アミノ酸配列のエネルギー量を求め当該エネルギー量を用いて計算したスコアである、ことを特徴とする。
【0027】
このプログラムによれば、目的のタンパク質の一次配列情報を入力し、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する二次構造予測プログラムに対して入力された一次配列情報の二次構造予測シミュレーションを実行させ、二次構造予測プログラムの二次構造予測結果を比較し、比較結果に基づいて、目的のタンパク質の一次配列情報の局所部分のフラストレーションを計算し、計算された局所部分のフラストレーションにより目的のタンパク質の相互作用部位を予測するので、タンパク質の一次配列情報においてフラストレーションのある局所部位を発見することにより相互作用部位を効果的に予測することができる。
【0028】
また、請求項8に記載のプログラムは、制御装置と記憶装置を少なくとも備えた相互作用部位予測装置において実行されるプログラムであって、上記記憶装置は、目的のタンパク質の一次配列情報を記憶する目的配列格納手段と、上記目的のタンパク質の二次構造データを記憶する二次構造データ格納手段と、を備え、上記制御装置にて実行される、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各断片構造予測プログラムの断片構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行ステップと、上記二次構造予測プログラム実行ステップにて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果と、上記二次構造データ格納手段にて記憶された対応する上記二次構造データとを比較する予測結果比較ステップと、上記目的配列データの先頭から最後までの上記予測結果比較ステップによる比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算ステップと、を含み、上記フラストレーション・スコアは、上記二次構造データと異なる上記二次構造予測結果を出力した上記二次構造予測プログラムの数に応じて増減したスコアである、ことを特徴とする。
【0029】
このプログラムによれば、目的のタンパク質の一次配列情報を入力し、目的のタンパク質の二次構造データを取得し、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する二次構造予測プログラムに対して入力された一次配列情報の二次構造予測シミュレーションを実行させ、二次構造予測プログラムの二次構造予測結果と、取得した二次構造データとを比較し、比較結果に基づいて、目的のタンパク質の一次配列情報の局所部分のフラストレーションを計算し、計算された局所部分のフラストレーションにより目的のタンパク質の相互作用部位を予測するので、二次構造予測プログラムの予測結果と目的のタンパク質の実際の二次構造との差を見ることにより、より明確にフラストレーションのある局所部位(相互作用部位になっている確率の高い部位)を見つけることが可能になる。
【0030】
また、請求項9に記載のプログラムは、請求項7または8に記載のプログラムにおいて、上記記憶装置は、上記二次構造予測プログラムの上記二次構造予測結果に対する確信度を示す確信度情報を記憶する確信度情報格納手段、をさらに備え、上記フラストレーション計算ステップは、上記二次構造予測結果の比較結果が異なる場合に、上記確信度情報格納手段により記憶された対応する上記確信度情報を参照し、上記フラストレーション・スコアを増減することを特徴とする。
【0031】
これはフラストレーション計算の一例を一層具体的に示すものである。このプログラムによれば、二次構造予測プログラムの二次構造予測結果に対する確信度を示す確信度情報を設定し、設定された確信度情報および比較結果に基づいて、局所部分のフラストレーションを計算するので、確信度情報が高い(すなわち、シミュレーションの精度の高い)プログラムによる二次構造予測結果データに対する重みを高くすることにより、フラストレーション計算においてシミュレーション結果に対する確信度を反映させることができるようになる。
【0032】
また、本発明は記録媒体に関するものであり、請求項10に記載の記録媒体は、上記請求項7〜9のいずれか一つに記載されたプログラムを記録したことを特徴とする。
【0033】
この記録媒体によれば、当該記録媒体に記録されたプログラムをコンピュータに読み取らせて実行することによって、請求項7〜9のいずれか一つに記載されたプログラムをコンピュータを利用して実現することができ、これら各プログラムと同様の効果を得ることができる。
【0034】
【発明の実施の形態】
以下に、本発明にかかる相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
【0035】
[本発明の概要]
以下、本発明の概要について説明し、その後、本発明の構成および処理等について詳細に説明する。図1は本発明の基本原理を示す原理構成図である。
【0036】
本発明は、概略的に、以下の基本的特徴を有する。まず、利用者は、目的のタンパク質の一次配列情報である目的配列データ10を本発明の相互作用部位予測装置に入力する。この目的配列データ10の入力は、例えば、利用者がSWISS−PROTやPIRやTrEMBL等の外部のデータベースに登録された一次配列情報を選択することにより入力してもよく、また、所望の一次配列情報を直接入力してもよい。
【0037】
ついで、本発明の相互作用部位予測装置は、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する二次構造予測プログラム20a〜20dに対して入力された目的配列データ10の二次構造予測シミュレーションを実行する。ここで、二次構造プログラム20a〜20dは、例えば、Chou−Fasmanの方法や、neural networkを使う手法や、linear statisticsを用いる手法や、nearest neighbor methodを用いる手法などを利用して二次構造予測シミュレーションを実行する。
【0038】
ついで、本発明の相互作用部位予測装置は、各二次構造予測プログラム20a〜20dの二次構造予測結果30a〜30dを比較する(60)。すなわち、目的配列データ61に対応する各予測プログラムの実行結果を並置して比較する(63〜66)。
【0039】
そして、本発明の相互作用部位予測装置は、この比較結果に基づいて、目的のタンパク質の一次配列情報の局所部分のフラストレーションを計算する(70)。すなわち、比較結果から各予測結果データ(63〜66)で異なる二次構造を予測した局所部分を抽出して、その部分のフラストレーションを計算する。既存の二次構造予測プログラム20a〜20dは、基本的には一次配列情報のうち一部の局所配列を見て予測を行うが、二次構造はタンパク質の全体の構造との関係で最終的に決定されるので、全体と局所部分との間に整合性が取れない部位、すなわちフラストレーションが大きい局所的部位では二次構造予測結果は外れる場合が多い。従って、複数のプログラムにおいて予測結果が外れる局所部分については、フラストレーションが大きいと仮定することができる。
【0040】
フラストレーションの計算方法は、例えば、異なる予測結果データを出力した二次構造予測プログラム数に応じてフラストレーションを増減してもよく、あるいは、異なる予測結果のそれぞれの構造における確信度の平均値や分散値などに応じてフラストレーションを増減してもよく、また、その部分のアミノ酸配列を分子力学または分子動力学などの手法を用いてエネルギー量を求めそのエネルギー量を用いてフラストレーションを計算してもよい。
【0041】
そして、本発明の相互作用部位予測装置は、計算された局所部分のフラストレーションにより目的のタンパク質の相互作用部位を予測する(80)。すなわち、例えば、一定の閾値を超えるフラストレーションが存在する局所部分(67)を相互作用部位と予測する。
【0042】
また、本発明の相互作用部位予測装置は、例えば、PDBやSCOPなどの外部のデータベースに目的のタンパク質の二次構造データが登録されている場合にはその二次構造データ40を取得し、予測結果の比較において用いる(60)。すなわち、目的のタンパク質が実際に採る二次構造データ62と、予測プログラムの予測結果データ63〜66とを比較する。
【0043】
そして、実際の二次構造データ62と予測プログラムの予測結果データ63〜66とが異なっている部分については、高いフラストレーションを計算する。タンパク質の立体構造データが分かっている場合、すなわち、既存のPDBなどに立体構造データが登録されているタンパク質は、その全体構造が既知であるため、様々な二次構造予測手法の予測結果とその実際の構造との差を見ることにより、より明確にフラストレーションのある局所部位(相互作用部位になっている確率の高い部位)を見つけることが可能になる。例えば、実際の二次構造データ62と異なる予測結果データを出力した二次構造予測プログラム数に応じてフラストレーションを増減してもよい。
【0044】
さらに、本発明の相互作用部位予測装置は、二次構造予測プログラム20a〜20dの二次構造予測結果データ30a〜30dに対する確信度を示す確信度情報50を設定する。すなわち、二次構造予測プログラム20a〜20dのシミュレーション精度を実際の二次構造データなどに基づいて設定する。
【0045】
そして、本発明の相互作用部位予測装置は、設定された確信度情報および比較結果に基づいて、局所部分の上記フラストレーションを計算する。すなわち、確信度情報が高い(すなわち、シミュレーションの精度の高い)プログラムによる二次構造予測結果データに対する重みを高くすることにより、フラストレーション計算においてシミュレーション結果に対する確信度を反映させることができる。
【0046】
[システム構成]
まず、本システムの構成について説明する。図2は、本発明が適用される本システムの構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。本システムは、概略的に、相互作用部位予測装置100と、配列情報や立体構造等に関する外部データベースおよびホモロジー検索や二次構造予測等の外部プログラム等を提供する外部システム200とを、ネットワーク300を介して通信可能に接続して構成されている。
【0047】
図2においてネットワーク300は、相互作用部位予測装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。
【0048】
図2において外部システム200は、ネットワーク300を介して、相互作用部位予測装置100と相互に接続され、利用者に対して配列情報や立体構造等に関する外部データベース、および、ホモロジー検索やモチーフ検索や二次構造予測等の外部プログラムを実行するウェブサイトを提供する機能を有する。
【0049】
ここで、外部システム200は、WEBサーバやASPサーバ等として構成してもよく、そのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成してもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。
【0050】
図2において相互作用部位予測装置100は、概略的に、相互作用部位予測装置100の全体を統括的に制御するCPU等の制御部102、通信回線等に接続されるルータ等の通信装置(図示せず)に接続される通信制御インターフェース部104、入力装置112および出力装置114に接続される入出力制御インターフェース部108、および、各種のデータベースやテーブル(予測結果データベース106a〜タンパク質構造データベース106c)を格納する記憶部106を備えて構成されており、これら各部は任意の通信路を介して通信可能に接続されている。さらに、この相互作用部位予測装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク300に通信可能に接続されている。
【0051】
図2において記憶部106に格納される各種のデータベースやテーブル(予測結果データベース106a〜タンパク質構造データベース106c)は、固定ディスク装置等のストレージ手段であり、各種処理に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0052】
これら記憶部106の各構成要素のうち、予測結果データベース106aは、二次構造予測プログラムの予測結果などに関する情報を格納する予測結果情報格納手段である。図3は、予測結果データベース106aに格納される情報の一例を示す図である。
【0053】
この予測結果データベース106aに格納される情報は、図3に示すように、目的のタンパク質の一次配列情報(アミノ酸配列情報)である目的配列データ、タンパク質構造データベースから取得した目的配列データの二次構造データ、および、各二次構造予測プログラムの予測結果データを相互に関連付けて構成されている。
【0054】
また、確信度情報データベース106bは、二次構造予測プログラムの二次構造予測結果データに対する確信度を示す確信度情報を格納する予測結果情報格納手段である。例えば、シミュレーション結果の精度の標準的な値(例えば、二次構造予測結果と実際の二次構造データとの一致率であるシミュレーション精度が60%の場合など)の確信度を1とし、標準値より精度が高い場合にはその精度に応じて確信度の値を大きくし、また、標準値より精度が低い場合にはその精度に応じて確信度の値を小さくしてもよい。さらに、二次構造プログラムごと、構造ごと、各配列におけるアミノ酸ごとに確信度を設定してもよい。すなわち、例えば、ある二次構造予測プログラムがある配列のあるアミノ酸についてその二次構造を予測するとき、その構造がα構造である確信度、β構造である確信度等をそれぞれ別々に設定してもよい。
【0055】
また、タンパク質構造データベース106cは、タンパク質の立体構造データを格納したデータベースである。タンパク質構造データベース106cは、インターネットを経由してアクセスする外部のタンパク質構造データベースであってもよく、また、これらのデータベースをコピーしたり、オリジナルの配列情報を格納したり、さらに独自のアノテーション情報等を付加したりして作成したインハウスデータベースであってもよい。
【0056】
また、図2において、通信制御インターフェース部104は、相互作用部位予測装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
【0057】
また、図2において、入出力制御インターフェース部108は、入力装置112や出力装置114の制御を行う。ここで、出力装置114としては、モニタ(家庭用テレビを含む)の他、スピーカを用いることができる(なお、以下においては出力装置をモニタとして記載する)。また、入力装置112としては、キーボード、マウス、および、マイク等を用いることができる。また、モニタも、マウスと協働してポインティングデバイス機能を実現する。
【0058】
また、図2において、制御部102は、OS(Operating System)等の制御プログラム、各種の処理手順等を規定したプログラム、および所要データを格納するための内部メモリを有し、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、目的配列入力部102a、二次構造予測プログラム実行部102b、二次構造予測プログラム102c、予測結果比較部102d、フラストレーション計算部102e、相互作用部位予測部102f、二次構造データ取得部102g、および、確信度情報設定部102hを備えて構成されている。
【0059】
このうち、目的配列入力部102aは、目的のタンパク質の一次配列情報(目的配列データ)を入力する入力手段である。また、二次構造予測プログラム実行部102bは、二次構造予測プログラムに対して入力手段により入力された一次配列情報(目的配列データ)の二次構造予測シミュレーションを実行させる二次構造予測プログラム実行手段である。また、二次構造予測プログラム102cは、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する二次構造予測プログラムである。
【0060】
また、予測結果比較部102dは、二次構造予測プログラムの二次構造予測結果を比較する予測結果比較手段、および、二次構造予測プログラムの二次構造予測結果と二次構造データ取得手段により取得した二次構造データとを比較する予測結果比較手段である。また、フラストレーション計算部102eは、予測結果比較手段による比較結果に基づいて、目的のタンパク質の一次配列情報(目的配列データ)の局所部分のフラストレーションを計算するフラストレーション計算手段、および、確信度情報設定手段により設定された確信度情報および比較結果に基づいて、局所部分のフラストレーションを計算するフラストレーション計算手段である。
【0061】
また、相互作用部位予測部102fは、フラストレーション計算手段により計算された局所部分のフラストレーションにより目的のタンパク質の相互作用部位を予測する相互作用部位予測手段である。また、二次構造データ取得部102gは、目的のタンパク質の二次構造データを取得する二次構造データ取得手段である。また、確信度情報設定部102hは、二次構造予測プログラムの二次構造予測結果に対する確信度を示す確信度情報を設定する確信度情報設定手段である。なお、これら各部によって行なわれる処理の詳細については、後述する。
【0062】
[システムの処理]
次に、このように構成された本実施の形態における本システムの処理の一例について、以下に図4〜図7を参照して詳細に説明する。
【0063】
[メイン処理]
次に、メイン処理の詳細について図4を参照して説明する。図4は、本実施の形態における本システムのメイン処理の一例を示すフローチャートである。
【0064】
まず、相互作用部位予測装置100は、目的配列入力部102aの処理により、利用者に対して目的のタンパク質の一次配列情報(目的配列データ)を入力させる(ステップSA−1)。
【0065】
ついで、相互作用部位予測装置100は、二次構造データ取得部102gの処理により、利用者が入力した目的配列データの二次構造データを取得する(ステップSA−2)。
【0066】
ここで、ステップSA−2において、二次構造データ取得部102gにより実行される二次構造データ取得処理の詳細について図5を参照して説明する。図5は、本実施形態における本システムの二次構造データ取得処理の一例を示すフローチャートである。
【0067】
まず、二次構造データ取得部102gは、タンパク質構造データベース106cを参照して目的配列データが登録されているか判定する(ステップSB−1)。ステップSB−1において、目的配列データがタンパク質構造データベース106cに登録されている場合には、二次構造データ取得部102gは、タンパク質構造データベース106cから目的配列データの二次構造データを取得して予測結果データベース106aの所定の記憶領域に格納する(ステップSB−2)。
【0068】
一方、ステップSB−1において、目的配列データがタンパク質構造データベース106cに登録されていない場合には、二次構造データ取得部102gは、目的配列データに類似する配列のタンパク質の二次構造データがタンパク質構造データベース106cに存在するか判断する(ステップSB−3)。すなわち、二次構造データ取得部102gは、例えば、配列間のホモロジーを判定するプログラムを用いて、目的配列データと、タンパク質構造データベース106cに登録された構造既知のタンパク質に対応する配列データとを比較して、高い相同性を有する配列データ(目的配列データの一部分に対応するものであってもよい)が存在するか否かを判断する。
【0069】
ステップSB−3において、目的配列データに類似する配列のタンパク質の二次構造データがタンパク質構造データベース106cに存在する場合には、二次構造データ取得部102gは、類似部分の二次構造データを予測結果データベース106aの所定の記憶領域に格納する(ステップSB−4)。なお、目的配列データのうち一部分について二次構造データが存在する場合には、二次構造データが存在する部分について、当該二次構造データを予測結果データベース106aに格納する。
【0070】
一方、ステップSB−3において、目的配列データに類似する配列のタンパク質の二次構造データがタンパク質構造データベース106cに存在しない場合には、二次構造データ取得処理が終了する。
【0071】
再び図4に戻り、相互作用部位予測装置100は、二次構造予測プログラム実行部102bの処理により、目的配列データを1つまたは2つ以上の二次構造予測プログラム102cに実行させる(ステップSA−3)。すなわち、二次構造予測プログラム実行部102bは、例えば、目的配列データを所定のフォーマットに変換したり、また、目的配列データに所定のヘッダ情報などを追加したりすることにより、各二次構造予測プログラム102cの入力形式を合わせた後、二次構造予測プログラム102cを実行する。ここで、二次構造予測プログラム102cは、相互作用部位予測装置100の内部に存在するプログラムであってもよく、また、ネットワーク300を介してリモートで実行することができる外部システム200の外部プログラムであってもよい。
【0072】
ついで、二次構造予測プログラム実行部102bは、各二次構造予測プログラム102cのシミュレーション結果である二次構造予測結果を予測結果データベース106aの所定の記憶領域に格納する(ステップSA−4)。
【0073】
ついで、相互作用部位予測装置100は、予測結果比較部102dの処理により、予測結果データベース106aに格納された目的配列データに対する各二次構造予測プログラム102cの二次構造予測結果を比較する(ステップSA−5)。すなわち、予測結果比較部102dは、各二次構造予測プログラム102cの二次構造予測結果について、目的配列データの先頭から最後までの各予測結果を比較する。なお、ステップSA−2において、二次構造予測プログラム実行部102bが目的配列データに対応する二次構造データを取得できた場合、すなわち、予測結果データベース106aに目的配列データの二次構造データが格納されている場合には、二次構造データと各二次構造予測プログラム102cの二次構造予測結果とを比較する。
【0074】
ついで、相互作用部位予測装置100は、フラストレーション計算部102eの処理により、目的配列データの局所部分のフラストレーションのスコアを計算する(ステップSA−6)。ここで、図6は、本システムのフラストレーション計算部102eにより実行されるフラストレーション実行処理の一例を示すフローチャートである。
【0075】
図6に示すように、フラストレーション計算部102eによるフラストレーションのスコアの計算方法は、例えば、二次構造予測プログラムが異なる二次構造予測結果を出力した局所部分について、結果が異なる二次構造予測プログラムの数に応じてスコアを増減してもよく、あるいは、異なる予測結果のそれぞれの構造における確信度の平均値や分散値などに応じてフラストレーションを増減してもよく、また、二次構造予測プログラムが異なる二次構造予測結果を出力した局所部分について、アミノ酸配列を分子力学または分子動力学などの手法を用いてエネルギー量を求めそのエネルギー量を用いてフラストレーションを計算してもよい(ステップSC−1)。
【0076】
また、フラストレーション計算部102eは、二次構造データと予測プログラムの二次構造予測結果とが異なっている部分について、高いフラストレーションのスコアを計算してもよい(ステップSC−2)。例えば、二次構造データと異なる二次構造予測結果を出力した二次構造予測プログラムの数に応じてスコアを増減してもよい。
【0077】
また、フラストレーション計算部102eは、確信度情報データベース106bを参照して、予め確信度情報設定部102hの処理により格納された各二次構造予測プログラム102cの確信度情報を取得し、確信度情報に基づいてフラストレーションのスコアを計算してもよい(ステップSC−3)。すなわち、フラストレーション計算部102eは、シミュレーション精度の高い二次構造予測プログラム102cの二次構造予測結果に高い重みを付けて、フラストレーションのスコアを計算する。
【0078】
ここで、確信度情報設定部102hによる確信度情報の設定の一例を示す。まず、確信度情報設定部102hは、各二次構造予測プログラム102cの二次構造予測結果と、二次構造データとを比較して、各二次構造予測プログラム102cの二次構造予測結果の精度(一致率)を計算する。そして、確信度情報設定部102hは、各二次構造予測プログラム102cの精度の平均値を標準の確信度情報(例えば、1)として設定し、平均値以上の精度については標準の確信度情報よりも高い値(例えば、1より大きい数)を計算し、平均値以下の精度については標準の確信度情報よりも低い値(例えば、1より小さい数)を計算して、確信度情報データベース106bの所定の記憶領域に格納する。
【0079】
なお、確信度情報設定部102hは、各二次構造予測プログラム102cの確信度情報を各配列中の各アミノ酸(残基)毎に設定してもよい。すなわち、各二次構造予測プログラム102cによる配列の予測結果につき配列中のアミノ酸毎に二次構造予測プログラム102cの確信度情報を設定してもよい(例えば、配列中の一番目のアミノ酸について、プログラムAは、α構造の確信度情報が1.5であり、β構造の確信度情報が0.7であり、その他の構造の確信度情報が1.1である等)。
【0080】
また、確信度情報設定部102hは、各二次構造予測プログラム102cの確信度情報を構造(α構造、β構造など)毎に設定してもよい。すなわち、各二次構造予測プログラム102cによっては、特定の構造について高い精度を有するものや低い精度を有するものが存在するため、構造毎に二次構造予測プログラム102cの確信度情報を設定してもよい(例えば、プログラムAは、α構造の確信度情報が1.5であり、β構造の確信度情報が0.7であり、その他の構造の確信度情報が1.1である等)。
【0081】
再び図4に戻り、相互作用部位予測装置100は、相互作用部位予測部102fの処理により、計算された局所部分のフラストレーションのスコアにより目的配列データのうち相互作用部位となる局所部分を予測する(ステップSA−7)。すなわち、相互作用部位予測部102fは、例えば、一定の閾値を超えるフラストレーションのスコアである局所部分を相互作用部位と予測する。
【0082】
ついで、相互作用部位予測装置100は、配列データの相互作用部位の予測結果を出力装置114に出力する(ステップSA−8)。
【0083】
ここで、図7は、相互作用部位予測装置100の出力装置114に表示される相互作用部位予測結果の表示画面の一例を示す図である。この図に示すように相互作用部位予測結果の表示画面は、例えば、目的配列データの配列情報の表示領域MA−1、相互作用部位と予測される局所部分の表示領域MA−2およびMA−3、相互領域部位と予測される局所部分のフラストレーションのスコアの表示領域MA−4およびMA−5等を含んで構成されている。これにて、メイン処理が終了する。
【0084】
[実施例]
以下に本発明の実施例について、図8および図9を参照して詳細に説明する。本実施例は、哺乳類アデニル酸シクラーゼ(Mammalian Adenylyl Cyclase)(PDB ID:1CJK)(本明細書において「MAC」という。)のアミノ酸配列についてプログラム1および2を用いて二次構造予測を行い、その二次構造予測結果に基づいてフラストレーションの計算を行い、相互作用部位の予測を行った場合の一例である。
【0085】
図8は、100のモニタに表示される本実施例の処理結果出力画面の一例を示す図である。この図に示すように処理結果出力画面は、例えば、MACのアミノ酸配列がβストランド構造である場合の確信度を示すグラフの表示領域MB−1、MACのアミノ酸配列がαへリックス構造である場合の確信度を示すグラフの表示領域MB−2、MACのアミノ酸配列がその他の二次構造である場合の確信度を示すグラフの表示領域MB−3、MACのアミノ酸配列の表示領域MB−4、フラストレーションの値が高いアミノ酸配列の断片領域(すなわち、相互作用部位である可能性が高い領域)を示す表示領域MB−5、プログラム1の二次構造予測結果の表示領域MB−6、プログラム2の二次構造予測結果の表示領域MB−7等を含んで構成されている。
【0086】
本実施例において、フラストレーションの計算は、2つのプログラムが異なった二次構造予測を行い、その配列部分が比較的長く、かつ、それぞれの予測結果の確信度が比較的高いものについて、フラストレーションを大きく設定している。この他に、確信度を用いずに、直接二次構造の予測の差を用いてフラストレーションを計算することもできる。
【0087】
図9は、既知のドッキング・シミュレーションによりフラストレーションが大きい部位であると予測された部位が実際に相互作用部位として機能しているかを確認するための図である。
【0088】
図9においてMACについて予測した立体構造は空間充填模型(spacefill)にて記載されている。なお、フラストレーションの大きい部位は濃い色で表示されている。また、図9においてMACとコンプレックスを作るその他のタンパク質は針金模型(wireframe)にて記載されている。図9に示すように、フラストレーションの大きい部位は、他のタンパク質との距離が比較的近く、これらの部位またはこれらと連続した配列の一部が相互作用部位である確率が高いことを示している。
【0089】
[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
例えば、相互作用部位予測装置100がスタンドアローンの形態で相互作用部位予測を行う場合を一例に説明したが、相互作用部位予測装置100とは別筐体で構成されるクライアント端末からの要求に応じて相互作用部位予測を行い、その予測結果を当該クライアント端末に返却するように構成してもよい。
【0090】
また、実施形態において説明した各処理のうち、自動的に行なわれるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行なわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
【0091】
また、相互作用部位予測装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
例えば、相互作用部位予測装置100の各サーバが備える処理機能、特に制御部にて行なわれる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現することができ、あるいは、ワイヤードロジックによるハードウェアとして実現することも可能である。なお、プログラムは、後述する記録媒体に記録されており、必要に応じて相互作用部位予測装置100に機械的に読み取られる。
【0092】
また、このプログラムは、相互作用部位予測装置100に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記録されてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
【0093】
また、記憶部106に格納される各種のデータベース等(予測結果データベース106a〜タンパク質構造データベース106c)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0094】
また、相互作用部位予測装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理端末等の情報処理装置にプリンタやモニタやイメージスキャナ等の周辺装置を接続し、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
【0095】
さらに、相互作用部位予測装置100の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷等に応じた任意の単位で、機能的または物理的に分散・統合して構成することができる。例えば、各データベースを独立したデータベース装置として独立に構成してもよく、また、処理の一部をCGI(Common Gateway Interface)を用いて実現してもよい。
【0096】
また、本発明にかかるプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD等の任意の「可搬用の物理媒体」や、各種コンピュータシステムに内蔵されるROM、RAM、HD等の任意の「固定用の物理媒体」を含むものとする。
【0097】
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
【0098】
また、ネットワーク300は、相互作用部位予測装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネットや、イントラネットや、LAN(有線/無線の双方を含む)や、VANや、パソコン通信網や、公衆電話網(アナログ/デジタルの双方を含む)や、専用回線網(アナログ/デジタルの双方を含む)や、CATV網や、IMT2000方式、GSM方式またはPDC/PDC―P方式等の携帯回線交換網/携帯パケット交換網や、無線呼出網や、Bluetooth等の局所無線網や、PHS網や、CS、BSまたはISDB等の衛星通信網等のうちいずれかを含んでもよい。すなわち、本システムは、有線・無線を問わず任意のネットワークを介して、各種データを送受信することができる。
【0099】
【発明の効果】
以上詳細に説明したように、本発明によれば、目的のタンパク質の一次配列情報を入力し、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する二次構造予測プログラムに対して入力された一次配列情報の二次構造予測シミュレーションを実行させ、二次構造予測プログラムの二次構造予測結果を比較し、比較結果に基づいて、目的のタンパク質の一次配列情報の局所部分のフラストレーションを計算し、計算された局所部分のフラストレーションにより目的のタンパク質の相互作用部位を予測するので、タンパク質の一次配列情報においてフラストレーションのある局所部位を発見することにより相互作用部位を効果的に予測することができる相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体を提供することができる。
【0100】
また、本発明によれば、目的のタンパク質の一次配列情報を入力し、目的のタンパク質の二次構造データを取得し、タンパク質の一次配列情報から当該タンパク質の二次構造を予測する二次構造予測プログラムに対して入力された一次配列情報の二次構造予測シミュレーションを実行させ、二次構造予測プログラムの二次構造予測結果と、取得した二次構造データとを比較し、比較結果に基づいて、目的のタンパク質の一次配列情報の局所部分のフラストレーションを計算し、計算された局所部分のフラストレーションにより目的のタンパク質の相互作用部位を予測するので、二次構造予測プログラムの予測結果と目的のタンパク質の実際の二次構造との差を見ることにより、より明確にフラストレーションのある局所部位(相互作用部位になっている確率の高い部位)を見つけることが可能になる相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体を提供することができる。
【0101】
さらに、本発明によれば、二次構造予測プログラムの二次構造予測結果に対する確信度を示す確信度情報を設定し、設定された確信度情報および比較結果に基づいて、局所部分のフラストレーションを計算するので、確信度情報が高い(すなわち、シミュレーションの精度の高い)プログラムによる二次構造予測結果データに対する重みを高くすることにより、フラストレーション計算においてシミュレーション結果に対する確信度を反映させることができる相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体を提供することができる。
【図面の簡単な説明】
【図1】本発明の基本原理を示す原理構成図である。
【図2】本発明が適用される本システムの構成の一例を示すブロック図である。
【図3】予測結果データベース106aに格納される情報の一例を示す図である。
【図4】本実施形態における本システムのメイン処理の一例を示すフローチャートである。
【図5】本実施形態における本システムの二次構造データ取得処理の一例を示すフローチャートである。
【図6】本システムのフラストレーション計算部102eにより実行されるフラストレーション実行処理の一例を示すフローチャートである。
【図7】相互作用部位予測装置100の出力装置114に表示される相互作用部位予測結果の表示画面の一例を示す図である。
【図8】100のモニタに表示される本実施例の処理結果出力画面の一例を示す図である。
【図9】既知のドッキング・シミュレーションによりフラストレーションが大きい部位であると予測された部位が実際に相互作用部位として機能しているかを確認するための図である。
【符号の説明】
10 目的配列データ
20 二次構造予測プログラム
30 二次構造予測結果データ
40 二次構造データ
50 確信度情報
100 相互作用部位予測装置
102 制御部
102a 目的配列入力部
102b 二次構造予測プログラム実行部
102c 二次構造予測プログラム
102d 予測結果比較部
102e フラストレーション計算部
102f 相互作用部位予測部
102g 二次構造データ取得部
102h 確信度情報設定部
104 通信制御インターフェース部
106 記憶部
106a 予測結果データベース
106b 確信度情報データベース
106c タンパク質構造データベース
108 入出力制御インターフェース部
112 入力装置
114 出力装置
200 外部システム
300 ネットワーク

Claims (10)

  1. 制御装置と記憶装置を少なくとも備えた相互作用部位予測装置であって、
    上記記憶装置は、
    目的のタンパク質の一次配列情報を記憶する目的配列格納手段、
    を備え、
    上記制御装置は、
    タンパク質の一次配列情報から当該タンパク質の二次構造を予測する、複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各二次構造予測プログラムの二次構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行手段と、
    上記二次構造予測プログラム実行手段にて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果を比較する予測結果比較手段と、
    上記目的配列データの先頭から最後までの上記予測結果比較手段による比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算手段と、
    を備え
    上記フラストレーション・スコアは、
    上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、結果が異なる上記二次構造予測プログラムの数に応じて増減、または、上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、アミノ酸配列のエネルギー量を求め当該エネルギー量を用いて計算したスコアである、
    ことを特徴とする相互作用部位予測装置。
  2. 制御装置と記憶装置を少なくとも備えた相互作用部位予測装置であって、
    上記記憶装置は、
    目的のタンパク質の一次配列情報を記憶する目的配列格納手段と、
    上記目的のタンパク質の二次構造データを記憶する二次構造データ格納手段と、
    を備え、
    上記制御装置は、
    タンパク質の一次配列情報から当該タンパク質の二次構造を予測する複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各二次構造予測プログラムの二次構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行手段と、
    上記二次構造予測プログラム実行手段にて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果と、上記二次構造データ格納手段にて記憶された対応する上記二次構造データとを比較する予測結果比較手段と、
    上記目的配列データの先頭から最後までの上記予測結果比較手段による比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算手段と、
    を備え
    上記フラストレーション・スコアは、
    上記二次構造データと異なる上記二次構造予測結果を出力した上記二次構造予測プログラムの数に応じて増減したスコアである、
    ことを特徴とする相互作用部位予測装置。
  3. 請求項1または2に記載の相互作用部位予測装置において、
    上記記憶装置は、
    上記二次構造予測プログラムの上記二次構造予測結果に対する確信度を示す確信度情報 を記憶する確信度情報格納手段、
    をさらに備え、
    上記フラストレーション計算手段は、上記二次構造予測結果の比較結果が異なる場合に、上記確信度情報格納手段により記憶された対応する上記確信度情報を参照し、上記フラストレーション・スコアを増減することを特徴とする相互作用部位予測装置。
  4. 制御装置と記憶装置を少なくとも備えた相互作用部位予測装置において実行される相互作用部位予測方法であって、
    上記記憶装置は、
    目的のタンパク質の一次配列情報を記憶する目的配列格納手段、
    を備え、
    上記制御装置にて実行される、
    タンパク質の一次配列情報から当該タンパク質の二次構造を予測する、複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各二次構造予測プログラムの二次構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行ステップと、
    上記二次構造予測プログラム実行ステップにて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果を比較する予測結果比較ステップと、
    上記目的配列データの先頭から最後までの上記予測結果比較ステップによる比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算ステップと、
    を含み、
    上記フラストレーション・スコアは、
    上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、結果が異なる上記二次構造予測プログラムの数に応じて増減、または、上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、アミノ酸配列のエネルギー量を求め当該エネルギー量を用いて計算したスコアである、
    ことを特徴とする相互作用部位予測方法。
  5. 制御装置と記憶装置を少なくとも備えた相互作用部位予測装置において実行される相互作用部位予測方法であって、
    上記記憶装置は、
    目的のタンパク質の一次配列情報を記憶する目的配列格納手段と、
    上記目的のタンパク質の二次構造データを記憶する二次構造データ格納手段と、
    を備え、
    上記制御装置にて実行される、
    タンパク質の一次配列情報から当該タンパク質の二次構造を予測する複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各断片構造予測プログラムの断片構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行ステップと、
    上記二次構造予測プログラム実行ステップにて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果と、上記二次構造データ格納手段にて記憶された対応する上記二次構造データとを比較する予測結果比較ステップと、
    上記目的配列データの先頭から最後までの上記予測結果比較ステップによる比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算ステップと、
    を含み、
    上記フラストレーション・スコアは、
    上記二次構造データと異なる上記二次構造予測結果を出力した上記二次構造予測プログラムの数に応じて増減したスコアである、
    ことを特徴とする相互作用部位予測方法。
  6. 請求項4または5に記載の相互作用部位予測方法において、
    上記記憶装置は、
    上記二次構造予測プログラムの上記二次構造予測結果に対する確信度を示す確信度情報を記憶する確信度情報格納手段、
    をさらに備え、
    上記フラストレーション計算ステップは、上記二次構造予測結果の比較結果が異なる場合に、上記確信度情報格納手段により記憶された対応する上記確信度情報を参照し、上記フラストレーション・スコアを増減することを特徴とする相互作用部位予測方法。
  7. 制御装置と記憶装置を少なくとも備えた相互作用部位予測装置において実行されるプログラムであって、
    上記記憶装置は、
    目的のタンパク質の一次配列情報を記憶する目的配列格納手段、
    を備え、
    上記制御装置にて実行される、
    タンパク質の一次配列情報から当該タンパク質の二次構造を予測する、複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各二次構造予測プログラムの二次構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行ステップと、
    上記二次構造予測プログラム実行ステップにて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果を比較する予測結果比較ステップと、
    上記目的配列データの先頭から最後までの上記予測結果比較ステップによる比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算ステップと、
    を含み、
    上記フラストレーション・スコアは、
    上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、結果が異なる上記二次構造予測プログラムの数に応じて増減、または、上記二次構造予測プログラムが異なる上記二次構造予測結果を出力した局所部分について、アミノ酸配列のエネルギー量を求め当該エネルギー量を用いて計算したスコアである、
    ことを特徴とするプログラム。
  8. 制御装置と記憶装置を少なくとも備えた相互作用部位予測装置において実行されるプログラムであって、
    上記記憶装置は、
    目的のタンパク質の一次配列情報を記憶する目的配列格納手段と、
    上記目的のタンパク質の二次構造データを記憶する二次構造データ格納手段と、
    を備え、
    上記制御装置にて実行される、
    タンパク質の一次配列情報から当該タンパク質の二次構造を予測する複数の二次構造予測プログラムに対して上記目的配列格納手段により記憶された上記一次配列情報の二次構造予測シミュレーションを実行させることにより、各断片構造予測プログラムの断片構造予測結果を取得し、上記記憶装置に格納する二次構造予測プログラム実行ステップと、
    上記二次構造予測プログラム実行ステップにて上記記憶装置に格納された上記各二次構造予測プログラムの二次構造予測結果を抽出し、上記目的配列データの先頭から最後までの各二次構造予測結果と、上記二次構造データ格納手段にて記憶された対応する上記二次構造データとを比較する予測結果比較ステップと、
    上記目的配列データの先頭から最後までの上記予測結果比較ステップによる比較結果に基づいて、上記目的のタンパク質の一次配列情報の局所部分のフラストレーション・スコアを計算するフラストレーション計算ステップと、
    を含み、
    上記フラストレーション・スコアは、
    上記二次構造データと異なる上記二次構造予測結果を出力した上記二次構造予測プログラムの数に応じて増減したスコアである、
    ことを特徴とするプログラム。
  9. 請求項7または8に記載のプログラムにおいて、
    上記記憶装置は、
    上記二次構造予測プログラムの上記二次構造予測結果に対する確信度を示す確信度情報を記憶する確信度情報格納手段、 をさらに備え、
    上記フラストレーション計算ステップは、上記二次構造予測結果の比較結果が異なる場合に、上記確信度情報格納手段により記憶された対応する上記確信度情報を参照し、上記フラストレーション・スコアを増減することを特徴とするプログラム。
  10. 上記請求項7〜9のいずれか一つに記載されたプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2001392802A 2001-12-25 2001-12-25 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体 Expired - Fee Related JP4054574B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001392802A JP4054574B2 (ja) 2001-12-25 2001-12-25 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001392802A JP4054574B2 (ja) 2001-12-25 2001-12-25 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体

Publications (2)

Publication Number Publication Date
JP2003196576A JP2003196576A (ja) 2003-07-11
JP4054574B2 true JP4054574B2 (ja) 2008-02-27

Family

ID=27599987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001392802A Expired - Fee Related JP4054574B2 (ja) 2001-12-25 2001-12-25 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体

Country Status (1)

Country Link
JP (1) JP4054574B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006028038A (ja) * 2004-07-13 2006-02-02 Ishikawajima Harima Heavy Ind Co Ltd 高分子化合物の結合評価方法
JP5344391B2 (ja) * 2009-02-23 2013-11-20 国立大学法人北陸先端科学技術大学院大学 タンパク質分子の分子模型及びその作製方法

Also Published As

Publication number Publication date
JP2003196576A (ja) 2003-07-11

Similar Documents

Publication Publication Date Title
Yang et al. Accurate disulfide-bonding network predictions improve ab initio structure prediction of cysteine-rich proteins
EP1403779A1 (en) Structured data processing apparatus
JP4074988B2 (ja) 情報処理装置、通信処理装置、および方法、並びにコンピュータ・プログラム
JP2004287846A (ja) 個人特定防止装置、個人特定防止方法、および、プログラム
JP2003330934A (ja) 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体
JP4054574B2 (ja) 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体
KR100650203B1 (ko) 유전체 서열 분석 및 데이터 관리 시스템 및 그 방법
Grundy Family-based homology detection via pairwise sequence comparison
US20070124081A1 (en) Biological information processing apparatus, biological information processing method and biological information processing program
JP3802416B2 (ja) 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体
JP3880417B2 (ja) 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体
Woo et al. MONACO: accurate biological network alignment through optimal neighborhood matching between focal nodes
Kann et al. A structure-based method for protein sequence alignment
JP5247009B2 (ja) 配列抽出装置、配列抽出方法、プログラムおよび記録媒体
JP4084040B2 (ja) 蛋白質構造予測装置、蛋白質構造予測方法、プログラム、および、記録媒体
JP2003203076A (ja) 知見探索装置、知見探索方法、プログラム、および、記録媒体
JP5288355B2 (ja) 塩基配列決定プログラム、塩基配列決定装置および塩基配列決定方法
Pavesi et al. Using Weeder for the discovery of conserved transcription factor binding sites
JP2004295606A (ja) 遺伝子機能推定装置、遺伝子機能推定方法、および、プログラム
JP3990963B2 (ja) 結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体
JP5396081B2 (ja) 遺伝子多型解析データ信頼性評価方法及び遺伝子多型解析データ信頼性評価装置
JP3881224B2 (ja) 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体
JP2004178020A (ja) 発現制御関係推定装置、発現制御関係推定方法、プログラム、および、記録媒体
JP4250443B2 (ja) 抗体設計装置、抗体設計方法、プログラム、および、記録媒体
JP2005275794A (ja) 情報間関係性解析装置、情報間関係性解析方法、プログラムおよび記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070814

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071210

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101214

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101214

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111214

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121214

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131214

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees