JP2003196290A - 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体 - Google Patents

相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体

Info

Publication number
JP2003196290A
JP2003196290A JP2001398570A JP2001398570A JP2003196290A JP 2003196290 A JP2003196290 A JP 2003196290A JP 2001398570 A JP2001398570 A JP 2001398570A JP 2001398570 A JP2001398570 A JP 2001398570A JP 2003196290 A JP2003196290 A JP 2003196290A
Authority
JP
Japan
Prior art keywords
frustration
prediction
protein
fragment structure
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001398570A
Other languages
English (en)
Other versions
JP3802416B2 (ja
Inventor
Seiji Saito
静司 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celestar Lexico Sciences Inc
Original Assignee
Celestar Lexico Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico Sciences Inc filed Critical Celestar Lexico Sciences Inc
Priority to JP2001398570A priority Critical patent/JP3802416B2/ja
Priority to EP02792061A priority patent/EP1460560A4/en
Priority to PCT/JP2002/013833 priority patent/WO2003056462A1/ja
Priority to US10/500,006 priority patent/US20050067848A1/en
Publication of JP2003196290A publication Critical patent/JP2003196290A/ja
Application granted granted Critical
Publication of JP3802416B2 publication Critical patent/JP3802416B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Abstract

(57)【要約】 【課題】 タンパク質の一次配列情報においてフラスト
レーションのある局所部位を発見することにより相互作
用部位を効果的に予測することを課題とする。 【解決手段】 利用者は、目的のタンパク質の一次配列
情報である目的配列データ10を本発明の相互作用部位
予測装置に入力する。タンパク質の一次配列情報から当
該タンパク質の断片構造を予測する断片構造予測プログ
ラム20a〜20dに対して入力された目的配列データ
10の断片構造予測シミュレーションを実行する。各断
片構造予測プログラム20a〜20dの断片構造予測結
果30a〜30dを比較する(60)。この比較結果に
基づいて、目的のタンパク質の一次配列情報の局所部分
のフラストレーションを計算する(70)。計算された
局所部分のフラストレーションにより目的のタンパク質
の相互作用部位を予測する(80)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、相互作用部位予測
装置、相互作用部位予測方法、プログラム、および、記
録媒体に関し、特に、局所部位のフラストレーションに
基づいて相互作用部位を予測する相互作用部位予測装
置、相互作用部位予測方法、プログラム、および、記録
媒体に関する。
【0002】
【従来の技術】タンパク質が働くため、すなわちタンパ
ク質が一定の機能を表すためには他のタンパク質や基質
等と何らかの相互作用をすることが必要である。したが
って、タンパク質の相互作用部位を決定することは、創
薬等の分野においては極めて重要な研究テーマであり、
従来より、バイオインフォマティクス分野などにおい
て、タンパク質の一次配列情報(アミノ酸配列情報)に
対してモチーフ検索を実行するなどの手法によりタンパ
ク質の相互作用部位を解析する技術が開発されている。
すなわち、既知の相互作用部位に特異的に存在するアミ
ノ酸配列を探索することにより、タンパク質の相互作用
部位を予測している。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
モチーフ検索などによる相互作用部位の解析手法は、既
知の相互作用部位については解析することができるが、
未知の相互作用部位については解析することができない
というシステム構造上の基本的問題点を有していた。以
下、この問題点の内容について、一層具体的に説明す
る。
【0004】すなわち、従来の相互作用部位の解析手法
は、予め判明している相互作用部位に特異的な一次配列
をモチーフデータベースなどに登録し、その情報を用い
て相互作用部位の予測を行うものであるため、今までに
発見されていない相互作用部位については、その解析を
することができなかった。従って、今まで発見されてい
ない未知の相互作用部位をバイオインフォマティクス技
術を用いてコンピュータ上で予測する際には、まったく
別の手法を用いる必要があるが、有効な手法は未だ確立
していない。
【0005】ところで、タンパク質のネイティブの立体
構造は、できるだけアミノ酸間の相互作用にフラストレ
ーションが無いような構造に形作られている。すなわ
ち、タンパク質のエネルギー曲面はフラストレーション
が無いような全体構造(ネイティブ構造)へ向かって漏
斗状に設計されていると言われている(folding
funnel)。ここで、ネイティブ構造はフラストレ
ーションが少ない構造ではあるが、要素間に働く相互作
用の複雑さ、自由度の大きさ、進化的な経緯などの点か
ら、フラストレーションが完全に無くなっているわけで
はない。
【0006】最近の計算機実験では、進化の産物である
タンパク質の漏斗状のエネルギー面は本質的に等方的で
はなく、フラストレーションの大きい方向と小さな方向
が存在している(異方性を持つ)ことがわかってきた
(anisotropic funnel)。これは構
造的に言うならば、局所的な構造にはフラストレーショ
ンの大きい構造と小さい構造があることを示している。
そして、フラストレーションの大きい局所構造部位は、
全体構造の安定化のために犠牲になっている構造部位で
あり、この部分は、全体構造の安定化のために歪んだ構
造を取らざるを得ない状況下に置かれており、いわば全
体構造の中における不安定部位であることを示してい
る。
【0007】一方、タンパク質の相互作用は二つの安定
な全体構造をもつタンパク質同士が作用することによ
り、さらに安定化する過程であるといえる。タンパク質
が相互作用する際の構造の変化について更に説明する
と、タンパク質AとBとが相互作用する際には、タンパ
ク質Aの一部分の構造とタンパク質Bの一部分の構造に
変化が起こり結合する。
【0008】変化が起こる一部分の構造として考えられ
る部位について考察すると、まず、局所的に見ても、か
つ全体的に見ても安定な局所構造は、それ以上安定化す
る必要性がない。一方、全体的に見れば安定であるが局
所的に見ると不安定である部分は、他のタンパク質等と
結合することによりその部分が安定化し、さらに結合す
ることにより全体もさらに安定化するという状況が考え
られる。すなわち、局所的に不安定な構造領域は、タン
パク質相互作用部位である可能性が比較的高いと考える
ことができる。このように局所的に不安定な部位を一次
配列から予測することにより、相互作用部位の候補を挙
げることができるようになる可能性がある。
【0009】タンパク質の立体構造は、配列情報から一
意に決まると言われている。これは、配列空間と構造空
間との間には何らかの相関があるということを意味す
る。ここで、配列空間と構造空間(ネイティブ構造の空
間)の大きさを比較してみると、配列空間の方が大きい
と言える。なぜなら、進化的に見ると、配列が多少変化
したとしても構造はあまり変化しているようには見えな
いからである。このことを換言すると、構造の方が配列
よりも進化的に保守性が強いとも言える。
【0010】また、近年の進化的に良く似たタンパク質
の構造解析によって、似たような配列をもつタンパク質
は、似たような全体構造をもつということが明らかにな
ってきた。全体は部分の組み合わせから作られていると
考えると、タンパク質の全体構造に対して成り立つであ
ろう上記のような経験則が、タンパク質の一部を切り出
した部分に関してもある程度成り立つのではないかと考
えることができる。
【0011】実際に、タンパク質の似たような部分配列
は似たような部分構造となるという部分配列と構造とに
相関のあるものが存在している。最近の研究では、部分
配列と部分構造との相関を利用して、部分配列から全体
構造を組み立てるという試みが試されてきている。
【0012】例えば、Kim T.Simons等
「Assembly of Protein Tert
iary Structures from Frag
ments with Similar Local
Sequences using Simulated
Annealing and Bayesian S
coring Functions」J.Mol.Bi
ol.(1997)268,209p−225p(以下
「文献1」という)や、ChristopherBys
troff等「Predection of Loca
l Structure in Proteins U
sing a Library ofSequence
−Structure Motifs」J.Mol.B
iol.(1998)281,565p−577p(以
下「文献2」という)により開示された研究において
は、部分配列に対応する構造をクラスタリングすること
により、広大な構造(folding)空間を狭めるこ
とが可能となり、フォールディング・シミュレーション
の計算時間の短縮にも繋がっている。
【0013】ここで、文献1には、localな配列に
よってlocal構造は特定の偏った構造に制限される
ので構造空間は小さくなること、その構造は配列上近い
タンパク質の構造に類似していること、配列のプロファ
イルをマルチプルアラインメントにより求め、問合せ
(query)配列との距離の近さを求めることなどが
開示されている。
【0014】また、文献2には、断片構造と配列の相関
がある場合には、断片の配列傾向から限られた数の構造
の候補がとりだせること、構造に関しては二つの構造指
標を用いてクラスタリングを行い、また、配列について
はfrequency profileの距離を使って
計算し、クラスター作成は配列が似ているものの中から
構造が似ているものを探してクラスター化することによ
り実際に配列−構造断片のクラスターを作成することが
開示されている。
【0015】ここで、部分配列−部分構造クラスター
は、配列と相関の高い部分構造予測を行うためのもので
あるが、相関の強さ(似た配列がその構造である確信
度)を用いて、全体構造の中で(配列と構造との間の相
関の観点から)局所的に安定な部位(相関の強い部位)
や、不安定な部位を特定することが可能であると考えら
れる。このクラスターはまた、データセット、部分配列
の長さ、クラスターの大きさなどの観点から様々な分類
が可能である。
【0016】部分配列と部分構造との間の相関の強い部
分は、その部分配列のみで全体構造におけるその部位の
構造が決まっている部位(つまり、全体構造の中でも安
定している部位)である可能性が高いといえる。一方、
部分配列と部分構造との間の相関の弱い部分は、その部
分配列のみでは構造が決まらない(全体構造の中でその
部分構造が決まる)部位である可能性が高い。
【0017】よって、フラストレーションが大きい(不
安定な)局所部位の候補としては、部分配列と部分構造
の相関が弱い部分や、様々なクラスターでの結果におい
て、確信度の高い結果がまちまちである部分や、フォー
ルディング・シミュレーション(folding si
mulation)を実行した後、確信度が高く予想さ
れた初期構造とは異なる構造を取っている部分や、まわ
りの局所構造と整合性を欠く部分が考えられる。
【0018】このようなフラストレーションの大きい局
所部位の断片構造予測においては、上述した様々な手法
における処理の仕方の差が大きいと言えるだろう。すな
わち、種々の手法による誤差が大きくなる、すなわち精
度の悪くなる部位等が、フラストレーションの大きい局
所部位である可能性が高いといえる。よって、様々な手
法における断片構造予測の結果比較を通して、フラスト
レーションの比較的大きな局所部位の予測が可能になる
と考えることができる。
【0019】また、タンパク質の立体構造データが分か
っている場合、すなわち、既存のPDBなどに立体構造
データが登録されているタンパク質は、その全体構造が
既知であるため、様々な断片構造予測手法の予測結果と
その実際の構造との差を見ることにより、より明確にフ
ラストレーションのある局所部位(相互作用部位になっ
ている確率の高い部位)を見つけることが可能になると
考えられる。
【0020】本発明は上記問題点に鑑みてなされたもの
で、タンパク質の一次配列情報においてフラストレーシ
ョンのある局所部位を発見することにより相互作用部位
を効果的に予測することのできる、相互作用部位予測装
置、相互作用部位予測方法、プログラム、および、記録
媒体を提供することを目的としている。
【0021】
【課題を解決するための手段】このような目的を達成す
るため、請求項1に記載の相互作用部位予測装置は、目
的のタンパク質の一次配列情報を入力する入力手段と、
タンパク質の一次配列情報から当該タンパク質の断片構
造を予測する断片構造予測プログラムに対して上記入力
手段により入力された上記一次配列情報の断片構造予測
シミュレーションを実行させる断片構造予測プログラム
実行手段と、上記断片構造予測プログラム実行手段によ
る上記断片構造予測プログラムの断片構造予測結果を比
較する予測結果比較手段と、上記予測結果比較手段によ
る比較結果に基づいて、上記目的のタンパク質の一次配
列情報の局所部分のフラストレーションを計算するフラ
ストレーション計算手段と、上記フラストレーション計
算手段により計算された上記局所部分の上記フラストレ
ーションにより上記目的のタンパク質の相互作用部位を
予測する相互作用部位予測手段とを備えたことを特徴と
する。
【0022】この装置によれば、目的のタンパク質の一
次配列情報を入力し、タンパク質の一次配列情報から当
該タンパク質の断片構造を予測する断片構造予測プログ
ラムに対して入力された一次配列情報の断片構造予測シ
ミュレーションを実行させ、断片構造予測プログラムの
断片構造予測結果を比較し、比較結果に基づいて、目的
のタンパク質の一次配列情報の局所部分のフラストレー
ションを計算し、計算された局所部分のフラストレーシ
ョンにより目的のタンパク質の相互作用部位を予測する
ので、タンパク質の一次配列情報においてフラストレー
ションのある局所部位を発見することにより相互作用部
位を効果的に予測することができる。
【0023】また、請求項2に記載の相互作用部位予測
装置は、目的のタンパク質の一次配列情報を入力する入
力手段と、上記目的のタンパク質の立体構造データを取
得する立体構造データ取得手段と、タンパク質の一次配
列情報から当該タンパク質の断片構造を予測する断片構
造予測プログラムに対して上記入力手段により入力され
た上記一次配列情報の断片構造予測シミュレーションを
実行させる断片構造予測プログラム実行手段と、上記断
片構造予測プログラム実行手段による上記断片構造予測
プログラムの断片構造予測結果と、上記立体構造データ
取得手段により取得した上記立体構造データとを比較す
る予測結果比較手段と、上記予測結果比較手段による比
較結果に基づいて、上記目的のタンパク質の一次配列情
報の局所部分のフラストレーションを計算するフラスト
レーション計算手段と、上記フラストレーション計算手
段により計算された上記局所部分の上記フラストレーシ
ョンにより上記目的のタンパク質の相互作用部位を予測
する相互作用部位予測手段とを備えたことを特徴とす
る。
【0024】この装置によれば、目的のタンパク質の一
次配列情報を入力し、目的のタンパク質の立体構造デー
タを取得し、タンパク質の一次配列情報から当該タンパ
ク質の断片構造を予測する断片構造予測プログラムに対
して入力された一次配列情報の断片構造予測シミュレー
ションを実行させ、断片構造予測プログラムの断片構造
予測結果と、取得した立体構造データとを比較し、比較
結果に基づいて、目的のタンパク質の一次配列情報の局
所部分のフラストレーションを計算し、計算された局所
部分のフラストレーションにより目的のタンパク質の相
互作用部位を予測するので、断片構造予測プログラムの
予測結果と目的のタンパク質の実際の断片構造との差を
見ることにより、より明確にフラストレーションのある
局所部位(相互作用部位になっている確率の高い部位)
を見つけることが可能になる。
【0025】また、請求項3に記載の相互作用部位予測
装置は、請求項1または2に記載の相互作用部位予測装
置において、上記断片構造予測プログラムの上記断片構
造予測結果に対する確信度を示す確信度情報を設定する
確信度情報設定手段をさらに備え、上記フラストレーシ
ョン計算手段は、上記確信度情報設定手段により設定さ
れた上記確信度情報および上記比較結果に基づいて、上
記局所部分の上記フラストレーションを計算することを
特徴とする。
【0026】これはフラストレーション計算の一例を一
層具体的に示すものである。この装置によれば、断片構
造予測プログラムの断片構造予測結果に対する確信度を
示す確信度情報を設定し、設定された確信度情報および
比較結果に基づいて、局所部分のフラストレーションを
計算するので、確信度情報が高い(すなわち、シミュレ
ーションの精度の高い)プログラムによる断片構造予測
結果データに対する重みを高くすることにより、フラス
トレーション計算においてシミュレーション結果に対す
る確信度を反映させることができるようになる。
【0027】また、本発明は相互作用部位予測方法に関
するものであり、請求項4に記載の相互作用部位予測方
法は、目的のタンパク質の一次配列情報を入力する入力
ステップと、タンパク質の一次配列情報から当該タンパ
ク質の断片構造を予測する断片構造予測プログラムに対
して上記入力ステップにより入力された上記一次配列情
報の断片構造予測シミュレーションを実行させる断片構
造予測プログラム実行ステップと、上記断片構造予測プ
ログラム実行ステップによる上記断片構造予測プログラ
ムの断片構造予測結果を比較する予測結果比較ステップ
と、上記予測結果比較ステップによる比較結果に基づい
て、上記目的のタンパク質の一次配列情報の局所部分の
フラストレーションを計算するフラストレーション計算
ステップと、上記フラストレーション計算ステップによ
り計算された上記局所部分の上記フラストレーションに
より上記目的のタンパク質の相互作用部位を予測する相
互作用部位予測ステップとを含むことを特徴とする。
【0028】この方法によれば、目的のタンパク質の一
次配列情報を入力し、タンパク質の一次配列情報から当
該タンパク質の断片構造を予測する断片構造予測プログ
ラムに対して入力された一次配列情報の断片構造予測シ
ミュレーションを実行させ、断片構造予測プログラムの
断片構造予測結果を比較し、比較結果に基づいて、目的
のタンパク質の一次配列情報の局所部分のフラストレー
ションを計算し、計算された局所部分のフラストレーシ
ョンにより目的のタンパク質の相互作用部位を予測する
ので、タンパク質の一次配列情報においてフラストレー
ションのある局所部位を発見することにより相互作用部
位を効果的に予測することができる。
【0029】また、請求項5に記載の相互作用部位予測
方法は、目的のタンパク質の一次配列情報を入力する入
力ステップと、上記目的のタンパク質の立体構造データ
を取得する立体構造データ取得ステップと、タンパク質
の一次配列情報から当該タンパク質の断片構造を予測す
る断片構造予測プログラムに対して上記入力ステップに
より入力された上記一次配列情報の断片構造予測シミュ
レーションを実行させる断片構造予測プログラム実行ス
テップと、上記断片構造予測プログラム実行ステップに
よる上記断片構造予測プログラムの断片構造予測結果
と、上記立体構造データ取得ステップにより取得した上
記立体構造データとを比較する予測結果比較ステップ
と、上記予測結果比較ステップによる比較結果に基づい
て、上記目的のタンパク質の一次配列情報の局所部分の
フラストレーションを計算するフラストレーション計算
ステップと、上記フラストレーション計算ステップによ
り計算された上記局所部分の上記フラストレーションに
より上記目的のタンパク質の相互作用部位を予測する相
互作用部位予測ステップとを含むことを特徴とする。
【0030】この方法によれば、目的のタンパク質の一
次配列情報を入力し、目的のタンパク質の立体構造デー
タを取得し、タンパク質の一次配列情報から当該タンパ
ク質の断片構造を予測する断片構造予測プログラムに対
して入力された一次配列情報の断片構造予測シミュレー
ションを実行させ、断片構造予測プログラムの断片構造
予測結果と、取得した立体構造データとを比較し、比較
結果に基づいて、目的のタンパク質の一次配列情報の局
所部分のフラストレーションを計算し、計算された局所
部分のフラストレーションにより目的のタンパク質の相
互作用部位を予測するので、断片構造予測プログラムの
予測結果と目的のタンパク質の実際の断片構造との差を
見ることにより、より明確にフラストレーションのある
局所部位(相互作用部位になっている確率の高い部位)
を見つけることが可能になる。
【0031】また、請求項6に記載の相互作用部位予測
方法は、請求項4または5に記載の相互作用部位予測方
法において、上記断片構造予測プログラムの上記断片構
造予測結果に対する確信度を示す確信度情報を設定する
確信度情報設定ステップをさらに含み、上記フラストレ
ーション計算ステップは、上記確信度情報設定ステップ
により設定された上記確信度情報および上記比較結果に
基づいて、上記局所部分の上記フラストレーションを計
算することを特徴とする。
【0032】これはフラストレーション計算の一例を一
層具体的に示すものである。この方法によれば、断片構
造予測プログラムの断片構造予測結果に対する確信度を
示す確信度情報を設定し、設定された確信度情報および
比較結果に基づいて、局所部分のフラストレーションを
計算するので、確信度情報が高い(すなわち、シミュレ
ーションの精度の高い)プログラムによる断片構造予測
結果データに対する重みを高くすることにより、フラス
トレーション計算においてシミュレーション結果に対す
る確信度を反映させることができるようになる。
【0033】また、本発明はプログラムに関するもので
あり、請求項7に記載のプログラムは、目的のタンパク
質の一次配列情報を入力する入力ステップと、タンパク
質の一次配列情報から当該タンパク質の断片構造を予測
する断片構造予測プログラムに対して上記入力ステップ
により入力された上記一次配列情報の断片構造予測シミ
ュレーションを実行させる断片構造予測プログラム実行
ステップと、上記断片構造予測プログラム実行ステップ
による上記断片構造予測プログラムの断片構造予測結果
を比較する予測結果比較ステップと、上記予測結果比較
ステップによる比較結果に基づいて、上記目的のタンパ
ク質の一次配列情報の局所部分のフラストレーションを
計算するフラストレーション計算ステップと、上記フラ
ストレーション計算ステップにより計算された上記局所
部分の上記フラストレーションにより上記目的のタンパ
ク質の相互作用部位を予測する相互作用部位予測ステッ
プとを含む相互作用部位予測方法をコンピュータに実行
させることを特徴とする。
【0034】このプログラムによれば、目的のタンパク
質の一次配列情報を入力し、タンパク質の一次配列情報
から当該タンパク質の断片構造を予測する断片構造予測
プログラムに対して入力された一次配列情報の断片構造
予測シミュレーションを実行させ、断片構造予測プログ
ラムの断片構造予測結果を比較し、比較結果に基づい
て、目的のタンパク質の一次配列情報の局所部分のフラ
ストレーションを計算し、計算された局所部分のフラス
トレーションにより目的のタンパク質の相互作用部位を
予測するので、タンパク質の一次配列情報においてフラ
ストレーションのある局所部位を発見することにより相
互作用部位を効果的に予測することができる。
【0035】また、請求項8に記載のプログラムは、目
的のタンパク質の一次配列情報を入力する入力ステップ
と、上記目的のタンパク質の立体構造データを取得する
立体構造データ取得ステップと、タンパク質の一次配列
情報から当該タンパク質の断片構造を予測する断片構造
予測プログラムに対して上記入力ステップにより入力さ
れた上記一次配列情報の断片構造予測シミュレーション
を実行させる断片構造予測プログラム実行ステップと、
上記断片構造予測プログラム実行ステップによる上記断
片構造予測プログラムの断片構造予測結果と、上記立体
構造データ取得ステップにより取得した上記立体構造デ
ータとを比較する予測結果比較ステップと、上記予測結
果比較ステップによる比較結果に基づいて、上記目的の
タンパク質の一次配列情報の局所部分のフラストレーシ
ョンを計算するフラストレーション計算ステップと、上
記フラストレーション計算ステップにより計算された上
記局所部分の上記フラストレーションにより上記目的の
タンパク質の相互作用部位を予測する相互作用部位予測
ステップとを含む相互作用部位予測方法をコンピュータ
に実行させることを特徴とする。
【0036】このプログラムによれば、目的のタンパク
質の一次配列情報を入力し、目的のタンパク質の立体構
造データを取得し、タンパク質の一次配列情報から当該
タンパク質の断片構造を予測する断片構造予測プログラ
ムに対して入力された一次配列情報の断片構造予測シミ
ュレーションを実行させ、断片構造予測プログラムの断
片構造予測結果と、取得した立体構造データとを比較
し、比較結果に基づいて、目的のタンパク質の一次配列
情報の局所部分のフラストレーションを計算し、計算さ
れた局所部分のフラストレーションにより目的のタンパ
ク質の相互作用部位を予測するので、断片構造予測プロ
グラムの予測結果と目的のタンパク質の実際の断片構造
との差を見ることにより、より明確にフラストレーショ
ンのある局所部位(相互作用部位になっている確率の高
い部位)を見つけることが可能になる。
【0037】また、請求項9に記載のプログラムは、請
求項7または8に記載のプログラムにおいて、上記断片
構造予測プログラムの上記断片構造予測結果に対する確
信度を示す確信度情報を設定する確信度情報設定ステッ
プをさらに含み、上記フラストレーション計算ステップ
は、上記確信度情報設定ステップにより設定された上記
確信度情報および上記比較結果に基づいて、上記局所部
分の上記フラストレーションを計算することを特徴とす
る。
【0038】これはフラストレーション計算の一例を一
層具体的に示すものである。このプログラムによれば、
断片構造予測プログラムの断片構造予測結果に対する確
信度を示す確信度情報を設定し、設定された確信度情報
および比較結果に基づいて、局所部分のフラストレーシ
ョンを計算するので、確信度情報が高い(すなわち、シ
ミュレーションの精度の高い)プログラムによる断片構
造予測結果データに対する重みを高くすることにより、
フラストレーション計算においてシミュレーション結果
に対する確信度を反映させることができるようになる。
【0039】また、本発明は記録媒体に関するものであ
り、請求項10に記載の記録媒体は、上記請求項7〜9
のいずれか一つに記載されたプログラムを記録したこと
を特徴とする。
【0040】この記録媒体によれば、当該記録媒体に記
録されたプログラムをコンピュータに読み取らせて実行
することによって、請求項7〜9のいずれか一つに記載
されたプログラムをコンピュータを利用して実現するこ
とができ、これら各プログラムと同様の効果を得ること
ができる。
【0041】
【発明の実施の形態】以下に、本発明にかかる相互作用
部位予測装置、相互作用部位予測方法、プログラム、お
よび、記録媒体の実施の形態を図面に基づいて詳細に説
明する。なお、この実施の形態によりこの発明が限定さ
れるものではない。
【0042】[本発明の概要]以下、本発明の概要につ
いて説明し、その後、本発明の構成および処理等につい
て詳細に説明する。図1は本発明の基本原理を示す原理
構成図である。
【0043】本発明は、概略的に、以下の基本的特徴を
有する。すなわち、本発明は、断片構造クラスターを用
いて相互作用部位を予測すること、断片構造の予測結果
から相互作用部位を予測すること、様々な断片構造予測
の予測結果の差異から相互作用予測部位を予測するこ
と、断片構造の予測結果の差異が表れる部位が全体構造
と部分構造におけるフラストレーションの高いストレス
部位であると予測すること、構造的なストレス部位(比
較的構造的に不安定な部分)は他と相互作用する部位で
ある可能性があると予測すること等を特徴とする。以下
に、本発明の基本原理を説明する。
【0044】まず、利用者は、目的のタンパク質の一次
配列情報である目的配列データ10を本発明の相互作用
部位予測装置に入力する。この目的配列データ10の入
力は、例えば、利用者がSWISS−PROTやPIR
やTrEMBL等の外部のデータベースに登録された一
次配列情報を選択することにより入力してもよく、ま
た、所望の一次配列情報を直接入力してもよい。
【0045】ついで、本発明の相互作用部位予測装置
は、タンパク質の一次配列情報から当該タンパク質の断
片構造を予測する断片構造予測プログラム20a〜20
dに対して入力された目的配列データ10の断片構造予
測シミュレーションを実行する。ここで、断片構造予測
プログラム20a〜20dは、例えば、文献1または文
献2に開示された手法や、スレッディング法や、アブイ
ニシオ法などを利用して断片構造予測シミュレーション
を実行する。
【0046】ついで、本発明の相互作用部位予測装置
は、各断片構造予測プログラム20a〜20dの断片構
造予測結果30a〜30dを比較する(60)。すなわ
ち、目的配列データ10に対応する各予測プログラムの
実行結果を並置して比較する(30a〜30d)。
【0047】そして、本発明の相互作用部位予測装置
は、この比較結果に基づいて、目的のタンパク質の一次
配列情報の局所部分のフラストレーションを計算する
(70)。すなわち、比較結果から各予測結果データ
(30a〜30b)で異なる断片構造を予測した局所部
分を抽出して、その部分のフラストレーションを計算す
る。既存の断片構造予測プログラム20a〜20dは、
基本的には一次配列情報のうち一部の局所配列を見て予
測を行うが、断片構造はタンパク質の全体の構造との関
係で最終的に決定されるので、全体と局所部分との間に
整合性が取れない部位、すなわちフラストレーションが
大きい局所的部位では断片構造予測結果は外れる場合が
多い。従って、複数のプログラムにおいて予測結果が異
なる局所部分については、フラストレーションが大きい
と仮定することができる。
【0048】フラストレーションの計算方法は、例え
ば、異なる予測結果データを出力した断片構造予測プロ
グラム数に応じてフラストレーションを増減してもよ
く、あるいは、異なる予測結果のそれぞれの構造におけ
る確信度の平均値や分散値などに応じてフラストレーシ
ョンを増減してもよく、また、その部分のアミノ酸配列
を分子力学または分子動力学などの手法を用いてエネル
ギー量を求めそのエネルギー量を用いてフラストレーシ
ョンを計算してもよい。
【0049】そして、本発明の相互作用部位予測装置
は、計算された局所部分のフラストレーションにより目
的のタンパク質の相互作用部位を予測する(80)。す
なわち、例えば、一定の閾値を超えるフラストレーショ
ンが存在する局所部分(61)を相互作用部位と予測す
る。
【0050】また、本発明の相互作用部位予測装置は、
例えば、PDBやSCOPなどの外部のデータベースに
目的のタンパク質の立体構造データが登録されている場
合にはその立体構造データ40を取得し、予測結果の比
較において用いる。すなわち、目的のタンパク質が実際
に採る立体構造データ40と、予測プログラムの予測結
果データ30a〜30dとを比較する。
【0051】そして、実際の立体構造データ40と予測
プログラムの予測結果データ30a〜30dとが異なっ
ている部分については、高いフラストレーションを計算
する。タンパク質の立体構造データが分かっている場
合、すなわち、既存のPDBなどに立体構造データが登
録されているタンパク質は、その全体構造が既知である
ため、様々な断片構造予測手法の予測結果とその実際の
構造との差を見ることにより、より明確にフラストレー
ションのある局所部位(相互作用部位になっている確率
の高い部位)を見つけることが可能になる。例えば、実
際の立体構造データ40と異なる予測結果データを出力
した断片構造予測プログラム数に応じてフラストレーシ
ョンを増減してもよい。
【0052】さらに、本発明の相互作用部位予測装置
は、断片構造予測プログラム20a〜20dの断片構造
予測結果データ30a〜30dに対する確信度を示す確
信度情報50を設定する。すなわち、断片構造予測プロ
グラム20a〜20dのシミュレーション精度を実際の
立体構造データなどに基づいて設定する。
【0053】そして、本発明の相互作用部位予測装置
は、設定された確信度情報および比較結果に基づいて、
局所部分の上記フラストレーションを計算する。すなわ
ち、確信度情報が高い(すなわち、シミュレーションの
精度の高い)プログラムによる断片構造予測結果データ
に対する重みを高くすることにより、フラストレーショ
ン計算においてシミュレーション結果に対する確信度を
反映させることができる。
【0054】すなわち、本発明は、それぞれの手法にお
ける構造予測の結果とその構造への確信度を解析し、部
分配列→部分構造の相関が弱い部分や、様々なクラスタ
ーでの結果において確信度の高い結果がまちまちである
部分や、フォールディング・シミュレーション(fol
ding simulation)を実行した後、確信
度が高く予想された初期構造とは異なる構造を取ってい
る部分や、まわりの局所構造と整合性を欠く部分等に対
して高いフラストレーションとなるように候補部位に関
する得点を計算し、計算した結果をもとに相互作用部位
として可能性の高い部位を順に得点をつけて抽出するこ
とができる。
【0055】[システム構成]まず、本システムの構成
について説明する。図2は、本発明が適用される本シス
テムの構成の一例を示すブロック図であり、該構成のう
ち本発明に関係する部分のみを概念的に示している。本
システムは、概略的に、相互作用部位予測装置100
と、配列情報や立体構造等に関する外部データベースお
よびホモロジー検索や断片構造予測等の外部プログラム
等を提供する外部システム200とを、ネットワーク3
00を介して通信可能に接続して構成されている。
【0056】図2においてネットワーク300は、相互
作用部位予測装置100と外部システム200とを相互
に接続する機能を有し、例えば、インターネット等であ
る。
【0057】図2において外部システム200は、ネッ
トワーク300を介して、相互作用部位予測装置100
と相互に接続され、利用者に対して配列情報や立体構造
等に関する外部データベース、および、ホモロジー検索
やモチーフ検索や断片構造予測等の外部プログラムを実
行するウェブサイトを提供する機能を有する。
【0058】ここで、外部システム200は、WEBサ
ーバやASPサーバ等として構成してもよく、そのハー
ドウェア構成は、一般に市販されるワークステーショ
ン、パーソナルコンピュータ等の情報処理装置およびそ
の付属装置により構成してもよい。また、外部システム
200の各機能は、外部システム200のハードウェア
構成中のCPU、ディスク装置、メモリ装置、入力装
置、出力装置、通信制御装置等およびそれらを制御する
プログラム等により実現される。
【0059】図2において相互作用部位予測装置100
は、概略的に、相互作用部位予測装置100の全体を統
括的に制御するCPU等の制御部102、通信回線等に
接続されるルータ等の通信装置(図示せず)に接続され
る通信制御インターフェース部104、入力装置112
および出力装置114に接続される入出力制御インター
フェース部108、および、各種のデータベースやテー
ブル(予測結果データベース106a〜タンパク質構造
データベース106c)を格納する記憶部106を備え
て構成されており、これら各部は任意の通信路を介して
通信可能に接続されている。さらに、この相互作用部位
予測装置100は、ルータ等の通信装置および専用線等
の有線または無線の通信回線を介して、ネットワーク3
00に通信可能に接続されている。
【0060】図2において記憶部106に格納される各
種のデータベースやテーブル(予測結果データベース1
06a〜タンパク質構造データベース106c)は、固
定ディスク装置等のストレージ手段であり、各種処理に
用いる各種のプログラムやテーブルやファイルやデータ
ベースやウェブページ用ファイル等を格納する。
【0061】これら記憶部106の各構成要素のうち、
予測結果データベース106aは、断片構造予測プログ
ラムの予測結果などに関する情報を格納する予測結果情
報格納手段である。図3は、予測結果データベース10
6aに格納される情報の一例を示す図である。
【0062】この予測結果データベース106aに格納
される情報は、図3に示すように、目的のタンパク質の
一次配列情報(アミノ酸配列情報)である目的配列デー
タ、タンパク質構造データベースから取得した目的配列
データの立体構造データ、および、各断片構造予測プロ
グラムの予測結果データを相互に関連付けて構成されて
いる。
【0063】また、確信度情報データベース106b
は、断片構造予測プログラムの断片構造予測結果データ
に対する確信度を示す確信度情報を格納する予測結果情
報格納手段である。例えば、シミュレーション結果の精
度の標準的な値(例えば、断片構造予測結果と実際の立
体構造データとの一致率であるシミュレーション精度が
60%の場合など)の確信度を1とし、標準値より精度
が高い場合にはその精度に応じて確信度の値を大きく
し、また、標準値より精度が低い場合にはその精度に応
じて確信度の値を小さくしてもよい。さらに、断片構造
予測プログラムごと、構造ごと、各配列におけるアミノ
酸ごとに確信度を設定してもよい。すなわち、例えば、
ある断片構造予測プログラムがある配列のあるアミノ酸
についてその断片構造を予測するとき、その構造がa構
造である確信度、b構造である確信度等をそれぞれ別々
に設定してもよい。
【0064】また、タンパク質構造データベース106
cは、タンパク質の立体構造データを格納したデータベ
ースである。タンパク質構造データベース106cは、
インターネットを経由してアクセスする外部のタンパク
質構造データベースであってもよく、また、これらのデ
ータベースをコピーしたり、オリジナルの配列情報を格
納したり、さらに独自のアノテーション情報等を付加し
たりして作成したインハウスデータベースであってもよ
い。
【0065】また、図2において、通信制御インターフ
ェース部104は、相互作用部位予測装置100とネッ
トワーク300(またはルータ等の通信装置)との間に
おける通信制御を行う。すなわち、通信制御インターフ
ェース部104は、他の端末と通信回線を介してデータ
を通信する機能を有する。
【0066】また、図2において、入出力制御インター
フェース部108は、入力装置112や出力装置114
の制御を行う。ここで、出力装置114としては、モニ
タ(家庭用テレビを含む)の他、スピーカを用いること
ができる(なお、以下においては出力装置をモニタとし
て記載する)。また、入力装置112としては、キーボ
ード、マウス、および、マイク等を用いることができ
る。また、モニタも、マウスと協働してポインティング
デバイス機能を実現する。
【0067】また、図2において、制御部102は、O
S(Operating System)等の制御プロ
グラム、各種の処理手順等を規定したプログラム、およ
び所要データを格納するための内部メモリを有し、これ
らのプログラム等により、種々の処理を実行するための
情報処理を行う。制御部102は、機能概念的に、目的
配列入力部102a、断片構造予測プログラム実行部1
02b、断片構造予測プログラム102c、予測結果比
較部102d、フラストレーション計算部102e、相
互作用部位予測部102f、立体構造データ取得部10
2g、および、確信度情報設定部102hを備えて構成
されている。
【0068】このうち、目的配列入力部102aは、目
的のタンパク質の一次配列情報(目的配列データ)を入
力する入力手段である。また、断片構造予測プログラム
実行部102bは、断片構造予測プログラムに対して入
力手段により入力された一次配列情報(目的配列デー
タ)の断片構造予測シミュレーションを実行させる断片
構造予測プログラム実行手段である。また、断片構造予
測プログラム102cは、タンパク質の一次配列情報か
ら当該タンパク質の断片構造を予測する断片構造予測プ
ログラムである。
【0069】また、予測結果比較部102dは、断片構
造予測プログラムの断片構造予測結果を比較する予測結
果比較手段、および、断片構造予測プログラムの断片構
造予測結果と立体構造データ取得手段により取得した立
体構造データとを比較する予測結果比較手段である。ま
た、フラストレーション計算部102eは、予測結果比
較手段による比較結果に基づいて、目的のタンパク質の
一次配列情報(目的配列データ)の局所部分のフラスト
レーションを計算するフラストレーション計算手段、お
よび、確信度情報設定手段により設定された確信度情報
および比較結果に基づいて、局所部分のフラストレーシ
ョンを計算するフラストレーション計算手段である。
【0070】また、相互作用部位予測部102fは、フ
ラストレーション計算手段により計算された局所部分の
フラストレーションにより目的のタンパク質の相互作用
部位を予測する相互作用部位予測手段である。また、立
体構造データ取得部102gは、目的のタンパク質の立
体構造データを取得する立体構造データ取得手段であ
る。また、確信度情報設定部102hは、断片構造予測
プログラムの断片構造予測結果に対する確信度を示す確
信度情報を設定する確信度情報設定手段である。なお、
これら各部によって行なわれる処理の詳細については、
後述する。
【0071】[システムの処理]次に、このように構成
された本実施の形態における本システムの処理の一例に
ついて、以下に図4〜図7を参照して詳細に説明する。
【0072】[メイン処理]次に、メイン処理の詳細に
ついて図4を参照して説明する。図4は、本実施の形態
における本システムのメイン処理の一例を示すフローチ
ャートである。
【0073】まず、相互作用部位予測装置100は、目
的配列入力部102aの処理により、利用者に対して目
的のタンパク質の一次配列情報(目的配列データ)を入
力させる(ステップSA−1)。
【0074】ついで、相互作用部位予測装置100は、
立体構造データ取得部102gの処理により、利用者が
入力した目的配列データの立体構造データを取得する
(ステップSA−2)。
【0075】ここで、ステップSA−2において、立体
構造データ取得部102gにより実行される立体構造デ
ータ取得処理の詳細について図5を参照して説明する。
図5は、本実施の形態における本システムの立体構造デ
ータ取得処理の一例を示すフローチャートである。
【0076】まず、立体構造データ取得部102gは、
タンパク質構造データベース106cを参照して目的配
列データが登録されているか判定する(ステップSB−
1)。ステップSB−1において、目的配列データがタ
ンパク質構造データベース106cに登録されている場
合には、立体構造データ取得部102gは、タンパク質
構造データベース106cから目的配列データの立体構
造データを取得して予測結果データベース106aの所
定の記憶領域に格納する(ステップSB−2)。
【0077】一方、ステップSB−1において、目的配
列データがタンパク質構造データベース106cに登録
されていない場合には、立体構造データ取得部102g
は、目的配列データに類似する配列のタンパク質の立体
構造データがタンパク質構造データベース106cに存
在するか判断する(ステップSB−3)。すなわち、立
体構造データ取得部102gは、例えば、配列間のホモ
ロジーを判定するプログラムを用いて、目的配列データ
と、タンパク質構造データベース106cに登録された
構造既知のタンパク質に対応する配列データとを比較し
て、高い相同性を有する配列データ(目的配列データの
一部分に対応するものであってもよい)が存在するか否
かを判断する。
【0078】ステップSB−3において、目的配列デー
タに類似する配列のタンパク質の立体構造データがタン
パク質構造データベース106cに存在する場合には、
立体構造データ取得部102gは、類似部分の立体構造
データを予測結果データベース106aの所定の記憶領
域に格納する(ステップSB−4)。なお、目的配列デ
ータのうち一部分について立体構造データが存在する場
合には、立体構造データが存在する部分について、当該
立体構造データを予測結果データベース106aに格納
する。
【0079】一方、ステップSB−3において、目的配
列データに類似する配列のタンパク質の立体構造データ
がタンパク質構造データベース106cに存在しない場
合には、立体構造データ取得処理が終了する。
【0080】再び図4に戻り、相互作用部位予測装置1
00は、断片構造予測プログラム実行部102bの処理
により、目的配列データを1つまたは2つ以上の断片構
造予測プログラム102cに実行させる(ステップSA
−3)。すなわち、断片構造予測プログラム実行部10
2bは、例えば、目的配列データを所定のフォーマット
に変換したり、また、目的配列データに所定のヘッダ情
報などを追加したりすることにより、各断片構造予測プ
ログラム102cの入力形式を合わせた後、断片構造予
測プログラム102cを実行する。ここで、断片構造予
測プログラム102cは、相互作用部位予測装置100
の内部に存在するプログラムであってもよく、また、ネ
ットワーク300を介してリモートで実行することがで
きる外部システム200の外部プログラムであってもよ
い。
【0081】ここで、断片構造予測プログラム実行部1
02bは、以下のいずれかの手法により断片構造を求め
てもよい。
【0082】(1)オーソログ(ortholog)相
同性解析 ある遺伝子X、YのオーソログX’、Y’があり、
X’、Y’が相互作用することが既知の場合、X、Yも
相互作用する可能性が高いだろうと考える解析手法であ
る。
【0083】(2)ロゼッタストーン(Rozetta
Stone)法 ある生物種の遺伝子X、Yが、他生物種遺伝子の遺伝子
Zと、例えば、前半部分はXと似ている、後半部分はY
と似ているという状況のとき、進化により以前は一つの
遺伝子ZだったものがX、Yに分離したと考え、XとY
は相互作用する可能性が高いと考える解析手法である。
【0084】(3)スレッディング(threadin
g)法 構造情報から3Dプロファイルを作り、これを用いて配
列とアラインメントを行うことにより、構造予測を行う
手法である。
【0085】(4)トポロジー・フィンガープリント法
(topology fingerprint法) あるタンパク質Aの構造の内外性、距離マップなどを用
いて、その構造のtopology printと呼ば
れるパラメータ(その構造におけるエネルギー関数の係
数等に対応する)を抽出し、このパラメータをタンパク
質Bの配列に適用することにより、アラインメントを行
う手法である。
【0086】(5)モチーフ検索法 モチーフを登録したデータベース(例えば、PROSI
TE、Pfamなど)に登録されているモチーフをキー
にして検索することにより機能(構造)を予測する手法
である。同じ機能モチーフを持っているタンパク質は同
様の機能(構造)をもつ可能性が高いと考える。
【0087】(6)モジュール検索(3Dキーノート)
法 モジュールとは、球状タンパク質においてコンパクトな
構造をとる15残基程度のアミノ酸配列であり、イント
ロンがモジュールの境界とよく対応していると言われて
いることから、色々なタンパク質に存在する共通のモジ
ュール構造からアミノ酸配列のパターンを抽出し、それ
をキーにして検索することにより構造予測を行う手法で
ある。機能に関わるモジュール構造から抽出された特徴
的なアミノ酸配列の類似性は、それらのタンパク質間で
の機能の類似性を意味すると考えられる。
【0088】(7)進化追跡法(Evolutiona
ry trace method) あるタンパク質の立体構造とそのオーソログのマルチプ
ルアラインメントが与えられたとき、配列の変化を進化
的に追うことによって、基質結合部位や、別のタンパク
質との相互作用部位を予測する方法である。
【0089】(8)ホモロジープロファイル法(HMM
法) ある配列Aがあったとき、それのファミリーやオーソロ
グなどの関連タンパク質があり、それらのアラインメン
トがとれた場合に、配列Aまたはそのファミリーなどに
関してプロファイル行列を作成する。これと配列B(あ
るいは配列Bに関しても同様なことを行った配列Bのプ
ロファイル)とのアラインメントをとる手法である。本
手法によれば、配列Aと配列Bとの間のアラインメント
よりも、より遠くの関係を検索することができる。
【0090】(9)Fugue 類縁タンパク質のアミノ酸配列保存性を、立体構造上ど
の部分で保存されているかにより分類し、この情報を用
いて従来のものより感度の高いBLOSUMのような構
造−配列の置換マトリックスを作成する手法である。本
手法によれば、マトリックスを用いてアラインメントす
ることにより、より感度の高いアラインメントが可能と
なる。
【0091】なお、本発明は、これらの手法に限定され
ず、断片構造を予測するいかなる手法を用いてもよい。
【0092】ついで、断片構造予測プログラム実行部1
02bは、各断片構造予測プログラム102cのシミュ
レーション結果である断片構造予測結果を予測結果デー
タベース106aの所定の記憶領域に格納する(ステッ
プSA−4)。
【0093】ついで、相互作用部位予測装置100は、
予測結果比較部102dの処理により、予測結果データ
ベース106aに格納された目的配列データに対する各
断片構造予測プログラム102cの断片構造予測結果を
比較する(ステップSA−5)。すなわち、予測結果比
較部102dは、各断片構造予測プログラム102cの
断片構造予測結果について、目的配列データの先頭から
最後までの各予測結果を比較する。なお、ステップSA
−2において、断片構造予測プログラム実行部102b
が目的配列データに対応する立体構造データを取得でき
た場合、すなわち、予測結果データベース106aに目
的配列データの立体構造データが格納されている場合に
は、立体構造データと各断片構造予測プログラム102
cの断片構造予測結果とを比較する。
【0094】ついで、相互作用部位予測装置100は、
フラストレーション計算部102eの処理により、目的
配列データの局所部分のフラストレーションのスコアを
計算する(ステップSA−6)。ここで、図6は、本シ
ステムのフラストレーション計算部102eにより実行
されるフラストレーション実行処理の一例を示すフロー
チャートである。
【0095】図6に示すように、フラストレーション計
算部102eによるフラストレーションのスコアの計算
方法は、例えば、断片構造予測プログラムが異なる断片
構造予測結果を出力した局所部分について、結果が異な
る断片構造予測プログラムの数に応じてスコアを増減し
てもよく、あるいは、異なる予測結果のそれぞれの構造
における確信度の平均値や分散値などに応じてフラスト
レーションを増減してもよく、また、断片構造予測プロ
グラムが異なる断片構造予測結果を出力した局所部分に
ついて、アミノ酸配列を分子力学または分子動力学など
の手法を用いてエネルギー量を求めそのエネルギー量を
用いてフラストレーションを計算してもよい(ステップ
SC−1)。
【0096】また、フラストレーション計算部102e
は、立体構造データと予測プログラムの断片構造予測結
果とが異なっている部分について、高いフラストレーシ
ョンのスコアを計算してもよい(ステップSC−2)。
例えば、立体構造データと異なる断片構造予測結果を出
力した断片構造予測プログラムの数に応じてスコアを増
減してもよい。
【0097】また、フラストレーション計算部102e
は、確信度情報データベース106bを参照して、予め
確信度情報設定部102hの処理により格納された各断
片構造予測プログラム102cの確信度情報を取得し、
確信度情報に基づいてフラストレーションのスコアを計
算してもよい(ステップSC−3)。すなわち、フラス
トレーション計算部102eは、シミュレーション精度
の高い断片構造予測プログラム102cの断片構造予測
結果に高い重みを付けて、フラストレーションのスコア
を計算する。
【0098】ここで、確信度情報設定部102hによる
確信度情報の設定の一例を示す。まず、確信度情報設定
部102hは、各断片構造予測プログラム102cの断
片構造予測結果と、立体構造データとを比較して、各断
片構造予測プログラム102cの断片構造予測結果の精
度(一致率)を計算する。そして、確信度情報設定部1
02hは、各断片構造予測プログラム102cの精度の
平均値を標準の確信度情報(例えば、1)として設定
し、平均値以上の精度については標準の確信度情報より
も高い値(例えば、1より大きい数)を計算し、平均値
以下の精度については標準の確信度情報よりも低い値
(例えば、1より小さい数)を計算して、確信度情報デ
ータベース106bの所定の記憶領域に格納する。
【0099】なお、確信度情報設定部102hは、各断
片構造予測プログラム102cの確信度情報を各配列中
の各アミノ酸(残基)毎に設定してもよい。すなわち、
各断片構造予測プログラム102cによる配列の予測結
果につき配列中のアミノ酸毎に断片構造予測プログラム
102cの確信度情報を設定してもよい(例えば、配列
中の一番目のアミノ酸について、プログラムAは、a構
造の確信度情報が1.5であり、b構造の確信度情報が
0.7であり、c構造の確信度情報が1.1である
等)。
【0100】また、確信度情報設定部102hは、各断
片構造予測プログラム102cの確信度情報を構造毎に
設定してもよい。すなわち、各断片構造予測プログラム
102cによっては、特定の構造について高い精度を有
するものや低い精度を有するものが存在するため、構造
毎に断片構造予測プログラム102cの確信度情報を設
定してもよい(例えば、プログラムAは、a構造の確信
度情報が1.5であり、b構造の確信度情報が0.7で
あり、c構造の確信度情報が1.1である等)。
【0101】再び図4に戻り、相互作用部位予測装置1
00は、相互作用部位予測部102fの処理により、計
算された局所部分のフラストレーションのスコアにより
目的配列データのうち相互作用部位となる局所部分を予
測する(ステップSA−7)。すなわち、相互作用部位
予測部102fは、例えば、一定の閾値を超えるフラス
トレーションのスコアである局所部分を相互作用部位と
予測する。
【0102】ついで、相互作用部位予測装置100は、
配列データの相互作用部位の予測結果を出力装置114
に出力する(ステップSA−8)。
【0103】ここで、図7は、相互作用部位予測装置1
00の出力装置114に表示される相互作用部位予測結
果の表示画面の一例を示す図である。この図に示すよう
に相互作用部位予測結果の表示画面は、例えば、目的配
列データの配列情報の表示領域MA−1、相互作用部位
と予測される局所部分の表示領域MA−2およびMA−
3、相互領域部位と予測される局所部分のフラストレー
ションのスコアの表示領域MA−4およびMA−5等を
含んで構成されている。これにて、メイン処理が終了す
る。
【0104】[他の実施の形態]さて、これまで本発明
の実施の形態について説明したが、本発明は、上述した
実施の形態以外にも、上記特許請求の範囲に記載した技
術的思想の範囲内において種々の異なる実施の形態にて
実施されてよいものである。例えば、相互作用部位予測
装置100がスタンドアローンの形態で相互作用部位予
測を行う場合を一例に説明したが、相互作用部位予測装
置100とは別筐体で構成されるクライアント端末から
の要求に応じて相互作用部位予測を行い、その予測結果
を当該クライアント端末に返却するように構成してもよ
い。
【0105】また、断片構造予測プログラムが用いる予
測手法は、いかなる方法を用いて予測するものであって
もよい。
【0106】また、実施形態において説明した各処理の
うち、自動的に行なわれるものとして説明した処理の全
部または一部を手動的に行うこともでき、あるいは、手
動的に行なわれるものとして説明した処理の全部または
一部を公知の方法で自動的に行うこともできる。
【0107】この他、上記文書中や図面中で示した処理
手順、制御手順、具体的名称、各種の登録データや検索
条件等のパラメータを含む情報、画面例、データベース
構成については、特記する場合を除いて任意に変更する
ことができる。
【0108】また、相互作用部位予測装置100に関し
て、図示の各構成要素は機能概念的なものであり、必ず
しも物理的に図示の如く構成されていることを要しな
い。例えば、相互作用部位予測装置100の各サーバが
備える処理機能、特に制御部にて行なわれる各処理機能
については、その全部または任意の一部を、CPU(C
entral Processing Unit)およ
び当該CPUにて解釈実行されるプログラムにて実現す
ることができ、あるいは、ワイヤードロジックによるハ
ードウェアとして実現することも可能である。なお、プ
ログラムは、後述する記録媒体に記録されており、必要
に応じて相互作用部位予測装置100に機械的に読み取
られる。
【0109】また、このプログラムは、相互作用部位予
測装置100に対して任意のネットワークを介して接続
されたアプリケーションプログラムサーバに記録されて
もよく、必要に応じてその全部または一部をダウンロー
ドすることも可能である。
【0110】また、記憶部106に格納される各種のデ
ータベース等(予測結果データベース106a〜タンパ
ク質構造データベース106c)は、RAM、ROM等
のメモリ装置、ハードディスク等の固定ディスク装置、
フレキシブルディスク、光ディスク等のストレージ手段
であり、各種処理やウェブサイト提供に用いる各種のプ
ログラムやテーブルやファイルやデータベースやウェブ
ページ用ファイル等を格納する。
【0111】また、相互作用部位予測装置100は、既
知のパーソナルコンピュータ、ワークステーション等の
情報処理端末等の情報処理装置にプリンタやモニタやイ
メージスキャナ等の周辺装置を接続し、該情報処理装置
に本発明の方法を実現させるソフトウェア(プログラ
ム、データ等を含む)を実装することにより実現しても
よい。
【0112】さらに、相互作用部位予測装置100の分
散・統合の具体的形態は図示のものに限られず、その全
部または一部を、各種の負荷等に応じた任意の単位で、
機能的または物理的に分散・統合して構成することがで
きる。例えば、各データベースを独立したデータベース
装置として独立に構成してもよく、また、処理の一部を
CGI(Common Gateway Interf
ace)を用いて実現してもよい。
【0113】また、本発明にかかるプログラムを、コン
ピュータ読み取り可能な記録媒体に格納することもでき
る。ここで、この「記録媒体」とは、フレキシブルディ
スク、光磁気ディスク、ROM、EPROM、EEPR
OM、CD−ROM、MO、DVD等の任意の「可搬用
の物理媒体」や、各種コンピュータシステムに内蔵され
るROM、RAM、HD等の任意の「固定用の物理媒
体」、あるいは、LAN、WAN、インターネットに代
表されるネットワークを介してプログラムを送信する場
合の通信回線や搬送波のように、短期にプログラムを保
持する「通信媒体」を含むものとする。
【0114】また、「プログラム」とは、任意の言語や
記述方法にて記述されたデータ処理方法であり、ソース
コードやバイナリコード等の形式を問わない。なお、
「プログラム」は必ずしも単一的に構成されるものに限
られず、複数のモジュールやライブラリとして分散構成
されるものや、OS(Operating Syste
m)に代表される別個のプログラムと協働してその機能
を達成するものをも含む。なお、実施の形態に示した各
装置において記録媒体を読み取るための具体的な構成、
読み取り手順、あるいは、読み取り後のインストール手
順等については、周知の構成や手順を用いることができ
る。
【0115】また、ネットワーク300は、相互作用部
位予測装置100と外部システム200とを相互に接続
する機能を有し、例えば、インターネットや、イントラ
ネットや、LAN(有線/無線の双方を含む)や、VA
Nや、パソコン通信網や、公衆電話網(アナログ/デジ
タルの双方を含む)や、専用回線網(アナログ/デジタ
ルの双方を含む)や、CATV網や、IMT2000方
式、GSM方式またはPDC/PDC―P方式等の携帯
回線交換網/携帯パケット交換網や、無線呼出網や、B
luetooth等の局所無線網や、PHS網や、C
S、BSまたはISDB等の衛星通信網等のうちいずれ
かを含んでもよい。すなわち、本システムは、有線・無
線を問わず任意のネットワークを介して、各種データを
送受信することができる。
【0116】
【発明の効果】以上詳細に説明したように、本発明によ
れば、目的のタンパク質の一次配列情報を入力し、タン
パク質の一次配列情報から当該タンパク質の断片構造を
予測する断片構造予測プログラムに対して入力された一
次配列情報の断片構造予測シミュレーションを実行さ
せ、断片構造予測プログラムの断片構造予測結果を比較
し、比較結果に基づいて、目的のタンパク質の一次配列
情報の局所部分のフラストレーションを計算し、計算さ
れた局所部分のフラストレーションにより目的のタンパ
ク質の相互作用部位を予測するので、タンパク質の一次
配列情報においてフラストレーションのある局所部位を
発見することにより相互作用部位を効果的に予測するこ
とができる相互作用部位予測装置、相互作用部位予測方
法、プログラム、および、記録媒体を提供することがで
きる。
【0117】また、本発明によれば、目的のタンパク質
の一次配列情報を入力し、目的のタンパク質の立体構造
データを取得し、タンパク質の一次配列情報から当該タ
ンパク質の断片構造を予測する断片構造予測プログラム
に対して入力された一次配列情報の断片構造予測シミュ
レーションを実行させ、断片構造予測プログラムの断片
構造予測結果と、取得した立体構造データとを比較し、
比較結果に基づいて、目的のタンパク質の一次配列情報
の局所部分のフラストレーションを計算し、計算された
局所部分のフラストレーションにより目的のタンパク質
の相互作用部位を予測するので、断片構造予測プログラ
ムの予測結果と目的のタンパク質の実際の断片構造との
差を見ることにより、より明確にフラストレーションの
ある局所部位(相互作用部位になっている確率の高い部
位)を見つけることが可能になる相互作用部位予測装
置、相互作用部位予測方法、プログラム、および、記録
媒体を提供することができる。
【0118】さらに、本発明によれば、断片構造予測プ
ログラムの断片構造予測結果に対する確信度を示す確信
度情報を設定し、設定された確信度情報および比較結果
に基づいて、局所部分のフラストレーションを計算する
ので、確信度情報が高い(すなわち、シミュレーション
の精度の高い)プログラムによる断片構造予測結果デー
タに対する重みを高くすることにより、フラストレーシ
ョン計算においてシミュレーション結果に対する確信度
を反映させることができる相互作用部位予測装置、相互
作用部位予測方法、プログラム、および、記録媒体を提
供することができる。
【図面の簡単な説明】
【図1】本発明の基本原理を示す原理構成図である。
【図2】本発明が適用される本システムの構成の一例を
示すブロック図である。
【図3】予測結果データベース106aに格納される情
報の一例を示す図である。
【図4】本実施の形態における本システムのメイン処理
の一例を示すフローチャートである。
【図5】本実施の形態における本システムの立体構造デ
ータ取得処理の一例を示すフローチャートである。
【図6】本システムのフラストレーション計算部102
eにより実行されるフラストレーション実行処理の一例
を示すフローチャートである。
【図7】相互作用部位予測装置100の出力装置114
に表示される相互作用部位予測結果の表示画面の一例を
示す図である。
【符号の説明】
10 目的配列データ 20 断片構造予測プログラム 30 断片構造予測結果データ 40 立体構造データ 50 確信度情報 100 相互作用部位予測装置 102 制御部 102a 目的配列入力部 102b 断片構造予測プログラム実行部 102c 断片構造予測プログラム 102d 予測結果比較部 102e フラストレーション計算部 102f 相互作用部位予測部 102g 立体構造データ取得部 102h 確信度情報設定部 104 通信制御インターフェース部 106 記憶部 106a 予測結果データベース 106b 確信度情報データベース 106c タンパク質構造データベース 108 入出力制御インターフェース部 112 入力装置 114 出力装置 200 外部システム 300 ネットワーク

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 目的のタンパク質の一次配列情報を入力
    する入力手段と、 タンパク質の一次配列情報から当該タンパク質の断片構
    造を予測する断片構造予測プログラムに対して上記入力
    手段により入力された上記一次配列情報の断片構造予測
    シミュレーションを実行させる断片構造予測プログラム
    実行手段と、 上記断片構造予測プログラム実行手段による上記断片構
    造予測プログラムの断片構造予測結果を比較する予測結
    果比較手段と、 上記予測結果比較手段による比較結果に基づいて、上記
    目的のタンパク質の一次配列情報の局所部分のフラスト
    レーションを計算するフラストレーション計算手段と、 上記フラストレーション計算手段により計算された上記
    局所部分の上記フラストレーションにより上記目的のタ
    ンパク質の相互作用部位を予測する相互作用部位予測手
    段と、 を備えたことを特徴とする相互作用部位予測装置。
  2. 【請求項2】 目的のタンパク質の一次配列情報を入力
    する入力手段と、 上記目的のタンパク質の立体構造データを取得する立体
    構造データ取得手段と、 タンパク質の一次配列情報から当該タンパク質の断片構
    造を予測する断片構造予測プログラムに対して上記入力
    手段により入力された上記一次配列情報の断片構造予測
    シミュレーションを実行させる断片構造予測プログラム
    実行手段と、 上記断片構造予測プログラム実行手段による上記断片構
    造予測プログラムの断片構造予測結果と、上記立体構造
    データ取得手段により取得した上記立体構造データとを
    比較する予測結果比較手段と、 上記予測結果比較手段による比較結果に基づいて、上記
    目的のタンパク質の一次配列情報の局所部分のフラスト
    レーションを計算するフラストレーション計算手段と、 上記フラストレーション計算手段により計算された上記
    局所部分の上記フラストレーションにより上記目的のタ
    ンパク質の相互作用部位を予測する相互作用部位予測手
    段と、 を備えたことを特徴とする相互作用部位予測装置。
  3. 【請求項3】 上記断片構造予測プログラムの上記断片
    構造予測結果に対する確信度を示す確信度情報を設定す
    る確信度情報設定手段、 をさらに備え、 上記フラストレーション計算手段は、上記確信度情報設
    定手段により設定された上記確信度情報および上記比較
    結果に基づいて、上記局所部分の上記フラストレーショ
    ンを計算することを特徴とする請求項1または2に記載
    の相互作用部位予測装置。
  4. 【請求項4】 目的のタンパク質の一次配列情報を入力
    する入力ステップと、 タンパク質の一次配列情報から当該タンパク質の断片構
    造を予測する断片構造予測プログラムに対して上記入力
    ステップにより入力された上記一次配列情報の断片構造
    予測シミュレーションを実行させる断片構造予測プログ
    ラム実行ステップと、 上記断片構造予測プログラム実行ステップによる上記断
    片構造予測プログラムの断片構造予測結果を比較する予
    測結果比較ステップと、 上記予測結果比較ステップによる比較結果に基づいて、
    上記目的のタンパク質の一次配列情報の局所部分のフラ
    ストレーションを計算するフラストレーション計算ステ
    ップと、 上記フラストレーション計算ステップにより計算された
    上記局所部分の上記フラストレーションにより上記目的
    のタンパク質の相互作用部位を予測する相互作用部位予
    測ステップと、 を含むことを特徴とする相互作用部位予測方法。
  5. 【請求項5】 目的のタンパク質の一次配列情報を入力
    する入力ステップと、 上記目的のタンパク質の立体構造データを取得する立体
    構造データ取得ステップと、 タンパク質の一次配列情報から当該タンパク質の断片構
    造を予測する断片構造予測プログラムに対して上記入力
    ステップにより入力された上記一次配列情報の断片構造
    予測シミュレーションを実行させる断片構造予測プログ
    ラム実行ステップと、 上記断片構造予測プログラム実行ステップによる上記断
    片構造予測プログラムの断片構造予測結果と、上記立体
    構造データ取得ステップにより取得した上記立体構造デ
    ータとを比較する予測結果比較ステップと、 上記予測結果比較ステップによる比較結果に基づいて、
    上記目的のタンパク質の一次配列情報の局所部分のフラ
    ストレーションを計算するフラストレーション計算ステ
    ップと、 上記フラストレーション計算ステップにより計算された
    上記局所部分の上記フラストレーションにより上記目的
    のタンパク質の相互作用部位を予測する相互作用部位予
    測ステップと、 を含むことを特徴とする相互作用部位予測方法。
  6. 【請求項6】 上記断片構造予測プログラムの上記断片
    構造予測結果に対する確信度を示す確信度情報を設定す
    る確信度情報設定ステップ、 をさらに含み、 上記フラストレーション計算ステップは、上記確信度情
    報設定ステップにより設定された上記確信度情報および
    上記比較結果に基づいて、上記局所部分の上記フラスト
    レーションを計算することを特徴とする請求項4または
    5に記載の相互作用部位予測方法。
  7. 【請求項7】 目的のタンパク質の一次配列情報を入力
    する入力ステップと、 タンパク質の一次配列情報から当該タンパク質の断片構
    造を予測する断片構造予測プログラムに対して上記入力
    ステップにより入力された上記一次配列情報の断片構造
    予測シミュレーションを実行させる断片構造予測プログ
    ラム実行ステップと、 上記断片構造予測プログラム実行ステップによる上記断
    片構造予測プログラムの断片構造予測結果を比較する予
    測結果比較ステップと、 上記予測結果比較ステップによる比較結果に基づいて、
    上記目的のタンパク質の一次配列情報の局所部分のフラ
    ストレーションを計算するフラストレーション計算ステ
    ップと、 上記フラストレーション計算ステップにより計算された
    上記局所部分の上記フラストレーションにより上記目的
    のタンパク質の相互作用部位を予測する相互作用部位予
    測ステップと、 を含むことを特徴とする相互作用部位予測方法をコンピ
    ュータに実行させるためのプログラム。
  8. 【請求項8】 目的のタンパク質の一次配列情報を入力
    する入力ステップと、 上記目的のタンパク質の立体構造データを取得する立体
    構造データ取得ステップと、 タンパク質の一次配列情報から当該タンパク質の断片構
    造を予測する断片構造予測プログラムに対して上記入力
    ステップにより入力された上記一次配列情報の断片構造
    予測シミュレーションを実行させる断片構造予測プログ
    ラム実行ステップと、 上記断片構造予測プログラム実行ステップによる上記断
    片構造予測プログラムの断片構造予測結果と、上記立体
    構造データ取得ステップにより取得した上記立体構造デ
    ータとを比較する予測結果比較ステップと、 上記予測結果比較ステップによる比較結果に基づいて、
    上記目的のタンパク質の一次配列情報の局所部分のフラ
    ストレーションを計算するフラストレーション計算ステ
    ップと、 上記フラストレーション計算ステップにより計算された
    上記局所部分の上記フラストレーションにより上記目的
    のタンパク質の相互作用部位を予測する相互作用部位予
    測ステップと、 を含むことを特徴とする相互作用部位予測方法をコンピ
    ュータに実行させるためのプログラム。
  9. 【請求項9】 上記断片構造予測プログラムの上記断片
    構造予測結果に対する確信度を示す確信度情報を設定す
    る確信度情報設定ステップ、 をさらに含み、 上記フラストレーション計算ステップは、上記確信度情
    報設定ステップにより設定された上記確信度情報および
    上記比較結果に基づいて、上記局所部分の上記フラスト
    レーションを計算することを特徴とする請求項7または
    8に記載のプログラム。
  10. 【請求項10】 上記請求項7〜9のいずれか一つに記
    載されたプログラムを記録したことを特徴とするコンピ
    ュータ読み取り可能な記録媒体。
JP2001398570A 2001-12-27 2001-12-27 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体 Expired - Fee Related JP3802416B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2001398570A JP3802416B2 (ja) 2001-12-27 2001-12-27 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体
EP02792061A EP1460560A4 (en) 2001-12-27 2002-12-27 APPARATUS FOR PREDICTING AN INTERACTION SITE, METHOD FOR PREDICTING AN INTERACTION SITE, PROGRAM AND RECORDING MEDIUM THEREOF
PCT/JP2002/013833 WO2003056462A1 (fr) 2001-12-27 2002-12-27 Appareil de prediction d'un site d'interaction, procede de prediction d'un site d'interaction, programme et support d'enregistrement associes
US10/500,006 US20050067848A1 (en) 2001-12-27 2002-12-27 Apparatus for predicting interaction site, method of predicting interaction site, program and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001398570A JP3802416B2 (ja) 2001-12-27 2001-12-27 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体

Publications (2)

Publication Number Publication Date
JP2003196290A true JP2003196290A (ja) 2003-07-11
JP3802416B2 JP3802416B2 (ja) 2006-07-26

Family

ID=19189363

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001398570A Expired - Fee Related JP3802416B2 (ja) 2001-12-27 2001-12-27 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体

Country Status (4)

Country Link
US (1) US20050067848A1 (ja)
EP (1) EP1460560A4 (ja)
JP (1) JP3802416B2 (ja)
WO (1) WO2003056462A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003107218A1 (ja) * 2002-05-31 2003-12-24 セレスター・レキシコ・サイエンシズ株式会社 相互作用予測装置
JP2007265268A (ja) * 2006-03-29 2007-10-11 Fujitsu Ltd 抗原決定基予測プログラム、抗原決定基予測装置、および抗原決定基予測方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0325817D0 (en) * 2003-11-05 2003-12-10 Univ Cambridge Tech Method and apparatus for assessing polypeptide aggregation

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3073092B2 (ja) * 1992-03-31 2000-08-07 富士通株式会社 蛋白質分子立体構造解析装置
NZ510230A (en) * 1998-08-25 2004-01-30 Scripps Research Inst Predicting protein function by electronic comparison of functional site descriptors
AU2352601A (en) * 2000-01-05 2001-07-16 Structural Bioinformatics Advanced Technologies A/S Computer predictions of molecules

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003107218A1 (ja) * 2002-05-31 2003-12-24 セレスター・レキシコ・サイエンシズ株式会社 相互作用予測装置
JP2007265268A (ja) * 2006-03-29 2007-10-11 Fujitsu Ltd 抗原決定基予測プログラム、抗原決定基予測装置、および抗原決定基予測方法

Also Published As

Publication number Publication date
US20050067848A1 (en) 2005-03-31
JP3802416B2 (ja) 2006-07-26
EP1460560A4 (en) 2007-01-24
WO2003056462A1 (fr) 2003-07-10
EP1460560A1 (en) 2004-09-22

Similar Documents

Publication Publication Date Title
Wang et al. Improved detection of DNA-binding proteins via compression technology on PSSM information
Li et al. Prediction of protein domain with mRMR feature selection and analysis
Xu et al. Identification of DNA-binding proteins by incorporating evolutionary information into pseudo amino acid composition via the top-n-gram approach
Topf et al. Refinement of protein structures by iterative comparative modeling and CryoEM density fitting
Benos et al. Additivity in protein–DNA interactions: how good an approximation is it?
Blaabjerg et al. Rapid protein stability prediction using deep learning representations
Yang et al. Accurate disulfide-bonding network predictions improve ab initio structure prediction of cysteine-rich proteins
Truong et al. Funneling and frustration in the energy landscapes of some designed and simplified proteins
Basu et al. Proteus: a random forest classifier to predict disorder-to-order transitioning binding regions in intrinsically disordered proteins
Cheung et al. De novo protein structure prediction using ultra-fast molecular dynamics simulation
Singh et al. Application of docking methodologies to modeled proteins
Nanni et al. An empirical study on the matrix-based protein representations and their combination with sequence-based approaches
KR102138165B1 (ko) 국가, 민족, 및 인종별 표준게놈지도를 이용한 정체성 분석 서비스 제공 방법
Zheng et al. Protein structure prediction constrained by solution X-ray scattering data and structural homology identification
Xu et al. OPUS-Rota3: improving protein side-chain modeling by deep neural networks and ensemble methods
JP2003330934A (ja) 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体
JP2003196290A (ja) 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体
Sacan et al. LFM-Pro: a tool for detecting significant local structural sites in proteins
Kann et al. A structure-based method for protein sequence alignment
Xiao et al. iCataly-PseAAC: identification of enzymes catalytic sites using sequence evolution information with grey model GM (2, 1)
Woo et al. MONACO: accurate biological network alignment through optimal neighborhood matching between focal nodes
JP2003196575A (ja) 蛋白質構造予測装置、蛋白質構造予測方法、プログラム、および、記録媒体
JP2003196576A (ja) 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体
JP2004295606A (ja) 遺伝子機能推定装置、遺伝子機能推定方法、および、プログラム
Zaki Protein-protein interaction prediction using homology and inter-domain linker region information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060427

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100512

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110512

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120512

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130512

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees