JPH07206894A - 蛋白質の立体構造の予測精度演算方法及び予測精度演算装置 - Google Patents

蛋白質の立体構造の予測精度演算方法及び予測精度演算装置

Info

Publication number
JPH07206894A
JPH07206894A JP6002461A JP246194A JPH07206894A JP H07206894 A JPH07206894 A JP H07206894A JP 6002461 A JP6002461 A JP 6002461A JP 246194 A JP246194 A JP 246194A JP H07206894 A JPH07206894 A JP H07206894A
Authority
JP
Japan
Prior art keywords
atom
protein
target protein
amino acid
dimensional structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6002461A
Other languages
English (en)
Other versions
JP2930851B2 (ja
Inventor
Yasushi Kubota
綏 窪田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ADVANCED TECHNOL INST KK
ADVANCED TECHNOL INSUTEITEYUUTO KK
Original Assignee
ADVANCED TECHNOL INST KK
ADVANCED TECHNOL INSUTEITEYUUTO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ADVANCED TECHNOL INST KK, ADVANCED TECHNOL INSUTEITEYUUTO KK filed Critical ADVANCED TECHNOL INST KK
Priority to JP6002461A priority Critical patent/JP2930851B2/ja
Publication of JPH07206894A publication Critical patent/JPH07206894A/ja
Application granted granted Critical
Publication of JP2930851B2 publication Critical patent/JP2930851B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Peptides Or Proteins (AREA)

Abstract

(57)【要約】 【目的】 所定の方法で予測された目的蛋白質の立体構
造の予測精度をアミノ酸配列に沿って定量的に推定して
演算することができる蛋白質の立体構造の予測精度演算
方法及び装置を提供する。 【構成】 立体構造を予測すべき目的蛋白質との相同性
の度合いが高い少なくとも1つの蛋白質を参照蛋白質に
選択し、選択した参照蛋白質のアミノ酸残基の原子の座
標に基づいて目的蛋白質のアミノ酸残基の原子の座標が
所定の方法で予測された目的蛋白質の立体構造の予測精
度を演算する方法及び装置であって、目的蛋白質に含ま
れる複数種類のアミノ酸の物理化学的パラメータに基づ
いて、参照蛋白質と目的蛋白質の併置配列において各対
応するアミノ酸残基に対する相関性を示す相関関数の値
を、複数種類のアミノ酸の物理化学的パラメータから予
め選択された少なくとも1つの選択物理化学的パラメー
タについてそれぞれ計算して平均値を計算して予測精度
として用いる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、蛋白質工学などのバイ
オテクノロジーの分野における蛋白質の立体構造の予測
精度演算方法及び予測精度演算装置に関する。
【0002】
【従来の技術】蛋白質とは、グルタミン酸やリジンなど
表1に示す20種類のアミノ酸がペプチド結合して、例
えば、メチオニン−グルタミン酸−グリシン−リジン−
プロリン−……のように数十乃至数百個のアミノ酸がつ
ながって構成されたものであり、これをアミノ酸配列又
は蛋白質の1次構造と呼んでおり、当該アミノ酸配列
は、蛋白質の最も本質的な情報、特にその立体構造や機
能に関する情報を有する。このように隣接する同士のア
ミノ酸がペプチド結合して蛋白質を構成する単位を特に
アミノ酸残基と呼んでいる。
【0003】
【表1】 ─────────────────────────── アミノ酸の名称 3文字コード 1文字コード ─────────────────────────── グリシン GLY G アラニン ALA A セリン SER S システイン CYS C メチオニン MET M リシン LYS K バリン VAL V トレオニン THR T イソロイシン ILE I ロイシン LEU L アスパラギン酸 ASP D アスパラギン ASN N グルタミン酸 GLU E グルタミン GLN Q アルギニン ARG R プロリン PRO P ヒスチジン HIS H フェニルアラニン PHE F チロシン TYR Y トリプトファン TRP W ───────────────────────────
【0004】一般に、蛋白質のアミノ酸配列を決定する
ことは比較的容易であり、現在までに約2万種類にのぼ
る蛋白質のアミノ酸配列が決定され、データベース化さ
れている。一方、これらの蛋白質の立体構造について
は、従来、例えば、X線結晶解析又はNMRを用いた解
析によって、蛋白質を構成するアミノ酸残基の各原子に
対してその空間座標(x,y,z)が求められている。
以下、この空間座標の蛋白質のデータベースをPDB
(Protein Data Bank)という。従って、これらの立体
構造が既知である蛋白質から20種類のアミノ酸残基間
の相対距離に関する統計データを計算することができ
る。
【0005】一方、近年、上記X線解析によって決定さ
れた蛋白質の立体構造のデータの増加に伴って、予測目
的とする蛋白質(以下、目的蛋白質という。)のアミノ
酸配列と類似の、すなわち相同性(ホモロジー)がある
立体構造が既知である参照とすべき蛋白質(以下、参照
蛋白質という。)を見つけ出す可能性が高くなりつつあ
る。このような状況のもとで、参照蛋白質の立体構造を
参照することによって、目的蛋白質の立体構造を予測す
るというホモロジーモデリングの手法が提案されてい
る。すなわち、アミノ酸配列が類似していれば、立体構
造もよく似ているであろうという仮定に基づいている。
【0006】上記ホモロジーモデリングの手法の一例と
して、参照蛋白質を構成する主要な原子であってアミノ
残基の中心を成すα炭素原子(以下、Cα原子とい
う。)の3次元座標を用いる方法が提案されている。当
該Cα原子の絶対座標は、蛋白質分子の向きや位置に依
存するために、上記3次元座標の計算がたいへん複雑に
なるという問題点があった。
【0007】一方、クリッペン(G.M.Crippen)とヘー
ベル(T.Havel)はCα原子間の相対距離からメトリッ
ク行列を求め、この固有値問題を解くことにより、大き
い順で上位3つの固有値からCα原子の3次元座標を求
めるという、いわゆる距離の幾何学(distance geometr
y)による方法を提案している。しかしながら、かかる
方法では得られた蛋白質が実際のものより縮小されると
いう問題点があった。
【0008】この問題点を解決するために、参照蛋白質
の2つのCα原子間の相対距離を用いて、目的蛋白質の
立体構造を予測する方法が、例えば、輪湖博(Hiroshi
Wako)とハロルド・エイ・シェラガ(Harold A.Scherag
a)による次の文献において提案されている(以下、輪
湖・シェラガの方法という。)。 “Distance-Conatraint Approach to Protein Folding.
I. StatisticalAnalysis of Protein Conformations i
n Terms of Distances Between Residues”,Journal o
f Protein Chemistry, Vol.1,No.1,pp5-45,1982(以
下、文献1という。)
【0009】しかしながら、文献1において開示された
輪湖・シェラガの方法においては、X線結晶解析及びN
MRを用いた解析によって得られた参照蛋白質の立体構
造に基づいた平均的な統計データを使用するために、予
測したい実際の蛋白質の座標と大きなずれを生じ、実際
の立体構造を予測することができなかった。
【0010】この問題点を解決するために、本発明者
は、特願平5−252895号において、蛋白質の立体
構造の予測演算方法及び予測演算装置を提案した。当該
演算方法及び演算装置は、アミノ酸残基の原子の座標が
既知の蛋白質のうち、立体構造を予測する目的蛋白質と
の相同性の度合いが高い少なくとも1つの蛋白質を参照
蛋白質に選択し、上記選択した参照蛋白質のアミノ酸残
基の原子の座標に基づいて上記目的蛋白質のアミノ酸残
基の原子の座標を予測演算する蛋白質の立体構造の予測
演算方法であって、上記参照蛋白質と上記目的蛋白質と
の間のアミノ酸配列を比較することによって相同な複数
の残基ペアを切り出し、上記切り出した複数の残基ペア
に基づいて上記参照蛋白質における互いに残基番号が異
なる各残基の原子間の相対距離を計算して上記目的蛋白
質の対応する第1の相対距離に設定し、所定の目的蛋白
質の初期の立体構造の座標に基づいて上記初期の立体構
造における互いに残基番号が異なる各残基の原子間の第
2の相対距離を計算し、上記目的蛋白質における互いに
残基番号が異なる各残基の原子間に関する上記第1の相
対距離とそれに対応する上記第2の相対距離との差の二
乗の和が最小になるように最適化を行って上記目的蛋白
質のアミノ酸残基の原子の座標を予測演算することを特
徴としている。
【0011】
【発明が解決しようとする課題】ところで、蛋白質の立
体構造を、例えば、本発明者の上記予測演算方法等の、
ホモロジーモデリングなどの手法により予測した場合、
X結晶解析などによる実際の立体構造からのズレを示す
偏差(deviation)は、アミノ酸配列に沿って一様では
ないことが知られている。通常、立体構造を予測すべき
目的蛋白質は、X線結晶解析などの結果が知られていな
いので、アミノ酸配列の情報から局所的な予測精度を推
定することは困難である。一方、目的蛋白質のアミノ酸
配列と相同な(類似な)配列を有する参照蛋白質が見つ
かった場合は、例えばホモロジーモデリングなどの手法
により立体構造が予測されるが、一般的に、アミノ酸配
列が類似していれば立体構造も良く似ていることが期待
されているということは、アミノ酸配列の情報から局所
的な予測精度の推定の可能性を示唆するものである。
【0012】しかしながら、従来の技術では、相同性の
程度がアミノ酸配列に沿って定量的且つ立体構造を反映
するように定義されていないために、アミノ酸配列に沿
った立体構造の局所的な予測精度を定量的に推定するこ
とができなかった。すなわち、相同性の定義がアミノ酸
配列に沿って、定量的且つある領域のアミノ酸配列の相
同性が高ければその領域の立体構造もよく似ているよう
にはなされていないという問題点があった。
【0013】この問題点を解決するためには、この定量
的且つ立体構造を反映していない相同性の定義の問題点
については、本発明者である窪田綏(Yasushi Kubota)
らが相関関数を用いることで解決できることを次の文献
で示している(以下、窪田らの方法という。)。 “Correspondence of Homologies in Amino Acid Seque
nce and Tertiary Structure of Protein Molecules"
,Biochimica et Biophysica Acta,Vol.701,pp242-252
(1982)(以下、文献2という。)
【0014】しかしながら、文献2において開示された
窪田らの方法においては、2つのアミノ酸配列を2次元
的にマトリックスの形で展開しているために、アミノ酸
配列に沿って1次元的に相同性を定量的に表現できない
という難点があった。
【0015】本発明の目的はかかる問題点を解決し、所
定の方法で予測された目的蛋白質の立体構造の予測精度
をアミノ酸配列に沿って定量的に推定して演算すること
ができる蛋白質の立体構造の予測精度演算方法及び予測
精度演算装置を提供することにある。
【0016】
【課題を解決するための手段】本発明に係る請求項1記
載の蛋白質の立体構造の予測演算方法は、アミノ酸残基
の原子の座標が既知の蛋白質のうち、立体構造を予測す
べき目的蛋白質との相同性の度合いが高い少なくとも1
つの蛋白質を参照蛋白質に選択し、上記選択した参照蛋
白質のアミノ酸残基の原子の座標に基づいて上記目的蛋
白質のアミノ酸残基の原子の座標が所定の方法で予測さ
れた目的蛋白質の立体構造の予測精度を演算する蛋白質
の立体構造の予測精度演算方法であって、上記目的蛋白
質に含まれる複数種類のアミノ酸の物理化学的パラメー
タに基づいて、上記参照蛋白質と上記目的蛋白質の併置
配列において各対応するアミノ酸残基に対する相関性を
示す相関関数の値を、上記複数種類のアミノ酸の物理化
学的パラメータから予め選択された少なくとも1つの選
択物理化学的パラメータについてそれぞれ計算し、上記
計算した相関関数の値を平均して計算された相関関数の
平均値を上記予測された目的蛋白質の立体構造の予測精
度として用いることを特徴とする。また、請求項2記載
の蛋白質の立体構造の予測精度演算方法は、請求項1記
載の蛋白質の立体構造の予測精度演算方法において、上
記アミノ酸残基の原子はα炭素原子であることを特徴と
する。さらに、請求項3記載の蛋白質の立体構造の予測
精度演算方法は、請求項1又は2記載の蛋白質の立体構
造の予測精度演算方法において、上記選択物理化学的パ
ラメータは、極性度と、偏比容と、ターン形成度と、α
アミノ基のpK値と、αカルボキシル基のpK値と、突
然変異度とのうちの少なくとも1つを含むことを特徴と
する。
【0017】本発明に係る請求項4記載の蛋白質の立体
構造の予測演算装置は、アミノ酸残基の原子の座標が既
知の蛋白質のうち、立体構造を予測すべき目的蛋白質と
の相同性の度合いが高い少なくとも1つの蛋白質を参照
蛋白質に選択し、上記選択した参照蛋白質のアミノ酸残
基の原子の座標に基づいて上記目的蛋白質のアミノ酸残
基の原子の座標が所定の方法で予測された目的蛋白質の
立体構造の予測精度を演算する蛋白質の立体構造の予測
精度演算装置であって、上記目的蛋白質に含まれる複数
種類のアミノ酸の物理化学的パラメータに基づいて、上
記参照蛋白質と上記目的蛋白質の併置配列において各対
応するアミノ酸残基に対する相関性を示す相関関数の値
を、上記複数種類のアミノ酸の物理化学的パラメータか
ら予め選択された少なくとも1つの選択物理化学的パラ
メータについてそれぞれ計算する第1の計算手段と、上
記第1の計算手段によって計算された相関関数の値を平
均して上記相関関数の平均値を計算する第2の計算手段
とを備え、上記第2の計算手段によって計算された上記
相関関数の平均値を、上記予測された目的蛋白質の立体
構造の予測精度として用いることを特徴とする。また、
請求項5記載の蛋白質の立体構造の予測精度演算装置
は、請求項4記載の蛋白質の立体構造の予測精度演算装
置において、上記アミノ酸残基の原子はα炭素原子であ
ることを特徴とする。さらに、請求項6記載の蛋白質の
立体構造の予測精度演算装置は、請求項4又は5記載の
蛋白質の立体構造の予測精度演算装置において、上記選
択物理化学的パラメータは、極性度と、偏比容と、ター
ン形成度と、αアミノ基のpK値と、αカルボキシル基
のpK値と、突然変異度とのうちの少なくとも1つを含
むことを特徴とする。
【0018】
【実施例】以下、図面を参照して本発明に係る実施例に
ついて説明する。図1は、本発明に係る一実施例である
蛋白質の立体構造の予測演算及び予測精度演算装置の構
成を示すブロック図である。
【0019】本実施例の蛋白質の立体構造の予測演算及
び予測精度演算装置で用いる方法は、大きく分けて以下
のステップを有することを特徴としている。 (a)PDBに基づいて、目的蛋白質のアミノ酸配列と
類似する配列を有しかつ立体構造が既知の参照蛋白質を
検索し、対応する相同な残基ペアが全体に占める割合を
示す相同性の度合いが高い、例えば30%以上である参
照蛋白質候補のうち相同性の度合いが最大(又は比較的
高い)である蛋白質を参照蛋白質に選択する。 (b)選択された参照蛋白質と目的蛋白質との間のアミ
ノ酸配列を比較して、5残基以上の挿入又は欠失の無い
対応する相同な複数の残基ペアを切り出す。 (c)切り出された複数の残基ペアに基づいて、参照蛋
白質に対応する複数の相同な領域間における互いに残基
番号が異なる各残基の原子間の相対距離を計算して、そ
れを目的蛋白質の対応する相対距離<dij>として設定
する。 (d)所定の乱数のタネIRに基づいて乱数を発生させ
て乱数値に比例する値を目的蛋白質の初期の立体構造
(以下、初期構造という。)の座標値として設定した
後、これに基づいて上記目的蛋白質の初期構造における
上記複数の相同な領域間における互いに残基番号が異な
る各残基の原子間の相対距離に対応する相対距離dij
計算する。 (e)例えば準ニュートン法を用いて、上記目的蛋白質
における互いに残基番号が異なる各残基の原子間に関す
る上記相対距離dijと上記相対距離<dij>との差の二
乗の和が最小となるように、すなわち、後述する数1で
示す目的蛋白質の関数Fの関数値が最小になるように関
数Fの最適化を行い、関数Fの変数である目的蛋白質の
α原子の予測座標を計算する。 (f)アミノ酸配列を、例えば極性度、偏比容、ターン
形成度、αアミノ基のpK値、αカルボキシル基のpK
値、突然変異度などのような、表1の20種類のアミノ
酸に固有の物理化学的パラメータpを使って数列化し、
目的蛋白質Xと参照蛋白質Yとの間のアミノ酸配列の対
応関係を示す併置配列(alignment)において、目的蛋
白質Xの残基番号iと、その残基番号iに対応する参照
蛋白質Yの残基番号jとの間の相関関数Cp(i)を後
述の数5で定義して計算し、さらに、雑音軽減のため信
号対雑音比S/Nの向上するために、後述の数6に示す
ように上記相関関数Cp(i)について複数個のパラメ
ータpに関する平均値<C(i)>を計算することによ
り、予測精度を推定して演算する。
【0020】まず、目的蛋白質の立体構造の予測演算及
び予測精度演算に関する基本的な原理について説明す
る。この演算において、1つの目的蛋白質はCα原子の
みによって代表される残基によってモデル化されるもの
とする。従って、自然数M個の残基により構成される1
つの目的蛋白質の立体構造はM個のポイントによって表
される。ここで、M個のポイントの空間的な位置からな
る立体構造は、次の数1に示す関数を最適化することに
よって得ることができる。
【0021】
【数1】F=Σ Σwij・(dij−<dij>)2/m i<j
【0022】関数Fは、上記数1に示すようにi<jの
条件のもとで互いに残基番号が異なる各残基の原子間で
のiとjに関する和で表される。ここで、1個のポイン
トをXYZの直交座標系を用いて座標を表わすと、関数
Fは次の数2に示すように、3M個の座標変数の関数と
なる。
【0023】
【数2】F=F(x1,y1,z1,x2,y2,z2,…,
M,yM,zM
【0024】上記数1において、mは目的蛋白質と参照
蛋白質との間で対応する残基ペアの全体の数M(M−
1)/2である。また、wijは重み係数であり、従来の
輪湖・シェラガの方法においては平均的な統計データに
基づいた重み係数を用いるが、本実施例においては常時
ij=1としている。さらに、dijはi番目の残基とj
番目の残基との間の相対距離であり、<dij>は、従来
の輪湖・シェラガの方法においてはPDBに基づいて多
数の蛋白質から得られた平均的な統計データによる対応
するi番目とj番目の残基ペアに割り当てられた相対距
離であるが、本実施例においては、上述のように目的蛋
白質と相同性の度合いが最大であるように選択された立
体構造が既知の参照蛋白質についての上記目的蛋白質に
対応するi番目とj番目の残基ペアに割り当てられた相
対距離である。
【0025】アミノ酸配列が与えられると、数1の関数
Fが一意的に決定されるので、本実施例においては、所
定の乱数のタネIRを与えて乱数を発生させてその乱数
値に比例する値を座標値とした目的蛋白質の初期構造に
おけるi番目の残基とj番目の残基との間の相対距離を
関数Fのdijに代入して、例えば準ニュートン法を用い
て、数1の関数Fが最小になるように関数Fを最適化
し、最適化された関数Fを用いて目的蛋白質のCα原子
の座標を計算する。すなわち、目的蛋白質の初期構造に
おけるi番目の残基とj番目の残基との間の相対距離
と、参照蛋白質についての上記目的蛋白質に対応するi
番目とj番目の残基ペアに割り当てられた相対距離との
差の二乗の和を最小にするような、目的蛋白質の座標変
数x1,y1,z1,x2,y2,z2,…,xM,yM,zM
を求めて、目的蛋白質の立体構造を求めている。なお、
挿入又は欠失があったり、あるいは相同性の無い領域の
残基には従来の方法の統計データの相対距離を用いる。
【0026】一方、従来の輪湖・シェラガの方法におい
ては、PDBに基づいて多数の蛋白質から得られた平均
的な統計データによる対応するi番目とj番目の残基ペ
アに割り当てられた相対距離<dij>を用いた場合、非
常に粗いデータであるので、関数Fから得られた目的蛋
白質の立体構造は実際のそれと程遠いものとなる。
【0027】本実施例において、所定の乱数のタネIR
を与えて乱数を発生させてその乱数値に比例する値を座
標値とした目的蛋白質の初期構造を求めるときに、蛋白
質の統計学的データに基づいて14個の球状蛋白質の線
形回帰分析により経験的に得られた蛋白質の旋回半径
(radius of gyration)Rg(Å)を示す次の数3と、
当該初期構造の3M個の座標(x1,y1,z1,x2,y
2,z2,…,xM,yM,zM)(以下、その符号を代表
してqlmとし、ここで、l=1,2,3;m=1,2,
…,Mである。)を示す次の数4を用いる。
【0028】
【数3】logRg=0.824+0.367・log
【数4】qlm=2×Rg×rand(IR)
【0029】ここで、rand( )は、乱数のタネを
初期値としたときに乱数値(0≦乱数値<1)を発生す
る公知の乱数発生関数である。上記数4を用いて、目的
蛋白質の初期構造の座標を実際の座標により近似させる
ために、上記乱数値rand(IR)に蛋白質の旋回半
径Rgをかけた後、直径の座標とするためにそれを2倍
して、当該初期構造の座標値とする。
【0030】さらに、上記の予測方法で予測された目的
蛋白質の立体構造の予測精度を、アミノ酸配列に沿って
推測して計算する方法について詳述する。アミノ酸配列
は表1に示す1文字コードを用いる“記号列”で表され
るため、従来の一般的に用いられる相同性は、アミノ酸
残基の物理的及び化学的性質の類似性、例えばイソロイ
シン(I)とロイシン(L)とが類似し、グルタミン酸
(E)とアスパラギン酸(D)とが類似しているなどの
類似性に基づいた、いわば定性的な方法によるものであ
る。本発明の当該方法はアミノ酸配列をあるパラメータ
で数列化して後述の数5を用いて目的蛋白質と参照蛋白
質との相関関数を求めるため、−1≦相同性の程度≦1
のように定量的に定義する。すなわち、当該方法は、目
的蛋白質と参照蛋白質との間の相同性の定義を、アミノ
酸配列に沿って定量的且つ立体構造を反映するように行
うことにより、相同性の高低から立体構造の局所的な予
測精度の推定を行おうというものである。
【0031】アミノ酸配列は、公知の通り、例えば、次
に示すような、極性度、偏比容、ターン形成度、αアミ
ノ基のpK値、αカルボキシル基のpK値、突然変異度
などのような、表1に示す20種類のアミノ酸に固有の
物理化学的パラメータpを使って表2乃至表7に示すよ
うに、数列化することができる。なお、表2乃至表7で
は、表1に示す20種類のアミノ酸の1文字コードのア
ルファベット順(A,C,D,E,F,G,H,I,
K,L,M,N,P,Q,R,S,T,V,W,Y)に
数列化しており、表2乃至表7のそれぞれの( )内の
2つは、各パラメータの数値を提示した論文の著者名
と、その発表年である。 (a)極性度(polarity):アミノ酸残基が蛋白質表面
に露出する度合い。 (b)偏比容(partial specific volume):単位質量
のアミノ酸を無限量の溶液に溶かしたときの溶液の容積
変化。 (c)ターン形成度(propensipy to form reverse tur
n):アミノ酸残基が蛋白質内で折れ曲がる度合い。 (d)αアミノ基のpK値(pK−N):アミノ酸のα
アミノ基の解離定数Kの対数に負の符号を付けた値、す
なわち−logK。 (e)αカルボキシル基のpK値(pK−C):アミノ
酸のαカルボキシル基の解離定数Kの対数に負の符号を
付けた値、すなわち−logK。 (f)突然変異度(relative mutability):アミノ酸
残基の相対的な置換頻度。
【0032】
【表2】 極性度(Grantham,1974) ──────────────────────────── 8.10,5.50,13.00,12.30,5.20,9.00,10.40,5.20,11.30,4.90, 5.70,11.60,8.00,10.50,10.50,9.20,8.60,5.90,5.40,6.20 ────────────────────────────
【0033】
【表3】 偏比容(Cohn and Edsall,1943) ──────────────────────────── 0.75,0.61,0.60,0.66,0.77,0.64,0.67,0.90,0.82,0.90, 0.75,0.61,0.76,0.67,0.70,0.68,0.70,0.86,0.74,0.71 ────────────────────────────
【0034】
【表4】 ターン形成度(Levitt,1978) ──────────────────────────── 0.77,0.81,1.41,0.99,0.59,1.64,0.68,0.51,0.96,0.58, 0.41,1.28,1.91,0.98,0.88,1.32,1.04,0.47,0.76,1.05 ────────────────────────────
【0035】
【表5】 αアミノ基のpK値(Sober,1970) ──────────────────────────── 9.69,8.35,9.60,9.67,9.18,9.78,9.17,9.68,9.18,9.60, 9.21,8.80,10.64,9.13,8.99,9.21,9.10,9.62,9.44,9.11 ────────────────────────────
【0036】
【表6】 αカルボキシル基のpK値(Sober,1970) ──────────────────────────── 2.34,1.92,1.88,2.10,2.16,2.35,1.82,2.36,2.16,2.36, 2.28,2.02,1.95,2.17,1.82,2.19,2.09,2.32,2.43,2.20 ────────────────────────────
【0037】
【表7】 突然変異度(Dayhoff,1978) ──────────────────────────── 1.00,0.20,1.06,1.02,0.41,0.49,0.66,
0.96,0.56,0.40, 0.94,1.34,0.56,0.93,0.65,1.20,0.97,
0.74,0.18,0.41 ────────────────────────────
【0038】そこで、目的蛋白質Xと参照蛋白質Yとの
間のアミノ酸配列の対応関係を示す併置配列において、
目的蛋白質Xの残基番号iと、その残基番号iに対応す
る参照蛋白質Yの残基番号jとの間の相関性を示す相関
関数Cp(i)を次の数5で定義する。
【0039】
【数5】
【0040】ここで、x(m)およびyp(n)はそ
れぞれ、目的蛋白質Xの残基番号mと、参照蛋白質Yと
の残基番号nにおけるアミノ酸残基に対する物理化学的
パラメータpの値であり、また<cp>は例えば表1の
20種類のアミノ酸でのパラメータpの平均値であり、
kとしては例えば5を与える。なお、挿入又は欠失など
のため対応する残基ペアの無い箇所については相関関数
の値を0とおく。
【0041】目的蛋白質Xと参照蛋白質Yをある1つの
物理化学的パラメータで数列化し、k=5の場合は11
残基のセグメント(断片)に対して図5のような対応関
係で上記数5を用いて相関関数Cp(i)の値を求め
る。なお、数5の数列和Σはl=−kからl=+kであ
るが、例えばk=5のとき、以下のように相関関数Cp
(i)の値を求める。 (a)i=1(N末端)の場合は、図5の31に示すよ
うに、目的蛋白質Xの残基番号i,i+1,…,i+5
に対してそれぞれ、参照蛋白質Yの残基番号j,j+
1,…,j+5の6残基との間の相関関数Cp(i)の
値が計算される。 (b)i=2の場合は、図5の32のように、目的蛋白
質Xの残基番号i−1,i,i+1,…,i+5に対し
てそれぞれ、参照蛋白質Yの残基番号j−1,j,j+
1,…,j+5の7残基との間の相関係数Cp(i)の
値が計算される。(c)iが最後の残基(C末端)の場
合はその逆に、目的蛋白質Xの残基番号i−5,…,i
−1,iに対してそれぞれ、参照蛋白質Yの残基番号j
−5,…,j−1,jの6残基との相関係数Cp(i)
の値が計算される。
【0042】さらに、本発明では、雑音を除去しS/N
比の向上させるために、上記計算された相関関数Cp
(i)について、複数個の物理化学的パラメータpに関
する平均値(以下、相関関数の平均値という。)<C
(i)>を次の数6で表わす。
【0043】
【数6】
【0044】従って、本発明では、立体構造を反映し且
つできるだけ独立な、すなわち互いに相関がない、例え
ば上記6つの物理化学的パラメータに対する上記数6を
用いて(この場合n=6)、アミノ酸配列に沿った1次
元的な相同性の度合いを示す相関係数を計算する。以
下、目的蛋白質がエラスターゼであって参照蛋白質がキ
モトリプシノーゲンであるときの例について説明する。
【0045】図6は、目的蛋白質であるエラスターゼの
上記予測方法で予測された立体構造(実線)とX線結晶
解析によって計測された立体構造(点線)を最適に重ね
合せたものを、ステレオ図で示したものである。また、
図7は、図6に基づいて、目的蛋白質エラスターゼの立
体構造において、予測された当該立体構造のCα原子の
位置について、対応するX線結晶解析による立体構造の
α原子からの偏差、すなわち、各Cα原子の位置の距
離(以下、単に偏差という。)liiを次の数7を用いて
残基番号に対してプロットしたものである。
【0046】
【数7】lii=√{(x1−x22+(y1−y22
(z1−z22
【0047】ここで、(x1,y1,z1)は目的蛋白質
の3次元座標であり、(x2,y2,z2)は参照蛋白質
の3次元座標である。図7から明らかなように、予測精
度が高い領域では偏差liiの値は小さく、予測精度の低
い領域でのそれは大きくなっていることが認められる。
【0048】図8は、数6を用いて計算した相関関数の
平均値<C(i)>を残基番号に対してプロットしたも
のである。図7と比較することにより、目的蛋白質であ
るエラスターゼと参照蛋白質であるキモトリプシノーゲ
ンとの間で相同性が高い、すなわち相関値が高い残基番
号の領域では立体構造の予測精度が高く、すなわち偏差
iiの値が小さいが、一方、相同性が低い、すなわち相
関値が低い残基番号の領域では立体構造の予測精度が低
く、すなわち偏差liiの値が大きいことが認められる。
このように、上記数6に基づいた相同性の定義に従え
ば、アミノ酸配列情報のみから予測された立体構造の局
所的な予測精度の推定が可能となる。
【0049】以上の実施例において、立体構造の局所的
な予測精度の推定を行うために、上記6つの物理化学的
パラメータを用いているが、これらは本発明者が、立体
構造が似ている部分に対応する残基番号の領域の相関値
が高くなるようなパラメータを探した結果、いわば経験
的に見つけたものである。本発明において用いる物理化
学的パラメータとしては、好ましくは、上記6つの物理
化学的パラメータのうちの少なくとも1つを用いるよう
にしてもよい。
【0050】本発明者は、上記の目的蛋白質であるエラ
スターゼと参照蛋白質であるキモトリプシノーゲンとの
間の偏差liiと相関関数の平均値<C(i)>との関係
のほかに、以下の目的蛋白質と参照蛋白質との間で、立
体構造の局所的な予測精度の推定が可能であることを確
認している。 (a)目的蛋白質ヘモグロビン・アルファ鎖(hemoglob
in α−chain)と参照蛋白質ヘモグロビン・ベータ鎖
(hemoglobin β−chain)。 (b)目的蛋白質アルファ・リスティック・プロテアー
ゼ(α−lytic protease)と参照蛋白質プロテアーゼA
(protease A)。 (c)目的蛋白質エンドチアペプシン(endothiapepsi
n)と参照蛋白質ペニシロペプシン(penicillopepsi
n)。
【0051】次に、図1を参照して、本実施例の目的蛋
白質の立体構造の予測演算及び予測精度演算装置の構成
について説明する。図1に示すように、図2及び図3の
処理を実行する演算制御装置であるマイクロプロセッシ
ングユニット(以下、MPUという。)10には、バス
を介して以下の装置が接続される。 (a)ROM11:図2及び図3のプログラムデータ及
び当該プログラムを実行するために必要なデータを格納
する。 (b)RAM12:図2及び図3の処理を実行するため
のワークエリアとなる記憶領域のためのメモリである。 (c)キーボード13:図2及び図3の処理を実行する
ための指示コマンド又は目的蛋白質の名称と、アミノ酸
配列と、並びに、予測座標計算処理における乱数のタネ
の値などを入力するための入力装置である。 (d)CRTディスプレイ14:図2及び図3の処理の
処理中の内容及び計算結果を表示する表示装置である。 (e)プリンタ15:図2及び図3の処理の計算結果を
印字する印字装置である。 (f)計算結果ファイル20:例えばハードディスクか
ら構成され、図2及び図3の処理の計算結果のデータを
記憶するための記憶装置である。 (g)蛋白質データベース(PDB)ファイル21:例
えばハードディスクから構成され、公知のX線結晶解析
及びNMRを用いた解析によって、種々の蛋白質を構成
するアミノ酸残基の各々に対してその空間座標(x,
y,z)を求めた結果を含むデータベースファイルであ
って、本実施例において参照蛋白質となる得る各蛋白質
に関する蛋白質の名称、アミノ酸配列(3文字コード表
示及び1文字コード表示)、残基数、各残基に対する空
間座標を記憶する記憶装置である。
【0052】図2は、図1の装置で実行される蛋白質の
立体構造予測及び精度計算処理を示すフローチャートで
ある。以下、目的蛋白質がエラスターゼであって参照蛋
白質がキモトリプシノーゲンであるときの一例を参照し
て、本実施例の蛋白質の立体構造予測及び精度計算処理
について説明する。なお、印字出力結果である表8乃至
表24については、明細書の編集の都合上、実施例の最
後に記載しかつ各表においてデータ長が1ページの長さ
を超えるものについては、複数の表に分割している。
【0053】図2において、まず、ステップS1におい
て、キーボード13を用いて、座標を予測したい目的蛋
白質の名称とアミノ酸配列とを入力した後、ステップS
2においてホモロジー検索処理が実行される。ホモロジ
ー検索処理においては、PDBに基づいて、目的蛋白質
のアミノ酸配列と類似する配列を有しかつ立体構造が既
知の参照蛋白質を検索し、対応する残基ペアが全体に占
める割合を示す相同性の度合いが例えば30%以上であ
る参照蛋白質候補のうち、本実施例では相同性の度合い
が最大である蛋白質を参照蛋白質に選択する。次いで、
ステップS3において、表8乃至表11に示すように、
以下の事項が印字される。 (a)表8:目的蛋白質の名称及び残基数 (b)表9乃至表11:上記選択された各参照蛋白質候
補について (b−1)参照蛋白質の名称 (b−2)目的蛋白質と参照蛋白質との間の対応する残
基番号 (b−3)相同性の度合い(%) (b−4)目的蛋白質と参照蛋白質との間のアミノ酸配
列の対応関係:ここで、アミノ酸は1文字コードで表さ
れ、上段が目的蛋白質であり下段が参照蛋白質であり、
残基番号の10毎に*が付されている。また、目的蛋白
質と参照蛋白質のアミノ酸が対応一致しているところに
“:”が付されており、アミノ酸が欠失しているところ
に“−”が付されている。
【0054】この例では、3つの参照蛋白質候補とし
て、[1]キモトリプシノーゲンAと、[2]トリプシ
ノーゲンと、[3]キモトリプシノーゲン*Aとが検索
され、本実施例では、これらの参照蛋白質候補のうち相
同性の度合いが最大であるキモトリプシノーゲン*A
(以下、単にキモトリプシノーゲンという。)が参照蛋
白質に選択される。
【0055】次いで、ステップS4において、選択され
た参照蛋白質(キモトリプシノーゲン)と目的蛋白質
(エラスターゼ)との間のアミノ酸配列を比較して、本
実施例では、5残基以上の挿入又は欠失(−)の無い対
応する相同な残基ペアを切り出して、ステップS5にお
いて、表12に示すように、対応する残基ペアの数と、
目的蛋白質と参照蛋白質の残基番号の対応表とが印字さ
れる。切り出される対応する残基ペアは、表11から明
らかなように以下の通りである。 (a)目的蛋白質の残基番号1−23が参照蛋白質の残
基番号16−38に相同し、以下、残基ペアRP1とす
る。 (b)目的蛋白質の残基番号28−53が参照蛋白質の
残基番号40−65に相同し、以下、残基ペアRP2と
する。
【0056】以下、同様に、残基ペアRP3乃至RP8
まで存在する。これら対応する残基ペアRP1乃至RP
8を図4に示す。本実施例では、図4に示すように、座
標が既知である参照蛋白質の残基番号i’番目のCα
子の座標と残基番号j’番目のCα原子の座標との間の
相対距離を、それぞれ対応する目的蛋白質の残基番号i
番目のCα原子の座標と残基番号j番目のCα原子の座
標との間の相対距離<dij>に設定して、目的蛋白質の
立体構造を予測する。さらに、ステップS6において、
図3の予測座標計算処理を実行して、目的蛋白質のCα
原子の座標を計算して、計算結果をCRTディスプレイ
14に表示するとともに、プリンタ15を用いて印字す
る。
【0057】次いで、ステップS7において、上記20
種類のアミノ酸に固有の物理化学的パラメータpの値に
基づいて、ある1つの物理化学的パラメータpについて
数5を用いて、目的蛋白質と参照蛋白質との間の相関関
数Cp(i)の値を計算し、次いで、さらに他の5種類
の物理化学的パラメータpについて同様に数5を用いて
目的蛋白質と参照蛋白質との間の相関関数Cp(i)の
値を計算し、すなわち6種類の物理化学的パラメータp
について目的蛋白質と参照蛋白質との間の相関関数Cp
(i)の値を計算した後、数6を用いて相関関数の平均
値<C(i)>を目的蛋白質の残基番号iに対して計算
する。
【0058】さらに、ステップS8において、ステップ
S7において計算された相関関数の平均値<C(i)>
を、図8のフォーマットで、すなわち目的蛋白質の残基
番号iに対する相関関数の平均値<C(i)>を折れ線
グラフをCRTディスプレイ14に表示するとともに、
プリンタ15を用いて印字する。当該図8から、アミノ
酸配列情報のみに基づいて、予測された目的蛋白質の立
体構造の座標について残基番号に沿って1次元的に、局
所的な予測精度の推定が可能となった。この方法で1次
構造を比較し、立体構造の似ている可能性の高い部分を
抽出することができる。当該方法によれば、相関関数の
値がどれくらいであれば、また鎖がどれだけ長ければ立
体構造の一致が期待されるかを検討することができる。
【0059】図3は、図2のサブルーチンである予測座
標計算処理(ステップS6)を示すフローチャートであ
る。図3に示すように、まず、ステップS11におい
て、ステップS4において切り出された残基ペアRP1
乃至RP8に基づいて、参照蛋白質における対応する相
同な領域間の相対距離dij’を計算して、これを目的
蛋白質の対応する相対距離<dij>として設定し、この
処理をi<jの条件のもとでiとjに関して繰り返し実
行する。次いで、ステップS12において、乱数のタネ
IRを入力する。ステップS13においては、入力した
乱数のタネIRに基づいて乱数値(0≦乱数値<1)を
発生し、さらに、上記数4を用いて、目的蛋白質の初期
構造の座標を実際の座標により近似させるために、上記
乱数値に蛋白質の旋回半径Rgをかけた後、直径の座標
とするためにそれを2倍して目的蛋白質の初期構造の座
標qlmを計算しそれに基づいて上記初期構造の相対距離
ijを計算し、この計算をi<jの条件のもとでiとj
に関して繰り返し実行する。そして、ステップS14に
おいて当該初期構造における後述する数1の関数値Fを
計算する。
【0060】次いで、ステップS15において、例えば
1階の偏微分のみを計算するが2階の偏微分を計算しな
いで関数の最小化を行う公知の準ニュートン法を用い
て、数1の目的蛋白質の関数Fの関数値が最小になるよ
うに関数Fの最適化を行い、関数値Fを計算する。さら
に、ステップS16において、最適化された関数Fに基
づいて、関数Fの変数である目的蛋白質の予測座標変数
1,y1,z1,x2,y2,z2,…,xM,yM,zM
計算する。なお、ステップS14,S15において目的
蛋白質の初期構造における関数値Fと最適化後の目的蛋
白質の関数値Fとを計算するのは、最適化の度合いを知
るためである。最適化後の目的蛋白質の関数値Fが目的
蛋白質の初期構造における関数値Fに比較して十分に小
さくなったとき、最適化の度合いが大きいと判定するこ
とができる。
【0061】さらに、ステップS17において、表13
と表14に示す標準出力フォーマットで出力結果を印字
した後、ステップS18において、表15乃至表24に
示す目的蛋白質の予測座標の計算結果を印字する。
【0062】上記標準出力フォーマットにおいては、表
13と表14に示すように、以下の情報が印字される。 (a)目的蛋白質の名称及びアミノ酸配列(1文字コー
ド表示) (b)参照蛋白質の名称及びアミノ酸配列(3文字コー
ド表示) (c)目的蛋白質と参照蛋白質との間で対応する相同な
残基番号 (d)乱数のタネの値 (e)ステップS15における最適化における最適化の
計算の繰り返し数 (f)ステップS14で計算された目的蛋白質の初期構
造の関数値F (g)ステップS15で計算された最適化後の目的蛋白
質の予測構造の関数値F
【0063】さらに、上記予測座標の計算結果において
は、表15乃至表24に示すように、以下の情報が印字
される。 (a)目的蛋白質の名称 (b)目的蛋白質の残基毎の以下のデータ (b−1)アミノ酸配列(3文字コード表示) (b−2)残基番号 (b−3)予測されたx,y,z座標値
【0064】以上説明したように、本実施例によれば、
PDBに基づいて相同性の度合いが最大又は比較的高い
蛋白質を参照蛋白質を選択し、選択された参照蛋白質と
目的蛋白質との間のアミノ酸配列を比較して、相同な複
数の残基ペアを切り出し、切り出された複数の残基ペア
に基づいて、参照蛋白質における互いに残基番号が異な
る各残基の原子間の相対距離を計算して、それを目的蛋
白質の対応する相対距離<dij>として設定し、所定の
乱数のタネIRに基づいて乱数を発生させて乱数値に比
例する値を目的蛋白質の初期構造の座標値として設定し
て初期構造の相対距離dijを計算した後、目的蛋白質の
関数Fの関数値が最小になるように関数Fの最適化を行
い、関数Fの変数である目的蛋白質の予測座標を計算し
ている。従って、従来の方法に比較して計算をより簡単
にすることができるとともに、輪湖・シェラガの方法な
どの従来の方法に比較して目的蛋白質の座標をより高い
精度で、すなわちより実際に近い座標を計算することが
できる。
【0065】さらに、目的蛋白質の残基番号iに対する
相関関数の平均値<C(i)>を上記数5と数6とを用
いて計算しかつ表示することにより、アミノ酸配列情報
のみに基づいて、予測された目的蛋白質の立体構造の座
標について残基番号に沿って1次元的に、局所的な予測
精度の推定が可能となる。この方法で1次構造を比較
し、立体構造の似ている可能性の高い部分を抽出するこ
とができる。当該方法によれば、相関関数の値がどれく
らいであれば、また鎖がどれだけ長ければ立体構造の一
致が期待されるかを検討することができる。
【0066】
【表8】 Target protein: elastase porcine ec 3.4.21.36 No. of residues: 240 Fragmentation from 1 to 240
【0067】
【表9】 [ 1] ( 1 - 240) 240 elastase porcine ec 3.4.21.36 ( 16 - 226) 226 CHYMOTRYPSINOGEN A code name: 1CHG cor. coef.= 0.415 ( 37.9%) + * + * + * + * + * + * + * VVGGTEAQRNSWPSQISLQYRSGSSWAHTCGGTLIRQNWVMTAAHCVDRELTFRVVVGEHNLNQNNGTEQ : : :: ::: : ::: : : ::: :: ::: ::::: : ::: IVNGEEAVPGSWPWQVSLQDKTG--F-HFCGGSLINENWVVTAAHC-GVT-TSDVVVAGEKIQKLK-IAK + * + * + * + * + * + * + * YVGVQKIVVHPYWNTDDVAAGYDIALLRLAQSVTLNSYVQLGVLPRAGTILANNSPCYITGWGLTRTNGQ : : : : :: :: : : :: : : : :::: : -V-F-KNS-K-Y-NSLTINN--DITLLKLSTAASFSQTVSAVCLPSASDDFAAGTTCVTTGWG--R---- + * + * + * + * + * + * + * LAQTLQQAYLPTVDYAICSSSSYWGSTVKNSMVCAGGNGVRSGCQGDSGGPLHCLVNGQYAVHGVTSFVS : : : :: : ::: : : ::: :: : : ::::::: : :: : : : L-Q--QAS-LPLLSNTNCKK--YWGTKIKDAMICAGASGV-SSCMGDSGGPLVCKKNGAWTLVGIVSWGS + * + * + * + * + * + * + * RLGCNVTRKPTVFTRVSAYISWINNVIASN : : : : :: : : : : S-TCS-TSTPGVYARVTALVNWVQQTLAAN
【0068】
【表10】 [ 2] ( 17 - 240) 240 elastase porcine ec 3.4.21.36 ( 10 - 222) 222 TRYPSINOGEN code name: 1TGN cor. coef.= 0.452 ( 35.7%) + * + * + * + * + * + * + * SLQYRSGSSWA-HTCGGTLIRQNWVMTAAHCVDRELTFRVVVGEHNLNQNNGTEQYVGVQKIVVHPYWNT : : ::: :: :: :::: : :: : : : :: : ::: : TVPYQVSLNSGYHFCGGSLINSQWVVSAAHCY-KS-GIQVRLGEDNINVVEGNEQFISASKSIVHPSYNS + * + * + * + * + * + * + * DDVAAGYDIALLRLAQSVTLNSYVQLGVLPRAGTILANNSPCYITGWGLTRTNGQ-LAQTLQQAYLPTVD :: : : ::: : :: : : ::: : : : : NTLNN--DIMLIKLKSAASLNSRVASISLP-TSCA-SAGTQCLISGWGNTKSSGTSYPDVLKCLKAPILS + * + * + * + * + * + * + * YAICSSSSYWGSTVKNSMVCAG-GNGVRSGCQGDSGGPLHCLVNGQYAVHGVTSFVSRLGCNVTRKPTVF : : : : ::: : :::::::: : : : : : :: :: : DSSCKSA-Y-PGQITSNMFCAGYLEGGKDSCQGDSGGPVVC--SGK--LQGIVSWGS--GCAQKNKPGVY + * + * + * + * + * + * + * TRVSAYISWINNVIASN : : : ::: :::: TKVCNYVSWIKQTIASN
【0069】
【表11】 [ 3] ( 1 - 240) 240 elastase porcine ec 3.4.21.36 ( 16 - 245) 245 CHYMOTRYPSINOGEN *A code name: 2CGA cor. coef.= 0.502 ( 39.0%) + * + * + * + * + * + * + * VVGGTEAQRNSWPSQISLQYRSGSSWAHTCGGTLIRQNWVMTAAHCVDRELTFRVVVGEHNLNQNNGTEQ : : :: ::: : ::: : : ::: :: ::: ::::: :: :: : IVNGEEAVPGSWPWQVSLQDKTG--F-HFCGGSLINENWVVTAAHCGVTTSDV-VVAGEFDQGSSSEKIQ + * + * + * + * + * + * + * YVGVQKIVVHPYWNTDDVAAGYDIALLRLAQSVTLNSYVQLGVLPRAGTILANNSPCYITGWGLTR-TNG : :: :: : : :: : : : ::::::: :: KLKIAKVFKNS--KYNSLTINNDITLLKLSTAASFSQTVSAVCLPSASDDFAAGTTCVTTGWGLTRYTNA + * + * + * + * + * + * + * QLAQTLQQAYLPTVDYAICSSSSYWGSTVKNSMVCAGGNGVRSGCQGDSGGPLHCLVNGQYAVHGVTSFV :::: :: : ::: : : ::: :: : : ::::::: : :: : : NTPDRLQQASLPLLSNTNCKK--YWGTKIKDAMICAGASGV-SSCMGDSGGPLVCKKNGAWTLVGIVSWG + * + * + * + * + * + * + * SRLGCNVTRKPTVFTRVSAYISWINNVIASN : : : : : :: : : : : SS-TCS-TSTPGVYARVTALVNWVQQTLAAN
【0070】
【表12】
【0071】
【表13】 Protein name: elastase porcine ec 3.4.21.36 Sequence: vvggteaqrn swpsqislqy rsgsswahtc ggtlirqnwv mtaahcvdre ltfrvvvgeh nlnqnngteq yvgvqkivvh pywntddvaa gydiallrla qsvtlnsyvq lgvlpragti lannspcyit gwgltrtngq laqtlqqayl ptvdyaicss ssywgstvkn smvcaggngv rsgcqgdsgg plhclvngqy avhgvtsfvs rlgcnvtrkp tvftrvsayi swinnviasn
【0072】
【表14】 [Suplementary information] Reference protein: CHYMOTRYPSINOGEN *A 2CGA 4 Sequence: CYS GLY VAL PRO ALA ILE GLN PRO VAL LEU SER GLY LEU SER ARG ILE VAL ASN GLY GLU GLU ALA VAL PRO GLY SER TRP PRO TRP GLN VAL SER LEU GLN ASP LYS THR GLY PHE HIS PHE CYS GLY GLY SER LEU ILE ASN GLU ASN TRP VAL VAL THR ALA ALA HIS CYS GLY VAL THR THR SER ASP VAL VAL VAL ALA GLY GLU PHE ASP GLN GLY SER SER SER GLU LYS ILE GLN LYS LEU LYS ILE ALA LYS VAL PHE LYS ASN SER LYS TYR ASN SER LEU THR ILE ASN ASN ASP ILE THR LEU LEU LYS LEU SER THR ALA ALA SER PHE SER GLN THR VAL SER ALA VAL CYS LEU PRO SER ALA SER ASP ASP PHE ALA ALA GLY THR THR CYS VAL THR THR GLY TRP GLY LEU THR ARG TYR THR ASN ALA ASN THR PRO ASP ARG LEU GLN GLN ALA SER LEU PRO LEU LEU SER ASN THR ASN CYS LYS LYS TYR TRP GLY THR LYS ILE LYS ASP ALA MET ILE CYS ALA GLY ALA SER GLY VAL SER SER CYS MET GLY ASP SER GLY GLY PRO LEU VAL CYS LYS LYS ASN GLY ALA TRP THR LEU VAL GLY ILE VAL SER TRP GLY SER SER THR CYS SER THR SER THR PRO GLY VAL TYR ALA ARG VAL THR ALA LEU VAL ASN TRP VAL GLN GLN THR LEU ALA ALA ASN Residue pairs: 1- 23: 16- 38 | 28- 53: 40- 65 | 55- 81: 66- 92 | 84-136: 93-145 | 137-160:147-170 | 163-180:171-188 | 182-211:189-218 | 217-240:222-245 | Random number generation: 2 Minop has exhausted 300calls of calcfg ** Initial conformation: F= 0.521134E+07 ** Final conformation: F= 0.323426E+04
【0073】
【表15】 HEADER elastase porcine ec 3.4.21.36 COMPND ATOM 1 CA VAL 1 18.851 -2.532 20.987 ATOM 2 CA VAL 2 15.303 -2.327 19.641 ATOM 3 CA GLY 3 14.268 1.317 20.378 ATOM 4 CA GLY 4 16.678 2.285 23.284 ATOM 5 CA THR 5 15.808 2.957 26.986 ATOM 6 CA GLU 6 14.409 5.605 29.237 ATOM 7 CA ALA 7 16.874 8.289 30.295 ATOM 8 CA GLN 8 17.404 9.265 33.926 ATOM 9 CA ARG 9 15.443 12.444 34.524 ATOM 10 CA ASN 10 17.432 15.682 34.242 ATOM 11 CA SER 11 20.388 13.904 32.727 ATOM 12 CA TRP 12 20.195 15.463 29.240 ATOM 13 CA PRO 13 19.813 19.086 30.382 ATOM 14 CA SER 14 20.126 20.787 26.964 ATOM 15 CA GLN 15 17.127 18.902 25.531 ATOM 16 CA ILE 16 14.106 21.076 24.752 ATOM 17 CA SER 17 10.689 20.574 23.259 ATOM 18 CA LEU 18 9.093 22.827 20.699 ATOM 19 CA GLN 19 5.414 23.298 20.964 ATOM 20 CA TYR 20 2.907 25.510 19.275 ATOM 21 CA ARG 21 0.476 28.157 20.613 ATOM 22 CA SER 22 -2.005 25.426 21.582 ATOM 23 CA GLY 23 0.535 22.932 22.760 ATOM 24 CA SER 24 0.467 21.756 19.096 ATOM 25 CA SER 25 2.042 22.804 15.793
【0074】
【表16】 ATOM 26 CA TRP 26 3.969 19.750 14.634 ATOM 27 CA ALA 27 2.807 17.611 17.585 ATOM 28 CA HIS 28 4.789 18.927 20.563 ATOM 29 CA THR 29 6.194 19.127 17.020 ATOM 30 CA CYS 30 9.957 19.301 17.210 ATOM 31 CA GLY 31 12.964 19.010 19.458 ATOM 32 CA GLY 32 15.944 21.369 20.022 ATOM 33 CA THR 33 19.182 21.917 22.057 ATOM 34 CA LEU 34 20.207 24.855 24.311 ATOM 35 CA ILE 35 23.569 26.252 23.416 ATOM 36 CA ARG 36 23.218 28.969 26.009 ATOM 37 CA GLN 37 20.595 30.780 28.048 ATOM 38 CA ASN 38 19.501 32.806 24.995 ATOM 39 CA TRP 39 19.762 30.486 22.041 ATOM 40 CA VAL 40 18.339 27.129 20.770 ATOM 41 CA MET 41 19.501 25.071 17.786 ATOM 42 CA THR 42 16.988 23.035 15.819 ATOM 43 CA ALA 43 16.242 21.851 12.273 ATOM 44 CA ALA 44 15.217 24.288 9.484 ATOM 45 CA HIS 45 12.578 21.796 8.167 ATOM 46 CA CYS 46 10.856 22.238 11.555 ATOM 47 CA VAL 47 9.278 25.470 10.248 ATOM 48 CA ASP 48 9.424 27.290 13.625 ATOM 49 CA ARG 49 7.681 30.673 14.011 ATOM 50 CA GLU 50 7.681 33.203 16.785
【0075】
【表17】 ATOM 51 CA LEU 51 4.274 31.867 17.943 ATOM 52 CA THR 52 5.811 28.550 18.988 ATOM 53 CA PHE 53 7.071 28.006 22.591 ATOM 54 CA ARG 54 8.397 24.718 21.106 ATOM 55 CA VAL 55 10.286 26.413 23.928 ATOM 56 CA VAL 56 9.932 24.014 26.848 ATOM 57 CA VAL 57 12.973 23.250 28.996 ATOM 58 CA GLY 58 13.598 20.851 31.890 ATOM 59 CA GLU 59 11.025 18.298 30.786 ATOM 60 CA HIS 60 11.118 14.540 31.293 ATOM 61 CA ASN 61 7.653 13.062 31.184 ATOM 62 CA LEU 62 5.258 14.966 29.043 ATOM 63 CA ASN 63 2.358 13.384 30.844 ATOM 64 CA GLN 64 3.344 15.002 34.151 ATOM 65 CA ASN 65 2.043 18.438 35.406 ATOM 66 CA ASN 66 4.203 18.063 38.430 ATOM 67 CA GLY 67 7.441 18.996 36.718 ATOM 68 CA THR 68 9.139 22.298 37.292 ATOM 69 CA GLU 69 9.719 23.150 33.610 ATOM 70 CA GLN 70 10.445 26.522 31.865 ATOM 71 CA TYR 71 8.236 27.651 29.000 ATOM 72 CA VAL 72 10.232 30.118 26.973 ATOM 73 CA GLY 73 9.090 32.602 24.329 ATOM 74 CA VAL 74 10.871 33.193 21.048 ATOM 75 CA GLN 75 12.145 36.637 19.897
【0076】
【表18】 ATOM 76 CA LYS 76 13.419 35.909 16.359 ATOM 77 CA ILE 77 13.963 32.885 14.160 ATOM 78 CA VAL 78 17.058 32.573 11.944 ATOM 79 CA VAL 79 16.921 29.883 9.269 ATOM 80 CA HIS 80 20.294 29.135 7.395 ATOM 81 CA PRO 81 19.837 30.674 3.980 ATOM 82 CA TYR 82 16.953 28.351 4.957 ATOM 83 CA TRP 83 20.573 27.735 5.984 ATOM 84 CA ASN 84 21.686 27.864 2.292 ATOM 85 CA THR 85 18.733 25.451 3.256 ATOM 86 CA ASP 86 17.599 23.567 0.387 ATOM 87 CA ASP 87 14.123 22.580 0.848 ATOM 88 CA VAL 88 14.430 20.145 -2.002 ATOM 89 CA ALA 89 17.363 18.113 -0.848 ATOM 90 CA ALA 90 16.890 18.918 2.901 ATOM 91 CA GLY 91 20.567 19.922 2.948 ATOM 92 CA TYR 92 21.984 22.543 5.411 ATOM 93 CA ASP 93 19.056 21.731 7.820 ATOM 94 CA ILE 94 19.470 24.142 10.697 ATOM 95 CA ALA 95 17.722 27.016 12.452 ATOM 96 CA LEU 96 18.585 29.300 15.403 ATOM 97 CA LEU 97 16.026 30.577 17.739 ATOM 98 CA ARG 98 16.756 33.629 19.888 ATOM 99 CA LEU 99 14.620 33.510 23.091 ATOM 100 CA ALA 100 12.579 36.612 24.198
【0077】
【表19】 ATOM 101 CA GLN 101 12.921 35.234 27.696 ATOM 102 CA SER 102 16.256 33.781 28.839 ATOM 103 CA VAL 103 16.598 30.229 30.219 ATOM 104 CA THR 104 17.429 29.900 33.841 ATOM 105 CA LEU 105 20.290 27.410 34.114 ATOM 106 CA ASN 106 19.975 24.821 36.900 ATOM 107 CA SER 107 20.655 21.250 37.796 ATOM 108 CA TYR 108 18.309 20.142 35.019 ATOM 109 CA VAL 109 18.669 22.991 32.486 ATOM 110 CA GLN 110 22.024 23.750 30.864 ATOM 111 CA LEU 111 23.957 23.834 27.556 ATOM 112 CA GLY 112 25.474 21.338 25.072 ATOM 113 CA VAL 113 28.934 22.164 23.644 ATOM 114 CA LEU 114 29.414 23.002 19.950 ATOM 115 CA PRO 115 32.334 21.340 17.893 ATOM 116 CA ARG 116 35.074 23.456 16.017 ATOM 117 CA ALA 117 34.676 23.489 12.202 ATOM 118 CA GLY 118 37.846 21.310 12.129 ATOM 119 CA THR 119 36.637 18.684 14.544 ATOM 120 CA ILE 120 36.853 15.237 13.204 ATOM 121 CA LEU 121 34.484 12.657 14.608 ATOM 122 CA ALA 122 35.483 9.192 13.197 ATOM 123 CA ASN 123 33.124 6.458 11.904 ATOM 124 CA ASN 124 32.277 3.845 14.454 ATOM 125 CA SER 125 32.462 6.308 17.289
【0078】
【表20】 ATOM 126 CA PRO 126 29.443 5.603 19.607 ATOM 127 CA CYS 127 27.161 8.681 20.144 ATOM 128 CA TYR 128 23.801 9.364 21.797 ATOM 129 CA ILE 129 20.457 10.524 20.417 ATOM 130 CA THR 130 17.632 11.463 22.732 ATOM 131 CA GLY 131 13.996 12.472 22.429 ATOM 132 CA TRP 132 10.244 11.899 22.536 ATOM 133 CA GLY 133 10.010 10.720 18.922 ATOM 134 CA LEU 134 8.160 7.549 19.898 ATOM 135 CA THR 135 5.145 9.670 20.637 ATOM 136 CA ARG 136 4.723 10.340 16.882 ATOM 137 CA THR 137 -0.358 8.075 17.391 ATOM 138 CA ASN 138 -2.041 4.683 17.584 ATOM 139 CA GLY 139 0.642 3.241 19.679 ATOM 140 CA GLN 140 0.073 6.394 21.641 ATOM 141 CA LEU 141 3.334 5.402 23.381 ATOM 142 CA ALA 142 5.564 6.033 26.461 ATOM 143 CA GLN 143 5.945 9.802 26.947 ATOM 144 CA THR 144 9.266 9.810 28.849 ATOM 145 CA LEU 145 12.605 10.935 27.345 ATOM 146 CA GLN 146 14.358 7.949 25.590 ATOM 147 CA GLN 147 18.018 7.543 24.736 ATOM 148 CA ALA 148 19.880 5.281 22.299 ATOM 149 CA TYR 149 23.601 4.723 21.595 ATOM 150 CA LEU 150 24.381 4.597 17.895
【0079】
【表21】 ATOM 151 CA PRO 151 27.725 4.413 15.936 ATOM 152 CA THR 152 28.655 7.144 13.428 ATOM 153 CA VAL 153 28.940 6.048 9.799 ATOM 154 CA ASP 154 31.047 7.478 6.999 ATOM 155 CA TYR 155 28.950 9.044 4.203 ATOM 156 CA ALA 156 30.379 6.460 1.703 ATOM 157 CA ILE 157 28.888 3.802 3.705 ATOM 158 CA CYS 158 25.671 5.686 4.243 ATOM 159 CA SER 159 25.080 5.897 0.451 ATOM 160 CA SER 160 24.542 2.092 0.480 ATOM 161 CA SER 161 23.473 1.851 4.162 ATOM 162 CA SER 162 20.506 3.770 5.660 ATOM 163 CA TYR 163 21.189 2.940 2.015 ATOM 164 CA TRP 164 20.008 6.191 0.847 ATOM 165 CA GLY 165 22.043 6.686 -2.295 ATOM 166 CA SER 166 22.599 10.145 -3.735 ATOM 167 CA THR 167 20.332 11.720 -1.147 ATOM 168 CA VAL 168 23.467 11.834 1.098 ATOM 169 CA LYS 169 25.090 15.334 0.833 ATOM 170 CA ASN 170 28.351 16.462 2.426 ATOM 171 CA SER 171 26.602 18.580 5.035 ATOM 172 CA MET 172 24.920 15.473 6.321 ATOM 173 CA VAL 173 26.021 12.759 8.769 ATOM 174 CA CYS 174 24.491 9.298 9.375 ATOM 175 CA ALA 175 24.378 7.183 12.460
【0080】
【表22】 ATOM 176 CA GLY 176 22.974 3.824 13.593 ATOM 177 CA GLY 177 21.787 0.767 11.650 ATOM 178 CA ASN 178 23.430 -1.515 14.182 ATOM 179 CA GLY 179 20.439 -3.047 15.884 ATOM 180 CA VAL 180 18.859 -0.111 17.378 ATOM 181 CA ARG 181 19.056 3.286 18.939 ATOM 182 CA SER 182 16.589 2.327 16.140 ATOM 183 CA GLY 183 16.885 6.146 15.520 ATOM 184 CA CYS 184 13.181 7.048 15.645 ATOM 185 CA GLN 185 13.352 8.263 19.312 ATOM 186 CA GLY 186 15.002 11.524 18.037 ATOM 187 CA ASP 187 12.469 14.253 17.449 ATOM 188 CA SER 188 13.025 16.375 14.353 ATOM 189 CA GLY 189 15.565 18.979 15.251 ATOM 190 CA GLY 190 16.815 17.051 18.336 ATOM 191 CA PRO 191 20.443 16.249 19.282 ATOM 192 CA LEU 192 23.005 13.724 18.326 ATOM 193 CA HIS 193 25.791 14.108 20.861 ATOM 194 CA CYS 194 29.203 12.596 21.186 ATOM 195 CA LEU 195 31.753 13.081 23.894 ATOM 196 CA VAL 196 34.846 15.124 23.079 ATOM 197 CA ASN 197 37.452 15.597 25.869 ATOM 198 CA GLY 198 34.806 14.392 28.396 ATOM 199 CA GLN 199 32.250 16.930 27.291 ATOM 200 CA TYR 200 29.016 16.171 25.402
【0081】
【表23】 ATOM 201 CA ALA 201 29.237 17.882 22.017 ATOM 202 CA VAL 202 26.477 18.407 19.386 ATOM 203 CA HIS 203 27.599 16.495 16.297 ATOM 204 CA GLY 204 24.149 15.989 14.545 ATOM 205 CA VAL 205 20.649 17.525 14.312 ATOM 206 CA THR 206 17.833 14.988 13.502 ATOM 207 CA SER 207 17.004 15.670 9.868 ATOM 208 CA PHE 208 15.361 12.670 8.212 ATOM 209 CA VAL 209 15.198 8.921 7.541 ATOM 210 CA SER 210 12.840 6.012 7.980 ATOM 211 CA ARG 211 9.065 6.721 8.446 ATOM 212 CA LEU 212 9.207 10.363 9.487 ATOM 213 CA GLY 213 10.513 8.176 12.286 ATOM 214 CA CYS 214 14.299 8.540 12.751 ATOM 215 CA ASN 215 14.022 5.057 14.226 ATOM 216 CA VAL 216 16.089 2.589 12.218 ATOM 217 CA THR 217 16.970 -0.988 13.315 ATOM 218 CA ARG 218 18.852 -1.719 10.187 ATOM 219 CA LYS 219 18.625 1.675 8.439 ATOM 220 CA PRO 220 20.773 4.709 9.586 ATOM 221 CA THR 221 19.186 7.973 10.532 ATOM 222 CA VAL 222 20.240 11.136 8.710 ATOM 223 CA PHE 223 21.377 14.250 10.543 ATOM 224 CA THR 224 22.588 17.709 9.840 ATOM 225 CA ARG 225 26.434 17.861 10.202
【0082】
【表24】 ATOM 226 CA VAL 226 26.987 20.558 12.851 ATOM 227 CA SER 227 30.732 20.894 12.035 ATOM 228 CA ALA 228 29.767 22.035 8.475 ATOM 229 CA TYR 229 27.315 24.546 9.917 ATOM 230 CA ILE 230 29.176 25.852 12.929 ATOM 231 CA SER 231 30.676 28.924 11.237 ATOM 232 CA TRP 232 27.267 30.374 10.371 ATOM 233 CA ILE 233 26.138 29.758 14.035 ATOM 234 CA ASN 234 29.038 31.790 15.523 ATOM 235 CA ASN 235 28.410 34.403 12.987 ATOM 236 CA VAL 236 24.670 34.745 13.693 ATOM 237 CA ILE 237 25.176 34.793 17.433 ATOM 238 CA ALA 238 28.014 37.384 17.237 ATOM 239 CA SER 239 25.674 39.775 15.407 ATOM 240 CA ASN 240 22.208 39.280 16.899 END
【0083】以上の実施例において、目的蛋白質のα炭
素原子の座標を予測演算しているが、本発明はこれに限
らず、同様にして、蛋白質を構成するすべての原子であ
るアミノ酸残基の原子の座標を予測演算するように構成
してもよい。
【0084】
【発明の効果】以上詳述したように本発明によれば、ア
ミノ酸残基の原子の座標が既知の蛋白質のうち、立体構
造を予測すべき目的蛋白質との相同性の度合いが高い少
なくとも1つの蛋白質を参照蛋白質に選択し、上記選択
した参照蛋白質のアミノ酸残基の原子の座標に基づいて
上記目的蛋白質のアミノ酸残基の原子の座標が所定の方
法で予測された目的蛋白質の立体構造の予測精度を演算
する蛋白質の立体構造の予測精度演算方法及び装置であ
って、上記目的蛋白質に含まれる複数種類のアミノ酸の
物理化学的パラメータに基づいて、上記参照蛋白質と上
記目的蛋白質の併置配列において各対応するアミノ酸残
基に対する相関性を示す相関関数の値を、上記複数種類
のアミノ酸の物理化学的パラメータから予め選択された
少なくとも1つの選択物理化学的パラメータについてそ
れぞれ計算し、上記計算した相関関数の値を平均して計
算された相関関数の平均値を上記予測された目的蛋白質
の立体構造の予測精度として用いる。従って、本発明
は、アミノ酸配列情報のみに基づいて、予測された目的
蛋白質の立体構造の座標について残基番号に沿って1次
元的に、局所的な予測精度の推定が可能となる。この方
法で1次構造を比較し、立体構造の似ている可能性の高
い部分を抽出することができる。当該方法によれば、相
関関数の値がどれくらいであれば、また鎖がどれだけ長
ければ立体構造の一致が期待されるかを検討することが
できる。
【図面の簡単な説明】
【図1】 本発明に係る一実施例である蛋白質の立体構
造の予測演算及び予測精度演算装置の構成を示すブロッ
ク図である。
【図2】 図1の装置で実行される蛋白質の立体構造予
測及び精度計算処理を示すフローチャートである。
【図3】 図2のサブルーチンである予測座標計算処理
を示すフローチャートである。
【図4】 目的蛋白質がエラスターゼであり参照蛋白質
がキモトリプシノーゲンであるときの相同な残基ペアと
本発明に係る相対距離<dij>を示す図である。
【図5】 本発明で用いる目的蛋白質Xの残基番号iと
参照蛋白質Yの残基番号jとの間の相関関数Cp(i)
を示す数5を説明するための図である。
【図6】 図1の装置で予測された目的蛋白質エラスタ
ーゼの立体構造(実線)とそのX線結晶解析による計測
結果の立体構造(破線)とを示すステレオ図である。
【図7】 目的蛋白質エラスターゼの残基番号に対す
る、図1の装置で予測された目的蛋白質エラスターゼの
立体構造とそのX線結晶解析による計測結果の立体構造
との間の偏差liiを示すグラフである。
【図8】 目的蛋白質エラスターゼの残基番号に対す
る、図1の装置で計算された予測精度係数を示す相関関
数Cp(i)の平均値<C(i)>を示すグラフであ
る。
【符号の説明】
10…マイクロプロセッシングユニット(MPU)、 11…ROM、 12…RAM、 13…キーボード、 14…CRTディスプレイ、 15…プリンタ、 20…計算結果ファイル、 21…蛋白質データベース(PDB)ファイル、 RP1乃至RP8…対応する残基ペア。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 アミノ酸残基の原子の座標が既知の蛋白
    質のうち、立体構造を予測すべき目的蛋白質との相同性
    の度合いが高い少なくとも1つの蛋白質を参照蛋白質に
    選択し、上記選択した参照蛋白質のアミノ酸残基の原子
    の座標に基づいて上記目的蛋白質のアミノ酸残基の原子
    の座標が所定の方法で予測された目的蛋白質の立体構造
    の予測精度を演算する蛋白質の立体構造の予測精度演算
    方法であって、 上記目的蛋白質に含まれる複数種類のアミノ酸の物理化
    学的パラメータに基づいて、上記参照蛋白質と上記目的
    蛋白質の併置配列において各対応するアミノ酸残基に対
    する相関性を示す相関関数の値を、上記複数種類のアミ
    ノ酸の物理化学的パラメータから予め選択された少なく
    とも1つの選択物理化学的パラメータについてそれぞれ
    計算し、上記計算した相関関数の値を平均して計算され
    た相関関数の平均値を上記予測された目的蛋白質の立体
    構造の予測精度として用いることを特徴とする蛋白質の
    立体構造の予測精度演算方法。
  2. 【請求項2】 上記アミノ酸残基の原子はα炭素原子で
    あることを特徴とする請求項1記載の蛋白質の立体構造
    の予測精度演算方法。
  3. 【請求項3】 上記選択物理化学的パラメータは、極性
    度と、偏比容と、ターン形成度と、αアミノ基のpK値
    と、αカルボキシル基のpK値と、突然変異度とのうち
    の少なくとも1つを含むことを特徴とする請求項1又は
    2記載の蛋白質の立体構造の予測精度演算方法。
  4. 【請求項4】 アミノ酸残基の原子の座標が既知の蛋白
    質のうち、立体構造を予測すべき目的蛋白質との相同性
    の度合いが高い少なくとも1つの蛋白質を参照蛋白質に
    選択し、上記選択した参照蛋白質のアミノ酸残基の原子
    の座標に基づいて上記目的蛋白質のアミノ酸残基の原子
    の座標が所定の方法で予測された目的蛋白質の立体構造
    の予測精度を演算する蛋白質の立体構造の予測精度演算
    装置であって、 上記目的蛋白質に含まれる複数種類のアミノ酸の物理化
    学的パラメータに基づいて、上記参照蛋白質と上記目的
    蛋白質の併置配列において各対応するアミノ酸残基に対
    する相関性を示す相関関数の値を、上記複数種類のアミ
    ノ酸の物理化学的パラメータから予め選択された少なく
    とも1つの選択物理化学的パラメータについてそれぞれ
    計算する第1の計算手段と、 上記第1の計算手段によって計算された相関関数の値を
    平均して上記相関関数の平均値を計算する第2の計算手
    段とを備え、 上記第2の計算手段によって計算された上記相関関数の
    平均値を、上記予測された目的蛋白質の立体構造の予測
    精度として用いることを特徴とする蛋白質の立体構造の
    予測精度演算装置。
  5. 【請求項5】 上記アミノ酸残基の原子はα炭素原子で
    あることを特徴とする請求項4記載の蛋白質の立体構造
    の予測精度演算装置。
  6. 【請求項6】 上記選択物理化学的パラメータは、極性
    度と、偏比容と、ターン形成度と、αアミノ基のpK値
    と、αカルボキシル基のpK値と、突然変異度とのうち
    の少なくとも1つを含むことを特徴とする請求項4又は
    5記載の蛋白質の立体構造の予測精度演算装置。
JP6002461A 1994-01-14 1994-01-14 蛋白質の立体構造の予測精度演算方法及び予測精度演算装置 Expired - Fee Related JP2930851B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6002461A JP2930851B2 (ja) 1994-01-14 1994-01-14 蛋白質の立体構造の予測精度演算方法及び予測精度演算装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6002461A JP2930851B2 (ja) 1994-01-14 1994-01-14 蛋白質の立体構造の予測精度演算方法及び予測精度演算装置

Publications (2)

Publication Number Publication Date
JPH07206894A true JPH07206894A (ja) 1995-08-08
JP2930851B2 JP2930851B2 (ja) 1999-08-09

Family

ID=11529946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6002461A Expired - Fee Related JP2930851B2 (ja) 1994-01-14 1994-01-14 蛋白質の立体構造の予測精度演算方法及び予測精度演算装置

Country Status (1)

Country Link
JP (1) JP2930851B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999018440A1 (en) * 1997-10-02 1999-04-15 Akiko Itai Method of inferring three-dimensional structure of protein
WO2004016781A1 (ja) * 2002-08-13 2004-02-26 Riken ドメインを形成するヒト由来のタンパク質またはその用途
KR100592086B1 (ko) * 2004-07-16 2006-06-21 아주대학교산학협력단 적응적인 가중치 보팅 알고리즘을 적용한 단백질 이차구조 예측 방법
JPWO2005034004A1 (ja) * 2003-09-30 2006-12-14 日本電気株式会社 生体高分子の同定を支援するシステム、方法およびプログラム
WO2023139933A1 (ja) * 2022-01-21 2023-07-27 ソニーグループ株式会社 情報処理装置、情報処理方法、及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999018440A1 (en) * 1997-10-02 1999-04-15 Akiko Itai Method of inferring three-dimensional structure of protein
EP1028317A4 (en) * 1997-10-02 2002-10-02 Akiko Itai METHOD FOR THE INTERFERENCE OF A THREE-DIMENSIONAL PROTEIN STRUCTURE
US7212924B1 (en) 1997-10-02 2007-05-01 Akiko Itai Method of inferring three-dimensional structure of protein
WO2004016781A1 (ja) * 2002-08-13 2004-02-26 Riken ドメインを形成するヒト由来のタンパク質またはその用途
JPWO2005034004A1 (ja) * 2003-09-30 2006-12-14 日本電気株式会社 生体高分子の同定を支援するシステム、方法およびプログラム
KR100592086B1 (ko) * 2004-07-16 2006-06-21 아주대학교산학협력단 적응적인 가중치 보팅 알고리즘을 적용한 단백질 이차구조 예측 방법
WO2023139933A1 (ja) * 2022-01-21 2023-07-27 ソニーグループ株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JP2930851B2 (ja) 1999-08-09

Similar Documents

Publication Publication Date Title
Wojcik et al. New efficient statistical sequence-dependent structure prediction of short to medium-sized protein loops based on an exhaustive loop classification
Cowtan Fitting molecular fragments into electron density
ŠAli et al. Derivation of rules for comparative protein modeling from a database of protein structure alignments
Blaabjerg et al. Rapid protein stability prediction using deep learning representations
Lee et al. Prediction of protein side-chain conformation by packing optimization
Wilson et al. A computer model to dynamically simulate protein folding: studies with crambin
Janin et al. Macromolecular recognition in the protein data bank
George et al. SnapDRAGON: a method to delineate protein structural domains from sequence data
Rufino et al. Predicting the conformational class of short and medium size loops connecting regular secondary structures: application to comparative modelling
Dumontier et al. Armadillo: domain boundary prediction by amino acid composition
Lennox et al. Density estimation for protein conformation angles using a bivariate von Mises distribution and Bayesian nonparametrics
JPH07206894A (ja) 蛋白質の立体構造の予測精度演算方法及び予測精度演算装置
US20020072864A1 (en) Computer-based method for macromolecular engineering and design
AU2002249545B2 (en) Method for building optimal models of 3-dimensional molecular structures
US20060253260A1 (en) Methods for establishing and analyzing the conformation of amino acid sequences
O'Connell et al. The “random‐coil” state of proteins: Comparison of database statistics and molecular simulations
JP2856306B2 (ja) 蛋白質の立体構造の予測演算方法及び予測演算装置
WO2019232222A1 (en) Computational protein design using tertiary or quaternary structural motifs
Mathiowetz et al. Building proteins from Cα coordinates using the dihedral probability grid Monte Carlo method
Ogata et al. Prediction of protein side-chain conformations by principal component analysis for fixed main-chain atoms.
JP4243423B2 (ja) 蛋白質の立体構造の推定方法
Tasmia et al. An improved computational prediction model for lysine succinylation sites mapping on Homo sapiens by fusing three sequence encoding schemes with the random forest classifier
JP5382675B2 (ja) 安定な変異型タンパク質の製造方法
Samudrala et al. Confronting the problem of interconnected structural changes in the comparative modeling of proteins
Zenkevich Using Recurrent Dependences to Control, Adjust, and Recover Values of the Physicochemical Properties of Organic Compounds

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees