JPH07152775A - Method for determining three-dimensional structure of protein - Google Patents

Method for determining three-dimensional structure of protein

Info

Publication number
JPH07152775A
JPH07152775A JP29701693A JP29701693A JPH07152775A JP H07152775 A JPH07152775 A JP H07152775A JP 29701693 A JP29701693 A JP 29701693A JP 29701693 A JP29701693 A JP 29701693A JP H07152775 A JPH07152775 A JP H07152775A
Authority
JP
Japan
Prior art keywords
protein
simulation
value
dihedral angle
interaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP29701693A
Other languages
Japanese (ja)
Inventor
Motonori Oota
元規 太田
Nobuhiko Saito
信彦 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Waseda University
Tonen General Sekiyu KK
Original Assignee
Waseda University
Tonen Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Waseda University, Tonen Corp filed Critical Waseda University
Priority to JP29701693A priority Critical patent/JPH07152775A/en
Publication of JPH07152775A publication Critical patent/JPH07152775A/en
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

PURPOSE:To quickly predict and determine structure close to natural structure by automating a part for setting up and updating a mutually interacting range and optimizing energy. CONSTITUTION:A simulation condition is inputted, the two-face angles of parts having the primary structure and secondary structure of a protein are inputted, the initial two-face angle is inputted to a random coil of the protein so as to obtain extended structure at first, and an updatable mutually interacting range is set up. Under the set condition, energy optimization is executed by using simulated annealing, and after checking that the mutually affected range is equal to the total number of residues of the protein, simulation is executed only by prescribed trial frequency and a two-face angle for predicted structure is outputted. Consequently structure close to natural structure can be quickly predicted and determined.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、一次構造及び二次構造
既知の蛋白質の立体構造(即ち、三次構造)を自動的に
決定する方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for automatically determining the three-dimensional structure (that is, tertiary structure) of a protein having a known primary structure and secondary structure.

【0002】[0002]

【従来の技術】蛋白質の立体構造を決定する方法とし
て、X線結晶解析法、分光学的方法などが知られている
(タンパク質化学3「高次構造」、第 215〜289 頁、第
324〜347 頁、1973年(共立出版);E. D. Schmidら
「Spectroscopy of Biological Molecules-New Advance
s 」, John Wiley & Sons, New York, 1988 )。
2. Description of the Related Art X-ray crystallography and spectroscopic methods are known as methods for determining the three-dimensional structure of proteins (Protein Chemistry 3, "Higher-order structure", pp. 215-289, p.
324-347, 1973 (Kyoritsu Shuppan); ED Schmid et al. "Spectroscopy of Biological Molecules-New Advance"
S., John Wiley & Sons, New York, 1988).

【0003】蛋白質は、折りたたまれ秩序のある状態
と、折りたたまれず乱れた状態との間で動的に平衡して
おり、この平衡は、一部は、蛋白質の構造を安定化させ
ようとするアミノ酸残基の側鎖の間の相互作用を反映
し、他方では、分子の乱雑さを促進しようとする熱力学
的力を反映する。
[0003] Proteins are in dynamic equilibrium between a folded and ordered state and an unfolded and disordered state, and this equilibrium is, in part, the amino acids that try to stabilize the protein's structure. It reflects the interactions between the side chains of the residues and, on the other hand, the thermodynamic forces that try to promote the disorder of the molecule.

【0004】蛋白質は、通常、20種のアミノ酸から構
成され、そのアミノ酸配列の違いにより、個々に異なる
立体構造及び性質をもつ。このような相違をもたらすア
ミノ酸類は、側鎖の構造や荷電に起因して、非極性アミ
ノ酸類(例えば、Ala、Val、Leu、Ile、P
ro、Phe、Trp、Met)、非荷電性極性アミノ
酸類(例えば、Gly、Ser、Thr、Cys、Ty
r、Asn、Gln)、及び荷電性極性アミノ酸類(例
えば、Asp、Glu、Lys、Arg、His)に大
別することができる。
A protein is usually composed of 20 kinds of amino acids, and has different three-dimensional structures and properties depending on the difference in the amino acid sequence. Amino acids that cause such a difference are nonpolar amino acids (for example, Ala, Val, Leu, Ile, P, etc.) due to the structure and charge of the side chain.
ro, Phe, Trp, Met), uncharged polar amino acids (eg, Gly, Ser, Thr, Cys, Ty)
r, Asn, Gln) and charged polar amino acids (eg Asp, Glu, Lys, Arg, His).

【0005】蛋白質の一次構造は、DNAの塩基配列決
定法(Maxam ら,Methods in Enzymology, 65, 499 (1
980))の進歩に伴って次々と決定されている。さらに、
その一次構造に基づいて、ヘリックス構造やβ構造など
の二次構造の予測が可能となっている(G.E.Schulz &
R.H.Schirmer 共著、大井龍夫監訳「タンパク質−構造
・機能・進化」、化学同人、1980年)。二次構造
は、蛋白質主鎖の規則的な配置であって、側鎖の種類や
コンホメーションとは無関係であり、ペプチドのアミド
基とカルボキシル基の間の水素結合によって安定化され
ている。ヘリックス構造は線状構造であるため、規則的
なヘリックスの場合には1対の二面角(φ,Ψ)で表現
することができる(二面角については、G.E.Schulz &
R.H.Schirmer(上掲)参照)。非常に安定で蛋白質中に
よく現われるのがα−ヘリックスであり、まれに310
リッスも見られる。一方、β構造は、複数個の延びたポ
リペプチド鎖が水素結合でつながってシート状構造を形
成したものであり、平行βシート、反平行βシートなど
がある。
The primary structure of a protein is determined by the DNA sequencing method (Maxam et al., Methods in Enzymology, 65 , 499 (1
980)) is being decided one after another. further,
Based on the primary structure, it is possible to predict secondary structures such as helix structure and β structure (GESchulz &
Co-authored by RHSchirmer, "Protein-Structure / Function / Evolution", translated by Tatsuo Ooi, Kagaku Dojin, 1980). The secondary structure is a regular arrangement of the protein main chain, which is independent of the side chain type and conformation, and is stabilized by the hydrogen bond between the amide group and the carboxyl group of the peptide. Since the helix structure is a linear structure, a regular helix can be expressed by a pair of dihedral angles (φ, Ψ) (for dihedral angles, see GESchulz &
RHSchirmer (see above)). Is a very stable and well appears to have α- helix in the protein, rarely 3 10 Herissu can also be seen. On the other hand, the β structure is a structure in which a plurality of extended polypeptide chains are connected by hydrogen bonds to form a sheet-like structure, such as a parallel β sheet and an antiparallel β sheet.

【0006】特に、前述の物理学的方法(X線結晶解析
法,分光学的方法)により、蛋白質の立体構造の予測、
決定が行なわれるが、目的の蛋白質の大量入手及びその
結晶の調製の困難さのために、立体構造の分かっている
蛋白質は数百にすぎない。これら公知の立体構造の大部
分は、X線結晶解析によるものである。このような状況
下にあって、蛋白質の立体構造を理論的に予測する手法
もいくつか提案されている(例えば、N. Saitoら,Repo
rts on Progress in Polymer Physics in Japan, Vol.
XXXV, 1992;斎藤信彦,生物物理,25(6), 11-20(198
5);C. Wilson とS. Doniach, PROTEINS: Structurp Fu
nction, and Genetics 6: 193-209 (1989);T. L. Blun
dellら,Nature 326, 347 (1987);J. Skolnick と
A. Kolinski, J. Mol. Biol., 221, 499 (1991))など
が知られている。さらに、蛋白質の立体構造の予測に関
し、本発明者はすでに添付図面中図2に示す方法を提案
してきた(N. Saitoら,Reports on Progress in Polym
er Physics in Japan, Vol. XXXV, 1992;斎藤信彦,生
物物理,25(6), 11-20(1985))。しかし、この方法は相
互作用範囲の更新ができないといった欠点をもつ。
[0006] In particular, the three-dimensional structure of a protein is predicted by the above-mentioned physical methods (X-ray crystallographic analysis method, spectroscopic method),
Although decisions have been made, there are only a few hundred proteins of known conformation due to the large availability of the protein of interest and the difficulty in preparing its crystals. Most of these known three-dimensional structures are based on X-ray crystallography. Under such circumstances, some methods for theoretically predicting the three-dimensional structure of proteins have been proposed (for example, N. Saito et al., Repo
rts on Progress in Polymer Physics in Japan, Vol.
XXXV, 1992; Nobuhiko Saito, Biophysics, 25 (6), 11-20 (198)
5) ; C. Wilson and S. Doniach, PROTEINS: Structurp Fu
nction, and Genetics 6: 193-209 (1989); TL Blun
dell et al., Nature 326 , 347 (1987); with J. Skolnick
A. Kolinski, J. Mol. Biol., 221 , 499 (1991)) are known. Further, regarding the prediction of the three-dimensional structure of a protein, the present inventor has already proposed the method shown in FIG. 2 in the attached drawings (N. Saito et al., Reports on Progress in Polym.
er Physics in Japan, Vol. XXXV, 1992; Nobuhiko Saito, Biophysics, 25 (6), 11-20 (1985)). However, this method has the drawback that the interaction range cannot be updated.

【0007】[0007]

【発明が解決しようとする課題】蛋白質の立体構造を予
測する従来の方法においては、たとえコンピューターを
使用しても大規模な計算を必要としたり、またプログラ
ミングを実行するオペレーター自身の経験知識に依存す
るところが大きい、といった問題点があった。このよう
な課題を解消すべく、鋭意研究を重ねた結果、本発明
は、「島模型」を用いる立体構造の予測法に基づいて、
蛋白質鎖に沿って近距離(ときには中距離)にある疎水
基同士を後述のシミュレーテッドアニーリング(simula
ted annealing )を用い相互作用させることにより、二
次構造を自動的に三次構造へとパッキングする方法を見
出したものである。
The conventional methods for predicting the three-dimensional structure of a protein require large-scale calculation even if a computer is used, and depend on the experience of the operator himself who executes programming. There was a problem that there was a lot to do. As a result of intensive studies to solve such problems, the present invention is based on a three-dimensional structure prediction method using an “island model”.
Hydrophobic groups at short distances (sometimes medium distances) along the protein chain are subjected to simulated annealing (simula) described later.
We have discovered a method of automatically packing secondary structures into tertiary structures by using ted annealing).

【0008】[0008]

【課題を解決するための手段】本発明は、蛋白質の立体
構造を決定する方法であって、(a) シミュレーショ
ン条件を入力し、(b) 蛋白質の一次構造と、二次構
造を取る部分の二面角とを入力し、(c) 最初伸びた
構造となるよう蛋白質のランダムコイルに初期二面角を
入力し、(d) 更新可能な相互作用範囲を設定し、
(e) 設定された条件下でシミュレーテッドアニーリ
ングを用いてエネルギーの最適化を行ない、(f) 相
互作用範囲が該蛋白質の全残基数になっていることを確
認し、(g) 所定の試行回数だけシミュレーションを
行ない、(h) 予測構造の二面角を出力するステップ
を具備することを特徴とする前記方法を提供する。
The present invention is a method for determining the three-dimensional structure of a protein, which comprises (a) inputting simulation conditions, and (b) a part of the protein having a primary structure and a secondary structure. Input the dihedral angle, (c) enter the initial dihedral angle in the random coil of the protein so that the structure initially stretches, and (d) set the renewable interaction range,
(E) Energy optimization was performed using simulated annealing under set conditions, (f) it was confirmed that the interaction range was the total number of residues of the protein, and (g) The method is characterized by comprising the step of: (h) outputting the dihedral angle of the prediction structure by performing simulation for the number of trials.

【0009】斉藤ら(上掲)が開発した島模型による蛋
白質の立体構造の予測は、一つの重要な規則、即ち「蛋
白質の鎖に沿って近距離の疎水性アミノ酸ペアが近づい
ている(よく相互作用している)」に基づいている。つ
まり、蛋白質の鎖に沿って近距離の疎水性アミノ酸ペア
が近づくという制限つきで、蛋白質は折りたたまれてい
くと推定している。一般に、球状の蛋白質は、親水性の
基を表面に、疎水性の基を内部に配置してその三次構造
を形成しており、折りたたみの際に疎水性基が重要な役
割を果たすという「疎水性相互作用」が注目を集めてき
た。ここで、疎水性相互作用とは次のように説明され
る。疎水性アミノ酸の側鎖が水に触れると、その側鎖の
周りに水が規則的にはりつき、エントロピーが低い状態
となる。この疎水性アミノ酸同士が近づき、その側鎖に
はりついている水同士が接触しあうと、規則正しい構造
が崩れエントロピーが増加する。その結果、接触によっ
てエネルギーは少し増加するが、全体として自由エネル
ギーは低下することとなる。これが一般的に言われてい
る疎水性相互作用のメカニズムである。このような疎水
性相互作用に関わっている疎水性アミノ酸は、主にトリ
プトファン、フェニルアラニン、ロイシン、イソロイシ
ン、メチオニン及びバリンである。さらに、より弱い疎
水性アミノ酸、即ちアラニン、システイン及びチロシン
もまた相互作用に関わる場合もあると考えられる。
The island model developed by Saito et al. (Supra) predicts the three-dimensional structure of a protein by one important rule, namely, "a close pair of hydrophobic amino acid pairs are close to each other along the protein chain. Interacting with each other) ”. In other words, it is presumed that proteins are folded with the restriction that short-distance hydrophobic amino acid pairs come close to each other along the protein chain. Generally, a globular protein has a hydrophilic group on the surface and a hydrophobic group inside to form its tertiary structure, and the hydrophobic group plays an important role during folding. "Sex interaction" has attracted attention. Here, the hydrophobic interaction is explained as follows. When the side chain of the hydrophobic amino acid comes into contact with water, water regularly sticks around the side chain, resulting in a low entropy state. When these hydrophobic amino acids approach each other and the water clinging to their side chains contact each other, the regular structure collapses and the entropy increases. As a result, the contact increases the energy a little, but the overall free energy decreases. This is the generally known mechanism of hydrophobic interaction. The hydrophobic amino acids involved in such hydrophobic interactions are mainly tryptophan, phenylalanine, leucine, isoleucine, methionine and valine. In addition, the weaker hydrophobic amino acids, alanine, cysteine and tyrosine, may also be involved in the interaction.

【0010】本発明を、図1に示したフローチャートを
参照しながら説明する。
The present invention will be described with reference to the flow chart shown in FIG.

【0011】本発明の蛋白質立体構造を自動的に予測・
決定する方法は、(a)シミュレーション条件の入力ス
テップ、(b)一次及び二次構造データの入力ステッ
プ、(c)ランダムコイルへの初期二面角の入力ステッ
プ、(d)相互作用範囲の設定ステップ、(e)エネル
ギー最適化ステップ、(f)相互作用範囲が全残基数に
なっていることを確認するステップ、(g)指定された
試行回数だけシミュレーションされたことを確認するス
テップ及び(h)予測構造の二面角の出力ステップから
構成される。本発明の方法はさらに、(i)予測構造の
三次元座標のグラフ化ステップを包含し得る。
The protein three-dimensional structure of the present invention is automatically predicted.
The determination method is as follows: (a) simulation condition input step, (b) primary and secondary structure data input step, (c) initial dihedral angle input step to random coil, (d) interaction range setting Step, (e) energy optimization step, (f) step of confirming that the interaction range is the total number of residues, (g) step of confirming that the simulation has been performed a designated number of times, and ( h) Comprised of dihedral angle output steps of the prediction structure. The method of the present invention may further include (i) graphing the three-dimensional coordinates of the prediction structure.

【0012】以下に、これら(a)〜(i)の各ステッ
プを説明する。
The steps (a) to (i) will be described below.

【0013】ステップ(a)では、シミュレーション条
件を入力する。通常、次のシミュレーション条件を使用
することができる。
In step (a), simulation conditions are input. Generally, the following simulation conditions can be used.

【0014】・試行回数:何回シミュレーションを繰り
返すかを示す。
Number of trials: Shows how many times the simulation is repeated.

【0015】・残基数:蛋白質の残基数を示す。Number of residues: Indicates the number of residues in the protein.

【0016】・乱数の開始値:この値から乱数列を発生
させる。
Start value of random number: A random number sequence is generated from this value.

【0017】・ランダムコイルの数:ランダムコイルの
部分がいくつあるかを示す。
Number of random coils: Shows how many random coil parts there are.

【0018】・ランダムコイルの場所:N残基からM残
基までという形でランダムコイルの数だけ指定する。
Location of random coil: Specify the number of random coils in the form of N residues to M residues.

【0019】・相互作用範囲の初期値:相互作用させ
る、鎖に沿っての残基数の初期値を示す。
Initial value of interaction range: Indicates the initial value of the number of residues along the chain to be interacted with.

【0020】・相互作用範囲の更新値:エネルギー最適
化が一回終了した後、相互作用範囲をどれだけ伸ばすか
を示す。
Update value of interaction range: Indicates how much the interaction range is extended after the energy optimization is completed once.

【0021】・1回のエネルギー最適化のステップ数:
相互作用範囲を設定した後、エネルギー最適化を何モン
テカルロステップ行なうかを示す。
Number of steps for one energy optimization:
After setting the interaction range, we show how many Monte Carlo steps to perform energy optimization.

【0022】・アニーリング開始温度:シミュレーテッ
ドアニーリングの開始温度を示す。
Annealing start temperature: Indicates the starting temperature of simulated annealing.

【0023】・アニーリング終了温度:シミュレーテッ
ドアニーリングの終了温度を示す。
Annealing end temperature: Indicates the end temperature of simulated annealing.

【0024】・アニーリング温度更新回数:アニーリン
グを開始してから終了するまで何回温度を更新するかを
示す。
Number of times annealing temperature is updated: Indicates how many times the temperature is updated from the start to the end of annealing.

【0025】さらに必要に応じて以下の条件を追加して
もよい。
Further, the following conditions may be added if necessary.

【0026】・レナードジョーンズ(Lennard-Jones )
ポテンシャル(ファンデルワールス力)について、 1−4の相互作用に対する係数:1−4の相互作用(あ
る原子から結合に沿って数えて4番目の原子との相互作
用)についてはこの係数を掛けた分だけエネルギーとし
てカウントする。
[Lennard-Jones]
For the potential (Van der Waals force): Coefficient for 1-4 interaction: For 1-4 interaction (interaction from an atom with the fourth atom counting along the bond), multiply this coefficient Only the minutes are counted as energy.

【0027】相互作用範囲以外の原子間に対する係数:
相互作用範囲以外の原子間には斥力部分にこの係数を掛
けた分だけエネルギーとしてカウントする。
Coefficients between atoms outside the interaction range:
Between atoms outside the interaction range, the repulsive force is multiplied by this coefficient to count as energy.

【0028】・エントロピーを自由エネルギーに換算す
る時の温度:エントロピーの値に温度を掛け、エネルギ
ーと足して自由エネルギーにするための温度を示す。
Temperature when entropy is converted to free energy: The temperature for multiplying the entropy value by the temperature and adding the energy to obtain free energy is shown.

【0029】・スケーリング間隔:乱数を用いて二面角
のねじりに変更するためのスケーリングを何モンテカル
ロステップ毎に行なうかを示す。
Scaling interval: Indicates how many Monte Carlo steps are performed for scaling to change the twist of the dihedral angle using a random number.

【0030】・エネルギーの揺らぎ:二面角のねじりの
最大値がどのくらいのエネルギーの揺らぎに対応するか
を示す。
Energy fluctuation: It shows how much the maximum value of the twist of the dihedral angle corresponds to the energy fluctuation.

【0031】・二面角のねじりの最大カットオフ値:二
面角のねじりがこの値より大きくなったときに、この値
に設定する。
Maximum cutoff value for twisting of dihedral angles: Set to this value when twisting of dihedral angles becomes larger than this value.

【0032】・二面角のねじりの最小カットオフ値:二
面角のねじりがこの値より小さくなったときに、この値
に設定する。
Minimum twist-off cutoff value of dihedral angle: Set to this value when the twist of dihedral angle becomes smaller than this value.

【0033】・リスト出力間隔:エネルギーの値をこの
値毎にファイルに出力する。
List output interval: The energy value is output to a file for each value.

【0034】・二面角の刻み値:乱数を二面角のねじり
値に変更する時に用いる刻み値を示す。
Dihedral angle step value: Indicates the step value used when changing the random number to the dihedral angle twist value.

【0035】・SS結合の有無。Presence / absence of SS bond.

【0036】・水素結合の有無。Presence / absence of hydrogen bond.

【0037】ステップ(b)では、蛋白質の一次構造と
二次構造(ヘリックス構造及びβ構造)を取る部分とを
データ入力する。このとき、一次構造はアミノ酸配列
を、二次構造は実際にとり得る二面角を夫々入力する。
In step (b), data is input for the primary structure of the protein and the portion having the secondary structure (helix structure and β structure). At this time, an amino acid sequence is input as the primary structure, and a dihedral angle that can be actually taken is input as the secondary structure.

【0038】ステップ(c)では、ランダムコイルに最
初に与える二面角の値を入力する。最初は伸びた構造と
仮定し、そのときの二面角(φ,Ψ)を入力する。この
二面角の設定は任意であるが、通常(180°,180
°)又は(−120°,120°)に設定し、またプロ
リンの場合にはφは約−75度に固定するのがよい。
In step (c), the value of the dihedral angle initially given to the random coil is input. First, assume that the structure is elongated, and enter the dihedral angle (φ, Ψ) at that time. The setting of this dihedral angle is arbitrary, but normally (180 °, 180
) Or (-120 °, 120 °), and in the case of proline, φ should be fixed at about -75 °.

【0039】ステップ(d)では、ステップ(a)です
でに決めた最初の主鎖に沿って相互作用させる範囲(こ
れを「相互作用範囲の初期値」という)につき、その範
囲を一定の残基数(これを「更新値」という)ごとに伸
ばしていく操作を行なう。相互作用範囲に関しては、蛋
白質の「折りたたみ(folding) 」が、前述した「疎水性
相互作用」が広範囲力として働くこと、並びに、近距離
(ときには中距離)の疎水性アミノ酸ペアが特異的に決
まることに基づいて実効されるという前提に立ってい
る。「相互作用範囲」は、下記の式: 相互作用範囲=(相互作用範囲の初期値)+(更新値)
×(相互作用範囲の更新回数) から算出される。ここで、相互作用範囲の更新回数は、
エネルギー最適化の回数を示す。
In step (d), for the range of interaction along the first main chain already determined in step (a) (this is referred to as "initial value of interaction range"), the range remains constant. Perform the operation to increase each radix (this is called the "updated value"). Regarding the range of interaction, the protein'folding 'determines that the above-mentioned'hydrophobic interaction' acts as a broad force, and that short-range (sometimes medium-range) hydrophobic amino acid pairs are specifically determined. It is based on the premise that it will be implemented based on that. "Interaction range" is the following formula: Interaction range = (initial value of interaction range) + (updated value)
Calculated from × (the number of times the interaction range is updated). Here, the number of updates of the interaction range is
Indicates the number of energy optimizations.

【0040】ステップ(e)では、ステップ(d)で設
定された条件下でシミュレーテッドアニーリングを用い
てエネルギーの最適化を行なう。
In step (e), the energy is optimized by using simulated annealing under the conditions set in step (d).

【0041】シミュレーテッドアニーリングは、非線型
の最適化手法の一種であり、金属などを徐々に冷やして
きれいに結晶化させることを模擬しているところから、
焼きなまし法とも称する。この方法では、まず温度を設
定し、次に現在の状態変数における目的関数の値(O
1)と次ステップでの状態変数における目的関数の値
(O2)を算出しその差(△O=O2−O1)を求め
る。もし△Oが負ならばO1よりO2の方が値が小さい
ということなので、次ステップでの状態変数を無条件で
受容する。もし△Oが正ならば、その大きさと温度に応
じた確率で次ステップでの状態変数を受容し、他を除外
する。この時の受容の確率は△Oが小さいほど、温度が
高いほど、高率になるように設定されている。この手続
きを何回か繰り返した後徐々に温度を下げていき、最終
状態を得る。このように最適化を行なうと、状態が局所
的な極少値(凹凸の多い目的関数の最小値)にひっかか
ってもある確率で抜け出ることが可能である。シミュレ
ーテッドアニーリングの詳細は、Kirkpatrick, S. ら,
Science, 220, 4598 (1983) に記載されている。
Simulated annealing is a kind of non-linear optimization method, and since it simulates gradually cooling a metal or the like to crystallize it neatly,
Also called the annealing method. In this method, the temperature is first set, and then the value of the objective function (O
The value (O2) of the objective function in the state variable in 1) and the next step is calculated, and the difference (ΔO = O2-O1) is obtained. If ΔO is negative, it means that the value of O2 is smaller than that of O1, so the state variable in the next step is unconditionally accepted. If ΔO is positive, the state variable in the next step is accepted with a probability corresponding to the magnitude and temperature, and the others are excluded. The acceptance probability at this time is set to be higher as ΔO is smaller and as temperature is higher. After repeating this procedure several times, the temperature is gradually lowered to obtain the final state. When the optimization is performed in this way, even if the state is caught by a local minimum value (minimum value of an objective function having many irregularities), it is possible to exit with a certain probability. For more information on simulated annealing, see Kirkpatrick, S. et al.
Science, 220 , 4598 (1983).

【0042】エネルギーの最適化におけるエネルギー関
数(目的関数の値)は、以下の3つのエネルギー(単位
kcal/mol )の和からなる。
The energy function (value of the objective function) in the energy optimization is the following three energies (unit:
kcal / mol).

【0043】(i) ファンデア・ワールス力 下記の6−12型のレナード・ジョーンズポテンシャル
を採用する。
(I) Van der Waals Force The following 6-12 type Leonard-Jones potential is adopted.

【0044】[0044]

【数1】 [Equation 1]

【0045】ここでA,BはパラメータでECCEP
(Momany, F.A.ら,J. Phys. Chem.,78, 1595(1974))
もしくはOPLS(Jorgensen, W.L. ら,J. Am. Chem.
Soc.,110, 1657 (1988) )などのモレキュラーダイナ
ミックスのファンデア・ワールス力のものを用いる。ま
たrは疎水性側鎖を球とみなしたときの中心間距離を示
す。
Here, A and B are parameters ECCEP
(Momany, FA et al., J. Phys. Chem., 78 , 1595 (1974))
Or OPLS (Jorgensen, WL et al., J. Am. Chem.
Soc., 110 , 1657 (1988)) and other molecular dynamics van der Waals forces are used. Further, r represents the center-to-center distance when the hydrophobic side chain is regarded as a sphere.

【0046】(ii) 疎水性相互作用 この相互作用を疎水性アミノ酸側鎖間に導入する。(Ii) Hydrophobic Interaction This interaction is introduced between the hydrophobic amino acid side chains.

【0047】[0047]

【数2】 [Equation 2]

【0048】ここで、ro は疎水性側鎖のファンデア・
ワールス半径の和(オングストローム)を、またrは疎
水性側鎖を球とみなしたときの中心間距離を示す。
Where r o is the van der of the hydrophobic side chain
The sum of the Walls radii (angstrom), and r represents the center-to-center distance when the hydrophobic side chain is regarded as a sphere.

【0049】(iii )エントロピー力 ガウス鎖を仮定し、疎水性アミノ酸Cα間に導入する。(Iii) Entropy force Assuming a Gaussian chain, it is introduced between the hydrophobic amino acids Cα.

【0050】[0050]

【数3】 [Equation 3]

【0051】ここで、Rは気体定数、Tは温度(°
K)、Nは疎水基間のモノマー数、rは上記と同義であ
る。
Here, R is a gas constant and T is a temperature (°
K) and N are the numbers of monomers between the hydrophobic groups, and r is as defined above.

【0052】上記3つの和を目的関数とし、それをシミ
ュレーテッドアニーリングを用いて最適化する。アニー
リング温度は最初約160°K、終了時約60°Kと
し、従来行なわれているように数千度などにはしない。
これは、短い相互作用範囲で作られた構造を壊さずに最
適化を進めるためである。
The above-mentioned three sums are used as an objective function, and the objective function is optimized by using simulated annealing. The annealing temperature is set to about 160 ° K at the beginning and about 60 ° K at the end, and is not set to several thousand degrees as is conventionally done.
This is to proceed with the optimization without breaking the structure created in the short interaction range.

【0053】ステップ(f)では、相互作用範囲が全残
基数になっているかを判断する。もし全残基数にいたっ
ていない場合には、ステップ(d)に戻るようにし、そ
の後のステップ(d)〜(f)を実施する。一方、もし
相互作用範囲=全残基数となった場合にはステップ
(g)に進む。
In step (f), it is determined whether the interaction range is the total number of residues. If the total number of residues is not reached, the process returns to step (d) and the subsequent steps (d) to (f) are performed. On the other hand, if the interaction range = the total number of residues, go to step (g).

【0054】ステップ(g)では、設定された回数だけ
シミュレーションを行なったかを判断する。もし否なら
ば、乱数列を変えて同じシミュレーションを行なうため
二面角を初期化した後、ステップ(d)に戻るように
し、その後のステップ(d)〜(g)を実施する。一
方、もし指定された試行回数がシミュレートされた場合
には、ステップ(h)に進む。
In step (g), it is determined whether the simulation has been performed the set number of times. If not, the dihedral angle is initialized to change the random number sequence to perform the same simulation, and then the process returns to step (d), and the subsequent steps (d) to (g) are executed. On the other hand, if the specified number of trials is simulated, the process proceeds to step (h).

【0055】ステップ(h)では、予測した構造の二面
角を出力する。
In step (h), the dihedral angle of the predicted structure is output.

【0056】ステップ(i)では、ステップ(h)で出
力された二面角から予測構造の三次元座標をグラフ化す
る。
In step (i), the three-dimensional coordinates of the predicted structure are graphed from the dihedral angles output in step (h).

【0057】一般に三次元座標は次のように求めること
ができる。
Generally, the three-dimensional coordinates can be obtained as follows.

【0058】例えば、ねじりたい二面角が蛋白質主鎖の
i番目とi+1番目の原子の間であるとする。このと
き、二面角をねじっても即ち結合主鎖をねじってもi+
1番目の原子の座標は変化しないが、i+2番目以降の
原子の座標は全て変化するものとする。また、ねじる角
度はθとし、参照する三次元構造[二面角以外の変数
(例えば結合長、結合角)が天然構造と等しい構造]は
すでに入力済みとする。
For example, assume that the dihedral angle to be twisted is between the i-th and i + 1-th atoms of the protein main chain. At this time, even if the dihedral angle is twisted, that is, the bond main chain is twisted, i +
The coordinates of the first atom do not change, but the coordinates of the i + 2nd and subsequent atoms all change. The twisting angle is θ, and the three-dimensional structure to be referred to [a structure other than the dihedral angle (for example, bond length, bond angle) equal to the natural structure] is already input.

【0059】上記設定の下で、以下の作業を実施する。The following work is carried out under the above settings.

【0060】(i) ねじる角度θを決める。ここでθ
は、参照構造のi番目とi+1番目の原子の間の二面角
と予測した構造のi番目とi+1番目の原子の間の二面
角の差である。
(I) Determine the twist angle θ. Where θ
Is the difference between the dihedral angle between the i-th and i + 1-th atoms of the reference structure and the predicted dihedral angle between the i-th and i + 1-th atoms of the structure.

【0061】(ii) i番目の原子からi+1番目の原
子への方向ベクトルを求める。これを(dx,dy,d
z)とする。
(Ii) The direction vector from the i-th atom to the i + 1-th atom is obtained. This is (dx, dy, d
z).

【0062】(iii ) 回転行列Rを作成する。(Iii) A rotation matrix R is created.

【0063】[0063]

【数4】 [Equation 4]

【0064】(iv) i+1番目の原子からi+2番目
の原子へのベクトルを求める。これを(x12,y12,z
12)とする。
(Iv) Find the vector from the (i + 1) th atom to the (i + 2) th atom. This is (x 12 , y 12 , z
12 ).

【0065】(v) 下記式の計算により、i+1番目
の原子を中心に回転を行ない、i+2番目の原子の新し
い座標を決める。ここで新しいi+2番目の原子の座標
を(Xi+2 ,Yi+2 ,Zi+2 )とする。また、i+1番
目の原子の座標を(Xi+1 ,Yi+1 ,Zi+1 )とする。
(V) By the calculation of the following formula, rotation is performed around the (i + 1) th atom, and a new coordinate of the (i + 2) th atom is determined. Here, the coordinates of the new i + 2nd atom are (X i + 2 , Y i + 2 , Z i + 2 ). The coordinates of the i + 1-th atom are (X i + 1 , Y i + 1 , Z i + 1 ).

【0066】[0066]

【数5】 [Equation 5]

【0067】(vi) (iv)、(v)の作業を順次i+
3番目から終りの原子まで進める。
(Vi) The work of (iv) and (v) is sequentially performed by i +
Advance from the third atom to the last atom.

【0068】(vii ) 回転させる二面角の場所を、i
+1番目とi+2番目の原子の間の二面角、i+2とi
+3番目の原子の間の二面角………というように変えて
新しい座標を決めていく。
(Vii) The position of the dihedral angle to be rotated is i
Dihedral angle between + 1st and i + 2nd atoms, i + 2 and i
Change the dihedral angle between the + 3rd atoms and so on to determine new coordinates.

【0069】(viii) 全ての二面角をねじり終えたら
終了とする。
(Viii) When all the dihedral angles have been twisted, the process ends.

【0070】計算した座標は、原子座標の表示プログラ
ム[例えば、Insight(BIOSYM製)、Mo
l−Graph(ダイキン工業製)、AVS(AVS社
製)など]で読み込みができるような形、例えばプロテ
インデータバンク(PDB)フォーマットにして出力す
る。そして、上記のようなプログラムに入力しグラフィ
ック表示する。
The calculated coordinates are the atomic coordinate display program [for example, Insight (manufactured by BIOSYM), Mo
1-Graph (manufactured by Daikin Industries, Ltd.), AVS (manufactured by AVS), etc.], for example, in a protein data bank (PDB) format for output. Then, the program as described above is input and displayed graphically.

【0071】あるいは、三次元座標から各アミノ酸のC
α間の距離を計算し、これを用いて距離マップを作図す
ることも可能である。距離マップの作図は以下のように
して行なうことができる。
Alternatively, the C of each amino acid can be determined from the three-dimensional coordinates.
It is also possible to calculate the distance between α and use this to draw a distance map. The distance map can be constructed as follows.

【0072】(i) N残基からなる蛋白質の場合、横
軸に1〜N−1、縦軸に上から2〜Nまで番号をふる。
(I) In the case of a protein consisting of N residues, numbers are given from 1 to N-1 on the horizontal axis and from 2 to N from the top on the vertical axis.

【0073】(ii) 1番目のアミノ酸と2番目のアミ
ノ酸のCα間の距離を計算し、それがカットオフ値より
大きいか小さいかで、対応する場所(1,2)に記号を
付ける。
(Ii) Calculate the distance between Cα of the 1st amino acid and the 2nd amino acid, and mark the corresponding place (1, 2) depending on whether it is larger or smaller than the cutoff value.

【0074】(iii ) 2番目のアミノ酸と3番目のア
ミノ酸のCα間の距離を計算し、それがカットオフ値よ
り大きいか小さいかで、対応する場所(1,3)に記号
を付ける。
(Iii) Calculate the distance between Cα of the 2nd amino acid and the 3rd amino acid, and mark the corresponding place (1, 3) depending on whether it is larger or smaller than the cutoff value.

【0075】(iv) この作業を(N−1,N)まで繰
り返し、図の左下半分(三角マップ)を記号で埋め尽く
す。
(Iv) This operation is repeated up to (N-1, N), and the lower left half of the figure (triangular map) is filled with symbols.

【0076】[0076]

【実施例】下記の非限定的実施例によって、本発明をさ
らに詳しく説明する。
The invention is illustrated in more detail by the following non-limiting examples.

【0077】実施例1 クランビン(crambin) の折り
たたみシミュレーション(1) この実施例では、図1に示す本発明のフローチャートに
従ってクランビンの折りたたみシミュレーションを行な
った。シミュレーション条件は下記の通りである。
Example 1 Folding of crambin
Folding Simulation (1) In this embodiment, the folding simulation of the clambin was performed according to the flowchart of the present invention shown in FIG. The simulation conditions are as follows.

【0078】試行回数:20回 残基数:46 乱数の開始値:1026400755 ランダムコイルの数:6 ランダムコイルの場所:1−1,4−6,18−22,31−
32,35−41,45−46 相互作用範囲の初期値:6 相互作用範囲の更新値:5 レナードジョーンズポテンシャル(ファンデルワールス
力)について 1−4の相互作用に対する係数:0.5 相互作用範囲以外の原子間に対する係数:0.5 1回のエネルギー最適化のステップ数:300 スケーリング間隔:30 エネルギーの揺らぎ:10 Kcal/mol 二面角のねじりの最大カットオフ値:9度 二面角のねじりの最小カットオフ値:0.018度 アニーリング開始温度:160ケルビン アニーリング終了温度:60ケルビン エントロピーを自由エネルギーに換算する時の温度:1
00ケルビン アニーリング温度更新回数:50回 二面角の刻み値:1.8度 レナードジョーンズポテンシャルのカットオフ値:10
Kcal/mol 。
Number of trials: 20 Number of residues: 46 Start value of random number: 1026400755 Number of random coils: 6 Place of random coils: 1-1, 4-6, 18-22, 31-
32,35-41,45-46 Initial value of interaction range: 6 Updated value of interaction range: 5 About Leonard Jones potential (van der Waals force) Coefficient for interaction 1-4: 0.5 Interaction range Coefficients for atoms other than 0.5: Number of steps for one energy optimization: 300 Scaling interval: 30 Energy fluctuation: 10 Kcal / mol Maximum cutoff value for torsion of dihedral angle: 9 degrees Dihedral angle Minimum twist-off value: 0.018 degrees Annealing start temperature: 160 Kelvin Annealing end temperature: 60 Kelvin Temperature when converting entropy to free energy: 1
00 Kelvin Annealing temperature Number of updates: 50 times Dihedral angle value: 1.8 degrees Leonard Jones potential cutoff value: 10
Kcal / mol.

【0079】さらに、一次構造はクランビンのアミノ酸
配列(プロテインデータバンク1CRN参照)を、二次
構造部分の二面角はクランビンの天然構造の二面角(α
ヘリックスの場合φ=約−57°,Ψ=約−47°;3
10ヘリックスの場合φ=約−−60°,Ψ=約−30
°;β構造の場合φ=約−120°,Ψ=約120°)
を入力し、またランダムコイルの初期二面角として(−
120°,120°)を入力する。
Further, the primary structure is the amino acid sequence of crambin (see Protein Data Bank 1CRN), and the dihedral angle of the secondary structure part is the dihedral angle (α of the natural structure of crambin.
In case of helix φ = about −57 °, Ψ = about −47 °; 3
In case of 10 helices φ = about −60 °, Ψ = about −30
°; in case of β structure φ = about −120 °, Ψ = about 120 °)
As the initial dihedral angle of the random coil (-
120 °, 120 °).

【0080】この結果得られた20の構造のエネルギー
とルートミーンスクエァ(R.M.S.)値を表1に示
す。表1から、エネルギーの一番低い構造(−91.1
Kcal/mol)がルートミーンスクエァ値最小(3.88オ
ングストローム)になっており、また、この方法で得ら
れた予測構造の距離マップ(図3)と天然構造の距離マ
ップ(図4)の比較から本方法でおおまかな構造予測が
できたことがわかる。すなわち、両者には、(1) αヘリ
ックスがほぼ平行にパックしていること、(2)2番目の
βストランドと310ヘリックスが相互作用しているこ
と、(3) βストランド同士が相互作用していること、な
どの類似点が認められる。ここでR.M.S.値は予測
がどれくらい上手くできたかを示す評価関数であり、予
測構造のi番目の残基とj番目の残基の距離をRij、
天然構造のi番目の残基とj番目の残基の距離をTij
とした時、(<Rij−Tij)2 >)1/2 で定義され
る。但し、<**>は残基ペアでの相加平均を示す。
Table 1 shows the energies and root mean square (RMS) values of 20 structures obtained as a result. From Table 1, the structure with the lowest energy (-91.1
Kcal / mol) is the minimum root mean square value (3.88 angstrom), and the distance map of the predicted structure (Fig. 3) and the distance map of the natural structure (Fig. 4) obtained by this method. From the comparison, it can be seen that a rough structure prediction can be made by this method. That is, in both of them, (1) α helices are packed almost in parallel, (2) The second β strand interacts with 3 10 helices, and (3) β strands interact with each other. There are similarities such as what you are doing. Here, R. M. S. The value is an evaluation function indicating how well the prediction was performed, and the distance between the i-th residue and the j-th residue in the predicted structure is Rij,
The distance between the i-th residue and the j-th residue in the natural structure is Tij
Is defined as (<Rij-Tij) 2 >) 1/2 . However, <**> indicates the arithmetic mean of residue pairs.

【0081】[0081]

【表1】 [Table 1]

【0082】実施例2 クランビンの折りたたみシミ
ュレーション(2) 下線部の条件を変えた以外は実施例1と同様の条件でシ
ミュレーションを行なった。
Example 2 Folding stains on clambin
Simulation (2) The simulation was performed under the same conditions as in Example 1 except that the underlined conditions were changed.

【0083】試行回数:20回 残基数:46 乱数の開始値:1026400755 ランダムコイルの数:6 ランダムコイルの場所:1−1,4−6,18−22,31−
32,35−41,45−46 相互作用範囲の初期値:6 相互作用範囲の更新値:5 レナードジョーンズポテンシャル(ファンデルワールス
力)について 1−4の相互作用に対する係数:0.5 相互作用範囲以外の原子間に対する係数:0.5 1回のエネルギー最適化のステップ数:300 スケーリング間隔:30エネルギーの揺らぎ:7 Kcal/mol 二面角のねじりの最大カットオフ値:9度 二面角のねじりの最小カットオフ値:0.018度 アニーリング開始温度:160ケルビン アニーリング終了温度:60ケルビンエントロピーを自由エネルギーに換算する時の温度:3
00ケルビン アニーリング温度更新回数:50回 二面角の刻み値:1.8度 レナードジョーンズポテンシャルのカットオフ値:10
Kcal/mol 。
Number of trials: 20 Number of residues: 46 Start value of random number: 1026400755 Number of random coils: 6 Place of random coils: 1-1, 4-6, 18-22, 31-
32,35-41,45-46 Initial value of interaction range: 6 Updated value of interaction range: 5 About Leonard Jones potential (van der Waals force) Coefficient for interaction 1-4: 0.5 Interaction range Coefficients between atoms other than 0.5: 0.5 Number of steps for one energy optimization: 300 Scaling interval: 30 Energy fluctuation: 7 Kcal / mol Maximum cutoff value of torsion of dihedral angle: 9 degrees Dihedral angle Minimum twist-off value: 0.018 degrees Annealing start temperature: 160 Kelvin Annealing end temperature: 60 Kelvin Temperature when converting entropy to free energy: 3
00 Kelvin Annealing temperature Number of updates: 50 times Dihedral angle value: 1.8 degrees Leonard Jones potential cutoff value: 10
Kcal / mol.

【0084】また、一次構造、二次構造及びランダムコ
イルの二面角の各入力については、実施例1と同じであ
る。
The inputs of the primary structure, the secondary structure, and the dihedral angles of the random coil are the same as in the first embodiment.

【0085】この結果得られた20の構造のエネルギー
とルートミーンスクエァを表2に示す。表2から、エネ
ルギーの一番低い構造がルートミーンスクエァ値にはな
っていないが、実施例1で行なわれたシミュレーション
に相当する良好な構造(図5参照)が得られている。す
なわち、表2をみると試行回数5でR.M.S.値3.
80オングストロームとなり、実施例1の結果に近似し
た値となっていることが分かる。
Table 2 shows the energies and root mean squares of 20 structures obtained as a result. From Table 2, although the structure with the lowest energy does not have the root mean square value, a good structure (see FIG. 5) corresponding to the simulation performed in Example 1 is obtained. That is, looking at Table 2, the number of trials was 5, and the R. M. S. Value 3.
It is 80 angstroms, which is a value close to the result of Example 1.

【0086】[0086]

【表2】 [Table 2]

【0087】比較例 従来法によるグランビンの折り
たたみシミュレーション この比較例では、図2に示すフローチャートに従ってグ
ランビンの折りたたみシミュレーションを行なった。こ
のプログラムは、相互作用範囲の更新が不可能であるた
め、プログラムが1回終了した時点で、人が相互作用範
囲、動かすランダムコイルの部分を設定し直し、前に出
力された二面角を入力して、再度プログラムを実行し、
これを繰り返す必要がある。
Comparative Example Folding of Granbin by the conventional method
Folding Simulation In this comparative example, a folding simulation of Granvin was performed according to the flowchart shown in FIG. Since the interaction range cannot be updated in this program, when the program ends once, the interaction range and the part of the random coil to be moved are reset by the person, and the dihedral angle previously output is set. Type in, run the program again,
This needs to be repeated.

【0088】第1回シミュレーション 下記のシミュレーション条件を入力してシミュレーショ
ンを行なった。なお、一次構造、二次構造及びランダム
コイルの二面角の各入力については実施例1と同じであ
る(以下に示す第2〜5回においても同様である)。
First Simulation A simulation was performed by inputting the following simulation conditions. The input of the primary structure, the secondary structure, and the dihedral angle of the random coil are the same as in Example 1 (the same applies to the second to fifth times described below).

【0089】試行回数:10回 残基数:46 乱数の開始値:1026400755 ランダムコイルの数:6 ランダムコイルの場所:1−1,4−6,18−22,31−
32,35−41,45−46 動かすランダムコイルの数:1 動かすランダムコイルの場所:31−32 相互作用範囲の範囲:10 レナードジョーンズポテンシャル(ファンデルワールス
力)について 1−4の相互作用に対する係数:0.5 相互作用範囲以外の原子間に対する係数:0.5 エネルギー最適化のステップ数:800 スケーリング間隔:50 エネルギーの揺らぎ:1 Kcal/mol 二面角のねじりの最大カットオフ値:9度 二面角のねじりの最小カットオフ値:0.018度 アニーリング開始温度:150ケルビン アニーリング終了温度:50ケルビン エントロピーを自由エネルギーに換算する時の温度:3
00ケルビン アニーリング温度更新回数:50回 二面角の刻み値:1.8度 レナードジョーンズポテンシャルのカットオフ値:10
Kcal/mol この結果得られた10の構造のエネルギーと疎水基の相
互作用の状態を比較し、次のシミュレーションを行なう
時の入力構造を選んだ。
Number of trials: 10 times Residue number: 46 Random starting value: 1026400755 Number of random coils: 6 Random coil locations: 1-1, 4-6, 18-22, 31-
32,35-41,45-46 Number of random coils to move: 1 Location of random coil to move: 31-32 Range of interaction range: 10 For Leonard-Jones potential (van der Waals force) Coefficients for 1-4 interactions : 0.5 Coefficient between atoms outside the interaction range: 0.5 Number of steps for energy optimization: 800 Scaling interval: 50 Energy fluctuation: 1 Kcal / mol Maximum cutoff value of torsion of dihedral angle: 9 degrees Minimum cutoff value for twist of dihedral angle: 0.018 degrees Annealing start temperature: 150 Kelvin Annealing end temperature: 50 Kelvin Temperature when converting entropy to free energy: 3
00 Kelvin Annealing temperature Number of updates: 50 times Dihedral angle value: 1.8 degrees Leonard Jones potential cutoff value: 10
Kcal / mol The energy of 10 structures obtained as a result and the state of interaction of the hydrophobic group were compared, and the input structure for the next simulation was selected.

【0090】第2回シミュレーション 試行回数:10回 残基数:46 乱数の開始値:1026400755 ランダムコイルの数:6 ランダムコイルの場所:1−1,4−6,18−22,31−
32,35−41,45−46 動かすランダムコイルの数:1 動かすランダムコイルの場所:35−41 相互作用範囲の範囲:10 レナードジョーンズポテンシャル(ファンデルワールス
力)について 1−4の相互作用に対する係数:0.5 相互作用範囲以外の原子間に対する係数:0.5 1回のエネルギー最適化のステップ数:800 スケーリング間隔:50 エネルギーの揺らぎ:1 Kcal/mol 二面角のねじりの最大カットオフ値:9度 二面角のねじりの最小カットオフ値:0.018度 アニーリング開始温度:150ケルビン アニーリング終了温度:50ケルビン エントロピーを自由エネルギーに換算する時の温度:3
00ケルビン アニーリング温度更新回数:50回 二面角の刻み値:1.8度 レナードジョーンズポテンシャルのカットオフ値:10
Kcal/mol 先の入力と変った点は動かすランダムコイルの位置であ
る。これを入力としてシミュレーションを行なった。こ
の結果得られた10の構造のエネルギーと疎水基の相互
作用の状態を比較し、次のシミュレーションを行なう時
の入力構造を選んだ。
2nd simulation trial number: 10 times Residue number: 46 Random start value: 1026400755 Number of random coils: 6 Random coil location: 1-1, 4-6, 18-22, 31-
32,35-41,45-46 Number of moving random coil: 1 Location of moving random coil: 35-41 Range of interaction range: 10 For Leonard Jones potential (van der Waals force) Coefficient for 1-4 interaction : 0.5 Coefficient between atoms outside the interaction range: 0.5 Number of steps for one energy optimization: 800 Scaling interval: 50 Energy fluctuation: 1 Kcal / mol Maximum cutoff value of torsion of dihedral angle : 9 degrees Minimum cutoff value for dihedral twist: 0.018 degrees Annealing start temperature: 150 Kelvin Annealing end temperature: 50 Kelvin Temperature when converting entropy to free energy: 3
00 Kelvin Annealing temperature Number of updates: 50 times Dihedral angle value: 1.8 degrees Leonard Jones potential cutoff value: 10
Kcal / mol The point different from the previous input is the position of the random coil to move. A simulation was performed using this as an input. The energy of 10 structures obtained as a result and the state of interaction of the hydrophobic group were compared, and the input structure for the next simulation was selected.

【0091】第3回シミュレーション 試行回数:10回 残基数:46 乱数の開始値:1026400755 ランダムコイルの数:6 ランダムコイルの場所:1−1,4−6,18−22,31−
32,35−41,45−46 動かすランダムコイルの数:1 動かすランダムコイルの場所:4−6 相互作用範囲の範囲:10 レナードジョーンズポテンシャル(ファンデルワールス
力)について 1−4の相互作用に対する係数:0.5 相互作用範囲以外の原子間に対する係数:0.5 1回のエネルギー最適化のステップ数:800 スケーリング間隔:50 エネルギーの揺らぎ:1 Kcal/mol 二面角のねじりの最大カットオフ値:9度 二面角のねじりの最小カットオフ値:0.018度 アニーリング開始温度:150ケルビン アニーリング終了温度:50ケルビン エントロピーを自由エネルギーに換算する時の温度:3
00ケルビン アニーリング温度更新回数:50回 二面角の刻み値:1.8度 レナードジョーンズポテンシャルのカットオフ値:10
Kcal/mol 先の入力と変った点は動かすランダムコイルの位置であ
る。これを入力としてシミュレーションを行なった。こ
の結果得られた10の構造のエネルギーと疎水基の相互
作用の状態を比較し、次のシミュレーションを行なう時
の入力構造を選んだ。
Third simulation trial number: 10 times Residue number: 46 Random number starting value: 1026400755 Number of random coils: 6 Random coil location: 1-1, 4-6, 18-22, 31-
32,35-41,45-46 Number of random coils to move: 1 Place of random coil to move: 4-6 Range of interaction range: 10 For Lennard Jones potential (van der Waals force) Coefficients for 1-4 interactions : 0.5 Coefficient between atoms outside the interaction range: 0.5 Number of steps for one energy optimization: 800 Scaling interval: 50 Energy fluctuation: 1 Kcal / mol Maximum cutoff value of torsion of dihedral angle : 9 degrees Minimum cutoff value for dihedral twist: 0.018 degrees Annealing start temperature: 150 Kelvin Annealing end temperature: 50 Kelvin Temperature when converting entropy to free energy: 3
00 Kelvin Annealing temperature Number of updates: 50 times Dihedral angle value: 1.8 degrees Leonard Jones potential cutoff value: 10
Kcal / mol The point different from the previous input is the position of the random coil to move. A simulation was performed using this as an input. The energy of 10 structures obtained as a result and the state of interaction of the hydrophobic group were compared, and the input structure for the next simulation was selected.

【0092】第4回シミュレーション 試行回数:20回 残基数:46 乱数の開始値:1026400755 ランダムコイルの数:6 ランダムコイルの場所:1−1,4−6,18−22,31−
32,35−41,45−46 動かすランダムコイルの数:1 動かすランダムコイルの場所:18−22 相互作用範囲の範囲:14 レナードジョーンズポテンシャル(ファンデルワールス
力)について 1−4の相互作用に対する係数:0.5 相互作用範囲以外の原子間に対する係数:0.5 1回のエネルギー最適化のステップ数:1200 スケーリング間隔:50 エネルギーの揺らぎ:1 Kcal/mol 二面角のねじりの最大カットオフ値:9度 二面角のねじりの最小カットオフ値:0.018度 アニーリング開始温度:150ケルビン アニーリング終了温度:50ケルビン エントロピーを自由エネルギーに換算する時の温度:3
00ケルビン アニーリング温度更新回数:50回 二面角の刻み値:1.8度 レナードジョーンズポテンシャルのカットオフ値:10
Kcal/mol 先の入力と変った点は、試行回数、動かすランダムコイ
ルの位置、相互作用の範囲、およびエネルギー最適化の
ステップ数である。これを入力としてシミュレーション
を行なった。この結果得られた20の構造のエネルギー
と疎水基の相互作用の状態を比較し、次のシミュレーシ
ョンを行なう時の入力構造を選んだ。
4th number of simulation trials: 20 times Number of residues: 46 Start value of random number: 1026400755 Number of random coils: 6 Location of random coils: 1-1, 4-6, 18-22, 31-
32,35-41,45-46 Number of random coils to move: 1 Location of random coil to move: 18-22 Range of interaction range: 14 For Lennard-Jones potential (van der Waals force) Coefficients for 1-4 interactions : 0.5 Coefficient between atoms outside the interaction range: 0.5 Number of steps for one energy optimization: 1200 Scaling interval: 50 Energy fluctuation: 1 Kcal / mol Maximum cutoff value of torsion of dihedral angle : 9 degrees Minimum cutoff value for dihedral twist: 0.018 degrees Annealing start temperature: 150 Kelvin Annealing end temperature: 50 Kelvin Temperature when converting entropy to free energy: 3
00 Kelvin Annealing temperature Number of updates: 50 times Dihedral angle value: 1.8 degrees Leonard Jones potential cutoff value: 10
Kcal / mol The points that changed from the previous input are the number of trials, the position of the random coil to move, the range of interaction, and the number of steps for energy optimization. A simulation was performed using this as an input. The energy of 20 structures obtained as a result and the state of interaction of the hydrophobic groups were compared, and the input structure for the next simulation was selected.

【0093】第5回シミュレーション 試行回数:20回 残基数:46 乱数の開始値:1026400755 ランダムコイルの数:6 ランダムコイルの場所:1−1,4−6,18−22,31−
32,35−41,45−46 動かすランダムコイルの数:6 動かすランダムコイルの場所:1−1,4−6,18−2
2,31−32,35−41,45−46 相互作用範囲の範囲:46 レナードジョーンズポテンシャル(ファンデルワールス
力)について 1−4の相互作用に対する係数:0.5 相互作用範囲以外の原子間に対する係数:0.5 1回のエネルギー最適化のステップ数:3600 スケーリング間隔:50 エネルギーの揺らぎ:1 Kcal/mol 二面角のねじりの最大カットオフ値:9度 二面角のねじりの最小カットオフ値:0.018度 アニーリング開始温度:150ケルビン アニーリング終了温度:50ケルビン エントロピーを自由エネルギーに換算する時の温度:3
00ケルビン アニーリング温度更新回数:50回 二面角の刻み値:1.8度 レナードジョーンズポテンシャルのカットオフ値:10
Kcal/mol 先の入力と変った点は、動かすランダムコイルの位置、
相互作用の範囲、およびエネルギー最適化のステップ数
である。これを入力としてシミュレーションを行なっ
た。この結果得られた20の構造のエネルギーとルート
ミーンスクエァ値を表3に示す。エネルギー的には最低
ではないが、図6に示す距離マップが得られた。これを
みると本発明の方法によって得られたものと同様の結果
が得られている。
Fifth simulation trial number: 20 times Residue number: 46 Random number starting value: 1026400755 Random coil number: 6 Random coil location: 1-1, 4-6, 18-22, 31-
32,35-41,45-46 Number of moving random coil: 6 Place of moving random coil: 1-1,4-6,18-2
2, 31-32, 35-41, 45-46 Range of interaction range: 46 About Leonard-Jones potential (van der Waals force) 1-4 Coefficient for interaction: 0.5 For atoms outside the interaction range Coefficient: 0.5 Number of steps for one energy optimization: 3600 Scaling interval: 50 Energy fluctuation: 1 Kcal / mol Maximum cutoff value of torsion of dihedral angle: 9 degrees Minimum cutoff of torsion of dihedral angle Value: 0.018 degrees Annealing start temperature: 150 Kelvin Annealing end temperature: 50 Kelvin Temperature when converting entropy to free energy: 3
00 Kelvin Annealing temperature Number of updates: 50 times Dihedral angle value: 1.8 degrees Leonard Jones potential cutoff value: 10
Kcal / mol The point that changed from the previous input is the position of the random coil to move,
The range of interaction and the number of steps for energy optimization. A simulation was performed using this as an input. Table 3 shows the energies and root mean square values of 20 structures obtained as a result. Although not the lowest in terms of energy, the distance map shown in FIG. 6 was obtained. As a result, the same results as those obtained by the method of the present invention are obtained.

【0094】[0094]

【表3】 [Table 3]

【0095】[0095]

【発明の効果】蛋白質の立体構造予測において、相互作
用範囲を設定、更新する部分を自動化してエネルギー最
適化を行なうことによって、相互作用範囲の更新のでき
ない従来法と比べてより短い時間で、より天然構造に近
い構造を予測決定することが可能となり、しかもプログ
ラムの実行者の技術に依存せずに蛋白質の折りたたみが
できる、という利点をもつ。
INDUSTRIAL APPLICABILITY In protein three-dimensional structure prediction, by performing energy optimization by automating the part for setting and updating the interaction range, the interaction range can be updated in a shorter time than in the conventional method, It has an advantage that a structure closer to a natural structure can be predicted and determined, and moreover, the protein can be folded without depending on the technique of the program executor.

【図面の簡単な説明】[Brief description of drawings]

【図1】この図は、本発明の蛋白質の立体構造予測シス
テムのフローチャートを示す。
FIG. 1 shows a flowchart of the protein tertiary structure prediction system of the present invention.

【図2】この図は、従来法の蛋白質立体構造予測システ
ムのフローチャートを示す。
FIG. 2 shows a flowchart of a conventional protein tertiary structure prediction system.

【図3】この図は、実施例1のシミュレーション(1)
により予測したクランビンの予測構造の距離マップを示
す。図中、白四角はCα間距離が13オングストローム
(カットオフ距離)未満の疎水基ペア以外のアミノ酸ペ
ア、黒四角はCα間距離が13オングストローム未満の
疎水基ペア、×はCα間距離が13オングストローム以
上の疎水基ペア、空白はCα間距離が13オングストロ
ーム以上の疎水基ペア以外のアミノ酸ペアを示す(図4
〜6の場合も同様である)。
FIG. 3 is a simulation of Example 1 (1).
3 shows a distance map of the prediction structure of Crambin predicted by. In the figure, white squares are amino acid pairs other than hydrophobic group pairs with a Cα distance of less than 13 Å (cutoff distance), black squares are hydrophobic group pairs with a Cα distance of less than 13 Å, and × is a Cα distance of 13 Å. The above hydrophobic group pairs, and the blanks represent amino acid pairs other than the hydrophobic group pairs in which the distance between Cα is 13 Å or more (FIG. 4).
The same applies to cases of ~ 6).

【図4】この図は、クランビンの天然構造の距離マップ
を示す。
FIG. 4 This figure shows a distance map of the natural structure of clambin.

【図5】この図は、実施例2のシミュレーション(2)
により予測したクランビンの予測構造の距離マップを示
す。
FIG. 5 shows a simulation (2) of the second embodiment.
3 shows a distance map of the prediction structure of Crambin predicted by.

【図6】この図は、従来法のシミュレーションにより予
測したクランビンの予測構造の距離マップを示す。
FIG. 6 shows a distance map of the prediction structure of clambin predicted by the simulation of the conventional method.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/42 A (72)発明者 斎藤 信彦 東京都新宿区大久保三丁目4番1号 学校 法人早稲田大学 理工学総合研究センター 内─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 6 Identification number Internal reference number FI Technical display location G06F 15/42 A (72) Inventor Nobuhiko Saito 3-4 Okubo, Shinjuku-ku, Tokyo School corporation Waseda University Science and Engineering Research Center

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 蛋白質の立体構造を決定する方法であっ
て、(a) シミュレーション条件を入力し、(b)
蛋白質の一次構造と、二次構造を取る部分の二面角とを
入力し、(c) 最初伸びた構造となるよう蛋白質のラ
ンダムコイルに初期二面角を入力し、(d) 更新可能
な相互作用範囲を設定し、(e) 設定された条件下で
シミュレーテッドアニーリングを用いてエネルギーの最
適化を行ない、(f) 相互作用範囲が該蛋白質の全残
基数になっていることを確認し、(g) 所定の試行回
数だけシミュレーションを行ない、(h) 予測構造の
二面角を出力する各ステップを具備することを特徴とす
る前記方法。
1. A method for determining a three-dimensional structure of a protein, comprising: (a) inputting simulation conditions;
Input the primary structure of the protein and the dihedral angle of the part that takes the secondary structure, (c) enter the initial dihedral angle in the random coil of the protein so that the structure initially extends, and (d) updatable The interaction range is set, (e) energy optimization is performed using simulated annealing under the set conditions, and (f) the interaction range is confirmed to be the total number of residues of the protein. Then, (g) the simulation is performed a predetermined number of times, and (h) each step of outputting the dihedral angle of the prediction structure is provided.
【請求項2】 前記シミュレーション条件が少なくと
も、シミュレーションの試行回数、蛋白質の残基数、乱
数の開始値、ランダムコイルの数、ランダムコイルの場
所、相互作用範囲の初期値、相互作用範囲の更新値、1
回のエネルギー最適化のステップ数、アニーリング開始
温度、アニーリング終了温度、アニーリング温度更新回
数からなる請求項1に記載の方法。
2. The simulation condition is at least the number of simulation trials, the number of protein residues, the random number start value, the random coil number, the random coil location, the initial value of the interaction range, and the updated value of the interaction range. 1
The method according to claim 1, comprising the number of steps of energy optimization per cycle, an annealing start temperature, an annealing end temperature, and an annealing temperature update frequency.
【請求項3】 前記ステップ(f)で、相互作用範囲が
全残基数になっていない場合、ステップ(d)に戻り、
その後のステップ(d)〜(f)を実行する請求項1に
記載の方法。
3. In the step (f), if the interaction range is not the total number of residues, the process returns to the step (d),
The method according to claim 1, wherein the subsequent steps (d) to (f) are performed.
【請求項4】 前記ステップ(g)で、設定された試行
回数だけシミュレーションが行なわれていない場合、ス
テップ(d)に戻り、その後のステップ(d)〜(g)
を実行する請求項1に記載の方法。
4. In step (g), if the simulation is not performed for the set number of trials, the process returns to step (d) and the subsequent steps (d) to (g).
The method of claim 1 for performing.
【請求項5】 さらに、出力された二面角から予測構造
の三次元座標をグラフ化するステップを含む請求項1に
記載の方法。
5. The method according to claim 1, further comprising the step of graphing the three-dimensional coordinates of the prediction structure from the output dihedral angle.
JP29701693A 1993-11-26 1993-11-26 Method for determining three-dimensional structure of protein Pending JPH07152775A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29701693A JPH07152775A (en) 1993-11-26 1993-11-26 Method for determining three-dimensional structure of protein

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29701693A JPH07152775A (en) 1993-11-26 1993-11-26 Method for determining three-dimensional structure of protein

Publications (1)

Publication Number Publication Date
JPH07152775A true JPH07152775A (en) 1995-06-16

Family

ID=17841155

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29701693A Pending JPH07152775A (en) 1993-11-26 1993-11-26 Method for determining three-dimensional structure of protein

Country Status (1)

Country Link
JP (1) JPH07152775A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014233228A (en) * 2013-05-31 2014-12-15 独立行政法人産業技術総合研究所 Protein structure evaluating device, protein structure evaluating method, protein structure evaluating program, and computer-readable recording medium in which structure evaluating program is recorded
JP2017037377A (en) * 2015-08-07 2017-02-16 富士通株式会社 Information processor, simulation method, and simulation program
CN107704726A (en) * 2017-10-13 2018-02-16 齐齐哈尔大学 A kind of method that Protein folding prediction is carried out using population simulated annealing
JP2020067931A (en) * 2018-10-26 2020-04-30 富士通株式会社 Compound search device, compound search method, and compound search program
JP2021005282A (en) * 2019-06-27 2021-01-14 富士通株式会社 Optimization device, control method of the optimization device, and control program of the optimization device
JP2022501694A (en) * 2018-09-21 2022-01-06 ディープマインド テクノロジーズ リミテッド Determining a protein distance map by combining distance map crops

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014233228A (en) * 2013-05-31 2014-12-15 独立行政法人産業技術総合研究所 Protein structure evaluating device, protein structure evaluating method, protein structure evaluating program, and computer-readable recording medium in which structure evaluating program is recorded
JP2017037377A (en) * 2015-08-07 2017-02-16 富士通株式会社 Information processor, simulation method, and simulation program
CN107704726A (en) * 2017-10-13 2018-02-16 齐齐哈尔大学 A kind of method that Protein folding prediction is carried out using population simulated annealing
JP2022501694A (en) * 2018-09-21 2022-01-06 ディープマインド テクノロジーズ リミテッド Determining a protein distance map by combining distance map crops
JP2020067931A (en) * 2018-10-26 2020-04-30 富士通株式会社 Compound search device, compound search method, and compound search program
JP2021005282A (en) * 2019-06-27 2021-01-14 富士通株式会社 Optimization device, control method of the optimization device, and control program of the optimization device

Similar Documents

Publication Publication Date Title
de Brevern et al. Bayesian probabilistic approach for predicting backbone structures in terms of protein blocks
Fulton et al. Mapping the interactions present in the transition state for unfolding/folding of FKBP12
Levitt Protein folding by restrained energy minimization and molecular dynamics
Harano et al. Theoretical study for partial molar volume of amino acids and polypeptides by the three-dimensional reference interaction site model
US5265030A (en) System and method for determining three-dimensional structures of proteins
JPH01158574A (en) Method of composing polymer compound successively and product produced by the method
Scheraga Predicting three‐dimensional structures of oligopeptides
US5680319A (en) Hierarchical protein folding prediction
JPH07152775A (en) Method for determining three-dimensional structure of protein
Jurkowski et al. Conformational subspace in simulation of early‐stage protein folding
Zhang et al. Pareto dominance archive and coordinated selection strategy-based many-objective optimizer for protein structure prediction
Demchuk et al. Thermodynamics of a reverse turn motif. Solvent effects and side-chain packing
US7925484B2 (en) Method for predicting the spatial-arrangement topology of an amino acid sequence using free energy combined with secondary structural information
JP2016527481A (en) Obtaining improved therapeutic ligands
Salgado et al. Predicting the behaviour of proteins in hydrophobic interaction chromatography: 2. Using a statistical description of their surface amino acid distribution
Friedrichs et al. Molecular dynamics of associative memory hamiltonians for protein tertiary structure recognition
Mayewski A multibody, whole‐residue potential for protein structures, with testing by Monte Carlo simulated annealing
Thota et al. Correlation between chemical denaturation and the unfolding energetics of Acanthamoeba actophorin
Petrescu et al. Change in backbone torsion angle distribution on protein folding
Fang et al. Geometry, thermodynamics, and protein
Granados-Ramírez et al. Secondary structure specified polarizabilities of residues for an evaluation of circular dichroism spectra of proteins
JP2930851B2 (en) Method and apparatus for calculating prediction accuracy of three-dimensional structure of protein
Venske et al. A multiobjective algorithm for protein structure prediction using adaptive differential evolution
Sun Reduced representation approach to protein tertiary structure prediction: statistical potential and simulated annealing
Anderson et al. Effect of short-and long-range interactions on protein folding