JP2005234699A - Apparatus and method for estimation of spatial structure of protein by cellular automaton - Google Patents

Apparatus and method for estimation of spatial structure of protein by cellular automaton Download PDF

Info

Publication number
JP2005234699A
JP2005234699A JP2004040362A JP2004040362A JP2005234699A JP 2005234699 A JP2005234699 A JP 2005234699A JP 2004040362 A JP2004040362 A JP 2004040362A JP 2004040362 A JP2004040362 A JP 2004040362A JP 2005234699 A JP2005234699 A JP 2005234699A
Authority
JP
Japan
Prior art keywords
dimensional structure
estimation method
structure estimation
protein
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004040362A
Other languages
Japanese (ja)
Inventor
Tomoharu Nagao
智晴 長尾
Masahito Enomoto
雅仁 榎本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yokohama TLO Co Ltd
Original Assignee
Yokohama TLO Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokohama TLO Co Ltd filed Critical Yokohama TLO Co Ltd
Priority to JP2004040362A priority Critical patent/JP2005234699A/en
Publication of JP2005234699A publication Critical patent/JP2005234699A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a computerized technique for a spatial structure analysis of protein that helps efficient drug discovery by shortening a time span bottlenecking existing techniques while ensuring practical accuracy. <P>SOLUTION: A proposed model based on a cellular automaton method is a discrete three-dimensional model with layered hexagonal lattice planes, and unit cells have information on a contained amino acid and its accompanying charge and mass. The transition of the unit cells depends on a vector sum from the surrounding cells. The mobility of the unit cells also varies with temperature. The framework represents the structure of protein. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

タンパク質の立体構造を予測する技術に関するものである。   The present invention relates to a technique for predicting the three-dimensional structure of a protein.

最近ヒトゲノム解析が終了し、その遺伝情報を利用した創薬が関係者の間で非常に注目されてきている。なぜなら、今までのようなある意味場当たり的なものではなく、遺伝情報という根本的な情報を用いるため、薬の開発コストを下げ、今までにない画期的な薬を創れるのではないかと期待されるからである。製薬企業の関係者は、創薬をしばしばギャンブルと呼んでいる。それは、10年以上の長い研究開発期間を経ても、新しい化合物が新薬の承認を得られる確率が極めて低いからである。一般に新薬を市場に出すとき、100個の種(シード)から5個が臨床試験に到達し、その5個のうちの1個が最終的に市場に出る。製薬企業の任意団体である日本製薬工業会(製薬協)の調べでは、1997年から2001年にかけて、日本の製薬企業18社が合成した新薬候補の化合物43万2312個のうち、承認までにこぎつけた化合物は、36個となっている。その確率は実に1万2004分の1であった。この確率の低さは、これまでのものと見比べてみても一向に向上する気配はない。1剤につき平均400億円の開発費、12年の研究開発期間がかかり、その60%が臨床試験の経費といわれている。したがって、よりよいシードを作り、かつ臨床試験のコストを下げ、研究開発期間を短縮することが、製薬企業にとって不可欠なことになる。このような中でキーを担うのが、タンパク質・遺伝子・ゲノムの情報産業、いわゆるバイオインフォマティクス(Bioinformatics、生命情報科学)産業である。これは、新たなシードの探索領域、研究開発期間の短縮を可能にする。ここで、バイオインフォマティクスを利用した創薬がどの段階で行われているのかを確認するために、ゲノム情報を利用した創薬の流れを以下にまとめた。   Recently, human genome analysis has been completed, and drug discovery using the genetic information has attracted a great deal of attention among those concerned. Because it uses fundamental information, such as genetic information, instead of something that is per se, it is expected that it will reduce drug development costs and create innovative drugs that have never existed before. Because it is done. Pharmaceutical industry officials often refer to drug discovery as gambling. This is because even after a long R & D period of more than 10 years, the probability that a new compound will be approved for a new drug is extremely low. In general, when a new drug is marketed, 5 out of 100 seeds will reach clinical trials, and 1 of 5 will eventually be on the market. According to a survey by the Japan Pharmaceutical Manufacturers Association (Pharmaceutical Association), a voluntary organization of pharmaceutical companies, it was possible to obtain approval from among 432,312 new drug candidate compounds synthesized by 18 Japanese pharmaceutical companies from 1997 to 2001. There are 36 compounds. The probability was really 1/2004. This low probability does not seem to improve at all compared to the previous one. Each drug costs 40 billion yen on average and takes 12 years of research and development, 60% of which is said to be the cost of clinical trials. Therefore, it is essential for pharmaceutical companies to create better seeds, reduce the cost of clinical trials, and shorten research and development periods. The key to this is the protein, gene, and genome information industry, the so-called bioinformatics (Bioinformatics) industry. This makes it possible to search for new seeds and shorten the research and development period. Here, in order to confirm at which stage drug discovery using bioinformatics is being performed, the flow of drug discovery using genome information is summarized below.

・ 遺伝子の発見
・ 遺伝子の機能解析
・ 創薬、治療ターゲットの特定
・ リード化合物の同定と最適化
・ 薬物代謝、安全性試験
・ 臨床試験
・ 承認
・ 市販
上述したように従来では、研究が開始されてから薬が市場に出るまでに10年から15年の期間が必要とされてきた。しかし、ITインフラストラクチャとバイオインフォマティクスを活用することで(1)〜(4)の開発が効率よく行われるようになり、その期間は従来より10年近く短縮できると言われている。以下で具体的に各段階を見ていく。
(1)の遺伝子の発見では、創薬や治療のターゲットとなりそうな遺伝子やタンパク質を特定することを目的とする。約30億のヒトゲノム配列中には3〜4万の遺伝子が点在しているといわれており、その遺伝子を発見するためにバイオインフォマティクスが使われている。これによって遺伝子の位置と配列を推定するのである。推定された遺伝子に対して、この後cDNA解析と呼ばれる実験的手法を用いる。これにより、正確な遺伝子の同定が可能である。このステップで解析されたデータは、公共もしくは私的なデータバンクに保存されている。
(2)の遺伝子機能解析では、ゲノム上で発見された遺伝子から、創薬や治療のターゲットとなる遺伝子を絞り込むために、遺伝子と特定の疾患との相関性や体内での役割、すなわち遺伝子の機能を明らかにすることを目的とする。この機能を解析する方法として、DNAマイクロアレイやSNPデータなどが使われている。
(3)の創薬、治療ターゲットの特定では、タンパク質の立体構造を決定することが非常に重要である。その方法としては、実験的にはNMRやX線結晶構造解析を、計算機的にはバイオインフォマティクスが使われている。
(4)のリード化合物の同定と最適化では、(1)〜(3)の過程で出てきたターゲット遺伝子や候補物質が正しいかどうかを客観的に証明する。この段階では、ゲノム情報データベース、医学文献データベース、ITインフラストラクチャを利用したバイオインフォマティクス、遺伝子チップを利用する実験などをはじめとする、遺伝子に関するさまざまな方向からの検討が行われる。これらの過程を経て効果が確認されたリード化合物に対して、その効果が上がるようにいろいろな化学修飾などを施し誘導体を合成する。
(5)の薬物代謝、安全性試験では、動物実験などを行うことによって、薬物の効果や安全性を確認する。
(6)の臨床試験では、人に対して薬物の投与を行い、効果や安全性を確かめる。
(7)の承認では、国の機関に対して、(6)で得られた実験データを提出し、有効性が確認されれば市販することが許可される。
(8)の市販では、市場に実際に薬を出し、想定外の副作用等が生じたときには、市場から薬を回収することもある。
・ Gene discovery ・ Functional analysis of genes ・ Identification of drug discovery and treatment targets ・ Identification and optimization of lead compounds ・ Drug metabolism and safety studies ・ Clinical trials ・ Approval ・ Commercialization As mentioned above, research has started in the past. Since then, a period of 10 to 15 years has been required for drugs to enter the market. However, by utilizing IT infrastructure and bioinformatics, the development of (1) to (4) is efficiently performed, and it is said that the period can be shortened by almost 10 years. We will look specifically at each stage below.
The discovery of genes in (1) aims to identify genes and proteins that are likely to be targets for drug discovery and treatment. It is said that about 3 to 40,000 genes are scattered in about 3 billion human genome sequences, and bioinformatics is used to discover the genes. This estimates the position and sequence of the gene. An experimental technique called cDNA analysis is then used for the estimated gene. Thereby, accurate gene identification is possible. The data analyzed in this step is stored in public or private data banks.
In the gene function analysis in (2), in order to narrow down genes targeted for drug discovery and treatment from genes discovered on the genome, the correlation between genes and specific diseases, the role in the body, The purpose is to clarify the function. As a method for analyzing this function, a DNA microarray, SNP data, or the like is used.
In (3) drug discovery and treatment target identification, it is very important to determine the three-dimensional structure of the protein. As the method, NMR and X-ray crystal structure analysis are experimentally used, and bioinformatics is used computationally.
In the identification and optimization of the lead compound in (4), it is objectively proved whether or not the target gene and candidate substance produced in the processes (1) to (3) are correct. At this stage, studies on genes from various directions including genome information databases, medical literature databases, bioinformatics using IT infrastructure, and experiments using gene chips will be conducted. Derivatives are synthesized by applying various chemical modifications to lead compounds that have been confirmed to be effective through these processes.
In the drug metabolism and safety test of (5), the effects and safety of the drug are confirmed by conducting animal experiments.
In the clinical trial (6), drugs are administered to humans to confirm the efficacy and safety.
In the approval of (7), the experimental data obtained in (6) is submitted to a national institution, and if it is confirmed to be effective, it is allowed to be marketed.
In the market of (8), when a drug is actually put on the market and an unexpected side effect occurs, the drug may be collected from the market.

タンパク質は、アミノ酸が鎖状に連結した高分子であり、生体内で多様な働きをもち、あるものは生体自身を形成し、またあるものは酵素として生理的反応の円滑な進行を担っている。複雑な生命活動の維持を可能にしているそれら多様かつ精巧なタンパク質の機能は、実は立体構造と密接に関係しており、そのため生体高分子の立体構造解析は必然的に特に重要な役割を果たすのである。(3)のステップではこのことが特に重要である。創薬を行う上でタンパク質の立体構造を正確に理解することは薬剤候補物質の絞込みを容易にし、開発期間の大幅な短縮が見込まれる。この立体構造の決定には、NMRやX線結晶構造解析等の物理化学的な方法が用いられていたが、時間・人手・費用がとてもかかっていた。そのため、計算機により有望そうなタンパク質を探し出し、その立体構造だけを実験的な方法で行いたいという要望が出てきた。そこで、既存のタンパク質立体構造予測の手法が用いられはじめたが、時間、精度の面がネックとなっている。
岡崎進,岡本祐幸編「生体系のコンピュータシミュレーション−タンパク質の構造をどこまで予測できるか」化学同人、2002年、p.12−49(第1章,第2章),p.98−109(第8章) 加藤恭義,光成友孝,築山洋著、「セルオートマトン法−複雑系の自己組織化と超並列処理」森北出版、p.17−27
Proteins are macromolecules in which amino acids are linked in a chain, have various functions in the body, some form the body itself, and some are enzymes that are responsible for the smooth progression of physiological reactions. . The functions of these diverse and sophisticated proteins that enable the maintenance of complex life activities are actually closely related to the three-dimensional structure, and the three-dimensional structure analysis of biopolymers inevitably plays a particularly important role. It is. This is particularly important in step (3). Accurate understanding of the three-dimensional structure of proteins in drug discovery facilitates narrowing down of drug candidate substances, and the development period is expected to be greatly shortened. This three-dimensional structure is determined by physicochemical methods such as NMR and X-ray crystal structure analysis, but it takes time, manpower and cost. Therefore, there has been a demand for finding a promising protein by a computer and performing only its three-dimensional structure by an experimental method. Therefore, existing methods for protein tertiary structure prediction have begun to be used, but time and accuracy have become a bottleneck.
Susumu Okazaki, Yuki Okamoto, “Computer simulation of biological systems-how far can we predict the structure of proteins?” Kagaku Doujin, 2002, p. 12-49 (Chapter 1, Chapter 2), p. 98-109 (Chapter 8) Kato Yasuyoshi, Mitsunari Tomotaka, Tsukiyama Hiroshi, "Cellular automaton method-Self-organization and massively parallel processing of complex systems" Morikita Publishing, p. 17-27

本発明の目的は、実用的な精度を保ちつつ、既存の手法でネックとなっている時間を短縮し、効率的な創薬を行うための助けとなることである。   An object of the present invention is to reduce the time that has become a bottleneck in existing methods while maintaining practical accuracy, and to assist in efficient drug discovery.

本発明に係る立体構造推定方法は、
計算機を用いて複数の連接した要素により構成される物質の構造に対して行われるものであって、対象構造が存在する空間を分割し、分割された空間に状態を埋め込み、数式を用いて構造の形成過程を制御しながら全体を推定する。
The three-dimensional structure estimation method according to the present invention includes:
This is performed on the structure of a substance composed of a plurality of connected elements using a computer, and the space where the target structure exists is divided, the state is embedded in the divided space, and the structure is made using mathematical formulas. The whole process is estimated while controlling the formation process.

前記要素が、アミノ酸であることを特徴とする。   The element is an amino acid.

前記物質が、タンパク質であることを特徴とする。   The substance is a protein.

前記空間の分割が、格子による分割であることを特徴とする。   The space is divided by a lattice.

前記格子が、六法格子であることを特徴とする。   The lattice is a hexagonal lattice.

前記格子が、層状に重なることを特徴とする。   The lattice is overlapped in layers.

前記状態として、要素の有無と、要素がある場合の電荷と、隣接する要素の位置を含む情報を記憶する特徴とする。   As the state, information including presence / absence of an element, a charge when the element is present, and a position of an adjacent element is stored.

前記数式が、焼きなまし法のメトロポリス基準であることを特徴とする。   The mathematical formula is a metropolis standard of annealing method.

前記数式が、ベクトル(F)と制御パラメータ(T)の関数であることを特徴とする。   The mathematical expression is a function of a vector (F) and a control parameter (T).

前記ベクトル(F)が、クーロン力であることを特徴とする。   The vector (F) is a Coulomb force.

前記数式が閾値を越えた場合に、要素を移動させるように、前記状態を変更することを特徴とする。   The state is changed so that an element is moved when the mathematical formula exceeds a threshold value.

前記閾値が、関数により算出されることを特徴とする。   The threshold value is calculated by a function.

前記関数は、乱数を生成することを特徴とする。   The function generates a random number.

前記乱数は、一様乱数であることを特徴とする。   The random number is a uniform random number.

前記数式は、

Figure 2005234699
であることを特徴とする。 The formula is
Figure 2005234699
It is characterized by being.

前記状態が、局所的な規則に基づいていることを特徴とする。   The state is based on a local rule.

前記状態が、近傍の状態に左右されることを特徴とする。   The state depends on the state in the vicinity.

最近傍もしくはその定数倍の範囲でクーロン力を算出することを特徴とする。   It is characterized in that the Coulomb force is calculated in the nearest neighborhood or a range of a constant multiple thereof.

本発明に係る立体構造推定装置は、
計算機を用いて複数の連接した要素により構成される物質の構造に対して行われるものであって、対象構造が存在する空間を分割し、分割された空間に状態を埋め込み、数式を用いて構造の形成過程を制御しながら全体を推定する。
The three-dimensional structure estimation apparatus according to the present invention is
This is performed on the structure of a substance composed of a plurality of connected elements using a computer, and the space where the target structure exists is divided, the state is embedded in the divided space, and the structure is made using mathematical formulas. The whole process is estimated while controlling the formation process.

実用的な精度を保ちつつ既存の手法でネックとなっている時間を短縮し、効率的な創薬を行うための助けとすることができる。   While maintaining practical accuracy, the time that has become a bottleneck with existing methods can be shortened, and this can be an aid for efficient drug discovery.

実施の形態1.
実験的手法について説明する。タンパク質の立体構造解析には実験的方法では、X線結晶構造解析法が広く用いられている。しかし対象タンパク質の純粋精製を大量に必要とする点、本来の溶媒(主に水)中での構造ではなく結晶構造を観測している点が問題である。近年ではNMR法、電子顕微鏡による直接観測なども行われている。
Embodiment 1 FIG.
The experimental method will be described. An X-ray crystal structure analysis method is widely used as an experimental method for the three-dimensional structure analysis of proteins. However, the problem is that a large amount of pure purification of the target protein is required, and the crystal structure is observed instead of the structure in the original solvent (mainly water). In recent years, NMR methods and direct observations using an electron microscope have been performed.

計算機的手法について説明する。近年の計算機能力の著しい発展を受けて計算機的手法を用いた構造予測が試みられている。それらは構造既知タンパク質の構造情報を用いるものといないものとに大きく分けられる。前者の代表はホモロジー法である。後者の代表はモンテカルロ法、分子動力学法であり、ランダムな初期立体構造からアミノ酸配列情報だけを用いて最も安定な立体構造を探索する方法である。前者では既知の構造情報との類似性がないと使えないが、後者ではそのような制約はない。   The computer method will be described. In recent years, with the remarkable development of computational capabilities, structural predictions using computational methods have been attempted. They are roughly classified into those that do not use structural information of proteins with known structures and those that do not use structural information. The former representative is the homology method. Representative of the latter are the Monte Carlo method and the molecular dynamics method, which are methods for searching for the most stable three-dimensional structure using only amino acid sequence information from a random initial three-dimensional structure. The former cannot be used without similarity to known structural information, but the latter does not have such restrictions.

次に、セルオートマトン法について説明する。セルオートマトン法は解析対象をセルと称する区分領域に分割し、各セル上に定義された離散的な状態量を近傍のセル間に設けた局所近傍則で定義し、離散的な時間変化にともなって状態量を推移させる、現象のモデル化手法である。この局所近傍則によって系全体としての現象が表現可能となる。この局所近傍則は任意に設定することができ、物理現象を表すものであれば物理法則を近傍則として扱うことも可能である。この手法は流体解析などに用いられている。

Figure 2005234699
Figure 2005234699
本手法のモデルは、CA法からヒントを得ている。以下では、CA法との対応関係を考慮にいれながら、提案モデルについて順に述べる。
1.解析空間の設定
はじめに設定しなければならないのは状態空間をどのように定義するかである。本手法では、六方格子面を層状に重ねた離散的3次元モデルを用いている。図1に解析空間の分割図を示す。
2.単位セルの保持する情報
次に、上記のように分割された単位セルが保持している情報について述べていく。単位セルには以下のような情報が含まれている。
(1)どのアミノ酸が含まれているか(もしくは、アミノ酸が存在しないか)。
(2)アミノ酸の種類に付随した電荷および質量はいくらか。
3.近傍の定義
近傍1の定義は、同一平面上(六方格子面上、x−y平面)では1つ隣のセル(図2)、高さ方向(層、Z軸)では上下セルおよびこれらのセルの1つ隣のセルである(図2)。近傍の大きさはシミュレーション実験ごとに設定できる。このモデルを用いたのは、これによりX−Y平面で60n度、Z軸方向で90n度、斜め上(もしくは下)方向で45n度が表現でき、これらの組み合わせによりアミノ酸の結合角度をある程度表せると考えたからである。ただし、n=1,・・・,5、n=1,・・・,3、n=1,・・・,7、である。これによって、タンパク質の構造で重要な2次構造のαへリックス、βシートが表現できる。
4.遷移規則
任意のセルに対して適用される遷移規則を以下で定義する。
(1)近傍として設定された範囲にあるアミノ酸から受けるベクトル和によって、セル情報を移動させる方向の候補を決定する。アミノ酸の電荷Zは、実際に特定されている値を使っている。ただし、電荷Zが0のアミノ酸に対しては、後述の揺らぎ定数で表現している。任意のアミノ酸が受けるベクトル和は、式(5)
Figure 2005234699
の第1項を式(6)
Figure 2005234699
に代入する事により得られる。すなわち、 Next, the cellular automaton method will be described. In the cellular automaton method, the analysis target is divided into divided regions called cells, and the discrete state quantities defined on each cell are defined by local neighborhood rules provided between neighboring cells. This is a phenomenon modeling method that changes state quantities. This local neighborhood rule makes it possible to represent the phenomenon of the entire system. This local neighborhood rule can be set arbitrarily, and if it represents a physical phenomenon, it can also be treated as a neighborhood rule. This technique is used for fluid analysis and the like.
Figure 2005234699
Figure 2005234699
The model of this method is inspired by the CA method. Below, the proposed model will be described in order, taking into account the correspondence with the CA method.
1. Setting the analysis space The first thing you need to set is how to define the state space. In this method, a discrete three-dimensional model in which hexagonal lattice planes are layered is used. FIG. 1 shows a division diagram of the analysis space.
2. Information held by the unit cell Next, information held by the unit cell divided as described above will be described. The unit cell includes the following information.
(1) Which amino acids are contained (or which amino acids are not present).
(2) What is the charge and mass associated with the type of amino acid?
3. Definition of neighborhood The definition of neighborhood 1 is as follows: one cell on the same plane (on the hexagonal lattice plane, xy plane) (FIG. 2), upper and lower cells in the height direction (layer, Z axis), and these cells Is a cell next to (Fig. 2). The size of the neighborhood can be set for each simulation experiment. Was of the use of this model, thereby 60n 1 time in the X-Y plane, 90n 2 degrees Z-axis direction, in an obliquely upward (or downward) can be expressed 45n 3 degrees, bond angles amino acid a combination thereof This is because I thought that I could express to some extent. However, n 1 = 1, ···, 5, n 2 = 1, ···, 3, n 3 = 1, ···, 7, a. As a result, α-helix and β-sheet of secondary structure important in protein structure can be expressed.
4). Transition rules The transition rules that apply to any cell are defined below.
(1) A candidate for a direction in which cell information is moved is determined based on a vector sum received from amino acids in a range set as a neighborhood. The actually specified value is used as the charge Z of the amino acid. However, an amino acid having a charge Z of 0 is expressed by a fluctuation constant described later. The vector sum that any amino acid receives is given by equation (5)
Figure 2005234699
The first term of Eq. (6)
Figure 2005234699
It is obtained by assigning to. That is,

Figure 2005234699
となる。
(2)周囲の状況を調べ、(1)で決定された移動候補先に実際に移動できるかどうかを判断する。例えば、移動候補先に他のアミノ酸がある場合はそこには移動する事ができない。
(3)ベクトル和の大きさFとパラメータT(以下で、便宜上温度と呼ぶ)、パラメータTh(以下で閾値と呼ぶ)が、以下の不等式を満たしているかどうかを調べる。
Figure 2005234699
It becomes.
(2) The surrounding situation is examined, and it is determined whether or not the movement candidate destination determined in (1) can actually be moved. For example, if there is another amino acid at the transfer candidate destination, it cannot move there.
(3) It is examined whether the magnitude F of the vector sum, the parameter T (hereinafter referred to as temperature for convenience), and the parameter Th (hereinafter referred to as threshold) satisfy the following inequality.

Figure 2005234699
ただし、閾値は0から1の間に正規化された一様乱数の値である。
(4)上記条件を全て満たしていれば、移動させる。
Figure 2005234699
However, the threshold value is a uniform random number value normalized between 0 and 1.
(4) If all of the above conditions are met, move it.

式(8)はSA法で用いられているメトロポリス基準を基にしている。式(8)でベクトル和が大きいもしくは温度が高ければ、左辺は大きな値となり、式(8)を満足する確率が高くなる。   Equation (8) is based on the Metropolis standard used in the SA method. If the vector sum is large or the temperature is high in Equation (8), the left side becomes a large value, and the probability of satisfying Equation (8) increases.

ここでこの関数の性質を調べるために以下の2つの条件を別々に考えてみる。1つ目は温度が一定の時で、ベクトル和が大きいほどセルが保持する情報が移動する、すなわち遷移する可能性が高くなる。言い換えれば、周囲から受ける力が大きいほどアミノ酸配列が変形しやすくなる。2つ目はベクトル和が一定の時で、温度が高いほど遷移する可能性が高くなる。言い換えれば、周囲から受ける力がそれほど強くなくても高温下ではアミノ酸配列が変形しやすくなる。ここで閾値として一様乱数を用いたのは、高い温度でも条件式が満たされない、つまりタンパク質が動きやすい環境であっても、動けない状態を作り出すためと、逆に低い温度でも条件式が満たされる、つまりタンパク質が動きにくい環境であっても動くことができる状態を作り出すためである。   Here, to examine the properties of this function, consider the following two conditions separately. The first is when the temperature is constant. As the vector sum is larger, the information held in the cell moves, that is, the possibility of transition increases. In other words, the greater the force received from the surroundings, the easier the amino acid sequence is deformed. The second is when the vector sum is constant. The higher the temperature, the higher the possibility of transition. In other words, even if the force received from the surroundings is not so strong, the amino acid sequence is easily deformed at high temperatures. Here, the uniform random number is used as the threshold value, because the conditional expression is not satisfied even at high temperatures. In other words, even in an environment where the protein is easy to move, the conditional expression is satisfied even at low temperatures. That is, to create a state where the protein can move even in an environment where the protein is difficult to move.

以上の事から、次のことが言える環境ができたと考える。   From the above, I think that the following environment has been established.

温度が高いもしくは周囲から受けるベクトル和が大きいほどタンパク質は活発な変形を行い、逆に温度が低くなるもしくはベクトル和が小さくなると動きは鈍くなる。しかし、温度が低くても、周囲から受けるベクトル和や閾値の値が高ければ動き回ることが可能になる。つまり、最初は活発にフォールディングを行うが、温度が下がるにつれてある一定の構造に収束する。これらは、実際のタンパク質のフォールディングを意識して設定したものである。
以上の事を踏まえた提案手法の流れを図3に示す。
The higher the temperature or the greater the vector sum received from the surroundings, the more active the protein is deformed. Conversely, the lower the temperature or the smaller the vector sum, the slower the movement. However, even if the temperature is low, it is possible to move around if the vector sum or threshold value received from the surroundings is high. In other words, it is actively folded at first, but converges to a certain structure as the temperature decreases. These are set in consideration of actual protein folding.
Figure 3 shows the flow of the proposed method based on the above.

(1)三次元セルの状態空間(図1)を生成する。
(2)任意の状態空間に直線状のアミノ酸配列を配置する(図4)。ただし図中のAはアミノ酸を表し、その後の番号はアミノ酸に振られたシリアルナンバーである。
(3)任意の初期個体に変形を加えるために、アミノ酸配列の一部分を変形候補として乱数により選択する。これは、ファネル理論が、「フォールディング過程において、遷移状態は1つのトラジェクトリ(経路)はなく多様なトラジェクトリである」ことを示しているため、どこから変形を加えるのかということを厳密に定義しなくても良いと考えたからである。
(4)その変形候補に対し、遷移規則の(1)〜(4)の条件を満たしていた時のみ変形(遷移)を許す。そして(3)(4)を全ての初期個体に規定回数だけ行う。これは、後に出てくる試行回数に相当する。
(5)遷移を規定回数だけ行った後に動きやすさの指標となる温度Tの変更を行う。今回は、1つ前の温度に対して、1未満の比例定数をかけて変更を行っている。これは、後に出てくる減少定数に相当する。
提案手法を用いて表現可能なタンパク質のイメージ図を図5に示す。0はアミノ酸の情報を保持していない状態、Aはアミノ酸を表し、その後の番号はアミノ酸に振られたシリアルナンバーである。図ではA1〜A15でαヘリックスが、A16〜A33でβシートが表現されている。
(1) A three-dimensional cell state space (FIG. 1) is generated.
(2) A linear amino acid sequence is arranged in an arbitrary state space (FIG. 4). In the figure, A represents an amino acid, and the subsequent numbers are serial numbers assigned to the amino acids.
(3) In order to add a modification to an arbitrary initial individual, a part of the amino acid sequence is selected as a modification candidate by a random number. This means that the funnel theory shows that "in the folding process, the transition state is not a single trajectory (path) but various trajectories". Because I thought it was good.
(4) The transformation candidate is allowed to undergo transformation (transition) only when the conditions (1) to (4) of the transition rule are satisfied. Then, (3) and (4) are performed a specified number of times for all initial individuals. This corresponds to the number of trials that appear later.
(5) The temperature T, which is an index of ease of movement, is changed after the transition is performed a specified number of times. This time, a change is made by applying a proportional constant of less than 1 to the previous temperature. This corresponds to a decreasing constant that appears later.
An image of the protein that can be expressed using the proposed method is shown in FIG. 0 represents a state in which no amino acid information is held, A represents an amino acid, and the subsequent number is a serial number assigned to the amino acid. In the figure, α-helix is represented by A1 to A15, and β sheet is represented by A16 to A33.

以上の事から、筆者の提案手法を用いれば構造情報を使わない既存の手法より早い時間で結果を出すことができ、課題に示した要望を満たすことができると考える。   From the above, using the author's proposed method, we can obtain results faster than existing methods that do not use structural information, and we can meet the needs indicated in the problem.

しかし、空間の近似をはじめとしていろいろな近似を導入したため、精度はその分だけ既存の手法よりも劣っている可能性があると考えられる。次に、筆者の主張が正しいことを証明するために本手法を用いたシミュレーション実験を行った。   However, since various approximations including space approximation are introduced, the accuracy may be inferior to that of existing methods. Next, we conducted a simulation experiment using this method to prove that the author's assertion was correct.

『実験結果とその考察』について説明する。   “Experimental results and discussion” will be explained.

はじめに実験条件について述べ、その後各条件に対する実験結果を示す。
1.実験条件の設定
以下の4種類のタンパク質に関して提案手法を用いたシミュレーション実験を行った。なお、以下の名前は、タンパク質のコード名である。
(1)1 d x g A
(2)2 e r l
(3)1 g p t
(4)1 i x a
(1)〜(4)の各タンパク質に対する実験条件を表1〜表4で示す。なお表内で使われている言葉の定義は次のとおりである。
・コード名: タンパク質に一意に与えられるコード名。
・残基数: タンパク質に含まれるアミノ酸の数。
・初期温度: シミュレーション開始時の温度パラメータの値。
・終了温度: シミュレーション終了時の温度パラメータの値。
・減少定数: ある時点における次の温度は、ある時点の温度にこの定数をかける。これは1未満の比例定数である。
・試行回数:同一温度における試行回数。残基数の何倍かで定義される。
・個体数: 生成する状態空間の数。
・近傍半径: ベクトル和を計算するために考慮に入れる近傍の半径。
・ランダム遷移数: 温度が十分に高い時のランダムな状態遷移の回数を表す。残基数の何倍かで定義される。
・揺らぎ定数: 電荷が0のアミノ酸の電荷的な揺らぎを表現。0を中心としたこの定数の大きさの範囲内でプラス・マイナスの電荷の揺らぎが乱数によって与えられる。ただし、電子の電荷を1としている。
・格子定数:六方格子面の一辺の長さ。単位は、Å。
First, the experimental conditions are described, and then the experimental results for each condition are shown.
1. Setting of Experimental Conditions A simulation experiment using the proposed method was performed for the following four types of proteins. The following names are protein code names.
(1) 1 d x g A
(2) 2 er l
(3) 1 g p t
(4) 1 i x a
Tables 1 to 4 show experimental conditions for the proteins (1) to (4). The definitions of the words used in the table are as follows.
Code name: A code name uniquely given to a protein.
-Number of residues: The number of amino acids contained in the protein.
-Initial temperature: The value of the temperature parameter at the start of simulation.
-End temperature: Temperature parameter value at the end of the simulation.
• Decreasing constant: The next temperature at a certain time will multiply this temperature by the constant at that time. This is a proportionality constant less than 1.
-Number of trials: Number of trials at the same temperature. It is defined as the number of residues.
-Number of individuals: Number of state spaces to be generated.
• Neighborhood radius: the radius of the neighborhood that is taken into account to calculate the vector sum.
-Number of random transitions: Indicates the number of random state transitions when the temperature is sufficiently high. It is defined as the number of residues.
-Fluctuation constant: Expresses the charge fluctuation of amino acids with zero charge. Within this constant size range centered around 0, plus and minus charge fluctuations are given by random numbers. However, the charge of electrons is 1.
Lattice constant: The length of one side of the hexagonal lattice plane. The unit is Å.

Figure 2005234699
Figure 2005234699

Figure 2005234699
Figure 2005234699

Figure 2005234699
Figure 2005234699

Figure 2005234699
2.結果の画像
各実験条件に対する結果を以下に示す。

(1)1 d x g Aに関する実験結果

最初に乱数依存性を調べるために乱数の種を変えて実験を行った。この実験結果を図6〜図8に示す。これは、Rasmolと呼ばれるタンパク質の立体構造を観察するために作成されたViewerから得た画像である。実験結果を評価するために、このRasmolを用いて各タンパク質の立体構造を観察した。
Figure 2005234699
2. Result image The result for each experimental condition is shown below.

(1) Experimental results for 1 d x g A

First, in order to investigate the dependence on random numbers, we experimented by changing the seeds of random numbers. The experimental results are shown in FIGS. This is an image obtained from a viewer created to observe the three-dimensional structure of a protein called Rasmol. In order to evaluate the experimental results, the three-dimensional structure of each protein was observed using this Rasmol.

まず天然に存在するタンパク質と予測構造の比較を行うために、図6にそれぞれ番号を振った。図(b)で図(a)と構造上対応している部分には、図(a)と同じ番号を振った。また、図7から図13に対しても同様に番号を振った。図6では、番号を1から5まで振ってある。   First, in order to compare the predicted structure with a naturally occurring protein, numbers are assigned to FIG. In FIG. (B), parts corresponding to those in FIG. (A) are given the same numbers as in FIG. Also, numbers are similarly assigned to FIGS. In FIG. 6, the numbers are assigned from 1 to 5.

まず全体の形は(b)が全体的に画像の奥に伸びているため、(a)よりもやや小さくまとまっている。次に個々の部分では、1から4までの部分はだいたい同じである。両図とも1から2へ曲線が伸び、2で左回りの曲線を描きながら方向が反対に変わっている。このことは、2から4でも全く同じである。しかし、4から5では、(a)は右に曲線を描いた後に左下に伸びているのに対し、(b)は右に曲線を描いた後は左上に伸びている。ただし、タンパク質の構造において両端はそれ程重要ではないことから、この実験結果は良好であると考えた。   First, the overall shape is a little smaller than (a) because (b) extends entirely behind the image. Next, in the individual parts, the parts from 1 to 4 are almost the same. In both figures, the curve extends from 1 to 2, and the direction changes in the opposite direction while drawing a counterclockwise curve. This is exactly the same for 2-4. However, in 4 to 5, (a) extends to the lower left after drawing a curve to the right, whereas (b) extends to the upper left after drawing a curve to the right. However, since both ends are not so important in the structure of the protein, this experimental result was considered good.

この実験結果に対するタンパク質構造を専門に扱っている研究者の評価は、
「全体的な構造は似ているが、個々の部分では似ている所もあれば、似ていないと所もある」
であった。このことから、図6に示してある実験結果は比較的良好であると結論付けることができる。
Researchers specializing in protein structure for this experimental result
“The overall structure is similar, but some parts are similar and some are not.”
Met. From this, it can be concluded that the experimental results shown in FIG. 6 are relatively good.

次に図7について述べる。図では番号を1から5まで振ってある。
まず全体の形では図の(b)は図6の(b)のように小さくまとまってはいない。次に個々の部分では、1から4までの部分はだいたい同じである。両図とも、1から2へ曲線が伸び、2で左回りの曲線を描がきながら方向が反対に変わっている。このことは、2から4でも全く同じである。しかし、4から5で(a)は右に曲線を描いた後に左下に伸びているのに対し、(b)は左に曲線を描いた後に右下に伸びている。これも両端が違っているだけなのでそれ程問題はないと考えられる。したがって、この実験結果は良好であると考えた。

図6と同様にこの実験結果に対するタンパク質構造を専門に扱っている研究者の評価は図6と同じであった。このことから、図7に示してある実験結果は良好であると結論付けることができる。
Next, FIG. 7 will be described. In the figure, numbers are assigned from 1 to 5.
First, in the overall form, (b) in the figure is not as small as (b) in FIG. Next, in the individual parts, the parts from 1 to 4 are almost the same. In both figures, the curve extends from 1 to 2, and the direction changes in the opposite direction while drawing a counterclockwise curve at 2. This is exactly the same for 2-4. However, from 4 to 5, (a) extends to the lower left after drawing a curve to the right, whereas (b) extends to the lower right after drawing a curve to the left. It is thought that there is not much problem because this is also different at both ends. Therefore, this experimental result was considered good.

Similar to FIG. 6, the evaluation of researchers specializing in protein structure for this experimental result was the same as FIG. From this, it can be concluded that the experimental results shown in FIG. 7 are good.

次に図8について述べる。図では番号を1から5まで振ってある。
まず全体の形では図の(b)は図6の(b)のように小さくまとまっていない。次に個々の部分では、1から2の部分が欠如していること、4から5では(a)は右に曲線を描いた後に左下に伸びているのに対し、(b)は左に曲線を描いた後は左下に伸びているが途中で切れている。これも両端が違っているだけだが、1から2の部分の欠如は許容できない。したがって、この実験結果はやや良好であると考えた。
Next, FIG. 8 will be described. In the figure, numbers are assigned from 1 to 5.
First, in the overall form, (b) in the figure is not as small as (b) in FIG. Next, in each part, the parts 1 to 2 are missing. In 4 to 5, (a) extends to the lower left after drawing a curve to the right, whereas (b) curves to the left. After drawing, it extends to the lower left but is cut off. This is also different at both ends, but the lack of one or two parts is unacceptable. Therefore, this experimental result was considered somewhat good.

図6と同様にこの実験結果に対するタンパク質構造を専門に扱っている研究者の評価は図6と同じであった。しかし1から2の部分が欠如しているため、その分だけ評価は他の結果よりも低くなってしまった。   Similar to FIG. 6, the evaluation of researchers specializing in protein structure for this experimental result was the same as FIG. However, since the parts 1 and 2 were missing, the evaluation was lower than the other results.

(1)では乱数の種を変えてそれぞれ実験を行った。この3回の結果を見る限りでは、どれもある程度良好な結果が出ているので、本手法の乱数に対する依存性はそれほど強くないと考えられる。しかしこの結果は1つのタンパク質に対してのものであり、他のタンパク質についても同じことが言えるとは限らない。そこで(2)においても確認のため乱数を変えて実験を行った。

(2)2 e r lに関する実験結果

(1)に続き(2)でも乱数依存性を調べるため乱数の種を変えて実験を行った。その結果を図9〜図11に示す。 2 e r lに関する実験結果1
次に図9について述べる。図は番号を1から6まで振ってある。
まず全体の形はだいたい同じである(図の(b)では一端画像の奥に向かって螺旋を形成し、それから手前に螺旋を形成しながら戻ってきている)。次に個々の部分では、図の(b)は5から6では(a)と異なっているが、2から3では図の(b)は(a)と同じようにαへリックスを形成し、その螺旋のサイクル数が3回である。さらに3から4でも2サイクル目の螺旋はやや崩れているがαへリックスを形成しているのが分かる。したがって、この実験結果は良好であると考えた。
In (1), the experiment was performed by changing the seed of random numbers. As long as these three results are seen, all the results are good to some extent, and it is considered that the dependence of the present method on the random number is not so strong. However, this result is for one protein, and the same is not true for other proteins. Therefore, in (2), an experiment was performed by changing the random number for confirmation.

(2) Experimental results on 2 er l

In (2) following (1), an experiment was conducted by changing the seed of random numbers in order to investigate the random number dependency. The results are shown in FIGS. Experimental result 1 for 2 er l
Next, FIG. 9 will be described. The figure is numbered from 1 to 6.
First, the overall shape is almost the same ((b) in the figure, one end forms a spiral toward the back of the image, and then returns to the front while forming a spiral). Next, in each part, (b) in the figure is different from (a) in 5 to 6, but (b) in the figure forms an α helix in the same way as (a) in 2 to 3, The spiral cycle number is three. Furthermore, it can be seen that the spiral in the second cycle is slightly broken even at 3 to 4, but an α helix is formed. Therefore, this experimental result was considered good.

図6と同様にこの実験結果に対するタンパク質構造を専門に扱っている研究者の評価は、図6と同じであった。さらに個々の部分では(1)の実験結果よりも特徴が良く出ているとのことであった。このことから図9に示してある実験結果は良好であると結論付けることができる。
次に図10について述べる。図では番号を1から6まで振ってある。
まず全体の形では図の(b)は1と5が(a)と異なり離れている。次に個々の部分では、2から3では図の(b)は(a)と同じようにαへリックスを形成し、その螺旋のサイクル数が3回である。4から5でも2サイクル目の螺旋はやや崩れているがαへリックスを形成し((b)では右下からやや左上に向かって螺旋を形成している)、さらに5から6でもαへリックスを形成し、その螺旋のサイクル数が3回である。したがって、この実験結果は良好であると考えた。

図6と同様にこの実験結果対するタンパク質構造を専門に扱っている研究者の評価は、図9と同じであった。このことから図10に示してある実験結果は良好であると結論付けることができる。
Similar to FIG. 6, the evaluation of researchers specializing in protein structure for this experimental result was the same as FIG. Furthermore, it was said that the characteristics were better than the experimental result of (1) in each part. From this, it can be concluded that the experimental results shown in FIG. 9 are good.
Next, FIG. 10 will be described. In the figure, numbers 1 to 6 are assigned.
First, in the overall form, (b) in the figure is different from 1 and 5, unlike (a). Next, in each part, from 2 to 3, (b) in the figure forms an α helix as in (a), and the number of cycles of the helix is three. Even in 4 to 5, the second cycle helix is slightly broken but forms an α helix ((b) forms a helix slightly from the lower right to the upper left). And the number of cycles of the helix is three. Therefore, this experimental result was considered good.

Similar to FIG. 6, the evaluation of researchers specializing in protein structure for the experimental results was the same as FIG. From this, it can be concluded that the experimental results shown in FIG. 10 are good.

次に図11について述べる。図は個体中で一番良い結果であるが明らかに良くない。   Next, FIG. 11 will be described. The figure is the best result among individuals, but it is clearly not good.

図6と同様にこの実験結果に対するタンパク質構造を専門に扱っている研究者の評価は、似ていないという事であった。   Similar to FIG. 6, the evaluation of researchers specializing in protein structure for this experimental result was not similar.

(2)では(1)と同様に乱数の種を変えてそれぞれ実験を行った。この3回の結果を見る限りでは、2回の結果は良好なものであったが、残り1つが良くなかった。(1)(2)の結果から、本手法の乱数に対する依存性を否定することはできないが、実用上は問題ないと考えることができる。

(3)1 g p tに関する実験結果

(3)では、(1)(2)よりも複雑な構造をもつタンパク質に対する実験を行った。この実験結果を図12に示す。
In (2), the experiment was performed by changing the seed of random numbers as in (1). As far as seeing these three results, the two results were good, but the other one was not good. From the results of (1) and (2), the dependence on the random number of this method cannot be denied, but it can be considered that there is no problem in practical use.

(3) Experimental results on 1 g pt

In (3), an experiment was conducted on a protein having a more complex structure than (1) and (2). The experimental results are shown in FIG.

まず図12について述べる。図では番号を1から9まで振ってある。
まず全体の形は図の(b)で3を基点として1を右方向にもっていくことができる、さらに8を基点として9を右方向にもっていくことができると仮定した場合、図の(b)は(a)とほぼ同じ形になる。次に個々の部分では、4から5では図の(b)は(a)と同じようにαへリックスを形成し、その螺旋のサイクル数が3回である。さらに2から3、6から7でも(a)と同じような構造をとっている。したがって、この実験結果は良好であると考えた。
First, FIG. 12 will be described. In the figure, numbers are assigned from 1 to 9.
First, assuming that the overall shape is (b) in the figure and 1 can be moved to the right from 3 as a base point, and 9 can be moved to the right from 8 as a base point. ) Has almost the same shape as (a). Next, in each part, from 4 to 5, (b) in the figure forms an α helix as in (a), and the number of cycles of the helix is three. Further, the structures 2 to 3 and 6 to 7 have the same structure as (a). Therefore, this experimental result was considered good.

図6と同様にこの実験結果に対するタンパク質構造を専門に扱っている研究者の評価は、図9と同じであった。さらに構造が複雑な割には良く特徴が出ているとのことであった。このことから図12に示してある実験結果は良好であると結論付けることができる。

(4)1 i x aに関する実験結果

(3)に続き(4)でも、(1)(2)よりも複雑な構造をもつタンパク質に対する実験を行った。この実験結果は図13に示す。
Similar to FIG. 6, the evaluation of researchers specializing in protein structure for this experimental result was the same as FIG. Furthermore, it is said that the features are good for the complicated structure. From this, it can be concluded that the experimental results shown in FIG. 12 are good.

(4) Experimental results for 1 i x a

In (4) following (3), an experiment was conducted on a protein having a more complicated structure than in (1) and (2). The result of this experiment is shown in FIG.

次に図13について述べる。図では番号を1から9まで振ってある。
まず全体の形では図の(b)は(a)とほぼ同じような構造をとっている。次に個々の部分では、2から6では、3から4の間のくの字型向きが同じであれば、図の(b)は(a)と同じような構造となっている。さらに8のループ部分の構造も同じとなっている。したがって、この実験結果は良好であると考えた。
Next, FIG. 13 will be described. In the figure, numbers are assigned from 1 to 9.
First, as a whole, (b) in the figure has a structure almost the same as (a). Next, in each part, in the case of 2 to 6, (b) in the figure has the same structure as (a) if the shape of the dogleg shape between 3 and 4 is the same. Furthermore, the structure of the loop portion of 8 is the same. Therefore, this experimental result was considered good.

図6と同様にこの実験結果に対するタンパク質構造を専門に扱っている研究者からの評価は、図12と同じであった。このことから図13示してある実験結果は良好であると結論付けることができる。   Similar to FIG. 6, the evaluation from the researchers who specialize in protein structure for this experimental result was the same as FIG. From this, it can be concluded that the experimental results shown in FIG. 13 are good.

この節の実験結果に対するタンパク質構造を専門に扱っている研究者の評価は、「全体を通して比較的良好な結果が得られていると考えられる」であった。このことからこの節で示してある実験結果は全体的に良好であると結論付けることができる。   The evaluation of researchers who specialize in protein structure for the experimental results in this section was "We believe that relatively good results were obtained throughout." From this it can be concluded that the experimental results presented in this section are generally good.

最後に、Pentium(登録商標)4の2.26GHzで本手法を用いて実験を行った場合、平均して2時間程度で結果を得ることができた。   Finally, when an experiment was conducted using this method at 2.26 GHz of Pentium (registered trademark) 4, the results could be obtained in about 2 hours on average.

実験結果に関する考察として以下の3つをあげることができる。
(1)多くの予測構造で、その両端が天然に存在するタンパク質と違うものとなった。これは両端の周りには他のアミノ酸が他の部分に比べ存在しにくく、周囲からの影響を受けにくかったため、適切な構造が形成されなかったと考えられる。
(2)図11が示す結果から、本手法には乱数に対してある程度の依存性がある。
(3)全体的な実験結果が良好であったため、導入したいろいろな近似は妥当なものであったと考えられる。
The following three can be given as considerations regarding the experimental results.
(1) Many predicted structures differed from the naturally occurring protein at both ends. It is considered that an appropriate structure was not formed because other amino acids were less likely to be present around both ends than other parts and were not easily affected by the surroundings.
(2) From the results shown in FIG. 11, this method has a certain degree of dependence on random numbers.
(3) Since the overall experimental results were good, it is considered that the various approximations introduced were valid.

改善すべき点はあるが、いろいろな近似を導入しているのにも関わらず、実験結果は全体的に良好なものとなった。これは、本手法がタンパク質の立体構造の解析手法として有効である可能性を示唆している。   Although there are points to be improved, the results of the experiment were generally good despite the introduction of various approximations. This suggests that this method may be effective as a method for analyzing the three-dimensional structure of proteins.

筆者の提案手法を用いれば構造情報を使わない既存の手法より早い時間で結果が出せるため、課題に示したの要望を満たすことができると考えられる。つまり、本手法がタンパク質の立体構造の解析手法として有効である可能性を示唆している。   If the author's proposed method is used, results can be obtained in a shorter time than the existing method that does not use structural information. In other words, this method suggests the possibility of being effective as a method for analyzing the three-dimensional structure of proteins.

今後の課題となるのは以下の3つである。
(1)計算過程をエネルギー計算を用いて調べる事により、本手法に対する信頼性を高める。
(2)タンパク質の両端を正しく形成することおよび乱数に対する依存性を小さくすることができる枠組みを考える。
(3)さらに精度をあげるために、疎水性相互作用などの情報を本手法に組み入れる。
The following three issues will be addressed.
(1) The reliability of this method is improved by examining the calculation process using energy calculation.
(2) Consider a framework that can correctly form both ends of a protein and reduce the dependence on random numbers.
(3) In order to further improve accuracy, information such as hydrophobic interaction is incorporated into this method.

解析空間の分割図。Division diagram of analysis space. 近傍1の範囲。Neighborhood 1 range. 提案手法の流れ。Flow of the proposed method. アミノ酸配列の初期状態。The initial state of the amino acid sequence. 提案手法で表現されるタンパク質の例。Examples of proteins expressed by the proposed method. 1 d x g Aに関する実験結果1。Experimental result 1 for 1 d x g A 1 d x g Aに関する実験結果2。Experimental result 2 for 1 d x g A. 1 d x g Aに関する実験結果3。Experimental result 3 for 1 d x g A 2 e r lに関する実験結果1。Experimental result 1 for 2 er l. 2 e r lに関する実験結果2。Experimental result 2 for 2 er l. 2 e r lに関する実験結果3。Experimental result 3 for 2 er l 3. 1 g p tに関する実験結果。Experimental results for 1 g pt. 1 i x aに関する実験結果。Experimental results for 1 i x a.

Claims (19)

計算機を用いて複数の連接した要素により構成される物質の構造に対して行われるものであって、対象構造が存在する空間を分割し、分割された空間に状態を埋め込み、数式を用いて構造の形成過程を制御しながら全体を推定する立体構造推定方法。   This is performed on the structure of a substance composed of a plurality of connected elements using a computer, and the space where the target structure exists is divided, the state is embedded in the divided space, and the structure is made using mathematical formulas. A three-dimensional structure estimation method for estimating the whole while controlling the formation process. 前記要素が、アミノ酸であることを特徴とする請求項1記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 1, wherein the element is an amino acid. 前記物質が、タンパク質であることを特徴とする請求項1記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 1, wherein the substance is a protein. 前記空間の分割が、格子による分割であることを特徴とする請求項1記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 1, wherein the space is divided by a lattice. 前記格子が、六法格子であることを特徴とする請求項4記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 4, wherein the lattice is a hexagonal lattice. 前記格子が、層状に重なることを特徴とする請求項4記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 4, wherein the lattices are layered. 前記状態として、要素の有無と、要素がある場合の電荷と、隣接する要素の位置を含む情報を記憶する特徴とする請求項1記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 1, wherein information including presence / absence of an element, charge when an element is present, and positions of adjacent elements are stored as the state. 前記数式が、焼きなまし法のメトロポリス基準であることを特徴とする請求項1記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 1, wherein the mathematical expression is a metropolis standard of annealing method. 前記数式が、ベクトル(F)と制御パラメータ(T)の関数であることを特徴とする請求項1記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 1, wherein the mathematical expression is a function of a vector (F) and a control parameter (T). 前記ベクトル(F)が、クーロン力であることを特徴とする請求項9記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 9, wherein the vector (F) is a Coulomb force. 前記数式が閾値を越えた場合に、要素を移動させるように、前記状態を変更することを特徴とする請求項1記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 1, wherein the state is changed so that an element is moved when the mathematical formula exceeds a threshold value. 前記閾値が、関数により算出されることを特徴とする請求項11記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 11, wherein the threshold value is calculated by a function. 前記関数は、乱数を生成することを特徴とする請求項12記載の立体構造推定方法。   The method according to claim 12, wherein the function generates a random number. 前記乱数は、一様乱数であることを特徴とする請求項13記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 13, wherein the random number is a uniform random number. 前記数式は、
Figure 2005234699
であることを特徴とする請求項9記載の立体構造推定方法。
The formula is
Figure 2005234699
The three-dimensional structure estimation method according to claim 9, wherein:
前記状態が、局所的な規則に基づいていることを特徴とする請求項1記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 1, wherein the state is based on a local rule. 前記状態が、近傍の状態に左右されることを特徴とする請求項1記載の立体構造推定方法。   The three-dimensional structure estimation method according to claim 1, wherein the state depends on a nearby state. 最近傍もしくはその定数倍の範囲でクーロン力を算出することを特徴とする請求項10記載の立体構造推定方法。   11. The method for estimating a three-dimensional structure according to claim 10, wherein the Coulomb force is calculated in the nearest neighborhood or a range of a constant multiple thereof. 計算機を用いて複数の連接した要素により構成される物質の構造に対して行われるものであって、対象構造が存在する空間を分割し、分割された空間に状態を埋め込み、数式を用いて構造の形成過程を制御しながら全体を推定する立体構造推定装置。   This is performed on the structure of a substance composed of a plurality of connected elements using a computer, and the space where the target structure exists is divided, the state is embedded in the divided space, and the structure is made using mathematical formulas. A three-dimensional structure estimation device that estimates the whole while controlling the formation process.
JP2004040362A 2004-02-17 2004-02-17 Apparatus and method for estimation of spatial structure of protein by cellular automaton Pending JP2005234699A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004040362A JP2005234699A (en) 2004-02-17 2004-02-17 Apparatus and method for estimation of spatial structure of protein by cellular automaton

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004040362A JP2005234699A (en) 2004-02-17 2004-02-17 Apparatus and method for estimation of spatial structure of protein by cellular automaton

Publications (1)

Publication Number Publication Date
JP2005234699A true JP2005234699A (en) 2005-09-02

Family

ID=35017615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004040362A Pending JP2005234699A (en) 2004-02-17 2004-02-17 Apparatus and method for estimation of spatial structure of protein by cellular automaton

Country Status (1)

Country Link
JP (1) JP2005234699A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100797400B1 (en) 2006-12-04 2008-01-28 한국전자통신연구원 Apparatus and method for protein structure comparison using principal components analysis and autocorrelation
JP2011514509A (en) * 2008-02-05 2011-05-06 ザイムワークス,インコーポレイテッド Method for determining correlated residues in proteins or other biopolymers using molecular dynamics
CN108469313A (en) * 2018-04-16 2018-08-31 大连理工大学 Copper plate of crystallizer temperature anomaly method for detecting area based on cellular automata
JP2020091518A (en) * 2018-12-03 2020-06-11 富士通株式会社 Structure search method of cyclic molecule and structure search device as well as program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05501324A (en) * 1990-04-24 1993-03-11 スクリップス クリニック アンド リサーチ ファウンデーション System and method for determining three-dimensional structure of proteins
JP2000122521A (en) * 1998-10-14 2000-04-28 Makoto Morishita Simulator, analytical system and method for diffusion phenomenon, and storage medium
JP2002132506A (en) * 2000-10-30 2002-05-10 Advanced Telecommunication Research Institute International Apparatus and method of hypothesis simulation
JP2002536301A (en) * 1999-01-27 2002-10-29 ザ スクリプス リサーチ インスティテュート Protein modeling tools

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05501324A (en) * 1990-04-24 1993-03-11 スクリップス クリニック アンド リサーチ ファウンデーション System and method for determining three-dimensional structure of proteins
JP2000122521A (en) * 1998-10-14 2000-04-28 Makoto Morishita Simulator, analytical system and method for diffusion phenomenon, and storage medium
JP2002536301A (en) * 1999-01-27 2002-10-29 ザ スクリプス リサーチ インスティテュート Protein modeling tools
JP2002132506A (en) * 2000-10-30 2002-05-10 Advanced Telecommunication Research Institute International Apparatus and method of hypothesis simulation

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100797400B1 (en) 2006-12-04 2008-01-28 한국전자통신연구원 Apparatus and method for protein structure comparison using principal components analysis and autocorrelation
JP2011514509A (en) * 2008-02-05 2011-05-06 ザイムワークス,インコーポレイテッド Method for determining correlated residues in proteins or other biopolymers using molecular dynamics
CN108469313A (en) * 2018-04-16 2018-08-31 大连理工大学 Copper plate of crystallizer temperature anomaly method for detecting area based on cellular automata
CN108469313B (en) * 2018-04-16 2019-06-14 大连理工大学 Copper plate of crystallizer temperature anomaly method for detecting area based on cellular automata
JP2020091518A (en) * 2018-12-03 2020-06-11 富士通株式会社 Structure search method of cyclic molecule and structure search device as well as program
JP7176381B2 (en) 2018-12-03 2022-11-22 富士通株式会社 Structure search method for cyclic molecule, structure search device, and program

Similar Documents

Publication Publication Date Title
Bonneau et al. Ab initio protein structure prediction: progress and prospects
Yuan et al. Binding site detection and druggability prediction of protein targets for structure-based drug design
Lai et al. On the importance of cotranscriptional RNA structure formation
Alber et al. Integrating diverse data for structure determination of macromolecular assemblies
Ulrich et al. Toxicogenomics and drug discovery: will new technologies help us produce better drugs?
US10192641B2 (en) Method of generating a dynamic pathway map
Xue et al. Predicting residue–residue contact maps by a two‐layer, integrated neural‐network method
Miao et al. Active-site hydration and water diffusion in cytochrome P450cam: a highly dynamic process
Shangguan A review of target identification strategies for drug discovery: from database to machine-based methods
EP1724697A1 (en) Ligand searching device, ligand searching method, program, and recording medium
Li Conformational sampling in template-free protein loop structure modeling: an overview
Tan et al. RNA folding: structure prediction, folding kinetics and ion electrostatics
Qazi et al. Translational bioinformatics in healthcare: past, present, and future
Yu-ming Multiscale computational study of ligand binding pathways: Case of p38 MAP kinase and its inhibitors
Vilhekar et al. Artificial Intelligence in Genetics
JP2005234699A (en) Apparatus and method for estimation of spatial structure of protein by cellular automaton
Sarkar et al. Chelated magnesium logic gate regulates riboswitch pseudoknot formation
Sripakdeevong et al. Why can’t we predict RNA structure at atomic resolution?
Tseng et al. A unified approach to computational drug discovery
Ormazábal et al. Dynamics and Function of sRNA/mRNAs Under the Scrutiny of Computational Simulation Methods
Fan et al. Mimicking the action of folding chaperones in molecular dynamics simulations: application to the refinement of homology‐based protein structures
Zeng et al. Evaluation of DNA–protein complex structures using the deep learning method
Chugh et al. Machine learning applications in rational drug discovery
Robson et al. The future of highly personalized health care
Das et al. Therapeutic target identification and evaluation using machine learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100420