JP2017174057A - Method for predicting partial cubic structure of protein - Google Patents

Method for predicting partial cubic structure of protein Download PDF

Info

Publication number
JP2017174057A
JP2017174057A JP2016058220A JP2016058220A JP2017174057A JP 2017174057 A JP2017174057 A JP 2017174057A JP 2016058220 A JP2016058220 A JP 2016058220A JP 2016058220 A JP2016058220 A JP 2016058220A JP 2017174057 A JP2017174057 A JP 2017174057A
Authority
JP
Japan
Prior art keywords
protein
predicted
partial
determined
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016058220A
Other languages
Japanese (ja)
Inventor
秀始 石井
Hideshi Ishii
秀始 石井
森 正樹
Masaki Mori
正樹 森
祐一郎 土岐
Yuichiro Doki
祐一郎 土岐
準 小関
Jun Koseki
準 小関
尚弘 西田
Hisahiro Nishida
尚弘 西田
雅允 今野
Masamitsu Konno
雅允 今野
弘一 川本
Koichi Kawamoto
弘一 川本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka University NUC
Original Assignee
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka University NUC filed Critical Osaka University NUC
Priority to JP2016058220A priority Critical patent/JP2017174057A/en
Publication of JP2017174057A publication Critical patent/JP2017174057A/en
Pending legal-status Critical Current

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method capable of easily predicting a cubic structure of a protein with sufficient accuracy.SOLUTION: A cubic structure of a protein can be predicted in a manner that: overlaps cubic structures of at least two types of known proteins having high amino-acid sequence homology with respect to a prediction object protein so as to maximize an overlapped portions and identifies plural overlapped portions and plural non-overlapped portions; adopts the overlapped portion directly as a predicted partial (core) structure of the prediction object protein; and extracts plural predicted partial (component) structures by executing partial structural prediction with the non-overlapped portions of the prediction object protein as molds and converts combinations of the core and plural types of components into a thermodynamically stable structural group by simulating the same at a temperature in a body.SELECTED DRAWING: Figure 1

Description

本発明は、タンパク質の部分立体構造を予測する方法に関する。   The present invention relates to a method for predicting a partial tertiary structure of a protein.

現在、in silicoスクリーニング技術としては、大きく分けてLigand-Based Drug Design (LBDD)法と、Structure-Based Drug Design (SBDD)法とが用いられている。   Currently, Ligand-Based Drug Design (LBDD) method and Structure-Based Drug Design (SBDD) method are widely used as in silico screening techniques.

LBDD法においては、薬理効果を有する幾つかの既存薬が必要であり、薬物間相互作用特性を予測して新規候補化合物を生成する。   In the LBDD method, some existing drugs having a pharmacological effect are required, and drug-drug interaction characteristics are predicted to generate new candidate compounds.

一方でSBDD法においては、薬物標的となるタンパク質構造が既に明らかとなっている必要があり、そのタンパク質の標的部位を基に新規候補化合物を生成する。   On the other hand, in the SBDD method, the protein structure to be a drug target needs to be clarified, and a new candidate compound is generated based on the target site of the protein.

このように、従来の手法では、立体構造が明らかになっていない新規標的タンパク質に対するスクリーニングを行う場合、SBDD法はもちろんのこと、複数個の既存薬が分かっていなければLBDD法も行うことはできなかった。   Thus, in the conventional method, when screening for a new target protein whose steric structure is not known, not only the SBDD method but also the LBDD method can be performed if multiple existing drugs are not known. There wasn't.

タンパク質立体構造の予測方法がいくつか提案されているが(非特許文献1及び2)、SBDD法に使用できるほど十分な精度で、かつ簡易に予測できる方法はなかった。   Several methods for predicting protein tertiary structures have been proposed (Non-Patent Documents 1 and 2), but there has been no method that can be easily predicted with sufficient accuracy to be used in the SBDD method.

D. Petrey, et al., Using Multiple Structure Alignments, Fast model Building, and Energetic Analysis in Fold Reecognition and Homology Modeling. Proteins.53, 430-435 (2003)D. Petrey, et al., Using Multiple Structure Alignments, Fast model Building, and Energetic Analysis in Fold Reecognition and Homology Modeling. Proteins. 53, 430-435 (2003) K. Zhu, et al., Antibody structure determination using a combination of homology modeling, energy-based refinement, and loop prediction. Proteins.82, 1646-1655 (2014)K. Zhu, et al., Antibody structure determination using a combination of homology modeling, energy-based refinement, and loop prediction.Proteins. 82, 1646-1655 (2014)

本発明は、十分な精度で、かつ簡易にタンパク質立体構造を予測することのできる方法を提供することを課題とする。   An object of the present invention is to provide a method capable of easily predicting a protein tertiary structure with sufficient accuracy.

本発明者らは、上記した課題を解決すべく鋭意研究を重ねた結果、
(i)予測対象タンパク質に対して高いアミノ酸配列相同性を有する、少なくとも二種の既知タンパク質の立体構造を互いに重複部分が最大となるように重ね合わせることにより、それぞれの立体構造が重複する部分と重複しない部分とを、それぞれ複数ずつ決定し、
(ii)重複する部分については、そのままその部分に相当する予測対象タンパク質の予測部分構造(核)として採用し、
(iii)重複しない部分については、その部分に相当する予測対象タンパク質の部分構造を鋳型としてさらに部分的な構造予測を行うことにより予測部分構造(部品)を複数種抽出し、
(iv)核と複数種の部品との組合せを、タンパク質の予測全体構造とし、さらに、
(v)このようにして得られた予測全体構造を、生体内温度で動かす(シミュレートする)ことにより、安定した構造群へと変換させる、
という方法論を採用することにより、高精度かつ簡易に構造予測を行うことができることを見出し、この本発明を完成するに至った。
As a result of intensive studies to solve the above problems, the present inventors have
(I) By overlapping the three-dimensional structures of at least two known proteins having high amino acid sequence homology with the protein to be predicted so that the overlapping portions are maximized with each other, Determine multiple parts that do not overlap,
(Ii) For overlapping portions, adopt as the predicted partial structure (nucleus) of the prediction target protein corresponding to that portion as it is,
(Iii) For non-overlapping parts, a plurality of types of predicted partial structures (parts) are extracted by performing partial structure prediction using the partial structure of the protein to be predicted corresponding to the part as a template,
(Iv) The combination of the nucleus and multiple types of parts is the predicted overall structure of the protein,
(V) The predicted overall structure obtained in this way is converted into a stable structure group by moving (simulating) the temperature in the living body.
By adopting the methodology, it has been found that the structure can be predicted with high accuracy and simplicity, and the present invention has been completed.

すなわち、本発明は、下記の実施形態を含む。
項1.
タンパク質の部分立体構造を予測する方法であって、以下の工程を含む方法:
(1)予測対象タンパク質に対して高いアミノ酸配列相同性を有する、少なくとも二種の既知タンパク質の立体構造を互いに重複部分が最大となるように重ね合わせることにより、それぞれの立体構造が重複する部分と重複しない部分とを、それぞれ一以上ずつ決定する工程;
(2)工程(1)で決定された、立体構造が重複する各部分を、予測対象タンパク質の第一次予測部分構造として決定する工程;
(3)工程(1)で決定された、立体構造が重複しない各部分のアミノ酸配列に対応する予測対象タンパク質の各部分について、それぞれ高い相同性を有する、少なくとも一種の既知タンパク質のアミノ酸部分配列を決定し、該既知タンパク質の立体構造のうち、該アミノ酸部分配列に対応する部分構造のそれぞれを、予測対象タンパク質の当該部分についての第一次予測部分構造候補として決定する工程;
(4)工程(1)で決定された第一次予測部分構造と、工程(3)で決定された第一次予測部分構造候補のそれぞれを互いに組み合わせることにより、第一次予測全体構造候補をそれぞれ決定する工程;及び
(5)工程(4)で決定された第一次予測全体構造候補それぞれに対して分子動力学計算を行い、最も各候補間で共通して安定な構造となっている部分構造を抽出し、該部分構造を予測対象タンパク質の第二次予測部分構造として決定する工程。
項2.
工程(5)における前記分子動力学計算によって、生体内における熱力学的挙動をシミュレーションする、項1に記載の方法。
項3.
工程(5)における部分構造の抽出を、クラスタリングにより行う、項1又は2に記載の方法。
That is, the present invention includes the following embodiments.
Item 1.
A method for predicting a partial three-dimensional structure of a protein, comprising the following steps:
(1) By overlapping the three-dimensional structures of at least two known proteins having high amino acid sequence homology with the protein to be predicted so that the overlapping portions are maximized with each other, Determining one or more non-overlapping parts;
(2) A step of determining each portion having a three-dimensional structure determined in step (1) as a primary predicted partial structure of a protein to be predicted;
(3) An amino acid partial sequence of at least one kind of known protein having high homology with respect to each part of the protein to be predicted corresponding to the amino acid sequence of each part having a non-overlapping three-dimensional structure determined in step (1) Determining and determining each of the partial structures corresponding to the amino acid partial sequence among the three-dimensional structures of the known proteins as primary predicted partial structure candidates for the part of the protein to be predicted;
(4) By combining each of the primary predicted partial structure determined in step (1) and the primary predicted partial structure candidate determined in step (3) with each other, a primary predicted overall structure candidate is obtained. (5) The molecular dynamics calculation is performed for each of the primary predicted overall structure candidates determined in (5) and (4), and the most stable structure is the most common among the candidates. A step of extracting a partial structure and determining the partial structure as a second predicted partial structure of the protein to be predicted.
Item 2.
Item 2. The method according to Item 1, wherein the thermodynamic behavior in the living body is simulated by the molecular dynamics calculation in the step (5).
Item 3.
Item 3. The method according to Item 1 or 2, wherein the extraction of the partial structure in the step (5) is performed by clustering.

本発明によれば、十分な精度で、かつ簡易にタンパク質立体構造を予測することのできる方法を提供することができる。   According to the present invention, it is possible to provide a method capable of easily predicting a protein tertiary structure with sufficient accuracy.

また、本発明の方法は、従来のホモロジーモデリング手法とは異なり、予測対象タンパク質のコアドメイン全域に渡り高いアミノ酸配列相同性を示す既知タンパク質を特定できない場合であっても、立体構造を予測しうる点で有利である。   In addition, unlike the conventional homology modeling method, the method of the present invention can predict a three-dimensional structure even when a known protein exhibiting high amino acid sequence homology over the entire core domain of the protein to be predicted cannot be identified. This is advantageous.

本発明の方法を模式的に示した図である。It is the figure which showed the method of this invention typically. 本発明の方法を利用した薬物スクリーニングの模式図である。It is a schematic diagram of the drug screening using the method of the present invention. 本発明の方法により得られた予測構造と、X−線結晶解析により得られた立体構造とを対比した図面である。1 is a drawing comparing a predicted structure obtained by the method of the present invention with a three-dimensional structure obtained by X-ray crystal analysis.

1.工程(1)
工程(1)は、予測対象タンパク質に対して高いアミノ酸配列相同性を有する、少なくとも二種の既知タンパク質の立体構造を互いに重複部分が最大となるように重ね合わせることにより、それぞれの立体構造が重複する部分と重複しない部分とを、それぞれ一以上ずつ決定する工程である。
1. Process (1)
In step (1), the three-dimensional structures of at least two known proteins having high amino acid sequence homology with the protein to be predicted are overlapped so that the overlapping portion is maximized. This is a step of determining one or more portions that do not overlap with each other.

予測対象タンパク質に対して高いアミノ酸配列相同性を有する、既知タンパク質の立体構造は、公知の手段により探索することができる。特に限定されないが、例えば、BLAST等を用い、Protein Data Bank(PDB)に登録されているタンパク質構造の中から相同性検索により探索することができる。上記探索のためには、他にも、FASTA等も用いることができる。   The three-dimensional structure of a known protein having high amino acid sequence homology with the protein to be predicted can be searched for by a known means. Although not particularly limited, for example, it can be searched by homology search from protein structures registered in Protein Data Bank (PDB) using BLAST or the like. In addition, FASTA or the like can be used for the search.

2.工程(2)
工程(2)は、工程(1)で決定された、立体構造が重複する各部分を、予測対象タンパク質の第一次予測部分構造として決定する工程である。便宜上、このようにして決定された第一次予測部分構造を、「核」と呼ぶことがある。
2. Process (2)
Step (2) is a step of determining each portion having a three-dimensional structure determined in step (1) as the primary predicted partial structure of the protein to be predicted. For convenience, the primary prediction partial structure determined in this way may be referred to as a “nucleus”.

3.工程(3)
工程(3)は、工程(1)で決定された、立体構造が重複しない各部分のアミノ酸配列に対応する予測対象タンパク質の各部分について、それぞれ高い相同性を有する、少なくとも一種の既知タンパク質のアミノ酸部分配列を決定し、該既知タンパク質の立体構造のうち、該アミノ酸部分配列に対応する部分構造のそれぞれを、予測対象タンパク質の当該部分についての第一次予測部分構造候補として決定する工程である。
3. Step (3)
Step (3) is an amino acid of at least one kind of known protein having high homology with respect to each part of the protein to be predicted corresponding to the amino acid sequence of each part that does not overlap in the three-dimensional structure determined in step (1). In this step, a partial sequence is determined, and each of the partial structures corresponding to the amino acid partial sequence in the three-dimensional structure of the known protein is determined as a primary predicted partial structure candidate for that part of the protein to be predicted.

便宜上、このようにして決定された第一次予測部分構造を、「部品」と呼ぶことがある。   For convenience, the primary predicted partial structure determined in this way may be referred to as a “component”.

これらの各部分について、高い相同性を有する既知タンパク質のアミノ酸部分配列を決定するには、公知の手段を利用することができる。特に限定されないが、例えば、BLAST等を用い、PDBに登録されているタンパク質構造の中から相同性検索により探索することができる。上記探索のためには、他にも、FASTA等も用いることができる。   In order to determine the amino acid partial sequence of a known protein having high homology for each of these parts, a known means can be used. Although not particularly limited, for example, it can be searched by homology search from protein structures registered in PDB using BLAST or the like. In addition, FASTA or the like can be used for the search.

この段階において、各部分に相当する部品を、少なくとも二種以上決定したほうが、後述の通り核と組み合わせて構造予測を行う際に、予測精度を向上することができるため、好ましい。   At this stage, it is preferable to determine at least two or more types of parts corresponding to each part because prediction accuracy can be improved when structure prediction is performed in combination with a nucleus as described later.

4.工程(4)
工程(4)は、工程(1)で決定された第一次予測部分構造と、工程(3)で決定された第一次予測部分構造候補のそれぞれを互いに組み合わせることにより、第一次予測全体構造候補をそれぞれ決定する工程である。
4). Process (4)
In the step (4), the primary prediction partial structure determined in the step (1) and the primary prediction partial structure candidate determined in the step (3) are combined with each other, so that the entire primary prediction This is a step of determining structure candidates.

第一次予測全体構造候補は、核及び部品の組合せであり、それらの種類が多くなれば、組合せの種類も多くなるため、候補の数が増える。候補の場合が多いほうが、後述の構造予測を行う際に、予測精度を向上することができるため、好ましい。   The primary overall prediction structure candidate is a combination of a nucleus and a part. If the number of types increases, the number of combinations increases, and the number of candidates increases. It is preferable that the number of candidates is larger because prediction accuracy can be improved when performing structure prediction described later.

例えば、核が一つであり、部品の存在する箇所が二箇所ある場合であって、それぞれの箇所において二種類ずつの部品が得られている場合は、核と部品の組合せとしては4通りが得られることになる(図1)。核が一つであり、部品の存在する箇所が三箇所ある場合であって、それぞれの箇所において二種類ずつの部品が得られている場合は、核と部品の組合せとしては6通りが得られることになる。   For example, if there is one core and there are two parts where there are parts, and two types of parts are obtained at each part, there are four combinations of cores and parts. Will be obtained (FIG. 1). If there are three cores and there are three parts, and two parts are obtained at each part, six combinations of cores and parts can be obtained. It will be.

この段階で得られる、第一次予測全体構造候補については、ラマチャンドラン・プロットで禁制領域に入る領域がたとえ多くても問題としない。そのような領域が多数あったとしても、以後の構造予測により最適な構造を決定することができるためである。   For the primary prediction overall structure candidate obtained at this stage, it does not matter even if there are many regions that enter the forbidden region in the Ramachandran plot. This is because even if there are many such regions, an optimal structure can be determined by subsequent structure prediction.

5.工程(5)
工程(5)は、工程(4)で決定された第一次予測全体構造候補それぞれに対して分子動力学計算を行い、最も各候補間で共通して安定な構造となっている部分構造を抽出し、該部分構造を予測対象タンパク質の第二次予測部分構造として決定する工程である。
5. Step (5)
In step (5), molecular dynamics calculation is performed for each primary predicted overall structure candidate determined in step (4), and a partial structure that is most stable among the candidates is obtained. This is a step of extracting and determining the partial structure as the second predicted partial structure of the protein to be predicted.

この工程は、特に限定されないが、例えば、以下のようにして行うことができる。   Although this process is not specifically limited, For example, it can carry out as follows.

まず始めに、構造の安定化を行う。安定化は、特に限定されないが、例えば、Energy Minimization法により行うことができる。ここでは、タンパク質が持つ不自然な構造を生体内の温度揺らぎ(分子振動)を考慮せずに、ある程度緩和させる。内部エネルギーを各原子間距離、原子核度及び二面角によって記述される関数としてあらわし、そのエネルギー値を減少させるように微分方程式を解く。このときには例えば、原子が得る力の大きさに応じて、最急降下法とニュートン法とを組合せることができる。   First, the structure is stabilized. Although stabilization is not specifically limited, For example, it can carry out by the Energy Minimization method. Here, the unnatural structure of the protein is relaxed to some extent without considering the temperature fluctuation (molecular vibration) in the living body. The internal energy is expressed as a function described by the interatomic distance, atomic nuclei and dihedral angle, and the differential equation is solved so as to decrease the energy value. At this time, for example, the steepest descent method and the Newton method can be combined according to the magnitude of the force obtained by the atoms.

また、上のようにして第一次予測全体構造候補をエネルギーが小さい方向へと緩和させる際に、特に限定されないが、例えば、各第一次予測全体構造候補の周囲に緩衝水を配置することができる。より具体的には、12 [Å]の緩衝水(TIP3P)を配置することができる。緩衝水の配置により対象内部での水素結合形成によって引き起こされる凝縮等を緩和する事が出来る。   Moreover, when relaxing the primary predicted overall structure candidates in the direction of lower energy as described above, for example, buffer water is arranged around each primary predicted overall structure candidate. Can do. More specifically, 12 [Å] of buffer water (TIP3P) can be arranged. Condensation caused by the formation of hydrogen bonds inside the object can be mitigated by the arrangement of buffered water.

その後、分子動力学計算を利用して、第一次予測全体構造候補を揺らがせる。特に限定されないが、通常、生体内温度に相当する温度において行うことができる。一例として、310 [K] において行うことができる。特に限定されないが、温度上昇は、ゆっくりと行うことが好ましい。例えば、ステップ幅0.0002 [ps]で500,000ステップかけてゆっくりと310 [K]まで昇温させるなどして、ゆっくりと行う。   Then, using the molecular dynamics calculation, the first predicted overall structure candidate is shaken. Although not particularly limited, it can be usually performed at a temperature corresponding to the in-vivo temperature. As an example, it can be performed at 310 [K]. Although not particularly limited, it is preferable to increase the temperature slowly. For example, slowly increase the temperature to 310 [K] over 500,000 steps with a step width of 0.0002 [ps].

昇温後、上記の昇温ステップ数に相当する数の構造トラジェクトリを蓄積する。例えば、上記例のように、5,000,000ステップかけて昇温した場合には、5,000,000ステップの構造トラジェクトリを蓄積する。熱揺らぎの過程で十分な時間シミュレートすれば、一般的に不自然な三次元構造部分は消滅させることが可能である。   After the temperature increase, the number of structural trajectories corresponding to the number of temperature increase steps is accumulated. For example, when the temperature is increased over 5,000,000 steps as in the above example, a structural trajectory of 5,000,000 steps is accumulated. If a sufficient amount of time is simulated in the process of thermal fluctuation, generally unnatural three-dimensional structures can be eliminated.

この構造緩和過程において、全体構造のRMSD(Root Mean Square Deviation)の変異量が十分小さくなるまで分子動力学計算を続ける。十分量なサンプリングがなされているかの判断は、蓄積されたRMSDの偏差がその分割数によらず一定になっているかどうか(Reblocking Analysis)で判定することができる。(J. Chem. Phys. 91, 461, 1989)
上記部分構造の抽出を、クラスタリングにより行うことができる。クラスタリングとしては、特に限定されず、通常用いられる構造クラスタリングの手法を利用することができる。例えば、薬物が結合する空間の周囲5 [Å]に存在する残基だけをできるだけ重ね合せた(RMSDが最小になるようにした)後、RMSDが小さく重なりが大きいものの順に、似たような構造で振り分けることが可能である。
In this structural relaxation process, molecular dynamics calculation is continued until the amount of mutation of RMSD (Root Mean Square Deviation) of the entire structure becomes sufficiently small. Whether or not a sufficient amount of sampling has been performed can be determined based on whether or not the accumulated RMSD deviation is constant regardless of the number of divisions (Reblocking Analysis). (J. Chem. Phys. 91, 461, 1989)
The partial structure can be extracted by clustering. The clustering is not particularly limited, and a commonly used structure clustering method can be used. For example, after overlapping only the residues that exist in the space 5 [Å] around the drug binding space (to minimize RMSD), similar structures in the order of small RMSD and large overlap It is possible to sort by.

また、本工程においては、必要に応じて、かつ可能な限りにおいて、部分構造ではなく全体構造を同様のプロセスにより決定することとしてもよい。   In this step, the entire structure, not the partial structure, may be determined by a similar process as necessary and as much as possible.

本発明においては、さらに、上記のようにして得られた部分予測構造、例えば、代表触媒構造を用いて、薬物スクリーニングを行うことができる(図2)。薬物スクリーニングは、薬物候補化合物の結合可否を判定する工程を含む1次スクリーニングと、脱水和作用及び/又は構造変化を考慮した、薬物候補化合物の2次スクリーニングと、さらに薬物候補化合物の類似性クラスタリングとからなっていてもよい。   In the present invention, further, drug screening can be performed using the partially predicted structure obtained as described above, for example, a representative catalyst structure (FIG. 2). The drug screening includes a primary screening including a step of determining whether or not a drug candidate compound can be bound, a secondary screening of a drug candidate compound in consideration of dehydration action and / or structural change, and a similarity clustering of drug candidate compounds. It may consist of

特に限定されないが、薬物候補化合物の類似性クラスタリングは、Finger Printや、体積等を考慮して行うことができる。   Although not particularly limited, similarity clustering of drug candidate compounds can be performed in consideration of Finger Print, volume, and the like.

以下、実施例を挙げて本発明をさらに具体的に説明するが、本発明はこれらの実施例に何ら限定されるものではない。   EXAMPLES Hereinafter, although an Example is given and this invention is demonstrated further more concretely, this invention is not limited to these Examples at all.

実施例1:タンパク質予測構造の作成
Jarid1Bタンパク質のコアドメイン構造を、構造類似性の高いファミリータンパク質である1A、1C及び1Dのいずれも用いずに予測し、Structure-Based Drug Design(SBDD)に必要な立体構造を抽出した。
Example 1: Preparation of protein predicted structure
The core domain structure of Jarid1B protein was predicted without using any of the family proteins 1A, 1C, and 1D that have high structural similarity, and the three-dimensional structure required for Structure-Based Drug Design (SBDD) was extracted.

Jarid1Bのコアドメインのアミノ酸配列は、配列番号1に示される通りである(117塩基)であることが既に報告されている。   The amino acid sequence of the core domain of Jarid1B has already been reported to be as shown in SEQ ID NO: 1 (117 bases).

ここでBLASTを用いて、 PDBに登録されているタンパク質構造の中から、Jarid1Bのアミノ酸配列との相同性の高いタンパク質群を検索した。その中から比較的高い相同性を持つ複数のタンパク質の三次元構造を重ね合せ、配列、三次元構造共に重なりが高い部分はその三次元構造を採用した。   Here, using BLAST, a protein group having a high homology with the amino acid sequence of Jarid1B was searched from protein structures registered in the PDB. Among them, the three-dimensional structures of a plurality of proteins having relatively high homology were superimposed, and the three-dimensional structure was adopted for the portion where both the arrangement and the three-dimensional structure were high.

一方、重なりが低い部分に関しては、その重なりが低い参照配列のみを用いて同様に相同性の高いタンパク質を探索し、三次元構造を抽出した。この三次元構造を「部品」と呼ぶ。この過程によって、コアドメインの中で核となる比較的大きなタンパク質三次元構造と、小さな部品となる三次元部分構造を抽出することが可能となる。   On the other hand, with respect to the portion having a low overlap, a highly homologous protein was similarly searched using only a reference sequence having a low overlap, and a three-dimensional structure was extracted. This three-dimensional structure is called “component”. Through this process, it is possible to extract a relatively large protein three-dimensional structure as a nucleus and a three-dimensional partial structure as a small component in the core domain.

これらの大きなタンパク質三次元構造に対して、小さな部品の組合せにより、複数のタンパク質構造を作成した。この時点ではラマチャンドラン・プロットで禁制領域が多くても問題としないこととした。   With respect to these large protein three-dimensional structures, a plurality of protein structures were prepared by combining small parts. At this point, it was decided that there would be no problem if there were many forbidden areas in the Ramachandran plot.

次に、タンパク質構造の熱揺らぎシミュレートを、以下の通り行った。   Next, the thermal fluctuation simulation of the protein structure was performed as follows.

作成した予測構造を、分子動力学法を用いて生体内温度(310 [K])で揺らがせた。各予測構造に対して、タンパク質周囲に12 [Å]の緩衝水(TIP3P)を配置した。Energy Minimization法により構造を安定化させた後、ステップ幅0.0002 [ps]で500,000ステップかけてゆっくりと310 [K]まで昇温させた。その後、5,000,000ステップの構造トラジェクトリを蓄積した。この熱揺らぎの過程で十分な時間シミュレートすれば、一般的に不自然な三次元構造部分は消滅させることが可能である。   The created predicted structure was shaken at in-vivo temperature (310 [K]) using molecular dynamics method. For each predicted structure, 12 [Å] buffered water (TIP3P) was placed around the protein. After stabilizing the structure by the energy minimization method, the temperature was slowly raised to 310 [K] over 500,000 steps with a step width of 0.0002 [ps]. Later, 5,000,000 steps of structural trajectories were accumulated. If a sufficient time is simulated in the process of this thermal fluctuation, generally unnatural three-dimensional structure can be eliminated.

さらに、In Silico創薬のためのタンパク質構造の抽出を、以下の通り行った。   Furthermore, protein structure extraction for In Silico drug discovery was performed as follows.

それぞれの初期構造からシミュレートしたそれぞれの構造トラジェクトリを、その触媒部位周辺の残基の三次元配向でクラスタリングすることにより、SBDDに必要な立体構造を抽出した。   The three-dimensional structure required for SBDD was extracted by clustering each structural trajectory simulated from each initial structure based on the three-dimensional orientation of residues around the catalytic site.

試験例1:得られた予測構造の評価
上述した手法により得られた構造トラジェクトリから選ばれた平均的な触媒部位の構造と、X-線結晶解析により抽出された構造(PDB ID: 5A3N)との比較を図3に示した。また、先のトラジェクトリから触媒部位のアミノ酸のみで構造クラスタリングをかけて、SBDDに必須な代表的なタンパク質構造を抽出することに成功した。
Test Example 1: Evaluation of the Predicted Structure Obtained The structure of the average catalyst site selected from the structure trajectory obtained by the above-described method and the structure extracted by X-ray crystal analysis (PDB ID: 5A3N) A comparison of these is shown in FIG. In addition, we succeeded in extracting the representative protein structure essential for SBDD by applying structural clustering from the previous trajectory only with the amino acid at the catalytic site.

本発明により得られた予測構造と、X-線結晶解析により得られた立体構造とを比較すると、非常に類似した構造を抽出することに成功していることが判る。本発明により得られた予測構造においては生体内温度での分子運動が表現されているため、X-線結晶構造と比較して、ややアミノ酸残基間の距離、つまり触媒部位空間が少々広く観測されることと、残基の方向が少々異なる点も存在するが、その残基間の配向は維持されていた。本発明により得られるように、生体内温度での熱揺らぎを考慮した配座から複数の代表構造を抽出するほうが、SBDDにより現実の薬物相互作用を解析するには適していることが推測できる。本発明の構造予測手法は、ファミリータンパク質を用いずとも高精度にタンパク質構造を予測でき、in silico創薬においても非常に有益な手法であると考えられる。   When the predicted structure obtained by the present invention is compared with the three-dimensional structure obtained by X-ray crystal analysis, it can be seen that a very similar structure has been successfully extracted. In the predicted structure obtained by the present invention, molecular motion at in-vivo temperature is expressed, so the distance between amino acid residues, that is, the catalytic site space is slightly wider than the X-ray crystal structure. However, the orientation of the residues is slightly different, but the orientation between the residues is maintained. As obtained by the present invention, it can be inferred that the extraction of a plurality of representative structures from the conformation considering the thermal fluctuation at the in vivo temperature is more suitable for analyzing the actual drug interaction by SBDD. The structure prediction method of the present invention can predict a protein structure with high accuracy without using a family protein, and is considered to be a very useful method even in in silico drug discovery.

Claims (3)

タンパク質の部分立体構造を予測する方法であって、以下の工程を含む方法:
(1)予測対象タンパク質に対して高いアミノ酸配列相同性を有する、少なくとも二種の既知タンパク質の立体構造を互いに重複部分が最大となるように重ね合わせることにより、それぞれの立体構造が重複する部分と重複しない部分とを、それぞれ一以上ずつ決定する工程;
(2)工程(1)で決定された、立体構造が重複する各部分を、予測対象タンパク質の第一次予測部分構造として決定する工程;
(3)工程(1)で決定された、立体構造が重複しない各部分のアミノ酸配列について、それぞれ高い相同性を有する、少なくとも一種の既知タンパク質のアミノ酸部分配列を決定し、該既知タンパク質の立体構造のうち、該アミノ酸部分配列に対応する部分構造のそれぞれを、予測対象タンパク質の当該部分についての第一次予測部分構造候補として決定する工程;
(4)工程(1)で決定された第一次予測部分構造と、工程(3)で決定された第一次予測部分構造候補のそれぞれを互いに組み合わせることにより、第一次予測全体構造候補をそれぞれ決定する工程;及び
(5)工程(4)で決定された第一次予測全体構造候補それぞれに対して分子動力学計算を行い、最も各候補間で共通して安定な構造となっている部分構造を抽出し、該部分構造を予測対象タンパク質の第二次予測部分構造として決定する工程。
A method for predicting a partial three-dimensional structure of a protein, comprising the following steps:
(1) By overlapping the three-dimensional structures of at least two known proteins having high amino acid sequence homology with the protein to be predicted so that the overlapping portions are maximized with each other, Determining one or more non-overlapping parts;
(2) A step of determining each portion having a three-dimensional structure determined in step (1) as a primary predicted partial structure of a protein to be predicted;
(3) Determine the amino acid partial sequence of at least one kind of known protein having high homology with respect to the amino acid sequences of the respective parts that do not overlap in the three-dimensional structure determined in step (1), and determine the three-dimensional structure of the known protein Determining each of the partial structures corresponding to the amino acid partial sequence as a primary predicted partial structure candidate for that part of the protein to be predicted;
(4) By combining each of the primary predicted partial structure determined in step (1) and the primary predicted partial structure candidate determined in step (3) with each other, a primary predicted overall structure candidate is obtained. (5) The molecular dynamics calculation is performed for each of the primary predicted overall structure candidates determined in (5) and (4), and the most stable structure is the most common among the candidates. A step of extracting a partial structure and determining the partial structure as a second predicted partial structure of the protein to be predicted.
工程(5)における前記分子動力学計算によって、生体内における熱力学的挙動をシミュレーションする、請求項1に記載の方法。 The method according to claim 1, wherein thermodynamic behavior in a living body is simulated by the molecular dynamics calculation in step (5). 工程(5)における部分構造の抽出を、クラスタリングにより行う、請求項1又は2に記載の方法。 The method according to claim 1 or 2, wherein the extraction of the partial structure in the step (5) is performed by clustering.
JP2016058220A 2016-03-23 2016-03-23 Method for predicting partial cubic structure of protein Pending JP2017174057A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016058220A JP2017174057A (en) 2016-03-23 2016-03-23 Method for predicting partial cubic structure of protein

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016058220A JP2017174057A (en) 2016-03-23 2016-03-23 Method for predicting partial cubic structure of protein

Publications (1)

Publication Number Publication Date
JP2017174057A true JP2017174057A (en) 2017-09-28

Family

ID=59972029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016058220A Pending JP2017174057A (en) 2016-03-23 2016-03-23 Method for predicting partial cubic structure of protein

Country Status (1)

Country Link
JP (1) JP2017174057A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033753A (en) * 2018-06-07 2018-12-18 浙江工业大学 A kind of group's Advances in protein structure prediction based on the assembling of secondary structure segment
WO2024038700A1 (en) * 2022-08-16 2024-02-22 富士フイルム株式会社 Compound searching device, compound searching method, and compound searching program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033753A (en) * 2018-06-07 2018-12-18 浙江工业大学 A kind of group's Advances in protein structure prediction based on the assembling of secondary structure segment
CN109033753B (en) * 2018-06-07 2021-06-18 浙江工业大学 Group protein structure prediction method based on secondary structure fragment assembly
WO2024038700A1 (en) * 2022-08-16 2024-02-22 富士フイルム株式会社 Compound searching device, compound searching method, and compound searching program

Similar Documents

Publication Publication Date Title
Sadybekov et al. Computational approaches streamlining drug discovery
Pearce et al. Deep learning techniques have significantly impacted protein structure prediction and protein design
Pontén et al. The Human Protein Atlas—a tool for pathology
Lange et al. Resolution‐adapted recombination of structural features significantly improves sampling in restraint‐guided structure calculation
Ofran et al. Automated identification of complementarity determining regions (CDRs) reveals peculiar characteristics of CDRs and B cell epitopes
Lindert et al. EM-fold: De novo folding of α-helical proteins guided by intermediate-resolution electron microscopy density maps
Karpenko et al. Prediction of MHC class II binders using the ant colony search strategy
Joo et al. High accuracy template based modeling by global optimization
Zhang et al. Predicting linear B-cell epitopes by using sequence-derived structural and physicochemical features
JP2017174057A (en) Method for predicting partial cubic structure of protein
Erickson et al. Structure-guided expansion of kinase fragment libraries driven by support vector machine models
Liang et al. De novo protein design by an energy function based on series expansion in distance and orientation dependence
Karanicolas et al. The importance of explicit chain representation in protein folding models: An examination of Ising‐like models
CN105260626B (en) The full information Forecasting Methodology of protein structure space conformation
Wallach Pharmacophore inference and its application to computational drug discovery
Sun et al. Myofilament-associated proteins with intrinsic disorder (MAPIDs) and their resolution by computational modeling
Cortés-Cabrera et al. A reverse combination of structure-based and ligand-based strategies for virtual screening
CN100428254C (en) Cross reaction antigen computer-aided screening method
JP2020129270A (en) Pretreatment method for binding free energy calculation, preprocessing device, preprocessing program, and method for calculating binding free energy
Dror et al. Predicting nucleic acid binding interfaces from structural models of proteins
Zaki Protein-protein interaction prediction using homology and inter-domain linker region information
CN101710365A (en) Method for calculating and identifying protein kinase phosphorylation specific sites
He et al. Bioinformatics methods to predict allergen epitopes
CN111653310A (en) Method and device for predicting structure of polypeptide containing disulfide bond
Vlachakis Antibody Clustering and 3D Modeling for Neurodegenerative Diseases