JP2007058273A - Aggregate model evaluation device for evaluating aggregate model among plurality of polypeptides, aggregate model evaluation method and aggregate model evaluation program - Google Patents

Aggregate model evaluation device for evaluating aggregate model among plurality of polypeptides, aggregate model evaluation method and aggregate model evaluation program Download PDF

Info

Publication number
JP2007058273A
JP2007058273A JP2005239516A JP2005239516A JP2007058273A JP 2007058273 A JP2007058273 A JP 2007058273A JP 2005239516 A JP2005239516 A JP 2005239516A JP 2005239516 A JP2005239516 A JP 2005239516A JP 2007058273 A JP2007058273 A JP 2007058273A
Authority
JP
Japan
Prior art keywords
conjugate
model
index
dimensional structure
structure model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005239516A
Other languages
Japanese (ja)
Inventor
Takatsugu Hirokawa
貴次 広川
Kentaro Tomii
健太郎 富井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2005239516A priority Critical patent/JP2007058273A/en
Publication of JP2007058273A publication Critical patent/JP2007058273A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a technology for accurately evaluating adaptability of a solid structural model of an aggregate of a plurality of polypeptides. <P>SOLUTION: This aggregate model evaluation device 100 is provided with an aggregate model acquisition part 102 which acquires the solid structural model of the aggregate generated based on each solid structural model of the plurality of polypeptides, a selection part 140 which selects the solid structural model of the aggregate with a ZDOCK evaluation component, an adaptability evaluation part 142 which evaluates the adaptability of the solid structural model of the aggregate with a Verify 3D program and a Prosa 2003 program, and an output part 134 which outputs a comprehensive adaptability index. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、複数のポリペプチド同士の結合体モデルを評価する結合体モデル評価装置、結合体モデル評価方法および結合体モデル評価プログラムに関する。   The present invention relates to a conjugate model evaluation apparatus, a conjugate model evaluation method, and a conjugate model evaluation program for evaluating a conjugate model between a plurality of polypeptides.

タンパク質の立体構造はその機能に密接に関係しており、機能の分子基盤レベルでの理解には立体構造情報が必要である。また、既存の薬物のほとんどはタンパク質と相互作用しているため、その相互作用による結合体の結合形式を調べ、あるいは、新しい薬物となり得る低分子の化学構造を知るためにも、タンパク質の立体構造情報は必要である。タンパク質の立体構造を決定する手段としては、X線解析などの実験的手法と、分子シミュレーションなどの計算機的手法がある。   The three-dimensional structure of a protein is closely related to its function, and three-dimensional structure information is necessary for understanding the function at the molecular basis level. In addition, since most existing drugs interact with proteins, the three-dimensional structure of proteins can be used to investigate the binding mode of conjugates due to these interactions, or to know the chemical structure of small molecules that can become new drugs. Information is needed. As means for determining the three-dimensional structure of a protein, there are an experimental method such as X-ray analysis and a computer method such as molecular simulation.

このような計算機的手法によるタンパク質同士の結合予測に関する従来の結合部位予測装置としては、例えば特許文献1に記載されたものがある。同文献に記載された結合部位予測装置は、タンパク質または生理活性ポリペプチドのアミノ酸配列データから当該タンパク質または生理活性ポリペプチドの立体構造における各アミノ酸残基間の空間上の距離データを求め、当該距離データおよび各アミノ酸の電荷に従って静電的に不安定なアミノ酸残基を特定することにより結合部位を予測する。   An example of a conventional binding site prediction apparatus relating to protein-protein binding prediction by such a computer technique is disclosed in Patent Document 1, for example. The binding site prediction apparatus described in the same document obtains spatial distance data between amino acid residues in the three-dimensional structure of the protein or bioactive polypeptide from the amino acid sequence data of the protein or bioactive polypeptide, and calculates the distance. Binding sites are predicted by identifying electrostatically unstable amino acid residues according to the data and the charge of each amino acid.

また、計算機的手法によるタンパク質−化合物の結合体またはタンパク質−高分子の結合体の結合予測に関する従来の機能予測支援装置としては、例えば特許文献2に記載されたものもある。同文献に記載された機能予測支援装置は、個々のタンパク質について既知の文献や実験結果から得られる情報(活性部位の形状、静電ポテンシャル、疎水領域)などをDB(データベース)に格納し、このDBに格納された情報に基づいてタンパク質−化合物の結合体またはタンパク質−高分子の結合体の結合予測を行う。   Further, as a conventional function prediction support apparatus for predicting the binding of a protein-compound conjugate or a protein-polymer conjugate by a computer technique, for example, there is one described in Patent Document 2. The function prediction support apparatus described in the same document stores information (active site shape, electrostatic potential, hydrophobic region) and the like obtained from known documents and experimental results for individual proteins in a DB (database). Based on the information stored in the DB, the binding prediction of the protein-compound conjugate or the protein-polymer conjugate is performed.

また、計算機的手法によるタンパク質とリガンドとの相互作用を考慮した立体構造予測に関する従来の構造予測装置としては、例えば特許文献3に記載されたものもある。同文献に記載された構造予測装置は、リガンドが結合した状態での単鎖を含む複数鎖タンパク質を単純化のため全立体構造作成過程において、リガンドを原子種類に依存しない剛体として取り扱い、該当タンパク質の動的挙動を反映したパラメータと関数を用いて最適化することで、該当タンパク質とリガンドとの相互作用計算を考慮した立体構造予測を行う。   Moreover, as a conventional structure prediction apparatus regarding a three-dimensional structure prediction in consideration of the interaction between a protein and a ligand by a computer method, there is, for example, one described in Patent Document 3. The structure prediction apparatus described in this document treats a ligand as a rigid body that does not depend on the type of atoms in the process of creating a three-dimensional structure for simplification of a multi-chain protein including a single chain in a state in which the ligand is bound. By using parameters and functions that reflect the dynamic behavior of the protein, the three-dimensional structure prediction is performed in consideration of the calculation of the interaction between the protein and the ligand.

また、計算機的手法によるタンパク質同士の結合予測に関する従来の結合予測プログラムとしては、例えば非特許文献1に記載されたものもある。同文献に記載された結合予測プログラムは、ボストン大学のZhiping Wengグループによって開発されたZDOCKと呼ばれるタンパク質−タンパク質ドッキングシミュレーションソフトウェアである。ZDOCKではタンパク質を剛体として取り扱っている。そして、各分子の回転角をオイラー角として制御し、FFT処理することで、結合部位予測を行う。また、静電相互作用エネルギーとACE脱溶媒和エネルギーに基づいて、結合構造をランキングする。   Further, as a conventional binding prediction program related to protein binding prediction by a computer method, there is, for example, one described in Non-Patent Document 1. The binding prediction program described in this document is a protein-protein docking simulation software called ZDOCK developed by the Zhiping Weng group at Boston University. ZDOCK treats proteins as rigid bodies. Then, the binding site prediction is performed by controlling the rotation angle of each molecule as the Euler angle and performing FFT processing. In addition, bond structures are ranked based on electrostatic interaction energy and ACE desolvation energy.

特開2004−109053号公報JP 2004-109053 A 特開2004−152029号公報JP 2004-152029 A 特開2004−258814号公報JP 2004-258814 A Rong Chen and Zhiping Weng, “DockingUnbound Proteins Using Shape Complementarity, Desolvation, and Electrostatics”,PROTEINS: Structure, Function, and Genetics 47:281−294 (2002)Rong Chen and Zhiping Weng, “DockingUnbound Proteins Using Shape Complementarity, Desolvation, and Electrostatics”, PROTEINS: Structure, Function, and Genetics 47: 281−294 (2002)

しかしながら、上記文献記載の従来技術は、以下の点で改善の余地を有していた。
第一に、特許文献1に記載された結合部位予測装置は、タンパク質の中で不安定な部分は、結合によって安定化する可能性を秘めているので結合しやすいという前提に立っているが、タンパク質の中で不安定な部分であっても必ずしも他のタンパク質などと結合しやすいとは限らないため、予測・評価の精度の面で改善の余地があった。また、特許文献1に記載された結合部位予測装置は、活性部位予測(いわゆるタンパク質同士の糊代に相当する部位の予測情報)を提供するにとどまり、タンパク質同士の結合体モデルの妥当性を評価することが困難であった。
However, the prior art described in the above literature has room for improvement in the following points.
First, the binding site prediction apparatus described in Patent Document 1 is based on the premise that an unstable portion in a protein is likely to be bound because it has the possibility of being stabilized by binding. Even if the protein is unstable, it is not always easy to bind to other proteins, so there is room for improvement in terms of prediction and evaluation accuracy. In addition, the binding site prediction apparatus described in Patent Document 1 only provides active site prediction (prediction information of a site corresponding to the so-called glue margin between proteins), and evaluates the validity of a protein conjugate model. It was difficult to do.

第二に、特許文献2に記載された機能予測支援装置においては、DB(データベース)に格納された情報(活性部位の形状、静電ポテンシャル、疎水領域)は、個々のタンパク質についての情報である。このため、これらの情報に基づいてタンパク質−化合物の結合体またはタンパク質−高分子の結合体のドッキング後の状態についての精度良い情報を得ることが困難であり、予測・評価の精度の面で改善の余地があった。   Second, in the function prediction support apparatus described in Patent Document 2, information (active site shape, electrostatic potential, hydrophobic region) stored in a DB (database) is information about individual proteins. . For this reason, it is difficult to obtain accurate information about the state after docking of the protein-compound conjugate or protein-polymer conjugate based on this information, which improves the accuracy of prediction and evaluation. There was room for.

第三に、特許文献3に記載された構造予測装置は、単純化のため全立体構造作成過程において、リガンドが結合した状態での単鎖を含む複数鎖タンパク質を、リガンドを原子種類に依存しない剛体として取り扱う。すなわち、リガンド分子を構成する原子が電気的極性を持たない平均的な原子半径を持つ剛体として扱うため、タンパク質−リガンド結合予測の際に用いる情報の種類が限定され、予測・評価の精度の面で改善の余地があった。   Third, the structure prediction apparatus described in Patent Document 3 is a multi-chain protein including a single chain in a state in which a ligand is bound in a process for creating an entire three-dimensional structure for simplification, and the ligand is not dependent on the atomic type. Treat as a rigid body. In other words, since the atoms constituting the ligand molecule are treated as rigid bodies having an average atomic radius with no electrical polarity, the types of information used for protein-ligand bond prediction are limited, and the accuracy of prediction and evaluation is limited. There was room for improvement.

第四に、非特許文献1に記載された結合予測プログラムは、形状相補性と静電相互作用エネルギーとACE脱溶媒和エネルギーとに基づいて、タンパク質−タンパク質ドッキングシミュレーションを行っているが、予測・評価の精度の面で未だ改善の余地があった。   Fourth, the binding prediction program described in Non-Patent Document 1 performs protein-protein docking simulation based on shape complementarity, electrostatic interaction energy, and ACE desolvation energy. There was still room for improvement in terms of evaluation accuracy.

本発明は上記事情に鑑みてなされたものであり、複数のポリペプチド同士の結合体の立体構造モデルの適合性を精度良く評価する技術を提供することを目的とする。   The present invention has been made in view of the above circumstances, and an object thereof is to provide a technique for accurately evaluating the suitability of a three-dimensional structure model of a conjugate of a plurality of polypeptides.

本発明によれば、複数のポリペプチド同士の結合体モデルを評価する結合体モデル評価装置であって、複数のポリペプチドの各々の立体構造モデルに基づいて生成された、結合体の立体構造モデルを取得する結合体モデル取得部と、結合体の立体構造モデルにおけるアミノ酸残基ごとの周辺極性度およびアミノ酸残基ごとの側鎖の溶媒露出度に基づいて、結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成する環境適合性評価部と、結合体の立体構造モデルにおけるアミノ酸残基ペアごとの距離依存型ポテンシャルエネルギーに基づいて、結合体の立体構造モデル全体の距離依存型ポテンシャルエネルギー指標を生成する距離依存型ポテンシャルエネルギー評価部と、結合体の立体構造モデルの環境適合性指標および距離依存型ポテンシャルエネルギー指標に基づいて、結合体の立体構造モデルの総合適合性指標を生成する総合適合性評価部と、総合適合性指標を出力する出力部と、を備えることを特徴とする結合体モデル評価装置が提供される。   According to the present invention, there is provided a conjugate model evaluation apparatus for evaluating a conjugate model of a plurality of polypeptides, which is generated based on the three-dimensional structure model of each of the plurality of polypeptides. And the water solubility of the entire three-dimensional structure model of the conjugate based on the peripheral polarity for each amino acid residue and the degree of solvent exposure of the side chain for each amino acid residue in the three-dimensional structure model of the conjugate. The environmental conformity assessment unit that generates an environmental compatibility index for the sex and internal environment of the protein, and the distance-dependent potential energy for each amino acid residue pair in the conformational model of the conjugate, A distance-dependent potential energy evaluation unit that generates a distance-dependent potential energy index, and a ring of a three-dimensional structure model of a conjugate A comprehensive suitability evaluation unit that generates a comprehensive suitability index of the three-dimensional structure model of the conjugate based on the suitability index and the distance-dependent potential energy index; and an output unit that outputs the comprehensive suitability index. A combined model evaluation device is provided.

この構成によれば、通常はポリペプチド単体の立体構造の評価に用いられる環境適合性および距離依存型ポテンシャルエネルギーを、結合体の立体構造モデル全体について評価し、これらに基づいて結合体の立体構造モデルの適合性を評価するため、複数のポリペプチド同士の結合体の立体構造モデルの適合性を精度良く評価することができる。   According to this configuration, the environmental compatibility and distance-dependent potential energy normally used for evaluating the three-dimensional structure of a single polypeptide are evaluated for the entire three-dimensional structure model of the conjugate, and based on these, the three-dimensional structure of the conjugate is evaluated. Since the suitability of the model is evaluated, the suitability of the three-dimensional structure model of a conjugate of a plurality of polypeptides can be accurately evaluated.

本発明によれば、複数のポリペプチド同士の結合体モデルを評価する結合体モデル評価装置であって、複数のポリペプチドの各々の立体構造モデルに基づいて生成された、複数の結合体の立体構造モデルを取得する結合体モデル取得部と、結合体の立体構造モデルにおける各々のポリペプチド同士の構造相補性に基づいて、結合体の構造相補性指標を生成する構造相補性評価部と、複数の結合体の立体構造モデルから、構造相補性指標が閾値以上である結合体の立体構造モデルを選択する結合体モデル選択部と、選択された結合体の立体構造モデルにおけるアミノ酸残基ごとの周辺極性度およびアミノ酸残基ごとの側鎖の溶媒露出度に基づいて、結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成する環境適合性評価部と、選択された結合体の立体構造モデル全体の距離依存型ポテンシャルエネルギー指標を生成する距離依存型ポテンシャルエネルギー評価部と、選択された結合体の立体構造モデルの環境適合性指標および距離依存型ポテンシャルエネルギー指標に基づいて、選択された結合体の立体構造モデルの総合適合性指標を生成する総合適合性評価部と、総合適合性指標を出力する出力部と、を備えることを特徴とする結合体モデル評価装置が提供される。   According to the present invention, there is provided a conjugate model evaluation apparatus for evaluating a conjugate model of a plurality of polypeptides, and a plurality of conjugate solids generated on the basis of the three-dimensional structure model of each of the plurality of polypeptides. A combination model acquisition unit for acquiring a structural model, a structural complementarity evaluation unit for generating a structural complementarity index of the conjugate based on the structural complementarity of each polypeptide in the three-dimensional structure model of the conjugate, and a plurality of A conjugate model selection unit for selecting a conjugate model having a structural complementarity index greater than or equal to a threshold value from the three-dimensional model of the conjugate of the conjugate, and a periphery for each amino acid residue in the stereostructure model of the selected conjugate Generates an environmental compatibility indicator for the water solubility of the entire conformational model of the conjugate and the internal environment of the protein based on the degree of polarity and solvent exposure of the side chain for each amino acid residue Environmental suitability evaluation unit, distance-dependent potential energy evaluation unit that generates a distance-dependent potential energy index for the entire three-dimensional model of the selected conjugate, and environmental suitability of the three-dimensional model of the selected conjugate A total suitability evaluation unit that generates a total suitability index of the three-dimensional structure model of the selected conjugate based on the index and the distance-dependent potential energy index; and an output unit that outputs the total suitability index A combined body model evaluation apparatus is provided.

この構成によれば、各々のポリペプチド同士の構造相補性に基づいて、構造相補性が所定の水準以上である結合体の立体構造モデルを選択し、選択された結合体の立体構造モデル全体について環境適合性および距離依存型ポテンシャルエネルギーを評価し、これらに基づいて結合体の立体構造モデルの適合性を評価するため、複数のポリペプチド同士の結合体の立体構造モデルの適合性を精度良く評価することができる。   According to this configuration, based on the structural complementarity between the polypeptides, a three-dimensional structure model of a conjugate whose structural complementarity is equal to or higher than a predetermined level is selected, and the whole three-dimensional structure model of the selected conjugate is selected. In order to evaluate environmental compatibility and distance-dependent potential energy, and to evaluate the conformity of the three-dimensional structure model of the conjugate based on these, accurately evaluate the conformity of the three-dimensional structure model of the conjugate between multiple polypeptides. can do.

なお、上記の装置は本発明の一態様であり、本発明の装置は、以上の構成要素の任意の組合せであってもよい。また、本発明の結合体モデル評価方法、結合体モデル評価システム、結合体モデル評価プログラム、記録媒体なども、同様の構成を有する。   Note that the above-described device is one embodiment of the present invention, and the device of the present invention may be any combination of the above components. Also, the conjugate model evaluation method, the conjugate model evaluation system, the conjugate model evaluation program, the recording medium, etc. of the present invention have the same configuration.

なお、本発明において、ポリペプチドとは、タンパク質を含む物質であるものとする。   In the present invention, a polypeptide is a substance containing a protein.

本発明によれば、通常はポリペプチド単体の立体構造の評価に用いられる環境適合性および距離依存型ポテンシャルエネルギーを、結合体の立体構造モデル全体について評価し、これに基づいて結合体の立体構造モデルの適合性を評価するため、複数のポリペプチド同士の結合体の立体構造モデルの適合性を精度良く評価することができる。   According to the present invention, the environmental compatibility and the distance-dependent potential energy normally used for evaluating the three-dimensional structure of a single polypeptide are evaluated for the entire three-dimensional structure model of the conjugate, and based on this, the three-dimensional structure of the conjugate is evaluated. Since the suitability of the model is evaluated, the suitability of the three-dimensional structure model of a conjugate of a plurality of polypeptides can be accurately evaluated.

本発明において、上述の環境適合性評価部は、さらにアミノ酸残基の形成する2次構造に基づいて、結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成してもよい。   In the present invention, the environmental compatibility evaluation unit further generates an environmental compatibility index for the water solubility of the entire three-dimensional structure model of the conjugate and the internal environment of the protein based on the secondary structure formed by the amino acid residue. Also good.

この構成によれば、アミノ酸残基ごとの周辺極性度およびアミノ酸残基ごとの側鎖の溶媒露出度にくわえて、さらにアミノ酸残基の形成する2次構造に基づいて環境適合性を評価することができるので、複数のポリペプチド同士の結合体の立体構造モデルの適合性の評価精度が向上する。   According to this configuration, in addition to the peripheral polarity for each amino acid residue and the degree of solvent exposure of the side chain for each amino acid residue, environmental compatibility is evaluated based on the secondary structure formed by the amino acid residue. Therefore, the accuracy of evaluating the conformity of the three-dimensional structure model of a conjugate of a plurality of polypeptides is improved.

また、本発明において、上述の結合体モデル評価装置は、結合体の立体構造モデルにおける各々のポリペプチド同士の構造相補性に基づいて、結合体の構造相補性指標を生成する構造相補性評価部をさらに備えてもよく、上述の総合適合性評価部は、さらに構造相補性指標に基づいて、総合適合性指標を生成してもよい。   In the present invention, the above-described conjugate model evaluation apparatus includes a structural complementarity evaluation unit that generates a structural complementarity index of a conjugate based on the structural complementarity between the polypeptides in the three-dimensional structure model of the conjugate. The comprehensive suitability evaluation unit described above may further generate a comprehensive suitability index based on the structural complementarity index.

この構成によれば、環境適合性および距離依存型ポテンシャルエネルギーにくわえて、さらに構造相補性を評価することができるので、複数のポリペプチド同士の結合体における立体構造モデルの適合性の評価精度が向上する。   According to this configuration, in addition to environmental compatibility and distance-dependent potential energy, structural complementarity can be further evaluated. Therefore, the accuracy of evaluating the conformity of the three-dimensional model in a conjugate of a plurality of polypeptides can be improved. improves.

また、本発明において、上述の構造相補性評価部は、各々のポリペプチド同士の形状相補性と、各々のポリペプチド同士の脱溶媒和と、各々のポリペプチド同士の静電相互作用と、に基づいて、結合体の構造相補性指標を生成してもよい。   Further, in the present invention, the structural complementarity evaluation unit described above includes the shape complementarity between the polypeptides, the desolvation between the polypeptides, and the electrostatic interaction between the polypeptides. Based on this, a structural complementarity index of the conjugate may be generated.

この構成によれば、上述の構造相補性評価部は、ポリペプチド同士の形状相補性と、各々のポリペプチド同士の脱溶媒和と、各々のポリペプチド同士の静電相互作用と、の3種類の特性により構造相補性を評価するため、複数のポリペプチド同士の結合体における立体構造モデルの構造相補性の評価精度が向上する。   According to this configuration, the above-described structural complementarity evaluation unit has three types of shape complementarity between polypeptides, desolvation between the polypeptides, and electrostatic interaction between the polypeptides. Since the structural complementarity is evaluated based on the above characteristics, the accuracy of evaluating the structural complementarity of the three-dimensional structure model in a conjugate of a plurality of polypeptides is improved.

また、本発明において、上述の結合体モデル評価装置は、各々のポリペプチドのアミノ酸残基のうち、他のポリペプチドとの結合に関与するアミノ酸残基を規定する既知の結合関与情報を取得する結合関与情報取得部と、各々のポリペプチドの立体構造モデルの既知の結合関与情報に基づいて、結合体の立体構造モデル全体における結合関与指標を生成する結合関与指標生成部と、をさらに備え、上述の総合適合性評価部は、さらに結合関与指標に基づいて、総合適合性指標を生成してもよい。   In the present invention, the above-described conjugate model evaluation apparatus acquires known binding participation information that defines amino acid residues involved in binding to other polypeptides among the amino acid residues of each polypeptide. A binding participation information acquisition unit; and a binding participation index generation unit that generates a binding participation index in the entire three-dimensional structure model of the conjugate based on the known binding participation information of the three-dimensional structure model of each polypeptide. The total suitability evaluation unit described above may further generate a comprehensive suitability index based on the binding participation index.

この構成によれば、上述の総合適合性評価部は、さらに結合関与指標に基づいて総合適合性を評価するため、既知の情報を有効に利用することができ、複数のポリペプチド同士の結合体の立体構造モデルの適合性の評価精度が向上する。   According to this configuration, since the above-described comprehensive compatibility evaluation unit further evaluates the comprehensive compatibility based on the binding participation index, it is possible to effectively use known information, and a conjugate of a plurality of polypeptides. The accuracy of evaluating the conformity of the three-dimensional structure model is improved.

また、本発明において、上述の結合体モデル評価装置は、複数のポリペプチドの各々の立体構造モデルを取得する各々モデル取得部と、複数のポリペプチドの各々の立体構造モデルに基づいて、結合体の立体構造モデルを生成する結合体モデル生成部と、をさらに備えてもよい。   Further, in the present invention, the conjugate model evaluation apparatus includes a model acquisition unit that acquires each of the three-dimensional structure models of a plurality of polypeptides, and a conjugate based on each of the three-dimensional structure models of the plurality of polypeptides. And a combined model generation unit that generates the three-dimensional structure model.

この構成によれば、複数のポリペプチドの各々の立体構造モデルを取得した場合にも、これらのポリペプチドの結合体の立体構造モデルを生成することにより、複数のポリペプチド同士の結合体の立体構造モデルの適合性を評価することができる。   According to this configuration, even when a three-dimensional structure model of each of a plurality of polypeptides is obtained, a three-dimensional structure model of a conjugate of these polypeptides is generated, so that a three-dimensional structure of a conjugate of a plurality of polypeptides can be obtained. The suitability of the structural model can be evaluated.

また、本発明において、上述の結合体モデル評価装置は、複数のポリペプチドの各々のアミノ酸配列を規定する情報を取得する各々配列取得部と、複数のポリペプチドの各々のアミノ酸配列を規定する情報に基づいて、複数のポリペプチドの各々の立体構造モデルを生成する単独モデル生成部と、をさらに備えてもよい。   Further, in the present invention, the conjugate model evaluation apparatus described above includes a sequence acquisition unit that acquires information that specifies each amino acid sequence of a plurality of polypeptides, and information that specifies each amino acid sequence of the plurality of polypeptides. And a single model generation unit for generating a three-dimensional structure model of each of the plurality of polypeptides.

この構成によれば、複数のポリペプチドの各々のアミノ酸配列を規定する情報を取得した場合にも、これらのアミノ酸配列から複数のポリペプチドの各々の立体構造モデルを生成することにより、複数のポリペプチド同士の結合体の立体構造モデルの適合性を評価することができる。   According to this configuration, even when information defining each amino acid sequence of a plurality of polypeptides is acquired, a plurality of polypeptides are generated by generating a three-dimensional structure model of each of the plurality of polypeptides from these amino acid sequences. The suitability of the three-dimensional structure model of the conjugate between peptides can be evaluated.

また、本発明において、上述の総合適合性評価部は、結合体の立体構造モデルの各指標をそれぞれ正規化し、正規化された各指標に基づいて、結合体の立体構造モデルの総合適合性指標を生成してもよい。   Further, in the present invention, the total suitability evaluation unit described above normalizes each index of the three-dimensional structure model of the conjugate, and based on each normalized index, the general suitability index of the three-dimensional structure model of the conjugate May be generated.

この構成によれば、各指標をそれぞれ正規化しているため、各指標について同次元で扱うことができ、各指標を合成して総合適合性指標を生成することができる。   According to this configuration, since each index is normalized, it is possible to handle each index in the same dimension, and it is possible to generate a comprehensive suitability index by synthesizing each index.

以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. In all the drawings, the same reference numerals are given to the same components, and the description will be omitted as appropriate.

<実施形態1>
図1は、実施形態1に係る結合体モデル評価装置の構成を示した機能ブロック図である。結合体モデル評価装置100は、複数のポリペプチド同士の結合体モデルを評価する装置である。結合体モデル評価装置100は、例えば、図17〜図19にて後述するように、タンパク質−タンパク質のドッキング構造の予測コンテスト「CAPRI(Critical Assessment of PRediction of Interactions)」の出題テーマのように、複数のポリペプチドの各々の立体構造モデルが提供された場合に、結合体の立体構造モデルの予測に用いることを目的とする。
<Embodiment 1>
FIG. 1 is a functional block diagram illustrating a configuration of a combined body model evaluation apparatus according to the first embodiment. The conjugate model evaluation apparatus 100 is an apparatus that evaluates a conjugate model of a plurality of polypeptides. For example, as described later in FIGS. 17 to 19, the conjugate model evaluation apparatus 100 includes a plurality of themes as shown in the theme of the prediction contest “CAPRI (Critical Assessment of Pedition of Interactions)” of the protein-protein docking structure. When a three-dimensional structure model of each polypeptide is provided, it is intended to be used for prediction of a three-dimensional structure model of a conjugate.

すなわち、結合体の立体構造モデルの評価に計算機的手法を利用して、結合体モデル評価装置100によりドッキング解析を行い、結合体の立体構造モデルを精度良く評価することを目的とする。   That is, an object of the present invention is to perform a docking analysis by the conjugate model evaluation apparatus 100 by using a computer method for evaluating the three-dimensional structure model of the conjugate, and to accurately evaluate the three-dimensional model of the conjugate.

結合体モデルを外部で生成する場合、結合体モデル評価装置100には、結合体モデル取得部102が設けられている。結合体モデル取得部102は、複数のポリペプチドの各々の立体構造モデル(例えば、レセプターの立体構造モデルおよびリガンドの立体構造モデル)に基づいて任意のプログラムで生成された、複数の結合体の立体構造モデル(例えば、レセプター−リガンド複合体の立体構造モデル)を外部から取得する。こうして取得された結合体の立体構造モデルは、結合体モデル記憶部104に格納される。   When the combined body model is generated outside, the combined body model evaluation apparatus 100 includes a combined body model acquisition unit 102. The conjugate model acquisition unit 102 generates a three-dimensional structure of a plurality of conjugates generated by an arbitrary program based on the three-dimensional structure model (for example, the receptor three-dimensional structure model and the ligand three-dimensional structure model) of the plurality of polypeptides. A structural model (for example, a three-dimensional structure model of a receptor-ligand complex) is acquired from the outside. The three-dimensional structure model of the combined body acquired in this way is stored in the combined body model storage unit 104.

一方、結合体モデル評価装置100には、外部データベースなどに接続する結合関与情報取得部114が設けられている。結合関与情報取得部114は、各々のポリペプチドのアミノ酸残基のうち、他のポリペプチドとの結合に関与するアミノ酸残基を規定する既知の結合関与情報(例えば、文献公知情報または公知の実験データなど)を取得する。こうして取得された既知の結合関与情報は、結合関与情報記憶部116に格納される。   On the other hand, the combined body model evaluation apparatus 100 is provided with a combined participation information acquisition unit 114 connected to an external database or the like. The binding involvement information acquisition unit 114 is known binding involvement information (for example, literature known information or known experiment) that defines amino acid residues involved in binding to other polypeptides among amino acid residues of each polypeptide. Data). The known binding participation information acquired in this way is stored in the binding participation information storage unit 116.

結合体モデル評価装置100には、ZDOCKをはじめとするドッキング予測プログラムを含む選択部140が設けられている。選択部140は、複数の結合体の立体構造モデルから、所定の基準を満たす結合体の立体構造モデルを選択する。   The combined body model evaluation apparatus 100 is provided with a selection unit 140 including a docking prediction program such as ZDOCK. The selection unit 140 selects a three-dimensional structure model of a combined body that satisfies a predetermined criterion from a plurality of three-dimensional structure models of the combined body.

選択部140には、構造相補性評価部106が設けられている。構造相補性評価部106は、図4にて後述するように、結合体の立体構造モデルにおける各々のポリペプチド同士の構造相補性に基づいて、構造相補性指標を生成する。なお、構造相補性指標とは、結合体を構成するポリペプチド同士の構造の相補性の程度を示すスコアである。   The selection unit 140 includes a structural complementarity evaluation unit 106. As will be described later with reference to FIG. 4, the structural complementarity evaluation unit 106 generates a structural complementarity index based on the structural complementarity between the polypeptides in the three-dimensional structure model of the conjugate. The structural complementarity index is a score indicating the degree of structural complementarity between the polypeptides constituting the conjugate.

より詳しくは、構造相補性評価部106は、各々のポリペプチド同士の形状相補性と、各々のポリペプチド同士の脱溶媒和と、各々のポリペプチド同士の静電相互作用と、に基づいて、結合体の構造相補性指標を生成する。   More specifically, the structural complementarity evaluation unit 106 is based on the shape complementarity between the polypeptides, the desolvation between the polypeptides, and the electrostatic interaction between the polypeptides. Generate a structural complementarity indicator for the conjugate.

例えば、選択部140の構造相補性評価部106は、ZDOCKをはじめとするドッキング予測プログラムの評価コンポーネントなどを含んでもよい。ZDOCKは、ボストン大学で開発された、タンパク質形状の相補性、脱溶媒和、静電相互作用に基づくタンパク質ドッキングプログラムであり、URLとしてhttp://zlab.bu.edu/zdock/から入手可能である。   For example, the structural complementarity evaluation unit 106 of the selection unit 140 may include an evaluation component of a docking prediction program such as ZDOCK. ZDOCK is a protein docking program based on protein shape complementation, desolvation, and electrostatic interaction, developed at Boston University. The URL is http: // zlab. bu. Available from edu / zdock /.

ZDOCKは、タンパク質形状の相補性、脱溶媒和、静電相互作用に基づいて各々のタンパク質の結合体モデルを生成するドッキングコンポーネントと、生成した結合体モデルの適合性を、タンパク質形状の相補性、脱溶媒和、静電相互作用に基づいて評価する評価コンポーネントとを含むプログラムである。   ZDOCK is a component that generates a binding model of each protein based on protein shape complementarity, desolvation, electrostatic interaction, and compatibility of the generated binding model. A program including a desolvation and an evaluation component for evaluation based on electrostatic interaction.

ZDOCKでは、タンパク質を剛体として取り扱い、各分子の回転角をオイラー角として制御し、FFT処理することで、図4で後述するように、各々のポリペプチド同士の形状相補性に基づいて結合部位予測を行う。なお、構造相補性指標とは、ZDOCKの評価コンポーネントの生成するランクに相当する。   In ZDOCK, a protein is treated as a rigid body, the rotation angle of each molecule is controlled as an Euler angle, and FFT processing is performed. As described later in FIG. I do. The structural complementarity index corresponds to the rank generated by the evaluation component of ZDOCK.

また、ZDOCKの評価コンポーネントでは、図4にて後述するように、形状相補性に加えて、さらに静電相互作用エネルギーおよびACE脱溶媒和エネルギーに基づいて、結合構造を構造相補性指標によりランキングする。このようにして得られた構造相補性指標は、構造相補性指標記憶部108に格納される。   In addition, as will be described later with reference to FIG. 4, in the ZDOCK evaluation component, in addition to the shape complementarity, the binding structure is ranked by the structural complementarity index based on the electrostatic interaction energy and the ACE desolvation energy. . The structural complementarity index obtained in this way is stored in the structural complementarity index storage unit 108.

また、選択部140には、結合体モデル選択部110が設けられている。結合体モデル選択部110は、複数の結合体の立体構造モデルから、構造相補性指標が閾値以上である結合体の立体構造モデルを選択する。   The selection unit 140 is provided with a combined model selection unit 110. The conjugate model selection unit 110 selects a three-dimensional structure model of a conjugate whose structural complementarity index is equal to or greater than a threshold value from a plurality of three-dimensional structure models of the conjugate.

例えば、ZDOCKの評価コンポーネントによる構造相補性指標が所定の値以上であるか、あるいは構造相補性指標が上位から数えて所定数以内に入る結合体の立体構造モデルを選択する。さらに詳細な一例としては、ZDOCKによる構造相補性指標が上位から数えて2000以内の結合体の立体構造モデル(候補複合体形成状態)を選択してもよい。このようにして選択された結合体の立体構造モデルは、選択結合体モデル記憶部112に格納される。   For example, a three-dimensional structure model of a conjugate in which the structural complementarity index by the evaluation component of ZDOCK is greater than or equal to a predetermined value, or the structural complementarity index is within a predetermined number from the top is selected. As a more detailed example, a three-dimensional structure model (candidate complex formation state) of a conjugate whose structural complementarity index by ZDOCK is 2000 or less from the top may be selected. The three-dimensional structure model of the combined body selected in this way is stored in the selected combined body model storage unit 112.

結合体モデル評価装置100には、適合性評価部142が設けられている。適合性評価部142は、図2にて後述するように、選択された結合体の立体構造モデルの適合性を評価する。適合性評価部142は、例えば、Verify 3DおよびProsa 2003を組み合わせてなるCQSという立体構造予測プログラムを含む。   The combined body model evaluation apparatus 100 is provided with a conformity evaluation unit 142. As will be described later with reference to FIG. 2, the suitability evaluation unit 142 evaluates the suitability of the three-dimensional structure model of the selected combined body. The conformity evaluation unit 142 includes, for example, a three-dimensional structure prediction program called CQS formed by combining Verify 3D and Prosa 2003.

適合性評価部142には、環境適合性評価部118が設けられている。環境適合性評価部118は、図6にて後述するように、選択された結合体の立体構造モデルにおけるアミノ酸残基ごとの周辺極性度およびアミノ酸残基ごとの側鎖の溶媒露出度に基づいて、結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成する。環境適合性評価部118は、例えば、Verify 3Dという立体構造評価プログラムを含む。こうして得られた環境適合性指標は、環境適合性指標記憶部120に格納される。   The suitability evaluation unit 142 is provided with an environment suitability evaluation unit 118. As will be described later with reference to FIG. 6, the environmental compatibility evaluation unit 118 is based on the degree of peripheral polarity for each amino acid residue and the degree of solvent exposure of the side chain for each amino acid residue in the three-dimensional structure model of the selected conjugate. Generate an index of water compatibility of the entire three-dimensional model of the conjugate and an environmental compatibility index for the protein internal environment. The environmental suitability evaluation unit 118 includes, for example, a 3D structure evaluation program called Verify 3D. The environmental suitability index obtained in this way is stored in the environmental suitability index storage unit 120.

また、適合性評価部142には、距離依存型ポテンシャルエネルギー評価部122が設けられている。距離依存型ポテンシャルエネルギー評価部122は、図8および図9にて後述するように、選択された結合体の立体構造モデルにおけるアミノ酸残基ペアごとの距離依存型ポテンシャルエネルギーに基づいて、選択された結合体の立体構造モデル全体の距離依存型ポテンシャルエネルギー指標を生成する。距離依存型ポテンシャルエネルギー評価部122は、例えば、Prosa 2003という立体構造評価プログラムを含む。こうして得られた距離依存型ポテンシャルエネルギー指標は、距離依存型ポテンシャルエネルギー指標記憶部124に格納される。   The compatibility evaluation unit 142 is provided with a distance-dependent potential energy evaluation unit 122. The distance-dependent potential energy evaluation unit 122 is selected based on the distance-dependent potential energy for each amino acid residue pair in the three-dimensional structure model of the selected conjugate, as will be described later with reference to FIGS. A distance-dependent potential energy index for the entire three-dimensional structure model of the conjugate is generated. The distance-dependent potential energy evaluation unit 122 includes, for example, a three-dimensional structure evaluation program called Prosa 2003. The distance-dependent potential energy index thus obtained is stored in the distance-dependent potential energy index storage unit 124.

また、適合性評価部142には、結合関与指標生成部126が設けられている。結合関与指標生成部126は、図11にて後述するように、上述の結合関与情報取得部114により取得された、各々のポリペプチドの立体構造モデルの既知の結合関与情報に基づいて、結合体の立体構造モデル全体における結合関与指標(結合に関与することが知られているアミノ酸残基同士のコンタクト数など)を生成する。こうして得られた結合関与指標は、結合関与指標記憶部128に格納される。   In addition, the compatibility evaluation unit 142 is provided with a coupling participation index generation unit 126. As described later with reference to FIG. 11, the binding participation index generation unit 126 is based on the known binding participation information of the three-dimensional structure model of each polypeptide acquired by the above-described binding participation information acquisition unit 114. A binding participation index (such as the number of contacts between amino acid residues known to be involved in binding) in the entire three-dimensional structure model is generated. The coupling participation index obtained in this way is stored in the coupling participation index storage unit 128.

また、適合性評価部142には、総合適合性評価部130が設けられている。総合適合性評価部130は、環境適合性評価部118由来の環境適合性指標、距離依存型ポテンシャルエネルギー評価部122由来の距離依存型ポテンシャルエネルギー指標、結合関与指標生成部126由来の結合関与指標、あるいは構造相補性評価部106由来の構造相補性指標などに基づいて、結合体の立体構造モデルの総合適合性指標を生成する。なお、総合適合性指標を得るための各指標の正規化方法および計算方法については、詳しくは後述する。こうして得られた総合適合性指標は、総合適合性指標記憶部132に格納される。   In addition, the suitability evaluation unit 142 is provided with a comprehensive suitability evaluation unit 130. The comprehensive compatibility evaluation unit 130 includes an environmental compatibility index derived from the environmental compatibility evaluation unit 118, a distance dependent potential energy index derived from the distance dependent potential energy evaluation unit 122, a binding participation index derived from the coupling participation index generation unit 126, Alternatively, based on the structural complementarity index derived from the structural complementarity evaluation unit 106, an overall compatibility index of the three-dimensional structure model of the conjugate is generated. The normalization method and calculation method of each index for obtaining the comprehensive suitability index will be described later in detail. The comprehensive suitability index thus obtained is stored in the comprehensive suitability index storage unit 132.

結合体モデル評価装置100には、出力部134が設けられている。適合性評価部142による評価結果(総合適合性指標)は、出力部134を介して外部に出力される。   The combined body model evaluation apparatus 100 is provided with an output unit 134. The evaluation result (total compatibility index) by the suitability evaluation unit 142 is output to the outside via the output unit 134.

図2は、実施形態1における結合体の立体構造モデルの評価方法について説明するための概念図である。図2に示すように、結合体モデル評価装置100では、ZDOCKのドッキングコンポーネントによって生成された結合モデルについて、ZDOCKの評価コンポーネントにより構造適合性に基づいて結合体の立体構造モデルが選択される。そして、環境適合性(Verify 3Dによる指標)および距離依存型ポテンシャルエネルギー(Prosa 2003による指標)などの指標を、結合体の立体構造モデル全体について評価する。なお、通常は、Verify 3DおよびProsa 2003は、ポリペプチド単体の立体構造の評価に用いられるが、本実施形態では、結合体の立体構造モデル全体についての評価に用いている。   FIG. 2 is a conceptual diagram for explaining a method for evaluating a three-dimensional structure model of a combined body in the first embodiment. As shown in FIG. 2, in the combined body model evaluation apparatus 100, for the combined model generated by the ZDOCK docking component, the 3D structure model of the combined body is selected based on the structural compatibility by the ZDOCK evaluation component. Then, indices such as environmental compatibility (index by Verify 3D) and distance-dependent potential energy (index by Prosa 2003) are evaluated for the entire three-dimensional structure model of the conjugate. Normally, Verify 3D and Prosa 2003 are used for evaluating the three-dimensional structure of a single polypeptide, but in this embodiment, it is used for evaluating the entire three-dimensional structure model of the conjugate.

この場合、図示した左右の2つのポリペプチドの結合領域(真中の接する部分)は、単体のポリペプチドの場合のポリペプチド内部に相当する領域として評価される。そのため、結合体モデル評価装置100では、図示した左右の2つのポリペプチド全体を単体のポリペプチドとみなした場合に、立体構造の適合性を精度良く評価することができる。   In this case, the illustrated binding region (the middle contact portion) between the left and right polypeptides is evaluated as a region corresponding to the interior of the polypeptide in the case of a single polypeptide. Therefore, the conjugate model evaluation apparatus 100 can accurately evaluate the conformity of the three-dimensional structure when the two left and right illustrated polypeptides are regarded as a single polypeptide.

このように、構造適合性(ZDOCKによる指標など)により結合体の立体構造モデルを選択した上で、従来はポリペプチド単体の評価にしか用いられなかった環境適合性(Verify 3Dによる指標)および距離依存型ポテンシャルエネルギー(Prosa 2003による指標)などの指標を、結合体全体について適用しているため、結合体モデル評価装置100では、複数のポリペプチド同士の結合体の立体構造モデルの適合性を精度良く評価することができる。   In this way, after selecting a three-dimensional structure model of a conjugate based on structural compatibility (index by ZDOCK, etc.), environmental compatibility (index by Verify 3D) and distance conventionally used only for evaluating a single polypeptide. Since an index such as dependent potential energy (an index according to Prosa 2003) is applied to the entire conjugate, the conjugate model evaluation apparatus 100 accurately determines the conformity of the three-dimensional structure model of the conjugate between a plurality of polypeptides. Can be evaluated well.

図3は、実施形態1における構造相補性評価部の構成の詳細を示した機能ブロック図である。また、図4は、実施形態1における構造相補性評価部による評価方法について説明するための概念図である。   FIG. 3 is a functional block diagram showing details of the structure of the structural complementarity evaluation unit in the first embodiment. FIG. 4 is a conceptual diagram for explaining an evaluation method by the structural complementarity evaluation unit in the first embodiment.

構造相補性評価部106には、形状相補性評価部202が設けられている。形状相補性評価部202は、図4に示すように、各々のポリペプチド同士の表面の凹凸の相補性を結合体全体について評価して、形状相補性指標を生成する。形状相補性指標とは、各々のポリペプチド同士の表面の凹凸の相補性の程度を示すスコアである。例えば、ZDOCKの評価コンポーネントを用いる場合には、タンパク質を剛体として取り扱い、各分子の回転角をオイラー角として制御し、FFT処理することで、結合部位予測を行う。こうして得られた形状相補性指標は、形状相補性指標記憶部204に格納される。   The structural complementarity evaluation unit 106 is provided with a shape complementarity evaluation unit 202. As shown in FIG. 4, the shape complementarity evaluation unit 202 evaluates the complementarity of the unevenness of the surface of each polypeptide for the whole conjugate, and generates a shape complementarity index. The shape complementarity index is a score indicating the degree of complementarity of the surface irregularities of each polypeptide. For example, when using an evaluation component of ZDOCK, a binding site is predicted by handling a protein as a rigid body, controlling the rotation angle of each molecule as an Euler angle, and performing FFT processing. The shape complementarity index obtained in this way is stored in the shape complementarity index storage unit 204.

また、構造相補性評価部106には、脱溶媒和評価部206が設けられている。一般に、分極した化学種は水などの極性溶媒によって溶媒和される。溶媒和されると、溶媒和エネルギーが放出され、安定化される。逆に、脱溶媒和されると、不安定化する。   The structural complementarity evaluation unit 106 is provided with a desolvation evaluation unit 206. In general, polarized species are solvated by a polar solvent such as water. When solvated, solvation energy is released and stabilized. Conversely, desolvation destabilizes.

脱溶媒和評価部206は、図4に示すように、各々のポリペプチド同士が結合する際に、結合体の立体構造モデルの結合領域において生じる脱溶媒和について結合体全体について評価し、脱溶媒和指標を生成する。脱溶媒和指標とは、各々のポリペプチド同士が結合する際に、結合体の立体構造モデルの結合領域において生じる脱溶媒和の大きさを示すスコアである。例えば、ZDOCKの評価コンポーネントを用いる場合には、ACE脱溶媒和エネルギーについて評価する。こうして得られた脱溶媒和指標は、脱溶媒和指標記憶部208に格納される。   As shown in FIG. 4, the desolvation evaluation unit 206 evaluates the entire conjugate for desolvation that occurs in the binding region of the three-dimensional structure model of the conjugate when each polypeptide binds to each other. Generate a sum indicator. The desolvation index is a score indicating the magnitude of desolvation that occurs in the binding region of the three-dimensional structure model of the conjugate when each polypeptide binds. For example, when the ZDOCK evaluation component is used, the ACE desolvation energy is evaluated. The desolvation index obtained in this way is stored in the desolvation index storage unit 208.

また、構造相補性評価部106には、静電相互作用評価部210が設けられている。静電相互作用とは、各々のポリペプチド同士の表面の電荷同士の相互作用である。静電相互作用評価部210では、複数のポリペプチドのそれぞれのアミノ酸残基ごとの静電相互作用(引力−斥力)に基づいて、各々のポリペプチド同士の静電相互作用が結合体全体について評価され、静電相互作用指標が生成される。静電相互作用指標とは、各々のポリペプチド同士の静電相互作用の正負および大きさを示すスコアである。例えば、ZDOCKの評価コンポーネントを用いる場合にも、各々のポリペプチド同士の静電相互作用エネルギーが評価される。こうして得られた静電相互作用指標は、静電相互作用指標記憶部212に格納される。   The structural complementarity evaluation unit 106 is provided with an electrostatic interaction evaluation unit 210. Electrostatic interaction is the interaction between the charges on the surface of each polypeptide. In the electrostatic interaction evaluation unit 210, the electrostatic interaction between the polypeptides is evaluated for the entire conjugate based on the electrostatic interaction (attraction-repulsive force) for each amino acid residue of the plurality of polypeptides. And an electrostatic interaction index is generated. The electrostatic interaction index is a score indicating the sign and magnitude of electrostatic interaction between each polypeptide. For example, when using the ZDOCK evaluation component, the electrostatic interaction energy between the polypeptides is also evaluated. The electrostatic interaction index thus obtained is stored in the electrostatic interaction index storage unit 212.

また、構造相補性評価部106には、指標合成部214が設けられている。指標合成部214は、各々のポリペプチド同士の形状相補性と、各々のポリペプチド同士の脱溶媒和と、各々のポリペプチド同士の静電相互作用と、に基づいて、結合体の構造相補性指標を生成する。例えば、ZDOCKの評価コンポーネントでは、形状相補性に加えて、さらに静電相互作用エネルギーおよびACE脱溶媒和エネルギーに基づいて、結合体の構造適合性を評価する。   The structural complementarity evaluation unit 106 is provided with an index synthesis unit 214. The index synthesizer 214 determines the structural complementarity of the conjugate based on the shape complementarity between the polypeptides, the desolvation between the polypeptides, and the electrostatic interaction between the polypeptides. Generate indicators. For example, the ZDOCK evaluation component evaluates the structural compatibility of the conjugate based on electrostatic interaction energy and ACE desolvation energy in addition to shape complementarity.

より詳細には、ZDOCKを用いる場合には、あらかじめそれぞれ正規化された、上述の形状相補性指標(SSC)と、脱溶媒和指標(SDS)と、静電相互作用指標(SELEC)とをそれぞれ適宜重み付けして、S=αSSC+SDS+βSELECという式に代入することにより、構造相補性指標を生成する。なお、上記の式で、αおよびβは、重み付けのための所定の定数である。 More specifically, when ZDOCK is used, the above-described shape complementarity index (S SC ), desolvation index (S DS ), and electrostatic interaction index (S ELEC ), which are respectively normalized in advance. Are appropriately weighted and substituted into the formula S = αS SC + S DS + βS ELEC to generate a structural complementarity index. In the above formula, α and β are predetermined constants for weighting.

図5は、実施形態1における環境適合性評価部の構成の詳細を示した機能ブロック図である。また、図6は、実施形態1における環境適合性評価部による評価方法について説明するための概念図である。   FIG. 5 is a functional block diagram showing details of the configuration of the environmental suitability evaluation unit in the first embodiment. FIG. 6 is a conceptual diagram for explaining an evaluation method by the environmental suitability evaluation unit in the first embodiment.

環境適合性評価部118には、周辺極性度評価部302が設けられている。周辺極性度評価部302は、選択された結合体の立体構造モデルにおけるアミノ酸残基ごとの周辺極性度(図6の右側のFraction Polarの指標に相当)を評価する。こうして生成された周辺極性度は、周辺極性度記憶部304に格納される。   The environmental suitability evaluation unit 118 is provided with a peripheral polarity evaluation unit 302. The peripheral polarity evaluation unit 302 evaluates the peripheral polarity for each amino acid residue in the three-dimensional structure model of the selected conjugate (corresponding to the Fraction Polar index on the right side of FIG. 6). The peripheral polarity degree generated in this way is stored in the peripheral polarity degree storage unit 304.

また、環境適合性評価部118には、溶媒露出度評価部306が設けられている。溶媒露出度評価部306は、選択された結合体の立体構造モデルにおけるアミノ酸残基ごとの側鎖の溶媒露出度(図6の上側の埋設領域の指標と逆相関する)を評価する。このとき、埋設領域の面積と、溶媒露出度とは、逆相関するため、一方を評価することは、他方を評価することと等価である。こうして生成された溶媒露出度は、溶媒露出度記憶部308に格納される。   The environmental suitability evaluation unit 118 is provided with a solvent exposure degree evaluation unit 306. The solvent exposure degree evaluation unit 306 evaluates the solvent exposure degree of the side chain for each amino acid residue in the three-dimensional structure model of the selected conjugate (inversely correlated with the index of the upper embedded region in FIG. 6). At this time, since the area of the embedded region and the degree of solvent exposure are inversely correlated, evaluating one is equivalent to evaluating the other. The solvent exposure degree thus generated is stored in the solvent exposure degree storage unit 308.

また、環境適合性評価部118には、2次構造評価部310が設けられている。2次構造評価部310は、選択された結合体の立体構造モデルにおけるアミノ酸残基ごとに、そのアミノ酸残基の形成する2次構造(αへリックス、βシート、ループなどその他の構造)を評価する。こうして生成された2次構造の種類(3種類のいずれか)は、2次構造記憶部312に格納される。   The environmental suitability evaluation unit 118 is provided with a secondary structure evaluation unit 310. The secondary structure evaluation unit 310 evaluates the secondary structure (other structures such as α helix, β sheet, and loop) formed by each amino acid residue in the three-dimensional structure model of the selected conjugate. To do. The secondary structure type (any one of the three types) generated in this way is stored in the secondary structure storage unit 312.

また、環境適合性評価部118には、結合体の環境クラスを18段階に分類する環境クラス評価部318が設けられている。環境クラス評価部318は、上述の周辺極性度および溶媒露出度にくわえて、さらにアミノ酸残基の形成する2次構造に基づいて、結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する18段階の環境クラスの指標(環境適合性指標)を生成する。こうして生成された18段階の環境クラスの指標は、環境クラス記憶部320に格納される。   The environment suitability evaluation unit 118 is provided with an environment class evaluation unit 318 that classifies the environment class of the combined body into 18 levels. In addition to the above-mentioned peripheral polarity and solvent exposure, the environment class evaluation unit 318 further determines the water solubility of the entire three-dimensional structure model of the conjugate and the internal environment of the protein based on the secondary structure formed by the amino acid residue. Generate the environmental class index (environment suitability index) of the stage. The 18-stage environmental class indices generated in this way are stored in the environmental class storage unit 320.

より詳細には、Verify 3Dを用いる場合には、図6の分類図を用いて、結合体の3次元構造における残基の環境クラスを評価(判定)する。まず、立体構造モデルの各残基について溶媒接触表面積(溶媒露出度)を計算する。次いで、Gly−XGlyペプチドの溶媒接触表面積との差をArea Buried(残基埋設度)とする。   More specifically, when Verify 3D is used, the environmental class of residues in the three-dimensional structure of the conjugate is evaluated (determined) using the classification diagram of FIG. First, the solvent contact surface area (solvent exposure) is calculated for each residue of the three-dimensional structure model. Then, the difference from the solvent contact surface area of Gly-XGly peptide is defined as Area Buried (residue embedding degree).

そして、立体構造モデルの各残基の表面積のうち、極性原子(溶媒を含む)に覆われている割合をFraction Polar(周辺極性度)とする。次いで、図6の分類図から各残基(a)がどの環境クラスに属するか(j)決定する。   Then, the fraction covered with polar atoms (including the solvent) in the surface area of each residue in the three-dimensional structure model is defined as Fraction Polar (peripheral polarity). Next, the environmental class to which each residue (a) belongs (j) is determined from the classification diagram of FIG.

すなわち、アミノ酸残基の側鎖がタンパク質に埋もれている領域(溶媒露出度)と、アミノ酸残基の周辺の極性度と、さらに主鎖の2次構造により、アミノ酸残基を18段階の環境クラスに分類する。そして、後述する式によりその残基のスコア(環境適合性指標)を計算する。   In other words, amino acid residues are classified into 18 environmental classes based on the region where the side chains of amino acid residues are buried in protein (solvent exposure), the degree of polarity around the amino acid residues, and the secondary structure of the main chain. Classify into: Then, the score of the residue (environment suitability index) is calculated by the formula described later.

ここで、6段階の分類の記号の内容は、残基が置かれている環境を定義しており、Buried(B)、Partially buried(P)、Exposed(E)に大きく分けられ、さらに詳細には、以下の通りである。
E:溶媒に接している環境
P1:部分的に埋もれている;わずかな極性環境
P2:部分的に埋もれている;極性環境
B1:埋もれている;疎水環境
B2:埋もれている;わずかな極性環境
B3:埋もれている;極性環境
Here, the contents of the six-level classification symbols define the environment in which the residue is placed, and are broadly divided into Burried (B), Partially buried (P), and Exposed (E). Is as follows.
E: Environment in contact with solvent P1: Partially buried; Slightly polar environment P2: Partially buried; Polar environment B1: Buried; Hydrophobic environment B2: Buried; Slightly polar environment B3: buried; polar environment

これらについて、PDB(タンパク質立体構造データベース)に登録されている立体構造について、残基の種類毎に各環境にある頻度を計算してある。例えば、大きな疎水性残基は、B1、B2、B3を好み、親水的な残基はE環境を好む。しかし、極性残基、例えばグルタミン(Q)は、B3ならば取り得る。   About these, about the three-dimensional structure registered into PDB (protein three-dimensional structure database), the frequency in each environment is calculated for every kind of residue. For example, large hydrophobic residues prefer B1, B2, B3, and hydrophilic residues prefer the E environment. However, polar residues such as glutamine (Q) can be taken with B3.

図6について、横軸は、各側鎖残基の埋もれた表面積である。Eは、A<40、Pは、40≦A≦114、Bは、114≦Aである(単位はいずれもオングストローム)。縦軸は、極性残基に囲まれた表面の割合である。B1は、f<0.45、B2は、0.45≦f<0.58、B3は、0.58≦f、P1は、f<0.67、P2は、0.67≦fである(単位はいずれもオングストローム)。なお、Aは、Area Buriedを示し、fは、Fraction Polarを示す。   For FIG. 6, the horizontal axis is the buried surface area of each side chain residue. E is A <40, P is 40 ≦ A ≦ 114, and B is 114 ≦ A (the unit is angstrom). The vertical axis represents the ratio of the surface surrounded by polar residues. B1 is f <0.45, B2 is 0.45 ≦ f <0.58, B3 is 0.58 ≦ f, P1 is f <0.67, and P2 is 0.67 ≦ f. (All units are angstroms.) Here, A indicates Area Buried, and f indicates Fraction Polar.

また、環境適合性評価部118には、指標変換部322が設けられている。この指標変換部322には、あらかじめ精度の高い結晶構造でポリペプチドの立体構造における各アミノ酸の上述の18段階の環境クラスへの出現頻度について、統計データが収集されて格納されている。例えば、LuethyらがProteins(1991)において発表した、16種類の構造既知のタンパク質、およびそれと相同性のあるタンパク質をアライメントした結果得られた3Dスコアテーブルなどを好適に用いうる。   The environmental suitability evaluation unit 118 is provided with an index conversion unit 322. In the index conversion unit 322, statistical data is collected and stored in advance for the appearance frequency of each amino acid in the three-dimensional structure of the polypeptide in the above-described 18-stage environmental class with a highly accurate crystal structure. For example, the 3D score table obtained as a result of aligning 16 types of proteins with known structures and proteins having homology thereto, which was published in Proteins (1991) by Luethy et al., Can be suitably used.

そして、指標変換部322は、各アミノ酸の上述の18段階の環境クラスへの分類と、あらかじめ設定した出現頻度とを、Saj=log(Pa:j/P)の式により対比して、予測された結合体の立体構造モデルがその統計値にどれくらい準じているかで、立体構造モデルにおけるそのアミノ酸の環境適合性指標を生成する。なお、上記の式で、Sajは、残基aの環境jにおける環境適合性指標であり、Pa:jは、環境jに残基種aを見出す条件付き確率であり、Pは、残基aを観測する全確率である。 Then, the index conversion unit 322 compares the classification of each amino acid into the above-described 18-stage environmental class and the appearance frequency set in advance using the formula of S aj = log (P a: j / P a ). An environmental compatibility index of the amino acid in the three-dimensional structure model is generated according to how much the predicted three-dimensional structure model of the conjugate conforms to the statistical value. In the above equation, S aj is an environmental suitability index of residue a in environment j, P a: j is a conditional probability of finding residue type a in environment j, and P a is The total probability of observing residue a.

この場合、PDB(タンパク質データベース)中に出現頻度が少ない環境にあると、スコアは低くなる。すなわち、スコアが低いと、立体構造モデルが間違っている可能性が高い。例えば、Exposed環境にあることが多い残基が立体構造モデルにおいてBuried環境にあれば、立体構造モデルが間違っている可能性が高くなる。   In this case, the score is low if the appearance frequency is low in the PDB (protein database). That is, if the score is low, there is a high possibility that the three-dimensional structure model is wrong. For example, if a residue that is often in the Exposed environment is in the Buried environment in the three-dimensional structure model, there is a high possibility that the three-dimensional structure model is incorrect.

また、環境適合性評価部118には、全アミノ酸指標合成部324が設けられている。全アミノ酸指標合成部324は、上述の各アミノ酸についての環境適合性指標を合成して、全アミノ酸についての環境適合性指標を生成する。こうして得られた環境適合性指標は、環境適合性指標記憶部120に格納される。   The environmental suitability evaluation unit 118 is provided with an all-amino acid index synthesis unit 324. The total amino acid index synthesis unit 324 synthesizes the environmental compatibility index for each amino acid described above to generate an environmental compatibility index for all amino acids. The environmental suitability index obtained in this way is stored in the environmental suitability index storage unit 120.

図7は、実施形態1における距離依存型ポテンシャルエネルギー評価部の構成の詳細を示した機能ブロック図である。また、図8および図9は、実施形態1における距離依存型ポテンシャルエネルギー評価部による評価方法について説明するための概念図である。   FIG. 7 is a functional block diagram showing details of the configuration of the distance-dependent potential energy evaluation unit in the first embodiment. 8 and 9 are conceptual diagrams for explaining an evaluation method by the distance-dependent potential energy evaluation unit in the first embodiment.

距離依存型ポテンシャルエネルギー評価部122には、残基ペア距離評価部402が設けられている。残基ペア距離評価部402は、選択された結合体の立体構造モデルにおけるアミノ酸残基ごとに、立体構造モデルおよび立体構造モデル中のαへリックスとβストランドの二次構造要素の位置を調べ、αへリックスとβストランドの二次構造要素の残基ペア(Cα−Cα、Cβ−Cβ)の距離を評価する。こうして得られた残基ペアの距離は、残基ペア距離記憶部404に格納される。   The distance-dependent potential energy evaluation unit 122 is provided with a residue pair distance evaluation unit 402. The residue pair distance evaluation unit 402 examines the position of the secondary structural element of the α helix and β strand in the three-dimensional structure model and the three-dimensional structure model for each amino acid residue in the three-dimensional structure model of the selected conjugate. The distance of the residue pair (Cα-Cα, Cβ-Cβ) of the secondary structural element of α-helix and β-strand is evaluated. The residue pair distances obtained in this way are stored in the residue pair distance storage unit 404.

また、距離依存型ポテンシャルエネルギー評価部122には、残基ペア距離依存型ポテンシャルエネルギー評価部406が設けられている。残基ペア距離依存型ポテンシャルエネルギー評価部406には、あらかじめ構造既知のポリペプチドの結晶構造から求められる残基ペア(Cα−Cα、Cβ−Cβ)の距離依存型ポテンシャルエネルギーの統計データがPDB(タンパク質立体構造データベース)から収集されて格納されている。実際には、アミノ酸残基間の接触が網羅的に解析されて、これらの接触に伴うエネルギーの一覧表が作成されているので、この一覧表を格納しておいてもよい。   The distance-dependent potential energy evaluation unit 122 includes a residue pair distance-dependent potential energy evaluation unit 406. In the residue pair distance-dependent potential energy evaluation unit 406, statistical data of distance-dependent potential energy of residue pairs (Cα-Cα, Cβ-Cβ) obtained in advance from the crystal structure of a polypeptide whose structure is already known is stored in PDB ( Collected from the protein 3D structure database) and stored. Actually, contacts between amino acid residues are comprehensively analyzed, and a list of energies associated with these contacts is created. This list may be stored.

そして、残基ペア距離依存型ポテンシャルエネルギー評価部406は、選択された結合体の立体構造モデルにおける残基ペア(Cα−Cα、Cβ−Cβ)の距離と、上記統計データとを比較して、E(r)=−kTln[f(r)]の式により、それぞれの残基ペア(Cα−Cα、Cβ−Cβ)の距離依存型ポテンシャルエネルギーを評価する。なお、上記の式で、E(r)は、残基ペア距離依存型ポテンシャルエネルギーであり、f(r)は、距離rの確率密度関数であり、kは、ボルツマン定数であり、Tは、絶対温度(K)である。こうして得られた残基ペアの距離依存型ポテンシャルエネルギー指標は、残基ペア距離依存型ポテンシャルエネルギー指標記憶部408に格納される。   The residue pair distance-dependent potential energy evaluation unit 406 compares the distance of the residue pair (Cα-Cα, Cβ-Cβ) in the three-dimensional structure model of the selected conjugate with the statistical data, The distance-dependent potential energy of each residue pair (Cα-Cα, Cβ-Cβ) is evaluated by the equation E (r) = − kTln [f (r)]. In the above equation, E (r) is the residue pair distance-dependent potential energy, f (r) is the probability density function of the distance r, k is the Boltzmann constant, and T is Absolute temperature (K). The distance-dependent potential energy index of the residue pair thus obtained is stored in the residue pair distance-dependent potential energy index storage unit 408.

また、距離依存型ポテンシャルエネルギー評価部122には、全アミノ酸指標合成部410が設けられている。指標合成部410は、それぞれの残基ペア(Cα−Cα、Cβ−Cβ)の距離依存型ポテンシャルエネルギーを、全アミノ酸残基の残基ペア(Cα−Cα、Cβ−Cβ)について合成し、結合体の立体構造モデル全体についての距離依存型ポテンシャルエネルギー指標を生成する。こうして得られた距離依存型ポテンシャルエネルギーは、距離依存型ポテンシャルエネルギー指標記憶部124に格納される。   The distance-dependent potential energy evaluation unit 122 is provided with an all-amino acid index synthesis unit 410. The index synthesizer 410 synthesizes the distance-dependent potential energy of each residue pair (Cα-Cα, Cβ-Cβ) for the residue pairs (Cα-Cα, Cβ-Cβ) of all amino acid residues and combines them. A distance-dependent potential energy index is generated for the whole body structure model. The distance-dependent potential energy thus obtained is stored in the distance-dependent potential energy index storage unit 124.

このように、距離依存型ポテンシャルエネルギー評価部122では、Sippl著、1993年刊行の論文から引用した図8で示すように、rubiscoタンパク質の(Cα−Cα)距離依存型ポテンシャルエネルギーは、正しい立体構造モデルにおいては、横軸をアミノ酸番号、縦軸をZ−値(距離依存型ポテンシャルエネルギーのエネルギー密度)とすると、左側のグラフのように低い値となり、間違った立体構造モデルにおいては、右側のように高い値となる。   Thus, in the distance-dependent potential energy evaluation unit 122, the (Cα-Cα) distance-dependent potential energy of the rubisco protein has a correct three-dimensional structure, as shown in FIG. 8 cited from a paper published by Shippl and published in 1993. In the model, when the horizontal axis is the amino acid number and the vertical axis is the Z-value (energy density of the distance-dependent potential energy), the value is low as shown in the left graph, and in the wrong three-dimensional structure model, as shown on the right side. High value.

また、距離依存型ポテンシャルエネルギー評価部122では、Sippl著、1990年刊行の論文から引用した図9で示すように、polyprotein由来のlysozyme(PDB code 1lz3)の分布は、横軸をZ−値(距離依存型ポテンシャルエネルギーのエネルギー密度)とし、縦軸をランダムに生成した立体構造モデルの数とすると、正規分布を示す。なお、lysozymeのランダムに生成した立体構造モデルの数は、全部で50000である。下向きの矢印は、自然な(正しい)立体構造モデルのタンパク質を示す。このように、自然な(正しい)立体構造モデルのタンパク質は、Z−値(距離依存型ポテンシャルエネルギーのエネルギー密度)が低くなる。   Further, in the distance-dependent potential energy evaluation unit 122, as shown in FIG. 9 quoted from a paper published by Shippl, published in 1990, the distribution of lysozyme (PDB code 11z3) derived from polyprotein is represented by a Z-value ( The energy distribution of the distance-dependent potential energy), and the vertical axis represents the number of randomly generated three-dimensional structure models indicates a normal distribution. Note that the total number of randomly generated three-dimensional structure models of lysozyme is 50000. The down arrow indicates a natural (correct) conformational model protein. Thus, a natural (correct) three-dimensional model protein has a low Z-value (energy density of distance-dependent potential energy).

図10は、実施形態1における結合関与指標評価部の構成の詳細を示した機能ブロック図である。また、図11は、実施形態1における結合関与指標評価部による評価方法について説明するための概念図である。   FIG. 10 is a functional block diagram illustrating details of the configuration of the binding participation index evaluation unit in the first embodiment. FIG. 11 is a conceptual diagram for explaining an evaluation method performed by the joint participation index evaluation unit in the first embodiment.

結合関与指標評価部126には、結合関与アミノ酸特定部502が設けられている。結合関与アミノ酸特定部502は、選択された結合体の立体構造モデルおよび既知の結合関与情報から、選択された結合体の立体構造モデルにおいて、各々のポリペプチド同士の結合に関与するアミノ酸残基を特定する。このように特定された結合に関与するアミノ酸残基を規定する情報は、結合関与アミノ酸記憶部504に格納される。   The binding participation index evaluation unit 126 includes a binding participation amino acid specifying unit 502. The binding-participating amino acid specifying unit 502 calculates amino acid residues involved in binding between polypeptides in the selected three-dimensional structure model from the three-dimensional structure model of the selected conjugate and known binding participation information. Identify. Information defining the amino acid residues involved in the binding specified in this way is stored in the binding participating amino acid storage unit 504.

上述の既知の結合関与情報(Biological Data)は、例えば、文献や配列解析などからあらかじめ複合体結合(結合体の生成)に重要な箇所をアノテーションした情報であってもよい。   The above-described known binding participation information (biological data) may be, for example, information obtained by annotating a part important for complex binding (generation of a conjugate) in advance from literature or sequence analysis.

また、上述の既知の結合関与情報は、例えば、PDB:Protein Data Bank由来の情報であってもよい。PDBには、X線結晶解析やNMRによる立体構造データ、各原子の3次元座標、2次構造:αヘリックス・βシート・その他ループなどの情報が含まれている。   Moreover, the above-mentioned known binding participation information may be information derived from PDB: Protein Data Bank, for example. The PDB includes three-dimensional structure data by X-ray crystallography and NMR, three-dimensional coordinates of each atom, secondary structure: α helix, β sheet, other loops, and other information.

PDBは、ルトガーズ大学などを中心としたコンソーシアムであり、URLは、http://www.rcsb.org/pdb/である。また、日本でのミラーサイトと独自のXML化も行われており、URLは、http://pdb.protein.osaka−u.ac.jp/pdb/およびhttp://pdbj.protein.osaka−u.ac.jp/である。あるいは、ゲノムネットでのキーワード検索を行うこともでき、URLは、http://www.genome.ad.jp/dbget−bin/www_bfind?pdbである。   PDB is a consortium centered on Rutgers University and the URL is http: // www. rcsb. org / pdb /. In addition, the mirror site in Japan and original XML conversion are also performed, and the URL is http: // pdb. protein. osaka-u. ac. jp / pdb / and http: // pdbj. protein. osaka-u. ac. jp /. Alternatively, a keyword search on the genome net can be performed, and the URL is http: // www. genome. ad. jp / dbget-bin / www_bfind? pdb.

また、結合関与指標評価部126には、結合関与アミノ酸カウント部506が設けられている。結合関与アミノ酸カウント部506は、図11に示すように、結合体の立体構造モデルにおける上述の特定された結合に関与するアミノ酸残基の個数をカウントする。   The binding participation index evaluation unit 126 is provided with a binding participation amino acid counting unit 506. As shown in FIG. 11, the binding participating amino acid counting unit 506 counts the number of amino acid residues involved in the identified binding in the three-dimensional structure model of the conjugate.

より詳細には、上述のアノテーションの後、複合体候補構造(結合体の立体構造モデル)においてアノテーションされた残基の複合体(結合体)全体におけるコンタクト数(DIMPLOT)の総和をスコア化する。このようにしてカウントされた結合関与アミノ酸カウント値は、そのまま結合関与指標として扱われ、結合関与指標記憶部128に格納される。   More specifically, after the above annotation, the sum of the number of contacts (DIMPLOT) in the entire complex (conjugate) of the annotated residues in the complex candidate structure (conjugate three-dimensional structure model) is scored. The binding participation amino acid count value thus counted is handled as a binding participation index as it is and stored in the binding participation index storage unit 128.

図12は、実施形態1における総合適合性評価部の構成の詳細を示した機能ブロック図である。図13は、実施形態1における総合適合性評価部での正規化について説明するための概念図である。   FIG. 12 is a functional block diagram showing details of the configuration of the comprehensive compatibility evaluation unit in the first embodiment. FIG. 13 is a conceptual diagram for explaining normalization in the comprehensive compatibility evaluation unit in the first embodiment.

総合適合性評価部130は、図13(a)に示すように、ベースライン記憶部604を備える。このベースライン記憶部604には、あらかじめダミーのランダムなアミノ酸配列のポリペプチドの環境適合性指標について回帰線を引くことにより得られるベースラインが格納されている。図13(a)では、横軸がタンパク質長であり、縦軸が環境適合性指標である。   The comprehensive suitability evaluation unit 130 includes a baseline storage unit 604 as shown in FIG. The baseline storage unit 604 stores a baseline obtained by drawing a regression line in advance for an environmental compatibility index of a polypeptide having a dummy random amino acid sequence. In FIG. 13A, the horizontal axis is the protein length, and the vertical axis is the environmental compatibility index.

次に、正規化部606にて、環境適合性指標は、ベースラインを用いて正規化される。より詳細には、下記の一連の式により正規化(無次元化)される。こうして正規化された環境適合性指標は、正規化環境適合性指標記憶部608に格納される。
verify 3D=(Squality−Slow)/(Shigh−Slow
quality=ΣSi,j
high=exp(−0.83+1.008×ln(L))
low=0.45×Shigh
なお、上述の式で、Qverify 3Dは、タンパク質長により正規化されたVerify 3Dによる環境適合性指標であり、Squalityは、実測の環境適合性指標であり、Shighは、タンパク質長Lの際における環境適合性指標の理想値であり、Slowは、適切と判断される環境適合性指標の閾値であり、Lは、タンパク質長(アミノ酸残基数)である。
Next, the normalization unit 606 normalizes the environmental suitability index using the baseline. More specifically, it is normalized (non-dimensionalized) by the following series of equations. The normalized environmental suitability index is stored in the normalized environment suitability index storage unit 608.
Q verify 3D = (S quality -S low ) / (S high -S low )
S quality = ΣS i, j
S high = exp (−0.83 + 1.008 × ln (L))
S low = 0.45 × S high
In the above formula, Q verify 3D is an environment suitability index by Verify 3D normalized by the protein length, S quality is an actually measured environment suitability index, and S high is the protein length L. Is an ideal value of the environmental compatibility index, and S low is a threshold value of the environmental compatibility index determined to be appropriate, and L is the protein length (number of amino acid residues).

また、総合適合性評価部130は、図13(b)に示すように、距離依存型ポテンシャルエネルギー指標について、ベースラインを生成するベースライン生成部610を備える。図13(b)では、横軸がタンパク質長であり、縦軸がZ−値であるグラフにおいて、最もZ−値の大きい距離依存型ポテンシャルエネルギー指標について、距離依存型ポテンシャルエネルギー指標の回帰線と平行な線を引くことにより、ベースラインを生成している。このようにして生成されたベースラインは、ベースライン記憶部612に格納される。   Further, as shown in FIG. 13B, the comprehensive suitability evaluation unit 130 includes a baseline generation unit 610 that generates a baseline for the distance-dependent potential energy index. In FIG. 13B, in the graph in which the horizontal axis is the protein length and the vertical axis is the Z-value, the distance-dependent potential energy index having the largest Z-value is represented by the regression line of the distance-dependent potential energy index. Baselines are generated by drawing parallel lines. The baseline generated in this way is stored in the baseline storage unit 612.

次に、正規化部614にて、距離依存型ポテンシャルエネルギー指標は、ベースラインを用いて正規化される。より詳細には、下記の一連の式により正規化(無次元化)される。こうして正規化された距離依存型ポテンシャルエネルギー指標は、正規化距離依存型ポテンシャルエネルギー指標記憶部616に格納される。
prosa=(ZS−ZSlow)/(ZShigh−ZSlow
ZShigh=−6.67−0.0141L
ZSlow=−3.32−0.0141L
なお、上述の式で、Qprosaは、タンパク質長により正規化されたProsaによるZ−値(距離依存型ポテンシャルエネルギー指標)であり、Shighは、タンパク質長Lの際におけるZ−値の理想値であり、ZSは、目的とする立体構造モデルの(Cβ−Cβ)結合エネルギーのZ−値であり、Slowは、適切と判断されるZ−値の閾値であり、Lは、タンパク質長(アミノ酸残基数)である。
Next, in the normalization unit 614, the distance-dependent potential energy index is normalized using the baseline. More specifically, it is normalized (non-dimensionalized) by the following series of equations. The distance-dependent potential energy index thus normalized is stored in the normalized distance-dependent potential energy index storage unit 616.
Q prosa = (ZS−ZS low ) / (ZS high −ZS low )
ZS high = −6.67−0.0141L
ZS low = −3.32−0.0141L
In the above formula, Q prosa is a Z-value (distance-dependent potential energy index) by Prosa normalized by the protein length, and S high is an ideal value of the Z-value when the protein length is L. ZS is the Z-value of the (C β -C β ) binding energy of the target three-dimensional structure model, S low is the threshold value of the Z-value judged to be appropriate, and L is the protein Long (number of amino acid residues).

また、総合適合性評価部130は、正規化された環境適合性指標および正規化された距離依存型ポテンシャルエネルギー指標に基づいて、例えばCQS(combined q−score)を、下記の一連の式により生成するCQS評価部618を備える。CQSは、独立行政法人 産業技術総合研究所(産総研)(AIST)の生命情報科学研究センター(CBRC)で開発されたタンパク質立体構造予測のための評価値である。すなわち、CQSは、タンパク質に含まれるアミノ酸残基の立体配置の適合性を示す指標である。こうして得られたCQSは、CQS記憶部620に格納される。   Further, the comprehensive suitability evaluation unit 130 generates, for example, CQS (combined q-score) by the following series of formulas based on the normalized environmental suitability index and the normalized distance-dependent potential energy index. A CQS evaluation unit 618 is provided. CQS is an evaluation value for protein three-dimensional structure prediction developed at the Center for Bioinformatics Research (CBRC) of the National Institute of Advanced Industrial Science and Technology (AIST). That is, CQS is an index indicating the conformity of the configuration of amino acid residues contained in a protein. The CQS obtained in this way is stored in the CQS storage unit 620.

CQSの値については、以下の式が成立する。
CQS=sign(Qverify 3D,Qprosa)Qverify 3Dprosa
The following formula is established for the value of CQS.
CQS = sign (Q verify 3D , Q prosa ) Q verify 3D Q prosa

また、sign関数については、以下の式が成り立つ。
まず、Qverify 3D<0 および Qprosa<0の場合、次式が成りたつ。
sign(Qverify 3D,Qprosa)=−1
一方、Qverify 3D≧0 または Qprosa≧0の場合、次式が成り立つ。
sign(Qverify 3D,Qprosa)=1
For the sign function, the following equation is established.
First, when Q verify 3D <0 and Q prosa <0, the following equation holds.
sign (Q verify 3D , Q prosa ) = − 1
On the other hand, when Q verify 3D ≧ 0 or Q prosa ≧ 0, the following equation holds.
sign (Q verify 3D , Q prosa ) = 1

上述の式で、Qverify 3Dは、タンパク質長により正規化されたVerify 3Dによる環境適合性指標である。また、Qprosaは、タンパク質長により正規化されたProsaによるZ−値(距離依存型ポテンシャルエネルギー指標)である。 In the above formula, Q verify 3D is an environmental suitability index by Verify 3D normalized by protein length. Q prosa is a Z-value (distance-dependent potential energy index) by Prosa normalized by the protein length.

さらに、総合適合性評価部130は、CQSを標準偏差を考慮して正規化(無次元化)する正規化部622を備える。こうして正規化されたCQSは、正規化CQS記憶部624に格納される。   Further, the overall compatibility evaluation unit 130 includes a normalization unit 622 that normalizes (non-dimensionalizes) the CQS in consideration of the standard deviation. The normalized CQS is stored in the normalized CQS storage unit 624.

一方、上述の結合関与指標も、正規化部626にて標準偏差を考慮して正規化(無次元化)される。こうして正規化された結合関与指標は、正規化結合関与指標記憶部628に格納される。また、上述の構造相補性指標も、正規化部630にて標準偏差を考慮して正規化(無次元化)される。こうして正規化された構造相補性指標は、正規化構造相補性指記憶部632に格納される。   On the other hand, the above-described combination participation index is also normalized (non-dimensionalized) by the normalizing unit 626 in consideration of the standard deviation. The normalized binding participation index thus stored is stored in the normalized binding participation index storage unit 628. Further, the above-described structural complementarity index is also normalized (non-dimensionalized) by the normalizing unit 630 in consideration of the standard deviation. The normalized structure complementarity index is stored in the normalized structure complementation finger storage unit 632.

また、総合適合性評価部130は、上述の標準偏差を考慮して正規化された各指標に基づいて、各指標を合成し、総合適合性指標を生成する指標合成部634を備える。このとき、指標合成部634では、下記の式により各指標が合成される。こうして合成された総合適合性指標は、総合適合性指標記憶部132に格納される。
core=ZSCQS+ZSZDOCK+ZSContact
なお、上述の式で、Scoreは、総合適合性指標であり、ZSCQSは、正規化されたCQSであり、ZSZDOCKは、正規化されたZDOCKスコアであり、ZSContactは、正規化された結合関与指標である。
The comprehensive suitability evaluation unit 130 includes an index composition unit 634 that synthesizes each index based on each index normalized in consideration of the above-described standard deviation and generates a comprehensive suitability index. At this time, the index synthesis unit 634 synthesizes each index according to the following formula. The comprehensive suitability index synthesized in this way is stored in the comprehensive suitability index storage unit 132.
S core = ZS CQS + ZS ZDOCK + ZS Contact
In the above equation, S core is a comprehensive fitness index, ZS CQS is a normalized CQS, ZS ZDOCK is a normalized ZDOCK score, and ZS Contact is normalized. It is a binding participation index.

このようにして、通常はタンパク質(単量体)の構造予測評価プログラムであるCQSを、各複合体候補(各結合体の立体構造モデル)の全体について計算し、これらに基づいて各複合体候補の適合性を評価し、CQS他、複数の複合体評価値(指標)の総合得点から最終的な結合体モデルを決定するため、複数のポリペプチド同士の各複合体候補の適合性を精度良く評価することができ、適合性の高い結合体モデルを得ることができる。   Thus, CQS, which is usually a protein (monomer) structure prediction evaluation program, is calculated for each complex candidate (stereostructure model of each conjugate), and based on these, each complex candidate is calculated. In order to determine the final conjugate model from the overall score of CQS and other complex evaluation values (indexes), it is possible to accurately determine the compatibility of each complex candidate between multiple polypeptides. It is possible to evaluate and obtain a conjugate model with high compatibility.

以下、結合体モデル評価装置100の動作について説明する。
図14は、実施形態1に係る結合体モデル評価装置の動作について説明するためのフローチャートである。結合体モデル評価装置100は、一連の動作を開始すると、結合体モデル取得部102により、外部にて生成された結合体の立体構造モデルを取得する(S102)。
Hereinafter, the operation of the combined body model evaluation apparatus 100 will be described.
FIG. 14 is a flowchart for explaining the operation of the combined body model evaluation apparatus according to the first embodiment. When the combined body model evaluation apparatus 100 starts a series of operations, the combined body model acquisition unit 102 acquires a three-dimensional structure model of a combined body generated outside (S102).

次に、取得した結合体の立体構造モデルについて、構造相補性評価部106により、構造相補性評価を行う(S104)。そして、得られた構造相補性指標に基づいて、結合体モデル選択部110により、上述の結合体の立体構造モデルが選択される(S106)。   Next, structural complementarity evaluation is performed by the structural complementarity evaluation unit 106 on the acquired three-dimensional structure model of the combined body (S104). Based on the obtained structural complementarity index, the conjugate model selection unit 110 selects the three-dimensional structure model of the conjugate (S106).

さらに、選択された結合体の立体構造モデルは、環境適合性評価部118により、環境適合性を評価される(S108)。一方、選択された結合体の立体構造モデルは、距離依存型ポテンシャルエネルギー評価部122により、距離依存型ポテンシャルエネルギーを評価される(S110)。また、選択された結合体の立体構造モデルは、結合関与指標生成部126により、結合関与指標を評価される(S112)。   Further, the three-dimensional structure model of the selected combined body is evaluated for environmental compatibility by the environmental compatibility evaluation unit 118 (S108). On the other hand, the distance-dependent potential energy of the three-dimensional structure model of the selected conjugate is evaluated by the distance-dependent potential energy evaluation unit 122 (S110). The three-dimensional structure model of the selected conjugate is evaluated for the binding participation index by the binding participation index generation unit 126 (S112).

そして、これらの各指標に基づいて、総合適合性評価部130により、選択された結合体の立体構造モデルの総合適合性が評価される(S114)。続いて、総合適合性指標は、出力部134により、外部に出力され(S116)、一連の動作が終了する。   Based on each of these indices, the comprehensive suitability evaluation unit 130 evaluates the comprehensive suitability of the three-dimensional structure model of the selected conjugate (S114). Subsequently, the comprehensive suitability index is output to the outside by the output unit 134 (S116), and the series of operations ends.

以下、実施形態1に係る結合体モデル評価装置100の作用効果について説明する。
図15は、実施形態1に係る結合体モデル評価装置におけるCQSの計算方法について説明するための概念図である。また、図16は、多数の各々のポリペプチドのCQSを計算したときのCQSの分布を示すグラフである。ここで用いた各々のポリペプチドは、いずれも結晶構造解析などにより、立体構造が既知であり、自然な立体構造を有しているはずである。
Hereinafter, the operation and effect of the combined body model evaluation apparatus 100 according to the first embodiment will be described.
FIG. 15 is a conceptual diagram for explaining a CQS calculation method in the combined body model evaluation apparatus according to the first embodiment. FIG. 16 is a graph showing the distribution of CQS when calculating the CQS of each of a number of polypeptides. Each polypeptide used here has a known three-dimensional structure by crystal structure analysis or the like, and should have a natural three-dimensional structure.

このように、多数の各々のポリペプチドについて、図15に示す計算方法により、CQSを計算して、分布をとると、一部の各々のポリペプチドのCQSの値は負の値になる。なお、図15の横軸は、CQSの値であり、縦軸は、そのCQSの値をとる各々のポリペプチドの個数である。また、この多数の各々のポリペプチドのCQSの値のSCOPは、1.65〜4.%であった。このように、自然な立体構造を有しているはずの各々のポリペプチドのCQSの値が負になったため、本発明者はその原因を追及した。   As described above, when CQS is calculated for a large number of each polypeptide by the calculation method shown in FIG. 15 and distribution is obtained, the CQS values of some of the polypeptides become negative values. The horizontal axis in FIG. 15 is the CQS value, and the vertical axis is the number of each polypeptide having the CQS value. Also, the SCOP of the CQS value of each of the multiple polypeptides is 1.65-4. %Met. Thus, since the value of CQS of each polypeptide which should have a natural three-dimensional structure became negative, the present inventors sought the cause.

本発明者の研究の結果、一部の各々のポリペプチドのCQSの値が負の値になった原因は、自然な状態で他のポリペプチドなどと結合しているポリペプチドについて、各々のポリペプチドのCQSを計算したため、本来は結合領域(結合体の内部)にあるはずのアミノ酸残基について、各々のポリペプチドの表面に存在するものとして計算したため、一部の各々のポリペプチドのCQSの値が負の値になったものと、原因が想定された。   As a result of the inventor's research, the cause of the negative CQS value of some of the polypeptides is that each polypeptide is naturally associated with other polypeptides and the like. Since the CQS of the peptide was calculated, the amino acid residues that should originally be in the binding region (inside the conjugate) were calculated as existing on the surface of each polypeptide, so that the CQS of some of each polypeptide The cause was assumed to be a negative value.

そこで、本発明者は、それらのCQSの値が負の値になった各々のポリペプチドについて、他のポリペプチドなどと結合している結合体の状態で、結合体全体を一つのポリペプチドとして扱って、CQSの計算をしたところ、CQSの値が正の値となった。   Therefore, the present inventor made the whole conjugate as one polypeptide in the state of conjugates that are bound to other polypeptides, etc., for each polypeptide having a negative CQS value. When the CQS was calculated by handling it, the CQS value became a positive value.

このような経緯で、本発明者は、通常はポリペプチド単体の立体構造の評価に用いられるCQS(Verify 3DおよびProsa 2003の組合せ)を、結合体の立体構造モデル全体について評価し、これらに基づいて結合体の立体構造モデルの適合性を評価することにより、複数のポリペプチド同士の結合体の立体構造モデルの適合性を精度良く評価することができることに想到した。   With this background, the inventor evaluated CQS (combination of Verify 3D and Prosa 2003), which is usually used for evaluating the three-dimensional structure of a single polypeptide, for the whole three-dimensional structure model of the conjugate, and based on these. Thus, it was conceived that the suitability of the three-dimensional structure model of a conjugate of a plurality of polypeptides can be evaluated with high accuracy by evaluating the suitability of the three-dimensional model of the conjugate.

すなわち、本発明者は、CQS(combined q−score)を予測される結合体の立体構造モデルの評価に適用して、結合体の立体構造モデルをランク付けすることに用いることとした。さらに、本発明者は、このCQSをVerify 3DおよびProsa 2003という2種類の主要なタンパク質立体構造評価プログラムにより得られる指標として構成することとした。   That is, the present inventor applied CQS (combined q-score) to the evaluation of the predicted three-dimensional structure model of the conjugate and used it to rank the three-dimensional model of the conjugate. Furthermore, the present inventor decided to configure this CQS as an index obtained by two major protein structure evaluation programs, Verify 3D and Prosa 2003.

すなわち、本実施形態に係る結合体モデル評価装置100によれば、通常はポリペプチド単体の立体構造の評価に用いられる環境適合性および距離依存型ポテンシャルエネルギーを、結合体の立体構造モデル全体について評価し、これらに基づいて結合体の立体構造モデルの適合性を評価するため、複数のポリペプチド同士の結合体の立体構造モデルの適合性を精度良く評価することができる。   That is, according to the conjugate model evaluation apparatus 100 according to the present embodiment, the environmental compatibility and the distance-dependent potential energy normally used for evaluating the three-dimensional structure of a single polypeptide are evaluated for the entire three-dimensional structure model of the conjugate. In addition, since the suitability of the three-dimensional structure model of the conjugate is evaluated based on these, the suitability of the three-dimensional structure model of the conjugate of a plurality of polypeptides can be accurately evaluated.

また、本実施形態に係る結合体モデル評価装置100によれば、各々のポリペプチド同士の構造相補性に基づいて、構造相補性が所定の水準以上である結合体の立体構造モデルを選択するため、その後に行う結合体の立体構造モデルの適合性の評価の際の計算負担が軽減され、複数のポリペプチド同士の結合体の立体構造モデルの適合性を効率良く評価することができる。   In addition, according to the conjugate model evaluation apparatus 100 according to the present embodiment, in order to select a three-dimensional structure model of a conjugate whose structural complementarity is equal to or higher than a predetermined level based on the structural complementarity between the polypeptides. Then, the computational burden in the subsequent evaluation of the suitability of the conformation model of the conjugate is reduced, and the suitability of the conformation model of the conjugate between a plurality of polypeptides can be efficiently evaluated.

また、本実施形態に係る結合体モデル評価装置100によれば、上述の環境適合性および距離依存型ポテンシャルエネルギーにくわえて、さらに構造相補性を評価することができるので、複数のポリペプチド同士の結合体の立体構造モデルの適合性の評価精度を維持しつつ、上述の通り計算負担を軽減して効率良く評価することができる。   Moreover, according to the conjugate model evaluation apparatus 100 according to the present embodiment, in addition to the environmental compatibility and the distance-dependent potential energy described above, structural complementarity can be further evaluated. While maintaining the accuracy of evaluating the conformity of the three-dimensional structure model of the combined body, the calculation burden can be reduced and the evaluation can be efficiently performed as described above.

また、本実施形態に係る結合体モデル評価装置100によれば、構造相補性評価部106は、ポリペプチド同士の形状相補性評価部と、各々のポリペプチド同士の脱溶媒和と、各々のポリペプチド同士の静電相互作用と、の3種類の特性により構造相補性を評価するZDOCKを用いるため、複数のポリペプチド同士の結合体における立体構造モデルの構造相補性の評価精度が向上する。   Further, according to the conjugate model evaluation apparatus 100 according to the present embodiment, the structural complementarity evaluation unit 106 includes a shape complementarity evaluation unit between polypeptides, a desolvation between each polypeptide, and each polymorphism. Since ZDOCK that evaluates structural complementarity based on the three types of properties of electrostatic interaction between peptides is used, the accuracy of structural complementarity evaluation of a three-dimensional structure model in a conjugate of a plurality of polypeptides is improved.

また、本実施形態に係る結合体モデル評価装置100によれば、上述の総合適合性評価部130は、上述の各指標にくわえて、さらにPDBからインターネットなどを経由して得られる結合関与指標(Biological Data)に基づいて総合適合性を評価するため、既知の情報を有効に利用することができ、複数のポリペプチド同士の結合体の立体構造モデルの適合性の評価精度が向上する。   In addition, according to the combined body model evaluation apparatus 100 according to the present embodiment, the above-described comprehensive compatibility evaluation unit 130 includes, in addition to the above-described indexes, a binding participation index (from the PDB via the Internet or the like) ( Since comprehensive compatibility is evaluated based on (Biological Data), known information can be used effectively, and the accuracy of evaluating the conformity of a three-dimensional structure model of a conjugate of a plurality of polypeptides is improved.

また、本実施形態に係る結合体モデル評価装置100によれば、上述の環境適合性および距離依存型ポテンシャルエネルギーにくわえて、さらにアミノ酸残基の形成する2次構造に基づいて、結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成するため、環境適合性をさらに精度良く評価することができる。   Moreover, according to the conjugate model evaluation apparatus 100 according to the present embodiment, in addition to the environmental compatibility and the distance-dependent potential energy described above, the conjugate three-dimensional structure is further based on the secondary structure formed by amino acid residues. Since the environmental compatibility index for the water solubility of the entire structural model and the internal environment of the protein is generated, the environmental compatibility can be evaluated with higher accuracy.

また、本実施形態に係る結合体モデル評価装置100によれば、上述の総合適合性評価部130において、複数の正規化部606、614、622、626、630により、各指標をそれぞれ正規化しているため、各指標について同等の基準に基づいて、各指標を合成して総合適合性指標を生成することができる。   Further, according to the combined body model evaluation apparatus 100 according to the present embodiment, each index is normalized by the plurality of normalization units 606, 614, 622, 626, and 630 in the overall suitability evaluation unit 130 described above. Therefore, based on an equivalent standard for each index, each index can be synthesized to generate a comprehensive suitability index.

図17は、CAPRIの歴史について説明するための概念図である。また、図18は、CAPRIの出題テーマについて説明するための概念図である。さらに、図19は、実施形態1に係る結合体モデル評価装置を用いてCAPRIに応募したコンテスト審査結果を説明するための概念図である。   FIG. 17 is a conceptual diagram for explaining the history of CAPRI. FIG. 18 is a conceptual diagram for explaining a CAPRI question theme. Further, FIG. 19 is a conceptual diagram for explaining a contest examination result applied for CAPRI using the combined body model evaluation apparatus according to the first embodiment.

CAPRIとは、Critical Assesment of Prediction of Interactionsの略称であり、2つの構造既知タンパク質の複合体状態(原子座標)を予測する(タンパク質−タンパク質ドッキング)コンテストである。各チームは、10モデルまで投稿可能であり、High、Acceptable、Incorrect、Clashes−incorrectで評価される。   CAPRI is an abbreviation for Critical Assessment of Prediction of Interactions, and is a (protein-protein docking) contest that predicts the complex state (atomic coordinates) of two proteins with known structures. Each team can post up to 10 models and is evaluated with High, Acceptable, Incorrect, Classes-indirect.

図17に示すように、直近では、2005年1月〜2月に第6ラウンドが開催されており、現在は第7ラウンドの途中である(第7ラウンドのコンテスト審査結果は未だ公開されていない)。また、図18に示すように、出題テーマは、バラバラのレセプタータンパク質およびリガンドタンパク質の単量体として出題される。投稿者は、この出題テーマに対し、レセプタータンパク質−リガンドタンパク質結合体の立体構造モデルとして回答することとなっている。   As shown in FIG. 17, the 6th round was held recently in January-February 2005 and is currently in the middle of the 7th round (the results of the 7th round contest have not yet been released). ). Further, as shown in FIG. 18, the question theme is set as a monomer of disjoint receptor protein and ligand protein. The contributor is to answer this question as a three-dimensional model of the receptor protein-ligand protein conjugate.

本発明者の属するCBRCチームが、結合体モデル評価装置100を用いて、第7ラウンドの出題テーマの一つ(Target21)に応募したところ、コンテスト審査結果は、図19示すように、37予測チームにより337構造が提出されたが、CBRCチームの予測した10構造のうち2構造が“Acceptable”という高い評価を得た。図19の右上に、それぞれの評価結果の割合をグラフとして示す。なお、3337構造の評価結果として、“High”に該当する構造はなかった。このグラフから、結合体モデル評価装置100を用いた評価結果の精度が高いことがわかる。   When the CBRC team to which the present inventor applied was applied to one of the 7th round themes (Target 21) using the combined model evaluation device 100, the contest examination result was 37 prediction teams as shown in FIG. The 337 structure was submitted, but two of the 10 structures predicted by the CBRC team were highly evaluated as “Acceptable”. In the upper right of FIG. 19, the ratio of each evaluation result is shown as a graph. As a result of evaluating the 3337 structure, there was no structure corresponding to “High”. From this graph, it can be seen that the accuracy of the evaluation result using the combined body model evaluation apparatus 100 is high.

CBRCチームの予測した、“Acceptable”という高い評価を得た構造の一つ(CBRC(model 8))を図19の下部の右側に示す。また、図19の下部の左側には、第7ラウンドの解答(Native:1ZHl)を示す。すなわち、図19の下部では、Target21(Orc1/Sir1結合体)のCBRC予測結果(model 8)と、天然構造との比較が行われている。なお、いずれも、Orc(薄い方のタンパク質)で構造の重ね合わせを行った後のSir(濃い方のタンパク質)の配置比較を行っている。   One of the structures (CBRC (model 8)) predicted by the CBRC team and highly evaluated as “Acceptable” is shown on the right side at the bottom of FIG. In addition, on the left side of the lower part of FIG. 19, the answer of the seventh round (Native: 1ZHl) is shown. That is, in the lower part of FIG. 19, the CBRC prediction result (model 8) of Target 21 (Orc1 / Sir1 conjugate) is compared with the natural structure. In either case, the arrangement of Sir (the darker protein) after comparison of the structure with Orc (the thinner protein) is compared.

すなわち、繰り返しになるが、本実施形態に係る結合体モデル評価装置100によれば、図17〜図19の結果からもわかるように、各々のポリペプチド同士の構造相補性(ZDOCKの指標)に基づいて、構造相補性が所定の水準以上である結合体の立体構造モデルを選択し、その後に、通常はポリペプチド単体の立体構造の評価に用いられるCQS(Verify 3DおよびProsa 2003の組合せ)を、結合体の立体構造モデル全体について評価し、これらに基づいて結合体の立体構造モデルの適合性を評価することにより、複数のポリペプチド同士の結合体の立体構造モデルの適合性を精度良く評価することができる。   That is, although it is repeated, according to the conjugate model evaluation apparatus 100 according to the present embodiment, as can be seen from the results of FIGS. 17 to 19, the structural complementarity (index of ZDOCK) of each polypeptide is determined. Based on this, a three-dimensional structure model of a conjugate having a structural complementarity equal to or higher than a predetermined level is selected, and then CQS (a combination of Verify 3D and Prosa 2003), which is usually used for evaluating the three-dimensional structure of a single polypeptide. Evaluate the overall conformation model of the conjugate and evaluate the suitability of the conformation model of the conjugate based on these to accurately evaluate the conformity of the conformation model of the conjugate between multiple polypeptides. can do.

<実施形態2>
実施形態2では、実施形態1に係る結合体モデル評価装置100の結合体モデル取得部102をモデル生成部800に置換した実施形態について説明する。なお、特に言及する場合をのぞき、この実施形態2の構成は、実施形態1の構成と同様である。
<Embodiment 2>
In the second embodiment, an embodiment in which the combined model obtaining unit 102 of the combined model evaluation apparatus 100 according to the first embodiment is replaced with a model generating unit 800 will be described. Note that the configuration of the second embodiment is the same as the configuration of the first embodiment except when specifically mentioned.

図20は、実施形態2に係る結合体モデル評価装置のモデル生成部の構成の詳細を示す機能ブロック図である。モデル生成部800には、第一ポリペプチド(レセプタータンパク質)の各々の立体構造モデルを取得する第一モデル取得部802が設けられている。こうして得られた第一ポリペプチドの立体構造モデルは、第一モデル記憶部708に格納される。   FIG. 20 is a functional block diagram illustrating details of the configuration of the model generation unit of the combined body model evaluation apparatus according to the second embodiment. The model generation unit 800 is provided with a first model acquisition unit 802 that acquires a three-dimensional structure model of each first polypeptide (receptor protein). The three-dimensional structure model of the first polypeptide thus obtained is stored in the first model storage unit 708.

一方、モデル生成部800には、第二ポリペプチド(リガンドタンパク質)の各々の立体構造モデルを取得する第二モデル取得部804が設けられている。こうして得られた第二ポリペプチドの立体構造モデルは、第二モデル記憶部716に格納される。   On the other hand, the model generation unit 800 is provided with a second model acquisition unit 804 that acquires each three-dimensional structure model of the second polypeptide (ligand protein). The three-dimensional structure model of the second polypeptide thus obtained is stored in the second model storage unit 716.

こうして得られた第一ポリペプチドの各々の立体構造モデルおよび第二ポリペプチドの各々の立体構造モデルに基づいて、結合体モデル生成部718は、第一ポリペプチドおよび第二ポリペプチドの結合体(レセプター−リガンド結合体)の立体構造モデルを生成する。こうして得られた結合体の立体構造モデルは、結合体モデル記憶部104に格納される。例えば、結合体モデル生成部718としては、上述のZDOCKプログラムを好適に用いることができる。   Based on the three-dimensional structure model of each of the first polypeptides thus obtained and the three-dimensional structure model of each of the second polypeptides, the conjugate model generation unit 718 generates a conjugate of the first polypeptide and the second polypeptide ( A three-dimensional model of the receptor-ligand conjugate) is generated. The three-dimensional structure model of the combined body thus obtained is stored in the combined body model storage unit 104. For example, as the combined model generation unit 718, the above-described ZDOCK program can be suitably used.

以下、実施形態2の作用効果について説明する。なお、特に言及する場合をのぞき、この実施形態2の作用効果は、実施形態1の作用効果と同様である。   Hereinafter, the function and effect of the second embodiment will be described. Note that the effects of the second embodiment are the same as the effects of the first embodiment except when specifically mentioned.

この実施形態2によれば、複数のポリペプチドの各々の立体構造モデルを取得した場合にも、結合体モデル生成部718により、ZDOCKのドッキングコンポーネントなどを用いて、複数のポリペプチドの結合体の立体構造モデルを生成できる。このため、実施形態2においても、その後は、実施形態1の場合と同様に、複数のポリペプチド同士の結合体の立体構造モデルの適合性を評価することができる。   According to the second embodiment, even when a three-dimensional structure model of each of a plurality of polypeptides is acquired, the conjugate model generation unit 718 uses a ZDOCK docking component or the like to generate a conjugate of a plurality of polypeptides. A three-dimensional structure model can be generated. For this reason, also in Embodiment 2, similarly to the case of Embodiment 1, the conformity of the three-dimensional structure model of the conjugate | bonded_body of several polypeptides can be evaluated.

<実施形態3>
実施形態3では、実施形態1に係る結合体モデル評価装置100の結合体モデル取得部102をモデル生成部700に置換した実施形態について説明する。なお、特に言及する場合をのぞき、この実施形態3の構成は、実施形態1の構成と同様である。
<Embodiment 3>
In the third embodiment, an embodiment in which the combined body model acquisition unit 102 of the combined body model evaluation apparatus 100 according to the first embodiment is replaced with a model generation unit 700 will be described. Note that the configuration of the third embodiment is the same as the configuration of the first embodiment except when specifically mentioned.

図21は、実施形態3に係る結合体モデル評価装置のモデル生成部の構成の詳細を示す機能ブロック図である。モデル生成部700には、第一ポリペプチド(レセプタータンパク質)の各々のアミノ酸配列を規定する情報を取得する第一配列取得部702が設けられている。こうして得られた第一ポリペプチドのアミノ酸配列は、第一配列記憶部704に格納される。   FIG. 21 is a functional block diagram illustrating details of the configuration of the model generation unit of the combined body model evaluation apparatus according to the third embodiment. The model generation unit 700 is provided with a first sequence acquisition unit 702 that acquires information defining the amino acid sequence of each first polypeptide (receptor protein). The amino acid sequence of the first polypeptide thus obtained is stored in the first sequence storage unit 704.

モデル生成部700には、第一ポリペプチドのアミノ酸配列を規定する情報に基づいて、第一ポリペプチドの各々の立体構造モデルを生成する第一モデル生成部706が設けられている。こうして得られた第一ポリペプチドの各々の立体構造モデルは、第一モデル記憶部708に格納される。   The model generation unit 700 is provided with a first model generation unit 706 that generates each three-dimensional structure model of the first polypeptide based on information defining the amino acid sequence of the first polypeptide. Each three-dimensional structure model of the first polypeptide thus obtained is stored in the first model storage unit 708.

例えば、第一モデル生成部706としては、公知のMODELLERというプログラムを好適に用いることができる。なお、第一ポリペプチドの各々の立体構造モデルの適合性は、上述のCQSプログラムを用いて確認しておくことが望ましい。   For example, as the first model generation unit 706, a known program called MODELLER can be suitably used. In addition, it is desirable to confirm the suitability of each three-dimensional structure model of the first polypeptide using the above-described CQS program.

モデル生成部700は、第二ポリペプチド(リガンドタンパク質)の各々のアミノ酸配列を規定する情報を第二配列取得部710により取得すると、第二配列記憶部712に格納し、第一ポリペプチドの場合と同様に、第二モデル生成部714により、第二ポリペプチドの各々の立体構造モデルを生成し、第二モデル記憶部716に格納する。なお、第一ポリペプチドの場合と同様の説明は、繰り返さない。   When the model generation unit 700 acquires information defining each amino acid sequence of the second polypeptide (ligand protein) by the second sequence acquisition unit 710, the model generation unit 700 stores the information in the second sequence storage unit 712. Similarly to the above, the second model generation unit 714 generates each three-dimensional structure model of the second polypeptide and stores it in the second model storage unit 716. The description similar to that for the first polypeptide will not be repeated.

こうして得られた第一ポリペプチドの各々の立体構造モデルおよび第二ポリペプチドの各々の立体構造モデルに基づいて、結合体モデル生成部718は、第一ポリペプチドおよび第二ポリペプチドの結合体(レセプター−リガンド結合体)の立体構造モデルを生成する。こうして得られた結合体の立体構造モデルは、結合体モデル記憶部104に格納される。例えば、結合体モデル生成部718としては、上述のZDOCKプログラムのドッキングコンポーネントを好適に用いることができる。   Based on the three-dimensional structure model of each of the first polypeptides thus obtained and the three-dimensional structure model of each of the second polypeptides, the conjugate model generation unit 718 generates a conjugate of the first polypeptide and the second polypeptide ( A three-dimensional model of the receptor-ligand conjugate) is generated. The three-dimensional structure model of the combined body thus obtained is stored in the combined body model storage unit 104. For example, as the combined model generation unit 718, the docking component of the above-described ZDOCK program can be suitably used.

以下、実施形態3の作用効果について説明する。なお、特に言及する場合をのぞき、この実施形態3の作用効果は、実施形態1の作用効果と同様である。   Hereinafter, the function and effect of the third embodiment will be described. Note that the effects of the third embodiment are the same as the effects of the first embodiment except when specifically mentioned.

この実施形態3によれば、複数のポリペプチドの各々のアミノ酸配列を規定する情報を取得した場合にも、第一モデル生成部706および第二モデル生成部714により複数のポリペプチドの各々の立体構造モデルを生成することができる。そして、結合体モデル生成部718により、複数のポリペプチドの各々の立体構造モデルに基づいて、複数のポリペプチドの結合体の立体構造モデルを生成できる。このため、実施形態3においても、その後は、実施形態1の場合と同様に、複数のポリペプチド同士の結合体の立体構造モデルの適合性を評価することができる。   According to the third embodiment, even when information defining the amino acid sequences of each of the plurality of polypeptides is acquired, the first model generation unit 706 and the second model generation unit 714 can obtain the three-dimensional data of each of the plurality of polypeptides. A structural model can be generated. The conjugate model generation unit 718 can generate a three-dimensional structure model of a conjugate of the plurality of polypeptides based on the three-dimensional structure model of each of the plurality of polypeptides. For this reason, also in Embodiment 3, similarly to the case of Embodiment 1, the conformity of the three-dimensional structure model of the conjugate | bonded_body of several polypeptides can be evaluated.

<実施形態4>
図22は、実施形態4に係る結合体モデル評価装置の構成の概要を示す機能ブロック図である。実施形態4に係る結合体モデル評価装置400は、適合性評価部142中に構造相補性評価部106および構造相補性指標記憶部108が設けられている点で、実施形態1に係る結合体モデル評価装置100とは異なる。また、結合体モデル評価装置400は、選択部140が設けられていない点でも、結合体モデル評価装置100とは異なる。なお、特に言及する場合をのぞき、この実施形態4の構成は、実施形態1の構成と同様である。
<Embodiment 4>
FIG. 22 is a functional block diagram illustrating an outline of the configuration of the combined model evaluation device according to the fourth embodiment. The conjugate model evaluation apparatus 400 according to the fourth embodiment is the conjugate model according to the first embodiment in that the structural complementarity evaluation unit 106 and the structural complementarity index storage unit 108 are provided in the suitability evaluation unit 142. Different from the evaluation device 100. The combined body model evaluation apparatus 400 is different from the combined body model evaluation apparatus 100 in that the selection unit 140 is not provided. The configuration of the fourth embodiment is the same as the configuration of the first embodiment except when specifically mentioned.

図23は、実施形態4に係る結合体モデル評価装置の動作について説明するためのフローチャートである。まず、結合体モデル評価装置400は、一連の動作を開始すると、結合体モデル取得部102により、外部にて生成された結合体の立体構造モデルを取得する(S202)。   FIG. 23 is a flowchart for explaining the operation of the combined body model evaluation apparatus according to the fourth embodiment. First, when the combined body model evaluation apparatus 400 starts a series of operations, the combined body model acquisition unit 102 acquires a 3D structure model of a combined body generated externally (S202).

この際、結合体モデル評価装置400は、結合体の立体構造モデルをZDOCKの評価コンポーネントにより、ZDOCKのスコアの高い結合体の立体構造モデルを選択することを行わない点で、結合体モデル評価装置100とは異なる。   At this time, the conjugate model evaluation apparatus 400 does not select the three-dimensional structure model of the conjugate having a high ZDOCK score by using the ZDOCK evaluation component for the three-dimensional structure model of the conjugate. 100 is different.

次いで、取得した結合体の立体構造モデルは、環境適合性評価部118により、環境適合性が評価される(S204)。一方、取得した結合体の立体構造モデルは、距離依存型ポテンシャルエネルギー評価部122により、距離依存型ポテンシャルエネルギーが評価される(S206)。   Next, the environmental suitability evaluation unit 118 evaluates the environmental suitability of the acquired three-dimensional structure model of the combined body (S204). On the other hand, the distance-dependent potential energy of the acquired three-dimensional structure model of the combined body is evaluated by the distance-dependent potential energy evaluation unit 122 (S206).

また、取得した結合体の立体構造モデルは、構造相補性評価部106により、構造相補性が評価される(S208)。さらに、取得した結合体の立体構造モデルは、結合関与指標生成部により、結合関与指標が評価される(S210)。   Further, the structural complementarity evaluation unit 106 evaluates the structural complementarity of the acquired three-dimensional structure model of the combined body (S208). Furthermore, the binding participation index is evaluated by the binding participation index generation unit of the acquired three-dimensional structure model of the combined body (S210).

そして、これらの各指標に基づいて、総合適合性評価部130により、選択された結合体の立体構造モデルの総合適合性が評価される(S212)。続いて、総合適合性指標は、出力部134により、外部に出力され(S214)、一連の動作が終了する。   Then, based on each of these indices, the total suitability evaluation unit 130 evaluates the total suitability of the three-dimensional structure model of the selected conjugate (S212). Subsequently, the comprehensive suitability index is output to the outside by the output unit 134 (S214), and the series of operations ends.

以下、実施形態4の作用効果について説明する。なお、特に言及する場合をのぞき、この実施形態4の作用効果は、実施形態1の作用効果と同様である。   Hereinafter, the function and effect of the fourth embodiment will be described. Except in particular cases, the operational effects of the fourth embodiment are the same as the operational effects of the first embodiment.

この実施形態4に係る結合体モデル評価装置400によれば、通常はポリペプチド単体の立体構造の評価に用いられるVerify 3DおよびProsa 2003を、結合体の立体構造モデル全体について評価し、さらに各々のポリペプチド同士のZDOCKの評価コンポーネントのスコアについて評価し、これらに基づいて結合体の立体構造モデルの適合性を評価することにより、複数のポリペプチド同士の結合体の立体構造モデルの適合性を精度良く評価することができる。   According to the conjugate model evaluation apparatus 400 according to the fourth embodiment, Verify 3D and Prosa 2003, which are usually used for evaluating the three-dimensional structure of a single polypeptide, are evaluated for the whole three-dimensional structure model of the conjugate. By evaluating the score of the ZDOCK evaluation component between polypeptides and evaluating the conformity of the three-dimensional structure model of the conjugate based on these scores, the conformity of the three-dimensional structure model of the conjugate between multiple polypeptides is accurately determined Can be evaluated well.

また、この実施形態4に係る結合体モデル評価装置400によれば、Verify 3DおよびProsa 2003による処理を行う前に、結合体の立体構造モデルをZDOCKの評価コンポーネントにより、ZDOCKのスコアの高い結合体の立体構造モデルを選択することを行わないため、得られた結合モデルのすべてについて総合適合性の評価を行うことができ、複数のポリペプチド同士の結合体の立体構造モデルの適合性の評価精度を向上できる。   Further, according to the conjugate model evaluation apparatus 400 according to the fourth embodiment, the conjugate structure having a high ZDOCK score is obtained by using the ZDOCK evaluation component to convert the three-dimensional structure model of the conjugate before performing the processing by Verify 3D and Prosa 2003. Therefore, it is possible to evaluate the overall suitability of all of the obtained binding models, and to evaluate the conformity assessment accuracy of the conformation model of conjugates of multiple polypeptides. Can be improved.

以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。   As mentioned above, although embodiment of this invention was described with reference to drawings, these are the illustrations of this invention, Various structures other than the above are also employable.

例えば、上記実施の形態ではタンパク質−タンパク質ドッキングプログラムをZDOCKとしたが、特に限定する趣旨ではなく、他のプログラムであっても形状相補性を評価するプログラムであれば好適に使用し得る。   For example, in the above embodiment, the protein-protein docking program is ZDOCK, but there is no particular limitation, and any other program can be suitably used as long as it is a program that evaluates shape complementarity.

また、上記実施の形態では環境クラス評価部318は、18段階の環境クラスを有する構成としたが、特に限定する趣旨ではない。例えば、環境クラス評価部318は、上述の周辺極性度および溶媒露出度に基づいて、結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する6段階の環境クラスの指標(環境適合性指標)を生成してもよい。   In the above embodiment, the environment class evaluation unit 318 is configured to have 18 levels of environment classes, but the present invention is not particularly limited. For example, the environment class evaluation unit 318 has six levels of environmental class indices (environment suitability indices) for the water solubility of the entire three-dimensional structure model of the conjugate and the internal environment of the protein based on the above-described peripheral polarity and solvent exposure. May be generated.

また、上記実施の形態では環境適合性指標のベースラインをあらかじめダミーのタンパク質を用いて生成してベースライン記憶部604に格納しておき、距離依存型ポテンシャルエネルギー指標のベースラインは、ベースライン生成部610により生成しているが、特に限定する趣旨ではない。   In the above embodiment, the baseline of the environmental compatibility index is generated in advance using a dummy protein and stored in the baseline storage unit 604, and the baseline of the distance-dependent potential energy index is generated as a baseline. Although it is generated by the part 610, it is not intended to be particularly limited.

逆に、環境適合性指標のベースラインをベースライン生成部により生成し、距離依存型ポテンシャルエネルギー指標のベースラインをあらかじめダミーのタンパク質を用いて生成してベースライン記憶部に格納しておいてもよい。また、環境適合性指標および距離依存型ポテンシャルエネルギー指標のベースラインをともに、ダミーのタンパク質を用いて生成してベースライン記憶部に格納しておいてもよい。あるいは、環境適合性指標および距離依存型ポテンシャルエネルギー指標のベースラインをともに、ベースライン生成部により生成してもよい。   Conversely, a baseline for an environmental suitability index may be generated by the baseline generation unit, and a baseline for a distance-dependent potential energy index may be generated in advance using a dummy protein and stored in the baseline storage unit. Good. In addition, the baselines of the environmental compatibility index and the distance-dependent potential energy index may be generated using a dummy protein and stored in the baseline storage unit. Alternatively, both the baseline of the environmental suitability index and the distance-dependent potential energy index may be generated by the baseline generation unit.

以上のように、本発明にかかる結合体モデル評価装置は、複数のポリペプチド同士の結合体の立体構造モデルの適合性を精度良く評価することができるという効果を有し、複数のポリペプチド同士の結合体モデルを評価する結合体モデル評価装置、結合体モデル評価方法および結合体モデル評価プログラム等として有用である。   As described above, the conjugate model evaluation apparatus according to the present invention has an effect that the conformity of a three-dimensional structure model of a conjugate of a plurality of polypeptides can be accurately evaluated. It is useful as a conjugate model evaluation apparatus, a conjugate model evaluation method, a conjugate model evaluation program, etc.

実施形態1に係る結合体モデル評価装置の構成の概要を示した機能ブロック図である。FIG. 3 is a functional block diagram illustrating an outline of a configuration of a combined body model evaluation apparatus according to the first embodiment. 実施形態1における結合体の立体構造モデルの評価方法について説明するための概念図である。3 is a conceptual diagram for explaining a method for evaluating a three-dimensional structure model of a combined body in Embodiment 1. FIG. 実施形態1における構造相補性評価部の構成の詳細を示した機能ブロック図である。3 is a functional block diagram illustrating details of a configuration of a structural complementarity evaluation unit according to Embodiment 1. FIG. 実施形態1における構造相補性評価部による評価方法について説明するための概念図である。6 is a conceptual diagram for explaining an evaluation method by a structural complementarity evaluation unit in Embodiment 1. FIG. 実施形態1における環境適合性評価部の構成の詳細を示した機能ブロック図である。3 is a functional block diagram illustrating details of a configuration of an environmental suitability evaluation unit in Embodiment 1. FIG. 実施形態1における環境適合性評価部による評価方法について説明するための概念図である。It is a conceptual diagram for demonstrating the evaluation method by the environmental suitability evaluation part in Embodiment 1. FIG. 実施形態1における距離依存型ポテンシャルエネルギー評価部の構成の詳細を示した機能ブロック図である。3 is a functional block diagram illustrating details of a configuration of a distance-dependent potential energy evaluation unit according to Embodiment 1. FIG. Sippl著、1993年刊行の論文から引用した図である。It is a figure quoted from a paper published in 1993 by Shippl. Sippl著、1990年刊行の論文から引用した図である。It is a figure quoted from a paper published in 1990 by Shippl. 実施形態1における結合関与指標評価部の構成の詳細を示した機能ブロック図である。4 is a functional block diagram illustrating details of a configuration of a binding participation index evaluation unit in Embodiment 1. FIG. 実施形態1における結合関与指標評価部による評価方法について説明するための概念図である。FIG. 5 is a conceptual diagram for explaining an evaluation method by a joint participation index evaluation unit in the first embodiment. 実施形態1における総合適合性評価部の構成の詳細を示した機能ブロック図である。FIG. 3 is a functional block diagram illustrating details of a configuration of an overall compatibility evaluation unit in the first embodiment. 実施形態1における総合適合性評価部での正規化について説明するための概念図である。6 is a conceptual diagram for explaining normalization in a comprehensive suitability evaluation unit in Embodiment 1. FIG. 実施形態1に係る結合体モデル評価装置の動作について説明するためのフローチャートである。6 is a flowchart for explaining an operation of the combined body model evaluation apparatus according to the first embodiment. 実施形態1に係る結合体モデル評価装置におけるCQSの計算方法について説明するための概念図である。It is a conceptual diagram for demonstrating the calculation method of CQS in the conjugate | bonded_body model evaluation apparatus which concerns on Embodiment 1. FIG. 多数の各々のポリペプチドのCQSを計算したときのCQSの分布を示すグラフである。It is a graph which shows distribution of CQS when calculating CQS of many each polypeptide. CAPRIの歴史について説明するための概念図である。It is a conceptual diagram for demonstrating the history of CAPRI. CAPRIの出題テーマについて説明するための概念図である。It is a conceptual diagram for demonstrating the CAPRI question theme. 実施形態1に係る結合体モデル評価装置を用いてCAPRIに応募したコンテスト審査結果を説明するための概念図である。It is a conceptual diagram for demonstrating the contest examination result applied to CAPRI using the conjugate | bonded_body model evaluation apparatus which concerns on Embodiment 1. FIG. 実施形態2に係る結合体モデル評価装置のモデル生成部の構成の詳細を示す機能ブロック図である。It is a functional block diagram which shows the detail of a structure of the model production | generation part of the conjugate | bonded_body model evaluation apparatus which concerns on Embodiment 2. FIG. 実施形態3に係る結合体モデル評価装置のモデル生成部の構成の詳細を示す機能ブロック図である。It is a functional block diagram which shows the detail of a structure of the model production | generation part of the conjugate | bonded_body model evaluation apparatus which concerns on Embodiment 3. FIG. 実施形態4に係る結合体モデル評価装置の構成の概要を示す機能ブロック図である。It is a functional block diagram which shows the outline | summary of a structure of the conjugate | bonded_body model evaluation apparatus which concerns on Embodiment 4. FIG. 実施形態4に係る結合体モデル評価装置の動作について説明するためのフローチャートである。10 is a flowchart for explaining an operation of the combined body model evaluation apparatus according to the fourth embodiment.

符号の説明Explanation of symbols

100 結合体モデル評価装置
102 結合体モデル取得部
104 結合体モデル記憶部
106 構造相補性評価部
108 構造相補性指標記憶部
110 結合体モデル選択部
112 選択結合体モデル記憶部
114 結合関与情報取得部
116 結合関与情報記憶部
118 環境適合性評価部
120 環境適合性指標記憶部
122 距離依存型ポテンシャルエネルギー評価部
124 距離依存型ポテンシャルエネルギー指標記憶部
126 結合関与指標生成部
128 結合関与指標記憶部
130 総合適合性評価部
132 総合適合性指標記憶部
134 出力部
140 選択部
142 適合性評価部
202 形状相補性評価部
204 形状相補性指標記憶部
206 脱溶媒和評価部
208 脱溶媒和指標記憶部
210 静電相互作用評価部
212 静電相互作用指標記憶部
214 指標合成部
302 周辺極性度評価部
304 周辺極性度記憶部
306 溶媒露出度評価部
308 溶媒露出度記憶部
310 2次構造評価部
312 2次構造記憶部
318 環境クラス評価部
320 環境クラス記憶部
322 指標変換部
324 全アミノ酸指標合成部
402 残基ペア距離評価部
404 残基ペア距離記憶部
406 残基ペア距離依存型ポテンシャルエネルギー評価部
408 残基ペア距離依存型ポテンシャルエネルギー指標記憶部
410 全アミノ酸指標合成部
502 結合関与アミノ酸特定部
504 結合関与アミノ酸記憶部
506 結合関与アミノ酸カウント部
604 ベースライン記憶部
606 正規化部
608 正規化環境適合性指標記憶部
610 ベースライン生成部
612 ベースライン記憶部
614 正規化部
616 正規化距離依存型ポテンシャルエネルギー指標記憶部
618 CQS評価部
620 CQS記憶部
622 正規化部
624 正規化CQS記憶部
626 正規化部
628 正規化結合関与指標記憶部
630 正規化部
632 正規化構造相補性指記憶部
634 指標合成部
700 モデル生成部
702 第一配列取得部
704 第一配列記憶部
706 第二モデル生成部
708 第二モデル記憶部
710 第二配列取得部
712 第二配列記憶部
714 第二モデル生成部
716 第二モデル記憶部
718 結合体モデル生成部
800 モデル生成部
802 第一モデル取得部
804 第二モデル取得部
DESCRIPTION OF SYMBOLS 100 Conjugate model evaluation apparatus 102 Conjugate model acquisition part 104 Conjugate model memory | storage part 106 Structural complementarity evaluation part 108 Structural complementarity index memory | storage part 110 Conjugation model selection part 112 Selective conjugate model memory | storage part 114 Binding participation information acquisition part 116 Binding Involvement Information Storage Unit 118 Environmental Suitability Evaluation Unit 120 Environmental Suitability Index Storage Unit 122 Distance Dependent Potential Energy Evaluation Unit 124 Distance Dependent Potential Energy Index Storage Unit 126 Binding Involvement Index Generation Unit 128 Binding Involvement Index Storage Unit 130 Conformity evaluation unit 132 Total compatibility index storage unit 134 Output unit 140 Selection unit 142 Conformity evaluation unit 202 Shape complementarity evaluation unit 204 Shape complementarity index storage unit 206 Desolvation evaluation unit 208 Desolvation index storage unit 210 Static Electric interaction evaluation unit 212 Electrostatic interaction index storage unit 21 Index synthesis unit 302 Peripheral polarity evaluation unit 304 Peripheral polarity storage unit 306 Solvent exposure evaluation unit 308 Solvent exposure storage unit 310 Secondary structure evaluation unit 312 Secondary structure storage unit 318 Environmental class evaluation unit 320 Environmental class storage unit 322 Index conversion unit 324 Total amino acid index synthesis unit 402 Residue pair distance evaluation unit 404 Residue pair distance storage unit 406 Residue pair distance dependent potential energy evaluation unit 408 Residue pair distance dependent potential energy index storage unit 410 Total amino acid index Synthesis unit 502 Binding-related amino acid identification unit 504 Binding-related amino acid storage unit 506 Binding-related amino acid count unit 604 Baseline storage unit 606 Normalization unit 608 Normalized environment suitability index storage unit 610 Baseline generation unit 612 Baseline storage unit 614 Normal 616 Normalization distance dependent type Temporal energy index storage unit 618 CQS evaluation unit 620 CQS storage unit 622 Normalization unit 624 Normalization CQS storage unit 626 Normalization unit 628 Normalization binding participation index storage unit 630 Normalization unit 632 Normalized structure complementation finger storage unit 634 Index Synthesis unit 700 Model generation unit 702 First sequence acquisition unit 704 First sequence storage unit 706 Second model generation unit 708 Second model storage unit 710 Second sequence acquisition unit 712 Second sequence storage unit 714 Second model generation unit 716 First Two model storage unit 718 Combined model generation unit 800 Model generation unit 802 First model acquisition unit 804 Second model acquisition unit

Claims (16)

複数のポリペプチド同士の結合体モデルを評価する結合体モデル評価装置であって、
前記複数のポリペプチドの各々の立体構造モデルに基づいて生成された、前記結合体の立体構造モデルを取得する結合体モデル取得部と、
前記結合体の立体構造モデルにおけるアミノ酸残基ごとの周辺極性度および前記アミノ酸残基ごとの側鎖の溶媒露出度に基づいて、前記結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成する環境適合性評価部と、
前記結合体の立体構造モデルにおけるアミノ酸残基ペアごとの距離依存型ポテンシャルエネルギーに基づいて、前記結合体の立体構造モデル全体の距離依存型ポテンシャルエネルギー指標を生成する距離依存型ポテンシャルエネルギー評価部と、
前記結合体の立体構造モデルの前記環境適合性指標および前記距離依存型ポテンシャルエネルギー指標に基づいて、前記結合体の立体構造モデルの総合適合性指標を生成する総合適合性評価部と、
前記総合適合性指標を出力する出力部と、
を備えることを特徴とする結合体モデル評価装置。
A conjugate model evaluation apparatus for evaluating a conjugate model of a plurality of polypeptides,
A conjugate model acquisition unit that acquires a three-dimensional structure model of the conjugate, which is generated based on the three-dimensional structure model of each of the plurality of polypeptides;
Based on the peripheral polarity for each amino acid residue in the three-dimensional structure model of the conjugate and the degree of solvent exposure of the side chain for each amino acid residue, the water solubility of the whole three-dimensional model of the conjugate and the environment for the internal environment of the protein An environmental suitability assessment unit that generates a suitability index;
A distance-dependent potential energy evaluation unit that generates a distance-dependent potential energy index for the entire three-dimensional structure model of the conjugate based on the distance-dependent potential energy of each amino acid residue pair in the three-dimensional structure model of the conjugate;
A comprehensive suitability evaluation unit that generates a comprehensive suitability index of the three-dimensional structure model of the conjugate based on the environmental suitability index of the three-dimensional structure model of the conjugate and the distance-dependent potential energy index;
An output unit for outputting the comprehensive suitability index;
A combined body model evaluation apparatus comprising:
請求項1記載の結合体モデル評価装置において、
前記環境適合性評価部は、さらに前記アミノ酸残基の形成する2次構造に基づいて、前記結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成することを特徴とする結合体モデル評価装置。
The combined body model evaluation apparatus according to claim 1,
The environmental suitability evaluation unit further generates water compatibility of the entire three-dimensional structure model of the conjugate and an environmental suitability index for the protein internal environment based on the secondary structure formed by the amino acid residue. A combined model evaluation device.
請求項1または2記載の結合体モデル評価装置において、
前記結合体の立体構造モデルにおける前記各々のポリペプチド同士の構造相補性に基づいて、前記結合体の構造相補性指標を生成する構造相補性評価部をさらに備え、
前記総合適合性評価部は、さらに前記構造相補性指標に基づいて、前記総合適合性指標を生成することを特徴とする結合体モデル評価装置。
In the combined body model evaluation apparatus of Claim 1 or 2,
A structural complementarity evaluation unit that generates a structural complementarity index of the conjugate based on the structural complementarity between the polypeptides in the three-dimensional structure model of the conjugate;
The comprehensive compatibility evaluation unit further generates the comprehensive compatibility index based on the structural complementarity index.
請求項3に記載の結合体モデル評価装置において、
前記構造相補性評価部は、
前記各々のポリペプチド同士の形状相補性と、
前記各々のポリペプチド同士の脱溶媒和と、
前記各々のポリペプチド同士の静電相互作用と、
に基づいて、前記結合体の構造相補性指標を生成することを特徴とする結合体モデル評価装置。
In the combined body model evaluation apparatus according to claim 3,
The structural complementarity evaluation unit is:
Shape complementarity between each of the polypeptides,
Desolvation of each of the polypeptides;
Electrostatic interaction between each of the polypeptides;
Based on the above, a conjugate model evaluation apparatus, which generates a structural complementarity index of the conjugate.
複数のポリペプチド同士の結合体モデルを評価する結合体モデル評価装置であって、
前記複数のポリペプチドの各々の立体構造モデルに基づいて生成された、複数の前記結合体の立体構造モデルを取得する結合体モデル取得部と、
前記結合体の立体構造モデルにおける前記各々のポリペプチド同士の構造相補性に基づいて、前記結合体の構造相補性指標を生成する構造相補性評価部と、
前記複数の結合体の立体構造モデルから、前記構造相補性指標が閾値以上である前記結合体の立体構造モデルを選択する結合体モデル選択部と、
前記選択された結合体の立体構造モデルにおけるアミノ酸残基ごとの周辺極性度および前記アミノ酸残基ごとの側鎖の溶媒露出度に基づいて、前記結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成する環境適合性評価部と、
前記選択された結合体の立体構造モデルにおけるアミノ酸残基ペアごとの距離依存型ポテンシャルエネルギーに基づいて、前記選択された結合体の立体構造モデル全体の距離依存型ポテンシャルエネルギー指標を生成する距離依存型ポテンシャルエネルギー評価部と、
前記選択された結合体の立体構造モデルの前記環境適合性指標および前記の距離依存型ポテンシャルエネルギー指標に基づいて、前記選択された結合体の立体構造モデルの総合適合性指標を生成する総合適合性評価部と、
前記総合適合性指標を出力する出力部と、
を備えることを特徴とする結合体モデル評価装置。
A conjugate model evaluation apparatus for evaluating a conjugate model of a plurality of polypeptides,
A conjugate model acquisition unit that acquires a plurality of three-dimensional structure models of the conjugates generated based on the three-dimensional structure model of each of the plurality of polypeptides;
A structural complementarity evaluation unit that generates a structural complementarity index of the conjugate based on the structural complementarity between the polypeptides in the three-dimensional structure model of the conjugate;
A conjugate model selection unit that selects a three-dimensional structure model of the conjugate whose structural complementarity index is equal to or greater than a threshold value from the three-dimensional structure models of the plurality of conjugates;
Based on the peripheral polarity for each amino acid residue in the three-dimensional structure model of the selected conjugate and the degree of solvent exposure of the side chain for each amino acid residue, the water solubility of the whole three-dimensional model of the conjugate and the protein interior An environmental suitability evaluation unit that generates an environmental suitability index for the environment;
A distance-dependent type that generates a distance-dependent potential energy index of the entire three-dimensional structure model of the selected conjugate based on a distance-dependent potential energy for each amino acid residue pair in the three-dimensional structure model of the selected conjugate A potential energy evaluation unit;
Based on the environmental suitability index of the three-dimensional structure model of the selected conjugate and the distance-dependent potential energy index, an overall suitability for generating a total suitability index of the three-dimensional structure model of the selected conjugate An evaluation unit;
An output unit for outputting the comprehensive suitability index;
A combined body model evaluation apparatus comprising:
請求項5記載の結合体モデル評価装置において、
前記環境適合性評価部は、さらに前記アミノ酸残基の形成する2次構造に基づいて、前記結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成することを特徴とする結合体モデル評価装置。
In the combined body model evaluation apparatus of Claim 5,
The environmental suitability evaluation unit further generates water compatibility of the entire three-dimensional structure model of the conjugate and an environmental suitability index for the protein internal environment based on the secondary structure formed by the amino acid residue. A combined model evaluation device.
請求項5または6記載の結合体モデル評価装置において、
前記総合適合性評価部は、さらに前記構造相補性指標に基づいて、前記総合適合性指標を生成することを特徴とする結合体モデル評価装置。
The combined body model evaluation apparatus according to claim 5 or 6,
The comprehensive compatibility evaluation unit further generates the comprehensive compatibility index based on the structural complementarity index.
請求項5乃至7いずれかに記載の結合体モデル評価装置において、
前記構造相補性評価部は、
前記各々のポリペプチド同士の形状相補性と、
前記各々のポリペプチド同士の脱溶媒和と、
前記各々のポリペプチド同士の静電相互作用と、
に基づいて、前記結合体の構造相補性指標を生成することを特徴とする結合体モデル評価装置。
In the combined body model evaluation apparatus in any one of Claims 5 thru | or 7,
The structural complementarity evaluation unit is:
Shape complementarity between each of the polypeptides,
Desolvation of each of the polypeptides;
Electrostatic interaction between each of the polypeptides;
Based on the above, a conjugate model evaluation apparatus, which generates a structural complementarity index of the conjugate.
請求項1乃至8いずれかに記載の結合体モデル評価装置において、
前記各々のポリペプチドのアミノ酸残基のうち、他のポリペプチドとの結合に関与するアミノ酸残基を規定する既知の結合関与情報を取得する結合関与情報取得部と、
前記各々のポリペプチドの立体構造モデルの前記既知の結合関与情報に基づいて、前記結合体の立体構造モデル全体における結合関与指標を生成する結合関与指標生成部と、
をさらに備え、
前記総合適合性評価部は、さらに前記結合関与指標に基づいて、前記総合適合性指標を生成することを特徴とする結合体モデル評価装置。
In the combined body model evaluation apparatus in any one of Claims 1 thru | or 8,
Of the amino acid residues of each polypeptide, a binding participation information acquisition unit for acquiring known binding participation information that defines amino acid residues involved in binding to other polypeptides,
A binding participation index generation unit that generates a binding participation index in the entire three-dimensional structure model of the conjugate based on the known binding participation information of the three-dimensional structure model of each polypeptide;
Further comprising
The comprehensive suitability evaluation unit further generates the comprehensive suitability index based on the binding participation index.
請求項1乃至9いずれかに記載の結合体モデル評価装置において、
前記複数のポリペプチドの各々の立体構造モデルを取得する各々モデル取得部と、
前記複数のポリペプチドの各々の立体構造モデルに基づいて、前記結合体の立体構造モデルを生成する結合体モデル生成部と、
をさらに備えることを特徴とする結合体モデル評価装置。
In the combined body model evaluation apparatus in any one of Claims 1 thru | or 9,
Each model acquisition unit for acquiring a three-dimensional structure model of each of the plurality of polypeptides;
A conjugate model generation unit for generating a three-dimensional structure model of the conjugate based on the three-dimensional structure model of each of the plurality of polypeptides;
The combined body model evaluation apparatus further comprising:
請求項10に記載の結合体モデル評価装置において、
前記複数のポリペプチドの各々のアミノ酸配列を規定する情報を取得する各々配列取得部と、
前記複数のポリペプチドの各々のアミノ酸配列を規定する情報に基づいて、前記複数のポリペプチドの各々の立体構造モデルを生成する単独モデル生成部と、
をさらに備えることを特徴とする結合体モデル評価装置。
The combined body model evaluation apparatus according to claim 10,
Each sequence obtaining unit for obtaining information defining an amino acid sequence of each of the plurality of polypeptides;
A single model generation unit that generates a three-dimensional structure model of each of the plurality of polypeptides based on information defining the amino acid sequences of each of the plurality of polypeptides;
The combined body model evaluation apparatus further comprising:
請求項1乃至11いずれかに記載の結合体モデル評価装置において、
前記総合適合性評価部は、前記結合体の立体構造モデルの各指標をそれぞれ正規化し、前記正規化された各指標に基づいて、前記結合体の立体構造モデルの総合適合性指標を生成することを特徴とする結合体モデル評価装置。
The combined body model evaluation apparatus according to claim 1,
The total suitability evaluation unit normalizes each index of the three-dimensional structure model of the combined body, and generates a total compatibility index of the three-dimensional structure model of the combined body based on each normalized index. An apparatus for evaluating a combined body model.
複数のポリペプチド同士の結合体モデルを評価する結合体モデル評価方法であって、
前記複数のポリペプチドの各々の立体構造モデルに基づいて生成された、前記結合体の立体構造モデルを取得するステップと、
前記結合体の立体構造モデルにおけるアミノ酸残基ごとの周辺極性度および前記アミノ酸残基ごとの側鎖の溶媒露出度に基づいて、前記結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成するステップと、
前記結合体の立体構造モデルにおけるアミノ酸残基ペアごとの距離依存型ポテンシャルエネルギーに基づいて、前記結合体の立体構造モデル全体の距離依存型ポテンシャルエネルギー指標を生成するステップと、
前記結合体の立体構造モデルの前記環境適合性指標および前記距離依存型ポテンシャルエネルギー指標に基づいて、前記結合体の立体構造モデルの総合適合性指標を生成するステップと、
前記総合適合性指標を出力するステップと、
を含むことを特徴とする結合体モデル評価方法。
A conjugate model evaluation method for evaluating a conjugate model of a plurality of polypeptides,
Obtaining a three-dimensional structure model of the conjugate generated based on the three-dimensional structure model of each of the plurality of polypeptides;
Based on the peripheral polarity for each amino acid residue in the three-dimensional structure model of the conjugate and the degree of solvent exposure of the side chain for each amino acid residue, the water solubility of the whole three-dimensional model of the conjugate and the environment for the internal environment of the protein Generating a fitness index; and
Generating a distance-dependent potential energy index for the entire three-dimensional structure model of the conjugate based on a distance-dependent potential energy for each amino acid residue pair in the three-dimensional structure model of the conjugate;
Generating an overall suitability index of the 3D structure model of the conjugate based on the environmental suitability index of the 3D structure model of the conjugate and the distance-dependent potential energy index;
Outputting the comprehensive suitability index;
A combined model evaluation method comprising:
複数のポリペプチド同士の結合体モデルを評価する結合体モデル評価方法であって、
前記複数のポリペプチドの各々の立体構造モデルに基づいて生成された、複数の前記結合体の立体構造モデルを取得するステップと、
前記結合体の立体構造モデルにおける前記各々のポリペプチド同士の構造相補性に基づいて、前記結合体の構造相補性指標を生成するステップと、
前記複数の結合体の立体構造モデルから、前記構造相補性指標が閾値以上である前記結合体の立体構造モデルを選択するステップと、
前記選択された結合体の立体構造モデルにおけるアミノ酸残基ごとの周辺極性度および前記アミノ酸残基ごとの側鎖の溶媒露出度に基づいて、前記結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成するステップと、
前記選択された結合体の立体構造モデルにおけるアミノ酸残基ペアごとの距離依存型ポテンシャルエネルギーに基づいて、前記選択された結合体の立体構造モデル全体の距離依存型ポテンシャルエネルギー指標を生成するステップと、
前記選択された結合体の立体構造モデルの前記環境適合性指標および前記距離依存型ポテンシャルエネルギーに基づいて、前記選択された結合体の立体構造モデルの総合適合性指標を生成するステップと、
を含むことを特徴とする結合体モデル評価方法。
A conjugate model evaluation method for evaluating a conjugate model of a plurality of polypeptides,
Obtaining a three-dimensional structure model of the plurality of conjugates generated based on the three-dimensional structure model of each of the plurality of polypeptides;
Generating a structural complementarity index for the conjugate based on the structural complementarity between the polypeptides in the conformational model of the conjugate;
Selecting the three-dimensional structure model of the conjugate whose structural complementarity index is equal to or greater than a threshold from the three-dimensional structure models of the plurality of conjugates;
Based on the peripheral polarity for each amino acid residue in the three-dimensional structure model of the selected conjugate and the degree of solvent exposure of the side chain for each amino acid residue, the water solubility of the whole three-dimensional model of the conjugate and the protein interior Generating an environmental suitability index for the environment;
Generating a distance-dependent potential energy index for the entire three-dimensional structure model of the selected conjugate based on the distance-dependent potential energy of each amino acid residue pair in the three-dimensional structure model of the selected conjugate;
Generating an overall suitability index of the 3D structure model of the selected conjugate based on the environmental suitability index of the 3D structure model of the selected conjugate and the distance-dependent potential energy;
A combined model evaluation method comprising:
複数のポリペプチド同士の結合体モデルを評価する処理をコンピュータに実行させるための結合体モデル評価プログラムであって、
前記複数のポリペプチドの各々の立体構造モデルに基づいて生成された、前記結合体の立体構造モデルを取得するステップと、
前記結合体の立体構造モデルにおけるアミノ酸残基ごとの周辺極性度および前記アミノ酸残基ごとの側鎖の溶媒露出度に基づいて、前記結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成するステップと、
前記結合体の立体構造モデルにおけるアミノ酸残基ペアごとの距離依存型ポテンシャルエネルギーに基づいて、前記結合体の立体構造モデル全体の距離依存型ポテンシャルエネルギー指標を生成するステップと、
前記結合体の立体構造モデルの前記環境適合性指標および前記距離依存型ポテンシャルエネルギー指標に基づいて、前記結合体の立体構造モデルの総合適合性指標を生成するステップと、
前記総合適合性指標を出力するステップと、
をコンピュータに実行させることを特徴とする結合体モデル評価プログラム。
A conjugate model evaluation program for causing a computer to execute a process for evaluating a conjugate model of a plurality of polypeptides,
Obtaining a three-dimensional structure model of the conjugate generated based on the three-dimensional structure model of each of the plurality of polypeptides;
Based on the peripheral polarity for each amino acid residue in the three-dimensional structure model of the conjugate and the degree of solvent exposure of the side chain for each amino acid residue, the water solubility of the whole three-dimensional model of the conjugate and the environment for the internal environment of the protein Generating a fitness index; and
Generating a distance-dependent potential energy index for the entire three-dimensional structure model of the conjugate based on a distance-dependent potential energy for each amino acid residue pair in the three-dimensional structure model of the conjugate;
Generating an overall suitability index of the 3D structure model of the conjugate based on the environmental suitability index of the 3D structure model of the conjugate and the distance-dependent potential energy index;
Outputting the comprehensive suitability index;
A computer-implemented model evaluation program characterized by causing a computer to execute.
複数のポリペプチド同士の結合体モデルを評価する処理をコンピュータに実行させるための結合体モデル評価プログラムであって、
前記複数のポリペプチドの各々の立体構造モデルに基づいて生成された、複数の前記結合体の立体構造モデルを取得するステップと、
前記結合体の立体構造モデルにおける前記各々のポリペプチド同士の構造相補性に基づいて、前記結合体の構造相補性指標を生成するステップと、
前記複数の結合体の立体構造モデルから、前記構造相補性指標が閾値以上である前記結合体の立体構造モデルを選択するステップと、
前記選択された結合体の立体構造モデルにおけるアミノ酸残基ごとの周辺極性度および前記アミノ酸残基ごとの側鎖の溶媒露出度に基づいて、前記結合体の立体構造モデル全体の水溶性およびタンパク質内部環境に対する環境適合性指標を生成するステップと、
前記選択された結合体の立体構造モデルにおけるアミノ酸残基ペアごとの距離依存型ポテンシャルエネルギーに基づいて、前記選択された結合体の立体構造モデル全体の距離依存型ポテンシャルエネルギー指標を生成するステップと、
前記選択された結合体の立体構造モデルの前記環境適合性指標および前記距離依存型ポテンシャルエネルギーに基づいて、前記選択された結合体の立体構造モデルの総合適合性指標を生成するステップと、
をコンピュータに実行させることを特徴とする結合体モデル評価プログラム。

A conjugate model evaluation program for causing a computer to execute a process for evaluating a conjugate model of a plurality of polypeptides,
Obtaining a three-dimensional structure model of the plurality of conjugates generated based on the three-dimensional structure model of each of the plurality of polypeptides;
Generating a structural complementarity index for the conjugate based on the structural complementarity between the polypeptides in the conformational model of the conjugate;
Selecting the three-dimensional structure model of the conjugate whose structural complementarity index is equal to or greater than a threshold from the three-dimensional structure models of the plurality of conjugates;
Based on the peripheral polarity for each amino acid residue in the three-dimensional structure model of the selected conjugate and the degree of solvent exposure of the side chain for each amino acid residue, the water solubility of the whole three-dimensional model of the conjugate and the protein interior Generating an environmental suitability index for the environment;
Generating a distance-dependent potential energy index for the entire three-dimensional structure model of the selected conjugate based on the distance-dependent potential energy of each amino acid residue pair in the three-dimensional structure model of the selected conjugate;
Generating an overall suitability index of the 3D structure model of the selected conjugate based on the environmental suitability index of the 3D structure model of the selected conjugate and the distance-dependent potential energy;
A computer-implemented model evaluation program characterized by causing a computer to execute.

JP2005239516A 2005-08-22 2005-08-22 Aggregate model evaluation device for evaluating aggregate model among plurality of polypeptides, aggregate model evaluation method and aggregate model evaluation program Pending JP2007058273A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005239516A JP2007058273A (en) 2005-08-22 2005-08-22 Aggregate model evaluation device for evaluating aggregate model among plurality of polypeptides, aggregate model evaluation method and aggregate model evaluation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005239516A JP2007058273A (en) 2005-08-22 2005-08-22 Aggregate model evaluation device for evaluating aggregate model among plurality of polypeptides, aggregate model evaluation method and aggregate model evaluation program

Publications (1)

Publication Number Publication Date
JP2007058273A true JP2007058273A (en) 2007-03-08

Family

ID=37921763

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005239516A Pending JP2007058273A (en) 2005-08-22 2005-08-22 Aggregate model evaluation device for evaluating aggregate model among plurality of polypeptides, aggregate model evaluation method and aggregate model evaluation program

Country Status (1)

Country Link
JP (1) JP2007058273A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009151406A (en) * 2007-12-19 2009-07-09 National Institute Of Advanced Industrial & Technology Protein function identification device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004086862A (en) * 2002-05-31 2004-03-18 Celestar Lexico-Sciences Inc Apparatus, method and program for processing protein interaction information, and recording medium
JP2004152029A (en) * 2002-10-30 2004-05-27 Fujitsu Ltd Function prediction support method, function prediction support program and function prediction support device
JP2005181104A (en) * 2003-12-19 2005-07-07 Hitachi Ltd High-precision docking and scoring method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004086862A (en) * 2002-05-31 2004-03-18 Celestar Lexico-Sciences Inc Apparatus, method and program for processing protein interaction information, and recording medium
JP2004152029A (en) * 2002-10-30 2004-05-27 Fujitsu Ltd Function prediction support method, function prediction support program and function prediction support device
JP2005181104A (en) * 2003-12-19 2005-07-07 Hitachi Ltd High-precision docking and scoring method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009151406A (en) * 2007-12-19 2009-07-09 National Institute Of Advanced Industrial & Technology Protein function identification device

Similar Documents

Publication Publication Date Title
Yin et al. Benchmarking AlphaFold for protein complex modeling reveals accuracy determinants
Melo et al. Statistical potentials for fold assessment
Yuan et al. Binding site detection and druggability prediction of protein targets for structure-based drug design
Clark et al. Relative binding affinity prediction of charge-changing sequence mutations with FEP in protein–protein interfaces
Yu et al. Designing template-free predictor for targeting protein-ligand binding sites with classifier ensemble and spatial clustering
Skwark et al. Improved contact predictions using the recognition of protein like contact patterns
Berrera et al. Amino acid empirical contact energy definitions for fold recognition in the space of contact maps
Shen et al. Identification of helix capping and β-turn motifs from NMR chemical shifts
Radivojac et al. Protein flexibility and intrinsic disorder
Nugent et al. Membrane protein orientation and refinement using a knowledge-based statistical potential
Hwang et al. A hybrid method for protein–protein interface prediction
Cossio et al. Exploring the universe of protein structures beyond the Protein Data Bank
Qiu et al. Ranking predicted protein structures with support vector regression
De Sancho et al. Integrated prediction of protein folding and unfolding rates from only size and structural class
Irbäck et al. Folding thermodynamics of peptides
Zhou et al. Predicting the topology of transmembrane helical proteins using mean burial propensity and a hidden‐Markov‐model‐based method
Feng et al. Four‐body contact potentials derived from two protein datasets to discriminate native structures from decoys
Liao et al. Predicting peptide binding to Major Histocompatibility Complex molecules
Viswanath et al. Improving ranking of models for protein complexes with side chain modeling and atomic potentials
Pokarowski et al. Inferring ideal amino acid interaction forms from statistical protein contact potentials
Kinjo et al. Predicting absolute contact numbers of native protein structure from amino acid sequence
Xie et al. Predicting protein–protein association rates using coarse-grained simulation and machine learning
Krüger et al. DrugScorePPI knowledge-based potentials used as scoring and objective function in protein-protein docking
Xue et al. Predicting residue–residue contact maps by a two‐layer, integrated neural‐network method
Zheng et al. Analysis of conformational B-cell epitopes in the antibody-antigen complex using the depth function and the convex hull

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070314

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100326

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100803