JPWO2007004643A1 - 3次元構造活性相関法と共に利用される分子重ね合わせ方法 - Google Patents

3次元構造活性相関法と共に利用される分子重ね合わせ方法 Download PDF

Info

Publication number
JPWO2007004643A1
JPWO2007004643A1 JP2007524073A JP2007524073A JPWO2007004643A1 JP WO2007004643 A1 JPWO2007004643 A1 JP WO2007004643A1 JP 2007524073 A JP2007524073 A JP 2007524073A JP 2007524073 A JP2007524073 A JP 2007524073A JP WO2007004643 A1 JPWO2007004643 A1 JP WO2007004643A1
Authority
JP
Japan
Prior art keywords
dimensional structure
molecule
structure data
conformer
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007524073A
Other languages
English (en)
Inventor
孝行 小谷
孝行 小谷
邦彦 東浦
邦彦 東浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Zoki Pharmaceutical Co Ltd
Original Assignee
Nippon Zoki Pharmaceutical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Zoki Pharmaceutical Co Ltd filed Critical Nippon Zoki Pharmaceutical Co Ltd
Publication of JPWO2007004643A1 publication Critical patent/JPWO2007004643A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures

Landscapes

  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

仮想空間において、構造活性相関解析を指標として複数の分子の3次元構造データを重ね合わせる分子重ね合わせ方法であって、解析対象分子群から1つの分子の3次元構造データを取り除いた分子群で、3次元構造データによる第1の3次元構造活性相関解析を行いモデルの質を示す指標を求める工程Aと、すべての分子について工程Aを繰り返す工程Bと、工程Bで得られる第1の3次元構造活性相関解析よりモデルの質を示す指標を並べ替え、最もモデルの質を低下させている分子を求める工程Cと、工程Cで求めた分子のコンフォマーの3次元構造データを順次変化させて第2の3次元構造活性相関解析を行い、選択するコンフォマーを決定する工程Dと、収束条件を満たすまで工程Aに戻る工程Eとを含むことを特徴とする分子重ね合わせ方法を提供する。

Description

本発明は、統計的手法を用いて化合物の構造と生理活性との相関を定量的に解析する3次元構造活性相関(3 Dimensional Quantitative Structure-Activity Relationships: 3D QSAR)法と共に利用される仮想空間における分子重ね合わせ法及びそのプログラムに関する。
仮想空間において、統計的手法を用いて化合物の構造と生理活性との相関を定量的に解析する3次元構造活性相関解析を実施する際には、先ず分子の重ね合わせが行われなければならない。仮想空間にて分子類似性を指標として行われる従来の分子重ね合わせ法は、分子の物理化学的特徴だけに基づいて重ね合わせを行うものである。すなわち、分子の持つ活性値(薬効や目的とする物性)とは無関係に重ね合わせが行われている。しかし、物理化学的な特徴が最も高い類似性を示す重ね合わせモデルを構造活性相関解析にそのまま用いても、良好な結果は必ずしも得られていない。
また、通常の3D QSAR解析では、多くのコンフォマーの中から解析に用いるコンフォマーを選択する必要がある。一般的には分子類似性などを指標としてコンフォマーを選択した後に3D QSAR解析を行うが、そのように選択されるコンフォマーが最もよい3D QSAR解析結果を与えるコンフォマーである保証はない。
一方で、生物活性や物性を指標として重ね合わせる手法としてファーマコフォアを指標とする方法が既にあり、非特許文献1に示されるDISCO、非特許文献2に示されるCatalyst、若しくはApex-3Dなどが知られている。これらの手法は、親水性基や電気的な相互作用を行うであろう置換基を重ね合わせることによりファーマコフォアモデルを作成し、引き続いて3D QSAR解析を行うことにより目的とするQSAR解析結果を得ようとするものである。医薬分子設計研究所の板井らは、分子の自由度を考慮した分子重ね合わせを行うため、標的蛋白側の水素結合位置と疎水性グループの位置を表すダミー原子の相対位置に基づき、分子のコンフォマーと相対位置の可能性を網羅的に探索し、QSAR解析を行い、重ね合わせモデルを決定している。
しかしながら、ファーマコフォアモデルを構築後に、非特許文献3に示されるCoMFA法などの3D QSAR解析を行う場合、ファーマコフォアモデル構築と3D QSAR解析のそれぞれの過程で用いられる相互作用計算方法が異なるため、用いた計算方法に応じて、異なる結果が与えられる危険性が内在する。
また、多くのコンフォマーを考慮する場合に、どの分子についてコンフォマーを入れ替えればモデルの質が向上するかという知見を得る方法について、現状確立された技術があるとはいえない。
さらに、従来の3D QSAR解析は計算量の増大と共に、計算機において多くのメモリー領域が必要となるため、通常のPC(パーソナルコンピュータ)で簡便に3D QSAR解析を行うことが困難である。
Martin, Y. C.; Bures, M. G.; Danaher, E. A.; DeLazzer, J.; Lico, I.; Pavlik, P. A. A fast new approach to pharmacophore mapping and its application to dopaminergic and benzodiazepine agonists. J. Comput. Aided Mol. Des. 1993, 7, 83-102. Greene, J.; Kahn, S.; Savoj, H.; Sprague, P.; Teig, S. Chemical Function Queries for 3D Database Search. J. Chem. Inf. Comput. Sci., 1994, 34, 1297-1308. Cramer III, R. D.; Patterson, D. E.; Bunce, J. D. Comparative Molecular Field Analysis (CoMFA). 1. Effect of Shape on Binding of Steroids to Carrier Proteins. J. Am. Chem. Soc. 1988, 110, 5959-5967.
以上のことから、従来の分子重ね合わせ法には以下の欠点がある。
(1)3D QSAR解析を指標として重ね合わせを行っていないため、3D QSAR解析に用いた重ね合わせモデルが最もよい3D QSAR解析結果を与えるコンフォマーである保証はない。
(2)コンフォマーを入れ替え、3D QSAR解析の質を向上させるための分子を論理的に選択することはできない。
(3)3D QSAR解析結果やモデルの質が良好な場合においても、解析分子群のうち任意の分子が、他の分子と異なった空間を占めるモデルを与えることがある。すなわち、他の分子と大きく異なった空間は、本来分子が蛋白質と接触あるいはタンパク質に埋没する空間であるため、他の分子はこの空間をさけて重なり合ったが特定の分子のみこの領域を占有する、というようなことが生じる可能性も否定できない。
本発明は、これらの欠点を解消することを目的とするものである。
そこで、本発明に係る、仮想空間において、構造活性相関解析を指標として複数の分子の3次元構造データを重ね合わせる分子重ね合わせ方法は、
解析対象分子群から1つの分子の3次元構造データを取り除いた分子群で、3次元構造データによる第1の3次元構造活性相関解析を行いモデルの質を示す指標を求める工程Aと、
すべての分子について工程Aを繰り返す工程Bと、
工程Bで得られる第1の3次元構造活性相関解析よりモデルの質を示す指標を並べ替え、最もモデルの質を低下させている分子を求める工程Cと、
工程Cで求めた分子のコンフォマーの3次元構造データを順次変化させて第2の3次元構造活性相関解析を行い、選択するコンフォマーを決定する工程Dと、
収束条件を満たすまで工程Aに戻る工程Eとを含むことを特徴とする。
このうち、工程Aは、
計算に用いる複数の分子の3次元構造データを読み込む工程A1と、
前工程で1つの分子の3次元構造データが取り除かれている場合に取り除いたデータを戻す工程A2と、
読み込んだ複数の分子の3次元構造データから、1つの分子の3次元構造データを取り除いた分子群を作成する工程A3と、
1つの分子の3次元構造データを取り除いた分子群について、3次元構造データによる第1の3次元構造活性相関解析でモデルの質を計算する工程A4と、
計算した1つの分子の3次元構造データを取り除いた分子群についての第1の3次元構造活性相関解析の結果を保持する工程A5とを含む。
工程Cは、
保持されている1つの分子の3次元構造データを取り除いた分子群についての第1の3次元構造活性相関解析結果を並べ替える工程C1と、
1つの分子の3次元構造データを取り除いた分子群についての第1の3次元構造活性相関解析結果で最もモデルの質を低下させているものを求め、その分子群において取り除かれていた分子を求める工程C2とを含む。
工程Dは、
工程Cで求めた分子についてコンフォマーの3次元構造データを新たに発生させる工程D1と、
工程Cで求めた分子について、別途作成されたコンフォマーに関するデータベースから、コンフォマーの3次元構造データを読み込む工程D2と、
工程D2を行う場合、工程D2の直後にコンフォマーを1つ選択する工程D3と、
第2の3次元構造活性相関解析を行う工程D4と、
平行移動や回転に係る収束条件に到達するまで、3次元構造上の平行移動や回転を行う工程D5と、
次のコンフォマーの3次元構造データを選択する若しくはコンフォマーの3次元構造データを新たに発生させる工程D6と、
コンフォマーについてすべて計算されたかを確認する工程D7と、
コンフォマーについてすべて計算されていない場合にコンフォマーの3次元構造データを入れ替える工程D8と、
保持されている第2の3次元構造活性相関解析結果を読み込み、第2の3次元構造活性相関解析により得られるモデルの質の評価値を並べ替える工程D9と、
並べ替えたモデルの質の評価値から最も良好なものを選び、最も適合的なモデルを与えるコンフォマーを決定する工程D10とを含む。
ここでの収束条件は、例えば、計算時間や、計算回数、3D QSAR解析結果の増減の度合いなどに関する条件とすればよい。
モデルの質の評価は、q2(cross-validated r2)値(r2は重相関係数)や、Tropshaらにより提唱されたコンポーネント数に敏感な評価関数である1-(n-1)(1-q2)/(n-c)値(Cho, S. J.; Zheng, W.; Tropsha, A. Rational combinatorial library design. 2. Rational design of targeted combinatorial peptide libraries using chemical similarity probe and the inverse QSAR approaches. J. Chem. Inf. Comput. Sci. 1998, 38, 259-268.)や、これらの指標に対して分子の重なり程度を示す指標を加味して形成される指標などにより行われればよい。ここでnは解析に用いた分子数、cはコンポーネント数を表す。
上記の分子の重なり程度を示す指標として分子類似性が多用される。しかし、分子類似性では分子群の占める空間と任意の分子の重なり領域が考慮されるだけであって、任意の分子上の原子が分子群の占める空間からどの程度の距離にあるかについては考慮されていない。
上述の状況を鑑みて、上記の分子重ね合わせ方法において、工程A4が、分子の重なり程度を示す指標を求め、これによりモデルの質を計算する工程Fを含み、
工程D4が、分子の重なり程度を示す指標を求め、これによりモデルの質を計算する工程Gを含むようにしてもよい。
更に、工程Fが、
工程A3で作成された、1つの分子の3次元構造データを取り除いた分子群の、占める空間を求める工程F1と、
工程F1で求めた空間と、工程A3で取り除いた分子の占める空間との差異を求める工程F2とを含み、
工程Gが、
解析対象分子群から、工程Cで求めた分子の3次元構造データを取り除いた分子群の、占める空間を求める工程G1と、
工程G1で求めた空間と、工程Cで求めた分子の占める空間との差異を求める工程G2とを含んでもよい。
更に、工程F1は、
クラスタ解析により分子群における原子位置を代表する代表点を求める工程F3を含み、
工程F2は、
取り除いた分子の原子位置と代表点との距離を求める工程F4と、
工程F4で求めた距離を用いて分子の重なり程度を評価する工程F5とを含み、
工程G1は、
クラスタ解析により分子群における原子位置を代表する代表点を求める工程G3を含み、
工程G2は、
取り除いた分子の原子位置と代表点との距離を求める工程G4と、
工程G4で求めた距離を用いて分子の重なり程度を評価する工程G5とを含んでもよい。
また、コンフォマーを発生させる場合、分子の自由結合を順次回転させてもよく、分子動力学法計算等により発生させてもよい。さらに、分子の平行移動や回転はSimplex法やPowell法などの最適化方法や、ランダムに移動させる手法を用いることができる。分子の平行移動や回転、あるいは、ランダムに移動させる手法での収束条件は、例えば、計算時間や、計算回数、3D QSAR解析結果の増減の度合いなどを用いることができる。
まとめると本発明に係る方法は、新たに生物活性や解析しようとする物性を指標に分子の重ね合わせを行う方法であり、この中には、コンフォマーを順次入れ替え、コンフォマーを入れ替えるべき分子を導き出す工程と、QSARモデルを最適化する工程が含まれる。
本発明に係る分子重ね合わせ方法では、3D QSAR解析結果を指標とする重ね合わせ方法を用いるため、重ね合わせ時の3D QSAR解析結果と最終モデルでの3D QSAR解析結果には矛盾がなく、精度の高い予測モデル構築が期待できる。また、本発明に係る分子重ね合わせ方法は、論理的にコンフォマーを順次入れ替える方法であるため、効率的に3D QSARモデルを構築することができる。更に、本発明に係る分子重ね合わせ方法は、通常のPC(パーソナルコンピュータ)で行える簡便で良好な3D QSAR法及び分子の重ね合わせ方法として、効率的な薬物分子設計に応用できる。
本発明に係る構造活性相関解析を指標とした分子重ね合わせ法の概略プロセスを示すフローチャートである。 図1で図示したCoMASA_SP_LOOで行う処理の概略プロセスを示すフローチャートである。 CoMASA_SP_LOOの処理が行われたとき、どのように分子が選択されていくかの概略の手順を概念的に示す。 図2で図示したCoMASA_SP_LOO_mainで行う処理の概略プロセスを示すフローチャートである。 図1で図示したCoMASA_SP_OPTで行う処理の概略プロセスを示すフローチャートである。 図5で図示したCoMASA_SP_OPT_mainで行う処理の概要プロセスを示すフローチャートである。 CoMASA_SP_LOOで分子を決定し、CoMASA_SP_OPTでコンフォマーを順次入れ替える方法の概要を模式的に示す図である。 実施例1の解析に用いたPPAR-γアゴニストである。 実施例1における手法(1)の計算結果のグラフである。 実施例1における手法(2)の計算結果のグラフである。 実施例1における手法(3)の計算結果のグラフである。 実施例1において手法(1)により得られた重ね合わせモデルである。 実施例1において手法(2)により得られた重ね合わせモデルである。 実施例1において手法(3)により得られた重ね合わせモデルである。 実施例2において手法(4)により得られた重ね合わせモデルである。 実施例2において手法(5)により得られた重ね合わせモデルである。
以下、添付画面を参照して本発明に係る計算手法を採用した3次元構造活性相関(3D QSAR)法及び分子重ね合わせ法について説明する。なお、図面には示していないが、本発明の3次元構造活性相関法及び分子重ね合わせ法は、コンピュータを用いて行われるもので、適当なプログラム言語によって記述されたプログラムをコンピュータで実行することにより実現されるものである。また、プログラムは、CD−ROM等の種々の既存の記録媒体に記録され、又はインターネットや電話回線等の回線を通じて提供される。
本発明の3次元構造活性相関法及び分子重ね合わせ法は、コンピュータ上の仮想空間において3次元構造データを利用して実現されるものである。従って、以下における「分子」「コンフォマー」は、仮想空間(x,y,z)における「分子の3次元構造データ」「コンフォマーの3次元構造データ」を示すことになる。
図1は、本発明に係る3次元構造活性相関解析を指標とした分子重ね合わせ法の概略プロセスを示すフローチャートである。図示するように、この分子重ね合わせ法では、計算に用いる分子に3次元構造データ(各分子に含まれる複数の原子の3次元座標を含むデータ)を読み込むステップ(S02)と、解析する化合物群からコンフォマーを変更すべき分子を決定するステップ(CoMASA_SP_LOO)(S04)と、コンフォマーを入れ替えるべき分子を決定した後に、コンフォマーを順次入れ替えるステップ(CoMASA_SP_OPT)(S06)と、収束条件になったか否かを判断するステップ(S06)からなる。S06で収束条件を満たせば、分子重ね合わせ法は終了する(S10)。
この分子重ね合わせ法では、用いる分子の個数は限定されないが、ステップS04(CoMASA_SP_LOO)において分子を1つ取り除いた分子群で(後述の)LOO法による3D QSAR解析を行うため、少なくとも3つの分子が必要である。また、ステップS08での収束条件として、例えば、計算時間や、計算回数、3D QSAR解析結果の増減の度合いなどを用いることができる。
図2は、図1で図示したCoMASA_SP_LOO(S04)で行う処理の概略プロセスを示すフローチャートである。本発明に係る3次元構造活性相関解析を指標とした分子重ね合わせ法では、最終的には全ての分子の全てのコンフォマーの重ね合わせを行うことを想定しているが、これを同時に行うことは不可能である。そこで、CoMASA_SP_LOOでは、分子を一つ選択し、その分子の全てのコンフォマーから最適なものを一つ選び出す計算を行う。その計算対象となる一つの分子を選択する方法として、本発明では、分子を一つ取り除いた上で(後述の)LOO法を行う。
図示するように、CoMASA_SP_LOOでは、LOO(Leave-one-out)法による3D QSAR解析を実際に行うステップ(CoMASA_SP_LOO_main)(S0402)と、3D QSAR解析結果を並べ替えコンフォマーを順次入れ替えるべき分子を決定するステップ(S0404)からなる。3D QSAR解析結果の計算方法は、任意に決定でき、例えば、立体的相互作用、静電的相互作用、疎水的相互作用を用いることができる。3D QSAR解析により得られるモデルの質の評価には、例えば、q2値、1-(n-1)(1-q2)/(n-c)値、若しくはこれらの指標に対して分子の重なり程度を示す指標を加味して形成される指標などが用いられる。
分子を1つ取り除きLOO(Leave-one-out)法を行うことで、最も高い3D QSAR解析結果が得られた場合、当該分子は、3D QSARのモデルの質を最も低下させていることを意味している。そこで、後で説明するように当該分子のコンフォマーを順次入れ替えることで、解析分子全体のモデルの質を向上させることが期待できる。
3D QSARのモデルの質は、q2値や1-(n-1)(1-q2)/(n-c)値などにより数値化して評価できる。しかし、これらの指標のみで評価すると、特定の分子だけが他の分子群とは異なった空間を占めるような解析結果が得られる可能性がある。そこで、LOO法により取り除いた分子が残りの解析分子群からどの程度はみだしているかの評価値(evol_score)を求める指標に加えることにより、置き換える分子が他の分子群から著しく異なった空間を占有するようなモデルを排除できる。
図3は、CoMASA_SP_LOOの処理が行われたとき、どのように分子が選択されていくかの概略の手順を概念的に示す。例えば、CoMASA_SP_LOOでは、計算対象となる各分子より任意のコンフォマーを一つ選択して、n個の分子からなる分子群(M)を作成する。次に、その分子群Mから分子を1つ取り除きn-1個の分子でQSAR解析を行う。この操作を全ての分子について行い、n個の3D QSAR解析結果を得る。得られたn個の3D QSAR解析結果をソートし、最も高い3D QSAR解析結果を与えた分子Xをコンフォマー入れ替えの分子として採用する。このようにしてコンフォマーを順次入れ替える分子を決定することができる。
図4は、図2で図示したCoMASA_SP_LOO_main(S0402)で行う処理の概略プロセスを示すフローチャートである。図示するように、CoMASA_SP_LOO_mainでは、分子を選択するステップ(S040202)と、分子を1つ取り除いてLOO(Leave-one-out)法による3D QSAR解析を行うステップ(S040204)と、すべての分子についてLOO法による3D QSAR解析を行ったか確認するステップ(S040206)と、すべての分子についてLOO法による3D QSAR解析が未だ行われていない場合に、取り除く分子を入れ替えてLOO法による3D QSAR解析を行うステップに戻るステップ(S040208)からなる。
図5は、図1で図示したCoMASA_SP_OPT(S06)で行う処理の概略プロセスを示すフローチャートである。CoMASA_SP_OPTでは、LOO法による3D QSAR解析結果より分子を選択し、当該分子のコンフォマーを新規に発生させ、あるいは別途用意したコンフォマーのデータベースから読み込み、更にQSAR解析を行う。
図5に示すように、まず、CoMASA_SP_LOOの結果をソートし分子を選択する(S0602)。次に、選択した分子が前に(後述の)CoMASA_SP_OPT_main(S0606)で計算した分子と同じか否かを確認する(S0604)。同じである場合、ステップS0616に進む。異なる場合には、コンフォマーを入れ替えて実際に3D QSAR解析を行うステップ(CoMASA_SP_OPT_main)(S0606)へ進む。
CoMASA_SP_OPT_main(S0606)に続いて、CoMASA_SP_OPT_mainにおける3D QSAR結果からコンフォマーを選択するステップ(S0608)を行う。ここで、選択したコンフォマーは元のコンフォマーと同じか否かを確認し(S0610)、同じである場合ステップS0616へ進む。異なる場合には、選択したコンフォマーを採用し(S0612)、CoMASA_SP_OPT(S06)の処理を終了させる(S0614)。
ステップ0616では、すべての分子につき探索がされたか否か確認される。全ての分子につき探索がされたのであれば、CoMASA_SP_OPT(S06)の処理を終了させる(S0614)。全ての分子については探索されていないのであれば、CoMASA_SP_LOO(S04)の3D QSAR解析結果のソートに従い、次に値が高い3D QSAR解析結果を示した分子を選択し(S0618)、CoMASA_SP_OPT_main(S0606)以降の処理を行う。
図5のフローチャートにおける3D QSAR解析結果の計算方法は、特に限定されず、例えば、立体的相互作用、静電的相互作用、疎水的相互作用を用いればよい。3D QSAR解析により得られるモデルの質の評価には、例えば、q2値、1-(n-1)(1-q2)/(n-c)値、若しくはこれらの指標に対してevol_score値を加味して形成される指標などが用いられる。
図6は、図5で図示したCoMASA_SP_OPT_main(S0606)で行う処理の概要プロセスを示すフローチャートである。まず、コンフォマーを新規に発生させる処理が選択されるのか、コンフォマーを別途準備されたデータベースから読み込む処理が選択されるのか、いずれであるかが判断される(S060602)。コンフォマーを新規に発生させる処理が選択されるのであれば、コンフォマーを新規に発生させる(S060604)。コンフォマーを別途準備されたデータベースから読み込む処理が選択されるのであれば、コンフォマー一覧を別途データベースから読み込み(S060606)、コンフォマーを1つ選択する(S060608)。
コンフォマーが発生すれば若しくは選択されれば、そのコンフォマーに基づいて3D QSAR解析が行われる(S060610)。解析直後、平行移動や回転に係る収束条件に到達しているか否か確認される(S060612)。ここで収束条件に達していなければ、対象の分子につき仮想空間上で平行移動若しくは回転がなされ(S060614)、再び3D QSAR解析が行われる(S060610)。S060612にて収束条件に達していれば、次のコンフォマーを選択若しくは発生するステップ(S060616)に進む。
次に、すべてのコンフォマーにつき計算されたか否かが確認され(S060618)、計算されていなければコンフォマーが入れ替えられ(S060620)、再び3D QSAR解析が行われる(S060610)。すべてのコンフォマーにつき計算されていれば、CoMASA_SP_OPT_main(S0606)の処理を終了させる(S060622)。
なお、ステップS060614における分子の平行移動や回転では、例えば、Simplex法やPowell法による最適化方法や、ランダムに移動させる手法を用いることができる。ステップS060612における平行移動や回転に係る収束条件として、例えば、計算時間や、計算回数、3D QSAR解析結果の増減の度合いなどを用いることができる。
図7は、CoMASA_SP_LOOで分子を決定し、CoMASA_SP_OPTでコンフォマーを順次入れ替える方法の概要を模式的に示す図である。最初に入れ替える分子としてAが導き出されている(左端の列)。ここで、Aのコンフォマーを順次読み込みQSAR解析を行い、解析結果を並べ替えてコンフォマーA2を採用し、次の計算に用いる。分子AについてコンフォマーをA1からA2に入れ替え、新たな分子群M1を作成した後、CoMASA_SP_LOOの処理を行い、更に入れ替える分子を決定する。入れ替える分子を決定した後、再度QSAR解析を行い、最も解析結果のよかったコンフォマーを選択(C1−>C2)し、新たな分子群M2とする。この作業を収束条件になるまで繰り返す。収束条件は、例えば、計算時間や、計算回数、3D QSAR解析結果の増減の度合いなどを用いることができる。
ステップS0402(図2、図4参照)、及びステップS0606(図2、図5、図6参照)における3D QSAR解析でのモデルの質を示す指標として利用され得る(、若しくは、加えられ得る)evol_score値について説明する。evol_score値を分子類似性計算により決定するということも考えられる。しかし、分子類似性計算は解析分子群から分子上の原子までの距離を考慮しない。従って、分子の一部が、解析分子群の近傍に屈曲してはみ出しているに過ぎない場合と、突き出ている場合とにおいて、重なり程度が両方の場合で同じであれば同じ評価値が算出されてしまう。
CoMASA法(Kotani, T.; Higashiura, K. Comparative molecular active site analysis (CoMASA). 1. An approach to rapid evaluation of 3D QSAR. J. Med. Chem. 2004, 47, 2732-2742.小谷孝行、東浦邦彦;SAR News No.7 (Oct. 2004), p10-14, あるいは、国際公開WO 2004/031999 A1公報参照)による3D QSAR解析を行う場合では、LOO法により分子が取り除かれて残余する分子群からクラスタ解析で得られる代表点と、取り除いた分子との距離により、距離に応じたスコアを計算し、evol_score値を求めることができる。すなわち、LOO法により取り除いた分子の各原子から最も近傍にある代表点までの距離を求め、この距離が閾値以上の原子について、スコアを計算する。
閾値は、任意に決めることができるが、たとえばクラスタ解析に用いた閾値(通常0.75Å)の2倍を用いることができる。
[数1]
Figure 2007004643
ここでnは取り除いた分子中の原子数、iは取り除いた分子中の原子の番号、riはi番目の原子と最も近い代表点との距離、thは閾値、aは任意の係数を表す。通常ではth=1.5、a=0.3を用いる。取り除いた分子がすべて代表点からth以内の距離にあるとき、evol_score値は0となる。取り除いた分子のうちで、代表点からth以内の距離からはみ出すものの割合が多くなると、evol_score値は絶対値の大きな負の値となる。
モデルの質の評価でevol_score値を考慮するならば、q2値や1-(n-1)(1-q2)/(n-c)値などに、任意の係数を乗じたevol_score値を加算する。例えば、1-(n-1)(1-q2)/(n-c)値とevol_score値を用いてモデルの質を評価するには、以下の式で求められる評価値(Score値)を用いればよい。
[数2]
Figure 2007004643
ここで、aは任意の係数、bは任意の定数を表す。通常ではa=1、b=0を用いる。
I.計算に用いたモデル
本発明に係る3次元構造活性相関解析を指標とした分子重ね合わせ法の有用性を検討するために、黒木らにより報告されている7種のPPAR-γアゴニストを用い構造活性相関解析を行った(Kurogi, Y. Three-dimensional quantitative structure-activity relationships (3D-QSAR) of antidiabetic thiazolidinediones. Drug Des. Discov. 1999, 16, 109-118)。計算はすべてWindows(登録商標) XP SP2のシステム環境で行い、プログラムはCygwinの FortranとC言語、Tcl/tkを用いて作成した。PLS(Partial Least Square)計算にはSAMPLS(QCPE#650)(Bush, B. L.; Nachbar, R. B., Jr. Sample-distance partial least squares: PLS optimized for many variables, with application to CoMFA. J. Comput. Aided Mol. Des. 1993, 7, 587-619)を用い、コンピュータグラフィックスによる計算結果の視覚化にはWebLab ViewerLite 4.0(Accerlys社)を用いた。解析に用いた分子を図8に図示した。
II.本発明の計算
本発明に係る3次元構造活性相関解析を指標とした分子重ね合わせ方法の計算結果を以下に示す。
II−1.配座の発生
Rosiglitazoneの3次元構造は、X線結晶構造解析(1FM6)で得られているコンフォマーを用いた。すなわち、基質−受容体複合体のX線結晶構造からrosiglitazoneを取り出し、水素を付与した後、MOPAC93.01(MOPAC93, Stewart,,J. J. P. Fujitsu Limited, Tokyo.、MOPAC93.01, revised by Kotani, T. for Cygwin environment.)を用いて水素位置のみを最適化した。そのほかのPPAR-γアゴニストは以下のConfgenを用い多くのコンフォマーを発生させた後、rosiglitazoneのチアゾリジンジオン部分とのRMSD(root mean squire deviation)値を指標として重ね合わせを行いコンフォマーのデータベースを作成した。
Confgenは、発明者らによる、3次元構造体データでのコンフォマーを生成するジェネレータ・ルーチンである。Confgenでは、Chem3D(Chem3D version 7.0, CambridgeSoft, Cambridge)で作成した3次元構造をMM2(Allinger, N. L. Conformational analysis. 130. MM2. A hydrocarbon force field utilizing V1 and V2 torsional terms, J. Am. Chem. Soc. 1997, 99, 8127-8134.)を用いて最適化した後、MM2のパラメータを用いたTINKER(TINKER version 4.2, Ponder, J. W., Biochemistry & Molecular Biophysics, Washington University School of Medicine, St. Louis.)MD計算により、多くのコンフォマーを発生させた後、それぞれのコンフォマーからMOPAC93でエネルギー安定コンフォマーを作成した。また、TINKERに含まれていないMM2パラメータはChem3Dのものを使用した。
その後、得られた各極小エネルギーのGasteiger電荷を計算し、エネルギー及びコンフォマー間の類似性を考慮して、計算に供するコンフォマーのフィルタリングを行いコンフォマーのデータベースを作成した。なお、フィルタリングに用いるエネルギーは、「10 kcal/mol」を用い、RMSD(root mean squire deviation)値が0.1Å以下のものを類似したコンフォマーとしてコンフォマーのデータベースから除外した。
II−2.モデルの最適化
それぞれのコンフォマーについてrosiglitazoneとのRMSD値の最も小さいものを選択し初期モデルとした。今回はモデルの質を示す指標としてq2値とともに、1-(n-1)(1-q2)/(n-c)値を用いることとした。
3D QSAR解析手法として本出願の発明者らによる3次元構造活性相関法である前述のCoMASA法の立体的、電気的および疎水的なパラメータを用い、CoMASA法により導出される代表点との相互作用を計算した。その他のパラメータは標準のものを用いた。
相互作用の計算は、
(1)擬似変数(indicator valuables)を用いる手法
(2)擬似変数を用いてモデルの最適化を行った後にガウス関数を用いる方法
(3)ガウス関数を用いる方法
の3手法を行った。計算結果を図9〜図11及び表1に、最適化後の重ね合わせモデルを図12〜図14及び表2に示す。表1は計算手法によるインデックスの差異を示し、表2は、最適化後モデルのコンフォマーを示す。なお、表2中の数字は発明者が適宜付したコンフォマーの識別子である。また、図9、図10及び図11の「ステップ(step)」は、図1に示すフローチャートのループ処理の回数に対応する。
最適化を行っていくことでq2値や1-(n-1)(1-q2)/(n-c)値が向上していることが明らかとなり、モデルの最適化が図られていることが明らかとなった。ここでnは解析に用いた分子数、cはコンポーネント数を表す。通常はモデルの最適化を行わないため、これを初期モデルとした。
初期モデルでのr2値が0.9以上であったが、手法(1)ではq2値が低く、モデルの質が高いとはいえなかった。また、手法(3)ではq2値が0.5以上であるため、モデルとしては十分な質を持っていると判断できるが、CoMASA_SPを用いることにより、q2値が初期モデルと比較して大幅に向上し、よりQSAR結果が信頼できるモデルを構築することができた。ガウス関数を使用する手法(3)は擬似変数を使用する手法(1)と比較して、より精度の高い解析結果が得られた。しかしながら、今回の結果では、手法(2)で手法(1)と手法(3)の両方の特徴を生かすような結果を得ることはできなかった。さらに、手法(1)や手法(2)では、解析分子のなかで他の分子と異なった空間を占めるものが見出された。手法(3)では解析分子はほぼ同一の空間を占めていた。
[表1]
Figure 2007004643
[表2]
Figure 2007004643
I.計算に用いたモデル
前述のevol_score値をモデルの質を示す指標として利用して、実施例1と同様の構造活性相関解析を行った。従って、用いたモデルは基本的に実施例1と同じものである。
II.本発明の計算
3次元構造活性相関解析において、分子の重なり程度を示す指標を考慮した分子重ね合わせ方法の計算結果を以下に示す。
II−1.配座の発生
実施例1と同じ配座を用いた。
II−2.モデルの最適化
実施例1と同じ初期モデルとした。モデルの質を評価する評価値として、evol_score値を加えた1-(n-1)(1-q2)/(n-c)値を用いた。
パラメータは実施例1と同じものを用いた。相互作用の計算として、
(4)擬似変数(indicator valuables)を用いる方法
(5)ガウス関数を用いる方法
の2手法を行い、実施例1の手法(1)〜手法(3)と比較した。計算結果を図15〜16および表3に示す。
手法(1)では、解析分子のなかで他の分子と異なった空間を占めるものが見出されたが、手法(4)では解析分子がほぼ同一の空間を占めるモデルとなった。q2値や1-(n-1)(1-q2)/(n-c)値は手法(1)の方がよい結果を与えた。手法(3)と手法(5)との比較でも同様の傾向が見られた。
[表3]
Figure 2007004643
本発明は、従来の3D QSAR解析方法と比較して、高速に3D QSAR解析結果が得られるCoMASA法の特徴を生かし、3D QSAR解析結果を指標とした分子重ね合わせ法を提案する。3D QSAR解析結果を指標とする重ね合わせ法を用いるため、重ね合わせ時の3D QSAR解析結果と最終モデルでの3D QSAR解析結果には矛盾がなく、精度の高い予測モデル構築が期待できる。また、本発明に係る分子重ね合わせ方法は、論理的にコンフォマーを順次入れ替える方法であり、実施例の結果から効率的に3D QSARモデルを構築できることが明らかとなった。また、モデルの質の計算時に、ある分子が残りの分子からどの程度はみ出しているかを示す指標(evol_score値)を導入し、より的確な3D QSARモデルを構築できることが明らかとなった。更に、本発明に係る分子重ね合わせ方法は、通常のPC(パーソナルコンピュータ)で行える簡便で良好な3D QSAR法及び分子の重ね合わせ方法として、効率的な薬物設計に応用できることが示された。

Claims (10)

  1. 仮想空間において、構造活性相関解析を指標として複数の分子の3次元構造データを重ね合わせる分子重ね合わせ方法であって、
    解析対象分子群から1つの分子の3次元構造データを取り除いた分子群で、3次元構造データによる第1の3次元構造活性相関解析を行いモデルの質を示す指標を求める工程Aと、
    すべての分子について工程Aを繰り返す工程Bと、
    工程Bで得られる第1の3次元構造活性相関解析よりモデルの質を示す指標を並べ替え、最もモデルの質を低下させている分子を求める工程Cと、
    工程Cで求めた分子のコンフォマーの3次元構造データを順次変化させて第2の3次元構造活性相関解析を行い、選択するコンフォマーを決定する工程Dと、
    収束条件を満たすまで工程Aに戻る工程Eとを含むことを特徴とする分子重ね合わせ方法。
  2. 上記工程Aは、
    計算に用いる複数の分子の3次元構造データを読み込む工程A1と、
    前工程で1つの分子の3次元構造データが取り除かれている場合に取り除いたデータを戻す工程A2と、
    読み込んだ複数の分子の3次元構造データから、1つの分子の3次元構造データを取り除いた分子群を作成する工程A3と、
    1つの分子の3次元構造データを取り除いた分子群について、3次元構造データによる第1の3次元構造活性相関解析でモデルの質を計算する工程A4と、
    計算した1つの分子の3次元構造データを取り除いた分子群についての第1の3次元構造活性相関解析の結果を保持する工程A5とを含み、
    上記工程Cは、
    保持されている1つの分子の3次元構造データを取り除いた分子群についての第1の3次元構造活性相関解析結果を並べ替える工程C1と、
    1つの分子の3次元構造データを取り除いた分子群についての第1の3次元構造活性相関解析結果で最もモデルの質を低下させているものを求め、その分子群において取り除かれていた分子を求める工程C2とを含み、
    上記工程Dは、
    工程Cで求めた分子についてコンフォマーの3次元構造データを新たに発生させる工程D1と、
    工程Cで求めた分子について、別途作成されたコンフォマーに関するデータベースから、コンフォマーの3次元構造データを読み込む工程D2と、
    工程D2を行う場合、工程D2の直後にコンフォマーを1つ選択する工程D3と、
    第2の3次元構造活性相関解析を行う工程D4と、
    平行移動や回転に係る収束条件に到達するまで、3次元構造上の平行移動や回転を行う工程D5と、
    次のコンフォマーの3次元構造データを選択する若しくはコンフォマーの3次元構造データを新たに発生させる工程D6と、
    コンフォマーについてすべて計算されたかを確認する工程D7と、
    コンフォマーについてすべて計算されていない場合にコンフォマーの3次元構造データを入れ替える工程D8と、
    保持されている第2の3次元構造活性相関解析結果を読み込み、第2の3次元構造活性相関解析により得られるモデルの質の評価値を並べ替える工程D9と、
    並べ替えたモデルの質の評価値から最も良好なものを選び、最も適合的なモデルを与えるコンフォマーを決定する工程D10とを含むことを特徴とする請求項1に記載の分子重ね合わせ方法。
  3. 上記工程A4が、分子の重なり程度を示す指標を求め、これによりモデルの質を計算する工程Fを含み、
    上記工程D4が、分子の重なり程度を示す指標を求め、これによりモデルの質を計算する工程Gを含むことを特徴とする請求項2に記載の分子重ね合わせ方法。
  4. 上記工程Fが、
    工程A3で作成された、1つの分子の3次元構造データを取り除いた分子群の、占める空間を求める工程F1と、
    工程F1で求めた空間と、工程A3で取り除いた分子の占める空間との差異を求める工程F2とを含み、
    上記工程Gが、
    解析対象分子群から、工程Cで求めた分子の3次元構造データを取り除いた分子群の、占める空間を求める工程G1と、
    工程G1で求めた空間と、工程Cで求めた分子の占める空間との差異を求める工程G2とを含むことを特徴とする請求項3に記載の分子重ね合わせ方法。
  5. 上記工程F1は、
    クラスタ解析により分子群における原子位置を代表する代表点を求める工程F3を含み、
    上記工程F2は、
    取り除いた分子の原子位置と代表点との距離を求める工程F4と、
    工程F4で求めた距離を用いて分子の重なり程度を評価する工程F5とを含み、
    上記工程G1は、
    クラスタ解析により分子群における原子位置を代表する代表点を求める工程G3を含み、
    上記工程G2は、
    取り除いた分子の原子位置と代表点との距離を求める工程G4と、
    工程G4で求めた距離を用いて分子の重なり程度を評価する工程G5とを含むことを特徴とする請求項4に記載の分子重ね合わせ方法。
  6. 仮想空間において、構造活性相関解析を指標として複数の分子の3次元構造データを重ね合わせる分子重ね合わせ方法を行わせるコンピュータプログラムであって、コンピュータに、
    解析対象分子群から1つの分子の3次元構造データを取り除いた分子群で、3次元構造データによる第1の3次元構造活性相関解析を行わせモデルの質を示す指標を求める処理Aと、
    すべての分子について処理Aを繰り返す処理Bと、
    処理Bで得られる第1の3次元構造活性相関解析よりモデルの質を示す指標を並べ替え、最もモデルの質を低下させている分子を求める処理Cと、
    処理Cで求めた分子のコンフォマーの3次元構造データを順次変化させて第2の3次元構造活性相関解析を行わせ、選択するコンフォマーを決定する処理Dと、
    収束条件を満たすまで工程Aに戻らせる工程Eとを含むことを特徴とするコンピュータプログラム。
  7. 上記処理Aは、
    計算に用いる複数の分子の3次元構造データを読み込む処理A1と、
    前処理で1つの分子の3次元構造データが取り除かれている場合に取り除いたデータを戻す処理A2と、
    読み込んだ複数の分子の3次元構造データから、1つの分子の3次元構造データを取り除いた分子群を作成する処理A3と、
    1つの分子の3次元構造データを取り除いた分子群について、3次元構造データによる第1の3次元構造活性相関解析でモデルの質を計算する処理A4と、
    計算した1つの分子の3次元構造データを取り除いた分子群についての第1の3次元構造活性相関解析の結果を保持する処理A5とを実行させ、
    上記処理Cは、
    保持されている1つの分子の3次元構造データを取り除いた分子群についての第1の3次元構造活性相関解析結果を並べ替える処理C1と、
    1つの分子の3次元構造データを取り除いた分子群についての第1の3次元構造活性相関解析結果で最もモデルの質を低下させているものを求め、その分子群において取り除かれていた分子を求める処理C2とを実行させ、
    上記処理Dは、
    処理Cで求めた分子についてコンフォマーの3次元構造データを新たに発生させる処理D1と、
    処理Cで求めた分子について、別途作成されたコンフォマーに関するデータベースから、コンフォマーの3次元構造データを読み込む処理D2と、
    処理D2を行う場合、処理D2の直後にコンフォマーを1つ選択する処理D3と、
    第2の3次元構造活性相関解析を行う処理D4と、
    平行移動や回転に係る収束条件に到達するまで、3次元構造上の平行移動や回転を行う処理D5と、
    次のコンフォマーの3次元構造データを選択する若しくはコンフォマーの3次元構造データを新たに発生させる処理D6と、
    コンフォマーについてすべて計算されたかを確認する処理D7と、
    コンフォマーについてすべて計算されていない場合にコンフォマーの3次元構造データを入れ替える処理D8と、
    保持されている第2の3次元構造活性相関解析結果を読み込み、第2の3次元構造活性相関解析により得られるモデルの質の評価値を並べ替える処理D9と、
    並べ替えたモデルの質の評価値から最も良好なものを選び、最も適合的なモデルを与えるコンフォマーを決定する処理D10とを実行させることを特徴とする請求項6に記載のコンピュータプログラム。
  8. 上記処理A4が、分子の重なり程度を示す指標を求め、これによりモデルの質を計算する処理Fを含み、
    上記処理D4が、分子の重なり程度を示す指標を求め、これによりモデルの質を計算する処理Gを含むことを特徴とする請求項7に記載のコンピュータプログラム。
  9. 上記処理Fが、
    処理A3で作成された、1つの分子の3次元構造データを取り除いた分子群の、占める空間を求める処理F1と、
    処理F1で求めた空間と、処理A3で取り除いた分子の占める空間との差異を求める処理F2とを含み、
    上記処理Gが、
    解析対象分子群から、処理Cで求めた分子の3次元構造データを取り除いた分子群の、占める空間を求める処理G1と、
    処理G1で求めた空間と、処理Cで求めた分子の占める空間との差異を求める処理G2とを含むことを特徴とする請求項8に記載のコンピュータプログラム。
  10. 上記処理F2は、
    クラスタ解析により分子群における原子位置を代表する代表点を求める処理F3を含み、
    上記処理F2は、
    取り除いた分子の原子位置と代表点との距離を求める処理F4と、
    処理F4で求めた距離を用いて分子の重なり程度を評価する処理F5とを含み、
    上記処理G1は、
    クラスタ解析により分子群における原子位置を代表する代表点を求める処理G3を含み、
    上記処理G2は、
    取り除いた分子の原子位置と代表点との距離を求める処理G4と、
    処理G4で求めた距離を用いて分子の重なり程度を評価する処理G5とを含むことを特徴とする請求項9に記載のコンピュータプログラム。

JP2007524073A 2005-07-04 2006-07-04 3次元構造活性相関法と共に利用される分子重ね合わせ方法 Pending JPWO2007004643A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005195121 2005-07-04
JP2005195121 2005-07-04
PCT/JP2006/313303 WO2007004643A1 (ja) 2005-07-04 2006-07-04 3次元構造活性相関法と共に利用される分子重ね合わせ方法

Publications (1)

Publication Number Publication Date
JPWO2007004643A1 true JPWO2007004643A1 (ja) 2009-01-29

Family

ID=37604504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007524073A Pending JPWO2007004643A1 (ja) 2005-07-04 2006-07-04 3次元構造活性相関法と共に利用される分子重ね合わせ方法

Country Status (2)

Country Link
JP (1) JPWO2007004643A1 (ja)
WO (1) WO2007004643A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109637673A (zh) * 2018-12-18 2019-04-16 广州市爱菩新医药科技有限公司 一种药物虚拟筛选方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4436759B2 (ja) * 2002-10-07 2010-03-24 日本臓器製薬株式会社 三次元構造活性相関法

Also Published As

Publication number Publication date
WO2007004643A1 (ja) 2007-01-11

Similar Documents

Publication Publication Date Title
Zhang et al. AutoDock CrankPep: combining folding and docking to predict protein–peptide complexes
DePristo et al. Ab initio construction of polypeptide fragments: efficient generation of accurate, representative ensembles
Kahraman et al. Cross-link guided molecular modeling with ROSETTA
Yuan et al. Binding site detection and druggability prediction of protein targets for structure-based drug design
Harrison et al. Quantifying the similarities within fold space
Alexander et al. bcl:: Cluster: A method for clustering biological molecules coupled with visualization in the Pymol Molecular Graphics System
Fiser Template-based protein structure modeling
Brown Chemoinformatics—an introduction for computer scientists
Medina‐Franco et al. A similarity‐based data‐fusion approach to the visual characterization and comparison of compound databases
Pan et al. Robust prediction of B-factor profile from sequence using two-stage SVR based on random forest feature selection
Chen et al. Prediction of metabolic pathway using graph property, chemical functional group and chemical structural set
US20070198195A1 (en) Determining Pharmacophore Features From Known Target Ligands
Hawkins et al. Ligand-based methods in GPCR computer-aided drug design
Shea et al. Studying the early stages of protein aggregation using replica exchange molecular dynamics simulations
Ramakrishnan et al. Understanding structure-guided variant effect predictions using 3D convolutional neural networks
US8374837B2 (en) Descriptors of three-dimensional objects, uses thereof and a method to generate the same
Amini et al. A general approach for developing system‐specific functions to score protein–ligand docked complexes using support vector inductive logic programming
Kotulska et al. Bioinformatics methods in predicting amyloid propensity of peptides and proteins
JPWO2007004643A1 (ja) 3次元構造活性相関法と共に利用される分子重ね合わせ方法
Bologa et al. Chemical database preparation for compound acquisition or virtual screening
Gobbi et al. Atom-Atom-Path similarity and Sphere Exclusion clustering: tools for prioritizing fragment hits
EP1862927A1 (en) Descriptors of three-dimensional objects, uses thereof and a method to generate the same
EP1145160A1 (en) A global method for mapping property spaces
Song et al. BagPyPe: A Python package for the construction of atomistic, energy-weighted graphs from biomolecular structures
Poluri et al. Prediction, analysis, visualization, and storage of protein–protein interactions using computational approaches