JP2006323833A

JP2006323833A - 生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラム

Info

Publication number: JP2006323833A
Application number: JP2006115504A
Authority: JP
Inventors: Koji Ogata; 浩二緒方; Satoru Isomura; 哲磯村
Original assignee: Molecuence Corp
Current assignee: Molecuence Corp
Priority date: 2005-04-19
Filing date: 2006-04-19
Publication date: 2006-11-30

Abstract

【課題】生理活性を有する化合物の設計を行なう際に、網羅的な化合物空間から目的に応じた化合物の分子構造を効率的に探索することが可能な方法を提供する。
【解決手段】（１）特定の生理活性を有し、且つ、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の生理活性化合物を用意し、（２）このジオメトリに対して、原子間の結合次数の関係を満たすように原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得し、（３）この候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する。
【選択図】図１

Description

本発明は、医薬や農薬等に有効な生理活性を有する化合物を設計する方法及び装置と、その機能をコンピュータに実行させるプログラムに関するものである。

従来、医薬や農薬に有用性の高い化合物の設計は、既知の構造を有する化合物の結合様式などを参考にして、化合物の基本骨格を変換することにより行なわれている。しかし、その基本骨格の変換は、合成化学者の経験に基づいて行なわれている場合が多い。

一方、多くの化合物とタンパク質との複合体の構造が、Ｘ線結晶構造解析や核磁気共鳴（Nuclear magnetic resonance：NMR）法などによって解明されており、それらの結合の様式が明らかにされている。この複合体の構造から得られる情報を基に化合物の設計を行なうことによって、より生理活性が高い化合物を見出すことが可能になると期待できる。

コンピュータによる化合物の設計方法としては、構造既知のタンパク質から化合物が結合する部位を計算的に又は実験的に見出し、その部位にうまく当てはまる化合物を探し出す方法が用いられている。

このような方法の例としては、既知の構造を有する化合物が収められているデータベースから、最適な化合物を探索する方法が挙げられる（非特許文献１）。

また、探索する化合物の空間を広くするために、独自に設計した化合物の集団の中から標的のタンパク質にうまく結合する最適な化合物を探し出す方法もある（非特許文献２）。

また、標的タンパク質との結合状態などがＸ線結晶構造解析やＮＭＲ等によって解明されている化合物に対して、化学修飾を行なうことにより、更に有効な生理活性を示す化合物を探索する方法もある（非特許文献３）。

更には、標的タンパク質のポケットから、それに当てはまる化合物をde novo 分子設計によって求める方法もある（非特許文献４）。この方法は、原子或いは原子集団の単位で三次元の原子座標を定め、それらの座標に対して原子種或いは既知のフラグメントを割り当てるものである。

T. J. A. Ewing, et al., Journal of Computational Chemistry, Vol.18, p.1175-1189, 1997年 R. D. Cramer, et al., Journal of Chemical Information and Computer Sciences, Vol.38, p.1010-1023, 1998年 H. J. Bohm, Journal of Computer-Aided Molecular Design, Vol.6, p.61-78, 1992年 Y. Nishibata, et al., Journal of Medical Chemistry, Vol.36, p.2921-2928, 1993年

しかしながら、上述の非特許文献１及び非特許文献２に記載の、コンピュータなどを用いて、既知の構造を有する化合物のデータベース、又は、独自に設計した化合物集団の中から、標的タンパク質に結合する化合物を探索する方法は、探索する化合物の空間が非常に狭いという課題がある。また、標的タンパク質に対して、様々な化合物の結合様式を予測することは、相互作用エネルギー値の精度の問題から非常に困難である。

また、上述の非特許文献３及び非特許文献４に記載の方法では、原子種や既知のフラグメントの割り当ては、探索する空間が広大なことから、乱数を用いて行なっている場合が多い。従ってこの方法は、可能な組み合わせにより化合物を網羅的に決めているのではなく、また、骨格変換を行なうことにより更に高活性の化合物を求めているわけではない。

そこで、Ｘ線結晶構造解析やＮＭＲなどにより複合体の構造が解明されている化合物の三次元座標上の各点に対応する原子種を網羅的な検索を行ない、タンパク質のポケットにうまく当てはまる化合物を探し出すことができれば、新たな骨格を持った新規化合物を設計するための重要な情報となることが示唆される。また、それらの網羅的な化合物空間から標的タンパク質に結合する化合物の特徴を抽出することが可能であり、この方法は化合物を展開する上で非常に有用な情報であることが考えられる。更に、大量の化合物を目的に応じてスクリーニングする、例えば、“薬物らしさ（drug-likeness）”や合成のしやすさなどの指標を基に作成されたフィルタを用いてスクリーニングすることにより、目的の化合物を確実に得ることができることが期待できる。

本発明は、上述の課題を解決するためになされたものである。即ち、本発明の目的は、生理活性を有する化合物（以下、適宜「生理活性化合物」と略称する。）の設計を行なう際に、網羅的な化合物空間から目的に応じた化合物の分子構造を効率的に探索することが可能な、生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラムを提供することにある。

本発明者らは、上記課題に鑑みて鋭意検討した結果、設計対象の生理活性化合物のジオメトリに対して、結合次数の関係を満たすように原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を作成し、これを化合物の活性を予測するモデルから求めたスコアで評価することによって、網羅的な化合物空間から目的に応じた化合物の分子構造を効率的に探索することが可能となり、上記課題が効果的に解決されることを見出して、本発明を完成させた。

即ち、本発明の要旨は、（１）特定の生理活性を有し、且つ、既知の構造を有する化合物（これを「原型化合物」という場合がある。）から原子座標を抽出することにより、設計対象の生理活性化合物のジオメトリを用意する第１工程、（２）前記第１工程で用意されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得する第２工程、及び、（３）前記第２工程で得られた候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めたスコア（これを「活性スコア」という場合がある。）により評価する第３工程を有することを特徴とする、生理活性化合物の設計方法に存する（請求項１）。

ここで、上述の請求項１に係る生理活性化合物の設計装置において、前記第２工程が、前記第１工程で用意されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する工程、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する工程を有するとともに、前記第３工程において、候補化合物を構成する各化合物断片の構造の上記生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出することが好ましい（請求項２）。

また、本発明の別の要旨は、（１）設計対象の生理活性化合物のジオメトリを用意する第１工程、（２）前記第１工程で用意されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得する第２工程、及び、（３）前記第２工程で得られた候補化合物の分子構造を、化合物の所望の生理活性を予測するモデルから求めた活性スコアにより評価する第３工程を有し、前記第２工程が、前記第１工程で用意されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する工程、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する工程を有するとともに、前記第３工程において、候補化合物を構成する各化合物断片の構造の上記所望の生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出することを特徴とする、生理活性化合物の設計方法に存する（請求項３）。

また、本発明の別の要旨は、（１）特定の生理活性を有し、且つ、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の生理活性化合物のジオメトリを得るジオメトリ取得部、（２）前記ジオメトリ取得部で取得されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を得る候補化合物取得部、及び、（３）前記候補化合物取得部で得られた候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する候補化合物評価部を備えることを特徴とする、生理活性化合物の設計装置に存する（請求項９）。

ここで、上述の請求項９に係る生理活性化合物の設計装置において、前記候補化合物取得部が、前記ジオメトリ取得部で取得されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する化合物断片作成部、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する候補化合物作成部を備えるとともに、前記候補化合物評価部が、候補化合物を構成する各化合物断片の構造の上記生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出するように構成することが好ましい（請求項１０）。

また、本発明の別の要旨は、（１）設計対象の生理活性化合物のジオメトリを得るジオメトリ取得部、（２）前記ジオメトリ取得部で取得されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を得る候補化合物取得部、及び、（３）前記候補化合物取得部で得られた候補化合物の分子構造を、化合物の所望の生理活性を予測するモデルから求めた活性スコアにより評価する候補化合物評価部を備え、前記候補化合物取得部が、前記ジオメトリ取得部で取得されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する化合物断片作成部、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する候補化合物作成部を備えるとともに、前記候補化合物評価部が、候補化合物を構成する各化合物断片の構造の上記所望の生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出するように構成されたことを特徴とする、生理活性化合物の設計装置に存する（請求項１１）。

上述の請求項１〜３に係る生理活性化合物の設計方法及び請求項９〜１１に係る生理活性化合物の設計装置によれば、設計対象の化合物のジオメトリに原子種を配置して候補化合物を設計しているので、同じジオメトリを有する化合物を網羅的に（原理的には可能な全ての化合物を）発生させることができる。従って、膨大な数の化合物を含む網羅的な化合物空間から、目的に応じた生理活性を有すると期待される化合物の分子構造を、効率的に探索することが可能となる。また、得られた候補化合物の分子構造に関する情報は、設計対象の化合物の合成、リード化合物の最適化や展開、将来の合成展開の方針決定などの際に、有効な情報となるものと期待される。

なお、ここでいう「網羅的な化合物空間」とは、厳密には設計対象の化合物のジオメトリに配置することのできる原子種の全ての組み合わせを指す。例えば、設計対象の化合物が単純な平面の六員環（ベンゼンなど）の場合、原子種として炭素（Ｃ）、窒素（Ｎ、ＮＨ）、酸素（Ｏ）を用いたときには、単純には４の６乗＝４０９６通りの配置の仕方が存在する。しかし、これらは結合次数の矛盾、対象性（鏡面・回転）による化合物としての重複を含み、実際には１２２種類の組み合わせが存在する。上述の生理活性化合物の設計方法及び設計装置は、こういった実際に存在しうる組み合わせからなる化合物空間全てを網羅し、あるいは実質的に同等な網羅性を有する手法で探索を行なうことを特徴とするものである。

また、上述の請求項１，２に係る生理活性化合物の設計方法及び請求項９，１０に係る生理活性化合物の設計装置によれば、特定の生理活性を有する既知の化合物であって、その構造がＸ線結晶構造解析法やＮＭＲなどによって解明されている化合物を原型化合物として用いることによって、原型化合物のジオメトリを変更することなく、同じジオメトリでありながら別の骨格を有する化合物を、効率的且つ網羅的に探索することが可能となる。また、既知の化合物の分子構造に化学修飾を加えたり、既知の化合物断片の構造を用いてこれを組み合わせたりする従来の技術とは異なり、既知の構造に制限されることがなく、新規な骨格の化合物を得ることも可能である。本発明者らの知見によれば、多数のタンパク質と生理活性化合物（特にリガンド）との複合体構造を観察すると、ジオメトリが似ていれば、骨格の異なる生理活性化合物でも同じタンパク質と複合体を形成した場合に、その結合様式は類似している場合が多い。

また、上述の請求項２，３に係る生理活性化合物の設計方法及び請求項１０，１１に係る生理活性化合物の設計装置によれば、ジオメトリの把握が容易になるとともに、候補化合物の分子構造の作成や活性スコアの算出を効率的に行なうことが可能となる。また、原型化合物の部分ジオメトリに基づいて可能な化合物断片を網羅的に探索しているので、既知の化合物断片を用意してこれを組み合わせる従来の技術とは異なり、極めて多様な骨格の候補化合物を得ることが可能である。また、得られた部分ジオメトリや化合物断片等の情報は、設計対象の化合物の合成や、リード化合物の最適化・展開をする上で有効な情報となり得る。

また、上述の請求項２，３に係る生理活性化合物の設計方法において、前記第２工程が、所定の指標を用いて化合物断片の構造のスクリーニングを行なう工程を更に有することが好ましい（請求項４）。
この特徴によれば、設計対象とする生理活性化合物の材料として適切でない化合物断片を予め取り除くことができ、適切な候補化合物をより確実に探し出すことが可能となる。

この場合、前記所定の指標が、膜透過性、溶解性、反応性、安定性、毒性、極性、分子量、水素結合ドナーの数、水素結合アクセプターの数、回転しうる結合の数、ハロゲン原子の数、環の数、環の大きさ、リンカーの数、及び、表面積の極性（polar surface area）からなる群から選ばれる少なくとも一つの指標であることが好ましい（請求項８）。
これらの指標を用いることによって、適切でない化合物断片や候補化合物を確実に取り除くことが可能となる。

また、設計対象の化合物が、例えば、受容体のリガンドである（請求項５）場合には、前記第３工程において、リガンドと受容体との推定される結合様式に基づき求められる、候補化合物と受容体との相互作用エネルギー値を、候補化合物の分子構造の活性スコアとして使用することが好ましい（請求項６）。

さらに、上記の場合、受容体との複合体の立体構造がＸ線結晶構造解析法やＮＭＲなどによって解明されているリガンド、或いは、その複合体の立体構造がドッキングソフトなどによって予測されているリガンドを、原型化合物として用いるとともに、この複合体の結合様式に基づいて、活性スコアによる候補化合物の評価を行なうことにより、受容体と安定な複合体構造を取ると期待される候補化合物を、効率的且つ網羅的に探索することが可能となる。また、得られた候補化合物の分子構造の情報は、設計対象のリガンドが受容体に結合する際に有効に作用する原子等を知る上で有用な情報となるものと期待される。

また、前記第３工程において、所定の指標を用いて候補化合物の分子構造のスクリーニングを行なうことも好ましい（請求項７）。
この特徴によれば、設計対象とする生理活性化合物として適切でない候補化合物を取り除くことができ、適切な候補化合物をより確実に探し出すことが可能となる。

また、本発明の別の要旨は、上述の生理活性化合物の設計方法が有する各工程をコンピュータに実行させることを特徴とする、生理活性化合物の設計プログラムに存する（請求項１２）。

この生理活性化合物の設計プログラムを用いれば、上述の生理活性化合物の設計方法及び生理活性化合物の設計装置を、一般的なコンピュータシステムを用いて容易に実現することが可能になる。

なお、本明細書において「生理活性化合物」とは、生体機能に作用する物質を意味し、薬理学的に有用なものであればいかなる物質でもよく、天然に存在するビタミン、ホルモンから合成有機化合物までを広く含む概念である。作用機構としては、受容体と結合して作用を示す化合物（リガンド）、抗酸化作用等の化学反応を起こして活性を示す化合物、ペプチドなどが存在する。

また、本明細書において「リガンド」とは、特定の受容体の特定の部位に結合（相互作用）する低分子量の（具体的には、分子量が千以下程度の）化合物をいうものとし、神経伝達物質、ホルモン、ビタミンなどの生体内活性物質、天然および合成の生理活性物質、薬物、酵素基質などを含む。

また、受容体とは、薬物の標的となりうるすべての生体高分子をいうものとし、タンパク質、核酸、多糖、およびそれらの複合体を含む。受容体の中でも特にタンパク質からなるものを「標的タンパク質」というものとする。

さらに、本明細書において「ジオメトリ」とは、２次元または３次元空間上に定められた点の集合の幾何学的関係を意味し、通常は各点の２次元座標又は３次元座標の集合として表わされる。また、「化合物のジオメトリ」とは、ある化合物の２次元構造又は３次元構造において、当該化合物を構成する個々の原子のうち少なくとも一部（例えば、水素原子、炭素原子、酸素原子、窒素原子、硫黄原子、塩素原子等）を点と看做すことにより得られるジオメトリを意味する。本発明で用いられるジオメトリにおいては、その空間に張られた座標系により各点の座標が一意に定められ、それらの座標に原子種を配置することにより、化合物の分子構造になりうる。また、ジオメトリを分解して得られる部分的な点の集合の幾何学的関係もジオメトリであり、本明細書においてはそれらを適宜「部分ジオメトリ」と称する。

本発明の生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラムは、上述の生理活性化合物を設計の対象とすることが可能であるが、中でもリガンドを設計の対象とすることが好ましい。

本発明によれば、生理活性を有する化合物の設計を行なう際に、網羅的な化合物空間から設計対象の化合物の分子構造を効率的に探索することが可能となる。

以下、本発明の実施の形態について説明するが、本発明は以下の実施の形態に限定されるものではなく、その要旨の範囲内で種々変形して実施することができる。

［Ｉ．生理活性化合物の設計方法］
図１は、本発明の一実施形態に係る生理活性化合物の設計方法（以下適宜「本実施形態の設計方法」等と略称する。）の手順を説明するためのフローチャートである。図１のフローチャートに示すように、本実施形態の設計方法は、工程Ｒ１〜Ｒ１１を有する。以下、各工程について順に説明する。

なお、本実施形態では、設計対象の生理活性化合物として、何らかの受容体と結合し得るリガンドを想定する。ここで、受容体としては標的タンパク質を想定するものとする。また、この標的タンパク質と結合して生理活性を有し、且つ、その構造が既知の化合物を、原型化合物として用いるものとする。

更に、本実施形態では、化合物の活性を予測するモデルとして、化合物と標的タンパク質との間の相互作用エネルギーを求めるモデルを使用し、このモデルによって求めた標的タンパク質との間の相互作用エネルギーを活性スコアとして、評価を行なうものとする。標的タンパク質との間の相互作用エネルギーを求めるモデルは、一般的に用いられる公知のものを用いることができる。具体的には、例えば、Kitchen, D. B. et al., J. Nat. Rev. Drug Discov., p.935-949, 2004年に記載の方法等が用いられる。

〔１：設計対象の化合物のジオメトリの用意〕
まず、工程Ｒ１において、標的タンパク質と原型化合物の複合体構造を用意する。複合体構造としては、例えばＸ線結晶構造解析法やＮＭＲ等によって解明した構造を利用することができる。また、公共データベース、例えばＰＤＢ（protein data bank）（the Research Collaboratory for Structural Bioinformatics（ＲＣＳＢ）によって管理されているデータベース。ＵＲＬは"http://www.rcsb.org/pdb/"。）等に登録されている構造を用いてもよい。更には、標的タンパク質と原型化合物の結合様式をＤＯＣＫ（上述の非特許文献１参照）やＧＯＬＤ（G. Jones et al., The Journal of Molecular Biology, Vol.245, p.43-53, 1995年参照）等の予測ソフトにより予測し、それを用いてもよい。

次に、工程Ｒ２において、標的タンパク質に結合している原型化合物の構造から原子座標を抽出し、設計対象の生理活性化合物のジオメトリを取得する。原子座標の抽出の手法としては、例えば、ＰＤＢ形式のファイルからリガンドの各原子のｘ，ｙ，ｚのそれぞれの座標を抽出して用いる。

〔２：部分ジオメトリへの分解〕
次に、工程Ｒ３において、工程Ｒ２で抽出された設計対象の化合物のジオメトリを、複数の部分的なジオメトリ（これを適宜「部分ジオメトリ」という。）に分解する。部分ジオメトリの種類は特に制限されないが、本実施形態では部分ジオメトリの種類として、環、リンカー、及びターミナルという三種類の部分ジオメトリを用いる。ここで、「環」とは化合物の環状骨格（炭素環式骨格及び複素環式骨格を含み、また、単環及び縮合環を含む。）に対応する部分ジオメトリをいい、「リンカー」とは環と環を結ぶ連結基に対応する部分ジオメトリをいい、「ターミナル」とは環とリンカー以外の置換基等に対応する部分ジオメトリをいう。

〔３：部分ジオメトリに対する原子種の配置及び化合物断片の設計〕
次に、工程Ｒ４において、工程Ｒ３で得られた個々の部分ジオメトリの各座標に対して、原子種の可能な組み合わせの配置を行なうことにより、設計対象の化合物の材料となる化合物断片を得る。各座標への原子種の配置は、原子間の結合次数の関係を満足するように行なう。ここで「原子種」とは、重原子及びそれと結合している水素原子をひとまとめにしたもの、例えば、ＣＨ₂、ＣＨ₃、ＮＨ、ＯＨ等のことをいう。下記表１に、本工程において使用可能な原子種の種類の例を示す。

また、「原子間の結合次数を満足する」関係とは、具体的には、１番目の原子種と２番目の原子種との間に結合が存在すると仮定して、１番目の原子種としてある特定の原子種を与えた時に１番目の原子種から２番目の原子種への結合に或る結合次数を得た場合、２番目の原子種から１番目の原子種への結合が該結合次数となるような原子種のみを、２番目の原子種として配置するということである。このような関係を全て満たすようにジオメトリに対して原子種を配置することで、組み合わせの数を減らしつつ、膨大な化合物空間を効率よく網羅することが可能となる。

例えば、「Ｘ・Ｙ・Ｚ」（ここで「Ｘ」、「Ｙ」、「Ｚ」は原子種を表わし、「・」は原子種間の結合を表わす。）で表わされる、３つの原子種からなる分子のジオメトリを仮定する。「Ｙ」の位置に「＝ＣＨ−」を配置すると、そのジオメトリは「Ｘ＝ＣＨ−Ｚ」（ここで「−」は単結合、「＝」は二重結合を表わす。）となる。この状態で「Ｘ」及び「Ｚ」に配置できる原子種を考えると、「Ｘ」は二重結合により「ＣＨ」と結合しているので、「Ｘ」に配置可能な原子種としては「Ｏ＝」や「ＣＨ₂＝」などが考えられる。また、「Ｚ」は単結合により「ＣＨ」と結合しているので、「Ｚ」に配置可能な原子種としては「−ＣＨ₃」や「−ＮＨ₂」などが考えられる。これらの原子種を繋げることにより、原子間の結合次数を満たす分子として「Ｏ＝ＣＨ−ＣＨ₃」、「Ｏ＝ＣＨ−ＮＨ₂」、「ＣＨ₂＝ＣＨ−ＣＨ₃」、「ＣＨ₂＝ＣＨ−ＮＨ₂」などの分子を得ることができる。

配置する原子種の型は、部分ジオメトリの各座標に関して、近接する点との平面性を調べて、近隣の点が全て同一平面状にあるときはｓｐ型かｓｐ²型の原子種が、また、平面でないときはｓｐ³型の原子種が配置されるように、原子種の配置を行なう。この際、環に関しては、環に属している全ての原子が同一平面状にある場合は、その環を芳香環とみなす。また、二つの結合を持つ点は、ｓｐ²型とｓｐ³型の両方の形を持つ原子種を配置するようにする。

〔４：化合物断片のスクリーニング〕
次に、工程Ｒ５において、工程Ｒ４で得られた化合物断片について、所定の指標を用いてスクリーニングを行なうか否かを選択する。スクリーニングを行なう場合には、工程Ｒ６において、工程Ｒ４で得られた化合物断片に対してスクリーニングを行なって、設計対象の化合物の材料として適切でない化合物断片を予め取り除き、その後で工程Ｒ７に進む。スクリーニングを行なわない場合には、工程Ｒ６を経由せずそのまま工程Ｒ７に進む。

ここで、スクリーニングに用いる所定の指標としては、例えば、膜透過性、溶解性、反応性、安定性、毒性、極性、分子量、水素結合ドナーの数、水素結合アクセプターの数、回転しうる結合の数、ハロゲン原子の数、環の大きさ、表面積の極性（polar surface area）などが挙げられる。これらの指標は予測値を使用してもよい。例えば、膜透過性や溶解性は、A. K. Ghose, et al. の文献（Journal of Computational Chemistry, Vol.7, p.565-577, 1986年参照）に記載の方法に従ってそれらの予測値を求めることができる。また、“薬物らしさ”を表わすフィルタ、例えば、G. M. Rishton（Drug Discovery Today, Vol.8, p.86, 2003年参照）が定めたフィルタ（以下適宜「Ｒｉｓｈｔｏｎのフィルタ」と略称する。）等を使用して、スクリーニングを行なうことも可能である。

〔５：化合物断片への活性スコアの付与〕
次に、工程Ｒ７において、工程Ｒ４で得られた化合物断片（又は、工程Ｒ６のスクリーニングを経た化合物断片）について、化合物の生理活性を予測するモデルを用いて活性スコアを求める。活性スコアとしては、化合物断片を評価する際に使用できるものであれば、その種類は特に制限されないが、本実施形態では、化合物と標的タンパク質との間の相互作用エネルギーを求めるモデルを使用し、標的タンパク質との間の相互作用エネルギー値を活性スコアとして算出する。具体的には、以下の手順に従って活性スコアの算出を行なう。

まず、活性スコアを求める準備として、各化合物断片の各点に配置した原子種に水素原子が存在する場合は、座標に配置された原子種の型（ｓｐ型、ｓｐ²型又はｓｐ³型）に応じて、水素原子の座標の生成を行なう。具体例として、「Ｈ・Ｘ・Ｙ」で表わされる構造（ここで「Ｘ」は配置した原子種内の重原子を表わし、「Ｙ」は「Ｘ」に隣接する重原子を表わし、「・」は原子種間の結合を表わす。）を考えると、配置した原子種「Ｘ」がｓｐ型の場合には、この結合角が１８０°になるように、ｓｐ²型の場合には、この構造の結合角が１２０°になるように、また、ｓｐ³型の場合には、この結合角が１０９°になるように、水素原子の座標の生成を行なう。そして、後述の式（１）に示すスコア関数に基づいて、活性スコアの値を算出する。なお、「ＯＨ」や「ＣＨ₃」など、水素原子が重原子に対して単結合で回転できるように結合している原子種に関しては、水素原子を１０°毎にずらしながら仮に配置して、活性スコアの値が一番よいものを選択する。

活性スコア（標的タンパク質との間の相互作用エネルギー値）の算出は、それ自体既知の通常用いられる方法（Kitchen, D. B. et al., J. Nat. Rev. Drug Discov., p.935-949, 2004年参照）を用いることができるが、具体的には、例えば、下記式（１）に示すスコア関数に基づいて行なうことができる。なお、下記式（１）において、Ｕは、標的タンパク質との間の相互作用エネルギー値を表わし、Ｕ_vは、標的タンパク質と化合物断片との間におけるファンデルワールス力を表わし、Ｕ_eは、標的タンパク質と化合物断片との間における静電相互作用を表わし、Ｕ_sは、溶媒露出表面積から得られる水和の自由エネルギーを近似した値を表わし、Ｕ_bは、水素結合に関するスコアを表わす。

ここで、Ｕ_v及びＵ_eとしては、下記式（２）で示す関数を用いる。

いま、系の原子の総数をＭとし、各原子に任意に番号をつける。

上記式（２）において、ｒ_ijはｉ番目とｊ番目の原子の距離を表わし、ｒ⁰ _ijは各原子のファンデルワールス半径の和を表わし、式
ｒ⁰ _ij＝ｒ⁰ _i＋ｒ⁰ _j
に基づいて原子の組毎に算出される。

また、ε_ijはファンデルワールス相互作用にかかわる係数で、式

に基づいて原子の組毎に算出される。

更に、ｅ_i及びｅ_jは、それぞれｉ番目及びｊ番目の原子に定められた電荷を表わし、εは誘電率を表わす。

式（２）に示すこれらのパラメータとして、標的タンパク質に関する値としては、例えば、ＡＭＢＥＲのパラメータを用いることができる（S. J. Weiner et al., Journal of Computational Chemistry, Vol.7, p.230-252, 1986年参照）。また、化合物断片側の値としては、例えば、下記表２に示す値を用いることができる。

また、上記式（１）におけるＵ_bは、水素原子と水素結合性ヘテロ原子との関係を用いて、下記式（３）により定義される。

上記式（３）において、ａ_bは、任意の係数を表わす。後述の実施例ではａ_b＝１とした。
また、Ｅ（ｒ_ij）は、距離ｒ_ijに関するスコアであり、下記式（４）によって定義される。

上記式（４）において、ｒ_Hは、標準的な水素結合における水素とヘテロ原子の距離を表わす。後述の実施例においては、ｒ_H＝２．０とした。

また、上記式（１）において、Ｕ_sは、複合体の状態における水和の自由エネルギーと、単体の状態における水和の自由エネルギーとの差によって定められる。本実施形態では、溶媒露出表面積を基にした下記式（５）で表わされる関数を用いる。

上記式（５）において、Ａ^complexは、複合体の状態における溶媒露出表面積を表わし、Ａ^isolateは、単体の状態における溶媒露出表面積を表わす。
また、σは、各原子種に定められた露出表面積に対する自由エネルギーに関する係数である。これらのパラメータの値としては、例えば、上記表２に示すものを用いることができる。

以上の手順により、各化合物断片と標的タンパク質との間の相互作用エネルギー値が求められるので、それを各化合物断片の活性スコアとして付与する。ここで、この相互作用エネルギー値（活性スコアの値）が小さい方が、標的タンパク質と強く結合しているので、よい活性スコアであるということができる。よって以下の記載では、活性スコアの値が「小さい」ことを、活性スコアの値が「よい」という場合がある。

なお、この段階で、化合物断片を活性スコアの小さい順に並べ替えてもよい。これによって、どのような化合物断片が標的タンパク質と適合するかを調べることができ、化合物合成の展開のヒントとなりえる。また、各座標を占めている原子種を観察することにより、複合体における化合物の傾向を見出すことができる。

〔６：候補化合物の作成及び活性スコアによる評価〕
次に、工程Ｒ８において、原子種を配置された化合物断片を、結合次数の関係を満足するようにつなぎ合わせていき、原型化合物と同じジオメトリを有する候補化合物を生成する。

次に、工程Ｒ９において、各化合物断片の活性スコアの値から候補化合物全体の活性スコアの値を求め、その活性スコアを良い順（活性スコアの値の小さい順）に並べることにより、標的タンパク質と適合する候補化合物を探し出すことができる。

〔７：候補化合物のスクリーニング〕
次に、工程Ｒ１０において、工程Ｒ８で得られた候補化合物について、所定の指標を用いてスクリーニングを行なうか否かを選択する。スクリーニングを行なう場合には、工程Ｒ１１において、得られた候補化合物に対してスクリーニングを行ない、設計対象の化合物として適切でない候補化合物を取り除き、残った候補化合物を結果として得る。スクリーニングを行なわない場合には、工程Ｒ１１を経由せずそのまま候補化合物を結果として得る。

スクリーニングに用いる所定の指標としては、例えば、膜透過性、溶解性、反応性、安定性、毒性、極性、分子量、水素結合ドナーの数、水素結合アクセプターの数、回転しうる結合の数、ハロゲン原子の数、環の数、環の大きさ、リンカーの数、及び、表面積の極性（polar surface area）などが挙げられる。これらの指標は予測値を使用してもよい。例えば、膜透過性や溶解性は、A. K. Ghose, et al.の文献（Journal of Computational Chemistry, Vol.7, p.565-577, 1986年参照）に記載の方法に従ってそれらの予測値を求めることができる。また、“薬物らしさ”を表わすフィルタ、例えば上述のＲｉｓｈｔｏｎのフィルタ等を使用して、スクリーニングを行なうことも可能である。このように“薬物らしさ”を表わすフィルタを通して候補化合物のスクリーニングを行なうことによって、より医薬品らしい化合物を得ることができ、医薬品の設計に非常に有効である。

〔８：その他〕
以上、本発明の一実施形態について説明したが、本発明の実施の形態はこれに限られるものではなく、適宜変更を加えて実施することが可能である。

例えば、上述の実施形態では、工程Ｒ２において、既知の構造を有する化合物（原型化合物）の原子座標を抽出して、これを設計対象の化合物のジオメトリとして用いていたが、設計対象の化合物のジオメトリがデノボ設計（例えば、特開２０００−１７８２０９号明細書等を参照）等から明らかである場合には、そのジオメトリを直接用いることも可能である。

また、上述の実施形態では、工程Ｒ１において、原型化合物と標的タンパク質との複合体の構造を取得していたが、原型化合物と標的タンパク質との複合体の構造が明らかでない場合や予測が困難な場合には、この工程は不要である。この場合、工程Ｒ７，Ｒ９における、化合物の活性を予測するモデルとしては、上述した標的タンパク質との間の相互作用エネルギー値を求めるモデルの代わりに、定量的構造活性相関（ＱＳＡＲ； Quantitative Structure Activity Relationship）（「最新創薬科学下巻」p.29-, 1999年, テクノミック等を参照）や、３次元定量的構造活性相関（３Ｄ−ＱＳＡＲ）等を使用し、これらのモデルによって得られる値を活性スコアとして使用することができる。なお、活性スコアの種類によっては、活性スコアの値が小さいほどよい活性スコアであるとは限らない（例えば、活性スコアの値が大きいほどよい活性スコアとなる場合もある。）ので、注意が必要である。

なお、上述の実施形態では、工程Ｒ３において、原型化合物のジオメトリを部分ジオメトリに分解して、工程Ｒ４において、各部分ジオメトリに対して原子種を配置して化合物断片を作成し、工程Ｒ８において、これを組み立てることにより候補化合物を作成していたが、原型化合物が特定の生理活性を有し、且つ、構造が分かっていてジオメトリを取得できる場合には、原型化合物のジオメトリを分解することなく、これに直接原子種を配置することにより、候補化合物を作成してもよい。

また、上述の実施形態では、工程Ｒ７において、各化合物断片について活性スコアを求め、工程Ｒ９において、化合物断片の活性スコアを足し合わせて候補化合物の活性スコアを算出していたが、上述の様に原型化合物のジオメトリを分解せず直接原子種を配置して候補化合物を作成する場合には、候補化合物から直接その活性スコアを求めればよい。

また、上述の実施形態では、工程Ｒ５及びＲ１０において、スクリーニングを行なうか否かの選択を行なっていたが、各々の段階でスクリーニングを行なうか否かが事前に決まっている場合には、このような選択を行なう工程を設ける必要は無い。スクリーニングを行なう場合には、その前段の工程Ｒ４，Ｒ９から直接スクリーニングの工程Ｒ６，Ｒ１１に進むようにすればよく、スクリーニングを行なわない場合には、これらのスクリーニングの工程Ｒ６，Ｒ１１の工程を省いて更に次段の工程に進むようにすればよい。

また、上述の実施形態におけるＲ１〜Ｒ１１の各工程は、本発明の要旨を逸脱しない範囲において、適宜順序を入れ替えてもよい。例えば、化合物断片の活性スコアを求める工程Ｒ７と、候補化合物の作成を行なう工程Ｒ８とは、逆の順序で実施してもよい。

なお、上述の実施形態において、工程Ｒ１，Ｒ２が、本発明の設計方法の第１工程に該当し、工程Ｒ３，Ｒ４，Ｒ８が、本発明の設計方法の第２工程に該当し、工程Ｒ９が、本発明の設計方法の第３工程に該当する。

また、本実施形態では、設計対象の生理活性化合物として、何らかの受容体と結合し得るリガンドを想定し、受容体としては標的タンパク質を想定していたが、本発明では、標的タンパク質以外の受容体と結合するリガンドを設計対象としたり、リガンド以外の生理活性化合物を設計対象とすることも当然可能である。

［II．その他］
本発明の設計方法は、ＣＰＵ，ＲＡＭ，ハードディスクや各種周辺機器等を備えた通常のコンピュータシステム（例えば各種ネットワークサーバ、ワークステーション、パーソナルコンピュータ等）を用いることによって、容易に実現することができる。

通常、こうしたコンピュータシステムでは、ＣＰＵがハードディスク等に記憶されたコンピュータプログラムに従って各種の演算処理を実行するとともに、ＣＰＵの各種演算処理に必要なデータがＲＡＭに適宜記憶・更新される。また、コンピュータシステムには更に各種の機器（キーボード、マウス等の入力機器、ディスプレイ、プリンタ等の出力機器、ＣＤ−ＲＯＭドライブ、フロッピー（登録商標）ディスクドライブ等の記憶媒体読取・書込装置、通信ネットワークとのインターフェースなど）が内蔵又は接続され、ＣＰＵの演算処理によって制御される。

従って、本発明の設計方法の各工程（上述の第１，第２，第３工程）をコンピュータに実行させるコンピュータプログラム（本発明の生理活性化合物の設計プログラム）を用いれば、このコンピュータプログラムをＲＡＭに読み出して起動し、ＣＰＵで実行することにより、ＣＰＵの動作として、又はＣＰＵとＲＡＭ，ハードディスク，各種周辺機器等との協動動作として、本発明の設計方法が実現される。

本発明の生理活性化合物の設計プログラムは、使用するコンピュータシステムの構成やオペレーティングシステムの種類・バージョン等に応じて、公知の各種のプログラム言語を用いて作成することが可能である。得られたコンピュータプログラムは、内蔵ハードディスクや外付けハードディスク等の記憶装置に記録しておいてもよいが、例えばＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、ＭＯディスク等のコンピュータ読取可能な各種の記憶媒体に記録しておき、必要に応じて随時、コンピュータシステムが有する記憶媒体読取装置を通じて、これを直接、又はハードディスクにインストールして使用するのが好ましい。或いは、コンピュータシステムから情報通信ネットワークを通じてアクセス可能な外部記憶領域（他のコンピュータ等）に当該コンピュータプログラムを記録しておき、必要に応じて随時、前記の外部記憶領域から情報通信ネットワークを通じてこれを直接、又はハードディスクにインストールして使用するのが好ましい。

ここで、本発明の生理活性化合物の設計プログラムを実行するコンピュータは、（１）設計対象の生理活性化合物のジオメトリを得るジオメトリ取得部、（２）前記ジオメトリ取得部で取得されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を得る候補化合物取得部、及び、（３）前記候補化合物取得部で得られた候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する候補化合物評価部を備えた装置（本発明の生理活性化合物の設計装置）として機能することになる。

また、前記ジオメトリ取得部は、好ましくは、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の化合物のジオメトリを得るように構成される。

また、前記候補化合物評価部は、好ましくは、リガンドと標的タンパク質等の受容体との推定される結合様式に基づき求められる、候補化合物と受容体との相互作用エネルギー値を、候補化合物の分子構造の活性スコアとして使用するように構成される。

また、前記候補化合物取得部は、好ましくは、前記ジオメトリ取得部で取得されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する化合物断片作成部、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する候補化合物作成部を備えて構成され、前記候補化合物評価部が、候補化合物を構成する各化合物断片の構造の活性スコアに基づいて、候補化合物の分子構造の活性スコアを付与するように構成される。

また、本発明の生理活性化合物の設計装置は、好ましくは、所定の指標を用いて化合物断片の構造のスクリーニングを行なうスクリーニング部を更に備える。このスクリーニング部は、前記化合物断片作成部で得られた化合物断片の構造や、前記候補化合物取得部で得られた候補化合物の分子構造、所定の指標を用いて候補化合物の分子構造のスクリーニングを行なうように構成される。

なお、本発明の生理活性化合物の設計装置を構成するこれらの要素（これらのジオメトリ取得部、候補化合物取得部（化合物断片作成部、候補化合物作成部）、候補化合物評価部、スクリーニング部）は、主にコンピュータのＣＰＵにおける演算処理によって達成されることになる。

更に、本発明の生理活性化合物の設計装置は、上述のＣＰＵでの演算処理に必要な各種情報をコンピュータに入力するための入力部と、上述のＣＰＵでの演算処理で得られた情報をコンピュータから出力するための出力部とを備えて構成される。

なお、これらの入力部及び出力部は、コンピュータに接続されたキーボード、マウス等の入力機器、ディスプレイ、プリンタ等の出力機器、ＣＤ−ＲＯＭドライブ、フロッピー（登録商標）ディスクドライブ等の記憶媒体読取・書込装置、通信ネットワークとのインターフェースなどによって達成されることになる。

次に、実施例により本発明を更に具体的に説明するが、本発明はその要旨を超えない限り、以下の実施例に限定されるものではない。

［Ｉ．概要及び手順］
本発明の設計方法の実施例として、チロシンキナーゼであるｃ−ｋｉｔ（D. Linnekin, The International Journal of Biochemistry & Cell Biology, Vol.31, p.1053-1074, 1999年参照）と複合体を形成する化合物の設計を行なった。原型化合物としては、Ｉｍａｔｉｎｉｂ（Ｇｌｉｖｅｃ（登録商標）、ノバルティスファ−マ社製）を用いた。Ｉｍａｔｉｎｉｂはｃ−ｋｉｔと複合体を形成し、ｃ−ｋｉｔを特定的に阻害する化合物で、慢性骨髄性白血病の治療薬として用いられている。

化合物の設計は、図１に示すフローチャートに沿って行なった。なお、実施例としては、フローチャートの工程Ｒ６及び工程Ｒ１１におけるスクリーニングを省略したもの（実施例１）と、工程Ｒ６及び工程Ｒ１１におけるスクリーニングを実行したもの（実施例２）を行なった。実施例１と実施例２は、他の工程については共通である。

まず、フローチャートの工程Ｒ１において、Ｉｍａｔｉｎｉｂとｃ−ｋｉｔとの複合体構造をＰＤＢ（protein data bank）から取得した。Ｉｍａｔｉｎｉｂとｃ−ｋｉｔとの複合体の立体構造は、Ｘ線結晶構造解析により解明されており、１ｔ４６というＰＤＢ−ｅｎｔｒｙで登録されている。Ｉｍａｔｉｎｉｂとｃ−ｋｉｔとの複合体構造の模式図を図２に示す。図２では、ｃ−ｋｉｔをリボン（solid ribbon）モデルで、ＩｍａｔｉｎｉｂをＣＰＫ（Corey-Pauling-Kolturn）モデルでそれぞれ表わしている。

次に、フローチャートの工程Ｒ２において、Ｉｍａｔｉｎｉｂの原子座標の抽出を行ない、設計対象の化合物（ｃ−ｋｉｔと複合体を形成する化合物）のジオメトリを用意した。Ｉｍａｔｉｎｉｂの化学構造式を図３（ａ）に示す。また、Ｉｍａｔｉｎｉｂの化学構造から抽出されたジオメトリの各座標に番号を割り当てたものを図３（ｂ）に示す。

次に、フローチャートの工程Ｒ３において、工程Ｒ２で得られたＩｍａｔｉｎｉｂのジオメトリを、環、リンカー、ターミナルという３種類の部分ジオメトリに分解した。この作業によって得られた部分ジオメトリを、その種類毎に分類して図４に示す。

次に、フローチャートの工程Ｒ４において、工程Ｒ３で得られた部分ジオメトリの各座標に対して、原子間の結合次数の関係を満たすように原子種を配置することにより、化合物断片を得た。原子種の種類としては、上述の表１に挙げたものを用いた。

次に、フローチャートの工程Ｒ５において、工程Ｒ４で得られた化合物断片についてスクリーニングを行なうか否かを選択した。実施例１ではスクリーニングを行なわず、そのまま工程Ｒ７に進んだ。実施例２では、工程Ｒ６においてスクリーニングを実行してから、工程Ｒ７に進んだ。スクリーニングの指標としては、上述のＲｉｓｈｔｏｎのフィルタを使用した。また、環に対応する化合物断片に関しては、既知の構造を有する化合物に存在する環構造を持つものだけを選択した。

次に、フローチャートの工程Ｒ７において、各化合物断片に配置された原子種に基づいて、各化合物断片の活性スコアの値を求めた。各化合物断片の活性スコアとしては、上述の表２に掲げた各パラメータを上述の式（１）〜（５）に当てはめて得られた相互作用エネルギー値を用いた。

次に、フローチャートの工程Ｒ８において、結合次数の関係を満たすように各化合物断片をつなぎ合わせることにより、候補化合物を生成した。

次に、フローチャートの工程Ｒ９において、各候補化合物についてその構成要素となる化合物断片の活性スコアを足し合わせることにより、候補化合物の活性スコアを算出した。

次に、フローチャートの工程Ｒ１０において、工程Ｒ８で得られた候補化合物についてスクリーニングを行なうか否かを選択した。実施例１ではスクリーニングを行なわず、工程Ｒ８で得られた候補化合物をそのまま後述の評価に供した。実施例２では、工程Ｒ１１においてスクリーニングを実行してから、得られた候補化合物を後述の評価に供した。スクリーニングの際の指標としては、上述のＲｉｓｈｔｏｎのフィルタを使用した。

［II．結果及び考察］
〔実施例１〕
図５，６は、図４に示す各部分ジオメトリに基づいて得られた化合物断片のうち、スコアの良い順に上位５個の化合物断片を、その部分ジオメトリに対応する原型化合物の化合物断片とともに表わす表である。図５は、環に分類される部分ジオメトリの化合物断片を示し、図６は、リンカー及びターミナルに分類される部分ジオメトリの化合物断片を示している。

なお、図５，６の表において、左欄には、部分ジオメトリの各座標に番号を当てはめた図を示す。表の中欄には、活性スコアの上位５個の化合物断片を、活性スコアのよいものから順に左から並べて示すとともに、その下に活性スコアを併記している。また、原型化合物の化合物断片については網掛けで示している。活性スコアの上位５個に原型化合物の化合物断片が含まれていない場合には、表の中欄の最右側に示している。また、表の右欄には、得られた化合物断片の数を下段に、原型化合物の化合物断片の活性スコアの順位を上段にそれぞれ記している。

図５から、各部分ジオメトリについて得られた活性スコア上位の５個の化合物断片を見ると、対応する原型化合物の化合物断片と比べて、少し化学的な性質が異なったものが得られていることが分かる。特に、７〜１２の点で構成されている環（上から二段目）については、工程Ｒ４で得られた１１２４個の化合物断片の中で、原型化合物の化合物断片が４４７番目に位置しており、その性質は上位５個の化合物とはあまり似ていないことがわかる。それに対して、図６に示すように、リンカーとターミナルの部分は、原型化合物の化合物断片が上位に来ていることがわかる。これらの部分に関しては、よい精度で原子種の配置ができたことを意味する。

図７は、各化合物断片を組み合わせて得られた候補化合物のうち、活性スコアの良い順に上位５個の候補化合物の化学構造式を、原型化合物の化学構造式とともに表わす図である。

図７から、得られた活性スコア上位５個の候補化合物には、ヘテロ原子が数多く存在することがわかる。また、活性スコア上位５個の候補化合物と原型化合物との間で、活性スコア値の差が非常に大きいことが分かる。但し、ここで得られた候補化合物は、“薬物らしさ”のフィルタを通していないものであり、化学合成が容易でないもの等、不適切な化合物も含まれている。従って、それらの不適切な化合物をフィルタなどで結果から除くと、原型化合物と上位５個の候補化合物との活性スコア値の差が小さくなると考えられる。

〔実施例２〕
図８，９は、図４に示す各部分ジオメトリに基づいて得られた化合物断片に対し、フィルタによるスクリーニングを行なって得られた化合物断片のうち、活性スコアの良い順に上位５個の化合物断片を、その部分ジオメトリに対応する原型化合物の化合物断片とともに表わす表である。図８は、環に分類される部分ジオメトリの化合物断片を示し、図９は、リンカー及びターミナルに分類される部分ジオメトリの化合物断片を示している。

なお、図８，９の表において、左欄には、部分ジオメトリの各座標に番号を当てはめた図を示す。表の中欄には、活性スコアの上位５個の化合物断片を、活性スコアのよいものから順に左から並べて示すとともに、その下に活性スコアを併記している。また、原型化合物の化合物断片については網掛けで示している。活性スコアの上位５個に原型化合物の化合物断片が含まれていない場合には、表の中欄の最右側に示している。また、表の右欄には、得られた化合物断片の数を下段に、原型化合物の化合物断片の活性スコアの順位を上段にそれぞれ記している。

図８，９から、原型化合物の構造に類似したものを選択しているのが観察される。特に、リンカー部分は原型化合物の部分ジオメトリと同じものを高い順位で選択していることがわかる。これらの結果は複合体の状態から分子構造を求めていることが有効に働いたと考えられる。また、環構造に関しては、上位５個は元の構造と類似したものが選ばれていることが観察される。上位５個以内に位置していない部分に関しても、上位２０番以内に基の環構造が位置している。これら選ばれた環構造は、既知の構造を有する化合物に存在する環構造であることから、化学合成を容易に行なえると考えられる。

ターミナルに関しては、原型化合物の構造に類似しないものも上位に存在している。ターミナル部分は環やリンカー構造に比べて、複合体の周りの影響を非常に受けやすい傾向にある。特に、活性スコアに使用したファンデルワールス力を過剰に算出してしまう傾向にある。従って、活性スコアの値が僅差の点、例えば、点３３においては、そこに位置する原子種も多様化してしまう傾向にある。これに対して、点３７に関しては親水性の原子が配置しやすい傾向にあることがわかる。このようにこれらの原子種を観察することにより、その座標に配置される原子種の性質の傾向を見出すことができる。従って、各部分ジオメトリを観察することは合成展開のよいヒントになることが言える。

図１０は、各化合物断片を組み合わせて得られた化合物に対し、フィルタによるスクリーニングを行なって得られた候補化合物のうち、活性スコアの良い順に上位５個の候補化合物の化学構造式を、原型化合物の化学構造式とともに表わす図である。

図１０の結果を観察すると、フィルタによるスクリーニングを通じて得られた活性スコア上位５種の候補化合物は、原型化合物と類似したものであることが分かる。図１０の候補化合物の構造と図８，９の部分ジオメトリを比較すると、各部分ジオメトリで上位に位置していた化合物の組み合わせが必ずしも上位に位置していないことがわかる。これは結合次数の関係を満たすように化合物を組み合わせた場合、上位の部分ジオメトリだけでは化合物を得ることができず、活性スコアが悪いものを選ばなければならなくなり、結果として、全体の活性スコアが悪くなってしまったということが考えられる。また、医薬品らしさなどのスクリーニングからもれてしまったこともひとつの原因だと考えられる。従って、原型化合物とはまったく異なった骨格を持つ化合物を得るためには、部分ジオメトリだけを見るのではなく、全体を観察して考える必要があることがわかる。

図５〜７と図８〜１０から、網羅的に化合物を発生し、“薬物らしさ”を表わすフィルタを通すことによって、効率よく標的タンパク質に結合する薬物を見つけ出すことができることがわかる。もし、偏ったサンプリングの方法で化合物を生成し、スクリーニングを行なっても、標的タンパク質に結合する薬物を見つけ出すことは非常に困難であると考えられる。

本実施例で得られた活性スコア上位の候補化合物は、標的タンパク質との複合体の構造の情報を考慮して、同じジオメトリを持つ膨大な数の候補化合物の中から選択されていることから、高い確率で標的タンパク質と複合体を形成する可能性があると考えられる。このことから、本実施例で導き出した活性スコア上位の候補化合物は、標的タンパク質と高い確率で複合体構造を形成できると考えられる。本実施例においては、原型化合物であるＩｍａｔｉｎｉｂが標的タンパク質であるｃ−ｋｉｔと非常に高い親和性を示すために、Ｉｍａｔｉｎｉｂと類似した化合物が出力され、本方法の有効性が示されたが、原型化合物が標的タンパク質に対して親和性が非常に高くない場合には、本方法により、原型化合物と異なった骨格を有し原型化合物と親和性が同等または高い化合物を得ることが期待できる。

本発明の生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラムは、各種の生理活性化合物の設計に使用することが可能であるが、とりわけ医薬、農薬等の分野において好適に用いられる。

本発明の第１実施形態に係る生理活性化合物の設計方法の手順を説明するためのフローチャートである。実施例における標的タンパク質ｃ−ｋｉｔと原型化合物Ｉｍａｔｉｎｉｂとの複合体構造の模式図である。ｃ−ｋｉｔをリボンモデルで、ＩｍａｔｉｎｉｂをＣＰＫモデルで表わしている。（ａ）は、実施例における原型化合物Ｉｍａｔｉｎｉｂの化学構造式を示す図であり、（ｂ）は、その化学構造から抽出されたジオメトリの各座標に番号を割り当てた図である。実施例における原型化合物Ｉｍａｔｉｎｉｂのジオメトリを分解して得られた部分ジオメトリを、環、リンカー、ターミナルという部分ジオメトリの種類毎に分類し、且つ、各座標に番号を割り当てて示す図である。実施例１において、環に分類された各部分ジオメトリから得られた化合物断片のうち、活性スコアの良い順に上位５個の化合物断片を、その部分ジオメトリに対応する原型化合物の化合物断片とともに表わす表である。実施例１において、リンカー及びターミナルに分類された各部分ジオメトリから得られた化合物断片のうち、活性スコアの良い順に上位５個の化合物断片を、その部分ジオメトリに対応する原型化合物の化合物断片とともに表わす表である。実施例１において、各化合物断片を組み合わせて得られた候補化合物のうち、活性スコアの良い順に上位５個の候補化合物の化学構造式を、原型化合物Ｉｍａｔｉｎｉｂの化学構造式とともに表わす図である。実施例２において、環に分類された各部分ジオメトリから得られた化合物断片のうち、活性スコアの良い順に上位５個の化合物断片を、その部分ジオメトリに対応する原型化合物の化合物断片とともに表わす表である。実施例２において、リンカー及びターミナルに分類された各部分ジオメトリから得られた化合物断片のうち、活性スコアの良い順に上位５個の化合物断片を、その部分ジオメトリに対応する原型化合物の化合物断片とともに表わす表である。実施例２において、各化合物断片を組み合わせて得られた候補化合物のうち、活性スコアの良い順に上位５個の候補化合物の化学構造式を、原型化合物Ｉｍａｔｉｎｉｂの化学構造式とともに表わす図である。

Claims

（１）特定の生理活性を有し、且つ、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の生理活性化合物のジオメトリを用意する第１工程、
（２）前記第１工程で用意されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得する第２工程、及び、
（３）前記第２工程で得られた候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する第３工程を有する
ことを特徴とする、生理活性化合物の設計方法。
前記第２工程が、前記第１工程で用意されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する工程、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する工程を有するとともに、
前記第３工程において、候補化合物を構成する各化合物断片の構造の上記生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出する
ことを特徴とする、請求項１記載の生理活性化合物の設計方法。
（１）設計対象の生理活性化合物のジオメトリを用意する第１工程、
（２）前記第１工程で用意されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得する第２工程、及び、
（３）前記第２工程で得られた候補化合物の分子構造を、化合物の所望の生理活性を予測するモデルから求めた活性スコアにより評価する第３工程を有し、
前記第２工程が、前記第１工程で用意されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する工程、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する工程を有するとともに、
前記第３工程において、候補化合物を構成する各化合物断片の構造の上記所望の生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出する
ことを特徴とする、生理活性化合物の設計方法。
前記第２工程が、所定の指標を用いて化合物断片の構造のスクリーニングを行なう工程を更に有する
ことを特徴とする、請求項２又は請求項３に記載の生理活性化合物の設計方法。
設計対象の生理活性化合物がリガンドである
ことを特徴とする、請求項１〜４の何れか一項に記載の生理活性化合物の設計方法。
前記第３工程において、リガンドと受容体との推定される結合様式に基づき求められる候補化合物と受容体との相互作用エネルギー値を、候補化合物の分子構造の活性スコアとして使用する
ことを特徴とする、請求項５記載の生理活性化合物の設計方法。
前記第３工程において、所定の指標を用いて候補化合物の分子構造のスクリーニングを行なう
ことを特徴とする、請求項１〜６の何れか一項に記載の生理活性化合物の設計方法。
前記所定の指標が、膜透過性、溶解性、反応性、安定性、毒性、極性、分子量、水素結合ドナーの数、水素結合アクセプターの数、回転しうる結合の数、ハロゲン原子の数、環の数、環の大きさ、リンカーの数、表面積の極性（polar surface area）からなる群から選ばれる少なくとも一つの指標である
ことを特徴とする、請求項７記載の生理活性化合物の設計方法。
（１）特定の生理活性を有し、且つ、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の生理活性化合物のジオメトリを得るジオメトリ取得部、
（２）前記ジオメトリ取得部で取得されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を得る候補化合物取得部、及び、
（３）前記候補化合物取得部で得られた候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する候補化合物評価部を備える
ことを特徴とする、生理活性化合物の設計装置。
前記候補化合物取得部が、前記ジオメトリ取得部で取得されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する化合物断片作成部、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する候補化合物作成部を備えるとともに、
前記候補化合物評価部が、候補化合物を構成する各化合物断片の構造の上記生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出するように構成された
ことを特徴とする、請求項９記載の生理活性化合物の設計装置。
（１）設計対象の生理活性化合物のジオメトリを得るジオメトリ取得部、
（２）前記ジオメトリ取得部で取得されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を得る候補化合物取得部、及び、
（３）前記候補化合物取得部で得られた候補化合物の分子構造を、化合物の所望の生理活性を予測するモデルから求めた活性スコアにより評価する候補化合物評価部を備え、
前記候補化合物取得部が、前記ジオメトリ取得部で取得されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する化合物断片作成部、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する候補化合物作成部を備えるとともに、
前記候補化合物評価部が、候補化合物を構成する各化合物断片の構造の上記所望の生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出するように構成された
ことを特徴とする、生理活性化合物の設計装置。
請求項１〜８の何れか一項に記載の生理活性化合物の設計方法が有する各工程を、コンピュータに実行させる
ことを特徴とする、生理活性化合物の設計プログラム。