JP2006323833A - 生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラム - Google Patents
生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラム Download PDFInfo
- Publication number
- JP2006323833A JP2006323833A JP2006115504A JP2006115504A JP2006323833A JP 2006323833 A JP2006323833 A JP 2006323833A JP 2006115504 A JP2006115504 A JP 2006115504A JP 2006115504 A JP2006115504 A JP 2006115504A JP 2006323833 A JP2006323833 A JP 2006323833A
- Authority
- JP
- Japan
- Prior art keywords
- compound
- geometry
- candidate compound
- candidate
- molecular structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
Abstract
【課題】生理活性を有する化合物の設計を行なう際に、網羅的な化合物空間から目的に応じた化合物の分子構造を効率的に探索することが可能な方法を提供する。
【解決手段】(1)特定の生理活性を有し、且つ、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の生理活性化合物を用意し、(2)このジオメトリに対して、原子間の結合次数の関係を満たすように原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得し、(3)この候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する。
【選択図】図1
【解決手段】(1)特定の生理活性を有し、且つ、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の生理活性化合物を用意し、(2)このジオメトリに対して、原子間の結合次数の関係を満たすように原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得し、(3)この候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する。
【選択図】図1
Description
本発明は、医薬や農薬等に有効な生理活性を有する化合物を設計する方法及び装置と、その機能をコンピュータに実行させるプログラムに関するものである。
従来、医薬や農薬に有用性の高い化合物の設計は、既知の構造を有する化合物の結合様式などを参考にして、化合物の基本骨格を変換することにより行なわれている。しかし、その基本骨格の変換は、合成化学者の経験に基づいて行なわれている場合が多い。
一方、多くの化合物とタンパク質との複合体の構造が、X線結晶構造解析や核磁気共鳴(Nuclear magnetic resonance:NMR)法などによって解明されており、それらの結合の様式が明らかにされている。この複合体の構造から得られる情報を基に化合物の設計を行なうことによって、より生理活性が高い化合物を見出すことが可能になると期待できる。
コンピュータによる化合物の設計方法としては、構造既知のタンパク質から化合物が結合する部位を計算的に又は実験的に見出し、その部位にうまく当てはまる化合物を探し出す方法が用いられている。
このような方法の例としては、既知の構造を有する化合物が収められているデータベースから、最適な化合物を探索する方法が挙げられる(非特許文献1)。
また、探索する化合物の空間を広くするために、独自に設計した化合物の集団の中から標的のタンパク質にうまく結合する最適な化合物を探し出す方法もある(非特許文献2)。
また、標的タンパク質との結合状態などがX線結晶構造解析やNMR等によって解明されている化合物に対して、化学修飾を行なうことにより、更に有効な生理活性を示す化合物を探索する方法もある(非特許文献3)。
更には、標的タンパク質のポケットから、それに当てはまる化合物をde novo 分子設計によって求める方法もある(非特許文献4)。この方法は、原子或いは原子集団の単位で三次元の原子座標を定め、それらの座標に対して原子種或いは既知のフラグメントを割り当てるものである。
T. J. A. Ewing, et al., Journal of Computational Chemistry, Vol.18, p.1175-1189, 1997年
R. D. Cramer, et al., Journal of Chemical Information and Computer Sciences, Vol.38, p.1010-1023, 1998年
H. J. Bohm, Journal of Computer-Aided Molecular Design, Vol.6, p.61-78, 1992年
Y. Nishibata, et al., Journal of Medical Chemistry, Vol.36, p.2921-2928, 1993年
しかしながら、上述の非特許文献1及び非特許文献2に記載の、コンピュータなどを用いて、既知の構造を有する化合物のデータベース、又は、独自に設計した化合物集団の中から、標的タンパク質に結合する化合物を探索する方法は、探索する化合物の空間が非常に狭いという課題がある。また、標的タンパク質に対して、様々な化合物の結合様式を予測することは、相互作用エネルギー値の精度の問題から非常に困難である。
また、上述の非特許文献3及び非特許文献4に記載の方法では、原子種や既知のフラグメントの割り当ては、探索する空間が広大なことから、乱数を用いて行なっている場合が多い。従ってこの方法は、可能な組み合わせにより化合物を網羅的に決めているのではなく、また、骨格変換を行なうことにより更に高活性の化合物を求めているわけではない。
そこで、X線結晶構造解析やNMRなどにより複合体の構造が解明されている化合物の三次元座標上の各点に対応する原子種を網羅的な検索を行ない、タンパク質のポケットにうまく当てはまる化合物を探し出すことができれば、新たな骨格を持った新規化合物を設計するための重要な情報となることが示唆される。また、それらの網羅的な化合物空間から標的タンパク質に結合する化合物の特徴を抽出することが可能であり、この方法は化合物を展開する上で非常に有用な情報であることが考えられる。更に、大量の化合物を目的に応じてスクリーニングする、例えば、“薬物らしさ(drug-likeness)”や合成のしやすさなどの指標を基に作成されたフィルタを用いてスクリーニングすることにより、目的の化合物を確実に得ることができることが期待できる。
本発明は、上述の課題を解決するためになされたものである。即ち、本発明の目的は、生理活性を有する化合物(以下、適宜「生理活性化合物」と略称する。)の設計を行なう際に、網羅的な化合物空間から目的に応じた化合物の分子構造を効率的に探索することが可能な、生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラムを提供することにある。
本発明者らは、上記課題に鑑みて鋭意検討した結果、設計対象の生理活性化合物のジオメトリに対して、結合次数の関係を満たすように原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を作成し、これを化合物の活性を予測するモデルから求めたスコアで評価することによって、網羅的な化合物空間から目的に応じた化合物の分子構造を効率的に探索することが可能となり、上記課題が効果的に解決されることを見出して、本発明を完成させた。
即ち、本発明の要旨は、(1)特定の生理活性を有し、且つ、既知の構造を有する化合物(これを「原型化合物」という場合がある。)から原子座標を抽出することにより、設計対象の生理活性化合物のジオメトリを用意する第1工程、(2)前記第1工程で用意されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得する第2工程、及び、(3)前記第2工程で得られた候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めたスコア(これを「活性スコア」という場合がある。)により評価する第3工程を有することを特徴とする、生理活性化合物の設計方法に存する(請求項1)。
ここで、上述の請求項1に係る生理活性化合物の設計装置において、前記第2工程が、前記第1工程で用意されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する工程、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する工程を有するとともに、前記第3工程において、候補化合物を構成する各化合物断片の構造の上記生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出することが好ましい(請求項2)。
また、本発明の別の要旨は、(1)設計対象の生理活性化合物のジオメトリを用意する第1工程、(2)前記第1工程で用意されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得する第2工程、及び、(3)前記第2工程で得られた候補化合物の分子構造を、化合物の所望の生理活性を予測するモデルから求めた活性スコアにより評価する第3工程を有し、前記第2工程が、前記第1工程で用意されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する工程、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する工程を有するとともに、前記第3工程において、候補化合物を構成する各化合物断片の構造の上記所望の生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出することを特徴とする、生理活性化合物の設計方法に存する(請求項3)。
また、本発明の別の要旨は、(1)特定の生理活性を有し、且つ、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の生理活性化合物のジオメトリを得るジオメトリ取得部、(2)前記ジオメトリ取得部で取得されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を得る候補化合物取得部、及び、(3)前記候補化合物取得部で得られた候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する候補化合物評価部を備えることを特徴とする、生理活性化合物の設計装置に存する(請求項9)。
ここで、上述の請求項9に係る生理活性化合物の設計装置において、前記候補化合物取得部が、前記ジオメトリ取得部で取得されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する化合物断片作成部、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する候補化合物作成部を備えるとともに、前記候補化合物評価部が、候補化合物を構成する各化合物断片の構造の上記生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出するように構成することが好ましい(請求項10)。
また、本発明の別の要旨は、(1)設計対象の生理活性化合物のジオメトリを得るジオメトリ取得部、(2)前記ジオメトリ取得部で取得されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を得る候補化合物取得部、及び、(3)前記候補化合物取得部で得られた候補化合物の分子構造を、化合物の所望の生理活性を予測するモデルから求めた活性スコアにより評価する候補化合物評価部を備え、前記候補化合物取得部が、前記ジオメトリ取得部で取得されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する化合物断片作成部、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する候補化合物作成部を備えるとともに、前記候補化合物評価部が、候補化合物を構成する各化合物断片の構造の上記所望の生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出するように構成されたことを特徴とする、生理活性化合物の設計装置に存する(請求項11)。
上述の請求項1〜3に係る生理活性化合物の設計方法及び請求項9〜11に係る生理活性化合物の設計装置によれば、設計対象の化合物のジオメトリに原子種を配置して候補化合物を設計しているので、同じジオメトリを有する化合物を網羅的に(原理的には可能な全ての化合物を)発生させることができる。従って、膨大な数の化合物を含む網羅的な化合物空間から、目的に応じた生理活性を有すると期待される化合物の分子構造を、効率的に探索することが可能となる。また、得られた候補化合物の分子構造に関する情報は、設計対象の化合物の合成、リード化合物の最適化や展開、将来の合成展開の方針決定などの際に、有効な情報となるものと期待される。
なお、ここでいう「網羅的な化合物空間」とは、厳密には設計対象の化合物のジオメトリに配置することのできる原子種の全ての組み合わせを指す。例えば、設計対象の化合物が単純な平面の六員環(ベンゼンなど)の場合、原子種として炭素(C)、窒素(N、NH)、酸素(O)を用いたときには、単純には4の6乗=4096通りの配置の仕方が存在する。しかし、これらは結合次数の矛盾、対象性(鏡面・回転)による化合物としての重複を含み、実際には122種類の組み合わせが存在する。上述の生理活性化合物の設計方法及び設計装置は、こういった実際に存在しうる組み合わせからなる化合物空間全てを網羅し、あるいは実質的に同等な網羅性を有する手法で探索を行なうことを特徴とするものである。
また、上述の請求項1,2に係る生理活性化合物の設計方法及び請求項9,10に係る生理活性化合物の設計装置によれば、特定の生理活性を有する既知の化合物であって、その構造がX線結晶構造解析法やNMRなどによって解明されている化合物を原型化合物として用いることによって、原型化合物のジオメトリを変更することなく、同じジオメトリでありながら別の骨格を有する化合物を、効率的且つ網羅的に探索することが可能となる。また、既知の化合物の分子構造に化学修飾を加えたり、既知の化合物断片の構造を用いてこれを組み合わせたりする従来の技術とは異なり、既知の構造に制限されることがなく、新規な骨格の化合物を得ることも可能である。本発明者らの知見によれば、多数のタンパク質と生理活性化合物(特にリガンド)との複合体構造を観察すると、ジオメトリが似ていれば、骨格の異なる生理活性化合物でも同じタンパク質と複合体を形成した場合に、その結合様式は類似している場合が多い。
また、上述の請求項2,3に係る生理活性化合物の設計方法及び請求項10,11に係る生理活性化合物の設計装置によれば、ジオメトリの把握が容易になるとともに、候補化合物の分子構造の作成や活性スコアの算出を効率的に行なうことが可能となる。また、原型化合物の部分ジオメトリに基づいて可能な化合物断片を網羅的に探索しているので、既知の化合物断片を用意してこれを組み合わせる従来の技術とは異なり、極めて多様な骨格の候補化合物を得ることが可能である。また、得られた部分ジオメトリや化合物断片等の情報は、設計対象の化合物の合成や、リード化合物の最適化・展開をする上で有効な情報となり得る。
また、上述の請求項2,3に係る生理活性化合物の設計方法において、前記第2工程が、所定の指標を用いて化合物断片の構造のスクリーニングを行なう工程を更に有することが好ましい(請求項4)。
この特徴によれば、設計対象とする生理活性化合物の材料として適切でない化合物断片を予め取り除くことができ、適切な候補化合物をより確実に探し出すことが可能となる。
この特徴によれば、設計対象とする生理活性化合物の材料として適切でない化合物断片を予め取り除くことができ、適切な候補化合物をより確実に探し出すことが可能となる。
この場合、前記所定の指標が、膜透過性、溶解性、反応性、安定性、毒性、極性、分子量、水素結合ドナーの数、水素結合アクセプターの数、回転しうる結合の数、ハロゲン原子の数、環の数、環の大きさ、リンカーの数、及び、表面積の極性(polar surface area)からなる群から選ばれる少なくとも一つの指標であることが好ましい(請求項8)。
これらの指標を用いることによって、適切でない化合物断片や候補化合物を確実に取り除くことが可能となる。
これらの指標を用いることによって、適切でない化合物断片や候補化合物を確実に取り除くことが可能となる。
また、設計対象の化合物が、例えば、受容体のリガンドである(請求項5)場合には、前記第3工程において、リガンドと受容体との推定される結合様式に基づき求められる、候補化合物と受容体との相互作用エネルギー値を、候補化合物の分子構造の活性スコアとして使用することが好ましい(請求項6)。
さらに、上記の場合、受容体との複合体の立体構造がX線結晶構造解析法やNMRなどによって解明されているリガンド、或いは、その複合体の立体構造がドッキングソフトなどによって予測されているリガンドを、原型化合物として用いるとともに、この複合体の結合様式に基づいて、活性スコアによる候補化合物の評価を行なうことにより、受容体と安定な複合体構造を取ると期待される候補化合物を、効率的且つ網羅的に探索することが可能となる。また、得られた候補化合物の分子構造の情報は、設計対象のリガンドが受容体に結合する際に有効に作用する原子等を知る上で有用な情報となるものと期待される。
また、前記第3工程において、所定の指標を用いて候補化合物の分子構造のスクリーニングを行なうことも好ましい(請求項7)。
この特徴によれば、設計対象とする生理活性化合物として適切でない候補化合物を取り除くことができ、適切な候補化合物をより確実に探し出すことが可能となる。
この特徴によれば、設計対象とする生理活性化合物として適切でない候補化合物を取り除くことができ、適切な候補化合物をより確実に探し出すことが可能となる。
この場合、前記所定の指標が、膜透過性、溶解性、反応性、安定性、毒性、極性、分子量、水素結合ドナーの数、水素結合アクセプターの数、回転しうる結合の数、ハロゲン原子の数、環の数、環の大きさ、リンカーの数、及び、表面積の極性(polar surface area)からなる群から選ばれる少なくとも一つの指標であることが好ましい(請求項8)。
これらの指標を用いることによって、適切でない化合物断片や候補化合物を確実に取り除くことが可能となる。
これらの指標を用いることによって、適切でない化合物断片や候補化合物を確実に取り除くことが可能となる。
また、本発明の別の要旨は、上述の生理活性化合物の設計方法が有する各工程をコンピュータに実行させることを特徴とする、生理活性化合物の設計プログラムに存する(請求項12)。
この生理活性化合物の設計プログラムを用いれば、上述の生理活性化合物の設計方法及び生理活性化合物の設計装置を、一般的なコンピュータシステムを用いて容易に実現することが可能になる。
なお、本明細書において「生理活性化合物」とは、生体機能に作用する物質を意味し、薬理学的に有用なものであればいかなる物質でもよく、天然に存在するビタミン、ホルモンから合成有機化合物までを広く含む概念である。作用機構としては、受容体と結合して作用を示す化合物(リガンド)、抗酸化作用等の化学反応を起こして活性を示す化合物、ペプチドなどが存在する。
また、本明細書において「リガンド」とは、特定の受容体の特定の部位に結合(相互作用)する低分子量の(具体的には、分子量が千以下程度の)化合物をいうものとし、神経伝達物質、ホルモン、ビタミンなどの生体内活性物質、天然および合成の生理活性物質、薬物、酵素基質などを含む。
また、受容体とは、薬物の標的となりうるすべての生体高分子をいうものとし、タンパク質、核酸、多糖、およびそれらの複合体を含む。受容体の中でも特にタンパク質からなるものを「標的タンパク質」というものとする。
さらに、本明細書において「ジオメトリ」とは、2次元または3次元空間上に定められた点の集合の幾何学的関係を意味し、通常は各点の2次元座標又は3次元座標の集合として表わされる。また、「化合物のジオメトリ」とは、ある化合物の2次元構造又は3次元構造において、当該化合物を構成する個々の原子のうち少なくとも一部(例えば、水素原子、炭素原子、酸素原子、窒素原子、硫黄原子、塩素原子等)を点と看做すことにより得られるジオメトリを意味する。本発明で用いられるジオメトリにおいては、その空間に張られた座標系により各点の座標が一意に定められ、それらの座標に原子種を配置することにより、化合物の分子構造になりうる。また、ジオメトリを分解して得られる部分的な点の集合の幾何学的関係もジオメトリであり、本明細書においてはそれらを適宜「部分ジオメトリ」と称する。
本発明の生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラムは、上述の生理活性化合物を設計の対象とすることが可能であるが、中でもリガンドを設計の対象とすることが好ましい。
本発明によれば、生理活性を有する化合物の設計を行なう際に、網羅的な化合物空間から設計対象の化合物の分子構造を効率的に探索することが可能となる。
以下、本発明の実施の形態について説明するが、本発明は以下の実施の形態に限定されるものではなく、その要旨の範囲内で種々変形して実施することができる。
[I.生理活性化合物の設計方法]
図1は、本発明の一実施形態に係る生理活性化合物の設計方法(以下適宜「本実施形態の設計方法」等と略称する。)の手順を説明するためのフローチャートである。図1のフローチャートに示すように、本実施形態の設計方法は、工程R1〜R11を有する。以下、各工程について順に説明する。
図1は、本発明の一実施形態に係る生理活性化合物の設計方法(以下適宜「本実施形態の設計方法」等と略称する。)の手順を説明するためのフローチャートである。図1のフローチャートに示すように、本実施形態の設計方法は、工程R1〜R11を有する。以下、各工程について順に説明する。
なお、本実施形態では、設計対象の生理活性化合物として、何らかの受容体と結合し得るリガンドを想定する。ここで、受容体としては標的タンパク質を想定するものとする。また、この標的タンパク質と結合して生理活性を有し、且つ、その構造が既知の化合物を、原型化合物として用いるものとする。
更に、本実施形態では、化合物の活性を予測するモデルとして、化合物と標的タンパク質との間の相互作用エネルギーを求めるモデルを使用し、このモデルによって求めた標的タンパク質との間の相互作用エネルギーを活性スコアとして、評価を行なうものとする。標的タンパク質との間の相互作用エネルギーを求めるモデルは、一般的に用いられる公知のものを用いることができる。具体的には、例えば、Kitchen, D. B. et al., J. Nat. Rev. Drug Discov., p.935-949, 2004年に記載の方法等が用いられる。
〔1:設計対象の化合物のジオメトリの用意〕
まず、工程R1において、標的タンパク質と原型化合物の複合体構造を用意する。複合体構造としては、例えばX線結晶構造解析法やNMR等によって解明した構造を利用することができる。また、公共データベース、例えばPDB(protein data bank)(the Research Collaboratory for Structural Bioinformatics(RCSB)によって管理されているデータベース。URLは"http://www.rcsb.org/pdb/"。)等に登録されている構造を用いてもよい。更には、標的タンパク質と原型化合物の結合様式をDOCK(上述の非特許文献1参照)やGOLD(G. Jones et al., The Journal of Molecular Biology, Vol.245, p.43-53, 1995年参照)等の予測ソフトにより予測し、それを用いてもよい。
まず、工程R1において、標的タンパク質と原型化合物の複合体構造を用意する。複合体構造としては、例えばX線結晶構造解析法やNMR等によって解明した構造を利用することができる。また、公共データベース、例えばPDB(protein data bank)(the Research Collaboratory for Structural Bioinformatics(RCSB)によって管理されているデータベース。URLは"http://www.rcsb.org/pdb/"。)等に登録されている構造を用いてもよい。更には、標的タンパク質と原型化合物の結合様式をDOCK(上述の非特許文献1参照)やGOLD(G. Jones et al., The Journal of Molecular Biology, Vol.245, p.43-53, 1995年参照)等の予測ソフトにより予測し、それを用いてもよい。
次に、工程R2において、標的タンパク質に結合している原型化合物の構造から原子座標を抽出し、設計対象の生理活性化合物のジオメトリを取得する。原子座標の抽出の手法としては、例えば、PDB形式のファイルからリガンドの各原子のx,y,zのそれぞれの座標を抽出して用いる。
〔2:部分ジオメトリへの分解〕
次に、工程R3において、工程R2で抽出された設計対象の化合物のジオメトリを、複数の部分的なジオメトリ(これを適宜「部分ジオメトリ」という。)に分解する。部分ジオメトリの種類は特に制限されないが、本実施形態では部分ジオメトリの種類として、環、リンカー、及びターミナルという三種類の部分ジオメトリを用いる。ここで、「環」とは化合物の環状骨格(炭素環式骨格及び複素環式骨格を含み、また、単環及び縮合環を含む。)に対応する部分ジオメトリをいい、「リンカー」とは環と環を結ぶ連結基に対応する部分ジオメトリをいい、「ターミナル」とは環とリンカー以外の置換基等に対応する部分ジオメトリをいう。
次に、工程R3において、工程R2で抽出された設計対象の化合物のジオメトリを、複数の部分的なジオメトリ(これを適宜「部分ジオメトリ」という。)に分解する。部分ジオメトリの種類は特に制限されないが、本実施形態では部分ジオメトリの種類として、環、リンカー、及びターミナルという三種類の部分ジオメトリを用いる。ここで、「環」とは化合物の環状骨格(炭素環式骨格及び複素環式骨格を含み、また、単環及び縮合環を含む。)に対応する部分ジオメトリをいい、「リンカー」とは環と環を結ぶ連結基に対応する部分ジオメトリをいい、「ターミナル」とは環とリンカー以外の置換基等に対応する部分ジオメトリをいう。
〔3:部分ジオメトリに対する原子種の配置及び化合物断片の設計〕
次に、工程R4において、工程R3で得られた個々の部分ジオメトリの各座標に対して、原子種の可能な組み合わせの配置を行なうことにより、設計対象の化合物の材料となる化合物断片を得る。各座標への原子種の配置は、原子間の結合次数の関係を満足するように行なう。ここで「原子種」とは、重原子及びそれと結合している水素原子をひとまとめにしたもの、例えば、CH2、CH3、NH、OH等のことをいう。下記表1に、本工程において使用可能な原子種の種類の例を示す。
次に、工程R4において、工程R3で得られた個々の部分ジオメトリの各座標に対して、原子種の可能な組み合わせの配置を行なうことにより、設計対象の化合物の材料となる化合物断片を得る。各座標への原子種の配置は、原子間の結合次数の関係を満足するように行なう。ここで「原子種」とは、重原子及びそれと結合している水素原子をひとまとめにしたもの、例えば、CH2、CH3、NH、OH等のことをいう。下記表1に、本工程において使用可能な原子種の種類の例を示す。
また、「原子間の結合次数を満足する」関係とは、具体的には、1番目の原子種と2番目の原子種との間に結合が存在すると仮定して、1番目の原子種としてある特定の原子種を与えた時に1番目の原子種から2番目の原子種への結合に或る結合次数を得た場合、2番目の原子種から1番目の原子種への結合が該結合次数となるような原子種のみを、2番目の原子種として配置するということである。このような関係を全て満たすようにジオメトリに対して原子種を配置することで、組み合わせの数を減らしつつ、膨大な化合物空間を効率よく網羅することが可能となる。
例えば、「X・Y・Z」(ここで「X」、「Y」、「Z」は原子種を表わし、「・」は原子種間の結合を表わす。)で表わされる、3つの原子種からなる分子のジオメトリを仮定する。「Y」の位置に「=CH−」を配置すると、そのジオメトリは「X=CH−Z」(ここで「−」は単結合、「=」は二重結合を表わす。)となる。この状態で「X」及び「Z」に配置できる原子種を考えると、「X」は二重結合により「CH」と結合しているので、「X」に配置可能な原子種としては「O=」や「CH2=」などが考えられる。また、「Z」は単結合により「CH」と結合しているので、「Z」に配置可能な原子種としては「−CH3」や「−NH2」などが考えられる。これらの原子種を繋げることにより、原子間の結合次数を満たす分子として「O=CH−CH3」、「O=CH−NH2」、「CH2=CH−CH3」、「CH2=CH−NH2」などの分子を得ることができる。
配置する原子種の型は、部分ジオメトリの各座標に関して、近接する点との平面性を調べて、近隣の点が全て同一平面状にあるときはsp型かsp2型の原子種が、また、平面でないときはsp3型の原子種が配置されるように、原子種の配置を行なう。この際、環に関しては、環に属している全ての原子が同一平面状にある場合は、その環を芳香環とみなす。また、二つの結合を持つ点は、sp2型とsp3型の両方の形を持つ原子種を配置するようにする。
〔4:化合物断片のスクリーニング〕
次に、工程R5において、工程R4で得られた化合物断片について、所定の指標を用いてスクリーニングを行なうか否かを選択する。スクリーニングを行なう場合には、工程R6において、工程R4で得られた化合物断片に対してスクリーニングを行なって、設計対象の化合物の材料として適切でない化合物断片を予め取り除き、その後で工程R7に進む。スクリーニングを行なわない場合には、工程R6を経由せずそのまま工程R7に進む。
次に、工程R5において、工程R4で得られた化合物断片について、所定の指標を用いてスクリーニングを行なうか否かを選択する。スクリーニングを行なう場合には、工程R6において、工程R4で得られた化合物断片に対してスクリーニングを行なって、設計対象の化合物の材料として適切でない化合物断片を予め取り除き、その後で工程R7に進む。スクリーニングを行なわない場合には、工程R6を経由せずそのまま工程R7に進む。
ここで、スクリーニングに用いる所定の指標としては、例えば、膜透過性、溶解性、反応性、安定性、毒性、極性、分子量、水素結合ドナーの数、水素結合アクセプターの数、回転しうる結合の数、ハロゲン原子の数、環の大きさ、表面積の極性(polar surface area)などが挙げられる。これらの指標は予測値を使用してもよい。例えば、膜透過性や溶解性は、A. K. Ghose, et al. の文献(Journal of Computational Chemistry, Vol.7, p.565-577, 1986年参照)に記載の方法に従ってそれらの予測値を求めることができる。また、“薬物らしさ”を表わすフィルタ、例えば、G. M. Rishton(Drug Discovery Today, Vol.8, p.86, 2003年参照)が定めたフィルタ(以下適宜「Rishtonのフィルタ」と略称する。)等を使用して、スクリーニングを行なうことも可能である。
〔5:化合物断片への活性スコアの付与〕
次に、工程R7において、工程R4で得られた化合物断片(又は、工程R6のスクリーニングを経た化合物断片)について、化合物の生理活性を予測するモデルを用いて活性スコアを求める。活性スコアとしては、化合物断片を評価する際に使用できるものであれば、その種類は特に制限されないが、本実施形態では、化合物と標的タンパク質との間の相互作用エネルギーを求めるモデルを使用し、標的タンパク質との間の相互作用エネルギー値を活性スコアとして算出する。具体的には、以下の手順に従って活性スコアの算出を行なう。
次に、工程R7において、工程R4で得られた化合物断片(又は、工程R6のスクリーニングを経た化合物断片)について、化合物の生理活性を予測するモデルを用いて活性スコアを求める。活性スコアとしては、化合物断片を評価する際に使用できるものであれば、その種類は特に制限されないが、本実施形態では、化合物と標的タンパク質との間の相互作用エネルギーを求めるモデルを使用し、標的タンパク質との間の相互作用エネルギー値を活性スコアとして算出する。具体的には、以下の手順に従って活性スコアの算出を行なう。
まず、活性スコアを求める準備として、各化合物断片の各点に配置した原子種に水素原子が存在する場合は、座標に配置された原子種の型(sp型、sp2型又はsp3型)に応じて、水素原子の座標の生成を行なう。具体例として、「H・X・Y」で表わされる構造(ここで「X」は配置した原子種内の重原子を表わし、「Y」は「X」に隣接する重原子を表わし、「・」は原子種間の結合を表わす。)を考えると、配置した原子種「X」がsp型の場合には、この結合角が180°になるように、sp2型の場合には、この構造の結合角が120°になるように、また、sp3型の場合には、この結合角が109°になるように、水素原子の座標の生成を行なう。そして、後述の式(1)に示すスコア関数に基づいて、活性スコアの値を算出する。なお、「OH」や「CH3」など、水素原子が重原子に対して単結合で回転できるように結合している原子種に関しては、水素原子を10°毎にずらしながら仮に配置して、活性スコアの値が一番よいものを選択する。
活性スコア(標的タンパク質との間の相互作用エネルギー値)の算出は、それ自体既知の通常用いられる方法(Kitchen, D. B. et al., J. Nat. Rev. Drug Discov., p.935-949, 2004年参照)を用いることができるが、具体的には、例えば、下記式(1)に示すスコア関数に基づいて行なうことができる。なお、下記式(1)において、Uは、標的タンパク質との間の相互作用エネルギー値を表わし、Uvは、標的タンパク質と化合物断片との間におけるファンデルワールス力を表わし、Ueは、標的タンパク質と化合物断片との間における静電相互作用を表わし、Usは、溶媒露出表面積から得られる水和の自由エネルギーを近似した値を表わし、Ubは、水素結合に関するスコアを表わす。
ここで、Uv及びUeとしては、下記式(2)で示す関数を用いる。
上記式(2)において、rijはi番目とj番目の原子の距離を表わし、r0 ijは各原子のファンデルワールス半径の和を表わし、式
r0 ij=r0 i+r0 j
に基づいて原子の組毎に算出される。
r0 ij=r0 i+r0 j
に基づいて原子の組毎に算出される。
更に、ei及びejは、それぞれi番目及びj番目の原子に定められた電荷を表わし、εは誘電率を表わす。
式(2)に示すこれらのパラメータとして、標的タンパク質に関する値としては、例えば、AMBERのパラメータを用いることができる(S. J. Weiner et al., Journal of Computational Chemistry, Vol.7, p.230-252, 1986年参照)。また、化合物断片側の値としては、例えば、下記表2に示す値を用いることができる。
また、上記式(1)におけるUbは、水素原子と水素結合性ヘテロ原子との関係を用いて、下記式(3)により定義される。
上記式(3)において、abは、任意の係数を表わす。後述の実施例ではab=1とした。
また、E(rij)は、距離rijに関するスコアであり、下記式(4)によって定義される。
また、E(rij)は、距離rijに関するスコアであり、下記式(4)によって定義される。
上記式(4)において、rHは、標準的な水素結合における水素とヘテロ原子の距離を表わす。後述の実施例においては、rH=2.0とした。
また、上記式(1)において、Usは、複合体の状態における水和の自由エネルギーと、単体の状態における水和の自由エネルギーとの差によって定められる。本実施形態では、溶媒露出表面積を基にした下記式(5)で表わされる関数を用いる。
上記式(5)において、Acomplexは、複合体の状態における溶媒露出表面積を表わし、Aisolateは、単体の状態における溶媒露出表面積を表わす。
また、σは、各原子種に定められた露出表面積に対する自由エネルギーに関する係数である。これらのパラメータの値としては、例えば、上記表2に示すものを用いることができる。
また、σは、各原子種に定められた露出表面積に対する自由エネルギーに関する係数である。これらのパラメータの値としては、例えば、上記表2に示すものを用いることができる。
以上の手順により、各化合物断片と標的タンパク質との間の相互作用エネルギー値が求められるので、それを各化合物断片の活性スコアとして付与する。ここで、この相互作用エネルギー値(活性スコアの値)が小さい方が、標的タンパク質と強く結合しているので、よい活性スコアであるということができる。よって以下の記載では、活性スコアの値が「小さい」ことを、活性スコアの値が「よい」という場合がある。
なお、この段階で、化合物断片を活性スコアの小さい順に並べ替えてもよい。これによって、どのような化合物断片が標的タンパク質と適合するかを調べることができ、化合物合成の展開のヒントとなりえる。また、各座標を占めている原子種を観察することにより、複合体における化合物の傾向を見出すことができる。
〔6:候補化合物の作成及び活性スコアによる評価〕
次に、工程R8において、原子種を配置された化合物断片を、結合次数の関係を満足するようにつなぎ合わせていき、原型化合物と同じジオメトリを有する候補化合物を生成する。
次に、工程R8において、原子種を配置された化合物断片を、結合次数の関係を満足するようにつなぎ合わせていき、原型化合物と同じジオメトリを有する候補化合物を生成する。
次に、工程R9において、各化合物断片の活性スコアの値から候補化合物全体の活性スコアの値を求め、その活性スコアを良い順(活性スコアの値の小さい順)に並べることにより、標的タンパク質と適合する候補化合物を探し出すことができる。
〔7:候補化合物のスクリーニング〕
次に、工程R10において、工程R8で得られた候補化合物について、所定の指標を用いてスクリーニングを行なうか否かを選択する。スクリーニングを行なう場合には、工程R11において、得られた候補化合物に対してスクリーニングを行ない、設計対象の化合物として適切でない候補化合物を取り除き、残った候補化合物を結果として得る。スクリーニングを行なわない場合には、工程R11を経由せずそのまま候補化合物を結果として得る。
次に、工程R10において、工程R8で得られた候補化合物について、所定の指標を用いてスクリーニングを行なうか否かを選択する。スクリーニングを行なう場合には、工程R11において、得られた候補化合物に対してスクリーニングを行ない、設計対象の化合物として適切でない候補化合物を取り除き、残った候補化合物を結果として得る。スクリーニングを行なわない場合には、工程R11を経由せずそのまま候補化合物を結果として得る。
スクリーニングに用いる所定の指標としては、例えば、膜透過性、溶解性、反応性、安定性、毒性、極性、分子量、水素結合ドナーの数、水素結合アクセプターの数、回転しうる結合の数、ハロゲン原子の数、環の数、環の大きさ、リンカーの数、及び、表面積の極性(polar surface area)などが挙げられる。これらの指標は予測値を使用してもよい。例えば、膜透過性や溶解性は、A. K. Ghose, et al.の文献(Journal of Computational Chemistry, Vol.7, p.565-577, 1986年参照)に記載の方法に従ってそれらの予測値を求めることができる。また、“薬物らしさ”を表わすフィルタ、例えば上述のRishtonのフィルタ等を使用して、スクリーニングを行なうことも可能である。このように“薬物らしさ”を表わすフィルタを通して候補化合物のスクリーニングを行なうことによって、より医薬品らしい化合物を得ることができ、医薬品の設計に非常に有効である。
〔8:その他〕
以上、本発明の一実施形態について説明したが、本発明の実施の形態はこれに限られるものではなく、適宜変更を加えて実施することが可能である。
以上、本発明の一実施形態について説明したが、本発明の実施の形態はこれに限られるものではなく、適宜変更を加えて実施することが可能である。
例えば、上述の実施形態では、工程R2において、既知の構造を有する化合物(原型化合物)の原子座標を抽出して、これを設計対象の化合物のジオメトリとして用いていたが、設計対象の化合物のジオメトリがデノボ設計(例えば、特開2000−178209号明細書等を参照)等から明らかである場合には、そのジオメトリを直接用いることも可能である。
また、上述の実施形態では、工程R1において、原型化合物と標的タンパク質との複合体の構造を取得していたが、原型化合物と標的タンパク質との複合体の構造が明らかでない場合や予測が困難な場合には、この工程は不要である。この場合、工程R7,R9における、化合物の活性を予測するモデルとしては、上述した標的タンパク質との間の相互作用エネルギー値を求めるモデルの代わりに、定量的構造活性相関(QSAR; Quantitative Structure Activity Relationship)(「最新創薬科学 下巻」p.29-, 1999年, テクノミック等を参照)や、3次元定量的構造活性相関(3D−QSAR)等を使用し、これらのモデルによって得られる値を活性スコアとして使用することができる。なお、活性スコアの種類によっては、活性スコアの値が小さいほどよい活性スコアであるとは限らない(例えば、活性スコアの値が大きいほどよい活性スコアとなる場合もある。)ので、注意が必要である。
なお、上述の実施形態では、工程R3において、原型化合物のジオメトリを部分ジオメトリに分解して、工程R4において、各部分ジオメトリに対して原子種を配置して化合物断片を作成し、工程R8において、これを組み立てることにより候補化合物を作成していたが、原型化合物が特定の生理活性を有し、且つ、構造が分かっていてジオメトリを取得できる場合には、原型化合物のジオメトリを分解することなく、これに直接原子種を配置することにより、候補化合物を作成してもよい。
また、上述の実施形態では、工程R7において、各化合物断片について活性スコアを求め、工程R9において、化合物断片の活性スコアを足し合わせて候補化合物の活性スコアを算出していたが、上述の様に原型化合物のジオメトリを分解せず直接原子種を配置して候補化合物を作成する場合には、候補化合物から直接その活性スコアを求めればよい。
また、上述の実施形態では、工程R5及びR10において、スクリーニングを行なうか否かの選択を行なっていたが、各々の段階でスクリーニングを行なうか否かが事前に決まっている場合には、このような選択を行なう工程を設ける必要は無い。スクリーニングを行なう場合には、その前段の工程R4,R9から直接スクリーニングの工程R6,R11に進むようにすればよく、スクリーニングを行なわない場合には、これらのスクリーニングの工程R6,R11の工程を省いて更に次段の工程に進むようにすればよい。
また、上述の実施形態におけるR1〜R11の各工程は、本発明の要旨を逸脱しない範囲において、適宜順序を入れ替えてもよい。例えば、化合物断片の活性スコアを求める工程R7と、候補化合物の作成を行なう工程R8とは、逆の順序で実施してもよい。
なお、上述の実施形態において、工程R1,R2が、本発明の設計方法の第1工程に該当し、工程R3,R4,R8が、本発明の設計方法の第2工程に該当し、工程R9が、本発明の設計方法の第3工程に該当する。
また、本実施形態では、設計対象の生理活性化合物として、何らかの受容体と結合し得るリガンドを想定し、受容体としては標的タンパク質を想定していたが、本発明では、標的タンパク質以外の受容体と結合するリガンドを設計対象としたり、リガンド以外の生理活性化合物を設計対象とすることも当然可能である。
[II.その他]
本発明の設計方法は、CPU,RAM,ハードディスクや各種周辺機器等を備えた通常のコンピュータシステム(例えば各種ネットワークサーバ、ワークステーション、パーソナルコンピュータ等)を用いることによって、容易に実現することができる。
本発明の設計方法は、CPU,RAM,ハードディスクや各種周辺機器等を備えた通常のコンピュータシステム(例えば各種ネットワークサーバ、ワークステーション、パーソナルコンピュータ等)を用いることによって、容易に実現することができる。
通常、こうしたコンピュータシステムでは、CPUがハードディスク等に記憶されたコンピュータプログラムに従って各種の演算処理を実行するとともに、CPUの各種演算処理に必要なデータがRAMに適宜記憶・更新される。また、コンピュータシステムには更に各種の機器(キーボード、マウス等の入力機器、ディスプレイ、プリンタ等の出力機器、CD−ROMドライブ、フロッピー(登録商標)ディスクドライブ等の記憶媒体読取・書込装置、通信ネットワークとのインターフェースなど)が内蔵又は接続され、CPUの演算処理によって制御される。
従って、本発明の設計方法の各工程(上述の第1,第2,第3工程)をコンピュータに実行させるコンピュータプログラム(本発明の生理活性化合物の設計プログラム)を用いれば、このコンピュータプログラムをRAMに読み出して起動し、CPUで実行することにより、CPUの動作として、又はCPUとRAM,ハードディスク,各種周辺機器等との協動動作として、本発明の設計方法が実現される。
本発明の生理活性化合物の設計プログラムは、使用するコンピュータシステムの構成やオペレーティングシステムの種類・バージョン等に応じて、公知の各種のプログラム言語を用いて作成することが可能である。得られたコンピュータプログラムは、内蔵ハードディスクや外付けハードディスク等の記憶装置に記録しておいてもよいが、例えばCD−ROM、DVD−ROM、MOディスク等のコンピュータ読取可能な各種の記憶媒体に記録しておき、必要に応じて随時、コンピュータシステムが有する記憶媒体読取装置を通じて、これを直接、又はハードディスクにインストールして使用するのが好ましい。或いは、コンピュータシステムから情報通信ネットワークを通じてアクセス可能な外部記憶領域(他のコンピュータ等)に当該コンピュータプログラムを記録しておき、必要に応じて随時、前記の外部記憶領域から情報通信ネットワークを通じてこれを直接、又はハードディスクにインストールして使用するのが好ましい。
ここで、本発明の生理活性化合物の設計プログラムを実行するコンピュータは、(1)設計対象の生理活性化合物のジオメトリを得るジオメトリ取得部、(2)前記ジオメトリ取得部で取得されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を得る候補化合物取得部、及び、(3)前記候補化合物取得部で得られた候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する候補化合物評価部を備えた装置(本発明の生理活性化合物の設計装置)として機能することになる。
また、前記ジオメトリ取得部は、好ましくは、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の化合物のジオメトリを得るように構成される。
また、前記候補化合物評価部は、好ましくは、リガンドと標的タンパク質等の受容体との推定される結合様式に基づき求められる、候補化合物と受容体との相互作用エネルギー値を、候補化合物の分子構造の活性スコアとして使用するように構成される。
また、前記候補化合物取得部は、好ましくは、前記ジオメトリ取得部で取得されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する化合物断片作成部、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する候補化合物作成部を備えて構成され、前記候補化合物評価部が、候補化合物を構成する各化合物断片の構造の活性スコアに基づいて、候補化合物の分子構造の活性スコアを付与するように構成される。
また、本発明の生理活性化合物の設計装置は、好ましくは、所定の指標を用いて化合物断片の構造のスクリーニングを行なうスクリーニング部を更に備える。このスクリーニング部は、前記化合物断片作成部で得られた化合物断片の構造や、前記候補化合物取得部で得られた候補化合物の分子構造、所定の指標を用いて候補化合物の分子構造のスクリーニングを行なうように構成される。
なお、本発明の生理活性化合物の設計装置を構成するこれらの要素(これらのジオメトリ取得部、候補化合物取得部(化合物断片作成部、候補化合物作成部)、候補化合物評価部、スクリーニング部)は、主にコンピュータのCPUにおける演算処理によって達成されることになる。
更に、本発明の生理活性化合物の設計装置は、上述のCPUでの演算処理に必要な各種情報をコンピュータに入力するための入力部と、上述のCPUでの演算処理で得られた情報をコンピュータから出力するための出力部とを備えて構成される。
なお、これらの入力部及び出力部は、コンピュータに接続されたキーボード、マウス等の入力機器、ディスプレイ、プリンタ等の出力機器、CD−ROMドライブ、フロッピー(登録商標)ディスクドライブ等の記憶媒体読取・書込装置、通信ネットワークとのインターフェースなどによって達成されることになる。
次に、実施例により本発明を更に具体的に説明するが、本発明はその要旨を超えない限り、以下の実施例に限定されるものではない。
[I.概要及び手順]
本発明の設計方法の実施例として、チロシンキナーゼであるc−kit(D. Linnekin, The International Journal of Biochemistry & Cell Biology, Vol.31, p.1053-1074, 1999年参照)と複合体を形成する化合物の設計を行なった。原型化合物としては、Imatinib(Glivec(登録商標)、ノバルティスファ−マ社製)を用いた。Imatinibはc−kitと複合体を形成し、c−kitを特定的に阻害する化合物で、慢性骨髄性白血病の治療薬として用いられている。
本発明の設計方法の実施例として、チロシンキナーゼであるc−kit(D. Linnekin, The International Journal of Biochemistry & Cell Biology, Vol.31, p.1053-1074, 1999年参照)と複合体を形成する化合物の設計を行なった。原型化合物としては、Imatinib(Glivec(登録商標)、ノバルティスファ−マ社製)を用いた。Imatinibはc−kitと複合体を形成し、c−kitを特定的に阻害する化合物で、慢性骨髄性白血病の治療薬として用いられている。
化合物の設計は、図1に示すフローチャートに沿って行なった。なお、実施例としては、フローチャートの工程R6及び工程R11におけるスクリーニングを省略したもの(実施例1)と、工程R6及び工程R11におけるスクリーニングを実行したもの(実施例2)を行なった。実施例1と実施例2は、他の工程については共通である。
まず、フローチャートの工程R1において、Imatinibとc−kitとの複合体構造をPDB(protein data bank)から取得した。Imatinibとc−kitとの複合体の立体構造は、X線結晶構造解析により解明されており、1t46というPDB−entryで登録されている。Imatinibとc−kitとの複合体構造の模式図を図2に示す。図2では、c−kitをリボン(solid ribbon)モデルで、ImatinibをCPK(Corey-Pauling-Kolturn)モデルでそれぞれ表わしている。
次に、フローチャートの工程R2において、Imatinibの原子座標の抽出を行ない、設計対象の化合物(c−kitと複合体を形成する化合物)のジオメトリを用意した。Imatinibの化学構造式を図3(a)に示す。また、Imatinibの化学構造から抽出されたジオメトリの各座標に番号を割り当てたものを図3(b)に示す。
次に、フローチャートの工程R3において、工程R2で得られたImatinibのジオメトリを、環、リンカー、ターミナルという3種類の部分ジオメトリに分解した。この作業によって得られた部分ジオメトリを、その種類毎に分類して図4に示す。
次に、フローチャートの工程R4において、工程R3で得られた部分ジオメトリの各座標に対して、原子間の結合次数の関係を満たすように原子種を配置することにより、化合物断片を得た。原子種の種類としては、上述の表1に挙げたものを用いた。
次に、フローチャートの工程R5において、工程R4で得られた化合物断片についてスクリーニングを行なうか否かを選択した。実施例1ではスクリーニングを行なわず、そのまま工程R7に進んだ。実施例2では、工程R6においてスクリーニングを実行してから、工程R7に進んだ。スクリーニングの指標としては、上述のRishtonのフィルタを使用した。また、環に対応する化合物断片に関しては、既知の構造を有する化合物に存在する環構造を持つものだけを選択した。
次に、フローチャートの工程R7において、各化合物断片に配置された原子種に基づいて、各化合物断片の活性スコアの値を求めた。各化合物断片の活性スコアとしては、上述の表2に掲げた各パラメータを上述の式(1)〜(5)に当てはめて得られた相互作用エネルギー値を用いた。
次に、フローチャートの工程R8において、結合次数の関係を満たすように各化合物断片をつなぎ合わせることにより、候補化合物を生成した。
次に、フローチャートの工程R9において、各候補化合物についてその構成要素となる化合物断片の活性スコアを足し合わせることにより、候補化合物の活性スコアを算出した。
次に、フローチャートの工程R10において、工程R8で得られた候補化合物についてスクリーニングを行なうか否かを選択した。実施例1ではスクリーニングを行なわず、工程R8で得られた候補化合物をそのまま後述の評価に供した。実施例2では、工程R11においてスクリーニングを実行してから、得られた候補化合物を後述の評価に供した。スクリーニングの際の指標としては、上述のRishtonのフィルタを使用した。
[II.結果及び考察]
〔実施例1〕
図5,6は、図4に示す各部分ジオメトリに基づいて得られた化合物断片のうち、スコアの良い順に上位5個の化合物断片を、その部分ジオメトリに対応する原型化合物の化合物断片とともに表わす表である。図5は、環に分類される部分ジオメトリの化合物断片を示し、図6は、リンカー及びターミナルに分類される部分ジオメトリの化合物断片を示している。
〔実施例1〕
図5,6は、図4に示す各部分ジオメトリに基づいて得られた化合物断片のうち、スコアの良い順に上位5個の化合物断片を、その部分ジオメトリに対応する原型化合物の化合物断片とともに表わす表である。図5は、環に分類される部分ジオメトリの化合物断片を示し、図6は、リンカー及びターミナルに分類される部分ジオメトリの化合物断片を示している。
なお、図5,6の表において、左欄には、部分ジオメトリの各座標に番号を当てはめた図を示す。表の中欄には、活性スコアの上位5個の化合物断片を、活性スコアのよいものから順に左から並べて示すとともに、その下に活性スコアを併記している。また、原型化合物の化合物断片については網掛けで示している。活性スコアの上位5個に原型化合物の化合物断片が含まれていない場合には、表の中欄の最右側に示している。また、表の右欄には、得られた化合物断片の数を下段に、原型化合物の化合物断片の活性スコアの順位を上段にそれぞれ記している。
図5から、各部分ジオメトリについて得られた活性スコア上位の5個の化合物断片を見ると、対応する原型化合物の化合物断片と比べて、少し化学的な性質が異なったものが得られていることが分かる。特に、7〜12の点で構成されている環(上から二段目)については、工程R4で得られた1124個の化合物断片の中で、原型化合物の化合物断片が447番目に位置しており、その性質は上位5個の化合物とはあまり似ていないことがわかる。それに対して、図6に示すように、リンカーとターミナルの部分は、原型化合物の化合物断片が上位に来ていることがわかる。これらの部分に関しては、よい精度で原子種の配置ができたことを意味する。
図7は、各化合物断片を組み合わせて得られた候補化合物のうち、活性スコアの良い順に上位5個の候補化合物の化学構造式を、原型化合物の化学構造式とともに表わす図である。
図7から、得られた活性スコア上位5個の候補化合物には、ヘテロ原子が数多く存在することがわかる。また、活性スコア上位5個の候補化合物と原型化合物との間で、活性スコア値の差が非常に大きいことが分かる。但し、ここで得られた候補化合物は、“薬物らしさ”のフィルタを通していないものであり、化学合成が容易でないもの等、不適切な化合物も含まれている。従って、それらの不適切な化合物をフィルタなどで結果から除くと、原型化合物と上位5個の候補化合物との活性スコア値の差が小さくなると考えられる。
〔実施例2〕
図8,9は、図4に示す各部分ジオメトリに基づいて得られた化合物断片に対し、フィルタによるスクリーニングを行なって得られた化合物断片のうち、活性スコアの良い順に上位5個の化合物断片を、その部分ジオメトリに対応する原型化合物の化合物断片とともに表わす表である。図8は、環に分類される部分ジオメトリの化合物断片を示し、図9は、リンカー及びターミナルに分類される部分ジオメトリの化合物断片を示している。
図8,9は、図4に示す各部分ジオメトリに基づいて得られた化合物断片に対し、フィルタによるスクリーニングを行なって得られた化合物断片のうち、活性スコアの良い順に上位5個の化合物断片を、その部分ジオメトリに対応する原型化合物の化合物断片とともに表わす表である。図8は、環に分類される部分ジオメトリの化合物断片を示し、図9は、リンカー及びターミナルに分類される部分ジオメトリの化合物断片を示している。
なお、図8,9の表において、左欄には、部分ジオメトリの各座標に番号を当てはめた図を示す。表の中欄には、活性スコアの上位5個の化合物断片を、活性スコアのよいものから順に左から並べて示すとともに、その下に活性スコアを併記している。また、原型化合物の化合物断片については網掛けで示している。活性スコアの上位5個に原型化合物の化合物断片が含まれていない場合には、表の中欄の最右側に示している。また、表の右欄には、得られた化合物断片の数を下段に、原型化合物の化合物断片の活性スコアの順位を上段にそれぞれ記している。
図8,9から、原型化合物の構造に類似したものを選択しているのが観察される。特に、リンカー部分は原型化合物の部分ジオメトリと同じものを高い順位で選択していることがわかる。これらの結果は複合体の状態から分子構造を求めていることが有効に働いたと考えられる。また、環構造に関しては、上位5個は元の構造と類似したものが選ばれていることが観察される。上位5個以内に位置していない部分に関しても、上位20番以内に基の環構造が位置している。これら選ばれた環構造は、既知の構造を有する化合物に存在する環構造であることから、化学合成を容易に行なえると考えられる。
ターミナルに関しては、原型化合物の構造に類似しないものも上位に存在している。ターミナル部分は環やリンカー構造に比べて、複合体の周りの影響を非常に受けやすい傾向にある。特に、活性スコアに使用したファンデルワールス力を過剰に算出してしまう傾向にある。従って、活性スコアの値が僅差の点、例えば、点33においては、そこに位置する原子種も多様化してしまう傾向にある。これに対して、点37に関しては親水性の原子が配置しやすい傾向にあることがわかる。このようにこれらの原子種を観察することにより、その座標に配置される原子種の性質の傾向を見出すことができる。従って、各部分ジオメトリを観察することは合成展開のよいヒントになることが言える。
図10は、各化合物断片を組み合わせて得られた化合物に対し、フィルタによるスクリーニングを行なって得られた候補化合物のうち、活性スコアの良い順に上位5個の候補化合物の化学構造式を、原型化合物の化学構造式とともに表わす図である。
図10の結果を観察すると、フィルタによるスクリーニングを通じて得られた活性スコア上位5種の候補化合物は、原型化合物と類似したものであることが分かる。図10の候補化合物の構造と図8,9の部分ジオメトリを比較すると、各部分ジオメトリで上位に位置していた化合物の組み合わせが必ずしも上位に位置していないことがわかる。これは結合次数の関係を満たすように化合物を組み合わせた場合、上位の部分ジオメトリだけでは化合物を得ることができず、活性スコアが悪いものを選ばなければならなくなり、結果として、全体の活性スコアが悪くなってしまったということが考えられる。また、医薬品らしさなどのスクリーニングからもれてしまったこともひとつの原因だと考えられる。従って、原型化合物とはまったく異なった骨格を持つ化合物を得るためには、部分ジオメトリだけを見るのではなく、全体を観察して考える必要があることがわかる。
図5〜7と図8〜10から、網羅的に化合物を発生し、“薬物らしさ”を表わすフィルタを通すことによって、効率よく標的タンパク質に結合する薬物を見つけ出すことができることがわかる。もし、偏ったサンプリングの方法で化合物を生成し、スクリーニングを行なっても、標的タンパク質に結合する薬物を見つけ出すことは非常に困難であると考えられる。
本実施例で得られた活性スコア上位の候補化合物は、標的タンパク質との複合体の構造の情報を考慮して、同じジオメトリを持つ膨大な数の候補化合物の中から選択されていることから、高い確率で標的タンパク質と複合体を形成する可能性があると考えられる。このことから、本実施例で導き出した活性スコア上位の候補化合物は、標的タンパク質と高い確率で複合体構造を形成できると考えられる。本実施例においては、原型化合物であるImatinibが標的タンパク質であるc−kitと非常に高い親和性を示すために、Imatinibと類似した化合物が出力され、本方法の有効性が示されたが、原型化合物が標的タンパク質に対して親和性が非常に高くない場合には、本方法により、原型化合物と異なった骨格を有し原型化合物と親和性が同等または高い化合物を得ることが期待できる。
本発明の生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラムは、各種の生理活性化合物の設計に使用することが可能であるが、とりわけ医薬、農薬等の分野において好適に用いられる。
Claims (12)
- (1)特定の生理活性を有し、且つ、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の生理活性化合物のジオメトリを用意する第1工程、
(2)前記第1工程で用意されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得する第2工程、及び、
(3)前記第2工程で得られた候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する第3工程を有する
ことを特徴とする、生理活性化合物の設計方法。 - 前記第2工程が、前記第1工程で用意されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する工程、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する工程を有するとともに、
前記第3工程において、候補化合物を構成する各化合物断片の構造の上記生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出する
ことを特徴とする、請求項1記載の生理活性化合物の設計方法。 - (1)設計対象の生理活性化合物のジオメトリを用意する第1工程、
(2)前記第1工程で用意されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得する第2工程、及び、
(3)前記第2工程で得られた候補化合物の分子構造を、化合物の所望の生理活性を予測するモデルから求めた活性スコアにより評価する第3工程を有し、
前記第2工程が、前記第1工程で用意されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する工程、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する工程を有するとともに、
前記第3工程において、候補化合物を構成する各化合物断片の構造の上記所望の生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出する
ことを特徴とする、生理活性化合物の設計方法。 - 前記第2工程が、所定の指標を用いて化合物断片の構造のスクリーニングを行なう工程を更に有する
ことを特徴とする、請求項2又は請求項3に記載の生理活性化合物の設計方法。 - 設計対象の生理活性化合物がリガンドである
ことを特徴とする、請求項1〜4の何れか一項に記載の生理活性化合物の設計方法。 - 前記第3工程において、リガンドと受容体との推定される結合様式に基づき求められる候補化合物と受容体との相互作用エネルギー値を、候補化合物の分子構造の活性スコアとして使用する
ことを特徴とする、請求項5記載の生理活性化合物の設計方法。 - 前記第3工程において、所定の指標を用いて候補化合物の分子構造のスクリーニングを行なう
ことを特徴とする、請求項1〜6の何れか一項に記載の生理活性化合物の設計方法。 - 前記所定の指標が、膜透過性、溶解性、反応性、安定性、毒性、極性、分子量、水素結合ドナーの数、水素結合アクセプターの数、回転しうる結合の数、ハロゲン原子の数、環の数、環の大きさ、リンカーの数、表面積の極性(polar surface area)からなる群から選ばれる少なくとも一つの指標である
ことを特徴とする、請求項7記載の生理活性化合物の設計方法。 - (1)特定の生理活性を有し、且つ、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の生理活性化合物のジオメトリを得るジオメトリ取得部、
(2)前記ジオメトリ取得部で取得されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を得る候補化合物取得部、及び、
(3)前記候補化合物取得部で得られた候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する候補化合物評価部を備える
ことを特徴とする、生理活性化合物の設計装置。 - 前記候補化合物取得部が、前記ジオメトリ取得部で取得されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する化合物断片作成部、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する候補化合物作成部を備えるとともに、
前記候補化合物評価部が、候補化合物を構成する各化合物断片の構造の上記生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出するように構成された
ことを特徴とする、請求項9記載の生理活性化合物の設計装置。 - (1)設計対象の生理活性化合物のジオメトリを得るジオメトリ取得部、
(2)前記ジオメトリ取得部で取得されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を得る候補化合物取得部、及び、
(3)前記候補化合物取得部で得られた候補化合物の分子構造を、化合物の所望の生理活性を予測するモデルから求めた活性スコアにより評価する候補化合物評価部を備え、
前記候補化合物取得部が、前記ジオメトリ取得部で取得されたジオメトリを複数の部分ジオメトリに分解し、個々の部分ジオメトリに対して原子種の可能な組み合わせを配置することにより、化合物断片の構造を作成する化合物断片作成部、及び、前記化合物断片の構造を可能な組み合わせで繋ぎ合わせて候補化合物の分子構造を作成する候補化合物作成部を備えるとともに、
前記候補化合物評価部が、候補化合物を構成する各化合物断片の構造の上記所望の生理活性を予測するモデルから求めた活性スコアに基づいて、候補化合物の分子構造の活性スコアを算出するように構成された
ことを特徴とする、生理活性化合物の設計装置。 - 請求項1〜8の何れか一項に記載の生理活性化合物の設計方法が有する各工程を、コンピュータに実行させる
ことを特徴とする、生理活性化合物の設計プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006115504A JP2006323833A (ja) | 2005-04-19 | 2006-04-19 | 生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005120853 | 2005-04-19 | ||
JP2006115504A JP2006323833A (ja) | 2005-04-19 | 2006-04-19 | 生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006323833A true JP2006323833A (ja) | 2006-11-30 |
Family
ID=37543420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006115504A Pending JP2006323833A (ja) | 2005-04-19 | 2006-04-19 | 生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006323833A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017091526A (ja) * | 2015-11-04 | 2017-05-25 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 新規物質探索方法および装置 |
JP2021500660A (ja) * | 2017-10-19 | 2021-01-07 | シュレーディンガー インコーポレイテッドSchrodinger,Inc. | 代替コアを有する化合物の活性セットを予測する方法、およびそれを伴う創薬方法 |
WO2021044857A1 (ja) * | 2019-09-05 | 2021-03-11 | 株式会社日立製作所 | 材料特性予測システムおよび情報処理方法 |
US10957419B2 (en) | 2016-08-01 | 2021-03-23 | Samsung Electronics Co., Ltd. | Method and apparatus for new material discovery using machine learning on targeted physical property |
WO2021251414A1 (ja) * | 2020-06-09 | 2021-12-16 | 株式会社 Preferred Networks | 推定装置、訓練装置、推定方法、訓練方法及びプログラム |
WO2022149395A1 (ja) | 2021-01-07 | 2022-07-14 | 富士フイルム株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
-
2006
- 2006-04-19 JP JP2006115504A patent/JP2006323833A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017091526A (ja) * | 2015-11-04 | 2017-05-25 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 新規物質探索方法および装置 |
US11017314B2 (en) | 2015-11-04 | 2021-05-25 | Samsung Electronics Co., Ltd. | Method and device for searching new material |
US10957419B2 (en) | 2016-08-01 | 2021-03-23 | Samsung Electronics Co., Ltd. | Method and apparatus for new material discovery using machine learning on targeted physical property |
JP2021500660A (ja) * | 2017-10-19 | 2021-01-07 | シュレーディンガー インコーポレイテッドSchrodinger,Inc. | 代替コアを有する化合物の活性セットを予測する方法、およびそれを伴う創薬方法 |
US11710543B2 (en) | 2017-10-19 | 2023-07-25 | Schrödinger, Inc. | Methods for predicting an active set of compounds having alternative cores, and drug discovery methods involving the same |
JP7317815B2 (ja) | 2017-10-19 | 2023-07-31 | シュレーディンガー インコーポレイテッド | 代替コアを有する化合物の活性セットを予測する方法、およびそれを伴う創薬方法 |
WO2021044857A1 (ja) * | 2019-09-05 | 2021-03-11 | 株式会社日立製作所 | 材料特性予測システムおよび情報処理方法 |
JP2021039670A (ja) * | 2019-09-05 | 2021-03-11 | 株式会社日立製作所 | 材料特性予測システムおよび情報処理方法 |
JP7304778B2 (ja) | 2019-09-05 | 2023-07-07 | 株式会社日立製作所 | 材料特性予測システムおよび情報処理方法 |
WO2021251414A1 (ja) * | 2020-06-09 | 2021-12-16 | 株式会社 Preferred Networks | 推定装置、訓練装置、推定方法、訓練方法及びプログラム |
WO2022149395A1 (ja) | 2021-01-07 | 2022-07-14 | 富士フイルム株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bauer et al. | Electrostatic complementarity as a fast and effective tool to optimize binding and selectivity of protein–ligand complexes | |
Jónsdóttir et al. | Prediction methods and databases within chemoinformatics: emphasis on drugs and drug candidates | |
Kortagere et al. | The importance of discerning shape in molecular pharmacology | |
Jorgensen | The many roles of computation in drug discovery | |
Oprea et al. | Integrating virtual screening in lead discovery | |
Hawkins et al. | Conformer generation with OMEGA: learning from the data set and the analysis of failures | |
Loving et al. | Energetic analysis of fragment docking and application to structure-based pharmacophore hypothesis generation | |
Sanders et al. | From the protein's perspective: the benefits and challenges of protein structure-based pharmacophore modeling | |
Coleman et al. | Protein pockets: inventory, shape, and comparison | |
Merlot et al. | Chemical substructures in drug discovery | |
EP2216429A1 (en) | In silico screening system and in silico screening method | |
Clark et al. | 2D structure depiction | |
Huang et al. | HybridDock: a hybrid protein–ligand docking protocol integrating protein-and ligand-based approaches | |
Gürsoy et al. | Searching for bioactive conformations of drug-like ligands with current force fields: how good are we? | |
Bruce Macdonald et al. | Ligand binding free energies with adaptive water networks: two-dimensional grand canonical alchemical perturbations | |
Gowthaman et al. | Structural properties of non-traditional drug targets present new challenges for virtual screening | |
Thimm et al. | Comparison of 2 D Similarity and 3 D Superposition. Application to Searching a Conformational Drug Database | |
JP2006323833A (ja) | 生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラム | |
Ertl et al. | IADE: a system for intelligent automatic design of bioisosteric analogs | |
Wester et al. | Scaffold topologies. 2. Analysis of chemical databases | |
Bezhentsev et al. | Web resources for discovery and development of new medicines | |
Feldmann et al. | Systematic data analysis and diagnostic machine learning reveal differences between compounds with single-and multitarget activity | |
Reddy et al. | Curation and analysis of multitargeting agents for polypharmacological modeling | |
Brylinski et al. | eRepo-ORP: exploring the opportunity space to combat orphan diseases with existing drugs | |
Adnan et al. | Searching for novel anaplastic lymphoma kinase inhibitors: structure-guided screening of natural compounds for a tyrosine kinase therapeutic target in cancers |