WO2008035729A1

WO2008035729A1 - Procédé de recherche d'un ligand

Info

Publication number: WO2008035729A1
Application number: PCT/JP2007/068245
Authority: WO
Inventors: Shigeo Fujita; Masaya Orita
Original assignee: Astellas Pharma Inc.
Priority date: 2006-09-21
Filing date: 2007-09-20
Publication date: 2008-03-27
Also published as: US20100030530A1; JPWO2008035729A1; EP2065818A1; JP5093110B2; CA2663685A1

Description

明細書

リガンドの探索方法

技術分野

[0001] 本発明は、標的生体高分子に結合可能なリガンドの探索方法、及びその前段階である、標的生体高分子に結合可能なリガンドに特徴的な分子断片及びその三次元位置情報の決定方法に関する。

背景技術

[0002] 標的生体高分子に結合可能なリガンドを、計算機を用いて探索する方法として、標的生体高分子のリガンド結合部位とリガンドの三次元情報を利用して、ドッキング方法により、リガンドの妥当な結合様式とドッキングスコアを計算し、この計算を複数個のリガンドに対して連続的に適用することにより、結合する可能性があるリガンドを発見する、あるいは、結合する可能性がない化合物を振るい落とす計算方法が公知である。このような計算方法は、バーチャルスクリーニング又はインシリコスクリーニングと呼ばれている。

[0003] 幾つかのドッキングプログラムが市販されており、ドッキングスコアは、それぞれのプログラムが持つ独自のスコア関数により算出される（代表的なプログラムとして、 DOC K、 GOLD, FlexX、 AutoDOCK、 DrugScore等がある）。このドッキングスコアを利用した標的生体高分子のリガンド結合部位におけるリガンドの結合様式の予測は比較的良好で、例えば、非特許文献 1においては、検討した例のおよそ 80%について X線結晶解析の結果が再現されることが報告されている。し力、しながら、ドッキングスコアを利用した化合物の結合親和性の予測については、機能する例はあるものの、良好な予測はほとんどの場合できな!/、ことも、非特許文献 1には報告されて!/、る。

[0004] 一方、標的生体高分子の三次元情報を利用することなぐ 1つ以上の既知のリガンドの三次元情報をもとに、標的生体高分子に結合可能なリガンドを計算機で探索する方法として、ファーマコフォアモデル検索と呼ばれる手法がある。これは、既存の活性のあるリガンド 1分子、あるいは、 2つ以上の既存の活性のあるリガンドの重ね合わせから、標的生体高分子との相互作用に必要な官能基群 (例えば、水素結合性の置換基、イオン性原子、疎水性の置換基など）とそれらの相対的な立体配置を予測し、それらを満たす新規リガンドを計算機で探索する手法である (代表的なプログラムとして、 Catalyst、 Unity, MOE等がある）。しかしながら、このファーマコフォアモデル検索は、 1つ以上の既知の活性なリガンドが存在しない限り、計算をすることが不可能であること力、ら、限定された使用を強いられる手法と言える。また、このファーマコフォアモデル検索は、既存のリガンドと類似した性質を持つ新規のリガンドを見出す手法であり、標的生体高分子との相互作用につレ、ての情報も直接的には取り扱って!/、な!/、。

[0005] 非特許文献 1：「ジャーナル ·ォブ 'メディシナル 'ケミストリー（Journal of Medicinal Che mistry) J , (米国）, 2004年， 47巻， 12号， 3032- 47頁

発明の開示

発明が解決しょうとする課題

[0006] 以上のとおり、従来のファーマコフォアモデル検索では、 1つ以上の既知の活性なリガンドの情報が不可欠である。

また、バーチャルスクリーニング又はインシリコスクリーニング法では、ドッキングスコァと結合親和性との相関が低力、つた。創薬のリード化合物として有用な医薬候補化合物としては、 IC 力 S; _mol/L未満であることが望ましいが、従来のバーチャルスク

50

リーユング又はインシリコスクリーニング法や、ハイスループットスクリーニング法では、このような高活性の医薬候補化合物を取得することは容易ではない。従って、本発明の課題は、標的生体高分子に対する 1種又は 2種以上の高活性医薬候補化合物を高確率で見出すことのできる方法を提供することにある。

課題を解決するための手段

[0007] 本発明は、

[1]標的生体高分子に結合可能なリガンドに特徴的な分子断片及びその三次元位置情報の決定方法であって、

(a)複数種類の低分子化合物の各々に関して、その三次元構造情報と、前記標的生体高分子におけるリガンド結合領域の三次元構造情報とに基づいてドッキングシミュレーシヨンを実施することにより、各低分子化合物のドッキングスコアを算出すると共に、リガンド結合領域内において各低分子化合物が安定的に結合する三次元位置情報を取得する工程 (以下、ドッキングシミュレーション工程と称する）、

(b)前記工程 ωで算出したドッキングスコアに基づく上位群に含まれる各低分子化合物に関して、前記工程 (a)で取得したリガンド結合領域内における三次元位置情報から、所定の分子断片 1種類又はそれ以上の三次元位置情報を全て取得するェ程 (以下、取得工程と称する）、

(c)前記工程 (b)で取得した分子断片の三次元位置情報を、分子断片毎に集計する工程 (以下、集計工程と称する）、並びに

(d)前記工程 (c)の集計に基づき、リガンド結合領域内において局在傾向が認められた分子断片の種類及びその三次元位置情報を選択する工程 (以下、選択工程と称する）

を含むことを特徴とする、前記方法、

[2]前記 [1 ]の方法において決定された特徴的分子断片から分子断片 1種類以上を選択し、それを満足する化合物を決定する工程 (以下、リガンド決定工程と称する）を含む、標的生体高分子に結合可能なリガンドの探索方法、

[3]標的生体高分子に結合可能なリガンドに特徴的な分子断片及びその三次元位置情報を決定するためのプログラムであって、

複数種類の低分子化合物について、それぞれ、局在分子断片特定用ドッキング原子座標を発生させる手順、

前記原子座標から、所定の分子断片 1種類又はそれ以上の三次元位置情報を全て取得する手順、

取得した分子断片の三次元位置情報を、分子断片毎に集計する手順、並びに前記集計に基づき、局在傾向が認められた分子断片の種類及びその三次元位置情報を選択する手順

をコンピュータに実行させるためのプログラム、

[4]標的生体高分子に結合可能なリガンドを探索するためのプログラムであって、複数種類の低分子化合物について、それぞれ、局在分子断片特定用ドッキング原子座標を発生させる手順、

前記局在分子断片特定用ドッキング原子座標から、所定の分子断片 1種類又はそれ以上の三次元位置情報を全て取得する手順、

取得した分子断片の三次元位置情報を、分子断片毎に集計する手順、

前記集計に基づき、局在傾向が認められた分子断片の種類及びその三次元位置情報を選択する手順、

生理活性候補化合物 1種類又はそれ以上につ!/、て、生理活性候補化合物ドッキング原子座標を発生させる手順、

前記生理活性候補化合物ドッキング原子座標と、先に選択した局在分子断片の種類及び三次元位置情報とを比較して、前記生理活性候補化合物の局在分子断片充足度を見積る手順、並びに

局在分子断片充足度の高い生理活性候補化合物を選択する手順

をコンピュータに実行させるためのプログラム、

[5]標的生体高分子に結合可能なリガンドを探索するためのプログラムであって、複数種類の低分子化合物について、それぞれ、局在分子断片特定用ドッキング原子座標を発生させる手順、

生理活性候補化合物 1種類又はそれ以上につ!/、て、生理活性候補化合物三次元原子座標を発生させる手順、

前記生理活性候補化合物三次元原子座標と、先に選択した局在分子断片の種類及び三次元位置情報とを比較して、前記生理活性候補化合物の局在分子断片充足度を見積る手順、並びに

をコンピュータに実行させるためのプログラム

に関する。

本発明は、（1)ファーマコフォアモデル検索で必要な既知の活性なリガンドの情報が全く不要であり、（2)標的生体高分子との相互作用をドッキングにより取り扱う一方、信頼性にやや難のあるドッキングスコアは最終的に使わず、（3)標的生体高分子に結合可能なリガンドに特徴的な分子断片及び三次元位置情報という新しい概念でリガンドを検索する手法である。

発明の効果

[0009] 本発明によれば、標的生体高分子に対する 1種又は 2種以上の高活性医薬候補化合物を高確率で見出すことができる。

図面の簡単な説明

[0010] [図 l]DOCKプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素のリガンド (TIBO)結合領域におけるベンゼン環の局在位置を、 TIBOの結合状態と共に模式的に示す説明図である。

[図 2]DOCKプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素のリガンド (TIBO)結合領域におけるメチル基の局在位置を、 TIBOの結合状態と共に模式的に示す説明図である。

[図 3]DOCKプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素のリガンド (TIBO)結合領域におけるチォカルボニル基の局在位置を、 TIBOの結合状態と共に模式的に示す説明図である。

[図 4]GOLDプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素のリガンド (TIBO)結合領域におけるベンゼン環の局在位置を、 TIBOの結合状態と共に模式的に示す説明図である。

[図 5]GOLDプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素のリガンド (TIBO)結合領域におけるメチル基の局在位置を、 TIBOの結合状態と共に模式的に示す説明図である。

[図 6]GOLDプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素のリガンド (TIBO)結合領域におけるチォカルボニル基の局在位置を、 TIBOの結合状態と共に模式的に示す説明図である。

[図 7]図 1に示すベンゼン環の局在位置（DOCKプログラムによる）に基づ!/、て本発明方法により選抜された化合物（MayBridge社、コード番号 JFD 01710)の、 HIV— 1 逆転写酵素のリガンド結合領域における結合状態を模式的に示す説明図である。

[図 8]図 1に示すベンゼン環の局在位置（GOLDプラグラムによる）に基づ!/、て本発明方法により選抜された化合物（MayBridge社、コード番号 JFD 01710)の、 HIV— 1 逆転写酵素のリガンド結合領域における結合状態を模式的に示す説明図である。

[図 9]本発明方法により見出された、 HIV—1逆転写酵素に対する医薬品候補化合物の構造式と活性値 (IC 値)を示す説明図である。

50

[図 10]DOCKプログラムを用いる本発明方法により決定された、 CysLT2受容体のリガンド結合領域におけるベンゼン環の局在位置を、本発明方法により選抜された化合物（Specs社、コード番号 AK-968/40708060)の結合状態と共に模式的に示す説明図である。

[図 l l]GOLDプログラムを用いる本発明方法により決定された、 CysLT2受容体のリガンド結合領域におけるベンゼン環の局在位置を、本発明方法により選抜された化合物（Specs社、コード番号 AK-968/40708060)の結合状態と共に模式的に示す説明図である。

[図 12]本発明方法により見出された、 CysLT2受容体に対する医薬品候補化合物の構造式と活性値 (IC 値)を示す説明図である。

50

[図 13]本発明方法の手順を示すフローチャートである。

発明を実施するための最良の形態

[0011] 本発明には、ドッキングシミュレーション工程、取得工程、集計工程、及び選択工程を含む、標的生体高分子に結合可能なリガンドに特徴的な分子断片及びその三次元位置情報 (以下、特徴的分子断片情報と称することがある）の決定方法と、ドッキングシミュレーション工程、取得工程、集計工程、選択工程、及びリガンド決定工程を含む、標的生体高分子に結合可能なリガンドの探索方法とが含まれる。前記リガンド探索方法では、前記特徴的分子断片情報決定方法で得られた分子断片及びその三次元位置情報に基づいて、更に、前記リガンド決定工程を実施することにより、標的生体高分子に結合可能なリガンドを決定することができる。

[0012] 本発明方法では、ドッキングシミュレーション工程を実施する前に、標的生体高分子のリガンド結合領域に関する三次元構造情報と、ドッキングシミュレーションに用いる複数種類（通常、 10種類以上、好ましくは 1000種類以上）の低分子化合物に関する三次元構造情報とを用意する。

[0013] 本発明方法を適用することのできる標的生体高分子としては、医薬の標的として利用可能な高分子である限り、特に限定されるものではなぐ例えば、天然のタンパク質 (糖タンパク質を含む）、核酸、若しくは多糖類、又は、これらの誘導体 (例えば、改変タンパク質）を挙げること力 Sできる。

[0014] 標的生体高分子のリガンド結合領域に関する三次元構造情報は、標的生体高分子におけるリガンド結合領域を含む限り、例えば、前記リガンド結合領域のみの三次元構造情報であることもできるし、標的生体高分子の全体又はその一部（但し、リガンド結合領域を含む）の三次元構造情報であることもできる。前記三次元構造情報は、ドッキングシミュレーションを実施するのに必要な情報を含む限り、特に限定されるものではなく、リガンド結合領域を構成する各原子の情報、例えば、各原子の種類、状態、及び/又は三次元位置情報等を挙げることができる。前記三次元構造情報として、例えば、公知の既存情報若しくはその改変情報、又は新たに決定した新規情報を禾 IJ用すること力できる。

[0015] より具体的には、標的生体高分子の結晶構造が既に決定されている場合には、例えば、データバンク [例えば、プロテインデータバンク（http://www.rcsb.org/pdb/) ] 力、ら結晶構造の三次元情報を入手することができる。入手した三次元情報は、そのまま、リガンド結合領域の三次元構造情報として使用することもできるが、通常は、用いるドッキングシミュレーションプログラムに応じて、必要な加工処理を行うことが好ましい。

[0016] 例えば、 X線構造解析により決定された結晶構造では、水素原子が含まれてレ、ないため、水素原子の三次元情報を付加することが好ましい。水素原子の付加は、例えば、計算化学システム [Sybyl (商品名）（バージョン 6.4)； Tripos社 (米国）製]を用いて実施すること力できる。また、リガンドとの複合体の状態で X線構造解析を実施して得られた結晶構造では、リガンドに関する三次元情報を除去することが必要である。また、各原子に対して、その電荷情報を付加することが好ましぐ例えば、 AMBER (As sisted Model Building with Energy Refinement) [The Amber biomolecular simulation programs. J Comput Chem. 2005;26(16): 1668-88、及び Force fields for protein simulations. Adv Protein Chem. 2003;66:27-85]の力場パラメーターを使用し、割り付けること力 Sでさる。

[0017] 標的生体高分子の結晶構造が決定されていない場合には、例えば、類似の立体構造を有することが予想される別の生体高分子の結晶構造が既に決定されていれば、その結晶構造に基づいてホモロジ一モデリングを実施することにより、標的生体高分子の推定結晶構造を得ることができる。例えば、類似生体高分子の結晶構造を铸型として、計算化学システム [例えば、 MOE (商品名）（バージョン²00²·03)； Chemical Computing Group社（カナダ）製]を用いて、ホモロジ一モデリングを行うことにより、標的生体高分子の推定結晶構造を得ることができる。得られた推定結晶構造にっレヽて、所望により、前記加工処理、例えば、水素原子の付加、リガンドの除去、電荷の付加を行うことができる。

[0018] 本明細書における用語「低分子化合物」とは、標的生体高分子の分子量よりも小さい分子量を有する化合物を意味し、好ましくは、後述のドッキングシミュレーションプログラムにおいて、ドッキングパートナーの一方 (すなわち、リガンド）として利用可能な化合物、例えば、標的生体高分子のリガンド結合領域に、分子全体、あるいは、少なくともその一部が存在可能な化合物である。

[0019] 本発明方法では、低分子化合物の三次元構造情報を、通常、 10種類以上、好ましくは 1000種類以上、用意する。低分子化合物の選択方法は、特に限定されるものではないが、例えば、標的生体高分子のリガンド結合領域の形状及び大きさに応じて、低分子化合物の分子量の閾値（上限）を予め設定し、その閾値を超えない化合物を低分子化合物として選択することができる。なお、本発明においては、低分子化合物が標的生体高分子のリガンドであるか否かについて、予め考慮する必要はない。すなわち、本発明方法では、標的生体高分子のリガンドであるか否かを問わず、任意の低分子化合物を使用することができ、従って、これまでリガンドが全く知られていない標的生体高分子であっても、本発明方法を適用することが可能である。

[0020] 用意する三次元構造情報は、ドッキングシミュレーションを実施するのに必要な情報を含む限り、特に限定されるものではなぐ低分子化合物を構成する各原子の情報、例えば、各原子の種類、状態、及び/又は三次元位置情報等を挙げることができる。前記三次元構造情報として、例えば、公知の既存情報若しくはその改変情報、若しくは新たに決定した新規情報、又はそれらの組合せを利用することができる。

[0021] より具体的には、例えば、各種データベース、或いは、巿販化合物のカタログから平面構造式情報を入手し、立体構造生成プログラム [例えば、 Concord (商品名）（バ一ジョン 4.0.2)； Tripos社 (米国）製]を用いて三次元構造化することにより、低分子化合物の各々の三次元構造情報を得ることができる。所望により、更に、回転可能な一重結合をランダムに回転させるなどして、エネルギー最小化計算を行うことにより、コンホメーシヨンがよりランダマイズされた三次元構造情報を得ることができる。

[0022] 本発明方法におけるドッキングシミュレーション工程では、三次元構造情報を用意した各低分子化合物に関して、その三次元構造情報と、前記標的生体高分子におけるリガンド結合領域の三次元構造情報とに基づいてドッキングシミュレーションを実施することにより、各低分子化合物のドッキングスコアを算出すると共に、リガンド結合領域内において各低分子化合物が安定的に結合する三次元位置情報を取得する。

[0023] ドッキングシミュレーション用のプログラムとしては、各種プログラムが公知である。本工程で用いることのできるドッキングシミュレーションプログラムとしては、例えば、標的生体高分子のリガンド結合領域の三次元構造情報と、低分子化合物の三次元構造情報とを入力することにより、前記低分子化合物のドッキングスコアと、リガンド結合領域における前記低分子化合物の三次元位置情報 (より具体的には、低分子化合物を構成する各原子の三次元位置情報）とを出力可能なドッキングシミュレーションプログラムを挙げることカできる。

[0024] 前記ドッキングシミュレーションプログラムとしては、例えば、（1)力場ベースのスコア関数を利用するプログラム、（2)経験的なスコア関数を利用するプログラム、（3)知識ベースのスコア関数を利用するプログラム等を挙げることができる [Assessing Scoring Functions for Protein-Ligand Interactions. J. Med.

Chem. 2004;47(12):3032- 47]。

[0025] 前記プログラム（1)では、古典的なモレキュラーメカニックスのエネルギー関数を利用しており、ファンデルワールス及び静電相互作用の和を用いる。具体的なプロダラムとしては、列えば、、 CHARMm (Momany, F. A.; Rone, R. Validation of the general -purpose QUANTA.

3.2/CHARMm force-field. J. Comput. Chem. 1992， 13， 888- 900)、 DOCKの chemic al score (Ewing,

T. J. A.; untz, I. D. し ritical evaluation of search algorithms for automated molecular docking and database screening. J. Comput. Chem. 1997， 18， 1175-1189) が公知である。

[0026] 前記プログラム（2)では、水素結合、イオン相互作用、リボフィリックな相互作用等をノラメーター化し、重み付けをして合計する。具体的なプログラムとしては、例えば、 ChemScore (Eldriage, M. D. ; Murray, C. W. ; Auton, T. R.; Paonni, G. V.; Mee, R. P. Empirical scoring functions. I: The development of a fast empirical

scoring function to estimate the binding affinity of ligands in receptor

complexes. J. Comput. -Aided Mol. Des. 1997， 11， 425- 445)、 GOLD (Jones, G; Willett, P. ; Glen, R. し. Molecular recognition of receptor sites using genetic algorithm with a description of desolvation. J. Mol. Biol. 1995， 245, 43—53、 Jones, G; Willett, P. ; Glen, R. し.； Leach, A. R.; Taylor, R. Development and

validation of a genetic algorithm for flexible docking. J. Mol. Biol. 1997，

267， 727-748)、 AutoDock (Morris, G. M.; Goodsell, D. S.; Halliday, R. S.; Huey, R. ; Hart, W. E.; Belew, R. .; Olson, A. J. Automated docking using a

Lamarckian genetic algorithm and an empirical binding free energy function. J. Comp ut.

Chem. 1998， 19， 1639-1662、 Goodsell, D.S.; Olson, A. J. Automated docking of substrates to proteins by simulated annealing. Proteins: Struc, Funct., Genet. 1990， 8， 195-202、 Morris G. M.; Goodsell D. S.; Huey R.; Olson A.J. Distributed automated docking of flexible ligands to proteins: parallel applications of AutoDock 2.4., J. Comput. -Aided Mol. Des. 1996 Aug, 10(4)， 293- 304)が公知である。

[0027] 前記プログラム（3)では、標的タンパク質とリガンドの原子ペアの相互作用を合計する。相互作用のポテンシャルは、プロテインデータバンク（PDB)に登録されている既存の複合体結晶構造情報を用いる。具体的なプログラムとしては、例えば、 DrugSc ore ( ohlke, ri.; Hendlich, M. ; Llebe, . nowiedge-oased scoring function to predict protein-ligand interactions. J. Mol. Biol. 2000, 295, 337-356)、 PMF (Mu egge,

I.; Martin, Y. C. A general and fast scoring function for protein-ligand

interactions: A simplified potential approach. J. Med. Chem. 1999， 42, 791-804)力 S 公知である。

[0028] これらのドッキングシミュレーションプログラムでは、シミュレーション対象の低分子化合物（リガンド）に対してドッキングスコアを算出することができる。前記ドッキングスコァの評価基準は、そのプログラムで用いられるアプローチ方法によって異なる力本明細書における用語「ドッキングスコア」とは、結合の強度的安定性を示す指標であ

[0029] また、これらのドッキングシミュレーションプログラムでは、標的生体高分子のリガンド結合領域の三次元構造情報と、低分子化合物の三次元構造情報とを入力すると、前記低分子化合物に関して、そのドッキングスコアが算出されると同時に、低分子化合物とリガンド結合領域との安定的な結合が期待される結合様式、つまり、リガンド結合領域における低分子化合物の三次元位置情報が得られる。ここで、「リガンド結合領域における低分子化合物の三次元位置情報」とは、より具体的には、前記低分子化合物を構成する全原子の三次元位置情報である。

[0030] 1つの低分子化合物のドッキングシミュレーションが終了したところで、次の低分子化合物のドッキングシミュレーションを行い、以下、三次元構造情報を用意した低分子化合物の内、所望の低分子化合物の全てについて、順次、ドッキングシミュレーシヨンを実施することができる。

[0031] 本発明方法における取得工程では、前記ドッキングシミュレーション工程で算出されたドッキングスコアに基づく上位群に関して、前記ドッキングシミュレーション工程で取得したリガンド結合領域内における三次元位置情報から、所定の分子断片 1種類又はそれ以上の三次元位置情報を全て取得する。本工程における前記上位群は、各種条件、例えば、標的生体高分子の種類、ドッキングシミュレーションを行う低分子化合物の数、得られたドッキングスコアの傾向などに応じて適宜決定することができる

1S 通常、上位 10%以内、好ましくは上位 30%以上、より好ましくは上位 50 %以上である。より多くの上位群で行うことで、より正確な分子断片の三次元位置情報を取得すること力 Sでさる。

[0032] 本明細書における用語「分子断片」とは、化合物（特には低分子化合物）を構成することのできる原子又は原子団を意味し、例えば、各種の基本骨格 [例えば、非環式 (例えば、直鎖又は分岐)炭化水素骨格 (基）、環式 (例えば、単環式、縮合多環式、架橋環状、スピロ、又は環集合)炭化水素骨格、又はへテロ環式骨格]若しくは特性原子団（例えば、ベンゼン環、ァミン、カルボニル基、アミド、ゥレア、チォゥレア、水酸基、チオール基、ハロゲン原子、カルボキシル基、スルホ基、ノヽロホルミル基、力ルバモイル基、アミジノ基、シァノ基、ホルミル基、チォカルボニル基、アミノ基、イミノ基等 )又はそれらの組合せを挙げることができる。

[0033] 集計工程では、前記取得工程で取得した三次元位置情報を、各分子断片毎に集計する。また、選択工程では、前記集計工程の結果に基づき、リガンド結合領域内において局在傾向が認められた分子断片の種類及びその三次元位置情報を選択する。前記集計処理は、各分子断片毎に、有意な局在化を示す三次元位置を特定することができる限り、特に限定されるものではなぐ例えば、以下の手順に従って実施すること力 Sでさる。

[0034] まず、計算対象となる空間領域、すなわち、標的生体高分子のリガンド結合領域を複数の区域に分割する [例えば、 8000 ( = 20³)区域〜 125000 ( = 50³)区域]。三次元位置情報が得られた分子断片の中から 1つの分子断片を選択し、その分子断片に関して、前記上位群に出現する全ての三次元位置情報を前記分割区域毎に集計する。集計後、全分割区域の中で、有意な局在傾向が認められる区域が存在するか否力、を判定し、有意な局在傾向が認められた区域の三次元位置情報を、その分子断片の特徴的な三次元位置情報として記録する。なお、 1つの分子断片について、局在傾向が認められる区域は 1つに限定されず、複数の区域が特定される場合もあり得るし、局在傾向が全く認められない場合もあり得る。 1つの分子断片に関する前記集計、判定、及び記録が終了したところで、次の分子断片に関して、同様に、集計、判定、及び記録を実施し、その分子断片に特徴的な三次元位置情報を特定する。所望の分子断片について、順次、前記手順を繰り返すことにより、前記リガンド結合領域に特徴的な分子断片の種類及びその三次元位置情報を決定することができる。なお、分子断片の選択については、例えば、創薬において重要性が報告又は示唆されている分子断片を優先的に選択することもできるし、あるいは、経験的に、又はランダムに選択することもできる。

[0035] 本発明方法におけるリガンド決定工程では、前記選択工程で選択された特徴的分子断片（以下、局在分子断片とも称する)から、分子断片 1種類以上 (好ましくは、種類及び/又は三次元位置情報に関して異なる分子断片 2種類以上)を選択し、それらの種類及び三次元位置情報を同時に満足する化合物を決定する。前記決定方法としては、例えば、化合物データベースのスクリーニングなどを挙げることができる。

[0036] 前記スクリーニングの対象となる化合物群又はデータベースとしては、必要な三次元構造情報を含む限り、特に限定されるものではなぐ例えば、各種データベース又は市販化合物のカタログを対象とすることができる。より具体的には、例えば、前記ドッキングシミュレーションで用いた三次元構造情報を含む低分子化合物データべ一ス、好ましくは、前記ドッキングシミュレーションで得られた、リガンド結合領域における三次元位置情報を含む低分子化合物データベース（特に好ましくは、上位群に分類された低分子化合物のデータベース）を挙げることができる。

[0037] リガンド結合領域に対する相対的位置関係が特定された分子断片が提示された場合、その条件を満足する化合物を検索する方法としては、各種プログラムが公知であり、例えば、（1)「局在分子断片（分子断片の種類と相対的空間位置)」と「ドッキング結果である各低分子化合物の三次元位置情報」とを利用する検索方法、 (2)「局在分子断片」のみを利用する分子構造の 3D検索方法などを挙げることができる。

[0038] 前記検索方法（1)では、選択工程で選択された特徴的分子断片の局在分子断片の種類と三次元位置情報と、スクリーニング対象の各低分子化合物における、ドツキングシミュレーションにより得られる各三次元位置情報とを比較し、両者の一致度（以下、局在分子断片充足度と称する）が高いものを優先的に選択することができる。各低分子化合物の前記三次元位置情報を取得するために用いるドッキングシミュレ一シヨンプログラムとしては、例えば、前記ドッキングシミュレーション工程で例示した各種プログラムを使用することができる。また、各低分子化合物の前記三次元位置情報は、前記ドッキングシミュレーション工程で用いたのと同じドッキングシミュレーションプログラムを用いて取得することもできるし、それとは別のドッキングシミュレーションプログラムを用いて取得することもできる。局在分子断片充足度は計算により算出することもできるし、あるいは、コンピューターグラフィックス（CG)により視覚化し、それらの視察により決定することもできる。 CGに基づく視察では、標的生体高分子との全体的な結合の様子も同時に判断することができるため、好ましい。

[0039] 前記検索方法（2)では、三次元構造情報を用意した各低分子化合物に対して、局在分子断片に基づくスクリーニングを実施する。各低分子化合物の三次元構造情報は、例えば、各種データベース、或いは、市販化合物のカタログから平面構造式情報を入手し、立体構造生成プログラム [例えば、 Concord (商品名）（バージョン 4.0.2) ； Tripos社 (米国）製]を用いて三次元構造化することにより、取得すること力 Sできる。

[0040] 前記検索方法（1)又は（2)に利用することのできる公知プログラムとしては、例えば、 UNITY (Tripos社）、 CATALYST (Accelrys社）、 MOE (CCG社）を挙げることができる。

[0041] 本発明の具体的な態様を、図 13に示すフローチャートに基づいて、更に説明する

〇

図 13に示すフローチャートには、ドッキングシミュレーション工程が記載されていないが、各低分子化合物の三次元構造情報と標的生体高分子のリガンド結合領域の三次元構造情報とに基づいてドッキングシミュレーション工程を実施した後、図 13に示す各工程を実施する。

[0042] 先ず、ドッキングシミュレーション工程で得られたドッキングスコアに基づいて上位群に含まれる低分子化合物を選択し、その各々について、局在分子断片特定用ドツキング原子座標を発生させる（Sl)。前記原子座標は、ドッキングシミュレーション工程で得られた、リガンド結合領域内において各低分子化合物が安定的に結合する三次元位置情報を、以下の工程で使用可能な原子座標に変換したものである。所望の分子断片の種類を入力し (S2)、各局在分子断片特定用ドッキング原子座標に関して、入力した分子断片が有意に局在する空間位置を算出するため、前記分子断片の三次元位置情報を全て取得する（S3)。取得した分子断片の三次元位置情報を、リガンド結合領域内の分割区域毎に集計し、局在する空間位置があるか否力、を判定する (S4)。 S4において、局在する空間位置が認められない場合 (No)、 S2に戻り、別の分子断片を入力する（S2)。 S4において、局在する空間位置が認められた場合 (Ye s)、 S5に進み、局在化が認められた分子断片の種類とその局在化空間位置を局在化分子断片として記録する（S5)。所望の分子断片候補の全てを調べたか否力、を検討し（S6)、分子断片候補が残っている場合 (No)には S2に戻り、候補全てを調べ終わった場合 (Yes)には S7に進む。

[0043] 生理活性候補化合物の各々についてドッキングシミュレーションを行うことにより、生理活性候補化合物ドッキング原子座標を発生させる（S7)。生理活性候補化合物の三次元位置情報と、 S5で得られた局在化分子断片の種類と局在化位置情報とを比較することにより、局在分子断片充足度を見積る（S8)。生理活性候補化合物の全てについて、ドッキングシミュレーション及び局在分子断片充足度見積りが終了したか否かを検討する（S9)。 S9において候補が残っている場合（No)には S7に戻り、 S9 において候補全てが終了していた場合 (Yes)には S 10に進む。得られた局在分子断片充足度に基づいて、高充足度化合物のリストを作成し（S10)、終了する。

[0044] なお、図 13に示すフローチャートでは、リガンド決定工程において前記検索方法（

1)を使用する場合の各工程 (特に S7)を示している。リガンド決定工程において前記検索方法（2)を使用する場合には、図 13に示す工程 S7に代えて、生理活性候補化合物三次元原子座標を発生させる。

実施例

[0045] 本発明の有効性を示すために、創薬標的タンパク質の三次元構造力も医薬品候補化合物の探索が可能であることを確認した。以下、 HIV— 1逆転写酵素及び CysL T2受容体を例にとって手順を具体的に説明する力 S、これらは本発明の範囲を限定するものではない。

[0046] 《実施例 1 : HIV— 1逆転写酵素に対する医薬品候補化合物の探索》 (1)生体高分子情報の準備

本実施例では、 HIV—1逆転写酵素に関する医薬品候補化合物を探索した。

HIV-1逆転写酵素の結晶構造は、プロテインデータバンク（http：〃 www.rcsb.org/p db/)から入手した [HIV-1逆転写酵素（エントリー NV) ]。この結晶構造は、低分子リガンド TIBO [5- CHLORO- 8- METHYL- 7- (3- METHYL- BUT- 2- ENYL)- 6，7，8，9- TETRAHYDRO- 2H- 2，7，9A_TRIAZA_BENZO[CD]AZULENE_ 1-THIONE] との複合体結晶構造であり、結合している低分子リガンドは計算には不要なので、 TI BOに関する三次元構造情報を除去した。また、前記結晶構造は、 X線により決定されたものなので、水素原子が含まれていない。計算化学システム [Sybyl (商品名）（バ一ジョン 6.4)； Tripos社 (米国）製]を用いて、水素原子を付加した後、全原子の電荷を、カリフォルニア大コールマン教授らのグループによって開発された AMBER (Assist ed

Model Building with Bnergy Refinement) [The Amber biomolecuiar simulation programs. Jし omput Chem. 2005;26(16): 1668-88、及び Force neids for protein simulations. Adv Protein Chem. 2003;66:27-85]の力場パラメーターを使用し、割り付けた。

[0047] (2)低分子化合物情報の準備

医薬品候補化合物の探索は、市販されている化合物を対象として計算を行った。ハイスループットスクリーニング用化合物カタログ [MayBridge社（英国）： 1999年 8月版、 50,361化合物； Specs社（オランダ）： 1999年 4月版、 71,162化合物]に sdファイル形式で登録されている化合物（以下、カタログ化合物と称する）を、立体構造生成プログラム [Concord (商品名）（バージョン 4.0.2)； Tripos社 (米国）製]を用いて三次元構造化した後、回転可能な一重結合をランダムに回転させ、エネルギー最小化計算を行つた。以上の手順により得られたカタログ化合物の三次元構造の中から、医薬品候補化合物の探索を行った。

[0048] (3)ドッキングシミュレーション

HIV— 1逆転写酵素の TIBOが結合する部位は、この酵素のァロステリック部位として知られており、この領域に結合するいくつかの医薬品が知られている。このァロステリック部位に対し、カリフォルニア大学サンフランシスコ校クンツ教授らのグループによつて開発されたドッキングシミュレーションプログラム [DOCK (商品名）（バージョン 4.0 )； Ewing, T. J. A.; untz, I. D. Critical

evaluation of search algorithms for automated molecular docking and database screening. J. Comput. Chem. 1997， 18， 1175-1189]、あるいは、ドッキングシミュレ一シヨンプログラム [GOLD (商品名）（バージョン 1.0)；ケンブリッジ結晶学データセンタ一（英国）製]を用いて、前記工程（2)で三次元構造化したカタログ化合物のドッキングシミュレーションを行った。 DOCK及び GOLDのそれぞれのシミュレーションにおいて、全カタログ化合物について、ドッキングスコア及び各種分子断片の三次元位置情報を取得した。なお、 DOCKは複数のスコアを取り扱うことができ、本実施例及び後述の実施例 2では、 DOCKの chemical

scoreを使用した。

[0049] (4)分子断片情報の集計

DOCK及び GOLDのそれぞれのシミュレーションで得られたドッキングの結果から、ドッキングスコアが上位から数えて約半分の化合物（約 50,000個）を抽出し、代表的な分子断片、例えば、ベンゼン環、ァミン、カルボニル基、アミド、ゥレア、チォゥレア、メチル基、水酸基、チオール基等の三次元位置情報を集計した。その結果、少なくとも 3種類の分子断片、すなわち、ベンゼン環、メチル基、及びチォカルボニル基力 HIV— 1逆転写酵素のァロステリック部位のポケット内において、局在して存在することが見出された。また、この結果は、使用したドッキングプログラムに依存せず、 DOC Kのシミュレーション結果を用いても、 GOLDのシミュレーション結果を用いても、計算結果は同じであった。

[0050] 結果を図 1〜図 6に示す。図 1〜図 3は、ドッキングシミュレーションプログラムとして DOCKを用いた場合の結果であり、図 4〜図 6は、 GOLDを用いた場合の結果である。また、図 1及び図 4はベンゼン環に関する結果であり、図 2及び図 5はメチル基に関する結果であり、図 3及び図 6はチォカルボニル基に関する結果である。図 1〜図 6において、分子断片（ベンゼン環、メチル基、又はチォカルボニル基）を球体で表わし、 X線結晶解析により結合様式が明らかにされた TIBOも併せて表記した。例えば、図 1を例にとると、図 1に示す球体 (合計 12個）は、分割区域毎に集計し、局在化している度合いを統計的に調べた結果、局在傾向が認められた区域の内、上位 12番目までの分割区域を表示したものである。

[0051] 図 1〜図 6に示すように、 TIBOのベンゼン環、メチル基、又はチォカルボニル基が、本発明方法により明らかにされたベンゼン環、メチル基、又はチォカルボニル基の局在領域と非常によく一致していることがわかる。これらの官能基（分子断片）は、 HI V— 1逆転写酵素のァロステリック部位に対する TIBOの結合能に重要であることが知られており、本発明方法により決定される分子断片を満たす化合物が創薬標的タンパク質に対する結合能を有すると期待できること、すなわち、本発明方法が医薬品候補化合物の探索に有効であることが確認された。

[0052] (5)リガンドの決定

得られた局在化した分子断片の位置情報を元に、これを満たした様式で結合して V、る化合物を、 DOCK又は GOLDのシミュレーション力も得られた結合状態の三次元座標から抽出した。分子断片としてベンゼン環の位置情報を用いて抽出した化合物の 1つ（MayBridge社、コード番号 JFD 01710)について、その結合状態を図 7及び図 8に示す。図 7は、 DOCKを用いたシミュレーションから抽出した結果であり、図 8 は、 GOLDを用いたシミュレーションから抽出した結果であり、同じような抽出が可能であった。最終的に、ベンゼン環以外の分子断片も用いて、 MayBridge社及び Specs 社のカタログ化合物から 36化合物を選抜した。

[0053] 選抜した 36化合物について実際に評価を行ったところ、 IC 力 mol/L未満の化

50

合物が 2個見出された。得られた医薬品候補化合物を図 9に示す。

[0054] 《実施例 2： CysLT2受容体に対する医薬品候補化合物の探索》

(1)生体高分子情報の準備

本実施例では、 Gタンパク質共役型受容体（GPCR)である CysLT2受容体に関する医薬品候補化合物を探索した。

CysLT2受容体は、 X線結晶解析の報告例がないため、ホモロジ一モデリング (Ho mology Modeling)により三次元構造を構築した。プロテインデータバンク（http：〃 www .rcsb.org/pdb/)に登録されている結晶構造のうち、ゥシロドプシン（エントリー 1F88) を入手した。ゥシロドプシンは、 X線結晶構造解析が行われた唯一の GPCRであり、同じ GPCRである CysLT2受容体に三次元構造が最も類似している唯一の結晶構造と推定される。前記結晶構造は、レチナールとの複合体結晶構造であり、結合している低分子リガンドは計算には不要なので、レチナールに関する三次元構造情報を除去した。また、第 4ヘリックスと第 5ヘリックスとの間のループ（Trpl75〜Asnl99のァミノ酸）は、結晶構造中においてレチナ一ルを上力も被うようにポケットにふたをしており、ドッキング計算の妨げとなるので、このループ部分のアミノ酸も除去した。このようにして得たゥシロドプシンの三次元構造を铸型として、計算化学システム [MOE (商品名）（バージョン 2002.03)； Chemical

Computing Group社（カナダ）製]を用いて、ホモロジ一モデリングを行い、 CysLT2 受容体の三次元構造を得た。

[0055] 得られた三次元構造に、計算化学システム [Sybyl (商品名）（バージョン 6.4)； Tripos 社 (米国)製]を用いて、水素原子を付加した後、全原子の電荷を、カリフォルニア大コールマン教授らのグループによって開発された AMBER (Assisted

[0056] (2)低分子化合物情報の準備

医薬品候補化合物の探索は、市販されている化合物を対象として計算を行った。ハイスループットスクリーニング用化合物カタログ [MayBridge社（英国）： 1999年 8月版、 50,361化合物； Specs社（オランダ）：2003年 6月版、 174,245化合物]に sdファイル形式で登録されている化合物（以下、カタログ化合物と称する）を、立体構造生成プログラム [Concord (商品名）（バージョン 4.0.2)； Tripos社 (米国）製]を用いて三次元構造化した後、回転可能な一重結合をランダムに回転させ、エネルギー最小化計算を行つた。以上の手順により得られたカタログ化合物の三次元構造の中から、医薬品候補化合物の探索を行った。

[0057] (3)ドッキングシミュレーションホモロジ一モデリングにより得られた CysLT2受容体の結合ポケット（ゥシロドプシンの結晶構造において、レチナールが結合していた領域に相当する領域）に対し、カリフォルニァ大学サンフランシスコ校クンツ教授らのグループによって開発されたドツキングシミュレーションプログラム [DOCK (商品名）（バージョン 4.0)； Ewing, T. J. A.; u ntz, I. D. (critical

evaluation of search algorithms for automated molecular docking and database screening. J. Comput. Chem. 1997， 18， 1175-1189]、あるいは、ドッキングシミュレ一シヨンプログラム [GOLD (商品名）（バージョン 1.0)；ケンブリッジ結晶学データセンタ一（英国）製]を用いて、前記工程（2)で三次元構造化したカタログ化合物のドッキングシミュレーションを行った。 DOCK及び GOLDのそれぞれのシミュレーションにおいて、全カタログ化合物について、ドッキングスコア及び各種分子断片の三次元位置情報を取得した。

[0058] (4)分子断片情報の集計

DOCK及び GOLDのそれぞれのシミュレーションで得られたドッキングの結果から、ドッキングスコアが上位から数えて約 3割の化合物（約 50,000個）を抽出し、代表的な分子断片、例えば、ベンゼン環、ァミン、カルボニル基、アミド、ゥレア、チォゥレア、メチル基、水酸基、チオール基等の三次元位置情報を集計した。その結果、少なくともベンゼン環が CysLT2受容体の結合ポケット内に局在して存在することが見出され。

[0059] (5)リガンドの決定

得られた局在化した分子断片の位置情報を元に、これを満たした様式で結合して V、る化合物を、 DOCK又は GOLDのシミュレーション力も得られた結合状態の三次元座標から抽出した。分子断片としてベンゼン環の位置情報を用いて抽出した化合物の 1つ（Specs社、コード番号 AK-968/40708060)について、その結合状態を図 10 及び図 11に示す。図 10は、 DOCKを用いたシミュレーションから抽出した結果であり、図 11は、 GOLDを用いたシミュレーションから抽出した結果であり、同じような抽出が可能であった。最終的に、ベンゼン環以外の分子断片も用いて、 MayBridge社及び Specs社のカタログ化合物から 780化合物を選抜した。 [0060] 選抜した 780化合物について実際に評価を行ったところ、 IC 力 mol/L未満

50

の化合物が 3個見出された。得られた医薬品候補化合物を図 12に示す。

[0061] 以上、本発明方法によれば、有用な医薬品候補化合物を見出すことが可能であることを示すこと力 Sできた。また、本発明方法では、使用するドッキングプログラムに依存することなぐ化合物の探索が可能であることを示すことができた。

産業上の利用可能性

[0062] 本発明は、医薬候補化合物の探索の用途に適用することができる。

以上、本発明を特定の態様に沿って説明したが、当業者に自明の変形や改良は本発明の範囲に含まれる。

Claims

請求の範囲

[1] 標的生体高分子に結合可能なリガンドに特徴的な分子断片及びその三次元位置情報の決定方法であって、

(a)複数種類の低分子化合物の各々に関して、その三次元構造情報と、前記標的生体高分子におけるリガンド結合領域の三次元構造情報とに基づいてドッキングシミュレーシヨンを実施することにより、各低分子化合物のドッキングスコアを算出すると共に、リガンド結合領域内において各低分子化合物が安定的に結合する三次元位置情報を取得する工程、

(b)前記工程 (a)で算出したドッキングスコアに基づく上位群に含まれる各低分子化合物に関して、前記工程 (a)で取得したリガンド結合領域内における三次元位置情報から、所定の分子断片 1種類又はそれ以上の三次元位置情報を全て取得するェ程、

(c)前記工程 (b)で取得した分子断片の三次元位置情報を、分子断片毎に集計する工程、並びに

(d)前記工程 (c)の集計に基づき、リガンド結合領域内において局在傾向が認められた分子断片の種類及びその三次元位置情報を選択する工程

を含むことを特徴とする、前記方法。

[2] 請求項 1に記載の方法において決定された特徴的分子断片から分子断片 1種類以上を選択し、それを満足する化合物を決定する工程

を含む、標的生体高分子に結合可能なリガンドの探索方法。

[3] 標的生体高分子に結合可能なリガンドに特徴的な分子断片及びその三次元位置情報を決定するためのプログラムであって、

をコンピュータに実行させるためのプログラム。

[4] 標的生体高分子に結合可能なリガンドを探索するためのプログラムであって、複数種類の低分子化合物について、それぞれ、局在分子断片特定用ドッキング原子座標を発生させる手順、

をコンピュータに実行させるためのプログラム。

[5] 標的生体高分子に結合可能なリガンドを探索するためのプログラムであって、複数種類の低分子化合物について、それぞれ、局在分子断片特定用ドッキング原子座標を発生させる手順、

をコンピュータに実行させるためのプログラム。