明 細 書
リガンドの探索方法
技術分野
[0001] 本発明は、標的生体高分子に結合可能なリガンドの探索方法、及びその前段階で ある、標的生体高分子に結合可能なリガンドに特徴的な分子断片及びその三次元 位置情報の決定方法に関する。
背景技術
[0002] 標的生体高分子に結合可能なリガンドを、計算機を用いて探索する方法として、標 的生体高分子のリガンド結合部位とリガンドの三次元情報を利用して、ドッキング方 法により、リガンドの妥当な結合様式とドッキングスコアを計算し、この計算を複数個 のリガンドに対して連続的に適用することにより、結合する可能性があるリガンドを発 見する、あるいは、結合する可能性がない化合物を振るい落とす計算方法が公知で ある。このような計算方法は、バーチャルスクリーニング又はインシリコスクリーニングと 呼ばれている。
[0003] 幾つかのドッキングプログラムが市販されており、ドッキングスコアは、それぞれのプ ログラムが持つ独自のスコア関数により算出される(代表的なプログラムとして、 DOC K、 GOLD, FlexX、 AutoDOCK、 DrugScore等がある)。このドッキングスコアを利用し た標的生体高分子のリガンド結合部位におけるリガンドの結合様式の予測は比較的 良好で、例えば、非特許文献 1においては、検討した例のおよそ 80%について X線 結晶解析の結果が再現されることが報告されている。し力、しながら、ドッキングスコア を利用した化合物の結合親和性の予測については、機能する例はあるものの、良好 な予測はほとんどの場合できな!/、ことも、非特許文献 1には報告されて!/、る。
[0004] 一方、標的生体高分子の三次元情報を利用することなぐ 1つ以上の既知のリガン ドの三次元情報をもとに、標的生体高分子に結合可能なリガンドを計算機で探索す る方法として、ファーマコフォアモデル検索と呼ばれる手法がある。これは、既存の活 性のあるリガンド 1分子、あるいは、 2つ以上の既存の活性のあるリガンドの重ね合わ せから、標的生体高分子との相互作用に必要な官能基群 (例えば、水素結合性の置
換基、イオン性原子、疎水性の置換基など)とそれらの相対的な立体配置を予測し、 それらを満たす新規リガンドを計算機で探索する手法である (代表的なプログラムとし て、 Catalyst、 Unity, MOE等がある)。しかしながら、このファーマコフォアモデル検索 は、 1つ以上の既知の活性なリガンドが存在しない限り、計算をすることが不可能であ ること力、ら、限定された使用を強いられる手法と言える。また、このファーマコフォアモ デル検索は、既存のリガンドと類似した性質を持つ新規のリガンドを見出す手法であ り、標的生体高分子との相互作用につレ、ての情報も直接的には取り扱って!/、な!/、。
[0005] 非特許文献 1:「ジャーナル ·ォブ 'メディシナル 'ケミストリー(Journal of Medicinal Che mistry) J , (米国), 2004年, 47巻, 12号, 3032- 47頁
発明の開示
発明が解決しょうとする課題
[0006] 以上のとおり、従来のファーマコフォアモデル検索では、 1つ以上の既知の活性なリ ガンドの情報が不可欠である。
また、バーチャルスクリーニング又はインシリコスクリーニング法では、ドッキングスコ ァと結合親和性との相関が低力、つた。創薬のリード化合物として有用な医薬候補化 合物としては、 IC 力 S; mol/L未満であることが望ましいが、従来のバーチャルスク
50
リーユング又はインシリコスクリーニング法や、ハイスループットスクリーニング法では、 このような高活性の医薬候補化合物を取得することは容易ではない。従って、本発明 の課題は、標的生体高分子に対する 1種又は 2種以上の高活性医薬候補化合物を 高確率で見出すことのできる方法を提供することにある。
課題を解決するための手段
[0007] 本発明は、
[1]標的生体高分子に結合可能なリガンドに特徴的な分子断片及びその三次元位 置情報の決定方法であって、
(a)複数種類の低分子化合物の各々に関して、その三次元構造情報と、前記標的生 体高分子におけるリガンド結合領域の三次元構造情報とに基づいてドッキングシミュ レーシヨンを実施することにより、各低分子化合物のドッキングスコアを算出すると共 に、リガンド結合領域内において各低分子化合物が安定的に結合する三次元位置
情報を取得する工程 (以下、ドッキングシミュレーション工程と称する)、
(b)前記工程 ωで算出したドッキングスコアに基づく上位群に含まれる各低分子化 合物に関して、前記工程 (a)で取得したリガンド結合領域内における三次元位置情 報から、所定の分子断片 1種類又はそれ以上の三次元位置情報を全て取得するェ 程 (以下、取得工程と称する)、
(c)前記工程 (b)で取得した分子断片の三次元位置情報を、分子断片毎に集計する 工程 (以下、集計工程と称する)、並びに
(d)前記工程 (c)の集計に基づき、リガンド結合領域内において局在傾向が認めら れた分子断片の種類及びその三次元位置情報を選択する工程 (以下、選択工程と 称する)
を含むことを特徴とする、前記方法、
[2]前記 [1 ]の方法において決定された特徴的分子断片から分子断片 1種類以上を 選択し、それを満足する化合物を決定する工程 (以下、リガンド決定工程と称する) を含む、標的生体高分子に結合可能なリガンドの探索方法、
[3]標的生体高分子に結合可能なリガンドに特徴的な分子断片及びその三次元位 置情報を決定するためのプログラムであって、
複数種類の低分子化合物について、それぞれ、局在分子断片特定用ドッキング原 子座標を発生させる手順、
前記原子座標から、所定の分子断片 1種類又はそれ以上の三次元位置情報を全て 取得する手順、
取得した分子断片の三次元位置情報を、分子断片毎に集計する手順、並びに 前記集計に基づき、局在傾向が認められた分子断片の種類及びその三次元位置情 報を選択する手順
をコンピュータに実行させるためのプログラム、
[4]標的生体高分子に結合可能なリガンドを探索するためのプログラムであって、 複数種類の低分子化合物について、それぞれ、局在分子断片特定用ドッキング原 子座標を発生させる手順、
前記局在分子断片特定用ドッキング原子座標から、所定の分子断片 1種類又はそれ
以上の三次元位置情報を全て取得する手順、
取得した分子断片の三次元位置情報を、分子断片毎に集計する手順、
前記集計に基づき、局在傾向が認められた分子断片の種類及びその三次元位置情 報を選択する手順、
生理活性候補化合物 1種類又はそれ以上につ!/、て、生理活性候補化合物ドッキン グ原子座標を発生させる手順、
前記生理活性候補化合物ドッキング原子座標と、先に選択した局在分子断片の種 類及び三次元位置情報とを比較して、前記生理活性候補化合物の局在分子断片充 足度を見積る手順、並びに
局在分子断片充足度の高い生理活性候補化合物を選択する手順
をコンピュータに実行させるためのプログラム、
[5]標的生体高分子に結合可能なリガンドを探索するためのプログラムであって、 複数種類の低分子化合物について、それぞれ、局在分子断片特定用ドッキング原 子座標を発生させる手順、
前記局在分子断片特定用ドッキング原子座標から、所定の分子断片 1種類又はそれ 以上の三次元位置情報を全て取得する手順、
取得した分子断片の三次元位置情報を、分子断片毎に集計する手順、
前記集計に基づき、局在傾向が認められた分子断片の種類及びその三次元位置情 報を選択する手順、
生理活性候補化合物 1種類又はそれ以上につ!/、て、生理活性候補化合物三次元 原子座標を発生させる手順、
前記生理活性候補化合物三次元原子座標と、先に選択した局在分子断片の種類及 び三次元位置情報とを比較して、前記生理活性候補化合物の局在分子断片充足度 を見積る手順、並びに
局在分子断片充足度の高い生理活性候補化合物を選択する手順
をコンピュータに実行させるためのプログラム
に関する。
本発明は、(1)ファーマコフォアモデル検索で必要な既知の活性なリガンドの情報
が全く不要であり、(2)標的生体高分子との相互作用をドッキングにより取り扱う一方 、信頼性にやや難のあるドッキングスコアは最終的に使わず、(3)標的生体高分子に 結合可能なリガンドに特徴的な分子断片及び三次元位置情報という新しい概念でリ ガンドを検索する手法である。
発明の効果
[0009] 本発明によれば、標的生体高分子に対する 1種又は 2種以上の高活性医薬候補化 合物を高確率で見出すことができる。
図面の簡単な説明
[0010] [図 l]DOCKプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素 のリガンド (TIBO)結合領域におけるベンゼン環の局在位置を、 TIBOの結合状態と 共に模式的に示す説明図である。
[図 2]DOCKプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素 のリガンド (TIBO)結合領域におけるメチル基の局在位置を、 TIBOの結合状態と共 に模式的に示す説明図である。
[図 3]DOCKプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素 のリガンド (TIBO)結合領域におけるチォカルボニル基の局在位置を、 TIBOの結合 状態と共に模式的に示す説明図である。
[図 4]GOLDプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素 のリガンド (TIBO)結合領域におけるベンゼン環の局在位置を、 TIBOの結合状態と 共に模式的に示す説明図である。
[図 5]GOLDプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素 のリガンド (TIBO)結合領域におけるメチル基の局在位置を、 TIBOの結合状態と共 に模式的に示す説明図である。
[図 6]GOLDプログラムを用いる本発明方法により決定された、 HIV— 1逆転写酵素 のリガンド (TIBO)結合領域におけるチォカルボニル基の局在位置を、 TIBOの結合 状態と共に模式的に示す説明図である。
[図 7]図 1に示すベンゼン環の局在位置(DOCKプログラムによる)に基づ!/、て本発 明方法により選抜された化合物(MayBridge社、コード番号 JFD 01710)の、 HIV— 1
逆転写酵素のリガンド結合領域における結合状態を模式的に示す説明図である。
[図 8]図 1に示すベンゼン環の局在位置(GOLDプラグラムによる)に基づ!/、て本発 明方法により選抜された化合物(MayBridge社、コード番号 JFD 01710)の、 HIV— 1 逆転写酵素のリガンド結合領域における結合状態を模式的に示す説明図である。
[図 9]本発明方法により見出された、 HIV—1逆転写酵素に対する医薬品候補化合 物の構造式と活性値 (IC 値)を示す説明図である。
50
[図 10]DOCKプログラムを用いる本発明方法により決定された、 CysLT2受容体のリ ガンド結合領域におけるベンゼン環の局在位置を、本発明方法により選抜された化 合物(Specs社、コード番号 AK-968/40708060)の結合状態と共に模式的に示す説明 図である。
[図 l l]GOLDプログラムを用いる本発明方法により決定された、 CysLT2受容体のリ ガンド結合領域におけるベンゼン環の局在位置を、本発明方法により選抜された化 合物(Specs社、コード番号 AK-968/40708060)の結合状態と共に模式的に示す説明 図である。
[図 12]本発明方法により見出された、 CysLT2受容体に対する医薬品候補化合物の 構造式と活性値 (IC 値)を示す説明図である。
50
[図 13]本発明方法の手順を示すフローチャートである。
発明を実施するための最良の形態
[0011] 本発明には、ドッキングシミュレーション工程、取得工程、集計工程、及び選択工程 を含む、標的生体高分子に結合可能なリガンドに特徴的な分子断片及びその三次 元位置情報 (以下、特徴的分子断片情報と称することがある)の決定方法と、ドッキン グシミュレーション工程、取得工程、集計工程、選択工程、及びリガンド決定工程を 含む、標的生体高分子に結合可能なリガンドの探索方法とが含まれる。前記リガンド 探索方法では、前記特徴的分子断片情報決定方法で得られた分子断片及びその 三次元位置情報に基づいて、更に、前記リガンド決定工程を実施することにより、標 的生体高分子に結合可能なリガンドを決定することができる。
[0012] 本発明方法では、ドッキングシミュレーション工程を実施する前に、標的生体高分 子のリガンド結合領域に関する三次元構造情報と、ドッキングシミュレーションに用い
る複数種類(通常、 10種類以上、好ましくは 1000種類以上)の低分子化合物に関す る三次元構造情報とを用意する。
[0013] 本発明方法を適用することのできる標的生体高分子としては、医薬の標的として利 用可能な高分子である限り、特に限定されるものではなぐ例えば、天然のタンパク 質 (糖タンパク質を含む)、核酸、若しくは多糖類、又は、これらの誘導体 (例えば、改 変タンパク質)を挙げること力 Sできる。
[0014] 標的生体高分子のリガンド結合領域に関する三次元構造情報は、標的生体高分 子におけるリガンド結合領域を含む限り、例えば、前記リガンド結合領域のみの三次 元構造情報であることもできるし、標的生体高分子の全体又はその一部(但し、リガン ド結合領域を含む)の三次元構造情報であることもできる。前記三次元構造情報は、 ドッキングシミュレーションを実施するのに必要な情報を含む限り、特に限定されるも のではなく、リガンド結合領域を構成する各原子の情報、例えば、各原子の種類、状 態、及び/又は三次元位置情報等を挙げることができる。前記三次元構造情報とし て、例えば、公知の既存情報若しくはその改変情報、又は新たに決定した新規情報 を禾 IJ用すること力できる。
[0015] より具体的には、標的生体高分子の結晶構造が既に決定されている場合には、例 えば、データバンク [例えば、プロテインデータバンク(http://www.rcsb.org/pdb/) ] 力、ら結晶構造の三次元情報を入手することができる。入手した三次元情報は、そのま ま、リガンド結合領域の三次元構造情報として使用することもできるが、通常は、用い るドッキングシミュレーションプログラムに応じて、必要な加工処理を行うことが好まし い。
[0016] 例えば、 X線構造解析により決定された結晶構造では、水素原子が含まれてレ、な いため、水素原子の三次元情報を付加することが好ましい。水素原子の付加は、例 えば、計算化学システム [Sybyl (商品名)(バージョン 6.4); Tripos社 (米国)製]を用い て実施すること力できる。また、リガンドとの複合体の状態で X線構造解析を実施して 得られた結晶構造では、リガンドに関する三次元情報を除去することが必要である。 また、各原子に対して、その電荷情報を付加することが好ましぐ例えば、 AMBER (As sisted
Model Building with Energy Refinement) [The Amber biomolecular simulation programs. J Comput Chem. 2005;26(16): 1668-88、及び Force fields for protein simulations. Adv Protein Chem. 2003;66:27-85]の力場パラメーターを使用し、割り 付けること力 Sでさる。
[0017] 標的生体高分子の結晶構造が決定されていない場合には、例えば、類似の立体 構造を有することが予想される別の生体高分子の結晶構造が既に決定されていれば 、その結晶構造に基づいてホモロジ一モデリングを実施することにより、標的生体高 分子の推定結晶構造を得ることができる。例えば、類似生体高分子の結晶構造を铸 型として、計算化学システム [例えば、 MOE (商品名)(バージョン2002·03); Chemical Computing Group社(カナダ)製]を用いて、ホモロジ一モデリングを行うことにより、 標的生体高分子の推定結晶構造を得ることができる。得られた推定結晶構造にっレヽ て、所望により、前記加工処理、例えば、水素原子の付加、リガンドの除去、電荷の 付加を行うことができる。
[0018] 本明細書における用語「低分子化合物」とは、標的生体高分子の分子量よりも小さ い分子量を有する化合物を意味し、好ましくは、後述のドッキングシミュレーションプ ログラムにおいて、ドッキングパートナーの一方 (すなわち、リガンド)として利用可能 な化合物、例えば、標的生体高分子のリガンド結合領域に、分子全体、あるいは、少 なくともその一部が存在可能な化合物である。
[0019] 本発明方法では、低分子化合物の三次元構造情報を、通常、 10種類以上、好まし くは 1000種類以上、用意する。低分子化合物の選択方法は、特に限定されるもので はないが、例えば、標的生体高分子のリガンド結合領域の形状及び大きさに応じて、 低分子化合物の分子量の閾値(上限)を予め設定し、その閾値を超えない化合物を 低分子化合物として選択することができる。なお、本発明においては、低分子化合物 が標的生体高分子のリガンドであるか否かについて、予め考慮する必要はない。す なわち、本発明方法では、標的生体高分子のリガンドであるか否かを問わず、任意 の低分子化合物を使用することができ、従って、これまでリガンドが全く知られていな い標的生体高分子であっても、本発明方法を適用することが可能である。
[0020] 用意する三次元構造情報は、ドッキングシミュレーションを実施するのに必要な情
報を含む限り、特に限定されるものではなぐ低分子化合物を構成する各原子の情 報、例えば、各原子の種類、状態、及び/又は三次元位置情報等を挙げることがで きる。前記三次元構造情報として、例えば、公知の既存情報若しくはその改変情報、 若しくは新たに決定した新規情報、又はそれらの組合せを利用することができる。
[0021] より具体的には、例えば、各種データベース、或いは、巿販化合物のカタログから 平面構造式情報を入手し、立体構造生成プログラム [例えば、 Concord (商品名)(バ 一ジョン 4.0.2); Tripos社 (米国)製]を用いて三次元構造化することにより、低分子化 合物の各々の三次元構造情報を得ることができる。所望により、更に、回転可能な一 重結合をランダムに回転させるなどして、エネルギー最小化計算を行うことにより、コ ンホメーシヨンがよりランダマイズされた三次元構造情報を得ることができる。
[0022] 本発明方法におけるドッキングシミュレーション工程では、三次元構造情報を用意 した各低分子化合物に関して、その三次元構造情報と、前記標的生体高分子にお けるリガンド結合領域の三次元構造情報とに基づいてドッキングシミュレーションを実 施することにより、各低分子化合物のドッキングスコアを算出すると共に、リガンド結合 領域内において各低分子化合物が安定的に結合する三次元位置情報を取得する。
[0023] ドッキングシミュレーション用のプログラムとしては、各種プログラムが公知である。本 工程で用いることのできるドッキングシミュレーションプログラムとしては、例えば、標 的生体高分子のリガンド結合領域の三次元構造情報と、低分子化合物の三次元構 造情報とを入力することにより、前記低分子化合物のドッキングスコアと、リガンド結合 領域における前記低分子化合物の三次元位置情報 (より具体的には、低分子化合 物を構成する各原子の三次元位置情報)とを出力可能なドッキングシミュレーション プログラムを挙げることカできる。
[0024] 前記ドッキングシミュレーションプログラムとしては、例えば、(1)力場ベースのスコア 関数を利用するプログラム、(2)経験的なスコア関数を利用するプログラム、(3)知識 ベースのスコア関数を利用するプログラム等を挙げることができる [Assessing Scoring Functions for Protein-Ligand Interactions. J. Med.
Chem. 2004;47(12):3032- 47]。
[0025] 前記プログラム(1)では、古典的なモレキュラーメカニックスのエネルギー関数を利
用しており、ファンデルワールス及び静電相互作用の和を用いる。具体的なプロダラ ムとしては、 列えば、、 CHARMm (Momany, F. A.; Rone, R. Validation of the general -purpose QUANTA.
3.2/CHARMm force-field. J. Comput. Chem. 1992, 13, 888- 900)、 DOCKの chemic al score (Ewing,
T. J. A.; untz, I. D. し ritical evaluation of search algorithms for automated molecular docking and database screening. J. Comput. Chem. 1997, 18, 1175-1189) が公知である。
[0026] 前記プログラム(2)では、水素結合、イオン相互作用、リボフィリックな相互作用等を ノ ラメーター化し、重み付けをして合計する。具体的なプログラムとしては、例えば、 ChemScore (Eldriage, M. D. ; Murray, C. W. ; Auton, T. R.; Paonni, G. V.; Mee, R. P. Empirical scoring functions. I: The development of a fast empirical
scoring function to estimate the binding affinity of ligands in receptor
complexes. J. Comput. -Aided Mol. Des. 1997, 11, 425- 445)、 GOLD (Jones, G; Willett, P. ; Glen, R. し. Molecular recognition of receptor sites using genetic algorithm with a description of desolvation. J. Mol. Biol. 1995, 245, 43—53、 Jones, G; Willett, P. ; Glen, R. し.; Leach, A. R.; Taylor, R. Development and
validation of a genetic algorithm for flexible docking. J. Mol. Biol. 1997,
267, 727-748)、 AutoDock (Morris, G. M.; Goodsell, D. S.; Halliday, R. S.; Huey, R. ; Hart, W. E.; Belew, R. .; Olson, A. J. Automated docking using a
Lamarckian genetic algorithm and an empirical binding free energy function. J. Comp ut.
Chem. 1998, 19, 1639-1662、 Goodsell, D.S.; Olson, A. J. Automated docking of substrates to proteins by simulated annealing. Proteins: Struc, Funct., Genet. 1990, 8, 195-202、 Morris G. M.; Goodsell D. S.; Huey R.; Olson A.J. Distributed automated docking of flexible ligands to proteins: parallel applications of AutoDock 2.4., J. Comput. -Aided Mol. Des. 1996 Aug, 10(4), 293- 304)が公知である。
[0027] 前記プログラム(3)では、標的タンパク質とリガンドの原子ペアの相互作用を合計す
る。相互作用のポテンシャルは、プロテインデータバンク(PDB)に登録されている既 存の複合体結晶構造情報を用いる。具体的なプログラムとしては、例えば、 DrugSc ore ( ohlke, ri.; Hendlich, M. ; Llebe, . nowiedge-oased scoring function to predict protein-ligand interactions. J. Mol. Biol. 2000, 295, 337-356)、 PMF (Mu egge,
I.; Martin, Y. C. A general and fast scoring function for protein-ligand
interactions: A simplified potential approach. J. Med. Chem. 1999, 42, 791-804)力 S 公知である。
[0028] これらのドッキングシミュレーションプログラムでは、シミュレーション対象の低分子化 合物(リガンド)に対してドッキングスコアを算出することができる。前記ドッキングスコ ァの評価基準は、そのプログラムで用いられるアプローチ方法によって異なる力 本 明細書における用語「ドッキングスコア」とは、結合の強度的安定性を示す指標であ
[0029] また、これらのドッキングシミュレーションプログラムでは、標的生体高分子のリガンド 結合領域の三次元構造情報と、低分子化合物の三次元構造情報とを入力すると、 前記低分子化合物に関して、そのドッキングスコアが算出されると同時に、低分子化 合物とリガンド結合領域との安定的な結合が期待される結合様式、つまり、リガンド結 合領域における低分子化合物の三次元位置情報が得られる。ここで、「リガンド結合 領域における低分子化合物の三次元位置情報」とは、より具体的には、前記低分子 化合物を構成する全原子の三次元位置情報である。
[0030] 1つの低分子化合物のドッキングシミュレーションが終了したところで、次の低分子 化合物のドッキングシミュレーションを行い、以下、三次元構造情報を用意した低分 子化合物の内、所望の低分子化合物の全てについて、順次、ドッキングシミュレーシ ヨンを実施することができる。
[0031] 本発明方法における取得工程では、前記ドッキングシミュレーション工程で算出さ れたドッキングスコアに基づく上位群に関して、前記ドッキングシミュレーション工程で 取得したリガンド結合領域内における三次元位置情報から、所定の分子断片 1種類 又はそれ以上の三次元位置情報を全て取得する。本工程における前記上位群は、
各種条件、例えば、標的生体高分子の種類、ドッキングシミュレーションを行う低分子 化合物の数、得られたドッキングスコアの傾向などに応じて適宜決定することができる
1S 通常、上位 10%以内、好ましくは上位 30%以上、より好ましくは上位 50 %以上 である。より多くの上位群で行うことで、より正確な分子断片の三次元位置情報を取 得すること力 Sでさる。
[0032] 本明細書における用語「分子断片」とは、化合物(特には低分子化合物)を構成す ることのできる原子又は原子団を意味し、例えば、各種の基本骨格 [例えば、非環式 (例えば、直鎖又は分岐)炭化水素骨格 (基)、環式 (例えば、単環式、縮合多環式、 架橋環状、スピロ、又は環集合)炭化水素骨格、又はへテロ環式骨格]若しくは特性 原子団(例えば、ベンゼン環、ァミン、カルボニル基、アミド、ゥレア、チォゥレア、水酸 基、チオール基、ハロゲン原子、カルボキシル基、スルホ基、ノヽロホルミル基、力ルバ モイル基、アミジノ基、シァノ基、ホルミル基、チォカルボニル基、アミノ基、イミノ基等 )又はそれらの組合せを挙げることができる。
[0033] 集計工程では、前記取得工程で取得した三次元位置情報を、各分子断片毎に集 計する。また、選択工程では、前記集計工程の結果に基づき、リガンド結合領域内に おいて局在傾向が認められた分子断片の種類及びその三次元位置情報を選択する 。前記集計処理は、各分子断片毎に、有意な局在化を示す三次元位置を特定する ことができる限り、特に限定されるものではなぐ例えば、以下の手順に従って実施す ること力 Sでさる。
[0034] まず、計算対象となる空間領域、すなわち、標的生体高分子のリガンド結合領域を 複数の区域に分割する [例えば、 8000 ( = 203)区域〜 125000 ( = 503)区域]。三 次元位置情報が得られた分子断片の中から 1つの分子断片を選択し、その分子断 片に関して、前記上位群に出現する全ての三次元位置情報を前記分割区域毎に集 計する。集計後、全分割区域の中で、有意な局在傾向が認められる区域が存在する か否力、を判定し、有意な局在傾向が認められた区域の三次元位置情報を、その分 子断片の特徴的な三次元位置情報として記録する。なお、 1つの分子断片について 、局在傾向が認められる区域は 1つに限定されず、複数の区域が特定される場合も あり得るし、局在傾向が全く認められない場合もあり得る。 1つの分子断片に関する前
記集計、判定、及び記録が終了したところで、次の分子断片に関して、同様に、集計 、判定、及び記録を実施し、その分子断片に特徴的な三次元位置情報を特定する。 所望の分子断片について、順次、前記手順を繰り返すことにより、前記リガンド結合 領域に特徴的な分子断片の種類及びその三次元位置情報を決定することができる。 なお、分子断片の選択については、例えば、創薬において重要性が報告又は示唆 されている分子断片を優先的に選択することもできるし、あるいは、経験的に、又はラ ンダムに選択することもできる。
[0035] 本発明方法におけるリガンド決定工程では、前記選択工程で選択された特徴的分 子断片(以下、局在分子断片とも称する)から、分子断片 1種類以上 (好ましくは、種 類及び/又は三次元位置情報に関して異なる分子断片 2種類以上)を選択し、それ らの種類及び三次元位置情報を同時に満足する化合物を決定する。前記決定方法 としては、例えば、化合物データベースのスクリーニングなどを挙げることができる。
[0036] 前記スクリーニングの対象となる化合物群又はデータベースとしては、必要な三次 元構造情報を含む限り、特に限定されるものではなぐ例えば、各種データベース又 は市販化合物のカタログを対象とすることができる。より具体的には、例えば、前記ド ッキングシミュレーションで用いた三次元構造情報を含む低分子化合物データべ一 ス、好ましくは、前記ドッキングシミュレーションで得られた、リガンド結合領域における 三次元位置情報を含む低分子化合物データベース(特に好ましくは、上位群に分類 された低分子化合物のデータベース)を挙げることができる。
[0037] リガンド結合領域に対する相対的位置関係が特定された分子断片が提示された場 合、その条件を満足する化合物を検索する方法としては、各種プログラムが公知であ り、例えば、(1)「局在分子断片(分子断片の種類と相対的空間位置)」と「ドッキング 結果である各低分子化合物の三次元位置情報」とを利用する検索方法、 (2)「局在 分子断片」のみを利用する分子構造の 3D検索方法などを挙げることができる。
[0038] 前記検索方法(1)では、選択工程で選択された特徴的分子断片の局在分子断片 の種類と三次元位置情報と、スクリーニング対象の各低分子化合物における、ドツキ ングシミュレーションにより得られる各三次元位置情報とを比較し、両者の一致度(以 下、局在分子断片充足度と称する)が高いものを優先的に選択することができる。各
低分子化合物の前記三次元位置情報を取得するために用いるドッキングシミュレ一 シヨンプログラムとしては、例えば、前記ドッキングシミュレーション工程で例示した各 種プログラムを使用することができる。また、各低分子化合物の前記三次元位置情報 は、前記ドッキングシミュレーション工程で用いたのと同じドッキングシミュレーションプ ログラムを用いて取得することもできるし、それとは別のドッキングシミュレーションプロ グラムを用いて取得することもできる。局在分子断片充足度は計算により算出するこ ともできるし、あるいは、コンピューターグラフィックス(CG)により視覚化し、それらの 視察により決定することもできる。 CGに基づく視察では、標的生体高分子との全体的 な結合の様子も同時に判断することができるため、好ましい。
[0039] 前記検索方法(2)では、三次元構造情報を用意した各低分子化合物に対して、局 在分子断片に基づくスクリーニングを実施する。各低分子化合物の三次元構造情報 は、例えば、各種データベース、或いは、市販化合物のカタログから平面構造式情 報を入手し、立体構造生成プログラム [例えば、 Concord (商品名)(バージョン 4.0.2) ; Tripos社 (米国)製]を用いて三次元構造化することにより、取得すること力 Sできる。
[0040] 前記検索方法(1)又は(2)に利用することのできる公知プログラムとしては、例えば 、 UNITY (Tripos社)、 CATALYST (Accelrys社)、 MOE (CCG社)を挙げることが できる。
[0041] 本発明の具体的な態様を、図 13に示すフローチャートに基づいて、更に説明する
〇
図 13に示すフローチャートには、ドッキングシミュレーション工程が記載されていな いが、各低分子化合物の三次元構造情報と標的生体高分子のリガンド結合領域の 三次元構造情報とに基づいてドッキングシミュレーション工程を実施した後、図 13に 示す各工程を実施する。
[0042] 先ず、ドッキングシミュレーション工程で得られたドッキングスコアに基づいて上位群 に含まれる低分子化合物を選択し、その各々について、局在分子断片特定用ドツキ ング原子座標を発生させる(Sl)。前記原子座標は、ドッキングシミュレーション工程 で得られた、リガンド結合領域内において各低分子化合物が安定的に結合する三次 元位置情報を、以下の工程で使用可能な原子座標に変換したものである。所望の分
子断片の種類を入力し (S2)、各局在分子断片特定用ドッキング原子座標に関して、 入力した分子断片が有意に局在する空間位置を算出するため、前記分子断片の三 次元位置情報を全て取得する(S3)。取得した分子断片の三次元位置情報を、リガ ンド結合領域内の分割区域毎に集計し、局在する空間位置があるか否力、を判定する (S4)。 S4において、局在する空間位置が認められない場合 (No)、 S2に戻り、別の 分子断片を入力する(S2)。 S4において、局在する空間位置が認められた場合 (Ye s)、 S5に進み、局在化が認められた分子断片の種類とその局在化空間位置を局在 化分子断片として記録する(S5)。所望の分子断片候補の全てを調べたか否力、を検 討し(S6)、分子断片候補が残っている場合 (No)には S2に戻り、候補全てを調べ終 わった場合 (Yes)には S7に進む。
[0043] 生理活性候補化合物の各々についてドッキングシミュレーションを行うことにより、生 理活性候補化合物ドッキング原子座標を発生させる(S7)。生理活性候補化合物の 三次元位置情報と、 S5で得られた局在化分子断片の種類と局在化位置情報とを比 較することにより、局在分子断片充足度を見積る(S8)。生理活性候補化合物の全て について、ドッキングシミュレーション及び局在分子断片充足度見積りが終了したか 否かを検討する(S9)。 S9において候補が残っている場合(No)には S7に戻り、 S9 において候補全てが終了していた場合 (Yes)には S 10に進む。得られた局在分子 断片充足度に基づいて、高充足度化合物のリストを作成し(S10)、終了する。
[0044] なお、図 13に示すフローチャートでは、リガンド決定工程において前記検索方法(
1)を使用する場合の各工程 (特に S7)を示している。リガンド決定工程において前記 検索方法(2)を使用する場合には、図 13に示す工程 S7に代えて、生理活性候補化 合物三次元原子座標を発生させる。
実施例
[0045] 本発明の有効性を示すために、創薬標的タンパク質の三次元構造力も医薬品候 補化合物の探索が可能であることを確認した。以下、 HIV— 1逆転写酵素及び CysL T2受容体を例にとって手順を具体的に説明する力 S、これらは本発明の範囲を限定 するものではない。
[0046] 《実施例 1 : HIV— 1逆転写酵素に対する医薬品候補化合物の探索》
(1)生体高分子情報の準備
本実施例では、 HIV—1逆転写酵素に関する医薬品候補化合物を探索した。
HIV-1逆転写酵素の結晶構造は、プロテインデータバンク(http:〃 www.rcsb.org/p db/)から入手した [HIV-1逆転写酵素(エントリー NV) ]。この結晶構造は、低分子 リガンド TIBO [5- CHLORO- 8- METHYL- 7- (3- METHYL- BUT- 2- ENYL)- 6,7,8,9- TETRAHYDRO- 2H- 2,7,9A_TRIAZA_BENZO[CD]AZULENE_ 1-THIONE] との複合体結晶構造であり、結合している低分子リガンドは計算には不要なので、 TI BOに関する三次元構造情報を除去した。また、前記結晶構造は、 X線により決定さ れたものなので、水素原子が含まれていない。計算化学システム [Sybyl (商品名)(バ 一ジョン 6.4); Tripos社 (米国)製]を用いて、水素原子を付加した後、全原子の電荷 を、カリフォルニア大コールマン教授らのグループによって開発された AMBER (Assist ed
Model Building with Bnergy Refinement) [The Amber biomolecuiar simulation programs. Jし omput Chem. 2005;26(16): 1668-88、及び Force neids for protein simulations. Adv Protein Chem. 2003;66:27-85]の力場パラメーターを使用し、割り 付けた。
[0047] (2)低分子化合物情報の準備
医薬品候補化合物の探索は、市販されている化合物を対象として計算を行った。 ハイスループットスクリーニング用化合物カタログ [MayBridge社(英国): 1999年 8月版 、 50,361化合物; Specs社(オランダ): 1999年 4月版、 71,162化合物]に sdファイル形 式で登録されている化合物(以下、カタログ化合物と称する)を、立体構造生成プログ ラム [Concord (商品名)(バージョン 4.0.2); Tripos社 (米国)製]を用いて三次元構造 化した後、回転可能な一重結合をランダムに回転させ、エネルギー最小化計算を行 つた。以上の手順により得られたカタログ化合物の三次元構造の中から、医薬品候 補化合物の探索を行った。
[0048] (3)ドッキングシミュレーション
HIV— 1逆転写酵素の TIBOが結合する部位は、この酵素のァロステリック部位とし て知られており、この領域に結合するいくつかの医薬品が知られている。このァロステ
リック部位に対し、カリフォルニア大学サンフランシスコ校クンツ教授らのグループによ つて開発されたドッキングシミュレーションプログラム [DOCK (商品名)(バージョン 4.0 ); Ewing, T. J. A.; untz, I. D. Critical
evaluation of search algorithms for automated molecular docking and database screening. J. Comput. Chem. 1997, 18, 1175-1189]、あるいは、ドッキングシミュレ一 シヨンプログラム [GOLD (商品名)(バージョン 1.0);ケンブリッジ結晶学データセンタ 一(英国)製]を用いて、前記工程(2)で三次元構造化したカタログ化合物のドッキン グシミュレーションを行った。 DOCK及び GOLDのそれぞれのシミュレーションにお いて、全カタログ化合物について、ドッキングスコア及び各種分子断片の三次元位置 情報を取得した。なお、 DOCKは複数のスコアを取り扱うことができ、本実施例及び 後述の実施例 2では、 DOCKの chemical
scoreを使用した。
[0049] (4)分子断片情報の集計
DOCK及び GOLDのそれぞれのシミュレーションで得られたドッキングの結果から 、ドッキングスコアが上位から数えて約半分の化合物(約 50,000個)を抽出し、代表的 な分子断片、例えば、ベンゼン環、ァミン、カルボニル基、アミド、ゥレア、チォゥレア 、メチル基、水酸基、チオール基等の三次元位置情報を集計した。その結果、少なく とも 3種類の分子断片、すなわち、ベンゼン環、メチル基、及びチォカルボニル基力 HIV— 1逆転写酵素のァロステリック部位のポケット内において、局在して存在するこ とが見出された。また、この結果は、使用したドッキングプログラムに依存せず、 DOC Kのシミュレーション結果を用いても、 GOLDのシミュレーション結果を用いても、計 算結果は同じであった。
[0050] 結果を図 1〜図 6に示す。図 1〜図 3は、ドッキングシミュレーションプログラムとして DOCKを用いた場合の結果であり、図 4〜図 6は、 GOLDを用いた場合の結果であ る。また、図 1及び図 4はベンゼン環に関する結果であり、図 2及び図 5はメチル基に 関する結果であり、図 3及び図 6はチォカルボニル基に関する結果である。図 1〜図 6において、分子断片(ベンゼン環、メチル基、又はチォカルボニル基)を球体で表 わし、 X線結晶解析により結合様式が明らかにされた TIBOも併せて表記した。
例えば、図 1を例にとると、図 1に示す球体 (合計 12個)は、分割区域毎に集計し、 局在化している度合いを統計的に調べた結果、局在傾向が認められた区域の内、上 位 12番目までの分割区域を表示したものである。
[0051] 図 1〜図 6に示すように、 TIBOのベンゼン環、メチル基、又はチォカルボニル基が 、本発明方法により明らかにされたベンゼン環、メチル基、又はチォカルボニル基の 局在領域と非常によく一致していることがわかる。これらの官能基(分子断片)は、 HI V— 1逆転写酵素のァロステリック部位に対する TIBOの結合能に重要であることが 知られており、本発明方法により決定される分子断片を満たす化合物が創薬標的タ ンパク質に対する結合能を有すると期待できること、すなわち、本発明方法が医薬品 候補化合物の探索に有効であることが確認された。
[0052] (5)リガンドの決定
得られた局在化した分子断片の位置情報を元に、これを満たした様式で結合して V、る化合物を、 DOCK又は GOLDのシミュレーション力も得られた結合状態の三次 元座標から抽出した。分子断片としてベンゼン環の位置情報を用いて抽出した化合 物の 1つ(MayBridge社、コード番号 JFD 01710)について、その結合状態を図 7及び 図 8に示す。図 7は、 DOCKを用いたシミュレーションから抽出した結果であり、図 8 は、 GOLDを用いたシミュレーションから抽出した結果であり、同じような抽出が可能 であった。最終的に、ベンゼン環以外の分子断片も用いて、 MayBridge社及び Specs 社のカタログ化合物から 36化合物を選抜した。
[0053] 選抜した 36化合物について実際に評価を行ったところ、 IC 力 mol/L未満の化
50
合物が 2個見出された。得られた医薬品候補化合物を図 9に示す。
[0054] 《実施例 2: CysLT2受容体に対する医薬品候補化合物の探索》
(1)生体高分子情報の準備
本実施例では、 Gタンパク質共役型受容体(GPCR)である CysLT2受容体に関す る医薬品候補化合物を探索した。
CysLT2受容体は、 X線結晶解析の報告例がないため、ホモロジ一モデリング (Ho mology Modeling)により三次元構造を構築した。プロテインデータバンク(http:〃 www .rcsb.org/pdb/)に登録されている結晶構造のうち、ゥシロドプシン(エントリー 1F88)
を入手した。ゥシロドプシンは、 X線結晶構造解析が行われた唯一の GPCRであり、 同じ GPCRである CysLT2受容体に三次元構造が最も類似している唯一の結晶構 造と推定される。前記結晶構造は、レチナールとの複合体結晶構造であり、結合して いる低分子リガンドは計算には不要なので、レチナールに関する三次元構造情報を 除去した。また、第 4ヘリックスと第 5ヘリックスとの間のループ(Trpl75〜Asnl99のァ ミノ酸)は、結晶構造中においてレチナ一ルを上力も被うようにポケットにふたをして おり、ドッキング計算の妨げとなるので、このループ部分のアミノ酸も除去した。このよ うにして得たゥシロドプシンの三次元構造を铸型として、計算化学システム [MOE (商 品名)(バージョン 2002.03); Chemical
Computing Group社(カナダ)製]を用いて、ホモロジ一モデリングを行い、 CysLT2 受容体の三次元構造を得た。
[0055] 得られた三次元構造に、計算化学システム [Sybyl (商品名)(バージョン 6.4); Tripos 社 (米国)製]を用いて、水素原子を付加した後、全原子の電荷を、カリフォルニア大 コールマン教授らのグループによって開発された AMBER (Assisted
Model Building with Bnergy Refinement) [The Amber biomolecuiar simulation programs. Jし omput Chem. 2005;26(16): 1668-88、及び Force neids for protein simulations. Adv Protein Chem. 2003;66:27-85]の力場パラメーターを使用し、割り 付けた。
[0056] (2)低分子化合物情報の準備
医薬品候補化合物の探索は、市販されている化合物を対象として計算を行った。 ハイスループットスクリーニング用化合物カタログ [MayBridge社(英国): 1999年 8月版 、 50,361化合物; Specs社(オランダ):2003年 6月版、 174,245化合物]に sdファイル形 式で登録されている化合物(以下、カタログ化合物と称する)を、立体構造生成プログ ラム [Concord (商品名)(バージョン 4.0.2); Tripos社 (米国)製]を用いて三次元構造 化した後、回転可能な一重結合をランダムに回転させ、エネルギー最小化計算を行 つた。以上の手順により得られたカタログ化合物の三次元構造の中から、医薬品候 補化合物の探索を行った。
[0057] (3)ドッキングシミュレーション
ホモロジ一モデリングにより得られた CysLT2受容体の結合ポケット(ゥシロドプシン の結晶構造において、レチナールが結合していた領域に相当する領域)に対し、カリ フォルニァ大学サンフランシスコ校クンツ教授らのグループによって開発されたドツキ ングシミュレーションプログラム [DOCK (商品名)(バージョン 4.0); Ewing, T. J. A.; u ntz, I. D. (critical
evaluation of search algorithms for automated molecular docking and database screening. J. Comput. Chem. 1997, 18, 1175-1189]、あるいは、ドッキングシミュレ一 シヨンプログラム [GOLD (商品名)(バージョン 1.0);ケンブリッジ結晶学データセンタ 一(英国)製]を用いて、前記工程(2)で三次元構造化したカタログ化合物のドッキン グシミュレーションを行った。 DOCK及び GOLDのそれぞれのシミュレーションにお いて、全カタログ化合物について、ドッキングスコア及び各種分子断片の三次元位置 情報を取得した。
[0058] (4)分子断片情報の集計
DOCK及び GOLDのそれぞれのシミュレーションで得られたドッキングの結果から 、ドッキングスコアが上位から数えて約 3割の化合物(約 50,000個)を抽出し、代表的 な分子断片、例えば、ベンゼン環、ァミン、カルボニル基、アミド、ゥレア、チォゥレア 、メチル基、水酸基、チオール基等の三次元位置情報を集計した。その結果、少なく ともベンゼン環が CysLT2受容体の結合ポケット内に局在して存在することが見出さ れ 。
[0059] (5)リガンドの決定
得られた局在化した分子断片の位置情報を元に、これを満たした様式で結合して V、る化合物を、 DOCK又は GOLDのシミュレーション力も得られた結合状態の三次 元座標から抽出した。分子断片としてベンゼン環の位置情報を用いて抽出した化合 物の 1つ(Specs社、コード番号 AK-968/40708060)について、その結合状態を図 10 及び図 11に示す。図 10は、 DOCKを用いたシミュレーションから抽出した結果であ り、図 11は、 GOLDを用いたシミュレーションから抽出した結果であり、同じような抽 出が可能であった。最終的に、ベンゼン環以外の分子断片も用いて、 MayBridge社 及び Specs社のカタログ化合物から 780化合物を選抜した。
[0060] 選抜した 780化合物について実際に評価を行ったところ、 IC 力 mol/L未満
50
の化合物が 3個見出された。得られた医薬品候補化合物を図 12に示す。
[0061] 以上、本発明方法によれば、有用な医薬品候補化合物を見出すことが可能である ことを示すこと力 Sできた。また、本発明方法では、使用するドッキングプログラムに依 存することなぐ化合物の探索が可能であることを示すことができた。
産業上の利用可能性
[0062] 本発明は、医薬候補化合物の探索の用途に適用することができる。
以上、本発明を特定の態様に沿って説明したが、当業者に自明の変形や改良は 本発明の範囲に含まれる。