JP2005508487A

JP2005508487A - 生体標的に対するコンビナトリアル・ライブラリーの相補性を評価するための分子ドッキング法

Info

Publication number: JP2005508487A
Application number: JP2002511229A
Authority: JP
Inventors: ディラー，デイヴィッド，ジェイ．; メルツ，ケネス，エム．，ジューニア
Original assignee: ファーマコピアインコーポレーティッド
Priority date: 2000-06-15
Filing date: 2001-06-15
Publication date: 2005-03-31
Also published as: IL153393A0; WO2001097098A2; US20020025535A1; CA2411190A1; AU2001269869A1; WO2001097098A3; EP1356411A2

Abstract

結合するリガンドを同定し最後に医薬化合物を同定するためのコンビナトリアルライブラリーをスクリーニングするための高速大量処理が可能な分子ドッキング法が提供される。この方法はドッキング前コンホーメーション調査を用いてリガンドの複数の溶液コンホーメーションを作成する。この分子ドッキング法は、標的分子の結合部位画像を作成する工程、該結合部位画像のホットスポット群を、該リガンドの複数の溶液コンホーメーションのうちの少なくとも一つの溶液コンホーメーション中の原子群に適合させて、リガンド−標的分子複合体形成において標的分子に関連する少なくとも一つのリガンド位置を得る工程、及び該標的分子を固定し、該リガンドの並進、向き及び回転可能な結合を変更させながら少なくとも一つのリガンド位置を最適化する工程、を含む方法である。ドッキングの結果は二つのドッキングした分子のコアの間のｒｍｓ偏差を指標として分類される。

Description

【０００１】
発明の分野
本出願は、高速大量処理分子ドッキング技法を用いて、スクリーニング用のコンビナトリアル・ライブラリーの相補性を評価しそしてその選択に優先順位をつけるための計算方法に関する。
【０００２】
発明の背景
コンビナトリアル化学並びにその結果もたらされた広範囲の標的に対する膨大な化合物を合成する能力の出現と共に、スクリーニングの活動に効率的に優先順位をつける能力が、与えられた標的についての化学空間（ｃｈｅｍｉｃａｌｓｐａｃｅ）の適切な領域を迅速に確認するために重要であることが明らかになった。コンビナトリアル化学及び高速大量処理スクリーニングの能力が与えられると、合理的な設計ツールを専ら使用してリード化合物を作製することはもはや必要でない。しかしながら、現在合成により得られうる化学空間の容量のために、あらゆる可能性のある化合物を適切にサンプリングすることは不可能であり、従ってコンビナトリアル化学という模範例を用いた場合でさえ、何らかの「合理的な」意思決定が要求される。例えば、化学空間の正確な領域（溶解性、形状、腸管吸収、及び他の性質などの物理的性質を用いて定義される）について迅速に焦点を当てることが重要である。効率的な優先順位決定手段により、科学者は費用効率が高く且つ能率的な様式でリードを得ることができ、活発な合成及び生物分析を行なう前に新規な標的に対するバーチャル・ライブラリーを試験することもでき、それにより経費を削減できるであろう。その上、今後のヒトのゲノム及び多数のゲノムの完全配列決定から予期される標的の来るべき激増により、資源は、活性化合物が得られそうにない化学空間の無駄なスクリーニング範囲でないことが絶対的となる。コンビナトリアル化学の出現で生じた新たな挑戦は、次に、コンビナトリアル・ライブラリーのこの選択に優先順位をつけることである。
【０００３】
スクリーニングの活動に優先順位をつける方法は、該標的にドッキングされ且つ採点機能により序列付けされたライブラリー又はコレクションの個々の化合物を使用する。次いで、ライブラリー全体ではなく高位に序列付けされた化合物の部分集合が活性について検定されうる。この方法は個々の化合物を試験すべく選択するためのガイドとして有用であることが証明された一方で、コンビナトリアル・ライブラリーのスクリーニング活動に優先順位をつける方法、即ち、個々の化合物を序列付けするのではなく、化合物のコンビナトリアル・ライブラリーを序列付けする方法が依然必要である。
【０００４】
発明の概要
簡潔に要約すれば、一側面において、標的分子にリガンドをドッキングする方法が本明細書で提示される。この方法は、ドッキング前にコンフォメーション調査を実施し該リガンドの複数の溶液コンフォメーションを作成する工程、複数のホットスポット（定義は段落００３５にある）を含む、該標的分子の結合部位画像を作成する工程、該リガンドの複数の溶液コンフォメーションのうち少なくとも一つの溶液コンフォメーション中の原子群に該結合部位画像のホットスポット群を適合させ該標的分子に関連する少なくとも一つのリガンドの位置を得る工程、並びに該標的分子自体を固定させたままにし且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら、少なくとも一つのリガンドの位置を最適化する工程を含む。
【０００５】
別の一側面において、標的分子にリガンドをドッキングするシステムが提供される。このシステムは、リガンドの複数の溶液コンフォメーションを作成するためにドッキング前にコンフォメーション調査を実施する手段を含む。更に、該システムは、標的分子の、複数のホットスポットを含む結合部位画像を作成する手段、並びに該標的分子に関連する少なくとも一つのリガンドの位置を得るために該リガンドの複数の溶液コンフォメーションのうちの少なくとも一つの溶液コンフォメーションにおける原子群に該結合部位画像のホットスポット群を適合させる手段を含む。該標的分子を固定したままに保持し且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら少なくとも一つのリガンドの位置を最適化するための最適化機構も提供される。
【０００６】
更なる一側面において、本発明は機械により読取り可能な少なくとも一つのプログラム記憶装置を含む。この装置は標的分子にリガンドをドッキングする方法を実施するために該機械により実行可能な命令の少なくとも一つのプログラムを明確に具現する。該方法は、ドッキング前のコンフォメーション調査を実施し該リガンドの複数の溶液コンフォメーションを作成する工程、該標的分子の、複数のホットスポットを含む結合部位画像を作成する工程、該リガンドの複数の溶液コンフォメーションのうち少なくとも一つの溶液コンフォメーションにおける原子群に該結合部位画像のホットスポット群を適合させ該標的分子に関連する少なくとも一つのリガンドの位置を得る工程、並びに該標的分子を固定させたままにし且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら少なくとも一つのリガンドの位置を最適化する工程を含む。
【０００７】
別の一側面において、本発明は標的分子に対する相補性についてコンビナトリアル・ライブラリーを評価する方法に関する。このライブラリーは共通のコア（ｃｏｒｅ）を有する複数のリガンドを含む。該方法は該標的分子に複数のリガンドの個々のリガンドをドッキングして複数のリガンド−標的複合体形成における該標的分子に関連する複数のリガンドの位置を作成する工程であって複数のリガンドの位置は該標的分子に関連する複数の共通コアの位置を含むものである工程、他の共通コアの位置から複数の共通コアの位置の個々の共通コアの位置までの２乗平均偏差を決定する工程、並びに該２乗平均偏差に従ってクラスターを形成する工程を含む。
【０００８】
別の一側面において、本発明は少なくとも一つの結合部位を有する標的に対する相補性についてコンビナトリアル・ライブラリーを評価するシステムに関する。該コンビナトリアル・ライブラリーはそれぞれが共通コアに基づいた複数のリガンドを含む。このシステムは、複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンドの位置を形成するための該標的分子に複数のリガンドの個々のリガンドをドッキングする手段であって複数のリガンドの位置が該標的分子に関連する複数の共通コアの位置を含むものである手段、他の共通コアの位置から複数の共通コアの位置の個々の共通コアの位置までの２乗平均偏差を決定する手段、並びに該２乗平均偏差に従ってクラスターを形成する手段を含む。
【０００９】
更なる別の一側面において、本発明は機械により読取り可能な少なくとも一つのプログラム記憶装置に関する。該装置は少なくとも一つの結合部位を有する標的に対する相補性についてコンビナトリアル・ライブラリーを評価する方法を実施するために該機械により実行可能な命令の少なくとも一つのプログラムを明確に具現する。該コンビナトリアル・ライブラリーはそれぞれが共通コアに基づいた複数のリガンドを含む。該方法は複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンドの位置を作成するために該標的分子に複数のリガンドの個々のリガンドをドッキングする工程であって複数のリガンドの位置が該標的分子に関連する複数の共通コアの位置を含むものである工程、他の共通コアの位置から複数の共通コアの位置の個々の共通コアの位置までの２乗平均偏差を決定する工程、並びに該２乗平均偏差に従ってクラスターを形成する工程を含む。
【００１０】
本明細書で提示するドッキング方法は幾つかの利点を有する。第一に、これは幾つかの独立した要素から構築される。これは科学進歩をより巧みに駆使することを可能とする。例えば、より優れたコンフォメーション調査手法（現文脈において、これはより生物学的に適切な三次構造体を意味する）が利用できるようになると、現行のコンフォメーション調査手法に代えて新しい三次元データベースの作成を使用できる。第二に、リガンドの可変性へのこの取り組みはコンビナトリアル方法により合成される化合物の部類により適している。コンビナトリアル・ライブラリーから得られる化合物はしばしば明瞭なアンカー断片を有していない。該リガンドからアンカー断片を見出しドッキングすることは漸進的構造アルゴリズム（ｉｎｃｒｅｍｅｎｔａｌｃｏｎｓｔｒｕｃｔｉｏｎａｌｇｏｒｉｔｈｍ）において重要な工程であるので、これらのアルゴリズムはコンビナトリアル・ライブラリーで普通に見出される化合物について困難に遭遇する。（漸進的構造アルゴリズムはおおよそ下記のように作業する：リガンドを固定（ｒｉｇｉｄ）断片に分割し、これらの断片のうち最大の断片を標的分子の結合部位にドッキングし、そして次に該リガンドを、適切な断片を付着させ該回転可能な結合の周囲を体系的に調査することにより結合部位に再構築する。該手法は、エム・レアリー、ビイ・クラメール、ティ・レンガウル、＆ジイ・クレーブ、「漸進的構築アルゴリズムを用いる迅速可変的ドッキング方法」、Ｊ．ＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ、２６１（１９９６）、４７０−４８９頁；及びエス・マキノ＆アイ・クンツ、「自動可変的リガンドドッキング方法及びデータベース調査へのその適用」、Ｊ．ＣｏｍｐｕｔａｔｉｏｎａｌＣｈｅｍｉｓｔｒｙ、１８（１９９７）、１８１２−１８２５頁）。）でさらに記載される。コンフォメーション全体のドッキングはこの困難を克服する。その上、効率的で柔軟な最適化工程を含むことは該コンフォメーション調査手法からかなりの負担を取除く。エネルギー最小化アルゴリズムの更なる改良も利用できるようになれば活用できる。
【００１１】
本明細書におけるリガンドの可変性へのアプローチは、最初のコンフォメーション調査への信頼がもとで不利とみなされうるであろう。先に示したように、最大効率を達成するために、該コンフォメーション調査はライブラリー又はコレクション全体について一度は実施されるべきであり、得られたコンフォメーションは更なる使用のために保存されるべきである。大規模なコレクションでは、これはコンピュータ使用時間及びディスク空き容量の両方にかなりの投資となるであろう。データベースは通常何度も使用されるので、該コンフォメーション調査のための初期コンピュータ使用時間は容易に正当化され得る。更に、並列コンピュータ及びより高速のＣＰＵを使用すると、該コンフォメーション調査は適度な量の時間で完了し又は時折やり直すことができる。ディスクの大きさは今やテラバイトのレベルに迫っているので、数百万の化合物のコンフォメーションを記憶することは全く問題ない。
【００１２】
上述した本発明の目的、利点及び特性、並びに他は、添付の図面と併せて考慮されると、本発明のいくつかの好ましい実施態様の下記の詳細な記載からより容易に理解されるであろう。
【００１３】
発明の詳細な説明
本発明は標的分子に対する相補性についてコンビナトリアル・ライブラリーを評価する方法に関する。本方法において、該ライブラリーの個々のリガンドは該標的分子にドッキングされ該標的に関連するリガンドの位置を形成する。個々のリガンドについて、該ライブラリーにおける他のリガンドの共通コアの位置から各リガンドの共通コアの位置までの２乗平均偏差が次いで決定される。最後に、該データをクラスター分析により体系化する。ここで、クラスターは該リガンドの共通コア間の２乗平均偏差に従って形成され、該ライブラリーは最上位クラスターのリガンドの相対数に従って序列付けられる。
【００１４】
本発明の方法を用いてスクリーニングされうる該コンビナトリアル・ライブラリーは、一般的に、該標的に潜在的に結合する数千の化合物を含み、それ故に「リガンド」と呼ばれる。これらのライブラリーは、限られた数の位置に付いた置換基により変わる基本的な化学構造の周囲に構築される。該基本的な化学構造は本発明の目的上「共通コア」と称される。例えば、アスパルチル・プロテアーゼ阻害剤ライブラリーの共通コアは図９に示される。多数の異なるシントンは所定の位置で置換され、数万から数百万の化合物を含むライブラリーを生ずる。例えば、図９の構造において、Ｒ_１、Ｒ_２及びＲ_３は種々のシントンが置換されうる位置を示している。
【００１５】
該ライブラリー、とりわけタンパク質及びヌクレオチドのリガンドに結合し得る標的分子は任意の生化学的な分子でありうる。本発明の方法は、具体的にはタンパク質の使用、とりわけ構造のデータ（一般的に結晶データ）が利用できるタンパク質についての使用を意図する。潜在的な結合部位は通常目視検査により構造中で同定される。
【００１６】
本発明の方法において、個々のリガンドは該標的分子にドッキングされる。ドッキング手法は該標的分子に関連する個々のリガンドに対して少なくとも一つの位置を作成する。この場合、該リガンドは該標的上の相補的な結合点に適合する。好ましいドッキング手法は下記の工程を含む。即ち、ドッキング前のコンフォメーション調査を実施し各リガンドの複数の溶液コンフォメーションを作成する工程、該標的分子の結合部位画像を作成する工程、各リガンドの複数の溶液コンフォメーションのうち少なくとも一つの溶液コンフォメーションにおける原子群に該結合部位画像のホットスポット群を適合させ該標的分子に関連する少なくとも一つのリガンドの位置を得る工程、並びに該標的分子を固定させたままにし且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら該リガンドの位置を最適化する工程である。
【００１７】
該ドッキング手法はタンパク質−リガンド複合体形成の概念像に基づいている（図１Ａ〜図１Ｃを参照）。最初に、該リガンド（Ｌ）は溶液中で多数のコンフォメーションをとる。該タンパク質（Ｐ）はこれらのコンフォメーションのうち一つ又は数個を認識する。認識すると、該リガンド、タンパク質及び溶媒は局部エネルギー地形に従い最終的な複合体を形成する。該手法はタンパク質標的の用語で記載されるが、同工程は該標的がヌクレオチド等のタンパク質以外の生体分子である場合にも実施されうる。
【００１８】
標的分子／リガンド複合体形成のこの単純な図は下記のように効率的な計算モデルに変換される。最初の溶液コンフォメーションは簡単なコンフォメーション調査手法を用いて作成される。この技法のコンフォメーション調査部分はドッキング工程全体の一部としてみなされるかも知れないが、それはリガンドのみに関連するので、純粋なドッキング工程から切り離すことができる。これは、分子コレクションについてのコンフォメーションの三次元データベースが容易に作成でき多くのドッキング研究で使用するために保存できるので正しいと判断できる（例えば触媒を用いて、エイ・スメリイ、エス・ディ・カーン、エス・エル・テイグ、「コンフォメーション範囲の分析１。範囲の検証及び評価」、Ｊ．Ｃｈｅｍ．Ｉｎｆ．Ｃｏｍｐｕｔ．Ｓｃｉ．（１９９５）、２３５巻、２８５−２９４頁、及びエイ・スメリイ、エス・ディ・カーン、エス・エル・テイグ、「コンフォメーション範囲の分析２。コンフォメーションモデルの適用」、Ｊ．Ｃｈｅｍ．Ｉｎｆ．Ｃｏｍｐｕｔ．Ｓｃｉ．（１９９５）、２３５巻、２９５−３０４頁参照）。この認識段階は該リガンドの原子群を該結合部位の「ホットスポット群」との相互作用に適合させることによりモデル化される。最終的な複合体の形成は単純なエネルギー関数を用いた勾配に基づく最適化技法を用いてモデル化される。この最終段階の間に、該リガンドの並進、向き、及び回転可能な結合は該標的分子及び溶媒を固定させたままにしながら変更できる。
【００１９】
ほとんどのドッキング方法は二つの大まかに定義された範疇、即ち、（１）オートドック（ＡｕｔｏＤｏｃｋ）（グッドフォード，ピイ・ジェイ「生物学的に重要な高分子についてエネルギー的に好ましい結合部位を決定する計算手法」，ＪｏｕｒｎａｌｏｆＭｅｄｉｃｉｎａｌＣｈｅｍｉｓｔｒｙ，１９８５，２８（７）巻，８４９−８５７頁、グッドセール，ディ・エスとエイ・ジェイ・オルソン「模擬アニーリングによるタンパク質への基質の自動ドッキング」，ＰＲＯＴＥＩＮＳ：Ｓｔｒｕｃｔｕｒｅ，ＦｕｎｃｔｉｏｎａｎｄＧｅｎｅｔｉｃｓ，１９９０，８巻，１９５−２０２頁）、ＧＯＬＤ（ジョ―ンズ，ジイら「可変的ドッキングについての一般アルゴリズムの開発及び検証」，ＪｏｕｒｎａｌｏｆＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，１９９７，２６７巻，７２７−７４８頁）、ＴＡＢＵ（ウェストヘッド，ディ・アール、ディ・イー・クラーク、及びシイ・ダブリュ・ムレイ「分子ドッキングについての発見的調査アルゴリズムの比較」，ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒ−ＡｉｄｅｄＭｏｌｅｃｕｌａｒＤｅｓｉｇｎ，１９９７，１１巻，２０９−２２８頁、及びバクスター，シイ・エイら「タブ（Ｔａｂｕ）調査を用いた可変的ドッキング及び結合親和性の実証的評価」，ＰＲＯＴＥＩＮＳ：Ｓｔｒｕｃｔｕｒｅ，Ｆｕｎｃｔｉｏｎ，ａｎｄＧｅｎｅｔｉｃｓ、１９９８、３３巻、３６７−３８２頁）、並びに補正を用いた確率的概算（ＳＡＳ）（ディラー，ディ・ジェイとシイ・エル・エム・ジェイ・ベルリンデ「分子ドッキングのための幾つかの国際的最適化アルゴリズムについての批評」，ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔａｔｉｏｎａｌＣｈｅｍｉｓｔｒｙ，１９９９，２０巻（１６），１７４０−１７５１頁）などの確立論的方法、又は（２）例えば、ＤＯＣＫ（クンツ，アイ・ディら「高分子−リガンド相互作用への幾何学的アプローチ」，ＪｏｕｒｎａｌｏｆＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，１９８２，１６１巻，２６９−２８８頁、クンツ，アイ・ディ「薬物の設計及び発見のための構造に基づく戦略」，Ｓｃｉｅｎｃｅ，１９９２，２５７巻，１０７８−１０８２頁、マキノ・エスとアイ・ディ・クンツ「自動可変的リガンドドッキング方法及びデータベース調査へのその適用」，ＪｏｕｒｎａｌｏｆＯｃｃｕｐａｔｉｏｎａｌＣｈｅｍｉｓｔｒｙ，１９９７，１８（４）巻，１８１２−１８２５頁）、ＦｌｅｘＸ（レアリー，エムら「漸進的構造アルゴリズムを用いた迅速可変的ドッキング方法」，ＪｏｕｒｎａｌｏｆＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，１９９６，２６１巻，４７０−４８９頁、レアリー，エム、ビイ・クラメール、及びティ・レンガウル「粒子の概念：タンパク質−リガンドドッキング予測の間に個別の水分子を配置する」，ＰＲＯＴＥＩＮＳ：Ｓｔｒｕｃｔｕｒｅ，Ｆｕｎｃｔｉｏｎ，ａｎｄＧｅｎｅｔｉｃｓ，１９９９，３４巻，１７−２８頁、レアリー・エム、ビイ・クラメール、及びティ・レンガウル「相互作用に基づく適応アルゴリズムを用いた疎水性リガンドのドッキング」，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，１９９９，１５（３）巻，２４３−２５０頁）、及びハンマーヘッド（ウェルチ，ダブリュ、ジェイ・ルペルト、及びエイ・エヌ・ジェイン「ハンマーヘッド：タンパク質結合部位への可変的リガンドの迅速全自動ドッキング」，Ｃｈｅｍｉｓｔｒｙ＆Ｂｉｏｌｏｇｙ，１９９６，３（６）巻，４４９−４６２頁）などのコンビナトリアル方法の一つに分類できる。
【００２０】
該確率論的方法は、しばしばより正確な結果を与える一方で、通常非常に遅いため大規模なデータベースを調査することはできない。本明細書で提示される方法はコンビナトリアル群に該当する。このアプローチは、該リガンドと受容体との相互作用を適合させようと試みる点でＦｌｅｘＸ及びハンマーヘッドに類似している。このアプローチはどのように該リガンドの可変性を処理するかという点でこれらの技法及び他の大部分のドッキング技法と著しく異なる。ほとんどの現行のコンビナトリアル・ドッキング技法は漸進的構造アプローチを用いて可変性を処理しているが、一方、本明細書に記載する技法は最初のコンフォメーション調査の後、該標的の存在下での勾配に基づく最小化を用いる。
【００２１】
一般化された技法を図２に示す。最初に、コンフォメーション調査手法２１０をライブラリー又はコレクションの全体について実施し、得られるコンフォメーションは将来使用するために保存する。次に標的分子構造２２０を用いて結合部位画像を作成する。適合手順を実施し、最初に剛体としてのリガンドの所与のコンフォメーションを結合部位２３０内に配置することにより初期複合体を形成する。最後に、柔軟な最適化が実施され、ここで該適合が剪定され次いで最適化され最終結果２４０を得る。ドッキング・アプローチの個々のこれらの工程はそれぞれ図３〜図６を参照しながら以下にもっと詳細に記載する。
【００２２】
単純だが効率的なコンフォメーション調査手法が好ましい。コンフォメーション調査はライブラリー又はコレクションの全体について一度実施し、得られるコンフォメーションは将来使用するために保存する。必要ならば、コンフォメーションの調査は定期的に反復できる。
【００２３】
図３を参照すると、一様に分布する無作為のリガンドのコンフォメーションが形成され、回転可能な結合のみが変更できる。３１０。例えば、回転可能な結合のみを変更しうる、一様に分布する１０００個の無作為コンフォメーションを形成できる。次に、個々のコンフォメーションの内部エネルギーを最小化する。ここでも回転可能な結合のみが変更できる。３２０。内部エネルギーは、例えば、ファン・デル・ワールス・ポテンシャル及び２面角項（ｄｉｈｅｄｒａｌａｎｇｌｅｔｅｒｍ）を用いて見積もることができる。参照：ディラー，ディ・ジェイとシイ・エル・エム・ジェイ・ベルリンデ「分子ドッキングのための幾つかの全体的最適化アルゴリズムについての批判的評価」，ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔａｔｉｏｎａｌＣｈｅｍｉｓｔｒｙ，１９９９，２０巻（１６），１７４０−１７５１頁。これはその全体が参照により本明細書にインコーポレートされる。個々のコンフォメーションは、例えばＢＦＧＳ（ブロイデン−フレッチャー−ゴールドファーブ−シャンノ）最適化アルゴリズムを用いて最小化できる。例えば、プレス，ダブリュ・エイチら、Ｃ言語の数的手順、第二版、１９９７、ケンブリッジ：ケンブリッジ・ユニバーシィティ・プレス、９９４（これはその全体が参照により本明細書にインコーポレートされる）を参照。
【００２４】
最低の内部エネルギーをもつコンフォメーションを上回る選択的切捨てを超える内部エネルギーをもつコンフォメーションは排除される。３３０。例えば、最低内部エネルギーをもつコンフォメーションを１５ｋｃａｌ／ｍｏｌ上回る内部エネルギーをもつコンフォメーションはいずれも排除される。残りのコンフォメーションは評点され且つ序列付けられる。３４０。この評点は、該コンフォメーション調査手法をより生物活性のありそうなコンフォメーションに集中させるためにフィルター又はバイアスを取り入れ、不活性でありそうなコンフォメーションを排除する。この文脈において、「生物活性のある」及び「活性なコンフォメーション」は、生体標的に潜在的に結合できるリガンドのコンフォメーションとして定義され、リガンドが生体標的に結合するときのリガンドの実際のコンフォメーションに類似しうる。「不活性な」及び「不活性なコンフォメーション」は、逆の意味をもち、即ち、任意の生体標的に結合する可能性が非常に低いリガンドのコンフォメーションであり、従って、リガンドが生体標的に結合するときのリガンドの実際のコンフォメーションとは異なる。この焦点は、所与の生体標的に結合したリガンドのコンフォメーションを発見することを指向する分子ドッキング、薬物団（ｐｈａｒｍａｃｏｐｈｏｒｅ）調査及び三次元ＱＳＡＲなどの方法に極めて有益であろう。なぜなら、これらは必然的に出発点としてコンフォメーション調査に依存するからである。
【００２５】
該切捨て値を上回る内部エネルギーをもつリガンドのコンフォメーションを排除した後、コンフォメーションは、不活性なコンフォメーションから潜在的に活性なコンフォメーションを識別する際の助けとなる一以上の三次元記述子／フィルターを取り入れた評点により序列づけできる。該評点は下記のように計算されうる：
評点＝歪み−［（重み係数_１×記述子_１）＋（重み係数_２×記述子_２）．．．＋（重み係数_ｎ×記述子_ｎ）］
上式中、所与の分子の所与のコンフォメーションの「歪み」は所与のコンフォメーションの内部エネルギーから最低内部エネルギーをもつ所与の分子のコンフォメーションの内部エネルギーを差し引いたものであり、ｎは用いられる記述子及び重み係数の数である。これにより、不活性なコンフォメーションは排除され、潜在的に活性なコンフォメーションが保持され次の工程で用いられる。極性溶媒接近可能表面積、無極性溶媒接近可能表面積、内部相互作用の数及び回転半径、又はそれらの組合わせなどの記述子が用いられうるが、不活性なコンフォメーションから活性なコンフォメーションを分離するために効果的に用いられうる他の記述子も存在しうる。該溶媒接近可能表面積は、原子のファン・デル・ワールス半径に適切な量（例えば１．４Å）を加算したものを用いて計算しうる。一般的に、窒素原子又は酸素原子は、水素に結合している場合又は水素結合を受入れることができる孤立電子対を有する場合、極性として取り扱われる。窒素及び酸素以外の原子は無極性として取り扱われ、水素原子は通常この計算には使用しない。内部相互作用数のＮＩは所与の分子における二つ一組の相互作用の数についての単なる計算であり、
【００２６】
【数４】

【００２７】
として定義される。上式中、この合計は１〜２及び１〜３の原子を除く原子ｉ、原子ｊの全ての対にわたるものであり、ｄ_ｉｊはｉ番目及びｊ番目の原子間の距離であり、そして
【００２８】
【数５】

【００２９】
上式中の単位は全てÅである。コンフォメーションの回転半径は
【００３０】
【数６】

【００３１】
により与えられる。上式中、合計はコンフォメーションの全ての原子にわたるものであり、該コンフォメーションはその重心が０であるように並進される。例えば、極性溶媒接近可能表面積と無極性溶媒接近可能表面積との合計である溶媒接近可能表面積（ＳＡＳＡ）は、記述子として用いることができ、該表面積項の重み係数として０．１を用いる。
評点＝歪み−０．１×ＳＡＳＡ
【００３２】
より優れたコンフォメーションの予め定められた２乗平均偏差内にあるコンフォメーションを除去する。３５０。例えば、より高い序列の（即ち、より優れた）コンフォメーションの１．０Åの２乗平均偏差内にある如何なるコンフォメーションも除去できる。このクラスター化は余剰のコンフォメーションを取除くための手段である。所望のコンフォメーションの最大数、例えば５０個のコンフォメーションがコンフォメーション分析工程の最後で保持される。３６０。
【００３３】
所望する数を上回るコンフォメーションがクラスター化後に残る場合、次に最下位に序列されたコンフォメーションを所望する数のコンフォメーションが残るまで取除くことができる。
【００３４】
標的への小分子の結合過程は水による「溶媒和」対標的分子による「溶媒和」の間の均衡である。これを心に留めて、溶媒接近可能表面積項が単純な水性溶媒和モデルとの類似で選択され得る。例えば、アイゼンバーグ，ディとエイ・ディ・マックラシアン「タンパク質の折りたたみ及び結合における溶媒和エネルギー」，Ｎａｔｕｒｅ，１９８６，３１９巻，１９９−２０３、オオイ，ティら「ペプチドの水和の熱力学パラメータの尺度としての接近可能表面積」，ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓ，１９８７，８４巻，３０８６−３０９０頁、及びバジャ，エスら「受容体−リガンド・フリーエネルギーに及ぼすコンフォメーション可変性及び溶媒和の影響」，Ｂｉｏｃｈｅｍｉｓｔｒｙ，１９９４，３３巻，１３９７７−１３９８８頁。これらの各々はその全体が参照により本明細書にインコーポレートされる。タンパク質対水の「溶媒和」における重要な相違は、水が極性の相互作用のみと競合する一方で、タンパク質が極性相互作用及び疎水性相互作用の両方と効果的に競合することである。従って、本発明の目的上、極性及び無極性の表面積は同一に取り扱われる。重み係数として０．１を選択することはいささか恣意的であるが、表面積に基づく溶媒和モデル用に選択された重みに見合っている。究極的には、より多くの溶媒接近可能表面積をもつコンフォメーションは、標的とより広範囲に相互作用することができ、したがって若干高い歪みであり依然強固に結合し得る。より洗練された序列システムが本発明で用いられ得るであろうが、コンフォメーションを序列付けすることへのこのアプローチは妥当なコンフォメーションを供給する。
【００３５】
上記結合部位画像は無極性のホットスポット（即ち、無極性原子が結合するのに好都合な結合部位の点）の一覧表、並びに極性のホットスポット（即ち、水素結合の供与体又は受容体が結合するのに好都合な結合部位の点）の一覧表を含む。これらの二つの一覧表を作成する一つの手法を図４に示す。最初に、該結合部位を見出すために、グリッドが該結合部位の周辺に配置される。４１０。一例として、該グリッドは各方向に少なくとも５Åの余分な空間をつけた少なくとも２０Å×２０Å×２０Åでありうる。０．２Åの間隔が該グリッドのために使用できる。次に、「ホットスポットの調査容量」が決定される。４２０。これは該標的分子内部で任意のグリッド点を排除することにより達成される。例えば、該標的分子に接触しない６．０Å以上の球体に含まれる任意の点も排除できる。残存する最大の連結片が「ホットスポットの調査容量」となる。
【００３６】
次いで、ホットスポットを該ホットスポット調査容量のグリッド様調査を用いて決定できる。４３０。一例として、グリッド様調査は、グッドフォード，ピイ・ジェイ「生物学的に重要な高分子についてエネルギー的に好ましい結合部位を決定する計算手法」，ＪｏｕｒｎａｌｏｆＭｅｄｉｃｉｎａｌＣｈｅｍｉｓｔｒｙ，１９８５，２８（７）巻、８４９−８５７頁に記載されている。これはその全体が参照により本明細書にインコーポレートされる。無極性のホットスポットを見出すために、無極性のプローブが該ホットスポット調査容量の各グリッド点に配置され、該プローブの評点が計算され保存される。このプロセスは極性のホットスポットについて繰り返す。ホットスポットの各タイプについて、該グリッド点がクラスター化され、所望する数の最上位クラスターのグリッド点が保持され得る。４４０。例えば、トップ３０のクラスターのグリッド点が保持される。
【００３７】
図５を参照すると、最初に剛体としてリガンドの所与のコンフォメーションを結合部位内に配置するため、リガンドの原子群が適切なホットスポットに適合する。５１０。より正確には、一例において、若し下記の条件が満たされるならば、三個の原子Ａ_１、Ａ_２、Ａ_３は三個のホットスポットＨ_１、Ｈ_２、Ｈ_３に適合すると考えられる。
ｉＡ_ｊの型はｊ＝１、２、３のそれぞれについてＨ_ｊの型に適合する。即ち、無極性のホットスポットは無極性原子に適合し、極性のホットスポットは極性原子に適合する。
ｉｉｊ，ｋ＝１、２、３の全てについてＤ（Ａ_ｊ，Ａ_ｋ）＝Ｄ（Ｈ_ｊ，Ｈ_ｋ）±δ。上式中、Ｄ（Ａ_ｊ，Ａ_ｋ）及びＤ（Ｈ_ｊ，Ｈ_ｋ）はそれぞれＡ_ｊからＡ_ｋへの距離及びＨ_ｊからＨ_ｋへの距離であり、δは例えば０．２５Åから０．５Åまでの多少許容できる誤差量である。
【００３８】
言い換えると、適合は、一例において、三つのホットスポットが三角形（ｔｒｉａｎｇｌｅ）を形成し該リガンドの三原子が実質的な三角適合（ｔｒｉａｎｇｌｅｍａｔｃｈ）を形成する場合に生じる。即ち、適合は、各三角形の頂点が同型であり且つ対応する辺が同じ長さである三角形が十分に類似する場合に生ずる。適合アルゴリズムは所与のコンフォメーションの原子と該ホットスポットとの間にあるあらゆる適合を見出す。次に、個々の適合が独自の剛体の変換を決定する。次いで、該剛体変換を該結合部位内へ該コンフォメーションを持ち込み初期の標的分子−リガンド複合体を形成するために使用する。
【００３９】
工程５２０において、個々の適合は、
【００４０】
【数７】

【００４１】
上式を最小にする独自の剛体変換を決定する。上式中、Ｒは例えば３ｘ３回転マトリクスであり、Ｔは並進ベクトルである。この場合もやはり、剛体変換は、一例において、３ｘ３回転マトリクスのＲ及び並進ベクトルのＴを含み、その結果、点Ｘ（該コンフォメーションの一つの原子の位置）はＲＸ＋Ｔにより変換される。次に、分析で決定され得る個々の剛体変換を用いて該リガンドのコンフォメーションを該結合部位内に配置する。５３０。該計算のこの側面については、全ての適合を見出すため幾つかのアルゴリズムが試験された。ＦｌｅｘＸ用に開発されたジオメトリックハッシングアルゴリズム（レアリー，エム、エス・ヴェルフィング及びティ・レンガウル「タンパク質の活性部位への中型の分子断片の配置」，ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒ−ＡｉｄｅｄＭｏｌｅｃｕｌａｒＤｅｓｉｇｎ，１９９６，１０巻，４１−５４頁を参照。これはその全体が参照により本明細書にインコーポレートされる。）が最も効率的であることが証明された。
【００４２】
一つのリガンドのコンフォメーションはホットスポットに結合する１０，０００個までの適合を生じ得る。効率性のために、大半のこれらの適合は最適化され得ない。従って、剪定／評点の戦略が望ましい。図６はこのような一つの戦略を図示する。
【００４３】
図６を参照すると、最初に、予め定められた百分率（例えば１０％）を超えるリガンド原子が立体衝突するような適合の全てが排除される。６１０。残りの適合は以下に記載される原子二つ一組の評点、例えば１．０の原子評点切捨てを用いて序列付けされる。６２０。切捨ての使用は、ほとんど立体衝突がなく最終ラウンドまで生き残るような適合を十分合理的にフィットさせる。ここで１．０の選択は単に例示であるに過ぎない。序列付けされた後、該適合をクラスター化し、最上位のＮ個の適合が選別され最終工程へ移される。６３０。ここでＮは例えば２５〜１００の範囲の数を含みうる。
【００４４】
残りの適合はそれぞれ、単純な原子二つ一組の評点を用いるＢＦＧＳ最適化アルゴリズムを用いて最適化される。６４０。一実施態様において、該評点は区分的線形ポテンシャル（ＰｉｅｃｅｗｉｓｅＬｉｎｅａｒＰｏｔｅｎｔｉａｌ）（ゲールハール，ディ・ケイら「ＨＩＶ−１プロテアーゼによるＡＧ−１３４３阻害剤の分子認識：進化的プログラミングによるコンフォメーション的に柔軟なドッキング」，Ｃｈｅｍｉｓｔｒｙ＆Ｂｉｏｌｏｇｙ，１９９５，２巻，３１７−３２４頁参照。これはその全体が参照により本明細書にインコーポレートされる。）後にモデル化でき、相違は本明細書で用いられる評点が微分可能である（ｄｉｆｆｅｒｅｎｔｉａｂｌｅ）ことが好ましいことである。この評点の場合、全ての水素は無視され、全ての非水素原子は四つの範疇の一つに分類される：
ｉ無極性−水素結合を形成できない原子全て。
ｉｉ受容体−水素結合の受容体として作用し得るが供与体として作用し得ない任意の原子。
ｉｉｉ供与体−水素結合の供与体として作用し得るが受容体として作用し得ない任意の原子。
ｉｖ供与体／受容体−水素結合の供与体及び受容体の両方として作用し得る任意の原子。
【００４５】
二つの原子の間の評点は水素結合ポテンシャル又は立体ポテンシャルのいずれかを用いて計算する。図７に示されるこの二つのポテンシャルは数式の形式を有する。
【００４６】
【数８】

【００４７】
上式中、Ｒ_ｍｉｎは最小評点の位置であり、εは該最小値の深度（ｄｅｐｔｈ）であり、σは軟化因子（ｓｏｆｔｅｎｉｎｇｆａｃｔｏｒ）であり、そしてφ（ｒ：ｒ_１，ｒ_０）はｒ＜ｒ_１，φ＝１及びｒ＞ｒ_０，φ＝０の場合にその性質を有するｒ（原子対間の距離）の微分可能な切捨て関数である。立体的及び水素結合に対する各ポテンシャルにはそれ自体のパラメータを割り当てる。これらのポテンシャルについてのパラメータは直観及びその後の試験を通して当業者により選択され得るが、これらは完全に最適化される必要はない。表１は二つ一組のポテンシャルについての実例パラメータを含む。
【００４８】
【表１】

【００４９】
これらのポテンシャルは二つの相違点を除いて多くの力場で用いられる１２−６ファン・デル・ワールス・ポテンシャルに非常に類似している。第一に、軟化因子であるσは典型的な１２−６ファン・デル・ワールス・ポテンシャルより明確に弱いポテンシャルを生じる（図７を参照）。即ち、ドッキング実行時によくある穏やかな立体衝突はこのポテンシャルにより許容される。心の中では、該軟化因子は、重要であり得る標的分子の小さな誘導適合効果を暗にモデル化したものであり（ムレ−，シイ・ダブリュ、シイ・エイ・バクスター、及びディ・フレンケル「分子ドッキングの結果の誘導適合効果への感受性：トロンビン、サーモリシン及びノイラミニダーゼへの適用」，ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒ−ＡｉｄｅｄＭｏｌｅｃｕｌａｒＤｅｓｉｇｎ，１９９９，１２巻，５４７−５６２頁。これはその全体が参照により本明細書にインコーポレートされる）、そして実際に、該ポテンシャルを誤差に対し遙かに寛容にさせる。第二の相違点は該切捨て関数である。この関数は該ポテンシャルが通常５．０Åから６．０Åの有限距離を超えたゼロであることを保証する。該標的分子の原子群のある構成と共に該関数は該評点の直接計算を顕著に高速化する。
【００５０】
直接的に並びに予め計算されたグリッドによっての両方で該評点を計算することが試みられた。該グリッドを用いる利点は該評点が非常に迅速に計算され得ることである。グリッドは直接的な計算より５〜１０倍早いことが見出された。該直接的な計算の利点は、標的分子の可変性及び溶媒の移動性などの効果がより容易に適応され得ることである。該グリッドの使用がドッキング結果の性質にいかなる劣化も惹起するように見えないので且つ目下標的分子の可変性又は溶媒の移動性が含まれないので、後文で提示される結果については、該評点は予め計算されたグリッドによって計算された。ＢＦＧＳ最適化アルゴリズムの目的上、回転可能な結合に関するものを含む全ての派生物が分析的に計算された（ハウグ，イー・ジェイとエム・ケイ・マッククロフ「機械動力への変動性−ベクトル計算アプローチ」，ＪｏｕｒｎａｌｏｆＭｅｃｈａｎｉｓｍｓ，Ｔｒａｎｓｍｉｓｓｉｏｎｓ，ａｎｄＡｕｔｏｍａｔｉｏｎｉｎＤｅｓｉｇｎ，１９８６，１０８巻，２５−３０頁を参照。これはその全体が参照により本明細書にインコーポレートされる）。
【００５１】
該ドッキング手法を試験するために、ＧＯＬＤ試験セットが用いられた（ジョーンズ，ジイら「可変的ドッキングについての一般アルゴリズムの開発及び検証」、ＪｏｕｒｎａｌｏｆＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，１９９７，２６７巻，７２７−７４８頁を参照。これはその全体が参照により本明細書にインコーポレートされる）。共有結合したいずれのリガンドも又は金属イオンに結合したいずれのリガンドも、現在、本明細書に記載される評点関数によりモデル化できないので、取除かれた。更に、いずれの「表面糖類」も遭遇する問題に典型的ではないので取除かれた。これにより全部で１０３の事例が残った（下記の表２を参照）。該試験事例の更なる個々の処理は実施しなかった（「タンパク質データバンク」（ＰＤＢ）は標的分子構造が収納されたデータベースであることに留意せよ。この「ＰＤＢコード」は所与の構造を該ＰＤＢから見付け出し抽出することを可能とする四文字コードである）。
【００５２】
【表２】

【００５３】
【表２−１】

【００５４】
【表２−２】

【００５５】
予想されるように、該結合コンフォメーション（Ｘ＝ｒａｙ）と最も綿密に計算して作成されたコンフォメーションとの間の２乗平均偏差は回転可能な結合数が増加すると増加する。五つの事例を除く全てにおいて、少なくとも一つのコンフォメーションが該結合コンフォメーションの１．５Åの２乗平均偏差を用いたコンフォメーション調査により作成された。該コンフォメーション調査結果の最も興味深い側面は、幾つかのより硬いリガンドについて最小２乗平均偏差が大きかったことである。例えば、５未満の回転可能な結合をもつ幾つかのリガンドがあるが最小２乗平均偏差は１．０Åに近い。これは二つの理由から起こる。第一に全事例で１．０Åのクラスター化半径が用いられた。これにより、小さなリガンドのコンフォメーション空間が十分にサンプリングされなかった。しかしながら、分子サイズに依存するクラスター化半径はこの特定の問題を緩和するために用いることができるであろう。第二の問題は二つのｓｐ^２原子間の結合が常に共役するものとして扱われたことである。従って、この型の結合に遭遇する場合はいつでも平面的であるよう強く拘束される。二つのｓｐ^２原子間の結合がしばしば共役するものの、これは明らかに過度な簡略化である。これは本発明にしたがって二つのｓｐ^２原子間の２面角を平面から外れさせることにより対処されうる。この偏差は次いで共役の程度に応じてペナルティーを課せられ得る。このペナルティーはｓｐ^２原子の型に基づいて大まかに選択されうる（エス・エル・マヨ、ビイ・ディ・オラフソン＆ダブリュ・エイ・ゴッダード「ドリーディング（ＤＲＩＥＤＩＮＧ）：分子シミュレーションについての一般的力場」，Ｊ．Ｐｈｙｓ．Ｃｈｅｍ．，１９９０，９４巻，８８９７頁を参照）。
【００５６】
ドッキング実行について、二つの異なる組のパラメータ、即ち一つは高品質のドッキングのためのもので一つは迅速な調査のためのもの、が試験され該ドッキング実行の品質及び速度に及ぼすそれらの効果を調べた。二組のパラメータ間の重要な差異は適合寛容性及び数及びＢＦＧＳ最適化実行の長さである。該適合寛容性は高品質の０．５オングストロームから迅速な調査の０．２５Åの範囲にわたる。該寛容性が大きくなるほど見出される適合も多くなることに留意せよ。従って、より大きな寛容性はより綿密な調査を意味する一方、より小さな寛容性はそれほど綿密でないがより迅速な調査を意味する。迅速な調査では２０工程について１つのリガンドにつき２５個の適合が最適化されたのと比べて、高品質の実行では１００工程について１つのリガンドにつき最大１００個の適合が最適化された。
【００５７】
第一の問題は所与の２乗平均偏差の切捨て間に少なくとも一つのドッキング位置を生じることである。ここで、結晶学的に観察されたＸÅ内のリガンドの位置にドッキングされたリガンドはＸÅヒット（ｈｉｔ）と称される用語を採用する。２乗平均偏差は高品質の実行について表１に示す。高品質の実行について、１０３事例のうち８９事例が少なくとも一つの２．０Åヒットを生じる。この数は１．５Åで８０、１．０Åで６３及び０．５Åで２６に減少する。迅速な調査については、１０３事例のうち７５事例が２．０Åのヒットを生じ、６５事例が１．５Åのヒットを生じ、４２事例が１．０Åのヒットを生じ並びに１６事例が０．５Åのヒットを生じる。両事例において、これらの数はゴールド試験セット又は類似の試験セットに基づいて試験された他のドッキング・パッケージから得られる同様な統計値と比べて優れている（ジョ―ンズ，ジイら「可変的ドッキングについての一般アルゴリズムの開発及び検証」，ＪｏｕｒｎａｌｏｆＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，１９９７，２６７巻，７２７−７４８頁、バクスター，シイ・エイら「タブ（Ｔａｂｕ）調査を用いた可変的ドッキング及び結合親和性の実証的評価」，ＰＲＯＴＥＩＮＳ：Ｓｔｒｕｃｔｕｒｅ，Ｆｕｎｃｔｉｏｎ，ａｎｄＧｅｎｅｔｉｃｓ，１９９８，１９９８巻，３６７−３８２頁、レアリー，エム、ビイ・クラメール、及びティ・レンガウル「粒子の概念：タンパク質−リガンドドッキング予測の間に個別の水分子を配置する」，ＰＲＯＴＥＩＮＳ：Ｓｔｒｕｃｔｕｒｅ，Ｆｕｎｃｔｉｏｎ，ａｎｄＧｅｎｅｔｉｃｓ，１９９９，３４巻，１７−２８頁、レアリー・エム、ビイ・クラメール、及びティ・レンガウル「相互作用に基づく適応アルゴリズムを用いた疎水性リガンドドッキング」，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，１９９９，１５（３）巻，２４３−２５０頁、並びにクラメール，ビイ、エム・レアリー及びティ・レンガウル「タンパク質−リガンド・ドッキングについてのＦｌｅｘＸ漸進的構造アルゴリズムの評価」，ＰＲＯＴＥＩＮＳ：Ｓｔｒｕｃｔｕｒｅ，ＦｕｎｃｔｉｏｎａｎｄＧｅｎｅｔｉｃｓ，１９９９，３７巻，２２８−２４１頁を参照）。
【００５８】
第二の問題は、ドッキングされた化合物を正確に序列付けすることである。即ち、最上位に序列付けされたコンフォメーションが結晶学的に観察された該リガンドの位置に合理的に近接しているかである。これは第一の問題より極めて難解な問題である。高品質の実行についての最上位評点のドッキング位置と観察位置との２乗平均偏差は表１に示す。この事例において、二組のパラメータ間にほとんど差異はない。高品質の実行について、１０３事例のうち４８事例が最上位評点のドッキング位置として２．０Åヒットを生じる。この数は１．５Åで４１、１．０ Åで３４及び０．５Åで１０に減少する。迅速な調査については、１０３事例のうち４５事例が最上位評点のドッキング位置として２．０Åヒットを生じ、１．５ Åで４１、１．０Åで３４及び０．５Åで１０である。
【００５９】
この研究で用いた評点関数の有用性は、ドッキングされたコンフォメーションを絶対的に序列付けするための手段としてよりもごく少数のドッキングされたコンフォメーションを選別するための初期フィルタとして存在する。大半の良いドッキング位置、即ち低い２乗平均偏差はこの１０％の切捨てに生き残る。しかしながら、大半のドッキング位置は生き残らない。高品質の実行については、平均して７４の位置が見出されるが、該１０％の切捨て後、平均して僅か８つしか残らない。迅速な調査については、平均して２１近くの位置が見出されるが、該切捨て後に平均して僅か５つしか残らない。この時点で該１０％の評点切捨てを生き残るドッキング位置は、更に最適化され、視覚的にスクリーニングされ、又はより正確ではあるが効率的でない評点関数を通過しうるであろう。
【００６０】
高品質の実行では、一試験事例当たりの平均ＣＰＵ時間（例えばシリコン・グラフィックス社（ＳＧＩ）のコンピュータＲ１２０００を用いて）は約４．５秒である。この速度で、１ＣＰＵで百万個の化合物をスクリーニングするとおよそ５０日かかるであろう。迅速な調査では、一試験事例当たりの平均ＣＰＵ時間は一試験事例当たり約１．１秒に減少する。この速度で、１ＣＰＵで百万個の化合物をスクリーニングするとおよそ１２日かかるであろう。データベース・ドッキングは極めて並列的な仕事であり、複数のＣＰＵが妥当な時間量（例えば一日くらい）まで容易にこれを削減しうるであろう。
【００６１】
この節では、小分子をドッキングさせることへの本明細書に記載のアプローチの長所を証明するために二三のの成功事例が示される。これらの事例全てにおいて、示される結果は並の品質のドッキングの実行から得られる。第一の事例はＰＤＢエントリー３ｔｐｉ（マークアート，エムら「トリプシン、トリプシノーゲン及び阻害剤とのその複合体における反応性部位及びペプチド群の幾何学」，ＡｃｔａＣｒｙｓｔａｌｌｏｇｒａｐｈｉｃａ，１９８３，Ｂ３９巻，４８０頁を参照。これはその全体が参照により本明細書にインコーポレートされる。）からのジペプチドのＩｌｅ−Ｖａｌである。この事例は明瞭なアンカー断片がなく、その結果、ドッキングへの漸進的構築アプローチはこのリガンドでは難儀するであろう。本発明者らのコンフォメーション調査手法は観察されたコンフォメーションの０．４２ Å内でコンフォメーションを作成した。最高評点のドッキング位置と観察位置との２乗平均偏差は０．５３Åである。
【００６２】
第二の例は１５個の回転可能な結合を有するリガンドでありはるかに難しい例である。これは該ＰＤＢエントリーｌｉｄａ（トング，エルら「ヒドロキシエチルアミン・ジペプチド・アイソスターを含む阻害剤との複合体におけるＨＩＶ−２プロテアーゼの結晶構造」，Ｓｔｒｕｃｔｕｒｅ，１９９５，３（１）巻，３３−４０頁を参照。これはその全体が参照により本明細書にインコーポレートされる。）からのＨＩＶプロテアーゼ阻害剤である。この事例において、該コンフォメーション調査手法は該結合したコンフォメーションから０．９６ Åの２乗平均偏差のコンフォメーションを作成できた。最上位評点のドッキング位置についての２乗平均偏差は１．３８Åである。実際に、最上位の１３点のドッキング位置は全て該観察位置の２．０Å内にあり最も近かったのはほぼ１．３２Åであった。
【００６３】
最後の事例は該ＰＤＢエントリー４ｐｈｖ（ボーネ，アールら「Ｌ−７００，４１７によるＨＩＶプロテアーゼ複合体のＸ線結晶構造、擬似Ｃ２対称性を備えた阻害剤」，ＪｏｕｒｎａｌｏｆｔｈｅＡｍｅｒｉｃａｎＣｈｅｍｉｃａｌＳｏｃｉｅｔｙ，１９９１，１１３（２４）巻，９３８２−９３８４頁を参照。これはその全体が参照により本明細書にインコーポレートされる。）からのＨＩＶプロテアーゼ阻害剤である。この事例のリガンドは１２個の回転可能な結合を有する。これは明らかに該リガンドの最終可変的勾配最適化工程（ｆｉｎａｌｆｌｅｘｉｂｌｅｇｒａｄｉｅｎｔｏｐｔｉｍｉｚａｔｉｏｎｓｔｅｐ）を含める値打ちを証明している。該コンフォメーション調査手法から作成された最も近いコンフォメーションは結晶学的に観察されたコンフォメーションから１．３２Åである。最高評点のドッキング位置は該観察位置に最も近く、０．３８Åの２乗平均偏差である。可変的な最適化無しに得ることのできた最小の２乗平均偏差は該コンフォメーション調査手法により作成された最も近いコンフォメーションの２乗平均偏差であり、即ち１．３２Åである。従って、この事例において、該可変的な最適化は少なくとも１．０Åまで該最終２乗平均偏差を下げた。
【００６４】
ドッキングのシミュレーションが失敗する場合、該評点は失敗した、即ち該評点関数の全体的最小値は結晶学的に決定されたリガンドの位置に対応しなかった、としばしば推測される。ドッキングの問題は多数の自由度を含むので、多くの事例で該失敗は不十分な調査に帰することができると考えるのが妥当である。本明細書に記載の手法が不完全に実施される場合の失敗の原因を同定することがこの節の目的である。
【００６５】
評点の失敗又は調査の失敗のいずれかとしてのドッキングの失敗を分類するために、該リガンドは標的分子に結合したものとしてＢＦＧＳ最適化を実施した。得られる評点が該ドッキング実行から見出される最良の評点より有意に小さかった場合、その失敗は調査の失敗として分類される。他の失敗はいずれも評点の失敗として分類される。
【００６６】
圧倒的多数の事例が中程度の評点誤差と認定され、即ち該全体的最小値は該リガンドの結晶学的な位置に対応していないようである、しかし該全体的最小値と該リガンドの結晶学的な位置に近い最良評点の間の差の百分率は１０％に満たない。これらの事例において、該評点のどの側面が失敗しているのかを決定することは難しいが、これらの事例の多くが水素結合の条件又は溶媒和モデルに基づいた角度の拘束などの幾つかをより詳細に該評点関数に含めるだけで訂正できると考えるのが妥当である。しかしながら、深刻な評点誤差のある事例が少数存在する。これらの事例は該評点の弱点及び標的分子／リガンド相互作用の複雑性への何らかの洞察を提供する。
【００６７】
１ｇｌｑ（ガルシア−サエズ，アイら「Ｓ−（ｐ−ニトロベンジル）グルタチオン及び他の阻害剤と複合体形成したマウス肝臓πクラスのグルタチオンＳトランスフェラーゼの１．８Åでの分子構造」，ＪｏｕｒｎａｌｏｆＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，１９９４，２３７巻，２９８−３１４頁を参照）の事例はこの研究で用いた評点の主要な弱点−水素結合の様式を指摘した。これは極性のリガンドである。このリガンドについての最上位の位置は、多数の「感知された」水素結合が存在するため、おおむね非常によく得点する。実際には、該相互作用の角度依存が乏しいため、これらの水素結合は極めて弱い。さらに、Ｘ線配置の硫黄原子はチロシンのＯＨから水素結合を受容しており、カルボン酸はリシンとの塩橋に関与する。これらの相互作用はいずれも本明細書に記載される評点機能により認識されなかった。
【００６８】
ｌｉｖｅ（ジェドルゼジャス，エム・ジェイら、「インフルエンザ・ウイルス・ノイラミニダーゼの芳香阻害剤の構造」、Ｂｉｏｃｈｅｍｉｓｔｒｙ、１９９５、３４巻、３１４４−３１５１頁を参照）の事例において、正しい位置は観察されるコンフォメーションの推定歪みによりおおむね比較的低い評点を受取る。該ドッキング手法は共役されるものとしてのある種の結合を認識する。従って、これらの結合が平面的でない場合厳しいペナルティーが適用される。観察されるコンフォメーションにおいて、該２面角は全て平面から８０度近い。これらの２面角が余儀なく０°近くになる場合、該コンフォメーションは該リガンドと該標的分子との観察される相互作用にもはや適合しない。いかなるドッキング・アルゴリズムも該２面角についてのこれらの値を予測することは困難であろう。
【００６９】
ＨＩＶプロテアーゼ阻害剤である１ｈｅｆ（ムルチー，ケイ・エイチ・エムら、「ヒト免疫不全ウイルス１型プロテアーゼに結合するヒドロキシエチレン系阻害剤の２．２−Ａ解像度での結晶構造は該阻害剤が二つの異なる配向性で存在することを示す」、ＪｏｕｒｎａｌｏｆＢｉｏｌｏｇｉｃａｌＣｈｅｍｉｓｔｒｙ、１９９２、２６７巻、２２７７０−２２７７８を参照）の事例は、おそらく深刻な評点誤差の全てに最も関与している。該結合ポケットは二量体の界面にあり、該標的単量体は結晶学的対称操作の間に関係する。該リガンドのＣ末端では、メチル基は２．０Å内にある。これらの相互作用は予測することが極めて難しい。本発明者らのプログラムは該リガンドのＣ末端についての興味深い代替コンフォメーションと対等になった。このコンフォメーションは内部及び外部の立体的衝突をともに排除し標的分子との更なる水素結合を形成する。
【００７０】
コンフォメーション調査の失敗として分類された二つの事例、即ち１ｈｅｆと１ｐｏｃがある。これらの事例において、作成される最良のコンフォメーションはそれぞれ２．１Å及び２．３Åである。１ｐｏｃ事例のリガンドは２３個の回転可能な結合を有するため、僅か５０個のコンフォーマー（ｃｏｎｆｏｒｍｅｒ）でそのコンフォメーション空間を十分に網羅することは非常に難しい。一方、１ｈｅｆ事例のリガンドも非常に可変的（１８個の回転可能な結合）であり、上述したように、観察されるコンフォメーションも深刻な立体的衝突を有する。従って、予想されるように、これはどのコンフォメーション調査手法にとっても非常に困難な挑戦である。
【００７１】
本出願において、標的分子の結合部位内へ可変的リガンドをドッキングさせるための新規で且つ迅速な技法が提示される。この方法は、該リガンドについての予め作成された一組のコンフォメーション並びに該標的分子の結合部位におけるリガンドの最終可変性勾配（ｆｉｎａｌｆｌｅｘｉｂｌｅｇｒａｄｉｅｎｔ）に基づく最適化に基づいている。その結果に基づけば、これはリガンド可変性を取り扱うためのエラーに強いアプローチである。比較的少ないコンフォメーション（１分子当たり５０未満）を用いて、通常、結合コンフォメーションの１．５Å以内のコンフォメーションを作成できる。最終工程として該可変的な最適化を適用することにより、高品質の最終ドッキング位置を維持しながら必要とされるコンフォメーションの数を減少させうる。
【００７２】
例示されたドッキング技法を改良するための機会がある。このような改良も本発明の範囲内におさまる。例えば、適合体の作成は、かなり上出来である場合、比較的固定した小分子と可変的な大分子とは異なって扱うべきである。非常に大きな可変的分子のコンフォメーション空間は広すぎて完全に調査できないため、モンテカルロ調査アルゴリズムが用いられる。その上、該コンフォメーションを序列付けるために用いられる評点は確実に単純化し改良され得る。例えば、溶媒和モデルの変形（アイゼンバーグ，ディとエイ・ディ・マックラシアン、「タンパク質の折りたたみ及び結合における溶媒和エネルギー」、Ｎａｔｕｒｅ，１９８６，３１９巻、１９９−２０３、スティル，ダブリュ・シイら、「分子の力学及び動力学に関する溶媒和の半分析学的処理」、ＪｏｕｒｎａｌｏｆｔｈｅＡｍｅｒｉｃａｎＣｈｅｍｉｃａｌＳｏｃｉｅｔｙ，１９９０、１１２巻，６１２７−６１２９頁を参照。これらは両方ともそれらの全体が参照により本明細書にインコーポレートされる。）はおそらくより良いコンフォメーションを与えるであろう。最後に、歪みのより優れた処理、とりわけ二つのｓｐ^２原子間の間の結合の周りの回転についての歪みの処理が改良された結果を産むかも知れない。
【００７３】
例示される実施態様において、極性のホットスポットを見出すために用いるアルゴリズムは結合部位に埋もれたホットスポットではなく任意の水素結合の供与体及び受容体を見出す傾向がある。該ホットスポット調査ルーチンの改良は該技法の品質を高めるだけでなく、必要なホットスポットの数も減少させるので、該技法をより効率的にする。ＧＲＩＤ（グッドフォード，ピイ・ジェイ、「生物学的に重要な高分子についてエネルギー的に好ましい結合部位を決定する計算手法」，ＪｏｕｒｎａｌｏｆＭｅｄｉｃｉｎａｌＣｈｅｍｉｓｔｒｙ，１９８５，２８（７）巻，８４９−８５７頁、スティル，ダブリュ・シイら，「分子の力学及び動力学に関する溶媒和の半分析学的処理」，ＪｏｕｒｎａｌｏｆｔｈｅＡｍｅｒｉｃａｎＣｈｅｍｉｃａｌＳｏｃｉｅｔｙ，１９９０，１１２巻，６１２７−６１２９頁を参照。これらは両方ともそれらの全体が参照により本明細書にインコーポレートされる。）又はＬＵＤＩ結合部位の記述（ボーム，エイチ・ジェイ，「ＬＵＤＩ：酵素阻害剤誘導（ｌｅａｄ）についての規則に基づく新規な置換基の自動設計」，ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒ−ＡｉｄｅｄＭｏｌｅｃｕｌａｒＤｅｓｉｇｎ，１９９２，６巻，６９３−６０６頁を参照。これはその全体が参照により本明細書にインコーポレートされる。）又は文書化された方法（ミルズ，ジェイ・イー・ジェイ、ティ・ディ・ジェイ・パーキンス、及びピイ・エム・ディーン，「結合部位における水素結合原子の位置を予測する自動方法」，ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒ−ＡｉｄｅｄＭｏｌｅｃｕｌａｒＤｅｓｉｇｎｓ，１９９７，１１巻，２２９−２４２頁を参照。これはその全体が参照により本明細書にインコーポレートされる。）などの幾つかの利用できるプログラムがおそらくある種の改良を示すであろう。更に、該極性のホットスポットを供与体、受容体、イオンなどに区分すると、ホットスポットは該結果を改良しうる。最後に、実用化において、大半の利用者は該画像を強調するためにいくらかの時間を費やすことを厭わないであろう。即ち、手動で劣悪なホットスポットを排除し、必要ならばホットスポットを追加する。実際に、これはドッキングの実行を有意に改良するであろう。
【００７４】
全てのドッキング・プログラムにおいて、良い評点は効率的で誤差に寛容であり且つ正確であるべきである。本明細書で用いられる評点は初めの二つの性質を満足する。これらの二つの性質は、しかしながら、三番目の性質と通常両立できない。より正確な評点が適用され得た後にこの評点は初期スクリーニングとしてなお有用であるように見える。水素結合の項についての立体的拘束、イオン相互作用や溶媒和効果の認識、並びに金属を取り扱う項が正確性を改良するために導入され得る。
【００７５】
それにもかかわらず、結晶構造が利用できる場合、分子ドッキングへの本発明のアプローチはライブラリーのスクリーニングの優先順位決定に有用である。相同性モデルなどのより低い品質の構造情報でさえ、本明細書に記載の技法はなお有用な情報を提供する。
【００７６】
個々のリガンドが該標的にドッキングされた後、ドッキング結果は分析を容易にするためクラスター化手法を用いて体系化される。この手法において、複数のクラスターが形成され、これらの各々は該標的分子に関する該リガンドの位置の類似のものの群から構成される。単結合クラスター化アルゴリズム（ｓｉｎｇｌｅｌｉｎｋａｇｅｃｌｕｓｔｅｒｉｎｇａｌｇｏｒｉｔｈｍ）は、クラスター化測定基準（ｃｌｕｓｔｅｒｉｎｇｍｅｔｒｉｃ）としてリガンドの位置の対の間の２乗平均偏差とともに用いられうる。該リガンドのコア間の２乗平均偏差がある所定の数（典型的には０．２５Åから０．５Å）未満である場合の位置の対は同じクラスターに入る。代替のクラスター化アルゴリズムも用いられうる。単結合クラスター化はその単純性の故に特定の事例において有利でありうる。最上位クラスターにあるライブラリーの化合物の相対数は該標的分子に対する該ライブラリーの相補性の尺度であり該ライブラリーを序列付けするために用いられる。
【００７７】
一つの実施態様において、該リガンドの位置は図式解法を用いてクラスター化される。Ｎ個の化合物を含むライブラリーについて、該クラスター化手法はＮ（Ｎ−１）／２の２乗平均偏差の計算を必要とする。１化合物につき１ポーズ（ｐｏｓｅ）をもつ一万個のメンバーのライブラリーでは、５万個の２乗平均偏差の計算が必要とされる。この数は下記の考慮により実際には大幅に低減できる。２ポーズのコアの重心間の距離が所定の切捨てより大きいならば、該２コア間の２乗平均偏差は該２乗平均偏差の切捨てより必然的に大きい。従って、三次元の容量をより小さな容量単位への細分割を規定するグリッドが該標的分子の結合部位周辺に配置される。該ポーズの個々の重心が計算され特定のグリッド立方体と関係付けられる。２乗平均偏差は近くの立方体の位置の間でのみ計算される。実際には、これは１０〜１００の係数まで計算数を減らす。
【００７８】
ライブラリーの優先順位決定問題に取り組むためにドッキング・アプローチを用いる場合の一つの潜在的な難題は陽性と誤ることである。この問題は実例を通して最もよく説明される。我々が二つのコンビナトリアル・ライブラリー（Ａ及びＢ）を有し、そのそれぞれが１０，０００個の化合物を含むと仮定する。ある標的に対して、Ａライブラリーは活性化合物を含まないが、Ｂライブラリーは２５個の活性化合物を含むと仮定する。最後に、我々は操作時間の９５％まで化合物を（活性又は不活性と）正しく分類するために十分正確なドッキング手法を有すると仮定する。その場合、我々はＡライブラリーから平均で５００±２２のヒットを見出し、一方Ｂライブラリーについては我々は平均で５２４±２２のヒットを見出すであろう。こうして、この非常に正確なドッキング手法を用いた場合でさえ、Ｂライブラリーより活性なものとしてＡライブラリーを分類する可能性が依然かなりあるであろう。さらに、９５％正確なドッキング方法は無い。また、一つのコンビナトリアル・ライブラリーにおける化合物の間に明確な構造的類似性があり、従って活性化合物を含むライブラリーは該ライブラリーの活性化合物に類似したかなりの数の化合物を含むことになる。活性化合物に類似したこれらの化合物はどの計算手法によっても誤って陽性として見出される可能性が高い。
【００７９】
この効果は再び実例によって最も良く説明される。標的の結合部位がＰ１、Ｐ２及びＰ３の三つのポケットを有し且つライブラリーのコアがＲ１、Ｒ２及びＲ３という置換のための位置を有すると仮定する（図９参照）。更にそれぞれの位置で合計２７０００個の化合物に対して３０個の異なるシントンが存在すると仮定する。最後に、このライブラリーから得られる化合物は、Ｒ１で三つのシントンのうち一つを有し、Ｒ２で三つのシントンのうち一つを有し且つＲ３で三つのシントンのうち一つを有する場合に活性でありそしてその場合にのみ活性であり、このライブラリーに２７個の活性化合物を与えると仮定する。これらの２７個の活性化合物がうまくドッキングされ良い評点を受ける場合でさえ、これら２７個の活性化合物の評点が、このライブラリーを不活性なライブラリーから突出させる原因となるであろうことはありそうにない。
【００８０】
しかしながら、少なくとも二つの「活性な」シントンを有する７５６個の化合物が存在する。これらの化合物は無作為の評点より良い評点を受取る可能性が非常に高い。従って、あまり正確でないドッキング手法でさえも、コンビナトリアル・ライブラリーにより表されるように、化学空間の領域は正確に同定され得る可能性が高い。
【００８１】
実施例
本発明のクラスター化方法は、ファルマコピーア社から入手できる四つのＥＣＬｉＰＳ（商標）アスパルチル・プロテアーゼ・インヒビター・ライブラリーのＰＬ４１９、ＰＬ４４４、ＰＬ７９２、及びＰＬ７９９を用いた評点方法と比較して評価された。これらのライブラリーはプラスメプシンＩＩ（ｐｄｂ同定子１ｓｍｅ）及びカテプシンＤ（ｐｄｂ同定子１ｌｙｂ）の結合部位内にドッキングされた。四つの該ライブラリーは、下記に示すように、ペプスタチンのコアに基づいている。
【００８２】
【化１】

【００８３】
これらのライブラリーは、該四つのうち三つ（ＰＬ４４４、ＰＬ７９２、及びＰＬ７９９）が以前プラスメプシンＩＩとカテプシンＤの両方に対する活性についてスクリーニングされかなりの数の活性化合物を生じたので選択された。四番目のライブラリーのＰＬ４１９はプラスメプシンＩＩに対して試験されてかなりの数の活性化合物を得ており、カテプシンＤに対しては試験されていないものの、該ライブラリーから再合成された化合物はカテプシンに対して活性であった。その上、該ライブラリーは大きく（平均分子量が５５０）可変的な（回転可能な結合の平均数が１９）化合物から構成されるので、これらは如何なるドッキング手法に対しても相当な挑戦であった。分子量、回転可能な結合の数、及びライブラリーの化合物の数を含むライブラリーの関連する物理的特性は表３に示す。
【００８４】
二つの該標的に対する該ライブラリーの高速大量処理スクリーニングから得られたデータ、並びに該ライブラリーから再合成された化合物のＫ_ｉの測定から得られたデータを表４に示す。該ライブラリーはこれらのデータに従った相対的活性に関して序列付けされうる。
【００８５】
高速大量処理スクリーニングから得られるデータは一般的に活性形及び不活性形をとる。つまり、所与の化合物が、該スクリーニング試験で陽性活性を示す「解読された」合成ビーズ上に見出されか否かである。一個の解読されたビーズは陽性であると誤るかなりの可能性あるので、高速大量処理データに基づいてライブラリーに活性／効力の絶対的な度合いを付与することは困難である。複数の解読されたビーズ上に出現する化合物、即ち「重複解読」は陽性と誤る可能性が遙かに小さくなる（スクリーニングされるビーズの数は、ノイズを最小化するため、典型的には３の係数まで、通常化合物の数より多い）。従って、重複解読の数はライブラリーの活性についてのより良い目安である。
【００８６】
【表３】

【００８７】
ライブラリーの活性／効力についての第二の尺度は再合成され且つ検定されたこれらの解読された化合物の効力である。ほとんどの場合、ほんの一握りの解読された化合物が大量に再合成され検定された。従って、再合成された化合物の効力それ自体は該ライブラリーの全体的活性の完全な反映ではない。こうして、ライブラリーの活性は、解読の数／重複解読の数、及び効力（通常選別され再合成された化合物の最大効力）の両方により測定される。
【００８８】
プラスメプシンに対するこれらの活性／効力に関して、該ライブラリーは下記のように序列付けられる。
ＰＬ７９２＞ＰＬ４１９＝ＰＬ４４４＞ＰＬ７９９
相対的活性／効力は表４に示される解読の数／重複解読の数及びＫ_ｉ値に基づくこの様式で定義される。ＰＬ４１９及びＰＬ７９２の両方は相当の数の解読及び重複解読を生じた。ＰＬ７９２が１００ｎＭ以下のＫ_ｉ（単数又は複数）をもつ幾つかの化合物を生じた一方で、ＰＬ４１９に見出された最も効力のある化合物は５４０ｎＭのＫ_ｉを有していた。こうして、ＰＬ７９２は最も活性なライブラリーとして序列づけられる。より多くのデコード及び重複デコードを生じたので、ＰＬ４１９はプラスメプシンに対してＰＬ７９９より活性であるとして序列付けられる。ＰＬ４４４はＰＬ７９９と同様な数の重複解読を生じたが、有意により高い効力の化合物を生じた。従って、ＰＬ４４４はＰＬ７９９より活性であるとして格付けされた。ＰＬ４４４及びＰＬ４１９は、ＰＬ４１９が有意により多くの重複デコードを生じたがＰＬ４４４は有意により効力のある化合物を生じたので、ほぼ等しい活性であるとして序列付けされる。
【００８９】
カテプシンについては、該ライブラリーは下記のように序列付けされた。
ＰＬ４４４＞ＰＬ７９２＞ＰＬ７９９
ＰＬ４４４は最大の重複解読及び最も活性な化合物を生じたので、カテプシンに対して最も活性であるとして序列付けされる。ＰＬ７９２はＰＬ７９９より多くの重複解読及びより効力のある化合物を生じた。従って、カテプシンに対して、ＰＬ７９２はＰＬ７９９より活性であるとして序列付けされる。ＰＬ４１９はカテプシンに対してスクリーニングされなかったが、ＰＬ７９９が生じた如何なるものよりカテプシンに対して有意により効力のあった化合物を生じた。
【００９０】
【表４】

【００９１】
更に、８つの「仮想」ライブラリーが負の対照として作成された。これはスタチン（ｓｔａｔｉｎｅ）のコアにある一つの不斉中心のコンフィギュレーションの点でのみ正の対照と異なっている。これらの仮想ライブラリーをＰＬ４１９Ｒ、ＰＬ４１９Ｄ、ＰＬ４４４Ｒ、ＰＬ４４４Ｄ、ＰＬ７９２Ｒ、ＰＬ７９２Ｄ、ＰＬ７９９Ｒ及びＰＬ７９９Ｄと名付けた。上に示した本来のペプスタチンの足場は、スタチンのコアに対応し、該アミノ酸の二つの立体中心、ヒドロキシル基をもつ炭素、及びＣα原子を有する。両立体中心はＬコンフィギュレーションである。追加のＲと名付けられたこのライブラリーは、ヒドロキシル基をもつ炭素が正の対照のそれと逆のコンフィギュレーションを有することを除いて標準的なライブラリーと同一であり、Ｒと名付けられ、下記に示す。
【００９２】
【化２】

【００９３】
追加のＤと名付けられたライブラリーは、スタチンの一部が上記に示されるように標準的なＬ−アミノ酸のかわりにＤ−アミノ酸を有することを除いて標準的なライブラリーと同一である。これらの仮想ライブラリーは、プラスメプシンＩＩ又はカテプシンＤに対して活性を示すことが知られているＲ−スタチン又はＤ−アミノ化合物が存在しないので、負の対照として利用される。従って、これらの追加のライブラリーいずれかは本来のライブラリーより顕著に活性が低いか又は完全に不活性であろうと仮定された。その上、これらのライブラリーは全く同じ性質の配分（分子量、回転可能な結合数、水素結合の供与体など）を有するので、負の対照ライブラリー及び本来のライブラリーをドッキングする結果の差異は直接的に受容体との適合性及び相補性における差異に帰する。
【００９４】
１２個のライブラリーの各々は上述した手法を用いてプラスメプシン２及びカテプシンＤの結合部位内にドッキングされた。プラスメプシンの場合、該結合部位周辺の２０Å×３２Å×２２Åのボックスが調査空間として選択された。カテプシンＤでは、該結合部位周辺の２２Å×３０Å×２４Åのボックスが調査空間として選択された。簡単にするため、各分子について最上位に序列付けられたドッキング・ポーズのみが該分析で用いられた。両事例のドッキング時間は１化合物当たり３〜５秒の範囲である（表５参照）。結果は本発明の（比較）評点方法及びクラスター化方法の両方により分析された。
【００９５】
【表５】

【００９６】
実施例１（比較）評点分析：
該評点方法はライブラリー間の評点分布を比較する。（評点により序列付けられた）ドッキング化合物の上位５％における評点の２乗平均（ｒｍｓ）をライブラリー全体の評点として用いる。この論理的根拠は、ライブラリーが活性化合物を有するならば、かなりの数の化合物が該活性化合物に十分類似しており、結合部位内にかなり巧く適合し同様に良い評点を受けるはずであるということにある。従って、活性ライブラリーから得られる最高点の化合物は不活性ライブラリーから得られる化合物とは異なって分布するはずである。
【００９７】
該評点を用いて結果を分析するために、まず該化合物をそれらの評点に従って分類する。次に、ライブラリーの評点を、
【００９８】
【数９】

【００９９】
によって計算する。上式中、Ｓ_ｉはｉ番目に序列づけされた化合物の評点であり、この合計は上位５％より上の化合物のみに適用し、Ｎはライブラリー中の化合物の数である。該合計はライブラリーの化合物の２０分の１（５％）にしか及ばないので、２０の係数が式（１）に現れる。上述した評点手法が用いられた。平均ではなく評点の２乗平均（ｒｍｓ）を選ぶ理由は、該２乗平均が非常に良い評点を受ける少数の化合物を含むライブラリーに有利に働く点にある。
【０１００】
該評点を分析するために用いられうるであろう幾つかの付加的な統計的な量がある。例えば、ゴッドンらの異なるタンパク質結合部位への大規模な化合物データベースの計算ドッキングの統計分析では、多数のドッキング化合物から得られる評点分布の歪みが、ある範囲の標的にわたって試験された。評点全ての平均及び標準偏差を含む付加的な統計的尺度が用いられうるであろう。平均値、標準偏差、又は歪みなどの統計的な量を用いることに伴う問題は、本発明者らが良い評点を受ける化合物に興味があるのに対し、それらが全て低い評点を受ける化合物により影響されることである。例えば、全てが中程度の評点を受ける化合物のライブラリーは、化合物の半分が低い評点を受けそして半分が高い評点を受けるライブラリーと同じ平均値を有することになる。本発明者らは二番目のライブラリーにより遙かに強い興味を持つ。本発明者らは主として良い評点を受ける化合物に関心があるので、該化合物の上位５％のみを使用する。５％の的確な選択は恣意的であったが結果にほとんど関係が無いようであった。
【０１０１】
プラスメプシン及びカテプシンへのＰＬ４１９、ＰＬ４４４及びＰＬ７９２のドッキングについて、該評点は元のライブラリーを最上位に、次にＲ−スタチン・コアをもつライブラリーを、その後にＤ−アミノ酸をもつライブラリーをと序列付けする（表６参照）。プラスメプシン及びカテプシンの両方を用いるＰＬ７９９については、該評点は再び該三者の最上位として元のライブラリーを序列付けするが、Ｄ−アミノ酸をもつ該ライブラリーを二番目に、Ｒ−スタチン・コアをもつ該ライブラリーを最後に序列付けする。こうして、標的及び三つのライブラリー全ての両方に対して予期されたように、最上位で評点するライブラリーは、方程式１により判断される場合、元のライブラリーである。
【０１０２】
【表６】

【０１０３】
四つの元のライブラリー相互間の比較はそれほど容易でない。例えば、ドッキングされた化合物の評点は、しばしば、該化合物の分子量、極性原子の数などの物理的性質と何らかの相関性を示す。とりわけ、より大きく且つより極性のある分子は、単により強い相互作用をする原子をより多く持つという単純な理由のため、より良い評点を得る傾向がある。プラスメプシンでは、該評点はＰＬ４４４を明確に最上位に、続いてＰＬ７９２、その後にＰＬ７９９、そして最後にＰＬ４１９を序列付けする。カテプシンについては、該評点は再びＰＬ４４４を最上位に、続いてＰＬ７９２、その後にＰＬ４１９及びＰＬ７９９を序列付けする。従って、ライブラリーの実際の活性の程度（上記の表４参照）と該評点（表６）との間に何らかの相関関係がありそうに思われる。しかしながら、プラスメプシンについてはＲ−スタチンをもつＰＬ４４４及びＰＬ７９２の変形版（ＰＬ４４４Ｒ及びＰＬ７９２Ｒ）はＰＬ４１９の元のライブラリーより高く序列付けされたことに留意すべきである。従って、この関関係は完全なものではない。
【０１０４】
該評点は個々のシントンを序列付けするため用いることもできる。評点を所与のシントンに与えるため、方程式（１）は所与のシントンを含む化合物にのみ適用される。このため、本発明者らはＰＬ７９２とプラスメプシンに注意を限定する。Ｒ_２置換では、三つのシントン、即ち（１） −Ｃｈ_２Ｐｈ、（２） −ＣＨ_３、及び（３） −ＣＨ_２ＣＨ（ＣＨ_３）_２が存在する。かなりの数の活性体が（１）と（３）の両シントンに見出されたが、（２）には見出されなかった。これらのシントンの評点はそれぞれ１６９．９、１５５．２及び１７０．６である。該ＳＡＲに基づけば、これは正しい序列付けである、即ち（１）と（３）のシントンは近くに序列付けされ、シントン（２）は顕著に低く序列付けされる。
【０１０５】
該ＳＡＲとの一致及び該Ｒ３シントンの評点は完全から程遠い。実際、相関関係はないようである。最上位に序列付けされたシントンの大半は大きな極性のアミノ酸であり、一方、小さな無極性のアミノ酸はＳＡＲで優位にたつ。この相関関係の欠如について二つの説明がある。第一は、該分子の大きさ及び極性と該評点との間に顕著な相関関係が存在する。本発明者らが小さな無極性のアミノ酸に注意を限定する場合、該評点はそれらをＬ−ロイシン＞Ｌ−イソロイシン＞Ｌ−バリン＞Ｌ−アラニン＞Ｌ−ｔ−ブチルグリシン＞Ｄ−ロイシン＞Ｄ−アラニンと序列付けする。ここで、Ｌ−バリン及びＬ−イソロイシンは実験的に観察された活性化合物の中で最も普通に観察されたシントンである。こうして、一式の無極性アミノ酸内で、実験的ＳＡＲとの何らかの相関関係が観察される。相関関係の欠如についての第二の理由は、３１個のＲ３シントンがあるため、個々のシントンを含む僅か４２０個の分子が存在することである。その結果、各シントンの評点は僅か２１個（化合物の上位５％）の化合物に基づいている。これはかなりの量のノイズを誘導する可能性があり、このノイズは種々のＲ３シントンを正確に評点する能力を低下させる。
【０１０６】
該評点は分子量及び極性などの性質に相関するので、該評点方法を用いて、非常に異なる物理的性質をもつライブラリーを比較することは困難である。この問題はＰＬ７９２のＲ３シントンの分析を通して最も良く説明された。この場合、該ＳＡＲは小さなＬ−アミノ酸がこの位置に好ましいことを明確に示した。最高評点のシントンは、しかしながら、一般的に大きな極性アミノ酸であった。小さな疎水性アミノ酸に限定した場合、該評点はＲ３シントンについての高速大量処理ＳＡＲと何らかの相関関係を示した。この問題は正確な溶媒和モデルの使用を通して軽減されうるかも知れないが、使用されるためには、該モデルは高速で且つ誤差に寛容でなければならないであろう。
【０１０７】
実施例２：クラスター化分析
クラスター化分析では、該クラスターは単結合クラスター化（ｓｉｎｇｌｅｌｉｎｋａｇｅｃｌｕｓｔｅｒｉｎｇ）を用いて形成された。ここでは二つのドッキング分子のコアの間の２乗平均偏差が測定基準として用いられた。原則的に、コアがある所定の切捨て、通常０．２５Åから０．５Åの範囲内にある任意の二つのポーズは同じクラスターにある。この研究では、０．５Åの切捨てを用いた。上位のクラスターにあるライブラリーから得られる化合物の百分率を該ライブラリーを序列づけするために用いた。単結合クラスター化は該２乗平均偏差の切捨て以外のパラメータを要求しないので計算を容易にするために用いられた。これは、大規模なコンビナトリアル・ライブラリーのドッキングの結果から情報を引出すためにクラスター化が有用であることを証明するのに十分であった。
【０１０８】
適合の性質の尺度として、最大のクラスターにおける化合物の百分率が用いられた。評点の序列付けと同様に、両標的に対する元のライブラリー及び全部で三つのライブラリーは、対応するＲ−スタチン又はＤ−アミノ酸のライブラリーより高く序列付けされた（表４参照）。該クラスター化は、該評点が行なうよりも該対照ライブラリーから元のライブラリーをより良く区別するようである。元のライブラリーと対照ライブラリーの一つとの間の最も近いクラスターの大きさはＰＬ４１９及びＰＬ４４４及びプラスメプシンについてのものである。これら二つの事例では、該元のライブラリーについての最上位クラスターは、該ライブラリーの対応するＲ−スタチン版についての最上位クラスターより僅か３０〜４０％しか大きくない。残る６事例においては、元のライブラリーの最上位クラスターの大きさは少なくとも対照ライブラリーの大きさの２倍である。
【０１０９】
評点序列付けと同様に、異なるライブラリーに及ぶクラスターの序列付けはより問題がある。プラスメプシン及びカテプシンの両方については、該クラスターの大きさは三つのうち最良のものとしてＰＬ７９２を、続いてＰＬ４１９、その後にＰＬ７９９を正しく序列付けする。しかしながら、該クラスターの大きさはＰＬ４１９、ＰＬ４４４及びＰＬ７９２のＲ−スタチン版をＰＬ７９９の元のライブラリーの前に誤って序列付けする。これは該ライブラリー間の物理的性質の差異に帰することができる。ＰＬ７９９の化合物はＰＬ４１９及びＰＬ７９２の化合物より有意に大きく且つより可変的（表３を参照）である。更に、ＰＬ７９９の化合物には中央に可変的な環が存在し、コンフォメーション分析をより困難にする。従って、ＰＬ７９９の化合物は正確にドッキングすることが非常に難しく、結局、正しくドッキングされた化合物の割合を低くし、その結果、最上位クラスターをより小さくする。
【０１１０】
クラスター化法はデータ削減技法としても非常に有用である。本研究で用いられたプラスメプシン結晶構造の１ｓｍｅ及びカテプシン結晶構造の１ｌｙｂは両方とも該結合部位にペプスタチンを含む。上述したように、これらのライブラリーのそれぞれのコアがペプスタチンのコアに基づいていた。その結果、直接的な２乗平均偏差はドッキング化合物の個々のコアと結晶学的に観察されたペプスタチンのコアの結合様式との間で計算され得る。ＰＬ７９２及びプラスメプシンについては、相当の大きさ（１００メンバー以上）の個々のクラスターについての特定の２乗平均偏差を有する化合物の数のグラフが図１０で示される。これは、比較的少数の有意なクラスターが存在し且つ最上位のクラスターが正しくドッキングされていることを示している。同じことが両標的に対する全部で四つの元のライブラリーにも言える。即ち、最上位のクラスターが正しくドッキングされており、且つ比較的少数の有意なクラスターが存在する（表７参照）。該ドッキング化合物を更にフィルタにかけるために可視的スクリーニングが用いられる場合、クラスター化は何万個もの各化合物を試験することから幾つかのクラスターを試験することへと必要な労力を削減し得る。
【０１１１】
該クラスター化方法は、該評点の正確度にほとんど依存しないため、該評点方法よりも有利である。むしろ、正確に堅実に化合物をドッキングさせる能力に依存しており、そして結合親和性を正確に推定することより化合物を正しくドッキングさせることの方が一般的に容易である。
【０１１２】
【表７】

【０１１３】
実施例３：記述子の評価
分子は歪みの低いコンフォメーションでタンパク質に結合するという証拠が存在する。幾つかのグループがプロテイン・データ・バンク（ＰＢＤ）に寄託されたタンパク質−リガンド複合体から引出された小分子のコンフォメーションの歪みを調査した（ベルマンら，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，２８（２０００）２３５、及びベルマンら，Ｎａｔ．Ｓｔｒｕｃｔ．Ｂｉｏｌ．，７（２０００）９５７を参照）。初期の研究から、結合したコンフォメーションは実際に極めて歪んでおり、それらの歪みの推定値は５−４０ｋｃａｌ／ｍｏｌの範囲であることが見出された。しかしながら、これらの研究は、真空中でＣＨＡＲＭｍを用いて該歪みを計算しており、該構造における幾らかの座標誤差の可能性を考慮しなかった。ボストロムら（Ｃｏｍｐｕｔ．−ＡｉｄｅｄＭｏｌ．Ｄｅｓ．，１２（１９９８）３８３）は溶媒和の補正を用いることにより該歪みの推定値がかなり減少することを示した。更に、彼等は寄託された構造におけるリガンドの実際のコンフォメーションが極めて歪んでいる事例を見出したが、幾つかのコンフォメーションが小さな歪みの構造の誤差内にあることを示した。最後に、彼等は、計算で用いられた力場が計算されたコンフォメーションの歪みに劇的な影響を及ぼしうることを示した。これらの一連の研究から幾つかの可能な結論が得られる。第一に、方法が改良されるにつれ、結合したコンフォメーションの歪みの推定値が有意に減少した。即ち、結合したコンフォメーションのほとんどは３−４ｋｃａｌ／ｍｏｌ未満の歪みを有するようである。第二の結論は、座標誤差があれば、力場は依然あまりにも敏感であるためそれらがＰＤＢに寄託されたような小分子のコンフォメーションの歪みを有効に見積もるために用いることはできない。
【０１１４】
小分子が低エネルギーのコンフォメーションでタンパク質に結合するという確信に対する第二部分の証拠は、タンパク質−リガンド複合体の結合定数を見積もるために用いられ且つ実験的に導かれた評点関数の開発である。これらのモデルはいずれもリガンドの歪みを考慮するための項を有さないが、これらのモデルは全て１−１．５ｋｃａｌ／ｍｏｌの２乗平均誤差内まで実験的結合定数への適合を達成する。これらのリガンドの幾つかはほとんど又は全く歪みがなく結合すると推測するのが無難である。従って、これら全ての評点関数が有意に偏らない限り、歪みは、これらの評点関数を練習するために用いられる任意のタンパク質−リガンド複合体においてわずか３−４ｋｃａｌ／ｍｏｌと計上すべきである。
【０１１５】
他方で、如何なる一連の構造活性データを調査しても、コンフォメーションが堅く結合した阻害剤と弱く結合した阻害剤との間に差異を生じ得ることを示す。第一の例として、ＩＡとＩＢを検討する。
【０１１６】
【化３】

【０１１７】
ＩＡ分子は３７ｎｍのＩＣ５０で血管内皮増殖因子受容体（ＶＥＧＦｒ）に結合する。Ｃ８の原子が窒素に変わると（ＩＢ）、該化合物はＶＥＧＦｒに対して不活性になる（ＩＣ５０＞１００００ｎｍ）。溶媒和効果は該変化の一部を説明するかも知れないが５ｋｃａｌ／ｍｏｌ全てを説明できないことは確かである。該二分子間の最も大きな差異は、ＩＢ分子がアミノＮＨ及びＮ８の間で内部水素結合の可能性を有するが、ＩＡ分子は有さないことである。この水素結合はＩＢ分子の４−ＣＩ−フェニル−アミノを好ましくないコンフォメーションに固定しうる。こうして、この化合物がＶＥＧＦｒに活性なコンフォメーションをとることを妨げる。
【０１１８】
第二の例として、ＩＩＡ分子とＩＩＢ分子を検討する。コロニー刺激因子−１受容体（ＣＳＦ−１ｒ）に対して、ＩＩＡのＩＣ５０は５００ｎＭである一方、ＩＩＢは不活性である（ＩＣ５０＞５００００）。これら二分子の状態は上皮増殖因子受容体（ＥＧＦｒ）とほとんど逆であり、ここではＩＩＢのＩＣ５０が５０ｎＭであることと比べてＩＩＡのＩＣ５０は４０００ｎＭである。これら二化合物間の差異はアミノがＩＩＢでメチル化されていることだけである。このメチルは、該タンパク質との水素結合様式を変化させること及び該分子のコンフォメーションの選好を変えることを含む複数の効果を有しうる。ボルドらは、ＮＭＲを用いて、このメチルが溶液中におけるこの分子のコンフォメーションの挙動を大幅に変化させることを示した。この変化は該活性の変化のかなりの部分を生じさせる可能性がある。
【０１１９】
【化４】

【０１２０】
これらの研究及び実施例はともに、歪みが結合親和性を決定する際の重要な因子であるが我々の歪みについての理解は有用なモデルを開発するのにまだ十分でないことを示している。包括的な歪みのモデルを開発する代わりに、本発明者らは、「我々は無作為のコンフォメーションから活性なコンフォメーションを区別できるか」という疑問と取り組む。その目的は、任意の標的分子に堅く結合する可能性の小さなコンフォメーションを消去するために使用できるフィルターを開発すること又は生物活性である可能性が高いコンフォメーションの方にコンフォメーション調査手法を偏向させるために使用できる単純な記述子を開発することである。
【０１２１】
このようなフィルタ／記述子の有用性を確認するために、小分子の活性なコンフォメーションの小さなセットをＰＤＢにおける共結晶複合体から抽出した。幾つかの三次元記述子を検討し、これらの記述子のいずれが無作為のコンフォメーションから活性なコンフォメーションを最も上手く分離するかを調べた。本研究で用いられた記述子には、極性溶媒に接近可能な表面積、無極性溶媒に接近可能な表面積、回転半径、内部相互作用の数、二つの主軸の比、及び双極子モーメントの大きさが含まれた。これらの記述子は、それらがコンフォメーションの小さな変化に対して、従って結晶構造中に見出されるリガンドのコンフォメーションの誤差に対しても比較的鈍感であるために選択された。とりわけ、計算されたコンフォメーションの力場エネルギーは、コンフォメーションの小さな変化に対してあまりにも敏感であるため、用いられなかった。本研究は、極性溶媒接近可能表面積、無極性溶媒接近可能表面積、回転半径、及び内部相互作用の数が全て無作為のコンフォメーションから活性なコンフォメーションを分離するために使用できることを示す。極めて可変的な分子については、これらの記述子による無作為なコンフォメーションから活性なコンフォメーションの分離はより良好ですらある。これらの四つの記述子を用いた結果は、活性なコンフォメーションが無作為なコンフォメーションよりコンパクトでないことを示している。
【０１２２】
第一に、タンパク質に結合している際の６５個の小分子のコンフォメーションをＰＤＢから抽出した。大環状環を持つ分子又は剛体化合物は考慮しなかった。これらの分子は５個及び２３個の回転可能な結合を持っていた（表８参照）。
【０１２３】
【表８】

【０１２４】
このデータセットは関連化合物を含むため理想的なものではない。ペプスタチンを含む幾つかのアスパルチル・プロテアーゼ阻害剤及び幾つかのトリプシンの阻害剤が含まれる。
【０１２５】
個々のリガンドについて、無作為のコンフォメーションを下記のように作成した。２面角は、結合の長さ、結合の角度、及び環を固定して保持したまま、無作為に均等に選択された。次いで、該コンフォメーションを、単にファン・デル・ワールスの項及び二面角の項を用いて二面空間において最小化した。典型的には、コンフォメーションは、妥当なエネルギーまで最小化され又はフェニル環を介した結合経路（ｂｏｎｄｒｕｎ）を有するなど非常に高いエネルギー谷に捕捉されるであろう。これを念頭において、該最小化後に非常に高いエネルギー（＞１００ｋｃａｌ／ｍｏｌ）を持つコンフォメーションはいずれも切捨てた。この工程は、５０００個の無作為なコンフォメーションが各分子について作成されるまで続けられた。
【０１２６】
個々の分子Ｍ及び個々の記述子Ｄについて、下記の量が計算され得る。第一は、活性なコンフォメーションについてのＤの値、即ちａ（Ｍ，Ｄ）である。第二に、分子Ｍの無作為コンフォメーション全てにわたる記述子の平均値は、
【０１２７】
【数１０】

【０１２８】
により与えられる。上式中、Ｃ_ｋは、分子Ｍの第ｋ番目のコンフォメーションである。三番目の量は分子Ｍの無作為コンフォメーションにわたる記述子Ｄの標準偏差であり、次式
【０１２９】
【数１１】

【０１３０】
により与えられる。最後に、該活性なコンフォメーションについての補正値が次式により与えられる。
【０１３１】
【数１２】

【０１３２】
活性なコンフォメーションが無作為なコンフォメーションと識別不可能な場合、補正された記述子の値は、該データセットの分子にわたって０の周りに一様に分布するはずである。下記の記述子が本研究で用いられた。即ち極性溶媒に接近可能な表面積（ＰＳＡＳＡ）、無極性溶媒に接近可能な表面積（ＡＳＡＳＡ）、内部相互作用の数（ＮＩ）、回転半径（ＲＧ）、二つの主軸の比（ＲＰＡ）、及び双極子モーメントの大きさ（ＭＤＭ）である。該溶媒に接近可能な表面積は原子のファン・デル・ワールス半径＋１．４Åを用いて計算された。水素原子は計算に用いられなかった。窒素又は酸素は、水素を有する場合又は水素結合を受容できる孤立電子対を有する場合には極性として扱った。他の原子は全て無極性として扱った。量ＮＩは所与の分子における二つ一組の相互作用の数の単純な総数である。これは、
【０１３３】
【数１３】

【０１３４】
により与えられる。上式中、総和は、１〜２及び１〜３の原子を除く、原子ｉ_，ｊの全ての対に及び、ｄ_ｉｊはｉ番目とｊ番目の原子間の距離であり、そして
【０１３５】
【数１４】

【０１３６】
単位は全てÅである。コンフォメーションの回転半径は、
【０１３７】
【数１５】

【０１３８】
により与えられる。上式中、総和はコンフォメーションの全原子におよび、該コンフォメーションはその重心が０となるように移動（ｔｒａｎｓｌａｔｅｅｄ）される。主軸の比は、
【０１３９】
【数１６】

【０１４０】
により与えられる。上式中、λ_１はコンフォメーションの原子座標の分散行列の最大固有値であり、λ_２は二番目に最大である。０に近いＲＰＡの値は長く伸長したコンフォメーションを示すが、一方、１に近い値は丸いコンパクトなコンフォメーションを示す。最後に、双極子モーメントは、セリウス（Ｃｅｒｉｕｓ）２を通じて利用できるラッペとゴダードの方法（ラッペ，エイ・ケイとゴダード，ダブリュ・エイ，ＩＩＩ，Ｊ．Ｐｈｙｓ．Ｃｈｅｍ．，９５（１９９１）３３５８、Ｃｅｒｉｕｓ２，ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎ，Ｉｎｃ．、サンディエゴ、カリフォルニア州）を用いて計算された原子の点電荷を用いて計算した。
【０１４１】
活性なコンフォメーションについての記述子の個々の補正値は図１１に分子数に対してプロットされ、該分子は回転可能な結合数により序列付けされる。該補正値はゼロの周りに一様に分布するため、双極子モーメントの大きさ（図１１Ａ参照）及び主軸の比（図１１Ｂ参照）は無作為のコンフォメーションから活性なコンフォメーションを分離しないようである。残る四つの記述子であるＰＳＡＳＡ（図１１Ｃ参照）、ＡＳＡＳＡ（図１１Ｄ参照）、ＮＩ（図１１Ｅ参照）及びＲＧ（図１１Ｆ参照）は、とりわけ大きく且つ可変的な分子にとって無作為のコンフォメーションから活性なコンフォメーションを分離するのに確かに有用であるようである。これらの四つの記述子は以下に幾分詳細に論ずる。
【０１４２】
６５分子のうち僅か１４分子がゼロ未満の補正ＰＳＡＳＡを持つ活性コンフォメーションを有し、８を上回る回転可能な結合をもつ３７分子のうち僅か１分子がゼロ未満の補正ＰＳＡＳＡを持つ活性コンフォメーションを有する。従って、生物活性のあるコンフォメーションは平均して無作為のコンフォメーションより大きなＰＳＡＳＡを有するようである。この点において、活性なコンフォメーションは溶液コンフォメーションと似ている。更に、８を上回る回転可能な結合及びゼロ未満の補正ＰＳＡＳＡをもつ唯一の事例である１ｈｅｆの事例は、問題を有するようである。該コンフォメーションは、フェニル環と衝突するカルボニル基の酸素（Ｃ−Ｏの距離〜２．３Å）を含む幾つかの深刻な内部衝突（ＩＩＩＡ及びＩＩＩＢ参照）を示す。この衝突がおそらく平均的ＰＳＡＳＡより低いことの原因である。この分子も該タンパク質と何らかの望ましくない接触をしており、より妥当な代替的結合様式を有するようである。
【０１４３】
【化５】

【０１４４】
６５事例のうち僅か１０事例がゼロ未満の補正ＡＳＡＳＡを持つ活性コンフォメーションを有する。この結果は意外に思われうる。溶液中で低エネルギーのコンフォメーションは無極性の表面積ができるだけ多く埋めこまれたコンホーメーションであると予期するであろう。しかしながら、水と違って、タンパク質は無極性相互作用及び極性相互作用の両方に対して効果的に競合する。負の補正ＡＳＡＳＡを持つ活性コンフォメーションについての事例は主として相互作用できる二つの大きな疎水性基を有するものである。これらの多くは、相互に詰め込まれた芳香環とピペラジンを含むトリプシンの阻害剤である。こうして、この結果はタンパク質が無極性の相互作用に対して効果的に競合し得ることを示す一方で、分子間の無極性相互作用がタンパク質への結合の際に保持されるのに十分な程強力である場合の状況が存在する。
【０１４５】
内部相互作用の数は、無作為のコンフォメーションから活性なコンフォメーションを最も良く分離する記述子である。この事例において、活性なコンフォメーションのうち僅か５つが正の補正ＮＩを有し、該活性なコンフォメーションが無作為のコンフォメーションよりはるかに少ない内部相互作用を有することを示している。この５つの分離物（分布から離れたもの）は主として先の段落で論じたトリプシン阻害剤である。
【０１４６】
無作為のコンフォメーションから活性なコンフォメーションを分離する何らかの潜在能力を有する最後の記述子は回転半径である。この事例において、６５事例のうち１３が負の補正ＲＧを持つ活性コンフォメーションを有し、活性コンフォメーションの回転半径が無作為のコンフォメーションの回転半径より大きいことを示している。ここでも、該分離物は無極性溶媒接近可能表面積（ＡＳＡＳＡ）の場合の分離物に似ている。
【０１４７】
タンパク質に結合する際の小分子のコンフォメーションは種々の記述子を用いて無作為のコンフォメーションから分離され得る。これらの記述子には、極性溶媒に接近可能な表面積、無極性溶媒に接近可能な表面積、内部相互作用の数及び回転半径が含まれる。コンフォメーションに依存する記述子の全て不活性なコンフォメーションから活性なコンフォメーションを分離するのに有用であるわけではない。双極子モーメントの大きさや二つの主軸の比はいずれもこの目的に有用ではないようである。
【０１４８】
活性なコンフォメーションは無作為のコンフォメーションより平均して多くの極性及び無極性の溶媒接近可能表面積、少ない内部相互作用、並びに大きい回転半径を有する。これらの結果は平均して活性なコンフォメーションが無作為のコンフォメーションよりコンパクト（ぎっしり詰まっている）でないことを示している。これらの記述子は、よりコンパクトでないコンフォメーションを含むためにコンフォメーション調査手法を偏らせるための有用なウエイト付けになり、それにより、薬理団の調査、分子ドッキング、及び３Ｄ−ＱＳＡＲなどのモデル化技法の結果を改良するであろう。
【０１４９】
本発明の機能は、ソフトウェア、ハードウェア、マイクロコード、ファームウェア又はそれらの任意の組合わせにおいて適切なプログラムを作成することにより容易に自動化できる。更に、任意の型のコンピュータ又はコンピュータ環境が本発明の機能を提供、内臓及び／又は使用するために利用され得る。このような環境の一つは図８に示してあり、下記に詳細に記載する。
【０１５０】
一実施態様において、コンピュータ環境８００は、例えば、少なくとも一つの中央演算処理装置８１０、主記憶装置８２０、及び一つ以上の入力／出力装置８３０を含む。これらのそれぞれを以下に記載する。
【０１５１】
知られているように、中央演算処理装置８１０はコンピュータ環境８００の制御中心でありそして命令の実行、割込み行為、タイミング機能、初期プログラムローディング及び他の機械関連機能のための順序決定機能及び処理機能を提供する。中央演算処理装置は少なくとも一つのオペレーティング・システムを実行する。既知のように、該オペレーティング・システムは、他のプログラムの実行を制御し、周辺機器とのやりとりを制御しそしてコンピュータ・リソースの使用を制御することにより該演算器の操作を制御するために用いられる。
【０１５２】
中央演算処理装置８１０は主記憶装置８２０に連結されている。該８２０は直接アドレス可能であり該中央演算処理装置によりデータの高速処理を提供する。主記憶装置は物理的に該ＣＰＵと一体化されうるか又は独立の装置として構築されうる。
【０１５３】
主記憶装置８２０も一つ以上の入力／出力装置８３０に連結されている。これらの装置には、例えばキーボード、通信制御装置、遠隔処理装置、プリンタ、磁気記憶媒体（例えばテープ、ディスク）、直接アクセス記憶装置、及びセンサーベース装置を含む。データは主記憶装置８２０から入力／出力装置８３０へ移され、該入力／出力装置から逆に主記憶装置へ移される。
【０１５４】
本発明は、例えばコンピュータが使える媒体を有する製造品（例えば、一つ以上のコンピュータ・プログラム製品）に含めることができる。該媒体は、例えば、本発明の機能を提供及び促進するためのコンピュータ読み取り可能なプログラムコード手段をその内部に具現化した。該製造品はコンピュータシステムの一部として包含され又は単独で販売され得る。更に、本発明の機能を実施するために機械で実行可能な少なくとも一つの命令プログラムを現実に具現する、機械で読み取り可能な少なくとも一つのプログラム記憶装置が提供され得る。
【０１５５】
本明細書で示される流れ図は単に説明のためのものである。そこに記載されるこれらの図又は工程（又は操作）に対して本発明の精神を逸脱することなく多くの変形版が存在しうる。例えば、該工程は異なる順序で実行されうる、又は工程が追加、削除又は変更されうる。これらの変形版は全て請求の範囲に記載されている発明の一部とみなされる。
【０１５６】
好ましい実施態様は本明細書で詳細に示され且つ記載されるが、当業者には種々の変更、追加、置換等が本発明の精神から逸脱することなく為され得ることが明らかであり、従って、これらは請求の範囲によって定義される本発明の範囲内にあると考えられる。
【図面の簡単な説明】
【図１】
図１Ａ〜図１Ｃは、タンパク質−リガンド複合体の形成を概念的に表す。
【図２】
図２は、本発明の原理に基づく、分子ドッキングアプローチの一実施態様のフローチャートである。
【図３】
図３は、本発明の原理に基づく、図２のドッキングアプローチにより用いられ得る分子コンフォメーション調査手法の一実施態様のフローチャートである。
【図４】
図４は、本発明の原理に基づく、図２の分子ドッキングアプローチで使用するための結合部位画像を確立する一実施態様のフローチャートである。
【図５】
図５は、本発明の原理に基づく、図２の分子ドッキングアプローチで使用するための適合手法の一実施態様のフローチャートである。
【図６】
図６は、本発明の原理に基づく、図２の分子ドッキングアプローチで使用するための同定された適合の中でリガンドの位置を最適化するための最適化工程の一実施態様のフローチャートである。
【図７】
図７は、本発明の原理に基づく、原子二つ一組の評点で用いる水素結合ポテンシャル及び立体ポテンシャルのグラフ表示である。
【図８】
図８は、本発明の能力を提供し及び／又は使用するコンピュータ環境の一実施態様を表す。
【図９】
図９は、結合中心内に位置するコンビナトリアル・ライブラリーから得られた化合物と共に、Ｐ１、Ｐ２及びＰ３のポケットを有する標的タンパク質の結合部位の概念表示である。
【図１０】
図１０は、プラスモディウム・ファルシパルム（Ｐｌａｓｍｏｄｉｕｍｆａｌｃｉｐａｒｕｍ）から得られる標的タンパク質のプラスメプシン（ｐｌａｓｍｅｐｓｉｎ）ＩＩにドッキングされたコンビナトリアル・ライブラリーＰＬ７９２の化合物についてのクラスターの大きさを示すグラフである。
【図１１】
図１１Ａ〜図１１Ｆは、活性なコンフォメーションの調整記述子の集中し且つ縮尺した平均値（ｍｅａｎｃｅｎｔｅｒｅｄａｎｄｓｃａｌｅｄｖａｌｕｅ）を示すグラフである。

Claims

標的分子にリガンドをドッキングさせる方法であって、
ドッキング前のコンホーメーション調査を行なって該リガンドの複数の溶液コンホーメーションを作成する工程、
該標的分子の、複数のホットスポット群を含む結合部位画像を作成する工程、
該結合部位画像のホットスポット群を、該リガンドの複数の溶液コンホーメーションのうちの少なくとも一つの溶液コンホーメーション中の原子群に適合させて、リガンド−標的分子複合体形成において標的分子に関連する少なくとも一つのリガンド位置を得る工程、及び
該標的分子を固定して保持し、且つ該リガンドの並進、向き及び回転可能な結合を変更させながら少なくとも一つのリガンド位置を最適化する工程、
を含む方法。
該ドッキング前コンホーメーション調査を実行する工程が複数の溶液コンホーメーションのデータベースを作成する工程、及び該適合工程によりその後の使用のために該三次元データベースを保存する工程を含むものである、請求項１記載の方法。
複数の溶液コンホーメーションの該データベースがコンビナトリアルライブラリーのコンホーメーションデータベースを含むものである、請求項２記載の方法。
ドッキング前コンホーメーション調査を実行する該工程が、
該リガンドの均一に分布した複数のコンホーメーションを無作為に作成する工程、
潜在的に活性な各コンホーメーションの歪みを最小にする工程、
各コンホーメーションの歪み及び一つ以上の三次元記述子を用いて該潜在的に活性なコンホーメーションを序列付けする工程、及び
該コンホーメーションをクラスター化し、コンホーメーションの最上位クラスターの所望の数を保持する工程であって、該保持された数のコンホーメーションの最上位クラスターが該リガンドの複数の溶液コンホーメーションを含むものである工程、
を含むものである、請求項１記載の方法。
一つ以上の三次元記述子が極性溶媒接近可能表面積、無極性溶媒接近可能表面積、内部相互作用の数、回転の半径、及びそれらの組み合わせからなる群より選択されるものである、請求項４記載の方法。
該一つ以上の三次元記述子が極性溶媒接近可能表面積及び無極性溶媒接近可能表面積の組み合わせである、請求項４記載の方法。
該結合部位画像を作成する工程が、無極性原子が有利に結合する結合部位中の点を同定する無極性ホットスポットのリストを作成する工程、及び水素結合の供与体若しくは受容体が有利に結合する結合部位中の点を同定する極性ホットスポットのリストを作成する工程の少なくとも一つを含むものである、請求項１記載の方法。
該結合部位画像の作成工程が、
標的分子の結合部位の周りにグリッドを配置する工程、
該グリッドを用いてホットスポット調査容積を決定する工程、
ホットスポット調査容積のグリッド様調査を用いてホットスポットを決定する工程、及び
ホットスポットの各タイプについて、ホットスポット群をクラスター化しそして最良の評点をもつホットスポットの所望の数のクラスターを保持する工程であって、該所望の数のクラスターが該適合工程によって用いられる該複数のホットスポットを含むものである工程、
をさらに含む、請求項７記載の方法。
該適合工程が、
少なくとも一つの溶液コンホーメーションを剛体として結合部位画像中に配置することにより、該少なくとも一つの溶液コンホーメーションの原子群を標的分子の適当なホットスポット群に適合させる工程、
適合を規定する工程であって、該適合が独自の剛体変換を決定するものである工程、及び
該独自の剛体変換を用いて該リガンドの少なくとも一つの溶液コンホーメーションを該標的分子の結合部位中に配置する工程、
を含むものである、請求項１記載の方法。
独自の剛体変換を決定する該工程が、

上式中、
Ｈ_Ｊ＝標的分子のＪ番目のホットスポットであり、
Ａ_ｊ＝少なくとも一つの溶液コンホーメーションＪ番目の原子であり、
Ｒ＝３×３回転マトリックスであり、そして
Ｔ＝並進ベクトルである、
を最小にする独自の剛体変換を決定する工程を含むものである、請求項９記載の方法。
該最適化工程が複数の標的分子−リガンド複合体形成を最適化する工程を含むものであり、該最適化工程が
立体的衝突をもつリガンド原子の予め定めた百分率を有する各リガンド位置を削除する工程、
所望の原子評点切捨てを用い、二つ一組の原子評点を用いて残りのリガンド位置を序列付けする工程、
序列付けの後に、リガンド位置をクラスター化しそしてリガンド位置の最上位数ｎを選択する工程、及び
該リガンドの並進、回転及び回転可能な結合を変えながら、ｎ個の位置のそれぞれのリガンド位置を最適化する工程、
を含むものである、請求項１記載の方法。
該最適化工程が、単純な二つ一組の原子評点を用いＢＦＧＳ最適化アルゴリズムを用いて、該リガンドの並進、回転及び回転可能な結合を変えながら、ｎ個の位置の各リガンド位置を最適化する工程を含むものである、請求項１１記載の方法。
標的分子にリガンドをドッキングするためのシステムであって、
該リガンドの複数の溶液コンホーメーションを作成するためにドッキング前のコンホーメーション調査を実施する手段、
該標的分子の、複数のホットスポットを含む結合部位画像を作成する手段、
該標的分子と関連する少なくとも一つのリガンド位置を得るため、該リガンドの複数の溶液コンホーメーションの少なくとも一つの溶液コンホーメーション中の原子群に該結合部位画像のホットスポット群を適合させるための手段、及び
該標的分子を固定して保ちながら且つ該リガンドの並進、向き及び回転可能な結合を変えながら、少なくとも一つのリガンド位置を最適化するための手段、
を含むシステム。
ドッキング前コンホーメーション調査を実行するための該手段が複数の溶液コンホーメーションのデータベースを作成するための手段及び該適合工程によるその後の使用のため該三次元データベースを保存するための手段を含むものである、請求項１３記載のシステム。
複数の溶液コンホーメーションの該データベースがコンビナトリアルライブラリーのコンホーメーションデータベースを含むものである、請求項１４記載のシステム。
ドッキング前コンホーメーション調査を実行するための手段が、
該リガンドの複数の均一に分布したコンホーメーションを無作為に作成するための手段、
該複数の均一に分布したコンホーメーションの各コンホーメーションの歪みを最小化するための手段、
該コンホーメーションを序列付けするため各コンホーメーションの歪み及び溶媒接近可能表面積を用いるための手段、及び
該コンホーメーションをクラスター化しそして所望の数の最上位クラスターのコンホーメーションを保持するための手段であって、該保持された数の最上位クラスターのコンホーメーションがリガンドの該複数の溶液コンホーメーションを含むものである手段、
を含むものである、請求項１３記載のシステム。
結合部位画像を作成するための該手段が無極性原子が有利に結合する結合部位中の点を同定する無極性ホットスポットのリストを作成するための手段、及び水素結合の供与体若しくは受容体が有利に結合する結合部位中の点を同定する極性ホットスポットのリストを作成するための手段の少なくとも一つを含むものである、請求項１３記載のシステム。
ドッキング前コンホーメーション調査を実行する該手段が、
複数の、均一に分布したリガンドのコンホーメーションを無作為に作成する手段、
コンホーメーションそれぞれについて三次元記述子を用いて潜在的に活性なコンホーメーションを不活性なコンホーメーションから識別し、且つ、潜在的に活性なコンホーメーションを保持するための手段、
潜在的に活性なコンホーメーションそれぞれの歪みを最小にする手段、
潜在的に活性なコンホーメーションそれぞれの歪み及び溶媒接近可能表面積を用いて該潜在的に活性なコンホーメーションを序列付けするための手段、及び
該コンホーメーションをクラスター化し且つコンホーメーションの最上位クラスターの所望の数を保持するための手段であって、コンホーメーションの最上位クラスターの該保持数がリガンドの該複数の溶液コンホーメーションを含むものである手段、
を含むものである、請求項１３記載のシステム。
該三次元記述子が極性溶媒接近可能表面積、無極性溶媒接近可能表面積、内部相互作用の数、及び回転の半径からなる群より選択されるものである、請求項１８記載のシステム。
結合部位画像を作成するための手段が、
標的分子の結合部位の周りにグリッドを配置するための手段、
該グリッドを用いてホットスポット調査容積を決定する手段、
該ホットスポット調査容積のグリッド様調査を用いてホットスポットを決定する手段、及び
ホットスポットのタイプそれぞれについて、該ホットスポットをクラスター化し且つ最良の評点を持つホットスポットのクラスターの所望の数を保持するための手段であって、該クラスターの所望の数が該適合工程により採用されるべき該複数のホットスポットを含むものである手段、
をさらに含むものである、請求項１７記載の方法。
該適合させるための手段が、
少なくとも一つの溶液コンホーメーションを剛体として結合部位画像中に配置することにより該少なくとも一つの溶液コンホーメーションの原子群を該標的分子の適当なホットスポットに適合させるための手段、
適合を規定する手段であって、該適合が独自の剛体変換を決定するものである手段、及び
該独自の剛体変換を用いて該リガンドの少なくとも一つの溶液コンホーメーションを該標的分子の結合部位中に配置するための手段、
を含むものである、請求項１３記載のシステム。
独自の剛体変換を決定する該手段が下記の関数

上式中、
Ｈ_ｊ＝標的分子のｊ番目のホットスポット、
Ａ_ｊ＝少なくとも一つの溶液コンホーメーションのｊ番目の原子、
Ｒ＝３×３回転マトリックス、及び
Ｔ＝並進ベクトル、
を最小にする独自の剛体変換を決定する手段を含むものである、請求項２１記載のシステム。
該最適化手段が複数の標的分子−リガンド複合体形成を最適化する手段を含むものであり、該最適化手段が、
立体的衝突を有するリガンド原子の予め定められた百分率を持つ各リガンド位置を消去するための手段、
所望の原子評点切捨てを有する二つ一組の原子評点を用いて残りのリガンド位置を序列付けするための手段、
序列付けの後、該リガンド位置をクラスター化し且つリガンド位置の最上位数ｎを選択するための手段、及び
該リガンドの並進、回転及び回転可能な結合を変えながら、該ｎ個の位置の各リガンド位置を最適化する手段、
を含むものである、請求項１３記載のシステム。
該最適化手段が、リガンドの並進、回転、及び回転可能な結合を変えながら、単純な二つ一組の原子評点を用いＢＦＧＳ最適化アルゴリズムを用いてｎ個の位置の各リガンド位置を最適化するための手段を含むものである、請求項２３記載のシステム。
標的分子にリガンドをドッキングさせる方法であって、
該リガンドの複数の溶液コンホーメーションを作成するためドッキング前コンホーメーション調査を実行する工程、
該標的分子の、複数のホットスポットを含む結合部位画像を作成する工程、
該結合部位画像のホットスポットを該リガンドの複数の溶液コンホーメーションの少なくとも一つの溶液コンホーメーション中の原子群に適合させて、該標的分子に関連する少なくとも一つのリガンド位置を得る工程、及び
該標的分子を固定して保持し且つ該リガンドの並進、向き、及び回転可能な結合を変えながら、少なくとも一つのリガンド位置を最適化する工程、
を含む方法を実行するため、機械により実行可能な指令の少なくとも一つのプログラムを具体的に具現化する、該機械により読み取り可能な少なくとも一つのプログラム記憶装置。
ドッキング前コンホーメーション調査の該実行工程が複数の溶液コンホーメーションのデータベースを作成する工程及び該適合工程によるその後の使用のため該三次元データベースを記憶する工程を含むものである、請求項２５記載の少なくとも一つのプログラム記憶装置。
複数の溶液コンホーメーションの該データベースがコンビナトリアルライブラリーのコンホーメーションデータベースを含むものである、請求項２６記載の少なくとも一つのプログラム記憶装置。
ドッキング前コンホーメーション調査の該実行が、
該リガンドの均一に分布した複数のコンホーメーションを無作為に作成する工程、
該複数の均一に分布したコンホーメーションの各コンホーメーションの歪み及び溶媒接近可能表面積を最小にする工程、
各コンホーメーションの歪みを用いて該コンホーメーションを序列付けする工程、及び
該コンホーメーションをクラスター化し且つコンホーメーションの最上位クラスターの所望の数を保持する工程であって、コンホーメーションの最上位クラスターの該保持数がリガンドの該複数の溶液コンホーメーションを含むものである工程、
を含むものである、請求項２５記載の少なくとも一つのプログラム記憶装置。
結合部位画像を作成する該工程が無極性原子が有利に結合する結合部位中の点を同定する無極性ホットスポットのリストを作成する工程、及び水素結合の供与体若しくは受容体が有利に結合する結合部位中の点を同定する極性ホットスポットのリストを作成する工程の少なくとも一つを含むものである、請求項２５記載の少なくとも一つのプログラム記憶装置。
ドッキング前コンホーメーション調査を実行する該工程が、
該リガンドの均一に分布した複数のコンホーメーションを無作為に作成する工程、
各コンホーメーションについての三次元記述子を用いて潜在的に活性なコンホーメーションを不活性なコンホーメーションから識別する工程、及び潜在的に活性なコンホーメーションを保持する工程、
潜在的に活性なコンホーメーションそれぞれの歪みを最小にする工程、
潜在的に活性なコンホーメーションそれぞれの歪み及び溶媒接近可能表面積を用いて該潜在的に活性なコンホーメーションを序列付けする工程、及び
該コンホーメーションをクラスター化し且つコンホーメーションの最上位クラスターの所望の数を保持する工程であって、コンホーメーションの最上位クラスターの該保持数がリガンドの該複数の溶液コンホーメーションを含むものである工程、
を含むものである、請求項２５記載の装置。
該三次元記述子が極性溶媒接近可能表面積、無極性溶媒接近可能表面積、内部相互作用の数、及び回転の半径からなる群より選択されるものである、請求項３０記載の装置。
結合部位画像を作成する該工程が、
該標的分子の結合部位の周りにグリッドを配置する工程、
該グリッドを用いてホットスポット調査容積を決定する工程、
該ホットスポット調査容積のグリッド様調査を用いてホットスポットを決定する工程、及び
ホットスポットの各タイプについて、該ホットスポットをクラスター化し且つ最良の評点を有するホットスポットのクラスターの所望の数を保持する工程であって、該クラスターの所望の数が該適合工程により採用されるべき該複数のホットスポットを含むものである工程、
をさらに含むものである、請求項２９記載の少なくとも一つのプログラム記憶装置。
該適合工程が、
該少なくとも一つの溶液コンホーメーションを剛体として該結合部位画像中に配置することにより、該少なくとも一つの溶液コンホーメーションの原子群を該標的分子の適当なホットスポットに適合させる工程、
適合を規定する工程であって、該適合が独自の剛体変換を決定するものである工程、及び
該独自の剛体変換を用いて該リガンドの少なくとも一つの溶液コンホーメーションを該標的分子の結合部位中に配置する工程、
を含むものである、請求項２５記載の少なくとも一つのプログラム記憶装置。
独自の剛体変換を決定する該工程が下記の関数、

上式中、
Ｈ_ｊ＝標的分子のｊ番目のホットスポット、
Ａ_ｊ＝少なくとも一つの溶液コンホーメーションのｊ番目の原子、
Ｒ＝３×３回転マトリックス、及び
Ｔ＝並進ベクトル、
を最小にする独自の剛体変換を決定する工程を含むものである、請求項３３記載の少なくとも一つのプログラム記憶装置。
該最適化工程が複数の標的分子−リガンド複合体の形成を最適化する工程を含むものであり、該最適化工程が
立体的衝突を有するリガンド原子の予め定められた百分率を有する各リガンド位置を消去する工程、
所望の原子評点切捨てを有する二つ一組の原子評点を用いて残りのリガンド位置を序列付けする工程、
序列付けの後、該リガンド位置をクラスター化し且つリガンド位置の最上位数ｎを選択する工程、及び
該リガンドの並進、回転、及び回転可能な結合を変えながらｎ個の位置の各リガンド位置を最適化する工程、
を含むものである、請求項２５記載少なくとも一つのプログラム記憶装置。
該最適化工程が単純な二つ一組の原子評点を用いＢＦＧＳ最適化アルゴリズムを用いて、該リガンドの並進、回転、及び回転可能な結合を変えながら、ｎ個の位置の各リガンド位置を最適化する工程を含むものである、請求項２５記載の少なくとも一つのプログラム記憶装置。
少なくとも一つの結合部位を有する標的分子に対する相補性についてコンビナトリアルライブラリーを評価する方法であって、該コンビナトリアルライブラリーが複数のリガンドを含むものであり、該リガンドがそれぞれ共通のコアに基づくものであり、該方法が、
該標的分子に該複数のリガンドの各リガンドをドッキングさせて、複数のリガンド−標的分子複合体形成における標的分子に関連する複数のリガンド位置を形成する工程であって、該複数のリガンド位置が該標的分子に関連する複数の共通のコア位置を含むものである工程、
該複数の共通コア位置の各共通コア位置の他の共通コア位置からの２乗平均偏差を決定する工程、及び
該２乗平均偏差に従ってクラスターを形成する工程、
を含むものである方法。
コンビナトリアルライブラリー中のリガンドの数に関連する最小２乗平均偏差を有するクラスターにおけるリガンドの数に従って該標的分子への該コンビナトリアルライブラリーの相補性を評価する工程をさらに含む、請求項３７記載の方法。
２乗平均偏差を決定する該工程が、
該標的分子の結合部位の周りにグリッドを配置する工程、
各リガンド位置について、共通コアの重心に相当するグリッド上の位置を決定する工程、及び
予め定められた距離内でグリッド上に位置を有するあらゆる他の共通コア位置から各共通コア位置までの２乗平均偏差を決定する工程、
を含むものである、請求項３７記載の方法。
クラスターを形成する該工程が単結合クラスター化アルゴリズムを用いてクラスターを形成する工程を含むものである、請求項３７記載の方法。
各リガンドをドッキングする工程が、
ドッキング前コンホーメーション調査を行なって各リガンドの複数の溶液コンホーメーションを形成する工程、
該標的分子の、複数のホットスポットを含む結合部位画像を作成する工程、
結合部位のホットスポット群を各リガンドの複数の溶液コンホーメーションの少なくとも一つの溶液コンホーメーション中の原子群に適合させる工程であって、リガンド−標的分子複合体形成における該標的分子に関連する少なくとも一つのリガンド位置を得る工程、及び
該標的分子を固定して保持しながら且つ該リガンドの並進、向き、及び回転可能な結合を変えながら、該少なくとも一つのリガンド位置を最適化する工程、
を含むものである、請求項３７記載の方法。
少なくとも一つの結合部位を有する標的分子への相補性について複数のコンビナトリアルライブラリーを比較する方法であって、該複数のコンビナトリアルライブラリーのそれぞれが複数のリガンドを含むものであり、該リガンドのそれぞれが共通コアに基づくものであり、該方法が
コンビナトリアルライブラリーのそれぞれについて、複数のリガンドの各リガンドを該標的分子にドッキングさせて複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンド位置を形成させる工程であって、該複数のリガンド位置が該標的分子に関連する複数の共通コア位置を含むものである工程、
該複数の共通コア位置の他の共通コア位置から各共通コア位置までの２乗平均偏差を決定する工程、
該２乗平均偏差に従ってクラスターを形成する工程、及び
各コンビナトリアルライブラリーにおけるリガンドの総数と比べた該クラスターの最上位クラスターにおけるリガンドの数に従って、複数のコンビナトリアルライブラリーを序列付けする工程、
を含むものである方法。
該序列に従って生体標的（ｂｉｏｔａｒｇｅｔ）に対する活性について各コンビナトリアルライブラリーの高処理量スクリーニングに優先順位を付ける工程をさらに含む、請求項４２記載の方法。
少なくとも一つの結合部位を有する標的分子に対する相補性についてコンビナトリアルライブラリーを評価するシステムであって、該コンビナトリアルライブラリーが複数のリガンドを含むものであり、該リガンドが共通のコアに基づくものであり、該システムが、
複数のリガンドのうちの各リガンドを標的分子にドッキングさせて複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンド位置を作成するための手段であって、該複数のリガンド位置が該標的分子に関連する複数の共通のコア位置を含むものである手段、
該複数の共通コア位置の他の共通のコア位置から各共通のコア位置までの２乗平均偏差を決定するための手段、及び
該２乗平均偏差に従ってクラスターを形成するための手段、
を含むものであるシステム。
コンビナトリアルライブラリーにおけるリガンドの数に関連して最小２乗平均偏差を有するクラスターにおけるリガンドの数に従って標的分子に対するコンビナトリアルライブラリーの相補性を評価するための手段をさらに含む、請求項４４記載のシステム。
２乗平均偏差を決定するための該手段が、
標的分子の結合部位の周りにグリッドを配置する手段、
各リガンド位置について、共通コアの重心に相当するグリッド上に位置を決定する手段、及び
予め定められた距離内でグリッド上に位置を有する他の共通コア位置のすべてから各共通コア位置までの２乗平均偏差を決定する手段、
を含むものである、請求項４４記載のシステム。
クラスターを形成するための該手段が単結合クラスター化アルゴリズムを用いるクラスター形成手段を含むものである、請求項４４記載のシステム。
各リガンドをドッキングするための該手段が、
ドッキング前コンホーメーション調査を実行して各リガンドの複数の溶液コンホーメーションを作成する手段、
該標的分子の、複数のホットスポットを含む結合部位画像を作成する手段、
結合部位画像のホットスポット群を各リガンドの複数の溶液コンホーメーションの少なくとも一つの溶液コンホーメーション中の原子群に適合させて、リガンド−標的分子複合体形成において該標的分子に関連する少なくとも一つのリガンド位置を得る手段、及び
該標的分子を固定して保持しながら、且つ該リガンドの並進、向き、及び回転可能な結合を変えながら、少なくとも一つのリガンド位置を最適化する手段、
を含むものである、請求項４４記載のシステム。
少なくとも一つの結合部位を有する標的分子に対する相補性について複数のコンビナトリアルライブラリーを比較するためのシステムであって、該複数のコンビナトリアルライブラリーのそれぞれが複数のリガンドを含むものであり、各リガンドがそれぞれ共通のコアに基づいており、該方法が
各コンビナトリアルライブラリーについて、複数の該リガンドの各リガンドを該標的分子にドッキングさせて複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンド位置を作成するための手段であって、該複数のリガンド位置が該標的分子に関連する複数の共通コア位置を含むものである手段、
該複数の共通コア位置の他の共通コア位置から各共通のコア位置までの２乗平均偏差を決定する手段、
該２乗平均偏差に従ってクラスターを形成する手段、及び
各コンビナトリアルライブラリーにおけるリガンドの総数と比べた該クラスターの最上位クラスターにおけるリガンドの数に従って複数のコンビナトリアルライブラリーを序列付けするための手段、
を含むものであるシステム。
該序列付けに従って生体標的に対する活性について各コンビナトリアルライブラリーの高処理量スクリーニングに優先順位を付けるための手段をさらに含む、請求項４９記載のシステム。
機械により実行可能な指令の少なくとも一つのプログラムを具体的に具現化して、少なくとも一つの結合部位を有する標的分子に対する相補性についてコンビナトリアルライブラリーを評価する方法を実行する、機械により読み取り可能な少なくとも一つのプログラム記憶装置であって、該コンビナトリアルライブラリーが複数のリガンドを含むものであり、該リガンドのそれぞれが共通のコアに基づくものであり、該方法が、
該標的分子に複数のリガンドの各リガンドをドッキングさせて複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンド位置を作成する工程であって、該複数のリガンド位置が該標的分子に関連する複数の共通コア位置を含むものである工程、
該複数の共通コア位置の他の共通コア位置から各共通コア位置までの２乗平均偏差を決定する工程、及び
該２乗平均偏差に従ってクラスターを形成する工程、
を含むものである装置。
該方法が、該コンビナトリアルライブラリーにおけるリガンドの数と比べ最小の２乗平均偏差を有するクラスターにおけるリガンドの数に従って、該標的分子へのコンビナトリアルライブラリーの相補性を評価する工程をさらに含むものである、請求項５１記載の少なくとも一つのプログラム記憶装置。
２乗平均偏差を決定する該工程が
該標的分子の結合部位の周りにグリッドを配置する工程、
各リガンド位置について、共通コアの重心に相当するグリッド上の位置を決定する工程、及び
予め定められた距離内でグリッド上に位置を有するすべての他の共通コア位置から各共通コア位置までの２乗平均偏差を決定する工程、
を含むものである、請求項５１記載の少なくとも一つのプログラム記憶装置。
該クラスターを形成する工程が単結合クラスター化アルゴリズムを用いてクラスターを形成する工程を含むものである、請求項５１記載の少なくとも一つのプログラム記憶装置。
該各リガンドをドッキングさせる工程が、
ドッキング前コンホーメーション調査を実行して各リガンドの複数の溶液コンホーメーションを作成する工程、
該標的分子の、複数のホットスポットを含む結合部位画像を作成する工程、
該結合部位画像のホットスポット群を各リガンドの複数の溶液コンホーメーションの少なくとも一つの溶液コンホーメーション中の原子群に適合させて、リガンド−標的分子複合体形成における該標的分子に関連する少なくとも一つのリガンド位置を得る工程、及び
該標的分子を固定して保持しながら、且つ該リガンドの並進、向き、及び回転可能な結合を変えながら、少なくとも一つのリガンド位置を最適化する工程、
を含むものである、請求項５１記載の少なくとも一つのプログラム記憶装置。
少なくとも一つの結合部位を有する標的分子に対する相補性について複数のコンビナトリアルライブラリーを比較する方法を実行するために、機械により実行可能な指令の少なくとも一つのプログラムを具体的に具現化する、機械により読み取り可能な少なくとも一つのプログラム記憶装置であって、該複数のコンビナトリアルライブラリーのそれぞれが複数のリガンドを含むものであり、該リガンドがそれぞれ共通のコアに基づくものであり、該方法が
コンビナトリアルライブラリーのそれぞれについて、該標的分子に該複数のリガンドの各リガンドをドッキングさせて、複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンド位置を作成する工程であって、該複数のリガンド位置が該標的分子に関連する複数の共通コア位置を含むものである工程、
該複数の共通コア位置の他の共通コア位置からそれぞれの共通コア位置までの２乗平均偏差を決定する工程、
該２乗平均偏差に従ってクラスターを形成する工程、及び
各コンビナトリアルライブラリーにおけるリガンドの総数と比べ、該クラスターの最上位クラスターにおけるリガンドの数に従って複数のコンビナトリアルライブラリーを序列付けする工程、
を含むものである装置。
該序列付けに従って生体標的に対する活性について各コンビナトリアルライブラリーの高処理量スクリーニングに優先順位を付ける工程をさらに含む、請求項５６記載の少なくとも一つのプログラム記憶装置。