JP2005508487A - 生体標的に対するコンビナトリアル・ライブラリーの相補性を評価するための分子ドッキング法 - Google Patents
生体標的に対するコンビナトリアル・ライブラリーの相補性を評価するための分子ドッキング法 Download PDFInfo
- Publication number
- JP2005508487A JP2005508487A JP2002511229A JP2002511229A JP2005508487A JP 2005508487 A JP2005508487 A JP 2005508487A JP 2002511229 A JP2002511229 A JP 2002511229A JP 2002511229 A JP2002511229 A JP 2002511229A JP 2005508487 A JP2005508487 A JP 2005508487A
- Authority
- JP
- Japan
- Prior art keywords
- ligand
- target molecule
- conformation
- conformations
- binding site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/04—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length on carriers
- C07K1/047—Simultaneous synthesis of different peptide species; Peptide libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/20—Protein or domain folding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
- G16C20/64—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medicinal Chemistry (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Library & Information Science (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Pharmacology & Pharmacy (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
結合するリガンドを同定し最後に医薬化合物を同定するためのコンビナトリアルライブラリーをスクリーニングするための高速大量処理が可能な分子ドッキング法が提供される。この方法はドッキング前コンホーメーション調査を用いてリガンドの複数の溶液コンホーメーションを作成する。この分子ドッキング法は、標的分子の結合部位画像を作成する工程、該結合部位画像のホットスポット群を、該リガンドの複数の溶液コンホーメーションのうちの少なくとも一つの溶液コンホーメーション中の原子群に適合させて、リガンド−標的分子複合体形成において標的分子に関連する少なくとも一つのリガンド位置を得る工程、及び該標的分子を固定し、該リガンドの並進、向き及び回転可能な結合を変更させながら少なくとも一つのリガンド位置を最適化する工程、を含む方法である。ドッキングの結果は二つのドッキングした分子のコアの間のrms偏差を指標として分類される。
Description
【0001】
発明の分野
本出願は、高速大量処理分子ドッキング技法を用いて、スクリーニング用のコンビナトリアル・ライブラリーの相補性を評価しそしてその選択に優先順位をつけるための計算方法に関する。
【0002】
発明の背景
コンビナトリアル化学並びにその結果もたらされた広範囲の標的に対する膨大な化合物を合成する能力の出現と共に、スクリーニングの活動に効率的に優先順位をつける能力が、与えられた標的についての化学空間(chemical space)の適切な領域を迅速に確認するために重要であることが明らかになった。コンビナトリアル化学及び高速大量処理スクリーニングの能力が与えられると、合理的な設計ツールを専ら使用してリード化合物を作製することはもはや必要でない。しかしながら、現在合成により得られうる化学空間の容量のために、あらゆる可能性のある化合物を適切にサンプリングすることは不可能であり、従ってコンビナトリアル化学という模範例を用いた場合でさえ、何らかの「合理的な」意思決定が要求される。例えば、化学空間の正確な領域(溶解性、形状、腸管吸収、及び他の性質などの物理的性質を用いて定義される)について迅速に焦点を当てることが重要である。効率的な優先順位決定手段により、科学者は費用効率が高く且つ能率的な様式でリードを得ることができ、活発な合成及び生物分析を行なう前に新規な標的に対するバーチャル・ライブラリーを試験することもでき、それにより経費を削減できるであろう。その上、今後のヒトのゲノム及び多数のゲノムの完全配列決定から予期される標的の来るべき激増により、資源は、活性化合物が得られそうにない化学空間の無駄なスクリーニング範囲でないことが絶対的となる。コンビナトリアル化学の出現で生じた新たな挑戦は、次に、コンビナトリアル・ライブラリーのこの選択に優先順位をつけることである。
【0003】
スクリーニングの活動に優先順位をつける方法は、該標的にドッキングされ且つ採点機能により序列付けされたライブラリー又はコレクションの個々の化合物を使用する。次いで、ライブラリー全体ではなく高位に序列付けされた化合物の部分集合が活性について検定されうる。この方法は個々の化合物を試験すべく選択するためのガイドとして有用であることが証明された一方で、コンビナトリアル・ライブラリーのスクリーニング活動に優先順位をつける方法、即ち、個々の化合物を序列付けするのではなく、化合物のコンビナトリアル・ライブラリーを序列付けする方法が依然必要である。
【0004】
発明の概要
簡潔に要約すれば、一側面において、標的分子にリガンドをドッキングする方法が本明細書で提示される。この方法は、ドッキング前にコンフォメーション調査を実施し該リガンドの複数の溶液コンフォメーションを作成する工程、複数のホットスポット(定義は段落0035にある)を含む、該標的分子の結合部位画像を作成する工程、該リガンドの複数の溶液コンフォメーションのうち少なくとも一つの溶液コンフォメーション中の原子群に該結合部位画像のホットスポット群を適合させ該標的分子に関連する少なくとも一つのリガンドの位置を得る工程、並びに該標的分子自体を固定させたままにし且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら、少なくとも一つのリガンドの位置を最適化する工程を含む。
【0005】
別の一側面において、標的分子にリガンドをドッキングするシステムが提供される。このシステムは、リガンドの複数の溶液コンフォメーションを作成するためにドッキング前にコンフォメーション調査を実施する手段を含む。更に、該システムは、標的分子の、複数のホットスポットを含む結合部位画像を作成する手段、並びに該標的分子に関連する少なくとも一つのリガンドの位置を得るために該リガンドの複数の溶液コンフォメーションのうちの少なくとも一つの溶液コンフォメーションにおける原子群に該結合部位画像のホットスポット群を適合させる手段を含む。該標的分子を固定したままに保持し且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら少なくとも一つのリガンドの位置を最適化するための最適化機構も提供される。
【0006】
更なる一側面において、本発明は機械により読取り可能な少なくとも一つのプログラム記憶装置を含む。この装置は標的分子にリガンドをドッキングする方法を実施するために該機械により実行可能な命令の少なくとも一つのプログラムを明確に具現する。該方法は、ドッキング前のコンフォメーション調査を実施し該リガンドの複数の溶液コンフォメーションを作成する工程、該標的分子の、複数のホットスポットを含む結合部位画像を作成する工程、該リガンドの複数の溶液コンフォメーションのうち少なくとも一つの溶液コンフォメーションにおける原子群に該結合部位画像のホットスポット群を適合させ該標的分子に関連する少なくとも一つのリガンドの位置を得る工程、並びに該標的分子を固定させたままにし且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら少なくとも一つのリガンドの位置を最適化する工程を含む。
【0007】
別の一側面において、本発明は標的分子に対する相補性についてコンビナトリアル・ライブラリーを評価する方法に関する。このライブラリーは共通のコア(core)を有する複数のリガンドを含む。該方法は該標的分子に複数のリガンドの個々のリガンドをドッキングして複数のリガンド−標的複合体形成における該標的分子に関連する複数のリガンドの位置を作成する工程であって複数のリガンドの位置は該標的分子に関連する複数の共通コアの位置を含むものである工程、他の共通コアの位置から複数の共通コアの位置の個々の共通コアの位置までの2乗平均偏差を決定する工程、並びに該2乗平均偏差に従ってクラスターを形成する工程を含む。
【0008】
別の一側面において、本発明は少なくとも一つの結合部位を有する標的に対する相補性についてコンビナトリアル・ライブラリーを評価するシステムに関する。該コンビナトリアル・ライブラリーはそれぞれが共通コアに基づいた複数のリガンドを含む。このシステムは、複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンドの位置を形成するための該標的分子に複数のリガンドの個々のリガンドをドッキングする手段であって複数のリガンドの位置が該標的分子に関連する複数の共通コアの位置を含むものである手段、他の共通コアの位置から複数の共通コアの位置の個々の共通コアの位置までの2乗平均偏差を決定する手段、並びに該2乗平均偏差に従ってクラスターを形成する手段を含む。
【0009】
更なる別の一側面において、本発明は機械により読取り可能な少なくとも一つのプログラム記憶装置に関する。該装置は少なくとも一つの結合部位を有する標的に対する相補性についてコンビナトリアル・ライブラリーを評価する方法を実施するために該機械により実行可能な命令の少なくとも一つのプログラムを明確に具現する。該コンビナトリアル・ライブラリーはそれぞれが共通コアに基づいた複数のリガンドを含む。該方法は複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンドの位置を作成するために該標的分子に複数のリガンドの個々のリガンドをドッキングする工程であって複数のリガンドの位置が該標的分子に関連する複数の共通コアの位置を含むものである工程、他の共通コアの位置から複数の共通コアの位置の個々の共通コアの位置までの2乗平均偏差を決定する工程、並びに該2乗平均偏差に従ってクラスターを形成する工程を含む。
【0010】
本明細書で提示するドッキング方法は幾つかの利点を有する。第一に、これは幾つかの独立した要素から構築される。これは科学進歩をより巧みに駆使することを可能とする。例えば、より優れたコンフォメーション調査手法(現文脈において、これはより生物学的に適切な三次構造体を意味する)が利用できるようになると、現行のコンフォメーション調査手法に代えて新しい三次元データベースの作成を使用できる。第二に、リガンドの可変性へのこの取り組みはコンビナトリアル方法により合成される化合物の部類により適している。コンビナトリアル・ライブラリーから得られる化合物はしばしば明瞭なアンカー断片を有していない。該リガンドからアンカー断片を見出しドッキングすることは漸進的構造アルゴリズム(incremental construction algorithm)において重要な工程であるので、これらのアルゴリズムはコンビナトリアル・ライブラリーで普通に見出される化合物について困難に遭遇する。(漸進的構造アルゴリズムはおおよそ下記のように作業する:リガンドを固定(rigid)断片に分割し、これらの断片のうち最大の断片を標的分子の結合部位にドッキングし、そして次に該リガンドを、適切な断片を付着させ該回転可能な結合の周囲を体系的に調査することにより結合部位に再構築する。該手法は、エム・レアリー、ビイ・クラメール、ティ・レンガウル、&ジイ・クレーブ、「漸進的構築アルゴリズムを用いる迅速可変的ドッキング方法」、J. Molecular Biology、261(1996)、470−489頁;及びエス・マキノ&アイ・クンツ、「自動可変的リガンドドッキング方法及びデータベース調査へのその適用」、J. Computational Chemistry、18(1997)、1812−1825頁)。)でさらに記載される。コンフォメーション全体のドッキングはこの困難を克服する。その上、効率的で柔軟な最適化工程を含むことは該コンフォメーション調査手法からかなりの負担を取除く。エネルギー最小化アルゴリズムの更なる改良も利用できるようになれば活用できる。
【0011】
本明細書におけるリガンドの可変性へのアプローチは、最初のコンフォメーション調査への信頼がもとで不利とみなされうるであろう。先に示したように、最大効率を達成するために、該コンフォメーション調査はライブラリー又はコレクション全体について一度は実施されるべきであり、得られたコンフォメーションは更なる使用のために保存されるべきである。大規模なコレクションでは、これはコンピュータ使用時間及びディスク空き容量の両方にかなりの投資となるであろう。データベースは通常何度も使用されるので、該コンフォメーション調査のための初期コンピュータ使用時間は容易に正当化され得る。更に、並列コンピュータ及びより高速のCPUを使用すると、該コンフォメーション調査は適度な量の時間で完了し又は時折やり直すことができる。ディスクの大きさは今やテラバイトのレベルに迫っているので、数百万の化合物のコンフォメーションを記憶することは全く問題ない。
【0012】
上述した本発明の目的、利点及び特性、並びに他は、添付の図面と併せて考慮されると、本発明のいくつかの好ましい実施態様の下記の詳細な記載からより容易に理解されるであろう。
【0013】
発明の詳細な説明
本発明は標的分子に対する相補性についてコンビナトリアル・ライブラリーを評価する方法に関する。本方法において、該ライブラリーの個々のリガンドは該標的分子にドッキングされ該標的に関連するリガンドの位置を形成する。個々のリガンドについて、該ライブラリーにおける他のリガンドの共通コアの位置から各リガンドの共通コアの位置までの2乗平均偏差が次いで決定される。最後に、該データをクラスター分析により体系化する。ここで、クラスターは該リガンドの共通コア間の2乗平均偏差に従って形成され、該ライブラリーは最上位クラスターのリガンドの相対数に従って序列付けられる。
【0014】
本発明の方法を用いてスクリーニングされうる該コンビナトリアル・ライブラリーは、一般的に、該標的に潜在的に結合する数千の化合物を含み、それ故に「リガンド」と呼ばれる。これらのライブラリーは、限られた数の位置に付いた置換基により変わる基本的な化学構造の周囲に構築される。該基本的な化学構造は本発明の目的上「共通コア」と称される。例えば、アスパルチル・プロテアーゼ阻害剤ライブラリーの共通コアは図9に示される。多数の異なるシントンは所定の位置で置換され、数万から数百万の化合物を含むライブラリーを生ずる。例えば、図9の構造において、R1 、R2 及びR3 は種々のシントンが置換されうる位置を示している。
【0015】
該ライブラリー、とりわけタンパク質及びヌクレオチドのリガンドに結合し得る標的分子は任意の生化学的な分子でありうる。本発明の方法は、具体的にはタンパク質の使用、とりわけ構造のデータ(一般的に結晶データ)が利用できるタンパク質についての使用を意図する。潜在的な結合部位は通常目視検査により構造中で同定される。
【0016】
本発明の方法において、個々のリガンドは該標的分子にドッキングされる。ドッキング手法は該標的分子に関連する個々のリガンドに対して少なくとも一つの位置を作成する。この場合、該リガンドは該標的上の相補的な結合点に適合する。好ましいドッキング手法は下記の工程を含む。即ち、ドッキング前のコンフォメーション調査を実施し各リガンドの複数の溶液コンフォメーションを作成する工程、該標的分子の結合部位画像を作成する工程、各リガンドの複数の溶液コンフォメーションのうち少なくとも一つの溶液コンフォメーションにおける原子群に該結合部位画像のホットスポット群を適合させ該標的分子に関連する少なくとも一つのリガンドの位置を得る工程、並びに該標的分子を固定させたままにし且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら該リガンドの位置を最適化する工程である。
【0017】
該ドッキング手法はタンパク質−リガンド複合体形成の概念像に基づいている(図1A〜図1Cを参照)。最初に、該リガンド(L)は溶液中で多数のコンフォメーションをとる。該タンパク質(P)はこれらのコンフォメーションのうち一つ又は数個を認識する。認識すると、該リガンド、タンパク質及び溶媒は局部エネルギー地形に従い最終的な複合体を形成する。該手法はタンパク質標的の用語で記載されるが、同工程は該標的がヌクレオチド等のタンパク質以外の生体分子である場合にも実施されうる。
【0018】
標的分子/リガンド複合体形成のこの単純な図は下記のように効率的な計算モデルに変換される。最初の溶液コンフォメーションは簡単なコンフォメーション調査手法を用いて作成される。この技法のコンフォメーション調査部分はドッキング工程全体の一部としてみなされるかも知れないが、それはリガンドのみに関連するので、純粋なドッキング工程から切り離すことができる。これは、分子コレクションについてのコンフォメーションの三次元データベースが容易に作成でき多くのドッキング研究で使用するために保存できるので正しいと判断できる(例えば触媒を用いて、エイ・スメリイ、エス・ディ・カーン、エス・エル・テイグ、「コンフォメーション範囲の分析1。範囲の検証及び評価」、J. Chem. Inf. Comput. Sci. (1995)、235巻、285−294頁、及びエイ・スメリイ、エス・ディ・カーン、エス・エル・テイグ、「コンフォメーション範囲の分析2。コンフォメーションモデルの適用」、J. Chem. Inf. Comput. Sci. (1995)、235巻、295−304頁参照)。この認識段階は該リガンドの原子群を該結合部位の「ホットスポット群」との相互作用に適合させることによりモデル化される。最終的な複合体の形成は単純なエネルギー関数を用いた勾配に基づく最適化技法を用いてモデル化される。この最終段階の間に、該リガンドの並進、向き、及び回転可能な結合は該標的分子及び溶媒を固定させたままにしながら変更できる。
【0019】
ほとんどのドッキング方法は二つの大まかに定義された範疇、即ち、(1)オートドック(AutoDock)(グッドフォード,ピイ・ジェイ「生物学的に重要な高分子についてエネルギー的に好ましい結合部位を決定する計算手法」,Journal of Medicinal Chemistry,1985,28(7)巻,849−857頁、グッドセール,ディ・エスとエイ・ジェイ・オルソン「模擬アニーリングによるタンパク質への基質の自動ドッキング」,PROTEINS: Structure, Function and Genetics,1990,8巻,195−202頁)、GOLD(ジョ―ンズ,ジイら「可変的ドッキングについての一般アルゴリズムの開発及び検証」,Journal of Molecular Biology,1997,267巻,727−748頁)、TABU(ウェストヘッド,ディ・アール、ディ・イー・クラーク、及びシイ・ダブリュ・ムレイ「分子ドッキングについての発見的調査アルゴリズムの比較」,Journal of Computer−Aided Molecular Design,1997,11巻,209−228頁、及びバクスター,シイ・エイら「タブ(Tabu)調査を用いた可変的ドッキング及び結合親和性の実証的評価」,PROTEINS: Structure, Function,and Genetics、1998、33巻、367−382頁)、並びに補正を用いた確率的概算(SAS)(ディラー,ディ・ジェイとシイ・エル・エム・ジェイ・ベルリンデ「分子ドッキングのための幾つかの国際的最適化アルゴリズムについての批評」,Journal of Computational Chemistry,1999,20巻(16),1740−1751頁)などの確立論的方法、又は(2)例えば、DOCK(クンツ,アイ・ディら「高分子−リガンド相互作用への幾何学的アプローチ」,Journal of Molecular Biology,1982,161巻,269−288頁、クンツ,アイ・ディ「薬物の設計及び発見のための構造に基づく戦略」,Science,1992,257巻,1078−1082頁、マキノ・エスとアイ・ディ・クンツ「自動可変的リガンドドッキング方法及びデータベース調査へのその適用」,Journal of Occupational Chemistry,1997,18(4)巻,1812−1825頁)、FlexX(レアリー,エムら「漸進的構造アルゴリズムを用いた迅速可変的ドッキング方法」,Journal of Molecular Biology,1996,261巻,470−489頁、レアリー,エム、ビイ・クラメール、及びティ・レンガウル「粒子の概念:タンパク質−リガンドドッキング予測の間に個別の水分子を配置する」,PROTEINS: Structure, Function, and Genetics,1999,34巻,17−28頁、レアリー・エム、ビイ・クラメール、及びティ・レンガウル「相互作用に基づく適応アルゴリズムを用いた疎水性リガンドのドッキング」,Bioinformatics,1999,15(3)巻,243−250頁)、及びハンマーヘッド(ウェルチ,ダブリュ、ジェイ・ルペルト、及びエイ・エヌ・ジェイン「ハンマーヘッド:タンパク質結合部位への可変的リガンドの迅速全自動ドッキング」,Chemistry&Biology,1996,3(6)巻,449−462頁)などのコンビナトリアル方法の一つに分類できる。
【0020】
該確率論的方法は、しばしばより正確な結果を与える一方で、通常非常に遅いため大規模なデータベースを調査することはできない。本明細書で提示される方法はコンビナトリアル群に該当する。このアプローチは、該リガンドと受容体との相互作用を適合させようと試みる点でFlexX及びハンマーヘッドに類似している。このアプローチはどのように該リガンドの可変性を処理するかという点でこれらの技法及び他の大部分のドッキング技法と著しく異なる。ほとんどの現行のコンビナトリアル・ドッキング技法は漸進的構造アプローチを用いて可変性を処理しているが、一方、本明細書に記載する技法は最初のコンフォメーション調査の後、該標的の存在下での勾配に基づく最小化を用いる。
【0021】
一般化された技法を図2に示す。最初に、コンフォメーション調査手法210をライブラリー又はコレクションの全体について実施し、得られるコンフォメーションは将来使用するために保存する。次に標的分子構造220を用いて結合部位画像を作成する。適合手順を実施し、最初に剛体としてのリガンドの所与のコンフォメーションを結合部位230内に配置することにより初期複合体を形成する。最後に、柔軟な最適化が実施され、ここで該適合が剪定され次いで最適化され最終結果240を得る。ドッキング・アプローチの個々のこれらの工程はそれぞれ図3〜図6を参照しながら以下にもっと詳細に記載する。
【0022】
単純だが効率的なコンフォメーション調査手法が好ましい。コンフォメーション調査はライブラリー又はコレクションの全体について一度実施し、得られるコンフォメーションは将来使用するために保存する。必要ならば、コンフォメーションの調査は定期的に反復できる。
【0023】
図3を参照すると、一様に分布する無作為のリガンドのコンフォメーションが形成され、回転可能な結合のみが変更できる。310。例えば、回転可能な結合のみを変更しうる、一様に分布する1000個の無作為コンフォメーションを形成できる。次に、個々のコンフォメーションの内部エネルギーを最小化する。ここでも回転可能な結合のみが変更できる。320。内部エネルギーは、例えば、ファン・デル・ワールス・ポテンシャル及び2面角項(dihedral angle term) を用いて見積もることができる。参照:ディラー,ディ・ジェイとシイ・エル・エム・ジェイ・ベルリンデ「分子ドッキングのための幾つかの全体的最適化アルゴリズムについての批判的評価」,Journal of Computational Chemistry,1999,20巻(16),1740−1751頁。これはその全体が参照により本明細書にインコーポレートされる。個々のコンフォメーションは、例えばBFGS(ブロイデン−フレッチャー−ゴールドファーブ−シャンノ)最適化アルゴリズムを用いて最小化できる。例えば、プレス,ダブリュ・エイチら、C言語の数的手順、第二版、1997、ケンブリッジ:ケンブリッジ・ユニバーシィティ・プレス、994(これはその全体が参照により本明細書にインコーポレートされる)を参照。
【0024】
最低の内部エネルギーをもつコンフォメーションを上回る選択的切捨てを超える内部エネルギーをもつコンフォメーションは排除される。330。例えば、最低内部エネルギーをもつコンフォメーションを15 kcal/mol上回る内部エネルギーをもつコンフォメーションはいずれも排除される。残りのコンフォメーションは評点され且つ序列付けられる。340。この評点は、該コンフォメーション調査手法をより生物活性のありそうなコンフォメーションに集中させるためにフィルター又はバイアスを取り入れ、不活性でありそうなコンフォメーションを排除する。この文脈において、「生物活性のある」及び「活性なコンフォメーション」は、生体標的に潜在的に結合できるリガンドのコンフォメーションとして定義され、リガンドが生体標的に結合するときのリガンドの実際のコンフォメーションに類似しうる。「不活性な」及び「不活性なコンフォメーション」は、逆の意味をもち、即ち、任意の生体標的に結合する可能性が非常に低いリガンドのコンフォメーションであり、従って、リガンドが生体標的に結合するときのリガンドの実際のコンフォメーションとは異なる。この焦点は、所与の生体標的に結合したリガンドのコンフォメーションを発見することを指向する分子ドッキング、薬物団(pharmacophore)調査及び三次元QSARなどの方法に極めて有益であろう。なぜなら、これらは必然的に出発点としてコンフォメーション調査に依存するからである。
【0025】
該切捨て値を上回る内部エネルギーをもつリガンドのコンフォメーションを排除した後、コンフォメーションは、不活性なコンフォメーションから潜在的に活性なコンフォメーションを識別する際の助けとなる一以上の三次元記述子/フィルターを取り入れた評点により序列づけできる。該評点は下記のように計算されうる:
評点=歪み−[(重み係数1 ×記述子1 )+(重み係数2 ×記述子2 )...+(重み係数n ×記述子n )]
上式中、所与の分子の所与のコンフォメーションの「歪み」は所与のコンフォメーションの内部エネルギーから最低内部エネルギーをもつ所与の分子のコンフォメーションの内部エネルギーを差し引いたものであり、nは用いられる記述子及び重み係数の数である。これにより、不活性なコンフォメーションは排除され、潜在的に活性なコンフォメーションが保持され次の工程で用いられる。極性溶媒接近可能表面積、無極性溶媒接近可能表面積、内部相互作用の数及び回転半径、又はそれらの組合わせなどの記述子が用いられうるが、不活性なコンフォメーションから活性なコンフォメーションを分離するために効果的に用いられうる他の記述子も存在しうる。該溶媒接近可能表面積は、原子のファン・デル・ワールス半径に適切な量(例えば1.4Å)を加算したものを用いて計算しうる。一般的に、窒素原子又は酸素原子は、水素に結合している場合又は水素結合を受入れることができる孤立電子対を有する場合、極性として取り扱われる。窒素及び酸素以外の原子は無極性として取り扱われ、水素原子は通常この計算には使用しない。内部相互作用数のNIは所与の分子における二つ一組の相互作用の数についての単なる計算であり、
【0026】
【数4】
【0027】
として定義される。上式中、この合計は1〜2及び1〜3の原子を除く原子i、原子jの全ての対にわたるものであり、dijはi番目及びj番目の原子間の距離であり、そして
【0028】
【数5】
【0029】
上式中の単位は全てÅである。コンフォメーションの回転半径は
【0030】
【数6】
【0031】
により与えられる。上式中、合計はコンフォメーションの全ての原子にわたるものであり、該コンフォメーションはその重心が0であるように並進される。例えば、極性溶媒接近可能表面積と無極性溶媒接近可能表面積との合計である溶媒接近可能表面積(SASA)は、記述子として用いることができ、該表面積項の重み係数として 0.1 を用いる。
評点=歪み−0.1×SASA
【0032】
より優れたコンフォメーションの予め定められた2乗平均偏差内にあるコンフォメーションを除去する。350。例えば、より高い序列の(即ち、より優れた)コンフォメーションの1.0Åの2乗平均偏差内にある如何なるコンフォメーションも除去できる。このクラスター化は余剰のコンフォメーションを取除くための手段である。所望のコンフォメーションの最大数、例えば50個のコンフォメーションがコンフォメーション分析工程の最後で保持される。360。
【0033】
所望する数を上回るコンフォメーションがクラスター化後に残る場合、次に最下位に序列されたコンフォメーションを所望する数のコンフォメーションが残るまで取除くことができる。
【0034】
標的への小分子の結合過程は水による「溶媒和」対標的分子による「溶媒和」の間の均衡である。これを心に留めて、溶媒接近可能表面積項が単純な水性溶媒和モデルとの類似で選択され得る。例えば、アイゼンバーグ,ディとエイ・ディ・マックラシアン「タンパク質の折りたたみ及び結合における溶媒和エネルギー」,Nature,1986,319巻,199−203、オオイ,ティら「ペプチドの水和の熱力学パラメータの尺度としての接近可能表面積」,Proceedings of the National Academy of Sciences ,1987,84巻,3086−3090頁、及びバジャ,エスら「受容体−リガンド・フリーエネルギーに及ぼすコンフォメーション可変性及び溶媒和の影響」,Biochemistry,1994,33巻,13977−13988頁。これらの各々はその全体が参照により本明細書にインコーポレートされる。タンパク質対水の「溶媒和」における重要な相違は、水が極性の相互作用のみと競合する一方で、タンパク質が極性相互作用及び疎水性相互作用の両方と効果的に競合することである。従って、本発明の目的上、極性及び無極性の表面積は同一に取り扱われる。重み係数として0.1を選択することはいささか恣意的であるが、表面積に基づく溶媒和モデル用に選択された重みに見合っている。究極的には、より多くの溶媒接近可能表面積をもつコンフォメーションは、標的とより広範囲に相互作用することができ、したがって若干高い歪みであり依然強固に結合し得る。より洗練された序列システムが本発明で用いられ得るであろうが、コンフォメーションを序列付けすることへのこのアプローチは妥当なコンフォメーションを供給する。
【0035】
上記結合部位画像は無極性のホットスポット(即ち、無極性原子が結合するのに好都合な結合部位の点)の一覧表、並びに極性のホットスポット(即ち、水素結合の供与体又は受容体が結合するのに好都合な結合部位の点)の一覧表を含む。これらの二つの一覧表を作成する一つの手法を図4に示す。最初に、該結合部位を見出すために、グリッドが該結合部位の周辺に配置される。410。一例として、該グリッドは各方向に少なくとも5Åの余分な空間をつけた少なくとも20Å×20Å×20Åでありうる。0.2Åの間隔が該グリッドのために使用できる。次に、「ホットスポットの調査容量」が決定される。420。これは該標的分子内部で任意のグリッド点を排除することにより達成される。例えば、該標的分子に接触しない6.0Å以上の球体に含まれる任意の点も排除できる。残存する最大の連結片が「ホットスポットの調査容量」となる。
【0036】
次いで、ホットスポットを該ホットスポット調査容量のグリッド様調査を用いて決定できる。430。一例として、グリッド様調査は、グッドフォード,ピイ・ジェイ「生物学的に重要な高分子についてエネルギー的に好ましい結合部位を決定する計算手法」,Journal of Medicinal Chemistry,1985,28(7)巻、849−857頁に記載されている。これはその全体が参照により本明細書にインコーポレートされる。無極性のホットスポットを見出すために、無極性のプローブが該ホットスポット調査容量の各グリッド点に配置され、該プローブの評点が計算され保存される。このプロセスは極性のホットスポットについて繰り返す。ホットスポットの各タイプについて、該グリッド点がクラスター化され、所望する数の最上位クラスターのグリッド点が保持され得る。440。例えば、トップ30のクラスターのグリッド点が保持される。
【0037】
図5を参照すると、最初に剛体としてリガンドの所与のコンフォメーションを結合部位内に配置するため、リガンドの原子群が適切なホットスポットに適合する。510。より正確には、一例において、若し下記の条件が満たされるならば、三個の原子A1 、A2 、A3 は三個のホットスポットH1 、H2 、H3 に適合すると考えられる。
i Aj の型はj=1、2、3のそれぞれについてHj の型に適合する。即ち、無極性のホットスポットは無極性原子に適合し、極性のホットスポットは極性原子に適合する。
ii j,k=1、2、3の全てについてD(Aj ,Ak )=D(Hj ,Hk )±δ。上式中、D(Aj ,Ak )及びD(Hj ,Hk )はそれぞれAj からAk への距離及びHj からHk への距離であり、δは例えば0.25Åから0.5Åまでの多少許容できる誤差量である。
【0038】
言い換えると、適合は、一例において、三つのホットスポットが三角形(triangle)を形成し該リガンドの三原子が実質的な三角適合(triangle match)を形成する場合に生じる。即ち、適合は、各三角形の頂点が同型であり且つ対応する辺が同じ長さである三角形が十分に類似する場合に生ずる。適合アルゴリズムは所与のコンフォメーションの原子と該ホットスポットとの間にあるあらゆる適合を見出す。次に、個々の適合が独自の剛体の変換を決定する。次いで、該剛体変換を該結合部位内へ該コンフォメーションを持ち込み初期の標的分子−リガンド複合体を形成するために使用する。
【0039】
工程520において、個々の適合は、
【0040】
【数7】
【0041】
上式を最小にする独自の剛体変換を決定する。上式中、Rは例えば3x3回転マトリクスであり、Tは並進ベクトルである。この場合もやはり、剛体変換は、一例において、3x3回転マトリクスのR及び並進ベクトルのTを含み、その結果、点X(該コンフォメーションの一つの原子の位置)はRX+Tにより変換される。次に、分析で決定され得る個々の剛体変換を用いて該リガンドのコンフォメーションを該結合部位内に配置する。530。該計算のこの側面については、全ての適合を見出すため幾つかのアルゴリズムが試験された。FlexX用に開発されたジオメトリックハッシングアルゴリズム(レアリー,エム、エス・ヴェルフィング及びティ・レンガウル「タンパク質の活性部位への中型の分子断片の配置」,Journal of Computer−Aided Molecular Design,1996,10巻,41−54頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)が最も効率的であることが証明された。
【0042】
一つのリガンドのコンフォメーションはホットスポットに結合する10,000個までの適合を生じ得る。効率性のために、大半のこれらの適合は最適化され得ない。従って、剪定/評点の戦略が望ましい。図6はこのような一つの戦略を図示する。
【0043】
図6を参照すると、最初に、予め定められた百分率(例えば10%)を超えるリガンド原子が立体衝突するような適合の全てが排除される。610。残りの適合は以下に記載される原子二つ一組の評点、例えば1.0の原子評点切捨てを用いて序列付けされる。620。切捨ての使用は、ほとんど立体衝突がなく最終ラウンドまで生き残るような適合を十分合理的にフィットさせる。ここで1.0の選択は単に例示であるに過ぎない。序列付けされた後、該適合をクラスター化し、最上位のN個の適合が選別され最終工程へ移される。630。ここでNは例えば25〜100の範囲の数を含みうる。
【0044】
残りの適合はそれぞれ、単純な原子二つ一組の評点を用いるBFGS最適化アルゴリズムを用いて最適化される。640。一実施態様において、該評点は区分的線形ポテンシャル(Piecewise Linear Potential)(ゲールハール,ディ・ケイら「HIV−1プロテアーゼによるAG−1343阻害剤の分子認識:進化的プログラミングによるコンフォメーション的に柔軟なドッキング」,Chemistry & Biology,1995,2巻,317−324頁参照。これはその全体が参照により本明細書にインコーポレートされる。)後にモデル化でき、相違は本明細書で用いられる評点が微分可能である(differentiable)ことが好ましいことである。この評点の場合、全ての水素は無視され、全ての非水素原子は四つの範疇の一つに分類される:
i 無極性−水素結合を形成できない原子全て。
ii 受容体−水素結合の受容体として作用し得るが供与体として作用し得ない任意の原子。
iii 供与体−水素結合の供与体として作用し得るが受容体として作用し得ない任意の原子。
iv 供与体/受容体−水素結合の供与体及び受容体の両方として作用し得る任意の原子。
【0045】
二つの原子の間の評点は水素結合ポテンシャル又は立体ポテンシャルのいずれかを用いて計算する。図7に示されるこの二つのポテンシャルは数式の形式を有する。
【0046】
【数8】
【0047】
上式中、Rminは最小評点の位置であり、εは該最小値の深度(depth)であり、σは軟化因子(softening factor)であり、そしてφ(r: r1,r0)はr<r1 ,φ=1及びr>r0 ,φ=0の場合にその性質を有するr(原子対間の距離)の微分可能な切捨て関数である。立体的及び水素結合に対する各ポテンシャルにはそれ自体のパラメータを割り当てる。これらのポテンシャルについてのパラメータは直観及びその後の試験を通して当業者により選択され得るが、これらは完全に最適化される必要はない。表1は二つ一組のポテンシャルについての実例パラメータを含む。
【0048】
【表1】
【0049】
これらのポテンシャルは二つの相違点を除いて多くの力場で用いられる12−6ファン・デル・ワールス・ポテンシャルに非常に類似している。第一に、軟化因子であるσは典型的な12−6ファン・デル・ワールス・ポテンシャルより明確に弱いポテンシャルを生じる(図7を参照)。即ち、ドッキング実行時によくある穏やかな立体衝突はこのポテンシャルにより許容される。心の中では、該軟化因子は、重要であり得る標的分子の小さな誘導適合効果を暗にモデル化したものであり(ムレ−,シイ・ダブリュ、シイ・エイ・バクスター、及びディ・フレンケル「分子ドッキングの結果の誘導適合効果への感受性:トロンビン、サーモリシン及びノイラミニダーゼへの適用」,Journal of Computer−Aided Molecular Design,1999,12巻,547−562頁。これはその全体が参照により本明細書にインコーポレートされる)、そして実際に、該ポテンシャルを誤差に対し遙かに寛容にさせる。第二の相違点は該切捨て関数である。この関数は該ポテンシャルが通常5.0Åから6.0Åの有限距離を超えたゼロであることを保証する。該標的分子の原子群のある構成と共に該関数は該評点の直接計算を顕著に高速化する。
【0050】
直接的に並びに予め計算されたグリッドによっての両方で該評点を計算することが試みられた。該グリッドを用いる利点は該評点が非常に迅速に計算され得ることである。グリッドは直接的な計算より5〜10倍早いことが見出された。該直接的な計算の利点は、標的分子の可変性及び溶媒の移動性などの効果がより容易に適応され得ることである。該グリッドの使用がドッキング結果の性質にいかなる劣化も惹起するように見えないので且つ目下標的分子の可変性又は溶媒の移動性が含まれないので、後文で提示される結果については、該評点は予め計算されたグリッドによって計算された。BFGS最適化アルゴリズムの目的上、回転可能な結合に関するものを含む全ての派生物が分析的に計算された(ハウグ,イー・ジェイとエム・ケイ・マッククロフ「機械動力への変動性−ベクトル計算アプローチ」,Journal of Mechanisms, Transmissions, and Automation in Design,1986,108巻,25−30頁を参照。これはその全体が参照により本明細書にインコーポレートされる)。
【0051】
該ドッキング手法を試験するために、GOLD試験セットが用いられた(ジョーンズ,ジイら「可変的ドッキングについての一般アルゴリズムの開発及び検証」、Journal of Molecular Biology,1997,267巻,727−748頁を参照。これはその全体が参照により本明細書にインコーポレートされる)。共有結合したいずれのリガンドも又は金属イオンに結合したいずれのリガンドも、現在、本明細書に記載される評点関数によりモデル化できないので、取除かれた。更に、いずれの「表面糖類」も遭遇する問題に典型的ではないので取除かれた。これにより全部で103の事例が残った(下記の表2を参照)。該試験事例の更なる個々の処理は実施しなかった(「タンパク質データバンク」(PDB)は標的分子構造が収納されたデータベースであることに留意せよ。この「PDBコード」は所与の構造を該PDBから見付け出し抽出することを可能とする四文字コードである)。
【0052】
【表2】
【0053】
【表2−1】
【0054】
【表2−2】
【0055】
予想されるように、該結合コンフォメーション(X=ray)と最も綿密に計算して作成されたコンフォメーションとの間の2乗平均偏差は回転可能な結合数が増加すると増加する。五つの事例を除く全てにおいて、少なくとも一つのコンフォメーションが該結合コンフォメーションの1.5Åの2乗平均偏差を用いたコンフォメーション調査により作成された。該コンフォメーション調査結果の最も興味深い側面は、幾つかのより硬いリガンドについて最小2乗平均偏差が大きかったことである。例えば、5未満の回転可能な結合をもつ幾つかのリガンドがあるが最小2乗平均偏差は1.0Åに近い。これは二つの理由から起こる。第一に全事例で1.0Åのクラスター化半径が用いられた。これにより、小さなリガンドのコンフォメーション空間が十分にサンプリングされなかった。しかしながら、分子サイズに依存するクラスター化半径はこの特定の問題を緩和するために用いることができるであろう。第二の問題は二つのsp2原子間の結合が常に共役するものとして扱われたことである。従って、この型の結合に遭遇する場合はいつでも平面的であるよう強く拘束される。二つのsp2原子間の結合がしばしば共役するものの、これは明らかに過度な簡略化である。これは本発明にしたがって二つのsp2原子間の2面角を平面から外れさせることにより対処されうる。この偏差は次いで共役の程度に応じてペナルティーを課せられ得る。このペナルティーはsp2原子の型に基づいて大まかに選択されうる(エス・エル・マヨ、ビイ・ディ・オラフソン&ダブリュ・エイ・ゴッダード「ドリーディング(DRIEDING):分子シミュレーションについての一般的力場」,J. Phys. Chem.,1990,94巻,8897頁を参照)。
【0056】
ドッキング実行について、二つの異なる組のパラメータ、即ち一つは高品質のドッキングのためのもので一つは迅速な調査のためのもの、が試験され該ドッキング実行の品質及び速度に及ぼすそれらの効果を調べた。二組のパラメータ間の重要な差異は適合寛容性及び数及びBFGS最適化実行の長さである。該適合寛容性は高品質の0.5オングストロームから迅速な調査の0.25Åの範囲にわたる。該寛容性が大きくなるほど見出される適合も多くなることに留意せよ。従って、より大きな寛容性はより綿密な調査を意味する一方、より小さな寛容性はそれほど綿密でないがより迅速な調査を意味する。迅速な調査では20工程について1つのリガンドにつき25個の適合が最適化されたのと比べて、高品質の実行では100工程について1つのリガンドにつき最大100個の適合が最適化された。
【0057】
第一の問題は所与の2乗平均偏差の切捨て間に少なくとも一つのドッキング位置を生じることである。ここで、結晶学的に観察されたXÅ内のリガンドの位置にドッキングされたリガンドはXÅヒット(hit)と称される用語を採用する。2乗平均偏差は高品質の実行について表1に示す。高品質の実行について、103事例のうち89事例が少なくとも一つの 2.0Åヒットを生じる。この数は 1.5Åで80、1.0Åで63及び0.5Åで26に減少する。迅速な調査については、103事例のうち75事例が2.0Åのヒットを生じ、65事例が 1.5Åのヒットを生じ、42事例が 1.0Åのヒットを生じ並びに16事例が 0.5Åのヒットを生じる。両事例において、これらの数はゴールド試験セット又は類似の試験セットに基づいて試験された他のドッキング・パッケージから得られる同様な統計値と比べて優れている(ジョ―ンズ,ジイら「可変的ドッキングについての一般アルゴリズムの開発及び検証」, Journal of Molecular Biology, 1997, 267巻, 727−748頁、バクスター,シイ・エイら「タブ(Tabu)調査を用いた可変的ドッキング及び結合親和性の実証的評価」, PROTEINS: Structure, Function, and Genetics ,1998,1998巻,367−382頁、レアリー,エム、ビイ・クラメール、及びティ・レンガウル「粒子の概念:タンパク質−リガンドドッキング予測の間に個別の水分子を配置する」,PROTEINS: Structure, Function, and Genetics,1999,34巻,17−28頁、レアリー・エム、ビイ・クラメール、及びティ・レンガウル「相互作用に基づく適応アルゴリズムを用いた疎水性リガンドドッキング」,Bioinformatics,1999,15(3)巻,243−250頁、並びにクラメール, ビイ、エム・レアリー及びティ・レンガウル「タンパク質−リガンド・ドッキングについてのFlexX漸進的構造アルゴリズムの評価」,PROTEINS: Structure, Function and Genetics,1999,37巻,228−241頁を参照)。
【0058】
第二の問題は、ドッキングされた化合物を正確に序列付けすることである。即ち、最上位に序列付けされたコンフォメーションが結晶学的に観察された該リガンドの位置に合理的に近接しているかである。これは第一の問題より極めて難解な問題である。高品質の実行についての最上位評点のドッキング位置と観察位置との2乗平均偏差は表1に示す。この事例において、二組のパラメータ間にほとんど差異はない。高品質の実行について、103事例のうち48事例が最上位評点のドッキング位置として 2.0Åヒットを生じる。この数は 1.5Åで41、1.0 Åで34及び 0.5Åで10に減少する。迅速な調査については、103事例のうち45事例が最上位評点のドッキング位置として 2.0Åヒットを生じ、1.5 Åで41、1.0Åで34及び 0.5Åで10である。
【0059】
この研究で用いた評点関数の有用性は、ドッキングされたコンフォメーションを絶対的に序列付けするための手段としてよりもごく少数のドッキングされたコンフォメーションを選別するための初期フィルタとして存在する。大半の良いドッキング位置、即ち低い2乗平均偏差はこの10%の切捨てに生き残る。しかしながら、大半のドッキング位置は生き残らない。高品質の実行については、平均して74の位置が見出されるが、該10%の切捨て後、平均して僅か8つしか残らない。迅速な調査については、平均して21近くの位置が見出されるが、該切捨て後に平均して僅か5つしか残らない。この時点で該10%の評点切捨てを生き残るドッキング位置は、更に最適化され、視覚的にスクリーニングされ、又はより正確ではあるが効率的でない評点関数を通過しうるであろう。
【0060】
高品質の実行では、一試験事例当たりの平均CPU時間(例えばシリコン・グラフィックス社(SGI)のコンピュータR12000を用いて)は約4.5秒である。この速度で、1CPUで百万個の化合物をスクリーニングするとおよそ50日かかるであろう。迅速な調査では、一試験事例当たりの平均CPU時間は一試験事例当たり約1.1秒に減少する。この速度で、1CPUで百万個の化合物をスクリーニングするとおよそ12日かかるであろう。データベース・ドッキングは極めて並列的な仕事であり、複数のCPUが妥当な時間量(例えば一日くらい)まで容易にこれを削減しうるであろう。
【0061】
この節では、小分子をドッキングさせることへの本明細書に記載のアプローチの長所を証明するために二三のの成功事例が示される。これらの事例全てにおいて、示される結果は並の品質のドッキングの実行から得られる。第一の事例はPDBエントリー3tpi(マークアート,エムら「トリプシン、トリプシノーゲン及び阻害剤とのその複合体における反応性部位及びペプチド群の幾何学」,Acta Crystallographica,1983,B39巻,480頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)からのジペプチドのIle−Valである。この事例は明瞭なアンカー断片がなく、その結果、ドッキングへの漸進的構築アプローチはこのリガンドでは難儀するであろう。本発明者らのコンフォメーション調査手法は観察されたコンフォメーションの 0.42 Å内でコンフォメーションを作成した。最高評点のドッキング位置と観察位置との2乗平均偏差は0.53Åである。
【0062】
第二の例は15個の回転可能な結合を有するリガンドでありはるかに難しい例である。これは該PDBエントリーlida(トング,エルら「ヒドロキシエチルアミン・ジペプチド・アイソスターを含む阻害剤との複合体におけるHIV−2プロテアーゼの結晶構造」,Structure,1995,3(1)巻,33−40頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)からのHIVプロテアーゼ阻害剤である。この事例において、該コンフォメーション調査手法は該結合したコンフォメーションから 0.96 Åの2乗平均偏差のコンフォメーションを作成できた。最上位評点のドッキング位置についての2乗平均偏差は1.38Åである。実際に、最上位の13点のドッキング位置は全て該観察位置の 2.0Å内にあり最も近かったのはほぼ1.32Åであった。
【0063】
最後の事例は該PDBエントリー4phv(ボーネ,アールら「L−700, 417によるHIVプロテアーゼ複合体のX線結晶構造、擬似C2対称性を備えた阻害剤」,Journal of the American Chemical Society,1991,113(24)巻,9382−9384頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)からのHIVプロテアーゼ阻害剤である。この事例のリガンドは12個の回転可能な結合を有する。これは明らかに該リガンドの最終可変的勾配最適化工程(final flexible gradient optimization step)を含める値打ちを証明している。該コンフォメーション調査手法から作成された最も近いコンフォメーションは結晶学的に観察されたコンフォメーションから1.32Åである。最高評点のドッキング位置は該観察位置に最も近く、0.38Åの2乗平均偏差である。可変的な最適化無しに得ることのできた最小の2乗平均偏差は該コンフォメーション調査手法により作成された最も近いコンフォメーションの2乗平均偏差であり、即ち1.32Åである。従って、この事例において、該可変的な最適化は少なくとも1.0Åまで該最終2乗平均偏差を下げた。
【0064】
ドッキングのシミュレーションが失敗する場合、該評点は失敗した、即ち該評点関数の全体的最小値は結晶学的に決定されたリガンドの位置に対応しなかった、としばしば推測される。ドッキングの問題は多数の自由度を含むので、多くの事例で該失敗は不十分な調査に帰することができると考えるのが妥当である。本明細書に記載の手法が不完全に実施される場合の失敗の原因を同定することがこの節の目的である。
【0065】
評点の失敗又は調査の失敗のいずれかとしてのドッキングの失敗を分類するために、該リガンドは標的分子に結合したものとしてBFGS最適化を実施した。得られる評点が該ドッキング実行から見出される最良の評点より有意に小さかった場合、その失敗は調査の失敗として分類される。他の失敗はいずれも評点の失敗として分類される。
【0066】
圧倒的多数の事例が中程度の評点誤差と認定され、即ち該全体的最小値は該リガンドの結晶学的な位置に対応していないようである、しかし該全体的最小値と該リガンドの結晶学的な位置に近い最良評点の間の差の百分率は10%に満たない。これらの事例において、該評点のどの側面が失敗しているのかを決定することは難しいが、これらの事例の多くが水素結合の条件又は溶媒和モデルに基づいた角度の拘束などの幾つかをより詳細に該評点関数に含めるだけで訂正できると考えるのが妥当である。しかしながら、深刻な評点誤差のある事例が少数存在する。これらの事例は該評点の弱点及び標的分子/リガンド相互作用の複雑性への何らかの洞察を提供する。
【0067】
1glq(ガルシア−サエズ,アイら「S−(p−ニトロベンジル)グルタチオン及び他の阻害剤と複合体形成したマウス肝臓πクラスのグルタチオンSトランスフェラーゼの1.8Åでの分子構造」,Journal of Molecular Biology,1994,237巻,298−314頁を参照)の事例はこの研究で用いた評点の主要な弱点−水素結合の様式を指摘した。これは極性のリガンドである。このリガンドについての最上位の位置は、多数の「感知された」水素結合が存在するため、おおむね非常によく得点する。実際には、該相互作用の角度依存が乏しいため、これらの水素結合は極めて弱い。さらに、X線配置の硫黄原子はチロシンのOHから水素結合を受容しており、カルボン酸はリシンとの塩橋に関与する。これらの相互作用はいずれも本明細書に記載される評点機能により認識されなかった。
【0068】
live(ジェドルゼジャス,エム・ジェイら、「インフルエンザ・ウイルス・ノイラミニダーゼの芳香阻害剤の構造」、Biochemistry、1995、34巻、3144−3151頁を参照)の事例において、正しい位置は観察されるコンフォメーションの推定歪みによりおおむね比較的低い評点を受取る。該ドッキング手法は共役されるものとしてのある種の結合を認識する。従って、これらの結合が平面的でない場合厳しいペナルティーが適用される。観察されるコンフォメーションにおいて、該2面角は全て平面から80度近い。これらの2面角が余儀なく0°近くになる場合、該コンフォメーションは該リガンドと該標的分子との観察される相互作用にもはや適合しない。いかなるドッキング・アルゴリズムも該2面角についてのこれらの値を予測することは困難であろう。
【0069】
HIVプロテアーゼ阻害剤である1hef(ムルチー,ケイ・エイチ・エムら、「ヒト免疫不全ウイルス1型プロテアーゼに結合するヒドロキシエチレン系阻害剤の2.2−A解像度での結晶構造は該阻害剤が二つの異なる配向性で存在することを示す」、Journal of Biological Chemistry、1992、267巻、22770−22778を参照)の事例は、おそらく深刻な評点誤差の全てに最も関与している。該結合ポケットは二量体の界面にあり、該標的単量体は結晶学的対称操作の間に関係する。該リガンドのC末端では、メチル基は2.0Å内にある。これらの相互作用は予測することが極めて難しい。本発明者らのプログラムは該リガンドのC末端についての興味深い代替コンフォメーションと対等になった。このコンフォメーションは内部及び外部の立体的衝突をともに排除し標的分子との更なる水素結合を形成する。
【0070】
コンフォメーション調査の失敗として分類された二つの事例、即ち1hefと1pocがある。これらの事例において、作成される最良のコンフォメーションはそれぞれ2.1Å及び2.3Åである。1poc事例のリガンドは23個の回転可能な結合を有するため、僅か50個のコンフォーマー(conformer) でそのコンフォメーション空間を十分に網羅することは非常に難しい。一方、1hef事例のリガンドも非常に可変的(18個の回転可能な結合)であり、上述したように、観察されるコンフォメーションも深刻な立体的衝突を有する。従って、予想されるように、これはどのコンフォメーション調査手法にとっても非常に困難な挑戦である。
【0071】
本出願において、標的分子の結合部位内へ可変的リガンドをドッキングさせるための新規で且つ迅速な技法が提示される。この方法は、該リガンドについての予め作成された一組のコンフォメーション並びに該標的分子の結合部位におけるリガンドの最終可変性勾配(final flexible gradient)に基づく最適化に基づいている。その結果に基づけば、これはリガンド可変性を取り扱うためのエラーに強いアプローチである。比較的少ないコンフォメーション(1分子当たり50未満)を用いて、通常、結合コンフォメーションの1.5Å以内のコンフォメーションを作成できる。最終工程として該可変的な最適化を適用することにより、高品質の最終ドッキング位置を維持しながら必要とされるコンフォメーションの数を減少させうる。
【0072】
例示されたドッキング技法を改良するための機会がある。このような改良も本発明の範囲内におさまる。例えば、適合体の作成は、かなり上出来である場合、比較的固定した小分子と可変的な大分子とは異なって扱うべきである。非常に大きな可変的分子のコンフォメーション空間は広すぎて完全に調査できないため、モンテカルロ調査アルゴリズムが用いられる。その上、該コンフォメーションを序列付けるために用いられる評点は確実に単純化し改良され得る。例えば、溶媒和モデルの変形(アイゼンバーグ,ディとエイ・ディ・マックラシアン、「タンパク質の折りたたみ及び結合における溶媒和エネルギー」、Nature, 1986, 319巻、199−203、スティル,ダブリュ・シイら、「分子の力学及び動力学に関する溶媒和の半分析学的処理」、Journal of the American Chemical Society, 1990、112巻, 6127−6129頁を参照。これらは両方ともそれらの全体が参照により本明細書にインコーポレートされる。)はおそらくより良いコンフォメーションを与えるであろう。最後に、歪みのより優れた処理、とりわけ二つのsp2原子間の間の結合の周りの回転についての歪みの処理が改良された結果を産むかも知れない。
【0073】
例示される実施態様において、極性のホットスポットを見出すために用いるアルゴリズムは結合部位に埋もれたホットスポットではなく任意の水素結合の供与体及び受容体を見出す傾向がある。該ホットスポット調査ルーチンの改良は該技法の品質を高めるだけでなく、必要なホットスポットの数も減少させるので、該技法をより効率的にする。GRID(グッドフォード,ピイ・ジェイ、「生物学的に重要な高分子についてエネルギー的に好ましい結合部位を決定する計算手法」,Journal of Medicinal Chemistry,1985,28(7)巻,849−857頁、スティル,ダブリュ・シイら,「分子の力学及び動力学に関する溶媒和の半分析学的処理」,Journal of the American Chemical Society,1990,112巻,6127−6129頁を参照。これらは両方ともそれらの全体が参照により本明細書にインコーポレートされる。)又はLUDI結合部位の記述(ボーム,エイチ・ジェイ,「LUDI:酵素阻害剤誘導(lead)についての規則に基づく新規な置換基の自動設計」,Journal of Computer−Aided Molecular Design,1992,6巻,693−606頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)又は文書化された方法(ミルズ,ジェイ・イー・ジェイ、ティ・ディ・ジェイ・パーキンス、及びピイ・エム・ディーン,「結合部位における水素結合原子の位置を予測する自動方法」,Journal of Computer−Aided Molecular Designs,1997,11巻,229−242頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)などの幾つかの利用できるプログラムがおそらくある種の改良を示すであろう。更に、該極性のホットスポットを供与体、受容体、イオンなどに区分すると、ホットスポットは該結果を改良しうる。最後に、実用化において、大半の利用者は該画像を強調するためにいくらかの時間を費やすことを厭わないであろう。即ち、手動で劣悪なホットスポットを排除し、必要ならばホットスポットを追加する。実際に、これはドッキングの実行を有意に改良するであろう。
【0074】
全てのドッキング・プログラムにおいて、良い評点は効率的で誤差に寛容であり且つ正確であるべきである。本明細書で用いられる評点は初めの二つの性質を満足する。これらの二つの性質は、しかしながら、三番目の性質と通常両立できない。より正確な評点が適用され得た後にこの評点は初期スクリーニングとしてなお有用であるように見える。水素結合の項についての立体的拘束、イオン相互作用や溶媒和効果の認識、並びに金属を取り扱う項が正確性を改良するために導入され得る。
【0075】
それにもかかわらず、結晶構造が利用できる場合、分子ドッキングへの本発明のアプローチはライブラリーのスクリーニングの優先順位決定に有用である。相同性モデルなどのより低い品質の構造情報でさえ、本明細書に記載の技法はなお有用な情報を提供する。
【0076】
個々のリガンドが該標的にドッキングされた後、ドッキング結果は分析を容易にするためクラスター化手法を用いて体系化される。この手法において、複数のクラスターが形成され、これらの各々は該標的分子に関する該リガンドの位置の類似のものの群から構成される。単結合クラスター化アルゴリズム(single linkage clustering algorithm)は、クラスター化測定基準(clustering metric)としてリガンドの位置の対の間の2乗平均偏差とともに用いられうる。該リガンドのコア間の2乗平均偏差がある所定の数(典型的には0.25Åから0.5Å)未満である場合の位置の対は同じクラスターに入る。代替のクラスター化アルゴリズムも用いられうる。単結合クラスター化はその単純性の故に特定の事例において有利でありうる。最上位クラスターにあるライブラリーの化合物の相対数は該標的分子に対する該ライブラリーの相補性の尺度であり該ライブラリーを序列付けするために用いられる。
【0077】
一つの実施態様において、該リガンドの位置は図式解法を用いてクラスター化される。N個の化合物を含むライブラリーについて、該クラスター化手法はN(N−1)/2の2乗平均偏差の計算を必要とする。1化合物につき1ポーズ(pose)をもつ一万個のメンバーのライブラリーでは、5万個の2乗平均偏差の計算が必要とされる。この数は下記の考慮により実際には大幅に低減できる。2ポーズのコアの重心間の距離が所定の切捨てより大きいならば、該2コア間の2乗平均偏差は該2乗平均偏差の切捨てより必然的に大きい。従って、三次元の容量をより小さな容量単位への細分割を規定するグリッドが該標的分子の結合部位周辺に配置される。該ポーズの個々の重心が計算され特定のグリッド立方体と関係付けられる。2乗平均偏差は近くの立方体の位置の間でのみ計算される。実際には、これは10〜100の係数まで計算数を減らす。
【0078】
ライブラリーの優先順位決定問題に取り組むためにドッキング・アプローチを用いる場合の一つの潜在的な難題は陽性と誤ることである。この問題は実例を通して最もよく説明される。我々が二つのコンビナトリアル・ライブラリー(A及びB)を有し、そのそれぞれが10,000個の化合物を含むと仮定する。ある標的に対して、Aライブラリーは活性化合物を含まないが、Bライブラリーは25個の活性化合物を含むと仮定する。最後に、我々は操作時間の95%まで化合物を(活性又は不活性と)正しく分類するために十分正確なドッキング手法を有すると仮定する。その場合、我々はAライブラリーから平均で500±22のヒットを見出し、一方Bライブラリーについては我々は平均で524±22のヒットを見出すであろう。こうして、この非常に正確なドッキング手法を用いた場合でさえ、Bライブラリーより活性なものとしてAライブラリーを分類する可能性が依然かなりあるであろう。さらに、95%正確なドッキング方法は無い。また、一つのコンビナトリアル・ライブラリーにおける化合物の間に明確な構造的類似性があり、従って活性化合物を含むライブラリーは該ライブラリーの活性化合物に類似したかなりの数の化合物を含むことになる。活性化合物に類似したこれらの化合物はどの計算手法によっても誤って陽性として見出される可能性が高い。
【0079】
この効果は再び実例によって最も良く説明される。標的の結合部位がP1、P2及びP3の三つのポケットを有し且つライブラリーのコアがR1、R2及びR3という置換のための位置を有すると仮定する(図9参照)。更にそれぞれの位置で合計27000個の化合物に対して30個の異なるシントンが存在すると仮定する。最後に、このライブラリーから得られる化合物は、R1で三つのシントンのうち一つを有し、R2で三つのシントンのうち一つを有し且つR3で三つのシントンのうち一つを有する場合に活性でありそしてその場合にのみ活性であり、このライブラリーに27個の活性化合物を与えると仮定する。これらの27個の活性化合物がうまくドッキングされ良い評点を受ける場合でさえ、これら27個の活性化合物の評点が、このライブラリーを不活性なライブラリーから突出させる原因となるであろうことはありそうにない。
【0080】
しかしながら、少なくとも二つの「活性な」シントンを有する756個の化合物が存在する。これらの化合物は無作為の評点より良い評点を受取る可能性が非常に高い。従って、あまり正確でないドッキング手法でさえも、コンビナトリアル・ライブラリーにより表されるように、化学空間の領域は正確に同定され得る可能性が高い。
【0081】
実施例
本発明のクラスター化方法は、ファルマコピーア社から入手できる四つのECLiPS(商標)アスパルチル・プロテアーゼ・インヒビター・ライブラリーのPL419、PL444、PL792、及びPL799を用いた評点方法と比較して評価された。これらのライブラリーはプラスメプシンII(pdb同定子1sme)及びカテプシンD(pdb同定子1lyb)の結合部位内にドッキングされた。四つの該ライブラリーは、下記に示すように、ペプスタチンのコアに基づいている。
【0082】
【化1】
【0083】
これらのライブラリーは、該四つのうち三つ(PL444、PL792、及びPL799)が以前プラスメプシンIIとカテプシンDの両方に対する活性についてスクリーニングされかなりの数の活性化合物を生じたので選択された。四番目のライブラリーのPL419はプラスメプシンIIに対して試験されてかなりの数の活性化合物を得ており、カテプシンDに対しては試験されていないものの、該ライブラリーから再合成された化合物はカテプシンに対して活性であった。その上、該ライブラリーは大きく(平均分子量が550)可変的な(回転可能な結合の平均数が19)化合物から構成されるので、これらは如何なるドッキング手法に対しても相当な挑戦であった。分子量、回転可能な結合の数、及びライブラリーの化合物の数を含むライブラリーの関連する物理的特性は表3に示す。
【0084】
二つの該標的に対する該ライブラリーの高速大量処理スクリーニングから得られたデータ、並びに該ライブラリーから再合成された化合物のKi の測定から得られたデータを表4に示す。該ライブラリーはこれらのデータに従った相対的活性に関して序列付けされうる。
【0085】
高速大量処理スクリーニングから得られるデータは一般的に活性形及び不活性形をとる。つまり、所与の化合物が、該スクリーニング試験で陽性活性を示す「解読された」合成ビーズ上に見出されか否かである。一個の解読されたビーズは陽性であると誤るかなりの可能性あるので、高速大量処理データに基づいてライブラリーに活性/効力の絶対的な度合いを付与することは困難である。複数の解読されたビーズ上に出現する化合物、即ち「重複解読」は陽性と誤る可能性が遙かに小さくなる(スクリーニングされるビーズの数は、ノイズを最小化するため、典型的には3の係数まで、通常化合物の数より多い)。従って、重複解読の数はライブラリーの活性についてのより良い目安である。
【0086】
【表3】
【0087】
ライブラリーの活性/効力についての第二の尺度は再合成され且つ検定されたこれらの解読された化合物の効力である。ほとんどの場合、ほんの一握りの解読された化合物が大量に再合成され検定された。従って、再合成された化合物の効力それ自体は該ライブラリーの全体的活性の完全な反映ではない。こうして、ライブラリーの活性は、解読の数/重複解読の数、及び効力(通常選別され再合成された化合物の最大効力)の両方により測定される。
【0088】
プラスメプシンに対するこれらの活性/効力に関して、該ライブラリーは下記のように序列付けられる。
PL792>PL419=PL444>PL799
相対的活性/効力は表4に示される解読の数/重複解読の数及びKi値に基づくこの様式で定義される。PL419及びPL792の両方は相当の数の解読及び重複解読を生じた。PL792が100nM以下のKi(単数又は複数)をもつ幾つかの化合物を生じた一方で、PL419に見出された最も効力のある化合物は540nMのKiを有していた。こうして、PL792は最も活性なライブラリーとして序列づけられる。より多くのデコード及び重複デコードを生じたので、PL419はプラスメプシンに対してPL799より活性であるとして序列付けられる。PL444はPL799と同様な数の重複解読を生じたが、有意により高い効力の化合物を生じた。従って、PL444はPL799より活性であるとして格付けされた。PL444及びPL419は、PL419が有意により多くの重複デコードを生じたがPL444は有意により効力のある化合物を生じたので、ほぼ等しい活性であるとして序列付けされる。
【0089】
カテプシンについては、該ライブラリーは下記のように序列付けされた。
PL444>PL792>PL799
PL444は最大の重複解読及び最も活性な化合物を生じたので、カテプシンに対して最も活性であるとして序列付けされる。PL792はPL799より多くの重複解読及びより効力のある化合物を生じた。従って、カテプシンに対して、PL792はPL799より活性であるとして序列付けされる。PL419はカテプシンに対してスクリーニングされなかったが、PL799が生じた如何なるものよりカテプシンに対して有意により効力のあった化合物を生じた。
【0090】
【表4】
【0091】
更に、8つの「仮想」ライブラリーが負の対照として作成された。これはスタチン(statine) のコアにある一つの不斉中心のコンフィギュレーションの点でのみ正の対照と異なっている。これらの仮想ライブラリーをPL419R、PL419D、PL444R、PL444D、PL792R、PL792D、PL799R及びPL799Dと名付けた。上に示した本来のペプスタチンの足場は、スタチンのコアに対応し、該アミノ酸の二つの立体中心、ヒドロキシル基をもつ炭素、及びCα原子を有する。両立体中心はLコンフィギュレーションである。追加のRと名付けられたこのライブラリーは、ヒドロキシル基をもつ炭素が正の対照のそれと逆のコンフィギュレーションを有することを除いて標準的なライブラリーと同一であり、Rと名付けられ、下記に示す。
【0092】
【化2】
【0093】
追加のDと名付けられたライブラリーは、スタチンの一部が上記に示されるように標準的なL−アミノ酸のかわりにD−アミノ酸を有することを除いて標準的なライブラリーと同一である。これらの仮想ライブラリーは、プラスメプシンII又はカテプシンDに対して活性を示すことが知られているR−スタチン又はD−アミノ化合物が存在しないので、負の対照として利用される。従って、これらの追加のライブラリーいずれかは本来のライブラリーより顕著に活性が低いか又は完全に不活性であろうと仮定された。その上、これらのライブラリーは全く同じ性質の配分(分子量、回転可能な結合数、水素結合の供与体など)を有するので、負の対照ライブラリー及び本来のライブラリーをドッキングする結果の差異は直接的に受容体との適合性及び相補性における差異に帰する。
【0094】
12個のライブラリーの各々は上述した手法を用いてプラスメプシン2及びカテプシンDの結合部位内にドッキングされた。プラスメプシンの場合、該結合部位周辺の20Å×32Å×22Åのボックスが調査空間として選択された。カテプシンDでは、該結合部位周辺の22Å×30Å×24Åのボックスが調査空間として選択された。簡単にするため、各分子について最上位に序列付けられたドッキング・ポーズのみが該分析で用いられた。両事例のドッキング時間は1化合物当たり3〜5秒の範囲である(表5参照)。結果は本発明の(比較)評点方法及びクラスター化方法の両方により分析された。
【0095】
【表5】
【0096】
実施例1(比較)評点分析:
該評点方法はライブラリー間の評点分布を比較する。(評点により序列付けられた)ドッキング化合物の上位5%における評点の2乗平均(rms)をライブラリー全体の評点として用いる。この論理的根拠は、ライブラリーが活性化合物を有するならば、かなりの数の化合物が該活性化合物に十分類似しており、結合部位内にかなり巧く適合し同様に良い評点を受けるはずであるということにある。従って、活性ライブラリーから得られる最高点の化合物は不活性ライブラリーから得られる化合物とは異なって分布するはずである。
【0097】
該評点を用いて結果を分析するために、まず該化合物をそれらの評点に従って分類する。次に、ライブラリーの評点を、
【0098】
【数9】
【0099】
によって計算する。上式中、Si はi番目に序列づけされた化合物の評点であり、この合計は上位5%より上の化合物のみに適用し、Nはライブラリー中の化合物の数である。該合計はライブラリーの化合物の20分の1(5%)にしか及ばないので、20の係数が式(1)に現れる。上述した評点手法が用いられた。平均ではなく評点の2乗平均(rms)を選ぶ理由は、該2乗平均が非常に良い評点を受ける少数の化合物を含むライブラリーに有利に働く点にある。
【0100】
該評点を分析するために用いられうるであろう幾つかの付加的な統計的な量がある。例えば、ゴッドンらの異なるタンパク質結合部位への大規模な化合物データベースの計算ドッキングの統計分析では、多数のドッキング化合物から得られる評点分布の歪みが、ある範囲の標的にわたって試験された。評点全ての平均及び標準偏差を含む付加的な統計的尺度が用いられうるであろう。平均値、標準偏差、又は歪みなどの統計的な量を用いることに伴う問題は、本発明者らが良い評点を受ける化合物に興味があるのに対し、それらが全て低い評点を受ける化合物により影響されることである。例えば、全てが中程度の評点を受ける化合物のライブラリーは、化合物の半分が低い評点を受けそして半分が高い評点を受けるライブラリーと同じ平均値を有することになる。本発明者らは二番目のライブラリーにより遙かに強い興味を持つ。本発明者らは主として良い評点を受ける化合物に関心があるので、該化合物の上位5%のみを使用する。5%の的確な選択は恣意的であったが結果にほとんど関係が無いようであった。
【0101】
プラスメプシン及びカテプシンへのPL419、PL444及びPL792のドッキングについて、該評点は元のライブラリーを最上位に、次にR−スタチン・コアをもつライブラリーを、その後にD−アミノ酸をもつライブラリーをと序列付けする(表6参照)。プラスメプシン及びカテプシンの両方を用いるPL799については、該評点は再び該三者の最上位として元のライブラリーを序列付けするが、D−アミノ酸をもつ該ライブラリーを二番目に、R−スタチン・コアをもつ該ライブラリーを最後に序列付けする。こうして、標的及び三つのライブラリー全ての両方に対して予期されたように、最上位で評点するライブラリーは、方程式1により判断される場合、元のライブラリーである。
【0102】
【表6】
【0103】
四つの元のライブラリー相互間の比較はそれほど容易でない。例えば、ドッキングされた化合物の評点は、しばしば、該化合物の分子量、極性原子の数などの物理的性質と何らかの相関性を示す。とりわけ、より大きく且つより極性のある分子は、単により強い相互作用をする原子をより多く持つという単純な理由のため、より良い評点を得る傾向がある。プラスメプシンでは、該評点はPL444を明確に最上位に、続いてPL792、その後にPL799、そして最後にPL419を序列付けする。カテプシンについては、該評点は再びPL444を最上位に、続いてPL792、その後にPL419及びPL799を序列付けする。従って、ライブラリーの実際の活性の程度(上記の表4参照)と該評点(表6)との間に何らかの相関関係がありそうに思われる。しかしながら、プラスメプシンについてはR−スタチンをもつPL444及びPL792の変形版(PL444R及びPL792R)はPL419の元のライブラリーより高く序列付けされたことに留意すべきである。従って、この関関係は完全なものではない。
【0104】
該評点は個々のシントンを序列付けするため用いることもできる。評点を所与のシントンに与えるため、方程式(1)は所与のシントンを含む化合物にのみ適用される。このため、本発明者らはPL792とプラスメプシンに注意を限定する。R2 置換では、三つのシントン、即ち(1) −Ch2Ph 、(2) −CH3 、及び(3) −CH2CH(CH3)2 が存在する。かなりの数の活性体 が(1)と(3)の両シントンに見出されたが、(2)には見出されなかった。これらのシントンの評点はそれぞれ169.9、155.2及び170.6である。該SARに基づけば、これは正しい序列付けである、即ち(1)と(3)のシントンは近くに序列付けされ、シントン(2)は顕著に低く序列付けされる。
【0105】
該SARとの一致及び該R3シントンの評点は完全から程遠い。実際、相関関係はないようである。最上位に序列付けされたシントンの大半は大きな極性のアミノ酸であり、一方、小さな無極性のアミノ酸はSARで優位にたつ。この相関関係の欠如について二つの説明がある。第一は、該分子の大きさ及び極性と該評点との間に顕著な相関関係が存在する。本発明者らが小さな無極性のアミノ酸に注意を限定する場合、該評点はそれらをL−ロイシン>L−イソロイシン>L−バリン>L−アラニン>L−t−ブチルグリシン>D−ロイシン>D−アラニンと序列付けする。ここで、L−バリン及びL−イソロイシンは実験的に観察された活性化合物の中で最も普通に観察されたシントンである。こうして、一式の無極性アミノ酸内で、実験的SARとの何らかの相関関係が観察される。相関関係の欠如についての第二の理由は、31個のR3シントンがあるため、個々のシントンを含む僅か420個の分子が存在することである。その結果、各シントンの評点は僅か21個(化合物の上位5%)の化合物に基づいている。これはかなりの量のノイズを誘導する可能性があり、このノイズは種々のR3シントンを正確に評点する能力を低下させる。
【0106】
該評点は分子量及び極性などの性質に相関するので、該評点方法を用いて、非常に異なる物理的性質をもつライブラリーを比較することは困難である。この問題はPL792のR3シントンの分析を通して最も良く説明された。この場合、該SARは小さなL−アミノ酸がこの位置に好ましいことを明確に示した。最高評点のシントンは、しかしながら、一般的に大きな極性アミノ酸であった。小さな疎水性アミノ酸に限定した場合、該評点はR3シントンについての高速大量処理SARと何らかの相関関係を示した。この問題は正確な溶媒和モデルの使用を通して軽減されうるかも知れないが、使用されるためには、該モデルは高速で且つ誤差に寛容でなければならないであろう。
【0107】
実施例2:クラスター化分析
クラスター化分析では、該クラスターは単結合クラスター化(single linkage clustering)を用いて形成された。ここでは二つのドッキング分子のコアの間の2乗平均偏差が測定基準として用いられた。原則的に、コアがある所定の切捨て、通常0.25Åから0.5Åの範囲内にある任意の二つのポーズは同じクラスターにある。この研究では、0.5Åの切捨てを用いた。上位のクラスターにあるライブラリーから得られる化合物の百分率を該ライブラリーを序列づけするために用いた。単結合クラスター化は該2乗平均偏差の切捨て以外のパラメータを要求しないので計算を容易にするために用いられた。これは、大規模なコンビナトリアル・ライブラリーのドッキングの結果から情報を引出すためにクラスター化が有用であることを証明するのに十分であった。
【0108】
適合の性質の尺度として、最大のクラスターにおける化合物の百分率が用いられた。評点の序列付けと同様に、両標的に対する元のライブラリー及び全部で三つのライブラリーは、対応するR−スタチン又はD−アミノ酸のライブラリーより高く序列付けされた(表4参照)。該クラスター化は、該評点が行なうよりも該対照ライブラリーから元のライブラリーをより良く区別するようである。元のライブラリーと対照ライブラリーの一つとの間の最も近いクラスターの大きさはPL419及びPL444及びプラスメプシンについてのものである。これら二つの事例では、該元のライブラリーについての最上位クラスターは、該ライブラリーの対応するR−スタチン版についての最上位クラスターより僅か30〜40%しか大きくない。残る6事例においては、元のライブラリーの最上位クラスターの大きさは少なくとも対照ライブラリーの大きさの2倍である。
【0109】
評点序列付けと同様に、異なるライブラリーに及ぶクラスターの序列付けはより問題がある。プラスメプシン及びカテプシンの両方については、該クラスターの大きさは三つのうち最良のものとしてPL792を、続いてPL419、その後にPL799を正しく序列付けする。しかしながら、該クラスターの大きさはPL419、PL444及びPL792のR−スタチン版をPL799の元のライブラリーの前に誤って序列付けする。これは該ライブラリー間の物理的性質の差異に帰することができる。PL799の化合物はPL419及びPL792の化合物より有意に大きく且つより可変的(表3を参照)である。更に、PL799の化合物には中央に可変的な環が存在し、コンフォメーション分析をより困難にする。従って、PL799の化合物は正確にドッキングすることが非常に難しく、結局、正しくドッキングされた化合物の割合を低くし、その結果、最上位クラスターをより小さくする。
【0110】
クラスター化法はデータ削減技法としても非常に有用である。本研究で用いられたプラスメプシン結晶構造の1sme及びカテプシン結晶構造の1lybは両方とも該結合部位にペプスタチンを含む。上述したように、これらのライブラリーのそれぞれのコアがペプスタチンのコアに基づいていた。その結果、直接的な2乗平均偏差はドッキング化合物の個々のコアと結晶学的に観察されたペプスタチンのコアの結合様式との間で計算され得る。PL792及びプラスメプシンについては、相当の大きさ(100メンバー以上)の個々のクラスターについての特定の2乗平均偏差を有する化合物の数のグラフが図10で示される。これは、比較的少数の有意なクラスターが存在し且つ最上位のクラスターが正しくドッキングされていることを示している。同じことが両標的に対する全部で四つの元のライブラリーにも言える。即ち、最上位のクラスターが正しくドッキングされており、且つ比較的少数の有意なクラスターが存在する(表7参照)。該ドッキング化合物を更にフィルタにかけるために可視的スクリーニングが用いられる場合、クラスター化は何万個もの各化合物を試験することから幾つかのクラスターを試験することへと必要な労力を削減し得る。
【0111】
該クラスター化方法は、該評点の正確度にほとんど依存しないため、該評点方法よりも有利である。むしろ、正確に堅実に化合物をドッキングさせる能力に依存しており、そして結合親和性を正確に推定することより化合物を正しくドッキングさせることの方が一般的に容易である。
【0112】
【表7】
【0113】
実施例3:記述子の評価
分子は歪みの低いコンフォメーションでタンパク質に結合するという証拠が存在する。幾つかのグループがプロテイン・データ・バンク(PBD)に寄託されたタンパク質−リガンド複合体から引出された小分子のコンフォメーションの歪みを調査した(ベルマンら,Nucleic Acids Res., 28(2000)235、及びベルマンら,Nat. Struct. Biol.,7(2000)957を参照)。初期の研究から、結合したコンフォメーションは実際に極めて歪んでおり、それらの歪みの推定値は5−40 kcal/molの範囲であることが見出された。しかしながら、これらの研究は、真空中でCHARMmを用いて該歪みを計算しており、該構造における幾らかの座標誤差の可能性を考慮しなかった。ボストロムら(Comput.−Aided Mol. Des.,12(1998)383)は溶媒和の補正を用いることにより該歪みの推定値がかなり減少することを示した。更に、彼等は寄託された構造におけるリガンドの実際のコンフォメーションが極めて歪んでいる事例を見出したが、幾つかのコンフォメーションが小さな歪みの構造の誤差内にあることを示した。最後に、彼等は、計算で用いられた力場が計算されたコンフォメーションの歪みに劇的な影響を及ぼしうることを示した。これらの一連の研究から幾つかの可能な結論が得られる。第一に、方法が改良されるにつれ、結合したコンフォメーションの歪みの推定値が有意に減少した。即ち、結合したコンフォメーションのほとんどは3−4 kcal/mol未満の歪みを有するようである。第二の結論は、座標誤差があれば、力場は依然あまりにも敏感であるためそれらがPDBに寄託されたような小分子のコンフォメーションの歪みを有効に見積もるために用いることはできない。
【0114】
小分子が低エネルギーのコンフォメーションでタンパク質に結合するという確信に対する第二部分の証拠は、タンパク質−リガンド複合体の結合定数を見積もるために用いられ且つ実験的に導かれた評点関数の開発である。これらのモデルはいずれもリガンドの歪みを考慮するための項を有さないが、これらのモデルは全て1−1.5 kcal/molの2乗平均誤差内まで実験的結合定数への適合を達成する。これらのリガンドの幾つかはほとんど又は全く歪みがなく結合すると推測するのが無難である。従って、これら全ての評点関数が有意に偏らない限り、歪みは、これらの評点関数を練習するために用いられる任意のタンパク質−リガンド複合体においてわずか3−4 kcal/molと計上すべきである。
【0115】
他方で、如何なる一連の構造活性データを調査しても、コンフォメーションが堅く結合した阻害剤と弱く結合した阻害剤との間に差異を生じ得ることを示す。第一の例として、IAとIBを検討する。
【0116】
【化3】
【0117】
IA分子は37 nmのIC50で血管内皮増殖因子受容体(VEGFr)に結合する。C8の原子が窒素に変わると(IB)、該化合物はVEGFrに対して不活性になる(IC50>10000 nm)。溶媒和効果は該変化の一部を説明するかも知れないが5 kcal/mol全てを説明できないことは確かである。該二分子間の最も大きな差異は、IB分子がアミノNH及びN8の間で内部水素結合の可能性を有するが、IA分子は有さないことである。この水素結合はIB分子の4−CI−フェニル−アミノを好ましくないコンフォメーションに固定しうる。こうして、この化合物がVEGFrに活性なコンフォメーションをとることを妨げる。
【0118】
第二の例として、IIA分子とIIB分子を検討する。コロニー刺激因子−1受容体(CSF−1r)に対して、IIAのIC50は500nMである一方、IIBは不活性である(IC50 >50000)。これら二分子の状態は上皮増殖因子受容体(EGFr)とほとんど逆であり、ここではIIBのIC50が50nMであることと比べてIIAのIC50は4000nMである。これら二化合物間の差異はアミノがIIBでメチル化されていることだけである。このメチルは、該タンパク質との水素結合様式を変化させること及び該分子のコンフォメーションの選好を変えることを含む複数の効果を有しうる。ボルドらは、NMRを用いて、このメチルが溶液中におけるこの分子のコンフォメーションの挙動を大幅に変化させることを示した。この変化は該活性の変化のかなりの部分を生じさせる可能性がある。
【0119】
【化4】
【0120】
これらの研究及び実施例はともに、歪みが結合親和性を決定する際の重要な因子であるが我々の歪みについての理解は有用なモデルを開発するのにまだ十分でないことを示している。包括的な歪みのモデルを開発する代わりに、本発明者らは、「我々は無作為のコンフォメーションから活性なコンフォメーションを区別できるか」という疑問と取り組む。その目的は、任意の標的分子に堅く結合する可能性の小さなコンフォメーションを消去するために使用できるフィルターを開発すること又は生物活性である可能性が高いコンフォメーションの方にコンフォメーション調査手法を偏向させるために使用できる単純な記述子を開発することである。
【0121】
このようなフィルタ/記述子の有用性を確認するために、小分子の活性なコンフォメーションの小さなセットをPDBにおける共結晶複合体から抽出した。幾つかの三次元記述子を検討し、これらの記述子のいずれが無作為のコンフォメーションから活性なコンフォメーションを最も上手く分離するかを調べた。本研究で用いられた記述子には、極性溶媒に接近可能な表面積、無極性溶媒に接近可能な表面積、回転半径、内部相互作用の数、二つの主軸の比、及び双極子モーメントの大きさが含まれた。これらの記述子は、それらがコンフォメーションの小さな変化に対して、従って結晶構造中に見出されるリガンドのコンフォメーションの誤差に対しても比較的鈍感であるために選択された。とりわけ、計算されたコンフォメーションの力場エネルギーは、コンフォメーションの小さな変化に対してあまりにも敏感であるため、用いられなかった。本研究は、極性溶媒接近可能表面積、無極性溶媒接近可能表面積、回転半径、及び内部相互作用の数が全て無作為のコンフォメーションから活性なコンフォメーションを分離するために使用できることを示す。極めて可変的な分子については、これらの記述子による無作為なコンフォメーションから活性なコンフォメーションの分離はより良好ですらある。これらの四つの記述子を用いた結果は、活性なコンフォメーションが無作為なコンフォメーションよりコンパクトでないことを示している。
【0122】
第一に、タンパク質に結合している際の65個の小分子のコンフォメーションをPDBから抽出した。大環状環を持つ分子又は剛体化合物は考慮しなかった。これらの分子は5個及び23個の回転可能な結合を持っていた(表8参照)。
【0123】
【表8】
【0124】
このデータセットは関連化合物を含むため理想的なものではない。ペプスタチンを含む幾つかのアスパルチル・プロテアーゼ阻害剤及び幾つかのトリプシンの阻害剤が含まれる。
【0125】
個々のリガンドについて、無作為のコンフォメーションを下記のように作成した。2面角は、結合の長さ、結合の角度、及び環を固定して保持したまま、無作為に均等に選択された。次いで、該コンフォメーションを、単にファン・デル・ワールスの項及び二面角の項を用いて二面空間において最小化した。典型的には、コンフォメーションは、妥当なエネルギーまで最小化され又はフェニル環を介した結合経路(bond run)を有するなど非常に高いエネルギー谷に捕捉されるであろう。これを念頭において、該最小化後に非常に高いエネルギー(>100 kcal/mol)を持つコンフォメーションはいずれも切捨てた。この工程は、5000個の無作為なコンフォメーションが各分子について作成されるまで続けられた。
【0126】
個々の分子M及び個々の記述子Dについて、下記の量が計算され得る。第一は、活性なコンフォメーションについてのDの値、即ちa(M,D)である。第二に、分子Mの無作為コンフォメーション全てにわたる記述子の平均値は、
【0127】
【数10】
【0128】
により与えられる。上式中、Ck は、分子Mの第k番目のコンフォメーションである。三番目の量は分子Mの無作為コンフォメーションにわたる記述子Dの標準偏差であり、次式
【0129】
【数11】
【0130】
により与えられる。最後に、該活性なコンフォメーションについての補正値が次式により与えられる。
【0131】
【数12】
【0132】
活性なコンフォメーションが無作為なコンフォメーションと識別不可能な場合、補正された記述子の値は、該データセットの分子にわたって0の周りに一様に分布するはずである。下記の記述子が本研究で用いられた。即ち極性溶媒に接近可能な表面積(PSASA)、無極性溶媒に接近可能な表面積(ASASA)、内部相互作用の数(NI)、回転半径(RG)、二つの主軸の比(RPA)、及び双極子モーメントの大きさ(MDM)である。該溶媒に接近可能な表面積は原子のファン・デル・ワールス半径+1.4Åを用いて計算された。水素原子は計算に用いられなかった。窒素又は酸素は、水素を有する場合又は水素結合を受容できる孤立電子対を有する場合には極性として扱った。他の原子は全て無極性として扱った。量NIは所与の分子における二つ一組の相互作用の数の単純な総数である。これは、
【0133】
【数13】
【0134】
により与えられる。上式中、総和は、1〜2及び1〜3の原子を除く、原子i, jの全ての対に及び、dijはi番目とj番目の原子間の距離であり、そして
【0135】
【数14】
【0136】
単位は全てÅである。コンフォメーションの回転半径は、
【0137】
【数15】
【0138】
により与えられる。上式中、総和はコンフォメーションの全原子におよび、該コンフォメーションはその重心が0となるように移動(translateed)される。主軸の比は、
【0139】
【数16】
【0140】
により与えられる。上式中、λ1 はコンフォメーションの原子座標の分散行列の最大固有値であり、λ2 は二番目に最大である。0に近いRPAの値は長く伸長したコンフォメーションを示すが、一方、1に近い値は丸いコンパクトなコンフォメーションを示す。最後に、双極子モーメントは、セリウス(Cerius)2を通じて利用できるラッペとゴダードの方法(ラッペ,エイ・ケイとゴダード,ダブリュ・エイ,III,J. Phys. Chem.,95(1991)3358、Cerius2,Molecular Simulation, Inc.、サンディエゴ、カリフォルニア州)を用いて計算された原子の点電荷を用いて計算した。
【0141】
活性なコンフォメーションについての記述子の個々の補正値は図11に分子数に対してプロットされ、該分子は回転可能な結合数により序列付けされる。該補正値はゼロの周りに一様に分布するため、双極子モーメントの大きさ(図11A参照)及び主軸の比(図11B参照)は無作為のコンフォメーションから活性なコンフォメーションを分離しないようである。残る四つの記述子であるPSASA(図11C参照)、ASASA(図11D参照)、NI(図11E参照)及びRG(図11F参照)は、とりわけ大きく且つ可変的な分子にとって無作為のコンフォメーションから活性なコンフォメーションを分離するのに確かに有用であるようである。これらの四つの記述子は以下に幾分詳細に論ずる。
【0142】
65分子のうち僅か14分子がゼロ未満の補正PSASAを持つ活性コンフォメーションを有し、8を上回る回転可能な結合をもつ37分子のうち僅か1分子がゼロ未満の補正PSASAを持つ活性コンフォメーションを有する。従って、生物活性のあるコンフォメーションは平均して無作為のコンフォメーションより大きなPSASAを有するようである。この点において、活性なコンフォメーションは溶液コンフォメーションと似ている。更に、8を上回る回転可能な結合及びゼロ未満の補正PSASAをもつ唯一の事例である1hefの事例は、問題を有するようである。該コンフォメーションは、フェニル環と衝突するカルボニル基の酸素(C−Oの距離〜2.3Å)を含む幾つかの深刻な内部衝突(IIIA及びIIIB参照)を示す。この衝突がおそらく平均的PSASAより低いことの原因である。この分子も該タンパク質と何らかの望ましくない接触をしており、より妥当な代替的結合様式を有するようである。
【0143】
【化5】
【0144】
65事例のうち僅か10事例がゼロ未満の補正ASASAを持つ活性コンフォメーションを有する。この結果は意外に思われうる。溶液中で低エネルギーのコンフォメーションは無極性の表面積ができるだけ多く埋めこまれたコンホーメーションであると予期するであろう。しかしながら、水と違って、タンパク質は無極性相互作用及び極性相互作用の両方に対して効果的に競合する。負の補正ASASAを持つ活性コンフォメーションについての事例は主として相互作用できる二つの大きな疎水性基を有するものである。これらの多くは、相互に詰め込まれた芳香環とピペラジンを含むトリプシンの阻害剤である。こうして、この結果はタンパク質が無極性の相互作用に対して効果的に競合し得ることを示す一方で、分子間の無極性相互作用がタンパク質への結合の際に保持されるのに十分な程強力である場合の状況が存在する。
【0145】
内部相互作用の数は、無作為のコンフォメーションから活性なコンフォメーションを最も良く分離する記述子である。この事例において、活性なコンフォメーションのうち僅か5つが正の補正NIを有し、該活性なコンフォメーションが無作為のコンフォメーションよりはるかに少ない内部相互作用を有することを示している。この5つの分離物(分布から離れたもの)は主として先の段落で論じたトリプシン阻害剤である。
【0146】
無作為のコンフォメーションから活性なコンフォメーションを分離する何らかの潜在能力を有する最後の記述子は回転半径である。この事例において、65事例のうち13が負の補正RGを持つ活性コンフォメーションを有し、活性コンフォメーションの回転半径が無作為のコンフォメーションの回転半径より大きいことを示している。ここでも、該分離物は無極性溶媒接近可能表面積(ASASA)の場合の分離物に似ている。
【0147】
タンパク質に結合する際の小分子のコンフォメーションは種々の記述子を用いて無作為のコンフォメーションから分離され得る。これらの記述子には、極性溶媒に接近可能な表面積、無極性溶媒に接近可能な表面積、内部相互作用の数及び回転半径が含まれる。コンフォメーションに依存する記述子の全て不活性なコンフォメーションから活性なコンフォメーションを分離するのに有用であるわけではない。双極子モーメントの大きさや二つの主軸の比はいずれもこの目的に有用ではないようである。
【0148】
活性なコンフォメーションは無作為のコンフォメーションより平均して多くの極性及び無極性の溶媒接近可能表面積、少ない内部相互作用、並びに大きい回転半径を有する。これらの結果は平均して活性なコンフォメーションが無作為のコンフォメーションよりコンパクト(ぎっしり詰まっている)でないことを示している。これらの記述子は、よりコンパクトでないコンフォメーションを含むためにコンフォメーション調査手法を偏らせるための有用なウエイト付けになり、それにより、薬理団の調査、分子ドッキング、及び3D−QSARなどのモデル化技法の結果を改良するであろう。
【0149】
本発明の機能は、ソフトウェア、ハードウェア、マイクロコード、ファームウェア又はそれらの任意の組合わせにおいて適切なプログラムを作成することにより容易に自動化できる。更に、任意の型のコンピュータ又はコンピュータ環境が本発明の機能を提供、内臓及び/又は使用するために利用され得る。このような環境の一つは図8に示してあり、下記に詳細に記載する。
【0150】
一実施態様において、コンピュータ環境800は、例えば、少なくとも一つの中央演算処理装置810、主記憶装置820、及び一つ以上の入力/出力装置830を含む。これらのそれぞれを以下に記載する。
【0151】
知られているように、中央演算処理装置810はコンピュータ環境800の制御中心でありそして命令の実行、割込み行為、タイミング機能、初期プログラムローディング及び他の機械関連機能のための順序決定機能及び処理機能を提供する。中央演算処理装置は少なくとも一つのオペレーティング・システムを実行する。既知のように、該オペレーティング・システムは、他のプログラムの実行を制御し、周辺機器とのやりとりを制御しそしてコンピュータ・リソースの使用を制御することにより該演算器の操作を制御するために用いられる。
【0152】
中央演算処理装置810は主記憶装置820に連結されている。該820は直接アドレス可能であり該中央演算処理装置によりデータの高速処理を提供する。主記憶装置は物理的に該CPUと一体化されうるか又は独立の装置として構築されうる。
【0153】
主記憶装置820も一つ以上の入力/出力装置830に連結されている。これらの装置には、例えばキーボード、通信制御装置、遠隔処理装置、プリンタ、磁気記憶媒体(例えばテープ、ディスク)、直接アクセス記憶装置、及びセンサーベース装置を含む。データは主記憶装置820から入力/出力装置830へ移され、該入力/出力装置から逆に主記憶装置へ移される。
【0154】
本発明は、例えばコンピュータが使える媒体を有する製造品(例えば、一つ以上のコンピュータ・プログラム製品)に含めることができる。該媒体は、例えば、本発明の機能を提供及び促進するためのコンピュータ読み取り可能なプログラムコード手段をその内部に具現化した。該製造品はコンピュータシステムの一部として包含され又は単独で販売され得る。更に、本発明の機能を実施するために機械で実行可能な少なくとも一つの命令プログラムを現実に具現する、機械で読み取り可能な少なくとも一つのプログラム記憶装置が提供され得る。
【0155】
本明細書で示される流れ図は単に説明のためのものである。そこに記載されるこれらの図又は工程(又は操作)に対して本発明の精神を逸脱することなく多くの変形版が存在しうる。例えば、該工程は異なる順序で実行されうる、又は工程が追加、削除又は変更されうる。これらの変形版は全て請求の範囲に記載されている発明の一部とみなされる。
【0156】
好ましい実施態様は本明細書で詳細に示され且つ記載されるが、当業者には種々の変更、追加、置換等が本発明の精神から逸脱することなく為され得ることが明らかであり、従って、これらは請求の範囲によって定義される本発明の範囲内にあると考えられる。
【図面の簡単な説明】
【図1】
図1A〜図1Cは、タンパク質−リガンド複合体の形成を概念的に表す。
【図2】
図2は、本発明の原理に基づく、分子ドッキングアプローチの一実施態様のフローチャートである。
【図3】
図3は、本発明の原理に基づく、図2のドッキングアプローチにより用いられ得る分子コンフォメーション調査手法の一実施態様のフローチャートである。
【図4】
図4は、本発明の原理に基づく、図2の分子ドッキングアプローチで使用するための結合部位画像を確立する一実施態様のフローチャートである。
【図5】
図5は、本発明の原理に基づく、図2の分子ドッキングアプローチで使用するための適合手法の一実施態様のフローチャートである。
【図6】
図6は、本発明の原理に基づく、図2の分子ドッキングアプローチで使用するための同定された適合の中でリガンドの位置を最適化するための最適化工程の一実施態様のフローチャートである。
【図7】
図7は、本発明の原理に基づく、原子二つ一組の評点で用いる水素結合ポテンシャル及び立体ポテンシャルのグラフ表示である。
【図8】
図8は、本発明の能力を提供し及び/又は使用するコンピュータ環境の一実施態様を表す。
【図9】
図9は、結合中心内に位置するコンビナトリアル・ライブラリーから得られた化合物と共に、P1、P2及びP3のポケットを有する標的タンパク質の結合部位の概念表示である。
【図10】
図10は、プラスモディウム・ファルシパルム(Plasmodium falciparum)から得られる標的タンパク質のプラスメプシン(plasmepsin)IIにドッキングされたコンビナトリアル・ライブラリーPL792の化合物についてのクラスターの大きさを示すグラフである。
【図11】
図11A〜図11Fは、活性なコンフォメーションの調整記述子の集中し且つ縮尺した平均値(mean centered and scaled value)を示すグラフである。
発明の分野
本出願は、高速大量処理分子ドッキング技法を用いて、スクリーニング用のコンビナトリアル・ライブラリーの相補性を評価しそしてその選択に優先順位をつけるための計算方法に関する。
【0002】
発明の背景
コンビナトリアル化学並びにその結果もたらされた広範囲の標的に対する膨大な化合物を合成する能力の出現と共に、スクリーニングの活動に効率的に優先順位をつける能力が、与えられた標的についての化学空間(chemical space)の適切な領域を迅速に確認するために重要であることが明らかになった。コンビナトリアル化学及び高速大量処理スクリーニングの能力が与えられると、合理的な設計ツールを専ら使用してリード化合物を作製することはもはや必要でない。しかしながら、現在合成により得られうる化学空間の容量のために、あらゆる可能性のある化合物を適切にサンプリングすることは不可能であり、従ってコンビナトリアル化学という模範例を用いた場合でさえ、何らかの「合理的な」意思決定が要求される。例えば、化学空間の正確な領域(溶解性、形状、腸管吸収、及び他の性質などの物理的性質を用いて定義される)について迅速に焦点を当てることが重要である。効率的な優先順位決定手段により、科学者は費用効率が高く且つ能率的な様式でリードを得ることができ、活発な合成及び生物分析を行なう前に新規な標的に対するバーチャル・ライブラリーを試験することもでき、それにより経費を削減できるであろう。その上、今後のヒトのゲノム及び多数のゲノムの完全配列決定から予期される標的の来るべき激増により、資源は、活性化合物が得られそうにない化学空間の無駄なスクリーニング範囲でないことが絶対的となる。コンビナトリアル化学の出現で生じた新たな挑戦は、次に、コンビナトリアル・ライブラリーのこの選択に優先順位をつけることである。
【0003】
スクリーニングの活動に優先順位をつける方法は、該標的にドッキングされ且つ採点機能により序列付けされたライブラリー又はコレクションの個々の化合物を使用する。次いで、ライブラリー全体ではなく高位に序列付けされた化合物の部分集合が活性について検定されうる。この方法は個々の化合物を試験すべく選択するためのガイドとして有用であることが証明された一方で、コンビナトリアル・ライブラリーのスクリーニング活動に優先順位をつける方法、即ち、個々の化合物を序列付けするのではなく、化合物のコンビナトリアル・ライブラリーを序列付けする方法が依然必要である。
【0004】
発明の概要
簡潔に要約すれば、一側面において、標的分子にリガンドをドッキングする方法が本明細書で提示される。この方法は、ドッキング前にコンフォメーション調査を実施し該リガンドの複数の溶液コンフォメーションを作成する工程、複数のホットスポット(定義は段落0035にある)を含む、該標的分子の結合部位画像を作成する工程、該リガンドの複数の溶液コンフォメーションのうち少なくとも一つの溶液コンフォメーション中の原子群に該結合部位画像のホットスポット群を適合させ該標的分子に関連する少なくとも一つのリガンドの位置を得る工程、並びに該標的分子自体を固定させたままにし且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら、少なくとも一つのリガンドの位置を最適化する工程を含む。
【0005】
別の一側面において、標的分子にリガンドをドッキングするシステムが提供される。このシステムは、リガンドの複数の溶液コンフォメーションを作成するためにドッキング前にコンフォメーション調査を実施する手段を含む。更に、該システムは、標的分子の、複数のホットスポットを含む結合部位画像を作成する手段、並びに該標的分子に関連する少なくとも一つのリガンドの位置を得るために該リガンドの複数の溶液コンフォメーションのうちの少なくとも一つの溶液コンフォメーションにおける原子群に該結合部位画像のホットスポット群を適合させる手段を含む。該標的分子を固定したままに保持し且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら少なくとも一つのリガンドの位置を最適化するための最適化機構も提供される。
【0006】
更なる一側面において、本発明は機械により読取り可能な少なくとも一つのプログラム記憶装置を含む。この装置は標的分子にリガンドをドッキングする方法を実施するために該機械により実行可能な命令の少なくとも一つのプログラムを明確に具現する。該方法は、ドッキング前のコンフォメーション調査を実施し該リガンドの複数の溶液コンフォメーションを作成する工程、該標的分子の、複数のホットスポットを含む結合部位画像を作成する工程、該リガンドの複数の溶液コンフォメーションのうち少なくとも一つの溶液コンフォメーションにおける原子群に該結合部位画像のホットスポット群を適合させ該標的分子に関連する少なくとも一つのリガンドの位置を得る工程、並びに該標的分子を固定させたままにし且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら少なくとも一つのリガンドの位置を最適化する工程を含む。
【0007】
別の一側面において、本発明は標的分子に対する相補性についてコンビナトリアル・ライブラリーを評価する方法に関する。このライブラリーは共通のコア(core)を有する複数のリガンドを含む。該方法は該標的分子に複数のリガンドの個々のリガンドをドッキングして複数のリガンド−標的複合体形成における該標的分子に関連する複数のリガンドの位置を作成する工程であって複数のリガンドの位置は該標的分子に関連する複数の共通コアの位置を含むものである工程、他の共通コアの位置から複数の共通コアの位置の個々の共通コアの位置までの2乗平均偏差を決定する工程、並びに該2乗平均偏差に従ってクラスターを形成する工程を含む。
【0008】
別の一側面において、本発明は少なくとも一つの結合部位を有する標的に対する相補性についてコンビナトリアル・ライブラリーを評価するシステムに関する。該コンビナトリアル・ライブラリーはそれぞれが共通コアに基づいた複数のリガンドを含む。このシステムは、複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンドの位置を形成するための該標的分子に複数のリガンドの個々のリガンドをドッキングする手段であって複数のリガンドの位置が該標的分子に関連する複数の共通コアの位置を含むものである手段、他の共通コアの位置から複数の共通コアの位置の個々の共通コアの位置までの2乗平均偏差を決定する手段、並びに該2乗平均偏差に従ってクラスターを形成する手段を含む。
【0009】
更なる別の一側面において、本発明は機械により読取り可能な少なくとも一つのプログラム記憶装置に関する。該装置は少なくとも一つの結合部位を有する標的に対する相補性についてコンビナトリアル・ライブラリーを評価する方法を実施するために該機械により実行可能な命令の少なくとも一つのプログラムを明確に具現する。該コンビナトリアル・ライブラリーはそれぞれが共通コアに基づいた複数のリガンドを含む。該方法は複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンドの位置を作成するために該標的分子に複数のリガンドの個々のリガンドをドッキングする工程であって複数のリガンドの位置が該標的分子に関連する複数の共通コアの位置を含むものである工程、他の共通コアの位置から複数の共通コアの位置の個々の共通コアの位置までの2乗平均偏差を決定する工程、並びに該2乗平均偏差に従ってクラスターを形成する工程を含む。
【0010】
本明細書で提示するドッキング方法は幾つかの利点を有する。第一に、これは幾つかの独立した要素から構築される。これは科学進歩をより巧みに駆使することを可能とする。例えば、より優れたコンフォメーション調査手法(現文脈において、これはより生物学的に適切な三次構造体を意味する)が利用できるようになると、現行のコンフォメーション調査手法に代えて新しい三次元データベースの作成を使用できる。第二に、リガンドの可変性へのこの取り組みはコンビナトリアル方法により合成される化合物の部類により適している。コンビナトリアル・ライブラリーから得られる化合物はしばしば明瞭なアンカー断片を有していない。該リガンドからアンカー断片を見出しドッキングすることは漸進的構造アルゴリズム(incremental construction algorithm)において重要な工程であるので、これらのアルゴリズムはコンビナトリアル・ライブラリーで普通に見出される化合物について困難に遭遇する。(漸進的構造アルゴリズムはおおよそ下記のように作業する:リガンドを固定(rigid)断片に分割し、これらの断片のうち最大の断片を標的分子の結合部位にドッキングし、そして次に該リガンドを、適切な断片を付着させ該回転可能な結合の周囲を体系的に調査することにより結合部位に再構築する。該手法は、エム・レアリー、ビイ・クラメール、ティ・レンガウル、&ジイ・クレーブ、「漸進的構築アルゴリズムを用いる迅速可変的ドッキング方法」、J. Molecular Biology、261(1996)、470−489頁;及びエス・マキノ&アイ・クンツ、「自動可変的リガンドドッキング方法及びデータベース調査へのその適用」、J. Computational Chemistry、18(1997)、1812−1825頁)。)でさらに記載される。コンフォメーション全体のドッキングはこの困難を克服する。その上、効率的で柔軟な最適化工程を含むことは該コンフォメーション調査手法からかなりの負担を取除く。エネルギー最小化アルゴリズムの更なる改良も利用できるようになれば活用できる。
【0011】
本明細書におけるリガンドの可変性へのアプローチは、最初のコンフォメーション調査への信頼がもとで不利とみなされうるであろう。先に示したように、最大効率を達成するために、該コンフォメーション調査はライブラリー又はコレクション全体について一度は実施されるべきであり、得られたコンフォメーションは更なる使用のために保存されるべきである。大規模なコレクションでは、これはコンピュータ使用時間及びディスク空き容量の両方にかなりの投資となるであろう。データベースは通常何度も使用されるので、該コンフォメーション調査のための初期コンピュータ使用時間は容易に正当化され得る。更に、並列コンピュータ及びより高速のCPUを使用すると、該コンフォメーション調査は適度な量の時間で完了し又は時折やり直すことができる。ディスクの大きさは今やテラバイトのレベルに迫っているので、数百万の化合物のコンフォメーションを記憶することは全く問題ない。
【0012】
上述した本発明の目的、利点及び特性、並びに他は、添付の図面と併せて考慮されると、本発明のいくつかの好ましい実施態様の下記の詳細な記載からより容易に理解されるであろう。
【0013】
発明の詳細な説明
本発明は標的分子に対する相補性についてコンビナトリアル・ライブラリーを評価する方法に関する。本方法において、該ライブラリーの個々のリガンドは該標的分子にドッキングされ該標的に関連するリガンドの位置を形成する。個々のリガンドについて、該ライブラリーにおける他のリガンドの共通コアの位置から各リガンドの共通コアの位置までの2乗平均偏差が次いで決定される。最後に、該データをクラスター分析により体系化する。ここで、クラスターは該リガンドの共通コア間の2乗平均偏差に従って形成され、該ライブラリーは最上位クラスターのリガンドの相対数に従って序列付けられる。
【0014】
本発明の方法を用いてスクリーニングされうる該コンビナトリアル・ライブラリーは、一般的に、該標的に潜在的に結合する数千の化合物を含み、それ故に「リガンド」と呼ばれる。これらのライブラリーは、限られた数の位置に付いた置換基により変わる基本的な化学構造の周囲に構築される。該基本的な化学構造は本発明の目的上「共通コア」と称される。例えば、アスパルチル・プロテアーゼ阻害剤ライブラリーの共通コアは図9に示される。多数の異なるシントンは所定の位置で置換され、数万から数百万の化合物を含むライブラリーを生ずる。例えば、図9の構造において、R1 、R2 及びR3 は種々のシントンが置換されうる位置を示している。
【0015】
該ライブラリー、とりわけタンパク質及びヌクレオチドのリガンドに結合し得る標的分子は任意の生化学的な分子でありうる。本発明の方法は、具体的にはタンパク質の使用、とりわけ構造のデータ(一般的に結晶データ)が利用できるタンパク質についての使用を意図する。潜在的な結合部位は通常目視検査により構造中で同定される。
【0016】
本発明の方法において、個々のリガンドは該標的分子にドッキングされる。ドッキング手法は該標的分子に関連する個々のリガンドに対して少なくとも一つの位置を作成する。この場合、該リガンドは該標的上の相補的な結合点に適合する。好ましいドッキング手法は下記の工程を含む。即ち、ドッキング前のコンフォメーション調査を実施し各リガンドの複数の溶液コンフォメーションを作成する工程、該標的分子の結合部位画像を作成する工程、各リガンドの複数の溶液コンフォメーションのうち少なくとも一つの溶液コンフォメーションにおける原子群に該結合部位画像のホットスポット群を適合させ該標的分子に関連する少なくとも一つのリガンドの位置を得る工程、並びに該標的分子を固定させたままにし且つ該リガンドを並進させ、向きを変えそして回転可能な結合を変えながら該リガンドの位置を最適化する工程である。
【0017】
該ドッキング手法はタンパク質−リガンド複合体形成の概念像に基づいている(図1A〜図1Cを参照)。最初に、該リガンド(L)は溶液中で多数のコンフォメーションをとる。該タンパク質(P)はこれらのコンフォメーションのうち一つ又は数個を認識する。認識すると、該リガンド、タンパク質及び溶媒は局部エネルギー地形に従い最終的な複合体を形成する。該手法はタンパク質標的の用語で記載されるが、同工程は該標的がヌクレオチド等のタンパク質以外の生体分子である場合にも実施されうる。
【0018】
標的分子/リガンド複合体形成のこの単純な図は下記のように効率的な計算モデルに変換される。最初の溶液コンフォメーションは簡単なコンフォメーション調査手法を用いて作成される。この技法のコンフォメーション調査部分はドッキング工程全体の一部としてみなされるかも知れないが、それはリガンドのみに関連するので、純粋なドッキング工程から切り離すことができる。これは、分子コレクションについてのコンフォメーションの三次元データベースが容易に作成でき多くのドッキング研究で使用するために保存できるので正しいと判断できる(例えば触媒を用いて、エイ・スメリイ、エス・ディ・カーン、エス・エル・テイグ、「コンフォメーション範囲の分析1。範囲の検証及び評価」、J. Chem. Inf. Comput. Sci. (1995)、235巻、285−294頁、及びエイ・スメリイ、エス・ディ・カーン、エス・エル・テイグ、「コンフォメーション範囲の分析2。コンフォメーションモデルの適用」、J. Chem. Inf. Comput. Sci. (1995)、235巻、295−304頁参照)。この認識段階は該リガンドの原子群を該結合部位の「ホットスポット群」との相互作用に適合させることによりモデル化される。最終的な複合体の形成は単純なエネルギー関数を用いた勾配に基づく最適化技法を用いてモデル化される。この最終段階の間に、該リガンドの並進、向き、及び回転可能な結合は該標的分子及び溶媒を固定させたままにしながら変更できる。
【0019】
ほとんどのドッキング方法は二つの大まかに定義された範疇、即ち、(1)オートドック(AutoDock)(グッドフォード,ピイ・ジェイ「生物学的に重要な高分子についてエネルギー的に好ましい結合部位を決定する計算手法」,Journal of Medicinal Chemistry,1985,28(7)巻,849−857頁、グッドセール,ディ・エスとエイ・ジェイ・オルソン「模擬アニーリングによるタンパク質への基質の自動ドッキング」,PROTEINS: Structure, Function and Genetics,1990,8巻,195−202頁)、GOLD(ジョ―ンズ,ジイら「可変的ドッキングについての一般アルゴリズムの開発及び検証」,Journal of Molecular Biology,1997,267巻,727−748頁)、TABU(ウェストヘッド,ディ・アール、ディ・イー・クラーク、及びシイ・ダブリュ・ムレイ「分子ドッキングについての発見的調査アルゴリズムの比較」,Journal of Computer−Aided Molecular Design,1997,11巻,209−228頁、及びバクスター,シイ・エイら「タブ(Tabu)調査を用いた可変的ドッキング及び結合親和性の実証的評価」,PROTEINS: Structure, Function,and Genetics、1998、33巻、367−382頁)、並びに補正を用いた確率的概算(SAS)(ディラー,ディ・ジェイとシイ・エル・エム・ジェイ・ベルリンデ「分子ドッキングのための幾つかの国際的最適化アルゴリズムについての批評」,Journal of Computational Chemistry,1999,20巻(16),1740−1751頁)などの確立論的方法、又は(2)例えば、DOCK(クンツ,アイ・ディら「高分子−リガンド相互作用への幾何学的アプローチ」,Journal of Molecular Biology,1982,161巻,269−288頁、クンツ,アイ・ディ「薬物の設計及び発見のための構造に基づく戦略」,Science,1992,257巻,1078−1082頁、マキノ・エスとアイ・ディ・クンツ「自動可変的リガンドドッキング方法及びデータベース調査へのその適用」,Journal of Occupational Chemistry,1997,18(4)巻,1812−1825頁)、FlexX(レアリー,エムら「漸進的構造アルゴリズムを用いた迅速可変的ドッキング方法」,Journal of Molecular Biology,1996,261巻,470−489頁、レアリー,エム、ビイ・クラメール、及びティ・レンガウル「粒子の概念:タンパク質−リガンドドッキング予測の間に個別の水分子を配置する」,PROTEINS: Structure, Function, and Genetics,1999,34巻,17−28頁、レアリー・エム、ビイ・クラメール、及びティ・レンガウル「相互作用に基づく適応アルゴリズムを用いた疎水性リガンドのドッキング」,Bioinformatics,1999,15(3)巻,243−250頁)、及びハンマーヘッド(ウェルチ,ダブリュ、ジェイ・ルペルト、及びエイ・エヌ・ジェイン「ハンマーヘッド:タンパク質結合部位への可変的リガンドの迅速全自動ドッキング」,Chemistry&Biology,1996,3(6)巻,449−462頁)などのコンビナトリアル方法の一つに分類できる。
【0020】
該確率論的方法は、しばしばより正確な結果を与える一方で、通常非常に遅いため大規模なデータベースを調査することはできない。本明細書で提示される方法はコンビナトリアル群に該当する。このアプローチは、該リガンドと受容体との相互作用を適合させようと試みる点でFlexX及びハンマーヘッドに類似している。このアプローチはどのように該リガンドの可変性を処理するかという点でこれらの技法及び他の大部分のドッキング技法と著しく異なる。ほとんどの現行のコンビナトリアル・ドッキング技法は漸進的構造アプローチを用いて可変性を処理しているが、一方、本明細書に記載する技法は最初のコンフォメーション調査の後、該標的の存在下での勾配に基づく最小化を用いる。
【0021】
一般化された技法を図2に示す。最初に、コンフォメーション調査手法210をライブラリー又はコレクションの全体について実施し、得られるコンフォメーションは将来使用するために保存する。次に標的分子構造220を用いて結合部位画像を作成する。適合手順を実施し、最初に剛体としてのリガンドの所与のコンフォメーションを結合部位230内に配置することにより初期複合体を形成する。最後に、柔軟な最適化が実施され、ここで該適合が剪定され次いで最適化され最終結果240を得る。ドッキング・アプローチの個々のこれらの工程はそれぞれ図3〜図6を参照しながら以下にもっと詳細に記載する。
【0022】
単純だが効率的なコンフォメーション調査手法が好ましい。コンフォメーション調査はライブラリー又はコレクションの全体について一度実施し、得られるコンフォメーションは将来使用するために保存する。必要ならば、コンフォメーションの調査は定期的に反復できる。
【0023】
図3を参照すると、一様に分布する無作為のリガンドのコンフォメーションが形成され、回転可能な結合のみが変更できる。310。例えば、回転可能な結合のみを変更しうる、一様に分布する1000個の無作為コンフォメーションを形成できる。次に、個々のコンフォメーションの内部エネルギーを最小化する。ここでも回転可能な結合のみが変更できる。320。内部エネルギーは、例えば、ファン・デル・ワールス・ポテンシャル及び2面角項(dihedral angle term) を用いて見積もることができる。参照:ディラー,ディ・ジェイとシイ・エル・エム・ジェイ・ベルリンデ「分子ドッキングのための幾つかの全体的最適化アルゴリズムについての批判的評価」,Journal of Computational Chemistry,1999,20巻(16),1740−1751頁。これはその全体が参照により本明細書にインコーポレートされる。個々のコンフォメーションは、例えばBFGS(ブロイデン−フレッチャー−ゴールドファーブ−シャンノ)最適化アルゴリズムを用いて最小化できる。例えば、プレス,ダブリュ・エイチら、C言語の数的手順、第二版、1997、ケンブリッジ:ケンブリッジ・ユニバーシィティ・プレス、994(これはその全体が参照により本明細書にインコーポレートされる)を参照。
【0024】
最低の内部エネルギーをもつコンフォメーションを上回る選択的切捨てを超える内部エネルギーをもつコンフォメーションは排除される。330。例えば、最低内部エネルギーをもつコンフォメーションを15 kcal/mol上回る内部エネルギーをもつコンフォメーションはいずれも排除される。残りのコンフォメーションは評点され且つ序列付けられる。340。この評点は、該コンフォメーション調査手法をより生物活性のありそうなコンフォメーションに集中させるためにフィルター又はバイアスを取り入れ、不活性でありそうなコンフォメーションを排除する。この文脈において、「生物活性のある」及び「活性なコンフォメーション」は、生体標的に潜在的に結合できるリガンドのコンフォメーションとして定義され、リガンドが生体標的に結合するときのリガンドの実際のコンフォメーションに類似しうる。「不活性な」及び「不活性なコンフォメーション」は、逆の意味をもち、即ち、任意の生体標的に結合する可能性が非常に低いリガンドのコンフォメーションであり、従って、リガンドが生体標的に結合するときのリガンドの実際のコンフォメーションとは異なる。この焦点は、所与の生体標的に結合したリガンドのコンフォメーションを発見することを指向する分子ドッキング、薬物団(pharmacophore)調査及び三次元QSARなどの方法に極めて有益であろう。なぜなら、これらは必然的に出発点としてコンフォメーション調査に依存するからである。
【0025】
該切捨て値を上回る内部エネルギーをもつリガンドのコンフォメーションを排除した後、コンフォメーションは、不活性なコンフォメーションから潜在的に活性なコンフォメーションを識別する際の助けとなる一以上の三次元記述子/フィルターを取り入れた評点により序列づけできる。該評点は下記のように計算されうる:
評点=歪み−[(重み係数1 ×記述子1 )+(重み係数2 ×記述子2 )...+(重み係数n ×記述子n )]
上式中、所与の分子の所与のコンフォメーションの「歪み」は所与のコンフォメーションの内部エネルギーから最低内部エネルギーをもつ所与の分子のコンフォメーションの内部エネルギーを差し引いたものであり、nは用いられる記述子及び重み係数の数である。これにより、不活性なコンフォメーションは排除され、潜在的に活性なコンフォメーションが保持され次の工程で用いられる。極性溶媒接近可能表面積、無極性溶媒接近可能表面積、内部相互作用の数及び回転半径、又はそれらの組合わせなどの記述子が用いられうるが、不活性なコンフォメーションから活性なコンフォメーションを分離するために効果的に用いられうる他の記述子も存在しうる。該溶媒接近可能表面積は、原子のファン・デル・ワールス半径に適切な量(例えば1.4Å)を加算したものを用いて計算しうる。一般的に、窒素原子又は酸素原子は、水素に結合している場合又は水素結合を受入れることができる孤立電子対を有する場合、極性として取り扱われる。窒素及び酸素以外の原子は無極性として取り扱われ、水素原子は通常この計算には使用しない。内部相互作用数のNIは所与の分子における二つ一組の相互作用の数についての単なる計算であり、
【0026】
【数4】
【0027】
として定義される。上式中、この合計は1〜2及び1〜3の原子を除く原子i、原子jの全ての対にわたるものであり、dijはi番目及びj番目の原子間の距離であり、そして
【0028】
【数5】
【0029】
上式中の単位は全てÅである。コンフォメーションの回転半径は
【0030】
【数6】
【0031】
により与えられる。上式中、合計はコンフォメーションの全ての原子にわたるものであり、該コンフォメーションはその重心が0であるように並進される。例えば、極性溶媒接近可能表面積と無極性溶媒接近可能表面積との合計である溶媒接近可能表面積(SASA)は、記述子として用いることができ、該表面積項の重み係数として 0.1 を用いる。
評点=歪み−0.1×SASA
【0032】
より優れたコンフォメーションの予め定められた2乗平均偏差内にあるコンフォメーションを除去する。350。例えば、より高い序列の(即ち、より優れた)コンフォメーションの1.0Åの2乗平均偏差内にある如何なるコンフォメーションも除去できる。このクラスター化は余剰のコンフォメーションを取除くための手段である。所望のコンフォメーションの最大数、例えば50個のコンフォメーションがコンフォメーション分析工程の最後で保持される。360。
【0033】
所望する数を上回るコンフォメーションがクラスター化後に残る場合、次に最下位に序列されたコンフォメーションを所望する数のコンフォメーションが残るまで取除くことができる。
【0034】
標的への小分子の結合過程は水による「溶媒和」対標的分子による「溶媒和」の間の均衡である。これを心に留めて、溶媒接近可能表面積項が単純な水性溶媒和モデルとの類似で選択され得る。例えば、アイゼンバーグ,ディとエイ・ディ・マックラシアン「タンパク質の折りたたみ及び結合における溶媒和エネルギー」,Nature,1986,319巻,199−203、オオイ,ティら「ペプチドの水和の熱力学パラメータの尺度としての接近可能表面積」,Proceedings of the National Academy of Sciences ,1987,84巻,3086−3090頁、及びバジャ,エスら「受容体−リガンド・フリーエネルギーに及ぼすコンフォメーション可変性及び溶媒和の影響」,Biochemistry,1994,33巻,13977−13988頁。これらの各々はその全体が参照により本明細書にインコーポレートされる。タンパク質対水の「溶媒和」における重要な相違は、水が極性の相互作用のみと競合する一方で、タンパク質が極性相互作用及び疎水性相互作用の両方と効果的に競合することである。従って、本発明の目的上、極性及び無極性の表面積は同一に取り扱われる。重み係数として0.1を選択することはいささか恣意的であるが、表面積に基づく溶媒和モデル用に選択された重みに見合っている。究極的には、より多くの溶媒接近可能表面積をもつコンフォメーションは、標的とより広範囲に相互作用することができ、したがって若干高い歪みであり依然強固に結合し得る。より洗練された序列システムが本発明で用いられ得るであろうが、コンフォメーションを序列付けすることへのこのアプローチは妥当なコンフォメーションを供給する。
【0035】
上記結合部位画像は無極性のホットスポット(即ち、無極性原子が結合するのに好都合な結合部位の点)の一覧表、並びに極性のホットスポット(即ち、水素結合の供与体又は受容体が結合するのに好都合な結合部位の点)の一覧表を含む。これらの二つの一覧表を作成する一つの手法を図4に示す。最初に、該結合部位を見出すために、グリッドが該結合部位の周辺に配置される。410。一例として、該グリッドは各方向に少なくとも5Åの余分な空間をつけた少なくとも20Å×20Å×20Åでありうる。0.2Åの間隔が該グリッドのために使用できる。次に、「ホットスポットの調査容量」が決定される。420。これは該標的分子内部で任意のグリッド点を排除することにより達成される。例えば、該標的分子に接触しない6.0Å以上の球体に含まれる任意の点も排除できる。残存する最大の連結片が「ホットスポットの調査容量」となる。
【0036】
次いで、ホットスポットを該ホットスポット調査容量のグリッド様調査を用いて決定できる。430。一例として、グリッド様調査は、グッドフォード,ピイ・ジェイ「生物学的に重要な高分子についてエネルギー的に好ましい結合部位を決定する計算手法」,Journal of Medicinal Chemistry,1985,28(7)巻、849−857頁に記載されている。これはその全体が参照により本明細書にインコーポレートされる。無極性のホットスポットを見出すために、無極性のプローブが該ホットスポット調査容量の各グリッド点に配置され、該プローブの評点が計算され保存される。このプロセスは極性のホットスポットについて繰り返す。ホットスポットの各タイプについて、該グリッド点がクラスター化され、所望する数の最上位クラスターのグリッド点が保持され得る。440。例えば、トップ30のクラスターのグリッド点が保持される。
【0037】
図5を参照すると、最初に剛体としてリガンドの所与のコンフォメーションを結合部位内に配置するため、リガンドの原子群が適切なホットスポットに適合する。510。より正確には、一例において、若し下記の条件が満たされるならば、三個の原子A1 、A2 、A3 は三個のホットスポットH1 、H2 、H3 に適合すると考えられる。
i Aj の型はj=1、2、3のそれぞれについてHj の型に適合する。即ち、無極性のホットスポットは無極性原子に適合し、極性のホットスポットは極性原子に適合する。
ii j,k=1、2、3の全てについてD(Aj ,Ak )=D(Hj ,Hk )±δ。上式中、D(Aj ,Ak )及びD(Hj ,Hk )はそれぞれAj からAk への距離及びHj からHk への距離であり、δは例えば0.25Åから0.5Åまでの多少許容できる誤差量である。
【0038】
言い換えると、適合は、一例において、三つのホットスポットが三角形(triangle)を形成し該リガンドの三原子が実質的な三角適合(triangle match)を形成する場合に生じる。即ち、適合は、各三角形の頂点が同型であり且つ対応する辺が同じ長さである三角形が十分に類似する場合に生ずる。適合アルゴリズムは所与のコンフォメーションの原子と該ホットスポットとの間にあるあらゆる適合を見出す。次に、個々の適合が独自の剛体の変換を決定する。次いで、該剛体変換を該結合部位内へ該コンフォメーションを持ち込み初期の標的分子−リガンド複合体を形成するために使用する。
【0039】
工程520において、個々の適合は、
【0040】
【数7】
【0041】
上式を最小にする独自の剛体変換を決定する。上式中、Rは例えば3x3回転マトリクスであり、Tは並進ベクトルである。この場合もやはり、剛体変換は、一例において、3x3回転マトリクスのR及び並進ベクトルのTを含み、その結果、点X(該コンフォメーションの一つの原子の位置)はRX+Tにより変換される。次に、分析で決定され得る個々の剛体変換を用いて該リガンドのコンフォメーションを該結合部位内に配置する。530。該計算のこの側面については、全ての適合を見出すため幾つかのアルゴリズムが試験された。FlexX用に開発されたジオメトリックハッシングアルゴリズム(レアリー,エム、エス・ヴェルフィング及びティ・レンガウル「タンパク質の活性部位への中型の分子断片の配置」,Journal of Computer−Aided Molecular Design,1996,10巻,41−54頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)が最も効率的であることが証明された。
【0042】
一つのリガンドのコンフォメーションはホットスポットに結合する10,000個までの適合を生じ得る。効率性のために、大半のこれらの適合は最適化され得ない。従って、剪定/評点の戦略が望ましい。図6はこのような一つの戦略を図示する。
【0043】
図6を参照すると、最初に、予め定められた百分率(例えば10%)を超えるリガンド原子が立体衝突するような適合の全てが排除される。610。残りの適合は以下に記載される原子二つ一組の評点、例えば1.0の原子評点切捨てを用いて序列付けされる。620。切捨ての使用は、ほとんど立体衝突がなく最終ラウンドまで生き残るような適合を十分合理的にフィットさせる。ここで1.0の選択は単に例示であるに過ぎない。序列付けされた後、該適合をクラスター化し、最上位のN個の適合が選別され最終工程へ移される。630。ここでNは例えば25〜100の範囲の数を含みうる。
【0044】
残りの適合はそれぞれ、単純な原子二つ一組の評点を用いるBFGS最適化アルゴリズムを用いて最適化される。640。一実施態様において、該評点は区分的線形ポテンシャル(Piecewise Linear Potential)(ゲールハール,ディ・ケイら「HIV−1プロテアーゼによるAG−1343阻害剤の分子認識:進化的プログラミングによるコンフォメーション的に柔軟なドッキング」,Chemistry & Biology,1995,2巻,317−324頁参照。これはその全体が参照により本明細書にインコーポレートされる。)後にモデル化でき、相違は本明細書で用いられる評点が微分可能である(differentiable)ことが好ましいことである。この評点の場合、全ての水素は無視され、全ての非水素原子は四つの範疇の一つに分類される:
i 無極性−水素結合を形成できない原子全て。
ii 受容体−水素結合の受容体として作用し得るが供与体として作用し得ない任意の原子。
iii 供与体−水素結合の供与体として作用し得るが受容体として作用し得ない任意の原子。
iv 供与体/受容体−水素結合の供与体及び受容体の両方として作用し得る任意の原子。
【0045】
二つの原子の間の評点は水素結合ポテンシャル又は立体ポテンシャルのいずれかを用いて計算する。図7に示されるこの二つのポテンシャルは数式の形式を有する。
【0046】
【数8】
【0047】
上式中、Rminは最小評点の位置であり、εは該最小値の深度(depth)であり、σは軟化因子(softening factor)であり、そしてφ(r: r1,r0)はr<r1 ,φ=1及びr>r0 ,φ=0の場合にその性質を有するr(原子対間の距離)の微分可能な切捨て関数である。立体的及び水素結合に対する各ポテンシャルにはそれ自体のパラメータを割り当てる。これらのポテンシャルについてのパラメータは直観及びその後の試験を通して当業者により選択され得るが、これらは完全に最適化される必要はない。表1は二つ一組のポテンシャルについての実例パラメータを含む。
【0048】
【表1】
【0049】
これらのポテンシャルは二つの相違点を除いて多くの力場で用いられる12−6ファン・デル・ワールス・ポテンシャルに非常に類似している。第一に、軟化因子であるσは典型的な12−6ファン・デル・ワールス・ポテンシャルより明確に弱いポテンシャルを生じる(図7を参照)。即ち、ドッキング実行時によくある穏やかな立体衝突はこのポテンシャルにより許容される。心の中では、該軟化因子は、重要であり得る標的分子の小さな誘導適合効果を暗にモデル化したものであり(ムレ−,シイ・ダブリュ、シイ・エイ・バクスター、及びディ・フレンケル「分子ドッキングの結果の誘導適合効果への感受性:トロンビン、サーモリシン及びノイラミニダーゼへの適用」,Journal of Computer−Aided Molecular Design,1999,12巻,547−562頁。これはその全体が参照により本明細書にインコーポレートされる)、そして実際に、該ポテンシャルを誤差に対し遙かに寛容にさせる。第二の相違点は該切捨て関数である。この関数は該ポテンシャルが通常5.0Åから6.0Åの有限距離を超えたゼロであることを保証する。該標的分子の原子群のある構成と共に該関数は該評点の直接計算を顕著に高速化する。
【0050】
直接的に並びに予め計算されたグリッドによっての両方で該評点を計算することが試みられた。該グリッドを用いる利点は該評点が非常に迅速に計算され得ることである。グリッドは直接的な計算より5〜10倍早いことが見出された。該直接的な計算の利点は、標的分子の可変性及び溶媒の移動性などの効果がより容易に適応され得ることである。該グリッドの使用がドッキング結果の性質にいかなる劣化も惹起するように見えないので且つ目下標的分子の可変性又は溶媒の移動性が含まれないので、後文で提示される結果については、該評点は予め計算されたグリッドによって計算された。BFGS最適化アルゴリズムの目的上、回転可能な結合に関するものを含む全ての派生物が分析的に計算された(ハウグ,イー・ジェイとエム・ケイ・マッククロフ「機械動力への変動性−ベクトル計算アプローチ」,Journal of Mechanisms, Transmissions, and Automation in Design,1986,108巻,25−30頁を参照。これはその全体が参照により本明細書にインコーポレートされる)。
【0051】
該ドッキング手法を試験するために、GOLD試験セットが用いられた(ジョーンズ,ジイら「可変的ドッキングについての一般アルゴリズムの開発及び検証」、Journal of Molecular Biology,1997,267巻,727−748頁を参照。これはその全体が参照により本明細書にインコーポレートされる)。共有結合したいずれのリガンドも又は金属イオンに結合したいずれのリガンドも、現在、本明細書に記載される評点関数によりモデル化できないので、取除かれた。更に、いずれの「表面糖類」も遭遇する問題に典型的ではないので取除かれた。これにより全部で103の事例が残った(下記の表2を参照)。該試験事例の更なる個々の処理は実施しなかった(「タンパク質データバンク」(PDB)は標的分子構造が収納されたデータベースであることに留意せよ。この「PDBコード」は所与の構造を該PDBから見付け出し抽出することを可能とする四文字コードである)。
【0052】
【表2】
【0053】
【表2−1】
【0054】
【表2−2】
【0055】
予想されるように、該結合コンフォメーション(X=ray)と最も綿密に計算して作成されたコンフォメーションとの間の2乗平均偏差は回転可能な結合数が増加すると増加する。五つの事例を除く全てにおいて、少なくとも一つのコンフォメーションが該結合コンフォメーションの1.5Åの2乗平均偏差を用いたコンフォメーション調査により作成された。該コンフォメーション調査結果の最も興味深い側面は、幾つかのより硬いリガンドについて最小2乗平均偏差が大きかったことである。例えば、5未満の回転可能な結合をもつ幾つかのリガンドがあるが最小2乗平均偏差は1.0Åに近い。これは二つの理由から起こる。第一に全事例で1.0Åのクラスター化半径が用いられた。これにより、小さなリガンドのコンフォメーション空間が十分にサンプリングされなかった。しかしながら、分子サイズに依存するクラスター化半径はこの特定の問題を緩和するために用いることができるであろう。第二の問題は二つのsp2原子間の結合が常に共役するものとして扱われたことである。従って、この型の結合に遭遇する場合はいつでも平面的であるよう強く拘束される。二つのsp2原子間の結合がしばしば共役するものの、これは明らかに過度な簡略化である。これは本発明にしたがって二つのsp2原子間の2面角を平面から外れさせることにより対処されうる。この偏差は次いで共役の程度に応じてペナルティーを課せられ得る。このペナルティーはsp2原子の型に基づいて大まかに選択されうる(エス・エル・マヨ、ビイ・ディ・オラフソン&ダブリュ・エイ・ゴッダード「ドリーディング(DRIEDING):分子シミュレーションについての一般的力場」,J. Phys. Chem.,1990,94巻,8897頁を参照)。
【0056】
ドッキング実行について、二つの異なる組のパラメータ、即ち一つは高品質のドッキングのためのもので一つは迅速な調査のためのもの、が試験され該ドッキング実行の品質及び速度に及ぼすそれらの効果を調べた。二組のパラメータ間の重要な差異は適合寛容性及び数及びBFGS最適化実行の長さである。該適合寛容性は高品質の0.5オングストロームから迅速な調査の0.25Åの範囲にわたる。該寛容性が大きくなるほど見出される適合も多くなることに留意せよ。従って、より大きな寛容性はより綿密な調査を意味する一方、より小さな寛容性はそれほど綿密でないがより迅速な調査を意味する。迅速な調査では20工程について1つのリガンドにつき25個の適合が最適化されたのと比べて、高品質の実行では100工程について1つのリガンドにつき最大100個の適合が最適化された。
【0057】
第一の問題は所与の2乗平均偏差の切捨て間に少なくとも一つのドッキング位置を生じることである。ここで、結晶学的に観察されたXÅ内のリガンドの位置にドッキングされたリガンドはXÅヒット(hit)と称される用語を採用する。2乗平均偏差は高品質の実行について表1に示す。高品質の実行について、103事例のうち89事例が少なくとも一つの 2.0Åヒットを生じる。この数は 1.5Åで80、1.0Åで63及び0.5Åで26に減少する。迅速な調査については、103事例のうち75事例が2.0Åのヒットを生じ、65事例が 1.5Åのヒットを生じ、42事例が 1.0Åのヒットを生じ並びに16事例が 0.5Åのヒットを生じる。両事例において、これらの数はゴールド試験セット又は類似の試験セットに基づいて試験された他のドッキング・パッケージから得られる同様な統計値と比べて優れている(ジョ―ンズ,ジイら「可変的ドッキングについての一般アルゴリズムの開発及び検証」, Journal of Molecular Biology, 1997, 267巻, 727−748頁、バクスター,シイ・エイら「タブ(Tabu)調査を用いた可変的ドッキング及び結合親和性の実証的評価」, PROTEINS: Structure, Function, and Genetics ,1998,1998巻,367−382頁、レアリー,エム、ビイ・クラメール、及びティ・レンガウル「粒子の概念:タンパク質−リガンドドッキング予測の間に個別の水分子を配置する」,PROTEINS: Structure, Function, and Genetics,1999,34巻,17−28頁、レアリー・エム、ビイ・クラメール、及びティ・レンガウル「相互作用に基づく適応アルゴリズムを用いた疎水性リガンドドッキング」,Bioinformatics,1999,15(3)巻,243−250頁、並びにクラメール, ビイ、エム・レアリー及びティ・レンガウル「タンパク質−リガンド・ドッキングについてのFlexX漸進的構造アルゴリズムの評価」,PROTEINS: Structure, Function and Genetics,1999,37巻,228−241頁を参照)。
【0058】
第二の問題は、ドッキングされた化合物を正確に序列付けすることである。即ち、最上位に序列付けされたコンフォメーションが結晶学的に観察された該リガンドの位置に合理的に近接しているかである。これは第一の問題より極めて難解な問題である。高品質の実行についての最上位評点のドッキング位置と観察位置との2乗平均偏差は表1に示す。この事例において、二組のパラメータ間にほとんど差異はない。高品質の実行について、103事例のうち48事例が最上位評点のドッキング位置として 2.0Åヒットを生じる。この数は 1.5Åで41、1.0 Åで34及び 0.5Åで10に減少する。迅速な調査については、103事例のうち45事例が最上位評点のドッキング位置として 2.0Åヒットを生じ、1.5 Åで41、1.0Åで34及び 0.5Åで10である。
【0059】
この研究で用いた評点関数の有用性は、ドッキングされたコンフォメーションを絶対的に序列付けするための手段としてよりもごく少数のドッキングされたコンフォメーションを選別するための初期フィルタとして存在する。大半の良いドッキング位置、即ち低い2乗平均偏差はこの10%の切捨てに生き残る。しかしながら、大半のドッキング位置は生き残らない。高品質の実行については、平均して74の位置が見出されるが、該10%の切捨て後、平均して僅か8つしか残らない。迅速な調査については、平均して21近くの位置が見出されるが、該切捨て後に平均して僅か5つしか残らない。この時点で該10%の評点切捨てを生き残るドッキング位置は、更に最適化され、視覚的にスクリーニングされ、又はより正確ではあるが効率的でない評点関数を通過しうるであろう。
【0060】
高品質の実行では、一試験事例当たりの平均CPU時間(例えばシリコン・グラフィックス社(SGI)のコンピュータR12000を用いて)は約4.5秒である。この速度で、1CPUで百万個の化合物をスクリーニングするとおよそ50日かかるであろう。迅速な調査では、一試験事例当たりの平均CPU時間は一試験事例当たり約1.1秒に減少する。この速度で、1CPUで百万個の化合物をスクリーニングするとおよそ12日かかるであろう。データベース・ドッキングは極めて並列的な仕事であり、複数のCPUが妥当な時間量(例えば一日くらい)まで容易にこれを削減しうるであろう。
【0061】
この節では、小分子をドッキングさせることへの本明細書に記載のアプローチの長所を証明するために二三のの成功事例が示される。これらの事例全てにおいて、示される結果は並の品質のドッキングの実行から得られる。第一の事例はPDBエントリー3tpi(マークアート,エムら「トリプシン、トリプシノーゲン及び阻害剤とのその複合体における反応性部位及びペプチド群の幾何学」,Acta Crystallographica,1983,B39巻,480頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)からのジペプチドのIle−Valである。この事例は明瞭なアンカー断片がなく、その結果、ドッキングへの漸進的構築アプローチはこのリガンドでは難儀するであろう。本発明者らのコンフォメーション調査手法は観察されたコンフォメーションの 0.42 Å内でコンフォメーションを作成した。最高評点のドッキング位置と観察位置との2乗平均偏差は0.53Åである。
【0062】
第二の例は15個の回転可能な結合を有するリガンドでありはるかに難しい例である。これは該PDBエントリーlida(トング,エルら「ヒドロキシエチルアミン・ジペプチド・アイソスターを含む阻害剤との複合体におけるHIV−2プロテアーゼの結晶構造」,Structure,1995,3(1)巻,33−40頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)からのHIVプロテアーゼ阻害剤である。この事例において、該コンフォメーション調査手法は該結合したコンフォメーションから 0.96 Åの2乗平均偏差のコンフォメーションを作成できた。最上位評点のドッキング位置についての2乗平均偏差は1.38Åである。実際に、最上位の13点のドッキング位置は全て該観察位置の 2.0Å内にあり最も近かったのはほぼ1.32Åであった。
【0063】
最後の事例は該PDBエントリー4phv(ボーネ,アールら「L−700, 417によるHIVプロテアーゼ複合体のX線結晶構造、擬似C2対称性を備えた阻害剤」,Journal of the American Chemical Society,1991,113(24)巻,9382−9384頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)からのHIVプロテアーゼ阻害剤である。この事例のリガンドは12個の回転可能な結合を有する。これは明らかに該リガンドの最終可変的勾配最適化工程(final flexible gradient optimization step)を含める値打ちを証明している。該コンフォメーション調査手法から作成された最も近いコンフォメーションは結晶学的に観察されたコンフォメーションから1.32Åである。最高評点のドッキング位置は該観察位置に最も近く、0.38Åの2乗平均偏差である。可変的な最適化無しに得ることのできた最小の2乗平均偏差は該コンフォメーション調査手法により作成された最も近いコンフォメーションの2乗平均偏差であり、即ち1.32Åである。従って、この事例において、該可変的な最適化は少なくとも1.0Åまで該最終2乗平均偏差を下げた。
【0064】
ドッキングのシミュレーションが失敗する場合、該評点は失敗した、即ち該評点関数の全体的最小値は結晶学的に決定されたリガンドの位置に対応しなかった、としばしば推測される。ドッキングの問題は多数の自由度を含むので、多くの事例で該失敗は不十分な調査に帰することができると考えるのが妥当である。本明細書に記載の手法が不完全に実施される場合の失敗の原因を同定することがこの節の目的である。
【0065】
評点の失敗又は調査の失敗のいずれかとしてのドッキングの失敗を分類するために、該リガンドは標的分子に結合したものとしてBFGS最適化を実施した。得られる評点が該ドッキング実行から見出される最良の評点より有意に小さかった場合、その失敗は調査の失敗として分類される。他の失敗はいずれも評点の失敗として分類される。
【0066】
圧倒的多数の事例が中程度の評点誤差と認定され、即ち該全体的最小値は該リガンドの結晶学的な位置に対応していないようである、しかし該全体的最小値と該リガンドの結晶学的な位置に近い最良評点の間の差の百分率は10%に満たない。これらの事例において、該評点のどの側面が失敗しているのかを決定することは難しいが、これらの事例の多くが水素結合の条件又は溶媒和モデルに基づいた角度の拘束などの幾つかをより詳細に該評点関数に含めるだけで訂正できると考えるのが妥当である。しかしながら、深刻な評点誤差のある事例が少数存在する。これらの事例は該評点の弱点及び標的分子/リガンド相互作用の複雑性への何らかの洞察を提供する。
【0067】
1glq(ガルシア−サエズ,アイら「S−(p−ニトロベンジル)グルタチオン及び他の阻害剤と複合体形成したマウス肝臓πクラスのグルタチオンSトランスフェラーゼの1.8Åでの分子構造」,Journal of Molecular Biology,1994,237巻,298−314頁を参照)の事例はこの研究で用いた評点の主要な弱点−水素結合の様式を指摘した。これは極性のリガンドである。このリガンドについての最上位の位置は、多数の「感知された」水素結合が存在するため、おおむね非常によく得点する。実際には、該相互作用の角度依存が乏しいため、これらの水素結合は極めて弱い。さらに、X線配置の硫黄原子はチロシンのOHから水素結合を受容しており、カルボン酸はリシンとの塩橋に関与する。これらの相互作用はいずれも本明細書に記載される評点機能により認識されなかった。
【0068】
live(ジェドルゼジャス,エム・ジェイら、「インフルエンザ・ウイルス・ノイラミニダーゼの芳香阻害剤の構造」、Biochemistry、1995、34巻、3144−3151頁を参照)の事例において、正しい位置は観察されるコンフォメーションの推定歪みによりおおむね比較的低い評点を受取る。該ドッキング手法は共役されるものとしてのある種の結合を認識する。従って、これらの結合が平面的でない場合厳しいペナルティーが適用される。観察されるコンフォメーションにおいて、該2面角は全て平面から80度近い。これらの2面角が余儀なく0°近くになる場合、該コンフォメーションは該リガンドと該標的分子との観察される相互作用にもはや適合しない。いかなるドッキング・アルゴリズムも該2面角についてのこれらの値を予測することは困難であろう。
【0069】
HIVプロテアーゼ阻害剤である1hef(ムルチー,ケイ・エイチ・エムら、「ヒト免疫不全ウイルス1型プロテアーゼに結合するヒドロキシエチレン系阻害剤の2.2−A解像度での結晶構造は該阻害剤が二つの異なる配向性で存在することを示す」、Journal of Biological Chemistry、1992、267巻、22770−22778を参照)の事例は、おそらく深刻な評点誤差の全てに最も関与している。該結合ポケットは二量体の界面にあり、該標的単量体は結晶学的対称操作の間に関係する。該リガンドのC末端では、メチル基は2.0Å内にある。これらの相互作用は予測することが極めて難しい。本発明者らのプログラムは該リガンドのC末端についての興味深い代替コンフォメーションと対等になった。このコンフォメーションは内部及び外部の立体的衝突をともに排除し標的分子との更なる水素結合を形成する。
【0070】
コンフォメーション調査の失敗として分類された二つの事例、即ち1hefと1pocがある。これらの事例において、作成される最良のコンフォメーションはそれぞれ2.1Å及び2.3Åである。1poc事例のリガンドは23個の回転可能な結合を有するため、僅か50個のコンフォーマー(conformer) でそのコンフォメーション空間を十分に網羅することは非常に難しい。一方、1hef事例のリガンドも非常に可変的(18個の回転可能な結合)であり、上述したように、観察されるコンフォメーションも深刻な立体的衝突を有する。従って、予想されるように、これはどのコンフォメーション調査手法にとっても非常に困難な挑戦である。
【0071】
本出願において、標的分子の結合部位内へ可変的リガンドをドッキングさせるための新規で且つ迅速な技法が提示される。この方法は、該リガンドについての予め作成された一組のコンフォメーション並びに該標的分子の結合部位におけるリガンドの最終可変性勾配(final flexible gradient)に基づく最適化に基づいている。その結果に基づけば、これはリガンド可変性を取り扱うためのエラーに強いアプローチである。比較的少ないコンフォメーション(1分子当たり50未満)を用いて、通常、結合コンフォメーションの1.5Å以内のコンフォメーションを作成できる。最終工程として該可変的な最適化を適用することにより、高品質の最終ドッキング位置を維持しながら必要とされるコンフォメーションの数を減少させうる。
【0072】
例示されたドッキング技法を改良するための機会がある。このような改良も本発明の範囲内におさまる。例えば、適合体の作成は、かなり上出来である場合、比較的固定した小分子と可変的な大分子とは異なって扱うべきである。非常に大きな可変的分子のコンフォメーション空間は広すぎて完全に調査できないため、モンテカルロ調査アルゴリズムが用いられる。その上、該コンフォメーションを序列付けるために用いられる評点は確実に単純化し改良され得る。例えば、溶媒和モデルの変形(アイゼンバーグ,ディとエイ・ディ・マックラシアン、「タンパク質の折りたたみ及び結合における溶媒和エネルギー」、Nature, 1986, 319巻、199−203、スティル,ダブリュ・シイら、「分子の力学及び動力学に関する溶媒和の半分析学的処理」、Journal of the American Chemical Society, 1990、112巻, 6127−6129頁を参照。これらは両方ともそれらの全体が参照により本明細書にインコーポレートされる。)はおそらくより良いコンフォメーションを与えるであろう。最後に、歪みのより優れた処理、とりわけ二つのsp2原子間の間の結合の周りの回転についての歪みの処理が改良された結果を産むかも知れない。
【0073】
例示される実施態様において、極性のホットスポットを見出すために用いるアルゴリズムは結合部位に埋もれたホットスポットではなく任意の水素結合の供与体及び受容体を見出す傾向がある。該ホットスポット調査ルーチンの改良は該技法の品質を高めるだけでなく、必要なホットスポットの数も減少させるので、該技法をより効率的にする。GRID(グッドフォード,ピイ・ジェイ、「生物学的に重要な高分子についてエネルギー的に好ましい結合部位を決定する計算手法」,Journal of Medicinal Chemistry,1985,28(7)巻,849−857頁、スティル,ダブリュ・シイら,「分子の力学及び動力学に関する溶媒和の半分析学的処理」,Journal of the American Chemical Society,1990,112巻,6127−6129頁を参照。これらは両方ともそれらの全体が参照により本明細書にインコーポレートされる。)又はLUDI結合部位の記述(ボーム,エイチ・ジェイ,「LUDI:酵素阻害剤誘導(lead)についての規則に基づく新規な置換基の自動設計」,Journal of Computer−Aided Molecular Design,1992,6巻,693−606頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)又は文書化された方法(ミルズ,ジェイ・イー・ジェイ、ティ・ディ・ジェイ・パーキンス、及びピイ・エム・ディーン,「結合部位における水素結合原子の位置を予測する自動方法」,Journal of Computer−Aided Molecular Designs,1997,11巻,229−242頁を参照。これはその全体が参照により本明細書にインコーポレートされる。)などの幾つかの利用できるプログラムがおそらくある種の改良を示すであろう。更に、該極性のホットスポットを供与体、受容体、イオンなどに区分すると、ホットスポットは該結果を改良しうる。最後に、実用化において、大半の利用者は該画像を強調するためにいくらかの時間を費やすことを厭わないであろう。即ち、手動で劣悪なホットスポットを排除し、必要ならばホットスポットを追加する。実際に、これはドッキングの実行を有意に改良するであろう。
【0074】
全てのドッキング・プログラムにおいて、良い評点は効率的で誤差に寛容であり且つ正確であるべきである。本明細書で用いられる評点は初めの二つの性質を満足する。これらの二つの性質は、しかしながら、三番目の性質と通常両立できない。より正確な評点が適用され得た後にこの評点は初期スクリーニングとしてなお有用であるように見える。水素結合の項についての立体的拘束、イオン相互作用や溶媒和効果の認識、並びに金属を取り扱う項が正確性を改良するために導入され得る。
【0075】
それにもかかわらず、結晶構造が利用できる場合、分子ドッキングへの本発明のアプローチはライブラリーのスクリーニングの優先順位決定に有用である。相同性モデルなどのより低い品質の構造情報でさえ、本明細書に記載の技法はなお有用な情報を提供する。
【0076】
個々のリガンドが該標的にドッキングされた後、ドッキング結果は分析を容易にするためクラスター化手法を用いて体系化される。この手法において、複数のクラスターが形成され、これらの各々は該標的分子に関する該リガンドの位置の類似のものの群から構成される。単結合クラスター化アルゴリズム(single linkage clustering algorithm)は、クラスター化測定基準(clustering metric)としてリガンドの位置の対の間の2乗平均偏差とともに用いられうる。該リガンドのコア間の2乗平均偏差がある所定の数(典型的には0.25Åから0.5Å)未満である場合の位置の対は同じクラスターに入る。代替のクラスター化アルゴリズムも用いられうる。単結合クラスター化はその単純性の故に特定の事例において有利でありうる。最上位クラスターにあるライブラリーの化合物の相対数は該標的分子に対する該ライブラリーの相補性の尺度であり該ライブラリーを序列付けするために用いられる。
【0077】
一つの実施態様において、該リガンドの位置は図式解法を用いてクラスター化される。N個の化合物を含むライブラリーについて、該クラスター化手法はN(N−1)/2の2乗平均偏差の計算を必要とする。1化合物につき1ポーズ(pose)をもつ一万個のメンバーのライブラリーでは、5万個の2乗平均偏差の計算が必要とされる。この数は下記の考慮により実際には大幅に低減できる。2ポーズのコアの重心間の距離が所定の切捨てより大きいならば、該2コア間の2乗平均偏差は該2乗平均偏差の切捨てより必然的に大きい。従って、三次元の容量をより小さな容量単位への細分割を規定するグリッドが該標的分子の結合部位周辺に配置される。該ポーズの個々の重心が計算され特定のグリッド立方体と関係付けられる。2乗平均偏差は近くの立方体の位置の間でのみ計算される。実際には、これは10〜100の係数まで計算数を減らす。
【0078】
ライブラリーの優先順位決定問題に取り組むためにドッキング・アプローチを用いる場合の一つの潜在的な難題は陽性と誤ることである。この問題は実例を通して最もよく説明される。我々が二つのコンビナトリアル・ライブラリー(A及びB)を有し、そのそれぞれが10,000個の化合物を含むと仮定する。ある標的に対して、Aライブラリーは活性化合物を含まないが、Bライブラリーは25個の活性化合物を含むと仮定する。最後に、我々は操作時間の95%まで化合物を(活性又は不活性と)正しく分類するために十分正確なドッキング手法を有すると仮定する。その場合、我々はAライブラリーから平均で500±22のヒットを見出し、一方Bライブラリーについては我々は平均で524±22のヒットを見出すであろう。こうして、この非常に正確なドッキング手法を用いた場合でさえ、Bライブラリーより活性なものとしてAライブラリーを分類する可能性が依然かなりあるであろう。さらに、95%正確なドッキング方法は無い。また、一つのコンビナトリアル・ライブラリーにおける化合物の間に明確な構造的類似性があり、従って活性化合物を含むライブラリーは該ライブラリーの活性化合物に類似したかなりの数の化合物を含むことになる。活性化合物に類似したこれらの化合物はどの計算手法によっても誤って陽性として見出される可能性が高い。
【0079】
この効果は再び実例によって最も良く説明される。標的の結合部位がP1、P2及びP3の三つのポケットを有し且つライブラリーのコアがR1、R2及びR3という置換のための位置を有すると仮定する(図9参照)。更にそれぞれの位置で合計27000個の化合物に対して30個の異なるシントンが存在すると仮定する。最後に、このライブラリーから得られる化合物は、R1で三つのシントンのうち一つを有し、R2で三つのシントンのうち一つを有し且つR3で三つのシントンのうち一つを有する場合に活性でありそしてその場合にのみ活性であり、このライブラリーに27個の活性化合物を与えると仮定する。これらの27個の活性化合物がうまくドッキングされ良い評点を受ける場合でさえ、これら27個の活性化合物の評点が、このライブラリーを不活性なライブラリーから突出させる原因となるであろうことはありそうにない。
【0080】
しかしながら、少なくとも二つの「活性な」シントンを有する756個の化合物が存在する。これらの化合物は無作為の評点より良い評点を受取る可能性が非常に高い。従って、あまり正確でないドッキング手法でさえも、コンビナトリアル・ライブラリーにより表されるように、化学空間の領域は正確に同定され得る可能性が高い。
【0081】
実施例
本発明のクラスター化方法は、ファルマコピーア社から入手できる四つのECLiPS(商標)アスパルチル・プロテアーゼ・インヒビター・ライブラリーのPL419、PL444、PL792、及びPL799を用いた評点方法と比較して評価された。これらのライブラリーはプラスメプシンII(pdb同定子1sme)及びカテプシンD(pdb同定子1lyb)の結合部位内にドッキングされた。四つの該ライブラリーは、下記に示すように、ペプスタチンのコアに基づいている。
【0082】
【化1】
【0083】
これらのライブラリーは、該四つのうち三つ(PL444、PL792、及びPL799)が以前プラスメプシンIIとカテプシンDの両方に対する活性についてスクリーニングされかなりの数の活性化合物を生じたので選択された。四番目のライブラリーのPL419はプラスメプシンIIに対して試験されてかなりの数の活性化合物を得ており、カテプシンDに対しては試験されていないものの、該ライブラリーから再合成された化合物はカテプシンに対して活性であった。その上、該ライブラリーは大きく(平均分子量が550)可変的な(回転可能な結合の平均数が19)化合物から構成されるので、これらは如何なるドッキング手法に対しても相当な挑戦であった。分子量、回転可能な結合の数、及びライブラリーの化合物の数を含むライブラリーの関連する物理的特性は表3に示す。
【0084】
二つの該標的に対する該ライブラリーの高速大量処理スクリーニングから得られたデータ、並びに該ライブラリーから再合成された化合物のKi の測定から得られたデータを表4に示す。該ライブラリーはこれらのデータに従った相対的活性に関して序列付けされうる。
【0085】
高速大量処理スクリーニングから得られるデータは一般的に活性形及び不活性形をとる。つまり、所与の化合物が、該スクリーニング試験で陽性活性を示す「解読された」合成ビーズ上に見出されか否かである。一個の解読されたビーズは陽性であると誤るかなりの可能性あるので、高速大量処理データに基づいてライブラリーに活性/効力の絶対的な度合いを付与することは困難である。複数の解読されたビーズ上に出現する化合物、即ち「重複解読」は陽性と誤る可能性が遙かに小さくなる(スクリーニングされるビーズの数は、ノイズを最小化するため、典型的には3の係数まで、通常化合物の数より多い)。従って、重複解読の数はライブラリーの活性についてのより良い目安である。
【0086】
【表3】
【0087】
ライブラリーの活性/効力についての第二の尺度は再合成され且つ検定されたこれらの解読された化合物の効力である。ほとんどの場合、ほんの一握りの解読された化合物が大量に再合成され検定された。従って、再合成された化合物の効力それ自体は該ライブラリーの全体的活性の完全な反映ではない。こうして、ライブラリーの活性は、解読の数/重複解読の数、及び効力(通常選別され再合成された化合物の最大効力)の両方により測定される。
【0088】
プラスメプシンに対するこれらの活性/効力に関して、該ライブラリーは下記のように序列付けられる。
PL792>PL419=PL444>PL799
相対的活性/効力は表4に示される解読の数/重複解読の数及びKi値に基づくこの様式で定義される。PL419及びPL792の両方は相当の数の解読及び重複解読を生じた。PL792が100nM以下のKi(単数又は複数)をもつ幾つかの化合物を生じた一方で、PL419に見出された最も効力のある化合物は540nMのKiを有していた。こうして、PL792は最も活性なライブラリーとして序列づけられる。より多くのデコード及び重複デコードを生じたので、PL419はプラスメプシンに対してPL799より活性であるとして序列付けられる。PL444はPL799と同様な数の重複解読を生じたが、有意により高い効力の化合物を生じた。従って、PL444はPL799より活性であるとして格付けされた。PL444及びPL419は、PL419が有意により多くの重複デコードを生じたがPL444は有意により効力のある化合物を生じたので、ほぼ等しい活性であるとして序列付けされる。
【0089】
カテプシンについては、該ライブラリーは下記のように序列付けされた。
PL444>PL792>PL799
PL444は最大の重複解読及び最も活性な化合物を生じたので、カテプシンに対して最も活性であるとして序列付けされる。PL792はPL799より多くの重複解読及びより効力のある化合物を生じた。従って、カテプシンに対して、PL792はPL799より活性であるとして序列付けされる。PL419はカテプシンに対してスクリーニングされなかったが、PL799が生じた如何なるものよりカテプシンに対して有意により効力のあった化合物を生じた。
【0090】
【表4】
【0091】
更に、8つの「仮想」ライブラリーが負の対照として作成された。これはスタチン(statine) のコアにある一つの不斉中心のコンフィギュレーションの点でのみ正の対照と異なっている。これらの仮想ライブラリーをPL419R、PL419D、PL444R、PL444D、PL792R、PL792D、PL799R及びPL799Dと名付けた。上に示した本来のペプスタチンの足場は、スタチンのコアに対応し、該アミノ酸の二つの立体中心、ヒドロキシル基をもつ炭素、及びCα原子を有する。両立体中心はLコンフィギュレーションである。追加のRと名付けられたこのライブラリーは、ヒドロキシル基をもつ炭素が正の対照のそれと逆のコンフィギュレーションを有することを除いて標準的なライブラリーと同一であり、Rと名付けられ、下記に示す。
【0092】
【化2】
【0093】
追加のDと名付けられたライブラリーは、スタチンの一部が上記に示されるように標準的なL−アミノ酸のかわりにD−アミノ酸を有することを除いて標準的なライブラリーと同一である。これらの仮想ライブラリーは、プラスメプシンII又はカテプシンDに対して活性を示すことが知られているR−スタチン又はD−アミノ化合物が存在しないので、負の対照として利用される。従って、これらの追加のライブラリーいずれかは本来のライブラリーより顕著に活性が低いか又は完全に不活性であろうと仮定された。その上、これらのライブラリーは全く同じ性質の配分(分子量、回転可能な結合数、水素結合の供与体など)を有するので、負の対照ライブラリー及び本来のライブラリーをドッキングする結果の差異は直接的に受容体との適合性及び相補性における差異に帰する。
【0094】
12個のライブラリーの各々は上述した手法を用いてプラスメプシン2及びカテプシンDの結合部位内にドッキングされた。プラスメプシンの場合、該結合部位周辺の20Å×32Å×22Åのボックスが調査空間として選択された。カテプシンDでは、該結合部位周辺の22Å×30Å×24Åのボックスが調査空間として選択された。簡単にするため、各分子について最上位に序列付けられたドッキング・ポーズのみが該分析で用いられた。両事例のドッキング時間は1化合物当たり3〜5秒の範囲である(表5参照)。結果は本発明の(比較)評点方法及びクラスター化方法の両方により分析された。
【0095】
【表5】
【0096】
実施例1(比較)評点分析:
該評点方法はライブラリー間の評点分布を比較する。(評点により序列付けられた)ドッキング化合物の上位5%における評点の2乗平均(rms)をライブラリー全体の評点として用いる。この論理的根拠は、ライブラリーが活性化合物を有するならば、かなりの数の化合物が該活性化合物に十分類似しており、結合部位内にかなり巧く適合し同様に良い評点を受けるはずであるということにある。従って、活性ライブラリーから得られる最高点の化合物は不活性ライブラリーから得られる化合物とは異なって分布するはずである。
【0097】
該評点を用いて結果を分析するために、まず該化合物をそれらの評点に従って分類する。次に、ライブラリーの評点を、
【0098】
【数9】
【0099】
によって計算する。上式中、Si はi番目に序列づけされた化合物の評点であり、この合計は上位5%より上の化合物のみに適用し、Nはライブラリー中の化合物の数である。該合計はライブラリーの化合物の20分の1(5%)にしか及ばないので、20の係数が式(1)に現れる。上述した評点手法が用いられた。平均ではなく評点の2乗平均(rms)を選ぶ理由は、該2乗平均が非常に良い評点を受ける少数の化合物を含むライブラリーに有利に働く点にある。
【0100】
該評点を分析するために用いられうるであろう幾つかの付加的な統計的な量がある。例えば、ゴッドンらの異なるタンパク質結合部位への大規模な化合物データベースの計算ドッキングの統計分析では、多数のドッキング化合物から得られる評点分布の歪みが、ある範囲の標的にわたって試験された。評点全ての平均及び標準偏差を含む付加的な統計的尺度が用いられうるであろう。平均値、標準偏差、又は歪みなどの統計的な量を用いることに伴う問題は、本発明者らが良い評点を受ける化合物に興味があるのに対し、それらが全て低い評点を受ける化合物により影響されることである。例えば、全てが中程度の評点を受ける化合物のライブラリーは、化合物の半分が低い評点を受けそして半分が高い評点を受けるライブラリーと同じ平均値を有することになる。本発明者らは二番目のライブラリーにより遙かに強い興味を持つ。本発明者らは主として良い評点を受ける化合物に関心があるので、該化合物の上位5%のみを使用する。5%の的確な選択は恣意的であったが結果にほとんど関係が無いようであった。
【0101】
プラスメプシン及びカテプシンへのPL419、PL444及びPL792のドッキングについて、該評点は元のライブラリーを最上位に、次にR−スタチン・コアをもつライブラリーを、その後にD−アミノ酸をもつライブラリーをと序列付けする(表6参照)。プラスメプシン及びカテプシンの両方を用いるPL799については、該評点は再び該三者の最上位として元のライブラリーを序列付けするが、D−アミノ酸をもつ該ライブラリーを二番目に、R−スタチン・コアをもつ該ライブラリーを最後に序列付けする。こうして、標的及び三つのライブラリー全ての両方に対して予期されたように、最上位で評点するライブラリーは、方程式1により判断される場合、元のライブラリーである。
【0102】
【表6】
【0103】
四つの元のライブラリー相互間の比較はそれほど容易でない。例えば、ドッキングされた化合物の評点は、しばしば、該化合物の分子量、極性原子の数などの物理的性質と何らかの相関性を示す。とりわけ、より大きく且つより極性のある分子は、単により強い相互作用をする原子をより多く持つという単純な理由のため、より良い評点を得る傾向がある。プラスメプシンでは、該評点はPL444を明確に最上位に、続いてPL792、その後にPL799、そして最後にPL419を序列付けする。カテプシンについては、該評点は再びPL444を最上位に、続いてPL792、その後にPL419及びPL799を序列付けする。従って、ライブラリーの実際の活性の程度(上記の表4参照)と該評点(表6)との間に何らかの相関関係がありそうに思われる。しかしながら、プラスメプシンについてはR−スタチンをもつPL444及びPL792の変形版(PL444R及びPL792R)はPL419の元のライブラリーより高く序列付けされたことに留意すべきである。従って、この関関係は完全なものではない。
【0104】
該評点は個々のシントンを序列付けするため用いることもできる。評点を所与のシントンに与えるため、方程式(1)は所与のシントンを含む化合物にのみ適用される。このため、本発明者らはPL792とプラスメプシンに注意を限定する。R2 置換では、三つのシントン、即ち(1) −Ch2Ph 、(2) −CH3 、及び(3) −CH2CH(CH3)2 が存在する。かなりの数の活性体 が(1)と(3)の両シントンに見出されたが、(2)には見出されなかった。これらのシントンの評点はそれぞれ169.9、155.2及び170.6である。該SARに基づけば、これは正しい序列付けである、即ち(1)と(3)のシントンは近くに序列付けされ、シントン(2)は顕著に低く序列付けされる。
【0105】
該SARとの一致及び該R3シントンの評点は完全から程遠い。実際、相関関係はないようである。最上位に序列付けされたシントンの大半は大きな極性のアミノ酸であり、一方、小さな無極性のアミノ酸はSARで優位にたつ。この相関関係の欠如について二つの説明がある。第一は、該分子の大きさ及び極性と該評点との間に顕著な相関関係が存在する。本発明者らが小さな無極性のアミノ酸に注意を限定する場合、該評点はそれらをL−ロイシン>L−イソロイシン>L−バリン>L−アラニン>L−t−ブチルグリシン>D−ロイシン>D−アラニンと序列付けする。ここで、L−バリン及びL−イソロイシンは実験的に観察された活性化合物の中で最も普通に観察されたシントンである。こうして、一式の無極性アミノ酸内で、実験的SARとの何らかの相関関係が観察される。相関関係の欠如についての第二の理由は、31個のR3シントンがあるため、個々のシントンを含む僅か420個の分子が存在することである。その結果、各シントンの評点は僅か21個(化合物の上位5%)の化合物に基づいている。これはかなりの量のノイズを誘導する可能性があり、このノイズは種々のR3シントンを正確に評点する能力を低下させる。
【0106】
該評点は分子量及び極性などの性質に相関するので、該評点方法を用いて、非常に異なる物理的性質をもつライブラリーを比較することは困難である。この問題はPL792のR3シントンの分析を通して最も良く説明された。この場合、該SARは小さなL−アミノ酸がこの位置に好ましいことを明確に示した。最高評点のシントンは、しかしながら、一般的に大きな極性アミノ酸であった。小さな疎水性アミノ酸に限定した場合、該評点はR3シントンについての高速大量処理SARと何らかの相関関係を示した。この問題は正確な溶媒和モデルの使用を通して軽減されうるかも知れないが、使用されるためには、該モデルは高速で且つ誤差に寛容でなければならないであろう。
【0107】
実施例2:クラスター化分析
クラスター化分析では、該クラスターは単結合クラスター化(single linkage clustering)を用いて形成された。ここでは二つのドッキング分子のコアの間の2乗平均偏差が測定基準として用いられた。原則的に、コアがある所定の切捨て、通常0.25Åから0.5Åの範囲内にある任意の二つのポーズは同じクラスターにある。この研究では、0.5Åの切捨てを用いた。上位のクラスターにあるライブラリーから得られる化合物の百分率を該ライブラリーを序列づけするために用いた。単結合クラスター化は該2乗平均偏差の切捨て以外のパラメータを要求しないので計算を容易にするために用いられた。これは、大規模なコンビナトリアル・ライブラリーのドッキングの結果から情報を引出すためにクラスター化が有用であることを証明するのに十分であった。
【0108】
適合の性質の尺度として、最大のクラスターにおける化合物の百分率が用いられた。評点の序列付けと同様に、両標的に対する元のライブラリー及び全部で三つのライブラリーは、対応するR−スタチン又はD−アミノ酸のライブラリーより高く序列付けされた(表4参照)。該クラスター化は、該評点が行なうよりも該対照ライブラリーから元のライブラリーをより良く区別するようである。元のライブラリーと対照ライブラリーの一つとの間の最も近いクラスターの大きさはPL419及びPL444及びプラスメプシンについてのものである。これら二つの事例では、該元のライブラリーについての最上位クラスターは、該ライブラリーの対応するR−スタチン版についての最上位クラスターより僅か30〜40%しか大きくない。残る6事例においては、元のライブラリーの最上位クラスターの大きさは少なくとも対照ライブラリーの大きさの2倍である。
【0109】
評点序列付けと同様に、異なるライブラリーに及ぶクラスターの序列付けはより問題がある。プラスメプシン及びカテプシンの両方については、該クラスターの大きさは三つのうち最良のものとしてPL792を、続いてPL419、その後にPL799を正しく序列付けする。しかしながら、該クラスターの大きさはPL419、PL444及びPL792のR−スタチン版をPL799の元のライブラリーの前に誤って序列付けする。これは該ライブラリー間の物理的性質の差異に帰することができる。PL799の化合物はPL419及びPL792の化合物より有意に大きく且つより可変的(表3を参照)である。更に、PL799の化合物には中央に可変的な環が存在し、コンフォメーション分析をより困難にする。従って、PL799の化合物は正確にドッキングすることが非常に難しく、結局、正しくドッキングされた化合物の割合を低くし、その結果、最上位クラスターをより小さくする。
【0110】
クラスター化法はデータ削減技法としても非常に有用である。本研究で用いられたプラスメプシン結晶構造の1sme及びカテプシン結晶構造の1lybは両方とも該結合部位にペプスタチンを含む。上述したように、これらのライブラリーのそれぞれのコアがペプスタチンのコアに基づいていた。その結果、直接的な2乗平均偏差はドッキング化合物の個々のコアと結晶学的に観察されたペプスタチンのコアの結合様式との間で計算され得る。PL792及びプラスメプシンについては、相当の大きさ(100メンバー以上)の個々のクラスターについての特定の2乗平均偏差を有する化合物の数のグラフが図10で示される。これは、比較的少数の有意なクラスターが存在し且つ最上位のクラスターが正しくドッキングされていることを示している。同じことが両標的に対する全部で四つの元のライブラリーにも言える。即ち、最上位のクラスターが正しくドッキングされており、且つ比較的少数の有意なクラスターが存在する(表7参照)。該ドッキング化合物を更にフィルタにかけるために可視的スクリーニングが用いられる場合、クラスター化は何万個もの各化合物を試験することから幾つかのクラスターを試験することへと必要な労力を削減し得る。
【0111】
該クラスター化方法は、該評点の正確度にほとんど依存しないため、該評点方法よりも有利である。むしろ、正確に堅実に化合物をドッキングさせる能力に依存しており、そして結合親和性を正確に推定することより化合物を正しくドッキングさせることの方が一般的に容易である。
【0112】
【表7】
【0113】
実施例3:記述子の評価
分子は歪みの低いコンフォメーションでタンパク質に結合するという証拠が存在する。幾つかのグループがプロテイン・データ・バンク(PBD)に寄託されたタンパク質−リガンド複合体から引出された小分子のコンフォメーションの歪みを調査した(ベルマンら,Nucleic Acids Res., 28(2000)235、及びベルマンら,Nat. Struct. Biol.,7(2000)957を参照)。初期の研究から、結合したコンフォメーションは実際に極めて歪んでおり、それらの歪みの推定値は5−40 kcal/molの範囲であることが見出された。しかしながら、これらの研究は、真空中でCHARMmを用いて該歪みを計算しており、該構造における幾らかの座標誤差の可能性を考慮しなかった。ボストロムら(Comput.−Aided Mol. Des.,12(1998)383)は溶媒和の補正を用いることにより該歪みの推定値がかなり減少することを示した。更に、彼等は寄託された構造におけるリガンドの実際のコンフォメーションが極めて歪んでいる事例を見出したが、幾つかのコンフォメーションが小さな歪みの構造の誤差内にあることを示した。最後に、彼等は、計算で用いられた力場が計算されたコンフォメーションの歪みに劇的な影響を及ぼしうることを示した。これらの一連の研究から幾つかの可能な結論が得られる。第一に、方法が改良されるにつれ、結合したコンフォメーションの歪みの推定値が有意に減少した。即ち、結合したコンフォメーションのほとんどは3−4 kcal/mol未満の歪みを有するようである。第二の結論は、座標誤差があれば、力場は依然あまりにも敏感であるためそれらがPDBに寄託されたような小分子のコンフォメーションの歪みを有効に見積もるために用いることはできない。
【0114】
小分子が低エネルギーのコンフォメーションでタンパク質に結合するという確信に対する第二部分の証拠は、タンパク質−リガンド複合体の結合定数を見積もるために用いられ且つ実験的に導かれた評点関数の開発である。これらのモデルはいずれもリガンドの歪みを考慮するための項を有さないが、これらのモデルは全て1−1.5 kcal/molの2乗平均誤差内まで実験的結合定数への適合を達成する。これらのリガンドの幾つかはほとんど又は全く歪みがなく結合すると推測するのが無難である。従って、これら全ての評点関数が有意に偏らない限り、歪みは、これらの評点関数を練習するために用いられる任意のタンパク質−リガンド複合体においてわずか3−4 kcal/molと計上すべきである。
【0115】
他方で、如何なる一連の構造活性データを調査しても、コンフォメーションが堅く結合した阻害剤と弱く結合した阻害剤との間に差異を生じ得ることを示す。第一の例として、IAとIBを検討する。
【0116】
【化3】
【0117】
IA分子は37 nmのIC50で血管内皮増殖因子受容体(VEGFr)に結合する。C8の原子が窒素に変わると(IB)、該化合物はVEGFrに対して不活性になる(IC50>10000 nm)。溶媒和効果は該変化の一部を説明するかも知れないが5 kcal/mol全てを説明できないことは確かである。該二分子間の最も大きな差異は、IB分子がアミノNH及びN8の間で内部水素結合の可能性を有するが、IA分子は有さないことである。この水素結合はIB分子の4−CI−フェニル−アミノを好ましくないコンフォメーションに固定しうる。こうして、この化合物がVEGFrに活性なコンフォメーションをとることを妨げる。
【0118】
第二の例として、IIA分子とIIB分子を検討する。コロニー刺激因子−1受容体(CSF−1r)に対して、IIAのIC50は500nMである一方、IIBは不活性である(IC50 >50000)。これら二分子の状態は上皮増殖因子受容体(EGFr)とほとんど逆であり、ここではIIBのIC50が50nMであることと比べてIIAのIC50は4000nMである。これら二化合物間の差異はアミノがIIBでメチル化されていることだけである。このメチルは、該タンパク質との水素結合様式を変化させること及び該分子のコンフォメーションの選好を変えることを含む複数の効果を有しうる。ボルドらは、NMRを用いて、このメチルが溶液中におけるこの分子のコンフォメーションの挙動を大幅に変化させることを示した。この変化は該活性の変化のかなりの部分を生じさせる可能性がある。
【0119】
【化4】
【0120】
これらの研究及び実施例はともに、歪みが結合親和性を決定する際の重要な因子であるが我々の歪みについての理解は有用なモデルを開発するのにまだ十分でないことを示している。包括的な歪みのモデルを開発する代わりに、本発明者らは、「我々は無作為のコンフォメーションから活性なコンフォメーションを区別できるか」という疑問と取り組む。その目的は、任意の標的分子に堅く結合する可能性の小さなコンフォメーションを消去するために使用できるフィルターを開発すること又は生物活性である可能性が高いコンフォメーションの方にコンフォメーション調査手法を偏向させるために使用できる単純な記述子を開発することである。
【0121】
このようなフィルタ/記述子の有用性を確認するために、小分子の活性なコンフォメーションの小さなセットをPDBにおける共結晶複合体から抽出した。幾つかの三次元記述子を検討し、これらの記述子のいずれが無作為のコンフォメーションから活性なコンフォメーションを最も上手く分離するかを調べた。本研究で用いられた記述子には、極性溶媒に接近可能な表面積、無極性溶媒に接近可能な表面積、回転半径、内部相互作用の数、二つの主軸の比、及び双極子モーメントの大きさが含まれた。これらの記述子は、それらがコンフォメーションの小さな変化に対して、従って結晶構造中に見出されるリガンドのコンフォメーションの誤差に対しても比較的鈍感であるために選択された。とりわけ、計算されたコンフォメーションの力場エネルギーは、コンフォメーションの小さな変化に対してあまりにも敏感であるため、用いられなかった。本研究は、極性溶媒接近可能表面積、無極性溶媒接近可能表面積、回転半径、及び内部相互作用の数が全て無作為のコンフォメーションから活性なコンフォメーションを分離するために使用できることを示す。極めて可変的な分子については、これらの記述子による無作為なコンフォメーションから活性なコンフォメーションの分離はより良好ですらある。これらの四つの記述子を用いた結果は、活性なコンフォメーションが無作為なコンフォメーションよりコンパクトでないことを示している。
【0122】
第一に、タンパク質に結合している際の65個の小分子のコンフォメーションをPDBから抽出した。大環状環を持つ分子又は剛体化合物は考慮しなかった。これらの分子は5個及び23個の回転可能な結合を持っていた(表8参照)。
【0123】
【表8】
【0124】
このデータセットは関連化合物を含むため理想的なものではない。ペプスタチンを含む幾つかのアスパルチル・プロテアーゼ阻害剤及び幾つかのトリプシンの阻害剤が含まれる。
【0125】
個々のリガンドについて、無作為のコンフォメーションを下記のように作成した。2面角は、結合の長さ、結合の角度、及び環を固定して保持したまま、無作為に均等に選択された。次いで、該コンフォメーションを、単にファン・デル・ワールスの項及び二面角の項を用いて二面空間において最小化した。典型的には、コンフォメーションは、妥当なエネルギーまで最小化され又はフェニル環を介した結合経路(bond run)を有するなど非常に高いエネルギー谷に捕捉されるであろう。これを念頭において、該最小化後に非常に高いエネルギー(>100 kcal/mol)を持つコンフォメーションはいずれも切捨てた。この工程は、5000個の無作為なコンフォメーションが各分子について作成されるまで続けられた。
【0126】
個々の分子M及び個々の記述子Dについて、下記の量が計算され得る。第一は、活性なコンフォメーションについてのDの値、即ちa(M,D)である。第二に、分子Mの無作為コンフォメーション全てにわたる記述子の平均値は、
【0127】
【数10】
【0128】
により与えられる。上式中、Ck は、分子Mの第k番目のコンフォメーションである。三番目の量は分子Mの無作為コンフォメーションにわたる記述子Dの標準偏差であり、次式
【0129】
【数11】
【0130】
により与えられる。最後に、該活性なコンフォメーションについての補正値が次式により与えられる。
【0131】
【数12】
【0132】
活性なコンフォメーションが無作為なコンフォメーションと識別不可能な場合、補正された記述子の値は、該データセットの分子にわたって0の周りに一様に分布するはずである。下記の記述子が本研究で用いられた。即ち極性溶媒に接近可能な表面積(PSASA)、無極性溶媒に接近可能な表面積(ASASA)、内部相互作用の数(NI)、回転半径(RG)、二つの主軸の比(RPA)、及び双極子モーメントの大きさ(MDM)である。該溶媒に接近可能な表面積は原子のファン・デル・ワールス半径+1.4Åを用いて計算された。水素原子は計算に用いられなかった。窒素又は酸素は、水素を有する場合又は水素結合を受容できる孤立電子対を有する場合には極性として扱った。他の原子は全て無極性として扱った。量NIは所与の分子における二つ一組の相互作用の数の単純な総数である。これは、
【0133】
【数13】
【0134】
により与えられる。上式中、総和は、1〜2及び1〜3の原子を除く、原子i, jの全ての対に及び、dijはi番目とj番目の原子間の距離であり、そして
【0135】
【数14】
【0136】
単位は全てÅである。コンフォメーションの回転半径は、
【0137】
【数15】
【0138】
により与えられる。上式中、総和はコンフォメーションの全原子におよび、該コンフォメーションはその重心が0となるように移動(translateed)される。主軸の比は、
【0139】
【数16】
【0140】
により与えられる。上式中、λ1 はコンフォメーションの原子座標の分散行列の最大固有値であり、λ2 は二番目に最大である。0に近いRPAの値は長く伸長したコンフォメーションを示すが、一方、1に近い値は丸いコンパクトなコンフォメーションを示す。最後に、双極子モーメントは、セリウス(Cerius)2を通じて利用できるラッペとゴダードの方法(ラッペ,エイ・ケイとゴダード,ダブリュ・エイ,III,J. Phys. Chem.,95(1991)3358、Cerius2,Molecular Simulation, Inc.、サンディエゴ、カリフォルニア州)を用いて計算された原子の点電荷を用いて計算した。
【0141】
活性なコンフォメーションについての記述子の個々の補正値は図11に分子数に対してプロットされ、該分子は回転可能な結合数により序列付けされる。該補正値はゼロの周りに一様に分布するため、双極子モーメントの大きさ(図11A参照)及び主軸の比(図11B参照)は無作為のコンフォメーションから活性なコンフォメーションを分離しないようである。残る四つの記述子であるPSASA(図11C参照)、ASASA(図11D参照)、NI(図11E参照)及びRG(図11F参照)は、とりわけ大きく且つ可変的な分子にとって無作為のコンフォメーションから活性なコンフォメーションを分離するのに確かに有用であるようである。これらの四つの記述子は以下に幾分詳細に論ずる。
【0142】
65分子のうち僅か14分子がゼロ未満の補正PSASAを持つ活性コンフォメーションを有し、8を上回る回転可能な結合をもつ37分子のうち僅か1分子がゼロ未満の補正PSASAを持つ活性コンフォメーションを有する。従って、生物活性のあるコンフォメーションは平均して無作為のコンフォメーションより大きなPSASAを有するようである。この点において、活性なコンフォメーションは溶液コンフォメーションと似ている。更に、8を上回る回転可能な結合及びゼロ未満の補正PSASAをもつ唯一の事例である1hefの事例は、問題を有するようである。該コンフォメーションは、フェニル環と衝突するカルボニル基の酸素(C−Oの距離〜2.3Å)を含む幾つかの深刻な内部衝突(IIIA及びIIIB参照)を示す。この衝突がおそらく平均的PSASAより低いことの原因である。この分子も該タンパク質と何らかの望ましくない接触をしており、より妥当な代替的結合様式を有するようである。
【0143】
【化5】
【0144】
65事例のうち僅か10事例がゼロ未満の補正ASASAを持つ活性コンフォメーションを有する。この結果は意外に思われうる。溶液中で低エネルギーのコンフォメーションは無極性の表面積ができるだけ多く埋めこまれたコンホーメーションであると予期するであろう。しかしながら、水と違って、タンパク質は無極性相互作用及び極性相互作用の両方に対して効果的に競合する。負の補正ASASAを持つ活性コンフォメーションについての事例は主として相互作用できる二つの大きな疎水性基を有するものである。これらの多くは、相互に詰め込まれた芳香環とピペラジンを含むトリプシンの阻害剤である。こうして、この結果はタンパク質が無極性の相互作用に対して効果的に競合し得ることを示す一方で、分子間の無極性相互作用がタンパク質への結合の際に保持されるのに十分な程強力である場合の状況が存在する。
【0145】
内部相互作用の数は、無作為のコンフォメーションから活性なコンフォメーションを最も良く分離する記述子である。この事例において、活性なコンフォメーションのうち僅か5つが正の補正NIを有し、該活性なコンフォメーションが無作為のコンフォメーションよりはるかに少ない内部相互作用を有することを示している。この5つの分離物(分布から離れたもの)は主として先の段落で論じたトリプシン阻害剤である。
【0146】
無作為のコンフォメーションから活性なコンフォメーションを分離する何らかの潜在能力を有する最後の記述子は回転半径である。この事例において、65事例のうち13が負の補正RGを持つ活性コンフォメーションを有し、活性コンフォメーションの回転半径が無作為のコンフォメーションの回転半径より大きいことを示している。ここでも、該分離物は無極性溶媒接近可能表面積(ASASA)の場合の分離物に似ている。
【0147】
タンパク質に結合する際の小分子のコンフォメーションは種々の記述子を用いて無作為のコンフォメーションから分離され得る。これらの記述子には、極性溶媒に接近可能な表面積、無極性溶媒に接近可能な表面積、内部相互作用の数及び回転半径が含まれる。コンフォメーションに依存する記述子の全て不活性なコンフォメーションから活性なコンフォメーションを分離するのに有用であるわけではない。双極子モーメントの大きさや二つの主軸の比はいずれもこの目的に有用ではないようである。
【0148】
活性なコンフォメーションは無作為のコンフォメーションより平均して多くの極性及び無極性の溶媒接近可能表面積、少ない内部相互作用、並びに大きい回転半径を有する。これらの結果は平均して活性なコンフォメーションが無作為のコンフォメーションよりコンパクト(ぎっしり詰まっている)でないことを示している。これらの記述子は、よりコンパクトでないコンフォメーションを含むためにコンフォメーション調査手法を偏らせるための有用なウエイト付けになり、それにより、薬理団の調査、分子ドッキング、及び3D−QSARなどのモデル化技法の結果を改良するであろう。
【0149】
本発明の機能は、ソフトウェア、ハードウェア、マイクロコード、ファームウェア又はそれらの任意の組合わせにおいて適切なプログラムを作成することにより容易に自動化できる。更に、任意の型のコンピュータ又はコンピュータ環境が本発明の機能を提供、内臓及び/又は使用するために利用され得る。このような環境の一つは図8に示してあり、下記に詳細に記載する。
【0150】
一実施態様において、コンピュータ環境800は、例えば、少なくとも一つの中央演算処理装置810、主記憶装置820、及び一つ以上の入力/出力装置830を含む。これらのそれぞれを以下に記載する。
【0151】
知られているように、中央演算処理装置810はコンピュータ環境800の制御中心でありそして命令の実行、割込み行為、タイミング機能、初期プログラムローディング及び他の機械関連機能のための順序決定機能及び処理機能を提供する。中央演算処理装置は少なくとも一つのオペレーティング・システムを実行する。既知のように、該オペレーティング・システムは、他のプログラムの実行を制御し、周辺機器とのやりとりを制御しそしてコンピュータ・リソースの使用を制御することにより該演算器の操作を制御するために用いられる。
【0152】
中央演算処理装置810は主記憶装置820に連結されている。該820は直接アドレス可能であり該中央演算処理装置によりデータの高速処理を提供する。主記憶装置は物理的に該CPUと一体化されうるか又は独立の装置として構築されうる。
【0153】
主記憶装置820も一つ以上の入力/出力装置830に連結されている。これらの装置には、例えばキーボード、通信制御装置、遠隔処理装置、プリンタ、磁気記憶媒体(例えばテープ、ディスク)、直接アクセス記憶装置、及びセンサーベース装置を含む。データは主記憶装置820から入力/出力装置830へ移され、該入力/出力装置から逆に主記憶装置へ移される。
【0154】
本発明は、例えばコンピュータが使える媒体を有する製造品(例えば、一つ以上のコンピュータ・プログラム製品)に含めることができる。該媒体は、例えば、本発明の機能を提供及び促進するためのコンピュータ読み取り可能なプログラムコード手段をその内部に具現化した。該製造品はコンピュータシステムの一部として包含され又は単独で販売され得る。更に、本発明の機能を実施するために機械で実行可能な少なくとも一つの命令プログラムを現実に具現する、機械で読み取り可能な少なくとも一つのプログラム記憶装置が提供され得る。
【0155】
本明細書で示される流れ図は単に説明のためのものである。そこに記載されるこれらの図又は工程(又は操作)に対して本発明の精神を逸脱することなく多くの変形版が存在しうる。例えば、該工程は異なる順序で実行されうる、又は工程が追加、削除又は変更されうる。これらの変形版は全て請求の範囲に記載されている発明の一部とみなされる。
【0156】
好ましい実施態様は本明細書で詳細に示され且つ記載されるが、当業者には種々の変更、追加、置換等が本発明の精神から逸脱することなく為され得ることが明らかであり、従って、これらは請求の範囲によって定義される本発明の範囲内にあると考えられる。
【図面の簡単な説明】
【図1】
図1A〜図1Cは、タンパク質−リガンド複合体の形成を概念的に表す。
【図2】
図2は、本発明の原理に基づく、分子ドッキングアプローチの一実施態様のフローチャートである。
【図3】
図3は、本発明の原理に基づく、図2のドッキングアプローチにより用いられ得る分子コンフォメーション調査手法の一実施態様のフローチャートである。
【図4】
図4は、本発明の原理に基づく、図2の分子ドッキングアプローチで使用するための結合部位画像を確立する一実施態様のフローチャートである。
【図5】
図5は、本発明の原理に基づく、図2の分子ドッキングアプローチで使用するための適合手法の一実施態様のフローチャートである。
【図6】
図6は、本発明の原理に基づく、図2の分子ドッキングアプローチで使用するための同定された適合の中でリガンドの位置を最適化するための最適化工程の一実施態様のフローチャートである。
【図7】
図7は、本発明の原理に基づく、原子二つ一組の評点で用いる水素結合ポテンシャル及び立体ポテンシャルのグラフ表示である。
【図8】
図8は、本発明の能力を提供し及び/又は使用するコンピュータ環境の一実施態様を表す。
【図9】
図9は、結合中心内に位置するコンビナトリアル・ライブラリーから得られた化合物と共に、P1、P2及びP3のポケットを有する標的タンパク質の結合部位の概念表示である。
【図10】
図10は、プラスモディウム・ファルシパルム(Plasmodium falciparum)から得られる標的タンパク質のプラスメプシン(plasmepsin)IIにドッキングされたコンビナトリアル・ライブラリーPL792の化合物についてのクラスターの大きさを示すグラフである。
【図11】
図11A〜図11Fは、活性なコンフォメーションの調整記述子の集中し且つ縮尺した平均値(mean centered and scaled value)を示すグラフである。
Claims (57)
- 標的分子にリガンドをドッキングさせる方法であって、
ドッキング前のコンホーメーション調査を行なって該リガンドの複数の溶液コンホーメーションを作成する工程、
該標的分子の、複数のホットスポット群を含む結合部位画像を作成する工程、
該結合部位画像のホットスポット群を、該リガンドの複数の溶液コンホーメーションのうちの少なくとも一つの溶液コンホーメーション中の原子群に適合させて、リガンド−標的分子複合体形成において標的分子に関連する少なくとも一つのリガンド位置を得る工程、及び
該標的分子を固定して保持し、且つ該リガンドの並進、向き及び回転可能な結合を変更させながら少なくとも一つのリガンド位置を最適化する工程、
を含む方法。 - 該ドッキング前コンホーメーション調査を実行する工程が複数の溶液コンホーメーションのデータベースを作成する工程、及び該適合工程によりその後の使用のために該三次元データベースを保存する工程を含むものである、請求項1記載の方法。
- 複数の溶液コンホーメーションの該データベースがコンビナトリアルライブラリーのコンホーメーションデータベースを含むものである、請求項2記載の方法。
- ドッキング前コンホーメーション調査を実行する該工程が、
該リガンドの均一に分布した複数のコンホーメーションを無作為に作成する工程、
潜在的に活性な各コンホーメーションの歪みを最小にする工程、
各コンホーメーションの歪み及び一つ以上の三次元記述子を用いて該潜在的に活性なコンホーメーションを序列付けする工程、及び
該コンホーメーションをクラスター化し、コンホーメーションの最上位クラスターの所望の数を保持する工程であって、該保持された数のコンホーメーションの最上位クラスターが該リガンドの複数の溶液コンホーメーションを含むものである工程、
を含むものである、請求項1記載の方法。 - 一つ以上の三次元記述子が極性溶媒接近可能表面積、無極性溶媒接近可能表面積、内部相互作用の数、回転の半径、及びそれらの組み合わせからなる群より選択されるものである、請求項4記載の方法。
- 該一つ以上の三次元記述子が極性溶媒接近可能表面積及び無極性溶媒接近可能表面積の組み合わせである、請求項4記載の方法。
- 該結合部位画像を作成する工程が、無極性原子が有利に結合する結合部位中の点を同定する無極性ホットスポットのリストを作成する工程、及び水素結合の供与体若しくは受容体が有利に結合する結合部位中の点を同定する極性ホットスポットのリストを作成する工程の少なくとも一つを含むものである、請求項1記載の方法。
- 該結合部位画像の作成工程が、
標的分子の結合部位の周りにグリッドを配置する工程、
該グリッドを用いてホットスポット調査容積を決定する工程、
ホットスポット調査容積のグリッド様調査を用いてホットスポットを決定する工程、及び
ホットスポットの各タイプについて、ホットスポット群をクラスター化しそして最良の評点をもつホットスポットの所望の数のクラスターを保持する工程であって、該所望の数のクラスターが該適合工程によって用いられる該複数のホットスポットを含むものである工程、
をさらに含む、請求項7記載の方法。 - 該適合工程が、
少なくとも一つの溶液コンホーメーションを剛体として結合部位画像中に配置することにより、該少なくとも一つの溶液コンホーメーションの原子群を標的分子の適当なホットスポット群に適合させる工程、
適合を規定する工程であって、該適合が独自の剛体変換を決定するものである工程、及び
該独自の剛体変換を用いて該リガンドの少なくとも一つの溶液コンホーメーションを該標的分子の結合部位中に配置する工程、
を含むものである、請求項1記載の方法。 - 該最適化工程が複数の標的分子−リガンド複合体形成を最適化する工程を含むものであり、該最適化工程が
立体的衝突をもつリガンド原子の予め定めた百分率を有する各リガンド位置を削除する工程、
所望の原子評点切捨てを用い、二つ一組の原子評点を用いて残りのリガンド位置を序列付けする工程、
序列付けの後に、リガンド位置をクラスター化しそしてリガンド位置の最上位数nを選択する工程、及び
該リガンドの並進、回転及び回転可能な結合を変えながら、n個の位置のそれぞれのリガンド位置を最適化する工程、
を含むものである、請求項1記載の方法。 - 該最適化工程が、単純な二つ一組の原子評点を用いBFGS最適化アルゴリズムを用いて、該リガンドの並進、回転及び回転可能な結合を変えながら、n個の位置の各リガンド位置を最適化する工程を含むものである、請求項11記載の方法。
- 標的分子にリガンドをドッキングするためのシステムであって、
該リガンドの複数の溶液コンホーメーションを作成するためにドッキング前のコンホーメーション調査を実施する手段、
該標的分子の、複数のホットスポットを含む結合部位画像を作成する手段、
該標的分子と関連する少なくとも一つのリガンド位置を得るため、該リガンドの複数の溶液コンホーメーションの少なくとも一つの溶液コンホーメーション中の原子群に該結合部位画像のホットスポット群を適合させるための手段、及び
該標的分子を固定して保ちながら且つ該リガンドの並進、向き及び回転可能な結合を変えながら、少なくとも一つのリガンド位置を最適化するための手段、
を含むシステム。 - ドッキング前コンホーメーション調査を実行するための該手段が複数の溶液コンホーメーションのデータベースを作成するための手段及び該適合工程によるその後の使用のため該三次元データベースを保存するための手段を含むものである、請求項13記載のシステム。
- 複数の溶液コンホーメーションの該データベースがコンビナトリアルライブラリーのコンホーメーションデータベースを含むものである、請求項14記載のシステム。
- ドッキング前コンホーメーション調査を実行するための手段が、
該リガンドの複数の均一に分布したコンホーメーションを無作為に作成するための手段、
該複数の均一に分布したコンホーメーションの各コンホーメーションの歪みを最小化するための手段、
該コンホーメーションを序列付けするため各コンホーメーションの歪み及び溶媒接近可能表面積を用いるための手段、及び
該コンホーメーションをクラスター化しそして所望の数の最上位クラスターのコンホーメーションを保持するための手段であって、該保持された数の最上位クラスターのコンホーメーションがリガンドの該複数の溶液コンホーメーションを含むものである手段、
を含むものである、請求項13記載のシステム。 - 結合部位画像を作成するための該手段が無極性原子が有利に結合する結合部位中の点を同定する無極性ホットスポットのリストを作成するための手段、及び水素結合の供与体若しくは受容体が有利に結合する結合部位中の点を同定する極性ホットスポットのリストを作成するための手段の少なくとも一つを含むものである、請求項13記載のシステム。
- ドッキング前コンホーメーション調査を実行する該手段が、
複数の、均一に分布したリガンドのコンホーメーションを無作為に作成する手段、
コンホーメーションそれぞれについて三次元記述子を用いて潜在的に活性なコンホーメーションを不活性なコンホーメーションから識別し、且つ、潜在的に活性なコンホーメーションを保持するための手段、
潜在的に活性なコンホーメーションそれぞれの歪みを最小にする手段、
潜在的に活性なコンホーメーションそれぞれの歪み及び溶媒接近可能表面積を用いて該潜在的に活性なコンホーメーションを序列付けするための手段、及び
該コンホーメーションをクラスター化し且つコンホーメーションの最上位クラスターの所望の数を保持するための手段であって、コンホーメーションの最上位クラスターの該保持数がリガンドの該複数の溶液コンホーメーションを含むものである手段、
を含むものである、請求項13記載のシステム。 - 該三次元記述子が極性溶媒接近可能表面積、無極性溶媒接近可能表面積、内部相互作用の数、及び回転の半径からなる群より選択されるものである、請求項18記載のシステム。
- 結合部位画像を作成するための手段が、
標的分子の結合部位の周りにグリッドを配置するための手段、
該グリッドを用いてホットスポット調査容積を決定する手段、
該ホットスポット調査容積のグリッド様調査を用いてホットスポットを決定する手段、及び
ホットスポットのタイプそれぞれについて、該ホットスポットをクラスター化し且つ最良の評点を持つホットスポットのクラスターの所望の数を保持するための手段であって、該クラスターの所望の数が該適合工程により採用されるべき該複数のホットスポットを含むものである手段、
をさらに含むものである、請求項17記載の方法。 - 該適合させるための手段が、
少なくとも一つの溶液コンホーメーションを剛体として結合部位画像中に配置することにより該少なくとも一つの溶液コンホーメーションの原子群を該標的分子の適当なホットスポットに適合させるための手段、
適合を規定する手段であって、該適合が独自の剛体変換を決定するものである手段、及び
該独自の剛体変換を用いて該リガンドの少なくとも一つの溶液コンホーメーションを該標的分子の結合部位中に配置するための手段、
を含むものである、請求項13記載のシステム。 - 該最適化手段が複数の標的分子−リガンド複合体形成を最適化する手段を含むものであり、該最適化手段が、
立体的衝突を有するリガンド原子の予め定められた百分率を持つ各リガンド位置を消去するための手段、
所望の原子評点切捨てを有する二つ一組の原子評点を用いて残りのリガンド位置を序列付けするための手段、
序列付けの後、該リガンド位置をクラスター化し且つリガンド位置の最上位数nを選択するための手段、及び
該リガンドの並進、回転及び回転可能な結合を変えながら、該n個の位置の各リガンド位置を最適化する手段、
を含むものである、請求項13記載のシステム。 - 該最適化手段が、リガンドの並進、回転、及び回転可能な結合を変えながら、単純な二つ一組の原子評点を用いBFGS最適化アルゴリズムを用いてn個の位置の各リガンド位置を最適化するための手段を含むものである、請求項23記載のシステム。
- 標的分子にリガンドをドッキングさせる方法であって、
該リガンドの複数の溶液コンホーメーションを作成するためドッキング前コンホーメーション調査を実行する工程、
該標的分子の、複数のホットスポットを含む結合部位画像を作成する工程、
該結合部位画像のホットスポットを該リガンドの複数の溶液コンホーメーションの少なくとも一つの溶液コンホーメーション中の原子群に適合させて、該標的分子に関連する少なくとも一つのリガンド位置を得る工程、及び
該標的分子を固定して保持し且つ該リガンドの並進、向き、及び回転可能な結合を変えながら、少なくとも一つのリガンド位置を最適化する工程、
を含む方法を実行するため、機械により実行可能な指令の少なくとも一つのプログラムを具体的に具現化する、該機械により読み取り可能な少なくとも一つのプログラム記憶装置。 - ドッキング前コンホーメーション調査の該実行工程が複数の溶液コンホーメーションのデータベースを作成する工程及び該適合工程によるその後の使用のため該三次元データベースを記憶する工程を含むものである、請求項25記載の少なくとも一つのプログラム記憶装置。
- 複数の溶液コンホーメーションの該データベースがコンビナトリアルライブラリーのコンホーメーションデータベースを含むものである、請求項26記載の少なくとも一つのプログラム記憶装置。
- ドッキング前コンホーメーション調査の該実行が、
該リガンドの均一に分布した複数のコンホーメーションを無作為に作成する工程、
該複数の均一に分布したコンホーメーションの各コンホーメーションの歪み及び溶媒接近可能表面積を最小にする工程、
各コンホーメーションの歪みを用いて該コンホーメーションを序列付けする工程、及び
該コンホーメーションをクラスター化し且つコンホーメーションの最上位クラスターの所望の数を保持する工程であって、コンホーメーションの最上位クラスターの該保持数がリガンドの該複数の溶液コンホーメーションを含むものである工程、
を含むものである、請求項25記載の少なくとも一つのプログラム記憶装置。 - 結合部位画像を作成する該工程が無極性原子が有利に結合する結合部位中の点を同定する無極性ホットスポットのリストを作成する工程、及び水素結合の供与体若しくは受容体が有利に結合する結合部位中の点を同定する極性ホットスポットのリストを作成する工程の少なくとも一つを含むものである、請求項25記載の少なくとも一つのプログラム記憶装置。
- ドッキング前コンホーメーション調査を実行する該工程が、
該リガンドの均一に分布した複数のコンホーメーションを無作為に作成する工程、
各コンホーメーションについての三次元記述子を用いて潜在的に活性なコンホーメーションを不活性なコンホーメーションから識別する工程、及び潜在的に活性なコンホーメーションを保持する工程、
潜在的に活性なコンホーメーションそれぞれの歪みを最小にする工程、
潜在的に活性なコンホーメーションそれぞれの歪み及び溶媒接近可能表面積を用いて該潜在的に活性なコンホーメーションを序列付けする工程、及び
該コンホーメーションをクラスター化し且つコンホーメーションの最上位クラスターの所望の数を保持する工程であって、コンホーメーションの最上位クラスターの該保持数がリガンドの該複数の溶液コンホーメーションを含むものである工程、
を含むものである、請求項25記載の装置。 - 該三次元記述子が極性溶媒接近可能表面積、無極性溶媒接近可能表面積、内部相互作用の数、及び回転の半径からなる群より選択されるものである、請求項30記載の装置。
- 結合部位画像を作成する該工程が、
該標的分子の結合部位の周りにグリッドを配置する工程、
該グリッドを用いてホットスポット調査容積を決定する工程、
該ホットスポット調査容積のグリッド様調査を用いてホットスポットを決定する工程、及び
ホットスポットの各タイプについて、該ホットスポットをクラスター化し且つ最良の評点を有するホットスポットのクラスターの所望の数を保持する工程であって、該クラスターの所望の数が該適合工程により採用されるべき該複数のホットスポットを含むものである工程、
をさらに含むものである、請求項29記載の少なくとも一つのプログラム記憶装置。 - 該適合工程が、
該少なくとも一つの溶液コンホーメーションを剛体として該結合部位画像中に配置することにより、該少なくとも一つの溶液コンホーメーションの原子群を該標的分子の適当なホットスポットに適合させる工程、
適合を規定する工程であって、該適合が独自の剛体変換を決定するものである工程、及び
該独自の剛体変換を用いて該リガンドの少なくとも一つの溶液コンホーメーションを該標的分子の結合部位中に配置する工程、
を含むものである、請求項25記載の少なくとも一つのプログラム記憶装置。 - 該最適化工程が複数の標的分子−リガンド複合体の形成を最適化する工程を含むものであり、該最適化工程が
立体的衝突を有するリガンド原子の予め定められた百分率を有する各リガンド位置を消去する工程、
所望の原子評点切捨てを有する二つ一組の原子評点を用いて残りのリガンド位置を序列付けする工程、
序列付けの後、該リガンド位置をクラスター化し且つリガンド位置の最上位数nを選択する工程、及び
該リガンドの並進、回転、及び回転可能な結合を変えながらn個の位置の各リガンド位置を最適化する工程、
を含むものである、請求項25記載少なくとも一つのプログラム記憶装置。 - 該最適化工程が単純な二つ一組の原子評点を用いBFGS最適化アルゴリズムを用いて、該リガンドの並進、回転、及び回転可能な結合を変えながら、n個の位置の各リガンド位置を最適化する工程を含むものである、請求項25記載の少なくとも一つのプログラム記憶装置。
- 少なくとも一つの結合部位を有する標的分子に対する相補性についてコンビナトリアルライブラリーを評価する方法であって、該コンビナトリアルライブラリーが複数のリガンドを含むものであり、該リガンドがそれぞれ共通のコアに基づくものであり、該方法が、
該標的分子に該複数のリガンドの各リガンドをドッキングさせて、複数のリガンド−標的分子複合体形成における標的分子に関連する複数のリガンド位置を形成する工程であって、該複数のリガンド位置が該標的分子に関連する複数の共通のコア位置を含むものである工程、
該複数の共通コア位置の各共通コア位置の他の共通コア位置からの2乗平均偏差を決定する工程、及び
該2乗平均偏差に従ってクラスターを形成する工程、
を含むものである方法。 - コンビナトリアルライブラリー中のリガンドの数に関連する最小2乗平均偏差を有するクラスターにおけるリガンドの数に従って該標的分子への該コンビナトリアルライブラリーの相補性を評価する工程をさらに含む、請求項37記載の方法。
- 2乗平均偏差を決定する該工程が、
該標的分子の結合部位の周りにグリッドを配置する工程、
各リガンド位置について、共通コアの重心に相当するグリッド上の位置を決定する工程、及び
予め定められた距離内でグリッド上に位置を有するあらゆる他の共通コア位置から各共通コア位置までの2乗平均偏差を決定する工程、
を含むものである、請求項37記載の方法。 - クラスターを形成する該工程が単結合クラスター化アルゴリズムを用いてクラスターを形成する工程を含むものである、請求項37記載の方法。
- 各リガンドをドッキングする工程が、
ドッキング前コンホーメーション調査を行なって各リガンドの複数の溶液コンホーメーションを形成する工程、
該標的分子の、複数のホットスポットを含む結合部位画像を作成する工程、
結合部位のホットスポット群を各リガンドの複数の溶液コンホーメーションの少なくとも一つの溶液コンホーメーション中の原子群に適合させる工程であって、リガンド−標的分子複合体形成における該標的分子に関連する少なくとも一つのリガンド位置を得る工程、及び
該標的分子を固定して保持しながら且つ該リガンドの並進、向き、及び回転可能な結合を変えながら、該少なくとも一つのリガンド位置を最適化する工程、
を含むものである、請求項37記載の方法。 - 少なくとも一つの結合部位を有する標的分子への相補性について複数のコンビナトリアルライブラリーを比較する方法であって、該複数のコンビナトリアルライブラリーのそれぞれが複数のリガンドを含むものであり、該リガンドのそれぞれが共通コアに基づくものであり、該方法が
コンビナトリアルライブラリーのそれぞれについて、複数のリガンドの各リガンドを該標的分子にドッキングさせて複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンド位置を形成させる工程であって、該複数のリガンド位置が該標的分子に関連する複数の共通コア位置を含むものである工程、
該複数の共通コア位置の他の共通コア位置から各共通コア位置までの2乗平均偏差を決定する工程、
該2乗平均偏差に従ってクラスターを形成する工程、及び
各コンビナトリアルライブラリーにおけるリガンドの総数と比べた該クラスターの最上位クラスターにおけるリガンドの数に従って、複数のコンビナトリアルライブラリーを序列付けする工程、
を含むものである方法。 - 該序列に従って生体標的(biotarget)に対する活性について各コンビナトリアルライブラリーの高処理量スクリーニングに優先順位を付ける工程をさらに含む、請求項42記載の方法。
- 少なくとも一つの結合部位を有する標的分子に対する相補性についてコンビナトリアルライブラリーを評価するシステムであって、該コンビナトリアルライブラリーが複数のリガンドを含むものであり、該リガンドが共通のコアに基づくものであり、該システムが、
複数のリガンドのうちの各リガンドを標的分子にドッキングさせて複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンド位置を作成するための手段であって、該複数のリガンド位置が該標的分子に関連する複数の共通のコア位置を含むものである手段、
該複数の共通コア位置の他の共通のコア位置から各共通のコア位置までの2乗平均偏差を決定するための手段、及び
該2乗平均偏差に従ってクラスターを形成するための手段、
を含むものであるシステム。 - コンビナトリアルライブラリーにおけるリガンドの数に関連して最小2乗平均偏差を有するクラスターにおけるリガンドの数に従って標的分子に対するコンビナトリアルライブラリーの相補性を評価するための手段をさらに含む、請求項44記載のシステム。
- 2乗平均偏差を決定するための該手段が、
標的分子の結合部位の周りにグリッドを配置する手段、
各リガンド位置について、共通コアの重心に相当するグリッド上に位置を決定する手段、及び
予め定められた距離内でグリッド上に位置を有する他の共通コア位置のすべてから各共通コア位置までの2乗平均偏差を決定する手段、
を含むものである、請求項44記載のシステム。 - クラスターを形成するための該手段が単結合クラスター化アルゴリズムを用いるクラスター形成手段を含むものである、請求項44記載のシステム。
- 各リガンドをドッキングするための該手段が、
ドッキング前コンホーメーション調査を実行して各リガンドの複数の溶液コンホーメーションを作成する手段、
該標的分子の、複数のホットスポットを含む結合部位画像を作成する手段、
結合部位画像のホットスポット群を各リガンドの複数の溶液コンホーメーションの少なくとも一つの溶液コンホーメーション中の原子群に適合させて、リガンド−標的分子複合体形成において該標的分子に関連する少なくとも一つのリガンド位置を得る手段、及び
該標的分子を固定して保持しながら、且つ該リガンドの並進、向き、及び回転可能な結合を変えながら、少なくとも一つのリガンド位置を最適化する手段、
を含むものである、請求項44記載のシステム。 - 少なくとも一つの結合部位を有する標的分子に対する相補性について複数のコンビナトリアルライブラリーを比較するためのシステムであって、該複数のコンビナトリアルライブラリーのそれぞれが複数のリガンドを含むものであり、各リガンドがそれぞれ共通のコアに基づいており、該方法が
各コンビナトリアルライブラリーについて、複数の該リガンドの各リガンドを該標的分子にドッキングさせて複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンド位置を作成するための手段であって、該複数のリガンド位置が該標的分子に関連する複数の共通コア位置を含むものである手段、
該複数の共通コア位置の他の共通コア位置から各共通のコア位置までの2乗平均偏差を決定する手段、
該2乗平均偏差に従ってクラスターを形成する手段、及び
各コンビナトリアルライブラリーにおけるリガンドの総数と比べた該クラスターの最上位クラスターにおけるリガンドの数に従って複数のコンビナトリアルライブラリーを序列付けするための手段、
を含むものであるシステム。 - 該序列付けに従って生体標的に対する活性について各コンビナトリアルライブラリーの高処理量スクリーニングに優先順位を付けるための手段をさらに含む、請求項49記載のシステム。
- 機械により実行可能な指令の少なくとも一つのプログラムを具体的に具現化して、少なくとも一つの結合部位を有する標的分子に対する相補性についてコンビナトリアルライブラリーを評価する方法を実行する、機械により読み取り可能な少なくとも一つのプログラム記憶装置であって、該コンビナトリアルライブラリーが複数のリガンドを含むものであり、該リガンドのそれぞれが共通のコアに基づくものであり、該方法が、
該標的分子に複数のリガンドの各リガンドをドッキングさせて複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンド位置を作成する工程であって、該複数のリガンド位置が該標的分子に関連する複数の共通コア位置を含むものである工程、
該複数の共通コア位置の他の共通コア位置から各共通コア位置までの2乗平均偏差を決定する工程、及び
該2乗平均偏差に従ってクラスターを形成する工程、
を含むものである装置。 - 該方法が、該コンビナトリアルライブラリーにおけるリガンドの数と比べ最小の2乗平均偏差を有するクラスターにおけるリガンドの数に従って、該標的分子へのコンビナトリアルライブラリーの相補性を評価する工程をさらに含むものである、請求項51記載の少なくとも一つのプログラム記憶装置。
- 2乗平均偏差を決定する該工程が
該標的分子の結合部位の周りにグリッドを配置する工程、
各リガンド位置について、共通コアの重心に相当するグリッド上の位置を決定する工程、及び
予め定められた距離内でグリッド上に位置を有するすべての他の共通コア位置から各共通コア位置までの2乗平均偏差を決定する工程、
を含むものである、請求項51記載の少なくとも一つのプログラム記憶装置。 - 該クラスターを形成する工程が単結合クラスター化アルゴリズムを用いてクラスターを形成する工程を含むものである、請求項51記載の少なくとも一つのプログラム記憶装置。
- 該各リガンドをドッキングさせる工程が、
ドッキング前コンホーメーション調査を実行して各リガンドの複数の溶液コンホーメーションを作成する工程、
該標的分子の、複数のホットスポットを含む結合部位画像を作成する工程、
該結合部位画像のホットスポット群を各リガンドの複数の溶液コンホーメーションの少なくとも一つの溶液コンホーメーション中の原子群に適合させて、リガンド−標的分子複合体形成における該標的分子に関連する少なくとも一つのリガンド位置を得る工程、及び
該標的分子を固定して保持しながら、且つ該リガンドの並進、向き、及び回転可能な結合を変えながら、少なくとも一つのリガンド位置を最適化する工程、
を含むものである、請求項51記載の少なくとも一つのプログラム記憶装置。 - 少なくとも一つの結合部位を有する標的分子に対する相補性について複数のコンビナトリアルライブラリーを比較する方法を実行するために、機械により実行可能な指令の少なくとも一つのプログラムを具体的に具現化する、機械により読み取り可能な少なくとも一つのプログラム記憶装置であって、該複数のコンビナトリアルライブラリーのそれぞれが複数のリガンドを含むものであり、該リガンドがそれぞれ共通のコアに基づくものであり、該方法が
コンビナトリアルライブラリーのそれぞれについて、該標的分子に該複数のリガンドの各リガンドをドッキングさせて、複数のリガンド−標的分子複合体形成における該標的分子に関連する複数のリガンド位置を作成する工程であって、該複数のリガンド位置が該標的分子に関連する複数の共通コア位置を含むものである工程、
該複数の共通コア位置の他の共通コア位置からそれぞれの共通コア位置までの2乗平均偏差を決定する工程、
該2乗平均偏差に従ってクラスターを形成する工程、及び
各コンビナトリアルライブラリーにおけるリガンドの総数と比べ、該クラスターの最上位クラスターにおけるリガンドの数に従って複数のコンビナトリアルライブラリーを序列付けする工程、
を含むものである装置。 - 該序列付けに従って生体標的に対する活性について各コンビナトリアルライブラリーの高処理量スクリーニングに優先順位を付ける工程をさらに含む、請求項56記載の少なくとも一つのプログラム記憶装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/595,096 US7065453B1 (en) | 2000-06-15 | 2000-06-15 | Molecular docking technique for screening of combinatorial libraries |
US09/832,786 US20020025535A1 (en) | 2000-06-15 | 2001-04-11 | Prioritization of combinatorial library screening |
PCT/US2001/019318 WO2001097098A2 (en) | 2000-06-15 | 2001-06-15 | Computational molecular docking methods for assessing complementarity of combinatorial libraries to biotargets |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005508487A true JP2005508487A (ja) | 2005-03-31 |
Family
ID=27082160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002511229A Pending JP2005508487A (ja) | 2000-06-15 | 2001-06-15 | 生体標的に対するコンビナトリアル・ライブラリーの相補性を評価するための分子ドッキング法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20020025535A1 (ja) |
EP (1) | EP1356411A2 (ja) |
JP (1) | JP2005508487A (ja) |
AU (1) | AU2001269869A1 (ja) |
CA (1) | CA2411190A1 (ja) |
IL (1) | IL153393A0 (ja) |
WO (1) | WO2001097098A2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010539580A (ja) * | 2007-09-14 | 2010-12-16 | コンフォーメトリックス リミテッド | 動的分子の3次元構造の決定方法 |
JP2018205973A (ja) * | 2017-06-01 | 2018-12-27 | 富士通株式会社 | プローブ分子の配置方法、及び配置装置、標的分子の結合サイトの探索方法、及び探索装置、並びにプログラム |
JP2019502978A (ja) * | 2015-10-30 | 2019-01-31 | ヤンセン ファッシンズ アンド プリベンション ベーフェーJanssen Vaccines & Prevention B.V. | D−タンパク質リガンドの構造ベース設計 |
WO2020158609A1 (ja) * | 2019-01-31 | 2020-08-06 | 国立大学法人東京工業大学 | 立体構造判定装置、立体構造判定方法、立体構造の判別器学習装置、立体構造の判別器学習方法及びプログラム |
JP2021500661A (ja) * | 2017-10-19 | 2021-01-07 | シュレーディンガー インコーポレイテッドSchrodinger,Inc. | 誘導適合効果の計算 |
US11443834B2 (en) * | 2018-05-09 | 2022-09-13 | Shenzhen Jingtai Technology Co., Ltd. | Automatic conformation analysis method for quasi-drug organic molecules |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7065453B1 (en) | 2000-06-15 | 2006-06-20 | Accelrys Software, Inc. | Molecular docking technique for screening of combinatorial libraries |
US20040102936A1 (en) * | 2002-11-22 | 2004-05-27 | Lesh Neal B. | Method and system for designing and evaluating linear polymers |
US20060200315A1 (en) * | 2005-03-02 | 2006-09-07 | Yingyao Zhou | High-throughput screening hit selection system and method |
WO2009086331A1 (en) * | 2007-12-20 | 2009-07-09 | Georgia Tech Research Corporation | Elucidating ligand-binding information based on protein templates |
BRPI1107433B1 (pt) * | 2011-12-30 | 2021-01-26 | Embrapa - Empresa Brasileira De Pesquisa Agropecuária. | desenho computacional para novos inibidores de alfa-amilases |
GB201310544D0 (en) | 2013-06-13 | 2013-07-31 | Ucb Pharma Sa | Obtaining an improved therapeutic ligand |
US11524979B2 (en) | 2017-06-15 | 2022-12-13 | University Of Washington | Macrocyclic polypeptides |
US20210134398A1 (en) * | 2019-11-06 | 2021-05-06 | Southern Methodist University | Combinatorial Chemistry Computational System and Enhanced Selection Method |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5025388A (en) * | 1988-08-26 | 1991-06-18 | Cramer Richard D Iii | Comparative molecular field analysis (CoMFA) |
WO1997027559A1 (en) * | 1996-01-26 | 1997-07-31 | Patterson David E | Method of creating and searching a molecular virtual library using validated molecular structure descriptors |
US5854992A (en) * | 1996-09-26 | 1998-12-29 | President And Fellows Of Harvard College | System and method for structure-based drug design that includes accurate prediction of binding free energy |
-
2001
- 2001-04-11 US US09/832,786 patent/US20020025535A1/en not_active Abandoned
- 2001-06-15 WO PCT/US2001/019318 patent/WO2001097098A2/en not_active Application Discontinuation
- 2001-06-15 CA CA002411190A patent/CA2411190A1/en not_active Abandoned
- 2001-06-15 JP JP2002511229A patent/JP2005508487A/ja active Pending
- 2001-06-15 EP EP01948416A patent/EP1356411A2/en not_active Withdrawn
- 2001-06-15 IL IL15339301A patent/IL153393A0/xx unknown
- 2001-06-15 AU AU2001269869A patent/AU2001269869A1/en not_active Abandoned
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010539580A (ja) * | 2007-09-14 | 2010-12-16 | コンフォーメトリックス リミテッド | 動的分子の3次元構造の決定方法 |
JP2019502978A (ja) * | 2015-10-30 | 2019-01-31 | ヤンセン ファッシンズ アンド プリベンション ベーフェーJanssen Vaccines & Prevention B.V. | D−タンパク質リガンドの構造ベース設計 |
JP2021152910A (ja) * | 2015-10-30 | 2021-09-30 | ヤンセン ファッシンズ アンド プリベンション ベーフェーJanssen Vaccines & Prevention B.V. | D−タンパク質リガンドの構造ベース設計 |
JP2018205973A (ja) * | 2017-06-01 | 2018-12-27 | 富士通株式会社 | プローブ分子の配置方法、及び配置装置、標的分子の結合サイトの探索方法、及び探索装置、並びにプログラム |
JP2021500661A (ja) * | 2017-10-19 | 2021-01-07 | シュレーディンガー インコーポレイテッドSchrodinger,Inc. | 誘導適合効果の計算 |
JP7260535B2 (ja) | 2017-10-19 | 2023-04-18 | シュレーディンガー インコーポレイテッド | 誘導適合効果の計算 |
US11651840B2 (en) | 2017-10-19 | 2023-05-16 | Schrödinger, Inc. | Accounting for induced fit effects |
US11443834B2 (en) * | 2018-05-09 | 2022-09-13 | Shenzhen Jingtai Technology Co., Ltd. | Automatic conformation analysis method for quasi-drug organic molecules |
WO2020158609A1 (ja) * | 2019-01-31 | 2020-08-06 | 国立大学法人東京工業大学 | 立体構造判定装置、立体構造判定方法、立体構造の判別器学習装置、立体構造の判別器学習方法及びプログラム |
JP2020123189A (ja) * | 2019-01-31 | 2020-08-13 | 国立大学法人東京工業大学 | 立体構造判定装置、立体構造判定方法、立体構造の判別器学習装置、立体構造の判別器学習方法及びプログラム |
JP7168979B2 (ja) | 2019-01-31 | 2022-11-10 | 国立大学法人東京工業大学 | 立体構造判定装置、立体構造判定方法、立体構造の判別器学習装置、立体構造の判別器学習方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
IL153393A0 (en) | 2003-07-06 |
WO2001097098A2 (en) | 2001-12-20 |
US20020025535A1 (en) | 2002-02-28 |
CA2411190A1 (en) | 2001-12-20 |
AU2001269869A1 (en) | 2001-12-24 |
WO2001097098A3 (en) | 2003-08-28 |
EP1356411A2 (en) | 2003-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210280268A1 (en) | Protein structure prediction system | |
De Bakker et al. | Ab initio construction of polypeptide fragments: Accuracy of loop decoy discrimination by an all‐atom statistical potential and the AMBER force field with the Generalized Born solvation model | |
Coupez et al. | Docking and scoring-Theoretically easy, practically impossible? | |
Diller et al. | High throughput docking for library design and library prioritization | |
Kitchen et al. | Docking and scoring in virtual screening for drug discovery: methods and applications | |
Halperin et al. | Principles of docking: An overview of search algorithms and a guide to scoring functions | |
Zhou et al. | Computational peptidology: a new and promising approach to therapeutic peptide design | |
US20070078605A1 (en) | Molecular docking technique for screening of combinatorial libraries | |
Hashemi et al. | In silico approaches for the design and optimization of interfering peptides against protein–protein interactions | |
US20030130797A1 (en) | Protein modeling tools | |
JP2005508487A (ja) | 生体標的に対するコンビナトリアル・ライブラリーの相補性を評価するための分子ドッキング法 | |
Kar et al. | Hybrid all-atom/coarse-grained simulations of proteins by direct coupling of CHARMM and PRIMO force fields | |
Unal et al. | VitAL: Viterbi algorithm for de novo peptide design | |
Verkhivker et al. | Towards understanding the mechanisms of molecular recognition by computer simulations of ligand–protein interactions | |
WO2008144776A1 (en) | Systems and methods for designing molecules with affinity for therapeutic target proteins | |
AU780941B2 (en) | System and method for searching a combinatorial space | |
Deng et al. | Evaluation of different virtual screening programs for docking in a charged binding pocket | |
JP4314128B2 (ja) | タンパク質立体構造と誘導適合を利用したリガンド探索方法 | |
JP4314206B2 (ja) | リガンド探索装置、リガンド探索方法、プログラム、および記録媒体 | |
Stahl | Structure‐Based Library Design | |
JP2005515575A (ja) | 結合部位の同定方法 | |
Ramya et al. | Conformational space exploration of met‐and Leu‐enkephalin using the mols method, molecular dynamics, and Monte Carlo simulation—a comparative study | |
Muegge et al. | Docking and scoring | |
Thomsen | Protein–ligand docking with evolutionary algorithms | |
Damm | Protein Flexibility in Structure-Based Drug Design: Method Development and Novel Mechanisms for Inhibiting HIV-1 Protease. |