JP2004527726A - 蛋白質中のポケットを評価するためのシステムおよび方法 - Google Patents
蛋白質中のポケットを評価するためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2004527726A JP2004527726A JP2002504606A JP2002504606A JP2004527726A JP 2004527726 A JP2004527726 A JP 2004527726A JP 2002504606 A JP2002504606 A JP 2002504606A JP 2002504606 A JP2002504606 A JP 2002504606A JP 2004527726 A JP2004527726 A JP 2004527726A
- Authority
- JP
- Japan
- Prior art keywords
- slice
- protein
- ligand
- pockets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/20—Protein or domain folding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Abstract
システムおよび方法が、例えば蛋白質モデル中の蛋白質ポケットを決定するために、複雑な面での凹部を評価するために使用される。
Description
【0001】
(関連出願の相互参照)
本出願は、2000年6月16日出願の米国仮特許第60/212332号からの優先権を主張するものであり、この仮特許は参照により本明細書に組み込まれる。
【0002】
(発明の背景)
本発明は、表面、特に、多くの凹形および凸形領域を有する表面の評価に関し、好ましい実施形態では、生体高分子、特に蛋白質分子の評価に関する。
蛋白質X線結晶学の科学は十分に確立されている。10000を超える天然または非天然蛋白質のX線結晶構造が求められ、ケンブリッジ大学(Cambridge University)蛋白質データ・バンク(PDB)に保存されている。蛋白質のX線構造は、蛋白質中の全ての、またはほとんどの原子の空間座標を提供し、それにより、蛋白質の分子モデルを構成することができるようにする(図1A)。そのようなモデルはしばしばコンピュータで構成され、したがって、TRIPOSやRASMOLなどの3次元(3D)コンピュータ・モデリング・プログラムで閲覧するために原子を表示できるようになっている。蛋白質の原子の座標を用いて、潜在リガンド分子(すなわち、何らかの測定可能な親和性を有する蛋白質に結合する分子)に接近可能な蛋白質の3D原子表面(図1B)を求めることは簡単な作業である。
【0003】
この3D原子表面は、蛋白質の原子全てのファンデルワールス半径をモデル化し、次いで、そのように形成されたファンデルワールス・モデルの上で半径Rの「プローブ・ボール」を転がすことによって作成することができる。そのような蛋白質表面を作成する典型的な方法は、MSMSおよびMSROLLと呼ばれるソフトウェア製品である。したがって、潜在リガンド分子に接近可能な蛋白質の3D原子表面は、プローブ・ボールが蛋白質原子のファンデルワールス・モデルに接する点の集合と定義される。半径Rは通常、原子半径のオーダーである。例えば、1.8オングストロームの「プローブ・ボール」を使用して、3D蛋白質表面をうまく求めることができる。
【0004】
潜在リガンド分子に接近可能な蛋白質の3D原子表面が作成された後、どの蛋白質表面領域が最もリガンドが結合する可能性が高い部位であるか定義するという一般的な問題が残る。そのような領域は「蛋白質ポケット」と呼ばれ、蛋白質表面上の本質的に空の凹部である。そのような蛋白質ポケットの位置を求めることは、後の合理的薬物設計に必要である。蛋白質に対する分子リガンドを計算によって設計するために、リガンドが設計される蛋白質の特定のポケットがわかっているべきである。合理的薬物設計は、分子認識の原理に基づいて見出され、これは、リガンドおよび蛋白質の形状および機能的相補性に基づいている。所与の蛋白質ポケットの特定の形状および機能を求めた後、相補性リガンドまたはリガンドの結合ライブラリの合理的薬物設計が、この情報に基づいて始まる。したがって、リガンドが結合する可能性が高い部位である蛋白質表面の領域を選択することが非常に重要である。
【0005】
蛋白質に対する良好なリガンドを設計できる見込みは、リガンドが設計される蛋白質ポケットの3D形状に大きく左右される。リガンドと蛋白質の両方の非極性表面から水分子を除去することによって結合のエネルギーが得られることを示す、分子認識の「疎水性効果」により(アジャイ(Ajay)およびマーコウ(Murcko)、Journal of Medicinal Chemistry、1995年、4953ページ)、蛋白質/リガンド結合の最も決定的な因子の1つが、蛋白質と接触する非極性リガンド表面のパーセント領域であることが十分に立証されている。したがって、分子機能因子が等しいとき、リガンドが蛋白質表面によってより完全に覆われればそれだけ、蛋白質への首尾よい結合の機会が増える。その結果、所与の蛋白質に対するリガンドを設計するために、高い凹形性質を示し、したがって潜在リガンドを大きな度合で覆うことができる蛋白質の領域(ポケット)を見出すことが重要である。
【0006】
表面の凹部は、多くの方法で測定することができ、現在、後の合理的薬物設計のために蛋白質表面の凹形領域を定義するいくつかの方法が存在する。それには、凹部を識別するための「ある点での平均曲率」の測定に基づく、リーズ大学(Leeds University)でのCAnGAROOプロジェクトの方法が含まれる。他の方法は、「プローブ球」を用いて凹部を識別することに基づくものであり、蛋白質モデルの体積内に球を数学的に提供する一方法である。CASTなどのさらに他の方法は、蛋白質の「アルファ表面」を識別することに基づいている。
【0007】
(発明の概要)
本発明は、モデル、特に表面上に多くの凸形および凹形領域を有する不規則表面のモデル上にある、凸形および凹形表面を評価するためのシステムおよび方法を含む。一連のスライス面が、該モデルによって互いに平行に提供され、好ましくは、様々な角度でのスライスの複数の列が該モデルによって提供される。スライス面、モデルの表面、および他の最小および/または最大パラメータを使用して、モデルの凹部が求められ、所望の領域または形態が見出される。
【0008】
体積の凹形領域は、スライス面のみによって境界を画されてもよいし、あるいは、スライス面に垂直な1つまたは複数の平面によって、または第1のスライス平面に平行で第1のスライス面から離隔された別のスライス面によって、境界を画されてもよい。
【0009】
上記方法はまた、その占める空間の交差体積に基づいて、発見されたポケットを集約し、集約されたポケットをより小さな重複体積に区分化することを含む。
上記方法はさらに、幾何性質、スライスおよびモデルによって包含される体積、スライスがモデルに交差する開口面積、およびスライス面に平行または垂直な平面によって境界を画された領域によってモデル表面上の凹形領域をランク付けることを含む。
【0010】
本発明のシステムおよび方法は、多くの凸形および凹形変化を有する不規則表面に使用可能であり、特に、生体分子、より好ましくは生体高分子、さらに好ましくは蛋白質に使用できる。本発明は、RNAおよびDNAにも使用することができる。
【0011】
蛋白質の場合、蛋白質ポケットと呼ばれるこれらの凹形領域に関する知識を使用して、リガンドが結合される可能性が高い場所を決定し、そのポケットに適したリガンドを設計することができる。したがって、本発明のシステムおよび方法は、合理的薬物設計プロセスの一部として使用することができる。他の特徴および利点は以下の詳細な説明、図面、および特許請求の範囲から明らかになろう。
【0012】
(詳細な説明)
本発明は、より一般的な利用可能性を有するが、本明細書では、蛋白質モデルを使用して蛋白質ポケットを見出すことに関して説明する。蛋白質の3次元(3D)分子モデルが図1Aに示されており、蛋白質の原子表面を表す3D表面が図1Bに示されている。蛋白質の分子モデルを提供するため、さらには分子モデルから3D表面モデルを作成するためのデータベースおよびプログラムが知られている。
【0013】
本発明のシステムおよび方法を使用して、多数の凸形および凹形変化を有する非常に不規則な表面を含めた、モデル化することができる蛋白質表面および他の3次元表面上の凹形領域を識別することができる。
【0014】
以下に説明するプロセスでは、「表面」とは、計算幾何学の分野で一般に理解されている基本的な一貫性を満足する、三角形の集合から構成された3D空間に組み込まれた2D対象(オブジェクト)のことである。表面は、複数の「構成要素」(すなわち解体領域)を含むことができる。表面の「頂点」は、表面を構成する三角形の頂点の集合である。
【0015】
本発明の方法によって求められるように、「蛋白質ポケット」は、蛋白質表面および1つまたは複数の「境界」面からモデルを作成するために使用される三角形によって境界を画された3次元(3D)空間内の領域であり、ポケット内部の任意の点は蛋白質表面の内部領域に含まれないようになっている。「潜在蛋白質ポケット」は、蛋白質表面および1つまたは複数の境界面から三角形によって境界を画された3D空間内の領域であるが、ポケットの内部領域内の点には条件が何もない。蛋白質のモデルは、一連の平行な平面スライスによってスライスされ、それにより各スライスが、「スライス面」によって境界を画された潜在蛋白質ポケットを作成する。このプロセスは、複数の角度でモデルを通るいくつかの平行スライスを作成することによって繰り返すことができる。
【0016】
蛋白質のモデルの例が、図3A、4A、および5Aにおいて、平面スライスと共に示されている。図3Aで、蛋白質の表面10の3次元モデルが平面12によってスライスされて、表面10の部分によって境界を画されるが表面10の外側にある領域14を生成する。領域14は、平面12が表面10に交差する周縁16を有する。平面スライスが、図3Bに示される蛋白質ポケットを求め、画定することができる。別法として、図4Bに示されるようなスライス面に垂直な1つまたは複数の平面20,22など、追加の「開口完成パラメータ」を使用することができ、あるいは追加の「トンネル底部完成パラメータ」、すなわち図5Bに示されるようなスライス面に平行な別の平面24を使用することができる。
【0017】
「シンプル・ポケット」は、図3Bに示されるように、ただ1つの境界面、すなわちスライス面を有する蛋白質ポケットである。平面スライスが表面に交差して、スライス内で閉じた周縁を作成する。シンプル・ポケットでは、ポケット内を見下ろした場合に、ポケットの底部に到達するまでその断面は徐々に小さくなる。
【0018】
「部分ポケット」は、図4Bに示されるように、スライス面と、スライス面に垂直な1つまたは複数の平面によって境界を画される蛋白質ポケットである。このタイプのポケットは、シンプル・ポケットと同様であるが、スライスに交差する表面が、閉じた周縁を作成せず、開いた部分を有する。これらの開いた部分は、1つまたは複数の垂直面20,22によって「ふさがれる」。
【0019】
「トンネル・ポケット」は、図5Bに示されるように、計2つの境界面を有する蛋白質ポケットであり、境界面の一方はスライス面であり、他方はスライス面に平行なスライス24である。トンネル・ポケットは、例えば、蛋白質モデルが、蛋白質の一部を通って延在する取り囲まれた「穴」を有するとき(ドーナツ状であるとき)に使用される。
【0020】
図2Aおよび2Bを参照すると、潜在蛋白質ポケットの「ポケット開口」は、蛋白質表面および任意の追加の境界面によって境界を画されたスライス面の領域である(図2A)。比較される様々な蛋白質表面領域の凹部を評価する2つの重要な基準は、「包含ポケット体積」と「ポケット開口面積」である(図2A)。本発明により、そのような計算を迅速に行うことができる。CAnGAROOなど、上述した背景の項で説明したいくつかの他の方法では、出力蛋白質ポケットが、図2Bに示されるように3次元開口境界で見出され、そのため、ポケット体積とポケット開口面積の計算が困難であり不正確なものになる。
【0021】
本発明に従って求められる、結果として得られるポケットは、ポケット開口での平面によって全て画定される(すなわち2次元開口境界が存在する)ので、既知の計算幾何学方法を使用して、ポケット体積およびポケット開口面積を正確に計算することができ、使用者定義基準に合うように全てのポケットを高速かつ正確に評価することができる。したがって、蛋白質に結合する可能性があるリガンドの後の合理的設計の準備に、蛋白質表面の所与の領域に対するリガンド結合可能性を高速かつ正確に評価することができる。
【0022】
蛋白質に関して識別されたポケットは、空間の重複する領域を占有する場合がある。この場合、重複ポケットを合併させ、「合併ポケット体積」を計算することが望ましい。本発明はそれを、各ポケットの体積を球で埋めて、ポケットの集合にわたる和集合を取ることによって達成する。さらに、小分子リガンドに適した合併ポケット体積内部の正確な領域を識別するために、本発明は、合併ポケット体積を複数の「区分化ポケット体積」に分割するための方法を提供する。
また、図10〜17を参照すると、ポケットを識別するための方法は以下のプロセスを含む。
【0023】
SLICE
SLICE(S,P)は、図10に示されるように、表面Sを2つの表面、すなわち平面Pの上方の表面S部分であるSTOP30と、平面Pの下方の表面S部分であるSBOTTOM32とに分割することによって形成される、結果として得られる表面を識別する。したがって、このプロセスは、スライスされた三角形を複数の三角形に再画定するための機構を提供する。該複数の三角形の1つまたは複数がスライス面の上方にあってよく、1つまたは複数がスライス面の下方にあってよい。
【0024】
SLICEプロセスのステップ
a)Tを、Pによって交差されるS内の三角形の集合とする。Tの各三角形TRIが、Pによってより小さな三角形と台形とに分割される(図11参照)。
b)Tの各三角形TRIに関して、三角形TRIを3つの新たな三角形TRI1、TRI2、TRI3に分割する。これらの新たな三角形を集合NEW_TRIに格納する(図12参照)。
c)NO_INTERSECTを、Pに交差しないS内の三角形の集合とする。ALL_TRIを、NEW_TRIとNO_INTERSECTの和集合によって形成される集合とする。このとき、STOPは、Pの上方に少なくとも1つの頂点を有するALL_TRI内の三角形によって形成される表面であり、SBOTTOMは、Pの下方に少なくとも1つの頂点を有するALL_TRI内の三角形によって形成される表面である。
【0025】
POCKET
POCKET(S,P,FILTER)は、様々なタイプを含めた全ての蛋白質ポケットの決定を可能にし、蛋白質表面S上に位置するスライス面Pが、フィルタ構造FILTERによって指定される制約を受ける。FILTERは、望ましいポケットを決定するための使用者が設定可能なパラメータを設定する以下の要素を含む。
【0026】
・FILTER.MIN_AREA
・FILTER.MAX_AREA
・FILTER.MIN_VOLUME
・FILTER.MAX_VOLUME
・FILTER.TUNNEL_STEP
・FILTER.TUNNEL_FACTOR
・FILTER.MAX_TUNNEL_BOTTOM
・FILTER.MAX_PARTIAL_LENGTH
・FILTER.MAX_PARTIAL_AREA
・FILTER.TOTAL_PARTIAL_LENGTH
・FILTER.TOTAL_PARTIAL_AREA
【0027】
POCKETのステップ
a)SLICE(S,P)を使用して、STOPおよびSBOTTOMを識別する。
b)Vを、P上に位置するSBOTTOMの頂点の集合とする。V内の頂点に関する「平面接続構成要素」の集合CROSS_SECTを計算する。完全にP上に存在する2つの頂点をつなぐ三角形縁部の経路が存在する場合、V内のその2つの頂点は、同じ平面接続構成要素CJ内にある。図13は、平面44内の2つの個別の平面接続構成要素40,42を示す。
【0028】
c)SIMPLE_POCKET(CROSS_SECT,SBOTTOM,P,FILTER)(以下に説明する)を使用して、スライス面として平面Pを有するシンプル・ポケットを識別する。計算されたポケットを集合POCKに格納する。
【0029】
d)TUNNEL_POCKET(CROSS_SECT,SBOTTOM,P,FILTER)(以下に説明する)を使用して、スライス面として平面Pを有するトンネル・ポケットを識別する。結果として得られるポケットをPOCKに追加する。
【0030】
e)PARTIAL_POCKET(CROSS_SECT,SBOTTOM,P,FILTER)(以下に説明する)を使用して、スライス面として平面Pを有する部分ポケットを識別する。結果として得られるポケットをPOCKに追加する。
f)SBOTTOMをSTOPに置き換えて、ステップ(c)〜(e)を繰り返す。
g)全ての蛋白質ポケットの集合POCKを戻す。
【0031】
SIMPLE_POCKET
SIMPLE_POCKET(CROSS_SECT,S,P,FILTER)は、構成要素の集合CROSS_SECT内に含まれるポケット開口を有し、フィルタ構造FILTERによって指定される制約を満足する表面S上のシンプル・ポケットを計算する。
【0032】
定義
表面S内の2つの頂点VJとVKを接合するS内の三角形縁部の経路が存在する場合、VJとVKが「表面Sに対して表面接続」される。
CJの任意の頂点がCKの任意の頂点に表面接続される場合、CROSS_SECT内の2つの構成要素CJとCKが、表面Sに対して表面接続される。
【0033】
CJの任意の頂点がTRIの任意の頂点に接続される場合、CROSS_SECT内の構成要素CJと、表面S内の三角形TRIとが、表面Sに対して表面接続される。
【0034】
CKが、CJによって境界を画された領域内に完全に位置する場合に、CROSS_SECT内の構成要素CKは、構成要素CJの「内部構成要素」である(図14参照)。
【0035】
CKがCJの内部構成要素であって、CNがCJの内部構成要素であり、かつCKがCNの内部構成要素となるようなCROSS_SECTの構成要素CNが存在しない場合、CROSS_SECT内の構成要素CKは、構成要素CJの「隣接内部構成要素」である(図14参照)。
【0036】
SIMPLE_POCKETに関するステップ
a)CROSS_SECTの各構成要素CJに関して、CJが、その全ての隣接内部構成要素に表面Sに対して表面接続され、CROSS_SECTの他の構成要素には表面接続されない場合に、
i)CJに表面接続された表面S内の全ての三角形からなる潜在ポケットPPを形成する。
ii)潜在ポケットPP内の任意の内部点POINTを取り上げる。
iii)POINTが表面Sの内部領域に含まれず、構成要素CJの面積がFILTER.MAX_AREAよりも小さく、FILTER.MIN_AREAよりも大きく、PPの体積がFILTER.MAX_VOLUMEよりも小さく、FILTER.MIN_VOLUMEよりも大きい場合、PPは有効なシンプル・ポケットである。
【0037】
b)ステップ(a)を使用してCROSS_SECT内の各構成要素を検査することによって求められた有効シンプル・ポケットの集合POCKを戻す。
TUNNEL_POCKET
TUNNEL_POCKET(CROSS_SECT,S,P,FILTER)は、構成要素の集合CROSS_SECT内に含まれるポケット開口を有し、フィルタ構造FILTERに含まれる制約を満足する表面S上のトンネル・ポケットを識別する。
【0038】
TUNNEL_POCKETに関するステップ
a)CROSS_SECTの各構成要素CJに関して、CJが内部構成要素を含まず、CROSS_SECTの少なくとも1つの他の要素にSに対して表面接続される場合に、
1.DIST=FILTER.TUNNEL_STEPとする。
2.P’を、平面Pの下方で距離DISTに位置する、平面Pに平行な平面とする。
【0039】
3.P’と表面Sの交点が空の場合、ステップ6に進む。そうでない場合は、SLICE(S,P’)を使用してP’の上方および下方に位置する表面S部分STOP ’およびSBOTTOM ’を識別する。表記のために、S’=STOP ’とする。
【0040】
4.CROSS_SECT’を、P’上に位置するS’の頂点の平面接続構成要素の集合とする。
5.CROSS_SECT内のCJがCROSS_SECT’内のただ1つの要素CJ ’にS’に対して表面接続され、CJ ’の面積が、(CJの面積)*FILTER.TUNNEL_FACTORよりも小さい場合に、
CJ ’を集合VALID_BOTTOMSに格納して、DIST=DIST+FILTER.TUNNEL_STEPとし、ステップ2に進む。
そうでない場合は、ステップ6に進む。
【0041】
6.集合VALID_BOTTOMSが空でない場合、以下の条件を満足するVALID_BOTTOMS内の要素CJ ’を求める。条件は、CJ ’がFILTER.MAX_TUNNEL_BOTTOMよりも小さい面積を有し、FILTER.MAX_TUNNEL_BOTTOMよりも面積が小さいVALID_BOTTOMS内の全ての要素に関して、CJ ’が位置する平面がPから最も遠い距離にあることである。
【0042】
7.そのようなCJ ’が存在する場合に、CJ ’を「三角形化」する(すなわち2D多角形を三角形に分解する)。
8.P’を、CJ ’が位置する平面とする。ステップ7で計算された三角形を、SLICE(S,P’)を使用して計算された表面STOP ’に追加する。この表面をS’’と表記する。POCKを、CJに(S’’に対して)表面接続されたS’’内の三角形の集合と等しくする。
【0043】
9.CJの面積がFILTER.MAX_AREAより小さく、FILTER.MIN_AREAより大きく、POCKの体積がFILTER.MAX_VOLUMEよりも小さく、FILTER.MIN_VOLUMEよりも大きい場合、POCKは有効なトンネル・ポケットである。
b)CROSS_SECT内の残りの構成要素それぞれに関してステップ(a)に戻る。
【0044】
PARTIAL_POCKET
PARTIAL_POCKET(CROSS_SECT,S,P,FILTER)は、構成要素の集合CROSS_SECT内に含まれるポケット開口を有し、フィルタ構造FILTER内に含まれる制約を満足する表面S上の部分ポケットを識別する。
【0045】
PARTIAL_POCKETに関するステップ
1)構成要素の集合CROSS_SECTに関して、「外側境界」を識別する。図15および16で、構成要素40および42が、図示されるような境界を有し、外側境界48は、両構成要素40、42を包含するように作成される。図16は、断面の外側境界を見出す2つの例を示す。X印を有する円が、断面の最下頂点を示す。ステップ1(c)で説明する横断はこの点からスタートし、既存の断面縁部および新たに追加された特定の縁部(二重線)に沿って、開始点に再び達するまで反時計回りで続く。
【0046】
外側境界は、CROSS_SECT内の縁部と、以下の方法で求められるCROSS_SECTのいずれかの頂点間の追加の縁部(特定の縁部)との集合である。
【0047】
a)CROSS_SECT内の全ての頂点に、STATEと呼ばれるラベルを割り当てる。全ての頂点に関するSTATEの初期値を「未処理」に設定する。
【0048】
b)STATE=「未処理」を有するCROSS_SECT内の最下点(すなわち、最小のy座標を有する点)PNTを求める。
c)点PNTに再び到達するまで、以下の様式でCROSS_SECT内の縁部を横断する。
【0049】
1.PNT’がPNTの距離FILTER.MAX_PARTIAL_LENGTH以内にあるように、かつPNTとPNT’をつなぐセグメントが、横断時に前の縁部と最小の反時計回り角度をなすようにPNT’を求める。横断中の第1の点に関して、前の縁部の方向を正のx方向に指定する。
【0050】
2.PNT’がPNTの隣接点でない場合、PNTとPNT’の間の特定の縁部SEを集合SPECIAL_EDGESに追加する。PNT=PNT’とする。c)に進む。
【0051】
d)この進行プロセスに出てくるCROSS_SECTの様々な構成要素に関して、全ての頂点のSTATEを「未処理」に変える。
e)STATE=「未処理」の状態でCROSS_SECT内に任意の頂点が存在する場合、b)に進む。
【0052】
2)ステップ1で識別されたCROSS_SECTの外側境界での縁部から全ての「部分開口」を抽出する(影付き部分開口を示す図17を参照のこと)。部分開口は、SPECIAL_EDGESからの少なくとも1つの特定の縁部と、ステップ1(c)で横断されなかったCROSS_SECT内の縁部の集合とからなる閉じた多角形である。PARTIAL_OPENINGSを、ステップ1からの外側境界内に含まれる部分開口の集合とする。
【0053】
3)集合PARTIAL_OPENINGS内の各部分開口POに関して、
a)POの面積がFILTER.MAX_AREAよりも小さく、FILTER.MIN_AREAよりも大きく、PO内の全ての特定の縁部の全長がFILTER.TOTAL_PARTIAL_LENGTHよりも小さい場合、ステップ(b)に進む。そうでない場合は、任意の残りの部分開口に関してステップ3に戻る。
b)S*=Sとする。
c)SPECIAL_EDGES内にあるPOの各縁部Eに関して、P’を、Eを含みPに垂直な平面とする。SLICE(S*,P’)を使用してSBOTTOM *を計算する。S’=SBOTTOM *とする。Eの端点がS’内で(P’に対して)平面接続されていない場合、任意の残りの部分開口に関してステップ3に戻る(図18参照)。
d)SIDEを、縁部Eによって形成される多角形、およびEの端点をつなぐP’上の縁部の経路とする。SIDEの面積がFILTER.MAX_PARTIAL_AREAよりも小さい場合、SIDEを三角形化し、その三角形をS’に追加し、そうでない場合は、全ての残りの部分開口が処理されるまでステップ3に進む。
e)S*=S’とし、PO内の全ての残りの特定の縁部が処理されるまでステップ(c)に進む。
【0054】
4)ステップ4〜6でS*に追加される側辺多角形の総面積がFILTER.TOTAL_PARTIAL_AREAよりも小さい場合、POCKを、POに接続されたS*表面内の三角形の集合に等しくする。POCKの体積がFILTER.MAX_VOLUMEよりも小さく、FILTER.MIN_VOLUMEよりも大きい場合、POCKは有効な部分ポケットである。
【0055】
5)PARTIAL_OPENINGS内の全ての残りの部分開口が処理されるまで3)に進む。
【0056】
ALL_POCKETS
ALL_POCKETS(PROT,S,N,P_STEP,FILTER)は、フィルタ構造FILTERにおける制約を受ける蛋白質PROTの表面S上の蛋白質ポケットを計算する。図19を参照すると、蛋白質は、P_STEPだけ離隔されたいくつかの均等に分散された平面によってスライスされる。また、図19に示されるように、Nが、モデルの中心を通るラインのいくつかの向きを示し、一連の平行なスライスが、点PNTへの各ラインに垂直に取られている。典型的な値はN=514、およびP_STEP=1オングストロームである。蛋白質は、例えば、様々な向きに沿って10〜100オングストロームである。したがって、上で与えられたNおよびP_STEPの例示値について、この方法は、約5000〜50000スライスに関するポケットを決定する。
【0057】
1)CNTRを、蛋白質Pの質量中心の位置とする。
2)CNTRの周りで中心を取られた単位球上で、N個の均等に分散された点を計算する。
3)ステップ2で計算された各点PNTに関して、
a)ITER=0とする。
b)Pを、通常のベクトルがCNTRからPNTへのベクトルであり、CNTR+PNT*(ITER+0.5)*P_STEPを含む平面とする。
c)POCKETS(S,P,FILTER)を計算し、その結果を集合COMPLETE_SETに追加する。
d)PおよびSの交点が空の場合、ステップ3に進む。
e)ITER=ITER+1とする。
f)ステップa)に進む。
4)COMPLETE_SETを戻す。
【0058】
使用される典型的な値の例
(数値はすべてオングストローム単位である)
FILTER.MIN_AREA=45
FILTER.MAX_AREA=540
FILTER.MIN_VOLUME=300
FILTER.MAX_VOLUME=2300
FILTER.TUNNEL_STEP=1
FILTER.TUNNEL_FACTOR=3
FILTER.MAX_TUNNEL_BOTTOM=80
FILTER.MAX_PARTIAL_LENGTH=8
FILTER.MAX_PARTIAL_AREA=40
FILTER.TOTAL_PARTIAL_LENGTH=20
FILTER.TOTAL_PARTIAL_AREA=80
【0059】
重複ポケット
POCKET_VOLUME_MERGE
POCKET_VOLUME_MERGE(P,POCKETS)は、蛋白質Pによって画定される「合併ポケット体積」の集合、およびそれに関連する計算されたポケットの集合POCKETSを計算する。ALL_POCKETSによって定義される所与の蛋白質に関する全ての蛋白質ポケットの集合を仮定すると、POCKET_VOLUME_MERGEを使用して「合併ポケット体積」を定義することができる。これらの合併ポケット体積は、小分子の結合のために蛋白質によって利用可能な総体積を表す。
【0060】
POCKET_VOLUME_MERGEのステップ
1)任意の座標系を使用して、立方体の辺の長さがLATTICE_LENGTHである格子Lを定義する。
2)集合POCKETS内の各ポケットPOCKに関して、以下のように球の集合を定義する。
a)各球が、L内の格子点に中心を置き、半径BALL_RADIUSを有さなければならない。
b)各球の中心は、POCKの表面三角形および境界面によって画定される体積内に含まれなければならず、かつ、蛋白質表面から少なくともBALL_BUFFERの距離だけ離れていなければならない。
c)集合内に少なくともBALL_CLUSTER_SIZE_CUTOFFの隣接球を有さない場合には、集合から球を除去し、このとき各球が、任意の方向で所与の球の中心から最大1単位にあるL内の格子点に中心を取られた26個の球からなる隣接球を有する。
【0061】
3)Sを、前のステップで計算された全ての球の集合の和集合と定義する。
4)S内の任意の球の中心のLATTICE_SEARCH距離内にある全ての格子点をチェックし、そのような点の周りの半径BALL_RADIUSの球が蛋白質の体積の外側にある場合、この新たな球をSに追加する。
【0062】
5)Sを接続構成要素に区分化する。ここで、上述したように、各球が最大26個の隣接球に接続される。
6)Sの各接続構成要素で球によって占有される体積が、「合併ポケット体積」である。
【0063】
典型的な値の例
LATTICE_LENGTH=1.65オングストローム
BALL_RADIUS=1.5オングストローム
BALL_BUFFER=1.0オングストローム
BALL_CLUSTER_SIZE_CUTOFF=3
LATTICE_SEARCH=1.0オングストローム
【0064】
POCKET_VOLUME_PARTITION
POCKET_VOLUME_PARTITION(P,MP)は、小分子結合に適した蛋白質Pの合併ポケット体積の部分集合MPである「区分化ポケット体積」を計算する。区分化ポケット体積の集合は、POCKET_VOLUME_PARTITIONアルゴリズムを使用して各合併ポケット体積から導出することができる。各区分化ポケット体積は、蛋白質への小分子結合によって完全に占有することができる空間を表す。区分化ポケット体積を使用して、ポケットへの小分子の結合親和性を測定する。これは、例えば、区分化ポケット体積の量子化立方表示を定義し、これらを、小分子の量子化立方表示と比較することによって行うことができる。
【0065】
POCKET_VOLUME_MERGEのステップ
1)MP内の球を、以下のように、表面球SSの集合と内部球ISの集合とに分割する。
a)Pの最も近接する分子が、球のMAX_DISTANCE_TO_VDW以内のファンデルワールス半径を有する場合、表面球とする。
b)そうでない場合、内部球とする。
【0066】
2)SSを以下のように区分化する。
a)各球が集合MP内で有する隣接球の数によって、最小数の隣接球を有する球から、最大数の隣接球を有する球にSS内の球をソートする。
b)球を順番にループする。球が区画に割り当てられていない場合、SS内の球およびその隣接球を含む新たな区画を作成する。その区画を区画リストに追加する。
c)区画リストを、最小数の球を有する区画から、最大数の球を有する区画にソートする。
d)区画を順番にループする。区画PARTがMIN_PARTITION_SIZEよりも少ない球を有する場合、隣接区画を突き止めることが試みられる。すなわち、PART内の球に隣接する球を含む区画。隣接する区画が存在する場合、PARTを最小の隣接区画と合併させる。
【0067】
3)区画SSに使用されるのと同じアルゴリズムを使用してISを区分化する。
4)SSの区画の和集合の全ての取り得る集合を含む集合SSUNIONを以下のように構成する。
a)各和集合が、球の接続集合を含む。
b)各和集合が、最小でMIN_SURFACE_UNION_SIZEの球を含み、最大でMAX_SURFACE_UNION_SIZEの球を含む。
【0068】
5)SSUNION(SSの区画の和集合)の個々の要素と、0、1、またはそれ以上のIS区画との全ての取り得る和集合を以下のように構成する。
a)各和集合が、球の接続集合を含む。
b)各和集合が、最小でMIN_INTERIOR_UNION_SIZEの球を含み、最大でMAX_INTERIOR_UNION_SIZEの球を含む。
c)和集合内のSSからの球に対する和集合内のISからの球の比が、MAX_FRACTION_INTERIOR未満である。
d)和集合内に含まれるSSからの球が、SSUNION内の和集合の1つを形成する。
6)前のステップ内で構成された各和集合が「区分化ポケット体積」である。
【0069】
典型的な値の例
MAX_DISTANCE_TO_VDW=0.5オングストローム
MIN_PARTITION_SIZE=8
MIN_SURFACE_UNION_SIZE=10
MAX_SURFACE_UNION_SIZE=50
MIN_INTERIOR_UNION_SIZE=10
MAX_INTERIOR_UNION_SIZE=50
MAX_FRACTION_INTERIOR=0.5
【0070】
ポケットの決定後のプロセス
全てのポケットが求められると、それらを、特定の必要性、および所望の入力パラメータに基づいてソートし、評価することができる。ポケット体積およびポケット開口が特に興味深いものである。方法の使用者は、開口面積、包含体積、または面積と体積の何らかの組合せに有利なように評価に重み付けをすることができる。パラメータの重み付けは、方法の目的に応じて決めることができる。例えば、所望の蛋白質−蛋白質結合部位に関しては、より大きなポケット開口領域がより望ましい場合がある。小分子部位に関しては、ポケット開口面積比に対して大きな包含体積が望まれる場合がある。あるいは使用者が、主に包含体積に重み付けを置くことを望む場合がある。
【0071】
しばしば、シンプル・ポケット、またはほぼシンプル・ポケットであるポケット(スライス面以外の結合面からの追加面積がほとんどないポケット)を有することが望まれる。MAX_TUNNEL_BOTTOM、MAX_PARTIAL_LENGTH、およびTOTAL_PARTIAL_LENGTHを制御することによって、使用者は、シンプル・ポケットまたはほぼシンプル・ポケットであるポケットを好む場合がある。これらのパラメータは、ポケットを画定するために使用することができる追加の平面の量に制限を与える。上で識別された最大値がゼロである縮小ケースでは、シンプル・ポケットのみを求めることができる。
【0072】
したがって、本発明を使用して、蛋白質モデルなど大きな凸形および凹形変化を有する表面をもつ3D構造を含めた、任意のモデル化される不規則3D構造の断面スライスによって生成される包含体積およびポケット開口面積を評価することによって、3D構造内で凹形領域を求めることができる。より一般的には、本発明のシステムおよび方法を使用して、例えば、一般に生体分子を有する、一般に生体高分子を有する、特に蛋白質を有する他の構造の表面変化を評価することができる。
【0073】
ソフトウェアおよびハードウェア実施
本発明のシステムおよび方法は、コンピュータ、ワークステーション、サーバ、または1つまたは複数のCPUもしくは他のプロセッサを有する何らかの他のデバイスで動作し、かつそれらによって実行される、あるいは処理用のアプリケーション専用集積回路を有するデバイスで動作するソフトウェアとして、またはハードウェアとソフトウェアの組合せとして実施することができる。本明細書で説明した方法は、例えば、600MHzの従来のパーソナル・コンピュータで、蛋白質モデルに関して数時間で正常に実施することができ、より強力な処理機器ではより迅速に実施することができる。
【0074】
本発明のソフトウェア部分は、磁気媒体および光学媒体を含む任意の所望の格納媒体に格納することができる。そのような媒体は通常、プログラム・データが符号化された基板を有し、それにより適切なリーダと共に使用されるときに、コンピュータまたは計算システムが、符号化されたプログラム・データを読み取り、実行することができる。
【0075】
蛋白質ポケット評価の使用
どの蛋白質表面領域がリガンドが結合する可能性が最も高い部位であるかを定義することによって、後の合理的薬物設計を、本発明で説明した方法を使用することによって直接得ることができる。例えば、蛋白質表面の特定の領域をターゲット表面として使用することができ、Flexx、AutoDock、Dock、またはGoldといった知られているドッキング方法の任意のものを使用することによって、潜在結合親和性について分子を測定することができる。
【0076】
あるいは、蛋白質表面の特定の領域をターゲット表面として使用することができ、(1)蛋白質表面および潜在リガンドがそれぞれ立体形態に量子化され、(2)表面の立体量子化に対する分子の立体量子化の相補性に基づいてリガンドの潜在結合親和性がランク付けられる方法を使用することによって、潜在結合親和性について分子を測定することができる。そのような方法の詳細は、ウィントナー(Wintner)およびモアレミ(Moallemi):「Quantized Surface Complementarity Diversity(QSCD):A Model Based on Small Molecule−Target Complementarity」Journal of Medicinal Chemistry、2000年、43巻、1993〜2006ページに例示されており、その文献は参照により本明細書に組み込まれる。
【0077】
既存の化合物のマッピングおよび比較に加えて、QSCDも「可逆モデル」である。これは、詳細な3Dテンプレートに分子ライブラリを直接モデル化することによって、多様性空間内の未充填点を埋めることができることを意味する。1組の知られている試験化合物を使用して、モデルは、生物学的に関連し、同様のものとして知られている活動を一貫してスコアリングすることが示されている。すなわち、同様のものとして、または同様でないものとして知られている化合物の比較が、多様性に関してそれぞれハイおよびローをスコアする。このモデルはさらに、知られているリガンドが結合する蛋白質表面の一般的な形状および機能を予測することができる能力によって確証されている。最後に、このモデルは、3D形状および機能の類似性によって、知られている蛋白質モチーフを特徴付ける機会を提供する。
【0078】
QSCDは、分子構造を取り、立体配座を作成する。これらの立体配座は、本質的に、各立体配座を表すために小さなブロックを使用することによって量子化される。これらの量子化された立体配座は、全ての理論的なターゲット表面に対して比較され、スコアされる。
【0079】
ポケット体積および開口面積を使用し、量子化されたリガンドと比較して、ポケットに結合しそうなリガンドを求めることができる。
リガンドの潜在結合親和性が、上で列挙した方法の1つを使用してランク付けられた後、そのようにランク付けられたリガンドを合成して、結合検定で、対象の蛋白質に対する実際の結合親和性に対して試験することができる。例示的なスクリーニング方法は、国際特許出願国際公開公報WO99/35109号に記載されており、その出願は参照により本明細書に組み込まれる。
【0080】
(実施例)
上述した方法を、既知のリガンド、すなわちHIV−1プロテーゼ、熱ショック蛋白質−90、ストロメリシン、およびジヒドロ葉酸レダクターゼを有する4つの蛋白質結晶構造を用いて、原理的研究の証明に使用した。各蛋白質に関して、蛋白質の3D原子表面を計算し、次いで、潜在リガンド・ポケットを画定するために本発明の方法を使用して平面でスライスした。フィルタに使用するパラメータは、使用される典型的な値として上に列挙した典型的なパラメータである。全ての潜在リガンド・ポケットを、包含ポケット体積に従ってソートした。
【0081】
実際のリガンド・ポケットを、X線構造によって求めた(図6〜9)。4つのケース全てにおいて、本発明の方法によって計算される最大体積のポケットが、それぞれHIV−1プロテーゼ、熱ショック蛋白質−90、ストロメリシン、およびジヒドロ葉酸レダクターゼを表す図6〜9に示されるように、実際上、実際のリガンド・ポケットに合致した。この図では、図6がトンネル・ポケットであり、図7〜9が部分ポケットである。
【0082】
したがって、これらの実験は、本発明の方法が、蛋白質表面の複数の領域のリガンド結合可能性を評価するための計算ツールとして有用であることを示す。
特許請求の範囲の範囲から逸脱することなく、さらなる修正を施し、さらなる特徴を追加または提供することができる。
【図面の簡単な説明】
【図1A】
蛋白質の分子モデルの一例である。
【図1B】
図1Aに示される蛋白質の原子表面の3次元表示を示す。
【図2A】
スライスによって境界を画された蛋白質モデル内のポケットの斜視図である。
【図2B】
以前の方法によって求められた、3次元境界を有するポケットの斜視図である。
【図3A】
潜在蛋白質ポケットを定義するために取られた平面スライスを有する蛋白質モデルの3次元図面である。
【図3B】
図3Aにおける平面スライスによって作成され、シンプル・ポケットを表すポケットを示す斜視図である。
【図4A】
潜在蛋白質ポケットを定義するために取られた平面スライスを有する蛋白質モデルの3次元図面である。
【図4B】
図4Aにおける平面スライスによって作成され、部分ポケットを表すポケットを示す斜視図である。
【図5A】
潜在蛋白質ポケットを定義するために取られた平面スライスを有する蛋白質モデルの3次元図面である。
【図5B】
図5Aにおける平面スライスによって作成され、トンネル・ポケットを表すポケットを示す斜視図である。
【図6】
本発明に従って求められた最大体積のポケットと、X線構造によって求められた実際のリガンド・ポケットとを示す3Dモデルであって、それにより本発明の方法が潜在リガンド・ポケットを決定するのに効果的である場合があることを実証する3Dモデルを示す図である。図6の蛋白質は、HIV−1プロテーゼである。
【図7】
本発明に従って求められた最大体積のポケットと、X線構造によって求められた実際のリガンド・ポケットとを示す3Dモデルであって、それにより本発明の方法が潜在リガンド・ポケットを決定するのに効果的である場合があることを実証する3Dモデルを示す図である。図7の蛋白質は、熱ショック蛋白質90である。
【図8】
本発明に従って求められた最大体積のポケットと、X線構造によって求められた実際のリガンド・ポケットとを示す3Dモデルであって、それにより本発明の方法が潜在リガンド・ポケットを決定するのに効果的である場合があることを実証する3Dモデルを示す図である。図8の蛋白質は、ストロメリシンである。
【図9】
本発明に従って求められた最大体積のポケットと、X線構造によって求められた実際のリガンド・ポケットとを示す3Dモデルであって、それにより本発明の方法が潜在リガンド・ポケットを決定するのに効果的である場合があることを実証する3Dモデルを示す図である。図9の蛋白質は、ジヒドロ葉酸レダクターゼである。
【図10】
平面によってスライスされた蛋白質表面の図である。
【図11】
スライスがモデル三角形を通過するときのスライス・プロセスのステップを示す図である。
【図12】
スライスがモデル三角形を通過するときのスライス・プロセスのステップを示す図である。
【図13】
スライスを有する蛋白質の3Dモデルと、スライスによって作成された2つの構成要素の外径の射影とを示す図である。
【図14】
スライスから得られる構成要素の一例を示す図である。
【図15】
スライスを有する蛋白質と、断面および外側境界の計算を示す図である。
【図16】
蛋白質を介するスライスによって断面の外側境界を求める例を示す図である。
【図17】
図16の例での外径境界からの部分開口を示す図である。
【図18】
特定の縁部の決定を示す図である。
【図19】
モデルを通るいくつかの平面スライスを示す図である。
(関連出願の相互参照)
本出願は、2000年6月16日出願の米国仮特許第60/212332号からの優先権を主張するものであり、この仮特許は参照により本明細書に組み込まれる。
【0002】
(発明の背景)
本発明は、表面、特に、多くの凹形および凸形領域を有する表面の評価に関し、好ましい実施形態では、生体高分子、特に蛋白質分子の評価に関する。
蛋白質X線結晶学の科学は十分に確立されている。10000を超える天然または非天然蛋白質のX線結晶構造が求められ、ケンブリッジ大学(Cambridge University)蛋白質データ・バンク(PDB)に保存されている。蛋白質のX線構造は、蛋白質中の全ての、またはほとんどの原子の空間座標を提供し、それにより、蛋白質の分子モデルを構成することができるようにする(図1A)。そのようなモデルはしばしばコンピュータで構成され、したがって、TRIPOSやRASMOLなどの3次元(3D)コンピュータ・モデリング・プログラムで閲覧するために原子を表示できるようになっている。蛋白質の原子の座標を用いて、潜在リガンド分子(すなわち、何らかの測定可能な親和性を有する蛋白質に結合する分子)に接近可能な蛋白質の3D原子表面(図1B)を求めることは簡単な作業である。
【0003】
この3D原子表面は、蛋白質の原子全てのファンデルワールス半径をモデル化し、次いで、そのように形成されたファンデルワールス・モデルの上で半径Rの「プローブ・ボール」を転がすことによって作成することができる。そのような蛋白質表面を作成する典型的な方法は、MSMSおよびMSROLLと呼ばれるソフトウェア製品である。したがって、潜在リガンド分子に接近可能な蛋白質の3D原子表面は、プローブ・ボールが蛋白質原子のファンデルワールス・モデルに接する点の集合と定義される。半径Rは通常、原子半径のオーダーである。例えば、1.8オングストロームの「プローブ・ボール」を使用して、3D蛋白質表面をうまく求めることができる。
【0004】
潜在リガンド分子に接近可能な蛋白質の3D原子表面が作成された後、どの蛋白質表面領域が最もリガンドが結合する可能性が高い部位であるか定義するという一般的な問題が残る。そのような領域は「蛋白質ポケット」と呼ばれ、蛋白質表面上の本質的に空の凹部である。そのような蛋白質ポケットの位置を求めることは、後の合理的薬物設計に必要である。蛋白質に対する分子リガンドを計算によって設計するために、リガンドが設計される蛋白質の特定のポケットがわかっているべきである。合理的薬物設計は、分子認識の原理に基づいて見出され、これは、リガンドおよび蛋白質の形状および機能的相補性に基づいている。所与の蛋白質ポケットの特定の形状および機能を求めた後、相補性リガンドまたはリガンドの結合ライブラリの合理的薬物設計が、この情報に基づいて始まる。したがって、リガンドが結合する可能性が高い部位である蛋白質表面の領域を選択することが非常に重要である。
【0005】
蛋白質に対する良好なリガンドを設計できる見込みは、リガンドが設計される蛋白質ポケットの3D形状に大きく左右される。リガンドと蛋白質の両方の非極性表面から水分子を除去することによって結合のエネルギーが得られることを示す、分子認識の「疎水性効果」により(アジャイ(Ajay)およびマーコウ(Murcko)、Journal of Medicinal Chemistry、1995年、4953ページ)、蛋白質/リガンド結合の最も決定的な因子の1つが、蛋白質と接触する非極性リガンド表面のパーセント領域であることが十分に立証されている。したがって、分子機能因子が等しいとき、リガンドが蛋白質表面によってより完全に覆われればそれだけ、蛋白質への首尾よい結合の機会が増える。その結果、所与の蛋白質に対するリガンドを設計するために、高い凹形性質を示し、したがって潜在リガンドを大きな度合で覆うことができる蛋白質の領域(ポケット)を見出すことが重要である。
【0006】
表面の凹部は、多くの方法で測定することができ、現在、後の合理的薬物設計のために蛋白質表面の凹形領域を定義するいくつかの方法が存在する。それには、凹部を識別するための「ある点での平均曲率」の測定に基づく、リーズ大学(Leeds University)でのCAnGAROOプロジェクトの方法が含まれる。他の方法は、「プローブ球」を用いて凹部を識別することに基づくものであり、蛋白質モデルの体積内に球を数学的に提供する一方法である。CASTなどのさらに他の方法は、蛋白質の「アルファ表面」を識別することに基づいている。
【0007】
(発明の概要)
本発明は、モデル、特に表面上に多くの凸形および凹形領域を有する不規則表面のモデル上にある、凸形および凹形表面を評価するためのシステムおよび方法を含む。一連のスライス面が、該モデルによって互いに平行に提供され、好ましくは、様々な角度でのスライスの複数の列が該モデルによって提供される。スライス面、モデルの表面、および他の最小および/または最大パラメータを使用して、モデルの凹部が求められ、所望の領域または形態が見出される。
【0008】
体積の凹形領域は、スライス面のみによって境界を画されてもよいし、あるいは、スライス面に垂直な1つまたは複数の平面によって、または第1のスライス平面に平行で第1のスライス面から離隔された別のスライス面によって、境界を画されてもよい。
【0009】
上記方法はまた、その占める空間の交差体積に基づいて、発見されたポケットを集約し、集約されたポケットをより小さな重複体積に区分化することを含む。
上記方法はさらに、幾何性質、スライスおよびモデルによって包含される体積、スライスがモデルに交差する開口面積、およびスライス面に平行または垂直な平面によって境界を画された領域によってモデル表面上の凹形領域をランク付けることを含む。
【0010】
本発明のシステムおよび方法は、多くの凸形および凹形変化を有する不規則表面に使用可能であり、特に、生体分子、より好ましくは生体高分子、さらに好ましくは蛋白質に使用できる。本発明は、RNAおよびDNAにも使用することができる。
【0011】
蛋白質の場合、蛋白質ポケットと呼ばれるこれらの凹形領域に関する知識を使用して、リガンドが結合される可能性が高い場所を決定し、そのポケットに適したリガンドを設計することができる。したがって、本発明のシステムおよび方法は、合理的薬物設計プロセスの一部として使用することができる。他の特徴および利点は以下の詳細な説明、図面、および特許請求の範囲から明らかになろう。
【0012】
(詳細な説明)
本発明は、より一般的な利用可能性を有するが、本明細書では、蛋白質モデルを使用して蛋白質ポケットを見出すことに関して説明する。蛋白質の3次元(3D)分子モデルが図1Aに示されており、蛋白質の原子表面を表す3D表面が図1Bに示されている。蛋白質の分子モデルを提供するため、さらには分子モデルから3D表面モデルを作成するためのデータベースおよびプログラムが知られている。
【0013】
本発明のシステムおよび方法を使用して、多数の凸形および凹形変化を有する非常に不規則な表面を含めた、モデル化することができる蛋白質表面および他の3次元表面上の凹形領域を識別することができる。
【0014】
以下に説明するプロセスでは、「表面」とは、計算幾何学の分野で一般に理解されている基本的な一貫性を満足する、三角形の集合から構成された3D空間に組み込まれた2D対象(オブジェクト)のことである。表面は、複数の「構成要素」(すなわち解体領域)を含むことができる。表面の「頂点」は、表面を構成する三角形の頂点の集合である。
【0015】
本発明の方法によって求められるように、「蛋白質ポケット」は、蛋白質表面および1つまたは複数の「境界」面からモデルを作成するために使用される三角形によって境界を画された3次元(3D)空間内の領域であり、ポケット内部の任意の点は蛋白質表面の内部領域に含まれないようになっている。「潜在蛋白質ポケット」は、蛋白質表面および1つまたは複数の境界面から三角形によって境界を画された3D空間内の領域であるが、ポケットの内部領域内の点には条件が何もない。蛋白質のモデルは、一連の平行な平面スライスによってスライスされ、それにより各スライスが、「スライス面」によって境界を画された潜在蛋白質ポケットを作成する。このプロセスは、複数の角度でモデルを通るいくつかの平行スライスを作成することによって繰り返すことができる。
【0016】
蛋白質のモデルの例が、図3A、4A、および5Aにおいて、平面スライスと共に示されている。図3Aで、蛋白質の表面10の3次元モデルが平面12によってスライスされて、表面10の部分によって境界を画されるが表面10の外側にある領域14を生成する。領域14は、平面12が表面10に交差する周縁16を有する。平面スライスが、図3Bに示される蛋白質ポケットを求め、画定することができる。別法として、図4Bに示されるようなスライス面に垂直な1つまたは複数の平面20,22など、追加の「開口完成パラメータ」を使用することができ、あるいは追加の「トンネル底部完成パラメータ」、すなわち図5Bに示されるようなスライス面に平行な別の平面24を使用することができる。
【0017】
「シンプル・ポケット」は、図3Bに示されるように、ただ1つの境界面、すなわちスライス面を有する蛋白質ポケットである。平面スライスが表面に交差して、スライス内で閉じた周縁を作成する。シンプル・ポケットでは、ポケット内を見下ろした場合に、ポケットの底部に到達するまでその断面は徐々に小さくなる。
【0018】
「部分ポケット」は、図4Bに示されるように、スライス面と、スライス面に垂直な1つまたは複数の平面によって境界を画される蛋白質ポケットである。このタイプのポケットは、シンプル・ポケットと同様であるが、スライスに交差する表面が、閉じた周縁を作成せず、開いた部分を有する。これらの開いた部分は、1つまたは複数の垂直面20,22によって「ふさがれる」。
【0019】
「トンネル・ポケット」は、図5Bに示されるように、計2つの境界面を有する蛋白質ポケットであり、境界面の一方はスライス面であり、他方はスライス面に平行なスライス24である。トンネル・ポケットは、例えば、蛋白質モデルが、蛋白質の一部を通って延在する取り囲まれた「穴」を有するとき(ドーナツ状であるとき)に使用される。
【0020】
図2Aおよび2Bを参照すると、潜在蛋白質ポケットの「ポケット開口」は、蛋白質表面および任意の追加の境界面によって境界を画されたスライス面の領域である(図2A)。比較される様々な蛋白質表面領域の凹部を評価する2つの重要な基準は、「包含ポケット体積」と「ポケット開口面積」である(図2A)。本発明により、そのような計算を迅速に行うことができる。CAnGAROOなど、上述した背景の項で説明したいくつかの他の方法では、出力蛋白質ポケットが、図2Bに示されるように3次元開口境界で見出され、そのため、ポケット体積とポケット開口面積の計算が困難であり不正確なものになる。
【0021】
本発明に従って求められる、結果として得られるポケットは、ポケット開口での平面によって全て画定される(すなわち2次元開口境界が存在する)ので、既知の計算幾何学方法を使用して、ポケット体積およびポケット開口面積を正確に計算することができ、使用者定義基準に合うように全てのポケットを高速かつ正確に評価することができる。したがって、蛋白質に結合する可能性があるリガンドの後の合理的設計の準備に、蛋白質表面の所与の領域に対するリガンド結合可能性を高速かつ正確に評価することができる。
【0022】
蛋白質に関して識別されたポケットは、空間の重複する領域を占有する場合がある。この場合、重複ポケットを合併させ、「合併ポケット体積」を計算することが望ましい。本発明はそれを、各ポケットの体積を球で埋めて、ポケットの集合にわたる和集合を取ることによって達成する。さらに、小分子リガンドに適した合併ポケット体積内部の正確な領域を識別するために、本発明は、合併ポケット体積を複数の「区分化ポケット体積」に分割するための方法を提供する。
また、図10〜17を参照すると、ポケットを識別するための方法は以下のプロセスを含む。
【0023】
SLICE
SLICE(S,P)は、図10に示されるように、表面Sを2つの表面、すなわち平面Pの上方の表面S部分であるSTOP30と、平面Pの下方の表面S部分であるSBOTTOM32とに分割することによって形成される、結果として得られる表面を識別する。したがって、このプロセスは、スライスされた三角形を複数の三角形に再画定するための機構を提供する。該複数の三角形の1つまたは複数がスライス面の上方にあってよく、1つまたは複数がスライス面の下方にあってよい。
【0024】
SLICEプロセスのステップ
a)Tを、Pによって交差されるS内の三角形の集合とする。Tの各三角形TRIが、Pによってより小さな三角形と台形とに分割される(図11参照)。
b)Tの各三角形TRIに関して、三角形TRIを3つの新たな三角形TRI1、TRI2、TRI3に分割する。これらの新たな三角形を集合NEW_TRIに格納する(図12参照)。
c)NO_INTERSECTを、Pに交差しないS内の三角形の集合とする。ALL_TRIを、NEW_TRIとNO_INTERSECTの和集合によって形成される集合とする。このとき、STOPは、Pの上方に少なくとも1つの頂点を有するALL_TRI内の三角形によって形成される表面であり、SBOTTOMは、Pの下方に少なくとも1つの頂点を有するALL_TRI内の三角形によって形成される表面である。
【0025】
POCKET
POCKET(S,P,FILTER)は、様々なタイプを含めた全ての蛋白質ポケットの決定を可能にし、蛋白質表面S上に位置するスライス面Pが、フィルタ構造FILTERによって指定される制約を受ける。FILTERは、望ましいポケットを決定するための使用者が設定可能なパラメータを設定する以下の要素を含む。
【0026】
・FILTER.MIN_AREA
・FILTER.MAX_AREA
・FILTER.MIN_VOLUME
・FILTER.MAX_VOLUME
・FILTER.TUNNEL_STEP
・FILTER.TUNNEL_FACTOR
・FILTER.MAX_TUNNEL_BOTTOM
・FILTER.MAX_PARTIAL_LENGTH
・FILTER.MAX_PARTIAL_AREA
・FILTER.TOTAL_PARTIAL_LENGTH
・FILTER.TOTAL_PARTIAL_AREA
【0027】
POCKETのステップ
a)SLICE(S,P)を使用して、STOPおよびSBOTTOMを識別する。
b)Vを、P上に位置するSBOTTOMの頂点の集合とする。V内の頂点に関する「平面接続構成要素」の集合CROSS_SECTを計算する。完全にP上に存在する2つの頂点をつなぐ三角形縁部の経路が存在する場合、V内のその2つの頂点は、同じ平面接続構成要素CJ内にある。図13は、平面44内の2つの個別の平面接続構成要素40,42を示す。
【0028】
c)SIMPLE_POCKET(CROSS_SECT,SBOTTOM,P,FILTER)(以下に説明する)を使用して、スライス面として平面Pを有するシンプル・ポケットを識別する。計算されたポケットを集合POCKに格納する。
【0029】
d)TUNNEL_POCKET(CROSS_SECT,SBOTTOM,P,FILTER)(以下に説明する)を使用して、スライス面として平面Pを有するトンネル・ポケットを識別する。結果として得られるポケットをPOCKに追加する。
【0030】
e)PARTIAL_POCKET(CROSS_SECT,SBOTTOM,P,FILTER)(以下に説明する)を使用して、スライス面として平面Pを有する部分ポケットを識別する。結果として得られるポケットをPOCKに追加する。
f)SBOTTOMをSTOPに置き換えて、ステップ(c)〜(e)を繰り返す。
g)全ての蛋白質ポケットの集合POCKを戻す。
【0031】
SIMPLE_POCKET
SIMPLE_POCKET(CROSS_SECT,S,P,FILTER)は、構成要素の集合CROSS_SECT内に含まれるポケット開口を有し、フィルタ構造FILTERによって指定される制約を満足する表面S上のシンプル・ポケットを計算する。
【0032】
定義
表面S内の2つの頂点VJとVKを接合するS内の三角形縁部の経路が存在する場合、VJとVKが「表面Sに対して表面接続」される。
CJの任意の頂点がCKの任意の頂点に表面接続される場合、CROSS_SECT内の2つの構成要素CJとCKが、表面Sに対して表面接続される。
【0033】
CJの任意の頂点がTRIの任意の頂点に接続される場合、CROSS_SECT内の構成要素CJと、表面S内の三角形TRIとが、表面Sに対して表面接続される。
【0034】
CKが、CJによって境界を画された領域内に完全に位置する場合に、CROSS_SECT内の構成要素CKは、構成要素CJの「内部構成要素」である(図14参照)。
【0035】
CKがCJの内部構成要素であって、CNがCJの内部構成要素であり、かつCKがCNの内部構成要素となるようなCROSS_SECTの構成要素CNが存在しない場合、CROSS_SECT内の構成要素CKは、構成要素CJの「隣接内部構成要素」である(図14参照)。
【0036】
SIMPLE_POCKETに関するステップ
a)CROSS_SECTの各構成要素CJに関して、CJが、その全ての隣接内部構成要素に表面Sに対して表面接続され、CROSS_SECTの他の構成要素には表面接続されない場合に、
i)CJに表面接続された表面S内の全ての三角形からなる潜在ポケットPPを形成する。
ii)潜在ポケットPP内の任意の内部点POINTを取り上げる。
iii)POINTが表面Sの内部領域に含まれず、構成要素CJの面積がFILTER.MAX_AREAよりも小さく、FILTER.MIN_AREAよりも大きく、PPの体積がFILTER.MAX_VOLUMEよりも小さく、FILTER.MIN_VOLUMEよりも大きい場合、PPは有効なシンプル・ポケットである。
【0037】
b)ステップ(a)を使用してCROSS_SECT内の各構成要素を検査することによって求められた有効シンプル・ポケットの集合POCKを戻す。
TUNNEL_POCKET
TUNNEL_POCKET(CROSS_SECT,S,P,FILTER)は、構成要素の集合CROSS_SECT内に含まれるポケット開口を有し、フィルタ構造FILTERに含まれる制約を満足する表面S上のトンネル・ポケットを識別する。
【0038】
TUNNEL_POCKETに関するステップ
a)CROSS_SECTの各構成要素CJに関して、CJが内部構成要素を含まず、CROSS_SECTの少なくとも1つの他の要素にSに対して表面接続される場合に、
1.DIST=FILTER.TUNNEL_STEPとする。
2.P’を、平面Pの下方で距離DISTに位置する、平面Pに平行な平面とする。
【0039】
3.P’と表面Sの交点が空の場合、ステップ6に進む。そうでない場合は、SLICE(S,P’)を使用してP’の上方および下方に位置する表面S部分STOP ’およびSBOTTOM ’を識別する。表記のために、S’=STOP ’とする。
【0040】
4.CROSS_SECT’を、P’上に位置するS’の頂点の平面接続構成要素の集合とする。
5.CROSS_SECT内のCJがCROSS_SECT’内のただ1つの要素CJ ’にS’に対して表面接続され、CJ ’の面積が、(CJの面積)*FILTER.TUNNEL_FACTORよりも小さい場合に、
CJ ’を集合VALID_BOTTOMSに格納して、DIST=DIST+FILTER.TUNNEL_STEPとし、ステップ2に進む。
そうでない場合は、ステップ6に進む。
【0041】
6.集合VALID_BOTTOMSが空でない場合、以下の条件を満足するVALID_BOTTOMS内の要素CJ ’を求める。条件は、CJ ’がFILTER.MAX_TUNNEL_BOTTOMよりも小さい面積を有し、FILTER.MAX_TUNNEL_BOTTOMよりも面積が小さいVALID_BOTTOMS内の全ての要素に関して、CJ ’が位置する平面がPから最も遠い距離にあることである。
【0042】
7.そのようなCJ ’が存在する場合に、CJ ’を「三角形化」する(すなわち2D多角形を三角形に分解する)。
8.P’を、CJ ’が位置する平面とする。ステップ7で計算された三角形を、SLICE(S,P’)を使用して計算された表面STOP ’に追加する。この表面をS’’と表記する。POCKを、CJに(S’’に対して)表面接続されたS’’内の三角形の集合と等しくする。
【0043】
9.CJの面積がFILTER.MAX_AREAより小さく、FILTER.MIN_AREAより大きく、POCKの体積がFILTER.MAX_VOLUMEよりも小さく、FILTER.MIN_VOLUMEよりも大きい場合、POCKは有効なトンネル・ポケットである。
b)CROSS_SECT内の残りの構成要素それぞれに関してステップ(a)に戻る。
【0044】
PARTIAL_POCKET
PARTIAL_POCKET(CROSS_SECT,S,P,FILTER)は、構成要素の集合CROSS_SECT内に含まれるポケット開口を有し、フィルタ構造FILTER内に含まれる制約を満足する表面S上の部分ポケットを識別する。
【0045】
PARTIAL_POCKETに関するステップ
1)構成要素の集合CROSS_SECTに関して、「外側境界」を識別する。図15および16で、構成要素40および42が、図示されるような境界を有し、外側境界48は、両構成要素40、42を包含するように作成される。図16は、断面の外側境界を見出す2つの例を示す。X印を有する円が、断面の最下頂点を示す。ステップ1(c)で説明する横断はこの点からスタートし、既存の断面縁部および新たに追加された特定の縁部(二重線)に沿って、開始点に再び達するまで反時計回りで続く。
【0046】
外側境界は、CROSS_SECT内の縁部と、以下の方法で求められるCROSS_SECTのいずれかの頂点間の追加の縁部(特定の縁部)との集合である。
【0047】
a)CROSS_SECT内の全ての頂点に、STATEと呼ばれるラベルを割り当てる。全ての頂点に関するSTATEの初期値を「未処理」に設定する。
【0048】
b)STATE=「未処理」を有するCROSS_SECT内の最下点(すなわち、最小のy座標を有する点)PNTを求める。
c)点PNTに再び到達するまで、以下の様式でCROSS_SECT内の縁部を横断する。
【0049】
1.PNT’がPNTの距離FILTER.MAX_PARTIAL_LENGTH以内にあるように、かつPNTとPNT’をつなぐセグメントが、横断時に前の縁部と最小の反時計回り角度をなすようにPNT’を求める。横断中の第1の点に関して、前の縁部の方向を正のx方向に指定する。
【0050】
2.PNT’がPNTの隣接点でない場合、PNTとPNT’の間の特定の縁部SEを集合SPECIAL_EDGESに追加する。PNT=PNT’とする。c)に進む。
【0051】
d)この進行プロセスに出てくるCROSS_SECTの様々な構成要素に関して、全ての頂点のSTATEを「未処理」に変える。
e)STATE=「未処理」の状態でCROSS_SECT内に任意の頂点が存在する場合、b)に進む。
【0052】
2)ステップ1で識別されたCROSS_SECTの外側境界での縁部から全ての「部分開口」を抽出する(影付き部分開口を示す図17を参照のこと)。部分開口は、SPECIAL_EDGESからの少なくとも1つの特定の縁部と、ステップ1(c)で横断されなかったCROSS_SECT内の縁部の集合とからなる閉じた多角形である。PARTIAL_OPENINGSを、ステップ1からの外側境界内に含まれる部分開口の集合とする。
【0053】
3)集合PARTIAL_OPENINGS内の各部分開口POに関して、
a)POの面積がFILTER.MAX_AREAよりも小さく、FILTER.MIN_AREAよりも大きく、PO内の全ての特定の縁部の全長がFILTER.TOTAL_PARTIAL_LENGTHよりも小さい場合、ステップ(b)に進む。そうでない場合は、任意の残りの部分開口に関してステップ3に戻る。
b)S*=Sとする。
c)SPECIAL_EDGES内にあるPOの各縁部Eに関して、P’を、Eを含みPに垂直な平面とする。SLICE(S*,P’)を使用してSBOTTOM *を計算する。S’=SBOTTOM *とする。Eの端点がS’内で(P’に対して)平面接続されていない場合、任意の残りの部分開口に関してステップ3に戻る(図18参照)。
d)SIDEを、縁部Eによって形成される多角形、およびEの端点をつなぐP’上の縁部の経路とする。SIDEの面積がFILTER.MAX_PARTIAL_AREAよりも小さい場合、SIDEを三角形化し、その三角形をS’に追加し、そうでない場合は、全ての残りの部分開口が処理されるまでステップ3に進む。
e)S*=S’とし、PO内の全ての残りの特定の縁部が処理されるまでステップ(c)に進む。
【0054】
4)ステップ4〜6でS*に追加される側辺多角形の総面積がFILTER.TOTAL_PARTIAL_AREAよりも小さい場合、POCKを、POに接続されたS*表面内の三角形の集合に等しくする。POCKの体積がFILTER.MAX_VOLUMEよりも小さく、FILTER.MIN_VOLUMEよりも大きい場合、POCKは有効な部分ポケットである。
【0055】
5)PARTIAL_OPENINGS内の全ての残りの部分開口が処理されるまで3)に進む。
【0056】
ALL_POCKETS
ALL_POCKETS(PROT,S,N,P_STEP,FILTER)は、フィルタ構造FILTERにおける制約を受ける蛋白質PROTの表面S上の蛋白質ポケットを計算する。図19を参照すると、蛋白質は、P_STEPだけ離隔されたいくつかの均等に分散された平面によってスライスされる。また、図19に示されるように、Nが、モデルの中心を通るラインのいくつかの向きを示し、一連の平行なスライスが、点PNTへの各ラインに垂直に取られている。典型的な値はN=514、およびP_STEP=1オングストロームである。蛋白質は、例えば、様々な向きに沿って10〜100オングストロームである。したがって、上で与えられたNおよびP_STEPの例示値について、この方法は、約5000〜50000スライスに関するポケットを決定する。
【0057】
1)CNTRを、蛋白質Pの質量中心の位置とする。
2)CNTRの周りで中心を取られた単位球上で、N個の均等に分散された点を計算する。
3)ステップ2で計算された各点PNTに関して、
a)ITER=0とする。
b)Pを、通常のベクトルがCNTRからPNTへのベクトルであり、CNTR+PNT*(ITER+0.5)*P_STEPを含む平面とする。
c)POCKETS(S,P,FILTER)を計算し、その結果を集合COMPLETE_SETに追加する。
d)PおよびSの交点が空の場合、ステップ3に進む。
e)ITER=ITER+1とする。
f)ステップa)に進む。
4)COMPLETE_SETを戻す。
【0058】
使用される典型的な値の例
(数値はすべてオングストローム単位である)
FILTER.MIN_AREA=45
FILTER.MAX_AREA=540
FILTER.MIN_VOLUME=300
FILTER.MAX_VOLUME=2300
FILTER.TUNNEL_STEP=1
FILTER.TUNNEL_FACTOR=3
FILTER.MAX_TUNNEL_BOTTOM=80
FILTER.MAX_PARTIAL_LENGTH=8
FILTER.MAX_PARTIAL_AREA=40
FILTER.TOTAL_PARTIAL_LENGTH=20
FILTER.TOTAL_PARTIAL_AREA=80
【0059】
重複ポケット
POCKET_VOLUME_MERGE
POCKET_VOLUME_MERGE(P,POCKETS)は、蛋白質Pによって画定される「合併ポケット体積」の集合、およびそれに関連する計算されたポケットの集合POCKETSを計算する。ALL_POCKETSによって定義される所与の蛋白質に関する全ての蛋白質ポケットの集合を仮定すると、POCKET_VOLUME_MERGEを使用して「合併ポケット体積」を定義することができる。これらの合併ポケット体積は、小分子の結合のために蛋白質によって利用可能な総体積を表す。
【0060】
POCKET_VOLUME_MERGEのステップ
1)任意の座標系を使用して、立方体の辺の長さがLATTICE_LENGTHである格子Lを定義する。
2)集合POCKETS内の各ポケットPOCKに関して、以下のように球の集合を定義する。
a)各球が、L内の格子点に中心を置き、半径BALL_RADIUSを有さなければならない。
b)各球の中心は、POCKの表面三角形および境界面によって画定される体積内に含まれなければならず、かつ、蛋白質表面から少なくともBALL_BUFFERの距離だけ離れていなければならない。
c)集合内に少なくともBALL_CLUSTER_SIZE_CUTOFFの隣接球を有さない場合には、集合から球を除去し、このとき各球が、任意の方向で所与の球の中心から最大1単位にあるL内の格子点に中心を取られた26個の球からなる隣接球を有する。
【0061】
3)Sを、前のステップで計算された全ての球の集合の和集合と定義する。
4)S内の任意の球の中心のLATTICE_SEARCH距離内にある全ての格子点をチェックし、そのような点の周りの半径BALL_RADIUSの球が蛋白質の体積の外側にある場合、この新たな球をSに追加する。
【0062】
5)Sを接続構成要素に区分化する。ここで、上述したように、各球が最大26個の隣接球に接続される。
6)Sの各接続構成要素で球によって占有される体積が、「合併ポケット体積」である。
【0063】
典型的な値の例
LATTICE_LENGTH=1.65オングストローム
BALL_RADIUS=1.5オングストローム
BALL_BUFFER=1.0オングストローム
BALL_CLUSTER_SIZE_CUTOFF=3
LATTICE_SEARCH=1.0オングストローム
【0064】
POCKET_VOLUME_PARTITION
POCKET_VOLUME_PARTITION(P,MP)は、小分子結合に適した蛋白質Pの合併ポケット体積の部分集合MPである「区分化ポケット体積」を計算する。区分化ポケット体積の集合は、POCKET_VOLUME_PARTITIONアルゴリズムを使用して各合併ポケット体積から導出することができる。各区分化ポケット体積は、蛋白質への小分子結合によって完全に占有することができる空間を表す。区分化ポケット体積を使用して、ポケットへの小分子の結合親和性を測定する。これは、例えば、区分化ポケット体積の量子化立方表示を定義し、これらを、小分子の量子化立方表示と比較することによって行うことができる。
【0065】
POCKET_VOLUME_MERGEのステップ
1)MP内の球を、以下のように、表面球SSの集合と内部球ISの集合とに分割する。
a)Pの最も近接する分子が、球のMAX_DISTANCE_TO_VDW以内のファンデルワールス半径を有する場合、表面球とする。
b)そうでない場合、内部球とする。
【0066】
2)SSを以下のように区分化する。
a)各球が集合MP内で有する隣接球の数によって、最小数の隣接球を有する球から、最大数の隣接球を有する球にSS内の球をソートする。
b)球を順番にループする。球が区画に割り当てられていない場合、SS内の球およびその隣接球を含む新たな区画を作成する。その区画を区画リストに追加する。
c)区画リストを、最小数の球を有する区画から、最大数の球を有する区画にソートする。
d)区画を順番にループする。区画PARTがMIN_PARTITION_SIZEよりも少ない球を有する場合、隣接区画を突き止めることが試みられる。すなわち、PART内の球に隣接する球を含む区画。隣接する区画が存在する場合、PARTを最小の隣接区画と合併させる。
【0067】
3)区画SSに使用されるのと同じアルゴリズムを使用してISを区分化する。
4)SSの区画の和集合の全ての取り得る集合を含む集合SSUNIONを以下のように構成する。
a)各和集合が、球の接続集合を含む。
b)各和集合が、最小でMIN_SURFACE_UNION_SIZEの球を含み、最大でMAX_SURFACE_UNION_SIZEの球を含む。
【0068】
5)SSUNION(SSの区画の和集合)の個々の要素と、0、1、またはそれ以上のIS区画との全ての取り得る和集合を以下のように構成する。
a)各和集合が、球の接続集合を含む。
b)各和集合が、最小でMIN_INTERIOR_UNION_SIZEの球を含み、最大でMAX_INTERIOR_UNION_SIZEの球を含む。
c)和集合内のSSからの球に対する和集合内のISからの球の比が、MAX_FRACTION_INTERIOR未満である。
d)和集合内に含まれるSSからの球が、SSUNION内の和集合の1つを形成する。
6)前のステップ内で構成された各和集合が「区分化ポケット体積」である。
【0069】
典型的な値の例
MAX_DISTANCE_TO_VDW=0.5オングストローム
MIN_PARTITION_SIZE=8
MIN_SURFACE_UNION_SIZE=10
MAX_SURFACE_UNION_SIZE=50
MIN_INTERIOR_UNION_SIZE=10
MAX_INTERIOR_UNION_SIZE=50
MAX_FRACTION_INTERIOR=0.5
【0070】
ポケットの決定後のプロセス
全てのポケットが求められると、それらを、特定の必要性、および所望の入力パラメータに基づいてソートし、評価することができる。ポケット体積およびポケット開口が特に興味深いものである。方法の使用者は、開口面積、包含体積、または面積と体積の何らかの組合せに有利なように評価に重み付けをすることができる。パラメータの重み付けは、方法の目的に応じて決めることができる。例えば、所望の蛋白質−蛋白質結合部位に関しては、より大きなポケット開口領域がより望ましい場合がある。小分子部位に関しては、ポケット開口面積比に対して大きな包含体積が望まれる場合がある。あるいは使用者が、主に包含体積に重み付けを置くことを望む場合がある。
【0071】
しばしば、シンプル・ポケット、またはほぼシンプル・ポケットであるポケット(スライス面以外の結合面からの追加面積がほとんどないポケット)を有することが望まれる。MAX_TUNNEL_BOTTOM、MAX_PARTIAL_LENGTH、およびTOTAL_PARTIAL_LENGTHを制御することによって、使用者は、シンプル・ポケットまたはほぼシンプル・ポケットであるポケットを好む場合がある。これらのパラメータは、ポケットを画定するために使用することができる追加の平面の量に制限を与える。上で識別された最大値がゼロである縮小ケースでは、シンプル・ポケットのみを求めることができる。
【0072】
したがって、本発明を使用して、蛋白質モデルなど大きな凸形および凹形変化を有する表面をもつ3D構造を含めた、任意のモデル化される不規則3D構造の断面スライスによって生成される包含体積およびポケット開口面積を評価することによって、3D構造内で凹形領域を求めることができる。より一般的には、本発明のシステムおよび方法を使用して、例えば、一般に生体分子を有する、一般に生体高分子を有する、特に蛋白質を有する他の構造の表面変化を評価することができる。
【0073】
ソフトウェアおよびハードウェア実施
本発明のシステムおよび方法は、コンピュータ、ワークステーション、サーバ、または1つまたは複数のCPUもしくは他のプロセッサを有する何らかの他のデバイスで動作し、かつそれらによって実行される、あるいは処理用のアプリケーション専用集積回路を有するデバイスで動作するソフトウェアとして、またはハードウェアとソフトウェアの組合せとして実施することができる。本明細書で説明した方法は、例えば、600MHzの従来のパーソナル・コンピュータで、蛋白質モデルに関して数時間で正常に実施することができ、より強力な処理機器ではより迅速に実施することができる。
【0074】
本発明のソフトウェア部分は、磁気媒体および光学媒体を含む任意の所望の格納媒体に格納することができる。そのような媒体は通常、プログラム・データが符号化された基板を有し、それにより適切なリーダと共に使用されるときに、コンピュータまたは計算システムが、符号化されたプログラム・データを読み取り、実行することができる。
【0075】
蛋白質ポケット評価の使用
どの蛋白質表面領域がリガンドが結合する可能性が最も高い部位であるかを定義することによって、後の合理的薬物設計を、本発明で説明した方法を使用することによって直接得ることができる。例えば、蛋白質表面の特定の領域をターゲット表面として使用することができ、Flexx、AutoDock、Dock、またはGoldといった知られているドッキング方法の任意のものを使用することによって、潜在結合親和性について分子を測定することができる。
【0076】
あるいは、蛋白質表面の特定の領域をターゲット表面として使用することができ、(1)蛋白質表面および潜在リガンドがそれぞれ立体形態に量子化され、(2)表面の立体量子化に対する分子の立体量子化の相補性に基づいてリガンドの潜在結合親和性がランク付けられる方法を使用することによって、潜在結合親和性について分子を測定することができる。そのような方法の詳細は、ウィントナー(Wintner)およびモアレミ(Moallemi):「Quantized Surface Complementarity Diversity(QSCD):A Model Based on Small Molecule−Target Complementarity」Journal of Medicinal Chemistry、2000年、43巻、1993〜2006ページに例示されており、その文献は参照により本明細書に組み込まれる。
【0077】
既存の化合物のマッピングおよび比較に加えて、QSCDも「可逆モデル」である。これは、詳細な3Dテンプレートに分子ライブラリを直接モデル化することによって、多様性空間内の未充填点を埋めることができることを意味する。1組の知られている試験化合物を使用して、モデルは、生物学的に関連し、同様のものとして知られている活動を一貫してスコアリングすることが示されている。すなわち、同様のものとして、または同様でないものとして知られている化合物の比較が、多様性に関してそれぞれハイおよびローをスコアする。このモデルはさらに、知られているリガンドが結合する蛋白質表面の一般的な形状および機能を予測することができる能力によって確証されている。最後に、このモデルは、3D形状および機能の類似性によって、知られている蛋白質モチーフを特徴付ける機会を提供する。
【0078】
QSCDは、分子構造を取り、立体配座を作成する。これらの立体配座は、本質的に、各立体配座を表すために小さなブロックを使用することによって量子化される。これらの量子化された立体配座は、全ての理論的なターゲット表面に対して比較され、スコアされる。
【0079】
ポケット体積および開口面積を使用し、量子化されたリガンドと比較して、ポケットに結合しそうなリガンドを求めることができる。
リガンドの潜在結合親和性が、上で列挙した方法の1つを使用してランク付けられた後、そのようにランク付けられたリガンドを合成して、結合検定で、対象の蛋白質に対する実際の結合親和性に対して試験することができる。例示的なスクリーニング方法は、国際特許出願国際公開公報WO99/35109号に記載されており、その出願は参照により本明細書に組み込まれる。
【0080】
(実施例)
上述した方法を、既知のリガンド、すなわちHIV−1プロテーゼ、熱ショック蛋白質−90、ストロメリシン、およびジヒドロ葉酸レダクターゼを有する4つの蛋白質結晶構造を用いて、原理的研究の証明に使用した。各蛋白質に関して、蛋白質の3D原子表面を計算し、次いで、潜在リガンド・ポケットを画定するために本発明の方法を使用して平面でスライスした。フィルタに使用するパラメータは、使用される典型的な値として上に列挙した典型的なパラメータである。全ての潜在リガンド・ポケットを、包含ポケット体積に従ってソートした。
【0081】
実際のリガンド・ポケットを、X線構造によって求めた(図6〜9)。4つのケース全てにおいて、本発明の方法によって計算される最大体積のポケットが、それぞれHIV−1プロテーゼ、熱ショック蛋白質−90、ストロメリシン、およびジヒドロ葉酸レダクターゼを表す図6〜9に示されるように、実際上、実際のリガンド・ポケットに合致した。この図では、図6がトンネル・ポケットであり、図7〜9が部分ポケットである。
【0082】
したがって、これらの実験は、本発明の方法が、蛋白質表面の複数の領域のリガンド結合可能性を評価するための計算ツールとして有用であることを示す。
特許請求の範囲の範囲から逸脱することなく、さらなる修正を施し、さらなる特徴を追加または提供することができる。
【図面の簡単な説明】
【図1A】
蛋白質の分子モデルの一例である。
【図1B】
図1Aに示される蛋白質の原子表面の3次元表示を示す。
【図2A】
スライスによって境界を画された蛋白質モデル内のポケットの斜視図である。
【図2B】
以前の方法によって求められた、3次元境界を有するポケットの斜視図である。
【図3A】
潜在蛋白質ポケットを定義するために取られた平面スライスを有する蛋白質モデルの3次元図面である。
【図3B】
図3Aにおける平面スライスによって作成され、シンプル・ポケットを表すポケットを示す斜視図である。
【図4A】
潜在蛋白質ポケットを定義するために取られた平面スライスを有する蛋白質モデルの3次元図面である。
【図4B】
図4Aにおける平面スライスによって作成され、部分ポケットを表すポケットを示す斜視図である。
【図5A】
潜在蛋白質ポケットを定義するために取られた平面スライスを有する蛋白質モデルの3次元図面である。
【図5B】
図5Aにおける平面スライスによって作成され、トンネル・ポケットを表すポケットを示す斜視図である。
【図6】
本発明に従って求められた最大体積のポケットと、X線構造によって求められた実際のリガンド・ポケットとを示す3Dモデルであって、それにより本発明の方法が潜在リガンド・ポケットを決定するのに効果的である場合があることを実証する3Dモデルを示す図である。図6の蛋白質は、HIV−1プロテーゼである。
【図7】
本発明に従って求められた最大体積のポケットと、X線構造によって求められた実際のリガンド・ポケットとを示す3Dモデルであって、それにより本発明の方法が潜在リガンド・ポケットを決定するのに効果的である場合があることを実証する3Dモデルを示す図である。図7の蛋白質は、熱ショック蛋白質90である。
【図8】
本発明に従って求められた最大体積のポケットと、X線構造によって求められた実際のリガンド・ポケットとを示す3Dモデルであって、それにより本発明の方法が潜在リガンド・ポケットを決定するのに効果的である場合があることを実証する3Dモデルを示す図である。図8の蛋白質は、ストロメリシンである。
【図9】
本発明に従って求められた最大体積のポケットと、X線構造によって求められた実際のリガンド・ポケットとを示す3Dモデルであって、それにより本発明の方法が潜在リガンド・ポケットを決定するのに効果的である場合があることを実証する3Dモデルを示す図である。図9の蛋白質は、ジヒドロ葉酸レダクターゼである。
【図10】
平面によってスライスされた蛋白質表面の図である。
【図11】
スライスがモデル三角形を通過するときのスライス・プロセスのステップを示す図である。
【図12】
スライスがモデル三角形を通過するときのスライス・プロセスのステップを示す図である。
【図13】
スライスを有する蛋白質の3Dモデルと、スライスによって作成された2つの構成要素の外径の射影とを示す図である。
【図14】
スライスから得られる構成要素の一例を示す図である。
【図15】
スライスを有する蛋白質と、断面および外側境界の計算を示す図である。
【図16】
蛋白質を介するスライスによって断面の外側境界を求める例を示す図である。
【図17】
図16の例での外径境界からの部分開口を示す図である。
【図18】
特定の縁部の決定を示す図である。
【図19】
モデルを通るいくつかの平面スライスを示す図である。
Claims (23)
- いくつかの平面スライスと表面を交差させること(図19)と、
少なくとも2つのスライスについて、表面とスライスとの交点(14)に基づいてパラメータを決定すること(図2A)と、
前記少なくとも2つの決定を使用して、表面の好ましい凹形領域を求めることとによって、
不規則コンピュータ・モデル表面上の凹形領域を求めること(図1B)から成る、コンピュータにより実施される方法。 - 少なくとも1つのスライスについて、表面とスライスのみによって境界を画された閉じた体積を求めること(図3B)をさらに含む請求項1に記載の方法。
- 少なくとも1つのスライスについて、表面と、スライスと、スライスに垂直な1つまたは複数の平面(20,22)とによって境界を画された閉じた体積を求めること(図4B)をさらに含む請求項1または2に記載の方法。
- 少なくとも1つのスライスについて、表面と、スライスと、スライスに平行な平面(24)とによって境界を画された閉じた体積を求めること(図5B)をさらに含む請求項1、2、または3に記載の方法。
- 表面が、DNA分子またはRNA分子の計算された表面である請求項1に記載の方法。
- 表面上の凹形領域が、表面とスライスによって包囲される体積に従ってランク付けられている請求項1〜5のいずれかに記載の方法。
- 所与の表面上の凹形領域が、表面とスライスの交点によって作成されるポケット開口面積に従ってランク付けられている請求項1〜6のいずれかに記載の方法。
- 表面が、蛋白質の計算された表面(図6〜9)である請求項1、2、3、4、6、または7のいずれかに記載の方法。
- スライスによって交差される表面の一部分を使用して、該表面の一部分での結合親和性を測定することをさらに含む請求項5または8に記載の方法。
- 表面およびスライスによってのみ境界を画されたポケットと、表面、スライス、およびスライスに平行な平面によって境界を画されたポケットと、表面、スライス、およびスライスに垂直な1つまたは複数の平面によって境界を画されたポケットとを含む蛋白質ポケットを決定することをさらに含む請求項8に記載の方法。
- 表面および任意の垂直な平面によって境界を画されたスライスの面積、および/または表面、スライス、および追加の垂直または平行な平面によって閉じ込められた体積に従ってポケットをランク付けることをさらに含む請求項10に記載の方法。
- 重複するポケットの少なくともいくつかについて、小分子が結合するのに利用可能な総体積および表面積を求めることをさらに含む請求項8に記載の方法。
- 少なくともいくつかのポケットについて、前記ポケット、またはポケットの少なくともいくつかの集約体を、蛋白質に結合する小分子によって占有することができる個別の体積および表面積に区分化することをさらに含む請求項8に記載の方法。
- 結合親和性を測定することが、凹形領域および潜在リガンドを量子化することと、それらの間の相補性をランク付けることを含む請求項9に記載の方法。
- 前記決定を使用して、表面の好ましいリガンド親和性領域を求めることをさらに含む請求項1〜14のいずれかに記載の方法。
- 前記リガンド親和性領域に適合されたリガンドを設計するために、前記リガンド親和性領域のサイズおよび形状が使用される請求項15に記載の方法。
- 所望の親和性領域への潜在結合親和性を測定するためにドッキング方法を使用することをさらに含む請求項15に記載の方法。
- スライスおよび表面によって包囲される体積が各スライスについて求められる請求項15〜17のいずれかに記載の方法。
- スライスと表面との交差の面積が各スライスについて求められる請求項15〜18のいずれかに記載の方法。
- リガンド親和性領域および潜在リガンドを立体形態に量子化し、潜在リガンドに対する親和性領域の立体量子化の相補性に基づいて潜在結合親和性をランク付けることを含む請求項15〜19のいずれかに記載の方法。
- 3次元コンピュータ表面を表示するための計算システムと、ならびに、いくつかの平面スライスと表面を交差させ、少なくとも2つのスライスについて、表面とスライスの交点に基づいてパラメータを決定し、前記決定を使用して、表面の好ましい凹形領域を求めることによって、表面上の凹形領域を求めるソフトウェアとを備えたシステム。
- 表面の好ましいリガンド親和性領域を求めるために使用される請求項21に記載のシステム。
- リガンド親和性領域および潜在リガンドを立体形態に量子化し、潜在リガンドへの親和性領域の立体量子化の相補性に基づいて潜在結合親和性をランク付けるためにさらに使用される請求項21に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US21233200P | 2000-06-16 | 2000-06-16 | |
PCT/US2001/019370 WO2001098457A2 (en) | 2000-06-16 | 2001-06-15 | Surface model of a protein |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004527726A true JP2004527726A (ja) | 2004-09-09 |
Family
ID=22790554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002504606A Pending JP2004527726A (ja) | 2000-06-16 | 2001-06-15 | 蛋白質中のポケットを評価するためのシステムおよび方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20020015038A1 (ja) |
EP (1) | EP1307536A2 (ja) |
JP (1) | JP2004527726A (ja) |
AU (1) | AU2001268506A1 (ja) |
CA (1) | CA2410519A1 (ja) |
WO (1) | WO2001098457A2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPS039702A0 (en) * | 2002-02-08 | 2002-03-07 | University Of Queensland, The | Common protein surface shapes and uses therefor |
AU2003202324B2 (en) * | 2002-02-08 | 2008-05-08 | The University Of Queensland | Common protein surface shapes and uses therefor |
US20060031020A1 (en) * | 2004-08-09 | 2006-02-09 | Yang Jenny J | Computational approach for constructing an analyte binding motif |
US20060029942A1 (en) * | 2004-08-09 | 2006-02-09 | Yang Jenny J | Grafting method for constructing an analyte binding motif |
WO2007011748A2 (en) * | 2005-07-14 | 2007-01-25 | Molsoft, Llc | Structured documents for displaying and interaction with three dimensional objects |
JP5377965B2 (ja) | 2005-09-09 | 2013-12-25 | ジョージア ステート ユニバーシティ リサーチ ファウンデーション、インコーポレイテッド | 標的化された造影剤および造影剤を標的化するための方法 |
WO2008019123A2 (en) | 2006-08-04 | 2008-02-14 | Georgia State University Research Foundation, Inc. | Enzyme sensors, methods for preparing and using such sensors, and methods of detecting protease activity |
CA2671431C (en) | 2006-12-14 | 2019-03-26 | Georgia State University Research Foundation, Inc. | Analyte sensors, methods for preparing and using such sensors, and methods of detecting analyte activity |
US20110097742A1 (en) * | 2008-04-02 | 2011-04-28 | Jenny Jie Yang | Contrast agents, methods for preparing contrast agents, and methods of imaging |
WO2016154220A1 (en) * | 2015-03-23 | 2016-09-29 | New York University | Systems and methods of fragment-centric topographical mapping (fctm) to target protein-protein interactions |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4984157A (en) * | 1988-09-21 | 1991-01-08 | General Electric Company | System and method for displaying oblique planar cross sections of a solid body using tri-linear interpolation to determine pixel position dataes |
CA2369570A1 (en) * | 1999-04-02 | 2000-10-12 | Neogenesis, Inc. | Analyzing molecule and protein diversity |
-
2001
- 2001-06-15 AU AU2001268506A patent/AU2001268506A1/en not_active Abandoned
- 2001-06-15 US US09/882,606 patent/US20020015038A1/en not_active Abandoned
- 2001-06-15 EP EP01946455A patent/EP1307536A2/en not_active Withdrawn
- 2001-06-15 CA CA002410519A patent/CA2410519A1/en not_active Abandoned
- 2001-06-15 WO PCT/US2001/019370 patent/WO2001098457A2/en not_active Application Discontinuation
- 2001-06-15 JP JP2002504606A patent/JP2004527726A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2001268506A1 (en) | 2002-01-02 |
WO2001098457A3 (en) | 2003-02-27 |
CA2410519A1 (en) | 2001-12-27 |
US20020015038A1 (en) | 2002-02-07 |
WO2001098457A2 (en) | 2001-12-27 |
EP1307536A2 (en) | 2003-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6975140B2 (ja) | 畳み込みネットワークを空間データに適用するためのシステム及び方法 | |
Wriggers et al. | Using Situs for the registration of protein structures with low-resolution bead models from X-ray solution scattering | |
Poupon | Voronoi and Voronoi-related tessellations in studies of protein structure and interaction | |
Sanner et al. | Reduced surface: an efficient way to compute molecular surfaces | |
Cai et al. | Protein–ligand recognition using spherical harmonic molecular surfaces: towards a fast and efficient filter for large virtual throughput screening | |
US7679615B2 (en) | Calculating three-dimensional (3D) Voronoi diagrams | |
Xia et al. | Persistent topology for cryo‐EM data analysis | |
CA2580443A1 (en) | Systems and methods for generating and measuring surface lines on mesh surfaces and volume objects and mesh cutting techniques ("curved measurement") | |
JP2004527726A (ja) | 蛋白質中のポケットを評価するためのシステムおよび方法 | |
Gerstein et al. | Protein geometry: volumes, areas and distances | |
Lindow et al. | Ligand excluded surface: A new type of molecular surface | |
Cho et al. | Topology representation for the Voronoi diagram of 3D spheres | |
Lee et al. | Molecular recognition. I. Automatic identification of topographic surface features | |
Kim et al. | Pocket extraction on proteins via the Voronoi diagram of spheres | |
Kim et al. | Recognition of docking sites on a protein using β-shape based on Voronoi diagram of atoms | |
Yuan | Combined 3D thinning and greedy algorithm to approximate realistic particles with corrected mechanical properties | |
US8000536B2 (en) | Determining and using geometric feature data | |
Lewis | [8] Clefts and binding sites in protein receptors | |
Nærland | Geometry decomposition algorithms for the Nitsche method on unfitted geometries | |
Daberdaku | Identification of protein pockets and cavities by Euclidean Distance Transform | |
Jund et al. | Particle-based forecast mechanism for continuous collision detection in deformable environments | |
Giard et al. | Fast and accurate travel depth estimation for protein active site prediction | |
Simões | Geometric Algorithms for Cavity Detection on Protein Surfaces | |
Cai et al. | Protein-ligand recognition using spherical harmonic molecular surfaces: towards a fast and efficient filter for large virtual throughput screening | |
Wolters | Geometric modeling applications in rational drug design: a survey |