JP2005531850A - 自己組織化による配座サンプリング - Google Patents
自己組織化による配座サンプリング Download PDFInfo
- Publication number
- JP2005531850A JP2005531850A JP2004517772A JP2004517772A JP2005531850A JP 2005531850 A JP2005531850 A JP 2005531850A JP 2004517772 A JP2004517772 A JP 2004517772A JP 2004517772 A JP2004517772 A JP 2004517772A JP 2005531850 A JP2005531850 A JP 2005531850A
- Authority
- JP
- Japan
- Prior art keywords
- atomic
- constraint
- distance
- spe
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005070 sampling Methods 0.000 title description 11
- 238000000034 method Methods 0.000 claims abstract description 51
- 238000004590 computer program Methods 0.000 abstract description 17
- 102100030852 Run domain Beclin-1-interacting and cysteine-rich domain-containing protein Human genes 0.000 description 18
- 101710179516 Run domain Beclin-1-interacting and cysteine-rich domain-containing protein Proteins 0.000 description 18
- 230000006870 function Effects 0.000 description 14
- YLMAHDNUQAMNNX-UHFFFAOYSA-N imatinib methanesulfonate Chemical compound CS(O)(=O)=O.C1CN(C)CCN1CC1=CC=C(C(=O)NC=2C=C(NC=3N=C(C=CN=3)C=3C=NC=CC=3)C(C)=CC=2)C=C1 YLMAHDNUQAMNNX-UHFFFAOYSA-N 0.000 description 11
- 239000005517 L01XE01 - Imatinib Substances 0.000 description 10
- 238000004891 communication Methods 0.000 description 10
- 229940080856 gleevec Drugs 0.000 description 10
- GZUITABIAKMVPG-UHFFFAOYSA-N raloxifene Chemical compound C1=CC(O)=CC=C1C1=C(C(=O)C=2C=CC(OCCN3CCCCC3)=CC=2)C2=CC=C(O)C=C2S1 GZUITABIAKMVPG-UHFFFAOYSA-N 0.000 description 10
- 229960004622 raloxifene Drugs 0.000 description 10
- YFGBQHOOROIVKG-FKBYEOEOSA-N Met-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 YFGBQHOOROIVKG-FKBYEOEOSA-N 0.000 description 9
- SUAZRRTWDATHDK-UHFFFAOYSA-N cycloheptadecane Chemical compound C1CCCCCCCCCCCCCCCC1 SUAZRRTWDATHDK-UHFFFAOYSA-N 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N adamantane Chemical compound C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000012458 free base Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- XMWRBQBLMFGWIX-UHFFFAOYSA-N C60 fullerene Chemical compound C12=C3C(C4=C56)=C7C8=C5C5=C9C%10=C6C6=C4C1=C1C4=C6C6=C%10C%10=C9C9=C%11C5=C8C5=C8C7=C3C3=C7C2=C1C1=C2C4=C6C4=C%10C6=C9C9=C%11C5=C5C8=C3C3=C7C1=C1C2=C4C6=C2C9=C5C3=C12 XMWRBQBLMFGWIX-UHFFFAOYSA-N 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 229910003472 fullerene Inorganic materials 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 150000008574 D-amino acids Chemical class 0.000 description 1
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 1
- 239000000370 acceptor Substances 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229960003685 imatinib mesylate Drugs 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005182 potential energy surface Methods 0.000 description 1
- 238000000455 protein structure prediction Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
Abstract
距離および/または体積の制約群と一致する分子配座を生成するための自己組織化方法、システム、およびコンピュータプログラム製品。確率的近接埋め込み(stochastic proximity embedding)(SPE)アルゴリズムは、個々の距離および/または体積の制約を評価して、そのような制約の違反を最小化するように原子配位を調整する。方法は、原子の数に線形的に対応し、従来の距離幾何形状アルゴリズムによって必要とされている時間の数分の1の時間ではるかに多くの独自の配座を生成する。
Description
本発明は、分子配座の生成を対象とし、より詳細には、距離および体積の制約から分子配座を生成するための方法、システム、およびコンピュータプログラム製品を対象とする。
分子の低エネルギー配座を検出するための一般的で高速かつ信頼性の高い方法を見つけることは、計算化学の最大の課題の1つである。参照により全体として本明細書に組み込まれている非特許文献1を参照されたい。
この問題を解決するには、ポテンシャルエネルギー面の最低値を検出する方法が必要となる。これは通常、適切な開始幾何形状を生成して、それらを最近接の局所エネルギー最小値に最小化することによって行われる。この検索は、デカルト空間(Cartesian space)、ねじれ空間(torsion space)、または距離空間(distance space)において実行することができる。
デカルト空間検索方法の説明については、全体として参照により本明細書に組み込まれている非特許文献2および非特許文献3を参照されたい。
ねじれ空間検索方法の説明については、全体として参照により本明細書に組み込まれている非特許文献4および非特許文献5を参照されたい。
距離空間検索方法の説明については、全体として参照により本明細書に組み込まれている非特許文献6および非特許文献7を参照されたい。
後者の方法は、距離幾何形状(DG)と呼ばれ、共有結合の制約を用いて原子間距離の上界群および下界群を確立し、これらの境界と一致する配座の生成を試みる。DGは、配座解析(全体として参照により本明細書に組み込まれている非特許文献7および非特許文献8を参照)、NMR構造決定(全体として参照により本明細書に組み込まれている非特許文献9、非特許文献10および非特許文献11を参照)、タンパク質構造予測(全体として参照により本明細書に組み込まれている非特許文献12を参照)、およびリガンド連結(全体として参照により本明細書に組み込まれている非特許文献13を参照)を始めとする、広範な問題への適用に成功してきた。
DGには次の4つの基本ステップが含まれる。1)原子間距離境界を生成する、2)それぞれの境界範囲内の各距離にランダム値を代入する、3)その結果得られた距離行列をデカルト座標の開始群に変換する、および4)距離制約違反を最小化することにより座標を精密化する。適切な配座が確実に生成されるように、元の上界および下界は通常、反復三角平滑化手順を使用して精密化される。このプロセスは、初期の推測を改善するが、無作為に選択された距離は依然として有効な3次元幾何形状と一致しない場合もあり、誤差精密化に先立って、高価な距離化方式(metrization scheme)(全体として参照により本明細書に組み込まれている非特許文献11および非特許文献14、15を参照)、またはより高次元の埋め込み(embedding)(全体として参照により本明細書に組み込まれている非特許文献7を参照)を必要とする。
A. R. Leach, "Reviews in Computational Chemistry," Vol. 2 (Eds.: K. B. Lipkowitz, D. B. Boyd), VCH, New York, 1991
D. M. Ferguson and D. J. Raber, J. Am. Chem. Soc. 1989, 111, 4371,
M. Saunders, J. Am. Chem. Soc. 1987, 109, 3150
W. L. Jorgensen and J. Tirado-Rives, J. Phys. Chem. 1996, 100, 14508
G. Chang, W. C. Guida and W. C. Still, J. Am. Chem. Soc. 1989, 111, 4379
G. M. Crippen and T. F. Havel, "Distance Geometry and Molecular Conformation," Research Studies Press, Somerset, UK, 1988
D. C. Spellmeyer, et al., J. Mol. Graphics Modell. 1997, 15, 18
B. P. Feuston, et al., J. Chem. Inf. Comput. Sci., 2001, 41, 754
T. F. Havel and K. Wuthrich, J. Mol. Biol. 1985, 182, 281
C. Mumenthaler and W. Braun, J. Mol. Biol. 1995, 254, 465
J. Kuszewski, et al., Journal of Biomolecular NMR 1992, 2, 33
E. S. Huang and R. Samudrala, J. W. Ponder, Protein Sci. 1998, 7, 1998
E. C. Meng, et al., Proteins: Struct Funct. Gene. 1993, 17, 266
T. F. Havel and M. E. Snow, J. Mol. Biol. 1991, 217, 1
T. F. Havel and K. Wuthrich, Bull. Math. Biol. 1984, 46, 673
T. A. Halgren, J. Comput. Chem. 1996, 17, 616
T. A. Halgren, J. Comput. Chem. 1996, 17, 490
T. A. Halgren, J. Comput. Chem. 1996, 17, 520
T. A. Halgren, J. Comput. Chem. 1996, 17, 553
T. A. Halgren and R. B. Nachbar, J. Comput. Chem. 1996, 17, 587
必要とされているのは、従来の方法の限界を克服する低エネルギーの分子配座を生成するための方法、システム、およびコンピュータプログラム製品である。
本発明は、分子配座を生成するための方法、システム、およびコンピュータプログラム製品を対象としている。より詳細には、本発明は、原子間距離および体積の制約から分子配座を生成するための方法、システム、およびコンピュータプログラム製品を対象としている。
本発明によれば、確率的近接埋め込み(stochastic proximity embedding)(SPE)アルゴリズムは分子、分子の断片、あるいは分子または分子断片の結合を構成する原子群における距離および体積の制約の違反を評価して最小化する。原子は、実在のもの、または抽象化されたもの(ダミー原子、環状重心、水素結合ドナーまたは受容体のような官能基など)であってもよい。
方法は以下のステップを含んでいる。
(1)座標図(coordinate map)に原子群を配置するステップ、
(2)原子群から原子部分群を選択するステップで、原子部分群が部分群内の原子間の少なくとも1つの関連付けられた制約を含むステップ、
(3)少なくとも1つの関連付けられた制約が違反された場合に、少なくとも1つの関連付けられた制約に基づく図上の選択された原子部分群から、少なくとも1つの原子の少なくとも1つの座標を修正するステップ、
(4)原子群からの追加の原子部分群に対してステップ(2)および(3)を繰り返すステップ、
(5)原子群の配座を出力するステップ。
(1)座標図(coordinate map)に原子群を配置するステップ、
(2)原子群から原子部分群を選択するステップで、原子部分群が部分群内の原子間の少なくとも1つの関連付けられた制約を含むステップ、
(3)少なくとも1つの関連付けられた制約が違反された場合に、少なくとも1つの関連付けられた制約に基づく図上の選択された原子部分群から、少なくとも1つの原子の少なくとも1つの座標を修正するステップ、
(4)原子群からの追加の原子部分群に対してステップ(2)および(3)を繰り返すステップ、
(5)原子群の配座を出力するステップ。
本発明の他の特徴および利点については、以下で詳しく説明される。本発明のさらに多くの利点および特徴は、本明細書に示す説明を読めば当業者には明らかとなり、あるいはまた本発明の実施により理解されるであろう。本発明の利点は、詳細な説明とその請求の範囲および添付の図において具体的に指摘されている構造によって実現され達成されよう。
前述の要約および以下の詳細な説明は共に模範的かつ説明的なものであり、請求項に係る本発明についてさらに詳細に説明することを意図している。
本発明は、添付の図を参照して説明される。ここで、同様の参照番号は、同一または機能的に類似した要素を示している。さらに、参照番号の左端の数字は、関連付けられた要素が最初に紹介されている図を識別する。
本発明は、分子配座を生成するための方法、システム、およびコンピュータプログラム製品を対象としている。具体的には、本発明は、原子間距離および体積の制約から分子配座を生成するための方法、システム、およびコンピュータプログラム製品を対象としている。
分子配座は、外観の制約群を満たす必要がある。接続および共有結合の長さおよび角度では、任意のペアの原子iおよびjの間の距離dijが特定の境界lij≦dij≦uijの範囲内に入る必要がある。NOE測定などの実験データおよびリガンド−タンパク質複合体における接触対(contact pair)のような状況による化学的直観は、さらに距離の制約を与える。これらは通常、4つの原子i、j、k、lによって形成される符号付き体積Vijklが所定の限界を超えないように防ぐ体積の制約群によって捕捉されている。体積の制約は、共役システムの平面性(planarity)を強化し、立体中心のカイラリティ(chirality)を修正するために用いられる。距離および体積の制約は、分子に利用可能な配座の数および配座サンプリングで考慮されるべき検索空間を大幅に減少させる。
本発明によれば、距離および体積の制約の違反は、以下の誤差関数によって評価される。
第1の和は、距離の制約の違反を示す。ここで、
dij>uijの場合、
dij>uijの場合、
であれば
、それ以外の場合はf(dij,lij,uij)=0である。
第2の和は、体積の制約の違反を示す。ここで、
の場合、
であれば
、それ以外の場合は
である。αは、距離および体積の違反からの合計誤差に対して寄与の平衡を取るために使用される倍率である。規定では、α=0に設定する。原子配位に関して誤差関数Sを最小化することにより、距離および体積の制約を満たす配座が生成される。距離および/または体積の制約に不整合があることもあるため、Sを0に最小化することは不可能である場合が多い。
距離の違反Sdを最小化するための自己組織化方法については、2003年6月12日に米国受理官庁に提出された、「METHODS、SYSTEMS、AND COMPUTER PROGRAM PRODUCTS FOR REPRESENTING OBJECT RELATIONSHIPS IN A MULTIDIMENSIONAL SPACE」という名称の同時係属PCT出願番号(未指定―代理人整理番号1503.148PC01)において説明され請求の範囲に記載されている。本明細書において確率的近接埋め込み(stochastic proximity embedding)(SPE)と呼ばれる方法は、無作為な点(原子)の対を繰り返し選択し、それらの点の位置を、個々の誤差関数f(dij、lij、uij)を最小化する方向へ移動する。SPEは、すべての距離誤差関数Sdを迅速かつ高い信頼性で最小化することが示されている。
この方法は、以下の理由から成功すると推測される。すべての距離の制約を同時に満たすことができると仮定する。その場合、Sdの全体の最小値はmin(Sd)=0であり、これはすべて個別にf(dij、lij、uij)=0である場合にのみ達成される。このようにして、無作為な個別のf(dij、lij、uij)を繰り返しその最小に近づけることで、結果としてSdの全体の最小値が得られる。連続性の理由で、アルゴリズムは、距離の制約が非常にわずかな不一致を示すために同時に満たすことができない場合であっても機能する。
本発明によれば、SPEは、すべての誤差関数Sを最小化するように適用される。体積誤差関数Svは個々の寄与の合計も含んでいるので、制約が一致して同時に満たすことができるのであれば、すべて個々に
である場合、最小値min(Sv)に達する。個々の
は、それぞれ4つの原子を伴っている。Sdを最小化する前述の手順と同様に、体積の制約kを無作為に選択し、含まれている4つの原子の位置を、個々の誤差
を最小化する方向へ移動する。以下で、図4に示されている本発明を実施する方法例について説明する。
1.(ステップ402)適切な大きさのボックスに原子を無作為に配置する(たとえば、原子配位を初期化する)。
2.(ステップ404)距離学習率λd、体積学習率λv、距離および体積の制約を実施するための相対度数vを選択する。
3.(ステップ406)確率vの場合、ステップ(408)を実行する。それ以外の場合はステップ(410)を実行する。
4.(ステップ408)原子iおよびjの対を無作為に選択して、その距離dij=‖xi―xj‖を計算する。lij≦dij≦uijである場合、原子位置は変更しない。それ以外の場合は、座標xiおよびxjを
1.(ステップ402)適切な大きさのボックスに原子を無作為に配置する(たとえば、原子配位を初期化する)。
2.(ステップ404)距離学習率λd、体積学習率λv、距離および体積の制約を実施するための相対度数vを選択する。
3.(ステップ406)確率vの場合、ステップ(408)を実行する。それ以外の場合はステップ(410)を実行する。
4.(ステップ408)原子iおよびjの対を無作為に選択して、その距離dij=‖xi―xj‖を計算する。lij≦dij≦uijである場合、原子位置は変更しない。それ以外の場合は、座標xiおよびxjを
および
によって更新する。
ここで、tijはdijにの最も近い結合(つまりdij<lijの場合tij=lij、あるいはdij>uijの場合tij=uij)、εはゼロ除算を避けるために使用される小さい数である。
5.(ステップ410)体積の制約k、および関与する4つの原子p、q、s、tを無作為に選択する。4つの原子によって形成される符号付き体積Vpqstを計算する。
ここで、tijはdijにの最も近い結合(つまりdij<lijの場合tij=lij、あるいはdij>uijの場合tij=uij)、εはゼロ除算を避けるために使用される小さい数である。
5.(ステップ410)体積の制約k、および関与する4つの原子p、q、s、tを無作為に選択する。4つの原子によって形成される符号付き体積Vpqstを計算する。
である場合、原子位置は変更しない。それ以外の場合は、原子位置gμ=▽μVpqstに関して符号付き体積の勾配を計算し(μ=p,q,s,t)、原子配位を以下の式により更新する。
ここで
に最も近い結合である。つまり、
の場合
の場合
である。
6.(ステップ412)ステップ(406)からステップ(410)を所定のステップ数Sだけ繰り返す。
7.(ステップ414)学習率λdおよびλvを所定の減分δλdおよびδλvだけ減らす。
8.(ステップ418)ステップ(406)からステップ(414)を所定のサイクル数Cだけ繰り返す。
6.(ステップ412)ステップ(406)からステップ(410)を所定のステップ数Sだけ繰り返す。
7.(ステップ414)学習率λdおよびλvを所定の減分δλdおよびδλvだけ減らす。
8.(ステップ418)ステップ(406)からステップ(414)を所定のサイクル数Cだけ繰り返す。
方法の適切なパラメータ群は、λd=λv=1.0、C=50、δλd=δλv=0.9/C、S=50×N、および
である。ここでNは分子内の原子の数、‖V‖は体積の制約の合計数である。代替のパラメータも使用することができる。
剛体分子に適用される場合、本方法は常に正しい配座を見い出す。たとえば、図1Aから図1Cは、SPEによって生成される剛体分子の典型的な配座を示している。より詳細には、図1Aは、アダマンタン分子の典型的な配座を示す図である。図1Bは、アデニン分子の典型的な配座を示している。図1Cは、フラーレン分子の典型的な配座を示している。
SPEは、良好な配座の生成に成功する。これは、距離行列の冗長性および原子純化(atomic refinement)の協調的特性を利用するためである。つまり、1組の原子をその距離の制約を満たす方向へ移動することが、同時にこれらの原子に関与する他の多くの距離を改善するからである。
柔軟分子(flexible molecule)の場合、全体の最小値は通常不明である。しかし、本発明には、他の方法との比較により評価することができるという利点がある。たとえば、4つの既知の分子シクロヘプタデカン(cycloheptadecane)、ラロキシフェン(raloxifene)、グリベック(Gleevec)(商標)(メシル酸イマチニブ)の遊離塩基、および[Met5]−エンケファリン(enkephalin)(配列YGGFM)が検査され、SPEによって生成された配座が、広く用いられているRUBICON DGプログラム(Daylight Chemical Information Systems、www.daylight.com)によって生成された配座と比較された。統計的な有意性を保証するため、同一の規則群を使用して各プログラムにより10,000の異なる配座が生成された。RUBICONは多数の制約違反のある配座を拒否するので、ラロキシフェンについては8086の配座、グリベック(商標)については9669の配座、[Met5]−エンケファリンについては8034の配座しか生成しなかった。[Met5]−エンケファリンの各配座におけるD−アミノ酸のカイラリティが検査され、いずれの方法でも違反は見つけられなかった。
比較は、初期配座を生成する速度、エネルギー的に起こりやすい配座の範囲、異なる配座の発見率、および全検索中に得られた最低エネルギー、という複数の基準に基づいて行われた。DGによって得られた幾何形状は、エネルギー標準によってはかなり粗の状態(crude)であるため、2つの方法により生成された配座は、比較に先立ってMerck Molecular Force Field(MMFF94)を使用して局所的に最小化された。(全体として参照により本明細書に組み込まれている非特許文献16、17、18、19、および20を参照)。
方法は、高速でなければならず、固有の低エネルギー構造に最小化する配座をより多く生成する必要があり、しかも迅速に全体の最小値を識別する必要がある。SPEの利点について、表1および図2Aから図2Dを参照して以下で説明する。
図6の表1は、指定された方法(method)(SPEまたはRUBICON)によって1つの配座を生成するために必要な生のCPU時間tmethod、10、000回の試行内で発見された異なる配座の数
、およびその方法により見つけ出された分子ごとの最低エネルギー最小値
を示している。tmethodは、合計CPU時間を試行配座の数で除算することによって計算され、エネルギー最小化を含まない。2つの配座は、局所エネルギー最小化の後に0.05Åを超えるRMSDの相違がみられる場合に、異なっていると見なされた。
図2Aから図2Dは、SPEとRUBICONとのサンプリング効率の比較を示している。詳細には、図2Aは、シクロヘプタデカンに対するSPEおよびRUBICONとのサンプリング効率の比較を示す図である。図2Bは、ラロキシフェンに対するSPEおよびRUBICONの間のサンプリング効率の比較を示している。図2Cは、グリベック(商標)に対するSPEおよびRUBICONとのサンプリング効率の比較を示している。図2Dは、[Met5]−エンケファリンに対するSPEおよびRUBICONの間のサンプリング効率の比較を示している。
図2Aから図2Dにおいて、各グラフの左縦座標にエネルギー値が表示され、実線は多数の試行後に2つの方法によって見つけ出された最小および最大エネルギー(EminおよびEmax)を示している(太線はSPE、細線はRUBICON)。棒グラフでは、各グラフの右縦座標に数が表示され、多数の試行の後にそれぞれの方法によって見つけ出された異なる配座の数NC(左側がSPE、右側がRUBICON)を示している。通常はエネルギー的に生じ易い配座のみが化学的な関心の対象となるため、最小化されたエネルギーが全体の最小値から10.0kal・mol−1の範囲内の配座のみが含まれている。各棒グラフはさらに、全体の最小値から10.0kcal・mol−1以上まで0.5kcal・mol−1の非並行エネルギー間隔を表す20のセグメントに分割され、その対応するエネルギー値は各グラフの右側のカラー図によって示される。各セグメントの長さは、最小化されたエネルギーが対応するエネルギー間隔の範囲内に入る別個の配座の数を示している。
表1および図2Aから図2Dにおいて示されているように、SPEはあらゆる点においてRUBICONよりも優れている。実際に、SPEは生の配座の生成において最大1桁も高速であり、図2Aから図2Dの4つの場合すべてにおいて、一貫してより多くの異なる配座に最小化を行った(2つの配座は、対応する最小化構造が0.05Åを超えるRMSDの相違がみられる場合に異なっていると見なされた)。ラロキシフェン、グリベック(商標)、および[Met5]−エンケファリンの場合、図2Aから2Dの棒グラフにおいてRUBICONよりもSPEの青色のセグメントのほうがかなり長いことから明らかなように、低エネルギー領域において相違はさらに一層顕著であった。
たとえば、[Met5]−エンケファリンの場合、SPEでは、最低エネルギー最小値を超える5.0kcal・mol−1の範囲内の最小化エネルギーを持つ69の異なる配座を見つけ出したが、RUBICONでは9つしか見つけ出さなかった。SPEはさらに、最低エネルギー構造を探し出すことにも優れている。いずれの方法もシクロヘプタデカンおよびラロキシフェンについては同じ全体のエネルギー最小値を見つけ出したが、RUBICONは、SPEによって見つけ出されたグリベック(商標)および[Met5]−エンケファリンの最低エネルギー最小値を見つけ出すことはできなかった。さらに、SPEは、同程度またはより少ない試行回数で全体の最小値を見つけ出す。SPEによって生成されたそれぞれの生の配座に重ね合わされる最小化の後に発見された最低エネルギー構造は、図3Aから図3Fに示されている。
図3Aは、ラロキシフェンの化学構造を示している。図3Bは、グリベック(商標)の遊離塩基を示している。
図3Cから図3Fは、SPE(赤)によって生成されたそれぞれの生の配座による局所最小化(青)の後に発見された最低エネルギー構造の重なり合いを示している。対応するRMSDは、括弧に囲んで示してある。詳細には、図3Cは、シクロヘプタデカンを表している。図3Dは、ラロキシフェンを表している。図3Fは、グリベック(商標)を表している。図3Fは、[Met5]−エンケファリンを表している。
比較の特定の詳細事項は、採用されるエネルギー関数によって異なることがあるが、SPEが生成する配座の生の速度および多様性は引き続き維持されるべきである。
本発明は、本明細書に記載の機能を実行可能な1つまたは複数のコンピュータシステムにおいて実装することができる。たとえば、制限なく、プロセスフローチャート400、またはその一部をコンピュータシステムにおいて実装することができる。
図5は、コンピュータシステム例500を示している。各種のソフトウェアの実施形態が、このコンピュータシステム例500に関して説明されている。他のコンピュータシステムおよび/またはコンピュータアーキテクチャを使用して本発明を実装する方法は、この説明を読めば関連技術分野の当業者には明らかとなろう。
コンピュータシステム例500は、1つまたは複数のプロセッサ504を含んでいる。プロセッサ504は、通信基盤502に接続されている。
コンピュータシステム500はさらに、主記憶装置508も含んでいる。主記憶装置508は、ランダムアクセスメモリ(RAM)であることが好ましい。
コンピュータシステム500はさらに、たとえばハードディスクドライブ512および/または取り外し可能ストレージドライブ514などの補助記憶装置510を含むこともでき、これはフロッピー(登録商標)ディスクドライブ、磁気テープドライブ、光ディスクドライブなどであってもよい。取り外し可能なストレージドライブ514は、既知の方法で取り外し可能な記憶装置518との間で読み取りおよび/または書き込みを行う。取り外し可能な記憶装置518は、取り外し可能なドライブ514によって読み込みおよび書き込みが行われるフロッピー(登録商標)ディスク、磁気テープ、光ディスクなどである。取り外し可能な記憶装置518は、内部にコンピュータソフトウェアおよび/またはデータを格納した、コンピュータに使用可能なストレージ媒体を含んでいる。
代替の実施形態において、補助記憶装置510は、コンピュータプログラムまたは他の命令をコンピュータシステム500に読み込むことができるようにする他の装置を含むこともできる。そのような装置には、たとえば、取り外し可能な記憶装置522およびインターフェース520を含めることができる。そのような装置の例には、(ビデオゲーム装置に見られるような)プログラムカートリッジおよびカートリッジインターフェース、取り外し可能なメモリチップ(EPROMまたはPROMなど)および関連するソケット、その他取り外し可能な記憶装置522およびソフトウェアとデータを取り外し可能な記憶装置522からコンピュータシステム500に転送できるようにするインターフェース520を含めることができる。
コンピュータシステム500はさらに、ソフトウェアとデータをコンピュータシステム500と外部装置との間で転送できるようにする通信インターフェース524を含むこともできる。通信インターフェース524の例には、モデム、ネットワークインターフェース(イーサネット(登録商標)カードなど)、通信ポート、PCMCIAスロットおよびカードなどが含まれるが、これらに限定されることはない。通信インターフェース524を介して転送されるソフトウェアおよびデータは信号528の形態をとるが、通信インターフェース524によって受信することのできる電気信号、電磁信号、光信号またはその他の信号であってもよい。これらの信号528は、信号パス526を介して通信インターフェース524に提供される。信号パス526は信号528を搬送し、ワイヤまたはケーブル、光ファイバ、電話回線、携帯電話リンク、RFリンクおよびその他の通信チャネルを使用して実装される。
本明細書において、「コンピュータプログラム媒体」および「コンピュータに使用可能な媒体」という用語は、取り外し可能な記憶装置518、ハードディスクドライブ512に取り付けられているハードディスク、および信号528などの媒体を一般に参照するために使用されている。これらのコンピュータプログラム製品は、ソフトウェアをコンピュータシステム500に提供するための手段である。
(コンピュータ制御論理とも呼ばれる)コンピュータプログラムは、主記憶装置508および/または補助記憶装置510に格納される。コンピュータプログラムはまた、通信インターフェース524を介して受け取ることもできる。そのようなコンピュータプログラムは、実行された場合、コンピュータシステム500が本明細書で説明されている本発明の機能を実行できるようにする。特に、コンピュータプログラムは、実行された場合、プロセッサ504が本発明の機能を実行できるようにする。したがって、そのようなコンピュータプログラムは、コンピュータシステム500のコントローラに相当する。
本発明がソフトウェアを使用して実装されるような実施形態において、ソフトウェアは、取り外し可能なストレージドライブ514、ハードディスクドライブ512または通信インターフェース524を使用して、コンピュータプログラム製品に格納し、コンピュータシステム500にロードすることができる。制御論理(ソフトウェア)は、プロセッサ504によって実行された場合、プロセッサ504が本明細書で説明されている本発明の機能を実行できるようにする。
もう1つの実施形態において、本発明は主として、たとえば特定用途向け集積回路(ASIC)などのハードウェアコンポーネントを使用して、ハードウェアに実装される。本明細書で説明されている機能を実行するようにハードウェア状態マシンを実装する方法は、関連技術分野の当業者には明らかとなろう。
さらにもう1つの実施形態において、本発明は、ハードウェアおよびソフトウェアの組み合わせを使用して実装される。
(結論)
以上、明記されている機能の動作およびその関係を表す機能構成要素を参照して本発明を説明してきた。これらの機能構成要素の境界は、説明の便宜上、本明細書において任意に定義された。明記されている機能およびその関係が適切に実行される限り、代替の境界を定義することができる。したがって、そのような代替の境界は、請求項に係る発明の範囲および趣旨に沿っている。当業者であれば、これらの機能構成要素が、別個のコンポーネント、特定用途向け集積回路、適切なソフトウェアを実行するプロセッサなど、およびその組み合わせによって実装できることが理解されよう。
以上、明記されている機能の動作およびその関係を表す機能構成要素を参照して本発明を説明してきた。これらの機能構成要素の境界は、説明の便宜上、本明細書において任意に定義された。明記されている機能およびその関係が適切に実行される限り、代替の境界を定義することができる。したがって、そのような代替の境界は、請求項に係る発明の範囲および趣旨に沿っている。当業者であれば、これらの機能構成要素が、別個のコンポーネント、特定用途向け集積回路、適切なソフトウェアを実行するプロセッサなど、およびその組み合わせによって実装できることが理解されよう。
以上本発明のさまざまな実施形態について説明してきたが、これらはほんの一例として示されており、限定的なものではないことを理解されたい。したがって、本発明の広がりおよび範囲は、前述の模範的な実施形態に限定されることはないが、添付の特許請求の範囲およびその相当物により定義されるべきである。
Claims (12)
- 原子間距離および/または体積の制約群から原子配位を生成するための方法であって、
(1)座標図に原子群を配置するステップと、
(2)前記原子群から、含まれる原子との間で少なくとも1つの関連付けられた制約を有する原子部分群を選択するステップと、
(3)前記少なくとも1つの関連付けられた制約に違反した場合に、前記少なくとも1つの関連付けられた制約に基づいて前記座標図上の前記選択された原子部分群からの少なくとも1つの原子の少なくとも1つの座標を修正するステップと、
(4)前記原子群からの追加の原子部分群に対してステップ(2)およびステップ(3)を繰り返すステップと、
(5)前記原子群の原子配位を生成するステップと
を備えたことを特徴とする方法。 - 前記制約群は、距離の制約群を含むことを特徴とする請求項1に記載の方法。
- 前記制約群は、体積の制約群を含むことを特徴とする請求項1に記載の方法。
- 前記原子部分群は、2つの原子を含むことを特徴とする請求項2に記載の方法。
- 前記原子部分群は、4つの原子を含むことを特徴とする請求項3に記載の方法。
- 前記原子群は、少なくとも1つの実在の原子を含むことを特徴とする請求項1に記載の方法。
- 前記原子群は、少なくとも1つの抽象化された原子を含むことを特徴とする請求項1に記載の方法。
- 前記原子部分群は、無作為に選択されることを特徴とする請求項1に記載の方法。
- 前記原子部分群は、前記少なくとも1つの関連付けられた制約が距離の制約または体積の制約のいずれであるかにより決定する確率により選択されることを特徴とする請求項1に記載の方法。
- 前記ステップ(3)は、前記座標図上の前記選択された原子部分群から少なくとも1つの原子の少なくとも1つの座標を所定の補正率だけ調整して、前記少なくとも1つの関連付けられた制約の違反の程度が、前記少なくとも1つの座標を調整する際に改善されるようにするステップを含むことを特徴とする請求項1に記載の方法。
- 複数の補正率に対してステップ(2)からステップ(4)を繰り返すステップをさらに備えたことを特徴とする請求項10に記載の方法。
- (6)前記選択された原子群に関連付けられている接続および共有結合の長さから距離および体積の制約を生成するステップをさらに備えたことを特徴とする請求項1に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US39237202P | 2002-07-01 | 2002-07-01 | |
PCT/US2003/019905 WO2004003683A2 (en) | 2002-07-01 | 2003-06-26 | Conformational sampling by self-organization |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005531850A true JP2005531850A (ja) | 2005-10-20 |
Family
ID=30000858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004517772A Pending JP2005531850A (ja) | 2002-07-01 | 2003-06-26 | 自己組織化による配座サンプリング |
Country Status (6)
Country | Link |
---|---|
US (1) | US20060089808A1 (ja) |
EP (1) | EP1552295A4 (ja) |
JP (1) | JP2005531850A (ja) |
AU (1) | AU2003243761A1 (ja) |
CA (1) | CA2492041A1 (ja) |
WO (1) | WO2004003683A2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8993714B2 (en) * | 2007-10-26 | 2015-03-31 | Imiplex Llc | Streptavidin macromolecular adaptor and complexes thereof |
US9102526B2 (en) | 2008-08-12 | 2015-08-11 | Imiplex Llc | Node polypeptides for nanostructure assembly |
US9285363B2 (en) | 2009-05-11 | 2016-03-15 | Imiplex Llc | Method of protein nanostructure fabrication |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4855931A (en) * | 1988-03-25 | 1989-08-08 | Yale University | Stochastic method for finding molecular conformations |
US5241470A (en) * | 1992-01-21 | 1993-08-31 | The Board Of Trustees Of The Leland Stanford University | Prediction of protein side-chain conformation by packing optimization |
US5553004A (en) * | 1993-11-12 | 1996-09-03 | The Board Of Trustees Of The Leland Stanford Jr. University | Constrained langevin dynamics method for simulating molecular conformations |
US6341256B1 (en) * | 1995-03-31 | 2002-01-22 | Curagen Corporation | Consensus configurational bias Monte Carlo method and system for pharmacophore structure determination |
AU751331B2 (en) * | 1997-04-11 | 2002-08-15 | California Institute Of Technology | Apparatus and method for automated protein design |
-
2003
- 2003-06-26 CA CA002492041A patent/CA2492041A1/en not_active Abandoned
- 2003-06-26 US US10/519,638 patent/US20060089808A1/en not_active Abandoned
- 2003-06-26 EP EP03762003A patent/EP1552295A4/en not_active Withdrawn
- 2003-06-26 JP JP2004517772A patent/JP2005531850A/ja active Pending
- 2003-06-26 WO PCT/US2003/019905 patent/WO2004003683A2/en active Application Filing
- 2003-06-26 AU AU2003243761A patent/AU2003243761A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
AU2003243761A1 (en) | 2004-01-19 |
CA2492041A1 (en) | 2004-01-08 |
WO2004003683A2 (en) | 2004-01-08 |
WO2004003683A3 (en) | 2004-06-24 |
EP1552295A2 (en) | 2005-07-13 |
EP1552295A4 (en) | 2007-11-28 |
US20060089808A1 (en) | 2006-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Brown | Chemoinformatics—an introduction for computer scientists | |
Zou et al. | Supersecondary structure prediction using Chou's pseudo amino acid composition | |
Schindler et al. | Fully blind peptide-protein docking with pepATTRACT | |
Feyfant et al. | Modeling mutations in protein structures | |
Temelso et al. | ArbAlign: a tool for optimal alignment of arbitrarily ordered isomers using the Kuhn–Munkres algorithm | |
Bellesia et al. | Diversity of kinetic pathways in amyloid fibril formation | |
Huggins | Quantifying the entropy of binding for water molecules in protein cavities by computing correlations | |
Zuckerman | Simulation of an ensemble of conformational transitions in a united-residue model of calmodulin | |
Evenhuis et al. | A scheme to interpolate potential energy surfaces and derivative coupling vectors without performing a global diabatization | |
Lopes et al. | Computational sidechain placement and protein mutagenesis with implicit solvent models | |
Hu et al. | Monte Carlo simulations of biomolecules: The MC module in CHARMM | |
US20130303387A1 (en) | Methods and apparatus for predicting protein structure | |
EP1652123A2 (en) | STRUCTURAL INTERACTION FINGERPRINT (SIFt) | |
Zhang et al. | PROBselect: accurate prediction of protein-binding residues from proteins sequences via dynamic predictor selection | |
Kleinjung et al. | Implicit solvation parameters derived from explicit water forces in large-scale molecular dynamics simulations | |
JP2005531850A (ja) | 自己組織化による配座サンプリング | |
Yuan et al. | A comparison of three DFT exchange–correlation functionals and two basis sets for the prediction of the conformation distribution of hydrated polyglycine | |
Liu et al. | A self-organizing algorithm for modeling protein loops | |
Wagoner et al. | Communication: adaptive boundaries in multiscale simulations | |
Sain et al. | Understanding the molecular basis of substrate binding specificity of PTB domains | |
Jänes et al. | Deep learning for protein structure prediction and design—progress and applications | |
Si et al. | Combining image processing and modeling to generate traces of beta-strands from cryo-EM density images of beta-barrels | |
Oshima et al. | Modified hamiltonian in FEP calculations for reducing the computational cost of electrostatic interactions | |
Hunjan et al. | The size of the intermolecular energy funnel in protein–protein interactions | |
Roberts et al. | Predicting interactions of winged‐helix transcription factors with DNA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20050715 |