JP6441301B2 - 相対結合親和性および誤差のサイクルクロージャ推定 - Google Patents

相対結合親和性および誤差のサイクルクロージャ推定 Download PDF

Info

Publication number
JP6441301B2
JP6441301B2 JP2016501847A JP2016501847A JP6441301B2 JP 6441301 B2 JP6441301 B2 JP 6441301B2 JP 2016501847 A JP2016501847 A JP 2016501847A JP 2016501847 A JP2016501847 A JP 2016501847A JP 6441301 B2 JP6441301 B2 JP 6441301B2
Authority
JP
Japan
Prior art keywords
free energy
computer
ligand
fep
ligands
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016501847A
Other languages
English (en)
Other versions
JP2016515273A (ja
Inventor
ワン、リングル
リン、テン
アベル、ロバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Schroedinger LLC
Original Assignee
Schroedinger LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Schroedinger LLC filed Critical Schroedinger LLC
Publication of JP2016515273A publication Critical patent/JP2016515273A/ja
Application granted granted Critical
Publication of JP6441301B2 publication Critical patent/JP6441301B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Strength Of Materials By Application Of Mechanical Stress (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Description

本発明は、バイオインフォマティクスの一般的な分野におけるものであり、より詳細には、受容体/リガンドの相対結合親和性およびそれらの誤差の推定または計算におけるものである。
生物学的プロセスは多くの場合、タンパク質−リガンド結合事象(例えば、リガンドとこのリガンドの受容体との結合)に依拠し、このため、関連するエネルギー論の正確な計算が計算構造に基づく薬剤設計の中心となる目標である1〜3
速度と精度との様々なトレードオフを有するタンパク質−リガンド結合自由エネルギーを計算する多岐にわたる様々な手法が開発されている。これらの手法は、仮想スクリーニングおよび分子力学法/一般化ボルン表面積(MM/GBSA)または分子力学法/ポアソン−ボルツマン(MM/PBSA)モデル等の高速エンドポイント法、GB法よりもタンパク質の脱溶媒和からの寄与を明示的に考慮するWM/MM法、ならびに基礎をなす力場の精度限界内での結合の完全なまたは本質的に完全なエネルギー記述および完全なサンプリングを考慮するように設計される自由エネルギー摂動(FEP)法および熱力学的積分(TI)法を含む1,2,4〜10
タンパク質−リガンド結合親和性を計算する様々な方法の中でも、TI、FEP、ラムダ動力学、アルケミカルOSRW(alchemical OSRW)等の自由エネルギー計算は一般的に、結合事象の熱力学的に完全な記述を提供し、少なくとも理論上、用いられる力場の限界内での正確な予測および位相空間の完全なサンプリングをもたらす。しかしながら、産業との関連における自由エネルギー計算の実際の用途では、特に複数のコンフォメーションをサンプリングするときに必要とされる大きな計算リソース、生体プロジェクト(live project)に影響を与えるのに必要なタイムスケール、およびこのような自由エネルギー計算に関連するサンプリング誤差を決定するためのロバストで有意味な手法の必要性によって制限される場合がある4,11,12
本発明者らは、特に、リガンドの同種組の相対結合親和性を推定し、これらの推定に関連するサンプリング誤差を決定するために、受容体−リガンドの相対結合親和性の自由エネルギー計算を改善するための一般化可能なコンピュータ実装方法を発見した。
本発明の1つの態様は、包括的には、個々のリガンド組メンバーと受容体との間で複合体を形成するための、受容体と1組のリガンドの個々のメンバーとの間の結合の相対強度を決定するコンピュータ実装方法を特徴とする。本方法は、少なくとも1つの閉じたサイクルを形成するリガンド対の組についての複数の相対結合自由エネルギー差のコンピュータ実装された決定と、各閉じた熱力学的サイクルに関するヒステリシスの大きさのコンピュータ実装された決定とを含む。概して、本方法は、
a.閉じた熱力学的サイクルについて観察されるヒステリシスの値を確率的に導く、閉じた熱力学的サイクルの区画の各々に沿った自由エネルギー差およびこれらの自由エネルギー差に関する誤差分布のコンピュータ実装された確率的決定と、
b.aにおいて決定された確率モデルに含まれる閉じた熱力学的サイクルにおける区画ごとの最も確からしい自由エネルギー差のコンピュータ実装された決定と、
c.bにおける確率的決定からの、閉じた熱力学的サイクルにおける各区画に沿ったリガンド対ごとの最も確からしい自由エネルギー差に関連する最も確からしい誤差のコンピュータ実装された決定と、
d.コンピュータユーザに対する、cにおける相対結合自由エネルギーおよび誤差を表す値のコンピュータ実装された出力と、を備える。
好ましい実施形態では、誤差を推定する工程は、2つ以上の閉じた熱力学的サイクルの区画に沿ったリガンド間での結合自由エネルギー差のコンピュータ実装された解析と、閉じた熱力学的サイクルの各々に関するヒステリシスの大きさのコンピュータ実装された確率的決定とを備える。また、好ましい実施形態では、工程cおよびdは、関数
を最小にする区画ごとの1組の自由エネルギー値を、制約
を用いて決定することを含み、
ここで、Eiは、所与の区画iについての計算される自由エネルギー差であり、
は、所与の区画iについての理論上の自由エネルギー差であり、
σは、区画iについての計算される自由エネルギー差の標準偏差であり、全ての閉じたサイクルについての理論上の自由エネルギー差の和は0である。
他の好ましい実施形態では、受容体はタンパク質であり、リガンドは同種であり、工程aにおける観察されるヒステリシスの確率モデルの構築においてガウス分布が仮定され、工程aにおける自由エネルギーシミュレーションに関連する誤差分布は一様であると仮定され、誤差分布は、工程aにおいてベネット誤差に加算されると仮定される。閉じた熱力学的サイクルの連結性はグラフまたは行列として表される。確率的決定は、制限するものではないが、グラフ理論法、行列代数法、ベイズ法、最大尤度法を含む様々な方法によって行うことができる。
本発明の他の態様は、上記で記載した方法を実行するための有形の非一時的命令を備えるコンピュータ可読媒体、およびこれらの方法を実行するための非一時的コンピュータ可読命令を有する汎用グラフィック処理ユニットを特徴とする。
以下で、FEP/REST(自由エネルギー摂動/溶質テンパリングを用いるレプリカ交換)12〜15、FEP/MD、およびTI相対結合親和性自由エネルギー計算に対するサイクルクロージャ親和性推定および誤差解析機構の発明を例証するが、本発明は、ラムダ動力学、アルケミカルメタダイナミクス(alchemical metadynamics)、アルケミカルOSRW(alchemical OSRW)等を含む複数の
他の相対結合自由エネルギー計算プラットフォームと共に用いられ得る。また、本発明は、特定の相対自由エネルギー計算プラットフォームが、分子動力学、モンテカルロ、グランドカノニカルモンテカルロ、レプリカ交換分子動力学、加速分子動力学または任意の他のサンプリングプロトコルに基づくサンプリングアルゴリズムを利用して実施されるか否かに関わらず利用され得る。
特に、サイクリン依存性キナーゼCDK2−サイクリンA受容体16に結合する一連の同種リガンドからのサブセットを調査することによって本発明を例証する。CDK2は、細胞増殖およびRNAポリメラーゼII転写サイクルの調節において様々な機能を実行するCDKファミリーのメンバーである。CDK2は、腫瘍選択性治療戦略のための重要な薬剤標的としても同定されている17,18
本発明を例証するために提示する特定の系に関わらず、当業者であれば、本発明をリガンド結合調査のための一般的なツールとして用いることができることを理解するであろう。この点を説明するために、本発明を、JNKキナーゼおよびBACEに結合するリガンドの相対結合親和性の算出にも適用した。これらもまた、医薬的に関心の高いタンパク質標的である。
本発明の1つまたは複数の実施形態の詳細が添付の図面および以下の記載において述べられている。本発明の他の特徴、目的および利点は、記載および図面、ならびに特許請求の範囲から明らかとなろう。
この特許または出願ファイルは、色彩を付して作成された少なくとも1つの図面を含んでいる。彩色図面(複数の場合もある)が付された、この特許または特許出願公開の写しは、請求および所要の手数料の納付により、特許商標庁によって提供される。
FEP計算における一貫性および信頼性の検査の問題を示す単純なモデルの図。1組の3つのリガンドL1、L2およびL3について、それぞれ推定自由エネルギー差E21、E32およびE13を用いた3つのFEP計算が実行された。3つのFEP計算からどのように相対自由エネルギー(F21、F32およびF13)を入手するか、そして計算に信頼性があるか否かをどのように判定するか? CDK2阻害剤結合親和性計算において用いられる、同じエッジを共有する2つのサイクルを有するより複雑なパスの図。 一般的な用途における相対自由エネルギー計算のための例示的なグラフ。グラフ上の各頂点はリガンドを表す。グラフ上の各エッジは相対自由エネルギー計算を表し、エッジの矢印は相対結合自由エネルギー計算の方向を示し、各エッジ上の値は、その特定のリガンド対についての自由エネルギー計算から計算された自由エネルギー差である。 3つの独立した部分グラフへの図3の全体グラフの分解を示す図。部分グラフは同じ頂点を共有する場合があるが、同じエッジを共有しない。 結晶構造を有する6つのCDK2リガンドの構造、ならびにFEP/REST計算およびFEP/MD計算のために用いられるパスの図。3つの赤い矢印は、計算の一貫性および信頼性を評価するための3つの別個のサイクルを完成させる相対結合自由エネルギー計算パスを表す。5つの青で示す相対結合自由エネルギー計算のためにリガンドlhlqが用いられた。なぜなら、他の化合物は全て、リガンドlhlqのベンゼン環に異なる置換基を単に付加することによって生成され得るためである。 結晶構造を有するCDK2阻害剤の組についての、FEP/MDおよびFEP/RESTの予測結果対実験による結合親和性データの図。FEP/MDの予測結合親和性は大幅に変動せず、これにより、これらの値を用いてリガンドlhlr、lhls、loiu、loi9およびloiyを確実にランク付けすることが不可能になっている。対照的に、FEP/RESTの予測結果は、実験データと非常に高い相関を有し(R2=0.91)、全ての対について偏差は3.347kJ/mol(0.8kcal/mol)未満である。この図において報告されるFEP/REST予測のためのエラーバーは、サイクルクロージャ解析を用いて本発明の実施形態によって計算される。 リガンドlhlrのためのFEP/RESTシミュレーションのための結晶構造に対応する開始コンフォメーション(左)、REST/REST軌道において観察される、クロロ置換フェニル環がフリップした代替結合モード(中央)、およびX線結晶学におけるリガンドlhlrの電子密度(右)の図。タンパク質は、主鎖について彩色されたリボンで表され、側鎖についてスティック表現で表される一方、リガンドはチューブ表現で描かれ、電子密度は無地の黄色の表面として表示される。密度の視覚化のために用いられるシグマカットオフは1.0である。リガンドlhlrの場合、電子密度は、クロロ置換ベンゼン環について2つのピークを有し、リガンドがFEP/RESTシミュレーションに一致して2つの結合モードを有することを示す。 リガンドlhlsのためのFEP/RESTシミュレーションのための結晶構造に対応する開始コンフォメーション(左)、およびREST/REST軌道において観察される、代替結合モード(右)の図。タンパク質は、主鎖について彩色されたリボンで表され、側鎖についてスティック表現で表される一方、リガンドはチューブ表現で描かれる。開始コンフォメーションと比較して、スルホンアミド基はC−S結合の回りを約120°回転し、それに応じて、結合ポケットを取り囲む残基、特にGln85およびAsp86が再配列する。スルホンアミド基とタンパク質残基との間に2つの水素結合が形成される。 CDK2受容体への結晶構造結合を有しないリガンドのためのFEP/REST計算に用いられる相対結合自由エネルギー計算パスの図。 結晶構造を有する6つのリガンドおよび結晶構造を有しない10個のリガンドの双方を含むCDK2阻害剤の全体組についての、FEP/RESTの予測結果対実験による結合親和性データの図。結晶構造を有する6つのリガンド(図6に表示される)は、図において赤色で彩色され、結晶構造を有しない10個のリガンドは黒色で彩色される。この図において報告されるFEP/REST予測のためのエラーバーは、付録Aに詳述される方法に基づいて、サイクルクロージャを用いて計算される。 2つの独立したサイクルクロージャを有するJnk1受容体に結合する7つのリガンドのための相対結合自由エネルギー計算パスの図。 2つの独立したサイクルクロージャを有するBACEに結合する6つのリガンドのための相対結合自由エネルギー計算パスの図。 活性部位における水結合(water bound)を有するシタロンデヒドラターゼおよび有しないシタロンデヒドラターゼに結合する3つのリガンドのための相対結合自由エネルギー計算パスの図。活性部位における水結合を有するシミュレーションは「(H2O)」によって示される。相対結合自由エネルギー計算パスにおいて4つの独立したサイクルクロージャが構築される。 メタン−プレート結合親和性および水中でプレートに帯電する自由エネルギーを連結する熱力学的サイクルの図。灰色の粒子は、モデルの疎水性囲い(hydrophobic enclosure)を形成するレナード・ジョーンズ原子を表し、赤色の粒子は負に帯電したイオンを表し、青色の粒子は正に帯電したイオンを表し、緑色の粒子は、囲いに結合する融合原子メタンを表す。 本方法を実行するコンピュータシステムのブロック図。 本方法における工程のフローチャート。
本発明によりサイクルクロージャを用いて計算される相対結合親和性は、実験データと高度に相関し、計算の収束を示す有意味なエラーバーが生成される。
これは、本発明を利用してFEP/REST自由エネルギー計算の値を求めるときに特
に明らかである。このFEP/REST自由エネルギー計算は、受容体の活性部位におけるリガンドの様々なコンフォメーションの完全なサンプリングを提供する。特定の理論に縛られることなく、本発明者らは、リガンドのうちの2つについて、複数の結合モードが存在すること、およびこれらのモードをサンプリングすることが、結合親和性の正しい予測に重要であることを割り出した。FEP/RESTは比較的短いシミュレーション時間内で重要なコンフォメーションをサンプリングすることができるが、FEP/MDを用いると、リガンドは初期コンフォメーションにトラップされた。本方法は、FEP/MD自由エネルギー計算に関連する高い誤差、およびFEP/REST計算に関連する低い誤差を示すこの特徴を説明する。このため、本発明は、計算における関連誤差の妥当な推定、および予測の信頼性を提供することによって相対自由エネルギー計算技法を改善することができる19
最初に、本方法は、いくつかの他のグループによって行われたような相対自由エネルギー計算においてサイクルクロージャを構築し10,20,21、次に、この入力から、本方法は、閉じた熱力学サイクルごとに計算された自由エネルギーの和が理論値0からどれだけ変化しているかを評価することによって、相対自由エネルギー計算の一貫性および信頼性を決定する。次のセクションにおいて、この方法を詳細に説明する。これによって、当業者は、本方法が、どのようにサイクルクロージャ相対自由エネルギー計算によって取得された複数の自由エネルギー推定値から相対自由エネルギーの信頼性のある予測をもたらし、また、これらの計算に関連する予測誤差限界をもたらし、また、系統誤差を有する相対自由エネルギー計算にフラグを付けるメカニズムをもたらすかを直ちに理解することができる。
サイクルクロージャ相対自由エネルギー一貫性の発明の詳細な説明
I.相対結合自由エネルギー計算パスにおけるサイクルクロージャを用いた一貫性検証および最良自由エネルギー推定量
以下の単純なモデルは、本方法および本方法の概念を説明する。1組の3つのリガンドL、LおよびLを検討する。3つのリガンド間の実験により測定された相対結合自由エネルギーの差が、
であると仮定する。ここで、
は、それぞれリガンドL、LおよびLについて実験により測定された結合自由エネルギーである。自由エネルギーは熱力学的特性であり、したがって、
である(図1を参照)。仮に、3つの相対結合自由エネルギー計算が、LからLまで、LからLまで、およびLからLまで実行されるとすると、3つの相対結合自由エネルギー計算パスについて計算される自由エネルギーの差はそれぞれ、E2l、E32およびE13である。シミュレーションが完全に収束し、力場が完全である場合、理想的には、
である。しかしながら、実際には、計算される相対自由エネルギーに関連する誤差が存在し、通常、
である。Δを、このサイクルクロージャに関連する自由エネルギーのヒステリシスと呼ぶ。これらの誤差は、不規則変動に起因する不偏統計誤差、および位相空間の不完全なサンプリングに起因するバイアス誤差(タンパク質および/またはリガンドはコンフォメーション空間の極小にトラップされる)、および力場における誤差を含む。本方法は、これらの計算の一貫性および信頼性を評価する。
実験値と比較した相対自由エネルギー計算における誤差は、2つのカテゴリに分けられ得る。2つのカテゴリとは、系の真の潜在的なエネルギー面と比較した、シミュレーションにおいて用いられる力場の違いから生じる系統誤差と、位相区間の不規則に不完全なサンプリングもしくは系統的に不完全なサンプリングのいずれかに起因する非収束、または自由エネルギー推定量自体、例えば、TI対FEP等から生じる誤差である。F21が、無限長の不偏シミュレーションおよび不偏相対自由エネルギー推定量からの基礎をなす力場に関する2つの熱力学的状態間(すなわち、リガンドLからリガンドLまで)の理論的自由エネルギー差を表すものとする。力場に系統誤差が存在しない場合、
である。例えば、LからLまでの計算の場合の実際の相対自由エネルギー計算では、シミュレーションは有限のサンプリング時間量を用いて実行され、サンプリングは何らか
のバイアスを有する場合があり、このため、計算される自由エネルギーE21は、自由エネルギーE21の理論値F21から離れる場合があり、シミュレーションの初期構成に依存することになる。
様々な初期構成、および速度の様々な乱数種から開始して無限回同じ相対自由エネルギー計算を繰り返すと、計算される自由エネルギーは分布を有する。一般性を損なうことなく、リガンドLおよびリガンドL間の理論的自由エネルギー差がFjiであるリガンドLからリガンドLまでの相対結合自由エネルギーの計算に関して、P(Eji|Fji)は、計算される自由エネルギーEjiの分布を表す。P(Eji|Fji)は、原理的に、ガウス分布、ローレンツ分布、一様分布、デルタ分布等の任意の種類の分布であり得る。
この方法は、相対結合自由エネルギー計算パスにおいて構築されたサイクルクロージャを有する分布P(Eji|Fji)に基づいて、リガンドLからリガンドLまでの自由エネルギー差を予測し、この予測に関する関連誤差を予測する。すなわち、
である。ここで、
はリガンドLとリガンドLとの間の予測自由エネルギー差を表す、ejiは予測に関連付けられた誤差を表す。
予測は、多くの様々な方法、例えば、観察の確率を最大にする最大尤度法、計算される自由エネルギーに基づいてパラメーターを最適化するベイズ統計法等を用いて行われ得る。
ここで、最大尤度法を用いる1つの特定の例を通じて、かつ計算される自由エネルギー
についてガウス分布を仮定して、反転を例示する。当業者であれば、本発明が、他のタイプの統計的解析法および他のタイプの分布のための一般的なツールとして用いられ得ることを理解するであろう。ベイズ統計を用いた導出例も、このセクションの末尾において与えられる。
計算される自由エネルギーが、平均F21(系統的バイアスなし)および標準偏差σ21を有するガウス分布であると仮定する。このとき、単一の相対自由エネルギー計算がこのパスについてE21の値を与える確率密度は以下となる。
同様に、LからLへのパス、およびLからLへのパスについて、相対自由エネルギー計算がE32およびE13の値を与える確率密度はそれぞれ以下となる。
理論的自由エネルギー差F21、F32およびF13の所与の組について、3つの相対自由エネルギー計算がE21、E32およびE13の値を与える全体尤度Lは以下となる。
最大尤度法によれば、F21、F32およびF13の最も可能性の高い値は、上記の尤度を最大にする値の組である。上記の式の対数をとると、尤度を最大にする値の組は、以下の関数を最小にする値の組である。
ここで、制約:
21+F32+F13=0
を有する。
ラグランジュ乗数を用いると、尤度を最大にする値の組は以下となる。
上記の推定量は系統的バイアスを有さず、様々なパスからの自由エネルギー予測間には実質的に相違がない。本方法は、上記の推定量を2つのパスからの加重平均として解釈する。例えば、リガンドLとLとの間の自由エネルギー差F21は、E21または−(E32+E13)から推定することができ、最良の推定量は、2つの予測の加重平均である。パスに沿って計算された自由エネルギー差の標準偏差が小さいほど、最良推定量に対する重みが大きくなり、逆もまた同様である。
更に、上記のモデルによれば、サイクルクロージャのヒステリシスE21+E32+E13=Δも、平均0および標準偏差
を有するガウス分布である。3つの計算される自由エネルギーの和が、2sよりも大きく0から離れている場合、計算が収束しておらず、結果に信頼性がないことがほぼ確実(P=0.95)であり、3つの計算される自由エネルギーの和が、sよりも大きく0から離れている場合、計算が収束しておらず、結果に信頼性がない場合がある可能性が高い(P=0.68)。このため、本方法は、予測に信頼性があるか否かを決定する。
実際の相対自由エネルギー計算では、高い計算コストに起因して、所与の計算は通常一回のみ実行され、予測ごとに標準偏差が推定され得ない。この場合、本方法は、計算ごと
の標準偏差が同じである、例えばパスごとに3.347kJ/mol(0.8kcal/mol)であると仮定する。そして、2つのパスからの自由エネルギー結果の相違が5.757kJ/mol(1.4kcal/mol)よりも大きい場合、これは計算が収束しておらず、おそらく信頼性がないことを示す。この仮定の下で、最良自由エネルギー推定量は下式である。
更に、計算ごとの標準偏差が同じであるという仮定の下で、サイクルクロージャのヒステリシス自体が、各自由エネルギー予測に関連する誤差の推定値を提供する。上記で検討したように、サイクルクロージャのヒステリシスΔは、平均0および標準偏差
を有するガウス分布である。このため、所与の計算がサイクルクロージャについて値Δを有するヒステリシスを生成する確率は以下となる。
上記の確率を最大にするシグマの値は、各自由エネルギー計算に関連する標準偏差の最大尤度推定値を与える。
上記の導出において、本方法が推定する自由エネルギーおよび関連誤差は、相対自由エネルギー計算から得た全ての情報に基づく最適推定値である。計算における基礎をなす力場が系統的バイアスを有する場合、完全に収束した相対自由エネルギー計算結果であっても、実験により測定された値から離れる場合がある。これは上記の解析に基づいて補正され得ないものである。
上記で記載した方法を、より多くのメンバーをサイクルクロージャ内に有し、いくつかのサイクルが同じエッジを共有する、より複雑な事例に適用する。ここで、結晶構造を有する6つのCDK2リガンド(図2)のためのFEP/MD計算およびFEP/REST計算において用いられる、パスのための最良自由エネルギー推定量を取得する方法を説明する。任意の種類の相対結合自由エネルギー計算パスのためのより一般的なアルゴリズムが以下のセクションで与えられる。
ベイズ統計を用いた最良自由エネルギー推定量
リガンドLからリガンドLに、理論的自由エネルギー差Fjiを有して突然変異するFEP計算について、仮に、計算される自由エネルギーEjiが、平均Fjiおよび標準偏差σjiを有するガウス分布であるものとする(最大尤度法の場合に用いられるのと同じモデル)。このとき、1つのFEP計算から計算される自由エネルギーがEjiの値を与える確率密度は以下となる。
jiの多くの様々な値は、様々な確率を有する同じ計算された自由エネルギーEjiを導くことができる。ベイズ統計によれば、本方法は、FEP計算を実行する前に、2つのリガンド間の自由エネルギー差の分布(事前分布)の推定値
を有し、FEP計算を実行した後、FEPからの計算結果に基づいて分布(事後分布
を調整する。
FEP計算を実行する前に、相対結合自由エネルギー計算に関する情報が知られていない場合、Fjiの事前分布に関する妥当な推定は、Fjiが−∞と+∞との間で一様分布するというものであり、すなわち、
である。事前分布は正規化されないことに留意されたい。
FEP計算がEjiの値を与える場合、ベイズ統計によれば、Fjiの事後確率は以下となる。
上記の事例の場合、3つのリガンドL、LおよびLを用いて、本方法は、計算された自由エネルギー差E21、E32およびE13を有する閉じたサイクルを形成するFEP計算を実行する。このとき、ベイズ統計によれば、(F21,F32,F13)の事後分布は、
21+F32+F13=0
という制約の下で以下となる。
事後分布のピックは、
に位置する。
これにより、上記で提示した最大尤度法から取得した結果を確認する。
II.サイクルクロージャにより導出された自由エネルギー推定値および誤差推定値の発明の一般的な実施のプログラミング
1組のL個のリガンドについて、本方法は全てのリガンドをサイクルクロージャ(複数の場合もある)と連結するN個の相対自由エネルギー計算を実行する。このセクションに記載される本発明の特定の実施形態は、リガンド間の相対自由エネルギーの最良予測およびこれらの予測に関連するエラーバーをもたらす。入力は、相対自由エネルギーシミュレーションが実行されるリガンドのN個の対間のN個の計算される自由エネルギー差であり、出力は、相対自由エネルギーシミュレーションが実行されたリガンドのN個の対間のN個の予測相対自由エネルギー差および関連するエラーバー、ならびにまた、組内のリガンドの任意の対間の相対自由エネルギー差およびこれらの関連するエラーバーである。予測相対自由エネルギーはヒステリシスを有さず、これは、任意の2つのリガンド間の予測相対自由エネルギー差が、これらを連結するパスから独立しており、このため内部的に矛盾しないことを意味する。
図3に示す例示的なパスにおいて、8つ全てのリガンドをいくつかのサイクルクロージャに連結する、1組の8つのリガンドのための11個の相対自由エネルギー計算が存在する。プログラムの入力は、リガンドの11個の対についての11個の相対自由エネルギー計算結果であり、出力は、リガンドの11個の対についての予測相対自由エネルギー差、これらの関連するエラーバー、ならびにまた、組内の8つのリガンドの任意の対間の相対自由エネルギー差およびこれらの関連するエラーバーである。
入力:
{E;L→L}、ここでi∈{1,2,3,...N}
出力:
{F,e;L→L}、ここでi∈{1,2,3,...N}
および{Fij,eij}、ここでi,j∈{L...L}
アルゴリズム
工程1:実行される全ての相対結合自由エネルギー計算について計算される自由エネルギー、ならびにこれらの対応する初期リガンドおよび最終リガンドを列挙する。
この工程から入手するものは以下のリストである。
{E;L→L}、ここでi∈{1,2,3,...N}
ここで、Eは第iの相対結合自由エネルギー計算についての、相対自由エネルギーシミュレーションにより計算される自由エネルギーである。この相対自由エネルギー計算についての初期リガンドおよび最終リガンドはLおよびLである。これはプログラムの入力である。
工程2:相対結合自由エネルギー計算パスにおける全ての閉じたサイクルを列挙し、全体グラフについてサイクルクロージャ連結性行列(C3M)を組み立てる。
この工程において、本方法は、全てのリガンド対にわたって探索し、閉じたサイクルを形成する全ての対を発見し、この情報を連結性行列に変換する。
例えば、上記に示すリガンド対パスにおいて、対1、2および5は閉じたサイクルを形成する。自由エネルギーは状態関数であるので、そのような閉じたサイクルに沿った自由エネルギーの和は0となるべきである。換言すれば、
+F−F=0
である。
一般的な事例では、閉じたサイクルに沿った自由エネルギーに対する拘束は、以下の一般的な拘束関数に書かれ得る。
ここで、Fは、閉じたサイクルに沿ったエッジの2つの頂点上の2つのリガンド間の自由エネルギー差であり、Mは、エッジが閉じたサイクルと同じ方向にある場合、1であり、エッジが閉じたサイクルの反対方向にある場合、−1であり、エッジが閉じたサイクル内にない場合、0である。
この工程において、本方法は、リガンド対パス内の全ての閉じたサイクルおよび全ての拘束を列挙する。上記で示す例において、閉じたサイクルについて以下の拘束を有する。
+F−F=0
+F−F=0
−F−F=0
+F−F−F=0
−F−F−F=0
+F−F−F−F=0
+F11−F10=0
一般的な事例において、仮に、リガンド対パス内に合計M個の閉じたサイクルがあるとすると、M個の拘束方程式を有する。
ji=MはM×Nの行列であり、行列の各行は閉じたサイクルのための拘束方程式を表す。Mを用いて、全体グラフのサイクルクロージャ連結性行列(C3M)を表す。
上記で示す例において、
である。
工程3:全体グラフを独立した部分グラフに分解する。
相対自由エネルギー計算グラフにおいて、2つの部分グラフを連結する閉じたサイクルがない場合、リガンドのサブセット間の予測相対自由エネルギーは、リガンドの他のサブセット間の予測相対自由エネルギーから独立している。上記に示す例において、リガンドの組[1,2,3,4,5]間の予測相対自由エネルギーは、リガンドの組[6,7,8]間の相対自由エネルギーから独立している。なぜなら、2つの部分グラフを連結する閉じたサイクルがないためである。この工程において、全体グラフは各独立した部分グラフに分解され、次に、各独立した部分グラフが連続して解かれる。
工程3a:Mの各行を検査し、各行における非ゼロ要素の列数を記録し、列数を以下のリストに入れる。
この工程において、本方法はM個のリストを生成する。各リストは、C3M行列の各行の非ゼロ要素の列数を含む。これを以下の記載について明確にするために、この工程において生成される、未加工リストであるM個のリストを含む組は、組Sと呼ばれる。
上記で示す例において、本方法のこの工程は、7つのリストを含む未加工リスト組を生成する。
={1,2,5}
={3,4,5}
={4,6,7}
={1,2,3,4}
={3,5,6,7}
={1,2,3,6,7}
={9,10,11}
工程3b:未加工リスト組Sにおいて第2のリストから最後のリストまで反復し、Lに含まれる要素を第1のリストL内の要素と比較する。ここで、j∈{2,3,...m}である。これらが1つの共通要素(または数個の共通要素)を含む場合、L内の全ての要素をマージして第1のリストLにし、未加工リスト組からLを削除する。これらがコメント要素を一切有しない場合、リストLを未加工リスト組内に維持する。
上記に示す例において、L、L、L、Lは、Lとの共通要素(複数の場合もある)を含むので、これらのリストはこの工程において削除され、これらのリストの要素はLにマージされる。この工程から未加工リスト組内に残るものは、以下である。
={1,2,3,4,5,6,7}
={4,6,7}
={9,10,11}
工程3c:工程3bにおいて削除されていないリストについて工程3bを繰り返し、要素がLとの共通要素を含む場合、これらの要素をLに統合する。これ以上リストが削除され得なくなるまでこの工程を繰り返す。
上記で示す例において、この工程から未加工リスト組S内に残るものは、以下である。
={1,2,3,4,5,6,7}
={9,10,11}
工程3d:未加工リスト組S内の第1のリストLを最終リスト組S={L...}内に移し、これを未加工リスト組から削除する。
上記で示す例において、この工程の後、最終リスト組Sにおいて、
={L={1,2,3,4,5,6,7}}
であり、未加工リスト組内に1つのリストが残される。
={L={9,10,11}}
工程3e:工程3dの後、未加工リスト組内に2つ以上のリストが残されている場合、残されているリストが1つのみになるまで、工程3b〜工程3dを繰り返す。
上記に示す例では、この工程において動作は必要ない。なぜなら、工程3dの後、未加工リスト組内には1つのリストしか残されていないからである。
工程3f:未加工リスト組S内の最後のリストを、最終リスト組Sに移す。この工程の後、最終リスト組内にいくつかのリストが存在し、未加工リスト組内にはリストが残されていない。最終リスト組内のリストは、共通要素を一切含まない。
上記に示す例において、最終リスト組内に以下を有する。
={L={1,2,3,4,5,6,7},L={9,10,11}}
工程3g:列番号1〜Nにわたって反復する。列番号が最終リスト組内の任意のリストにある場合、これをスキップし、そうでない場合、その列番号しか含まないリストを最終リスト組に加える。
これはこのプロセスにおける最終工程である。この工程の後、最終リスト組はいくつかのリストを含み、リストの内のいずれの間においても共通要素は存在しない。列番号1〜Nは、最終リスト組における1つのリスト内にのみある。
上記に示す例において、この工程の後、
={L={1,2,3,4,5,6,7},L={9,10,11},L={8}}
である。
このプロセスの後、全体グラフは、各個々の独立した部分グラフに分解される。各独立した部分グラフはエッジを含み、エッジ番号は最終リスト組Sの各リスト内に列挙されている。これらの独立した部分グラフは共有エッジを含まないが、共有頂点を有する場合がある。
上記に示す例において、全体グラフは3つの独立した部分グラフに分解される。第1の部分グラフは7つの結合自由エネルギー計算パス[El,E2,E3,E4,E5,E6,E7]を含み、第2の部分グラフは3つの相対結合自由エネルギー計算パス[E9,E10,E11]を含み、第3の部分グラフは1つの相対結合自由エネルギー計算パス[E8]を含む。これらの部分グラフは図4に示される。
工程4:独立した部分グラフごとのC3MであるMを入手する。
工程3から、全体連結性グラフは既に独立した部分グラフに分解されており、各部分グラフのエッジ番号は最終リスト組内のリストに記憶されている。この工程において、独立した部分グラフごとのC3Mを入手することに着手する。
仮に、リスト内にN個の要素が存在するとして、最終リスト組Sから各リストLを取る。全体グラフのC3MであるMの全ての行にわたって探索する。Mの行ごとに、列番号がリストL内にある全てのn個の要素を探索し、これらのうちのいずれかがゼロでない場合、この行のn個の列をM に入れる。この部分グラフのためのC3MはリストLに対応している。これを、Mの全ての行、および最終リスト組S内の全てのリストに対して行う。
この工程から、全体グループのC3Mである、M×Nの行列であるMが、それぞれが独立した各部分グラフに対応する各独立したC3Mである、M=N行列であるM に分解される。これらの行列の次元は以下の特性を満たす。
この工程の後、全体グラフは独立した部分グラフに分解され、全体グラフのC3MであるMも、独立した部分グラフごとのC3MであるM に分解される。
内の各行が、パス内の閉じたサイクルを表し、ある独立した部分グラフのための連結性行列M は、ゼロ要素を含む場合があり、これは、その部分グラフ内に閉じたサイクルがないことを意味することに留意されたい。
上記の例において、3つの独立した部分グラフのためのC3Mは、以下である。
第3の部分グラフのためのMは空であることに留意されたい。
工程5:部分グラフMごとにC3Mを独立した行列MSRに縮約する。
部分グラフごとに工程4から生成されたC3Mにおいて、いくつかの行は互いに独立しておらず、これは、M内に列挙された閉じたサイクルが独立していないことを意味する。例えば、上記で示す例において、部分グラフ1について、3つの独立したサイクルが存在するが、6つ全ての閉じたサイクルが連結性行列M に列挙されている。それらのうちの3つは必ずしも必要でない。
この工程において、各部分グラフのC3MであるM は、独立した行ベクトルのみを含む行列に縮約される。独立した行ベクトルのみを含む変換された行列をRC3M(縮約されたサイクルクロージャ連結性行列(Reduced Cycle Closure Connectivity Matrix))と呼び、M SRと表す。
行列M を行列M SRに縮約する多くの方法が存在する。ここでは単純な方法を列挙する。
工程5a:M の最初の2つの行に新たな2×N行列Mを形成させる。
工程5b:det|MM|を計算する。抑制がゼロでない場合、2つの行は独立している。抑制がゼロの場合、2つの行は相互依存しており、第2の行を削除する。
工程5c:M の第3の行をMに入れ、工程5bを繰り返す。
工程5d:M 内の全ての残りの行について工程5cを繰り返す。
この工程の後、部分グラフごとにM SRが取得される。M SRは独立した行ベクトルのみを含み、これは、独立した閉じたサイクルのみが行列内に列挙されていることを意味する。
上記の例において、第1の部分グラフのためのMSRは以下である。
C3M内の行の順序および行列を縮約するアルゴリズムに依拠して、部分グラフごとのMSRは一意ではないが、MSR内の行数は、行の順序、および縮約を行うアルゴリズムに対し独立している。
この工程の後、縮約されたサイクルクロージャ連結性行列MSRが独立した部分グラフごとに取得される。MSRは各部分グラフ内に独立したサイクルのみを含む。以下において、独立した部分グラフごとにサイクルクロージャ方程式を解く。
工程6:独立した部分グラフごとにサイクルクロージャ方程式を解く。
この工程は、部分グラフごとに、ヒステリシスを有しないリガンドのN個の対について、自由エネルギーの1組の最適推定値を生成し、また、確率を最大にする。
2つの異なる事例が存在する。
事例a:部分グラフ内に閉じたサイクルが存在しない。このとき、この事例に対する解は以下となる。
=E
=0
上記に示す例において、第3の部分グラフは閉じたサイクルを一切有しない。このため、第3の部分グラフのための解は以下となる。
=E
=0
事例b:部分グラフ内にm個の独立した閉じたサイクルが存在する。
この事例では、n個の要素および対応するRC3Mである、M=MSR(m×n行列)を有する最終リスト組S内のリストLに対応する部分グラフごとに、以下の関数、
ここで、i∈L
が、以下の制約、
ここで、j∈{1,2...m}、i∈L
の下で最小化される。
ラグランジュ乗数を用いて、以下の関数、
を、以下の制約、
ここで、j∈{1,2...m}、およびi∈L
の下で最小化する必要がある場合がある。ここで、Cはラグランジュ乗数の係数である。
を解いて、本方法は、
を確立する。
ここで、M jiはMjiの転置である。
行列式において書かれると、
であり、以下の2組の式がもたらされる。
式(1)を式(2)に代入して、以下の式を得る。
RC3M行列MおよびベクトルEの双方が知られているので、式が解かれ、係数ベクトルCを得ることができる。係数が解かれた後、式(1)は、シミュレーションのn個の対について最良の自由エネルギー推定量をもたらす。
工程7:可能な相対結合自由エネルギー計算パスごとに誤差推定値を得る。
上記で導入された仮説によれば、閉じたサイクルに沿った相対自由エネルギー計算の和は、標準偏差
を有するガウス分布である。ここで、nは閉じたサイクル上のメンバー数である。この閉じたサイクル上のリガンドの対間の計算される差ごとの誤差は、
であり、ここで、Δは閉じたサイクルのヒステリシスである。
閉じたサイクル上のリガンドの対ごとに、閉じたサイクル上のリガンドの対間の計算される自由エネルギー差の誤差が、そのサイクルのヒステリシスによって推定され得る。
より誘導形の形式で書かれると、C3MであるM(ここでは縮約されていないサイクルクロージャ連結性行列であることに留意されたい)の行ごとに、以下の誤差推定値がサイクル上の各メンバーに割り当てられ得る。
全ての閉じたサイクルについて、すなわちM内の全ての行について式(4)に従って誤差計算を行った後、相対結合自由エネルギー推定値iのための最終誤差推定値が全ての行からの推定値の最大値として選択される。換言すれば、
である。
工程6および工程7の後、n個の相対自由エネルギーのための最良自由エネルギー推定値、およびまた独立した部分グラフごとのこれらの関連するエラーバーを得る。
工程8:組内のリガンドの任意の対間の自由エネルギー差の推定値およびこれらの関連するエラーバーを報告する。
前の工程において、本方法は既に、各独立した部分グラフのリガンドのn個の対について、最良自由エネルギー推定値およびこれらの関連するエラーバーを提供している。全ての独立した部分グラフからこれらのデータを共にマージすることによって、以下の出力が生じる。
上記で列挙されていないリガンドの任意の対について、本方法は、2つのリガンドを連結することができるグラフ上の全ての可能なパスを列挙し、次に、パスの各エッジ上の自由エネルギーおよびまた誤差を総和する。自由エネルギーはパスから独立しているが、誤差はパスに依拠する場合がある。報告する全ての誤差の最大値は、具体的な式で書かれ得る。
ここで、
であり、最大値は、リガンドLおよびリガンドLを連結する全ての可能なパスについて取られる。この工程において、自由エネルギー推定値および誤差は、自由エネルギー計算が実行されない(グラフにおいて直接連結されていない)リガンドの対についてのみ計算されることに留意されたい。自由エネルギー計算が実行されるリガンドの対についての自由エネルギー推定値および誤差は、前の工程において計算される。
当業者にとって、上記において、閉じたサイクル(複数の場合もある)について観察されるヒステリシス(複数の場合もある)を引き起こす、確からしい自由エネルギー差およびこれらの誤差の確率モデルのコンピュータ実装を開発し、また、そのような確率モデルを所与として、自由エネルギー差およびこれらの誤差の最適な予測を行うための、多くの様々な手法が取られ得ることが明らかであるはずである。例えば制限するものではないが、行列またはグラフによる方法を用いて、必要とされるデータ構造を作成することができ、行列代数またはグラフ理論による方法を用いて確率モデルを構築することができ,最大尤度法またはベイズ法を用いて、ヒステリシス(複数の場合もある)と矛盾しないようにモデルをパラメーター化することができる。先行するセクションにおける代数行列式は、本発明の特定の実施形態にすぎず、経路の区画(leg)の最も確からしい誤差がベネット誤差、ブートストラップ誤差または双方に加算されると仮定することを含む、多くの方法で容易に一般化され得る。同様に、上記代数行列式は、ガウス分布だけでなく、制限するものではないが、ローレンツ分布、レヴィ分布、レイリー分布、デルタ分布および一様分布等の他の分布を用いるように一般化され得る。
したがって、閉じたサイクル(複数の場合もある)について観察されるヒステリシス(複数の場合もある)を引き起こす、確からしい自由エネルギー差およびこれらの誤差の特定の確率モデルを構築し、また、そのような確率モデルを所与として、自由エネルギー差およびこれらの誤差の最適な予測を行うために検討され得る多岐にわたる手法は、本明細書に記載される本発明の興味深い実施形態であろう。
様々な特定の受容体およびリガンドに対する様々な特定の相対結合自由エネルギー計算への本発明の適用の例示的な実施例
FEP/REST相対自由エネルギー計算アルゴリズム
本発明は、相対自由エネルギー計算(例えば、明確な溶媒モデル計算)の精度および信頼性を改善する。そのような精度は、異なるリガンドが結合するときに結合ポケットを取り囲むタンパク質残基が大きく動く場合、または2つのリガンドが異なる結合モードを採用するか、もしくは1つもしくは複数の変性結合モードが現れる場合に、達成するのが特に困難である4,11,19。このような事例では、全ての関係するコンフォメーションをサンプリングすることによって、自由エネルギー差の推定値の精度が改善するが、異なるコンフォメーション間で交換するための移行時間が、ほとんどのFEP/MDシミュレーション長のタイムスケールでアクセス可能となるには長すぎる場合がある。
ここで、本発明者らは、近年開発された相対自由エネルギー計算法であるFEP/RE
STを用いる方法の有用性を説明する、相対結合自由エネルギー計算の特定の組を提示する。ワンら(Wang et al.)12によって導入されたFEP/RESTは、強化されたサンプリング法であるRESTを、効率的なラムダホッピングプロトコルを通じてFEP計算に組み込み、容易にアクセス可能なシミュレーション時間内で相対タンパク質−リガンド結合親和性計算における関係するローカル構造再配列をサンプリングする。本発明者らはまた、特定の選択された相対結合自由エネルギー計算方法と独立して、本発明の有用性を同様に説明する、より定型的なFEP/MD相対自由エネルギー計算も提示する。
FEPは、λ値によって表される一連の別個の工程において系間でアルケミカル的に(alchemically)変換することによって、2つの系間の自由エネルギー差を計算することを伴う。ここで、λは、初期状態の場合の0から最終状態の場合の1まで変動する。FEP/RESTは、タンパク質残基およびリガンドを含むことができる結合ポケット(「ホット」領域と呼ぶ)を取り囲む局所領域のための潜在エネルギーを変更する。中間λウィンドウについて、局所領域のための潜在エネルギーは1未満の係数でスケーリングされる。このようにして、エネルギー障壁が下げられ、これらの中間λウィンドウにおいて様々なコンフォメーションの効率的なサンプリングが可能になり、様々なコンフォメーションがハミルトニアンレプリカ交換法を通じて最終状態に伝搬される15,22,23。潜在的なエネルギーがスケーリングされる領域を「ホット」領域と呼ぶ。なぜなら、潜在的なエネルギーへのローカル寄与が、その領域の有効温度が高くなるように、より小さな値にスケーリングされているためである。しかし、この類推は、シミュレーション内においてより高い運動エネルギーを実際に有する粒子には引き継がない。FEP/RESTアルゴリズムに関する詳細は、本願明細書に援用される、ワンら(Wang et al.)12によるFEP/RESTの研究において記載されている。
REST強化型サンプリングのための「ホット」領域は、SARの研究において変異したリガンド官能基を含むように構成される。リガンド官能基が芳香環に付着されると、芳香環も「ホット」領域内に含まれ、環がREST強化型サンプリングを通じてフリップすることが可能になる。REST「ホット」領域のための効率的な温度プロファイルは、参考文献26の式9に従って計算され24、レプリカ交換の予測受容比を0.3になるように設定し、最適値は、必要なレプリカ数と交換効率との間のトレードオフを反映する。通常のFEP計算およびFEP/REST計算の双方について合計12個のλウィンドウが用いられる。初期状態に一意な静電相互作用は、レナード・ジョーンズ(LJ)相互作用の前にオフにされ、最終状態に一意なLJ相互作用は静電相互作用の前にオンにされた。結合された相互作用は、初期状態から平滑に最終状態にされる。LJ相互作用のコアは、シミュレーションにおける特異性および不安定性を回避するように軟化された25。本発明による現行のシミュレーションにおいて、SARの研究16において置換基が変更されたベンゼン環が「ホット」領域に含められ、合計で12個のλウィンドウが達成される最高有効温度は概ね900Kである。
FEP/RESTおよびFEP/MDの様々な相対自由エネルギー計算の詳細
デズモンド(Desmond)26,27において実施されるリガンド官能基変異モジュールが計算をセットアップするのに用いられた28。OPLS2005力場29,30がSPC31水モデルと共にタンパク質およびリガンドのために用いられた。シミュレーションのための開始構造は、ID lhlq、lhlr、lhls、loiu、loi9およびloiyを有するPDB構造から取られた16。PDB内に複数のコンフォメーションが存在した場合はいつでも、シミュレーションにおいて用いるために第1のコンフォメーションを選択した。タンパク質がタンパク質調剤ウィザードを用いて調剤され32,33、この間、7.0のpHを仮定してプロトン化状態が割り当てられた34。サイクリンAはCDK2と共に保持され、全ての計算について、受容体の一部として扱われた。N
イオンまたはCIイオンが、電気的中性を維持するために加えられた。系は、デフォルトのデズモンド緩和プロトコルを用いて緩和および平衡化された。デズモンド緩和プロトコルは、一連の最小化および短い分子動力学シミュレーションを伴う。通常のFEP計算およびFEP/REST計算の双方について合計12個のλウィンドウが用いられた。製造段階は、複雑なシミュレーションの場合、2ns続き、溶媒シミュレーションの場合、5ns続いた。近傍のラムダウィンドウ間のレプリカ交換が1.2psおきに試行された。製造段階は、FEP/MDおよびFEP/RESTを用いてサンプリングされた。ベネット受容比法(BAR)35を用いて自由エネルギーが計算された。ブートストラッピング19,36およびBAR解析誤差予測19,36,37の双方を用いて自由エネルギー計算ごとに誤差が推定され、2つの誤差のうちの大きい方が報告された。
本発明の特定の適用による予測の一貫性および信頼性の評価
最も単純には、共通参照リガンドから全てのFEPシミュレーションを実行することによって、相対タンパク質−リガンド結合親和性FEP計算におけるリガンドの全体組について相対結合親和性を順位付けすることができる。更に、計算ごとに完全に収束した結果を取得する場合、最終的な予測は理論的に、相対結合自由エネルギー計算を行うために選択されるパスと独立している。例えば、3つのリガンドA、BおよびCの場合、リガンドAとリガンドCとの間で相対結合親和性を取得するための2つの戦略、すなわち(1)AからCまでパスを直接サンプリングする、または(2)AからBおよびBからCの2工程でパスをサンプリングし、次に、2つの取得した自由エネルギーを合算する、が存在する。理論的に、上記の2つの方法からの最終的な収束した自由エネルギー推定値は同じであるはずである。一方、実際には、ベネット誤差限界によって特徴付けることができる位相空間のサンプリングにおける不規則変動に起因する不偏誤差と、ベネット誤差限界によって特徴付けされない位相空間の系統的に不完全なサンプリングに起因したバイアス誤差とを含む、各計算における誤差に起因して、上記の2つのパスからの分散および平均値の双方が、通例、幾分異なっている38。これらの制限を所与として、取得した結果の信頼性を評価することが重要である。
予測の一貫性および信頼性に関する追加情報を得るために、全てのパスについてサイクルクロージャを含む。上記で与える例において、2つのパスからの結果が指定された閾値以内まで一致する場合、これは予測に一貫性があり、利用される力場の制限内で信頼性がある可能性が高いことを示す。一方、2つのパスからの結果が、ある閾値を超えて異なっている場合、これは、結果が収束していない場合があり、予測に信頼性がない場合があることを示す場合がある。閾値は、各サイクル内のメンバーの数、およびサイクル内の区画について予期する誤差に依拠する。本発明のこの特定の実施形態は、予測の信頼性、およびサイクルごとの適切な閾値をどのように適応的に割り当てるかを厳密に評価する。更に、パス内にサイクルクロージャを含めると、2つの状態間の自由エネルギー差を計算する複数の独立した方法が存在する。本発明のこの特定の実施形態では、閉じたサイクルに沿って取得された複数の自由エネルギー推定値からの最適予測も報告される。この実施形態において、本発明はまた、各サイクルのヒステリシスからの自由エネルギー計算に関連する収束誤差に関する情報も直接提供する。
本明細書において検討される方法は、これらの工程を実行するようにプログラムされたコンピュータシステムによって実行される。図15において、システムは、コンピュータ(複数の場合もある)110と、データストア120と、プログラムモジュール130とを備える。コンピュータ命令は、1つまたは複数の非一時的コンピュータ可読媒体に記憶される。図16は、全ての自由エネルギー計算パスについての計算される自由エネルギーの列挙(302)と、全ての閉じたサイクルの列挙およびサイクルクロージャ連結性行列の組み立て(304)と、独立した部分グラフへの全体グラフの分解(306)とを含む本方法における工程を示す。
以下で、ある特定の例を検討し、以下のように関係する表を提示する。
表1:参照リガンドlhlqと比較した、結晶構造を有する5つのリガンドについてFEP/MDおよびFEP/RESTにより予測される相対結合自由エネルギー。
表2:本発明の実施形態によって導出される式を用いるFEP/MD計算およびFEP/REST計算からの、結晶構造を有する6つのリガンドについての最終自由エネルギー予測。
表3:FEP/RESTを用いて研究されるCDK2阻害剤およびこれらの化合物#の構造。
表4:結晶構造を有しない追加の10個の化合物についての、FEP/RESTにより予測される相対結合自由エネルギー。
表5:本発明の実施形態によって導出される式を用いる、リガンドの全体組についての最終自由エネルギー予測。
表6:jnk1リガンドの8つの相対結合自由エネルギー計算パスについてのFEP/REST結果。
表7:jnk1に結合している7つのリガンドについての予測結合親和性およびそれらの関連誤差。
表8:BACEリガンドのための7つの7相対結合自由エネルギー計算パスについてのFEP/REST結果。
表9:BACEに結合している6つのリガンドについての予測結合親和性およびそれらの関連誤差。
表10:シタロンデヒドラターゼリガンドの9個の相対結合自由エネルギー計算パスについてのMC/FEP結果。
表11:シタロンデヒドラターゼに結合している3つのリガンドについての予測結合親和性およびそれらの関連誤差。
表12:図14において描かれる4つの状態間のサイクルクロージャにより予測される自由エネルギー差およびそれらの関連誤差。
結果および検討
結晶構造を有するリガンドにおける性能
図5に表示される、CDK2−サイクリンA受容体に結合している6つのリガンドについて、相対結合親和性を予測するためのFEP/MDシミュレーションおよびFEP/RESTシミュレーションが行われた。これらは、PDB ID lhlq、lhlr、lhls、loi9、loiuおよびloiyを有するホロ複合体ごとに利用可能な、結晶構造を有する6つのみのリガンドであり16、これらのリガンドのための実験による結合親和性データは、同じ方法を用いる同じ公表文献を基にした。このため、リガンドの結合モードは結晶学から既知であるので、ここで報告される計算は、本質的に純粋にスコアリングの演習である。これらの結晶構造において、いずれのリガンドが結合しているかに関わらず、CDK2受容体・コンフォメーションは本質的に同じである。このため、シミュレーション収束を大きく制限するタンパク質コンフォメーション変化のサンプリングは予期しなかった。計算において、5つ全ての摂動のための開始構造として、lhlqからのタンパク質コンフォメーションおよびリガンドを用いることを選択した(図5において青い矢印で描画される)。なぜなら、組内の全ての他のリガンドは、リガンドlhlqのベンゼン環上に様々な置換基を付加することによって生成されるためでる。
FEP/MD結果とFEP/REST結果との比較
結晶構造を有するリガンド間の相対結合自由エネルギー計算パスについてのFEP/MD結果およびFEP/REST結果が表1に与えられる。予測と、実験による結合親和性データとの相関が図6に表示される。実験による結合親和性の〜14.64kJ/mol(〜3.5kcal/mol)の範囲に関わらず、FEP/MDは、5つの複合体(参照
複合体lhlqを除外する)がほぼ同じ結合親和性を有し、結果として0.32のR値が得られることを予測する。比較により、FEP/REST結果は、実験値と高く相関し(R=0.91)、実験値からのFEP/REST結果の偏差は、全てのリガンド対について3.347kJ/mol(0.8kcal/mol)未満である。
FEP/MD結果およびFEP/REST結果の比較から、2つの方法からの複合体loi9、loiuおよびlioyのための予測は、本質的に同じであり、実験結果との改善された相関の主な理由は、FEP/RESTを用いたリガンドlhlsおよびlhlrについてのより良好な結合親和性推定値を基にしているようである。以下で、これらの2つの事例についてFEP/RESTがFEP/MDよりも大幅に性能が優れている理由を検討する。
リガンドlhlrについてのFEP/MD軌道およびFEP/REST軌道の検査は、2−クロロ置換ベンゼン環がFEP/REST軌道において数回フリップする一方で、FEP/MD軌道では環は初期コンフォメーションにトラップされたままであることを示した。結晶構造のコンフォメーションのうちの1つに対応する初期コンフォメーション、およびFEP/REST計算において観察される代替フリップコンフォメーションが図7に表示される。興味深いことに、リガンドlhlrについて、堆積されたX線結晶構造における電子密度は、FEP/REST計算において見られる交互の結合モードに対応する代替リガンド結合モード(図7の右パネル)も示した。
lhlsについて、結晶構造においてモデル化される結合モードに加えて、FEP/REST軌道では別のコンフォメーションがサンプリングされるが、FEP/MDシミュレーションではサンプリングされない。図8は、結晶構造において見られる結合モードおよびFEP/REST計算においてサンプリングされる代替結合モードを表示する。結晶構造では、スルホンアミド基はAsp86との2つの水素結合(HB)を行い、一方は主鎖との水素結合であり、もう一方は側鎖との水素結合である。FEP/RESTシミュレーションにおいてサンプリングされる代替結合モードでは、スルホンアミド基は結晶構造に対しCS結合の回りを約120°回転する。それに応じて、結合ポケットを取り囲む残基、特にGln85およびAsp86が再配列し、スルホンアミド基とタンパク質残基との間に2つの水素結合が形成され、一方はAsp側鎖との水素結合であり、他方はGln85側鎖との水素結合である。X線結晶学における結合ポケットおよびリガンドを取り囲むこれらの数個の残基のB係数は、これらの基が非常に不安定であることを示す16。したがって、リガンドが溶媒内で2つの結合モード間で切り替わり得る可能性が非常に高い。FEP/RESTシミュレーション軌道では、結晶学的に観察される結合モードと代替結合モードとの占有比はほぼ60:40であり、結晶学的に決定されたモードに有利である。一方、この代替結合モードのサンプリングは、結合親和性の正確な予測のために非常に重要なようであり、FEP/MDと比較して、この種の相対結合自由エネルギーを正確に算出する際に、FEP/RESTのより高い有効性に対し責任を担う。興味深いことに、本発明は、実験データを参照することなくこれを決定することを可能にする。なぜなら、FEP/MDに関連する算出誤差は、本発明のこの特定の実施形態によって、高くなるように算出され(loiuおよびlhlsの場合、4.226kJ/mol(1.01kcal/mol)、ならびにloiy、loi9およびlhlsの場合、〜2.929kJ/mol(〜0.7kcal/mol))、それに対し、FEP/RESTに関連する算出誤差は、本発明によって低くなる(全てのリガンドについて0.8368kJ/mol(0.2kcal/mol)〜1.674kJ/mol(0.4kcal/mol))ように算出されるためである。
本発明の特定の実施形態を用いた相対自由エネルギー計算の一貫性および信頼性の評価
FEP/RESTの一貫性および信頼性を評価するために、相対結合自由エネルギー計
算パス(図5)において3つのサイクルクロージャを形成する3つの更なるシミュレーションを実行した。これらのサイクルを形成する3つのパスのFEP/REST結果が表1の最後の3つの行に与えられる。本発明の特定の実施形態によって決定されたこれらのリガンドの結合親和性のための最終予測が表2に与えられる。3つ全てのサイクルについて、サイクルは、異なるパスから3.347kJ/mol(0.8kcal/mol)未満の差異で自己矛盾なく閉じており、これは、自由エネルギーが良好に収束し、基礎をなす力場の制限内で予測の信頼性が高いことを示す。
一方、サイクルが十分に閉じており、様々なパスから計算される自由エネルギーがややタイトな閾値内で一致している場合であっても、これらは正確に同じではない。このため、同じリガンド対について、リガンド間のパスをどのようにトラバースするかに依拠して、自由エネルギー差のための複数の様々な推定値を有する。次に、自由エネルギーのための統計的に最良の推定値を取得するために、計算において生成される全ての情報をどのように最良に組み込むか?という問が残される。本発明の特定の実施形態を用いて、自由エネルギーの最適推定値、およびこれらの予測に関連する誤差を決定する。ここで、全てのサイクルは良好に閉じており、サイクルクロージャを有する最終予測は、サイクルクロージャを有しない上記の予測と良好に一致し、これらの計算の高い信頼性を更に立証する。最終予測と実験結果との間の偏差は、全て2.929kJ/mol(0.7kcal/mol)未満であり、これらは実験データと非常に高い相関を有する(R=0.92)。
本発明のこの特定の実施形態が、FEP/MD相対自由エネルギー計算を用いて算出された同様の閉じたサイクルに適用されたときと対象的に、リガンドlhlrおよびlhlsを伴う閉じたサイクルのヒステリシスは非常に大きく(それぞれ7.322kJ/mol(1.75kcal/mol)および5.648kJ/mol(1.35kcal/mol)の大きさ)、FEP/MD計算が収束していないことを示す。本発明のこの特定の実施形態によるサイクルクロージャ自由エネルギー推定値を用いると、これらのFEP/MD自由エネルギー計算の誤差は、FEP/REST結果(それぞれ1.464kJ/mol(0.35kcal/mol)および1.046kJ/mol(0.25kcal/mol)の誤差)よりもはるかに大きい(それぞれ4.226kJ/mol(1.01kal/mol)および2.845kJ/mol(0.68kal/mol))。
結晶構造を有しないリガンドにおける性能
本発明によるモデルを更に実証するために、ホロ複合体に対し利用可能な結晶構造を有しない同じ受容体に結合する別の10個のリガンドについて更なるFEP/REST計算が実行された。これらの10個のリガンドは、ハンドキャッスル(Handcastle)16によって同じ公表文献からランダムに選択された。上記で言及した結晶構造を有するリガンドと同じ方法を用いて結合親和性が測定され、これらは同じコアを保つ。元の公表文献16のように、リガンドの構造およびこれらの対応する複合体番号が表3に与えられる。これらのリガンドについてのFEP/REST予測相対結合親和性が、実験データと共に表4において報告される。サイクルクロージャは、これらのリガンドのためのパスにおいて構築され(図9)、サイクルクロージャのヒステリシスは全て4.184kJ/mol(1.0kcal/mol)未満であり、これは、計算が高度に収束していることを示す。本発明のこの特定の実施形態による最終的な予測相対結合親和性が表5において報告される。相対結合自由エネルギー計算パスにおいて構築されるサイクルクロージャを有するリガンドについて、自由エネルギー予測に関連する誤差も表5において報告される。予測相対結合親和性と、リガンドの全体組のための実験データとの間の相関(結晶構造を有する6つのリガンドおよび結晶構造を有しない10個のリガンド)が図10に表示される。結晶構造を有しないこれらのリガンドについて、FEP/REST自由エネルギー計算に適用されたときに本発明のこの特定の実施形態の性能が良好であることは明らかであり、手法の移行可能性を更に実証している。実験データと比較した予測結合親和性の平
均偏差は1.841kJ/mol(0.44kcal/mol)であり、R値は0.82である。
結論
上記において、複数の実施形態において、本方法が、近年開発された自由エネルギー計算FEP/REST法およびより定型的に用いられるFEP/MD自由エネルギー計算法に適用され、CDK2−サイクリンA受容体に結合する一連の同種リガンド間の相対結合親和性を計算することができることを示した。本発明は、FEP/REST自由エネルギー計算予測とFEP/MD自由エネルギー計算予測との比較を容易にした。結晶構造を有する6つのリガンドについて相対結合親和性を順位付けする際に、より定型的なFEP/MD法は性能が不良であったが、本発明は、FEP/MD予測に関連する誤差が高いことを示す値を提供した。対照的に、FEP/RESTにより計算された相対結合親和性は、実験データと極めて一致し、本発明の適用により収束することが示された。結晶構造を有しない10個のリガンドを含むより大きなデータセットに対しFEP/REST法によって実行される相対自由計算への本発明の適用は、同種リガンドの相対結合親和性を正しく順位付けする本発明の能力を更に実証した。
本発明は、任意のタイプの相対自由エネルギー計算手順に関連するサイクルクロージャ計算から導出された情報を用いて自由エネルギーの一貫性および信頼性を評価する手段を提供する。本発明は、予測の一貫性および信頼性を判定する明確な判断基準、および良好に形成された誤差限界を有する自由エネルギーの最適推定値を提供する。CDK2−サイクリンA系列への本発明の適用は、FEP/REST相対自由エネルギー計算を用いる本発明による予測の信頼性が高いことを示し、これは、予測が実験データと極めて一致していることによっても証明される。同様に、本発明はFEP/MD予測の信頼性がより低いことを妥当に決定した。
本発明の一般性および有用性において、他の系および他の相対結合自由エネルギー計算への本発明の様々な実施形態の更なる適用を含む。
多岐にわたる相対結合自由エネルギー計算方式を用いた多岐にわたる系への本発明の様々な実施形態の更なる適用
I.JNK1キナーゼへの本発明の一実施形態の適用
相対結合自由エネルギー計算パスにおける2つのサイクルクロージャを有するjnkl受容体と結合するリガンドのサブセットについてFEP/REST相対結合自由エネルギーシミュレーションが実行された(図11)。リガンドのサブセットのためのリガンド番号は[2,6,7,9,10,12,13]であり、8つの相対結合自由エネルギー計算パスのための8つのFEP/REST結果が表6に列挙される。
サイクルクロージャの最良エネルギー推定量および誤差推定量を用いて、7つのリガンドについての結合親和性およびこれらの関連するエラーバーが表7において報告される。
サイクルクロージャ推定値は、シミュレーションの力場において系統誤差を補正することができないことに留意されたい。このため、リガンドのうちの2つ(リガンド12および13)のための予測結合親和性は、実験値と比較して6.276kJ/mol(1.5kcal/mol)よりも大きく離れる。この偏差は、力場における誤差または実験測定値における不確実性のいずれかに起因する場合がある。しかし、予測結果と実験値との全体相関は非常に良好である。
II.BACEへの本発明の一実施形態の適用
相対結合自由エネルギー計算パスにおける2つの独立したサイクルクロージャを有するBACEに結合するリガンドのサブセットについてFEP/RESTシミュレーションが実行された(図12に示す)。リガンドのサブセットのためのリガンド番号は[4j,4
o,4p,17d,17g,17h]であり、7つの相対結合自由エネルギー計算パスのための7つのFEP/REST結果が表8に列挙される。
サイクルクロージャの最良自由エネルギー推定量および誤差推定量を用いて、6つのリガンドについての結合親和性およびこれらの関連するエラーバーが表9において報告される。
ここでもまた、リガンド17hについての結合親和性は、約8.368kJ/mol(2kcal/mol)だけ過剰予測されるが、予測結果と実験値と全体相関は非常に良好であることに留意されたい。
III.シタロンデヒドラターゼに結合するリガンドのFEP/MC相対結合自由エネルギー計算への本発明の一実施形態の適用
活性部位における水結合を有するシタロンデヒドラターゼおよび有しないシタロンデヒドラターゼに結合する3つのリガンド間の相対結合親和性がFEP/MCを用いて計算される39。4つの独立サイクルクロージャを有するこれらのシミュレーションのための相対結合自由エネルギー計算パスが図13に表示される。相対結合自由エネルギー計算のための計算される結合親和性が表10において報告される。
サイクル[L1(H2O),L2(H2O),L3(H2O)]のヒステリシスは、5.858kJ/mol(1.4kcal/mol)よりもはるかに大きい17.99kJ/mol(4.3kcal/mol)であり、これは、これらの計算が収束していないことを示し、このサイクルの内部の計算される結合親和性も実験データからの大きな偏差を有する。同様に、サイクル[L3(H2O),L3,L2,L2(H2O)]について、ヒステリシスは、5.858kJ/mol(1.4kcal/mol)よりも大きい6.276kJ/mol(1.5kcal/mol)であり、これは、これらの計算にも信頼性がないことを示す。
他方で、他のサイクル[L1(H2O),L1,L3,L3(H2O)]および[L1,L2,L3]のヒステリシスは非常に小さく(それぞれ、0.8368kJ/mol(0.2kcal/mol)および2.092kJ/mol(0.5kcal/mol))、計算に信頼性があることを示す。上記に記載のサイクルクロージャ推定値を有する3つのリガンド間の最終的な予測相対結合親和性が表11において報告される。
IV.モデルエンクロージャーのための試験粒子挿入による相対結合自由エネルギーサンプリングへの本発明の一実施形態の適用
融合原子メタンと電荷を有するモデルエンクロージャーおよび電荷を有しないモデルエンクロージャーとの間の相対結合自由エネルギーが試験粒子挿入法を用いて計算される40。結合メタンを有するモデルエンクロージャーおよび結合メタンを有しないモデルエンクロージャーに帯電する自由エネルギーも、FEP/MDサンプリングを用いて計算される。相対結合自由エネルギー計算パスは、閉じたサイクルを形成し(図14)、サイクル上のエッジごとの関連自由エネルギーがここで報告される。
上記で記載したサイクルクロージャ解析を用いて、図16において描く4つの状態間の予測自由エネルギー差およびこれらの関連誤差が表12において報告される。
複数の実施形態が記載された。それにもかかわらず、本発明の趣旨および範囲から逸脱することなく種々の変更を行うことができることが理解されよう。

表1:参照リガンドlhlqと比較した、結晶構造を有する5つのリガンドについてF
EP/MDおよびFEP/RESTにより予測される相対結合自由エネルギー。結晶構造を有する6つのリガンドについて3つのサイクルクロージャを形成する3つの相対結合自由エネルギー計算パスの結果も表に含まれる。BAR解析誤差推定を用いて計算される自由エネルギーの誤差も表に含まれる。FEP/MDによる予測結果は、リガンドlhlrおよびlhlsについて実験データからの大きな偏差を有し(表における太字)、一方、FEP/RESTによる予測結果は、全て実験データと良好に一致する。自由エネルギーはkJ/mol(kcal/mol)単位で報告される。
表2:本発明の実施形態によって導出される式を用いるFEP/MD計算およびFEP/REST計算からの、結晶構造を有する6つのリガンドについての最終自由エネルギー予測。サイクルクロージャを用いる最終自由エネルギー予測についての、本発明の実施形態によって導出される式を用いる誤差推定値も表に含まれる。リガンドIhlqが参照として用いられ、このため、リガンドIhlqの偏差は設計により0である。リガンドIhlqがこの研究のために用いられる参照リガンドであるので、リガンドIhlqについてサイクルクロージャエラーバーは報告されず、リガンドIhlqの結合自由エネルギーは、プロット目的でリガンドIhlqの実験値に全く同一に設定されることに留意されたい。自由エネルギーはkJ/mol(kcal/mol)単位で報告される。
表3:FEP/RESTを用いて研究されるCDK2阻害剤およびこれらの化合物#の構造。
表4:結晶構造を有しない追加の10個の化合物についての、FEP/RESTにより予測される相対結合自由エネルギー。BAR解析誤差推定を用いて計算される自由エネルギーについての誤差も表において報告される。自由エネルギーはkJ/mol(kcal
/mol)単位で報告される。
表5:本発明の実施形態によって導出される式を用いる、リガンドの全体組についての最終自由エネルギー予測。サイクルクロージャを用いる最終自由エネルギー予測についての、本発明の実施形態を用いる誤差推定値も表に含まれる。リガンドIhlqが参照として用いられ、このため、リガンドIhlqの偏差は設計により0である。リガンドIhlqがこの研究のために用いられる参照リガンドであるので、リガンドIhlqについてサイクルクロージャエラーバーは報告されず、リガンドIhlqの結合自由エネルギーは、プロット目的でリガンドIhlqの実験値に全く同一に設定されることに留意されたい。リガンド20、31および32についてもサイクルクロージャエラーバーは報告されない。なぜならこれらの種は、誤差について閉じたサイクルを形成することが要求されるように、参照リガンド以外の他のリガンドに連結することが技術的に困難であったためである。自由エネルギーはkJ/mol(kcal/mol)単位で報告される。
表6:jnk1リガンドの8つの相対結合自由エネルギー計算パスについてのFEP/REST結果。
表7:jnk1に結合している7つのリガンドについての予測結合親和性およびそれらの関連誤差。
表8:BACEリガンドのための7つの相対結合自由エネルギー計算パスについてのFEP/REST結果。
表9:BACEに結合している6つのリガンドについての予測結合親和性およびそれらの関連誤差。
表10:シタロンデヒドラターゼリガンドの9個の相対結合自由エネルギー計算パスについてのMC/FEP結果。
表11:シタロンデヒドラターゼに結合している3つのリガンドについての予測結合親和性およびそれらの関連誤差。3つのリガンドについての予測結合親和性は比較的大きな誤差を有するにもかかわらず、非常に大きな誤差を有する相対結合自由エネルギー計算パスはフィルタリング除去され、正しい順位が予測される。
*注:表において報告される結合親和性はリガンド1と比較した相対結合親和性である。
表12:図14において描かれる4つの状態間のサイクルクロージャにより予測される自由エネルギー差およびそれらの関連誤差。Mは融合原子メタンを表す、Pは疎水性プレートを表す、CPは帯電プレートを表す、MPは融合原子メタンと結合した疎水性プレートを表す、MCPは融合原子メタンと結合した帯電プレートを表す。

Claims (17)

  1. 個々のリガンド組メンバーと受容体との間で複合体を形成するための、前記受容体と1組のリガンドの個々のメンバーとの間の結合の相対強度を決定するコンピュータ実装された方法であって、
    a.コンピュータが、少なくとも1つの閉じたサイクルを形成するリガンド対の組について、前記閉じた熱力学的サイクルについて観察される前記ヒステリシスの大きさを確率的に導く、前記閉じた熱力学的サイクルの区画の各々に沿った結合自由エネルギー差と前記結合自由エネルギー差に関する誤差分布とを決定する工程と、
    b.前記コンピュータが、前記aの工程において決定された確率モデルに含まれる前記閉じた熱力学的サイクルにおける区画ごとの最も確からしい結合自由エネルギー差を決定する工程と、
    c.前記コンピュータが、前記bの工程における前記閉じた熱力学的サイクルにおける各区画に沿ったリガンド対ごとの前記最も確からしい結合自由エネルギー差に関連する最も確からしい誤差を決定する工程と、
    d.前記コンピュータが、コンピュータユーザに対する、前記cの工程における前記結合自由エネルギー差および前記誤差を表す値を出力する工程と、を備える、方法であって、同方法はさらに、
    前記コンピュータが、前記結合自由エネルギー差の計算のための自由エネルギー、ならびにこれらの対応する初期リガンドおよび最終リガンドのリガンド対を列挙する工程と、
    前記コンピュータが、閉じたサイクルを形成するリガンド対を探索して発見し、同発見したリガンド対を表す連結性行列を生成する工程と、
    前記コンピュータが、全体グラフを独立した部分グラフに分解する工程であって、前記独立した部分グラフの各々は、他の独立した部分グラフと連結する閉じたサイクルを有していない、工程と、
    前記コンピュータが、前記独立した部分グラフの各々に対応する連結性行列を入手する工程と、
    前記コンピュータが、前記部分グラフの各々に対応するそれぞれの連結性行列を、独立した行ベクトルのみを含む独立した行列に縮約する工程と、
    前記コンピュータが、前記部分グラフごとに、前記リガンド対について最も確からしい結合自由エネルギー推定値を生成する工程と、
    前記コンピュータが、前記最も確からしい結合自由エネルギー推定値に関連する戦記最も確からしい誤差を決定する工程と
    を備える方法。
  2. 前記誤差を決定する工程は、前記コンピュータが、2つ以上の閉じた熱力学的サイクルの区画に沿ったリガンド間での結合自由エネルギー差を解析する工程と、前記コンピュータが、閉じた熱力学的サイクルの各々に関するヒステリシスの大きさを決定する工程とを含む、請求項1に記載の方法。
  3. 前記cおよびdの工程は、前記コンピュータが、関数
    を最小にする区画ごとの1組の自由エネルギー値を、制約
    を用いて決定することを含み、
    Eiは、所与の区画iについての計算される自由エネルギー差であり、
    は、所与の区画iについての理論上の自由エネルギー差であり、
    σは、区画iについての前記計算される自由エネルギー差の標準偏差であり、全ての閉じたサイクルについての前記理論上の自由エネルギー差の和は0である、請求項1に記載の方法。
  4. 前記受容体はタンパク質である、請求項1に記載の方法。
  5. 前記リガンドは同種である、請求項1に記載の方法。
  6. 工程1a.前記aの工程における前記観察されるヒステリシスの前記確率モデルの構築においてガウス分布が仮定される、請求項1に記載の方法。
  7. 自由エネルギーシミュレーションに関連する前記誤差分布は、工程1aにおいて一様であると仮定される、請求項1に記載の方法。
  8. 自由エネルギーシミュレーションに関連する前記誤差分布は、工程1aにおいてベネット誤差に加算されると仮定される、請求項1に記載の方法。
  9. 前記閉じた熱力学的サイクルの連結性はグラフとして表される、請求項1に記載の方法。
  10. 前記閉じた熱力学的サイクルの連結性は行列として表される、請求項1に記載の方法。
  11. 前記確率的決定はグラフ理論法を実行することを含む、請求項1に記載の方法。
  12. 前記aの工程における前記決定は行列代数法を実行することを含む、請求項1に記載の方法。
  13. 前記aの工程における前記決定はベイズ法を実行することを含む、請求項1に記載の方法。
  14. 前記aの工程における前記決定は最大尤度法を実行することを含む、請求項1に記載の方法。
  15. 請求項1に記載の方法を実行するための有形の非一時的な命令を含むコンピュータ可読記憶媒体。
  16. コンピュータと、請求項1に記載の方法を実行するための非一時的なコンピュータ可読命令を記憶するコンピュータ可読記憶媒体とを備えるコンピュータシステムであって、前記コンピュータは、前記媒体から前記命令を読み出し前記命令を実行するように構成されている、コンピュータシステム。
  17. プロセッサと、請求項1に記載の方法を実行するための非一時的なコンピュータ可読命令を記憶するメモリとを備える汎用グラフィック処理ユニットであって、前記プロセッサは、前記メモリから前記命令を読み出し前記命令を実行するように構成されている、汎用グラフィック処理ユニット。
JP2016501847A 2013-03-15 2014-03-13 相対結合親和性および誤差のサイクルクロージャ推定 Active JP6441301B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/840,039 US20140278295A1 (en) 2013-03-15 2013-03-15 Cycle Closure Estimation of Relative Binding Affinities and Errors
US13/840,039 2013-03-15
PCT/US2014/025425 WO2014151310A2 (en) 2013-03-15 2014-03-13 Cycle closure estimation of relative binding affinities and errors

Publications (2)

Publication Number Publication Date
JP2016515273A JP2016515273A (ja) 2016-05-26
JP6441301B2 true JP6441301B2 (ja) 2018-12-19

Family

ID=51531746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016501847A Active JP6441301B2 (ja) 2013-03-15 2014-03-13 相対結合親和性および誤差のサイクルクロージャ推定

Country Status (6)

Country Link
US (2) US20140278295A1 (ja)
EP (2) EP3836147A1 (ja)
JP (1) JP6441301B2 (ja)
DK (1) DK2972311T3 (ja)
ES (1) ES2853348T3 (ja)
WO (1) WO2014151310A2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107027140A (zh) * 2017-03-27 2017-08-08 武汉虹信通信技术有限责任公司 一种lte中各协议层用户实例一致性维护方法
US20220115094A1 (en) * 2020-02-25 2022-04-14 Shenzhen Jingtai Technology Co., Ltd. Free energy perturbation computation scheduling method used in heterogeneous cluster environment
CN111341391B (zh) * 2020-02-25 2023-12-01 深圳晶泰科技有限公司 一种用于异构集群环境中的自由能微扰计算调度方法
US11568961B2 (en) * 2020-12-16 2023-01-31 Ro5 Inc. System and method for accelerating FEP methods using a 3D-restricted variational autoencoder

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5854992A (en) * 1996-09-26 1998-12-29 President And Fellows Of Harvard College System and method for structure-based drug design that includes accurate prediction of binding free energy
US6560542B1 (en) * 2000-01-24 2003-05-06 The Cielo Institute Algorithmic design of peptides for binding and/or modulation of the functions of receptors and/or other proteins
AU2003220487A1 (en) * 2002-03-19 2003-10-08 Cengent Therapeutics, Inc. Discrete bayesian analysis of data
US20070026406A1 (en) * 2003-08-13 2007-02-01 Iconix Pharmaceuticals, Inc. Apparatus and method for classifying multi-dimensional biological data
JP2007511470A (ja) * 2003-10-14 2007-05-10 バーセオン リード分子交差反応の予測・最適化システム
WO2007106894A2 (en) * 2006-03-15 2007-09-20 The Board Of Trustees Of The University Of Illinois Neutralizing agents for bacterial toxins
US8140268B2 (en) * 2006-03-31 2012-03-20 Verachem, Llc Computational method for drug discovery and receptor design
US7756674B2 (en) * 2007-08-03 2010-07-13 The Trustees Of Columbia University In The City Of New York Methods of calculating differences of binding affinities between congeneric pairs of ligands by way of a displaced solvent functional
US9499580B2 (en) * 2009-12-02 2016-11-22 The Johns Hopkins University Method for incorporating internal polar and ionizable groups in proteins
WO2012109383A2 (en) * 2011-02-08 2012-08-16 University Of Louisville Research Foundation, Inc. Method of determining protein binding characteristics of a drug candidate
US9858395B2 (en) * 2011-05-23 2018-01-02 Schrodinger, Llc Binding affinity scoring with penalty for breaking conjugation between aromatic ligand groups
EP2718464A1 (en) * 2011-06-06 2014-04-16 Imperial Innovations Limited Methods to predict binding affinity of tspo imaging agents to tspo

Also Published As

Publication number Publication date
WO2014151310A3 (en) 2014-11-13
EP3836147A1 (en) 2021-06-16
EP2972311A2 (en) 2016-01-20
EP2972311B1 (en) 2020-11-11
DK2972311T3 (da) 2021-02-08
JP2016515273A (ja) 2016-05-26
EP2972311A4 (en) 2016-11-30
ES2853348T3 (es) 2021-09-15
US20190026423A1 (en) 2019-01-24
WO2014151310A2 (en) 2014-09-25
US20140278295A1 (en) 2014-09-18

Similar Documents

Publication Publication Date Title
Biswas et al. Metadynamics enhanced Markov modeling of protein dynamics
Wu et al. Linear-scaling time-dependent density functional theory based on the idea of “from fragments to molecule”
Boschitsch et al. Hybrid boundary element and finite difference method for solving the nonlinear Poisson–Boltzmann equation
Thomas et al. Simulating protein motions with rigidity analysis
Bowman et al. Network models for molecular kinetics and their initial applications to human health
JP6441301B2 (ja) 相対結合親和性および誤差のサイクルクロージャ推定
Sriluckshmy et al. Fully algebraic and self-consistent effective dynamics in a static quantum embedding
Zhang et al. A stochastic solution to the unbinned WHAM equations
Voelz et al. Surprisal metrics for quantifying perturbed conformational dynamics in Markov state models
Devaurs et al. Coarse-grained conformational sampling of protein structure improves the fit to experimental hydrogen-exchange data
Solomon et al. Method and advantages of genetic algorithms in parameterization of interatomic potentials: Metal oxides
Barros et al. Recent developments in multiscale free energy simulations
Deng et al. Connecting free energy surfaces in implicit and explicit solvent: An efficient method to compute conformational and solvation free energies
Ikebe et al. Simulation study on the disordered state of an Alzheimer's β amyloid peptide Aβ (12–36) in water consisting of random‐structural, β‐structural, and helical clusters
Caceres-Delpiano et al. The automated optimisation of a coarse-grained force field using free energy data
Bolhuis Sampling kinetic protein folding pathways using all-atom models
Harada et al. How low-resolution structural data predict the conformational changes of a protein: a study on data-driven molecular dynamics simulations
Lee et al. Docking-based Multi-objective Molecular optimization Pipeline using Structure-constrained Genetic Algorithm
Venske et al. A multiobjective algorithm for protein structure prediction using adaptive differential evolution
Romano et al. GRadient adaptive decomposition (GRAD) method: optimized refinement along macrostate borders in markov state models
Kirkpatrick et al. A new model for approximating RNA folding trajectories and population kinetics
Hsu et al. Replica Exchange of Expanded Ensembles: A Generalized Ensemble Approach with Enhanced Flexibility and Parallelizability
Doloszeski Exploring Phosphine Ligation States through QM/MM Simulations with Equivariant Graph Neural Networks
Meshkin Thermodynamics of Protein Conformational Changes by Umbrella Sampling and Free Energy Calculation
Reinhardt Variational Approaches to Free Energy Calculations

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170912

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20171212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180309

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180801

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181121

R150 Certificate of patent or registration of utility model

Ref document number: 6441301

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250