JP2010539580A - 動的分子の3次元構造の決定方法 - Google Patents

動的分子の3次元構造の決定方法 Download PDF

Info

Publication number
JP2010539580A
JP2010539580A JP2010524562A JP2010524562A JP2010539580A JP 2010539580 A JP2010539580 A JP 2010539580A JP 2010524562 A JP2010524562 A JP 2010524562A JP 2010524562 A JP2010524562 A JP 2010524562A JP 2010539580 A JP2010539580 A JP 2010539580A
Authority
JP
Japan
Prior art keywords
molecule
data
bond
population
variability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010524562A
Other languages
English (en)
Other versions
JP5555630B2 (ja
JP2010539580A5 (ja
Inventor
ブランデル、チャールズ、ダグラス
アーモンド、アンドルー
Original Assignee
コンフォーメトリックス リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コンフォーメトリックス リミテッド filed Critical コンフォーメトリックス リミテッド
Publication of JP2010539580A publication Critical patent/JP2010539580A/ja
Publication of JP2010539580A5 publication Critical patent/JP2010539580A5/ja
Application granted granted Critical
Publication of JP5555630B2 publication Critical patent/JP5555630B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本発明は、分子、特に、限定されるものではないが、ペプチド、炭水化物、タンパク質、および薬物分子等の生物学的関心のある動的有機分子の三次元構造を決定する方法に関する。本発明の第1の態様は、分子の三次元構造の集団を表すデータを生成する方法を提供し、前記分子は少なくとも1つの結合で連結された第1および第2の原子を含み、前記結合は関連する角度を有し、前記角度は変化して前記分子の複数の三次元構造を生成し、前記方法は、前記角度の可変性を示すデータを含む前記分子を表すデータを受け取ること;および、前記角度が前記可変性に基づいて選択される関連する値を有するように、構造の集団を生成することを含む。本発明の第2の態様は、分子の三次元構造の可変性をシミュレートするコンピュータ実行方法を提供する。

Description

本発明は分子(限定はされないが特にペプチド、炭水化物、タンパク質および薬物分子等の生物学的に興味ある動的有機分子)の3次元構造の決定方法に関する。
多くの重要な分子は本質的にフレキシブルで動的な構造を有する(例えばペプチド、炭水化物、抗生物質、有機薬物分子およびタンパク質)。多くの生化学的分析において、溶液中でのこのような分子の3次元(3D)構造についての知識が、それらの物理化学的特性、化学修飾の効果、またはそれらがどのようにタンパク質等の他の分子と相互作用するかを理解するために望まれる。
分子の3D構造を理解するために現在のアプローチはしばしば単なる計算的な分子モデリングを用いるが、それは著しく不確かである。なぜなら、溶液中での分子のポテンシャルエネルギー面がよく理解されておらず、実験データが研究中のシステムの分子成分のモデルに組み込まれるのはまれであるからである。小分子の3D構造を決定するために実験データを用いることに伴う重要な課題の一つは、それらが溶液中ではしばしば比較的に無秩序であるために力学が考慮されなければならないことであり、その溶液中での3次元構造決定の問題はほとんど未解決のままである。小分子の3D構造を正確に定義できる手段は、合理的な薬物設計および仮想スクリーニング等の、これまで不正確とみなされてきた多くのプロセスを可能にするだろう。
本発明の目的は、現在の分子の3D構造決定法に付随する欠点を取り除くかまたは軽減することである。
本発明の第一の態様によれば、分子の3次元構造の集団を表すデータを生成する方法であって、前記分子が少なくとも1つの結合で連結された第一および第二の原子を含み、前記結合が関連角(associated angle)を有し、かつ前記角が変動して前記分子の3次元構造を複数生成する方法が提供され、前記方法は、
前記角の可変性を示すデータを含む、前記分子を表すデータを受け取ることと、
前記角が前記可変性に基づいて選択された関連値(associated value)を有するように、構造の集団を生成することと、を含む。
本発明のこの態様は、多数のさらなる応用に利用できる分子の3D構造の集団を生成するための計算的な方法を提供する。例えば好ましい一実施形態によれば、構造の集団は分析されて1種以上の予測実験データが提供され、これは対応する実際の実験データと比較できる。この比較は、構造の集団が何回か修飾される最適化手段、および構造の最適な集団が同定されるまで各集団について繰り返される、予測データの実験データに対する比較を駆動するために使用でき、これは実際のデータの予測実験データに対する最も密接な比較を提供する。
本発明の好ましい実施形態の重要な特色は、1種以上の実際の実験データに対する3D分子構造の集団の最適化を同時に促進することであり、これは1種の実験データ単独では分子の溶液3D構造を適切に特徴付けるために十分でないと思われる際に、特に重要となる。このことは、以下の実施例1、2および3で例証される。
本発明の第二の態様によれば、分子の3次元構造の可変性をシミュレートするためのコンピュータ実行方法であって、前記分子が少なくとも1つの結合で連結された第一および第二の原子を含み、前記結合が関連角(associated angle)を有し、かつ前記角が変動して前記分子の3次元構造を複数生成する方法が提供され、前記方法は、
前記角の可変性を示すデータを含む、前記分子を表すデータを受け取ることと、
前記角の可変性を示す前記データに基づいて前記分子の3次元構造の可変性をシミュレートすることと、
前記角が前記シミュレートに基づいて選択された関連値(associated value)を有するように、構造の集団を生成することと、を含む。
本発明は、限定されないが、下記の例のような広範囲の分子に対して適用可能である。
1)炭水化物リガンドおよび炭水化物ミメティクス(例えばアミノグリコシド抗生物質)
2)ペプチドおよび人工ペプチドミメティクス
3)薬物分子の分子フレキシビリティー
4)酵素/受容体活性部位またはタンパク質−タンパク質相互作用部位内のフレキシブルなタンパク質側鎖
5)核酸分子内のフレキシブルな塩基(例えばRNAアプタマー)
6)幾つかのコンフォメーション状態をもつタンパク質(例えばインテグリン)および本質的に折り畳まれていないタンパク質
フレキシブルな分子の構造情報を必要とするプロジェクト、特に、相互作用−エネルギー予測に頼る合理的薬物設計等のリガンド−タンパク質相互作用を伴うものは、本発明に従って生成される動的構造から劇的に利益を享受するであろう。エンタルピーの寄与は十分に推定できるが、エントロピーの寄与は十分に推定できないことから、現在、先行技術モデルに基づくこのような予測は乏しい(予測される分子のわずかに10%が、その受容体にうまく結合する)。本発明の方法論を用いて決定した薬物分子の好ましい構造(内部エンタルピー)および動的運動(エントロピー)の両方の使用はそれ故、合理的薬物設計アプローチによるヒット同定およびリード最適化において著しい改善をもたらす[30]。さらに、本発明の方法およびそれらから生み出される動的3D構造は、その結合型から遊離溶液構造の偏差を算出するために使用でき、これは候補分子を比較および選択するための正確な評価関数として使用できる。
以下の実施例4は異なる有機分子の一連の結果を提示し、これにより本発明の方法がこれらの分子の生物活性(すなわちリガンド結合)コンフォメーションを正確に予測できることが示される。以下の実施例5は、本発明の方法を用いて生成したリシノプリルおよびアンギオテンシンIの動的3D構造の比較が、次世代のACE阻害剤であるベナゼプリラートの構造の特色を予測したリシノプリルの化学構造への修飾を、どのように示唆したかについて述べる。この結果は、本発明の方法が、医薬品化学者によるリード最適化の決定を大いに助ける動的3D構造をどのように提供できるかを明瞭に示す。
本発明の方法により生成される3D動的構造のさらなる応用は、改善された仮想スクリーニング結果の中にある。天然のリガンドまたは薬物の3D動的構造は、クエリー化合物と類似した形を有する他の分子をデータベース中で探索する仮想スクリーニング技術で理論的に生成された3Dコンフォメーションよりも、さらに正確なクエリー化合物に対する3Dコンフォメーション鋳型またはファーマコフォアマップとして使用できる。典型的には、クエリー化合物の好ましい形状に対する不確実性を克服するため、仮想スクリーニング戦略は各クエリーに対して多くのコンフォメーション変異体を使用する。本発明の方法論を用いることにより、これら多くの潜在的な誘導体を実験から直接決定された単一または多くても数個の鍵となる好ましいコンフォメーションによって置き替えることができ、計算の複雑さおよび検索時間が数桁減少する。このような仮想スクリーニングから同定された分子は、新薬開発のための新たなヒットまたはbackbone scaffold−hopsとなり得る。
本発明の他の応用は、3D−QSAR(定量的構造活性相関)の改善である。本発明の方法論により決定された薬物ファミリー全体にわたる幾つかの分子の3D動的構造は、本発明の方法論によって実験データから決定された3D動的構造が理論的に生成されたコンフォメーションよりもさらにいっそう現実的であることから、(伝統的な計算機化学の方法論によって現在生成されているものよりも高い)3D−QSAR技術に対する新たなレベルの論理付けを提供することが期待される。
従って本発明は、存在する医薬分子の動的構造のシミュレーションや予測を容易にし、合理的薬物設計および化学的模倣による新薬発見の著しい助けとなるであろう。
上記に加え、本発明の方法から利益を享受するその他の技術分野は、
1)バイオミメティック分子の生成、例えばヘパリンミメティクスの設計;
2)受容体分子のアレイを用いる分子相互作用の分析、例えばシステム生物学およびプロテオミクスにおいて;
3)コンビナトリアルケミストリーにおける、可能性のある反応経路の予測による薬物ライブラリーの設計;および
4)分子機械の設計および構築(ナノテクノロジー)を含む。
本発明の第三の態様によれば、分子の3次元構造の複数の集団から選択される前記分子の3次元構造の最適化された集団を表すデータを生成するための方法であって、各集団が本発明の第一および/または第二の態様に従う方法により生成される方法が提供される。
実際の実験データの主要な源は、水性または有機溶液中の有機分子からの核磁気共鳴(NMR)データであるが、他の実験技術からのデータもまた用いられてよい。以下にさらに十分に記述されるように、様々なNMR実験が分子の3D構造および動的運動を抽出するため相乗的に使用できる。各NMR実験から得られたデータは、各実験データの種類に対して特定の方法を用いて処理され、分子構造の一連の集団を用いる最適化アルゴリズムへ入力する準備がなされる(各集団は本発明の第一および/または第二の態様に従って生成される)。
本発明の第四の態様によれば、前記化合物に関して得られたNMRスペクトル由来の分子の3次元構造を示すNMRデータを処理するためのコンピュータ実行方法が提供され、前記方法は、
a.前記スペクトル中の共鳴多重線成分に関する共鳴周波数νを決定すること;
b.前記多重線スペクトルの最大高さの半分での固有共鳴線幅λよりも小さい共鳴周波数差(Δν)を有する前記NMRスペクトル中の共鳴多重線成分を同定すること;
c.前記NMRスペクトルについて工程b.で同定された多重線成分iのそれぞれの高さhiを決定すること;
d.各多重線について、以下のように広幅化因子bを決定すること:
Figure 2010539580
e.多重線構造を分析して、前記多重線成分のそれぞれについて理想共鳴周波数νidealを予測し、理想多重線構造が二重線であるか三重線であるかを決定すること;
f.理想多重線構造が二重線の場合、各多重線成分についてスケーリング係数fiを以下のように決定し:
i=2・b
かつ、1モル存在量での共鳴多重線成分iの高さHiを以下のように決定すること:
i=hi×fi
g.理想多重線構造が三重線の場合、各外側多重線成分(outer multiplet component)についてスケーリング係数fi(outer)を以下のように決定し:
i(outer)=4・b
かつ、重複する内側多重線成分についてスケーリング係数fi(inner)を以下のように決定すること:
i(inner)=2・b
h.1モル存在量での共鳴多重線成分iの高さHiを以下のように決定すること:
i(inner)=hi(inner)×fi(inner)
i(outer)=hi(outer)×fi(outer)
を含む。
本発明のこの態様は、NMRスペクトル由来のデータを、本発明の第一または第二の態様に従って生成される分子集団を用いる最適化において用いることを可能にする。
本発明の第一および第二の態様に関して、分子を表すデータは、好ましくは前記結合についての平均角を示すデータをさらに含む。好ましくは、前記角の可変性を示すデータは、前記平均角に関連するデータを含む。前記結合の可変性を示すデータは、前記平均角の周りの角の分布を示すデータを含んでよい。前記分布は、好ましくは確率分布である。前記角の確率分布は、前記平均角の周りで対称であってよい。好ましくは前記結合の可変性を示すデータは、前記平均角の周りの角のガウス分布である。
好ましい態様によれば分子を表すデータは、前記結合についてのさらなる平均角を示すさらなるデータをさらに含む。前記角の可変性を示すデータは、前記さらなる平均角に関連するさらなるデータを含むことが好ましい。前記結合の可変性を示すデータは、前記さらなる平均角の周りのさらなる角の確率分布を含んでよい。前記さらなる角の確率分布は、前記さらなる平均角の周りで対称であってよい。好ましくは前記結合の可変性を示すデータは、前記さらなる平均角の周りのさらなる角のガウス分布である。
本発明の第一および第二の態様は、特定の関連する可変性を有する結合または一連の結合を介して連結した第一および第二の原子の単一ペアを含む分子の3D構造の集団を生成するために使用できるが、本発明の方法に供される各分子が比較的多数のフレキシブルな結合を含んでいる以下の実施例1から5に例証されるように(例えば実施例1に関連する図16および17を参照)、本発明の第一および第二の態様は、相互結合した第一および第二の原子の複数のペアを含む分子の3D構造の集団を生成するために大いに適していることが認識されるであろう。従って、以下「第一および第二の原子」について述べられる際には、本発明の方法論を用いて調べられるいずれの興味ある分子も、関連角の可変性を有する少なくとも1つの結合を介して連結される「第一および第二の原子」の1つ、2つまたはそれ以上のペアを組み込んでいてよいことが理解されるべきである。
本発明の第一および第二の態様に関して、分子を表すデータは、好ましくは第一および第二の原子の化学的性質を示すデータを含む。分子を表すデータは、第一および第二の原子の化学的性質に基づく前記結合の可変性を示すデータをさらに含んでよい。
前記結合の可変性を示す前記データは、第一および第二の原子が二重共有結合や三重共有結合を介して連結しているとき、または第一および第二の原子が芳香環構造に組み込まれているときに結合の可変性がゼロであることを示すデータを含んでよい。
前記結合の可変性を示す前記データが、第一および第二の原子のうちの一つが水素原子またはハロゲン原子であるときに結合の可変性がゼロであることを示すデータを含むケースであってもよい。
前記結合の可変性を示す前記データは、第一および第二の原子が3員または4員の環構造に組み込まれているときに結合の可変性がゼロであることを示すデータを含んでよい。
前記結合の可変性を示す前記データは、第一および第二の原子が単一の共有結合を介して連結され、かつ、第一および第二の原子のうちの一つが、二重または三重共有結合を介して第三の原子に連結するか、または、第一および第二の原子が酸素原子であるとき、結合の可変性がゼロではなく単峰性の結合角可変性を示すことを示すデータを含むことができる。
前記結合の可変性を示す前記データは、第一および第二の原子が5員または6員の飽和脂環構造に組み込まれているとき、結合の可変性がゼロではなく二峰性の結合角可変性を示すことを示すデータを含むケースであってもよい。
前記結合の可変性を示す前記データは、第一および第二の原子が単一の共有結合を介して連結され、かつ第一および第二の原子のうちの一方がsp3混成であり、かつ第一および第二の原子のうちの他方がsp2混成であるか、または、第一および第二の原子が単一の共有結合を介して連結され、かつ分子内で前記単一の共有結合が少なくとも一つのさらなる二重共有結合と共役するとき、結合の可変性がゼロではなく二峰性の結合角可変性を示すことを示すデータを含んでよい。
前記結合の可変性を示す前記データは、第一および第二の原子が単一の共有結合を介して連結され、かつ、第一および第二の原子の両方が四価でsp3混成であるか、または、第一および第二の原子のうちの一方がsp3混成であり、第一および第二の原子のうちの他方が酸素原子であるとき、結合の可変性がゼロではなく三峰性の結合角可変性を示すことを示すデータを含んでよい。
本発明の第一および第二の態様に関し、前記角は前記第一と第二の原子の間に規定される二面角であることが好ましい。
本発明の第一および第二の態様の好ましい実施形態では、前記方法は、前記分子の3次元構造の前記生成された集団から、少なくとも1の実験パラメータを予測することをさらに含む。
前記方法は、好ましくは、前記少なくとも1の予測される実験パラメータの、少なくとも1の物理的実験に由来する少なくとも1のさらなるパラメータに対する比較をさらに含む。すなわち、興味ある分子に対応する化学物質について行われる実験である。
前記方法は、前記比較に基づいて一致関数を決定することをさらに含むことが好ましい。
さらなる好ましい実施形態によれば、本発明の第一および/または第二の態様による方法は、
前記分子の3次元構造のさらなる集団を表すさらなるデータを生成すること;
前記分子の3次元構造の前記さらなる生成された集団から、少なくとも1のさらなる実験パラメータを予測すること;
前記少なくとも1のさらなる予測される実験パラメータを、少なくとも1の物理的実験に由来する前記少なくとも1のパラメータに対して比較すること;
前記少なくとも1のさらなる実験パラメータの、少なくとも1の物理的実験に由来する前記少なくとも1のパラメータに対する前記比較に基づいて、さらなる一致関数を決定すること;および
最もよい一致関数を有する集団を示すデータを生成すること、をさらに含んでよい。
前記方法は、前記さらなる集団を複数生成すること、および前記複数のさらなる集団から決定される最もよい一致関数を有する集団を選択すること、を含んでよい。
前記方法は、好ましくは、前記分子の3次元構造の前記生成された集団から少なくとも2の実験パラメータを予測することをさらに含む。
前記方法は、前記少なくとも2の予測される実験パラメータの、少なくとも2の物理的実験に由来する少なくとも2のさらなるパラメータに対する比較をさらに含んでよい。すなわち、興味ある分子に対応する化学物質について行われる少なくとも2の実験である。
好ましくは、前記少なくとも2の物理的実験は、異なる期間にわたって抽出された前記分子の3次元構造を示すデータを提供する。
前記少なくとも2の物理的実験は、前記分子の動きの異なる範囲にわたって抽出された前記分子の3次元構造を示すデータを提供してよい。
前記予測される実験パラメータの少なくとも一つは、前記分子の3次元構造を示すNMRデータに関連することが好ましい。
前記NMRデータは、スカラーカップリング、核オーバーハウザー効果(NOE)、回転座標系NOE(ROE)、残留双極子カップリング(RDC)、異核NOE、およびT1緩和データから成る群より選択されてよい。
前記物理的実験の少なくとも一つは1D NMR分光法を含んでよい。前記1D NMR分光法は、[1H]−1D分光法、[13C]−1D分光法、[13C]−フィルター[1H]−1D分光法、[15N]−1D分光法および[15N]−フィルター[1H]−1D分光法から成る群より選択されてよい。
好ましくは、前記物理的実験の少なくとも一つは2D NMR分光法を含む。前記2D NMR分光法は、[1H,1H]−DQF−COSY分光法、[1H,1H]−TOCSY分光法、[1H,13C]−HSQC分光法、[1H,13C]−HMBC分光法および[1H,15N]−HSQC分光法から成る群より選択されてよい。
好ましくは、前記分子は有機分子である。
好ましくは、前記分子はペプチド、炭水化物、抗生物質、核酸、脂質、代謝産物、薬物分子およびタンパク質から成る群より選択される。
前記分子は、好ましくはヒアルロナン、リシノプリルおよびアンギオテンシンIから成る群より選択される。
分子内の回転性結合には、平均角の値およびこれら平均の周りの角確率分布を含む多数動的パラメータが指定される。最適化アルゴリズムが、全ての実際の実験データに最もよく適合する動的パラメータそれぞれの値を決定するために用いられてよい。最適化の際の動的パラメータに対する修正およびさらに多くの実験データの包含を伴うアルゴリズムの繰り返し使用により、分子のフレキシブルな部分の平均構造および動的運動は正確に予測できる。この方法論は以下さらに詳しく説明され、3種の有機分子、すなわちヒアルロナン六糖類(オリゴ糖)、リシノプリル(ペプチドミメティック薬物分子)およびアンギオテンシンI(ペプチド)について以下の実施例1、2および3に示される。
本発明の別の態様は、本発明の第一および/または第二態様に従う方法により生成された分子の3次元構造の集団の使用を提供し、前記分子の3次元構造を示すNMRデータを予測する。
本発明のさらなる態様は、本発明の第一および/または第二態様に従う方法を用いて生成された分子の3次元構造の集団を用いてNMRデータを予測するための方法を提供する。
本発明の別の態様は、分子の3次元構造を示すNMRデータを予測することにより生成された分子の3次元構造の集団に対する、本発明の第一および/または第二態様に従う方法の使用を提供する。
本発明のさらなる態様は、本発明の第一および/または第二態様に従う方法を用いて生成された分子の3次元構造の集団を用いてNMRデータを予測するための方法を提供する。
本発明の別の態様は、本発明の第一および/または第二態様に従う方法を用いて分子の3次元構造の集団を生成することにより、分子の生物活性コンフォメーションをシミュレートするための方法を提供する。
本発明のさらなる態様は、分子の生物活性コンフォメーションをシミュレートするための、本発明の第一および/または第二態様において提示された方法により生成された分子の3次元構造の集団の使用を提供する。
本発明の別の態様は、本発明の第一および/または第二態様に従う方法を用いた分子の3次元構造の集団の生成により、その目的とする標的に結合したときの分子のコンフォメーションをシミュレートするための方法を提供する。
本発明はさらに、さらなる態様において、その目的とする標的に結合したときの分子のコンフォメーションをシミュレートするための、本発明の第一および/または第二態様において提示された方法により生成された分子の3次元構造の集団の使用を提供する。
別の態様によれば本発明は、本発明の第一および/または第二態様に従う方法を用いたリガンド分子の3次元構造の集団の生成による、その目的とする標的に結合したときのリガンド分子のコンフォメーションをシミュレートするための方法を提供する。
本発明のさらなる態様は、その目的とする標的に結合したときのリガンド分子のコンフォメーションをシミュレートするための、本発明の第一および/または第二態様において提示された方法により生成された、リガンド分子の3次元構造の集団の使用を提供する。
本発明のさらなる態様は、本発明の第一および/または第二態様に従う方法を用いたペプチド分子の3次元構造の集団の生成による、ペプチド分子の生物活性コンフォメーションをシミュレートするための方法を提供する。
別の態様において本発明はさらに、ペプチド分子の生物活性コンフォメーションをシミュレートするための、本発明の第一および/または第二態様において提示された方法により生成されたペプチド分子の3次元構造の集団の使用を提供する。
本発明のさらなる態様は、本発明の第一および/または第二態様に従う方法を用いた炭水化物分子の3次元構造の集団の生成による、炭水化物分子の生物活性コンフォメーションをシミュレートするための方法を提供する。
別の態様において本発明はさらに、炭水化物分子の生物活性コンフォメーションをシミュレートするための、本発明の第一および/または第二態様において提示された方法により生成された炭水化物分子の3次元構造の集団の使用を提供する。
本発明のさらなる態様は、本発明の第一および/または第二態様に従う方法を用いた薬物分子の3次元構造の集団の生成による、薬物分子の生物活性コンフォメーションをシミュレートするための方法を提供する。
別の態様において本発明はさらに、薬物分子の生物活性コンフォメーションをシミュレートするための、本発明の第一および/または第二態様において提示された方法により生成された薬物分子の3次元構造の集団の使用を提供する。
本発明の態様は、本発明の第一および/または第二態様に従う方法を用いた、ペプチド分子の3次元構造の集団の生成による分子内の水素結合占有率をシミュレートするための方法に関する。
本発明の別の態様によれば、分子の水素結合占有率をシミュレートするための、本発明の第一および/または第二態様において提示された方法により生成された分子の3次元構造の集団の使用がさらに提供される。
本発明のさらなる態様によれば、分子の3次元構造の集団の生成に使用できるデータを保持するデータキャリアであって、前記分子が少なくとも1つの結合で連結した第一および第二の原子を含み、前記データが前記角の可変性を示すデータを含む前記分子を表すデータを含むデータキャリアが提供される。
本発明のさらなる態様によれば、コンピュータに本発明の第一および/または第二態様に従う方法を行わせるように構成されたコンピュータで読み取り可能な命令を保持するキャリア媒体が提供される。
本発明の別の態様によれば、分子の3次元構造の集団を表すデータを生成するためのコンピュータ装置が提供され、前記装置は、プロセッサで読み取り可能な命令を記憶するメモリーと、前記メモリーに記憶された命令を読み取りかつ実行するために構成されたプロセッサと、を含み、前記プロセッサで読み取り可能な命令は、前記プロセッサに本発明の第一および/または第二態様に従う方法を行わせるように構成された命令を含む。
本発明の第一および/または第二態様に従って分子集団を生成するための開始点は、分子トポロジーについての記載であり、それは興味ある分子の化学式によって決定され、かつ、結合の数および種類、その長さ、それらの間の角およびねじれ(二面)角について記載するものである。この幾何学的情報は内部座標のセットにより便利に記述できる(一般的にはZ−マトリックスとして知られる)[1]。内部座標は、他の隣接する原子に対する、結合の長さ、結合角、および二面角に関して、分子の原子それぞれについての記述を提供する。これらの内部座標は、標準の幾何学的議論を用いて、空間の原子についての分子(デカルト)座標のセットを特定するために使用できる[2]。
共有化学結合の性質(例えばσ結合、π結合)および軌道の混成(sp2、sp3)のため、分子が溶液中で局所的な動的運動を行う間、ほとんどの場合に結合および角はそれらの平均的配置を維持すると仮定できる(よい近似値となる)。すなわちそれらは一定であることができる。従って、溶液中の分子の局所的な動的運動は、二面角のまわりの回転によって第一の近似値に向かって起こる(図1aおよび1bを参照)。さらに、これらの回転は通常、平均角付近の可能な角度の限られたセットを占める(これについては後にさらに詳しく述べられる)。すなわち、フレキシブルな結合が選ぶことのできる角の範囲は、その結合に付随する結合角における可変性を定義することによって特徴付けられる。
本発明の第一および/または第二態様に従って生成される3D構造の分子集団は、屈曲しているときの溶媒和した分子が有する3D形状の範囲を可能な限り密接に反映することを意図した、別々の分子構造(それ自体が原子座標のセットである)のセットである。本発明の好ましい実施形態によれば、分子運動の十分に確立されたモデルに従い、特定の二面角(回転可能なもの、コンフォメーションの自由度としても知られる)を変化させることによって分子集団が生成され、その間他のコンフォメーションの自由度は固定された状態で保たれる(角、結合および非回転性のねじれ)。コンフォメーションの自由度の例は、グリコシド、ホスホジエステル、およびペプチド骨格の二面角である。溶液中の特定の種類の結合の動的挙動に関する一連の法則が発明者らによって開発されており、以下に説明される。これらの法則は、興味ある分子内のどの結合が回転可能か、あるいはそうでないかを確立するために用いられる。結合が回転可能であるかどうかは、以下の考察により決定できる。
1)分子内の全ての単結合は回転可能であるが、二重、三重、芳香族結合は回転不可能である;
2)多くの単結合の回転は分子内の原子の相対的位置における効果をもたないため、これらの種類の単結合は回転する必要がない。このような単結合の例は、水素原子と他の原子との間、またはハロゲン原子と他の原子との間の結合を含む;
3)幾つかの環状化学における単結合は、拘束された配置のために回転できない;この例はシクロプロパン内のC−C結合であろう
二面角の小さな振動(平均角付近での変動)については、分子のポテンシャルエネルギーは調和していると考えられる(すなわち平均からの角度偏差の二乗に依存する)[3]。このようなポテンシャルから平均付近での角分布は、ガウス(正規としても知られる)分布を用いてモデル化できる(図1cを参照)が、結合角可変性の他のモデルを採用してもよいことは認識されるであろう。
一旦興味ある分子の化学構造が分析され、分子の適切なコンフォメーションの自由度が上に説明された法則と共に標準的な方法を用いて同定された後、それが適当な場合には、分子内の各結合について記述するための初期パラメータのセットの確立が必要である。単なる例として、単一の可変二面角のみを含む、興味ある分子の最も単純な事例を考察することにする。この事例では、二面角には平均結合角(例えば40°)および平均角の周りでの結合角の最大可変性(例えば18°)が割り当てられる。それ故、モデルとなる二面角は、40°の平均値を有するが、実際はその分子について生成された構造の集団にわたって22°〜58°に変化し得る。集団の大きさを10とした場合、この単純な例において、集団が生成されるとき、それは、全ての二面角の全体平均が40°であり、各構造が22°〜58°の可変性二面角の特定値を含む、10の別々の分子構造から構成されるであろう。22°〜58°の範囲にわたる二面角の分布は、好ましくは、ガウス確率分布関数等の、ある種の分布関数を用いることによって制御される。本発明の好ましい実施形態では、角に関するカノニカルガウス展開(式(1))を用いるが、他の分布も容易に実行される。他の分布の例は、トップハット関数(式(2))およびワイブル分布(式(3))を含む。
Figure 2010539580
角の確率分布がガウス分布としてモデル化される好ましい実施形態では、分布はp(α)=G(μ,σ)となり、これは、平均角μ(平均結合配置)および標準偏差角σ(局所的振動)を有するガウス分布角(α)であり、単一の自由度を表す。図1(c)を参照のこと。この確率分布は、単一のコンフォーマーの周囲の3D分布に対応する単結合の周りでの振動をシミュレートするであろう。自由度が0、1および2であるアンギオテンシン4に基づく例について、図2を参照のこと。
一般に遭遇するsp2およびsp3結合化学(それぞれ平面および四面体)には、幾つかの異なるコンフォメーションの状態が存在し得る(例えば、各炭素−炭素結合においてg+、g−、およびt回転異性体を採用できるアルカン鎖、いす型、ふね型および/またはねじれふね型コンフォメーション等のコンフォメーション範囲を採用できる環状環、およびゆっくりと相互変換するシスおよびトランスコンフォメーションを採用できる、ペプチド結合等の官能基)。このような事例において、さらに複雑かつさらに一般的な式が確率分布のために用いられてよい。例えば、p1、p2およびp3が確率であって、p1+p2+p3=1である、3までの振動状態を有するシステムに対応する、p(α)=p1G(μ1,σ1)+p2G(μ2,σ2)+p3G(μ3,σ3)である(特定の例については、以下に詳しく述べる)。さらに、幾つかの確率ならびに/あるいは平均および標準偏差値は、例えばペプチドもしくはパッカリングシクロヘキサン型環に見られるような事例をモデル化するため、互いに組み合わせてよい。例えば、σ1=σ2=σ3(上記の式において)は、各コンフォメーションの基質が同一の範囲の振動運動を有することを示すであろう。
この様式における動的集団の算出は、分子の一部が互いに偶然に衝突する結果を招き得る。このような状態を避けるため、単一の構造それぞれを生成した後(集団内で)、設定距離内に(典型的には0.1nm)いずれかのファンデルワールス活性原子(以下を参照)が存在するか否かについて試験されてよい。この条件が満たされる場合に3D構造は削除かつ再計算できる。この過程は立体的に許容できる3D構造が生成されるまで(典型的には50回である最大試行数まで、その後現在の3D構造が自動的に承認される)繰り返されてよい。
分子構造の集団が一旦生成されると、実際の実験データ、例えば限定はされないがNMRデータを予測するために使用されてよい。予測の質、すなわち予測実験データの実際の実験データに対する適合の密接さは、構造の集団が、溶液中に存在する実際の分子の構造の範囲をどれ程密接にモデル化しているかを評価するために使用されてよい。
静的な表現からよりも動的分子集団からの方が、さらに測定可能な分子特性の算出が理論的に可能であることが認識されるであろう(この二つを比較する関連物理的理論が知られていると仮定する)。これは、分子システムについての完全な記述が、それが占めることのできる状態(巨視的状態)およびそれらの発生の確率(統計的な重み)を含むという、古典的な統計物理学の基本的仮説である[4]。従って、以前の方法においては各回転性結合を表すために単一の平均角のみを使用するのに対し、各コンフォメーションの自由度における可変度を含む場合は、1以上の異なる種類のNMR実験データを同時に満たすことが可能になる。このNMR実験データそれぞれは、分子の幾何学的形状についての異なる関数にわたって集団から平均化されるため、分子のフレキシビリティーについての異なるスナップショットを提供し、モデルを定義するために利用できる実験情報の量を効果的に増大させる。このことは、多数のNMRデータベースの使用を促進し、動的分子のコンフォメーションを定義するためにしばしば必要とされる多数の制限を可能にする。
実際の実験データとの比較が行われるとき、分子の構造集団は最初に本発明の第一および/または第二の態様に従って生成される。集団の各メンバーについての実験パラメータを予測するため、標準的方法(以下、さらに詳細に説明する)が用いられる。集団の各メンバーについての予測値は平均化され、この平均値は実際の実験データ由来の対応するパラメータと比較される。
例えば、核オーバーハウザー効果(NOE)は、距離の六乗に対して平均化されることが知られている。従って、実際の実験データから算出したNOEとの比較で、集団の各メンバーについての予測NOE値、この平均化された予測NOEのセット、およびこの平均値を決定するために、標準的方法を用いることができる。さらなる例は、二乗したコサイン角に対して平均化される残留双極子カップリング、およびねじれ角に対して平均化されるスカラーカップリングを含む。
実験パラメータの予測、および前記予測されたパラメータの対応する実際のパラメータに対する比較に続き、1以上のさらなる集団が本発明の第一および/または第二の態様に従って生成でき、各さらなる集団は上記と同様の方法で実際の実験データに対して試験できる。このようにして最適化のルーチンが確立され(図3を参照)、ここで分子構造の一連の集団は繰り返し生成され、実際の実験データに最も密接に一致する集団、すなわち実際の実験データに最も高い相関関係を示す集団を決定するために、実際の実験データと比較される。
アルゴリズムの核心は、最適化ルーチンの各繰り返しごとに動的分子集団を生成する、コンフォメーションモデル生成部である。この生成部は、上で概説され、以下でさらに詳しく述べられる変数パラメータのセット(幾つかはコンフォメーションを定義し、他は動的広がりを定義する)から集団を導き出す。これらのパラメータは、1種またはそれ以上の実験に由来する実際の実験データ(好ましくは異なる種類のNMRデータを含む)に適合するように同時に最適化され、モンテカルロアプローチを用いて、分子に対して最も適合する動的集団が得られる[5]。このプロセスは、以下の方法においてアルゴリズムにより記述され、これによりデジタルコンピュータ上でのその実行が可能となる:
1)動的分子の変数のセットによるコンフォメーション自由度に基づく動的集団の生成。コンフォメーション自由度は局所的な化学の考慮に基づいて選択される(定義は以下を参照)。特に、化学結合の種類および混成が、それらが回転可能か否かを決定する。
2)適切な物理理論および積分(平均化)の使用による動的集団からの実験データの予測。例としての目的で、以下に詳しく考慮されるNMR実験のため(核オーバーハウザー効果実験(NOESY、ROESY)、残留双極子カップリング、カップリング定数および1H−15N異核効果(heteronuclear enhancements))、適切な物理理論が導かれ検証されてきた[6、7〜9]。
3)予測実験データの真の実験データに対する比較および一致関数の算出。これは通常二つの間の距離の二乗であり(実験誤差を含む)、χ2と称される。
4)χ2が以前に見られたものよりも小さい場合、この動的構造は承認され、最も良い構造の新しい候補となる。
5)分子変数はランダムに変化し(平均および動的広がりの両方において)、特定の繰り返し数が経過するまでは工程1へ戻る。要求される工程の数は問題の複雑さに依存する。簡単に述べると、この複雑さはコンフォメーション自由度の数から推定できる。
6)十分に定義された最終集団が再現性よく生成できるように適切な数の繰り返しが行われたら、現在の候補となる構造は単一の解決済みの動的構造を表す。この構造は、コンフォメーション制限あたりの平均χ2を算出することにより、実験データに対する適合の良さについて評価できる。
7)多くの動的構造が生成され、繰り返された構造決定の精度を決定するため、それらについての統計が取られる。このことは、単一の独特な動的分子のコンフォメーションの決定における実験データのロバスト性を決定する。
カイ二乗最小二乗測定(χ2)が実験データ(Xexp)および理論的予測(Xpred)の間の適合の良さを決定するために用いられ、これは予測と実験の間の距離の二乗の和を、各実験測定での推定される誤差の二乗(ε2 exp)で割ったものである。ここでは三種の測定、個々の制限それぞれについての最小二乗適合(χ2 restraint)、データセット(χ2 dataset)についての最小二乗適合を求めるためのこれらの値の和、および全ての実験データ(χ2 total)についての最小二乗適合を求めるためのこれらの値の和について考察される。式4〜6を参照のこと。
Figure 2010539580
アルゴリズムのそれぞれの繰り返しにおいて、現在の動的分子集団は、分子の幾何学的形状の異なる関数にわたる集団を理想的に平均化する1以上の実験データセットを予測するために用いられる(上での考察の通り)。それぞれのデータ点のχ2適合が報告され、そこから、それぞれの異なるデータセットの統計を算出できる(以下の実施例1、2および3に例証される)。
ガウス分布角の平均、その広がり(ここでは可変性とも称される)および相対的確率の重み付けは、実験データに対する良い適合が見出されるまで、動的分子集団の繰り返される算出および実験データとの比較により繰り返し探索される(図3)。本発明の好ましい実施形態では、モンテカルロ繰り返しアプローチがこの探索を行うために用いられているが、他の繰り返し最適化手順、例えば限定はされないがLevenberg−Marquardtアルゴリズムまたは遺伝的アルゴリズムも用いられてよい。
あるクラスの分子制限が実験データに依存しない計算に加えられてよいが、代わりにそれらは基本的分子特性とみなされる。最も明らかなものはファンデルワールスエネルギーであり、これはχ2へ直接追加できる。ファンデルワールス力定数の実際の数値は、他の実験データセットと調和するように、使用者により選択された一定のスケーリング係数(以下を参照)により修正されるべきである。
以下に、動的コンフォメーションに対して感受性のあるNMR実験データの例を示す。これは以下の実施例1、2および3で用いられ、様々な分子、特に有機分子の動的構造を決定するために用いることができる。NMR実験を実行し、NMRデータセットを得る方法についてもまた、以下に詳しく述べられる。さらに、これらの実験NMRパラメータを予測するために使われる理論、および、実験測定を予測に対して比較することによって構造がどのように最適化されるかについて記述される。NMRは、水溶液中での原子規模の情報を提供することから、特に適した方法である。しかしながら、他の種類の実験データ(動的情報を提供する)、例えば溶液状態での散乱および蛍光エネルギー転移、も使用できることに留意すべきである(これらの使用についての特定の例は、この出願においては詳述しない)。
考慮されるべき第一の種類の実験データは、核オーバーハウザー効果に基づくNMR実験により生成される[10]。この場合、特に有用な実験はNOESYおよびROESY分光法である。標準的なNMR構造計算法を超える重要な進歩は、実験データを理論的に予測するための完全な緩和行列[7]の使用である。このような計算法(距離rからr-6までに強度を単純に関係付ける近似値の使用と共に)は重要である。なぜなら、小分子は小容量に多数のNMR活性核を含むことができ、しばしば混合時間が比較的長いからである。従って、重要なスピン拡散の強い可能性があり、これは、完全な緩和行列の計算のみによって考慮することができる。この計算を行列対角比によって行う方法は、以前に公表されている[7]。最終的には、交差ピークは最終行列において非対角項により表されるが、対角ピークは行列の対角に見出される。スペクトル密度関数の異なる一次結合が、異なる可能な緩和実験(例えばNOESY、ROESY、およびT−ROESY)の計算を行うために使用できる。
異核T1緩和およびNOEデータ(典型的には、1Hと13Cもしくは15Nの間)等の他の種類のNMR緩和実験は、以前に記述されたように[8]、秩序パラメータ(S2)、全反転相関時間(overall tumbling correlation times)(τc)および内部相関時間(internal correlation times)(τi)として解釈できる。これらのデータは、局所的動態と密接に関連しており、他のNMR測定に対する補足として使用できる。予測するために、分子集団内の全ての構造は、それらの間で最小の二乗平均平方根偏差(RMSD)を有するようにオーバーレイされてよい。以前に得られた[11]この分子骨格の中で、選択されたベクトルについての相関関数が算出され、S2が推定される。
NMRスカラーカップリング定数(J)、特に三結合カップリングは、経験的関係、Karplus曲線を通してコンフォメーションを示す[12]。各二面角について、Karplus式が知られていると仮定すると、動的集団に対して平均化することによってJを算出し、χ2を決定するために実験データと直接比較することが可能である。
不活性で弱く配列する共溶質(weakly−alighning co−solute)により誘導された残留双極子カップリング(RDC)は、以前に得られた方法により算出できる[7]。さらに一般的な事例に対する他の方法は文献から得られる[13]。RDCは、緩和データにより提供される局所的情報よりも長距離にわたるコンフォメーション情報を提供することから、全実験データプールに対する重要な補完物である。幾つかのデータ(例えばスカラーカップリング)は理論的計算と直接比較される。しかしながら他の事例では(例えばNOESY測定)、データセットは、サンプル濃度、分光計の感度などに基づく任意の定数によってスケーリングする必要があり、かつ実験データおよび直線適合(0を通る)によるそれらの各予測から算出できる。適切な係数(κdataset)は式(7)に示され、{κχpred,χexp}で示されるグラフが単一の勾配を有するように、全ての予想に適用できる(以下を参照)。
Figure 2010539580
式(7)における重要な考慮は、誤差への強い依存である。これらが正確に定量化されない場合、結果としての構造にはバイアスがかかり得る。実験誤差(εexp)の計算は上で考察されてきたが、集団の有限サイズによる誤差については考察されていない。これが特に重要となる一事例(NOESY、ROESY、またはスカラーカップリングに対しては考慮されていない)は、RDCの予測を行う際であり、それは分子骨格内での核間ベクトルの方向に依存する。ここで角への依存は高度に非線形的であり、従って追加の誤差補正が適用される必要がある。これは実効誤差をスケーリングすることにより最も適切に達成される。このスケーリング(実効誤差εexp’を生じるための)は以下の方法で導くことができる。θが分子骨格内の配列の主軸の間の角である場合、残留双極子カップリングを定義する式から始まり[13]、式(8)が得られ、これにより、計算誤差が微分(式(9))により得られる。適切な近似の結果は式(10)である。
Figure 2010539580
恒等式:cos4θ=8cos4θ−8cos2θ+1を(10)に代入し、これで実験誤差を割ると、式(11)および(12)を得る。後者はほとんど式(11)と同一であるが、分母に最小値である1/4を有することによって0による除算が避けられるため、実際に用いられる。
Figure 2010539580
式(12)を用いることにより、総実験誤差推定量(εexp)を増加させて、残留双極子カップリングの予測に付随する誤差を考慮に入れることが可能になり、これは実験データとの適合度をさらに正確に評価するため用いることができる。
ここで本発明の様々な好ましい特性のさらなる記述のために供される、本発明の好ましい実施形態を記述する。
興味ある分子についての第一の集団が生成でき、かつ前記集団に基づいて構造計算が行われる前に、様々なパラメータが特定される。
実際の実験において用いられるそれぞれの溶媒における分子に対する一連の溶媒マスク(solvent mask)が特定され、そこから、実際の実験データのデータセットが得られた。これは溶媒との迅速な交換のためNMR活性および不活性である水素原子のリストを含む。この情報は、分子内の全てのプロトンの正確な位置に非常に敏感であるNMR緩和予測(上記を参照)の計算において使用される完全緩和行列の計算の正確さにとって重要である。従って、溶媒との化学交換によりNMR不活性である分子内の全てのプロトンは計算から除外されなければならない。例えば、H2O中の炭水化物に対する溶媒マスク(solvent mask)は、全てのヒドロキシル水素原子がNMR不活性であることを特定するが、DMSO中の同じ炭水化物に対しては、溶媒マスク(solvent mask)は同じヒドロキシルプロトンが活性であることを特定する。各データセットはそれに付随する適切な溶媒マスク(solvent mask)を、入力パラメータとして有する。
最初に必要な溶媒の数が特定され、必要な溶媒の数に続いて、名称によりリスト化される(これらは後に実験データ入力ファイルにより使用される)。溶媒マスク(solvent mask)において含まれるかまたは除外される実際の原子は、溶媒マスク(solvent mask)に原子を加えるかまたはそれらを取り去る、addステートメントまたはexcステートメントにより特定される。これらのステートメントのそれぞれにおける次の2つのフィールドは、残基数および原子タイプを定義する。全てのプロトン(H★)を選択し、全てのヒドロキシル(HO★)を取り除くために、ワイルドカードアスタリスクが用いられる。典型的なファイルを以下に示す。
Figure 2010539580
構造計算の必要に従い、全体的なパラメータセットである(すなわち特定のデータセットに特異的ではない)ファンデルワールスマスクが準備される。このマスクは原子をNMR活性にとどめるが、ファンデルワールス力(χ2への加算として算出される。以下を参照。)に対して効果的に透過性であり、これは原子が、構造計算の間に不利益なく分子の他の部分と重複および衝突することを可能にする。このマスクの使用は、構造計算からの結果に不運な立体的衝突によってバイアスをかけないために、原子を、未確定な配向の構造であるが任意の初期(および/または固定された)配置の範囲内とする点で重要である。このケースの例は、そのコンフォメーションが水中では実験的に容易には調べられない、ヒドロキシルプロトンおよびカルボキシレート基酸素原子である。このマスクはまた、動的変数の一セットが他から独立して試験可能な場合に、構造の他の部分に不利益なくコンフォメーションおよび立体衝突を選択させることによって構造の他の部分からそれらをアンカップリングさせることにより、3D構造決定の初期段階において使用可能である。分子の動的構造が定義されていくに従い、ファンデルワールスマスクは適切に更新される。すなわち、現在解決された分子の全ての部分を含む。
ファンデルワールス入力ファイルのconfigurationセクションにおいて、計算のためのカットオフ距離が特定され(1または2の共有結合により分離される原子は常に計算から除外される)、そしてカップリング定数が特定され、これは全体のχ2計算に項として含められる前にファンデルワールス計算に適用されるスケーリング係数を決定する。次のセクション(nonbondedセクション)は、各種の原子についての原子半径および反発エネルギーを定義する(例えば水素については、vdw ★ H★ 0.016 0.60)。これに続き、含まれる原子および除かれる原子を詳述する一連のステートメントがリストされる(いずれのステートメントも存在しないときには全ての原子が含まれる)。以下に示す入力ファイルの例では、全てのヒドロキシル原子は除かれるが(exc ★ HO★)、他の全ての原子は含まれる。この明細書で使用される命名法は、溶媒マスク(solvent mask)で使用されるものに類似する。
Figure 2010539580
モデルなしの近似[11]を経たNMR緩和データ(NOESY、ROESY、T−ROESY)の予測のために、値は、298Kかつ0.88cPの粘度(すなわち、25℃におけるH2O)での分子相関時間(τc)に対して特定されなければならず、これは一般的なパラメータである。τcの値は実験的に決定できるか[8]、または最初の実例において推定できる。妥当な最初の近似値まで、分子量が〜400Daの小分子は298Kにおいて0.4nsの相関時間を有するが、〜10kDaの小タンパク質は298Kにおいて〜5nsの相関時間を有する。時折、分子は、NOEの交差ピークが陰性(タンパク質にとっては正常)から陽性(すなわち、これらは対角ピークに対する逆の徴候を有する)への閾値を越える十分な低分子量(約〜250Da)であり、これはτcが式τcω〜1.12(ωがプロトン共鳴角周波数であるとき、NOE交差ピークがゼロとなるτcの値)を通して推定されることを可能にする。ROEはこのゼロ点を持たず、従ってτcωが〜1.12であるとき非常に有用となることに留意すべきである[9]。
緩和データの予測において用いられるスペクトル密度の計算は、分子拡散のための対称トップモデルを導入することにより、高度に異方性の形をもつ分子のために改善できる。この事例において、単一のτc値は二つの相関時間(対称トップにおいて対称な軸に対して平行および垂直)によって置き換えられる。得られるスペクトル密度関数への改変は[46]、式(3)〜(9)に記述される。
τcに対する値が実験的に決定されていないとき、最初の推定値は、構造計算の数回のラウンドの後(これが必要とみなされる場合)、動的構造が実験データと良好な相関を持ち始めることが明らかな時点で、検討できる。この時点において、τc値は、同じデータセットを用いて、しかし異なるτc値を用いて、実験データに対して最も良いχ2 total値を与える値を取って、繰り返し計算により最適化できる。
τc値は構造計算の間に固定される一般的な物理パラメータであるが、溶媒の粘度(例えば100%D2Oは100%H2Oの〜1.25の粘度を有する)または温度(例えば、一緩和データセットは298Kにおいて、別のデータセットは278Kにおいて記録された可能性がある)の差によるデータセット内での実際のτc値の変動は、τc値は温度に比例して溶媒粘度に反比例するという、回転拡散についての単純なデバイ理論を用いて補償される。それ故、各緩和データセットは、NMRサンプルの粘度(cPにおいて)、およびそのデータセットが取得された温度(Kにおいて)の両方の値を有する。異なる温度(T1,T2;100%H2Oのζ298=0.0088P)における100%H2Oの粘度(ζ)は、式(13)を用いて算出できる。所定の温度における100%D2Oの粘度は、式(14)を通して100%H2Oの粘度に関係する。H2O/D2Oの所定のパーセンテージv/vに対して式(13)および一次スケーリング式(14)を用いることにより、いずれの所定の温度におけるH2O/D2O混合物の粘度も推定できる。
Figure 2010539580
ここに記載される好ましい実施形態では、実験データは、特定の測定、スペクトル重複に関する情報、および実験条件を記述する物理パラメータを含む一連のテキストファイルを通して、構造計算へ入力される。全てのファイルにおいて、configulationセクションは、NMR磁場強度(field 900MHz)、データセットの名称識別子(ident NOESY)および使用される適切な溶媒マスク(h2o)を特定する。緩和データセットの場合、温度(temp 298、Kelvinにて)、溶媒粘度(visc 0.88、cPにて)、および使用される混合時間(mixtime 400ms)もまた特定される。NOESYデータを特定する入力ファイルの例を以下に示す。
Figure 2010539580
実験dataセクションはやや標準化されたフォーマットを有するが、実験測定の特定の種類に合わせることもまたできる。例えば、上記のNOESYデータ入力ファイルにおいてasgn 2 a 6 H3 a 6 H2N 34.2 13.70の行は制限数2を特定するが、それに続く4フィールドは2原子を定義し、その2原子間でNOEが観察される(かつ計算される必要がある)。次の2フィールドは制限強度およびその誤差(asgn 10の場合、34.2±13.7)を与え、最後のフィールドは、χ2 restraint値(この制限の予測値の実験的に観察された値に対する比較)が動的集団に対する総χ2 total値に含まれるべきであることを特定するflag(0)である(5を超える値は、それが使用されるべきではないことを示す)。重複した制限はフォーマットovlp 1 a 6 H2M a 6 H2N 48.8 19.6 0により特定され、ここでovlp 1は、この重複した制限における原子間のNOEを、同数の最初の制限から算出されたNOE(すなわちasgn 1)と組み合わせる必要があることを示す。スペクトルの対角ピークは、単純に同じ2原子の間のNOEとして表現される(これについての例は付表Aの実際の入力データファイルを参照)。
Figure 2010539580
残留双極子カップリング(RDC)入力ファイルのconfigulationセクションは、緩和データについて上に記載されたものに直接類似する。上記の入力ファイルの例を参照のこと。asgn 1 a 6 C1 a 6 H1 −5.85 0.35 0、asgn 1の行は、この行が制限数1であることを特定する。続くa 6 C1 a 6 H1の文字は、2原子の割り当てを定義し、その2原子間で残留双極子カップリングが算出される。これに続き、実験測定およびその誤差がリストされ(すなわち、asgn 1の場合、−5.85±0.35Hz)、flag(0)はこの制限の予測値の実験的に観察された値に対する比較のχ2 restraint値が、動的集団に対する総χ2 total値に含まれるべきであることを特定する(上記の通り)。
Figure 2010539580
コンフォメーションに依存するスカラーカップリングを表す入力データファイルは同様に特定される。典型的な入力ファイルは上に直接示される。coup 1 2 H2 2 C2 2 N2 2 H2N 9.45 −2.08 0.63 0 9.67 0.5 1の行において、coup 1はこの構造制限がカップリング定数型のデータであり、かつ制限数は1であることを特定する。9.45 −2.08 0.63 0の4フィールドは、HCNH角θに対する一般的なKarplus式3HH=Acos2(θ+φ)+Bcos(θ+φ)+Cにおいて用いられる、A、BおよびCならびにフェーズ(φ)パラメータを特定する。これに続き、実験測定およびその誤差が与えられ(coup 1の場合、9.67±0.5Hz)、flag(0)は、この制限の予測値の実験的に観察された値に対する比較のχ2 restraint値が、集団に対する総χ2 dataset値に含まれるべきであることを特定する(上記)。
ペプチドに対する二面角構造制限は化学シフトおよびTALOSプログラム[42]を用いて生成できる。TALOSプログラムは、ペプチド配列および分子内の各残基に対するHN、HA、C、CAおよびCB核の化学シフトを入力し、予測値を各骨格のphiおよびpsi角に対する誤差と共に出力する。TALOSは一般的にペプチドよりも強固であるタンパク質に対して実際に設計されたことから、χ2計算に実際に用いられる誤差はTALOSにより予測される誤差値の2倍とされる(この値は我々の現在の経験に基づく)。二面角構造制限ファイルのフォーマットの例は以下の通りである。
Figure 2010539580
このファイルにおいてconfigulation:セクションは、他のデータ型と同じフォーマットに従う。data:セクションにおいて、各制限はdiheにより導入され、続くフィールドは制限数である。次の8フィールドは二面角内の4原子を、(残基数、原子の名称)の組み合わせにおいて定義する。これらに続き、二面角値、続いてその誤差が与えられる。
水素結合相互作用の存在または不在は、アミドプロトン交換率および温度係数を含む数種の実験データから推測できる。水素結合が存在するか否かについての考慮は、角および距離基準の両方に依存する。典型的には、ドナーおよびアクセプター電気陰性原子は3.3〜2.5オングストロームの距離で隔てられ、ドナー水素およびアクセプター電気陰性原子は2.5〜1.5オングストロームの距離で隔てられ、3原子間の角は>110°である。構造内のこれらの3基準が満たされる場合、水素結合が存在するとみなすことができる。フレキシブルな分子内で水素結合は一過性に形成かつ切断でき、これらに実験データから推定され得るパーセンテージ占有率を与える([36]を参照)。これらの基準を満たす現在最も良い集団内の分子数を数えることにより、集団内の水素結合のパーセンテージ占有率を算出できる。現在の集団の算出された占有率と実験による制限占有値との比較は、χ2 restraintスコアの直接の算出を可能にする。
水素結合構造制限ファイルのフォーマットの例を以下に示す。
Figure 2010539580
このファイルにおいてconfigulation:セクションは、他のデータ型と同じフォーマットに従う。data:セクションにおいて、各制限はhbondにより導入され、続くフィールドは制限数である。次の6フィールドは水素結合(電気陰性ドナー、水素原子、電気陰性アクセプターそれぞれ)内の3原子を、(残基数、原子の名称)の組み合わせにおいて定義する。これらに続き次の5フィールドは、構造内に水素結合が存在するか否かを判定するための3基準を特定する。最初の二つの値は、その間で二つの電気陰性原子が見出されなければならない平均距離および範囲(例えばhbond 1に対し、2.9±0.4オングストローム)を与え、次の二つの値はその間で水素およびアクセプター原子が見出されなければならない平均距離および範囲を与え、最後の値は3原子全ての間の角の最小値である。次の二つの値は、実験データから決定された、水素結合の予期されるパーセンテージ占有率および誤差を定義する(例えばhbond 1,0および10に対し、0±10%の占有率)。最後の2フィールドは、制限がχ2 totalスコアおよび品質コードそれぞれに含まれる、各計算の実行中の点を定義する。水素結合アクセプター原子が1原子を超えることが可能な場合、他のアクセプター原子は、NOESYデータセットにおいて使用されるovip行と同等の様式で挙動する、hcombで始まる行による制限の累積スコア内へ含めることができる(例えば上の例中のhbond 1について、残基3のアミドプロトンと残基1の二つの側鎖酸素OD原子に対する全ての水素結合相互作用の総占有率は0±10であるべきである)。
Figure 2010539580
秩序パラメータ(Lipari−Szaboモデルのない解析による結果)は、局所的動態および特定の実行に有用な記述であり、入力データファイルはここに記載される。この入力ファイルのconfigulationセクションは、以前に記載されたものに直接類似し、例は上に示される。実験dataセクションにおいて、hnoe 1 w 2 H2N w 2 N2 0.44 0.01 0,hnoe 1は、この構造制限が秩序パラメータ型データであり、制限数は1であることを特定する。続くフィールドのw 2 H2N w 2 N2は、秩序パラメータが算出される2原子の割り当てを定義する。これに続き、実験測定およびその誤差が与えられ(hnoe 1の場合、0.44±0.01)、flag(0)は、この制限の予測値の実験的に観察された値に対する比較のχ2 restraint値が、動的集団に対する総χ2 dataset値に含まれるべきであることを特定する(上記の通り)。
3D構造の集団を正確に算出するため、別の一般的パラメータである分子の動的モデルが特定されなければならない。この動的モデルは、分子内の興味ある回転性結合の変数についての全ての明細を含む。結合が回転可能であるかどうかについては以下の考慮:
1)分子内の全ての単結合は回転可能であるが、二重、三重、または芳香結合は回転不可能である;
2)多くの単結合の回転は分子内の原子の相対的位置における効果をもたないため、これらの種類の単結合は回転する必要がない。このような単結合の例は、水素原子とその他のいずれかの原子の間、またはハロゲン原子とその他のいずれかの原子の間の結合を含む;および
3)幾つかの環状化学の中での単結合は、制約された配置のために回転できない;この例はシクロプロパン内のC−C結合であろう
により決定できる。
ここで、動的モデルが必要であることが同定された分子内の単結合(上記の考慮に従い)には、単峰性、二峰性、または三峰性が割り当てられる。問題となっている結合の様式を示す実験データが存在しないとき、動的モデルの様式の選択は表1を用いて決定される。この表は、単結合における2原子(原子AおよびB)の、使用される結合様式と混成状態[14]の間の相関関係を示す。
Figure 2010539580
これらの明細に従い、様式の挙動は最初に、以下に説明される広範囲の共有結合へ割り当てられる。
一般に内部座標配置に固定されるとみなされる共有結合の例(黒で示す共有結合は固定されるとみなされる)。
Figure 2010539580
一般に単峰性分布を好むとみなされる共有結合の例(黒で示す共有結合は単峰性の挙動を好むとみなされる)。
Figure 2010539580
一般に二峰性分布を好むとみなされる共有結合の例(黒で示す共有結合は二峰性の挙動を好むとみなされる)。
Figure 2010539580
一般に、電子共役によるシスおよびトランスのコンフォメーション異性体となる二峰性分布を好むとみなされる共有結合の例(黒で示す共有結合はシス/トランスの挙動を好むとみなされる)。
Figure 2010539580
一般に三峰性分布を好むとみなされる共有結合の例(黒で示す共有結合は三峰性の挙動を好むとみなされる)。
Figure 2010539580
各モードに対する平均角の最初の値は、立体的に好ましいコンフォメーションである値に設定される。例えば三峰性モデルにおいて、三つの平均角は、結合の完全なねじれ型の状態に相当し得る[15]。単結合および二重結合の間で中間特性を有する共有結合(電子共役により)は二峰性モデルを与え、ここで二つのコンフォメーションの二つの平均角はシスおよびトランス二面構造を与える。1以上のコンフォメーションの間で内部変換する環状化学には、必要に応じて二峰性または三峰性モデルが与えられ、ここで幾つかの二面角は一緒に同時に動く(いくつかの例は以下を参照)。
1以上のコンフォメーションを選択できる環状化学の例。
Figure 2010539580
動的3D構造の決定の間、最初に二峰性または三峰性の挙動に設定された(上記の表および記述に従い)回転性結合が、実際の分子内で実際により下位の様式の挙動を選択することが、実験データへの最も良い適合から明らかになるであろう。この場合、動的モデルファイルにおける様式の挙動は適宜更新される。
回転性結合の様式の挙動のために利用可能な以前の実験データが存在する場合、これは様式の挙動を定義するために用いることができる。所定の結合の様式の挙動を定義するために用いることのできる実験データの種類は、NMRデータ(例えばプロリンアミド結合のシス/トランス型は異なる化学シフトを有する)またはケンブリッジ構造データベースにおいてその結合(ならびに原子AおよびBにおける置換基)のために表示されるコンフォメーションの範囲の考慮を含む。分子動態のシミュレーションが行われるとき、これらはまた結合に対する最も良い様式の挙動を決定するためにも用いられてよい。
実験データに対して最も良く適合する集団を見出すためにどの回転性結合を変化させるべきかの決定後、各結合に対して使用者により指定される二つの基本的種類の定義されたフレキシビリティー:
1)単峰性結合のフレキシビリティーを定義する旋回
2)二峰性、三峰性およびより高次の様式の結合フレキシビリティーを定義する複数の旋回
が存在する。
以下に述べるように、本発明の好ましい実施形態では、回転性結合は単一の平均角値(μ)および角のガウス広がり(σ)を有する旋回によって指定され、これらは分子構造の集団を繰り返し生成しかつ各集団を実際の実験データに対して試験する適切な最適化アルゴリズムによって最適化される。この方法により特定される結合の例は、炭水化物内のグリコシド結合である。複数の旋回により指定される回転性結合には、それが選択可能な複数の配置が割り当てられ(典型的には2または3の低エネルギー回転異性体の位置)、これらはそれぞれ最適化できる角の値および角のガウス広がりを有し、かつそれらの相対的割合は確率モデルにより特定される(以下を参照)。これらの確率は、局所的なNOE/ROEの相対強度に従い、またはコンフォメーション依存性カップリング定数(例えばピラノース環内のヒドロキシメチル基)によって特定できるが、それらはアルゴリズムによってもまた最適化できる。二峰性の複数の旋回によって典型的に記載される結合の例はペプチドCα−CO結合(すなわちΨ二面)であり、これは典型的にはαらせん状(Ψ≒−60°)およびβひも状(Ψ≒120°)の幾何学的形状の間を跳躍する。以下に示す入力データファイルは、このようなモデル化の考慮が実際にはどのように実行できるかについての例を提供する。

Figure 2010539580
このファイルのvariablesセクションにおいて、変数は、それぞれが回転性結合の二面角についての平均値またはガウス広がりのいずれかを定義する、varコマンドを用いて定義される。varコマンドに続くものは、変数の数を示す数(後に変数を同定するために用いる)である。次のオプションは変数の初期開始値を決定する。例えば「rand 0 360」は最初の立体配置が0°〜360°のランダムな値であることを示すが、「fix 18」は変数が18°から始まることを示す。「jump」オプションは、最適化において各変数へランダムな変更を適用するために用いられる最初の値を特定する。大きな値(〜180)は、典型的には角の自由度(それらが効果的に空間を抽出することを確実にする)として用いられる変数のために用いられるが、より小さな値(〜10)は、典型的には25°までの最終値を有する動的広がりとして適用され得る変数のために用いられる(以下の実施例1、2および3を参照)。最後に「start」オプションは、最適化が開始される点を特定する。ここで、値0.0を用いることは最適化が直ちに開始されることを示すが、値0.5は、最適化の繰り返しの中間で最適化が開始されることを示す。
probabilitiesセクションは二峰性および三峰性分布を定義するために用いられる。modeの後、コマンドは確率数(それを参照するために用いられる)であり、二峰性分布に対する2、三峰性分布に対する3、または「対称的な」三峰性分布(ここで二つの確率は同等である。以下を参照。)に対する4のいずれかの数である。次の2または3の数は、そこにおいて異なるモードが選択される累積確率を表す。最後の数は、確率の繰り返し最適化を可能にする値である(値0.0は、最適化の間に確率モデルが変化すべきではないことを示す)。例えば上記の「mode 1 2 0.5」は、二峰性モデルを示し、ここで各構造は0.5(0.5)の確率を有する。上記第二のmode 2コマンドは三峰性分布を特定する(例えばメチル基に適用される)。両方は最適化されない設定である。最後のmode 3 4 0.33 0.1コマンドは、1自由度のみによる三峰性分布、単一の確率p1(すなわち対称三峰性モデル)を特定し;他の二つの確率は正確に同じ、すなわちp2=p3=1/2(1−p1)である。この場合p1は、適切な繰り返し跳躍サイズである0.1のこのコマンドにおける最後のカラムにより特定される浮動確率(floating probability)を有する。
このファイルのdynamicsセクションにおいて、定義された変数と分子二面結合角との間の相関関係が特定される。gyrateで始まる行は、
1)分子構造内の正確な二面角
2)二面角の平均値に対して用いられる変数(variablesセクションから)および
3)二面角のガウス広がりに対して用いられる変数
を特定する三つの付随する数による、単峰性確率分布モデルを特定する。
例えば、上記のgyrateの行の場合、41 1 3,41は二面角を特定し(41は内部座標の表において使用される特定の結合に対する値である。内部座標ファイルの例については、実施例1、2および3それぞれに付随する付表A、BおよびCを参照。)、1は平均値に対してvar 1が使用されるべきであることを特定し、かつ3はガウス広がりに対してvar 3が使用されるべきであることを特定する。
multigyrateで始まる行は、二峰性または三峰性角のモデルを特定する。multigyrate 48 1 4 6 5 6の行において、例えば最初の数(48)は内部座標表からの変化する分子二面角を特定し、二番目の数は使用される確率モデルであり(1、probabilitiesセクションより)、続く数は各モードに対する平均およびガウス広がりの適切な組み合わせ(var4および6、ならびにvar5および6)である。確率モデル2、3および4は、それぞれ2、3および2組の変数を必要とする。
変数および確率モデルは幾つかのgyrateまたはmultigyrateコマンドにおいて繰り返し使用でき、動的モデルが特定され得る方法において著しいフレキシビリティーが可能になることに留意すべきである。例えば、これにより、ある回転性結合が連結すること(例えば重合体内での同一の環境)、または複数の結合が主要なコンフォメーション状態の間で一斉に動くこと(例えばシクロヘキサン環)が可能になる。上で説明された一般的な原理は、以下の実施例1、2および3で用いられる。
溶媒マスク(solvent mask)、ファンデルワールスマスク、および動的モデルの定義後、例えば実施例10における、実験データに最も良い適合を与える未知の変数のそれぞれの値を見出すための最適化アルゴリズムの使用が可能となる。これは構造計算の繰り返されるラウンドの過程を用いることにより達成できる。図4は、全体的な集団生成および最適化過程の好ましい実施形態を代表するフローチャートを示す。
多数の最適化された動的構造を生成するため、構造計算のラウンドの間に、最適化過程は多数回(例えば約40回)実行されてよい。個々の実行はそれぞれ、同数の繰り返される最適化工程(例えば、動的小分子内に典型的に見出される自由度の数に対し、約10,000)を有してよく、かつ、動的集団において同数の構造(例えば約100)を用いてよい。最適化工程および動的集団内の構造の数は、構造計算の連続的なラウンドの間で一定に保たれてよく、異なるラウンドからの結果の直接比較が可能になる。または代わりに、最適化工程の数および/または動的集団内の構造数は、構造計算の1以上の連続的なラウンドの間で変動してよい。
好ましい実施形態では、実験データセットは構造計算の連続するラウンドに徐々に加えることができる。全てのデータセットファイルにおいて、最初の制限リスト内に様々な人的および実験的な誤差の源が存在し得ることから、これは実用的な限定を表し得る。これらの誤差の源は例えば、
1)構造制限の割り当ての誤り;
2)構造制限強度の決定におけるスケーリング係数の不正確な適用;
3)制限誤差の不正確な算出;および/または
4)スペクトルのアーティファクト
を含み得る。
これらの誤差を見出しかつ訂正するために、NMRによるタンパク質3D静的構造の決定に類似の様式において、構造計算の繰り返されるラウンドを行うことができる[16]。全データセットのうち、わずかな誤りしかなく、非常に高い信頼性を持つサブセット(典型的には、構造制限2D−NOESYおよびT−ROESYデータセットの60〜70%)を最初に使用することにより、構造計算のラウンドの後に高いχ2 restraintスコア(例えばχ2 restraint>>10)を有するわずかな構造制限が、異常値として容易に同定できる。これらの異常値は上記のように完全に再分析され、通常これにより不一致の源の決定およびその解決は成功する。これらが解決されたか否かを調べるため、修正された測定およびスケーリング係数による構造計算の別のラウンドが行なわれてよい。予測実験データと一致する実際の実験データ(構造制限)の適切なサブセットが一旦見出されると、実際の実験データセットからのさらなる構造制限を含めることができる。
この過程は、実際の実験データセット内の全ての構造制限が同時に満たされるまで繰り返されてよい。上記の構造制限リスト内でのフラッグフィールドの使用は、続く計算のラウンドにおいて個々の構造制限を迅速に含めるかまたは除くために用いることができる。一つの実際の実験データセットファイルを完了した後、別の実際の実験データセットが含められてさらなる計算のラウンドが行われ、新しいデータセットにおける誤った構造制限がこれまでのように徐々に訂正されるが、ここで新しいデータとの矛盾が見出された以前のデータセット内の誤った構造制限もまた訂正される。
前述の考察から、構造計算のラウンドにおいて、さらに、その構造と矛盾する誤った構造制限が同定できる前に、最適化された動的構造の大まかな収束を達成するため、十分な数の正確に測定された構造制限が、最初の実例において要求されることが認識されるであろう。動的構造は、さらなる構造制限または構造制限の実際の実験データセットの全体の包含が、最適化された動的構造における動的変数または確率に対する最終値に変化をもたらさないときには、十分に決定されている。
動的構造の解決においてもたらされた進歩は、少なくとも一つの実行について、好ましくはそれ以上、例えば構造計算の全てのラウンドについて、統計によりモニターされることが好ましい。最適化アルゴリズムの各実行は最適化された動的構造を生成し、これには各変数および確率に対する最も良い適合値、動的集団に対するχ2 total値、最適化に使用される各構造制限に対するχ2 restraint値、およびファンデルワールスの寄与に対するχ2値が付随する。計算のラウンドにおいて最も良い実行を用い(すなわち最も低いχ2 total値を有するもの)、これらの各パラメータについて平均値および標準偏差を算出する;例としての目的のみで、40のうち最も良い10の実行が使用され得る。各データセットファイルについてのχ2 dataset値に対する平均値および標準偏差が好ましくは算出される。これらのデータは以下の形であり得る第一の統計表において報告できる。
Figure 2010539580
このような第一の統計表において、最も良いχ2 total値を有する実行からのデータが示される(この場合、実行はχ2 totalの項において順位付けられ、最も良い10の実行が選択された)。TotChi行は、各実行についてのχ2 total値、およびこれらのχ2 total値に対するmean値および標準偏差(StDev)を与える。この行の上に、個々のデータセットファイルそれぞれについての平均χ2 totalおよびその標準偏差が与えられる(この場合、この計算のラウンドにおいて使用された2D−NOESY,JCOUP,ORDER、15N−NOESY−HSQCが指定される)。平均χ2 totalおよび標準偏差値は、各実行におけるファンデルワールス(VDW)項目に対してもまた与えられる。TotChi行に続くのは動的モデルファイルにおいて特定されるvariablesの結果、続いてprobabilitiesである。
本発明のさらなる好ましい実施形態では、いずれか1のデータセットファイルが新たに生じる動的構造へ過度にバイアスをかけているかどうかを決定するため、第二の統計表もまた作られてよい。この第二の統計表は、各データセットファイルにおける構造制限の数(Restraints)およびデータセットに対する総χ2 dataset値(Tot Chi)から、各データセットについてのχ2 dataset/制限(Chi/Res)を報告する。
Figure 2010539580
どの1データセットも新たに生じる動的構造へ過度にバイアスをかけていないとき、全てのχ2 dataset/制限値は〜1であり、互いに同程度である。上記の例において、実際にそのようになっていることが認められる。15N−NOESY−HSQCデータセットが構造に若干のバイアスをかけているようではあるが(χ2 dataset/制限=1.6)。秩序パラメータ(ORDER)およびスカラーカップリング(JCOUP)のような種類のデータについての誤差は実験的に決定できるが、NOESYおよびT−ROESYデータセットに対する誤差は、正確に知られていない値であるmに依存する。経験によるmに対する適切な値は、ほとんどの一般的な種類のNOESYおよびT−ROESY実験に与えられており(以下を参照)、これらは他のNOESYおよびT−ROESY実験に対する指針とすることができる。他の実験に対するmの値をさらに正確に決定するため、〜1のχ2 dataset/制限値が達成されるまで異なるm値を試みることができ、これはバランシングと称されてよい。バランシングの過程が非常に主観的になることを避けるため、下に挙げるものと同等なm値が使用されなければならず(すなわち0.1〜0.8)、かつバランシングは、ベースのデータセットがバランシングされるデータセットであると決定されるまでは試みるべきではない。
バランシングと類似の過程において、τcについての最も適切な値が、それが実験的に正確に決定されていない場合に見出すことができる。τcについての最初の推定値が、行われるべき構造計算、および収束構造を大まかに生成するための最適化アルゴリズムにおいて用いられるべき十分な構造制限を可能にするために使用できる。この点において、τc値のみが異なる幾つかの構造計算のラウンドを行うことができ、最も低い平均χ2 total値を与えるτcの値がτcの最も良い値とされる(上記の通り)。
実際の実験データに最も良く適合する分子の最初の動的3D溶液構造を決定した後、本発明のさらなる好ましい実施形態において、最初の最も良い3D溶液構造は、全ての利用可能な実験データへの可能な最も良い適合を見出すために、構造計算のさらに広範なラウンドにより改良される。この構造改良のラウンドは、構造計算の以前のラウンドで用いられたものと同じ実際の実験データセットの幾つかまたは全てを使用してよいが、例えば集団サイズは増大してよく(例えば250構造へ)、繰り返し工程数は増加してよく(例えば15000へ)、および/またはさらなる実行が行なわれてよい(例えば100)。それに加え、またはそれとは別に、動的モデルファイルは、分子の開始点が以前の構造計算のラウンドで決定された最も良いコンフォメーションにあるように(すなわちランダムなコンフォメーションにおいて始まる全ての変数は、以前に決定された最も良い値へ最初に固定される)、および/または動的パラメータ内で小さな跳躍サイズのみが許容されるように、変更できる。このことは、既知のχ2 total最小値が、実験変数および確率の可能な最も良い値が決定されるまで、局所的に探索されることを可能にする。この改良ラウンドの統計が、好ましくは全ての実際の実験データに最も良く適合する最初の集団または動的構造を提供する元の動的構造計算のラウンドにおいて以前に行われた統計と同じ様式において行なわれてよい。この改良ラウンドからの最も良い実行を用いて、平均の最適化された動的構造および平均の最適化された動的集団が算出されてよい(例えば、変数および確率についての平均値が、例えば100のうち最も良い20の実行から取られる)。
ここで図5を参照すると、本発明の実行を提供するために協同する複数の構成成分が図示されている。使用者のインターフェース構成成分1は、使用者とプログラムされたコンピュータとの間のインターフェイスを提供する。使用者のインターフェース構成成分1は、受け取ったデータを処理し、かつ処理されたデータを出力するように複数のモジュールと連絡する。例えば、構成成分2は本発明の実施形態により処理されるフレキシブルな分子を表す。フレキシブルな分子の構成成分2により表されるフレキシブルな分子は、使用者のインターフェース1により受け取られる。予測および実験計算構成成分3は、上記の様式において実験データ値を予測し、かつこれらの予測値をフレキシブルな分子の構成成分2に付随するデータを更新するために使用する。予測および実験計算構成成分3は、構造の集団から分子特性の平均を生成するために準備された、分子特性平均化構成成分4と連絡する。予測および実験計算構成成分3は、フレキシブルな分子の構成成分2により表されるフレキシブルな分子に影響する複数の繰り返しを行うため構成された、繰り返しスレッド5と連絡する。データ記憶構成成分6はシステムにより要求されるデータを記憶し、かつ複数のシステム構成成分と連絡する。動的コンフォメーション生成部構成成分7は、実験データの予測を実際の実験データに対して比較する。
フレキシブルな分子の構成成分2により表されるフレキシブルな分子は、デカルト座標を用いるよりも、結合、角およびねじれ角に関して定義される。フレキシブルな分子の表現は図6に示す複数のクラスを用いて達成される。分子クラス8は、フレキシブルな分子クラス9に対するスーパークラスとして作用する。フレキシブルな分子クラス9はトポロジークラス10とのつながりを有し、これは原子クラス11および結合クラス12とのつながりを有する。原子クラス11および結合クラス12はそれぞれ、分子内に含まれる原子および結合を表す。
図5のデータ記憶構成成分6のさらなる詳細を図7に示す。データ記憶クラス13は、データファイルを表すデータファイルクラス14とのつながりを有する。データ記憶クラス13は、実験データを記憶する実験データ記憶クラス15、および興味ある分子の物理パラメータを記憶する物理パラメータクラス16とのつながりを有する。分子特性記憶クラス17はデータ記憶クラス13ともまた接続し、分子特性を示すデータを記憶する。
実験データ記憶クラス15は、使用者により選択された実験データを予測し、かつ予測された実験測定と実際の実験測定の間の一致についてのχ2測定を報告するために、データ記憶クラスと接続する。分子特性平均化構成成分4は、実験データの予測に使用できる動的自由度から動的分子集団を生成する間に統計を算出する。これは、実験データの各型を定義する多形クラス構造の複数の例として実行される。従って新しい型の実験データを容易に加えることができる。これを図5に示す。
図8への参照により、データ_ファイルクラス14は異なるタイプの実験データを表す複数のサブクラスを有することがみとめられる。さらに詳細には、緩和_データクラス18、rdc_データクラス19、jcoup_データクラス20、hetnoe_データクラス21、hbond_データクラス22、二面角_データクラス23、およびvdw_データクラス24は全てデータ_ファイルクラス14のサブクラスである。データ_ファイルクラス14は、ファイルを同定する同定パラメータおよびデータのタイプを示す整数値であるデータタイプパラメータの二つのパラメータを公開する。多数の方法もまた、データ_ファイルクラス14により公開される。特に、データファイルからデータを読み取るために読み取りデータ法が準備され、クラスの内容をシリアル化するため、またはその内容を非シリアル化するためにシリアル化および非シリアル化法がそれぞれ準備され、一方、χ2計算を行うため、計算カイ二乗法が準備される。リターンデータタイプ法は、データ_ファイルクラス14により表されるデータファイルのデータタイプを変換し、一方、出力違反法はクラスに起こり得るいずれの違反も出力する。
緩和_データクラス18はnoe_データクラス25を有し、roe_データクラス26およびtroe_データクラス27は、緩和_データクラス18により表される緩和データのサブタイプを表すことがみとめられる。
図8への参照により記述されるクラス構造は、実験データの様々な異なるタイプを一般的な構造内で表すことを可能にする。複数の異なるタイプの実験データは、単一の動的モデルを生成するために共に使用できる。これについては上でさらに詳しく述べた。
図8への参照により記述されるクラス構造は、かなりのフレキシビリティーを提供し、かつ物理モデルに関連できるいずれの種類の動的データも上記の方法において使用されることを可能にする。例えば、NMR緩和データ、蛍光共鳴エネルギー転移(FRET)データ、分析超遠心(AUC)データおよび小角X線散乱(SAXS)データは全て使用できる。
NMRデータが最適化に用いられる場合、研究される分子は典型的に炭素および水素原子を含み(しばしば有機分子と称される)、かつ1以上の回転可能な共有結合(すなわち固定された配置を持たない)を有する。純粋な(>95%の単一分子種)分子が研究されてよいが、測定される実験的に観察可能なものが十分に分離または解析できれば、関連分子の混合物(すなわち数個の原子が異なる変異体)または実質的に異なる分子(例えば不純物の存在において)もまた使用できる。分子は、NMRデータが記録できる場合、受容体分子(例えばタンパク質または核酸)の存在下でもまた分析できる。
標準的な実践に従い、NMRサンプルは、生物学的に興味ある分子に対し、興味ある分子を溶媒、典型的には水(H2O、D2Oおよびそれらの混合物)に溶解することにより準備してよいが、適切な場合には有機溶媒もまた用いることができる。サンプルは典型的には1〜100mMの溶質濃度、300mMまでの塩(たとえば塩化ナトリウム、リン酸緩衝液)と共におおよそ中性のpHにおいて調製されるが、これらの範囲の条件に限定されるものではない。サンプルは典型的には内部標準化合物(例えばDSS、ジメチル−2−シラペンタン−5−スルホネート)および無機抗菌剤(例えばアジ化ナトリウム)を含むが、これらのいずれの条件も必須ではない。興味ある分子のわずかに異なる条件による1以上のサンプル(例えば、10%D2O/90%H2O V/V、100%D2O、アラインメント媒質(alignment media)の存在)が、必要により調製されてよい。分子は同位体が濃縮(例えば15N、13C、19Fまたは31Pにより)または枯渇(例えば天然存在13Cの12C、15Nの14N、または1Hの2Hによる置換)されている必要はないが、追加的な実験を行うことはでき、最適化において用いられるデータは分子がよく濃縮または枯渇しているべきである。NMRサンプルは、現代のいずれのNMR分光計において利用可能な、標準的なパルス系列を用いるNMRデータセットを記録するために用いられる。
NMRデータセットは、上記のように調製された分子サンプルにおいて記録され、1H、13Cおよび/または15N核(および存在するいずれのその他のNMR活性核)の帰属を可能にし(すなわちそれらのNMR化学シフトが決定される)、かつプロトン−プロトン等核スカラーカップリング定数が測定される。分子が溶液中にとどまっていれば、NMRスペクトルはいずれの温度においても記録できる。スペクトルは典型的には600MHzのプロトン共鳴周波数において記録されるが、より高いまたは低い磁界強度もまた使用でき、適切なスペクトル分解が達成できると推測される。これらの帰属実験[17、18]は、典型的には
1)[1H]−1D
2)[1H、1H]−DQF−COSY
3)[1H、1H]−TOCSY
4)[1H、13C]−HSQC
5)[1H、13C]−HMBC
6)[13C]−1Dスペクトル
7)[13C]−フィルター[1H]−1Dスペクトル
8)[1H、15N]−HSQC
9)[15N]−1Dスペクトル
10)[15N]−フィルター[1H]−1Dスペクトル
を含む。
次にNMR実験データセットが記録され、これは分子の3D構造および動的情報を定量的に示すパラメータの測定を可能にする。これを達成するため典型的に行われる実験は、以下のものを含むが、これらに限定されない。
1)核オーバーハウザー効果(NOE)および回転座標系NOE(ROE)。NOEおよびROEデータは、[1H、1H]−NOESY、[1H、15N]−NOESY−HSQC、[1H、13C]−NOESY−HSQC、[1H、1H]−T−ROESYおよび[1H、15N]−T−ROESY−HSQC[19、20]のような実験を用いて典型的に測定される。水が溶媒である特定の場合において、通常溶媒シグナルは前飽和または専用のパルス系列、例えばWATERGATEフィルターを含むものを用いて抑制される[21]。
2)コンフォメーション依存性スカラーカップリング。コンフォメーション依存性スカラーカップリング(例えば3HH)は、[1H]−1Dスペクトル、定量的E−COSY[22]、HNHA[23]およびJ−変調15N−HSQC実験[24]のような実験を用いて典型的に測定される。
3)残留双極子カップリング(RDC)。これは[1H]−1Dスペクトル、ならびに[1H、13C]−HSQCおよび[1H、15N]−HSQCのような実験から典型的に測定され、取得の間の広帯域異核デカップリングは動作しない[13]。分子が13Cおよび/または15Nにより同位体濃縮されている特定の場合において、タンパク質において行われるような標準的な実験もまた、RDCおよびコンフォメーション依存性スカラーカップリング(例えば3HC)を測定するために使用できる。
4)以前に得られた[6]、パルス系列を用いて測定するT1−およびT2−緩和データならびに異核(例えば1H−13Cまたは1H−15N)NOE[25]。
5)化学シフト異方性、常磁性誘導シフト、水素結合(例えば交換率、プロトン−カルボニルスカラーカップリング、同位元素効果または交換プロトン温度係数の決定により同定される)および塩橋(例えばpHまたはNaCl滴定により同定される)。
上で述べたように、実験データセットはいずれのNMR磁場強度、いずれの温度においても記録でき、ここで分子はなお可溶性であり、異なる組成のサンプル上にある。興味あるスペクトル特性の分離を可能にするため(例えばプロトン多重線構造)、全てのデータセットは取得次元(acquisition dimension)において十分な数のデータ点により記録されるべきである。NOESYおよびT−ROESY[26]スペクトルの場合において、プロトン多重線成分が間接的なプロトンの次元において分離されないように(何故ならこのことはスケーリング係数の決定を著しく複雑にするため(以下を参照))スペクトルは適切なパラメータにより好ましく記録される。スペクトルはまた、ピーク高さおよび化学シフト(ピーク−中心)測定における誤差を最少にするため、高いシグナル対ノイズ比によっても典型的に記録される。
NOESY、ROESYおよびT−ROESY NMRデータセットにおいて、構造および動的情報は各スペクトルのピーク強度(対角および交差ピークの両方)内でコード化され、従ってこれらのピーク強度は正確に決定されなければならない(しばしば最大ピーク高さを測定することによって達成される)。しかしながら、等核スカラーカップリングをもたない分子におけるプロトンは例外であるが(例えばアルデヒドプロトン)、プロトンからの各ピークは、プロトンに付随するスカラーカップリングの数および大きさ、NMR磁場強度、およびプロトンとそれに対してスカラーカップリングするプロトンとの間の化学シフト差に従い、取得次元(acquisition dimension)内で共鳴多重線へと多重分裂する
[27]。
アルゴリズムへの入力のため、1モル存在量のプロトンの真のピーク高さが必要とされることから(以下、図9、10および11への参照と共に記述する)、これらの分裂は、1モル存在量のプロトンの正確な等価ピーク高さ値の算出を可能にするために補正されなければならない。これはスケーリング係数fの使用により達成される。簡単に述べると、共鳴多重線内の各共鳴に対するスケーリング係数が決定されなければならず、このスケーリング係数は、共鳴多重線内の観察される共鳴の高さを1モル存在量のプロトンに対する値へ変換することを可能にする変換係数である。特定のプロトンの共鳴多重線に対するスケーリング係数のセットは、スケーリング係数セットfi={i1,・・・,in}と称される。従って、観察されたNOEの1モル存在量に相当する高さを決定するため、観察されたNOE(またはROE)の取得次元(acquisition dimension)におけるプロトンのスケーリング係数セットを知ることが必要になる。スケーリング係数セットの決定、および1モル存在量の真のピーク高さの算出におけるそれらの使用についての詳細を以下に述べる。
プロトン共鳴多重線は、隣接するプロトン間のスカラーカップリングから生じる。一次のケースにおいて、各スカラーカップリングはプロトンの線形を分岐させ、従って、プロトンに対するcのスカラーカップリングに対し、プロトンは2cの多重線成分を有するであろう。この一次のケースは、いわゆる弱いカップリング制限が満たされるときに起こり、これは式(15)に示すように、二つの核IおよびSの間における周波数差(ΔNIS)がそれらの間のスカラーカップリング(JIS)よりもかなり大きなときである(作動定義は、周波数差がスカラーカップリングの10倍であること)。
ΔNIS=|NI−NS|>>JIS (15)
式中、NIは核Iの測定された共鳴周波数、NSは核Sの測定された共鳴周波数、(ΔNIS)は核IおよびSの間における周波数差、および(JIS)は核IおよびSの間のスカラーカップリングを表す。
弱くカップリングしているプロトンの場合において、各等核カップリング定数の値が既知であるとき(上記)、プロトンスケーリング係数は明確かつ容易に算出できる(以下を参照)。しかしながら弱いカップリング制限が満たされないとき、核は強くカップリングしていると考えられ、一次では予想されない共鳴多重線の線形への変形が起こる。これらの変形はスケーリング係数の容易な計算を妨げるため(以下を参照)、弱く、および強くカップリングしたプロトンに対するスケーリング係数セットは異なる方法論により決定される。プロトンの等核カップリング定数は典型的には15Hz未満であることから(JIS)、一旦プロトンの化学シフトが分子内のプロトンを帰属する標準的方法によって決定されると、プロトンが特定のプロトン共鳴周波数(Hz)においてスカラーカップリングしている他のプロトンと弱くカップリングしているか否かは、式(1)によって容易に確認できる(上記)。
プロトンがスカラーカップリングしている全てのプロトンに対して弱いカップリング制限を満たすとき、プロトンのスケーリング係数セットは以下の方法論により決定できる。最も単純な場合において、全ての多重線成分は互いに分離される。すなわちcのスカラーカップリングを有するプロトンは、共鳴多重線における2Cの共鳴としてスペクトルにおいて独特に現れる2Cの多重線成分を有するであろう。この場合、理論的に全ての共鳴は互いに同じ高さを持つため、図9に示すように、この場合の各共鳴のスケーリング係数もまた2Cである。0、1、2または3の等核カップリング定数の存在により生成される各ピークに対するスケーリング係数セットを、図9に明確に示す。このようなスケーリング係数セットは単純スケーリング係数セットと称される。
弱いカップリング制限に従うプロトンのさらに複雑な場合において、多重線成分はある程度互いに重複し、このことはより少ない異なる共鳴(多重線成分数2Cよりも)がスペクトルにおいて観察されることを意味する。重複の程度および性質は、プロトンへのスカラーカップリングの数および大きさの両方、ならびにスペクトルにおける半分の高さでの固有プロトン共鳴線幅(λで表され、それ自体が温度、溶媒条件、および分子の相関時間に依存する)に依存する。λは特定のスペクトルの特性であることから、スケーリング係数セットは定量されるスペクトルそれぞれについて決定されなければならないことは明らかである。スペクトルにおける半分の高さでの固有プロトン共鳴線幅(λ)は、他の共鳴との重複から分離された幾つかの共鳴(例えば等核スカラーカップリングをもたないアルデヒドプロトン)から、半分の高さでの線幅の平均を取って測定される。多重線成分は、成分間の共鳴周波数差(Δν)がλの値よりも少ないか同等であるときに(すなわちΔν≦λ)重複し(すなわち別々に分離されない)、スペクトルにおいて個々の多重線成分に予想されるよりも高い単一共鳴として現れる。さらに、多重線成分が正確に重複(すなわちΔν=0)しない限り、共鳴はスペクトル内の重複しない多重線成分よりも広幅である。
プロトンの多重線成分の重複の程度は、そのプロトンに対する等核スケーリングカップリングの値に依存する。全てのカップリング定数が同時に同じ値(J)を有し、かつその値が半分の高さでの固有プロトン共鳴線幅よりも大きいとき(すなわちJ>λ)、多重線成分は完全に重複し(すなわちΔν=0)、かつ理想的なスケーリング係数セットを与える。1、2、3および4つの同一等核スケーリングカップリング定数が存在する事例について、プロトン線形の外観およびそれに付随するスケーリング係数セットを図10に示す。
むしろより一般的な事例であるカップリング定数の全てが同じ値を持たない場合、多重線成分は完全には重複せず(すなわちΔν≠0)、かつ非理想的な線形が観察される。このような多重線成分は、上で定義されたように本発明の第四の態様による方法を用いて解析することができ、本発明のこの態様の応用を示すため、この特定の実施形態をここに詳述する。
これらの非理想的な線形は一般に、図9および10に示す共鳴多重線パターンの一つに類似する外観を有する。この場合、非理想的なプロトンからのスケーリング係数セットは最初に、スペクトル内に観察されるものに最も類似する図9または10の線形から取られる。多重線成分の不完全な重複により広幅化されるこの多重線内の各共鳴について、重複成分間の値Δνは既知の等核カップリング定数の値から明確に算出される。例えば、プロトンが第二のプロトンに対して3Hz(Δν=3Hz)の単一のスカラーカップリングを有し、かつ、半分の高さでのスペクトルの固有線幅が6Hz(λ=6Hz)であるとき、二つの多重線成分は互いに完全には重複せず、かつ、スペクトル内に、1モル存在量のプロトンに要求されるものよりは低いが、1モル存在量のプロトンの値の半分よりは高い、単一の広幅の共鳴が観察される。単一の共鳴が観察されることから、このプロトンの多重線パターンは図9に示される事例(スカラーカップリングを持たないプロトン)に最も類似し、スケーリング係数セットは最初にf={1}とされる。しかしながら、この単一の広幅の共鳴の高さは、二つの成分が完全に重複した場合に重複した共鳴に対して観察されたであろう高さを決定するために、適切な広幅化調節(b)によりさらにスケーリングしなければならない。この広幅化調節は式(16)により適切にモデル化されることを示すことができる(1つのスカラーカップリングJの図解については図11を参照)。
Figure 2010539580
従って、半分の高さでの固有線幅が6Hz(λ=6Hz)であり、スペクトル内の単一のスカラーカップリング定数が3Hz(Δν=3Hz)である上記のプロトンの場合、最初のスケーリング係数セットがf={1}である広幅の共鳴は、広幅化調節b=6/(6−(3/2))=1.3を通して変換され、f={1.3}となる。スケーリング係数と組み合わせたこのセットは、この共鳴の実験的に測定された高さを、1モル存在量のプロトンについての同等な高さへ変換することを要求される正確なスケーリング係数である。共鳴多重線内の各広幅の共鳴は、非理想的な弱くカップリングしたプロトンに対する組み合わせたスケーリング係数のセットを決定するために、同様に処理されてよい。
第二の特に一般的な例として、6Hz(λ=6Hz)の半分の高さでの固有線幅を有するスペクトル中の、8Hzおよび10Hzの二つのスカラーカップリングを持つプロトンについて考慮する。このプロトンの線形は二つの同一なスケーリングカップリング定数を有するプロトンのそれに最も類似し(図10)、ここで二つの中央多重線成分は重複し、二つの外側の共鳴よりも約2倍高い共鳴を作り出す。従って共鳴には最初のスケーリング係数セットf={4,2,4}が与えられる。多重線成分間の分離は明らかに8Hz(第一および第二成分、Δν1,2=8Hz)、2Hz(第二および第三成分、Δν2,3=2Hz)および8Hz(第三および第四成分、Δν3,4=8Hz)である。Δν1,2およびΔν2,3の値がλよりも小さいことから、外側多重線成分(outer multiplet component)は他のいずれの多重線成分とも重複せず、従って広幅化調節は必要ではない。しかしながら二つの内側の多重線成分(Δν2,3<λであることから、単一の広幅の共鳴を与えるように不完全に重複している)については、広幅化調節が適用される。最初の値、すなわち2×b、ここでb=5/(5−(2/2))=1.25(Δν2,3=2、λ=5であるため)、従って2×1.25=2.5により、多重線内の中央共鳴に対する組み合わせたスケーリング係数fが与えられる。従って、このプロトンの共鳴多重線に対するスケーリング係数セットは、fi={4,2.5,4}となる。弱いカップリングの規則が適用される限りにおいて、これらの式および規則を用いて、いずれの所定のスペクトル内で異なる数および大きさのスカラーカップリングを持つプロトンに対して、組み合わせたスケーリング係数セットを明確に算出することが可能である。ヒアルロナン六糖類の加工例において、様々な異なる例が与えられる(以下の加工例を参照)。ここに提示される、単純な事例を超えた多重線パターンを計算するためのさらに一般的な規則は公表されている[27]。
広幅化調節式(16)から、Δνの値がλに等しいときb=2(すなわち二つの多重線成分が単に重複し、個々の多重線成分と同じ高さで、広幅のプラトーとしてスペクトル内に現れる共鳴を作り出す)であることが容易にみとめられる。二つの多重線成分が完全に重複するとき(すなわちΔν=0)b=1であることもまたみとめられ、これはそれぞれの多重線成分のスケーリング係数の数値の和と同等であり、かつ、広幅化のない理想的なスケーリング係数セットの事例と同等である。
プロトンが他のプロトンと強くカップリングしているとき、すなわち式(15)を満たさないとき、プロトンのスケーリング係数セットは以下の方法論により決定され得る。最初に、他のいずれのピークとも重複しないプロトンに由来するスペクトルピーク(すなわちこのプロトンに対応する取得次元(acquisition dimension)における化学シフト)を探索する(強いシグナル強度で)。従って、選択されたピークにおいて、多重線内の全ての共鳴は、スペクトル内の他のピークからの重複によって不明瞭になることなく明瞭に観察できる。そして、共鳴多重線内に他のいずれよりも特に広幅のものがあるか否かを決定するために、多重線内の共鳴の半分の高さでの線幅をスペクトルから直接測定する。実際に共鳴が全て互いにおおよそ同程度に広幅であるとき(最も広幅の共鳴が最も狭い共鳴の2倍に満たないことであると考えてよい)、プロトンのスケーリング係数セットは以下のように決定できる。各共鳴の高さはスペクトルから直接測定され(hi)、各共鳴のスケーリング係数(fi)は式(17)を用いて決定される。
Figure 2010539580
このようにして、スペクトル内で明確に分離されたピークが同定できれば、スケーリング係数セットは強くカップリングしたプロトンそれぞれについて決定できる。式(17)は、多重線内の各共鳴が半分の高さでおおよそ同じ線幅を有し、かつ共鳴多重線内の全ての共鳴の高さが正確に測定できるときにのみ、合理的に正確な結果を与えることに留意しなければならない。共鳴が半分の高さでおおよそ同じ線幅を有さないとき、その体積が十分な正確さで測定されれば、各共鳴の体積(vi)が式(17)における高さの代わりに用いられてよい。
分子の構造および動態についての情報を含む異なるNMRデータセットを分析し、各スペクトル内のデータ点を、スペクトルに含まれるデータの種類に応じて特定の方法により変換する。これらの手順は、データを動的構造計算アルゴリズム(上記)による使用に適した形へ変換するために必要とされる。各構造制限値の測定に加え、動的モデルが実験データに対しどのようによく適合するかをアルゴリズムが計算できるように、測定の標準誤差もまた決定されなければならない。
NOESY、ROESYおよびT−ROESYからの構造制限は、スペクトルからの対角および交差ピーク高さの両方の測定により得られる。プロトンの共鳴多重線内での共鳴に対するスケーリング係数セットを決定した後(上を参照)、各共鳴からの1モル存在量のプロトンについての真のピーク高さ(H)が以下のように算出できる。共鳴多重線内での各共鳴の共鳴高(hi)がスペクトルから直接測定され、これにスケーリング係数セットからの関連するスケーリング係数fiを掛け、真のピーク高さHiの個々の測定が与えられる。式(18)。
i=hi×fi (18)
共鳴多重線内の幾つかの共鳴高さを測定し、それぞれに、それに付随するスケーリング係数を掛けることにより、真のピーク高さ(H)についての幾つかの異なる値が算出される。従って、真のピーク高さとして使用する最も良い値は、これらの繰り返し測定からの平均値(<H>)である。式(19)。
Figure 2010539580
式(19)を用い、NOESYまたはROESYにおける全てのピーク(対角および交差ピークの両方)の真のピーク高さが、アルゴリズムへの直接入力のために算出されてよい。それぞれの真のピーク高さは、一対のプロトンに関連し、該プロトンを示すNOEまたはROEの帰属であり、それに対するNOEまたはROE値がアルゴリズムにより予測されるべきである。それぞれの真のピーク高さはまた、算出された標準誤差値が与えられる(以下を参照)。真のピーク高さ値および真のピーク高さ値についての標準誤差を伴う、NOE/ROE効果を受ける二つのプロトンの指定は、NOEまたはROE構造制限と称される。重複したNOEまたはROE構造制限の場合(特にスペクトル内でピークを形成するプロトンが同一の化学シフトを有するときに起こる)、幾つかのプロトン対が共にスペクトル内のピークを生じさせるため、アルゴリズムはこのプロトン対の群の真のピーク高さに対する組み合わせた予想値を算出する。互いにスカラーカップリングするプロトンに対して帰属された等核2D−NOESY、ROESYまたはT−ROESYスペクトルにおける交差ピークは、一般に正確な構造制限の生成には有用でないことに留意しなければならない。これは、NOEまたはROE混合時間の間のスカラーカップリングの発生が、共鳴多重線線形および構造を自明ではないように大きく歪め、この様式での分析を困難にするからである。
ピークの、平均の真のピーク高さ(<H>)を決定した後、この測定における推定誤差(εexp)もまた算出されなければならない。算出された平均の真のピーク高さにおける誤差の源は、スペクトルのシグナル対ノイズ、位相のねじれおよびスペクトルのアーティファクトによる各共鳴の線形内の固有の非理想性、および適用されるスケーリング係数による、それぞれの測定された共鳴高さにおける誤差のスケーリングを含む。スペクトルのシグナル対ノイズは直接測定される。各共鳴の線形内の非理想性は、測定された共鳴の高さに直接比例するNOESY、ROESYおよびT−ROESYスペクトルにわたる均一な系統的誤差を与えると考えることができる。比例定数はmとされ、2D−NOESYスペクトルの場合約0.4(すなわち測定された共鳴高さの〜40%)、2DT−ROESYスペクトルの場合0.5、15N−T−ROESY−HSQCスペクトルの場合0.2、および15N−T−NOESY−HSQCスペクトルの場合0.4であると考えてよい。従って、標準的な統計手法によれば、これら二つの系統的誤差に由来する、スペクトルからの各共鳴高さhの測定における誤差ε(h)は式(20)により与えられる。
Figure 2010539580
真のピーク高さの決定には、測定された共鳴高さそれぞれに適切なスケーリング係数(fi)を掛ける。この結果は真のピーク高さ(H)の個々の測定それぞれにおける誤差ε(H)をもたらし、これは式(21)により与えられる。
Figure 2010539580
従って、幾つかの共鳴の共鳴多重線について、真のピーク高さ(Hi)の推定値それぞれは、fi√(m2i 2+s2)で表される、付随する推定標準誤差を有する。真のピーク高さの平均値(<H>)を算出するだけで、推定標準誤差(εexp)に使用できる適切な単一の値が式(22)により与えられる(標準的な統計学的手順により)。
Figure 2010539580
NOESYまたはT−ROESYでのピーク高さの決定において起こり得るさらなる複雑さは、異なるピークからの共鳴が、各ピークを形成するプロトンの化学シフトに依存して、より大きなまたはより小さな範囲で重複し得るということである。同等なモル比の二つの重複する共鳴(Δν)間のHzにおける差(例えば異なる二重線からの二つの共鳴の重複)が正確に決定され得る場合(各プロトンの既知の化学シフト、ならびにスケーリング係数セットおよびスカラーカップリングから算出した共鳴多重線内の各共鳴の周波数を用いて)、広幅化調節のための上記式が直接適用でき、アルゴリズムにおける使用のための定量化された重複NOEまたはROE構造制限がもたらされる(すなわち真のピーク高さは2以上のNOE/ROEの和を表す)。重複が同等でないモル比の二つの成分によって生じる場合(例えば、0.5モルのプロトン存在量での二重線共鳴が、0.25モルのプロトン存在量での外側三重線共鳴と重複する場合)、この非同等性に対応するために重複および広幅化調節が適切に重み付けられてよい。
関連する分子種の混合物(すなわち数個の原子が異なる変異体)がNMRサンプル中に存在する場合、あるNOE/ROEは、モル存在量で存在するプロトン由来であるが(すなわち、化学構造に違いがない分子の部分)、別のNOE/ROEは、著しく少ないモル存在量で存在するプロトン由来である(すなわち、分子種の混合物の間で化学構造が変化している、分子の部分間でのNOE)。例えば、還元末端を有する糖の事例において、還元末端環は溶液中でαおよびβアノマーの混合物として、それぞれ1モル当たり0.4および0.6モルの典型的な相対的存在量(r)で存在することが知られているが、分子の残りは同一である。従って、分子の残りの基の間でのNOEは1モル存在量で存在するが、αまたはβ環におけるプロトン対するNOEは低い強度を有する。従って、α還元末端環にあるプロトンに対する還元末端環にないプロトンからのNOEの場合、強度はα型を100%存在量とした場合の40%となる。従って、真のピーク高さ(上記のように、共鳴多重線からの測定された共鳴高さから決定され、スケーリング係数によりスケーリングされる)には、1モルの値を決定するためさらに1/rの要素を掛けなければならない。それ故、この場合の真のピーク高さにおける推定標準誤差εexpは、ここで式(23)により算出される。
Figure 2010539580
1モル存在量にて挙動するプロトンの同様の欠乏は、用いたNMRパルス系列に起因する分子内のプロトンの不均一な励起を通して起こる。これは水サンプル中での水共鳴に近いプロトンの場合において特に当てはまり、ここでH2Oからのシグナルを最小化するためにWATERGATE励起プロファイルが用いられる。この問題を克服するために、均一な励起が達成される(例えば、水を減少させるための光前飽和による1Dスペクトル、または13Cフィルターによる1Dスペクトル)スペクトル内のプロトンからの共鳴高さは、不均一な励起を伴う(例えば、WATERGATEによる1Dスペクトル)スペクトルからの共鳴に対して比較でき、かつ共鳴高さの比は、同じ励起プロファイル(例えば、WATERGATEによる2D NOESY)を用いる全ての実験における1モル存在量に対する適切な再スケーリング係数を提供するために用いることができる。この方法で得られた真のピーク高さにおける誤差は、式(9)で表される、分子の混合によって起こる非モル存在量のプロトンを作り出す分子の混合物に対するものと同じ様式において決定される。明らかに、これらの励起プロファイルが誤差の別の源を導入することから、実験的に可能なプロトンシグナルの均一な励起が好ましい。
NOESYおよびROESYスペクトルそれぞれからの「noNOE」および「noROE」構造制限の使用は、各データセットの分析に重要な部分であり得る。データセットのサイズの増大に加え、noNOEおよびnoROEの重要性は、実験データになお一致するように分子中の原子が分子集団にわたって占めることのできる相対的3D空間において、それらが課す制限にある。noNOE(またはnoROE)は、化学シフト座標(相関が可能であり得る)においてスペクトルのノイズを超えるシグナルが存在しないときに帰属される。このようなnoNOEには、ゼロの真のピーク高さ、および取得次元(acquisition dimension)プロトンのスケーリング係数セットからの最小スケーリング係数を掛けた化学シフト座標において測定された強度の第三の値に設定された、それらの標準誤差を与えられてよい(すなわちεexp=(fmin×hzero)/3であり、式中、fminは取得次元(acquisition dimension)プロトンのスケーリング係数セットからの最小スケーリング係数、およびhzeroは化学シフト座標において測定された強度)。各スペクトル内に、できるだけ多くのnoNOE(およびnoROE)が帰属される。
3D分子構造および動態を報告する別の種類のNMRデータはコンフォメーション依存性スカラーカップリングである。これらは測定され、その標準誤差は上記のような標準的な実験から決定される。各スカラーカップリングは、アルゴリズムへの入力に関して適切なKarplus相関に関連し[28];適切なKarplus相関は公表された文献から引用されるか、または量子力学的アプローチを用いて明確に算出されてよい。幾つかの特定の場合において、測定されたカップリング定数は個々の分子の幾何学的形状または分子の幾何学的形状のセットに直接関連してよい。これらの場合、異なる結合回転異性体の状態およびその相対的割合は、アルゴリズムにより用いられる分子内部座標モデルにおいて明確に表現されてよい。この場合の例は、ggおよびgtコンフォーマーの相対的割合を明確に算出するためにHasnoot et al.の相関が使用できる、ピラノース環のヒドロキシメチル基である[29]。
3D分子構造および動態を報告するさらなる種類のNMRデータは、残留双極子カップリング(RDC)である。残留双極子カップリングは、分子が弱いアラインメント媒質(alignment media)中にあるとき(例えばファージ、バイセル、ゲル)、スカラーカップリングにおいて観察される明らかな変化として測定される[13]。最初に、分子内のカップリング定数(1、2および3結合)がアラインメント媒質(alignment media)の非存在下で記録された適切なスペクトルから標準的な方法論を用いて測定される。これらの同じカップリングは、次にアラインメント媒質(alignment media)の存在下で記録された同一のスペクトル内で測定され、この二つの測定の間のHzにおける相違が残留双極子カップリング(RDC)である。このRDCの決定に付随する誤差もまた、標準的な統計法を用いて算出されてよい(例えば、以下に述べる[1H,13C]−HSQCスペクトルから測定されたRDCの特定の事例のための方法)。
興味ある分子が同位体濃縮されていないときにRDCを測定するために用いられる特定の実験は、取得の間に13C広帯域デカップリングのない13Cの天然存在において記録される[1H,13C]−HSQCスペクトルである。この実験は1CHカップリングの直接の測定を可能にするだけではなく、記録される取得次元(acquisition dimension)における十分なデータ点を可能にし、プロトンカップリングによる多重線成分が分離される。各1CHカップリング(J)は次に、それぞれの高および低フィールド共鳴多重線における類似共鳴の間のHzによる分離として数(n)回測定でき、各測定に付随する平均値(μJ)および標準偏差(σJ)を与える。次にデータセット内の全ての1CHカップリングの二乗平均平方根偏差(RMSD)を算出し、これが個々の1CHカップリングそれぞれに付随する標準誤差(σJ)とされる。同様に、アラインメント媒質(alignment media)存在下での、各1CHカップリングの平均値(μR)および標準誤差(σR)を決定する。次に、残留双極子カップリング(D)が二つの平均値(μR−μJ)の間のHzにおける相違として算出されてよく、その標準誤差(σD)が標準誤差の二乗の和の平方根として与えられる(√(σD 2+σJ 2))。
プロトン−プロトンRDCのための化合物RDC(ここで化合物RDCは、2以上のRDCの和として定義される)もまた、このようなデカップリングされた[1H,13C]−HSQCスペクトルから同時に測定できる。強いカップリングが存在しないとき、これらは、各プロトン多重線の最外側成分の間のHzによる分離は、その多重線を形成する全ての2および3結合のプロトンスカラーカップリングの和に等しいという事実を用いて測定できる。同様にアラインメント媒質(alignment media)の存在下で、この分離はその多重線を形成するプロトン−プロトンRDCに組み合わせた全ての2および3結合のプロトンスカラーカップリングの和に等しい。これら二つの値の減算、および上記のものに同様の統計分析を行うことにより、化合物RDCおよびその標準誤差を測定できる。
上記の1以上の過程を用いた後、定量化誤差を伴う構造制限は抽出され、興味ある分子の分子3D構造および動的運動を抽出するNMR実験から適切に変換される。分子の動的構造は、構造および動的データを含む単一のNMRデータセットから決定できるが(例えば2D−NOESY)、異なる種類のデータを有する2以上の実際の実験データセットを用いるとき(例えばRDCデータを伴うNOEデータ)、質的に異なる方法における異なる種類の実験サンプルの分子運動により(すなわちここに記述される物理理論により、分子距離および幾何学的形状の様々な異なる平均を報告することにより)、著しく大きな正確さが達成され得る。2以上の実験データセットが、わずかに異なる方法により記録された(例えば2D−NOESYおよび13C−NOESY−HSQCデータセット、あるいは異なるNOE混合時間による複数の2D NOESYデータセット)同じ型のデータを含む時、決定された構造の正確度が改善されるがこれは実質的ではない可能性がある。1を超える実験データセットが用いられるとき、上記のように、各データセットはアルゴリズムによる使用のための構造制限の別々のリストとして保持される。
上記の方法は動的分子の3D構造の決定を可能にする。このような構造は、実験的に観察可能なものを予測できる、試みられる分析的およびコンピュータモデル化演習の多重度を可能にするため有用である。この技術は、限定されないが下記の例:
1)炭水化物リガンドおよび炭水化物ミメティクス(例えばアミノグリコシド抗生物質);
2)ペプチドおよび人工ペプチドミメティクス;
3)薬物分子の分子フレキシビリティー;
4)酵素/受容体活性部位またはタンパク質−タンパク質相互作用部位内のフレキシブルなタンパク質側鎖;
5)核酸分子内のフレキシブルな塩基(例えばRNAアプタマー);および
6)幾つかのコンフォメーション状態をもつタンパク質(例えばインテグリン)および本質的に折り畳まれていないタンパク質
のような、広範囲の分子に対して適用性をもつ。
フレキシブルな分子についての構造情報を必要とするいずれの研究および開発計画も、本発明の好ましい実施形態により生成された動的構造、特にリガンドタンパク質相互作用に関するものから劇的な利益を得るであろう。本発明により生成された動的構造のさらなる潜在的に重要な使用は、合理的薬物設計(RDD)、すなわち特定の方法で標的タンパク質と相互作用する分子を設計するためのコンピュータの使用である。RDDは相互作用−エネルギー予測に頼ることから、薬物およびタンパク質両方の詳細かつ正確な物理データを必要とする。現在、わずかに〜10%の予測された分子がその受容体にうまく結合するという事実にみられるように、予測は不十分である。これを改善するため、結合エネルギーに対するエンタルピーの寄与(分子の形により支配される分子間結合の形成)および結合エネルギーに対するエントロピーの寄与(結合における無秩序およびフレキシビリティーの変化)の両方に関わるデータが必要とされる。分子結合相互作用(エンタルピー)は十分に推定できるが、分子のフレキシビリティー(エントロピー)はそうではなく、このフレキシビリティーの情報なしでは、RDDはその予測能において基本的に限定される。我々の方法論により決定された薬物分子の好ましい構造(内部エンタルピー)および動的運動(エントロピー)の両方の使用はそれ故、RDDアプローチによるヒット同定およびリード最適化において著しい改善をもたらす[30]。この方法論は、合理的薬物設計および化学的模倣による新薬発見の著しい助けとなり得る、医薬分子の動的構造の決定を可能にする。
さらに、本発明およびそれから生み出される動的3D構造は、その結合型由来の遊離溶液構造の偏差を算出するために使用でき、かつ正確な評価関数として使用できる(図12を参照)。動的構造はそれ故、エンタルピーエネルギーの項のみを考慮する技術(例えば水素結合、疎水性など)または分子動態シミュレーションの使用に比較して、潜在的なリガンド−受容体相互作用を理解するための予知力において著しい進歩を提供する。特に、これは実験的に測定された結合定数および相互作用エネルギーに定量的に適合する評価関数により、さらに正確に行われるドッキングを可能にする[32]。本発明から利益を享受するその他の分野は、
1)バイオミメティック分子の生成、例えばヘパリンミメティクスの設計;
2)受容体分子のアレイを用いる分子相互作用の分析、例えばシステム生物学およびプロテオミクスにおいて;
3)コンビナトリアルケミストリーにおける、可能性のある反応経路の予測による薬物ライブラリーの設計;および
4)分子機械の設計および構築(ナノテクノロジー)を含む。
ここで本発明について、以下の限定されない実施例への参照によりさらに記述する。
(a/b)は二面角αを示し、(a)は側面から、(b)は中央の結合から見下ろしたものである。(c)は動的集団を生成するために用いるαのガウス分布を示す。 アンギオテンシン4ペプチド(VAL−TYR−ILE−HIS−PRO−PHE)のモデルである。左:アンギオテンシン4の静的構造。中央:上記の通り、ガウス分布G(−57°,20°)をTYRとILEの間のφ角(C[2]−N[3]−Cα[3]−C[3])に適用させることにより作られた集団。右:分布G(−57°,20°)をTYRとILEの間のφ角に適用させ、かつG(−20°,20°)をILEとHISの間のΨ角(N[3]−Cα[3]−C[3]−N[4])に適用させることにより作られた集団。 本発明の好ましい実施形態による動的構造決定法の模式的フローチャート表示。 本発明の好ましい実施形態による動的分子の3D構造を決定するために使用される全体的過程を示すフローチャート。 本発明の実施形態の実行のために使用される構成成分の模式図。 フレキシブルな分子を表すために用いられるクラスを示すUMLダイアグラム。 データを記憶するために用いられるクラスを示すUMLダイアグラム。 データファイルを表すために用いられるクラスを示すUMLダイアグラム。 全ての多重線成分が分離している単純な事例に対するプロトン共鳴スケーリング係数。これはスカラーカップリング(J1,J2,...)が線幅に比べて大きく、かつそれらが十分に異なるときに起こる。 全ての多重線成分が分離しているわけではなく、化学的類似性により重複が完全である事例に対するプロトン共鳴スケーリング係数。これはスカラーカップリング(J1,J2,...)が線幅に比べて大きく、かつ同じ値のJを有するときに起こり得る。 組み合わせたスケーリング係数のセットを用いて共鳴の高さを定量的に解釈するために、重複するプロトン共鳴多重線の成分に適用する必要のある広幅化因子(b)の計算。 ドッキング研究における構造決定の使用(詳細は以下の実施例を参照)。上に示す共複合体構造はタンパク質データバンクから取得される(コード2JCQ)[31]。 N−アセチル−D−グルコサミン(GlcNAc)およびD−グルクロン酸(GlcA)を含むヒアルロナンの繰り返し二糖単位を示す。これらの残基はβ1→3およびβ1→4グリコシド結合を交互に行うことにより接続される(表示)。 末端GlcNAc環(環6)内のヘミアセタール基の存在により、ヒアルロナン六糖類(HA6)は水溶液中にαおよびβ立体異性体型の混合として存在する。これら二つの型の間の化学結合の違いをアスタリスクで示す。GlcA=D−グルクロン酸;GlcNAc=N−アセチル−D−グルコサミン;数は環の数の指定に適用される。 HAオリゴ糖におけるGlcNAc(左)およびGlcA(右)残基の、2および3結合の等核スカラーカップリング定数。プロトンの各カップリング対に対するプロトン名(例えばHN、H−6proS、H2)およびカップリング値(Hzにおける)を示す。明解さのため、化学構造から環水素原子は除外されている。 α−HA6内のコンフォメーション的にフレキシブルな結合および化学。 動的モデルファイル内の各変数の、α−HA6における回転性結合に対する関係性。 α−HA6の平均3D溶液構造。(上図)水素原子を除外した棒表示。(下図)空間充填表示。環6は両方の図の左側にある。 全ての実験データと集団的に一致する250構造のうちの最も良い集団を示す、α−HA6の3D溶液構造。(上図)最も良く適合する動的集団。(下図)中央の二つの環にオーバーレイされた最も良く適合する動的集団。環6は両方の図の左側にある。 250構造の動的集団から選択された個々の構造。これらはα−HA6の、可能な瞬間的な溶液コンフォメーションを示す。水素原子は除外されている。 そのpH6.0におけるイオン化状態を示す、リシノプリルの化学構造。 プロリンアミド結合の存在により、リシノプリルは水溶液中でトランスおよびシス立体異性体型の混合として存在する。これら二つの型の間の違いを黒で示す。 pH*6.0、278Kでの100%D2Oにおけるトランスリシノプリルのプロトン化学シフト。 トランスリシノプリルにおいて測定された3HHカップリング定数。 リシノプリル内のコンフォメーション的にフレキシブルな結合および化学。 動的モデルファイル内の各変数(ν)および確率モード(m)の、トランスリシノプリルの化学構造に対する関係性。 リシノプリルの平均3D溶液構造。(上図)棒表示および(下図)空間充填表示。 250構造のうちの最もよい集団からの20のランダムな構造を示す、トランスリシノプリルの動的3D溶液構造。 トランスリシノプリルの動的溶液構造(薄い青の線;最も良い集団における250構造のうちの最もよい集団からの20のランダムな構造のオーバーレイ)の、ACEに結合したときのトランスリシノプリルの構造(濃い黄色の線)に対する対応[41]。リシノプリルの未結合の溶液コンフォメーションについての構造の集団が、起こりそうな酵素結合コンフォメーションを予測するための望ましい開始点を提供することは明らかである。 構造の最も良い動的集団からの10構造を示す、トランスアンギオテンシンIの3D動的溶液構造を示した二つの図。各残基は標識されている。二つの図はお互いに対して約90°回転しており、重原子のみが示される。 空間充填(上図)および棒(下図)表示による平均動的構造を示す、トランスアンギオテンシンIの3D動的溶液構造を示した二つの図。水素原子は棒表示から除外されている。両方の図は左にAsp1がある同一の配向にある。 リシノプリル(左)、架橋基(太く示す)の含有により望まれない自由度を除くために設計された、in silicoで開発された誘導体(右上)、および次世代ACE阻害剤であるベナゼプリラート(右下)の構造。
ヒアルロナンヘキササッカライド
ヒアルロナン(HA)は、N−アセチル−D−グルコサミン(GlcNAc)およびD−グルクロン酸(GlcA)の二糖の繰り返しからなる炭水化物である(図13参照)。多くの他の機能の中でも、HAは、脊椎動物の細胞外基質に構造的統一性および組織性を与える。HAの多糖形態は、二糖の数千の繰り返しを有し、生理学的プロセス(例えば、子宮頸部熟化、歯の発育)および疾患プロセス(例えば、子宮内膜癌、アテローム性動脈硬化症)の両方に関わる。HAのオリゴ糖は、二糖の数個のみの繰り返しを有し、別の条件下で顕著な活性を有する(例えば樹状細胞の成熟誘導)。したがって、HAは生物工学分野および化粧品分野で商業的に重要である。
ヒアルロナンのオリゴ糖は、ポリマーより研究が容易である。なぜなら、これらは決まった長さの均一な標品として精製することができ、ポリマーと異なり極端な粘性溶液を形成しないためである[33]。HAのヘキササッカライド(HA6、図14)は、HAの二糖の繰り返しを3個だけ含み、HAの長さは、NMRによる構造解析が可能なポリマーの局所的な構造的特徴を有するのに十分な長さであることが示されている[34、35]。本実施例で、本発明者らは、本特許に記載の方法を用いてNMRの実験データからHA6の動的3D溶液構造がどのように決定されたかを示す。
<化学シフトの帰属および等核スカラーカップリング定数の測定>
HA6中に「還元末端」(すなわちヘミアセタール基)が存在するため、HA6の末端環(環6)は実際には溶液中でα−およびβ−立体異性体の分離不可能な混合物として存在する(図14)。これら2つの形態の化学シフトはほぼ同じである[34]。本発明者らは以前に、HA6のα形態およびβ形態の両方の1H、15N、および13Cの化学シフトを全て帰属し、これら2つの形態のモル存在比がαが60%、βが40%であることを決定している[35]。α−HA6が混合物中により多く存在し、β−HA6よりも相当良い解像度を示したので、この段階で、β−HA6ではなくα−HA6の動的3D構造を決定することにした。
種々のHAオリゴ糖のGlcA環およびGlcNAc環中の2HHおよび3HHのカップリング定数を測定し、これらの残基タイプ中の各カップリング定数の合意値(consensus value)を得た(図15)[35]。
<スペクトルの線形の解析>
α−HA6の構造的制約を求めるために、4個の異なるNOESYおよびT−ROESYデータセットを用いた。それらは、2D−[1H,1H]−NOESYデータセット、2D−[1H,1H]−T−ROESYデータセット、3D[1H,15N]−NOESY−HSQCデータセット、および3D−[1H,15N]−T−ROESY−HSQCデータセットであり、各データセットの取得パラメータの完全な詳細を以下に示す。これらのデータセットのそれぞれについてスケーリング係数(scaling factor)セットを以下のように決定した。ブロードニング調整式(broadening adjustment formula)に必要なα−HA6内の全プロトンの2HHおよび3HHスカラーカップリングを図15からとった。
2D−[1H,1H]−NOESYデータセットの記録は、取得次元中でプロトンの多重分裂を解像するのに十分なデータポイント数且つ間接次元でこれらのマルチプレットが解像されるのを防ぐのに十分な少ないデータポイント数で記録した(すなわち、前述のように、プロトンマルチプレットの解析を取得次元だけに単純化した)。このデータセットのλの値(Hzで表した共鳴の線幅、上記参照)は、全て単純なダブレットを呈するアミドおよびGlcAのH1プロトンのNOESY交差ピークの測定から求めた(したがって、各ダブレットの要素がλの真の測定値を与える)。各ダブレットの別々の共鳴から、4.83、4.75、5.28、および5.21Hzの値が測定され、平均値は4.8Hzであった。このλの値、スカラーカップリング定数(図15)、およびブロードニング調整式を用いて、以下の通り、この2D−[1H,1H]−NOESYデータセットのα−HA6中の各プロトンについて、スケーリング係数セットを決定した:
<GlcA環1、3、および5、H1プロトン>
このプロトンは唯一つの3HHカップリング定数7.8Hzを有し、これはλより大きいため、この2D−NOESYスペクトルの取得次元中で単純なダブレットとして(すなわち、図9のスカラーカップリング1個のように)現れる。したがって、ダブレットの各要素についてのスケーリング係数セットは2である。すなわちfi={2,2}である。
<GlcA環1、3、および5、H2プロトン>
このプロトンは2個の3HHカップリング定数、9.5Hzおよび7.8Hzを有し、その結果、このプロトンは基本的なトリプレットで(すなわち、図10のスカラーカップリング2個のように)現れる。すなわち、初期スケーリング係数セットはfi={4,2,4}である。しかし、2個のカップリング定数が同じでないため、真ん中の2個のマルチプレット要素は完全には重ならず、「トリプレット」の中央のピークは広がっている。これら真ん中の要素間の距離Δνは(9.5〜7.8)=約1.7Hzであり、これはλよりかなり小さく、この要素のブロードニングは、ブロードニング調整式から(4.8/(4.8−1,7/2))=1.2と決定される。このブロードニング調整に重複調整因子(すなわち2)をかけると、共鳴マルチプレット中の中央ピークの複合スケーリング係数(上記参照)2.4が得られる。したがって、このプロトンのトリプレットの各要素のスケーリング係数セットはfi={4,2.4,4}である。
<GlcA環1、3、および5、H3プロトン>
GlcAのH2プロトン同様、このプロトンも、9.5Hzおよび8.8Hzという値の異なる2個の3HHカップリング定数を有する。GlcA H2と同じプロセスの後、初期スケーリング係数パターンfi={4,2,4}の基本的なトリプレットも、2個のカップリング定数の不一致により生じる中央のピークのブロードニングについて補正される必要があることが分かった。Hzで表した結合間の差Δν(1.3Hz)より、ブロードニング調整因子は1.1となり、補正後のスケーリング係数セットはfi={4,2.2,4}となる。
<GlcA環1、3、および5、H4プロトン>
このプロトンは2個の3HHカップリング定数9,7および8.8Hzを有する。GlcA H2およびH3プロトンと同じ推論から、スケーリング係数セットはfi={4,2.2,4}となる。
<GclA環1、3、および5、H5プロトン>
このプロトンは唯一つの3HHカップリング定数7.8Hzを有し、これはλより大きい。したがって、これは、スケーリング係数セットfi={2,2}の単純なダブレットである(すなわち、図9のスカラーカップリング1個)。
<GlcNAc環2および4、H1プロトン>
このプロトンは唯一つの3HHカップリング定数8.5Hzを有し、これはλより大きく(すなわち、図9のスカラーカップリング1個と同様)、スケーリング係数セットはfi={2,2}である。
<GlcNAc環2および4、H2プロトン>
このプロトンは、H2O中で3個の3HHカップリング定数10.4Hz、9.7Hz、および8.5Hzを有し、このプロトンは基本的なカルテットの形で(すなわち、図10のスカラーカップリング3個のように)現れ、すなわち初期スケーリング係数セットはfi={8,2.7,2.7,8}である。外側の2つのマルチプレット要素は明確に解像されて初期スケーリング係数8を維持しているが、カルテットの内側の対の要素は、3個のカップリング定数の不一致により幾分ブロード化している。この場合のブロードニング調整の解析は非常に複雑であるが、この重複を、重複するマルチプレット要素の2つの連続する対として処理すると、ブロードニング式により中央の共鳴が更に1.4倍にスケール調整(scaling)される。したがって、補正後のスケーリング係数セットはfi={8,3.8,3.8,8}となる。
<GlcNAc環2および4、H3プロトン>
2個の3HHカップリング定数10.4Hzおよび8.7Hzを有し(したがって、図10におけるスカラーカップリング2個のもののように現れる)、初期スケーリング係数セットはfi={4,2,4}となる。前述のように中央の共鳴にブロードニング式を適用すると、補正後のスケーリング係数セットはfi={4,2.4,4}となる。
<GlcNAc環2および4、H4プロトン>
2個の3HHカップリング定数9.9Hzおよび8.7Hzを有する。したがって、中央の共鳴のブロードニングを考慮した補正スケーリング係数はfi={4,2.4,4}となる。
<GlcNAc環2および4、H5プロトン>
4個の異なる3HHカップリング定数を有するため複数の重複を生じ、共鳴は、4つの共鳴を有する広いプラトーとして現れる(図9におけるスカラーカップリング2個に最も近い)。このプロトンのスケーリング係数は、重複するマルチプレットの要素を考慮して(図11参照)、fi={2.8,2.8,2.8,2.8}と計算された。
<GlcNAc環2および4、H6proSプロトン>
1個の2HHおよび1個の3HHカップリング定数を有し、その値は−12.3Hzおよび2.3Hzであり、したがって、ブロード化した共鳴のダブレットとして現れ(すなわち、図9の1つのスカラーカップリング1個に見た目が最も近い)、初期スケーリング係数セットはfi={2,2}となる。各共鳴のブロードニングは、この小さな2.3Hzの結合により生じるので、各スケーリング係数のブロードニング調整は1.3となる。したがって、このプロトンの補正スケーリング係数セットはfi={2.6,2.6}である。
<GlcNAc環2および4、H6proRプロトン>
1個の2HHおよび1個の3HHカップリング定数を有し、その値は−12.3Hzおよび5.4Hzであり、これらとλの間の周波数差のために、4つの明確に解像された共鳴を呈する(すなわち、図9のスカラーカップリング2個に最も近い)。したがって、このプロトンのスケーリング係数セットはfi={4,4,4,4}である。
<GlcNAc環2および4、HNプロトン>
このプロトンは唯一つの3HHカップリング定数9.7Hzを有し、これはλより大きい。したがって、これは単純なダブレットであり(すなわち、図9のスカラーカップリング1個に最も近い)、スケーリング係数セットはfi={2,2}である。
GlcNAc環6の場合、GlcNAc環2&4とはプロトンH1およびH2の間のカップリング定数が異なるため(図15参照)、H1およびH2プロトンのスケーリング係数セットはGlcNAc環4および6とはわずかに異なる。更に、αアノマーが60%のモル存在比でしかないことを補償するために、全てのスケーリング係数に、モル存在比1/r(r=0.6)(スケール調整比1.7)をかける。
<GlcNAc環6、H1プロトン>
このプロトンは唯一つの3HHカップリング定数3.5Hzを有し、これはλより小さい。したがって、これは、スペクトル中でブロード化したシングレットとして現れ(すなわち、図9のスカラーカップリング1個に最も近い)、ブロードニング調整は1.6である。したがって、そのスケーリング係数セットはfi={1.6}であり、モル存在比でのスケール調整後は、fi={2.7}である。
<GlcNAc環6、H2プロトン>
このプロトンは、H2O中で3個の3HHカップリング定数、10.4、9.7、および3.5Hzを有し、その結果、このプロトンは、複数のブロードニングを有する基本的なトリプレットの形をとり(すなわち、図10のスカラーカップリング2個に最も近い)、初期スケーリング係数セットは、fi={4,2,4}となる。外側の二つの共鳴は、3.5Hzの結合によりブロード化しており、ブロードニング調整はどちらの場合も1.6である。内側の共鳴は3.5Hzの結合で基本的にブロード化しており、ブロードニング調整は1.6であるが、2つの大きな結合間の差0.7Hzも寄与して1.1の更なるブロードニング調整を有し、正味1.7となる。したがって中央の共鳴のスケーリング係数は3.4である。したがって、スケーリング係数セットはfi={6.2,3.4,6.2}であり、モル存在比でのスケール調整後は、fi={10.5,5.8,10.5}である。
<GlcNAc環6、H2、H3、H4、H5、H6proS、H6proRプロトン>
これらのプロトンは、GlcNAc環2&4と同じカップリング定数を有するため、これらはGlcNAc環2&4と同じスケーリング係数セットを有するが、各スケーリング係数セット中の各スケーリング係数には、モル存在比スケール調整比の1.7がかけられる。
要約すると、2D[1H,1H]−NOESYデータセット中のプロトン共鳴マルチプレットのスケーリング係数セットは以下の通りである。
Figure 2010539580
2D[1H,1H]−T−ROESYデータセットは、取得次元中でプロトンのマルチプレット分裂を解像するのに十分なデータポイント数且つ間接次元中でこれらのマルチプレットが解像されるのを防ぐのに十分な少ないデータポイント数で記録された。このデータセットのスペクトルの線幅(λ)を、前述の2D[1H,1H]−NOESYデータセットのスペクトルの線幅を決定したのと同様な方法で、6.5Hzと決定した。前述と同様なプロセスから、この2D−T−ROESYスペクトルのスケーリング係数セットは以下のように算出された:
Figure 2010539580
このスペクトルのスケーリング係数セットと前述の2D−NOESYのスケーリング係数セットの第1の顕著な差は、アミドプロトンがスケーリング係数を有しないことであり、これは、スペクトルを100%D2O α−HA6サンプルで記録したために、アミドプロトンが完全に溶媒の重プロトンで置換されてNMR不活性となっているからである。第2の顕著な差は、環2および4上のGlcNAc H2プロトンは、3HHスカラーカップリングを2個しか有さず(アミドプロトンが置換されている)、初期スケーリング係数セットが、H2Oサンプルで見られるカルテットではなく、トリプレット(すなわち、図10のスカラーカップリング2個に最も近い)となる。
3D[1H,15N]−NOESY−HSQCデータセットは、取得次元中でプロトンマルチプレット分裂を解像するのに十分なデータポイント数且つ間接次元中でこれらのマルチプレットが解像されるのを防ぐのに十分少ないデータポイント数で記録された。このスペクトルはα−HA6中のアミドプロトン以外のプロトンに由来するピークを含まないため、このデータセット中でスケーリング係数セットはアミドプロトンについてのみ決定すればよい。各アミドプロトンは、環のH2プロトンと9.5Hzのスカラーカップリングで結合されており(図15参照)、このデータセットのλの値は6Hzであり、各NOEは、スペクトル中で単純なダブレットの共鳴として現れる。すなわち初期スケーリング係数セットはfi={2,2}である。環6の中のアミドプロトンの場合、初期スケーリング係数セット中の各スケーリング係数には、モル存在比スケール(=1.7)をかけなければならない。すなわち、環6のスケーリング係数セットはfi={3.3,3.3}である。環2および4のスケーリング係数セットはモル存在比で調整しないので、fi={2,2}のままである。
3D[1H、15N]−T−ROESY−HSQCのデータセットも、3D[1H,15N]−NOESY−HSQCと非常によく似たパラメータで取得したので、同じスケーリング係数セットを有する。
<NMRスペクトルの測定および定量>
α−HA6の動的溶液構造の決定に、7個の異なるNMR実験データセット中の5個の異なる種類のNMRデータを用いた。これらの制約を、13個の未知の変数の最適値を見つけるための最適化アルゴリズムで用いた(上記参照)。使用した5種類のNMRデータは:
1)NOESY緩和データ:2個の実験データセット。1)[1H、15N]−NOESY−HSQC、2)[1H,1H]−2D−NOESY
2)T−ROESY緩和データ:2個の実験データセット。1)[1H,15N]−T−ROESY−HSQC、2)[1H,1H]−2D−NOESY
3)コンフォメーション依存性スカラーカップリング:1個の実験データセット
4)残留双極子カップリング(RDC):1個の実験データセット
5)秩序変数([1H,15N]−異種核NOEおよびT1−測定より算出):1個の実験データセット
である。
これらの異なるNMRデータセットのそれぞれに適切な取得パラメータおよびそれから測定される構造的制約の数は以下の通りであった(全てのデータは298Kで得られた)。
5mM HA6(95% H2O、pH6.0、0.3mM DSS)のサンプルについて、900MHzの2D[1H,1H]−NOESYスペクトルを、NOE混合時間を400ms、両次元中の掃引幅を10800Hzにして記録した。前述のスケーリング係数セットを用いて、各NOEピークの真のピーク高さを求めたところ、82個のNOE構造的制約が得られた。各NOE制約の誤差は、2D−NOESYスペクトルのmの初期値に0.4を用いた。このスペクトルから、前述の方法に従って、94個のnoNOE構造的制約も測定された。これらのNOEおよびnoNOEの構造的制約は付表Aに示すデータセットファイル中に含めた。
12mM 15N標識HA6(95%H2O)のサンプルについて、600MHzでの3D[1H,15N]−NOESY−HSQCスペクトル(NOE混合時間は400ms;掃引幅は、両方のプロトン次元については7200Hz、15N次元については140Hz;15Nオフセットは122.5ppm)を、以前に報告されている[8、36]ように記録した。前述のスケーリング係数セットを用いて、各NOEの交差ピークおよび対角ピークについて、1モル存在比の真のピーク高さを求めた。3D[1H,15N]−NOESY−HSQCスペクトルのm値は0.4に設定し、真のピーク高さについての誤差が前述のように算出されるようにした。このスペクトルから19個のNOE制約が測定された。それを付表A中のデータセットファイルに示す。
20mM HA6(100% D2O、pH6.0、0.3mM DSS)のサンプルについて、600MHzでの2D[1H,1H]−T−ROESYスペクトルを、NOE混合時間を400ms、掃引幅を両方の次元で7200Hzにして記録した。前述のスケーリング係数セットを用いて、このスペクトルから62個のROE構造的制約が測定された。各ROE制約の誤差を、2D[1H,1H]−T−ROESYスペクトルのmの初期値に0.5を用いて前述のように決定した。このスペクトルから63個のnoNOE構造的制約も測定された。これらのROEおよびnoROEの構造的制約は付表A中に示したデータセットファイル中に含めた。
12mM 15N標識HA6(95%H2O)のサンプルについて、600MHzでの3D[1H,15N]−T−ROESY−HSQCスペクトル(ROE混合時間は400ms;掃引幅は、両方のプロトン次元には7200Hz、15N次元には140Hz;15Nオフセットは122.5ppm)を記録した。前述の式を用いて、3D[1H,15N]−T−ROESY−HSQCスペクトルのmの初期値を0.2として、各ROE制約の誤差を求めた。このスペクトルから、付表Aに示すデータセットファイルに記載されているように、18個のROE構造的制約が測定された。
α−HA6中のアセトアミド側鎖基のコンフォメーション依存性スカラーカップリング定数(32,HN)は以前に測定されている(図15参照)[35]。上述したように、環6のカップリング定数は、環2および4のカップリング定数とわずかに異なる値であることが観察されている。これらのカップリング定数を分子中の二面角と関連付ける最良のKarplus式が、前述のように[37]量子力学的計算により得られる。結合測定(約0.3Hz)およびこれらのKarplusの関係の予測精度(約0.3Hz)を合わせた誤差は約0.5Hzである。3個のスカラーカップリング定数は付表A中に示すデータセットファイル中に含めた。
α−HA6の残留双極子カップリングデータは以前に報告されていないので、前述の高解像度1D NMRスペクトルおよび天然存在比[1H,13C]−HSQC/[1H,15N]−HSQCスペクトルを用いた方法で本実験のために新たに測定した。50%D2O中のHA6の20mMサンプルについて、単結合性C−Hおよび重複するH−Hのカップリング定数を測定するために、[1H,13C]−HSQCスペクトル(取得中に13Cのブロードバンドデカップリングなし)を、(本発明者らが以前に記載しているように[35])配向媒体の非存在下にて天然存在比で記録した。二回目の[1H,13C]−HSQCスペクトルは、配向媒体を含むサンプル(アラインメントファージが3mg/mlで存在する、50%D2O中のHA6の5mMサンプル)について、同じ取得パラメータを用いて天然存在比で記録した。「1H,13C]−HSQCスペクトルから31個の非重複RDC(付表Aのリストの1〜31)および27個の重複RDC(付表Aのリストの101〜127)が測定された。同じサンプルの天然存在比で記録した[1H,15N]−HSQCスペクトルから、更に3個の非重複RDC(付表Aのリストの131〜132)が得られた。高解像度1D NMRスペクトルから、更に3個の非重複RDCが測定された(付表Aのリストの128〜130)。前述の方法を用いて、各RDC構造的制約の標準誤差は0.35Hzに決定された。これらのRDC(合計65個)は付表Aに示すデータセットファイルに含めた。
α−HA6中の3個のアセトアミドN−H基の秩序変数およびその誤差は以前に測定されている[22]。3個の秩序変数は付表Aに示すデータセットファイルに含めた。
<分子の詳細>
前述の実験データセットは2つの異なる溶媒、すなわちH2OおよびD2Oで取得した。これらのそれぞれに対する溶媒マスク(上記参照)を以下の通り決定した:
1)H2O溶媒マスク:α−HA6中の全ヒドロキシルプロトンは非常に急速に溶媒プロトンで置換されるため、これらのプロトンは全てNMR不活性と定義した(exc* HO*)。アミドプロトンは観察するのに十分にゆっくり置換されるのでNMR活性である[34]。その他のプロトンは全て活性と定義した(add**)。
2)D2O溶媒マスク:α−HA6中の全ヒドロキシルプロトン(exc* HO*)およびアミドプロトン(exc *H2N)は溶媒重水素で完全に置換されるので、これらのプロトンは全てNMR不活性と定義した。その他のプロトンは全て活性と定義した(add**
これら2つの溶媒マスクを指定するために用いた実際のファイルは以下の通りであった。
Figure 2010539580
α−HA6内の種々の原子の、分子構造の残りの部分に対する位置は、利用可能な実験データからは特定できなかった(すなわち、各カルボキシレート基中の2個の酸素原子および全ヒドロキシルプロトン)。これらの原子は、視覚的現実性のために分子中に保持したが、これらの(任意に定義された)分子内座標が反対のファンデルワールス相互作用により構造計算に影響を与えてはいけない。したがって、これらの原子は以下のファンデルワールスマスクによりファンデルワールス不活性に設定した。
Figure 2010539580
<実験データインプット>
構造計算の全てのラウンドでτcの値は、以前に記載したように実験的に決定された[22]0.4msとした。前述の種々の実験データセットを、異なるH2O/D2O溶媒混合物を含むNMRサンプル(上記参照)について記録した。したがって、各データセットについて、調整した溶媒粘度を、式(22)および(23)を用いて算出した。構造計算に使用した7個の実験データセットファイルを付表Aに示す。
<動的モデル>
前述の方法を用いて、α−HA6内の関連するコンフォメーションのフレキシブルな結合および化学的性質(chemistry)を以下のように特定した(図16参照):
1)6個の炭水化物環のそれぞれは種々のコンフォメーション、例えばいす型、ふね型、ねじれふね型のコンフォメーションで存在し得る。
2)3個のβ1→β3グリコシド結合、すなわち、環1&2、3&4、および5&6の間の結合。結合酸素原子のいずれかの側の各化学結合は、未定義の二面角を有し、それぞれファイ(φ)およびプシー(φ)とする。
3)2個のβ1→4グリコシド結合、すなわち、環2&3および3&4の間の結合。結合酸素原子のいずれかの側の各化学結合は、未定義の二面角を有し、それぞれファイ(φ)およびプシー(φ)とする。
4)GlcNAc環(環2、4、および6)に関して、3個のアセトアミド側鎖基が、N(窒素)−C2(環)結合の回りで回転可能である。
5)3個のアセトアミド側鎖基(環2、4、および6)が、アミドN(窒素)−C(カルボニル)結合でシスまたはトランスコンフォメーションで存在し得る。
6)アセトアミド側鎖基(環2、4、および6)上の3個のメチル基が、そのアセトアミド側鎖に関して、C(メチル)−C(カルボニル)結合の回りで回転可能である。
7)GlcNAc環(環2、4、および6)に関して、3個のヒドロキシメチル側鎖基がC6(ヒドロキシメチル)−C5(環)結合の回りで回転可能である。
8)GlcA環(環1、3、および5)に関して、3個のカルボキシレート基がC(カルボキシレート)−C5(環)結合の回りで回転可能である
9)GlcNAc環およびGlcA環の全てのヒドロキシル基が、それぞれのO(酸素)−C(炭素)結合の回りで回転可能である。
観察される実験データと比較するための分子の現実的な動的モデルを作製するために、自由度を以下のようにモデリングした:
1)GlcAおよびGlcNAc環中の大きな3HHの値は、環が水溶液中で41いす型コンフォメーションをとっており、他の形態と容易に相互変換されないことが示している[36]。したがって、各炭水化物環を強固な41いす型コンフォメーションでモデリングした。
2)化学シフトおよびNOEパターンの解析から、環1&2および3&4の間の2個のβ1→3グリコシド結合が水溶液中で(未決定ではあるが)実質的に同一のコンフォメーションをとり、複数の相互変換する安定なコンフォメーションが存在する実験的証拠はないことが示されている[8、34、36]。したがって、これら2個のβ1→3結合は、同じ変数で表され、角度ファイ(ψ)およびプシー(φ)のそれぞれは1つの単峰性のコン
フォメーション確率分布(すなわち、1&2および3&4の間の結合について、2つの平均値、μψおよびμφ)をしており、これら2つの二面角は直接動的に結合しているため
、局所的振動(local libration)の標準偏差角(σ)は同じになる。化学シフト、NOEパターン、および分子の動的シミュレーションの解析から、環5&6の間のβ1→3グリコシド結合(「アルファ」結合)は、溶液中で他の2個のβ1→3結合とは異なるコンフォメーションをとりやすいことが示されている[8、34、36]。そこで、この結合を、他のβ1→3結合と同様に(すなわち、同じ局所的振動の標準偏差角σを有する2つの平均値μψおよびμφ)、しかし他の2つのβ1→3結合とは独立した
変数をもたせ、モデリングした。
3)化学シフトおよびNOEパターンの解析から、2個のβ1→4グリコシド結合が、水溶液中で(未決定ではあるが)実質的に同一のコンフォメーションをとり、複数の相互変換する安定なコンフォメーションが存在する実験的証拠はないことが示されている[8、34、36]。したがって、2個のβ1→4結合は、同じ変数で表され、すなわち、角度ファイ(ψ)およびプシー(φ)のそれぞれは1つの単峰性のコンフォメーション確率分
布をし(すなわち、2&3および4&5の間の結合について、μψおよびμφ)、同じ局
所的振動の標準偏差角(σ)を有する。
4)環2および4中の全アセトアミド側鎖は、環に関してほぼトランスコンフォメーション(すなわち、HN−N−C2−H2の二面角=180°)であることが示されているが、環6中のアミド基は正確には分からないが少し他の2つとは異なることが示されている[8、34、36]。帰属スペクトルまたはNOE制約のいずれからも、いずれのアミド基にも複数のコンフォメーションが存在する実験的証拠はない[8、35]。したがって、アセトアミド側鎖は全て単峰性のコンフォメーション確率分布でモデリングした。環2および4中のアセトアミド側鎖は溶液中で区別できないため、それらの両方に同じ変数を用い(残基2&4中のμHN、σHN)、一方、環6中のアセトアミド側鎖は独立した変数でモデリングした(残基6のμHN、σHN)。
5)3個のアセトアミド側鎖基中のアミド結合は、その他の力がない場合のこの化学基の形状はトランスコンフォメーションであると予想され、トランスコンフォメーションは単糖GlcNAcに見られる状態でもあるため[38]、トランスコンフォメーションになるように設定した。
6)メチル基はC−C結合の回りを自由に回転し、半エクリプス状態よりもわずかに優位な3つのねじれ形の回転異性体配置を有する。この動きは、二面角に3つの値を与え(3つのねじれ形回転異性体配置に対応して3つの値0°、120°、および240°)、各コンフォメーションである確率を同じにした三峰性のコンフォメーションモデルによりモデリングした。更に、局所的振動は、各コンフォメーションについて30°の固定値とした。
7)3個のヒドロキシルメチル側鎖基は、化学シフトならびに35,6proSおよび35,6proRカップリング定数の比較により、水溶液中で互いに区別できないコンフォメーションをとることが示されている[35]。Hasnoot et al.[15]の関係によれば、これら2つの結合で観察される値(図15参照)は、各ヒドロキシメチル基が2つのコンフォーマー(ggおよびgtと呼ばれる)間で50:50%の比率で急速に相互変換することを示している。したがって、この動きは二峰性のコンフォメーションモデルでモデリングし、各コンフォメーションである確率が等しいggおよびgtに対する2つの適切な値を二面角に与え、各コンフォメーションの局所的振動は固定値15とした(すなわち、この値をより正確に決定するのに十分な実験データがないため、別の系の本発明者らの実験に基づく適切な値)。
8)カルボキシレート基のコンフォメーションを制約する利用可能な実験データはなかったので(酸素原子はNMR不活性)、各基の2個の酸素原子の位置は分子の残りの部分に対して決定することはできなかった。したがって、全てのカルボキシレート基に同じ任意の値を与え、この任意の値の選択が悪いと起こり得るそれらの立体的衝突が構造計算に影響を与えるのを防ぐために、これらは如何なるファンデルワールス反発にも寄与しないように設定した(上記参照)。幸運にも、カルボキシレート基の回転はα−HA6の全体的形状または動的動きに影響を与えない。更に、全ての実験はpH6,0で行ったので、カルボキシレート基は非プロトン化状態でモデリングした[36]。
9)同様に、ヒドロキシル基の水素原子のいずれかのコンフォメーションを制約するための利用可能な実験データはなかった(これらは溶媒の水と非常に急速に置換される)ので、各ヒドロキシル基中の水素原子の位置は分子の残りの部分に関して決定することができなかった。したがって、ヒドロキシルプロトンには任意の値を与え、この任意の値の選択が悪いと起こり得る立体的衝突が構造計算に影響を与えるのを防ぐためにファンデルワールス不活性にする。
これらの考察の具体的な実施は以下の動的モデルファイルを用いて達成された。
Figure 2010539580
Figure 2010539580
Figure 2010539580
このファイルのvariablesセクションでは、20個の変数(var 1〜var 20)を定義し、これらの変数を、図17に示すα−HA6中の各回転結合に用いた。2個の変数(var 4およびvar 5)を、環5および6の間のβ1→3結合の二面角ψおよびφの平均値に割り当て(remark b1−3 linkages ri
ng 5−6 mean)、1個の変数(var6)をそれらの共通するガウス広がり(remark b1−3 linkage rings 5−6 Gaussian spread)に割り当てた。これらψおよびφ平均二面角の両方に、繰り返し最適化の開
始時(start 0.0)に0〜360°のランダム値(rand 0 360)を与え、ガウス広がりには、最適化の開始時に特定の(且つ合理的な)値20°(fix 20)を帰属し、これは最適化の各ステップで、最適化の開始(start 0.0)から最大10°のランダムな幅で変えられる(jump 10.0)。他の2個のβ1→3結合も同様に指定し(var 1、var 2、およびvar 3)、これらには同じ変数が当てられるため、互いに動的およびコンフォメーション的に同じであるとしてモデリングされる。2個のβ1→4結合中のψ結合およびφ結合の単峰性分布も同様に変数7〜9
で指定される。アセトアミド側鎖C2−N2結合の単峰性分布も同様に変数9および10(環2および4中の側鎖)ならびに11および12(環6中の側鎖)で指定される。ヒドロキシメチル基は全て同じ二峰性の角度分布を有する。この二峰性分布の2つの平均二面角をvar 14およびvar 15で指定し、これらは最適化の開始時(start 0.0)から両方とも固定され(jump 0.0)、最適化の間変化しない(jump 0.0)同じガウス広がり(var 16)15°(fix 15.0)を有する。メチル基は全て同じ三峰性の角度分布を有する。この三峰性分布の3つの平均二面角をvar 17、var 18、およびvar 19で指定し、これらは最適化の開始時(start 0.0)から全て固定され(jump 0.0)、これらは全て最適化の間変化しない同じガウス広がり(var 20)30°(fix 30.0)を有する。これらの変数を、(前述の通り)probabilities、gyration、およびmultigyrationsを用いて分子内の特定の二面角にマッピングする。
この方法で、上で与えた自由度9の解析に従って、α−HA6分子の全てのフレキシビリティー部分およびその挙動をコンピュータ用に定義する。変数14〜20は所定の固定値を有するため、α−HA6の溶液構造を解明するために、決定すべき13の個別の未知の分子変数がある。
<構造計算>
α−HA6の構造計算の各ラウンドは40回のランを含む。χ2が最も小さい10個のランに対して統計処理を行った。個々のランはそれぞれ10,000回の繰り返しステップを有し、動的アンサンブルは100個の構造からなる。後述するように、構造計算の連続するラウンドで、連続的に7個の実験データセットファイル(付表A参照)を導入した。
(後述するように)固定された幾何学的関係にある分子の部分についての標準的な結合距離、角度、および化学的性質の知見に基づいて、HAヘキササッカライドの最初の3Dモデルを構築した。構造計算の初期のラウンド(ラウンド1〜30)では、4個のデータセットファイルを用いてα−HA6の大まかな溶液コンフォメーションを決定した。それらは以下の通りである:
1)秩序変数のデータセットファイル(3個の構造的制約)
2)スカラーカップリングのデータセットファイル(3個の構造的制約)
3)15N−NOESY−HSQCのデータセットファイル(19個の構造的制約)
4)2D−NOESYデータセットファイル(82個のNOE構造的制約)
秩序変数、スカラーカップリング、および15N−NOESY−HSQCデータセットファイル中の構造的制約は比較的少なく、容易に生成することができるので、誤りが含まれにくく、構造決定プロセスの開始からすぐに含めることができきる。対照的に、大きな2D−NOESYデータセットファイルは多くの誤りを含むと予想されるので、最も確実なNOE構造的制約(約60個の制約)のみを計算の最初のラウンドに用い、「noNOE」の構造的制約は使用しない。30ラウンドの構造計算の後には、2D−NOESYデータセット中の誤ったNOE構造的制約は補正され、全てのNOE構造的制約が含められている。以下の統計が示すように、このラウンドの40回のランのトップ10は全て10個の未知の変数に同様な値を与えた。
Figure 2010539580
この表には、χ2 totalが最も良かったトップ10のランの出力データを示し、ラン番号22が最も良く、ラン番号26が10番目に良い。Totchiのラインは、各ランのχ2 totalの値ならびにこれらのχ2 total値の平均値および標準偏差(StDev)を示す。このライン(χ2 total)より上は、このラウンドの計算で用いた個々のデータセットファイル、すなわち15N−NOESY−HSQC(NOE−HSQC)、2D−NOESY(2D−NOESY)、スカラーカップリング(JCOUP)、および秩序変数(ORDER)のそれぞれのχ2 total、平均、および標準偏差の値を示す。χ2 total、平均、および標準偏差の値はファンデルワールス(VDW)の点からも各ランに与える。TotChiライン以下は、動的モデルファイルで指定した10個の変数var 1〜var 10の結果である。したがって、このラウンドの計算の後、環1&2および3&4の間のβ1→3結合は、角度φおよびψがそれぞれ83.4±8.9°(var 1)お
よび−119.3±5.2°(var 2)、ガウス広がりが20.9±5.5°(var 3)であった。環5&6の間のβ1→3結合の角度は、φおよびψがそれぞれ−58
.4±25.7°(var 4)および−129.7±5.2°(var 5)、ガウス広がりが16.7±3.5°(var 6)であった。β1→4結合は、角度φおよびψ
が−91.9±8.8°(var 7)および−129.3±16.5°(var 8)
、ガウス広がりが18.9±3.0°(var9)であった。環2&4のアセトアミド基
は、平均値が119.1±1.3°(var 10)、ガウス広がりが32.3±1.6°(var 11)であり、環6のアセトアミド基は、平均値が119.1±1.0°(var 12)、ガウス広がりが26.4±2.6°(var 13)であった。
出現する構造に対していずれかのデータセットファイルが過度に影響を与えていないかを確かめるために、各データセットについて、χ2 dataset/制約数(Chi/Res)およびχ2 total/制約数を計算した。
Figure 2010539580
この場合、各データセットでChi/Resの値が近い(0.9〜1.6)ことが確認され、これはどのデータセットファイルも他のデータセットファイルより優勢(dominating)ではないことを示している。秩序変数およびスカラーカップリングデータの誤差は直接求めることができるが、NOESYデータセットファイルの誤差は正確に分かっていない値mに依存し、2D−NOESYデータセットのm値(0.4)および15N−NOESY−HSQCデータセットのm値(0.4)が適していると考えられる。このラウンドで用いた107個の構造的制約はいずれも異常値(violator)ではない。
次の10ラウンドの構造計算では、2D−NOESYスペクトルからのnoNOE構造的制約を含めた。この構造計算のラウンドの結果は以下の通りであり、全てのnoNOEが含まれ、そのいずれも異常値ではないか、その他のデータセットファイル中の構造的制約のいずれも異常値ではない。
Figure 2010539580
これらの結果から分かるように、グリコシド結合変数に対する新規な値は、(データのより少ない)それ以前のラウンドで決定された値と基本的には同じであるが異なる。これらの構造的制約データでは、環1&2および環3&4の間のβ1→3結合は、ガウス広がりが20.0±4.7°で(ψ,φ)が(−62.7±8.2°,−112.0±4.1
°)のコンフォメーションをとりやすく、環5&6の間のβ1→3結合は、ガウス広がりが15.7±2.8°で(ψ,φ)が(−50.4±7.7°、−127.4±3.5°
)のコンフォメーションをとりやすく、一方、β1→4結合は、ガウス広がりが18.7±5.1°で(ψ,φ)が(82.0±10.6°、−131.4±15.1°)のコン
フォメーションをとりやすい。アミド基はラウンド30と大きく変わらない。noNOE制約のChi/Res値(2D−NOESY(no))は0.5であり、これは他のデータセットの値よりかなり小さい。このことは、noNOE構造的制約は実際、観察データの欠如を表すので直接観察された構造的制約よりも信頼性が低く、したがって構造計算で優勢になるべきではないため、重要である。
次の30ラウンドの計算では、RDCデータを含め、ここでも、最初に基本的なデータセット(約45個の制約)を、次に残りの約20個を含めた。このラウンドの構造計算の結果は以下の通りであり、全てのRDCが含まれ、そのいずれも異常値ではないか、他のデータセットファイル中の構造的制約のいずれも異常値ではない。
Figure 2010539580
これらの結果から分かるように、グリコシド結合変数の新規な値は、ラウンド40で求めた値とわずかに異なるだけである。これらの構造的制約データでは、環1&2および3&4の間のβ1→3結合は、ガウス広がりが21.0±4.1°で(ψ,φ)が(−70
.4±8.3°,−114.4±4.3°)のコンフォメーションをとりやすく、環5&6の間のβ1→3結合は、ガウス広がりが16.7±3.4°で(ψ,φ)が(−20.
3±9.1°、−120.5±16.7°)のコンフォメーションをとりやすく、β1→4結合は、ガウス広がりが19.2±4.9°で(ψ,φ)が(−59.4±4.2°、
−152.3±8.5°)のコンフォメーションをとりやすい。アミド基は今回も前回のラウンドの計算と非常に近かった。
次の5ラウンドの計算では、[1H,15N]−T−ROESY−HSQCデータを、構造的制約が誤りを含まない信頼性が高いため、全体のブロックとして含めた。しかし、このデータセットを含めることで、他のデータセットファイル中のいくつかの誤りが明らかになった。このラウンドの構造計算の結果は以下の通りであり、全ての15N filtered−ROEが含まれ、そのいずれも異常値ではないか、他のデータセットファイル中の構造的制約のいずれも異常値ではない。
Figure 2010539580
これらの結果から分かるように、グリコシド結合変数の新規な値は、ラウンド70で求めた値と非常に近い。これらの構造的制約データでは、環1&2および3&4の間のβ1→3結合は、ガウス広がりが21.5±3.9°で(φ,ψ)が(70.7±5.6°,
−122.9±3.7°)のコンフォメーションをとりやすく、環5&6の間のβ1→3結合は、ガウス結合が18.1±2.1°で(φ,ψ)が(−16.6±4.1°,−1
21.7±2.6°)のコンフォメーションをとりやすく、β1→4結合は、ガウス広がりが19.9±3.2°で(φ,ψ)が(−63.6±7.0°,−147.0±8.8
°)のコンフォメーションをとりやすい。ここでも、アミド基は前回の計算ラウンドと非常に近い。
次の35ラウンドの計算では、2D−T−ROESYデータを含め(このスペクトルの幾つかの部分にはアーティファクトがあり、異常なデータポイントを除くために多くの計算ラウンドが必要であった)、やはり最初はROE構造的制約の基本的なデータセット(約40個の制約)を含め、次に残りの約20個を含めた。このラウンドの構造計算の結果は以下の通りであり、このデータセットの全てのROEが含まれ、そのいずれも異常値ではないか、他のデータセットファイル中の構造的制約のいずれも異常値ではない。
Figure 2010539580
これらの結果から分かるように、グリコシド結合変数の新規な値は、ラウンド75で求めた値とほとんど変わらない。これらの構造的制約データでは、環1&2および3&4の間のβ1→3結合は、ガウス広がりが20.6±4.5°で(φ,ψ)が(−68.8±
10.1°,−120.6±3.7°)のコンフォメーションをとりやすく、環5&6の間のβ1→3結合は、ガウス広がりが17.8±3.7°で(φ,ψ)が(−21.9±
8.5°,−118.4±3.6°)のコンフォメーションをとりやすく、β1→4結合は、ガウス広がりが21.7±2.4°で(φ,ψ)が(−60.4±5.7°,−14
6.9±12.9°)のコンフォメーションをとりやすい。ここでも、アミド基は前回のラウンドの計算と非常に近い。
次の15ラウンドの計算では、2D−T−ROESYデータセット中のnoROEを含めた。このラウンドの構造計算の結果は以下の通りであり、全てのnoROEが含まれ、そのいずれも異常値ではないか、他のデータセットファイル中の構造的制約のいずれも異常値ではない。
Figure 2010539580
これらの結果から分かるように、10個の変数、特にグリコシド結合変数およびそのガウス広がりのそれぞれの値は、75ラウンド以降2D−T−ROESYデータ(ROEまたはnoROE)を含める前から、大きく変化していない。この大きなデータ部分(154個の構造的制約)を含めてもこれら10個の変数の値は変わらなかったので、動的構造が解明されたとみなし、更なる実験データは必要としなかった。
<構造の精密化>
α−HA6の動的3D溶液構造を、ラウンド125(上記参照)の結果から採った13個の変数を開始値とする動的モデルファイル(以下に記載)を用いて精密化した。これにより、最適化アルゴリズムでこの特定のχ2 totalの最小値を非常に効果的に調べ、13個の変数の最良であろう値を探すことができる。アンサンブルのサイズを250に増やし、各ランについて15,000回の繰り返しステップを実施し、100回のランを行った。ラウンド125に用いた7個のNMRデータセット全てを構造精密化に用いた。
Figure 2010539580
Figure 2010539580
Figure 2010539580
この最小化ラウンドの合計100回のラン中で最小の合計χ2 total値を有する20個のランを統計解析に用いた。最も良い5個のランの値を簡潔に示すが、平均および標準偏差(StDev)の値は最も良い20個のランから計算したものである。
Figure 2010539580
これら10個の変数の値で、χ2 restraintが10を超える構造的制約はなく、このことは構造の質が高いことを示している。全412個の構造的制約とその個々のχ2restraint値の最終リストを付表Aに示す。したがって、最適化アルゴリズムを用いて、α−HA6の動的溶液構造を記述する13個の変数に最も適合(best fit)する値が決定された。412個の構造的制約があるので、これは定義した自由度1当たり、平均31.7個の構造的制約を意味する。最も適合した値は、環1&2および3&4の間のβ1→3結合では、角度φおよびψがそれぞれ−69.7±4.1°(var 1)お
よび−122.3±1.9°、振動のガウス広がりが23.5±2.2°(var 3);環5&6の間のβ1→3結合では、角度φおよびψがそれぞれ−20.4±2.6°(
var 4)および−121.8±2.3°(var 5)、振動のガウス広がりが17.5±1.1°(var 6);β1→4結合では、角度φおよびψがそれぞれ−60.
4±2.4°(var 7)および−142.2±4.7°(var 8)、振動のガウス広がりが19.4±1.3°(var 9)である。環2&4中のアセトアミド基は、二面角の平均値が120.4±0.8°(var 10)(すなわち、二面角は重原子に対して定義されるため、HNおよびH2は互いに正確にトランスである。)、ガウス広がりが29.8±1.4°(var 11)である。環6中のアセトアミド基は、平均値が119.6±1.0°(var 12)、ガウス広がりが25.8±1.0°(var 13)である。これらの変数から生成したα−HA6の平均的な溶液構造の座標を付表Aに示す。平均構造および構造の動的アンサンブルの視覚的例を図18〜20に示す。
[付表A−ヒアルロナンヘキササッカライド]
<PDBとして表したヒアルロナンヘキササッカライドの開始3D座標>
これはタンパク質データバンク(PDB)のファイルフォーマットである。列2は原子番号、列3は原子の種類、列5は残基番号、列6〜8は各原子核のデカルト座標(x、y、z)である。
Figure 2010539580
Figure 2010539580
Figure 2010539580
<ヒアルロナンヘキササッカライドの分子内座標の表>
最初の列は分子内座標番号、次の8列は原子の定義を示す。次の5列は距離(ij)、角度(ijk)、二面角(ijkl)、角度(jkl)、および距離(kl)を示す。列7のアスタリスクは、原子が他の原子に関して固定された形状(通常、混成、例えばsp2、sp3による固定形状を指定する。)であり、角度が少し異なる方法で用いられているがこれらの角度は最適化中に変動しにくいことを意味する。
Figure 2010539580
Figure 2010539580
Figure 2010539580
<ヒアルロナンヘキササッカライドの[1H−1H]−NOESYデータセット>
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
<ヒアルロナンヘキササッカライドの[1H−15N]−NOESY−HSQCデータセット>
Figure 2010539580
<ヒアルロナンヘキササッカライドの[1H−15N]−T−ROESY−HSQCデータセット>
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
<ヒアルロナンヘキササッカライドの[1H−15N]−T−ROESY−HSQCデータセット>
Figure 2010539580
<ヒアルロナンヘキササッカライドのスカラーカップリングデータセット>
Figure 2010539580
<ヒアルロナンヘキササッカライドの残留双極子カップリングデータセット>
Figure 2010539580
Figure 2010539580
<ヒアルロナンヘキササッカライドの秩序変数データセット>
Figure 2010539580
<構造精密化後の各構造的制約の最終χ2 restraint値>
このファイル中、各ラインのフィールドは以下の通りである:最初の数は構造的制約の数(例えば123)であり、この後ろに、構造的制約に関わる原子を定義する6つの文字または番号が続き(例えば、w 2 H1M a’ 5 H1)、次の2つの値は構造的制約の測定値およびその誤差を示し(例えば、0.00 2.00)、次の3つの値は、動的アンサンブルから得られたその構造的制約の予測値(例えば−0.00)、その構造的制約のχ2 restraint値(例えば0.00)、およびχ2 restraint値の標準偏差(例えば0.00)を示す。次の値はフラグ値(例えば0)であり、その次の値は制約が有する重複の数(例えば+2)を示す。最後のフィールドは構造的制約の見られるデータセットファイルの名称(例えば2D−ROESY)を示す。このファイル中、構造的制約は、χ2 restraint値の最も低い値から最も高い値へと(すなわち、2D−T−ROESYデータセット中の制約123からRDCデータセット中の制約104へと)並んでいる。
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
<最終的な最適化平均構造のPDB座標>
Figure 2010539580
Figure 2010539580
リシノプリル
リシノプリルは、高血圧、うっ血性心不全、心臓発作の治療に用いられる親水性有機薬物分子であり(図21参照)、糖尿病の腎臓および網膜の合併症を予防するためにも用いられている。リシノプリルは、アンギオテンシンIのアンギオテンシンII(強力な血管収縮剤)への変換を触媒し且つブラジキニン(強力な血管拡張剤)の不活化にも関わるアンギオテンシン変換酵素(ACE)の阻害剤である。歴史的に、リシノプリルは(カプトリルおよびエナラプリルに次いで)3番目に開発されたACE阻害剤であり1990年代初期に治療に導入された。リシノプリルはメルク社(Merck&CO.)により開発され、Prinivil(登録商標)として、およびアストラゼネカ社(AstraZeneca)からZestril(登録商標)として世界中で販売されている。オーストラリアでは、これはアルファファーム社(AlphaPharm)からLisodur(登録商標)として販売されている。本実施例で本発明者らは、リシノプリルの動的3D溶液構造がNMRの実験データから本発明の方法を用いてどのように決定されたかを示す。
<化学シフトの帰属および等核スカラーカップリング定数の測定>
リシノプリルは、トリペプチドNH3−Phe−Lys−Pro−COOと同様な化学的構造を有するペプチド模倣分子である。したがって、リシノプリル中の原子および残基はこのペプチドの命名法に従って命名され(付表B参照)、フェニルアラニン側鎖中の過飽和炭素はCGと呼ばれる。リシノプリルのNMRデータは全てpH6.0で記録されたので、アミン基(すなわち骨格第2級アミンおよびLys3側鎖の第1級アミン)およびカルボキシレート基(Phe1およびPro3残基中)のイオン化状態は、図21に示すように、これらの基の典型的なpKaの値からすぐに決定することができる。プロリン残基の窒素原子に由来する孤立電子対の隣接するカルボニル二重結合との部分的共役により、溶液中でリシノプリルはシスおよびトランス両方の立体異性体が存在する(図22)。
278Kにおけるリシノプリルの両立体異性体の1Hおよび13Cの化学シフトを、リシノプリルの20mMのNMRサンプル(100%D2O、pH*6.0、0.3mM DSS)について600MHzで記録した[1H−1H]−COSY、[1H−1H]−TOCSY、および天然存在比の[1H−13C]−HSQCのスペクトルを用いて帰属した。シスおよびトランスの形態に特徴的な共鳴のピーク体積を積分することで、モル存在比はトランス80%:シス20%に決定された。トランス−リシノプリルが混合物により多く含まれるため、この段階で、トランスリシノプリルの動的3D構造を決定することにした。トランスリシノプリルのプロトン化学シフトを図23に示す。
トランスリシノプリル中のHAプロトンを除き、ほとんどのプロトンは、多くのスカラーカップリングの存在(リシン側鎖中には2HH3HHスカラーカップリングが5個も存在する)および強い結合(strong−coupling)のため、スペクトルの線形が複雑であった。この複雑さにより、多くのスカラーカップリングが測定できなかった。しかし、図23に示す6個の3HHカップリング定数が測定された。
<スペクトル線形の解析>
2D[1H,1H]−T−ROESYデータセットを用いてトランスリシノプリルの構造的制約を得た。このデータセットは、取得次元でプロトンのマルチプレット分裂を解像するのに十分なデータポイント数且つ間接次元でこれらの分裂が解像されるのを防ぐのに十分な少ないデータポイント数で(すなわち、プロトンマルチプレットの解析を取得次元のみに単純化して)記録された。このデータセットのλの値(1.8Hz)を、ROEのPro3 HAプロトンの共鳴測定で決定した。この2D[1H,1H]−T−ROESYデータセットのトランスリシノプリル中の各プロトンのスケーリング係数セットは以下の通り決定された。
<Pro3、HAプロトン>
このプロトンは2個の3HHカップリング定数6.0Hzおよび8.0Hzを有し(図24参照)、ダブレットの中でも単純なダブレットとして(すなわち、図9中のスカラーカップリング2個のように)現れている。したがって、この初期スケーリング係数セットはfi={4,4,4,4}である。各スケーリング係数にモル存在比のスケール調整比(=1/0.8)である1.25をかけ、補正スケーリング係数セットは、fi={5,5,5,5}となる。
<Phe1、HAプロトン>
このプロトンは、スペクトル中で(図10中のスカラーカップリング2個で示すように)理想的なトリプレットとして現れると予想される。しかし、このプロトンに隣接する第2級アミン基の化学的置換により、このプロトンのマルチプレット共鳴は更にブロード化し、このマルチプレットは広幅のシングレットとして現れている(すなわち、図9中のスカラーカップリングなしに最も近い)。したがって、このプロトンのスケーリング係数セットは、スペクトル中のPro3 HAの対角ピークと比較することで推定した。Pro3 HAのスケーリング係数セット、すなわちfi={5,5,5,5}を用て、Pro3 HA対角ピークの真のピーク高さを求めた。Phe1 HAプロトンは、このスペクトル中のPro3 HA対角ピークと同様な真のピーク高さであると予想されるので、スケーリング係数は、観察されたシングレットPhe1 HA対角ピークの高さをPro3 HA対角ピークの真のピーク高さと同じ値にスケール調整するのに必要な値であると推定することができる。これにより、スケーリング係数セットはfi={4.5}となる。
<Lys2、HAプロトン>
このプロトンは、Phe1 HAプロトンで観察されたのと同様にブロード化されていた。同じように処理し、推定スケーリング係数セットはfi={4.1}となった。
<その他の全プロトン>
非常に複雑な線形を有し、強く結合(strong−coupling)していた。これらの初期スケーリング係数セットは、強く結合したプロトン用の規則を用いて決定した(上記参照)。次いで、各スケーリング係数にモル存在比をかけた。要約すると、2D[1H−1H]−NOESYデータセット中のプロトン共鳴マルチプレットのスケーリング係数セットは以下の通りである:
Figure 2010539580
<NMRスペクトルの測定および定量>
トランスリシノプリルの動的溶液構造の決定に、7個の異なるNMR実験データセット中の2個の異なるNMRデータを用いた:
1)T−ROESY緩和データ:1個の実験データセット。2D[1H,1H]−T−ROESY
2)コンフォメーション依存性のスカラーカップリング:1個の実験データセット。
これらの異なるNMRデータセットのそれぞれについて、関連する取得パラメータ(およびそれから測定された構造的制約の数)は以下の通りであった。2D[1H,1H]−T−ROESYスペクトルの記録は、20mMリシノプリルのサンプル(100%D2O、pH*6.0、0.3mM DSS)について、600MHz、278K、ROE混合時間を400ms、掃引幅を両方の次元で7200Hzにして行った。前述のスケーリング係数セットを用いて、このスペクトルから67個のROE構造的制約が測定された。各ROE制約の誤差を、2D[1H,1H]−T−ROESYスペクトルのmの初期値を0.5として、前述のように求めた(このスペクトル中に存在しない39個のnoNOE構造的制約も推測された)。これらのROEおよびnoROEの構造的制約は、付表Bに示すデータセットファイルに詳述する。
プロリン環は2つの既知のコンフォメーションの間で平衡しているため、この環中のHAプロトンの2個のスカラーカップリング定数(図24参照)は、環の形状をより正確に定義する役には立たず、したがって、これらのカップリング定数は構造的制約として使用しなかった。図24に示す残りの4個のスカラーカップリング定数を未知の結合形状を定義するための構造計算で構造的制約として用いることができる。これらのカップリング定数を分子中の二面角と関連付けるための最良のKarplus式は、通常、タンパク質およびペプチド中のχ1側鎖形状に用いられるものである[39]。結合の測定(約0.3Hz)およびこれらのKarplusの関係の予測精度(約0.3Hz)を合わせた誤差は約0.5Hzである。4個のスカラーカップリング定数の測定値を関連するデータセットファイルに示す(付表B参照)。
<分子の詳細>
前述の実験データセットはどちらもD2O中で得られたのものである。D2O中では、リシノプリル中の全てのアミンプロトンは非常に急速に溶媒重水素と置換される。したがって、これらのプロトンはNMR不活性であると定義した(exc 1 HN*,exc 2 HZ*)。その他のプロトンは全て活性と定義した(add**)。この溶媒マスクの指定に使用したファイルは以下の通りである。
Figure 2010539580
リシノプリルの各カルボキシレート基中の2個の酸素原子の、分子構造の残りの部分に対する位置は、実験データから特定することはできなかった。したがって、これらの原子は、以下のファンデルワールスインプットファイルに詳述するように、ファンデルワールス不活性とした。
Figure 2010539580
<実験データインプット>
トランスリシノプリルのτcの値は実験から正確に測定されていない。しかし、20mMのHA6サンプル(100%D2O、pH6.0、0.3mM DSS)について600MHz、278K(すなわち、2D[1H,1H]−T−ROESYで用いたのと同じサンプル条件)で記録した2D[1H,1H]−NOESYデータセットスペクトルは、弱いNOE陽性を示した。したがって、NOEが陽性になる(上記参照)τcの閾値を得るための式から、これらの条件下でトランスリシノプリルのτc値が0.3ns未満であることが示される。したがって、この値を最初0.1nsに設定した。構造計算を数回行った後(上記方法を参照)、値は0.2が好ましいことが分かり、式(22)および(23)を用いて、2D[1H,1H]−T−ROESYデータセットの100%D2Oの278Kにおける調整した溶媒粘度を1.94に決定した。構造計算に用いた2個の実験データセットファイルを付表Bに示す。
<動的モデル>
前述の方法を用いて、リシノプリル内の関連するコンフォメーションのフレキシブルな結合および化学的性質を特定した(図25参照):
1)分子骨格を含む4個の単結合、すなわちNF1−CAF1、NF1−CAK2、CAK2−CK2、CK2−NP3
2)プロリン環は溶液中で、N状態およびS状態と名付けられた(アップ(UP)コンフォメーションおよびダウン(DOWN)コンフォメーション、またはC3’エンドコンフォメーションおよびC3’−エキソコンフォメーションともいう)2つの主要なコンフォメーションをとる[15]。トランスプロリン環の場合、これらは約50:50の比率であることが分かっている[40]。
3)Phe1残基中のカルボキシレート基はCAF1−CF1単結合の回りで回転可能である。同様にPro3残基中のカルボキシレート基もCAP3−CP3単結合の回りで回転可能である。
4)リジン側鎖中の5個の単結合は回転可能である(CAK2−CBK2、CBK2−CGK2、CGK2−CDK2、CDK2−CEK2、CEK2−NZK2)。
5)フェニルアラニン側鎖中の3個の単結合は回転可能である(CAF1−CBF1、CBF1−CGF1、CGF1−CDF1)。
観察される実験データに対して最適化するために用いることができる現実的な動的分子モデルを作製するために、動的モデルファイル中で以下の自由度をモデリングした(下記参照)。
1)NF1−CAF1およびNF1−CAK2結合はsp3混成原子間にあるので、三峰性モデルを必要とする。3つの回転異性体状態(gt、tg、gg)が変数1、2、および3(繰り返し最適化の間、これらは固定されたままである。)で指定され、各結合には固有のガウス広がり値が与えられ(それぞれvar 4およびvar 5)、これは最適化の間に変更可能とした。各結合の3つの回転異性体状態の相対数は最適化の間に変更可能であり、それぞれ確率mode1およびmode2とした。CAK2−CK2結合はsp3混成原子(CAK2)とsp2混成原子(CK2)の間にあるので二峰性モデルを必要とする。これは、最適化の間に変更可能な2個の平均値(var 8および10)および2個の異なるガウス広がり値(var 9および11)を用いてモデリングした。これら2つのコンフォメーションの相対数は変更可能であり、確率mode3でとした。トランス形態のリシノプリルだけをモデリングしているので、CK2−NP3結合は固定した単峰性モデルで表しており、トランスの形状に適した平均二面角(すなわち180°)をとっている。この結合のガウス広がりには小さな値を設定し、小さなジャンプサイズを与え、ペプチド結合がかなり強固であることを反映させた。
2)プロリン環の2つの主要なコンフォメーションは、詳細に明らかにされた形状を有する[15]。したがって、環中の各結合は、2つの固定された平均値を有しガウス広がりがゼロの二峰性モデルとした。この環は、溶液中で見られるこれらのコンフォメーションの比50:50を反映した固定値0.5に設定した確率mode6で2つの状態の間を変化する。
3)いずれかのカルボキシレート基のカルボキシレート酸素原子が関わる構造的制約はないため、結合CAF1−CF1およびCAP3−CP3の正確な二面角の値をこれらのデータセットから決定することはできない。これらの初期の任意の位置が繰り返し最適化に影響を与えるのを防ぐために、カルボキシレート原子はファンデルワールス不活性(上記参照)に設定した。
4)CAK2−CBK2、CBK2−CGK2、CGK2−CDK2、CDK2−CEK2、CEK2−NZK2結合は全てsp3混成原子間にあるので三峰性のモデルを必要とする。HB1およびHB2プロトンは化学シフトが同じなので(図23参照)、これらは対称性の三峰性モデルを必要とし(var 1、var 2、var 3、var 7、mode 5 4)、tgおよびgt回転異性体の確率値は常に等しく、残りの1つの確率自由度は変更可能である。同じ論法で、CBK2−CGK2、CGK2−CDK2、およびCDK2−CEK2結合にも、変更可能且つそれぞれが自身のガウス広がり(var 29〜31)を有する確率値の、対称性の三峰性モデル(mode 9、10、および11)を与えた。CEK2−NZK2結合をメチル基として同じようにモデリングした(付表Aのヒアルロナンヘキササッカライド参照)。
5)CAF1−CBF1およびCBF1−CGF1結合は、sp3混成原子間にあるので三峰性のモデルを必要とする。HBプロトンは化学シフトが同じなので(図23参照)、CAF1−CBF1結合には、確率値が変更可能な対称性の三峰性モデルを用いた(var 1、var 2、var 3、var 6、mode 4 4)。同様にHGプロトンも化学シフトが同じなので(図23参照)、CBF1−CGF1結合にも、確率値が変更可能な対称性の三峰性モデルを用いた(var 1、var 2、var 3、var 6、mode 7 4)CGF1−CDF1結合はsp3混成原子(CGF1)とsp2混成原子(CDF1)の間にあるので二峰性のモデルを必要とする。動的モデルファイル中に示す2つの二面角(var 26、var 27)は、これらが種々の小分子結晶構造中のこの結合で主に観察される対称性コンフォメーションの両方の形態をモデリングするものであるためにこの値を選択した。この対称性のため、この結合には1個のガウス値を与えた(var 28)。
これらの考察の具体的実施は、以下に示す動的モデルファイルを用いて行った。各変数および確率モードと化学構造との関係を図26に示す。
Figure 2010539580
Figure 2010539580
Figure 2010539580
このようにして、アンサンブル生成アルゴリズムをコンピュータで実現するために必要なトランスリシノプリル分子の全てのフレキシビリティー部分およびその挙動を定義する。このモデルでは、トランスリシノプリルの溶液構造を解明するために決定すべき13個の未知のガウス広がり、2個の未知の平均二面角値、および11個の確率値がある。
<構造計算>
トランスリシノプリルの構造計算の各ラウンドは100回のランを含み、α−HA6で用いた回数(40)よりも多いが、これはモデリングされる自由度がより多いためである。χ2 totalの最も小さい25個のランについて統計処理を行った。個々のランはそれぞれ10,000回の繰り返しステップを有し、動的アンサンブルは250個の構造からなり、これはα−HA6で用いた数(40)より多いが、動的モデルファイル中で用いた二峰性および三峰性モデルの数がより多いためである。スカラーカップリングデータセットファイル(付表B参照)は、実験誤差が低く、構造計算の第1ラウンドから用いた。2D[1H,1H]−T−ROESYデータセットの基本的なデータセット(37個の構造的制約)を、構造計算の最初の8ラウンドで確立し、その後、未知の各パラメータに好ましい(および構造的に可能な)値へと構造を緩やかに収束させる。このラウンドの100回のランのトップ25についての一次統計および二次統計のデータ表を以下に示す(ランキングされた上位10ランのみを示す)。
Figure 2010539580
Figure 2010539580
この場合、Chi/Res値が2個のデータセットで近いことが分かる。このことは、2D−T−ROESYがスカラーカップリングデータセット(JCOUP)より特別に優勢ではなく、すなわち、mの値は0.4が好適であることを示している。
次の29ラウンドの構造計算では、より多くのROE構造的制約および多くのnoROE構造的制約を含めた。2D[1H,1H]−T−ROESYデータセットを完全に解析したこのラウンドの構造計算の結果は以下の通りである。
Figure 2010539580
Figure 2010539580
Figure 2010539580
これらの結果から分かるように、各パラメータの値、特に骨格結合の平均値、ガウス広がり、および確率値は、ラウンド8の結果と近い。どの構造的制約も10.0を超えるχ2 restraint値は有しない。ラウンド8に対して更にデータ(68個の構造的制約)を含めても、最適化された動的構造はあまり変わらないことから、動的構造が一次近似で解明された。その他の種類のNMRデータセットを含めることで、この分子の動的構造のより完全な理解が容易に得られるであろう(ヒアルロナンヘキササッカライドについて前述したように)。
これらの値に従って生成されるトランスリシノプリルの平均動的溶液構造の座標を付表Bに示す。平均動的構造および構造の動的アンサンブルの複数を視覚的例を図27〜29に示す。
[付表A−リシノプリル]
<リシノプリルの開始PDB 3D座標>
Figure 2010539580
<リシノプリルの分子内座標の表>
Figure 2010539580
<リシノプリルの[1H−1H]−T−ROESYデータセット>
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
<リシノプリルのスカラーカップリングデータセット>
Figure 2010539580
<最も良く最適化されたリシノプリルの動的構造のχ2 restraint値>
Figure 2010539580
Figure 2010539580
<リシノプリルの最も良い平均最適化動的構造のPDB座標>
Figure 2010539580
アンギオテンシンI
アンギオテンシンIは、血管を収縮させて血圧を上昇させる天然のデカペプチドである。アンギオテンシンIはデカペプチドホルモン(配列DRVYIHPFHL)であり、強力な口渇誘発剤である。アンギオテンシンIは、肝臓で生成される血清グロブリンである前駆体分子アンギオテンシノーゲンに由来し、レニン−アンギオテンシン系で重要な役割を果たす。アンギオテンシン変換酵素(ACE)はアンギオテンシンIから2個のC末端残基を切断してアンギオテンシンIIを生成し、これはこれらの生物学的プロセスを仲介する。本実施例では、本発明者らは本発明の方法を用いてNMR実験データからどのようにアンギオテンシンIの動的3D溶液構造が決定されたかを示す。
<化学シフトの帰属および等核スカラーカップリング定数の測定>
アンギオテンシンI中の原子および残基を、XPLORフォーマットに従って命名した(付表C参照)。アンギオテンシンIの全てのNMRデータはpH6.0で記録されており、典型的なpKa値と合わせて、分子中の滴定可能な基、すなわち骨格N末端アミン基(+ve)、Asp1側鎖(−ve)、Arg2側鎖(+ve)、骨格C末端カルボキシレート(−ve)のほとんどのイオン化状態を記述する。2個のヒスチジン側鎖(His6、His9)に、その予測pKa値(6.5)に一致した+veの電荷を与えるが、これが妥当であるか決定するためには更に実験データを収集すべきである。プロリン残基の窒素原子の孤立電子対の、隣接するカルボニル二重結合との部分的共役により、溶液中でアンギオテンシンIのシスおよびトランスの立体異性体の両方が存在する。
アンギオテンシンIの両立体異性体の300Kにおける1Hおよび13Cの化学シフトを、アンギオテンシンIの5mMのNMRサンプル(5%D2O、pH6.0、0.3mM DSS)について600MHzで記録した[1H−1H]−COSY、[1H−1H]−TOCSY、および天然存在比での[1H−13C]−HSQCのスペクトルを用いて帰属した。シス形態およびトランス形態に特徴的な共鳴のピーク体積を積分することで、モル存在比がトランス80%:シス20%に決定された。混合物中にトランス−アンギオテンシンIがより多く含まれるため、この段階で、トランスアンギオテンシンIの動的3D構造を決定することにした。アンギオテンシンIで測定されたプロトン化学シフトを以下の表2に示す。
Figure 2010539580
a1H化学シフトは全て300K、pH6.0、5%D2O/90%H2O中で、内部DSSに対して決定された。
b斜体で示した化学シフトは、局所的3D構造を参照せずに立体特異的に帰属できなかった原子を表す。
cアスタリスクの付いた原子は、縮重した化学シフトを表す(例えば、HB*は、HB1およびHB2が同じ値を有することを意味する)。
化学シフトは278Kおよび310Kでも測定したが、大きな変化は見られず(アミドプロトンの場合は直線的にだけ変化する。以下参照。)、この温度範囲で分子のコンフォメーションが顕著に乱れないことを示している。
トランスアンギオテンシンI中のHAプロトンおよびHNプロトンを除き、ほとんどのプロトンは、存在する多数のスカラーカップリング(アルギニン側鎖中には2HH3HHスカラーカップリングが5個も存在する)および強い結合(strong−coupling)により、スペクトルの線形が複雑であった。この複雑さにより、側鎖中のほとんどのスカラーカップリングが測定できなかった。しかし、スカラーカップリング制約のリストに示すように(付表C参照)、種々の側鎖プロトンの3HHカップリング定数が測定された。
<スペクトル線形の解析>
2D[1H,1H]−NOESYデータセットを用いてトランスアンギオテンシンIの構造的制約を得た。このデータセットのλの値(1.8Hz)を、NOEのIle5HNプロトンの共鳴を測定することで決定した。全てのHNプロトンは、単純なダブレットのスケーリング係数セットを有していた(すなわち、fi={2,2})。種々の芳香環プロトンは0、1、または2個の3Jスカラーカップリングを有し、強い結合の影響は受けず、したがって、それぞれ理想的なシングレット(例えばHis6 HE1)、ダブレット(例えばTyr4 HD*)、またはトリプレット(例えばPhe8 HZ)の線形を有していた。複数のHAプロトン(例えばHis6 HA)は、3個の3Jスカラーカップリングを有するため、基本的なクアドルプレット(quadruplet)の線形をしていた。これらの場合、前述のようにブロードニングの式を適用した。その他の全てのプロトンは複雑な線形をしており、強い結合の影響を受け、そのスケーリング係数セットは強く結合した(strong−coupoling)プロトンの規則を用いて決定した(上記参照)。
要約すると、この2D[1H,1H]−NOESYデータセットにおけるトランスアンギオテンシンI中の各プロトンのスケーリング係数セットは以下の通りである。
Figure 2010539580
Figure 2010539580
<NMRスペクトルの測定および定量>
全NMRスペクトルの記録は5mMアンギオテンシンIサンプル(5%D2O、pH6.0、0.3mM DSS)について600MHzで行った。6個の異なるNMR実験データセット中の4個の異なる種類のNMRデータをトランスアンギオテンシンIの動的溶液構造の決定に用いた。
1)NOESY緩和データ:1個の実験データセット、2D[1H,1H]−NOESY
2)コンフォメーション依存性スカラーカップリング:3個の実験データセット
3)二面角の制約:1個の実験データセット
4)水素結合の制約:1個の実験データセット
これらの異なるNMRデータセットのそれぞれの関連する取得パラメータ(およびそれらから測定された構造的制約の数)は以下の通りであった。
1)2D[1H,1H]−NOESYスペクトルを、278K、NOEを混合時間700ms、掃引幅を両方の次元で7200Hzにして記録した。前述のスケーリング係数セットを用いて、このスペクトルから343個のNOEおよび382個のnoNOEの構造的制約を測定した。2D[1H,1H]−NOESYスペクトルのmの初期値0.4を用いて、各NOE制約の誤差を前述したように決定した。このファイルのヘッダーを付表Cに示し、NOEおよびnoNOEの構造的制約は、簡潔にするために付表C中のχ2 restraintファイル中に非明示的に含めた。
2)278K、298K、および310Kの1D、15N−HSQC、および13C−HSQCのスペクトルから、HNプロトン、HAプロトン、およびIle5 CA−CB−CG1−CD1二面角について合計61個のコンフォメーション依存性スカラーカップリングが測定された。これらを、各温度について別々のスカラーカップリング制約のファイルにまとめた。その全てを付表Cに示す。
3)表2に示す化学シフトおよびプログラムTALOS[42]を用いて、二面角の制約を生成した。これらの予測される骨格角度ファイおよびプシーおよびその(二倍の)誤差の値を、合計16個の制約を含む付表Cに示す二面角の制約ファイル中で用いた。
4)アミドプロトンの化学シフト温度係数から、アンギオテンシンI中のアミド基の水素結合の有無を決定した。−4.6ppb/Kより小さい温度係数は、アミドプロトンが関わる有意な水素結合相互作用が存在しないことを示している[44]。アンギオテンシンIのアミドプロトンの温度係数の値は、Blundell and Almond(2007)[43]に記載されているように測定した。値は、Val3(−8.9ppb/K)、Tyr4(−9.4ppb/K)、Ile5(−6.4ppb/K)、His6(−8.9PPB/K)、Phe8(−9.1PPB/K)、およびLeu10(8.2ppb/K)であり、したがって、全てが−4.6ppb/Kより小さかった。このことは、これらが水溶液中であまり水素結合を形成しないことを示している(すなわち、<約10〜約20%の時間)。したがって、付表Cに示すファイル中の構造計算に5個の水素結合の制約を含めた。
<分子の詳細>
全ての実験データセットはH2O中で取得した。H2O中ではN末端第1級アミン、Arg2グアニジノ側鎖プロトン、Tyr4ヒドロキシルプロトン、およびHis6およびHis9の両方に含まれる両ヒスチジン側鎖アミンプロトンは素早く置換される。したがって、これらのプロトンは全て、以下の通り、溶媒マスクファイル中でNMR不活性として定義した。
Figure 2010539580
アンギオテンシンI中のカルボキシル基(すなわちAsp1側鎖&C末端)中の2個の酸素原子、Arg2グアニジノ基、およびTyr4ヒドロキシルプロトンの、分子構造の残りの部分に対する位置は、実験データからは特定できなかった。したがって、これらの原子は、以下のファンデルワールスインプットファイルに詳述するように、ファンデルワールス不活性と設定した。
Figure 2010539580
<実験データインプット>
トランスアンギオテンシンIのτcの値は実験では正確に測定されなかった。従って、τcの値は0.4nsを推定値として用いた。数ラウンドの構造計算の後、分子が非常に拡張された形状をとっていることおよび対称性のトップ異方性モデルがより適切であることが明らかとなった。2D−NOESYデータの定数セットについて計算ラウンドを繰り返した後、このことが更に確認され、この異方性モデルはかなりより良く実験データに適合した。垂直τc値1.2および平行τc値0.5nsで最も良く実験データに適合する(すなわち最もχ2 totalが小さい)ことが分かった。構造計算に用いた全実験データファイルを付表Cに詳述する。
<動的モデル>
前述の方法を用いて、アンギオテンシンI内の関連するコンフォメーションのフレキシビリティー結合および化学的性質を特定した:
1)分子骨格を含む各残基のファイ(φ,Ni−CAi)、プシー(ψ,CAi−Ci
およびオメガ(ω,Ci−Ni+1)単結合。
2)Asp1側鎖中の2個の単結合は回転可能である(CA−CB,CB−CG)。
3)Arg2側鎖中の4個の単結合は回転可能である(CA−CB、CB−CG、CG−CD、CD−NE)。
4)Val3側鎖中の3個の単結合は回転可能である(CA−CB、CB−CG1、CB−CG2)。
5)Tyr4側鎖中の3個の単結合は回転可能である(CA−CB、CB−CG、OH−HH)。
6)Ile5側鎖中の4個の単結合は回転可能である(CA−CB、CB−CG1、CG1−CD1、CB−CG2)。
7)His6側鎖中の2個の単結合は回転可能である(CA−CB、CB−CG)
8)Pro7環は、リシノプリルで記載したように、溶液中で2つの主要なコンフォメーションをとる。
9)Phe8側鎖中の2個の単結合は回転可能である(CA−CB、CB−CG)。
10)His9側鎖中の2個の単結合は回転可能である(CA−CB、CB−CG)。
11)Leu10側鎖中の4個の単結合は回転可能である(CA−CB、CB−CG、CG−CD1、CG−CD2)。
観察された実験データに対して最適化するために用いることができる現実的な動的分子モデルを作製するために、上記の自由度を以下の通り動的モデルファイル中でモデリングした。
1)骨格のファイ結合およびプシー結合の大半はsp2混成原子とsp3混成原子の間にあるので最初は二峰性モデルにした。骨格オメガ結合は全て固定単峰性モデルで表し、トランスの形状に適した平均二面角(すなわち180°)を用いた。N末端アミン結合(Asp1のN−CA)は2個のsp3混成原子の間にあるので、アミン基の回転を表すために三峰性モデルとした。
2)Asp1側鎖中のCA−CB結合(カイ1、χ1ともいう)はsp3混成原子間にあるので三峰性モデルをとる。3つの回転異性体状態(gt、tg、gg)を3個の異なる変数(var 11、12、13)で指定し、ガウス広がりは各回転異性体の位置で同じにした(var 14)。3つの回転異性体状態を与えるために用いられる最初の区切りはHAプロトンおよびHB1/HB2プロトンの間の3Jカップリング定数の差から推定した。Asp1側鎖中のCB−CG結合(カイ2、χ2ともいう)は、sp2混成原子とsp3混成原子の間にあるので二峰性モデルをとる。
3)Arg2側鎖中のCA−CB、CB−CGおよびCG−CD結合(χ1、χ2、χ3)は、sp3混成原子間にあるので三峰性モデルをとる。各結合について、3つの回転異性体状態(gt、tg、gg)を3個の異なる変数で指定し、ガウス広がりは各回転異性体の位置で同じにした。Arg2側鎖中のCD−NE結合(χ4)はsp2混成原子とsp3混成原子の間にあるので二峰性モデルをとる。
4)Val3側鎖中のCA−CB結合(カイ1、χ1ともいう)はsp3混成原子間にあるので三峰性モデルをとる。3つの回転異性体状態(gt、tg、gg)を3個の異なる変数で特定し、ガウス広がりは各回転異性体の位置で同じにした。3つの回転異性体状態を与えるための最初の区切りはHAプロトンおよびHBプロトンの間の3Jカップリング定数から推定した。2個のsp3混成原子の間にあるCB−CG1およびCB−CG2の結合で2個のメチル基が連結されている。これらはどちらも三峰性モデルにして、メチル基の回転を表した。
5)Tyr側鎖中のCA−CB結合(χ1)はsp3混成原子間にあるので三峰性モデルをとる。CB−CG結合(χ2)はsp2混成原子とsp3混成原子間にあるので二峰性モデルをとる。OH−HH結合は単峰性モデルをとる。
6)Ile5側鎖中の結合は全てsp3混成原子の間にあるので三峰性モデルをとる。CA−CBおよびCB−CG1結合の3つの回転異性体状態を与える最初の区切りは、HA−HB、HB−HG12、およびHB−HG13の3Jカップリング定数から推定した。
7)His6側鎖中のCA−CB結合(χ1)は、sp3混成原子間にあるので三峰性モデルをとる。CB−CG結合(χ2)は、sp2混成原子とsp3混成原子の間にあるので二峰性モデルをとる。
8)プロリン環の2つのコンフォメーションを、前述のリシノプリルで用いたのと同じように表した。
9)Phe8側鎖中のCA−CB結合(χ1)はsp3混成原子間にあるので三峰性モデルをとる。CB−CG結合(χ2)はsp2混成原子とsp3混成原子の間にあるので二峰性モデルをとる。
10)His9側鎖中のCA−CB結合(χ1)は、sp3混成原子間にあるので三峰性モデルをとる。CB−CG結合(χ2)はsp2混成原子とsp3混成原子の間にあるので二峰性モデルをとる。
11)Leu10側鎖内の結合は全てsp3混成原子間にあるので、三峰性モデルをとる。
これらの考察の具体的な実施は、以下に示す動的モデルファイルを用いて行った(関連する分子内座標の表については付表Cを参照されたい)。
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
このようにして、本発明に係るアンサンブル生成アルゴリズムをコンピュータで実施するために必要とされるトランスアンギオテンシンI分子の全てのフレキシビリティー部分およびその挙動を完全に定義した。
<構造計算>
トランスアンギオテンシンIの構造計算の各ラウンドは480回のランを含み、リシノプリルで用いたランの回数(100)よりも多いが、これはモデリングされる自由度の数がより多いからである。χ2 totalの最も小さい15個のランを統計処理した。個々のランはそれぞれ最初に5000回の繰り返しステップを有し、動的アンサンブルは200個の構造からなり、これは、α−HA6で用いた数(40)より多いが、動的モデルファイルで用いる二峰性モデルおよび三峰性モデルの数がより多いためである。
このペプチドで生じる困難の1つは、最初に立体化学的に不明瞭なプロトンが多いことから生じるものである。分子内の不斉中心の全てのプロトンの化学シフトが帰属されているものの、どのプロトンがproRまたはproSであるかの特定は収集したスペクトルの帰属からは簡単に決定されない。したがって、立体化学的に不明瞭なプロトンに固有且つ特異的な構造的制約(スカラーカップリングおよびNOEデータの両方を含む)が解明され得る一方で、これらは不明瞭さが解消されるまで構造計算に含めることはできない。これらの立体中心の一部は、構造計算から得られる更に詳細な3Dの知見がなくとも、局所的NOEおよびスカラーカップリング定数を考慮することで容易に決定され得る:
1)Va13 HG1*/HG2*:HAとHBの間のカップリング定数は、HAプロトンおよびHBプロトンが互いにトランスに強い傾向を有することを示しており、これは、一方のメチル基は平均してTyr4内のプロトンにより近く、他方は平均してArg2により近いことを意味する。したがって、Val3の両メチル基に対するTyr4およびArg2中のプロトンのNOE強度を比較することで、2個のメチル基を容易に立体特異的に帰属することができる。
2)Pro7 HD1/HD2:Pro7 HAからどちらも固定された距離にある両HDプロトンのPro7 HAプロトンに対するNOE強度を比較することで、2個のHDプロトンをすぐに立体特異的に帰属することができる。
スカラーカップリング、二面角、および水素結合の制約ファイル(付表C参照)は、信頼性が高く、構造計算の最初のラウンドからほとんど全体を使用した。2D[1H,1H]−NOESYデータセットの基本的なデータセット(167個のNOEおよび44個のnoNOEの構造的制約)を最初の30ラウンドの構造計算で確立し、その後、全ての残基の好ましいラマチャンドランプロット領域まで、構造を緩やかに収束させた。この時点での二次統計表は以下の通りである。
Figure 2010539580
この場合、Chi/Res値がデータセットと近いことが分かり、このことは、データセットのどれか1つが構造計算の結果に特に優勢ではないことを示している。実際、2D−NOESYデータセットで観察された、より高い値は、相関時間が準最適値であるためおよび少ない数の繰り返しステップ(5,000)で可能なコンフォメーション空間の探索が比較的不完全であるためと理解された。この時点で、このペプチドが全体的に拡張されたコンフォメーションをとっており、したがって、異方性モデルがより適していることが明確となった。アンギオテンシンIの対称性トップモデルの垂直および平行の両方の相関時間の値範囲の探索から、1.2ns(垂直)および0.5ns(平行)が、相関時間が0.4nsの最初の対称性モデルより2D−NOESYデータに相当良好なχ2 datasetスコアを与えることが示され、これらを残りのラウンドの構造計算で用いた。また、構造を更に効果的に最適化できるように10,000回の繰り返しステップを用いた。
次の30ラウンドの構造計算では、前述の不正確に解析されたアーティファクトなデータを除く繰り返し方法の後で、より多くのNOE構造的制約(合計277個)および多くのnoNOE構造的制約(合計225個)を含めた。この時点で、構造はとても良く収束した。二次統計表は以下の通りである。
Figure 2010539580
このプロセスの間、構造がより解明されるにつれて、残りの立体化学的に不明瞭なプロトンを以下のように立体特異的に帰属することができるようになった。
1)Pro7 HB1/HB2:両Pro7 HBプロトンに対するPhe8およびIle5中のプロトンのNOE強度の比較から、これらの構造はプロリン環の一方の面がPhe8に面し、他方の面がIle5に面していることを示していたため、2個のHBプロトンを容易に立体特異的に帰属することができた。
2)Asp1 HB1/HB2、Ile5 HG11/HG12、His6 HB1/HB2、Leu10 HD1*/HD2*:これらのプロトンは、同じデータで32個の可能な組合せ全てに対して計算を何ラウンドも行い、χ2 totalのスコアを比較することで、立体特異的に帰属した。これらのラウンド間でχ2 totalにかなりの差があることから、Ile5 HG1*およびHis6 HB*プロトンの立体特異的帰属の信頼性は非常に高く、Asp1 HB*およびLeu10 HD*プロトンの立体特異的帰属の信頼性は良好である。
次の15ラウンドの構造計算では、2D[1H,1H]−NOESYデータセットが完全に解析されるまで、残りのNOEおよびnoNOE制約を含めた。この時点での二次統計表は以下の通りである。
Figure 2010539580
これら15ラウンドには前回のラウンドと比べて追加のデータ(250個の構造制約)を含めたが、最適化された動的構造はあまり変化しなかったので、動的構造は一次近似まで解明されたとみなした。
<構造精密化>
動的モデルファイルを用いて、アンギオテンシンIの動的3D溶液構造を精密化した。動的モデルファイル中の変数の開始値は、上記最後のラウンドの結果からとった。これにより、最適化アルゴリズムでこの特定のχ2 total最小値を極めて効果的に調べることができた。アンサンブルサイズを大きくし、より多くの繰り返しステップを実施した。構造精密化後の二次統計表は以下の通りである。
Figure 2010539580
χ2 restraintの値が10.0より大きい構造的制約が3個だけあり、全てLeu10側鎖に関連している。このことは、この側鎖で計算された構造が何らかの理由でここでの実験データと幾分一致していないことを示している。この不一致は、Leu10 HB*およびHGプロトンのスケーリング係数が良くないためである可能性が高く、このスケーリング係数は、Leu10 HB*とHGの間の強い結合により線のブロード化が生じたために推定しなければならなかったものである。Leu10側鎖の構造をより正確に決定するためには更なる実験データが必要である。全807個の構造的制約およびその個々のχ2restraint値の最終リストを付表Cに示す。アンギオテンシンIの平均動的構造および構造の動的アンサンブルの複数の視覚的描写を図30〜31に示す。
[付表C−アンギオテンシンI]
<アンギオテンシンIの開始PDB 3D座標>
Figure 2010539580
Figure 2010539580
Figure 2010539580
<アンギオテンシンIの分子内座標の表>
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
<アンギオテンシンIの構造的制約ファイル>
1)2D−NOESY制約ファイル:[簡潔さのために、ここではヘッダーのみを示す。全343個のNOE制約および383個のnoNOE制約の全ては、以下のχ2 restraint値ファイルの中に非明示的に示されている。]
Figure 2010539580
2)スカラーカップリング制約ファイル:
Figure 2010539580
Figure 2010539580
3)二面角制約ファイル
Figure 2010539580
4)水素結合制約ファイル
Figure 2010539580
Figure 2010539580
<アンギオテンシンIの最も良く最適化された動的構造についてのχ2 restraint値>
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580
生物活性コンフォメーションの予測
リガンド分子の生物活性コンフォメーションは、そのリガンドのタンパク質結合コンフォメーションであり、コンピュータ支援分子設計プロセス(これは製薬業界全体で新薬の開発に使用されている。)における有用性から強く探求されている。特に生物活性コンフォメーションの知見は、リード化合物(lead)の最適化および同定に非常に重要である。通常、タンパク質は、水溶液中での全体の自由エネルギーが最小にとても近いコンフォメーションのリガンド分子に結合する[45]。本発明に係る方法を用いて決定される水溶液中での平均的な動的3D構造は、この全体自由エネルギーが最小のコンフォメーションに等しい。したがって、本方法を用いて決定された分子の平均動的3D構造は、分子の生物活性コンフォメーションの予測に優れ、したがって、本方法はコンピュータ支援分子設計プロセスに相当有用である。以下の表3に示すのは、様々な種類の分子について、本方法を用いて決定した平均動的3D構造が正確に生物活性コンフォメーションを予測していることを示す複数の例である。
Figure 2010539580
水溶液中の平均動的3D構造が生物活性コンフォメーションとほぼ同一であることで明らかに利益を受ける特定のコンピュータ支援分子設計技術は、リガンドベースのドラッグデザイン(Ligand−Based Drug Design)である。
医薬品化学における合理性の向上
本発明の方法を用いて得られるリシノプリルおよびアンギオテンシンIの動的3D構造の比較から、リシノプリルが天然リガンドのまたは生物活性コンフォメーションの形状および静電的特性を最適に模倣していない領域が明らかになった。
この以前には利用可能でなかった情報を用いることで、リシノプリルの化学構造の適切な修飾の選択を実現することが可能になり、これにより、結合エネルギーに不利であると認められたフレキシビリティーが除かれる。この3D動態情報がなければ、当業者にさえ、このような修飾の根本的理由は明らかではなかったであろう。
これらの示唆される修飾の1つ(架橋基を含める)は、スクリーニング、SAR解析、および医薬品化学の繰り返し(interative)ラウンドからなる従来の時間のかかるプロセスで独立して得られた次世代のACE阻害剤ベナゼプリラートの構造的特徴を予想していた(図32参照)。この結果から、本発明に従って作製された動的3D構造が医薬品化学者のリード化合物最適化の決定の大きな助けとなり得ることは明らかである。
Figure 2010539580
Figure 2010539580
Figure 2010539580
Figure 2010539580

Claims (62)

  1. 分子の3次元構造の集団を表すデータを生成するためのコンピュータ実行方法であって、前記分子が少なくとも1つの結合で連結された第一および第二の原子を含み、前記結合が関連角を有し、かつ前記角が変動して前記分子の3次元構造を複数生成し、前記方法が、
    前記角の可変性を示すデータを含む、前記分子を表すデータを受け取ることと、
    前記角が前記可変性に基づいて選択された関連値を有するように、構造の集団を生成することと、を含む方法。
  2. 分子の3次元構造の可変性をシミュレートするためのコンピュータ実行方法であって、前記分子が少なくとも1つの結合で連結された第一および第二の原子を含み、前記結合が関連角を有し、かつ前記角が変動して前記分子の3次元構造を複数生成し、前記方法が、
    前記角の可変性を示すデータを含む、前記分子を表すデータを受け取ることと、
    前記角の可変性を示す前記データに基づいて前記分子の3次元構造の可変性をシミュレートすることと、
    前記角が前記シミュレートに基づいて選択された関連値を有するように、構造の集団を生成することと、を含む方法。
  3. 前記分子を表すデータが前記結合の平均角を示すデータをさらに含む、請求項1または2に記載の方法。
  4. 前記角の可変性を示すデータが前記平均角に関連するデータを含む、請求項3に記載の方法。
  5. 前記結合の可変性を示すデータが前記平均角の周りの角の分布を示すデータを含む、請求項4に記載の方法。
  6. 前記分布が確率分布である、請求項5に記載の方法。
  7. 前記角の確率分布が前記平均角の周りで対称である、請求項6に記載の方法。
  8. 前記結合の可変性を示すデータが前記平均角の周りの角のガウス分布である、請求項4に記載の方法。
  9. 前記分子を表すデータが、前記結合のさらなる平均角を示すさらなるデータをさらに含む、請求項3〜8のいずれか1項に記載の方法。
  10. 前記角の可変性を示すデータが、前記さらなる平均角に関連するさらなるデータを含む、請求項9に記載の方法。
  11. 前記結合の可変性を示すデータが、前記さらなる平均角の周りのさらなる角の確率分布を含む、請求項10に記載の方法。
  12. 前記角のさらなる確率分布が前記さらなる平均角の周りで対称である、請求項11に記載の方法。
  13. 前記結合の可変性を示すデータが、前記さらなる平均角の周りのさらなる角のガウス分布である、請求項10に記載の方法。
  14. 前記分子を表すデータが第一および第二の原子の化学的性質を示すデータを含む、請求項1〜13のいずれか1項に記載の方法。
  15. 前記分子を表すデータが、第一および第二の原子の化学的性質に基づく前記結合の可変性を示すデータをさらに含む、請求項14に記載の方法。
  16. 前記結合の可変性を示すデータが、第一および第二の原子が二重共有結合、三重共有結合を介して連結しているとき、または第一および第二の原子が芳香環構造に組み込まれているときに結合の可変性がゼロであることを示すデータを含む、請求項15に記載の方法。
  17. 前記結合の可変性を示すデータが、第一および第二の原子のうちの一方が水素原子またはハロゲン原子であるときに結合の可変性がゼロであることを示すデータを含む、請求項15に記載の方法。
  18. 前記結合の可変性を示すデータが、第一および第二の原子が3員または4員の環構造に組み込まれているときに結合の可変性がゼロであることを示すデータを含む、請求項15に記載の方法。
  19. 前記結合の可変性を示すデータが、第一および第二の原子が単一の共有結合を介して連結され、かつ、
    a.第一および第二の原子のうちの一方が、二重または三重共有結合を介して第三の原子に連結するか、または
    b.第一および第二の原子が酸素原子であるとき、
    結合の可変性がゼロではなく単峰性の結合角可変性を示すことを示すデータを含む、請求項15に記載の方法。
  20. 前記結合の可変性を示すデータが、第一および第二の原子が5員または6員の飽和脂環構造に組み込まれているとき、結合の可変性がゼロではなく二峰性の結合角可変性を示すことを示すデータを含む、請求項15に記載の方法。
  21. 前記結合の可変性を示すデータが、
    a.第一および第二の原子が単一の共有結合を介して連結され、第一および第二の原子のうちの一方がsp3混成であり、第一および第二の原子のうちの他方がsp2混成であるか;または
    b.第一および第二の原子が単一の共有結合を介して連結され、かつ分子内で前記単一の共有結合が少なくとも一つのさらなる二重共有結合と共役するとき、
    結合の可変性がゼロではなく二峰性の結合角可変性を示すことを示すデータを含む、請求項15に記載の方法。
  22. 前記結合の可変性を示すデータが、第一および第二の原子が単一の共有結合を介して連結され、かつ:
    a.第一および第二の原子の両方が四価でsp3混成であるか;または
    b.第一および第二の原子のうちの一方がsp3混成であり、かつ第一および第二の原子のうちの他方が酸素原子であるとき、
    結合の可変性がゼロではなく三峰性の結合角可変性を示すことを示すデータを含む、請求項15に記載の方法。
  23. 前記角が第一と第二の原子の間に規定される二面角である、請求項1〜22のいずれか1項に記載の方法。
  24. 前記方法が、前記分子の3次元構造の前記生成された集団から少なくとも1の実験パラメータを予測することをさらに含む、請求項1〜23のいずれか1項に記載の方法。
  25. 前記方法が、前記少なくとも1の予測される実験パラメータの、少なくとも1の物理的実験に由来する少なくとも1のさらなるパラメータに対する比較をさらに含む、請求項24に記載の方法。
  26. 前記方法が、前記比較に基づいて一致関数を決定することをさらに含む、請求項25に記載の方法。
  27. 前記方法が、
    前記分子の3次元構造のさらなる集団を表すさらなるデータを生成すること;
    前記分子の3次元構造の前記さらなる生成された集団から、少なくとも1のさらなる実験パラメータを予測すること;
    前記少なくとも1のさらなる予測される実験パラメータを、少なくとも1の物理的実験に由来する前記少なくとも1のパラメータに対して比較すること;
    少なくとも1のさらなる実験パラメータの、少なくとも1の物理的実験に由来する前記少なくとも1のパラメータに対する前記比較に基づいてさらなる一致関数を決定すること;および
    最もよい一致関数を有する集団を示すデータを生成すること、をさらに含む、請求項26に記載の方法。
  28. 前記方法が、前記さらなる集団を複数生成すること、および前記複数のさらなる集団から決定される最もよい一致関数を有する集団を選択することを含む、請求項27に記載の方法。
  29. 前記方法が、前記分子の3次元構造の前記生成された集団から少なくとも2の実験パラメータを予測することをさらに含む、請求項25〜28のいずれか1項に記載の方法。
  30. 前記方法が、前記少なくとも2の予測される実験パラメータの、少なくとも2の物理的実験に由来する少なくとも2のさらなるパラメータに対する比較をさらに含む、請求項29に記載の方法。
  31. 前記少なくとも2の物理的実験が、異なる期間にわたって抽出された前記分子の3次元構造を示すデータを提供する、請求項30に記載の方法。
  32. 前記少なくとも2の物理的実験が、前記分子の動きの異なる範囲にわたって抽出された前記分子の3次元構造を示すデータを提供する、請求項30または31に記載の方法。
  33. 前記予測される実験パラメータの少なくとも一つが、前記分子の3次元構造を示すNMRデータに関連する、請求項24〜32のいずれか1項に記載の方法。
  34. 前記NMRデータが、スカラーカップリング、核オーバーハウザー効果(NOE)、回転座標系NOE(ROE)、残留双極子カップリング(RDC)、異核NOE、およびT1緩和データから成る群より選択される、請求項33に記載の方法。
  35. 前記物理的実験の少なくとも一つが1D NMR分光法を含む、請求項25または30に記載の方法。
  36. 前記1D NMR分光法が、[1H]−1D分光法、[13C]−1D分光法、[13C]−フィルター[1H]−1D分光法、[15N]−1D分光法および[15N]−フィルター[1H]−1D分光法から成る群より選択される、請求項35に記載の方法。
  37. 前記物理的実験の少なくとも一つが2D NMR分光法を含む、請求項25または30に記載の方法。
  38. 前記2D NMR分光法が、[1H,1H]−DQF−COSY分光法、[1H,1H]−TOCSY分光法、[1H,13C]−HSQC分光法、[1H,13C]−HMBC分光法および[1H,15N]−HSQC分光法から成る群より選択される、請求項37に記載の方法。
  39. 前記分子が有機分子である、請求項1〜38のいずれか1項に記載の方法。
  40. 前記分子がペプチド、炭水化物、抗生物質、核酸、脂質、代謝産物、薬物分子およびタンパク質から成る群より選択される、請求項1〜38のいずれか1項に記載の方法。
  41. 前記分子がヒアルロナン、リシノプリルおよびアンギオテンシンIから成る群より選択される、請求項1〜38のいずれか1項に記載の方法。
  42. 分子の3次元構造の複数の集団から選択される分子の3次元構造の最適化された集団を表すデータを生成するための方法であって、各集団が請求項1〜23のいずれか1項に記載の方法により生成される方法。
  43. 分子の3次元構造を示すNMRデータを予測するための、請求項1〜41のいずれか1項に記載の方法により生成された分子の3次元構造の集団の使用。
  44. 請求項1〜41のいずれか1項に記載の方法を用いて生成された分子の3次元構造の集団を用いて、NMRデータを予測するための方法。
  45. 請求項1〜41のいずれか1項に記載の方法を用いて分子の3次元構造の集団を生成することにより、分子の生物活性コンフォメーションをシミュレートするための方法。
  46. 分子の生物活性コンフォメーションをシミュレートするための、請求項1〜41のいずれか1項に記載の方法により生成された分子の3次元構造の集団の使用。
  47. 請求項1〜41のいずれか1項に記載の方法を用いた分子の3次元構造の集団の生成により、その目的とする標的に結合したときの分子のコンフォメーションをシミュレートするための方法。
  48. その目的とする標的に結合したときの分子のコンフォメーションをシミュレートするための、請求項1〜41のいずれか1項に記載の方法により生成された分子の3次元構造の集団の使用。
  49. 請求項1〜41のいずれか1項に記載の方法を用いたリガンド分子の3次元構造の集団の生成により、その目的とする標的に結合したときのリガンド分子のコンフォメーションをシミュレートするための方法。
  50. その目的とする標的に結合したときのリガンド分子のコンフォメーションをシミュレートするための、請求項1〜41のいずれか1項に記載の方法により生成されたリガンド分子の3次元構造の集団の使用。
  51. 請求項1〜41のいずれか1項に記載の方法を用いたペプチド分子の3次元構造の集団の生成により、ペプチド分子の生物活性コンフォメーションをシミュレートするための方法。
  52. ペプチド分子の生物活性コンフォメーションをシミュレートするための、請求項1〜41のいずれか1項に記載の方法により生成されたペプチド分子の3次元構造の集団の使用。
  53. 請求項1〜41のいずれか1項に記載の方法を用いた炭水化物分子の3次元構造の集団の生成により、炭水化物分子の生物活性コンフォメーションをシミュレートするための方法。
  54. 炭水化物分子の生物活性コンフォメーションをシミュレートするための、請求項1〜41のいずれか1項に記載の方法により生成された炭水化物分子の3次元構造の集団の使用。
  55. 請求項1〜41のいずれか1項に記載の方法を用いた薬物分子の3次元構造の集団の生成により、薬物分子の生物活性コンフォメーションをシミュレートするための方法。
  56. 薬物分子の生物活性コンフォメーションをシミュレートするための、請求項1〜41のいずれか1項に記載の方法により生成された薬物分子の3次元構造の集団の使用。
  57. 請求項1〜41のいずれか1項に記載の方法を用いたペプチド分子の3次元構造の集団の生成による分子内の水素結合占有率をシミュレートするための方法。
  58. 分子の水素結合占有率をシミュレートするための、請求項1〜41のいずれか1項に記載の方法により生成された分子の3次元構造の集団の使用。
  59. 分子の3次元構造の集団の生成に使用できるデータを保持するデータキャリアであって、前記分子が少なくとも1つの結合で連結した第一および第二の原子を含み、前記データが前記角の可変性を示すデータを含む前記分子を表すデータを含む、データキャリア。
  60. コンピュータに請求項1〜41のいずれか1項に記載の方法を行わせるように構成されたコンピュータで読み取り可能な命令を保持するキャリア媒体。
  61. 分子の3次元構造の集団を表すデータを生成するためのコンピュータ装置であって、
    前記装置が、プロセッサで読み取り可能な命令を記憶するメモリーと、前記メモリーに記憶された命令を読み取りかつ実行するために構成されたプロセッサと、を含み、
    前記プロセッサで読み取り可能な命令は、前記プロセッサに請求項1〜41のいずれか1項に記載の方法を行わせるように構成された命令を含む、装置。
  62. 化合物に関して得られたNMRスペクトル由来の分子の3次元構造を示すNMRデータを処理するためのコンピュータ実行方法であって、前記方法が、
    a.前記スペクトル中の共鳴多重線成分に関する共鳴周波数νを決定すること;
    b.前記多重線スペクトルの最大高さの半分での固有共鳴線幅λよりも小さい共鳴周波数差(Δν)を有する前記NMRスペクトル中の共鳴多重線成分を同定すること;
    c.前記NMRスペクトルについて工程b.で同定された多重線成分iのそれぞれの高さhiを決定すること;
    d.各多重線について、以下のように広幅化因子bを決定すること:
    Figure 2010539580
    e.多重線構造を分析して、前記多重線成分のそれぞれについて理想共鳴周波数νidealを予測し、理想多重線構造が二重線であるか三重線であるかを決定すること;
    f.理想多重線構造が二重線の場合、各多重線成分についてスケーリング係数fiを以下のように決定し:
    i=2・b
    かつ、1モル存在量での共鳴多重線成分iの高さHiを以下のように決定すること:
    i=hi×fi
    g.理想多重線構造が三重線の場合、各外側多重線成分についてスケーリング係数fi(outer)を以下のように決定し:
    i(outer)=4・b
    かつ、重複する内側多重線成分についてスケーリング係数fi(inner)を以下のように決定すること:
    i(inner)=2・b
    h.1モル存在量での共鳴多重線成分iの高さHiを以下のように決定すること:
    i(inner)=hi(inner)×fi(inner)
    i(outer)=hi(outer)×fi(outer)
    を含む、方法。
JP2010524562A 2007-09-14 2008-09-03 動的分子の3次元構造の決定方法 Active JP5555630B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB0718027.6A GB0718027D0 (en) 2007-09-14 2007-09-14 Method for determining three-dimensional structures of dynamic molecules
GB0718027.6 2007-09-14
PCT/GB2008/002973 WO2009034297A2 (en) 2007-09-14 2008-09-03 Method for determining three-dimensional structures of dynamic molecules

Publications (3)

Publication Number Publication Date
JP2010539580A true JP2010539580A (ja) 2010-12-16
JP2010539580A5 JP2010539580A5 (ja) 2011-10-20
JP5555630B2 JP5555630B2 (ja) 2014-07-23

Family

ID=38659024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010524562A Active JP5555630B2 (ja) 2007-09-14 2008-09-03 動的分子の3次元構造の決定方法

Country Status (6)

Country Link
US (2) US10482997B2 (ja)
EP (1) EP2188750B1 (ja)
JP (1) JP5555630B2 (ja)
CA (1) CA2735395C (ja)
GB (1) GB0718027D0 (ja)
WO (1) WO2009034297A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085309A (ja) * 2012-10-26 2014-05-12 Sumitomo Rubber Ind Ltd 架橋密度の試験方法
JP2014219943A (ja) * 2013-05-10 2014-11-20 富士通株式会社 特定プログラム、特定装置、および特定方法
WO2019230303A1 (ja) * 2018-05-29 2019-12-05 富士フイルム株式会社 分子安定構造の探索方法、分子安定構造の探索プログラム及び分子安定構造の探索装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101557514B (zh) * 2008-04-11 2011-02-09 华为技术有限公司 一种帧间预测编解码方法、装置及系统
JP5998580B2 (ja) * 2012-03-29 2016-09-28 富士通株式会社 決定プログラム、決定装置、および決定方法
US10366779B2 (en) * 2015-12-30 2019-07-30 International Business Machines Corporation Scheme of new materials
RU2019103444A (ru) * 2016-07-07 2020-08-07 Артем Ромаевич Оганов Компьютерно-реализуемый способ поиска кристаллических структур
US20180137256A1 (en) * 2016-11-16 2018-05-17 Paul MERRITHEW System and method of calculating the structure and properties of chemicals
CN109461475B (zh) * 2018-10-26 2022-05-13 中国科学技术大学 一种基于人工神经网络的分子属性预测方法
CN111863140B (zh) * 2020-06-15 2022-04-15 深圳晶泰科技有限公司 一种测试和拟合力场二面角参数的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049188A (ja) * 2003-07-28 2005-02-24 Matsushita Electric Ind Co Ltd タンパク質設計法
JP2005508487A (ja) * 2000-06-15 2005-03-31 ファーマコピア インコーポレーティッド 生体標的に対するコンビナトリアル・ライブラリーの相補性を評価するための分子ドッキング法
JP2005515575A (ja) * 2002-01-25 2005-05-26 アイシス イノヴェイション リミテッド 結合部位の同定方法
JP2007508637A (ja) * 2003-10-14 2007-04-05 バーセオン 分子を区分するための方法および装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005508487A (ja) * 2000-06-15 2005-03-31 ファーマコピア インコーポレーティッド 生体標的に対するコンビナトリアル・ライブラリーの相補性を評価するための分子ドッキング法
JP2005515575A (ja) * 2002-01-25 2005-05-26 アイシス イノヴェイション リミテッド 結合部位の同定方法
JP2005049188A (ja) * 2003-07-28 2005-02-24 Matsushita Electric Ind Co Ltd タンパク質設計法
JP2007508637A (ja) * 2003-10-14 2007-04-05 バーセオン 分子を区分するための方法および装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN6013032113; 目黒俊幸: '生体高分子のモンテカルロシミュレーションにおける分子変形方法の工夫' Journal of computer chemistry, Japan Vol.1, No.1, 20020315, p.9-22 *
JPN6013039777; Almond, A.: 'Hyaluronan: the local solution conformation determined by NMR and computer modeling is close to a co' Journal of molecular biology Vol.358, No.5, 20060519, p.1256-69 *
JPN6013039779; Guntert, P.: 'Efficient computation of three-dimensional protein structures in solution from nuclear magnetic reso' Journal of molecular biology Vol.217, No.3, 19910205, p.517-530 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085309A (ja) * 2012-10-26 2014-05-12 Sumitomo Rubber Ind Ltd 架橋密度の試験方法
JP2014219943A (ja) * 2013-05-10 2014-11-20 富士通株式会社 特定プログラム、特定装置、および特定方法
WO2019230303A1 (ja) * 2018-05-29 2019-12-05 富士フイルム株式会社 分子安定構造の探索方法、分子安定構造の探索プログラム及び分子安定構造の探索装置
JPWO2019230303A1 (ja) * 2018-05-29 2021-06-17 富士フイルム株式会社 分子安定構造の探索方法、分子安定構造の探索プログラム及び分子安定構造の探索装置
JP7019805B2 (ja) 2018-05-29 2022-02-15 富士フイルム株式会社 分子安定構造の探索方法、分子安定構造の探索プログラム、記録媒体及び分子安定構造の探索装置
US11694767B2 (en) 2018-05-29 2023-07-04 Fujifilm Corporation Method for searching for molecular stable structure, program for searching for molecular stable structure, and device for searching for molecular stable structure

Also Published As

Publication number Publication date
CA2735395C (en) 2017-11-07
WO2009034297A2 (en) 2009-03-19
EP2188750A2 (en) 2010-05-26
JP5555630B2 (ja) 2014-07-23
US20100191517A1 (en) 2010-07-29
WO2009034297A3 (en) 2009-10-22
GB0718027D0 (en) 2007-10-24
EP2188750C0 (en) 2023-06-07
US10482997B2 (en) 2019-11-19
EP2188750B1 (en) 2023-06-07
US20180096112A1 (en) 2018-04-05
CA2735395A1 (en) 2009-03-19

Similar Documents

Publication Publication Date Title
JP5555630B2 (ja) 動的分子の3次元構造の決定方法
Tian et al. ff19SB: amino-acid-specific protein backbone parameters trained against quantum mechanics energy surfaces in solution
Man et al. Effects of all-atom molecular mechanics force fields on amyloid peptide assembly: The case of aβ16–22 dimer
Song et al. The IDP-specific force field ff14IDPSFF improves the conformer sampling of intrinsically disordered proteins
Aldeghi et al. Predictions of ligand selectivity from absolute binding free energy calculations
Zhang et al. Well-balanced force field ff 03 CMAP for folded and disordered proteins
Cerutti et al. ff14ipq: A self-consistent force field for condensed-phase simulations of proteins
Christensen et al. Semiempirical quantum mechanical methods for noncovalent interactions for chemical and biochemical applications
Rahman et al. Comparison and evaluation of force fields for intrinsically disordered proteins
Richter et al. The MUMO (minimal under-restraining minimal over-restraining) method for the determination of native state ensembles of proteins
Pierce et al. Routine access to millisecond time scale events with accelerated molecular dynamics
Nerenberg et al. Optimizing protein− solvent force fields to reproduce intrinsic conformational preferences of model peptides
Miller et al. Reparametrization of protein force field nonbonded interactions guided by osmotic coefficient measurements from molecular dynamics simulations
Friedland et al. A correspondence between solution-state dynamics of an individual protein and the sequence and conformational diversity of its family
Anandakrishnan et al. Why computed protein folding landscapes are sensitive to the water model
McGee Jr et al. pH-REMD simulations indicate that the catalytic aspartates of HIV-1 protease exist primarily in a monoprotonated state
US6490532B1 (en) Method to construct protein structures
Wang et al. Effect of the force field on molecular dynamics simulations of the multidrug efflux protein P-glycoprotein
Best Atomistic force fields for proteins
Robinson et al. Are AMBER force fields and implicit solvation models additive? A folding study with a balanced peptide test set
Vashisth et al. Collective variable approaches for single molecule flexible fitting and enhanced sampling
Goel et al. Application of site-identification by ligand competitive saturation in computer-aided drug design
Song et al. Finite temperature string method with umbrella sampling: Application on a side chain flipping in Mhp1 transporter
Orr et al. Preserving the Integrity of Empirical Force Fields
Song et al. Phosphorylation modification force field FB18CMAP improving conformation sampling of phosphoproteins

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110901

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110901

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130813

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131112

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140513

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140602

R150 Certificate of patent or registration of utility model

Ref document number: 5555630

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250