JPH06503908A - 比較分子場解析法 - Google Patents

比較分子場解析法

Info

Publication number
JPH06503908A
JPH06503908A JP3512615A JP51261591A JPH06503908A JP H06503908 A JPH06503908 A JP H06503908A JP 3512615 A JP3512615 A JP 3512615A JP 51261591 A JP51261591 A JP 51261591A JP H06503908 A JPH06503908 A JP H06503908A
Authority
JP
Japan
Prior art keywords
molecule
molecules
displaying
data table
shape
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3512615A
Other languages
English (en)
Inventor
クレイマー、リチャード ディー、ザ サード
スバント、ウォールド
Original Assignee
トリポス アソシエイツ インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by トリポス アソシエイツ インコーポレーテッド filed Critical トリポス アソシエイツ インコーポレーテッド
Publication of JPH06503908A publication Critical patent/JPH06503908A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 比較分子場解析法 技術分野 この発明は、共通分子に対して類似の結合親和性をもった分子によって与えられ る立体場および静電場を三次元で比較し、それら場のクロス相関性によってそれ ら分子間の結合親和性の差に関係した最も重要な共通のトポロジカル(位相的) 特性を得る方法に関するものである。
背景技術 過去30年の間に近代生物学は、生物分子の観察された機能および活性に関して 生物分子の三次元立体配座/形状の重要性を認識するようになってきた。水素の 結合した絡み合う二重へリックス(らせん構造)としてDNA構造の解明を通し てタンパク質におけるαヘリックスの最初の確認に始まり、酵素−基質錯体のX −線結晶学による最近の研究によって、決定因子として形状の役割の評価が連続 的に増してきた。実際に、現在は殆んどの生物高分子の機能の適切な説明および 理解はそれら生物高分子の三次元形状の理解に左右されると理解されている。
その事情はしばしば三次元のジグソーパズルに類似し、−緒に適合しなければな らないパーツは三次元の特異的パターで互にからみ合っている。現在、分子基質 の酵素への結合は、基質が正しい三次元的および熱力学的配向における機械的お よび化学的に安定化されて触媒反応を促進するように、酵素内のノツチ/グルー プ/キャビティに適合する基質の能力によって決まると考えられている。同様に 、抗体の抗原への極めて特異的結合は抗体による抗原分子の表面形状の特異的特 徴のMpAmによって達成されると長い間認識されてきた。
これら三次元の難問の理解は酵素学、免疫学および生物化学の基本的理解に重要 であるのみならず、かかる研究は治療薬研究者にとって重要な関心事である。
大部分の薬物の作用効果は薬物の標的レセプター(受容体)分子への結合によっ て得られる。その結合特性がさらに十分に理解される程度に、それらの標的分子 に結合する薬物を天然の化合物よりも正確でかつ大きな効果をもって設計できる ようにすべきである。この治療薬の追求は、多くの治療薬の一般化された副作用 が望ましくなく、さらに特異的薬物相互作用が必要である癌研究において特に重 要である。
生物分子の三次元の立体配座(コンホメーション)の重要性の認識と共に、分子 のコンホメーションがそれらの活性にいかに関係しているかを理解することがい かに困難であるかを認識するようになってきた。現在、生物分子の三次元形状を 正確に決定する唯一の既知方法はX−線結晶学である。結晶学によって満足に構 造が決定された生物分子の数は急速に増大しているが、全体の数は比較的小さい ままであって、それらの結合基質又はリガンド(配位子)と共に結晶の形で研究 されたものはさらに少ない数である。X−線結晶学によってうまく分析されてい る少ないリガンド−生物分子の組合せについて、その錯体が研究用に用いられた 結晶化の形態の場合よりも溶液において異なる立体配座の組合せで存在するか否 かの問題が依然として未解決である(証拠は主要な差がないことを示唆している けれども)。
従って、分子の三次元立体配座/形状の研究は近代の分子生物学および生物物理 学における核心問題の1′つであると思われる。余り遠くない未来における生物 高分子の三次元イメージングをかなり容易にすることができる干渉性X−線レー ザの導入という考えられる例外はあるものの、ここ数年の間に利用できる機器技 術に基本的進歩はなかった。また、高度に折りたたまれたタンパク質の構造のた めにタンパク質の非常に異なる部分からのアミノ酸側鎖がレセプター又は結合部 位に含まれることが早く発見されたので、タンパク質の直接配列決定法又は前駆 体DNA分子の配列決定法によるタンパク質配列決定法における最近の進歩も、 三次元構造の説明に余り貢献しなかった。抗体の生成についても同様に考えられ る。αヘリックス構造の開始、多分タンパク質におけるアミノ酸配列の知識に基 づいた最も単純なタンパク質の三次元構造の理解に1つの提案がつい最近された (Presta、L、G、;Rose、G、D、5cience 1988,2 40.1632参照)。
生物分子のX−線結晶構造を得る困難さおよび長時間を認識して、研究者達は分 子の立体化学結合に関する情報を得る別の方法(正確度は低いが)を追求した。
実験化学者のとったかかる方法の1つが基質のありそうな結合部位の解析のため の基本的な化学的原理の理解に応用された。所定のタンパク質に結合することが 知られている種々の配位子の化学検討を行ない、一般化された化学および立体化 学の原理に基づいて、化学者は基質/配位子のどの部分がタンパク質への結合に 関係するかについて経験をふまえての推測をした。これらの推測に基づいて、予 測した反応性部位を組み入れて新しい化合物が合成されてきた。必要なタンパク 質に対する新しい基質の結合親和力が測定されている。この経験的方法によって 、いくつかの合理的な測定が成功したけれども、成功よりも失敗の方がはるかに 多かった。この計画は合理的であるけれども、基本的に試行錯誤であって、必要 な結合親和力をもった新しい分野の発見又は設計への筋の通った方法に至らない 。
数年間に渡って生物分子の立体化学的相互作用の理解および新しい基質分子の開 発をさらに定量的な立場に置く試みがされた。これらの方法は、類似する基質分 子の構造差をそれらの観察される生物学的活性の差に系統的に関係づける試みを している。かくして、所定クラスの基質/配位子に対して「構造活性関係(SA R)Jがさがしもとめられる。これらの方法は現在ある程度までは定量化されて きたが、それらは「定量的構造活性関係(QSAR)と呼ばれている。一般に、 QSARの公式化でめられた関係は最も簡単なフォーマットで、要素の線形(− 次)の組合せで考える。従って、測定された生物学的値のVは、線形の組合せ: V=A+B+C+・・・・・・・・・として一連の用語、A、BSC,等によっ て説明されるようにめられる。QSAR法は、分配係数およびモル屈折率のよう なそれらの構造をある程度反映している分子の多くの尺度/性質に関係づけるた めに用いることができる。これまで、形状に対するこれらの直接の尺度は、形状 の直接の尺度を使用することが概念的および計算的に困難であるから、QSAR に使用されてきた。技術の進歩と共に、QSARの研究に用いられた構造差が主 な分子形状差になってきたので、「三次元の定量的構造活性関係(3D−QSA R)Jが発展した。
3D−QSAR法は選択した形状パラメーターを定量化して、それらの相関と生 物学的変数、例えば結合親和力との間に相関か見出されるか否かを試験する。
配位子とその受容体間の相関をモデル化することが極めて複雑な問題であること がわかった。形状のシンプルな概念を示すために定量的方法を見出すことが困難 であった。往々そういうことかあるが、人間の目および脳に視覚的に明白なこと を定量的又は数値的に記載することは複雑である。形状の記載は十分に難しいが 、いくらよくみても不適当である形状ディスクリブタを用いて形状の類似性をさ がすことは非常に難しいことが判明した。
QSAR法に用いられる一般的な方法は、大部分のタンパク質に対して既知の構 造差を有し異なる親和力をもってタンパク質に結合する多数の化学化合物又は基 質があることにたよっている。3D−QSAR法の論理的根拠は、種々の基質に 適用したときに異なる結合親和力を反映する形状ディスクリブタを得ることが可 能な筈であるということである。3D−QSAR法においては、他のQSAR法 におけるように類似の基本的仮定、すなわち、適切な生物学的パラメーター(一 般に結合親和力)は基質分子に対する種々の形状ディスクリブタの加重寄与の線 形組合せとして示すことができるという仮定をする。全系列の基質を一旦同一の 形状ディスクリブタで記載したら、形状ディスクリブタを比較又は相関づけるこ とおよび基質間の生物活性の差と関係することが知られている臨界形状デターミ ナント(determinant)を導き出せる筈である。
基質又は配位子の最も重要な形状要素の知識から、タンパク質上のレセプター部 位の重要な要素を推論することができる。理想的に、この方法において、形状デ ィスクリブタ間に変数を有する同じような少なくとも多くの比較のための基質が ある。従って、形状ディスクリブタの数と未知の重量係数と等しくさせる式の数 をもった式の体系が存在して正確に解くことができる。
未知の形状の性質を説明するのに有効な形状ディスクリブタを用いて、しかしな がら、実際に、仮定を単純にしても、ディスクリブタ変数の数は結合データがわ かっている有効な基質の数よりはるかに多いことがわかってきた。従って、正確 な答えを得るよりむしろ、近似統計法を用いて数値の形状ディスクリブタから観 察される生物活性と最高に関連した形状要素を導き出す必要があることがわかっ た。しかしながら、極(最近まで式よりも多い変数を多(含む式の系から有効な 情報を導き出せる方法を利用できなかった。
過去10年間の間にこの分野の研究が進歩した。基質−タンパク質の錯体の化学 分析から、観察される生物活性を与える分子相互作用が一般に非共有であること か知られている。従って、分子間の会合に重要な力は疎水性、ファン・デル・ワ ールス(立体の)、水素結合および静電相互作用から生じると考えられる。これ らの性質に基づいて形状ディスクリブタを作る試みが行われてきたが、残念なが ら莫大な数の自由度および大きく不安定なタンパク質−基質の錯体が錯体の形状 の数学的モデル化を極めて困難にさせている。基準および仮定をさらに単純化す る必要があることがわかった。
シモンら(Simon、et al)(Simon、Z;Badilenscu ;Racovrtan、T、J、Theor、Bjal、1977゜66.48 5およびSimon、Z、;Dragomir、N、;Planchithin 、M、G、;Ho1ban、S、;Glatt、H,;Kerek。
F、Eur、J、Med、Chem、1980.’15,521)およびホップ フィンガー(Hopf inger、A、J、J、Am、Chem、Soc、1 980.102.7196)によって別々に開発された分子形状法(Molec ular 5hape Approch)なる表題の方法は分子間の場所−依存 差よりもネットを比較している。すなわち、全分子の形状特性を計算して、特異 的表面特性の詳細を全体の分子尺度に没入させる。生物学的親和力の意味におい て系の最も活性な分子をタンパク質におけるレセプター部位に最適の適応を有す る鋳型分子であると考える。従って、基質分子系の間の活性差は、多重回帰分析 によって系の各構成員に対して規定できる3つの構造(又は形状)パラメーター と潜在的に関係する。その形状パラメーターは、最初は(1)共通の体積、(2 )最も活性な分子が占めるが、低活性の分子によって占められない体積、および (3)低活性の分子によフて占められるが、系の最も活性な分子によって占めら れる体積のいずれかであった。ホップフィンガーはこれらのパラメーターを共通 のオーバーラツプ立体体積と記載し、それらを相対的形状類似性の定量的尺度と 説明しhem、1983.26.990)は、分子のポテンシャル・エネルギー 場から導いた新しいセントの分子形状ディスクリブタを作った。この方法におい て、ホップフィンガーは分子のポテンシャル・エネルギー場を評価する手段とし て分子のメカエックス・ポテンシャルを次のように用いている。
この式において、分子Uの支えられた点(R,θ、φ)における分子のポテンシ ャル・エネルギー場 Pu(R,θ、φ)が規定される;式中のa (T)iおよびb (T)iはそ れぞれ単一の力の中心として処理される試験プローブと相互作用する分子Uの原 子iの引き付はポテンシャル・エネルギー係数および反発ポテンシャル・エネル ギー係数であり;Q およびQ (T)はそれぞれi番目の原紙および試験プロ ーブの電荷密度であり;ε (rl)は誘電用語であり、nは分子U内の原子の 数であり。
(r 、)は原子lと試験プローブ間の距離である。ホップフィンガーは、対の 場一差〔ΔPu)ディスクリブタは3D−QSARにおける生物学的パラメータ ーと関係することを示唆している。しかしながら、これは特異的場所依存形状デ ィスクリブタよりむしろ正味の形状ディスクリブタであると認められる。
策2の方法はクリッペンの距離幾何学的方法(Distance Geomet ry Methodof Cr1ppen)である(例えば、Ghose、A。
;Cr1ppen、G1. J、 Med。
Chem、1985.333を参照)。この方法において、ユーザーは特定の物 理化学的性質をもった基質/配位子の各々に「薬物運搬体(pharmacop hore)Jまたはポテンシャル・レセプタ結合原子のリストを提供しなければ ならない。その薬物運搬体の知識は与えられた系の基質分子の結合特性の化学的 研究から生じる。ユーザーは、「結合部位」、近くの薬物運搬体の原子と相互作 用をすることができるデカルト空間における1組の点、その原子の性質に依存す る引または反発の大きさも提供しなければならない。配位子の原子と結合部位間 の幾何学的に許容される相互作用を決定する。各配位子は、結合部位との相互作 用の部位点エネルギーの和を最小にする様式において自由に移動またはねしり変 形をすることができる。従って、クリッペンは再び相互作用の一次関数を仮定し 、特定の結合モードの結合エネルギーを次式で示した上式のE。は立体配座のエ ネルギーであり;c′ は二次方程式のプログラミングによって決定される係数 であり:l′ は部位1のタイプであり;n は部位ポケットの数を示し+ n  pは部位ポケットの相互作用と関係するパラメーターの数を示し;n はその 部位ポケットを占める原子の数を示し;P、はタイプtkの原J 子のj番目の物理化学パラメーターを示す。
得られた相互作用のエネルギーの和が実験的に観察された結合親和力に適当に近 いときに満足な3D−QSARが見出される。その結果はレセプター・マツプ( 結合部位の点の位置および性質)と、系の各構成員に対するその分子の活性立体 配座の両方を提供する。ホップフィンガーとクリッペンの方法の両方において、 解析をする前に分子の活性立体配座の選択に最初の経験をふまえた推測をしなけ ればならないこと、そしてクリッペンの方法はさらに3次元における実際のレセ プター部位マツプを仮定しなければならないことが認められる。
形状分析の定量的方法におけるもう一つの主問題は、溶液において殆んどの化合 物が迅速に相互平衡化する形状又はフンホーマーの混合体として存在することで ある。一般に、分子の多重立体配座のどれがその測定された生物学的親和性に関 与するのかさえも知られていない。再び、多くの分子立体配座のどれが3D−Q SAR分析に使用されるかを決定するために経験をふまえた推測をしなければな らない。多重立体配座の存在は正確な分子配向を選択して基質分子間の比較をす る仕事を複雑にする。形状の尺度の分子形状を比較する能力は、その形状の尺度 が最初に決定されるときに分子の正確な相対配向に依存することは明白である。
同じ分子は、それ自体を90c′まで回転して比較すると決して共通の構造的特 徴を示さない。従って、3D−QSAR法のいくつかはアラインメントの法則に 頼って、分子の可変又は異なる部分が形状の比較に最高に寄与させる。与えられ た分子に多重立体配座の存在かこの仕事を複雑にさせることは明らかである。
典型的に、3D−QSAR解析は結合親和性のような生物学的活性が既知である 比較的少ない分子に対して多くの形状依存パラメーターで始まる。これは、関係 (横列)よりも多い多くの未知数(縦列)をもった生物学的尺度に形状パラメー ターを関係つける一連の直線関係/式をもたらす。単純化し過ぎる仮定をする形 状ディスクリブタの限定する場合を除いて、最近までかかる一連の式を解く可能 な望みを与える統計的な回帰又は相関法は得られなかった。
発明の開示 本発明は、分子の形状とそれらの生物学的性質とを関連づけるために相互作用の グラフと統計的手法を用いた有効なコンピュータ法である。本発明の方法は、分 子の全ての領域の三次元形状特性の客観的および定量的尺度を提供し、同時に極 めて少ない限定仮定しか要しない新しい3D−QSAR法を利用する。分子の形 状の定量的記載は試験プローブで分子を構成する原子の立体および静電相互作用 の解析から得られる。分子を囲む三次元格子における全ての交差点で計算して得 られた相互作用エネルギーは、データ表における横列として分子の測定された生 物学的活性と共に入った定量的な形状ディスクリブタを形成する。
各分子の立体配座は、同一の測定された生物学的活性に関係した格子点エネルギ ーの横列として同様に記載される。実験的基準又は加重平均によって典型的に種 々の立体配座のボルツマン分布についてコンホーマーの選択をすることができる 。次に与えられた分子の立体配座を表わす相互作用エネルギーの横列を用いる。
得られた3D−QSARの表は典型的に格子点エネルギーの数千の縦列と研究す る系の分子の数に対応する横列の数を有する。
理論的に、分子間の形状差の全部の記載がこの表に含まれるが、これまでに表か ら有効な情報を引き出す統計的な手法は得られなかった。もし、結合部位につい て縦列の数を少なくする限定仮定をしない、又は特異的立体配座の特異的結合部 位についての知識が存在しないと、同一の生物学的パラメーター値を与える無限 数の係数セット(組)を計算することができる。1980年代の始めに、このタ イプの多変量問題を明確に解く統計的手法カモされた。この方法は部分最小二乗 解析(P L S)法と呼ばれる。 本発明のソフトウェアは、異なる4つの方 法を使用して三次元格子の分子を整列させる。それらは、(1)他のデータに基 づくユーザーの特定整列1 (2)フィツト・ルーチン(Fit routin e);(3)オリエント(Qrient) ・ルーチン:および(4)各種分子 間の原子の計算した場の差を最小にするフィールド・フィツト(Fileld  Fit)である。整列はフィールド・フィツト法でするのが望ましい。3D−Q SARの表を作って、CoMFAを改良したPLS法に従って分析する。3D− QSAR表の得られた答が、種々の格子位置の生物学的活性への相対的寄与を現 わす縦列用語の係数を与える。その答は3D−QSAR表の作製において計算し たものに類似の相互作用エネルギー値によって再表示されるから、そのプロセス を逆にし、ビデオ端末装置に生物学的活性の差に関係した分子形状の領域を示す 相互作用エネルギーのプロットを表示することができる。相互作用グラフ表示環 境において、本発明によりユーザーは分析の選択を変え、適当なタイム・フレー ムにおいて目の前のスクリーンに目立った生物学的活性に最重要な分子形状の領 域を見ることができる。パラータを変えるに伴い変化する表示を研究することに よって、ユーザーは分子の特定形状特性がその生物学的活性にいかに重要である かを理解することができる。
本発明の目的は、分子の形状と局部的な表面積の差に極めて敏感な形状ディスク リブタとを比較することである。さらに本発明の目的は、分子の生物学的活性に とって分子の形状の各種構成要素が重要であるという定量的評価をする方法を提 供することである。さらに本発明の目的は、ユーザーが基質/配位子として使用 される新しい分子を示唆又は確認できる構造、立体配座および統計的情報を提供 することである。最後に、本発明の目的は、分子間の相互作用のさらに十分な知 識を得るために形状の各種パラメーターを定量的な方法で研究することができる 相互作用のグラフを提供することである。
図面の簡単な説明 第1図はCo M F A法の模式的説明および概観図である。第2図はクロス 確認法の略図である。第3A図は立体CoMFA解法の三次元格子空間における 撒布図を示す。第3B図は第3A図に示した同一のCoMFA解法の三次元格子 空間における輪郭図を示す。第4A図は、分子のCo M F A解法に対する 三次元関係を見ることができるように分子を重ねた第3A図の撒布図である。第 4B図は、分子のCoMFA解法に対する三次元関係を見ることができるように 分子を重ねた第3B図の輪郭図である。第5図はCoMFAソフトウェアの標準 分子モデル化環境への統合の模式説明図である。第6図〜第9図は、本発明の主 な特徴の相互関係を示すプロセス・フローチャートである。
発明を実施するための最良の形態 本発明は、初期の3D−QSAR法の制限を解消し、受容体の結合部位のX−線 結晶学的知識なしにこれまで決して得られなかった分子の相互作用を洞察するこ とができる。実際に、X−線の結果が静止画像を提供する程度に、本発明は分子 間の動的相互作用に働く形状差のさらに詳細な知識を提供する。比較分子場法( Comparative Mo1ecular Field Approach  (CoMFA))は、観察される分子活性の差に関与する分を囲む分子場の差 を規定し、処理し、表示する発見的手法である。このCoMFAの記載は2つの 詳細な部分、すなわち、第1はプロセス全体の概説;第2は構成要素の原理的説 明を含む各構成要素および従来技術との差の記載にアレンジされる。
CoMFAの概説 同じ生物学的相互作用パラメーターが測定された一連の分子が一旦分析のために 選択されると、各分子の三次元構造が典型的にケンブリッジ結晶データベースか ら、又は標準分子モデル化法によって得られる。最初の分子の三次元構造が、格 子の交点に対する分子の各原子の位置関係がわかるように三次元格子内に配置さ れる。プローブ原子を選び、各格子の交点に順次配置し、プローブ原子と分子間 の立体および静電相互作用を全ての格子交点に対して計算する。これらの計算し たエネルギーがその分子と関係したコンホーマーデータ表の横列を形成する。
第1の分子のさらに別の立体配座に対する相互体用エネルギーは、同様に計算す る。各コンホーマーについて各横列の相互作用エネルギーを計算した後、コンホ ーマーをフィールド・フィツト法によって整列させて、そのコンホーマーと第1 のコンホーマー間の各格子点におけるエネルギー差を最小にさせる。次に各コン ホーマーに対するフィールド・フィツト相互作用エネルギー値を第1の分子のデ ータ表に入れる。第1の分子の全立体配座の相互作用エネルギーが計算されたら 、全立体配座の各格子点における相互作用エネルギーの平均値が、第1の分子の 測定した生物学的パラメーターと関係した3D−QSARデータ表における第1 の横列になる。
その系における全ての分子について同じ方法を続ける。特定の分子の立体配座に ついて平均した場の値を決定した後、整列分子の場の値に対する平均場の値の場 一致最小化が新しい分子を系の他の分子に整列させる。第1図の上部は3D−Q SAR表がいかに作られるかを図解によって示す。各格子交点に対して、格子点 に配置された試験プローブ原子との立体又は静電相互作用エネルギーをその点に 関係した適当な立体又は静電欄に入れる。それらの交差点を引き続いて数えて、 対応する欄を立体(S)又は静電(E)欄として同定する。
その系の分子全てについてのデータ(相互作用エネルギーおよび測定した生物学 的活性)を3D−QSARデータ表に一旦入れたら、クロス確認法を含む部分最 小二乗(P L S)解析を行う。各格子の位置に対する相互作用エネルギーお よび生物学的値を用いて、本質的にPLSは式よりも多い未知数で一連の式を解 く。
第1図の下部に示すように、得られた解答は一連の係数であって、各欄の1つ、 その値(エネルギー単位)はその格子位置における相互作用エネルギーの測定さ れた生物学的パラメーターにおける差への寄与を反映する。
その解答は多くの用語を有するが、用語と格子点間の1・1の対応によってその 解答を相互作用の色分けした三次元画像として示し、第1図の上部に視覚的に類 似のグラフの形で(第3A図の点の色は対応する用語の程度(大きさ)を意味す る、又は輪郭の形態で要約した用語の値で(第3B図参照)示す。グラフの表示 は分子空間における領域を示し、3D−QSARが測定された生物学的パラメー ターの変化と共に分子の場の値の変化と強く関係する。
分子の力の場 前述のように、生物化学者および生物物理学者は、分子間の相互作用か主に形状 相補性に依存して極めて立体特異的であること、そして生物分子がそれらが結合 するごとに三次元ジグソーパズルを解くと信しるようになった。しかしながら、 前に挙げた従来技術の3D−QSARの形状ディスクリブタは形状全体の正味の 目安(尺度)のみを与えて、分子間の局部的位相幾何学的差を全体的に平均化す る。これらの方法は実際には総計の指数であって、「形状」を同じ程度のみに記 載する、例えば、2つの彫像の比較「形状」がそれらの示差重量又は体積を測定 することによって記載される。同様に、ボールおよびスティックの分子モデルは 延在する分子軌道の立体相互作用や電荷に関係した相互作用を反映しない。 分 子の形状を記載するために、ディスクリブタは少な(とも次の3つの分子パラメ ーターに敏感でなければならない:第1は、それは分子内の各原子の真の立体容 積を説明しなければならない、第2に、それは分子内の各原子の静電相互作用を 説明しなければならない;そして第3に、それは分子の各局部的位相幾何学的特 徴を反映するために十分繊細な尺度でなければならない。CoMFAに用いられ る方法は、分子の立体および静電相互作用の適当なサンプリングが考えられる形 状依存受容体相互作用についての疑問点の大部分に十分答えることである。分子 を囲む格子点における相互作用エネルギーの計算そのものは新しいものではない 。
他の人々はこの方法を分子形状の尺度として使用する試みをしている。例えば、 グツドフォード(Goodford)は本発明で計算されたものに類似のプロー ブ−相互作用「格子」の使用を記載している(Goodford、P、J、 J 、Med、、Chem、1985,28,849参照)。
理論的に、全ての格子点から得られる相互作用エネルギー・データの横列は分子 が三次元の受容体にいかに向いているかを記載する情報の大部分を含む。しかし ながら、本発明の前に、これら横列のデータよって示される異なる分子の形状を 比較する方法或いは分子の会合に重要な形状差に関する有用な情報を導出して視 覚化する方法を誰れも発見しなかった。 分子の形状を本庄によって記載する解 像度又は精密さは次の3つの要素に左右される。(1)試験プローブ原子の立体 サイズ、(2)試験プローブ原子の電荷、および(3)格子間隔。本発明により 、ユーザーは試験プローブの立体サイズと電荷の両方を特定することができる。
さらに、プローブのパラメーターは格子の場所によって変わる。ユーザーは格子 の間隔を選択することもできる。典型的に、プローブ原子のサイズは共有結合の 水素−Hか−)Sp 炭素、Sp3酸素、二価の硫黄まで異なる。用いられるプ ロ−ブの電荷は典型的に+1.0および0.0であり、一方格子間隔は1.0〜 4゜0オングストロームがしばしば用いられる。
立体の計算には一般にファンデル・ワールスの半径が用いられ、原子の電荷は原 子座標の知識から計算することができる。従って、立体相互作用エネルギーは次 のように計算される。
ここてNIlは生物分子内の原子数、riは生物分子内の1番目の原子とプロー ブ原子間の距離、モしてA とB、はそれぞれプローブ原子タイプおよび生物分 子内のi番目の原子のタイプに特有の定数である〔他の値は指数12の代りにユ ーザーによってオプションとして選ぶことができる〕。静電相互作用エネルギー は次のように計算される。
ここでNatおよびriは立体相互作用エネルギーの場合と同一である、Qはプ ローブ原子の電荷、モしてq、はi番目の原子の電荷である。q、はガスタイガ ー! 1 およびマルシイリイの方法によって計算することができる(Gasteiger 。
J、;Mars i 1 i、M、Te t rahedron、1980,3 6.3219参照)。ユーザーはオプションとして指数2を省略することができ る。プローブ原子は全ての格子点に順次配置されるから、分子内の格子点に対す 、る立体反発値は莫大になる。どれだけの原子容が重なって存在するかを評価す ることを除いて絶対値に意味がないから、プローブ原子が「カットオフ」値(典 型的に30Kca11モル)より大きい立体反発を経験するときはいつでも、立 体相互作用はそのカットオフ値に設定され、静電相互作用は同一場所における他 の分子の静電相互作用の平均に設定される。これらのカットオフ値は本発明のユ ーザーによって選択することもできる。位相幾何学的情報が失われないことは明 白である。
分子間の距離やねじれ角度のような分子モデルから計算できる性質は全て3D− QSAR表に追加縦列になることを認識する必要がある。縦列は、他の配向平均 化分子性質(log Pや生成熱)の値、他の縦列の関数として規定されたデー タ、又はユーザーによって提供される慣習法を介して計算されるデータさえも含 みつる。さらに、測定された生物学的活性は分子の受容体部位に至る並びに受容 体に結合する能力の両方の結果であるから、分子の拡散を反映するさらに別の用 語(縦列)も入れることができる。本発明の方法によって縦列のデータの統計的 および視覚相関は相互作用エネルギー形状ディスクリブタに限定されるものでは ない。
実際に、本発明の最も重要で有力な特徴は、X−線の結果は解答における動的相 互作用の全く方向を決定しない静止画像を提供するから、CoMFA法はX−線 結晶学的研究から得られない情報も与えることである。比べると、相互作用のC oMFAモデルは現象学的である。実際に測定された活性は決定できる量によっ て示される。本発明は測定された生物学的パラメーターの全縦列に含まれるデー タ(形状および他の関連情報)への依存性を示す。
本発明の開発のために、格子内に分子の位置決めは全てトリポス・アソシエイツ (Tripos As5ociates)社の5YBYLソフトウエア・プログ ラムで行った。しかしながら、機能的に同等で本発明に併用できる入手可能な2 .3の他のプログラムがある。例えば、次のものがある:Cbtmx : 英国 オツクフオードに在るケミラル・デザイン社製In+ight 米国カリフォル ニア州すンディエゴに在るパイロシム・チクノロシーズ(BioS7m Tec hnologie+)製Qoznta 米国マサチュウセッッ州つォルサムに在 るポリジエン(Po17geΩ)製Cheml+b 米国カリフォルニア州すン リアントロに在るモレキュラ・デザイン(Mol+culu Dt+1gn1社 製Mic+oModel コロンビア大学のクラーク・ステイル教授作製かかる ホスト・ソフトウェア・プログラムは、分子モデルの作製および貯蔵(原子座標 の修正)に加えて原子電荷の計算(電静場の計算用)および原子のタイプによる 立体パラメーターの表作成(立体場の計算用)を支えなければならない。
整列およびフィールド・フィツト(場面合)CoMFA法は、形状の相互作用エ ネルギー・ディスクリブタを比較し、形状の変化を測定した生物学的活性の差に 関係づけることによって働く。形状ディスクリブタは各格子点で計算されるから 、ちょうど1つの格子点までオフセットした同一分子について計算した格子部位 −特異的相互作用エネルギーは著しく異なることになる。このデータのCoMF A解析は少しもない形状差を示す。従って、相対的相互作用エネルギーは格子内 の相対的分子位置に強(依存するから、分子モデルの固定格子内での位置決めは CoMFA法において断熱最重要人力インプットである。
本発明の場面合の特徴は、分子を原子座標の差よりもむしろそれらの場の差を最 小にするように整列させる。相互作用エネルギーは分子の形状を反映するから、 それらは形状整列のために定量的に操作することができる。これは、分子間の比 較がこれらの同一エネルギー場に基づいているから特に適切な方法である。
場面合において分子は全て基準分子として使用される。しかしながら、同一分子 の適合立体配座の場合、他の理由から多分最活性の配座異性体にすべき立体配座 は一般に比較基準として使用される。場が最終組の試験分子に適合するとき、最 高の生物学的活性をもった分子は一般に基準分子として使用される。場面合整列 において、新しい分子と基準分子又は組の分子間の全格子点に渡って平均された 立体および静電相互作用エネルギーの和の二乗平均平方根(RMS)差が、6の 剛体自由度、ユーザー特定ねじり角度および内部形状の変化に関して最小にされ る。ユーザーは、場面合の前に彼が他の理由から与えられた分子系列又は立体配 座の整列に特に重要であると考えるこれら格子位置の補正のオプションを有する 補正係数を使用した場面合整列又は試験整列の結果は表示して、全てのグラフ出 力について後述するものと同し方法で三次元のバラツキ又は形状プロットとして 視覚的に比較する。
第1図の3D−QSAR表を参照して、分子2の分子1への場面合は、分子2の 位置および/またはねしれ角度を考えることによって表の第1および第2の横列 の第1の縦列における値開の二乗差の和の最小化に対応する。また、場面合は、 満足な結果のために格子境界を越えた立体反発作用および、ねじれ角度が変わる とき、同じ力の場を用いて計算した従来の分子力学内部エネルギーを必要とする 。
その境界の立体反発作用の理由は次の通りである。最小化の作用は、形が火山の 横断面に類似するものとして視覚化することができる。立体境界反発作用は、最 小化でめられる解答がクレータ−であるので必要である。しかし分子がそもそも 全熱整列(又は場に適合)しない場合には、下り斜面(最小化)方向は火山の外 側を下る、すなわち場における差の最小化は分子を引き離す。立体反発作用を格 子領域の縁部に配置することによって、火山の外側に沿った下り斜面方向は嫌わ れる。
また、場面合は使用者に3つの異なる寄与の相対的補正を最小化される関数へ向 けさせる(すなわち、ねじれ結合および他の内部形状が変わる際の場の差自体、 縁部の立体反発作用および異なる内部エネルギー)。補正の選択は本発明を実行 するソフトウェア・プログラムにおける使用者のオプションである。相互作用グ ラフ環境において分子整列について種々の補正選択の三次元結果を見る場面合能 はそれ自体3D−QSARの重要な進歩である。最小化は、個々の原子が最初0 ゜2Å以下移動するようなステップ・サイズで単体法によって行われる。単体法 は、最小化される関数が解析導関数をもたないから望ましい。連続関数評価が1 %以下で変わるとき収斂が生じる。最小化の場合として、最終の形状が出発の形 状に極めて類似することが期待されると場面合は最高の整列を見出す。
本発明を実施するC o M F Aのソフトウェア・プログラムは標準の適合 および配向ルーチンのような他の整列法に従うことができる。例えば、適合は内 部形状の緩和又は緩和なしに使用者の特定した組の咳原子の最小二乗重ね合せを 利用するが、配向は3個の使用者特定原子をとって、第1の原子を原点に配置し 、第2の原子をX軸に沿って配!し、第3の原子をX2面に配置する。使用者は 経験をふまえた推測又は他の3D−QSARデータに基づいて試行錯誤を試みる 。場面合は、いくつかの他の整列法に基っ(CoMFA法が低く過ぎるクロス確 認したr2を得たとき特に有用である。極めて大きな残差をもった化合物の場面 合は、CoMFA法を反復するときに改善をもたらす新しい整列を与える筈であ る。CoMFA−QSAR法に用いられる配座異性体は、CoMFA解析の前又 はC。
MFA解析中にこれらの整列法によって整列される。
場面合法は、また場の差を最小によるより最大にするために用いるとき重要な用 途をもつ。2つの形状相補分子の相互作用エネルギーの差が最高にされると、場 面合は2つの分子間に最高の三次元整列又は「ドツキング」を与える。従って、 基質と酵素(又は抗原および抗体)の両方の構造が既知の場合には、フィールド ・フィツトはそれらの最適整列を見出すことができる。
立体配座の選択 従来技術の3D−QSAR法における主な未解決の問題は、解析に使用される適 当な分子の立体配座の決定である。生物活性に関与する実際の活性立体配座の直 接的知識が欠けていたため、これまで唯一っの方法は経験をふまえた推測をする ことであった。フィールド・フィツトを用いたCoMFA法によって立体配座選 択の定量的方法ができる。CoMFAのソフトウェア・プログラムを使用して別 のデータ表に配座毎との相互作用エネルギーを入れて、それを選択した鋳型配座 異性体に適合させることができる。種々の平均化又は補正案を使用者のオプショ ンとして用いて最も代表的な配座異性体を決定することができる。種々の立体配 座の相互作用エネルギーは、多分低い活性形態からの寄与を全く排除することな く最活性である立体配座の可能性について適当な仮定に基づいて補正することが できる。それとは別に、大部分の立体配座は常温で自由の水溶液中で平衡化され ていると考えられるから、CoMFAのプログラムは配座異性体のエネルギーに ついてボルツマン分布を反映する補正をすることができる。極めて不安定な分子 の場合のみ(多重ロトマーおよび互変性体を有するもの)、ボルツマン分布がフ ァジィ、平均化された無意味のボールを生成する。フィールド・フィツトと共に Co M F A法はこれらの補正関数を用いて受容体部位が見るのに最も適し た分子の形態を決定する能力を与える。
PLS (部分最小2乗法)解析 前記のように、横列よりも多くの縦列をもった3D−QSARの表の固有の不完 全に決定された性質は、これまで数千の格子点において計算された相互作用エネ ルギーの形状ディスクリブタとしての使用を禁じた解決できない問題を提起した 。データ表の値は式より多くの未知数をもった式の体系として見ることができる 。例えば、3個の分子に対して次の3つの式を書くことができる。
Value、 嘩b’ + A、、S’(0011+A、s’(■2)+ 、、 、、AJ’(”) ” ’w+ E’ +001+”−E f(0021” 9 1.輌”Q’Q Valua、 −bl + 〜、S’((Xlll +A、、5’+0021+ 、、、、A、、5i(N) + a、、E’(001)+4d’(002)+、 、、、a、E’(N)上式の値は各分子について測定された生物学的活性である ;bxは分子Xに対する各式の切片;A−およびa−は立体および静電用語の係 数であって各空間場所の相対的寄与を反映する、下付き記号は異なる係数値と誤 値が関係する格子位置の両方を示す、5x(N)およびEx(N)は分子Xに対 して格子位置N(Nは1から格子の交差点の最大数に及ぶ)で計算し立体および 静電相互作用エネルギーである。 多重量解析の部分最小二乗(P L S)法 は、非依存(独立)マトリックスと依存可変マトリックス間の共有属性を最高に させる各回転において、前記両マトリックスの超空間での一連の直交回転によっ てこの明らかに不完全な系の式を解く。これに対して、古典的な最小2乗回帰は 独立の可変縦列を一緒ではなくて個々にかつ独立して回転させる、従って評価さ れた各係数の自由度を消費する。I’LSによって見出される式の解は一連の係 数値である。PLSは、2つのベクトル−マトリックスの掛は算のみを含むから CoMFA法には特に魅力的であり、生データの計算を行うことができ、そして より小さなコンピュータで大きな問題を解くことができる。
CoMFA用いるPLSの重要な改良か得られて、最初のPLSの解が元のダー ク・スペースに回転バックされ、それによって元のメートル法スペース(この場 合にはエネルギー値)に換算した解として得られた項の係数を再表示する。この 解はデータ表の各縦列に潜在的に零でない係数を含むから(実際に各格子点に2 )、それは、空間の既知場所で数値に関係した正に他の表現のように、三次元空 間に表示されかつ形状化することができる。
巡回クロス確認法はPLSによる解を見出すのに欠かせない。クロス確認法は、 モデルがデータにいかに良く適合するかではなくていかにデータを予示(予知) するかによってモデルを評価する。多くの場合に有用であるが、クロス確認は不 十分に決定されたCoMFA、3D−QSAR表の確認に重要である。PLSの 解の信頼性の統計的尺度は従来の r2の定義に類似のクロス確認した(又は予報値)r2を次のように定義するこ とによって計算される: 5D−PRESS クロス確認 r2=□ SD ここでSDは全ての分子について各生物学的パラ−ターの平均からの偏差の2乗 の和であり、PRESS (P+edicttiy!sow of 5quus 、予測値の2乗和)は全ての分子について実際と予測した生物学的活性パラ−タ ー間の差の2乗和である。
負のクロス確認r2は、PRESSがSDより大きいときは常に生じる、すなわ ち生物学的パラメーターは考慮下の解よるよりも全ての測定値によって評価する 方がよい。 クロス確認法はPLSと次のように統合される。最初に、3D−Q SARデータ表全体をPLSおよび超空間で開方された1つの成分によって解析 される。この成分の超空間における全ての直交面への射影は全ての面上にめられ た式の係数である成分を与える。次に除去された不規則に選択した分子(横列) でそのPLS解析をくり返す(式の係数を再誘導)。得られた係数を使用して除 外した分子(横列)の生物学的値を計算し、新しいr2を計算する。(実際の実 施において、ソフトウェア・プログラムは分子の値のランダム部分集合の除外お よび除外した生物学的値の計算もできる。これは第1の係数の計算に必要な時間 を減じる。この省略、再誘導および予測法は、全ての生物学的パラメーター値が 誘導から除去された一組の係数によって予測されるまで反復される。第2図はこ のクロス確認法の概要を示す。除外した分子の生物学的活性を予測するだに除外 した横列なしにPLSによって誘導された解の係数が式における除外した横列か ら相互作用エネルギー値と共に使用されるかが見られる。
r2とPRESSの値が各クロス確認サイクルに対して計算さる。それらのデー タ間に相関がない場合には、得られた係数は有意義な予測値を与えず、PRES SはSDを越えない。r2値は開方から得られる成分がいかに良いかを示す。
次に、既に得られた第1の成分の寄与がマトリックスの超空間から除外され、第 2のPLS解析を行い、そしてさらに別の成分の開方をする。別のクロス確認ラ ウンドを完了し、再び省略、再誘導および予測サイクルを完了する。使用者は開 方クロス確認法を反復する回数を特定する。開方された成分を加え、データ・ス ペースに循環バックし、結果の係数か生じる。
データ表のPLS/クロス確認解析の結果は、−組の係数(データ表の各縦列に 対するもの)であって、それらは、測定された生物学的値に対して縦列の値に関 数する一次式に用いたとき、サンプリングした格子点の各点でデータ・セットに おける分子間のエネルギー場の差によって観察された生物学的性質を最良に予測 する。
グラフ表示 CoMFA法の最終工程は生化学研究者に有意義な方法で解析結果の表示である 。一般に、人間の目と脳は数値表内よりも画像内の複雑なパターンの認識に著し く熟練している。CoMFAの出力は、入力データの三次元がずっと保持される からグラフ表示にこの固有の利点をユニークに利用することができる。確かに、 CoMFAを用いる化学者は視覚的に最も適したクラスの科学者の人達である。
従って、その力に加えて、CoMFAは、またその入力要件(分子モデル)、お よびその出力(分散プロットおよび形状マツプ)の両方において他の3D−QS ARよりも著しくグラフ的に適合している。文字通り、最終の使用者が関係する 必要のある唯一の数字はクロス確認のr2でって、Co M F A解析の図形 のメリットである。
CoMFA 3D−QSAR法の構成される仕方のために、すなわち、生物学的 活性の差を形状差に関係つける試みとして、試験分子間の共通形状領域は解に強 く寄与しないということが明白である。同様に、形状差の全ての領域が解の大き な寄与に反映するのではなくて、生物学的差に最も強く関係した形状差の領域の みを反映する。本発明の重要な成果は3D−QSARの相互作用エネルギーデー タ表の解が分子形状の定量的比較をすることである。また、PLSの解をデータ ・セットに巡回バックしたので、決定された係数はデータ値と同じ単位を有し、 従って各項は誘導された同一単位における機能性への寄与、すなわち相互作用エ ネルギーを示す。一般に、係数か大きくなる程、その関係する空間位置は観察さ れる生物学的差により強く関係する。係数の符号は生物学的差に及ぼす変化の効 果の効果の符号である。
さらに、解における項は、三次元空間(格子座標)における位置とユニークに関 係する。従って、項の値の三次元におけるグラフ・プロットは分子の機能性の変 化の予測に最も関与する空間における領域の表示をする。
比較および研究のために、各項(用語)の代表的な2.3の値を各点について示 すことができる: (1)縦列の値の標準偏差X3D−QSAR係数; (2)3D−QSAR係数 のみ; (3)縦列の標準偏差のみ: (4)1つの分子についての縦列の値 (5)分子についての縦列の値X3D−QSAR係数;又は(6)外部ファイル からのデータ。
立体および静電用語の値は別々に又は組合せて表示される。
グラフ表示の2つの方法が利用される。最初の方法は、用語は各格子点における エネルギー場変化と生物学的活性間の会合の大きさおよび符号を表わすためコー ド化した三次元撒布図のカラーとして表わすことができる。従って、第3A図に おいて、青色点は分子のサイズの近接増加が分子の結合を増すことを示す解の係 数値を表わすが、黄色領域は分子サイズの近接増加が分子の結合を減じることを 示す。最初は分子を格子に配置するために使用した分子のモデル化プログラムは 、データ・セットからの分子の1つを三次元ディスプレイ−上にスーパーインポ ーズするために使用されるので、重要なカラー領域なカラー領域を第4A図に示 すように特定の原子位置で容易に確認することができる。
情報を見る第2の方法は、形状を空間にプロットすることである。等高線が類似 の値を有する格子空間の点を接続する。等高線は空間を囲む多面体を形成する( それらの値は使用者が選んだカットオフ値よりも高いか低いかである)。各マツ プにおけるカラー化多面体は全ての格子点を囲み、CoMFAがフィールド値の 変化と生物学的バラ−ターの差とを強く関係させる。第3B図はそれだけで等高 線図を示すが、第4B図はデータ・セットからの分子スーパーインポーズして研 究および比較する等高線図を示す。
これらのディスプレーは、使用者に増加した立体容積又は1つの領域における増 大した静電相互作用が生物学的親和性に大いに関係することを示す。逆に言えば 、立体容積の増加又は静電相互作用の増加が生物学的親和性を妨げる領域のある ことを示す。 CoMFAの地図は、生物学的機能に著しく関係する分子の形状 の三次元表示としてのみならず、受容体空間の地図として見ることができる。
この観点において、高い相互作用領域は受容体の立体特異的配向要件を反映する 。
立体用語の地図は受容体部位の立体要件を示し、静電用語の地図は受容体部位の 静電要件を示す。他の手段によって得られた受容体の化学的知識と組み合せたと き、この情報は受容体部位の性質への興味ある断定的洞察に導く。この方法は、 3D−QSARを決定する前に受容体部位における原子の特異的位置に関する推 測を必要としない距離の幾何学的方法のような従来の技術と明らかに異なる。C oMFAでは、受容体に関する立体特異的および静電特異的情報は3D−QSA Rから得られる。受容体地図として等高線係数図を過剰解釈することは注意しな ければならない。化合物よりも多くの係数を何回も評価しなければならない。C o M F Aに用いるような極めて不完全に決定された系において、データ・ セットに対して多数の3D−QSARの解が所定組の化合物およびデータと等し く一致して存在しうる。これはPLS/クロス確認法によって見出される解又は 予測能力を減じないが、受容体部位地図として最終地図を解釈するのに何らかの 注意を要することを示唆する。
最終に、CoMFA地図は、空間特異的情報をさらに十分に認識するために、回 転して必要な角度から見る。
予 測 能 従来の技術に比べて本発明によって得られた著しい進歩は、最初のデータ・セッ トに含まれなかった分子の考えられる生物学的挙動を定量的に予測する能力であ る。分子間の会合を記載するため3D−QSARを開発させる主なカは、かがる 理解によって現在知られているよりもはるかに高い生物学的親和性をもった分子 を設計できることである。この能力の1つの用途は新規でさらに強力がっ選択的 薬物の設計である。従来の技術において、改良された分子構造に関する示唆がQ SAR解析の結果に基づいて行われる程度に、必要な変化が得られたが否かを知 る前に示唆さた分子を合成してそれを関連する生物系で試験する必要であった。
比較すると、本発明はCoMFAモデルの解に対して提案された分子の改良の試 験を直ちにすることができる。従って、CoMFAによって示された生物学的活 性に重要である空間領域に基づいて、新しい分子構成を提案することができる。
提案された分子は格子構造に配置、整列させ、その相互作用エネルギーを計算し 、それらのエネルギーを元のデータ表から得た係数を使用して3D−QSARの 式%式% 提案された分子の計算した相互作用エネルギーは表示して最初のCoMFAの空 間地図と比較することもできる。得られたディスプレー上に分子の設計において 作られた変化がCoMFAから予測されたものと同一の高相互作用エネルギー項 および空間領域と関連するかどうかを直ちに見ることができる。CoMFA法は 、分子が合成され試験された場合或いはCoMFA解析を行ったときに未知であ った場合に提案された分子の生物学的値を高精度で予測することがわかった。
従って、本発明は未合成分子の構成を研究してそれらの考えられる生物学的活性 を定量的に決定する方法を提供す。医化学および生化学の全ての面に対するこの 能力の重要性は決して過評価することができない。
さらに、CoMFA法は形状が相互作用エネルギーによって記載されている分子 のデータ・ベースから必要な構造をもった分子の検索をすることができる。確か に、与えられた生物系において決して試験されなかった思いも寄らない分子が相 互作用に適当な形状を有する或いは既知の分子より良いことがわかっている。
CoMFA法の結果は、使用を分子の相互作用に含まれる実際の配座異性体の決 定に向けさせることもてきる。前述のように、最終のディスプレーは生物学的活 性の差と最も強く関連する空間容積を同定する。使用者は分子の立配配座を3D −QSAR表の作製に使用されるスティック・モデルとして又は相互作用エネル ギーの形で解のディスプレー上に重ねてその立体配座の形状を臨界空間容積と比 較する。
その解は全ての立体配座を含む表から得られるから、なんらかの相関があるに相 違ない。しかしながら、解の空間の要件に最も適合するようになる立体配座はも う1つの3O−QSAR表の作製における主な立体配座として使用することがで きる。新しい表の解用の予測r2が第1の解より高い場合には、選んだ立体配座 は活性の立体配座であるようである。この方法は使用者が必要と感じるまで何回 もくり返すことができる。
薬剤の設計の試行錯誤法を実質的に少なくして時間、エネルギーおよびお金を節 約することが本発明でできる。CoMFA法の大規模使用は救命薬剤のより迅速 な開発ももたらす筈である。前述のように、CoMFA法は、抗原抗体結合の研 究および遺伝子的に変えられた酵素の受容体部位の変化のような別のタイプの分 子間会合も使用することができる。必要なことは、酵素のX−線結晶構造のよう な包含される分子の環境の知識および置換されたアミノ酸がそのX−線結合構造 にいかに合致するかの知識である。基質−酵素の結合親和性に関する本発明の議 論は、すぐに理解されて、本発明に開示された方法の大部分を限定しないから、 CoMFA法の有用性を示すものと理解すべきである。確かに、作製された空間 地図は、本庄の完全導入が未だ完全に実現されていないと考えられている分子間 の会合の研究に極めて強力な手段である。
CoMFAの利用 本発明は、現在使用されているいくつかの分子モデル化集合体の1つと共に利用 することを意図している。これらの集合体(+nyi+onme++++j は 種々のハードウェアおよび表示性能並びに利用できる種々のソフトウェアの特徴 を有する。しかしながら、典型的に、エバンス(Evani)およびサウザーラ ンド・シリーズ(Southe+1and 5uiu) 300なる分子モデル 化ユニットに見られるものに相当する計算および表示機能が本発明の実施に最も 有効である。
第6図〜第9図は本発明のCoMFA法を開示するソフトウェア流れ図である。
本発明者はCoMFAの特異的ソフトウェア・コードの6セクシヨン、すなわち FFIT、C,EVAL、C,PLS、FOR,MAP、C,Q3DEF、C。
およびDABDEF、Cを使用する。第5図は6つのCoMFA特異的ソフトウ ェア・プログラムが標準の分子モデル化集合体にいかに組み込まれるかを模式的 に示す。FFIT、C,EVAL、C,PLSおよびMAP、Ci!プロゲラム チあるが、Q3DEF、CはCo M F Aプログラムがめる全データのデー タ記載であり、DABDEF、Cは数の表を処理するソフトウェアに対する全体 的なデータ構造を含む。前述のように、2.3のプログラムは市販されている。
対象の分子およびそれらの配座異性体を三次元の格子空間に作るために使用する ことができる(本発明者はトリポス・アソシエーツ(Tripos As5oc iates)社のプログラム5YBYLを使用したけれども)。同様に、本発明 はトリポス・アソシエーツ社のプログラムDABYLを数の表を処理するために 使用したが、機能的に同等のソフトウェアはマサチュセツッ州ケンブリッジに在 るBBNソフトウェア社からのR3/1を含む。
本発明の方法は、使用者による入力のオプション/パラメーターの選択を与える 。その入力オプション/パラメーターのデータ構造はQ3DEF、Cに特定され ている。一方DABDEF、Cはデータ処理プログラムのデータ構造を特定する 。EVAL、Cは、分子モデル化プログラムによって提供される情報および生物 学的バラ−ターから3D−QSAR表を作る。FFIT、C,は分子、試験され るシリーズの配座異性体又は分子を適切に整列させるためにフィールド・フィツ ト(場面合)の整列操作を行う。PLSは、EVAL、Cによって作られた3D −QSAR表の部分最小2乗解析を行う。最後に、MAP、Cはグラフ出力に対 する空間地図を作る。CoMFA法の出力地図に分子構造を重ね合わせる必要が あるときには、標準分子モデル化プログラムを使用してそれを行うことができC oMFAのソフトウェア・プログラムは、使用者にCo M F Aの発明の効 能を完全に利用するための多数のオプションを与える。オプションの完全リスト を(1)計算は、完了時使用者の通知で「相互作用」モード−ターミナルで監視 された進行、または「バッチ」で別々に行われる。
(2)格子点のウェイティングはQSAR係数によって、または使用者の特定し た加重調整による。
(3)立体成分および静電成分は別々に処理または一緒に合計される。
(4)全部の移動/回転が含まれる、または除外される。
(5)ねじり回転が含まれる(その場合には、いずれかを特定する)または除外 される。
(6)施行移動において、分子をどの位移動させるのか?(7)収斂の規準−フ ィールド・フィツトを考慮する前に、連続工程において幾何学的変化をどの位小 さくさせるのか?(8)収斂の発生とは無関係に、フィールド・フィツトをやめ る前の工程の最高数。
(9)鋳型(ターゲット)フィールドは単一分子(配座異性体)または−緒に平 均した数分子からのものである。
(10)1以上の相互作用モードにおいて、各10工程後に中間結果を表示すべ きか? (11)相互作用モードおよび中間結果の表示において、使用者は各表示後に継 続するか否かをめられるのか? (12)これは普通のティールド・フィツトか或いは「ドツキング」フィールド ・フィツトか? (その場合の目的は鋳型フィールドを補足するものにフィールド・フィッティン グさせることによって差を最大にさせることである)。
(13)フィールド・フィツトの結果をセーブするのにはどうするのが?そのオ プションは何もしない、外部ファイルに書<、データヘース分子を交換すること である。
EVAL、Cにおいて: (1)分子の配座異性体について行われる整列の種類。オプションはなし、FI T、0RIENT、フィールド・フィツトである。
(2)整列の結果をデータヘースに戻して記憶させるのか?(3)エネルギーは スムーズであるか(その場合格子点におけるQSAR表の値は、その点の周囲に 一様に間隔を置いて並べられた実際の値と他の9つの値の平均である)? (4)プローブ原子の基本要素/混成状態(その立体又はファンデルワールス特 性を制御する)。
(5)プローブ原子の電荷(その静電作用を制御する)。
(6)ファンデルワールス・パラメーターを評価する方法(標準の5YBYL法 又は5col+/5che+xgaによって計算)(7)反発ファンデルワール ス指数値(通常12)。
(8)静電指数(通常2.1/r誘電体に相当)。
(9)3D−QSAR表に記録される最大立体値(通常30kc/m)。
(10)立体配座の平均として分子を示すときに考える最高エネルギーの立体配 座(過度の高エネルギー配座異性体は形状全体への寄与を無視できるほど小さく する)。
(11)QSAR表のANY化合物が最大立体値に寄与する場合、3D−QSA R表の縦振を除外するのか? (12)除外した3D−QSAR縦欄の縦振点を末端に挙げるのか(それは、全 ての化合物はその格子点で最大立体値を有するので、表の縦振に沿った値に差が ない時にはいつでも生じる)? PLS、FORI:おいて (1)クロス確認を行うのか?その場合には、クロス確認グループの数。
(2)ブートストラッピングをするのか?その場には、ブートストラッピング試 行の数。
(3)開方する成分の数。
(4)個々の縦振のデータを自動的に判断するのか(値の平均が0.0および標 準偏差が00であるように判断)?(この特殊な操作はCo M F Aでは推 薦されないが、PLSと併用する一般的操作として含まれる)。
(5)縦振の相対的加重調整はあるのか’i’ (log Pのような他の性質 を含むときは、多数のフィールド・ディスクリブタ縦欄と競うためにそれらに余 分の加重を与える必要がある。) (6)収斂規準、特にPLS自体内に使用されるイプシロン、繰返し数(PLS のラウンドか得られるイプシロン以下の差によるよりも超過する繰返し数によっ て終わる場合には、警告メツセージをプリントする)。
MAP、Cにおいて (1)プロット、輪郭を描く又は列挙する3Dのデータの源は何にか?それらの オプションは1)縦振の標準偏差XQSAR係数、2)縦振の標準偏差のみ、3 )QSAR係数のみ、4)個々の化合物に対する縦振の値、5)個々の化合物に 対する縦振の値XQSAR係数、6)外部ファイル。
(2)3Dのデータのどのアスペクトをプロット又は輪郭を描くのか?それらの 選択はそれぞれの表示領域における立体、静電又は立体と静電面の両方である。
以上、CoMFA法を特定の用途を参照して議論したが、本性の他の分解への適 用は本発明の範囲外と考えるべきではない。
蜂 十 IG 1 (、/−YaLOW FIG、3A (YELLOlvv FIG、3B FIG、4A FIG、4B I補th7プミ 企 ス5 −ア1,2]ユ」、−21,ユ22,6ユ、イ、手 続補正書 平成5年12月28日

Claims (1)

  1. 【特許請求の範囲】 1.(a)一連の分子において独特のパラメーター値と関係する各分子の分子形 状ディスクリプタを規定する工程;(b)前記一連の分子における全ての分子の 共通の形状要素をもった各分子を整列させる工程; (c)各分子の形状ディスクリプタおよび独特のパラメータと、前記一連の他の 全ての分子とを相関づける工程;および(d)コンピューター・グラフィックを 使用して、前記一連の分子間の相関を視覚的に表示する工程から成ることを特徴 とする、一連の分子の三次元の定量的構造活性関係を生成および視覚化する計算 機をベースにした方法。 2.工程(a)における各分子の形状が、プローブの数式と分子を囲む格子の各 交差点における分子間の立体および静電相互作用エネルギーを計算する手段によ って規定されることを特徴とする請求の範囲第1項記載の計算機をベースにした 方法。 3.工程(b)における各分子は、一連の分子における分子と他の分子間の全て の格子点間の立体および静電相互作用エネルギーの平均和における二乗平均平方 根の差を最小にすることによって整列されることを特徴とする請求の範囲第2項 記載の計算機をベースにした方法。 4.工程(c)における相関が各成分の開方後にクロス確認によって部分最小二 乗解析によって行うことを特徴とする請求の範囲第3項記載の計算機をベースに した方法。 5.分子間の相関が、工程(d)において格子空間の各点に対応する相関解答値 を二次元表示することによって視覚化されることを特徴とする請求の範囲第4項 記載の計算機をベースにした方法。 6.(a)第1の分子の第1の配座異性体を選択する工程;(b)各格子の交差 点における使用者の特定サイズおよび電荷のプローブの数式を順序配列する工程 ; (c)各粒子の交差点におけるプローブと配座異性体間の立体および静電エネル ギーを計算する工程; (d)工程(c)で計算した立体および静電相互作用エネルギーを配座異性体と 一致するデータ表の列に入れる工程;(e)第1の分子の次に配座異性体を選択 し、工程(b)および工程(c)を反復する工程; (f)前記次の配座異性体を第1の配座異性体を整列させる工程;(g)整列に よって生じた前記次の配座異性体の相互作用エネルギーを配座異性体と一致する データ表に次の列として入れる工程;(h)考慮すべき第1の分子の全ての配座 異性体について工程(e)〜工程(g)を反復する工程; (i)第1の分子の全ての配座異性体間の相互作用エネルギーに加重調整して平 均し、平均した相互作用エネルギーを第1の分子と関連のある測定活性値と共に 3D−QSARのデータ表の第1の横列に入れる工程;(j)考慮すべき全ての 分子について工程(a)〜工程(i)を反復する工程; (k)考慮すべきグループにおいて全ての分子を前記第1の分子に整列させる工 程; (1)前記3D−QSARのデータ表に部分最小二乗統計法を適用することによ って第1の成分を開方する工程;(m)第1の成分の開方から得られた解の係数 を用いて、前記3D−QSARのデータ表についてクロス確認サイクルを行う工 程;(n)前記3D−QSARのデータ表に部分最小二乗統計法を適用すること によって、次の成分を開方する工程;(o)前記次の成分の開方から得られた係 数を用いて、前記3D−QSARのデータ表についてクロス確認サイクルを行う 工程;(p)全ての必要な成分が開方されるまで工程(n)〜工程(o)を反復 する工程; (q)開方された成分を加える工程; (r)開方された成分の和から成る部分最小二乗解を回転して元のメートル法の 空間に戻す工程; (s)解の係数を導出する工程;および(t)該解を表示する工程; から成ることを特徴とする、各分子が活性の尺度と関係し、配座異性体を含むそ の基本構造が三次元格子にモデル化されている分子間の三次元の定量的構造の活 性関係を導出する電算機実行法。 7.各格子の交差点に順次配列される際に、使用者の規定した基準に従って、そ の数式を変えることによりプローブのサイズおよび電荷を変える工程をさらに含 むことを特徴とする請求の範囲第6項記載の方法。 8.プローブの数式が各格子交差点に順次配列される際に使用者の規定した基準 に従って、格子交差点の間隔を変える工程をさらに含むことを特徴とする請求の 範囲第6項記載の方法。 9.配座異性体の整列がFIT法によって行われることを特徴とする請求の範囲 第6項記載の方法。 10.配座異性体の並列がORIENT法によって行われることを特徴とする請 求の範囲第6項記載の方法。 11.配座異性体の整列がFIELD FIT法によって行われることを特徴と する請求の範囲第6項記載の方法。 12.分子の並列がFIT法によって行われることを特徴とする請求の範囲第6 項記載の方法。 13.分子の整列がORIENT法によって行われることを特徴とする請求の範 囲第6項記載の方法。 14,分子の整列がFIELD FIT法によって行われることを特徴とする請 求の範囲第6項記載の方法。 15.配座異性体についてボルツマン分布に従って平均する前に、配座異性体の 相互作用エネルギーを加重調整することを特徴とする請求の範囲第6項記載の方 法。 16.部分最小二乗解析を行う前に、3D−QSARのデータ表の各列の欄に相 互作用エネルギーの外に列に示された分子と関係したさらに別の分子パラメータ ーを配置する工程をさらに含むことを特徴とする請求の範囲第6項記載の方法。 17.格子空間における点に対応する三次元の分散プロットに解の項を表示する ことを特徴とする請求の範囲第6項記載の方法。 18,分散プロット上に重ねた分子モデルを表示する追加工程をさらに含むこと を特徴とする請求の範囲第17項記載の方法。 19.解の用語が格子空間における体積を規定する三次元形状プロットに表示す ることを特徴とする請求の範囲第6項記載の方法。 20.形状プロット上に重ねられた分子モデルを表示する追加工程をさらに含む ことを特徴とする請求の範囲第19項記載の方法。 21.(a)3次元格子の境界を越えて立体斥力を示す相互作用エネルギーを生 成する工程;および(b)6剛体自由度に関して基準分子と整列すべき分子間の 全格子点間の平均した立体および静電相互作用エネルギーの和における二乗平均 平方根の差を計算し最小にする工程から成ることを特徴とする、分子の形状ディ スクリプタが分子をモデル化している三次元格子における全ての点でサンプリン グしたプローブの数式と各分子間の立体および静電相互作用エネルギーの計算さ れた分子場値であるところの形状に従って分子を整列する計算機実行場適合法。 22.最小化を単体法によって行うことを特徴とする請求の範囲第21項記載の 方法。 23.分子整列を表示する追加工程をさらに含むことを特徴とする請求の範囲第 21項記載の方法。 24.分子整列に特に重要である格子位置の最小化への寄与を加重調整する追加 工程をさらに含むことを特徴とする請求の範囲第21項記載の方法。 25.分子整列に及ぼす各種の加重調整選択の影響を表示する追加工程をさらに 含むことを特徴とする請求の範囲第24項記載の方法。 26.場の差および縁部の立体斥力の最小化への寄与を加重調整する追加工程を さらに含むことを特徴とする請求の範囲第21項記載の方法。 27.分子整列に及ぼす各種の加重調整選択の影響を表示する追加工程をさらに 含むことを特徴とする請求の範囲第26項記載の方法。 28.整列される分子のねじり角および内部形状が使用者の規定する限度内で変 えられる際に、整列される分子と基準分子間の計算した内部エネルギーにおける 二乗平均平方根の差を最小にさせる追加工程をさらに含むことを特徴とする請求 の範囲第21項記載の方法。 29.最小化を単体法によって行うことを特徴とする請求の範囲第28項記載の 方法。 30.分子整列を表示する追加工程をさらに含むことを特徴とする請求の範囲第 28項記載の方法。 31.分子整列に特に重要である格子位置の最小化への寄与を加重調整する追加 工程をさらに含むことを特徴とする請求の範囲第28項記載の方法。 32.分子整列に及ぼす各種の加重調整選択の影響を表示する追加工程をさらに 含むことを特徴とする請求の範囲第31項記載の方法。 33.場の差、縁部の立体斥力およびねじり角および内部形状を変える際の異な る内部エネルギーの最小化への寄与を加重調整する追加工程をさらに含むことを 特徴とする請求の範囲第28項記載の方法。 34.分子整列に及ぼす各種の加重調整選択の影響を表示する追加工程をさらに 含むことを特徴とする請求の範囲第33項記載の方法。 35.(a)3次元格子の境界を越えて立体斥力を示す相互作用エネルギーを生 成する工程;および(b)6剛体自由度に関して基準分子と整列すべき分子間の 全格子点間の平均した立体および静電相互作用エネルギーの和における二乗平均 平方根の差を計算し最小する工程から成ることを特徴とする、分子の形状ディス クリプタが分子をモデル化している三次元格子における全ての点でサンブリング したプローブの数式と各分子間の立体および静電相互作用エネルギー計算された 分子場値であるところの形状補足分子を整列又はドッキングする計算機実行法。 36.最小化を単体法によって行うことを特徴とする請求の範囲第35項記載の 方法。 37.分子整列を表示する追加工程をさらに含むことを特徴とする請求の範囲第 35項記載の方法。 38.分子整列に特に重要である格子位置の最小化への寄与を加重調整する追加 工程をさらに含むことを特徴とする請求の範囲第35項記載の方法。 39.分子整列に及ぼす各種の加重調整選択の影響を表示する追加工程をさらに 含むことを特徴とする請求の範囲第38項記載の方法。 40.場の差および縁部の立体斥力の最小化への寄与を加重調整する追加工程を さらに含むことを特徴とする請求の範囲第35項記載の方法。 41.分子整列に及ぼす各種の加重調整選択の影響を表示する追加工程をさらに 含むことを特徴とする請求の範囲第40項記載の方法。 42.(a)各格子点における使用者の特定したサイズおよび電荷のプローブの 数式を順次配置する工程; (b)各格子交差点におけるプローブと試験分子間の立体および静電エネルギー を計算する工程; (c)試験分子を3−D QSAR解の係数の導出に使用した一連の分子におけ る分子に整列させる工程;および(d)一連の分子の3−D QSAR COMFA解析において導出された解の係数を試験分子の相互作用エネルギーに 適用して、試験分子がもつ筈の生物又は化学的パラメータ値を予測する工程から 成ることを特徴とする、試験分子の三次元形状を、COMFA法によって3−D QSARが予め決定されている既知生物学的又は化学的反応性の他の分子の形状 と比較することによって基本構造が三次元格子にモデル化されている試験分子の 生物学的又は化学的活性を決定する計算機実行法。 43.類似性又は差異の比較領域を視覚化するたに、予め導出した3−D QS AR解の係数をもった試験分子の計算した相互作用エネルギーを表示する追加工 程をさらに含むことを特徴とする請求の範囲第42項記載の方法。 44.試験分子が合成されないで、その構造およびその配座異性体の構造が、三 次元格子に配置するために分子のモデル化の考慮又は分子のモデル化技術から決 定されることを特徴とする請求の範囲第42項記載の方法。 45.(a)グループの各分子に対して個々の各分子と特異的に関係した分子の パラメーターから成るデータ表に列を生成させる工程;(b)クロス確認を含む 部分最小二乗統計法を用いて、データ表のデータの全列の相関を実行する工程; (c)解を元の一トル法空間に回転バックする工程;および(d)グループの分 子間の相関を表示する工程から成ることを特徴とする、関係する化学的又は生物 学的性質をもった分子のグループ間の三次元構造活性関係を生成および視覚化す る計算機実行法。 46.(a)データ表の各列にグループの単一分子と関係した分子ディスクリプ タ並びにその分子の測定された化学的又は生物学的性質を含むデータ表を生成す る工程; (b)データ表の列に部分最小二乗統計法を適用することによって第1の成分を 開方する工程; (c)第1の成分の開方から得られた解の係数を用いて、データ表についてクロ ス確認サイクルを実行する工程;(d)データ表の列に部分最小二乗統計法を適 用することによって次の成分を開方する工程; (e)前記次の成分の開方から得られた係数を用いて、データ表についてクロス 確認サイクルを実行する工程;(f)必要な全ての成分が開方さるまで工程(d )および工程(e)を反復する工程; (g)開方した成分を加える工程; (h)開方した成分の和からなる部分最小二乗の解を回転して元のメートル法空 間に戻して解の係数を導出する工程;および(i)その解を表示する工程から成 ることを特徴とする、グループ内の分子の数より多い各分子の多数の分子ディス クリプタがあるところの分子ディスクリプタと分子グループの測定した化学的又 は生物学的性質間の相関を導出する計算機実行法。 47.(a)第1の分子の第1の配座異性体を選択する手段;(b)各格子交差 点に使用者の特定サイズおよび電荷のプローブの数式を順次配置する手段; (c)各格子交差点におけるプローブと配座異性体間の立体および静電相互作用 エネルギーを計算する手段; (d)工程(c)で計算した立体および静電相互作用エネルギーを配座異性体で 同定したデータ表の列に入れる手段;(e)第1の分子の次の配座異性体を選択 し、前記手段(b)および前記手段(c)を実行する手段; (f)前記次の配座異性体を第1の配座異性体に整列させる手段;(g)整列に よって生成された前記次の配座異性体の相互作用エネルギーを配座異性体で同定 されたデータ表に次の列として挿入する手段;(h)考察せんとする第1の分子 の全配座異性体に対して手段(e)〜手段(g)を実行する手段; (i)第1の分子の全配座異性体間の相互作用エネルギーを加重調整した後平均 し、平均した相互作用エネルギーを第1の分子と関係した生物学的又は化学的値 と共に3−D QSARデータ表の第1の列に配置する工程;(j)考察すべき 全分子対して手段(a)〜手段(i)を実行する手段;(k)考察されるグルー プにおける全ての分子を前記第1の分子に整列させる手段; (l)前記3−D QSARデータ表に部分最小二乗統計法を適用することによ って第1の成分を開方する手段;(m)第1の成分の開方から得られた解の係数 を用いて、前記3−DQSARデータ表についてクロス確認サイクルを実行する 手段;(n)前記3−D QSARデータ表に部分最小二乗統計法を適用するこ とによって、次の成分を開方する手段;(o)次の成分の開方から得られた係数 を用いて、前記3−D QSARデータ表についてクロス確認サイクルを実行す る手段;(p)必要な全ての成分が開方されるまで手段(n)〜手段(o)を実 行する手段; (q)開方した成分を加える手段; (r)開方した成分の和から成る部分最小二乗の解を回転して元のメートル法空 間に戻す手段; (s)解の係数を導出する手段;および(t)その解を表示する手段から成るこ とを特徴とする、各分子が活性の尺度と関係しその配座異性体を含むその基本構 造が三次元格子にモデル化さている分子間の三次元定量的構造活性関係(3−D  QSAR)を導出する装置。 48.各格子交差点に順次配置される際に使用者の特定した基準に従って数式を 変える手段によって、プローブのサイズおよび電荷を変える追加の手段をさらに 含むことを特徴とする請求の範囲第47項記載の方法。 49.プローブの数式を各格子交差点に順次配置される際に使用者の特定した基 準に従って、格子交差点の間隔を変える追加の手段をさらに含むことを特徴とす る請求の範囲第47項記載の方法。 50.配座異性体を整列させる手段がFIT法を利用することを特徴とする請求 の範囲第47項記載の方法。 51.配座異性体を整列させる手段がORIENT法を利用することを特徴とす る請求の範囲第47項記載の方法。 52.配座異性体を整列させる手段がFIELDFIT法を利用することを特徴 とする請求の範囲第47項記載の方法。 53.分子を整列させる手段がFIT法を利用することを特徴とする請求の範囲 第47項記載の方法。 54.分子を整列させる手段がORIENT法を利用することを特徴とする請求 の範囲第47項記載の方法。 55.分子を整列させる手段がFIELD FIT法を利用することを特徴とす る請求の範囲第47項記載の方法。 56.配座異性体についてポルツマン分布に従って平均する前に、配座異性体の 相互作用エネルギーを加重調整する手段をさらに含むことを特徴とする請求の範 囲第47項記載の方法。 57.部分最小二乗解析を適用する手段を実行する前に、3−D QSARデー タ表の各列の欄に相互作用エネルギーの外に列によって示された分子と関係した さらに別の分子パラメーターを配置する追加の手段をさらに含むことを特徴とす る請求の範囲第47項記載の方法。 58.解を表示する手段が、さらに格子点に対応する三次元分散プロットにおけ る解の項を表示す手段から成ることを特徴とする請求の範囲第47項記載の方法 。 59.分散プロット上に重ねた分子モデルを表示する追加の手段をさらに含むこ とを特徴とする請求の範囲第58項記載の方法。 60.解を表示する手段がさらに、格子空間に体積を画定する三次元の形状プロ ットに解の項を表示する手段を含むことを特徴とする請求の範囲第47項記載の 方法。 61.形状プロットに重ねた分子モデルを表示する追加の手段をさらに含むこと を特徴とする請求の範囲第60項記載の方法。 62.(a)3次元格子の境界を越えて立体斥力を示す相互作用エネルギーを生 成する手段;および (b)6剛体自由度に関して基準分子と整列すべき分子間の全格子点間の平均し た立体および静電相互作用エネルギーの和における二乗平均平方根の差を計算し 最小にする手段から成ることを特徴とする、分子の形状ディスクリプタが分子を モデル化している三次元格子における全ての点でサンプリングしたプローブの数 式と各分子間の立体および静電相互作用エネルギー計算された分子場値であると ころの形状に従って分子を整列するFIELD FIT装置。 63.最小化手段が単体法を利用することを特徴とする請求の範囲第62項記載 の方法。 64.分子整列を表示する追加の手段をさらに含むことを特徴とする請求の範囲 第62項記載の方法。 65.分子整列に特に重要である格子位置の最小化への寄与を加重調整する追加 の手段をさらに含むことを特徴とする請求の範囲第62項記載の方法。 66.分子整列に及ぼす各種の加重調整選択の影響を表示する追加工程をさらに 含むことを特徴とする請求の範囲第65項記載の方法。 67.場の差および縁部の立体斥力の最小化への寄与を加重調整する追加の手段 をさらに含むことを特徴とする請求の範囲第62項記載の方法。 68.分子整列に及ぼす各種の加重調整選択の影響を表示する追加の手段をさら に含むことを特徴とする請求の範囲第67項記載の方法。 69.整列される分子のねじり角および内部形状が使用者の規定する限度内で変 えられる際に、整列される分子と基準分子間の計算した内部エネルギーにおける 二乗平均平方根の差を最小にさせる追加の手段をさらに含むことを特徴とする請 求の範囲第62項記載の方法。 70.最小化手段が単体法を利用することを特徴とする請求の範囲第69項記載 の方法。 71.分子整列を表示する追加の手段をさらに含むことを特徴とする請求の範囲 第69項記載の方法。 72.分子整列に特に重要である格子位置の最小化への寄与を加重調整する追加 の手段をさらに含むことを特徴とする請求の範囲第69項記載の方法。 73.分子整列に及ぼす各種の加重調整選択の影響を表示する追加の手段をさら に含むことを特徴とする請求の範囲第72項記載の方法。 74.場の差、縁部の立体斥力およびねじり角および内部形状を変える際の異な る内部エネルギーの最小化への寄与を加重調整する追加の手段をさらに含むこと を特徴とする請求の範囲第69項記載の方法。 75.分子整列に及ぼす各種の加重調整選択の影響を表示する追加の手段をさら に含むことを特徴とする請求の範囲第33項記載の方法。 76.(a)3次元格子の境界を越えて立体斥力を示す相互作用エネルギーを生 成する手段;および (b)6剛体自由度に関して基準分子と整列すべき分子間の全格子点間の平均し た立体および静電相互作用エネルギーの和における二乗平均平方根差を計算し最 大にする手段から成ることを特徴とする、分子の形状ディスクリプタが分子をモ デル化している三次元格子における全ての点でサンプリングしたプローブの数式 と各分子間の立体および静電相互作用エネルギー計算された分子場値であるとこ ろの形状補足分子を整列又はドッキングする装置。 77.最大化手段が単体法を利用することを特徴とする請求の範囲第76項記載 の装置。 78.分子整列を表示する追加の手段をさらに含むことを特徴とする請求の範囲 第76項記載の方法。 79.分子整列に特に重要である格子位置の最大化への寄与を加重調整する追加 の手段をさらに含むことを特徴とする請求の範囲第76項記載の方法。 80.分子整列に及ぼす各種の加重調整選択の影響を表示する追加の手段をさら に含むことを特徴とする請求の範囲第79項記載の方法。 81.場の差および縁部の立体斥力の最大化への寄与を加重調整する追加の手段 をさらに含むことを特徴とする請求の範囲第76項記載の方法。 82.分子整列に及ぼす各種の加重調整選択の影響を表示する追加の手段をさら に含むことを特徴とする請求の範囲第81項記載の装置。 83.(a)各格子点における使用者の特定したサイズおよび電荷のプローブの 数式を順次配置する手段; (b)各格子交差点におけるプローブと試験分子間の立体および静電エネルギー を計算する手段; (c)試験分子を3−D QSAR解の係数の導出使用した一連の分子における 分子に整列させる手段;および(d)一連の分子の3−D QSAR COMFA解析において導出された解の係数を試験分子の相互作用エネルギーに 適用して、試験分子がもつ筈の生物学的又は化学的パラメータ値を予測する手段 から成ることを特徴とする、試験分子の三次元形状を、COMFA法によって3 −D QSARが予め決定されている既知生物学的又は化学的反応性の他の分子 の形状と比較することによって基本構造が三次元格子にモデル化されている試験 分子の生物学的又は化学的活性を決定する装置。 84.類似性又は差異の比較領域を視覚化するために、予め導出した3−DQS AR解の係数をもった試験分子の計算した相互作用エネルギーを表示する追加の 手段をさらに含むことを特徴とする請求の範囲第83項記載の方法。 85.試験分子が合成されないで、その構造およびその配座異性体の構造が、三 次元格子に配置するために分子のモデル化の考慮又は分子のモデル化技術から決 定されることを特徴とする請求の範囲第83項記載の方法。 86.(a)グループの各分子に対して個々の各分子と特異的に関係した分子の パラメーターから成るデータ表に列を生成させる手段;(b)クロス確認を含む 部分最小二乗統計法を用いて、データ表のデータの全列の相関を実行する手段; (c)解を元のメートル法空間に回転バックする手段;および(d)グループの 分子間の相関を表示する手段から成ることを特徴とする、関係する化学的又は生 物学的性質をもった分子のグループ間の三次元構造活性関係を生成および視覚化 する装置。 87.(a)データ表の各列にグループの単一分子と関係した分子ディスクリプ タ並びにその分子の測定された化学的又は生物学的性質を含むデータ表を生成す る手段; (b)データ表の列に部分最小二乗統計法を適用することによって第1の成分を 開方する手段; (c)第1の成分の開方から得られた解の係数を用いて、データ表についてクロ ス確認サイクルを実行する手段;(d)データ表の列に部分最小二乗統計法を適 用することによって次の成分を開方する手段; (e)前記次の成分の開方から得られた係数を用いて、データ表についてクロス 確認サイクルを実行する手段;(f)必要な全ての成分が開方されるまで工程( d)および工程(e)を実行する工程; (g)開方した成分を加える手段; (h)開方した成分の和からなる部分最小二乗の解を回転して元のメートル法空 間に戻して解の係数を導出する手段;および(i)その解を表示する手段から成 ることを特徴とする、グループ内の分子の数より多い各分子の多数の分子ディス クリプタがあるところの分子ディスクリプタと分子グループの測定した化学又は 生物学的性質間の相関を導出する装置。 88.(a)一連の分子において独特のパラメーター値と関係する各分子の分子 形状ディスクリプタを規定する手段;(b)前記一連の分子における全ての分子 の共通の形状要素をもつた各分子を整列させる手段; (c)各分子の形状ディスクリプタおよび独特のパラメータと、前記一連の他の 全ての分子とを相関づける手段;および(d)コンピューター・グラフィックを 使用して、前記一連の分子間の相関を視覚的に表示する手段から成ることを特徴 とする、一連の分子の三次元の定量的構造活性関係を生成および視覚化する装置 。 89.形状を規定する手段がさらに、プローブの数式と分子を囲む格子の各交差 点における分子間の立体および静電相互作用エネルギーを計算する手段から成る ことを特徴とする請求の範囲第88項記載の装置。 90.各分子を整列させる手段がさらに、分子と一連の他の分子間の全ての格子 点間を平均した立体および静電相互作用エネルギーの和における二乗平均平方根 差を最小化する手段から成ることを特徴とする請求の範囲第89項記載の装置。 91.形状と特異のパラーターを相互づける手段がさらに、各成分の開方後にク ロス確認を用いて部分最小二乗解析を実行する手段から成ることを特徴とする請 求の範囲第go項記載の装置。 92.その相関を視覚表示する手段がさらに、格子空間における各点に対応する 相互解答値を三次元で表示する手段から成ることを特徴とする請求の範囲第91 項記載の装置。 93.(a)測定された親和性をもって大きな分子に結合することが知られてい る分子の配座異性体を含む基本構造を三次元格子にモデル化する工程;(b)第 1の分子の第1の配座異性体を選択する工程;(c)各格子の交差点における使 用者の特定サイズおよび電荷のプローブの数式を順序配列する工程; (d)各粒子の交差点におけるプローブと配座異性体間の立体および静電エネル ギーを計算する工程; (e)工程(d)で計算した立体および静電相互作用エネルギーを配座異性体と 一致するデータ表の横列に入れる工程;(f)第1の分子の次の配座異性体を選 択し、工程(c)および工程(d)を反復する工程; (g)前記次の配座異性体を第1の配座異性体に整列させる工程;(h)整列に よって生じた前記次の配座異性体の相互作用エネルギーを配座異性体と一致する データ表に次の列として入れる工程;(i)考慮すべき第1の分子の全ての配座 異性体について工程(f)〜工程(h)を反復する工程; (j)第1の分子の全ての配座異性体間の相互作用エネルギーを加重調整して平 均し、平均した相互作用エネルギーを第1の分子と関連のある測定活性値と共に 第2のデータ表の第1の列に入れる工程;(k)考慮すべき全ての分子について 工程(b)〜工程(j)を反復する工程; (1)考慮すべきグループにおいて全ての分子を前記第1の分子に整列させる工 程; (m)前記第2のデータ表に部分最小二乗統計的方法を適用することによって第 1の成分を開方する工程; (n)第1の成分の開方から得られた解の係数を用いて、前記第2のデータ表に ついてクロス確認サイクルを行う工程;(o)前記第2のデータ表に部分最小二 乗統計法を適用することによって、次の成分を開方する工程; (p)前記次の成分の開方から得られた係数を用いて、前記第2のデータ表につ いてクロス確認サイクルを行う工程;(q)全ての必要な成分が開方されるまで 工程(o)〜工程(p)を反復する工程; (r)開方された成分を加える工程; (s)開方された成分の和から成る部分最小二乗解を回転して元のメートル法の 空間に戻す工程; (t)解の係数を導出する工程; (u)該解を表示する工程;および (v)分子のより大きな分子への結合に重要であるとディスプレイに示された三 次元の空間/体積を必要に応じて占める又は占めないように配列された原子で分 子を合成する工程から成ることを特徴とする、測定された親和性をもって他の分 子に結合することが知られているより大きい分子に結合する分子を設計する計算 機をベースにした方法。 94.(a)測定された親和性をもって大きな分子に結合することが知られてい る分子の配座異性体を含む基本構造を三次元格子にモデル化する手段;(b)第 1の分子の第1の配座異性体を選択する手段;(c)各格子の交差点における使 用者の特定サイズおよび電荷のプローブの数式を順序配列する手段; (d)各粒子の交差点におけるプローブと配座異性体間の立体および静電エネル ギーを計算する手段; (e)工程(d)で計算した立体および静電相互作用エネルギーを配座異性体と 一致するデータ表の列に入れる手段;(f)第1の分子の次に配座異性体を選択 し、工程(c)および工程(d)を反復する手段; (g)前記次の配座異性体を第1の配座異性体に整列させる手段;(h)整列に よって生じた前記次の配座異性体の相互作用エネルギーを配座異性体と一致する データ表に次の列として入れる手段;(i)考慮すべき第1の分子の全ての配座 異性体について工程(f)〜工程(h)を反復する手段; (j)第1の分子の全ての配座異性体間の相互作用エネルギーを加重調整して平 均し、平均した相互作用エネルギーを第1の分子と関連のある測定活性値と共に 第2のデータ表の第1の列に入れる手段;(k)考慮すべき全ての分子について 工程(b)〜工程(j)を反復する手段; (1)考慮すべきグループにおいて全ての分子を前記第1の分子に整列させる手 段; (m)前記第2のデータ表に部分最小二乗統計法を適用することによって第1の 成分を開方する手段; (n)第1の成分の開方から得られた解の係数を用いて、前記第2のデータ表に ついてクロス確認サイクルを行う手段;(o)前記第2のデータ表に部分最小二 乗統計法を適用することによって、次の成分を開方する手段; (p)前記次の成分の開方から得られた係数を用いて、前記第2のデータ表につ いてクロス確認サイクルを行う手段;(q)全ての必要な成分が開方されるまで 工程(o)〜工程(p)を反復する手段; (r)開方された成分を加える手段; (s)開方された成分の和から成る部分最小二乗解を回転して元のメートル法の 空間に戻す手段; (t)該解を表示する手段;および (u)分子のより大きな分子への結合に重要であるとディスプレイに示された三 次元の空間/体積を必要に応じて占める又は占めないように配列された原子で分 子を合成する手段から成ることを特徴とする、測定された親和性をもって他の分 子に結合することが知られているより大きい分子に結合する分子を設計する装置 。 95.共通の分子に結合することが知られている他の分子と実質的に類似の全体 構造を有し、3D−QSARが形状決定要素の変化が前記共通分子との反応性の 増減と強い相関があることを示す領域において該共通分子との反応性を増減させ るように設計されている形状決定要素を有する分子であって、前記3D−QSA Rが下記の工程から成る計算機をベースにした方法によって導出されることを特 徴とする分子: (a)共通の分子に結合する一連の分子において独特のパラメーター値と関係す る各分子の形状を規定する工程;(b)前記一連の分子における全ての分子の共 通の形状要素をもった各分子を整列させる工程; (c)各分子の形状および独特のパラメータと、前記一連の他の全ての分子とを 相関づける工程;および (d)コンピューター・グラフィックを使用して、前記一連の分子間の相関を視 覚的に表示する工程。 96.工程(a)における各分子の形状が、プローブの数式と分子を囲む格子の 各交差点における分子間の立体および静電相互作用エネルギーを計算する手段に よって規定されることを特徴とする請求の範囲第95項記載の分子。 97.工程(b)における各分子は、一連の分子における分子と他の分子間の全 ての格子点間の立体および静電相互作用エネルギーの平均和における二乗平均平 方根の差を最小にすることによって整列されることを特徴とする請求の範囲第9 6項記載の分子。 98.工程(c)における相関が各成分の開方後にクロス確認によって部分最小 二乗解析によって行うことを特徴とする請求の範囲第97項記載の分子。 99.分子間の相関が、工程(d)において格子空間の各点に対応する相関解答 値を三次元表示することによって視覚化されることを特徴とする請求の範囲第9 8項記載の分子。 100.共通の分子に結合することが知られている他の分子に実質的に類似する 全体構造を有し、該共通分子との分子の反応性を増減させる必要がある際に、3 D−QSARが形状決定要素が共通分子との反応性の増減と強い相関があること を示すところの前記分子の周囲の三次元領域を占める又は占めないように、配置 された原子を有する分子であって、前記3D−QSARが下記の工程から成る計 算機をベースにした方法によって導出されることを特徴とする分子:(1)共通 の分子に結合する一連の分子において独特のパラメーター値と関係する各分子の 形状を規定する工程;(2)前記一連の分子における全ての分子の共通の形状要 素をもつた各分子を整列させる工程; (3)各分子の形状および独特のパラメータと、前記一連の他の全ての分子とを 相関づける工程;および (4)コンピューター・グラフィックを使用して、前記一連の分子間の相関を視 覚的に表示する工程。 101.工程(1)における各分子の形状が、プローブの数式と分子を囲む格子 の各交差点における分子間の立体および静電相互作用エネルギーを計算する手段 によって規定されることを特徴とする請求の範囲第100項記載の分子。 102.工程(2)における各分子は、一連の分子における分子と他の分子間の 全ての格子点間の立体および静電相互作用エネルギーの平均和における二乗平均 平方根の差を最小にすることによって整列されることを特徴とする請求の範囲第 101項記載の分子。 103.工程(3)における相関が各成分の開方後にクロス確認によって部分最 小二乗解析によって行うことを特徴とする請求の範囲第102項記載の分子。 104.分子間の相関が、工程(4)において格子空間の各点に対応する相関解 答値を三次元表示することによって視覚化されることを特徴とする請求の範囲第 103項記載の分子。 105.共通の分子に結合することが知られている他の分子と実質的に類似の全 体構造を有し、3D−QSARが形状決定要素の変化が前記共通分子との反応性 の増減と強い相関があることを示す領域において該共通分子との反応性を増減さ せるように設計されている形状決定要素を有する分子であって、前記3D−QS ARが下記の工程から成る計算機をベースにした方法によって導出されることを 特徴とする分子: (a)グループの各分子に対して個々の各分子と特異的に関係した分子のパラメ ーターから成るデータ表に列を生成させる工程;(b)クロス確認を含む部分最 小二乗統計法を用いて、データ表のデータの全列の相関を実行する工程; (c)解を元のメートル法空間に回転バックする工程;および(d)グループの 分子間の相関を表示する工程。
JP3512615A 1991-06-17 1991-06-17 比較分子場解析法 Pending JPH06503908A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US1991/004292 WO1992022875A1 (en) 1991-06-17 1991-06-17 COMPARATIVE MOLECULAR FIELD ANALYSIS (CoMFA)

Publications (1)

Publication Number Publication Date
JPH06503908A true JPH06503908A (ja) 1994-04-28

Family

ID=1239656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3512615A Pending JPH06503908A (ja) 1991-06-17 1991-06-17 比較分子場解析法

Country Status (7)

Country Link
US (2) US5025388A (ja)
EP (1) EP0592421B1 (ja)
JP (1) JPH06503908A (ja)
DE (2) DE592421T1 (ja)
DK (1) DK0592421T3 (ja)
GB (1) GB2266391A (ja)
WO (1) WO1992022875A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005529158A (ja) * 2002-05-28 2005-09-29 ザ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・ペンシルベニア 両親媒性ポリマーのコンピュータ分析および設計のための方法、システムおよびコンピュータプログラム製品
JP2006113878A (ja) * 2004-10-15 2006-04-27 Ryoka Systems Inc 受容体−リガンド安定複合体構造探索方法

Families Citing this family (136)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5025388A (en) * 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
US5260882A (en) * 1991-01-02 1993-11-09 Rohm And Haas Company Process for the estimation of physical and chemical properties of a proposed polymeric or copolymeric substance or material
US5200910A (en) * 1991-01-30 1993-04-06 The Board Of Trustees Of The Leland Stanford University Method for modelling the electron density of a crystal
JP2565005B2 (ja) * 1991-03-08 1996-12-18 富士通株式会社 異種結晶の合成装置
US5241470A (en) * 1992-01-21 1993-08-31 The Board Of Trustees Of The Leland Stanford University Prediction of protein side-chain conformation by packing optimization
US6370479B1 (en) * 1992-02-06 2002-04-09 Fujitsu Limited Method and apparatus for extracting and evaluating mutually similar portions in one-dimensional sequences in molecules and/or three-dimensional structures of molecules
US5353236A (en) * 1992-04-23 1994-10-04 The Board Of Trustees Of The Leland Stanford University High-resolution crystallographic modelling of a macromolecule
US5420805A (en) * 1992-05-05 1995-05-30 The Trustees Of Columbia University In The City Of New York Method and apparatus for designing molecular structures using an analytical solution for effective born radii
US5742290A (en) * 1992-09-03 1998-04-21 Fujitsu Limited Molecular orbital modeling system with an improved function processor
US5581476A (en) 1993-01-28 1996-12-03 Amgen Inc. Computer-based methods and articles of manufacture for preparing G-CSF analogs
US5524188A (en) * 1993-03-01 1996-06-04 Halpern Software, Inc. Viewing three dimensional objects by rotational wobble about multiple axes
US5453937A (en) * 1993-04-28 1995-09-26 Immunex Corporation Method and system for protein modeling
US5884230A (en) * 1993-04-28 1999-03-16 Immunex Corporation Method and system for protein modeling
US5703792A (en) * 1993-05-21 1997-12-30 Arris Pharmaceutical Corporation Three dimensional measurement of molecular diversity
US6081766A (en) * 1993-05-21 2000-06-27 Axys Pharmaceuticals, Inc. Machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics
US5434796A (en) * 1993-06-30 1995-07-18 Daylight Chemical Information Systems, Inc. Method and apparatus for designing molecules with desired properties by evolving successive populations
US5495423A (en) * 1993-10-25 1996-02-27 Trustees Of Boston University General strategy for vaccine and drug design
US5553004A (en) * 1993-11-12 1996-09-03 The Board Of Trustees Of The Leland Stanford Jr. University Constrained langevin dynamics method for simulating molecular conformations
AU1297995A (en) * 1993-11-26 1995-06-13 Lawrence B Hendry Design of drugs involving receptor-ligand-dna interactions
JP3235763B2 (ja) * 1994-02-28 2001-12-04 富士通株式会社 共通構造抽出装置
US5577239A (en) * 1994-08-10 1996-11-19 Moore; Jeffrey Chemical structure storage, searching and retrieval system
US5687090A (en) * 1994-09-01 1997-11-11 Aspen Technology, Inc. Polymer component characterization method and process simulation apparatus
US5463564A (en) * 1994-09-16 1995-10-31 3-Dimensional Pharmaceuticals, Inc. System and method of automatically generating chemical compounds with desired properties
US5740072A (en) * 1994-10-07 1998-04-14 The Trustees Of Columbia Universuty In The City Of New York Rapidly convergent method for boltzmann-weighted ensemble generation in free energy simulations
JPH08123781A (ja) * 1994-10-20 1996-05-17 Fujitsu Ltd 3次元化合物構造式の周辺空間情報を数値データへ変換する方法、並びに、3次元化合物構造式とその周辺空間との相互作用を数値データへ変換する方法
US5612894A (en) * 1995-02-08 1997-03-18 Wertz; David H. System and method for molecular modeling utilizing a sensitivity factor
US5621671A (en) * 1995-03-17 1997-04-15 The United States Of America As Represented By The Secretary Of The Navy Digital simulation of organismal growth
US6341256B1 (en) * 1995-03-31 2002-01-22 Curagen Corporation Consensus configurational bias Monte Carlo method and system for pharmacophore structure determination
US5657255C1 (en) * 1995-04-14 2002-06-11 Interleukin Genetics Inc Hierarchic biological modelling system and method
US5784294A (en) * 1995-06-09 1998-07-21 International Business Machines Corporation System and method for comparative molecular moment analysis (CoMMA)
US5978740A (en) * 1995-08-09 1999-11-02 Vertex Pharmaceuticals Incorporated Molecules comprising a calcineurin-like binding pocket and encoded data storage medium capable of graphically displaying them
US6266622B1 (en) * 1995-12-13 2001-07-24 Regents Of The University Of California Nuclear receptor ligands and ligand binding domains
US6185506B1 (en) * 1996-01-26 2001-02-06 Tripos, Inc. Method for selecting an optimally diverse library of small molecules based on validated molecular structural descriptors
AU1847997A (en) * 1996-01-26 1997-08-20 Robert D. Clark Method of creating and searching a molecular virtual library using validated molecular structure descriptors
US6622094B2 (en) * 1996-02-15 2003-09-16 The Trustees Of Columbia University In The City Of New York Method for determining relative energies of two or more different molecules
EA001095B1 (ru) * 1996-03-22 2000-10-30 Юниверсити Оф Гуелф Компьютерный способ создания химических структур, имеющих общие функциональные характеристики
US6108635A (en) * 1996-05-22 2000-08-22 Interleukin Genetics, Inc. Integrated disease information system
US5989835A (en) 1997-02-27 1999-11-23 Cellomics, Inc. System for cell-based screening
US5751605A (en) * 1996-08-15 1998-05-12 Tripos, Inc. Molecular hologram QSAR
GB2317030A (en) * 1996-08-30 1998-03-11 Xenova Ltd Defining a pharmacophore for the design of MDR modulators
US6571227B1 (en) * 1996-11-04 2003-05-27 3-Dimensional Pharmaceuticals, Inc. Method, system and computer program product for non-linear mapping of multi-dimensional data
US6453246B1 (en) 1996-11-04 2002-09-17 3-Dimensional Pharmaceuticals, Inc. System, method, and computer program product for representing proximity data in a multi-dimensional space
JP2001503546A (ja) * 1996-11-04 2001-03-13 3―ディメンショナル ファーマシューティカルズ インコーポレイテッド 化学データの可視化、並びに対話式に処理および分析するためのシステム、方法、およびコンピュータプログラム製品
US6219440B1 (en) 1997-01-17 2001-04-17 The University Of Connecticut Method and apparatus for modeling cellular structure and function
US5866343A (en) * 1997-04-15 1999-02-02 Universite De Montreal Energetically favorable binding site determination between two molecules
US5962669A (en) * 1997-06-02 1999-10-05 The Regents Of The University Of California Nucleic acid encoding prion protein variant
JP2002514224A (ja) 1997-06-02 2002-05-14 ザ レジェンツ オブ ザ ユニバーシティー オブ カリフォルニア プリオン蛋白質調節因子(ppmf)およびプリオン抵抗性動物
US6829540B1 (en) 1997-08-22 2004-12-07 Purdue Research Foundation Drug discovery using multiple membrane mimetic affinities
US6460014B1 (en) 1997-09-05 2002-10-01 Accelrys Inc. Modeling interactions with atomic parameters including anisotropic dipole polarizability
US6051029A (en) * 1997-10-31 2000-04-18 Entelos, Inc. Method of generating a display for a dynamic simulation model utilizing node and link representations
US6078739A (en) * 1997-11-25 2000-06-20 Entelos, Inc. Method of managing objects and parameter values associated with the objects within a simulation model
US6069629A (en) * 1997-11-25 2000-05-30 Entelos, Inc. Method of providing access to object parameters within a simulation model
US6708141B1 (en) 1998-01-16 2004-03-16 The University Of Connecticut Method for modeling cellular structure and function
GB9803466D0 (en) * 1998-02-19 1998-04-15 Chemical Computing Group Inc Discrete QSAR:a machine to determine structure activity and relationships for high throughput screening
EP1057014B1 (en) * 1998-02-26 2012-06-06 Openeye Scientific Software, Inc. Determining a shape space for a set of molecules using minimal metric distances
US7110888B1 (en) 1998-02-26 2006-09-19 Openeye Scientific Software, Inc. Method for determining a shape space for a set of molecules using minimal metric distances
US20020042423A1 (en) * 1998-04-29 2002-04-11 John R. Richert Methods for identifying compounds that bind to hla molecules and use of such compounds as hla-agonists or antagonists
US6839634B1 (en) 1998-09-11 2005-01-04 The Institute Of Physical And Chemical Research Method for predicting reaction characteristics of molecules
AU1615600A (en) 1998-11-13 2000-06-05 Cellomics, Inc. Methods and system for efficient collection and storage of experimental data
AU3217000A (en) * 1999-01-27 2000-08-18 Scripps Research Institute, The Protein modeling tools
US7912689B1 (en) * 1999-02-11 2011-03-22 Cambridgesoft Corporation Enhancing structure diagram generation through use of symmetry
US7295931B1 (en) * 1999-02-18 2007-11-13 Cambridgesoft Corporation Deriving fixed bond information
US6904423B1 (en) 1999-02-19 2005-06-07 Bioreason, Inc. Method and system for artificial intelligence directed lead discovery through multi-domain clustering
AU3001500A (en) * 1999-02-19 2000-09-04 Bioreason, Inc. Method and system for artificial intelligence directed lead discovery through multi-domain clustering
US6349265B1 (en) * 1999-03-24 2002-02-19 International Business Machines Corporation Method and apparatus for mapping components of descriptor vectors for molecular complexes to a space that discriminates between groups
US7356415B1 (en) 1999-03-24 2008-04-08 International Business Machines Corporation Similarity searching of molecules based upon descriptor vectors characterizing molecular regions
AU4466700A (en) * 1999-04-16 2000-11-02 Entelos, Inc. Method and apparatus for conducting linked simulation operations utilizing a computer-based system model
US6343257B1 (en) * 1999-04-23 2002-01-29 Peptor Ltd. Identifying pharmacophore containing combinations of scaffold molecules and substituents from a virtual library
WO2000065421A2 (en) * 1999-04-26 2000-11-02 Novascreen Biosciences Corporation Receptor selectivity mapping
US6555660B2 (en) * 2000-01-10 2003-04-29 Maxygen Holdings Ltd. G-CSF conjugates
US6646110B2 (en) * 2000-01-10 2003-11-11 Maxygen Holdings Ltd. G-CSF polypeptides and conjugates
US6831158B2 (en) * 2000-01-10 2004-12-14 Maxygen Holdings Ltd. G-CSF conjugates
AU2001229744A1 (en) 2000-01-25 2001-08-07 Cellomics, Inc. Method and system for automated inference of physico-chemical interaction knowl edge
CA2399967A1 (en) * 2000-02-01 2001-08-09 Dwight W. Miller Methods for predicting the biological, chemical, and physical properties of molecules from their spectral properties
US6898533B1 (en) 2000-02-01 2005-05-24 The United States Of America As Represented By The Department Of Health And Human Services Methods for predicting the biological, chemical, and physical properties of molecules from their spectral properties
US7416524B1 (en) 2000-02-18 2008-08-26 Johnson & Johnson Pharmaceutical Research & Development, L.L.C. System, method and computer program product for fast and efficient searching of large chemical libraries
US6625585B1 (en) 2000-02-18 2003-09-23 Bioreason, Inc. Method and system for artificial intelligence directed lead discovery though multi-domain agglomerative clustering
US6671627B2 (en) 2000-02-29 2003-12-30 3-D Pharmaceuticals, Inc. Method and computer program product for designing combinatorial arrays
US6907350B2 (en) * 2000-03-13 2005-06-14 Chugai Seiyaku Kabushiki Kaisha Method, system and apparatus for handling information on chemical substances
AU2001247627A1 (en) 2000-03-22 2001-10-03 3-Dimensional Pharmaceuticals, Inc. System, method, and computer program product for representing object relationships in a multidimensional space
US7139739B2 (en) 2000-04-03 2006-11-21 Johnson & Johnson Pharmaceutical Research & Development, L.L.C. Method, system, and computer program product for representing object relationships in a multidimensional space
US7356419B1 (en) 2000-05-05 2008-04-08 Cambridgesoft Corporation Deriving product information
US7272509B1 (en) * 2000-05-05 2007-09-18 Cambridgesoft Corporation Managing product information
AU2001264856A1 (en) * 2000-05-24 2001-12-03 The Board Of Trustees Of The Leland Stanford Junior University Inhibitors of viral infection
US20020025535A1 (en) * 2000-06-15 2002-02-28 Diller David J. Prioritization of combinatorial library screening
CA2419600A1 (en) * 2000-08-22 2002-02-28 3-Dimensional Pharmaceuticals, Inc. Method, system, and computer program product for determining properties of combinatorial library products from features of library building blocks
US6813615B1 (en) 2000-09-06 2004-11-02 Cellomics, Inc. Method and system for interpreting and validating experimental data with automated reasoning
US6678619B2 (en) * 2000-09-20 2004-01-13 Victor S. Lobanov Method, system, and computer program product for encoding and building products of a virtual combinatorial library
WO2002061662A1 (en) * 2000-11-02 2002-08-08 Protein Mechanics, Inc. Method for analytical jacobian computation in molecular modeling
US7054757B2 (en) * 2001-01-29 2006-05-30 Johnson & Johnson Pharmaceutical Research & Development, L.L.C. Method, system, and computer program product for analyzing combinatorial libraries
US6895340B2 (en) * 2001-04-25 2005-05-17 Bristol-Myers Squibb Company Method of molecular structure recognition
US7727713B2 (en) 2001-06-20 2010-06-01 Nuevolution A/S Templated molecules and methods for using such molecules
CA2452582C (en) * 2001-07-11 2013-01-22 Maxygen Holdings, Ltd. G-csf conjugates
US7516018B2 (en) * 2001-07-25 2009-04-07 Tripos, L.P. Structural unit analysis
AU2002327386A1 (en) * 2001-07-31 2003-02-17 Apt Therapeutics, Inc. Method for calculating a biological characteristic property of a molecule by correlation analysis
US20030148386A1 (en) * 2001-11-09 2003-08-07 North Dakota State University Method for drug design using comparative molecular field analysis (CoMFA) extended for multi-mode/multi-species ligand binding and disposition
AU2003213581A1 (en) * 2002-02-25 2003-09-09 Richard D. Cramer Comparative molecular field analysis (comfa) utilizing topomeric alignment of molecular fragments
US6671628B2 (en) 2002-03-04 2003-12-30 Chemnavigator, Inc. Methods for identifying a molecule that may bind to a target molecule
US7996156B2 (en) * 2002-03-07 2011-08-09 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Methods for predicting properties of molecules
DE60324778D1 (de) 2002-03-15 2009-01-02 Nuevolution As Eine verbesserte methode zur synthese von matritzenabhängigen molekülen
EP1539980B1 (en) 2002-08-01 2016-02-17 Nuevolution A/S Library of complexes comprising small non-peptide molecules and double-stranded oligonucleotides identifying the molecules
US20040034481A1 (en) * 2002-08-16 2004-02-19 Hurst John R. Methods for identifying a prospective binding site on a target molecule and for characterizing a site on a target molecule
GB2392746B (en) 2002-09-06 2004-07-28 Cresset Biomolecular Discovery Comparison of molecules using field points
CN1703704A (zh) * 2002-10-07 2005-11-30 日本臓器制药株式会社 三维结构活性相关法
CN106337046B (zh) 2002-10-30 2021-03-23 纽韦卢森公司 合成双功能复合物的方法
EP2175019A3 (en) 2002-12-19 2011-04-06 Nuevolution A/S Quasirandom structure and function guided synthesis methods
US20040186815A1 (en) * 2002-12-20 2004-09-23 Stockfisch Thomas P. Method for accommodating missing descriptor and property data while training neural network models
WO2004075021A2 (en) * 2003-02-14 2004-09-02 Vertex Pharmaceuticals, Inc. Molecular modeling methods
EP1597395A2 (en) 2003-02-21 2005-11-23 Nuevolution A/S Method for producing second-generation library
ATE447626T1 (de) 2003-09-18 2009-11-15 Nuevolution As Methode zur gewinnung struktureller informationen kodierter moleküle und zur selektion von verbindungen
US20060052943A1 (en) * 2004-07-28 2006-03-09 Karthik Ramani Architectures, queries, data stores, and interfaces for proteins and drug molecules
US7505989B2 (en) 2004-09-03 2009-03-17 Biowisdom Limited System and method for creating customized ontologies
US20060053174A1 (en) * 2004-09-03 2006-03-09 Bio Wisdom Limited System and method for data extraction and management in multi-relational ontology creation
US7493333B2 (en) * 2004-09-03 2009-02-17 Biowisdom Limited System and method for parsing and/or exporting data from one or more multi-relational ontologies
US20060053171A1 (en) * 2004-09-03 2006-03-09 Biowisdom Limited System and method for curating one or more multi-relational ontologies
US20060053382A1 (en) * 2004-09-03 2006-03-09 Biowisdom Limited System and method for facilitating user interaction with multi-relational ontologies
US20060074833A1 (en) * 2004-09-03 2006-04-06 Biowisdom Limited System and method for notifying users of changes in multi-relational ontologies
US20060053175A1 (en) * 2004-09-03 2006-03-09 Biowisdom Limited System and method for creating, editing, and utilizing one or more rules for multi-relational ontology creation and maintenance
US7496593B2 (en) 2004-09-03 2009-02-24 Biowisdom Limited Creating a multi-relational ontology having a predetermined structure
US20060053172A1 (en) * 2004-09-03 2006-03-09 Biowisdom Limited System and method for creating, editing, and using multi-relational ontologies
US20060053173A1 (en) * 2004-09-03 2006-03-09 Biowisdom Limited System and method for support of chemical data within multi-relational ontologies
US7797144B2 (en) * 2005-03-18 2010-09-14 Eve Zoebisch Molecular modeling method and system
AU2006254543A1 (en) 2005-06-01 2006-12-07 Maxygen Holdings Ltd. PEGylated G-CSF polypeptides and methods of producing same
PT3305900T (pt) * 2005-12-01 2021-10-27 Nuevolution As Métodos de codificação enzimática para síntese eficaz de bibliotecas grandes
EP2007934A4 (en) * 2006-03-24 2010-06-30 Richard D Cramer DIRECT SYNTHESIS SYNTHESIS CREATION AND ITS USES FOR IDENTIFYING MOLECULES HAVING A 3D STRUCTURE SIMILAR TO LARGE PHARMACEUTICAL COMPOUNDS
US20090228463A1 (en) * 2008-03-10 2009-09-10 Cramer Richard D Method for Searching Compound Databases Using Topomeric Shape Descriptors and Pharmacophoric Features Identified by a Comparative Molecular Field Analysis (CoMFA) Utilizing Topomeric Alignment of Molecular Fragments
US8374837B2 (en) * 2008-06-04 2013-02-12 Silicos Nv Descriptors of three-dimensional objects, uses thereof and a method to generate the same
KR102091207B1 (ko) 2009-02-13 2020-03-20 엑스-켐, 인크. Dna―코딩된 라이브러리의 생성 및 스크리닝 방법
EP3540059A1 (en) 2010-04-16 2019-09-18 Nuevolution A/S Bi-functional complexes and methods for making and using such complexes
EP2447865A1 (en) 2010-10-29 2012-05-02 COSMOlogic GmbH & Co. KG Molecular field analysis based on cosmo polarization densities
EA032438B1 (ru) 2011-09-07 2019-05-31 Икс-Чем, Инк. Способы мечения днк-кодированных библиотек
CN102682209B (zh) * 2012-05-03 2014-11-05 桂林理工大学 有机污染物定量结构活性相关建模的变量筛选方法
NZ739931A (en) 2012-07-13 2019-08-30 X Chem Inc Dna-encoded libraries having encoding oligonucleotide linkages not readable by polymerases
US8854361B1 (en) * 2013-03-13 2014-10-07 Cambridgesoft Corporation Visually augmenting a graphical rendering of a chemical structure representation or biological sequence representation with multi-dimensional information
CN103150482B (zh) * 2013-03-28 2016-03-16 湖南中烟工业有限责任公司 一种基于pls确定烘丝工艺参数影响因子的方法
JP6273470B2 (ja) * 2013-05-10 2018-02-07 ナノフォトン株式会社 分子振動の表示方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01159767A (ja) * 1987-12-16 1989-06-22 Toshiba Corp 化学分子構造表示装置
JPH0353380A (ja) * 1989-07-20 1991-03-07 Fuji Photo Film Co Ltd 化合物の対称性の処理方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4473889A (en) * 1981-09-11 1984-09-25 Leeds & Northrup Company Remote correlation of sequence of events
US4461619A (en) * 1981-12-29 1984-07-24 Medical College Of Georgia Research Inst. Method of predicting biological activity of compounds by nucleic acid models
JPS58175077A (ja) * 1982-04-07 1983-10-14 Nippon Kagaku Gijutsu Joho Center 化合物の立体化学情報記憶方法及び装置
US4642762A (en) * 1984-05-25 1987-02-10 American Chemical Society Storage and retrieval of generic chemical structure representations
US4704692A (en) * 1986-09-02 1987-11-03 Ladner Robert C Computer based system and method for determining and displaying possible chemical structures for converting double- or multiple-chain polypeptides to single-chain polypeptides
US4835708A (en) * 1987-07-06 1989-05-30 Spectra Physics, Inc. Method and apparatus for analysis of chromatograms using cross-correlation and moment analysis
US5025388A (en) * 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
EP0768377A1 (en) * 1988-09-02 1997-04-16 Protein Engineering Corporation Generation and selection of recombinant varied binding proteins
EP0431189A4 (en) * 1989-06-30 1992-04-22 Hitachi, Ltd. Method of assisting material design and apparatus therefor
SE470430B (sv) * 1989-09-18 1994-02-21 Tore Brinck Sätt att utnyttja kvantkemiska metoder vid molekyl-design

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01159767A (ja) * 1987-12-16 1989-06-22 Toshiba Corp 化学分子構造表示装置
JPH0353380A (ja) * 1989-07-20 1991-03-07 Fuji Photo Film Co Ltd 化合物の対称性の処理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005529158A (ja) * 2002-05-28 2005-09-29 ザ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・ペンシルベニア 両親媒性ポリマーのコンピュータ分析および設計のための方法、システムおよびコンピュータプログラム製品
JP2006113878A (ja) * 2004-10-15 2006-04-27 Ryoka Systems Inc 受容体−リガンド安定複合体構造探索方法
JP4688467B2 (ja) * 2004-10-15 2011-05-25 株式会社菱化システム 受容体−リガンド安定複合体構造探索方法

Also Published As

Publication number Publication date
DE592421T1 (de) 1994-08-18
GB9315049D0 (en) 1993-09-01
EP0592421B1 (en) 1997-03-26
DE69125399D1 (de) 1997-04-30
GB2266391A (en) 1993-10-27
EP0592421A1 (en) 1994-04-20
US5025388A (en) 1991-06-18
US5307287A (en) 1994-04-26
EP0592421A4 (ja) 1994-08-31
DE69125399T2 (de) 1997-10-23
DK0592421T3 (da) 1997-10-06
WO1992022875A1 (en) 1992-12-23

Similar Documents

Publication Publication Date Title
JPH06503908A (ja) 比較分子場解析法
Cohen et al. Molecular modeling software and methods for medicinal chemistry
Furey Phases
Potterton et al. Developments in the CCP4 molecular-graphics project
Petrey et al. GRASP2: visualization, surface properties, and electrostatics of macromolecular structures and sequences
EP1673626B8 (en) Method and apparatus for analysis of molecular combination based on computations of shape complementarity using basis expansions
WO2005083616A1 (ja) リガンド探索装置、リガンド探索方法、プログラム、および記録媒体
WO2019235567A1 (ja) タンパク質相互作用解析装置及び解析方法
Sensoy et al. Computational studies of G protein-coupled receptor complexes: Structure and dynamics
JP6484612B2 (ja) 改善された治療リガンドの取得
Koby et al. High-throughput binding free energy simulations: Applications in drug discovery
Wang Searching for the origin of protein conformational changes: Protein responses to specific forces in simulations
Huang Protein Ligand Binding Molecular Dynamics Simulations and Large-Scale Lead Identification
Yin Parametrization for empirical force field calculations and a theoretical study of membrane permeability of pyridine derivatives
Hurley Advancing Simulation Methods for Molecular Design and Drug Discovery
Walker Automating chemistry of small molecules with the AMOEBA model
Varkey et al. Interplay of Epitope Landscapes: Unraveling Molecular Recognition through Mapping, Docking, and Simulation
Turk Boxes of Model Building and Visualization
Veevers Applications of machine learning to problems in biomolecular function and dynamics
Nde Kengne Modeling Protein Dynamics and the Topological Assembly Pathway of the Multi-subunit Macromolecular Complexes
Abdulyaqeen Computer Modelling of an Enzyme Reference Reaction for Empirical Valence Bond Simulation
Carreras Conill et al. Effects of temperature on the shape and symmetry of molecules and solids
Furey et al. Programs and program systems in wide use
Ainsley Computational simulations of enzyme dynamics and the modelling of their reaction mechanisms
Iakovou Simulating molecular docking with haptics.