JP2015072691A - リード分子交差反応の予測・最適化システム - Google Patents

リード分子交差反応の予測・最適化システム Download PDF

Info

Publication number
JP2015072691A
JP2015072691A JP2014211968A JP2014211968A JP2015072691A JP 2015072691 A JP2015072691 A JP 2015072691A JP 2014211968 A JP2014211968 A JP 2014211968A JP 2014211968 A JP2014211968 A JP 2014211968A JP 2015072691 A JP2015072691 A JP 2015072691A
Authority
JP
Japan
Prior art keywords
lead
potential
reaction
chemical
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014211968A
Other languages
English (en)
Inventor
キタ、デビット
David Kita
フォドール、エニコ
Fodor Eniko
プラカシュ、アディティヨ
Prakash Aditya
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Verseon Corp
Original Assignee
Verseon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Verseon Corp filed Critical Verseon Corp
Publication of JP2015072691A publication Critical patent/JP2015072691A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Pathology (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Computing Systems (AREA)
  • Toxicology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】リード候補生体分子と、生体高分子であることが多い潜在的な反応物質分子との間の有害な交差反応を予測する方法を提供する。【解決手段】計算システムでは、適切な環境において反応をモデル化して、リード候補分子と潜在的な反応物質分子の間の反応プロファイルを求める。次いで、各リードと複数の潜在的な反応物質分子についての複数の反応プロファイルに基づいて、リードごとにリスク評価を生成する。予測される有害な交差反応をなくすために、反復してリード候補を再設計し最適化することを含む。【選択図】図5

Description

本発明は、概ね、バイオインフォマティクス、プロテオミクス、分子モデリング、コンピュータ支援分子設計(CAMD)に関し、より詳細には、コンピュータ支援薬物設計(CADD)および分子の組合せの計算によるモデル化に関する。
本願は、2003年10月14日出願の「Lead Molecule Cross Reaction Prediction and Optimization Process」という名称の米国仮出願第60/511474号の優先権を主張し、その正式出願である。事実上、この内容全体を参照により本明細書に組み込む。
本開示は、(本願と同日に出願のプラカッシュ他の「Method and Apparatus for Analysis of Molecular Configurations and Combinatios」という名称の米国特許出願第 号(弁理士整理番号第021986−000310US)(以下、「プラカッシュ I」と称する)本発明の譲受人に譲渡された出願/特許である米国特許第 号に関係するものである。
事実上、これらの出願/特許のそれぞれの開示全体を参照により本明細書に組み込む。
従来方式の創薬プロセスおよびそれらの制限を説明すると、本発明を理解するのに有用であろう。
何らかの生物学的な異常の処置または治療する新薬を創り出すことは、時間とコストがかかるプロセスであり、典型的には、1つの薬物当たり平均して12年の年月および8億ドルの費用がかかり、場合によっては、完成するのにおそらくは最大で15年以上の年月および10億ドルの費用がかかる。このプロセスは、薬物自体または最終的な薬物分子の前駆体として働く潜在的な化学化合物の識別、評価、最適化を行うためのウェット・ラボによる試験/実験、様々な生化学および細胞に基づくアッセイ、動物モデル、および計算ツールの形式での計算によるモデリングを含み得る。
創薬プロセスの目標は、潜在的な分子の相互作用または組合せを介して、生体内の1つまたは複数の生体分子(すなわち、薬物の「標的」)の機能に影響を及ぼす化学化合物またはリガンド、すなわち、結合剤、生体分子を識別し特徴付けることであり、これらは通常、生体高分子である。本明細書では、生体高分子という用語は、タンパク質、核酸(DNAまたはRNA)、ペプチドまたはヌクレオチドの配列、あるいはこれらの断片の任意の部分のうち1つまたは複数を含む巨大分子を指す。本明細書では、生体分子という用語は、生体高分子、炭化水素、ホルモンその他の無機または有機の分子あるいは化合物のうち1つまたは複数を含む化学的な実体を指す。これらには、合成化合物、医薬化合物、薬物様化合物、または天然化合物、あるいはこれらの任意の部分または断片が含まれるが、これらに限定されるものではない。標的分子は、典型的には、病気に関係する標的のタンパク質または核酸であり、その機能、構造、および/または化学的活性の変化に影響を及ぼし、それによって患者の病気その他の疾患の処置の助けとなることが望まれるものである。他の場合には、標的は、ウィルス、細菌、または寄生生物など、病気の原因となる生物内に見つかる生体分子であり、薬物の影響を受けると、この感染性生物の生存または活動が影響を受けることになるものである。他の場合には、標的は、癌細胞などの異常または有害な細胞の生体分子である。他の場合には、標的は、アレルギー反応その他の望まれない免疫学的または生物学的な応答を誘発し得る抗原その他の環境的な化学作用物質である。
リガンドは、典型的には、薬効、低毒性、膜透過性、溶解性、化学/代謝安定性などの点で所望の薬物様の特性を備えた小型分子による薬物または化学化合物として知られているものである。他の場合には、リガンドは、生物学的なもの、例えば、タンパク質系またはペプチド系の注入薬物とすることもできるし、あるいは別の完全なタンパク質とすることさえできる。他の場合には、リガンドは、標的酵素の化学的な基質とし得る。リガンドは、標的に共有結合させることさえでき、また実際には、タンパク質の一部、例えば、タンパク質の2次構造成分、活性部位を含むタンパク質ドメインまたは活性部位近傍のタンパク質ドメイン、適切なタンパク質4次構造のタンパク質サブユニットなどとすることもできる。
背景技術の考察の残りの部分を通じて、具体的に区別しない限り、(潜在的な)分子の組合せは1つのリガンドおよび1つの標的を扱い、これらのリガンドおよび標的は別々の化学的な実体であり、リガンドは化学化合物と仮定し、標的は、典型的には、(突然変異型または野生型の)生物学的なタンパク質とする。近年、標的としての核酸(DNA/RNAとも)の頻度は、遺伝子治療および病原微生物学が進歩するにつれ増加する可能性があることに留意されたい。また、「分子複合体」という用語は、適切な(しばしば水を含む)環境中で標的とリガンドが相互作用するときの両者の結合状態を指す。「潜在的な」分子複合体は、確率は低いが発生し得る結合状態、したがって、通常の条件下で実際に形成されることもあり、されないこともある結合状態を指す。
創薬プロセス自体は、典型的には、(1)標的の実証、(2)リードの創製/最適化、(3)臨床前試験、および(4)臨床的な治験および承認の4つの異なるサブプロセスを含む。
標的の実証には、病気に関連する1つまたは複数の標的の確定が含まれ、通常、完了するのに2年半かかる。この標的実証段階の結果には、生物内の標的分子の存在または活動により、治療または処置を試みる病気が発症するか、悪化するか、または、それに寄与するある種の作用が生じるか、または影響を受けることを確定することが含まれる。場合によっては、実験的な方法により、標的についての天然の結合剤または基質を確定することもできる。
リードの創製は、典型的には、リード化合物、すなわち、標的分子に結合し得るリガンドの識別に関わるものである。これらのリガンドは、標的の機能の活性化、不活性化、触媒作用、または抑制によって標的の作用を改変し得るものである。この場合、リードは、薬物適用プロセスで使用する適切なリガンドの候補とみなされる。リードの最適化は、所望の標的との結合親和性を向上させ、選択性を増大させ、毒性、溶解性、および代謝性の基本的な問題に対処するために、リード候補を化学的かつ構造的に改善して薬物前駆体にすることに関わるものである。リードの創製およびリードの最適化を合わせて完了するのに、典型的には約3年かかり、さらなる考察を行うための1つまたは複数の化学的に異なるリードを得ることができる。
臨床前試験では、生化学的アッセイおよび動物モデルを用いて、薬物の吸収および膜透過性、分布、代謝、排泄、毒性、副作用、および必要とされる投薬量に関係する様々な薬物動態学因子について、選択されたリードを試験する。この臨床前試験は約1年かかる。臨床前試験期間後、臨床の治験および承認には、さらに6〜8年以上かかり、その間、人間の被験者に対して安全および薬効について薬物候補を試験する。今日の創薬の途方もない経費は、1つには、最適化したリードの多くが依然として、副作用その他の理由から臨床前試験および臨床試験で不合格になることからくるものである。実際、臨床治験を通過し、最終的に承認される薬物の数は、創薬プロセスの初期に実証された標的タンパク質について開始されるプロジェクトの数と比較して極めて少ない。
合理的な薬物設計は一般に、有効なリード候補の創製および最適化を設計する基礎として、薬物の標的についての構造的な情報を利用し(構造に基づく設計)、かつ/またはこれらの天然リガンドを利用する(リガンドに基づく設計)。構造に基づく合理的な薬物設計は一般に、標的構造の3次元モデルを利用する。標的のタンパク質または核酸の場合、このような構造は、X線結晶解析/NMRその他の測定手順の結果であることもあるし、相同性モデリング、タンパク質モチーフおよび保存されているドメインの解析、および/またはタンパク質の折畳みまたは核酸の等価物の計算モデリングから得ることもできる。多数の膜関連標的タンパク質、例えば、GPCRおよびイオン・チャネルなどを考慮するときに利用可能なものは、モデルにより構築された構造だけであることが多い。リガンドの構造は、同様のやり方で生成することもできるし、その代わりに、リガンドが生体高分子でない場合には、物理学および化学の基本原理を用いて最初から周知の2次元化学表現から構築することもできる。
合理的な薬物設計は、標的−リガンドの分子間の相互作用および組合せの計算によりモデル化してリードを最適化し、所望の薬物様の生物学的かつ薬物動態学的な特性を計算により予測することまで、いくつかの計算コンポーネントのいずれかを使用することを組み込むことができる。合理的な薬物設計の状況で計算によるモデル化を利用することは、概ね、生物学的な「ウェット」ラボ試験などにおけるしばしば時間集約的であり、コストのかかる労力をかけないことによって、必要とされる時間を短縮し、薬物研究開発への集中度およびその効率を改善したいという動機に基づいている。
リードを創製する状況での標的−リガンドの分子的な組合せの計算によるモデル化は、分子ライブラリの大規模なin silicoスクリーニング(すなわち、ライブラリ・スクリーニング)に関わることがある。これは、これらのライブラリが、1つまたは複数の構造データベースとして仮想的に生成され格納されているか、コンビナトリアル・ケミストリおよび有機合成によって構築されているかにかかわらず、対象とする標的分子に関する計算による生物活性の予測(または等価な尺度)に基づいて、選択されたリガンドのサブセットをランク付けする計算法を利用して行われる。
本明細書を通じて、「結合様式」という用語は、最小結合エネルギー(すなわち、最大結合親和性)での、またはその近傍の結合状態での潜在的な分子複合体の3次元分子構造を指す。ここで、(「結合自由エネルギー」またはそれと正反対の概念である「結合親和性」と置き換えられることがある)「結合エネルギー」という用語は、潜在的な分子複合体が形成された後の分子系の自由エネルギーの変化、すなわち、リガンドおよび標的の非結合状態から(潜在的な)結合状態への移行を指す。「系のポーズ」という用語も、結合様式を指すのに用いられることがある。ここで、自由エネルギーという用語は、概ね、構成要素原子間の物理的な相互作用、および分子のそれら自体の間の結合(すなわち、分子間および分子内の相互作用)の結果、かつ、これらを取り巻く環境、すなわち、1つまたは複数の分子間の反応部位の物理的かつ化学的な周囲状況によるエンタルピおよびエントロピの両方の作用を指す。自由エネルギーの例は、平衡統計力学のカノニカル集合またはグランド・カノニカル集合で見られるギブスの自由エネルギーである。
一般に、所与の標的−リガンド対の最適結合自由エネルギーは、化学的な平衡状態にある2つの分子間での組合せまたは潜在的な分子複合体の形成の確度に直接相関しているが、実際には、この結合自由エネルギーは、単一の結合様式ではなく、(推定)複合構造の集合を記述している。ただし、計算によるモデル化では、通常、自由エネルギーの変化は、最小エネルギーに対応する単一構造によって左右されると仮定する。これは、強い結合剤(pKが約0.1〜10ナノモル)について確かに当てはまるが、弱い結合剤(pKが約10〜100マイクロモル)には疑問の余地がある。通常は、支配的な構造が結合様式であるとみなされる。場合によっては、関連する系の状態がエネルギーの点でほぼ縮退しているとき、2つ以上の代替結合様式を考慮する必要があることがある。
結合親和性は、創薬および合理的な薬物設計に直接関わるものである。というのは、2つの分子の相互作用、例えば、生物学的なプロセスまたは経路の一部であるタンパク質と、この生物学的なプロセスまたは経路の改変を目標としようとする薬物候補との相互作用がしばしば、この薬物候補がどの程度その目的に役立つかを示す助けになるからである。さらに、結合様式が決定可能な場合、標的に対する薬物の作用をよりよく理解することができる。このような理解は、例えば、リガンドの1つまたは複数の特徴をさらに改変して、その(標的に関する)薬効、(他の標的生体高分子に関する)結合特異性、または他の化学的かつ代謝的な特性を改善することが望ましいときに有用であることがある。
標的分子とリガンドの親和性を測定または推定する実験室的な方法がいくつか存在する。しばしば、最初に標的を分離し、次いで、in vitroでリガンドと混合し、ハイスループット・スクリーニングに関連する生化学アッセイおよび機能アッセイなどで分子間相互作用を実験的に評価することがある。しかし、このような方法は、標的が分離しやすく、リガンドが製作しやすく、分子間相互作用が容易に測定される場合に最も有用であるが、標的を容易に分離することができない、あるいは、分離により生物学的なプロセスまたは病気の経路が妨げられる、あるいは、十分な量のリガンドを合成するのが難しい場合、あるいは、特定の標的またはリガンドがあらかじめ良好に特徴付けられない場合にはより問題である。後者の場合、標的とリガンドのあらゆる可能な組合せについて何千回もの、または何百万回もの実験が必要とされ、そのため、実験室的な方法を利用することは実現不可能なことがある。
まず、標的(さらに、タンパク質ファミリのメンバなどの関連の標的)および/またはこの標的に対する1つまたは複数の周知の天然の結合剤または基質の様々な化学的かつ生物学的な特性の特殊な知識を利用して、実験室での処理に必要とされる組合せの数を減らすことによってこの障害を解決するためのいくつかの試みがなされているが、依然としてほとんどの場合、実際的ではなく、コストがかかりすぎる。実験室の環境で実際に分子を組合せ、実験結果を測定する代わりの別の手法は、コンピュータを使用して、2つ以上の分子(すなわち、in silicoでモデル化した分子の組合せ)間の分子間相互作用のシミュレーションまたは特徴付けを行うことである。計算による方法を用いて分子の組合せおよび相互作用を評価することは通常、構造に基づくものであるか、リガンドに基づくものであるか、あるいはその両方であるかにかかわらず、合理的な薬物設計の1つまたは複数の段階に関係する。
所与の標的−リガンド対について、潜在的な分子の組合せの性質および/または確度を計算によりモデル化する場合、結合様式および親和性の実際の計算による予測は、慣習的に、(a)計算システムにより、リガンドと標的についての最適結合様式を予測しようと試みる「ドッキング」、および(b)計算システムにより、計算された結合様式に関連する結合親和性を推定しようと試みる「スコアリング」の2つの部分で実施される。ライブラリ・スクリーニング中に、スコアリングを利用して、標的分子に関して1つのリガンドと別のリガンドの相対的な結合親和性を予測し、それによって、これらのリガンドの優先順位を付け、また、結合の確率を割り当てることもできる。
ドッキングは、本質的に決定論的であるか、確率論的であるかにかかわらず、探索アルゴリズムまたは機能最適化アルゴリズムに関わり、その意図は、好ましい親和性を有する1つまたは複数の系のポーズを見付けることである。
スコアリングは、親和性関数をより精度よく推定することに関わり、ここで、親和性は、1つまたは複数の実験的な表現、分子力学に基づく表現、量子力学に基づく表現、または知識に基づく表現の組合せ、すなわち、スコアリング関数の形で表される。個々のスコアリング関数自体を組合せ、様々な式を使用してよりロバストなコンセンサス・スコアリング方式を形成する。実際、多くの異なるドッキング戦略およびスコアリング方式が、今日の計算による薬物設計の状況で採用されている。
計算によるドッキングおよび/またはスコアリングの別の重要な適用領域は、仮想ライブラリ・スクリーニングの範囲を超えて、in silicoリード最適化プロセスにおけるものである。この場合、リード候補と標的の結合親和性に関して、計算によりリード候補をより厳密に検査する。大部分の生体分子は、それらが、標的の通常の結合相手、あるいは別の天然化合物またはアンタゴニスト、さらには別の薬物を含めて、同じまたは近傍の活性部位において標的タンパク質と相互作用し得る他の生体分子を凌駕する場合にのみ潜在的な薬物として適切なものとなる。ハイスループット・スクリーニングの結果、識別されるのは、通常、結合親和性がマイクロモルまたはそれよりも悪い(すなわち、IC50が約1〜100マイクロモルの)リード候補のみである。リードの最適化は、1つ(または複数)のリード候補を改善または改変して、マイクロモル未満、さらにはナノモル(すなわち、IC50が約10−9)の薬物を創製することに関わるものである。リードの最適化を行うために改変されたリードの結合親和性を推定する典型的な計算による方法には、QSAR[53、54]、QM、MM、またはQM/MMによるシミュレーション[55]、摂動論を利用する系の自由エネルギーの変化の推定[56、57]、および構造に基づく分子設計で用いる他の方法[58]が含まれる。
ただし、潜在的なリード候補が1つまたは複数の所望の標的生体高分子に良好に結合しても、すなわち、良好な生体活性を示しても、候補の分子は最終的に、代謝、毒性、望まれない副作用、宿主の分布および意図する標的部位への送達、細胞間および細胞内の輸送、ならびに排泄に関する別の厳格な要件を満たさなければならない。潜在的な薬物分子としてのリード候補の存続可能性を評価し、それによっておそらくは、市販するまでのスケジュールが短くなり、研究開発の労力の無駄が少なくなるように、計算によるモデル化を採用して、いわゆるアドメトックス(ADME/Tox、吸収−分布−代謝−排泄−毒性)プロファイル[59]が生成される。
in silicoでアドメトックス・プロファイルを生成する際に、多くの尺度が関わっている。これらの尺度には、生物濃縮性、バイオ・アベイラビリティ、代謝、pKa、発癌性、突然変異性、Log D、n−オクタノール/水分配係数またはLog P、水溶性、血液脳関門その他の膜に関する透過性、腸内吸収、皮膚感受性、さらには、他の周知の薬物または有機化合物との化学的かつ構造的な類似性についての実験的に導かれた予測または推定が含まれる。ある種の尺度は、生体分子の物理的またはエネルギー的な特性、例えば、pKa、Log D、Log Pなどのより正確な数値計算または数値予測に関わるものである[60]。他の尺度は、典型的には、知識またはルールに基づく手法、例えば、既知の生物学的な経路および形質転換に基づく代謝特性の予測、リピンスキーの実験的な「5の法則(rule of five)」に基づく分布特性の定性的な予測[61]、およびケモインフォマティクスの知識データベースを利用して発癌性、突然変異性、奇形発生性、皮膚感受性などを評価する毒性の予測に関わるものである。他の尺度は、例えば、血液脳関門に関して透過性である既知の生体分子、あるいは、肝臓または腎臓などの様々な器官の機能におそらくは悪影響を及ぼす既知の生体分子との化学的かつ構造的な類似性に基づくものである。
しかし、これらの計算ツールがすべて揃っていても、人間(または他の)被験体を扱う臨床前試験および臨床治験における安全性および薬効の審理ために失敗する率が依然として高く、コストおよび市場機会を失うことの両方の点で不安定である。これらの失敗の主な理由は、所望の標的に結合する特異性が欠如しているために、宿主生物内でリード候補と(しばしば他の生体高分子である)他の生体分子との間に有害な交差反応が存在することである。これらの有害な交差反応によりしばしば、薬物候補の薬効が低減し、望まれない副作用が生じ、さらには、病気または死に至ることがある。
例えば、リード候補は、所望の標的タンパク質を抑制すると同時に、遺憾ながら、肝臓内で1つまたは複数のタンパク質あるいは細胞表面受容体にも結合し、それによって、化学的な不均衡が生じ、さらには、肝硬変などの深刻な病状が生じることがある。別の例では、リード候補は、宿主生物の免疫系によって病原体その他の抗原と誤って識別されることがあり、それによって、アレルギー反応その他の免疫疾患が生じることがある。皮肉にも、臨床治験に合格し承認された多くの市販薬でさえ、しばしば、不眠症、吐き気、脱水症、勃起障害、および眠気などの様々な望まれない副作用を伴う。抗癌薬または強力な抗細菌作用物質などの他の薬物は、例えば、様々な癌に用いる化学治療薬、HIV複合製剤など、基となる病気がそうしなければ致死性であるために医学会でしか許容されないはるかに深刻な副作用を有する。
潜在的な有害交差反応についてこのように前もって知識が得られれば、臨床前試験および臨床治験だけでなく、望まれない副作用がより少なく、薬効がより高い薬物候補を選択する際に関わる時間およびコストを削減することができ、それによって、その薬物の商業化に直接的な利益がもたらされることになる。
2003年9月30日現在、タンパク質データ・バンク(PDB)のウエブ・サイト(http://www.rcsb.org/pdb/)で公表されている情報によれば、20,501種類のタンパク質構造、948種類のタンパク質/核酸複合体、ならびに1233種類の核酸(および18種類の炭化水素)の合計22,700種類の巨大分子構造がPDBにあり、これらが約3年で倍になる率で増加すると予測されている[62]。これらの約83%はX線回折法で得られ、15%はNMRで得られ、残りの部分は他の実験的な方法で得られる。ほぼ20000種類のタンパク質構造が、1000種類を超える個々の種由来のものであり、そのうち、4767種類がヒト由来のものであり、2411種類が大腸菌由来のもの、1030種類がマウス由来のものなどである。一方、ほぼ1900種類が合成によるものであり、追加の4658種類の実体については、種が明確に同定されていない。種ごとの完全な内訳については、http://www.biochem.ucl.ac.uk/bsm/pdbsum/species/を参照されたい。PDBで利用可能なタンパク質構造情報のさらなる解析および分類は、[65]および[66]に出ている。ヒト以外のタンパク質についてPDBで利用可能なタンパク質構造はしばしば、特に、マウス、ブタ、ニワトリ、線虫、酵母菌などの他の生物由来の多くのタンパク質が、構造および機能の両方の点でヒトのタンパク質に相同であることを考慮すると、薬物設計ための豊富な情報を有する。さらに、ある種の病気の標的は、ウィルスまたは細菌のタンパク質など、ヒト以外のタンパク質に関わるものである。構造プロテオミクスおよび機能ゲノミクスにおける新しい進歩により、利用可能な質の高い機能注釈付き3次元タンパク質構造の数が増え続けている。また、相同性モデル化、タンパク質モチーフ、およびタンパク質スレッディングにおける別の進歩により、実験により得られたタンパク質および核酸の3次元構造が継続して補完されている。そのため、多数の薬物候補について良好に特徴付けられた潜在的な交差反応物質の一覧は既にかなりのものになりつつあり、今後、増え続ける一方であろう。
本発明より以前は、コンピュータ・ベースのシステムで、リード分子(すなわち、潜在的な薬物候補)の有害反応を正確かつ効果的に計算する体系的な方法はなかった。
近年、「逆ドッキング」と称する方法では、はるかに限定された範囲の問題、すなわち、単一の薬物様分子についての代替標的の識別に注目しており、これは、チェン、ワイ・ゼット、ジー、ディー・ジー、「Ligand−Protein Inverse Docking and Its Potential Use in the Computer Search of Protein Targets of a Small Molecule」、Proteins、第43巻、217〜226頁、2001年、さらに、チェン、ワイ・ゼット、ジー、ディー・ジー、ウン、シー・ワイ、「Computational Method for Drug Target Search and Application in Drug Discovery」、Journal of Theoretical and Computational Chemistry、第1巻、第1号、213〜224頁、2002年に記載されている(以下、「チェン他」と称する)。これらをすべて全体として、参照によりここに組み込む。この限定された範囲でさえ、これらの方法は、これから説明するように、大きな欠点を有する。チェン他の方法は、概ねUCSFのソフトウエアであるドッキング・ツールDOCK[5、6、7]に関連する「sphgen」アルゴリズムと、既知の薬物候補と潜在的な代替標的の相互作用を評価するワン他[33]に記載のハイブリッド・ドッキング法とを組み合わせたものを本質的に利用する極めて特殊な幾何学アルゴリズムに依存している。当技術分野では、このような手法は、ほとんどのリガンドについて、結合エネルギーの正確な測定はおろか、正確な結合様式を予測する際にあまり当てにならないことが既に実証されている。
このような方法は、結合エネルギーを簡単な分子力学により予測することに依拠しており、これは、当技術分野では、ほとんどの系について自由エネルギーの変化を誤差±3kcal/molで予測するために知られているものである[34〜39]。2kcal/molの差でさえ、分子系の解離定数または阻害定数のほぼ30倍の差になる。そのため、チェン他の方法が、系の結合エネルギーの絶対変化を良好に推定すると期待することはできない。このことは実際に、著者ら自身が公表したデータを厳密に調べることによって裏付けられる。チェン他(2002年)の表1では、9個の系のうち4個(1hvr、4phv、1dhf、3cpa)の結合自由エネルギーの実験値が一般に利用可能である(http://www−mitchell.ch.cam.ac.uk/pld/energy.phpで公開されており、それぞれ、−13.13、−12.86、−3.08、および−5.39kcal/molである)。これは、それぞれ−70.2、−94.51、−48.67、および−40.63kcal/molの報告されている予測値と全く対照的である。さらに、1hvrおよび4phvのpdbエントリのリガンドは、同じHIV−1プロテアーゼ標的タンパク質に対して類似の結合親和性を有することが実験的に測定されているが、対応する予測値は、34%よりも大きく外れており、かなりの誤差がある。
さらに、チェン他の方法は、潜在的な標的タンパク質の関連する活性部位をあらかじめ正確に特徴付けることに依拠している。このような事前情報は、タンパク質については、それらの天然結合剤またはアゴニスト/アンタゴニストに関係してしばしば入手可能であるが、様々な生体高分子と、他の特定の標的タンパク質について設計されたリード候補との間の潜在的な交差反応を調べるときには当てはまらないことが多い。
さらに、チェン他の方法では、リガンド原子の数の多項式関数を、これらリガンド原子のドッキング・プロトコルによってpdb構造のサブセットに対して生成された結果に合わせることに基づく実験的な閾値を用いて、ある種の偽陽性候補を除外する。リガンド原子の数に基づくこのような実験的な尺度が、現在までに集計された結合自由エネルギーの実験観察データと良好に相関しないことが当業者には理解されよう。
最後に、上記で列挙した理由から、チェン他の方法は、潜在的候補と少なくとも1つの他の「競合する」リガンドとの複合体を扱う少なくとも1つのpdbエントリが存在することを必要とし、それによって、問題のリガンドについての結合親和性の予測をより良好に較正して、その適用性をさらに限定する。しかし、pdb構造の多くは、関連する結合リガンドを含まず、他の多くは、リード候補に関連し得る部位と全く異なる活性部位でリガンドに結合している。さらに、多くの系では、標的タンパク質は、非結合状態から結合状態に移行するときに大きな配座変化、すなわち、「誘導適合」を受ける。そのため、受容体の柔軟性を適切にモデル化する仕組みが欠如している場合、結合配座状態を利用することは多くの系では不適切である。カルボキシペプチダーゼAと複合体を作る様々な小型ペプチドおよびカルモジュリンとタモキシフェンの複合体の例があり、これらはいずれも、チェン他の結果の一覧に含まれるものである。これらの要因があいまって、チェン他が公開した方法によってスクリーニングし得る潜在的な標的の範囲が大きく制限されることがある。
チェン他の方法は、複数の潜在的なタンパク質標的に対して所与の薬物候補を高速に処理するために、予測の精度および確かさをともに犠牲にする。これは、リード候補の追加の2次治療標的を「探り出す」ことを意図している。あらかじめ特徴付けられた関連活性部位において少なくとも1つの競合リガンドと潜在的な標的が複合するという要件により、代替標的生体高分子の大きな集合に対して潜在的な望まれない副作用および他の有害な交差反応を識別することに関してこれらの候補が極めて魅力のないものになっている。
さらに、後でより詳細に論じるように、現在までの先行技術は、有害な交差反応を予測し、創薬プロセスの改善に適用することに関する他の3つの極めて重要な問題に対処していない。第1の問題は、公共ドメインおよび所有権下にあるドメインに存在する巨大分子標的についての機能、ソース、他の構造との相同性、および系統分類に関する豊富な注釈情報を利用して、潜在的な有害交差反応についてよりよく判定する方法である。第2の問題は、リード分子の集合の有効な比較評価を、それらの潜在的な交差反応プロファイルに基づいて生成する方法である。第3の問題は、結合特異性が欠如しているために1つまたは複数の潜在的な有害交差反応を示すリード候補を再構築または再設計して、所望の治療標的との結合と潜在的に有害な交差反応物質との結合をいかに大きく区別するかを推測ために、高度な計算によるモデル化の結果を用いて、生体分子を臨床治験で存続可能な薬物候補にする方法である。
創薬プロセスを大きく改善する際の潜在的な交差反応の事前知識の重要性は既に上記で説明した。このような知識は、明らかに、副作用が少なく、低コストで、臨床試験に合格する確度がより高いよりよい薬物を設計する助けとなる。本発明では、この極めて重要な要求に対処するシステムおよび方法を説明する。
参照文献および先行技術
本発明の分野における先行技術は大量に文書化されている。以下、それらを概観することを試みる。
ドゥルース[1]は、創薬の現況をうまく概観している。[2]では、アバギャンおよびトトロフは、ハイスループットのドッキングおよびスコアリングならびにその応用例の状況を示している。ラム他[3]はさらに、あるタンパク質ファミリに対して複数のコンビナトリアル・ライブラリを設計し、ドッキングし、仮想的にスクリーニングする一般手法を教示している。最後に、ワスコイチ他[4]は、複数のコンピュータを使用し、特定の標的に対する大きなリガンド・ライブラリの仮想スクリーニングを、リガンドを群にして特性のコンピュータに割り当てることによって加速することを記載している。
[1]ジェイ・ドゥルース、「Drug Discovery:A Historical perspective」、Science、第287巻、1960〜1964頁、2000年
[2]ルーベン・アバギャン、マキシム・トトロフ、「High−throughput docking for lead generation」、Current Opinion in Chemical Biology、第5巻、375〜382頁、2001年
[3]ラム、エム・エル、バーディック、ケイ・ダブリュー、トバ、エス、ヤング、エム・エム、スキルマン、エイ・ジー他、「Design,docking,and evaluation of multiple libraries against multiple targets」、Proteins 第42巻、296〜318頁、2001年
[4]ワスコイチ、ビー、パーキンス、ティー・ディー・ジェイ、サイクス、アール・エイ、リー、ジェイ、「Large−scale virtual screening for discoverying leads in the post−genomic era」、IBM Systems Journal、第40巻、第2号、2001年
ドッキング・シミュレーションを実施するのに現在使用されているソフトウエア・ツールの例がいくつかある。これらの方法は、a)幾何学的ハッシュ法、ポーズ・クラスタリングを利用する表面相関またはグラフ・パターン・マッチングに基づく剛体パターン・マッチング・アルゴリズム、b)段階的構成(incremental construction)または「配置し結合する」演算子を含めて断片に基づく方法、c)モンテ・カルロ法、シミュレーテッド・アニーリング、または遺伝子(またはミーム)アルゴリズムを用いることを含めて確率最適化法、d)分子動力学シミュレーション、またはe)これらから導出したハイブリッド戦略を利用することを含めて、広範な計算技術に関わるものである。
最初のドッキング・ソフトウエア・ツールは、1982年にUCSFで開発され(バージョン1.1)、現在はバージョン5.0まである(拡張機能は、段階的構成を含む)DOCKと呼ばれるグラフに基づく剛体パターン・マッチング・アルゴリズムであった[5、6、7]。グラフに基づくパターン・マッチング・アルゴリズムの他の例には、(GRID[9]、FLOG[10]、およびLIGIN[11]を使用する)CLIX[8]が含まれる。
[5]ショイチェット、ビー・ケイ、ボディアン、ディー・エル、クンツ、アイ・ディー、「Molecular docking using shape descriptors」、J.Comp.Chem.、第13巻、第3号、380〜397頁、1992年
[6]メン、イー・シー、シュベント、ディー・エイ、ブラニー、ジェイ・エム、アイ・ディー・クンツ、「Orientational sampling and rigid−body minimization in molecular docking」、Proteins:Structure,Function,and Genetics、第17巻、266〜278頁、1993年
[7]ユーイング、ティー・ジェイ・エイ、クンツ、アイ・ディー、「Critical Evaluation of Search Algorithms for Automated Molecular Docking and Database Screening」、J.Computational Chemistry、第18巻、第9号、1175〜1189頁、1997年
[8]ローレンス、エム・シー、デイビス、ピー・シー、「CLIX:A Search Algorithm for Finding Novel Ligands Capable of Binding Proteins of Known Three−Dimensional Structure」、Proteins、第12巻、31〜41頁、1992年
[9]カステンホルツ、エム・エイ、パスター、エム、クルシアーニ、ジー、ハークスマ、イー・イー・ジェイ、フォックス、ティー、「GRID/CPCA:A new computational tool to design selective ligands」、J.Medicinal Chemistry、第43巻、3033〜3044頁、2000年
[10]ミラー、エム・ディー、カースリー、エス・ケイ、アンダーウッド、ディー・ジェイ、シェリダン、アール・ピー、「FLOG:a system to select ‘quasi−flexible’ ligands complementary to a receptor of known three−dimensional structure」、J.Computer−Aided Molecular Design、第8巻、第2号、153〜174頁、1994年
[11]ソボレフ、ブイ、ウェイド、アール・シー、ブレンド、ジー、エデルマン、エム、「Molecular docking using surface complementarity」、Proteins、第25巻、120〜129頁、1996年。他の剛体パターン・マッチングによるドッキング・ソフトウエア・ツールには、形状に基づく相関法であるFTDOCK[12]およびHEX[13]、幾何学的ハッシュ法であるFischer他[14]、またはポーズ・クラスタリング法であるレアリー他[15]が含まれる。
[12]カチャルスキー−カツィール、イー、シャリフ、アイ、アイゼンスタイン、エム、フリーセム、エイ・エイ、アフラーロ、シー、バクサー、アイ・エイ、「Molecular surface recognition:Determination of geometric fit between proteins and their ligands by correlation techniques」、Proceedings of the National Academy of Sciences of the United States of America、第89巻、第6号、2195〜2199頁、1992年
[13]リッチー、ディー・ダブリュー、ケンプ、ジー・ジェイ・エル、「Fast Computation,Rotation,and Comparison of Low Resolution Spherical Harmonic Molecular Surfaces」、J.Computational Chemistry、第20巻、第4号、383〜395頁、1999年
[14]フィッシャー、ディー、ノレル、アール、ウルフソン、エイチ、ヌシノフ、アール、「Surface motifs by a computer vision technique:searches,detection,and implications for protein−ligand recognition」、Proteins、第16巻、278〜292頁、1993年
[15]レアリー、エム、ウェフィング、エス、レンガウアー、ティー、「Placement of medium−sized molecular fragments into active sites of proteins」、J.Computer−Aided Molecular Design、第10巻、41〜54頁、1996年
一般に、剛体パターン・マッチング・アルゴリズムは、標的およびリガンドがともに剛体であり(すなわち、可撓性でない)、したがって、小型の剛体分子(または分子の断片)が、簡単なタンパク質に、ほぼ剛体の明確な活性部位でドッキングするのに適したものであり得ると仮定する。そのため、このクラスのドッキング・ツールは、de novoリガンド設計、コンビナトリアル・ライブラリ設計、または1つのリガンド当たり複数の配座異性体を含む分子ライブラリの直裁的な剛体スクリーニングに適していることがある。
段階的構成に基づくドッキング・ソフトウエア・ツールには、(EMBLからライセンスを受けた)Tripos社のFlexX[16、17]、Hammerhead[18]、(任意選択として)DOCKバージョン4.0[7]、およびリーチ他のものぐさバックトラッキング・アルゴリズム[19]が含まれる。de novoリガンド設計の状況で段階的構成を利用するプログラムには、(Accelrys社の)LUDI[20]およびGrowMol[21]が含まれる。「配置し結合する」戦略に基づくドッキング・ソフトウエア・ツールには、デジャレー他[22]が含まれる。
[16]クレイマー、ビー、レアリー・エム、レンガウアー、ティー、「Evaluation of the FlexX incremental construction algorithm for protein−ligand docking」、Proteins、第37巻、228〜241頁、1999年
[17]レアリー・エム、クレイマー、ビー、レンガウアー・ティー、クリーブ、ジー、「A Fast Flexible Docking Method Using An Incremental Construction Algorithm」、J.Mol.Biol.、第261巻、470〜489頁、1996年
[18]ウェルチ、ダブリュー、ルーパート、ジェイ、ジェイン、エイ・エヌ、「Hammerhead:Fast,fully automated docking of flexible ligands to protein binding sites」、Chemical Biology、第3巻、449〜462頁、1996年
[19]リーチ、エイ・アール、クンツ、アイ・ディー、「Conformational Analysis of Flexible Ligands in Macromolecular Receptor Sites」、J.Comp.Chem.、第13巻、730〜748頁、1992年
[20]ボーム、エイチ・ジェイ、「The computer program LUDI:a new method for the de novo design of enzyme inhibitors」、J.Computer−Aided Molecular Design、第6巻、61〜78頁、1992年
[21]ボハチェク、アール・エス、マクマーティン、シー、「Multiple Highly Diverse Structures Complementary to Enzyme Binding Sites:Results of Extensive Application of a de Novo Design Method Incorporating Combinatorial Growth」、J.American Chemical Society、第116巻、5560〜5571頁、1994年
[22]デジャレー、アール・エル、シェリダン、アール・ピー、ディクソン、ジェイ・エス、クンツ、アイ・ディー、ベンカタラガバン、アール、「Docking Flexible Ligands to Macromolecular Receptors by Molecular Shape」、J.Med.Chem.、第29巻、2149〜2153頁、1986年
段階的構成アルゴリズムを利用して、良好に特徴付けられた活性部位を有する剛体標的分子への可撓性リガンドのドッキングをモデル化することができる。このようなアルゴリズムは、1つまたは複数の標的に対して可撓性リガンドのライブラリをスクリーニングするときに用いられる。このようなアルゴリズムは、比較的計算集約的ではなく、その結果、確率最適化に基づく多くの競合アルゴリズムよりも精度が低いことが多い。しかし、FlexXでさえ、標的−リガンドの1つの組合せを処理するのに1〜2分未満程度かかることがあり、そのため、依然として、ライブラリのサイズによっては(例えば、数千万以上の化合物の場合)計算が厄介なことがある。段階的構成アルゴリズムではしばしば、1つまたは複数のスコアリング関数を使用して、計算中に出くわす異なる系のポーズの値を求め、ランク付けする。最近、FlexXは、ある種の活性部位回転異性体のユーザ定義集合を用いることによって、標的分子の活性部位の部分的な可撓性を補償することを試みるために、FlexE[23]に拡張された。
[23]クラウセン、エイチ、ブニング、シー、レアリー・エム、レンガウアー・ティー、「FlexE:Efficient Molecular Docking Considering Protein Structure Variations」、J.Molecular Biology、第308巻、377〜395号、2001年
確率最適化に基づく計算によるドッキング・ソフトウエア・ツールには、(MolSoft社の)ICM[24]、(Schrodinger社の)GLIDE[25]、および(Accelrys社の)LigandFit[26](これらはすべて、変形モンテ・カルロ技法に基づくものである)、ならびにシミュレーテッド・アニーリングに基づく(Scripps Instituteの)AutoDockバージョン2.5[27]が含まれる。遺伝子アルゴリズムまたはミーム・アルゴリズムに基づく他のものには、GOLD[28、29]、DARWIN[30]、および(やはりScrippsの)AutoDockバージョン3.0[31]が含まれる。
[24]アバギャン、アール・エイ、トトロフ、エム・エム、クツネトソフ、ディー・エヌ、「Biased probability Monte Carlo conformational searches and electrostatic calculations for peptides and proteins」、J.Comp.Chem.、第15巻、488〜506頁、1994年
[25]ハルグレン、ティー・エイ、マーフィー、アール・ビー、フリースナー、アール・エイ、ベアード、エイチ・エス、フライ、エル・エル、ポラード、ダブリュー・ティー、バンクス、ジェイ・エル、「Glide:a new approach for rapid,accurate docking and scoring.2.Enrichment factors in database screening」、J Med Chem.、第47巻、第7号、1750〜1759頁、2004年
[26]ルーティ、ビー・エイ、ワッサーマン、ゼット・アール、スタウテン、ピー・エフ・ダブリュー、ホッジ、シー・エヌ、ザチャリアス、エム、マッカモン、ジェイ・エイ、「Molecular Mechanics/Grid Method for the Evaluation of Ligand−Receptor Interactions」、J.Comp.Chem.、第16巻、454〜464頁、1995年
[27]グッドセル、ディー・エス、オルソン、エイ・ジェイ、「Automated Docking of Substrates to Proteins by Simulated Annealing」、Proteins:Structure,Function,and Genetics、第8巻、195〜202頁、1990年
[28]ジョーンズ、ジー、ウィレット、ピー、グレン、アール・シー、「Molecular Recognition of Receptor Sites using a Genetic Algorithm with a Description of Desolvation」、J.Mol.Biol.、第245巻、43〜53頁、1995年
[29]ジョーンズ、ジー、ウィレット、ピー、グレン、アール・シー、リーチ、エイ、テイラー、アール、「Development and Validation of a Genetic Algorithm for Flexible Docking」、J.Mol.Biol.、第267巻、727〜748頁、1997年
[30]テイラー、ジェイ・エス、バーネット、アール・エム、Proteins、第41巻、173〜191頁、2000年
[31]モリス、ジー・エム、グッドセル、ディー・エス、ハリディ、アール・エス、ヒューイ、アール、ハート、ダブリュー・イー、ブリュー、アール・ケイ、オルソン、エイ・ジェイ、「Automated Docking Using a Lamarckian Genetic Algorithm and an Empirical Binding Free Energy Function」、J.Comp.Chem.、第19巻、1639〜1662頁、1998年
確率最適化に基づく方法を用いて、可撓性のリガンドの標的分子へのドッキングをモデル化することができる。このような方法では一般に、分子力学に基づく親和性関数の定式化を利用し、様々な戦略を採用して、有利な系の1つまたは複数のエネルギー極小値を探す。このような方法は、より計算集約的であるが、それに伴って競合する段階的構成による方法よりもロバスト性が高いことが多い。このような方法は本質的に確率論的なので、実行するたびに、またはシミュレーションするたびに、しばしば異なる予測値が得られることがある。従来、確率最適化法を利用する大部分のドッキング・ソフトウエア・ツールは、標的がほぼ剛体である(すなわち、活性部位における水素結合のドナー基とアクセプタ基は回転し得る)と仮定する。というのは、そうしないと、組合せによる複雑さが急激に増大し、そのため、適度な時間内に問題をロバストに解くことが難しくなるからである。
標的−リガンドの組合せを計算によりモデル化する状況では、分子動力学シミュレーションも用いられている。これには、(モンテ・カルロ法とともに)ディ ノーラ他[32]およびルーティ他[16]に示す実施形態が含まれる。原理的に、分子動力学シミュレーションは、タンパク質の可撓性を任意の程度にモデル化することができる。一方、分子動力学シミュレーションは、多数のきめ細かい時間ステップの値を求めることを必要とし、そのため、極めて時間集約的であることが多い(1つの標的−リガンドの組合せ当たり数時間程度、さらには数日程度)。分子動力学シミュレーションは、しばしば、有効な経路を選択するのに使用者との対話も必要とする。したがって、リードを発見するのに分子動力学シミュレーションを用いることが適しているのは、小数の見込みのあるリード候補を扱う予測される複合体を極小にする場合である。
[32]ディ ノーラ、エイ、ベレンドセン、エイチ・ジェイ・シー、ロッカターノ、ディー、「Molecular Dynamics Simulation of the Docking of Substrates to Proteins」、Proteins、第19巻、174〜182頁、1994年
ハイブリッド法は、選択した低エネルギー・リガンドの配座を高速にスクリーニングするために剛体パターン・マッチング技法の利用を必要とすることがあり、その後、モンテ・カルロ法によって残ったポーズの捻れ最適化を行い、最後にさらに、いくつか選択した(潜在的に)可撓性のタンパク質活性部位と組み合わせたリガンド構造に分子動力学による改善を加える。このタイプのドッキング・ソフトウエア戦略の例は、ワン他[33]である。
[33]ワン、ジェイ、コールマン、ピー・エイ、クンツ、アイ・ディー、Proteins、第36巻、1〜19頁、1999年。標的−リガンドの親和性を推定し、ライブラリ・スクリーニングにより異なるリガンドの優先順位を付け、また、結合様式を予測するために中間ドッキング・ポーズをランク付けるのに用いられる、ソフトウエアの形で実施されるスコアリング関数の例がいくつかある。従来、スコアリング関数は、a)実験的なスコアリング関数、b)分子力学に基づく表現、または、c)知識に基づくスコアリング関数、あるいはこれらから導出されるハイブリッド方式の3つの別個の範疇に分かれる。
(標的−リガンドの組合せに適用される)実験的に導出されるスコアリング関数は、当初、しばしばQSARの研究で用いられる自由エネルギーの線形な関係から考え出された。初期の例は、(LUDIで使用される)ベーム他[20、34]のものである。他の実験的なスコアリング関数には、(FlexXで使用される)SCORE[35]、ChemScore[36]、PLP[37]、Fresno[38]、およびGlideScoreバージョン2.0+(GLIDEが使用するChemScoreの改変形態)[39]が含まれる。
[34]ベーム、エイ・ジェイ、「The Development of a simple empirical scoring function to estimate the binding constant for a protein−ligand complex of known three−dimensional structure」、J.Comput−Aided Mol.Des.、第8巻、243〜256頁、1994年
[35]ワン、アール、ガオ、ワイ、ライ、エル、「A new empirical method for estimating the binding affinity of a protein−ligand complex」、J.Molecular Modeling、第4巻、379頁、1998年
[36]エルドブリッジ、エム・ディー、マリー、シー・ダブリュー、オートン、ティー・アール、パオリーニ、ジー・ブイ、ミー、アール・ピー、「Empirical scoring functions:I.The development of a fast empirical scoring function to estimate the binding affinity of ligands in receptor complexes」、J.Computer−Aided Molecular Design、第11巻、425〜445頁、1997年
[37]ゲルハー、ディー・ケイ、ブージダ、ディー、レイト、ピー・エイ、「Rational Drug Design:Novel Methodology and Practical Applications」、Parrill,L.、Reddy,M.R.監修、American Chemical Society、米国ワシントンD.C.、292〜311頁、1999年
[38]ログナン、ディー、ローエモラー、エス・エル、ホルム、エイ、ブース、エス、シンケ、ブイ・ジェイ、 Medicinal Chemistry、第42巻、4650〜4658頁、1999年
[39]ハルグレン、ティー・エイ、マーフィー、アール・ビー、フリースナー、アール・エイ、ベアード、エイチ・エス、フライ、エル・エル、ポラード、ダブリュー・ティー、バンクス、ジェイ・エル、「Glide:a new approach for rapid,accurate docking and scoring.2.Enrichment factors in database screening」、J Med Chem.、第47巻、第7号、1750〜1759頁、2004年
一般に、実験的なスコアリング関数は、特に、大きな化合物ライブラリをスクリーニングする状況では、今日使用されているスコアリング関数の大部分を含む。基本的な前提は、実験的なエネルギー・モデルにそれぞれ関連する数値的な重みを掛け、(いわゆる)「マスタ・スコアリング計算式」で表される1組の相互作用成分の1つを表すようにし、これらの1次結合を較正することである。この場合、前記計算式は、分子の組合せの結合自由エネルギーを良好に近似しようと試みる。これらの数値的な重み係数は、1組の学習用の標的−リガンド複合体用に構成された実験による結合自由エネルギー・データに合わせることによって得ることができる。
分子力学に基づくスコアリング関数は、当初、AMBER[40、41]、OPLS[42]、MMFF[43]、およびCHARMM[44]のように、分子力学の力場の状況で分子モデリングに利用するために開発された。分子力学に基づくスコアリング関数の例には、化学的かつエネルギーに基づくスコアリング関数である(AMBERに基づく)DOCKバージョン4.0[7]、GOLD[28、29]、(実験による重みを伴う)AutoDockバージョン3.0[31]、およびFLOG[10]で使用される目的関数がともに含まれる。
[40]パールマン、ディー・エイ、ケース、ディー・エイ、コールドウェル、ジェイ・シー、ロス、ダブリュー・エス、チーザムIII、ティー・イー、ファーガソン、ディー・エム、ザイベル、ジー・エル、シン、ユー・シー、ウィナー、ピー、コールマン、ピー・エイ、AMBER 4.1、University of California,San Francisco、1995年
[41]コーネル、ダブリュー・ディー、シープラック、ピー、ベイリー、シー・アイ、グールグ、アイ・アール、メルツ、ケイ・エム、ファーガソン、ディー・エム、スペルマイヤー、ディー・シー、フォックス、ティー、コールドウェル、ジェイ・ダブリュー、コールマン、ピー・エイ、「A second−generation force field for the simulation of proteins,nucleic acid,and organic molecules」、J.American Chemical Society、第117巻、5179〜5197頁、1995年
[42]ヨルゲンセン、ダブリュー・エル、ティラド−リベス、ジェイ、J.American Chemical Society、第110巻、1657〜1666頁、1988年
[43]ハルグレン、ティー・エイ、「Merck Molecular Force Field.I.Basis,Form,Scope,Parameterization,and Performance of MMFF94」、J.Comp.Chem.、第17巻、490〜519頁、1996年
[44]ブルックス、ビー・アール、ブルッコレリ、アール・イー、オルソン、ビー・ディー、ステイツ、ディー・ジェイ、スワミナサン、エス、カープラス、エム、「CHARMM:A Program for Macromolecular Energy,Minimization,and Dynamics Calculations」、J.Comp.Chem.、第4巻、187〜217頁、1983年
一般に、分子力学に基づくスコアリング関数は、多くの確率最適化に基づくドッキング・プログラムで使用される目的関数に極めて類似していることがある。このような関数は、典型的には、分子力学の1つまたは複数の力場(例えば、AMBER、MMFF、OPLSなど)に基づいて、様々な属性(例えば、電荷、質量、vdW半径、結合平衡定数など)の原子(または化学基)レベルのパラメータ化を必要とする。場合によっては、他の分子モデリング・ソフトウエア・パッケージの利用法に基づいて、リガンドについての関連するパラメータを割り当てることもできる。例えば、MOPAC[45]、AMPAC[46]、またはAMSOL[47]を利用することによってリガンドの部分的な電荷が割り当てられる。これらのパラメータは、分子内相互作用(すなわち、分子の自己エネルギー)、ならびに静電気などの遠距離相互作用も含み得る。場合によっては、リガンド−標的試験複合体を再生するのに最適化された数値的な重みによって、やはりエネルギー項の組合せを実現することができる。
[45]スチュワート、ジェイ・ジェイ・ピー、「Quantum Chemistry Program Exchange」、第10巻、86頁、1990年
[46]リオタード、ディー・エイ、ヒーリー、イー・エフ、ルイス、ジェイ・エム、デュワー、エム・ジェイ・エス、「Quantum Chemistry Program Exchange−no.506」、QCPE Bulletin、第9巻、123頁、1989年
[47]AMSOL−version 6.5.1、ジー・ディー・ホーキンス、ディー・ジェイ・ギーセン、ジー・シー・リンチ、シー・シー・チェンバース、アイ・ロッシ、ジェイ・ダブリュー・ストーラー、ジェイ・リー、ディー・リナルディ、ディー・エイ・リオタード、シー・ジェイ・クレイマー、ディー・ジー・トルーラー、University of Minnesota、Minneapolis、1997年
知識に基づくスコアリング関数は、当初、液体をモデル化するための平均力統計力学法のポテンシャルによって考え出された。例には、DrugScore[48]、PMF[49]、およびBLEEP[50]が含まれる。
[48]ゴールケ、エイチ、ヘンドリック、エム、クリーブ、ジー、「Knowledge−based Scoring Function to Predict protein−Ligand Interactions」、J.Mol.Biol.、第295巻、337〜356頁、2000年
[49]ミューゲ、アイ、マーティン、ワイ・シー、「A general and fast scoring function for protein−ligand interactions−a simplified potential approach」、J.Med.Chem.、第42巻、791〜804頁、1999年
[50]ミッチェル、ジェイ・ビー・オー、ラスコウスキー、アール・エイ、アレックス、エイ、ソーントン、ジェイ・エム、「BLEEP−Potential of Mean Force Describing Protein−Ligand Interactions II.Calculation of Binding Energies and Comparison with Experimental Data」、J.Comp.Chem.、第20巻、1165〜1176頁、1999年
一般に、知識に基づくスコアリング関数では、親和性関数を分割する必要はないが、関連する分子複合体の3次元構造の大きなデータベースを使用する必要がある。通常は、結合親和性が実験的に既知である分子複合体の1組のデータに回帰する必要もない。これらの方法は、所与の間隔の2つの原子の相互作用が有利なほど、無秩序なバルク媒体内では予想値よりも相互作用が頻繁に発生するという基礎仮定に基づいている。このような方式は、「逆ボルツマン」方式と称することがあるが、実際には、巨大分子における局所的な最適化された構造およびタンパク質の折畳みの存在は、距離に依存するペアワイズ・プリファレンス分布が厳密にボルツマンである必要がないことを意味する。例えば、溶媒和作用を近似するための溶媒接触可能表面積など、他の分子記述子に基づくシングレット・プリファレンスの概念を導入することも可能である。
ハイブリッド・スコアリング関数は、異なる型の1つまたは複数のスコアリング関数を合成したものとし得る。一例は、分子力学/実験的ハイブリッド関数であるVALIDATE[51]である。スコアリング関数の他の組合せは、分子の各組合せごとに複数の関数の値を求めることができ、1組のルールまたは統計的基準、例えば、各スコアリング関数の上位10%の順位一覧で生じる(共通部分に基づく)状態、平均順位が高い(平均に基づく)状態などに基づいて何らかの形式の「コンセンサス」決定がなされるコンセンサス・スコアリングの概念を含み得る。コンセンサス・スコアリングの考察の有用な検討は、ビサンツ他[52]に出ている。
[51]ヘッド、アール・ディー、スミス、エム・エル、オプリー、ティー・アイ、ウォーラー、シー・エル、グリーン、エス・エム、マーシャル、ジー・アール、「VALIDATE:A New Method for Receptor−Based Prediction of Binding Affinities of Novel Ligand」、J.American Chemical Society、第118巻、3959〜3969頁、1996年
[52]ビサンツ、シー、フォルカーズ、ジー、ログナン、ディー、「Protein−based virtual screening of chemical databases.1.Evaluation of different docking/scoring combinations」、J Med Chem、第43巻、4759〜4767頁、2000年
計算リソースの制約のためにリードの最適化中に特に使用する計算による他の方法には、QSAR(定量的構造活性相関)、QM/MMシミュレーション、および自由エネルギー摂動論が含まれる。これらのうち後者2つが、結合様式が既に良好に決定されている場合には、様々な複合体について結合親和性をより高精度に予測するにはより適切である。構造に基づく設計の状況でリードの最適化に適切な上記その他の方法には、ボハチェク他[58]で検討されているものが含まれる。
[53]「3D QSAR in Drug Design:Recent Advances」、(第1〜3巻)、ヒューゴ・クビニー(監修)、ゲルト・フォルカーズ(監修)、イボンヌ・シー・マーティン(監修)
[54]「Exploring QSAR:Hydrophobic,Electronic,and Steric Constants(ACS Professional Reference Book)」、コーウィン ハンシュ(監修)、アルバート・レオ(監修)、ディー・エイチ・フークマン(監修)
[55]マーフィー、アール・ビー、フィリップ、ディー・エム、フリースナー、アール・エイ、「Frozen Orbital QM/MM methods for density functional theory」、Chem.Phys.Letters、第321巻、113〜120頁、2000年
[56]アクビスト、ジェイ、メディーナ、シー、サミュエルソン、ジェイ・イー、「A new method for predicting binding affinity in computer−aided drug design」、Prot Eng、第7巻、385頁、1994年
[57]ジョーンズ−ハーツォグ、ディー・ケイ、ヨルゲンソン、ダブリュー・エル、「Binding Affinities for Sulfonamide Inhibitors with Human Thrombin Using Monte Carlo Simulations with a Linear Response Method」、J Med Chem、第40巻、1539頁、1997年
[58]ボハチェク、アール・エス、マクマーティン、シー、グイダ、ダブリュー・シー、「The Art and Practice of Structure−Based Drug Design:A Molecular Modeling Perspective」、Medicinal Research Reviews、第16巻、3頁、1996年
リードの最適化はしばしば、ウェット・ラボ、または計算手段、あるいはその両方のいずれによるかにかかわらず、リード候補についての様々な薬物動態学特性の評価を含む。これには、Log D、Log Pなどの様々な尺度を含むアドメトックス・プロファイル、ならびに、実験に基づくリピンスキーの「5のルール」が含まれる。
[59]エキンズ、エス、ローズ、ジェイ、「In silico ADME/Tox:the state of the art」、J Mol Graph Model、第20巻、第4号、305〜309頁、2002年
[60]ゴース、エイ、ケイ、ビスワナダン、ブイ・エヌ、ウェンドロスキー、ジェイ・ジェイ、「Prediction of hydrophobic(lipophilic)properties of small organic molecules using fragmental methods:An analysis of ALOGP and CLOGP methods」、J.Phys.Chem、第102巻、3762〜3772頁、1998年
[61]リピンスキー、シー・エイ、ロンバード、エフ、ドミニー、ビー・ダブリュー、フィーニー、ピー・ジェイ、「Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings」、Advanced Drug Delivery Reviews 1997、第23巻、3〜25頁、1997年
タンパク質データ・バンク(PDB)などの誰でもアクセス可能なデータベースに存在する様々な化合物と複合体を作るタンパク質に関して多くの実験的に得られた構造が存在する。GenBankおよびSwissProtなど、タンパク質および核酸の配列についての公共のデータベースも存在する。このようなデータベースの複数の解析を利用して、冗長性、配列類似性、発現した遺伝子の数などを含めて、データの様々な特性が推定されている。
[62]バーマン、エイチ・エム、ウェストブルック、ジェイ、フェン、ゼット、ジリランド、ジー、バート、ティー・エヌ、ワイシグ、エイチ、シンジャロフ、アイ、エヌ、ボーン、ピー・イー、「The Protein Data Bank」、Nucleic Acids Research、第28巻、235〜242頁、2000年
[63]www.ncbi.nlm.nih.gov/Genbank/
[64]バリロック、エイ、ベックマン、ビー、「The SWISS−PROT protein sequence data bank,recent developments」、Nucleic Acids Res、第21巻、3093〜3096頁、2003年
[65]ロスト、ビー、サンダー、シー、「Bridging the protein sequence structure gap by structure predictions」、Annual Review Biophys Biomol Struct、第25巻、113〜136頁、1996年
[66]ワン、ジー、ダンブラック、アール・エル、「PISCES:a protein culling server」、Bioinformatics、投稿中、2002年
[67]エイ・エル・ホプキンス、シー・アール・グルーム、「The Druggable Genome」、Nature Reviews Drug Discovery、第1巻、727〜730頁、2002年
[68]マーフィー、アール・ビー、フィリップ、ディー・エム、フリースナー、アール・エイ、「Frozen Orbital QM/MM methods for density functional theory」、Chem.Phys.Letters、第321巻、113〜120頁、2000年
構造データベースに関係する標的タンパク質および化合物について、構造的かつ化学的な情報をデジタル的に表現するための様々なファイル・フォーマットが存在する。例には、pdbフォーマット、(Tripos社の)mol2フォーマット、およびSMILESフォーマットが含まれる。
[69]ウェストブルック、ジェイ、フィッツジェラルド、ピー・エム、「Structural Bioinformatics」、ピー・イー・ボーン(監修)、エイチ・ワイシグ(監修)、John Wiley&Sons社、米国ニュージャージー州Hoboken所在、161〜179頁、2003年
[70]http://www.tripos.com/custResources/mol2Files/
[71]http://www.daylight.com/dayhtml/smiles/smiles−intro.html
[72]クラーク、エム、クレイマー、アール・ディー、オプデンボッシュ、エヌ、ブイ、「Validation of the General Purpose Tripos 5.2 Force Field」、J.Comp.Chem.、第10巻、982〜1012頁、1989年
[73]スタウテン、ピー・エフ・ダブリュー、フロメル、シー、ナカムラ、エイチ、サンダー、シー、「An effective solvation term based on atomic occupancies for use in protein simulations」、Molecular Simulation、第10巻、第2〜6号、97〜120頁、1993年
[74]http://www2.chemie.uni−erlangen.de/software/corina/index.html
[75]タカハシ、ワイ、サトー、ワイ、ササキ、エス、「Recognition of largest common structural fragment among a variety of chemical structures」、Analytical Sciences、第3巻、23〜28頁、1987年
[76]マクレガー、エム・ジェイ、パライ、ピー・ブイ、「Clustering of large databases of compounds using MDL Keys as structural descriptors」、J.Chem.Inf.Comput.Science、第37巻、頁443〜、1997年
米国仮出願第60/511474号 米国特許第 号
http://www.rcsb.org/pdb/ http://www.biochem.ucl.ac.uk/bsm/pdbsum/species/ チェン、ワイ・ゼット、ジー、ディー・ジー、「Ligand−Protein Inverse Docking and Its Potential Use in the Computer Search of Protein Targets of a Small Molecule」、Proteins、第43巻、217〜226頁、2001年 チェン、ワイ・ゼット、ジー、ディー・ジー、ウン、シー・ワイ、「Computational Method for Drug Target Search and Application in Drug Discovery」、Journal of Theoretical and Computational Chemistry、第1巻、第1号、213〜224頁、2002年 http://www−mitchell.ch.cam.ac.uk/pld/energy.php ジェイ・ドゥルース、「Drug Discovery:A Historical perspective」、Science、第287巻、1960〜1964頁、2000年 ルーベン・アバギャン、マキシム・トトロフ、「High−throughput docking for lead generation」、Current Opinion in Chemical Biology、第5巻、375〜382頁、2001年 ラム、エム・エル、バーディック、ケイ・ダブリュー、トバ、エス、ヤング、エム・エム、スキルマン、エイ・ジー他、「Design,docking,and evaluation of multiple libraries against multiple targets」、Proteins 第42巻、296〜318頁、2001年 ワスコイチ、ビー、パーキンス、ティー・ディー・ジェイ、サイクス、アール・エイ、リー、ジェイ、「Large−scale virtual screening for discoverying leads in the post−genomic era」、IBM Systems Journal、第40巻、第2号、2001年 ショイチェット、ビー・ケイ、ボディアン、ディー・エル、クンツ、アイ・ディー、「Molecular docking using shape descriptors」、J.Comp.Chem.、第13巻、第3号、380〜397頁、1992年 メン、イー・シー、シュベント、ディー・エイ、ブラニー、ジェイ・エム、アイ・ディー・クンツ、「Orientational sampling and rigid−body minimization in molecular docking」、Proteins:Structure,Function,and Genetics、第17巻、266〜278頁、1993年 ユーイング、ティー・ジェイ・エイ、クンツ、アイ・ディー、「Critical Evaluation of Search Algorithms for Automated Molecular Docking and Database Screening」、J.Computational Chemistry、第18巻、第9号、1175〜1189頁、1997年 ローレンス、エム・シー、デイビス、ピー・シー、「CLIX:A Search Algorithm for Finding Novel Ligands Capable of Binding Proteins of Known Three−Dimensional Structure」、Proteins、第12巻、31〜41頁、1992年 カステンホルツ、エム・エイ、パスター、エム、クルシアーニ、ジー、ハークスマ、イー・イー・ジェイ、フォックス、ティー、「GRID/CPCA:A new computational tool to design selective ligands」、J.Medicinal Chemistry、第43巻、3033〜3044頁、2000年 ミラー、エム・ディー、カースリー、エス・ケイ、アンダーウッド、ディー・ジェイ、シェリダン、アール・ピー、「FLOG:a system to select ‘quasi−flexible’ ligands complementary to a receptor of known three−dimensional structure」、J.Computer−Aided Molecular Design、第8巻、第2号、153〜174頁、1994年 ソボレフ、ブイ、ウェイド、アール・シー、ブレンド、ジー、エデルマン、エム、「Molecular docking using surface complementarity」、Proteins、第25巻、120〜129頁、1996年 カチャルスキー−カツィール、イー、シャリフ、アイ、アイゼンスタイン、エム、フリーセム、エイ・エイ、アフラーロ、シー、バクサー、アイ・エイ、「Molecular surface recognition:Determination of geometric fit between proteins and their ligands by correlation techniques」、Proceedings of the National Academy of Sciences of the United States of America、第89巻、第6号、2195〜2199頁、1992年 リッチー、ディー・ダブリュー、ケンプ、ジー・ジェイ・エル、「Fast Computation,Rotation,and Comparison of Low Resolution Spherical Harmonic Molecular Surfaces」、J.Computational Chemistry、第20巻、第4号、383〜395頁、1999年 フィッシャー、ディー、ノレル、アール、ウルフソン、エイチ、ヌシノフ、アール、「Surface motifs by a computer vision technique:searches,detection,and implications for protein−ligand recognition」、Proteins、第16巻、278〜292頁、1993年 レアリー、エム、ウェフィング、エス、レンガウアー、ティー、「Placement of medium−sized molecular fragments into active sites of proteins」、J.Computer−Aided Molecular Design、第10巻、41〜54頁、1996年 クレイマー、ビー、レアリー・エム、レンガウアー、ティー、「Evaluation of the FlexX incremental construction algorithm for protein−ligand docking」、Proteins、第37巻、228〜241頁、1999年 レアリー・エム、クレイマー、ビー、レンガウアー・ティー、クリーブ、ジー、「A Fast Flexible Docking Method Using An Incremental Construction Algorithm」、J.Mol.Biol.、第261巻、470〜489頁、1996年 ウェルチ、ダブリュー、ルーパート、ジェイ、ジェイン、エイ・エヌ、「Hammerhead:Fast,fully automated docking of flexible ligands to protein binding sites」、Chemical Biology、第3巻、449〜462頁、1996年 リーチ、エイ・アール、クンツ、アイ・ディー、「Conformational Analysis of Flexible Ligands in Macromolecular Receptor Sites」、J.Comp.Chem.、第13巻、730〜748頁、1992年 ボーム、エイチ・ジェイ、「The computer program LUDI:a new method for the de novo design of enzyme inhibitors」、J.Computer−Aided Molecular Design、第6巻、61〜78頁、1992年 ボハチェク、アール・エス、マクマーティン、シー、「Multiple Highly Diverse Structures Complementary to Enzyme Binding Sites:Results of Extensive Application of a de Novo Design Method Incorporating Combinatorial Growth」、J.American Chemical Society、第116巻、5560〜5571頁、1994年 デジャレー、アール・エル、シェリダン、アール・ピー、ディクソン、ジェイ・エス、クンツ、アイ・ディー、ベンカタラガバン、アール、「Docking Flexible Ligands to Macromolecular Receptors by Molecular Shape」、J.Med.Chem.、第29巻、2149〜2153頁、1986年 クラウセン、エイチ、ブニング、シー、レアリー・エム、レンガウアー・ティー、「FlexE:Efficient Molecular Docking Considering Protein Structure Variations」、J.Molecular Biology、第308巻、377〜395号、2001年 アバギャン、アール・エイ、トトロフ、エム・エム、クツネトソフ、ディー・エヌ、「Biased probability Monte Carlo conformational searches and electrostatic calculations for peptides and proteins」、J.Comp.Chem.、第15巻、488〜506頁、1994年 ハルグレン、ティー・エイ、マーフィー、アール・ビー、フリースナー、アール・エイ、ベアード、エイチ・エス、フライ、エル・エル、ポラード、ダブリュー・ティー、バンクス、ジェイ・エル、「Glide:a new approach for rapid,accurate docking and scoring.2.Enrichment factors in database screening」、J Med Chem.、第47巻、第7号、1750〜1759頁、2004年 ルーティ、ビー・エイ、ワッサーマン、ゼット・アール、スタウテン、ピー・エフ・ダブリュー、ホッジ、シー・エヌ、ザチャリアス、エム、マッカモン、ジェイ・エイ、「Molecular Mechanics/Grid Method for the Evaluation of Ligand−Receptor Interactions」、J.Comp.Chem.、第16巻、454〜464頁、1995年 グッドセル、ディー・エス、オルソン、エイ・ジェイ、「Automated Docking of Substrates to Proteins by Simulated Annealing」、Proteins:Structure,Function,and Genetics、第8巻、195〜202頁、1990年 ジョーンズ、ジー、ウィレット、ピー、グレン、アール・シー、「Molecular Recognition of Receptor Sites using a Genetic Algorithm with a Description of Desolvation」、J.Mol.Biol.、第245巻、43〜53頁、1995年 ジョーンズ、ジー、ウィレット、ピー、グレン、アール・シー、リーチ、エイ、テイラー、アール、「Development and Validation of a Genetic Algorithm for Flexible Docking」、J.Mol.Biol.、第267巻、727〜748頁、1997年 テイラー、ジェイ・エス、バーネット、アール・エム、Proteins、第41巻、173〜191頁、2000年 モリス、ジー・エム、グッドセル、ディー・エス、ハリディ、アール・エス、ヒューイ、アール、ハート、ダブリュー・イー、ブリュー、アール・ケイ、オルソン、エイ・ジェイ、「Automated Docking Using a Lamarckian Genetic Algorithm and an Empirical Binding Free Energy Function」、J.Comp.Chem.、第19巻、1639〜1662頁、1998年 ディ ノーラ、エイ、ベレンドセン、エイチ・ジェイ・シー、ロッカターノ、ディー、「Molecular Dynamics Simulation of the Docking of Substrates to Proteins」、Proteins、第19巻、174〜182頁、1994年 ワン、ジェイ、コールマン、ピー・エイ、クンツ、アイ・ディー、Proteins、第36巻、1〜19頁、1999年 ベーム、エイ・ジェイ、「The Development of a simple empirical scoring function to estimate the binding constant for a protein−ligand complex of known three−dimensional structure」、J.Comput−Aided Mol.Des.、第8巻、243〜256頁、1994年 ワン、アール、ガオ、ワイ、ライ、エル、「A new empirical method for estimating the binding affinity of a protein−ligand complex」、J.Molecular Modeling、第4巻、379頁、1998年 エルドブリッジ、エム・ディー、マリー、シー・ダブリュー、オートン、ティー・アール、パオリーニ、ジー・ブイ、ミー、アール・ピー、「Empirical scoring functions:I.The development of a fast empirical scoring function to estimate the binding affinity of ligands in receptor complexes」、J.Computer−Aided Molecular Design、第11巻、425〜445頁、1997年 ゲルハー、ディー・ケイ、ブージダ、ディー、レイト、ピー・エイ、「Rational Drug Design:Novel Methodology and Practical Applications」、Parrill,L.、Reddy,M.R.監修、American Chemical Society、米国ワシントンD.C.、292〜311頁、1999年 ログナン、ディー、ローエモラー、エス・エル、ホルム、エイ、ブース、エス、シンケ、ブイ・ジェイ、 Medicinal Chemistry、第42巻、4650〜4658頁、1999年 ハルグレン、ティー・エイ、マーフィー、アール・ビー、フリースナー、アール・エイ、ベアード、エイチ・エス、フライ、エル・エル、ポラード、ダブリュー・ティー、バンクス、ジェイ・エル、「Glide:a new approach for rapid,accurate docking and scoring.2.Enrichment factors in database screening」、J Med Chem.、第47巻、第7号、1750〜1759頁、2004年 パールマン、ディー・エイ、ケース、ディー・エイ、コールドウェル、ジェイ・シー、ロス、ダブリュー・エス、チーザムIII、ティー・イー、ファーガソン、ディー・エム、ザイベル、ジー・エル、シン、ユー・シー、ウィナー、ピー、コールマン、ピー・エイ、AMBER 4.1、University of California,San Francisco、1995年 コーネル、ダブリュー・ディー、シープラック、ピー、ベイリー、シー・アイ、グールグ、アイ・アール、メルツ、ケイ・エム、ファーガソン、ディー・エム、スペルマイヤー、ディー・シー、フォックス、ティー、コールドウェル、ジェイ・ダブリュー、コールマン、ピー・エイ、「A second−generation force field for the simulation of proteins,nucleic acid,and organic molecules」、J.American Chemical Society、第117巻、5179〜5197頁、1995年 ヨルゲンセン、ダブリュー・エル、ティラド−リベス、ジェイ、J.American Chemical Society、第110巻、1657〜1666頁、1988年 ハルグレン、ティー・エイ、「Merck Molecular Force Field.I.Basis,Form,Scope,Parameterization,and Performance of MMFF94」、J.Comp.Chem.、第17巻、490〜519頁、1996年 ブルックス、ビー・アール、ブルッコレリ、アール・イー、オルソン、ビー・ディー、ステイツ、ディー・ジェイ、スワミナサン、エス、カープラス、エム、「CHARMM:A Program for Macromolecular Energy,Minimization,and Dynamics Calculations」、J.Comp.Chem.、第4巻、187〜217頁、1983年 スチュワート、ジェイ・ジェイ・ピー、「Quantum Chemistry Program Exchange」、第10巻、86頁、1990年 リオタード、ディー・エイ、ヒーリー、イー・エフ、ルイス、ジェイ・エム、デュワー、エム・ジェイ・エス、「Quantum Chemistry Program Exchange−no.506」、QCPE Bulletin、第9巻、123頁、1989年 AMSOL−version 6.5.1、ジー・ディー・ホーキンス、ディー・ジェイ・ギーセン、ジー・シー・リンチ、シー・シー・チェンバース、アイ・ロッシ、ジェイ・ダブリュー・ストーラー、ジェイ・リー、ディー・リナルディ、ディー・エイ・リオタード、シー・ジェイ・クレイマー、ディー・ジー・トルーラー、University of Minnesota、Minneapolis、1997年 ゴールケ、エイチ、ヘンドリック、エム、クリーブ、ジー、「Knowledge−based Scoring Function to Predict protein−Ligand Interactions」、J.Mol.Biol.、第295巻、337〜356頁、2000年 ミューゲ、アイ、マーティン、ワイ・シー、「A general and fast scoring function for protein−ligand interactions−a simplified potential approach」、J.Med.Chem.、第42巻、791〜804頁、1999年 ミッチェル、ジェイ・ビー・オー、ラスコウスキー、アール・エイ、アレックス、エイ、ソーントン、ジェイ・エム、「BLEEP−Potential of Mean Force Describing Protein−Ligand Interactions II.Calculation of Binding Energies and Comparison with Experimental Data」、J.Comp.Chem.、第20巻、1165〜1176頁、1999年 ヘッド、アール・ディー、スミス、エム・エル、オプリー、ティー・アイ、ウォーラー、シー・エル、グリーン、エス・エム、マーシャル、ジー・アール、「VALIDATE:A New Method for Receptor−Based Prediction of Binding Affinities of Novel Ligand」、J.American Chemical Society、第118巻、3959〜3969頁、1996年 ビサンツ、シー、フォルカーズ、ジー、ログナン、ディー、「Protein−based virtual screening of chemical databases.1.Evaluation of different docking/scoring combinations」、J Med Chem、第43巻、4759〜4767頁、2000年 「3D QSAR in Drug Design:Recent Advances」、(第1〜3巻)、ヒューゴ・クビニー(監修)、ゲルト・フォルカーズ(監修)、イボンヌ・シー・マーティン(監修) 「Exploring QSAR:Hydrophobic,Electronic,and Steric Constants(ACS Professional Reference Book)」、コーウィン ハンシュ(監修)、アルバート・レオ(監修)、ディー・エイチ・フークマン(監修) マーフィー、アール・ビー、フィリップ、ディー・エム、フリースナー、アール・エイ、「Frozen Orbital QM/MM methods for density functional theory」、Chem.Phys.Letters、第321巻、113〜120頁、2000年 アクビスト、ジェイ、メディーナ、シー、サミュエルソン、ジェイ・イー、「A new method for predicting binding affinity in computer−aided drug design」、Prot Eng、第7巻、385頁、1994年 ジョーンズ−ハーツォグ、ディー・ケイ、ヨルゲンソン、ダブリュー・エル、「Binding Affinities for Sulfonamide Inhibitors with Human Thrombin Using Monte Carlo Simulations with a Linear Response Method」、J Med Chem、第40巻、1539頁、1997年 ボハチェク、アール・エス、マクマーティン、シー、グイダ、ダブリュー・シー、「The Art and Practice of Structure−Based Drug Design:A Molecular Modeling Perspective」、Medicinal Research Reviews、第16巻、3頁、1996年 エキンズ、エス、ローズ、ジェイ、「In silico ADME/Tox:the state of the art」、J Mol Graph Model、第20巻、第4号、305〜309頁、2002年 ゴース、エイ、ケイ、ビスワナダン、ブイ・エヌ、ウェンドロスキー、ジェイ・ジェイ、「Prediction of hydrophobic(lipophilic)properties of small organic molecules using fragmental methods:An analysis of ALOGP and CLOGP methods」、J.Phys.Chem、第102巻、3762〜3772頁、1998年 リピンスキー、シー・エイ、ロンバード、エフ、ドミニー、ビー・ダブリュー、フィーニー、ピー・ジェイ、「Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings」、Advanced Drug Delivery Reviews 1997、第23巻、3〜25頁、1997年 バーマン、エイチ・エム、ウェストブルック、ジェイ、フェン、ゼット、ジリランド、ジー、バート、ティー・エヌ、ワイシグ、エイチ、シンジャロフ、アイ、エヌ、ボーン、ピー・イー、「The Protein Data Bank」、Nucleic Acids Research、第28巻、235〜242頁、2000年 www.ncbi.nlm.nih.gov/Genbank/ バリロック、エイ、ベックマン、ビー、「The SWISS−PROT protein sequence data bank,recent developments」、Nucleic Acids Res、第21巻、3093〜3096頁、2003年 ロスト、ビー、サンダー、シー、「Bridging the protein sequence structure gap by structure predictions」、Annual Review Biophys Biomol Struct、第25巻、113〜136頁、1996年 ワン、ジー、ダンブラック、アール・エル、「PISCES:a protein culling server」、Bioinformatics、投稿中、2002年 エイ・エル・ホプキンス、シー・アール・グルーム、「The Druggable Genome」、Nature Reviews Drug Discovery、第1巻、727〜730頁、2002年 マーフィー、アール・ビー、フィリップ、ディー・エム、フリースナー、アール・エイ、「Frozen Orbital QM/MM methods for density functional theory」、Chem.Phys.Letters、第321巻、113〜120頁、2000年 ウェストブルック、ジェイ、フィッツジェラルド、ピー・エム、「Structural Bioinformatics」、ピー・イー・ボーン(監修)、エイチ・ワイシグ(監修)、John Wiley&Sons社、米国ニュージャージー州Hoboken所在、161〜179頁、2003年 http://www.tripos.com/custResources/mol2Files/ http://www.daylight.com/dayhtml/smiles/smiles−intro.html クラーク、エム、クレイマー、アール・ディー、オプデンボッシュ、エヌ、ブイ、「Validation of the General Purpose Tripos 5.2 Force Field」、J.Comp.Chem.、第10巻、982〜1012頁、1989年 スタウテン、ピー・エフ・ダブリュー、フロメル、シー、ナカムラ、エイチ、サンダー、シー、「An effective solvation term based on atomic occupancies for use in protein simulations」、Molecular Simulation、第10巻、第2〜6号、97〜120頁、1993年 http://www2.chemie.uni−erlangen.de/software/corina/index.html タカハシ、ワイ、サトー、ワイ、ササキ、エス、「Recognition of largest common structural fragment among a variety of chemical structures」、Analytical Sciences、第3巻、23〜28頁、1987年 マクレガー、エム・ジェイ、パライ、ピー・ブイ、「Clustering of large databases of compounds using MDL Keys as structural descriptors」、J.Chem.Inf.Comput.Science、第37巻、頁443〜、1997年
本発明の態様は、リード候補生体分子と、生体高分子であることが多い潜在的な反応物質分子の間の有害交差反応を予測して、対象とする病気または生物学的な状態に関する安全性および薬効の点でリード候補をよりよく特徴付け、リード候補分子のさらなる最適化を容易にして、所望の標的との結合特異性を改善し、他の無関係な生体分子との有害な、かつ/またはその他の点で不測の交差反応を回避する方法に関係するものである。
計算システムでは、適切な環境内で反応がモデル化され、それによってリード候補分子と潜在的な反応物質分子の間の反応プロファイルが求められる。この方法は、リード分子と潜在的な反応物質分子との間の反応について反応の尺度を取得することと、リードおよび潜在的な反応物質分子についての他の変量、例えば、関連するソース、機能、および相同体の注釈、モデル予測、ならびに(適用可能な場合には)実験結果を取得することと、反応の尺度と他の関連する注釈および変量とを組み合わせて反応プロファイルを構築することとを含む。この反応プロファイルは、リード候補と潜在的な反応物質分子が組み合わせられる確度、ならびに、予測される交差反応が望ましくなく、さらには有害である確度をともに反映するものである。このプロセスは同じリード候補分子について、分子ライブラリまたは分子データベースからの複数の潜在的な反応物質分子に対して繰り返すことができ、リード候補について交差反応概要プロファイルが生成され、それによって、安全性および薬効の点でこのリードがよりよく特徴付けられる。
本発明の別の態様は、リード候補の再設計および最適化を、おそらくは本質的に反復して行って、予測される有害な交差反応を回避する方法を含む。この方法は、リード候補を所望の標的分子に結合する際に必要とされる共通の分子のコアまたは枠組を識別することと、次いで、リード候補分子の、追加、除去、または置換し得る様々な分子構成要素を識別して、予測される関連結合様式および1つ(または複数)の反応の尺度を調べることによって、リードと所望の標的分子との結合親和性を大きく低下させることなく、潜在的な有害反応物質分子との結合親和性を低下させ、かつ/または、ある種の分子間水素結合を阻害することとを含む。次いで、リード候補の新たに生成された構造的な変形について、分子ライブラリまたは分子データベースからの複数の潜在的な反応物質分子に対して新しい概要反応プロファイルを生成することによって、リード候補の構造的な変異体の1つまたは複数の有害な交差反応の確率が十分に低いと考えられるまで、新しい最適化サイクルを反復することができる。
本発明の様々な実施形態の説明で用いる標的生体高分子の例として示すタンパク質(ジヒドロ葉酸還元酵素)の1次アミノ酸配列を示す図である。 本発明の様々な実施形態の説明で用いる標的生体高分子の例として示すタンパク質(ジヒドロ葉酸還元酵素)の2次構造表現を示す図である。 本発明の様々な実施形態の説明で用いる標的生体高分子の例として示すタンパク質(ジヒドロ葉酸還元酵素)の溶媒接触可能表面を示す図である。 本発明の様々な実施形態の説明で用いる標的生体高分子の例として示すタンパク質(ジヒドロ葉酸還元酵素)を扱うpdbエントリ4dfrについてのX線結晶解析による構造データのpdbファイルの表現を示す図である。 本発明の様々な実施形態の説明で用いるリード候補の例として示す分子(メトトレキサート)の化学式および立体SMILEを示す図である。 本発明の様々な実施形態の説明で用いるリード候補の例として示す分子(メトトレキサート)の2次元構造表現を示す図である。 本発明の様々な実施形態の説明で用いるリード候補の例として示す分子(メトトレキサート)の配座の「玉と棒」による3次元表現を示す図である。 本発明の様々な実施形態の説明で用いるリード候補の例として示す分子(メトトレキサート)の同じ配座についての構造データのTripos mol2ファイル表現を示す図である。 本発明の様々な実施形態の説明で用いる複合体構造の例として示すジヒドロ葉酸還元酵素に結合したメトトレキサートを扱う分子複合体の活性部位の溶媒接触表面図である。 本発明の様々な実施形態の説明で用いる複合体構造の例として示すジヒドロ葉酸還元酵素に結合したメトトレキサートを扱う分子複合体の活性部位内で結合したメトトレキサートを示す複合体の3次元表現図である。 本発明の様々な実施形態の説明で用いる複合体構造の例として示すジヒドロ葉酸還元酵素に結合したメトトレキサートを扱う分子複合体のリガンド(メトトレキサート)と標的(ジヒドロ葉酸還元酵素)に対して相互作用する基の2次元模式表現図である。 本発明の様々な実施形態の説明で用いる複合体構造の例として示すジヒドロ葉酸還元酵素に結合したメトトレキサートを扱う分子複合体の標的タンパク質の活性部位残基の4つの基の表を示す図である。 本発明のいくつかの実施形態で用いるのに、標的および/または潜在的な反応物質のレコードをどのように構築し得るかの例を示す図である。 本発明のいくつかの実施形態で用いるのに、標的および/または潜在的な反応物質のレコードをどのように構築し得るかの例を示す図である。 本発明のいくつかの実施形態で用いるのに、標的および/または潜在的な反応物質のレコードをどのように構築し得るかの例を示す図である。 本発明のいくつかの実施形態で用いるのに、リード候補のレコードをどのように構築し得るかの例を示す図である。 本発明のいくつかの実施形態で用いるのに、リード候補のレコードをどのように構築し得るかの例を示す図である。 本発明のいくつかの実施形態で用いるのに、リード候補のレコードをどのように構築し得るかの例を示す図である。 様々な潜在的反応物質とリード候補の潜在的な交差反応を求め、リード候補を再設計し最適化して1つまたは複数の所望の標的との結合特異性を改善するのに使用し得る、本発明の実施形態による計算モデリング・システムのブロック図である。 本発明の様々な実施形態の説明で用いる複合構造の別の例として示す大腸菌チミジル酸シンターゼに結合するメトトレキサートを扱う分子複合体を示す図で、ジヒドロ葉酸還元酵素と複合体を作るメトトレキサートについて図3Aで示すものに対応する。 本発明の様々な実施形態の説明で用いる複合構造の別の例として示す大腸菌チミジル酸シンターゼに結合するメトトレキサートを扱う分子複合体を示す図で、ジヒドロ葉酸還元酵素と複合体を作るメトトレキサートについて図3Bで示すものに対応する。 本発明の様々な実施形態の説明で用いる複合構造の別の例として示す大腸菌チミジル酸シンターゼに結合するメトトレキサートを扱う分子複合体を示す図で、ジヒドロ葉酸還元酵素と複合体を作るメトトレキサートについて図3Cで示すものに対応する。 本発明の様々な実施形態の説明で用いる複合構造の別の例として示すウサギ細胞質セリンヒドロキシメチル転移酵素に結合するフォリン酸を扱う分子複合体を示す図で、ジヒドロ葉酸還元酵素と複合体を作るメトトレキサートについて図3Aで示すものに対応する。 本発明の様々な実施形態の説明で用いる複合構造の別の例として示すウサギ細胞質セリンヒドロキシメチル転移酵素に結合するフォリン酸を扱う分子複合体を示す図で、ジヒドロ葉酸還元酵素と複合体を作るメトトレキサートについて図3Bで示すものに対応する。 本発明の様々な実施形態の説明で用いる複合構造の別の例として示すウサギ細胞質セリンヒドロキシメチル転移酵素に結合するフォリン酸を扱う分子複合体を示す図で、ジヒドロ葉酸還元酵素と複合体を作るメトトレキサートについて図3Cで示すものに対応する。 メトトレキサートの枠組分子構造の2次元表現を、注釈を付けた構造連結部位とともに示す図である。 メトトレキサートに適用する薬物再設計/最適化プロセスに関わる本発明の一実施形態の一部として、既存の枠組に置換または追加し得る化学基の表である。 メトトレキサートに適用する薬物再設計/最適化プロセスに関わる本発明の一実施形態の一部として生成された様々な異なる構造の例を示す図である。 メトトレキサートに適用する薬物再設計/最適化プロセスに関わる本発明の一実施形態の一部として生成された様々な異なる構造の例を示す図である。
本発明は、本開示を読んだ後で明らかになるように、広く適用される。本発明による計算システムの実施形態の説明では、いくつかの可能な変形形態のみを説明する。他の応用例および変形形態は当業者には明らかであり、そのため、本発明を、これらの実施例と同じ程度に狭く解釈すべきではなく、添付の特許請求の範囲に従って解釈すべきである。
次に、例として本発明の実施形態を説明するが、本発明はこれらに限定されるものではない。本発明の有用性は広く、本発明を多くの異なる状況で利用し得ることを理解されたい。
本発明は、おそらくは1つまたは複数の所望の標的に関連する1つまたは複数のリード候補と、1組の潜在的な反応物質との交差反応性を推定して、これらのリード候補の有用性の1つまたは複数の態様を評価することに関係するものである。
本発明では、標的は、生体分子、生体分子の一部、1つまたは複数の生体分子の化合物、あるいは他の生体反応性作用物質である。これらは生体高分子であることが多く、その環境において活動が改変されることが望まれるものである。例えば、タンパク質、ポリペプチド、および核酸を含めて、生体高分子は標的の例である。これらの標的の活動の改変は、他の相互作用の前またはその最中に、標的の活動を不活性化する(抑制作用)か、標的の活動を高めるか、または他のやり方でその活動を改変する(触媒作用)ことを含み得る。一実施形態では、標的は、ヒトの体内で生成されるか、またはヒトの体内に導入され、病気その他の悪影響を及ぼすタンパク質とすることができ、所望の改変は、このタンパク質の関連する活性部位に小型の生体分子を競合結合させることによって、このタンパク質の活動を抑制することである。別の実施形態では、この標的タンパク質自体は、望まれない病気または悪影響を直接引き起こすものではないが、その機能に影響を及ぼすことによって、何らかの他のタンパク質(例えば、酵素、抗体など)または生体分子が関わる反応をより良好に制御することができ、それによって、処置を必要とする病状が軽減される。
別の実施形態では、細胞表面受容体にリード候補をドッキングすることができ、それによって、ウィルス・タンパク質などの病原体生体高分子が細胞に取り付くことを妨げて病気を防ぐ。別の例では、リード候補は、標的タンパク質の化学的な改変(例えば、リン酸化、ジスルフィド結合の切断、金属イオン配位の崩壊など)、または遺伝子治療の場合には、DNA中の1つまたは複数の塩基対の実際の置換を促進することができる。別の例では、所望の改変は、標的を改変して、標的を扱う機能経路をより容易に識別し、かつ/またはよりよく特徴付けることである。例えば、リード候補によって分子標識を担持するように標的を改変し、それによって、この標的がどこにいるのか、標的がその環境とどのように相互作用するのかを検出するのを容易にすることができる。
図1a〜図1dに、タンパク質の例を示す。このタンパク質は、pdbエントリ4dfrで示す結晶構造を有する。このタンパク質のジヒドロ葉酸還元酵素は、DNA合成に重要なデオキシチミジル酸の産生サイクルの一部としてテトラヒドロ葉酸の再生に関わる標的である。図1aの項目110に、アミノ酸ごとの3文字表記を用いてこのタンパク質の1次アミノ酸配列を示す。図1bの絵120に、4dfrタンパク質分子の2次構造の模式的な表現を、βシート、αへリックス、ヘアピンなどの様々な2次構造構成要素の場所を示す表の集合125とともに示す。図1cの絵130に、半径1.4Åのプローブ球を用いたジヒドロ葉酸還元酵素タンパク質の溶媒接触可能表面の表現を示す。この絵で、異なる色は異なる表面原子を示す(例えば、項目131の白は水素、項目132の黒は炭素、項目133のネズミ色は酸素、など)。
図1dに、タンパク質データ・バンク[62、69]から得られたジヒドロ葉酸還元酵素タンパク質の入力された構造配座について、X線結晶解析に基づく化学構造のpdbファイルの表現150を示す。図1dでは、pdbファイルの表現150は、全般ヘッダ部分142、原子タイプおよび配位情報からなる部分144、および結合連結性情報に関する部分146を含む。ヘッダ部分142は、標的生体分子の身元、ソース、構造的構成要素、配列データその他の特徴に関する所望の任意の注釈その他の情報を含み得る。部分144に、省略記号を用いて、ジヒドロ葉酸還元酵素の単一鎖の1280個の非水素原子の一覧を示す。原子ごとに、化学的種類(例えば、原子)および3つの空間座標が含まれる。例えば、原子9の行は、それが、名称がNの窒素原子であり、A鎖のILE残基中にあり、残基IDが2であり、指定直交座標系における(x、y、z)座標が(23.920、57.222、6.665)であることを示す。部分144は、標的に関連する金属イオン、構造水、あるいは他の追加の原子または分子などの様々な異種原子のエントリも含み得ることに留意されたい。部分144では、項目148で示す行に、構造水に対応する酸素、さらには塩素原子についてのいくつかの行エントリの例を示す。
PDBファイル150の部分146に、PDBファイルのいわゆる「連結レコード」のサブセットを示す。各行のエントリは、各原子に関連する結合部の一覧を記述している。例えば、この部分の第1行には、原子1が原子2に結合していることが示され、第2行には、原子2が原子1、3、および5に結合していることが示されている。この例で水素がどのように欠落しており、したがって、原子ごとの結合連結部は完全ではないことがあることにも留意されたい。当然のことながら、水素原子の位置が既に指定されている場合には、このPDBファイルの表現の完全な変異体が可能であるが、化学構造がX線結晶解析などの実験的な観察から得られる多くの場合、水素の位置は極めて不確かであるか、完全に欠落していることがある。ただし、水素原子の位置を予測し、生理pHの仮定に基づいてタンパク質を正しく水素化し得る標準計算ツールが存在する。
ファイル・フォーマットの他の例には、MDLフォーマット、Tripos社のmol2フォーマット[70]、SMILES規約[71]などが含まれる。スキーマとエンティティの様々な関係を扱う様々な3次元生体分子構造データベースの形で、標的の化学的かつ構造的な情報を格納することもできる。
リード候補は、標的との関連生物活性の事前評価に基づいて選択された生体分子、生体分子の一部、1つまたは複数の生体分子の化合物、あるいは、他の生体反応性作用物質である。事前評価の目的は通常、適切な環境にあるリード候補が、標的と反応して標的の活動を所望のとおりに改変するかどうかを判定することである。生物活性の評価は、無数の生化学アッセイ、ウェット・ラボ実験、様々な測定プロセス、結合親和性の計算による予測、ハイスループット・スクリーニング、仮想ライブラリ・スクリーニング、アドメトックス・プロファイル、QSAR、分子モデリングなどを必要とすることがある。リード候補の例には、小型の分子リガンド、ペプチド、タンパク質、タンパク質の一部、合成化合物、天然化合物、有機分子、炭水化物、残基、無機分子、イオン、個々の原子、遊離基、および他の化学的に活性な要素が含まれる。リード候補から、所望の改変を作り出すために投与または使用し、また、望ましくない改変について検査または試験するために使用する薬物または化合物の基礎を形成することができる。「リード」および「薬物候補」という用語は、「リード候補」という用語と交換可能に用いられる。
図2a〜図2dに、図1a〜図1dに示すジヒドロ葉酸還元酵素に対する周知のナノモル結合剤である化合物メトトレキサートを示す。メトトレキサートは、タンパク質ジヒドロ葉酸還元酵素を抑制し、それによって間接的にデオキシチミジル酸の産生を阻害し、DNA合成に関わる基本細胞プロセスを止めて悪性癌細胞の成長を遅らせることによっていくつかのタイプのヒトの癌を治療する抗癌薬として化学療法に用いられる。図2aの項目210に、メトトレキサートの化学式を示す。図2aの項目215に、メトトレキサートについての立体SMILE[71]を示す。図2bの絵220に、非水素原子のみを含むメトトレキサート分子の2次元構造表現を示す。
図2cの項目230に、図2aの項目210で列挙した化学式C2022に従ってメトトレキサート分子の配座230を「玉と棒」で表現したものを示す。この分子は、原子240および結合部260の集合からなる。項目243で示す小型の黒い原子は炭素原子を表す。項目245で示すより小さい白い原子は水素原子を表し、わずかに大きい暗い色の原子(項目247)は酸素原子であり、より大型の白い原子(項目249)は窒素原子である。
図2cを継続して参照すると、項目253は、ベンゼン環(C)を含む円を示し、項目255は、カルボキシル基(COO)を含む円を示し、項目257は、メチル基(CH)を含む別の円を示している。項目263は、ベンゼン環256と、メチル基257を含むエステル基とを連結する共有結合を示す。項目265は、炭素原子243とカルボキシル基255を連結する共有結合を示す。最後に、項目267は、メチル基257と窒素原子249を連結する共有結合を示す。
図2dに、図2cに示すメトトレキサートについて入力された配座についての様々な構造的かつ化学的な情報を含むTripos mol2ファイルを示す。列270には、各原子ごとに指数が列挙されている。列273には、原子ごとに(一意でないことがある)原子名が列挙されている。列275、277、および279にはそれぞれ、原子ごとに内部座標系の座標x、y、zが列挙されている。列280には、原子ごとに、ハイブリッド形成状態、化学的種類、結合連結性、水素結合能力、芳香族性、ならびに、場合によっては化学基に関する情報を体系化したTripos力場[72]によるSYBYL原子タイプが列挙されている。列282および285には、原子ごとに(タンパク質、核酸などに関連する)残基IDおよび残基名が列挙されている。部分290には、この分子サブセットにおけるすべての結合部が列挙されている。列291には、結合部ごとに結合指数が列挙されており、列292および293には、結合部によって連結された2つの原子の原子指数が列挙されており、列295には、単結合、二重結合、三重結合、非局所的結合、アミド結合、芳香結合、または他の特殊な共有結合であり得る結合のタイプが列挙されている。他の実施形態では、このような情報は、塩橋または水素結合などの非共有結合を表すこともある。この例では、水素原子がこの時点でどのように含まれているかに留意されたい。
標的の表面上またはその近傍でリード候補が標的と結合または安定に接触する相互作用の座を通常、活性部位と称する。これは、結合ポケット、結合部位、または結合キャビティとも称する。
図3a〜図3dは、図1a〜図1dのジヒドロ葉酸還元酵素タンパク質と図2a〜図2dのメトトレキサート分子によって形成される分子複合体に関係するものである。図3aに、メトトレキサートとの反応に関連するジヒドロ葉酸還元酵素の活性部位を示す。図3aでは、この活性部位は、明るい灰色のタンパク質の全溶媒接触可能表面(項目320)に埋め込まれ、暗い灰色で陰影が付けられた溶媒接触可能表面の一部(項目310)として示されている。図3bに、白球325の集合で表すリード候補(メトトレキサート)に結合した複峰性溶媒接触可能表面で表された(暗い灰色の部分は活性部位310であり、明るい灰色の部分320はタンパク質の残りの部分である)標的タンパク質(ジヒドロ葉酸還元酵素)を含む分子複合体を示す。図3bで明らかなように、メトトレキサート分子は、図3aに示す活性部位に緊密に収まっている。
図3cに、メトトレキサートの様々な化学基とジヒドロ葉酸還元酵素の様々な残基との相互作用の2次元模式表現を示す。項目340は、pdbエントリ4dfrの第1鎖についてのジヒドロ葉酸還元酵素の活性部位内のメトトレキサート分子(MTX)の2次元表現を示す。項目331、333、334、335、336、337、および339は、メトトレキサートの様々な基との疎水性接触に関わるタンパク質残基を表す。項目350、352、354、356、および358はそれぞれ、活性部位内のジヒドロ葉酸還元酵素の触媒残基Asp27、Ile5、Ile94、Arg52、およびArg57を表す。これらはそれぞれ、メトトレキサートとの1つまたは複数の細胞間水素の形成に関わるものである。この水素結合自体は、対をなす水素結合ドナー基とアクセプタ基の間の破線で示す。
図3dに、メトトレキサート分子と相互作用するジヒドロ葉酸還元酵素タンパク質の活性残基の集合の文字列表現を示す。ここで、4つの活性部位残基にグループ分けし、それらを、項目371(APT)、372(ANM)、373(AAB)、および374(AGL)と示す。項目375は、APTグループについての概要説明を表し、項目377は、APTグループに含まれる個々の残基の一覧である。ANM、AAB、およびAGLのグループについて、類似の情報が入手可能である。
図3a〜図3dに示す分子複合体についての情報は、様々な手段によってデジタル的に表してもよい。これらの手段には、図1dおよび図2dの例で示した上記pdbおよびmol2のファイル・フォーマットが含まれるが、これらに限定されるものではない。
潜在的な反応物質は、リードが標的と反応すると予想される環境と類似の環境で生じるか否かにかかわらずリードと反応し得る生体分子、生体分子の一部、1つまたは複数の生体分子の複合体、あるいは、他の生体反応性作用物質である。本明細書では、標的と宿主生物を共有する1つまたは複数の潜在的な反応物質の活動をリードが改変することを「交差反応」と称する。
リード候補とこのような潜在的な反応物質との交差反応により、潜在的な反応物質の動作の、望ましくないことが多い不測の改変が生じることがある。しかし、このような潜在的な反応物質は、すぐには病気に直接関係しない生体高分子であることが多く、普通なら宿主生物にとって正常な機能を実施し、また、不可欠な機能さえ実施するので、このような交差反応により望ましくない副作用が生じることがある。例えば、メトトレキサートは、ジヒドロ葉酸還元酵素の強力な抑制剤であると同時に、肺、腎臓、および神経系内の複数のタンパク質の活動に影響を及ぼす毒性副作用を引き起こすことが知られている。別の例では、肝臓内のタンパク質との望ましくない相互作用を起こし、それによって肝臓障害、さらには、肝硬変などの深刻な病状を誘発する多くの化合物が知られている。
潜在的な反応物質は、ヒト、哺乳動物、昆虫、植物、細菌などを含めて、様々な生物由来のものとし得る。潜在的な反応物質は、様々な異なる種、器官、組織、細胞型などから得ることもできる。これらの構造的な情報は、様々な実験手段および測定プロセスによって得ることもできるし、計算によるモデル化および構造的な予測によって得ることもできる。
1組の潜在的な反応物質は、本質的に実験的なもの、計算によるもの、または生物学的なものであるかに関わらず、様々なソースから知ることができ、かつ/または得ることができる。これらのソースは、PDB[62]、GenBank[63]、SwissProt[64]など、1つまたは複数の公共の、または所有権下にあるプロテオミクスまたはゲノミクスのデータベースを含み得る。これらに関して、例えば、種/生物、分子サイズおよび分子量、塩基の非冗長配列、識別または予測される機能、疎水性、pKa、回転可能な結合の数、作用部位、タンパク質のファミリまたはスーパー・ファミリによる分類など、周知の、または導出された注釈に基づいて、様々なクエリ選択を行うことができる。このような組は、周知のあらゆるタンパク質、ヒト、またはそうでないものさえ含み得る。
他のソースには、機能ゲノミクス研究、あるいは周知のアミノ酸配列からの、さらには周知のDNA/RNA配列から直接行われる構造モデル予測が含まれる。潜在的な反応物質は、タンパク質チップ、遺伝子またはプロテオミクスによる発現研究、配列レベルまたは構造レベルのいずれかでの比較相同性分析、機能経路または信号経路の研究、あるいは他の方法を利用する様々な生化学アッセイその他の実験の結果として識別することもできる。
例として「標的分子」と称するが、標的は上記で説明したように単分子に限定されないこと、特にことわらない限り、標的分子に適用されることは他のタイプの標的にも適用されることを理解されたい。同じことが、リード分子と称するリードその他のリード候補および潜在的な反応物質分子と称する潜在的な反応物質にも当てはまる。
この時点で、「環境」という用語を詳細に論じることは価値があろう。というのは、それが本発明の実施形態に関係するからである。背景技術のところで既に述べたように、「環境」という用語は概ね、分子間の反応部位の物理的かつ化学的な周囲の状況を指す。本発明のある種の実施形態では、環境は、ヒトの体内、ヒト以外の体内、実験室環境、または他の生物学的に適切な環境であり得る。他の実施形態では、環境は、身体全体よりも小さな部分、例えば、特定の器官、循環系、または神経系と指定されることがある。反応部位の例には、様々な細胞内領域、細胞核内、血流中、消化管内、様々な膜、および細胞表面が含まれる。
標的の環境はしばしば、他の分子、1つまたは複数の分子の化合物、および/または他の生体反応性作用物質または不活性構成要素など、他の構成要素を含む。ある種の実施形態では、環境は、溶媒を含む複数の原子、イオン、および/または分子を含むことがあり、この溶媒中に反応部位が内部に埋め込まれる。溶媒の原子、イオン、または分子の例は、標的または潜在的な反応物質とリードとの反応部位のところ、またはその近傍に存在する水、アルコール、アルカン、塩、糖、脂肪酸、酸、塩基、ヒドロニウムイオン(H)、遊離基、ペプチドその他の生体分子、さらには生体高分子を含み得る。他の実施形態では、環境は、誘電強度、イオン化傾向、透過性、化学ポテンシャル、静電ポテンシャルなど、様々な特性をモデル化するのに用いる連続体溶媒和モデルも含み得る。他の実施形態では、環境は、その化学的な構成要素だけでなく、光その他の利用可能な放射の量、温度、圧力、水、または他の関連する環境条件などによってさらに特徴付けることができる。
本発明では、標的とリードの反応部位の環境は、潜在的な反応物質とリードの反応部位の環境と極めて異なることがあることに留意されたい。実際、反応部位は、同じ細胞型、組織、さらには生物内とする必要はない。場合によっては、標的とリードの反応部位の環境は既知であり、例えば筋組織内注入など、様々な手段によって生物のある種の部分にリードを閉じ込めることができる。この場合、これら2つの環境、すなわち、標的−リードの反応部位の一方の環境と、潜在的な反応物質−リードの反応部位の他方の環境とを同じに、少なくとも極めて類似したものにし得る。このような場合、標的とリードの反応部位に関連する環境と大きく異なる環境に存在する潜在的な反応物質を除外することが可能なこともある。しかし、ほとんどの場合、環境を極めて特定なものとしなくてよい。というのは、リード、標的、および/または潜在的な反応物質は、生物の消化管、血流その他の区域を通って移動し得るからである。
背景技術の項で既に論じたように、結合親和性は、様々なエンタルピ成分およびエントロピ成分に関わることがある。エンタルピ成分は、分子内相互作用および分子間相互作用の両方からの寄与を含み得る。これらの相互作用には、静電気、vdW、脱溶媒、水素結合、金属−リガンドの相互作用、および分子内歪みが含まれるが、これらに限定されるものではない。正確にモデル化するのがより難しいことが多いエントロピ成分は、結合後の配座エントロピの低下および疎水作用などの溶媒に関係する現象を含み得るが、これらに限定されるものではない。ドッキングおよびスコアリングの状況でのポテンシャル・エネルギー、および自由エネルギーのエントロピ成分の標準的なモデル化の考察については、[6、17、26、29、31]を参照されたい。
自由エネルギーへのエンタルピおよびエントロピの寄与はともに、物理モデルに適用する1つまたは複数の計算による方法を利用することによって、予測または近似することができる。結合エネルギーの例として、メトトレキサートとジヒドロ葉酸還元酵素の複合体について実験的に求めた結合エネルギーは、−55.34KJ/molであり、これは、解離定数Kが、標準生理条件下で1.97e−10であることを示唆している(この場合も、http://www−mitchell.ch.cam.ac.uk/pld/energy.php)。
モデルの例には、量子力学による計算、古典分子力学、統計力学、および実験および/または知識に基づく方式、あるいはこれらの任意の組合せに基づくものが含まれる。標準的な計算による方法の例には、分子動力学シミュレーション、統計力学シミュレーション、機能最適化ルーチン(モンテ・カルロ法、遺伝子アルゴリズム、動的計画法、シミュレーテッド・アニーリングなど)、自由エネルギー摂動論、QM/MMシミュレーションなどが含まれる。
分子力学モデルまたは分子動力学シミュレーションの状況では、パラメータ、エネルギー・パラメータは概ね、1つまたは複数の標準エネルギー成分の計算の状況で特定の物理的かつ化学的な属性を表す構成要素の原子、結合部、および/または化学基に関連する。エネルギー・パラメータの割当ては、化学基、ポリペプチド中のアミノ酸などの分子構造、タンパク質中のαヘリックスまたはβシートなどの2次構造、あるいは全体としての分子の状況での所与の相互作用に関わる1つまたは複数の原子または結合部の化学的な身元および/またはこれら1つ(または複数)の原子または1つ(または複数)の結合部の場所のみに依存し得る。一例は、タンパク質のリジン残基の主鎖上のペプチド結合に関わる窒素原子に割り当てられた静電相互作用に関する電荷の値である。別の例は、タンパク質のアルギニン残基の側鎖中の窒素原子に割り当てられた電荷の値である。この割り当てられた電荷の値は、リジン残基中の上記窒素に関連するものと大きく異なることがある。
典型的には、これらのパラメータは、全原子力場または融合原子力場、例えば、AMBER[40、41]、OPLS[42]、MMFF[43]、CHARMM[44]などを用いることによって、環境中の原子または原子群、あるいは標的/リード/潜在的な反応物質の結合部、ならびに、他の原子または分子に割り当てられる。エネルギー・パラメータは、計算実行時に先だって1つまたは複数の分子に割り当て、何らかのコンピュータ可読フォーマット(すなわち、フラット・ファイル、データベース・テーブルなど)に格納し、次いで、必要に応じて取り出すこともできるし、実際には、実際の計算自体の間に「計算中に」割り当てることもできる。
本発明では、標的、リード、および潜在的な反応物質分子についての化学的かつ構造的な情報、関連の注釈、および関連するエネルギー・パラメータを分子レコードに記憶することができる。これらの分子レコードは、複数のデータベース・レコードとして、または別々のファイルとして、あるいは他のデータ構造でデジタル的に表すことができる。特定の実施形態では、レコードは、データベースから読み取られ、個々のファイルとして格納され、これら個々のファイルは、このファイルに含まれるデータの演算を行うために本発明の他の部分に渡される。
これらのレコードがそれらの標的/リード/潜在的な反応物質を表すやり方にはいくつかのものがあり得る。一実施形態では、ある分子のレコードは、この分子中のすべての原子について、これらの原子が配置される空間的な場所、様々な物理的相互作用に対応するエネルギー・パラメータ、原子群についての(例えば分子のあまり関連しない部分、例えば活性部位から離れたタンパク質の内側の部分についての)近似、ならびにこの分子についての他のデータ、例えば、原子の種類、原子の位置、および結合部の一覧を含む。図4aおよび図4bに、本発明に関連する標的、リード、および潜在的な反応物質分子についての関連するデータの記憶部を列挙する一実施形態によるサンプル・レコードを示す。
例えば、図4aに、本発明の一実施形態に従って、pdbエントリ4dfrに関連する標的タンパク質のジヒドロ葉酸還元酵素を標的分子レコード400で表す。図4aでは、項目403は、このタンパク質に関連する1つまたは複数の名称を表し、項目405は、このタンパク質に関わるソース情報、機能、および反応/プロセスに関係するバイオインフォマティックスおよびプロテオミクスの注釈を表す。項目407は、このタンパク質の機能的/構造的な分類およびファミリ情報を表し、配列および/または構造の比較に基づく相同体との関連も含み得る。
図4aを継続して参照すると、項目410は、このタンパク質のアミノ酸配列を、予測される2次構造要素の注釈とともに表している。ここで、項目411、412、および413はそれぞれ、βシート・ストランド、αヘリックス、および様々なターンおよび/またはヘアピンを表す。項目414は、このタンパク質についての構造注釈、例えば、引用文献、結晶分解能、および鎖情報を含めて実験的な構造データに関する有効なpdbヘッダに見られるものを表す。
項目415は、塩イオン、構造水酸素、またはこのタンパク質構造に関連する他の分子など、(PDB規格[62]に関して定義された)個々のタンパク質原子または異種原子の化学的な身元および空間座標に関連するデータ、すなわち、pdbフォーマット・ファイルのATOMまたはHETATMのレコードに類似のブロックを表す。本発明のある種の実施形態による標的分子レコードの項目415に格納されるデータの例については、図1dに関連する記載に戻って参照されたい。本発明の他の実施形態では、ある種の形式の計算処理を用いて、欠落した、または「壊れた」残基および原子を検出し、次いで、推定される場所に欠落した構造構成要素を配置することによってその構造を修復する。このような修復機能を実施し得る現在入手可能なソフトウエア・ツールの例には、Tripos社のSYBYL(商標)、UCSFのChimera(商標)、およびWhatIf(商標)が含まれる。
標的レコードが、結合した複合体に対応する場合、リガンドに関連する異種原子を含めることもできるし、含めなくてもよいことに留意されたい。一実施形態では、図4aの項目415の構造データは、未処理の測定値を含み得る。別の実施形態では、データの値は、任意の別の計算によるモデル化に対するプリプロセッサとして働く標準エネルギー正則化ルーチンの結果として生成される。別の実施形態では、標的分子レコードは、実際には、未処理構造データおよび最終処理済み構造データならびに様々な中間状態を含み得る。
項目423は、pdbまたはmol2連結レコードに類似のデータ・ブロックを表し、様々な化学結合、すなわち共有結合、ジスルフィド結合を列挙し、タンパク質内水素結合または構造水との水素結合さえ含み得る。本発明のある種の実施形態による標的分子レコードの項目423に格納されるデータの例については、図1dに関連する記載に戻って参照されたい。
一実施形態では、項目425は、全電荷および部分電荷(列427)、質量(列428)、vdw半径(列429)、およびレナード・ジョーンズ12−6ポテンシャルに従うウェル深さパラメータ(列430)を含めて、タンパク質原子(列426)に関連する非結合エネルギー・パラメータを含むフィールドである。典型的には、非結合エネルギー・パラメータの最終的な選択は、様々なエネルギー成分に関する相互作用モデルによって決まる。例えば、溶媒和/疎水作用についてのモデルは、スタウテン他[73]の断片溶媒和モデルに従う原子溶媒和パラメータを必要とすることがある。別の例として、レナード・ジョーンズ12−10ポテンシャルに従う水素結合のドナー基とアクセプタ基の相互作用をモデル化するために水素結合パラメータを必要とすることがある。
一実施形態では、項目431は、適切な捻れの変化に関連する二面エネルギーに関して、タンパク質結合部または隣接するタンパク質結合部の基に関連する結合エネルギー・パラメータを含むフィールドである。ここで、列432は、ピッツァ・ポテンシャルに基づく捻れエネルギー・モデルとともに用いる様々なパラメータ(例えば、位相、振幅、移動度など)を表す。典型的には、結合エネルギー・パラメータの最終的な選択は、様々なエネルギー成分に関する相互作用モデルによって決まる。例えば、結合伸張、結合角の曲げ、不適切な捻れ、さらにはリング摂動に関係する結合エネルギー成分を表すために追加のパラメータを必要とすることがある。
一実施形態では、図4aの項目425および431に示す非結合および結合のエネルギー・パラメータはともに、Amber96力場[40、41]を用いて割り当てられる。ただし、項目425および431に関連して、エネルギー・パラメータを割り当てるのに選択した方法およびエネルギー・パラメータ自体の性質は、本発明の一実施形態に関係する単なる例であることを理解されたい。別の実施形態では、これらのエネルギー・パラメータは、計算実行時に「計算中」に割り当てられ、項目425および431は不要である。
最後に、項目433は、標的タンパク質に結合する様々な周知の生体分子(天然またはそうでないもの)との関連および入手可能な場合には任意の関連する反応データを含み得る任意選択のフィールドである。
本発明に関して使用する各リード候補生体分子ごとにリードのレコードも提供される。例えば、リード候補生体分子のメトトレキサートは、本発明の一実施形態に従って、図4bのリード候補生体分子レコードによって表す。図4bでは、項目434は、リード候補に関連する1つまたは複数の名称を表し、435は、化学式、分子量、化学名、およびCAS登録番号を含めて、この化合物の化学的性質に関連する様々な化学注釈を表す。項目437は、この生体分子の化学的かつ/または構造的な分類を表し、生体分子に関して用いられる任意の数の標準化合物分類子を含み得る。項目437はさらに、化学的かつ構造的な比較に基づく他の化合物相同体との関連を含み得る。
継続して図4bを参照すると、項目445は、mol2フォーマット・ファイルに従う個々の原子の化学的な身元および空間座標に関連するデータのブロックを表している。これは通常、リード候補にイオン化状態を割り当て、リード候補を水素化した後のものである。項目453は、pdbまたはmol2の連結レコードに類似のデータ・ブロックを表し、例えば共有結合などの様々な化学結合の一覧である。本発明のある種の実施形態によるリード候補分子レコードの項目445および453に格納されるデータの例については、図2dに関連する記載に戻って参照されたい。項目455および457は、標的分子に割り当てられるものに類似のやり方で、非結合および結合のエネルギー・パラメータについての別々のデータ・ブロックを表す。本発明のある種の実施形態によるリード候補分子レコードの項目455および457に格納されるデータの例については、図4aの項目425および431に関連する記載に戻って参照されたい。
項目459は、リードが結合することが知られている様々な周知の標的分子との関連、ならびに入手可能な場合には、関連する反応データを含み得る任意選択のフィールドである。この例では、メトトレキサートを扱う周知の複合体についてのpdb受付コードが列挙されている。最後に、項目460は、リード候補についてのアドメトックス・プロファイルを表す別の任意選択のフィールドであり、これには、臨床前試験または臨床試験の結果として周知の副作用の一覧が含まれることもある。
別の実施形態では、適切な計算ツールを用いて構造データが生成されることがある。別の実施形態では、仮想化合物ライブラリに含めることに従って、in silicoで構造データが生成されることがある。別の実施形態では、コンビナトリアル・ケミストリ・ライブラリから構造データを取得することができる。別の実施形態では、構造データは、本質的に2次元または3次元であり得るが、典型的には、2次元情報は、適切な構造生成計算ツールによって変換されることになる。このようなソフトウエア・ツールの例は、CORINAプログラム[74]である。
本発明の一実施形態では、潜在的な反応物質のレコードは、図4aに関して説明した標的分子レコードのものに極めて類似した形式をとり得る。別の実施形態では潜在的な反応物質のレコードの形式は、実際には、特に潜在的な反応物質が生体高分子であるときには、標的レコードのものと形式が同じであることさえある。しかし、典型的には、注釈情報も周知の結合剤もあまり多くなく、したがって、入手可能な反応データもほとんどないか、または全くないことがある。さらに、場合によっては、構造データは、直接測定したものではなく、構造モデル予測の結果であることがある。これは、GPCRまたはイオン・チャネル受容体など、多数の膜関連タンパク質を考慮するときにしばしば当てはまる。大きなタンパク質ファミリの類似の受容体を考慮するときには、モデルにより構築された構造もしばしば用いられる。
本発明の一実施形態では、標的、リード候補、および潜在的な反応物質は、それらが互いに、かつそれらの環境と相互作用する場合、完全な分子(または、2つ以上の分子の化合物)として表され、またモデル化される。別の実施形態では、1つまたは複数の計算プロセスを速めるために、計算プロセスではこのような分子の無関係な、または不活性な部分を除去し、実際の分子が普通なら備える数よりも原子および結合部の数が少ない部分的な分子として標的、リード候補、および/または潜在的な反応物質をモデル化することがある。例えば、一実施形態では、標的タンパク質の1つまたは複数の結合ポケットのところに、またはその近傍に存在するものを除くすべてのタンパク質原子を無視することができる。別の実施形態では、潜在的な水素結合ドナーに取り付いた極水素以外のすべての水素原子を無視することができる。別の実施形態では、これらの水素原子を無視するのではなく、それらの非水素原子の相手とともに1つにまとめる。別の実施形態では、水素原子についての類似の処置が、リード候補および/または潜在的な反応物質中の原子に当てはまることがある。
本発明の一実施形態では、タンパク質の内部の表面から離れた残基を含む原子は、それぞれ別個の残基に従って合わせてグループ化され、計算のための1つのユニットとして各グループを扱うことによって、エネルギー・パラメータの割当ておよび後続の計算によるモデル化が高速化される。1つ(または複数)の分子の一部を適切に除去し、代表的なグループによって他の部分を置換することが適切に行われると、計算結果に大きな影響を与えずに、必要とされる計算の数をかなり少なくすることができる。
一実施形態では、リードの送達および/またはリードと標的または潜在的な反応物質との反応部位の場所を考慮に入れる。例えば、リードが経口摂取される薬物の場合、計算プロセスでのリードの表現は、このリードが消化系を通過した後に残るリードの部分とし得る。別の例では、潜在的な反応物質が膜結合タンパク質であり、反応部位が細胞表面である場合、この潜在的な反応物質の表現は、この細胞の外側に存在するタンパク質の部分だけを含み得る。
本明細書では、「反応」という用語は、反応物質の1つまたは複数の作用を変化させる何らかの化学的または物理的な相互作用を指す。例えば、病気または障害を引き起こす何らかの望ましくない生物学的なプロセスに関与するタンパク質である標的を考える。この場合、この病気または障害の治療には、原因タンパク質と反応し、それによってこの特定の望ましくない作用についてこのタンパク質を不活性にする何らかのリード生体分子、例えば小型の分子リガンドを必要とし得る。
反応は、反応物質、環境、または反応物質とそれらの環境との相互作用を改変することである。交差反応は、2つ以上の反応物質、すなわち、リード候補と潜在的な反応物質の間の反応である。この潜在的な反応物質は、標的と異なる別の生体高分子であることが多く、不測の、おそらくは望ましくないものでさえある。反応物質が別の反応物質に結合するときに有害な交差反応が生じ、それによって作用が変化し、また、局所的な環境、組織の一部、器官、さらには生物全体に対する悪影響につながる応答が生成される。このような有害な交差反応の例は、メトトレキサートがジヒドロ葉酸還元酵素以外の肝臓内のタンパク質と結合し、それによって、化学療法処置で一般的な脱毛症、吐き気、および肝臓障害のような有毒副作用が誘発されることである。上記で説明したように、アドメトックス・プロファイルは、吸収、分布、代謝、排泄、および毒性に関係する反応を評価しようと試みるものである。
本明細書では、反応性は、1つまたは複数の分子間の化学活性を、それらの環境と組み合わせて表す用語として用いられる。反応性の値は、本質的に、定性的(完全に反応する、極めて反応性が高い、あまり反応性が高くない)、定量的(結合自由エネルギー、エンタルピ、反応の度合いまたは速度、解離定数または阻害定数の推定、実験的に導出される信号強度、ハイスループット・スクリーニングの結果、QSAR予測[53]、[54]など)、観察的(ある種の特徴を示す、ある作用を誘発する、観察される症状、徴候)、または実験的(知識またはルールに基づく予測、類似の分子の組合せからの示度)なものとし得る。交差反応性は、先に論じたように、潜在的に有害な、またはそうでない交差反応の反応性を指す。
反応の尺度は、1つまたは複数の反応性の値の関数である。本発明の一実施形態では、反応の尺度は、結合親和性の推定値を表す1つの反応性の値によって決まる。別の実施形態では、反応の尺度は、複数の反応性の値によって決まる。例えば、これらの反応性の値の1つは、結合親和性の推定値を表し、別の反応性の値は、QSAR解析の結果を表す。別の実施形態では、反応の尺度は、1つまたは複数の反応性の値の多項式関数である。別の実施形態では、反応の尺度は、1つまたは複数の反応性の値の非線形関数である。これは、例えば、結合エネルギーの推定値に基づくボルツマン確率分布である。交差反応の尺度は、先に論じたように、潜在的に有害な、またはそうでない交差反応に関する反応の尺度を指す。
リード候補と潜在的な反応物質を扱う組合せに割り当てられる反応プロファイルは、反応の尺度および他の変量の関数である。ある種の実施形態では、反応プロファイルは、様々な生物学的かつ/または化学的な注釈を含み得る。このような注釈は、リピンスキーの「ルール・オブ・ファイブ」に基づく分類、標的/リード/潜在的な反応物質分子のソース/機能/相同体注釈、アドメトックス・プロファイルの結果、反応部位の場所、log Pなどを含み得るが、これらに限定されるものではない。この反応プロファイルは、定性的なもの(例えば、等級または分類)、あるいは定量的なもの(例えば、複合スコアまたは数学関数)とし得る。交差反応プロファイルは、先に論じたように、潜在的に有害な、またはそうでない交差反応に関する反応の評価を指す。
ソース注釈は、標的/リード/潜在的な反応物質分子の宿主生物、器官、組織、膜、細胞型、野生型の知識を含み得る。
機能注釈は、例えば、タンパク質についての機能の知識、タンパク質をコードする遺伝子の機能、あるいはこの生体分子に対応する生物経路または反応サイクルの知識を含めて、標的/リード/潜在的な反応物質分子についての機能の知識または予測を含み得る。
相同体注釈は、クエリ標的/リード/潜在的な反応物質に何らかの形で類似すると考えられる他の生体分子、すなわち「クエリ分子」に関連する情報を含み得る。本発明の一実施形態では、クエリ分子がタンパク質のとき、相同体関連物は、クエリ分子のアミノ酸配列と、周知のペプチドまたはタンパク質に対応するアミノ酸配列の基準集合または基準データベースとの間の配列レベルの相同性に基づいて割り当てることができる。別の実施形態では、相同体関連物は、クエリ分子をコードする核酸配列(該当する場合)と、遺伝子、ミトコンドリア遺伝子、mRNA、tRNA、リボソームRNAなどに対応する周知の核酸配列に対応する核酸配列の基準集合または基準データベースとの間の配列レベルの相同性に基づいて割り当てることができる。別の実施形態では、基準集合または基準データベースを含む上記アミノ酸および核酸の配列は、様々な異なる種に由来することがあり、生物学的な機能の点で既に特徴付けられていることもあり、そうでないこともある生体高分子に対応することがある。
一実施形態では、クエリ分子がポリペプチドまたはタンパク質のとき、相同体関連物は、周知の公共の、および所有権下にあるタンパク質との、タンパク質モチーフ、2次構造要素、保存領域、および入手可能な場合にはタンパク質3次構造に基づく構造相同性に基づいて割り当てることができる。別の実施形態では、クエリ分子がタンパク質でなく、例えば、一般有機化合物である場合、様々な化学的かつ/または構造的なクラスタリングおよび分類の技術[75、76]を利用して、周知の化学構造との構造相同性に基づいて相同体関連物を割り当てることもできる。
本発明の別の実施形態では、同じ種内での、または異なる種にまたがる相同体注釈を用いて、相同基準分子のファミリ分類、系統樹その他の機能注釈に基づいてクエリ分子についての追加の機能注釈を推測することができる。
リスク評価は、1つまたは複数の潜在的に有害な交差反応の確率を反映したリード候補ごとの概要評価であり、各リード候補と1組の潜在的な反応物質分子との反応に対応する1組の反応プロファイルに基づくものである。リスク評価の値が大きいことは、1つまたは複数の標的分子についての所望の作用部位と同じ環境においてか、あるいは、例えば消化管内など、薬物送達/分配プロセスの何らかの他の生物学的な段階においてかにかかわらず、リード候補が、1つまたは複数の毒性副作用のために安全でないか、複数の望まれない副作用のために望ましくないか、あるいは、様々な潜在的な重要反応物質との反応性が高いために薬効がないかを示唆している。
リード候補についてリスク評価の値を求めることは、このリード候補が1つまたは複数の所望の標的分子と反応する際の反応データを必要とすることもある。リスク評価の大小に応じて、リード候補を改変して、1つまたは複数の所望の標的との結合特異性を増大させることが望ましいことがある。一実施形態では、リスク評価の値が大きすぎる場合、リード候補全体を破棄することがある。所与のリード候補との反応プロファイルを入手可能な潜在的な反応物質分子が多いほど、リスク評価が正確かつ堅固になる可能性が高くなる。リスク評価は、新しい潜在的な反応物質分子が入手可能になったときに更新することもできる。
図5を参照すると、1つまたは複数のリードと潜在的な反応物質の集合との間の交差反応の値を求め、対応する反応プロファイルを生成し、各リード候補ごとのリスク評価を形成し、所望の場合には、薬物の再設計および最適化の手順に入って、ある種のリードの選択性を改善するコンピュータ援用モデリング・システム500が示されている。
図5では、項目502は、潜在的な反応物質分子のデータベースまたはライブラリを表す。一実施形態では、潜在的な各反応物質分子に関連する情報は、図4aに示す形式の分子レコードに格納され、処理中にこれらのレコードは、システム500の他の部分に渡される。図5では、これらの潜在的な反応物質分子レコードを506と示す。潜在的な反応物質データベース502および関連する潜在的な反応物質分子レコード506に関する様々な以下の実施形態は、リード・データベース504および関連するリード分子レコード508に等しく良好に適用されることに留意されたい。
本明細書では「潜在的な反応物質分子」と称するが、ある種の実施形態では、潜在的な反応物質は単分子に限定されないことを理解されたい。潜在的な反応物質データベースは、商業的かつ/または学術的な状況で一般に用いられる、ファイル・システム上に格納されるフラット・ファイルの集合、リレーショナル・データベースその他のタイプの情報データベースとし得る。
一実施形態では、データベース502は、タンパク質データ・バンクの既知の非冗長タンパク質をすべて表し、周期的に更新して最新の情報に保つことができる。別の実施形態では、データベース502は、GenBank、SwissProtなどにおけるゲノム情報の様々な翻訳物を表すアミノ酸配列に基づいてモデルにより構築されたタンパク質構造を含み得る。別の実施形態では、データベース502に格納される構造の一部は、保存領域、結合部位、個々の鎖などを含むものなど、様々な生体高分子の関連するサブセットを表すことができる。
別の実施形態では、データベース502を構成する潜在的な反応物質分子の選択は、1つまたは複数の標的分子の事前知識または特徴付け、ならびに可能なリード候補分子が関わる反応予想部位の局所環境の影響を受ける。一実施形態では、潜在的な反応物質分子は、2次構造または3次構造、あるいはアミノ酸配列のレベルで、1つまたは複数の所望の分子の全部または一部に相同なタンパク質その他のポリペプチドを表すことがある。一実施形態では、潜在的な反応物質分子は、1つまたは複数の所望の標的分子を扱う生物経路、またはその代わりに、1つまたは複数の所望の標的分子についての薬物候補の分配、排泄、代謝、および吸収に関係する基本的な生物学的プロセスに関連する生物経路に関わることが知られている生体分子を表すことがある。データベース502を形成するために潜在的な反応物質分子を選択し得る多くのやり方があるが、これらはしばしば、所望の1つ(または複数)の標的分子およびそれらに付随する生物経路に関する1種または複数種の考察を必要とすることになる。別の実施形態では、潜在的な反応物質データベース502は、交差反応について試験すべき様々なリード候補が対象とする1つまたは複数の標的分子についての分子レコードも含む。図4aおよび図4bに関して既に述べたように、潜在的な反応物質に関する分子レコードおよび標的生体分子に関する分子レコードは、本質的に極めて類似したものになることがある。
図5では、項目504は、リード候補分子のデータベースまたはライブラリを表す。一実施形態では、各リード候補に関連する情報は、図4bに示す形式の分子レコードに格納され、処理中にこれらのレコードは、システム500の他の部分に渡される。図5では、これらのリード候補分子レコードを508と示す。このリード候補データベースは、商業的かつ/または学術的な状況で一般に用いられる、ファイル・システム上に格納されるフラット・ファイルの集合、リレーショナル・データベースその他のタイプの情報データベースとし得る。
データベース504を構成するリード候補分子は、多くのやり方で選択することができる。一実施形態では、リード候補分子は、1つまたは複数の所望の標的生体分子に適用する様々なリード創製プロセスおよび/または他のリード最適化プロセスの結果である。先に論じたように、このようなリード創製および最適化のプロセスは、合理的な薬物設計、QSAR、構造に基づく設計、化合物または仮想ライブラリのin silicoスクリーニング、機能アッセイ、マイクロ・フルイディクス、他の細胞に基づくアッセイまたは生化学アッセイなどを含むハイスループット・スクリーニング、あるいはこれらの任意の組合せを含み得る。次いで、このようなプロセスに合格したリード候補をデータベース504のメンバとして組み込むことができる。別の実施形態では、リード候補分子は、普通なら臨床前検査に進む1組のリードを表すことがある。
別の実施形態では、データベース504に組み込まれるリード候補分子は、1つまたは複数の所望の標的生体分子についての構造的かつ化学的な多様性および任意の事前特徴付けに基づいて、既存の仮想的な、またはそうでない化合物ライブラリからのサブセットとして選択し得る。別の実施形態では、リード候補分子の集合は、シード構造、すなわちコアまたは枠組として使用することができ、これに、分子構造生成技術および/またはコンビナトリアル・ケミストリ技術用の標準の計算ツールを適用して、元のコア構造に基づく別の代表的な構造を備えた追加の化合物の集合を生成する。データベース504を形成するために有力なリード候補分子を選択し得る多くのやり方があり、これらはしばしば、対象とする1つ(または複数)の標的分子およびそれらに付随する生物経路に関する1種または複数種の考察を必要とすることが当業者には理解されよう。実際、多くの場合、データベース504中のリード候補分子は、何らかの他のやり方で、1つまたは複数の所望の標的分子の挙動を抑制し、これらに触媒作用を及ぼし、また影響を及ぼすと予想される。
一実施形態では、データベース504は、後でより詳細に論じる薬物の再設計および最適化の手順の結果として生成される構造についての分子レコードも含み得る。
別の実施形態では、データベース502および504に格納される分子レコードおよび関連するデータを様々な情報圧縮方式を利用して圧縮し、それによって、分子の原子および結合部に関連する潜在的に無数の数値パラメータを格納するコストを下げることができる。別の実施形態では、データベースから関連するデータにアクセスするとき、データベースの処理時または要求時に、その実行中にこれらのデータを解凍することができる。
データベース502および504中の分子レコードを、バイオインフォマティックスの様々な化学的、構造的その他の技術によってクラスタ化して、データベースの一部選択およびクエリを処理しやすく、また理解かつ再検討しやすくすることもできる。一実施形態では、あらかじめデータベース502をクラスタ化し、クラスタの代表を選択してモデリング・システム500の別の処理ステップによって処理し、それによって全体の計算時間を速くする。次いで、リード候補とクラスタ化された潜在的な反応物質の1組の代表について生成された結果を再検討し、大きな反応性を示したクラスタの代表について、データベース502から対応するクラスタ全体を取り出し、モデリング・システム500によるさらなる処理を開始し、それによって、問題の1つ(または複数)のリード候補についてのリスク評価が完了する。このようにして、多数の潜在的な反応物質に対して多数のリードをスクリーニングすることができ、次いで、1つまたは複数のリードと有望なクラスタの個々のメンバとの間の個々の処理を行うことができる。このような実施形態により、所与の労力で、1組の可能なリード候補と潜在的な反応物質をより効率的に扱うことができる。
図5を再度参照すると、処理ブロック520は、反応決定部を表している。
1つまたは複数の潜在的な反応物質のレコード506を、1つまたは複数の可能なリード候補のレコード508とともに反応決定部520に提供する。あるいは、反応決定部520は、処理中に状況の必要に応じてデータベース502および504から直接、追加の分子レコードを先取りすることができる。反応決定部520は、1つまたは複数のリード候補レコード508および1つまたは複数の潜在的な反応物質のレコード506について、1組の反応の尺度を決定する。
反応の尺度はそれぞれ、1対のレコードに対応する。一方のレコードはリード候補に対応し、もう一方のレコードは潜在的な反応物質に対応する。この反応決定部は、各対を順に処理することもできるし、複数の対を並列に処理することもできる。典型的な実施形態では、1つのリード候補のレコードおよび複数の潜在的な反応物質分子が反応決定部に提示され、反応決定部は、リード候補分子および1つの潜在的な反応物質分子からなる対ごとに反応の尺度を生成する。別の実施形態では、1つの潜在的な反応物質のレコードおよび複数のリード候補のレコードが反応決定部520に提示され、その後反応決定部520は、リード候補分子および1つの潜在的な反応物質分子からなる対ごとに反応の尺度を生成する。
反応の尺度を構築するために、反応決定部520は、コンピュータ記録可能媒体上の格納部522から取り出した追加の入力パラメータ・データに基づいて1つまたは複数の反応性の値を直接生成することもできるし、コンピュータ記録可能媒体上の格納部524から1つまたは複数の既に計算した反応性の値を取り出すこともできる。一実施形態では、この反応決定部は、格納部522に置かれた様々な力場パラメータ・データ、例えばAMBER96力場に関連するパラメータを使用する分子力学法に従って、リード候補と1つ(または複数)の潜在的な反応物質レコードとの間の結合自由エネルギーについての推定値を計算する。別の実施形態では、反応決定部520は、直接にはモデリング・システム500の一部でさえないことがある別の処理モジュールによって事前に、または並列に計算した反応性の値を取り出す。例えば、リード候補および1つ(または複数)の潜在的な反応物質分子についてのQSAR計算をオフラインで計算し、次いで、ファイル・システムまたはコンピュータ・メモリなどのコンピュータ記録可能媒体上に適切に格納し、その後、関連する反応の尺度を形成するときに、反応決定部が取り出すことができる。別の実施形態では、反応決定部520内にQSAR計算用の専用処理要素を埋め込む。
反応決定部520は、1つまたは複数のリード候補と潜在的な反応物質対の反応の尺度を表すデータを、潜在的な反応物質−リード候補用反応フィルタ530に出力する。反応フィルタ530は、入力された反応の尺度に基づく様々な判定基準を適用して、特定の潜在的な反応物質−リード候補対をモデリング・システム500の後続の段階で利用可能にすべきかどうかを決定する。原理的には、リード候補−潜在的な反応物質対の多くは、反応性をわずかしか示さないか、または全く示さないことがあり、そのため、対応する反応の尺度は極めて小さい。したがって、場合によっては、反応の確率が低く見える、すなわち、結合親和性が悪く見える対をフィルタリングして除去することが望ましいことがある。
一実施形態では、反応フィルタ530は、反応の尺度の大きさが所定の閾値よりも大きいリード候補−潜在的な反応物質対しかシステム500の後続の段階に通過させない。別の実施形態では、反応フィルタ530は、反応決定部520によってすべての関連する対が処理されるまで待ち、これらの対応する反応の尺度によってランク付けを行い、次いで、上位X%(Xは、1と100の間の選択した数)を通過させる。別の実施形態では、反応フィルタ530は、所定の閾関数を適用する。この所定の閾関数は、入力される関数の引き数として1つまたは複数の反応の尺度を取り、次いで、変換された反応の尺度、例えば、1つ(または複数)の反応の尺度の多項式関数または指数関数に閾論理を適用する。
別の実施形態では、特定のリード候補−潜在的な反応物質対についての反応の尺度をよりよく判定するために、反応フィルタ530は、リード候補が反応かつ/または結合すると予想される1つまたは複数の所望の標的分子と反応した同じリード候補についてのあらかじめ集計された関連する反応データを使用する。例えば、関連する反応データが入手可能な場合、反応フィルタ530は、反応の尺度が、リード候補と所望の標的分子についての反応の尺度に定数を掛けたもの未満であるリード候補−反応物質対をフィルタリングして除去することができる。ここで、前記定数は通常、ゼロと1の間の値である。別の実施形態では、反応フィルタ530は、代わりに、潜在的な反応物質と結合することが知られている1つまたは複数の生体分子、すなわち、この潜在的な反応物質に関わる周知の結合剤または複合体と反応した潜在的な反応物質についてのあらかじめ集計された関連する反応データを使用する。しかし、多くの場合、このような追加の反応データは入手可能でないことがあり、そのため、反応フィルタ530は必ずしもそれを要求しない。
他の実施形態では、反応フィルタ530を通過することができないリード候補−潜在的な反応物質対も、それらの対応する反応の尺度その他のデータを転送して、1つまたは複数のデータベース・テーブルまたはフラット・ファイル中のコンピュータ記録可能媒体(項目532)に格納する。別の実施形態では、すべてのリード候補−潜在的な反応物質対は、反応フィルタを通過することができ、反応フィルタ530は単に、関連する反応データを取り込み、その結果をデータ構造532に丸ごと格納する機構として働く。
ある種の実施形態では、反応フィルタは、本発明に不可欠ではないとみなされることがあり、すべてのリード候補−潜在的な反応物質対は、モデリング・システム500の後続の段階へと通過する。
反応フィルタ530は、反応プロファイラ550へと通過するリード候補−潜在的な反応物質対に対応する反応データを出力する。反応プロファイラ550は、前に定義したように、530から入力される対応する反応の尺度その他の変量に基づく各リード候補−潜在的な反応物質対ごとの反応プロファイルの構築を司る。先に述べたように、これらの他の変量は、例えば、リピンスキーの「ルール・オブ・ファイブ」に基づく分類、関連する標的/リード/1つ(または複数)の潜在的な反応物質分子のソース/機能/相同体注釈、アドメトックス・プロファイルの結果、反応部位の場所、log P、log Dなどを含み得る。図4aおよび図4bに関して先に述べたように、リード候補および潜在的な反応物質のレコードは、ソース、機能、および構造的な注釈に関係する様々なデータ、ならびに様々な薬物動態学特性を含み得る。
潜在的な反応物質分子は、相同体注釈について前に説明した目的で、他の生体分子に関連する相同体も含み得る。一実施形態では、これらの相同体関連物は、潜在的な反応物質分子データベース502にレコードとして格納された他の潜在的な反応物質分子を指す。別の実施形態では、潜在的な反応物質分子のレコードは、図5の格納バッファ552で表す専用のデータ構造またはファイルにバッファされる。別の実施形態では、バッファ552は、潜在的な反応物質データベース502に直接関連しないコンピュータ記録可能媒体上のデータベースまたはデータ構造からロードされる。
別の実施形態では、異なる格納バッファ554は、1つ(または複数)のリード候補が結合することが知られている1つまたは複数の標的生体分子を格納するためのデータの構造またはファイルを表す。このような実施形態では、バッファ554に格納されたデータを用いて、1つ(または複数)の標的およびリード候補を扱う分子の組合せの反応の尺度を生成することができる。次いで、得られた反応の尺度と、このリードと1つまたは複数の潜在的な反応物質に関連する反応の尺度とを比較することができる。これは例えば、結合親和性についての相対比較である。一実施形態では、この1つ(または複数)の比較では、1つまたは複数の定量的なリード−標的反応の尺度を用いて数値的な閾値を生成し、それによって、同じリードと潜在的な反応物質についての定量的な反応の尺度をさらにフィルタリングまたは重み付けする必要があることがある。別の実施形態では、格納バッファ554は、識別された標的分子に相同の生体分子のレコードも含む。一実施形態では、これらの標的レコードおよび/または相同標的レコードを格納し、潜在的な反応物質データベース502から、適切な相互参照によってリード候補データベース504中で直接アクセス可能である。一実施形態では、バッファ554は、データベース502または504に直接関連しない入力される様々なデータベースまたはデータ構造からロードされる。
バッファ554に格納されるものなどの情報は、一般に有用であるが、本発明に本質的なものではなく、このようなあらかじめ識別された標的分子が存在しない場合、バッファ554は本質的に残っているだけで使用しない。本発明の別の実施形態では、個々のリード候補−潜在的な反応物質対に対応する反応プロファイルを構築する際に、反応プロファイラ550はバッファ552および554のいずれも使用しない。
反応プロファイルは、例えば等級などの本質的に定性的なもの、または、例えばスコアまたは関数値などの本質的に定量的なものとし得る。反応プロファイラ550は、反応フィルタ530から提示されたリード候補−潜在的な反応物質対についてのみ反応プロファイルを生成することを想起されたい。一般に、リード候補−潜在的な反応物質対の反応プロファイルを形成するとき、1つ(または複数)の反応の尺度、リード候補および潜在的な反応物質についての注釈、ならびに、アドメトックス・プロファイルまたは様々な生化学アッセイの結果など、他の特性を含めて、入手可能な反応データが多いほど、反応プロファイルが質の高い、すなわち、適切かつ有意義なものである確度が高くなる。
一般に、反応の尺度は、リード候補と潜在的な反応物質の間の交差反応の強さを反映するが、それ自体では、その交差反応が有害であるか否か、すなわち、有毒であり、また、望まれない副作用を誘発するかどうかについてほとんどわからない。また、反応の尺度はそれ自体では、1つまたは複数の所望の標的生体分子との意図する反応部位におけるリード候補のバイオ・アベイラビリティが、対象の病状または病気処置するのに効果があるほど十分なのかどうかは直接予測されない。
一実施形態では、ソース、機能、および相同体の注釈を含めて、リード候補および潜在的な反応物質に対応する反応の尺度の大きさおよび注釈データに基づいて、反応プロファイルに信頼度または信頼性スコアを割り当てる。例えば、潜在的な反応物質のソースおよび機能が周知である場合、例えば、ヒトインスリン分子であり、反応の尺度が大きい場合、反応プロファイルの信頼性スコアは高くなり、それによって、反応は強くかつ有害な可能性がある確率が高いことを反映することになる。別の例では、潜在的な反応物質は、脳における周知の機能のタンパク質であり、いかなる交差反応も悪性である可能性が高いが、このリード候補に付随する注釈情報は、このリードが血液脳関門を貫通することができず、そのため、このリードと潜在的な反応物質が互いに遭遇する可能性は少ないことを示すことがある。
別の例では、潜在的な反応物質自体は良好に特徴付けられないが、マウスの周知の癌遺伝子に関係するマウスタンパク質との構造的かつ配列のレベルで相同性が高いことが示される。先に説明したように、相同性注釈を用いて機能を推測することができる。したがって、リード候補が、上記マウス相同体潜在反応物質について高い反応の尺度を示す場合、このリードはヒト宿主生物においても発癌性を示す確度が高いと推論し得るはずである。一方、潜在的な反応物質との反応が潜在的に危険であっても、反応の尺度が小さいので信頼性スコアが比較的低くなることがある。というのは、リードとの何らかの反応が生じることが疑わしいことがあるからである。
別の例では、潜在的な反応物質が、ヒト免疫系に関わるタンパク質ファミリのメンバと分類される場合、反応の尺度が大きいと、このリードに対する免疫系の応答が潜在的に有害である確度が高く、おそらくは、アレルギー反応を誘発することになると推測される。別の例では、信頼性スコアが高いことは、様々な注釈および分類によって様々な消化プロセスに関わる生体分子と特徴付けられた潜在的な反応物質との強い相互作用のためにバイオ・アベイラビリティが低くなることを反映していることがある。別の例では、信頼性スコアが高いことは、薬効が欠如していることを反映していることがある。というのは、潜在的な反応物質が、所望の標的との意図する反応部位の同じ局所的な環境に存在する酵素であり、この潜在的な反応物質がリードと極めて強く結合して、標的と競合し、それによってリード候補の作用を実質的に低下させるからである。
別の実施形態では、信頼性スコアの代わりに、1つ(または複数)の反応の尺度の大きさ、ならびに潜在的な反応物質およびリード候補分子についての周知の入手可能な情報を反映する等級その他の定性的な分類を用いる。別の実施形態では、リード候補についてのアドメトックス・プロファイルが、このリードの様々な代謝、吸収、分布、排泄、および有毒な特性に関して既知であるか、あるいは、別の分子との構造的または機能的な類似性に基づいて外挿されるとき、このアドメトックス・プロファイルを用いて反応プロファイルの構築を補足することができる。例えば、リードが生物の消化系を無傷で通過して血流に効率的に吸収される確度についての知識、血液脳関門などの主要な膜を貫通する透過性、発癌性などを用いて、特定の潜在的な反応物質との反応が生じ、またそれが有害であるかどうかを推測することができる。
反応プロファイラ550は、各リード候補−潜在的な反応物質対ごとに、反応プロファイルをリスク評価解析部560に出力する。リスク評価解析部560の役割は、入力された反応プロファイルに基づいて、リード候補分子に関わる1組の反応プロファイルを解析した後で、リード候補ごとのコンセンサスまたは概要評価を形成することである。ある種の実施形態では、リード候補ごとのリスク評価は、この1組の反応プロファイルに基づく定量的なスコアまたはランク付けである。本発明の一実施形態では、リード候補に関わる1組の定量的な反応プロファイルを合計してリスク評価を生成する。別の実施形態では、リスク評価は、これらの反応プロファイルの1次結合である。別の実施形態では、リスク評価は、多項式関数または非線形関数など、定量的な反応プロファイルの関数である。
別の実施形態では、リスク評価は、ニューラル・ネットワークまたはサポート・ベクトル・マシンなどのコンピュータ学習手法から出力された予測を表す。この場合、定量的な反応プロファイルは入力として働き、学習アルゴリズムは、好都合なリードおよび不都合なリードを含めて、副作用および薬効の点で既に特徴付けられた化合物のデータの組について訓練される。別の実施形態では、リスク評価は、上位N個の反応プロファイルの平均として求められ、それらの対応する信頼性尺度に基づいてランク付けされる。ここで、Nは、例えば正の小整数である。別の実施形態では、リスク評価は、定性的な反応プロファイルに基づいて得られたコンセンサス等級その他の定性的な分類である。別の実施形態では、リスク評価は、複数の反応プロファイルに統計解析を適用することに基づいて生成された信頼性のスコアまたは確率である。この統計解析には、多変量解析(例えば、zスコア、カイ自乗など)またはベイズ解析(例えば、ベイズ・リスク)が含まれるが、これらに限定されるものではない。
このシステムの他の構成要素の場合と同様に、リスク評価解析部560は、より多くの潜在的な反応物質および/またはより多くの反応データが入手可能になったときに、所与のリード候補についてのリスク評価を更新することができる。一実施形態では、リスク評価解析部560は、リード候補ごとに、専用のデータ構造にリスク評価を出力して、記録可能なコンピュータ媒体上に格納し、後で再検討し解析することができる。
この考察をよりよく例示するために、再度、図2a〜図2dに示し、図4bに示す分子レコードにも表すリード候補であるメトトレキサートを考える。メトトレキサートは、図1a〜図1dに示す標的分子であるジヒドロ葉酸還元酵素(DHFR)を抑制する。メトトレキサートは、実際には、ある種の白血病を含めて様々な癌を治療する化学療法で使用する癌治療薬である。モデリング・システム500を使用して、化合物メトトレキサートについてのリスク評価を生成すると、いくつかの結果を観察することができる。
第1の結果では、メトトレキサートは、大腸菌由来のチミジル酸シンターゼを表す潜在的な反応物質とかなり強く結合することが観察されることがある。大腸菌チミジル酸シンターゼ(ECTS)は、病原性大腸菌内でデオキシウリジン5’−一リン酸をデオキシチミジン5’−一リン酸に変換することに関係するde novo DNA合成における不可逆ステップを制限することに関わるタンパク質である。図6a〜図6cに、大腸菌チミジル酸シンターゼと、図3a〜図3cに示すものに類似しているが、ここではPDBエントリ1axwから得られた構造データを有するフォーマットのメトトレキサートとの分子複合体の表現を示す。ECTSに関連する反応の尺度は、DHFRに関連する反応の尺度よりも弱いことがあるが、依然としてかなり大きい可能性がある。ECTS−メトトレキサート対についての反応プロファイルを構築するとき、ECTSに付随する注釈情報を調べると、TSの大腸菌変異体は、ヒトの変異体に極めて相同していることがわかる。ECTSに関連する機能注釈をさらに調べると、癌を治療する際、これは実際に有益な標的であり、同様に抑制することが示唆される。というのは、腫瘍の成長に必須である新しいDNA合成をさらに下方制御することによって、腫瘍細胞成長がさらに制限されることもあるからである。
第2の結果では、メトトレキサートは、ウサギの細胞質セリンヒドロキシメチル転移酵素(またはSHMT)を表す第2の潜在的な反応物質に、ある種の親和性で結合することが観察されることがある。この転移酵素は、とりわけ、メチオニンの産生、セリンの可逆産生、およびグリシンの産生を含めて、複数の反応の触媒作用に関わる酵素である。ヒトのSHMTをコードするヒト・ミトコンドリア遺伝子との配列相同性が高いことは、メトトレキサートが、SHMTに関わる反応経路に影響を及ぼすことがあることを示唆している。メトトレキサートの濃度または投薬量が多いと、細胞内のある種のアミノ酸合成経路に悪影響を及ぼすことがあるが、メトトレキサートの関連するアドメトックス・プロファイルを調べると、メトトレキサートが外部細胞膜を貫通する可能性はかなり低く、そのため、細胞表面受容体との相互作用が、アミノ酸合成およびプリン産生においてSHMTが関与する様々なミトコンドリア・プロセスを大きく妨げる可能性は少ないことがわかる。そのため、ウサギSHMT−メトトレキサート対について得られた反応プロファイルは、それ自体では、ヒトにおいて有害な交差反応が生じる確率が高いことを示さないことになる。図7a〜図7cに、ウサギ細胞質セリンヒドロキシメチル転移酵素とフォリン酸(メトトレキサートに類似の化学相同体)の分子複合体の表現を、図3a〜図3cに示すものに類似のフォーマットで示す。この構造データは、PDBエントリ1kl2から得られたものである。
第3の結果では、メトトレキサートは、ヒト、あるいはマウス、ウサギ、またはイヌなどの他の生物の腎臓におけるある種のタンパク質または酵素を表す1つまたは複数の潜在的な反応物質に適度な反応強度で結合することが観察されることがある。ソース/機能/相同体注釈、ならびに、排泄に関する潜在的な懸念を示唆するアドメトックス・プロファイルに基づいて、この反応プロファイルは、メトトレキサートの投薬量が多いと、腎機能に有害である確率が高いことを反映していることがある。
このように、例えば、メトトレキサートについての概要リスク評価は、(a)SHMTを扱う生物経路が阻害される可能性は低い、(b)チミジル酸シンターゼとの反応により腫瘍細胞の成長がさらに制限される可能性が高い、(c)メトトレキサートの濃度が高いことに関係する腎臓の問題および/または障害が潜在的に存在するという予測を含み得る。これらはすべて、様々な実施形態に関して先に論じたように、定量的なスコアまたはランク付けの形式で表すことができ、それによって、メトトレキサートのリスク評価が体系的にまとめられる。
図5に描いた実施形態では、リスク評価解析部560は、薬物再設計フィルタ570に、リード候補ごとのリスク評価も出力する。
薬物再設計フィルタ570は、入力されたリスク評価を調べて、1つまたは複数の所望の標的生体分子に対する選択性を増すために、さらに、リード候補についてのリスク評価が示す識別された潜在的な交差反応の確度または強度を小さくするためにリード候補を改変することができるか、あるいは改変すべきかどうかを決定する。
本発明の一実施形態では、薬物再設計フィルタ570が用いる決定プロセスは、使用者が入力する様々なパラメータによって決まる。一実施形態では、これらの使用者入力パラメータは、例えば、反応の尺度が所定の数値的な閾値を上回る潜在的な交差反応の数をどれだけ許容するかなど、本質的に定量的なものとし得る。別の実施形態では、これらの使用者入力パラメータは、例えば、定性的なリスク評価に関連する許容差など、本質的に定性的なものとし得る。
別の実施形態では、本質的に定性的であるか、定量的であるかにかかわらず、これらの使用者入力パラメータを用いて、低リスクのリード候補を無視し、他のすべてのリードにフィルタ570を通過させることができる。別の実施形態では、使用者が、あらゆる潜在的に有害な、または望まれない副作用がなくなるようにこのようなリードが改変される可能性が小さいとみなすことがあるので、高リスクの候補も無視される。別の実施形態では、フィルタ570は、使用者が指定した数のリードだけを、これらのリードをそれらのリスク評価に基づいて、使用者が指定した順序に従って仕分けした後で通過させることができる。
薬物再設計フィルタ570は、1つまたは複数の所望の標的分子と反応するリード候補の反応データの知識も含む。例えば、このリード候補の所望の標的との反応は比較的弱く、多くの潜在的な有害交差反応を示すことが知られている場合、このリード候補は、薬物再設計プロセスの労力に見合わないと考えられ、そのため、フィルタ570によって遮断し得る。
典型的には、薬物再設計フィルタ570の意図は、可能な化学的かつ構造的な改変を行って、このリードと1つ(または複数)の所望の標的生体分子との選択性を増すこと、すなわち、1つ(または複数)の標的が付随していない潜在的な反応物質との反応性は低くするが、1つ(または複数)の所望の標的分子自体との高い反応性を維持することから利益を得ることができるリード候補を識別することである。この意図はさらに、所望の標的との反応性を改善することも潜在的に含み得る。別の実施形態では、フィルタ570は、可能な化学的かつ構造的な改変を行って、1つ(または複数)の所望の標的分子との反応性を高く維持しながら、有益な潜在反応物質との反応性を増大させることから利益を得ることができるリード候補を識別することもできる。例えば、メトトレキサートの場合、リードを改変して、メトトレキサートの元の標的であるヒト・ジヒドロ葉酸還元酵素との高反応性を保持しながら、ヒト・チミジル酸シンターゼにより良好に結合させ、それによって、癌治療特性がさらに優れた改変リード候補を生成することは可能であり、かつ望ましいことがある。このような場合、問題の潜在的な反応物質は、潜在的な標的と分類し直すことができる。薬物再設計フィルタは、リード候補のサブセットを選択し、これらを薬物再設計/最適化エンジン580に送って、可能な化学的かつ構造的な改変を行うのと同時に、このリード候補の残りの部分を専用のデータ格納部575に送ってさらなる再検討および解析を行う。
図5では、薬物再設計/最適化エンジン580は、薬物再設計フィルタ570が提示した1つまたは複数のリード候補の再設計による可能な改変を探す処理ユニットを表す。これらの改変は、典型的には、リード候補の化学的かつ構造的な変更であり、それによって、このリード候補と1つまたは複数の生体分子との反応性が改変される。例えば、これらの改変では、リードと、リスク評価解析部560で生成されたこのリードのリスク評価で識別された1つまたは複数の潜在的な反応物質との反応性を減少または低下させ、同時に、1つまたは複数の所望の標的分子との反応性の度合いを満足に維持すること、すなわち、リード候補の特異性を増大させることを意図し得る。別の実施形態では、この意図は、化学的かつ構造的な改変を導入して、1つまたは複数の潜在的に有益な交差反応物質との反応性を増大させることである。別の実施形態では、これらの改変は、リードと1つ(または複数)の所望の標的分子との結合親和性を増大させて、薬効を改善し、かつ/または投薬量の要件を減らし、同時に、有害な交差反応の危険性を低く維持することを意図している。
以下の考察の目的のために、構造構成要素という用語を、化学基、さらには場合によっては個々の原子と定義する。有効な構造構成要素は、例えば、アセチル基、メチル基、カルボキシル基、アミン基、ヒドロキシル、芳香環および複素環、リンおよび硫黄を含む様々な基などを含み得る。他の有効な構造構成要素は、DNAまたはRNAにおけるものなど、1つまたは複数の核酸、あるいは、化学的な修飾および/または開裂の結果改変されたアミノ酸を含めて1つまたは複数のアミノ酸、あるいは、炭水化物、脂肪酸、さらには、βシートまたはαヘリックスなどのタンパク質2次構造の構成要素を含む。他の有効な構造構成要素は、有機化合物に一般に見られるものなど、例えば、炭素、酸素、窒素、硫黄、リン、および水素などの個々の原子、または、塩素、臭素、フッ素などのハロゲン、あるいは遷移金属または鉄、マグネシウムなどの他の金属イオンを含み得る。
リード候補構造の可能な改変には、新しい構造構成要素の追加、既存のリード候補構造を含む構造構成要素の置換および/または削除、あるいはこれらの任意の組合せを含む。新しい構造構成要素の追加または既存の構造構成要素の改変により、リード候補の反応性を劇的に変えることができる。
例えば、主要な水素結合のドナー基またはアクセプタ基を取り除くと、潜在的な反応物質との反応が不安定になることがある。一方、特定の水素結合のドナー基またはアクセプタ基を追加すると、1つまたは複数の標的分子との結合親和性が増大することがある。他の基を追加すると、立体構造の衝突または反発が導入されることがあり、そのため、好ましい結合様式が阻害され、そうでない場合にはエネルギー的に有利なファンデルワールスおよび静電気による相互作用が低減することから、1つまたは複数の分子との反応性が大きく劣化する。
構造構成要素の変化により、リードのイオン化状態または電荷分布が変化することがあり、それによって、リードと、1つ(または複数)の標的分子および1つ(または複数)の潜在的な反応物質の電荷および双極子モーメントによって生成された静電ポテンシャル場との相互作用が大きく影響を受ける。疎水基および/または親水基の導入または削除は、リードの様々な溶媒和特性だけでなく、リードとその溶媒環境、例えば水溶液との相互作用も改変し得る。構造構成要素の変化により、溶媒環境内で分離されているか、標的分子または潜在的な反応物質に近接しているかにかかわらず、リードのエネルギー的に最も有利な配座の性質が変化し得る。構造構成要素の追加、置換、および/または削除により、リガンドの電子密度も影響を受けることがあり、それによって、リードと、1つまたは複数の標的分子または潜在的な反応物質との量子力学的な相互作用が影響を受ける。大部分の実施形態では、元のリードの様々な改変によって得られた分子構造はそれぞれ、適切な原子価および/または正しいイオン化状態という意味で正当なはずであり、ほとんどの場合、化学的に合成可能なはずである。
図8aの絵800に、メトトレキサートの構造の2次元表現を表示する。一方、絵820に、メトトレキサートおよびその構造的な仲間の枠組分子構造を、様々な構造構成要素を追加、置換、さらには削除し得る7つの異なる連結部位で強調して示す。図8では、各連結部位は、802、803、804、806、807、808、および809と示す。5つの連結部位(802、803、804、806、および807)では、記号「R」は、いくつかの可能な構造構成要素のいずれかを示す。6番目の連結部位は、陰影を付けた領域808で表す。ここで、連結部位808は、810と標示したアミド結合の先の分子を置換または削除し得ることを表す。7番目かつ最後の連結部位は、さらに大きな陰影を付けた領域809で表す。ここで、連結部位809は、811と標示した結合の先の分子を置換または削除し得ることを表す。
図8aを継続して参照すると、表830に、代替構造構成要素として働き得る1組の分子群または断片の例が列挙されている。表830は、個々の原子種、さらにはアミノ酸、例えば、タンパク質中に一般に見られる20個の残基によってさらに増強することもできる。
図8bに、絵800のメトトレキサートの最終構造に対して、表830からの代替構造構成要素を、図8aの絵820に示す1つまたは複数の連結部位のところで追加または置換することによって得られた6つの構造の例(項目840、850、860、870、880、および890)を示す。例えば、構造840は、メトトレキサートのメチル基を連結部位804のところで個々の水素原子に置換した結果である。実際には、構造840は、アミノプテリンという名称のジヒドロ葉酸還元酵素の別の周知の結合剤である。しかし、このような些細な構造の改変では、生じ得る有害交差反応の危険性が小さくなる可能性は小さい。
構造850は、連結部位806および807のカルボキシル基をメチル基で置換した結果である。構造860に、803のところの平面三角形アミン基をsp酸素で置換して、葉酸として一般に知られる化合物が得られたところを示す。構造870に、連結部位808のアミノ基の先の構造構成要素をすべて、20個の標準アミノ酸の1つであるセリン残基で一括置換し、さらに、アミノプテリンの場合と同様に804のところのメチル基を水素原子で置換したものを示す。構造の例880に、連結部位809の先の構造構成要素をすべてエステル基で置換し、さらに、葉酸の場合と同様に803の平面三角形アミン基をsp酸素で置換したものを示す。構造880は、ビオプテリンとしてより一般に知られているものである。最後に、構造890に、連結部位808のエステル基を置換し、さらに、804のところのメチル基をプテリジン環で置換したものを示す。
この時点で、このような手順の組合せの態様を論じることは価値があろう。N個の異なる代替構造構成要素およびM個の連結部位では、削除を数えなければM個の可能な構造がある。例えば、N=25、M=3の場合、25個、すなわち15,625個の可能な構造がある。あるいは、N=15、M=6の場合、11,390,625個の可能な構造がある。ここで、所与の連結部位に、これらの代替構造構成要素のいずれをも配置し得るとは限らないことが多い。さらに、これら可能な組合せの多くは、アドメトックス・プロファイルの点で薬物にふさわしくない選択をもたらすこともあるし、実際、その化合物を化学的に合成し得ないこともある。さらに、あらゆる可能な組合せをそのまま探す必要はないことがあり、また、得策でないことが多い。上記の数字の例は、例として示したものである。ある種の実施形態では、所与の時間で改変可能なのは、可能な連結部位の一部のみ、例えば、6つの可能な連結部位の3つだけである。これは、N=15では、異なる構造は67,500個だけであることを示唆している。
所望の作用に応じて、薬物再設計/最適化エンジン580は、いくつかの構造的な組合せを効率よく探し、通常は1つまたは複数の所望の標的分子との反応性を高く維持し、同時に、リードと1つまたは複数の潜在的な反応物質との反応性を改変する(通常は低くする)新しい最適な構造を1つまたは複数選択する必要がある。
一実施形態では、薬物再設計/最適化エンジン580は、標的の結合キャビティと交差反応物質の結合キャビティを比較して異なる部分を識別する計算方法を採用する。次いで、キャビティごとに代表形状関数を生成し、その後、前記形状関数の相互の重なり合いを計算することによって、大雑把な評価を高速に行うことができる。重なり合いが少ない領域は異なると考えられる。潜在的な反応物質の結合キャビティの異なる領域を取り出すと、既存のリード候補構造の可能な改変形態について異なる座のところの、またはその近傍の潜在的な連結部位を識別することができる。次いで、リード分子の識別された連結部位のところの1つまたは複数の化学基を追加または改変することができ、それによって、選択された異なる領域の1つまたは複数のところで、反発または立体構造の衝突が生じるか、あるいは、水素結合の発生率および/または強度が低下する。正しく行われると、選択された座は、潜在的な反応物質と標的分子では異なるので、1つ(または複数)の所望の標的分子との反応性は保存されたまま、リードと潜在的な反応物質の反応の強さが弱くなり得る。識別される領域には、対象とする様々な部分間の類似性の尺度を計算するときに、分子の静電気的な特徴を考慮に入れることもできる。別の実施形態では、1つ(または複数)の標的分子の結合キャビティの1つまたは複数の異なる領域を選択することができ、これら異なる領域と緊密に接触するリードの構造構成要素に適切な改変を加えて、このリードと1つ(または複数)の標的との反応性を高め、リードと1つまたは複数の潜在的な反応物質との結合相互作用の改変は最小限に抑える。こうすると、このような改変されたリードは、所与の標的とする病状をより低い投薬量で処置することができ、そのため、有害副作用がなくなる。
別の実施形態では、リード候補データベース504からの試験中のリードは、ミニ・リード・ライブラリ自体として扱うことができ、新しいリードを生成する化学的に許容可能なルールに基づいて異なるリードの一部を交換することができる。すなわち、問題のリードの様々な連結部位で試験される代替構造構成要素は、1つまたは複数の他の被検リードから(部分的に)得ることができる。1つのリードがある種の潜在的な反応物質と交差反応しないか、または比較的低い親和性で反応する場合、そのリードの一部を使用するか、それを現在のものと交換して、改変されたリードを生成することができる。特に、標的に良好に結合するリードの部分を保存することができ、他の何らかの部分を、(問題の交差反応物質と反応しない)別のリードからの部分と置き換える場合、1つ(または複数)の標的分子に結合する際の特異性を増大させることができる。
新しい摂動構造が、元のリード候補構造の主要な枠組またはコアからどのように生成されるかにかかわらず、この新しい構造は、再設計プロセスで参照する潜在的な反応物質ならびに1つ(または複数)の所望の標的分子との反応の点で評価しなければならない。一実施形態では、新しい構造は、1つまたは複数の生化学アッセイまたはウェット・ラボ・アッセイから得られる結果に基づいて評価することができる。本発明の別の実施形態では、この評価は、新しい構造と1つ(または複数)の関連する潜在的な反応物質および1つ(または複数)の標的分子ごとに、好ましい結合様式および結合親和性の予測に基づく計算手段によって実現される。
一実施形態では、計算による予測は、標準形状相補性法、分子力学パラダイム、分子動力学、および/または量子力学シミュレーションに基づく従来技術、QSAR、自由エネルギー摂動論、さらには、様々な実験的に導出された、または知識に基づくスコアリング関数を使用することを含めて、先の背景技術の項および詳細な技術説明のところで既に論じたいくつかの従来技術の1つを利用して得られる。
一実施形態では、静電相互作用は、距離に依存する誘電体を伴う改変されたクーロン・ポテンシャルによってモデル化される。別の実施形態では、分子および局所環境に関わる静電相互作用および静電脱溶媒作用は、ポアソン−ボルツマン方程式の数値解法を利用して計算される。別の実施形態では、静電脱溶媒作用および疎水相互作用はともに、断片ボリュームに基づくモデルを利用してモデル化される。別の実施形態では、静電脱溶媒作用は、改変型ボルン溶媒和モデルを利用してモデル化される。別の実施形態では、ファンデルワールス相互作用は、改変型レナード・ジョーンズ・ポテンシャルによってモデル化される。別の実施形態では、水素結合および金属−リガンド相互作用はともに、改変型レナード・ジョーンズ・ポテンシャルまたは改変型モース・ポテンシャルによってモデル化される。
別の実施形態では、標準の分子力学による表現を用いて、結合伸張、結合の曲げ、適切な捻れおよび不適切な捻れ、ならびに様々なリング変換による配座の変化をモデル化する。別の実施形態では、実験的な定式化を利用して、親油性かつ親水性の相互作用を評価する。別の実施形態では、実験的な定式化を利用して、結合後のリードおよび/またはタンパク質の側鎖のエントロピの低下をモデル化する。別の実施形態では、様々な基底関数の組を用いて、量子力学の手法における適切なハミルトニアンの固有状態および固有値を解く。別の実施形態では、このハミルトニアンを簡略化するためにある種の近似を加えて、分子の電子密度を表す量子力学波動関数の解法を高速化することができる。
本発明の一実施形態では、上記計算を完了するために必要なエネルギー・パラメータは、先に説明したように、例えば、AMBER[40、41]、OPLS[42]、またはMerck Molecular Mechanics力場[43]のものなど、分子力場の一部として提供される。別の実施形態では、これらのエネルギー・パラメータは、アニーリング分子動力学シミュレーションその他の最適化手順に従って、経時的または反復してアニーリングすることができる。これら最適化手順には、遺伝子アルゴリズム、ミーム・アルゴリズム、シミュレーテッド・アニーリング・アルゴリズムなどが含まれるが、これらに限定されるものではない。既に説明したように、これらのエネルギー・パラメータの一部または全部は、データベース502および504中のリード候補および潜在的な反応物質のついての分子レコード中に格納することができる。
別の実施形態では、プラカッシュ Iの方法および装置を利用して、正確かつ効率的に新しい構造をそれぞれ評価する。
一実施形態では、薬物再設計/最適化エンジン580から新たに生成された構造は、リード・データベース504に再提示され、潜在的な交差反応をモデル化するためにシステム500によって再度処理される。ある種の実施形態では、交差反応をモデル化するプロセスの後で、薬物の再設計および最適化が行われる。リードの新しい構造的な変形の創製は、何らかの終端条件その他の基準が満足されるまで反復して繰り返すことができる。このことを、図5に、項目580と項目504を結ぶ矢印で示す。
図8bのメトトレキサートに対して改変された可能な構造850では、図8aの絵820の連結部位806および807のカルボキシル基が取り除かれ、それらの代わりに、水素結合を形成することができない疎水メチル基が用いられる。これら2つのカルボキシル基は、ジヒドロ葉酸還元酵素のある種の表面残基に対して強い水素結合を形成しないが、その代わりに、まず間違いなく溶媒水分子と結合するので、これらを削除すると、メトトレキサートと所望の標的であるジヒドロ葉酸還元酵素との結合がわずかに不安定になることがある。しかし、これらの新しいメチル基は、取り除かれたカルボキシル基に立体構造がいくらか類似しているので、この変化により、メトトレキサートと所望の標的であるジヒドロ葉酸還元酵素との結合が過度に不安定にならないはずである。一方、これらを取り除き、疎水基と置き換えることにより、例えば、ヒトの腎臓における潜在的な反応物質との結合はかなり不安定になり、それによって、リスク評価解析部560に関して論じたように、様々な排泄プロセスの望まれない変化が小さくなる。
次いで、1つまたは複数の潜在的な反応物質ならびに1つまたは複数の標的生体分子との反応性の所望の変化(例えば、潜在的な有害交差反応物質との反応性の低下、1つ(または複数)の所望の標的との反応性の維持または増大など)を示すこれら新しい構造についての分子レコードは、戻されてリード候補データベース504に格納され、新しい再設計または最適化された構造として適切に注釈が付けられる。その後、これらの新しい最適化された候補構造を、モデリング・システム500による新たな処理に再提示して、データベース502中の潜在的な反応物質との有害な交差反応の確率が十分に低くなり、それによって、これら1つ(または複数)の新しい構造がよりよい薬物候補になる確度が改善されるようにする。これらの技術を利用して、初期リード候補データベースにない望ましいリードを見付けることができるはずである。
潜在的な反応物質に対してスクリーニングを行い、リードごとにリスク評価を生成し、薬物の再設計および最適化を実施し、再度スクリーニングするこのプロセスは、特異性が高く、毒性が低く、他の有益な特性を備えた十分に望ましいリード候補構造が得られるまで、複数回実施することができることを理解されたい。
モデリング・システム500は、ソフトウエア、ハードウエア、ファームウエア、またはこれらの何らかの組合せの形で実施し得る。システム500は、ローカル・システムまたは分散システムとすることもできるし、1つまたは複数の汎用コンピュータ上で動作させることもでき、必要に応じて、ネットワーク接続部など、このシステムの周りにデータを伝達する様々なデータ通信チャネルを含み得る。
一実施形態では、モデリング・システム500は、専用のマイクロプロセッサ、ASIC、またはFPGA上で実施し得る。別の実施形態では、モデリング・システム500は、複数のマイクロプロセッサ、ASIC、FPGAを扱う電子基板またはシステム基板上で実施し得る。別の実施形態では、モデリング・システム500は、1つまたは複数の電子装置内に収容された複数の基板上で、または複数の基板にまたがって実施し得る。別の実施形態では、モデリング・システム500は、1つまたは複数の電子基板上に1つまたは複数のマイクロプロセッサ、ASIC、またはFPGAを含み、かつネットワークを介して接続された複数の装置にまたがって実施し得る。反応決定部520および/または薬物再設計/最適化エンジン580に関連するものなど、様々な計算ステップを高速化することを意図して専用のハードウエア処理ユニットを使用することがあり、プラカッシュ Iに記載のものに類似のシステムを必要とすることがある。
ある種の実施形態では、モデリング・システム500は、解析で使用し、また、解析によって生成される必要とされる様々なデータ要素を格納する1つまたは複数の記憶媒体装置も含み得る。
あるいは、ある種の他の実施形態では、これらの記憶媒体装置の一部または全部を、ネットワークその他の方法でモデリング・システム500に接続して外部に配置し得る。外部記憶媒体装置の例は、1つまたは複数のデータベース・サーバまたはファイル・システムを含み得る。1つまたは複数の基板を扱う実施形態に関わるある種の実施形態では、モデリング・システム500は、計算プロセスの助けとなる1つまたは複数のソフトウエア処理コンポーネントも含み得る。あるいは、ある種の他の実施形態では、これらソフトウエア処理コンポーネントの一部または全部を、モデリング・システム500にネットワークその他の方法で接続して外部に配置し得る。
反応決定部520に関して先に説明したように、システム500は、一度に1つのリード候補および潜在的な交差反応物質に対して、すなわち順に動作することもできるし、複数の対に対して並列に動作することもできる。典型的な実施形態では、1つのリード候補レコードおよび複数の潜在的な反応物質分子がシステム500に提示され、このリード候補についてのリスク評価が、リード候補と潜在的な反応物質の対ごとに、関連する1組の反応プロファイルに基づいて確立され、次いで、新しいリード候補レコードおよび同じ1組の複数の潜在的な反応物質分子がシステム500に提示され、関連するすべてのリード候補についてのリスク評価が生成されるまで、このプロセスが繰り返される。
任意選択で、580の薬物再設計/最適化プロセスの開始は、1つのリード候補分子についてのリスク評価の完了後、あるいは、関連するすべてのリード候補分子についての処理が完了した後とし得る。別の実施形態では、1組の潜在的な反応物質分子に対する1組のリード候補についての結果が生成されるが、新しい潜在的な反応物質分子が利用可能になると、すべての潜在的な反応物質に対してリード候補を再計算する代わりに、データベースの最近の更新に関わった潜在的な反応物質のみを、さらには、潜在的な反応物質データベース中の既存の構造に非相同の潜在的な反応物質のみをシステム500に提示して、このリード候補についての反応プロファイルおよびリスク評価を更新する。既に論じたように、薬物再設計/最適化エンジン580で新しい候補構造を構築するときには、この手順全体を反復手順で複数回実施し得る。
ある種の実施形態では、各リードおよび個々の潜在的な反応物質ごとに反応の尺度を個々に計算する代わりに、様々な配列相同性、構造的または化学的な類似性、および/または機能バイオインフォマティックスまたはプロテオミクスの分類基準に基づいて認められた方法に従ってこれらの潜在的な反応物質をクラスタ化またはグループ化し、各クラスタまたはグループからの代表を用いて、特定のリードに対する反応の尺度を生成することができる。次いで、確度の高い反応性を示す潜在的な反応物質クラスタのみをメンバごとに個々に処理して、このリードに関して詳細な個々の反応の尺度およびその後の反応プロファイルを生成し、それによって、計算の全体的なコストおよび時間を低減することができる。
ある種の潜在的な交差反応は有害でなく、運良く好都合なことがあり、予期せぬ利益が得られることがあるので、モデリング・システム500を使用すると、このリード候補についての可能な代替標的が識別されることもある。
要約すると、潜在的に有害な交差反応を計算により予測し、リードおよびその変異体を選択し最適化する新規のシステムを説明してきた。リード候補は、1つまたは複数の所望の標的分子と反応することが知られている複数のリード候補分子から選択することができる。標的は、病気の経路におけるタンパク質とし、リード分子は、この病気に対処する潜在的な薬物候補とし得る。このリード分子は、小型分子薬物の構成要素、またはタンパク質に基づく薬物の構成要素とし得る。このリード分子と1組の潜在的な反応物質分子のそれぞれとの1つまたは複数の反応性の値を求め、反応の尺度を計算する。これらの潜在的な反応物質分子は、リードと1つ(または複数)の標的分子との予想される反応部位に関連するものと同じ環境または異なる環境の、ヒトその他の生物内に存在する、様々な器官/組織/細胞型からの複数の反応物質分子から選択し得る。反応の尺度は、反応の結果としてのこれらの分子およびそれらの環境からなる系の自由エネルギーの変化、すなわち、リードと潜在的な反応物質(または標的)分子との間の結合親和性の関数とし得る。
この反応の尺度を、リード候補および潜在的な反応物質についてのソース/機能/相同体注釈などの他の反応データ、ならびに、リード候補および1つ(または複数)の所望の標的分子についての対応するアドメトックス・プロファイルおよび1つ(または複数)の反応の尺度の計算値などの他の尺度とともに用いて、このリード候補−潜在的な反応物質対についての反応プロファイルを確立する。リード候補−潜在的な反応物質対についての反応プロファイルは、指定した細胞型、指定した組織、指定した器官、および/または指定した生物における反応物質分子の発生率および/または生物学的な機能、リード分子に関わる送達、分布、吸収、排泄、および代謝の様々な機構の作用、潜在的な反応物質および1つ(または複数)の標的分子に関連する機能経路情報、および反応物質分子の関連する配列に基づく、モチーフの、かつ/または構造的な相同体を含めて、1つまたは複数の追加の基準も含み得る。
1組の潜在的な反応物質分子についてのリード候補ごとの1組の反応プロファイルは照合され、リードごとのリスク評価を形成するためにさらに処理される。リードのリスク評価ならびに使用者による様々な入力その他の決定基準に応じて、1つ(または複数)の所望の標的との結合特異性を増大させ、有害な交差反応の確度を低下させ、かつ/または、処置で用いる際に必要とされる投薬量を減少させるために、リード候補を化学的かつ構造的に改変することは価値がある。そのために、このシステムでは、リード、1つまたは複数の潜在的な反応物質、および1つ(または複数)の標的分子の間での予測される結合様式および結合親和性の点で所望の反応挙動を示す1つまたは複数の構造が得られるまで、分子の1つまたは複数の連結部位における様々な非コア分子群の追加、置換、および/または削除を利用して、選択されたリード候補構造の協調的かつ効率的な再設計または最適化も行う。先に論じたように、様々な実施形態は、このような再設計プロセスで生成される新しい潜在的な構造を評価するための新規技術および従来技術をともに包含する。
上記の説明は、例示的なものであり、限定的なものではない。この開示を検討した後なら、当業者には本発明の多くの変形形態が明らかになるであろう。したがって、本発明の範囲は、上記の説明を参照して決定すべきではなく、添付の特許請求の範囲を、それらの均等物すべてとともに参照して決定すべきである。

Claims (70)

  1. 1つまたは複数の所望の標的生体分子と反応することが知られているリード候補生体分子と潜在的な反応物質生体分子との潜在的な交差反応を、分子の組合せを計算によりモデル化し、関連する生物学的かつ化学的な注釈を分析することに基づいて予測しモデル化して反応プロファイルを生成する方法であって、
    計算によるモデル化システムに前記リード候補生体分子のデータ表現を提供することを含み、前記データ表現は、前記リード候補の化学的かつ構造的な情報を含み、前記方法はさらに、
    計算によるモデル化システムに前記潜在的な反応物質生体分子のデータ表現を提供することを含み、前記データ表現は、前記潜在的な反応物質の化学的かつ構造的な情報を含み、前記方法はさらに、
    ある環境状況における分子の組合せの計算によるモデル化に基づいて、前記リード候補生体分子と前記潜在的な反応物質生体分子の間の潜在的な交差反応について、1つまたは複数の反応性の値を推定することと、
    前記潜在的な交差反応に関連する1つまたは複数の反応性の値の関数として反応の尺度を構築することと、
    前記リード候補および前記潜在的な反応物質に関連する前記反応の尺度、ならびに関連するバイオインフォマティックスおよび化学的な注釈の分析結果の関数として反応プロファイルを構築することとを含む、方法。
  2. 前記環境は、前記リード候補と前記潜在的な反応物質の反応部位の物理的かつ化学的な周囲の状況である、請求項1に記載の方法。
  3. 前記環境は、前記リード候補と、前記リードに対する所望の、または既知の標的生体分子との反応部位の物理的かつ化学的な周囲の状況である、請求項1に記載の方法。
  4. 前記環境は、複数の原子、イオン、および/または他の分子を含む溶媒の(暗示的または明示的な)表現を含み、前記溶媒中に前記反応部位が埋め込まれている、請求項1に記載の方法。
  5. 前記環境は、ヒトその他の哺乳動物の身体の1つまたは複数の構成要素を含む、請求項1に記載の方法。
  6. 前記潜在的な反応物質生体分子は、生体高分子、あるいは生体高分子の1つまたは複数の部分を含み、前記1つまたは複数の部分は、1つまたは複数の既知の、または予測される活性部位を含む、請求項1に記載の方法。
  7. 前記リード候補は、合成化合物、化学基、ペプチド、医薬化合物、タンパク質系薬物、または炭水化物を含む、請求項1に記載の方法。
  8. 前記潜在的な交差反応に関連する反応の尺度を形成するのに用いる前記反応性の値の1つは、前記反応の結合親和性または自由エネルギーの計算による推定値である、請求項1に記載の方法。
  9. 前記潜在的な交差反応に関連する反応の尺度を形成するのに用いる前記反応性の値の1つは、並列処理パイプラインを利用して得られる、請求項1に記載の方法。
  10. 前記潜在的な交差反応に関連する前記反応性の値の一部または全部は、あらかじめ生成されるか、またはオフラインで導出され、コンピュータ可読媒体上にデジタル表現で格納され、次いで、前記反応の尺度の形成時に取り出される、請求項1に記載の方法。
  11. 前記潜在的な交差反応に関連する反応の尺度を形成するのに用いる前記反応性の値の1つは、前記2つの生体分子間の定量的な構造活性の関係の事前予測の結果である、請求項10に記載の方法。
  12. 前記潜在的な交差反応に関連する反応の尺度を形成するのに用いる前記反応性の値の1つは、1つまたは複数の実験室でのアッセイから得られた測定値または結果である、請求項10に記載の方法。
  13. 前記1つ(または複数)の実験室でのアッセイは、in vitro、細胞ベース、またはin vivoのいずれかにかかわらず、スクリーニングその他の機能アッセイを含む、請求項12に記載の方法。
  14. 前記潜在的な交差反応に関連する反応の尺度は、複数の反応性の値の1次結合である、請求項1に記載の方法。
  15. 前記潜在的な交差反応に関連する反応の尺度は、複数の反応性の値の非線形関数である、請求項1に記載の方法。
  16. 前記潜在的な交差反応に関連する反応の尺度は、1つまたは複数の反応性の値に基づくスコアまたは等級である、請求項1に記載の方法。
  17. 前記システムに反応フィルタを導入して、関連する反応の尺度が判定基準を満たさない潜在的な交差反応物質を、スクリーニングによる除去その他の方法でさらなる検討から除外する、請求項1に記載の方法。
  18. 前記判定基準は、1つ(または複数)の入力された反応の尺度の大きさに適用する数値的な閾値である、請求項17に記載の方法。
  19. 前記判定基準は、前記システムによって反応の尺度が生成されるときに動的に適用される、請求項17に記載の方法。
  20. 前記判定基準は、個々のリード候補生体分子を扱うすべての反応の尺度が生成された後でのみ適用される、請求項17に記載の方法。
  21. 前記判定基準は、1つまたは複数の所望の、または既知の標的と反応するリード候補生体分子について計算または実験により得られた対応する反応の尺度との相対的な比較に基づくものである、請求項17に記載の方法。
  22. 前記判定基準は、前記リード候補生体分子と潜在的な反応物質の反応に関連する結合親和性(または等価の反応の尺度)に閾値を適用することであり、前記親和性閾値は、(おそらくは1未満の)所定の定数と、前記リード候補生体分子と選択された標的との反応に関連する計算または測定された結合親和性(または等価の反応の尺度)とを掛けたものとして表現される、請求項21に記載の方法。
  23. 前記反応プロファイルの構築で用いる前記潜在的な反応物質生体高分子に関連する前記バイオインフォマティックスその他の化学的な注釈は、前記潜在的な反応物質に関連するソース、機能、相同性、および/またはファミリその他の分類の情報に関係するデータを含む、請求項6に記載の方法。
  24. 前記潜在的な反応物質についての前記ソース注釈は、前記潜在的な反応物質が得られ、由来することが期待され、また、見つかる可能性がある生物、種、器官、組織、細胞型、突然変異体または野生型、および/または系統に関係する情報を含む、請求項23に記載の方法。
  25. 前記潜在的な反応物質についての前記機能注釈は、前記潜在的な反応物質に関わる生物学的な、さらには病気の経路その他の反応および過程、あるいは、前記潜在的な反応物質についての既知の、さらには予測される生物学的な機能に関係する情報を含む、請求項23に記載の方法。
  26. 前記潜在的な反応物質についての前記相同性情報は、同じまたは異なる生物の他の生体高分子との構造および/または配列に基づく相同体との関連物を含み、タンパク質についての前記構造に基づく相同性は、保存領域、タンパク質モチーフ、さらには3次構造の類似性に基づいて確立され、生体高分子についての前記配列に基づく相同性は、1次アミノ酸またはその基礎となるゲノミクス配列の類似性に基づくものである、請求項23に記載の方法。
  27. 前記潜在的な反応物質についての前記相同性情報は、前記リード候補生体分子と反応または結合することが知られている、予測される、かつ/または望まれる1つまたは複数の標的との構造および/または配列に基づく相同性を含む、請求項26に記載の方法。
  28. 前記潜在的な反応物質についての構造および/または配列に基づく相同体は、前記潜在的な反応物質についての追加の機能注釈を推測または予測するためのものであり、前記相同体についてのソース情報は、前記潜在的な反応物質に関連するソース情報に類似していることも、異なることもある、請求項26に記載の方法。
  29. 前記反応プロファイルの構築で用いる前記リード候補に関連する前記化学注釈は、前記リード候補に関連する化学的かつ構造的な組成、反応の化学的性質、相同性、および/または化学的または構造的な分類情報に関係するデータを含む、請求項1に記載の方法。
  30. 前記リード候補についての前記化学的かつ構造的な組成の注釈は、化学式、化学名、1つまたは複数の化学目録に関係する指標記述子、生体分子の化学的かつ物理的な特性、キラル中心および立体化学についての知識、または2次元または3次元の表現での構造情報に関係する情報を含む、請求項29に記載の方法。
  31. 前記リード候補についての前記反応の化学的性質の注釈は、前記リード候補に関わることが知られている、またはその可能性がある1つまたは複数の化学反応または生物学的なプロセスに関係する反応データを含む、請求項29に記載の方法。
  32. 前記化学反応または生物学的なプロセスの範囲は、前記リードとの構造的かつ/または化学的な類似性が高い他の生体分子に関わることが知られている、またはその可能性がある化学反応または生物学的なプロセスを含むように拡張される、請求項31に記載の方法。
  33. 前記リードに関わる1つまたは複数の化学反応または生物学的なプロセスに関係する前記反応データは、前記リードが結合その他の方法で反応することが既に知られている1つまたは複数の標的についての情報との関連物を含む、請求項31に記載の方法。
  34. 前記リードに関わる1つまたは複数の化学反応または生物学的なプロセスに関係する前記反応データは、アドメトックスその他の薬物動態学のプロファイルの1つまたは複数の情報構成要素を含む、請求項31に記載の方法。
  35. 前記リードに関わる1つまたは複数の化学反応または生物学的なプロセスに関係する前記反応データは、1つまたは複数の実験室でのアッセイから得られた1つまたは複数の測定値を含む、請求項31に記載の方法。
  36. 前記リード候補についての前記相同性情報は、他の生物分子との構造に基づく相同体および/または化学的な相同体との関連物を含み、前記構造に基づく相同性および/または化学的な相同性は、2次元または3次元のファルマコフォア・モデル、化合物のクラスタリングおよび分類で用いる様々な分子記述子、または定量的な構造活性の関係の類似性を用いることに基づいて確立される、請求項29に記載の方法。
  37. 前記潜在的な反応物質と、前記リード候補に関連する1つまたは複数の所望の、または既知の標的との構造的または化学的な類似性に関する情報は、前記潜在的な反応物質を扱う潜在的な交差反応についての前記反応プロファイルに反応フィルタを適用するとき、あるいは、前記反応プロファイルを構築するときに考慮される、請求項1に記載の方法。
  38. 前記リード候補と、前記潜在的な反応物質についての1つまたは複数の既知の、または予測される結合剤との構造的または化学的な類似性に関する情報は、前記リードを扱う潜在的な交差反応についての前記反応プロファイルに反応フィルタを適用するとき、あるいは、前記反応プロファイルを構築するときに考慮される、請求項1に記載の方法。
  39. 前記リード候補生体分子は、複数の潜在的な反応物質生体分子に関して検討され、1組の反応プロファイルが構築され、それぞれ異なる反応プロファイルは、前記リード候補生体分子と個々の潜在的な反応物質生体分子の間の潜在的な交差反応に対応する、請求項1に記載の方法。
  40. リード候補生体分子についてのリスク評価は、複数の潜在的な反応物質生体分子に関して前記リード候補について生成された1組の反応プロファイルに基づいて評価される、請求項39に記載の方法。
  41. リード候補生体分子についての前記リスク評価は、新しい潜在的な反応物質が識別され、前記モデリング・システムで利用可能になったときに定期的または不定期に更新される、請求項40に記載の方法。
  42. 前記リスク評価は、複数の定量的な反応プロファイルの1次結合その他の機能的な合成物である、請求項40に記載の方法。
  43. 前記リスク評価は、複数の定量的な反応プロファイルに基づいて生成された定性的な分類または等級である、請求項40に記載の方法。
  44. 前記リスク評価は、複数の定量的な反応プロファイルの統計分析に基づいて生成された信頼性のスコアまたは確率あるいは統計量である、請求項40に記載の方法。
  45. リード候補生体分子についての前記リスク評価を構成するのに用いる前記統計分析では、1組の反応プロファイルすべての平均値または中心値、あるいは、前記1組の反応プロファイルの百分率の上位選択範囲を用いる、請求項44に記載の方法。
  46. リード候補生体分子についての前記リスク評価を構成するのに用いる前記統計分析はベイズ・リスク分析である、請求項44に記載の方法。
  47. 前記リスク評価は、コンピュータ学習手法から出力された予測を表す、請求項40に記載の方法。
  48. 前記リスク評価を生成するのに用いる前記コンピュータ学習手法は、ニューラル・ネットワークに基づくものである、請求項47に記載の方法。
  49. 前記リスク評価を生成するのに用いる前記コンピュータ学習手法は、サポート・ベクトル・マシンに基づくものである、請求項47に記載の方法。
  50. 複数の潜在的な反応物質生体分子の選択は、2次元または3次元の構造データベースの全部または一部からなされる、請求項39に記載の方法。
  51. 複数の潜在的な反応物質生体分子の選択は、関連する生物学的かつ/または薬物動態学的な経路の事前知識に関わる、請求項39に記載の方法。
  52. 前記潜在的な反応物質は生体高分子であり、複数の潜在的な反応物質生体高分子の選択は、前記リード候補と、1つまたは複数の所望の、または既知の標的との構造上かつ/または配列上の類似性に関わる、請求項39に記載の方法。
  53. 複数の潜在的な反応物質生体高分子の選択には、前記リード候補の1つまたは複数の所望の、または既知の標的の、タンパク質または遺伝子のファミリ、あるいは、他の機能またはバイオインフォマティックスの分類結果の他のメンバが含まれる、請求項52に記載の方法。
  54. 潜在的な反応物質間の化学的かつ/または構造的な類似性の考慮を含む1組のクラスタリング基準に基づいて、前記複数の潜在的な反応物質生体分子にクラスタリング操作を適用して、クラスタまたはグループの集合を生成することと、
    各クラスタまたは各グループから1つの潜在的な反応物質を選択して、クラスタの代表とすることと、
    前記リード候補と各クラスタ代表の間の潜在的な交差反応に対応する1組の反応の尺度を生成することと、
    前記得られた1組の反応の尺度に反応フィルタを適用して、前記リードとの高い反応性を示すクラスタ代表のサブセットを選択することと、
    合格したクラスタ代表を含む潜在的な反応物質からなる各クラスタを選択し直すことと、
    前記選択し直したクラスタのあらゆるメンバについての詳細な個々の反応の尺度および後続の反応プロファイルを生成することとをさらに含む、請求項39に記載の方法。
  55. 前記潜在的な反応物質は生体高分子であり、前記クラスタリング基準は、配列相同性、構造相同性、および/または他のバイオインフォマティックスまたはプロテオミクスの分類基準に関わる、請求項54に記載の方法。
  56. 1つまたは複数の所望の標的との結合特異性を改善し、前記リード候補との潜在的に有害な交差反応に関与することが予測される、またはその可能性がある1つまたは複数の潜在的な反応物質との反応性を低下させるために前記リード候補の最適化および再設計を行う別の方法が採用され、この方法は、
    1つまたは複数の所望の標的と結合するために前記リードが必要とする、前記リード候補に関連する分子のコアまたは枠組を識別することと、
    前記枠組の1つまたは複数の連結部位に追加または置換し得る分子群その他の構成要素を識別することと、
    前記リードと、前記リードが強く反応することが望まれる1つまたは複数の所望の標的との間の1つ(または複数)の反応を、前記リードおよび所望の各標的に関連する化学基間でエネルギー的に有利な分子相互作用を保存または促進する点で分析することと、
    前記リードと、前記リードが強く反応することが望まれない1つまたは複数の潜在的な反応物質との間の1つ(または複数)の反応を、前記リードおよび潜在的な各反応物質に関連する化学基間でエネルギー的に有利な分子相互作用を低減させるか、かつ/またはエネルギー的に不利な分子相互作用を促進する点で分析することと、
    前記リードと1つまたは複数の所望の標的との分子相互作用の分析に従って、かつ、前記リードと1つまたは複数の潜在的な反応物質との分子相互作用の分析に従って、局所分子構造の追加または置換を行うための前記枠組の1つまたは複数の連結部位を選択することと、
    前記リードと1つまたは複数の所望の標的との分子相互作用の分析に従って、かつ、前記リードと1つまたは複数の潜在的な反応物質との分子相互作用の分析に従って、前記選択した連結部位の1つまたは複数において局所分子構造に対して追加または置換する1つまたは複数の分子群その他の構成要素を選択することと、
    前記枠組の選択した連結部位と選択した分子群の追加または置換との組合せに基づいて、前記リード候補の複数の構造変異体を構築することと、
    前記リードの新しい各構造変異体を、1つまたは複数の潜在的な反応物質および1つまたは複数の所望標的との反応性に従って評価することとをさらに含む、請求項1に記載の方法。
  57. 前記リードの新しい各構造変異体を評価することは、前記リード候補の前記新たに生成された構造変異体を、新しい入力リード候補として、請求項1に記載の方法に基づいて潜在的な交差反応をモデル化するシステムに提示し直すことを含む、請求項56に記載の方法。
  58. 前記リード候補について既に構築された反応プロファイルおよび/または前記リード候補に関連するリスク評価の評価に基づいて、可能な再設計および最適化のためにリード候補に優先順位を付ける、請求項56に記載の方法。
  59. リードについての対応するリスク評価により、前記リード候補と1つまたは複数の潜在的な反応物質を扱う潜在的な有害交差反応に関連するリスクが許容差内にあり、かつ、所定の制限を超えないことが示唆されるとき、前記リード候補を提示して可能な再設計および最適化を行う、請求項58に記載の方法。
  60. 前記リード候補について複数の構造的に別個の枠組を識別し、前記リードの前記可能な再設計および最適化中に、それらを前記リードの複数の構造変異体を生成するための可能なシードとして用いる、請求項56に記載の方法。
  61. 前記枠組の1つまたは複数の連結部位に対する可能な追加または削除に関して識別された前記1組の分子群は、有機化学で見られる様々な化学基、アミノ酸側鎖、残基、さらには個々の原子またはイオンを含む、請求項56に記載の方法。
  62. 前記リードと1つまたは複数の潜在的な反応物質の間の1つ(または複数)の反応の分析は、水素結合の相互作用するドナー基またはアクセプタ基の改変によって不安定になった場合、前記リードと前記潜在的な反応物質の反応性を低下させることがあるが、前記リードと1つまたは複数の所望の標的の反応性を過度に損なわない1つまたは複数の分子間水素結合を識別することを含む、請求項56に記載の方法。
  63. 前記リードと1つまたは複数の潜在的な反応物質の間の1つ(または複数)の反応の分析は、相互作用する疎水基の改変によって不安定になった場合、前記リードと前記潜在的な反応物質の反応性を低下させることがあるが、前記リードと1つまたは複数の所望の標的の反応性を過度に損なわない1つまたは複数の分子間疎水性接触部を識別することを含む、請求項56に記載の方法。
  64. 前記リードと1つまたは複数の潜在的な反応物質の間の1つ(または複数)の反応の分析は、相互作用する静電的な、またはイオン化された基の改変によって不安定になった場合、前記リードと前記潜在的な反応物質の反応性を低下させることがあるが、前記リードと1つまたは複数の所望の標的の反応性を過度に損なわない1つまたは複数の分子間塩橋を識別することを含む、請求項56に記載の方法。
  65. 前記リードと1つまたは複数の潜在的な反応物質の間の1つ(または複数)の反応の分析は、化学的または構造的に改変された場合、前記リードと前記潜在的な反応物質の反応性を低下させることがあるが、前記リードと1つまたは複数の所望の標的の反応性を過度に損なわない高い局所立体相補性を示すいずれかの分子の1つまたは複数の相互作用する化学基を識別することを含む、請求項56に記載の方法。
  66. 前記リード候補の複数の構造変異体を構築することは、前記リード候補の1つまたは複数の基または構成要素に関連する立体化学的な性質を改変することをさらに含む、請求項56に記載の方法。
  67. 前記リード候補の複数の構造変異体を構築することは、前記リード候補の1つまたは複数の基または構成要素に関連するイオン化状態を改変することをさらに含む、請求項56に記載の方法。
  68. 前記リード候補の複数の構造変異体を構築することに関わるプロセス、前記構造変異体を、請求項1に記載の方法に基づいて潜在的な交差反応をモデル化するシステムに入力として提示し直すこと、ならびに、その後で、新しい各入力構造変異体と1つまたは複数の潜在的な反応物質ごとに反応プロファイルおよび/またはリスク評価を構築することを、何らかの終端条件その他の基準が満たされるまで反復的に繰り返す、請求項57に記載の方法。
  69. 潜在的な交差反応をモデル化する前記計算システムは、前記計算プラットホームを実施するソフトウエアを含むプログラム可能な汎用コンピュータ、専用ハードウエア、ファームウエア、あるいはこれらの組合せの1つまたは複数を備える、請求項1に記載の方法。
  70. 反応性の評価および関連する生物学的かつ化学的な注釈の分析に基づいて、前記潜在的な反応物質分子の中から、既知の標的と異なる1つまたは複数の新しい潜在的な標的を識別することをさらに含む、請求項1に記載の方法。
JP2014211968A 2003-10-14 2014-10-16 リード分子交差反応の予測・最適化システム Pending JP2015072691A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US51147403P 2003-10-14 2003-10-14
US60/511,474 2003-10-14

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011289786A Division JP2012108925A (ja) 2003-10-14 2011-12-28 リード分子交差反応の予測・最適化システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016256619A Division JP2017123169A (ja) 2003-10-14 2016-12-28 リード分子交差反応の予測・最適化システム

Publications (1)

Publication Number Publication Date
JP2015072691A true JP2015072691A (ja) 2015-04-16

Family

ID=34465236

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2006535357A Pending JP2007511470A (ja) 2003-10-14 2004-10-14 リード分子交差反応の予測・最適化システム
JP2011289786A Pending JP2012108925A (ja) 2003-10-14 2011-12-28 リード分子交差反応の予測・最適化システム
JP2014211968A Pending JP2015072691A (ja) 2003-10-14 2014-10-16 リード分子交差反応の予測・最適化システム
JP2016256619A Pending JP2017123169A (ja) 2003-10-14 2016-12-28 リード分子交差反応の予測・最適化システム

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2006535357A Pending JP2007511470A (ja) 2003-10-14 2004-10-14 リード分子交差反応の予測・最適化システム
JP2011289786A Pending JP2012108925A (ja) 2003-10-14 2011-12-28 リード分子交差反応の予測・最適化システム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2016256619A Pending JP2017123169A (ja) 2003-10-14 2016-12-28 リード分子交差反応の予測・最適化システム

Country Status (6)

Country Link
US (1) US7751988B2 (ja)
EP (1) EP1687627A4 (ja)
JP (4) JP2007511470A (ja)
KR (1) KR101229206B1 (ja)
CA (1) CA2542456A1 (ja)
WO (1) WO2005038618A2 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2589920A1 (en) * 2004-12-06 2006-06-15 Emory University Small molecule inhibitors of bacterial dam dna methyl transferases
US7653522B2 (en) * 2005-12-07 2010-01-26 Utah State University Robustness optimization system
US7739091B2 (en) * 2006-03-23 2010-06-15 The Research Foundation Of State University Of New York Method for estimating protein-protein binding affinities
DE102007011912A1 (de) * 2007-03-13 2008-09-18 Sanofi-Aventis Verfahren für das Erzeugen von Peptidbibliotheken und deren Verwendung
WO2009090796A1 (ja) * 2008-01-16 2009-07-23 Nec Corporation エネルギー関数最適化システム
US9078755B2 (en) 2009-02-25 2015-07-14 Zimmer, Inc. Ethnic-specific orthopaedic implants and custom cutting jigs
CA2753485C (en) 2009-02-25 2014-01-14 Mohamed Rashwan Mahfouz Customized orthopaedic implants and related methods
US9996634B2 (en) * 2010-12-15 2018-06-12 Autodesk, Inc. Computer-aided design and manufacturing system and method for composite part manufacturing method and system
US20140278295A1 (en) * 2013-03-15 2014-09-18 Schrodinger, Llc Cycle Closure Estimation of Relative Binding Affinities and Errors
US10402520B2 (en) 2013-09-26 2019-09-03 Synopsys, Inc. First principles design automation tool
US9836563B2 (en) 2013-09-26 2017-12-05 Synopsys, Inc. Iterative simulation with DFT and non-DFT
US10489212B2 (en) 2013-09-26 2019-11-26 Synopsys, Inc. Adaptive parallelization for multi-scale simulation
US10516725B2 (en) * 2013-09-26 2019-12-24 Synopsys, Inc. Characterizing target material properties based on properties of similar materials
US20160162625A1 (en) 2013-09-26 2016-06-09 Synopsys, Inc. Mapping Intermediate Material Properties To Target Properties To Screen Materials
JP6319452B2 (ja) * 2014-10-03 2018-05-09 富士通株式会社 相互作用エネルギーの算出方法、及び算出装置、プログラム、並びに記録媒体
EP3298524A4 (en) 2015-05-22 2019-03-20 CSTS Health Care Inc. THERMODYNAMIC MEASUREMENTS RELATING TO PROTEIN-PROTEIN INTERACTION NETWORKS FOR THE TREATMENT OF CANCER
US10366779B2 (en) * 2015-12-30 2019-07-30 International Business Machines Corporation Scheme of new materials
US10726944B2 (en) 2016-10-04 2020-07-28 International Business Machines Corporation Recommending novel reactants to synthesize chemical products
KR101995511B1 (ko) * 2017-06-22 2019-07-02 한국과학기술원 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템
WO2019004437A1 (ja) 2017-06-30 2019-01-03 学校法人 明治薬科大学 予測装置、予測方法、予測プログラム、学習モデル入力データ生成装置および学習モデル入力データ生成プログラム
US11132621B2 (en) * 2017-11-15 2021-09-28 International Business Machines Corporation Correction of reaction rules databases by active learning
EP3714458A4 (en) * 2017-11-22 2021-08-18 Cyclica Inc. DIFFERENTIAL DRUG DISCOVERY PROCESS AND SYSTEM
CN108647853B (zh) * 2018-04-03 2021-06-22 广东省科学院动物研究所 一种有害生物疫情评价分析方法
US11901045B2 (en) * 2019-01-15 2024-02-13 International Business Machines Corporation Machine learning framework for finding materials with desired properties
KR20230134525A (ko) * 2021-01-21 2023-09-21 케보틱스, 인크. 템플릿 프리 반응 예측들을 위한 시스템들 및 방법들
CN115240785B (zh) * 2022-07-21 2023-09-12 苏州沃时数字科技有限公司 化学反应预测方法、系统、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6519611B1 (en) * 1999-09-06 2003-02-11 National University Of Singapore Method and apparatus for computer automated detection of protein and nucleic acid targets of a chemical compound
JP2004509406A (ja) * 2000-09-14 2004-03-25 株式会社リバース・プロテオミクス研究所 医療および他の用途に用いる化合物の発見および創製のための方法、システム、装置、および機器

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6128608A (en) * 1998-05-01 2000-10-03 Barnhill Technologies, Llc Enhancing knowledge discovery using multiple support vector machines
WO2001018627A2 (en) 1999-09-06 2001-03-15 National University Of Singapore Method and apparatus for computer automated detection of protein and nucleic acid targets of a chemical compound
EP1383799A4 (en) * 2001-04-10 2008-08-06 Transtech Pharma Inc PROBES, SYSTEMS AND METHODS FOR DISCOVERING MEDICAMENTS

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6519611B1 (en) * 1999-09-06 2003-02-11 National University Of Singapore Method and apparatus for computer automated detection of protein and nucleic acid targets of a chemical compound
JP2004509406A (ja) * 2000-09-14 2004-03-25 株式会社リバース・プロテオミクス研究所 医療および他の用途に用いる化合物の発見および創製のための方法、システム、装置、および機器

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JPN6010049525; Carlin, R.J.: 'Characterization of monoclonal anti-furosemide antibodies and molecular modeling studies of cross-re' Molecular Immunology Vol.31, No.2, 199402, p.153-164 *
JPN6013043524; Rockey, W.M.: 'Progress toward virtual screening for drug side effects' Proteins Vol.48, No.4, 20020901, p.664-671 *
JPN6013043529; Chen, Y.Z.: 'Ligand-protein inverse docking and its potential use in the computer search of protein targets of a' Proteins Vol.43, No.2, 20010501, p.217-226 *
JPN6013043531; Sheridan, R.P.: 'Why do we need so many chemical similarity search methods?' Drug Discov Today Vol.7, No.17, 20020901, p.903-911 *

Also Published As

Publication number Publication date
EP1687627A4 (en) 2010-01-27
WO2005038618A3 (en) 2005-06-30
US7751988B2 (en) 2010-07-06
CA2542456A1 (en) 2005-04-28
JP2017123169A (ja) 2017-07-13
JP2007511470A (ja) 2007-05-10
WO2005038618A2 (en) 2005-04-28
US20050170379A1 (en) 2005-08-04
EP1687627A2 (en) 2006-08-09
KR20060125755A (ko) 2006-12-06
KR101229206B1 (ko) 2013-02-01
JP2012108925A (ja) 2012-06-07

Similar Documents

Publication Publication Date Title
JP2017123169A (ja) リード分子交差反応の予測・最適化システム
Waszkowycz et al. Outstanding challenges in protein–ligand docking and structure‐based virtual screening
Desaphy et al. Comparison and druggability prediction of protein–ligand binding sites from pharmacophore-annotated cavity shapes
Kitchen et al. Docking and scoring in virtual screening for drug discovery: methods and applications
Villoutreix et al. Free resources to assist structure-based virtual ligand screening experiments
Joseph-McCarthy et al. Fragment-based lead discovery and design
Dunbar Jr et al. CSAR data set release 2012: ligands, affinities, complexes, and docking decoys
Bruno et al. The in silico drug discovery toolbox: applications in lead discovery and optimization
JP4934428B2 (ja) 分子の配置および組合せを分析する方法および装置
Thompson et al. Investigation of MM-PBSA rescoring of docking poses
Krasowski et al. DrugPred: a structure-based approach to predict protein druggability developed using an extensive nonredundant data set
Das et al. Binding affinity prediction with property-encoded shape distribution signatures
Caliandro et al. Local fluctuations and conformational transitions in proteins
Blanes-Mira et al. Comprehensive survey of consensus docking for high-throughput virtual screening
Hoffer et al. S4MPLE–sampler for multiple protein–ligand entities: Simultaneous docking of several entities
Stafford et al. AtomNet PoseRanker: Enriching ligand pose quality for dynamic proteins in virtual high-throughput screens
Gowthaman et al. Structural properties of non-traditional drug targets present new challenges for virtual screening
KR20070045141A (ko) 분자 분해를 위한 방법 및 장치
Søndergaard et al. Structural artifacts in protein− ligand X-ray structures: implications for the development of docking scoring functions
Feldman et al. Pocket similarity: are α carbons enough?
Bottegoni Protein-ligand docking
Konteatis In silico fragment-based drug design
Zhou et al. FRAGSITE: a fragment-based approach for virtual ligand screening
Favia et al. SERAPhiC: a benchmark for in silico fragment-based drug design
Hu et al. Rescoring virtual screening results with the MM-PBSA methods: beware of internal dielectric constants

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160125

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160425

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160902