JP2004501348A

JP2004501348A - 分子極性表面積および生体吸収の予測

Info

Publication number: JP2004501348A
Application number: JP2001576456A
Authority: JP
Inventors: エガン，ウィリアム　ジェイ．; ロウリ，ジョルジオ
Original assignee: Pharmacopeia Inc
Current assignee: Pharmacopeia LLC
Priority date: 2000-04-19
Filing date: 2001-02-26
Publication date: 2004-01-15
Also published as: US6522975B1; US7113870B2; US20030114991A1; AU2001250005A1; CA2404929A1; US20030114990A1; EP1279034A1; WO2001079841A1; EP1279034A4

Abstract

分子の極性表面積が、三次元分子構造を参照することなく、窒素、酸素および関連する原子クラスタのカウントを組み入れる一次方程式を用いてコンピュータ計算される。候補化合物の腸内吸収および脳血液関門透過を予測するための方法およびシステムは、記述子として極性表面積およびオクタノール／水分配係数を用いる。

Description

【０００１】
［発明の背景］
本発明は、薬学上の発見についてのコンピュータ計算方法に関する。特に、本発明は、分子の膜透過性および生理学的吸収の予測に関する。
【０００２】
［関連技術の説明］
医薬化合物の開発において、所望の生物活性を有する化合物を同定することが化合物の薬剤としての適切性を決定するためにそれ自体で十分でないことはよく知られている。化合物は、必要な生物活性を示さなければならないだけでなく、好適には経口投与のような経済的かつ好都合な方法で、目的組織へ送達可能でなければならない。これは、いくつかの治療プロトコルでの課題であった。たとえば、色々なペプチド分子が有用な薬学活性を有することが示されているが、ヒト胃腸上皮組織のような生体膜を通して拡散するそれらの一般的に限定された能力が、それらの臨床的開発を限定している。効果的な経口投与は、薬剤が腸管膜を通して吸収され全身の循環に入ることを必要とし、そしてそのような吸収が制限されているならば、化合物の臨床的開発の見込みは、あまりない。
【０００３】
薬剤開発を通して重要な関心事は腸内吸収ばかりでなく、候補化合物の血液脳関門を透過する能力も重要な関心事である。血液脳関門（ＢＢＢ）は、循環系から中枢神経系の流体を分離する細胞系である。中枢神経系中の標的に向けられた薬剤は、ＢＢＢを透過することができるべきである。一方、他の標的組織に向けられた薬剤は、もしそれらが中枢神経系の流体中に自由に通過するならば、不要な副作用をもたらすかもしれない。
【０００４】
生体吸収と血液脳関門透過のためのｉｎ　ｖｉｖｏでの動物試験は、長い間実施されている。さらに、ヒト腸内ｃａｃｏ−２細胞を用いる細胞ベースのｉｎ　ｖｉｖｏアッセイは、薬剤候補化合物の生体膜透過性を測定するために広く用いられている。それらのプロトコルの両方は、速度が遅く、高価で、かつ多くの作業を必要とするために、より容易に得られた分子特性に基づく胃腸吸収および血液脳関門透過の能力を予測するコンピュータ計算方法が開発されている。また、そのようなコンピュータ計算方法は、どの化合物が合成されるべきかを決定する目的で、合成されていない化合物の仮想ライブラリの吸収および血液脳関門透過のコンピュータ内予測のために、非常に興味深い。これらのコンピュータ計算モデルにおいて、ヒト腸内吸収％（％ＨＩＡ）または中枢神経系および血液中の化合物の濃度の定常状態割合の対数（しばしば、ｌｏｇＢＢと呼ばれる）のいずれかを評価する式が、考案されている。この式は、典型的には、分子特性と、化合物の分子構造から誘導されることができるパラメータとを用いる。これらの式を用いて、％ＨＩＡとｌｏｇＢＢがｉｎ　ｖｉｖｏ実験を実施する必要なしに評価される得る。
【０００５】
多くのモデルは、腸内吸収または血液脳関門透過の性質を予測するために水素結合性、親油性、および分子量に関連する分子特性に焦点を合わせている。分子の極性表面積（ＰＳＡ）とその％ＨＩＡとの間のＳ字型関係が、低い％ＨＩＡに相関する高い極性表面積と共に観察されている。これは、ＰａｌｍらのＰｏｌａｒＭｏｌｅｃｕｌａｒＳｕｒｆａｃｅＰｒｏｐｅｒｔｉｅｓＰｒｅｄｉｃｔｔｈｅＩｎｔｅｓｔｉｎａｌＡｂｓｏｒｐｔｉｏｎｏｆＤｒｕｇｓｉｎＨｕｍａｎｓ（ＰｈａｒｍａｃｅｕｔｉｃａｌＲｅｓｅａｒｃｈ，Ｖｏｌ．１４，Ｎｏ．５，ｐ．５６８（１９９７））に示されている。特に高いかまたは特に低い、親油性の尺度である、オクタノール／水分配係数（ｌｏｇＰ）を有する分子が、低い％ＨＩＡに関連していることもまた観察されている。Ｐａｌｍ（上記）およびＷｉｌｓらのＨｉｇｈＬｉｐｏｐｈｉｌｉｃｉｔｙＤｅｃｒｅａｓｅｓＤｒｕｇＴｒａｎｓｐｏｒｔＡｃｒｏｓｓＩｎｔｅｓｔｉｎａｌＥｐｉｔｈｅｌｉａｌＣｅｌｌｓ（ＴｈｅＪｏｕｒｎａｌｏｆＰｈａｒｍａｃｏｌｏｇｙａｎｄＥｘｐｅｒｉｍｅｎｔａｌＴｈｅｒａｐｅｕｔｉｃｓ，Ｖｏｌｕｍｅ２６９，Ｎｏ．２，Ｐ．６５４（１９９４））。ＰａｌｍとＷｉｌｓの両論文の開示は、本明細書中にこれらの全体が参照により援用される。
【０００６】
したがって、分子のＰＳＡは、良好に吸収される化合物と吸収が乏しい化合物を区別するために用いられることができるパラメータとして提唱されており、１４０平方オングストロームが切り捨て値として提案されている。ＣｌａｒｋのＲａｐｉｄＣａｌｃｕｌａｔｉｏｎｏｆＰｏｌａｒＭｏｌｅｃｕｌａｒＳｕｒｆａｃｅＡｒｅａａｎｄｉｔｓＡｐｐｌｉｃａｔｉｏｎｔｏｔｈｅＰｒｅｄｉｃｔｉｏｎｏｆＴｒａｎｓｐｏｒｔＰｈｅｎｏｍｅｎａ１．ＰｒｅｄｉｃｔｉｏｎｏｆＩｎｔｅｓｔｉｎａｌＡｂｓｏｒｐｔｉｏｎ（ＪｏｕｒｎａｌｏｆＰｈａｒｍａｃｅｕｔｉｃａｌＳｃｉｅｎｃｅｓ，Ｖｏｌ．８８，Ｎｏ．８，ｐ．８０７（１９９９））。ＰＳＡはまた、膜透過性とｌｏｇＢＢを予測するための一次式での変数として用いられている。いくつかの場合に、ｌｏｇＰが、そのような一次式でＰＳＡと一緒に用いられている。ＣｌａｒｋのＲａｐｉｄＣａｌｃｕｌａｔｉｏｎｏｆＰｏｌａｒＭｏｌｅｃｕｌａｒＳｕｒｆａｃｅＡｒｅａａｎｄｉｔｓＡｐｐｌｉｃａｔｉｏｎｔｏｔｈｅＰｒｅｄｉｃｔｉｏｎｏｆＴｒａｎｓｐｏｒｔＰｈｅｎｏｍｅｎａ２．ＰｒｅｄｉｃｔｉｏｎｏｆＢｌｏｏｄ−ＢｒａｉｎＢａｒｒｉｅｒＰｅｎｅｔｒａｔｉｏｎ（ＪｏｕｒｎａｌｏｆＰｈａｒｍａｃｅｕｔｉｃａｌＳｃｉｅｎｃｅｓ，Ｖｏｌ．８８，Ｎｏ．８，ｐ．８１５（１９９９））およびＷｉｎｉｗａｒｔｅｒらのＣｏｒｒｅｌａｔｉｏｎｏｆＨｕｍａｎＪｅｊｕｎａｌＰｅｒｍｅａｂｉｌｉｔｙ（ｉｎＶｉｖｏ）ｏｆＤｒｕｇｓｗｉｔｈＥｘｐｅｒｉｍｅｎｔａｌｌｙａｎｄＴｈｅｏｒｅｔｉｃａｌｌｙＤｅｒｉｖｅｄＰａｒａｍｅｔｅｒｓ．ＡＭｕｌｔｉｖａｒｉａｔｅＤａｔａＡｎａｌｙｓｉｓＡｐｐｒｏａｃｈ（ＪｏｕｒｎａｌｏｆＭｅｄｉｃｉｎａｌＣｈｅｍｉｓｔｒｙ４１，ｐ．４９３９（１９９８））。本明細書中でこれらの両方の全体が参照により援用される。
【０００７】
これらのモデルは、ｉｎｖｉｖｏおよびｉｎｖｉｔｒｏでの化学的試験への依存を減少させることにより薬剤候補の評価プロセスの速度を改善しているが、それらはコンピュータ計算の不経済を残し、そして多くの場合に、厳密な線形モデル化がそれらの予測値を限定している。ＰＳＡ計算は、エネルギー最小化三次元分子構造の計算を必要とし、これはＳｕｎまたはＳＧＩ−Ｒ１０００ワークステーションで１０〜１５秒のＣＰＵ時間を必要とする。候補化合物の大きなライブラリへのこれらの技法の効果的な応用は、それぞれの分子に必要なコンピュータ計算時間を減少させる技法を必要とする。
【０００８】
［発明の概要］
一実施形態において、本発明は、複数の原子の種類のそれぞれの定義に当てはまる分子中の原子または原子クラスタの数の別々のカウントを行うこと、および別々のカウントの少なくともいくつかを用いて分子の極性表面積を評価することを含む、分子の極性表面積を評価する方法を含む。
【０００９】
コンピュータ計算された極性表面積は、コンピュータ実施された化合物分析方法で有用であり、本発明はまた、分子のエネルギー最小化三次元構造を参照することなく分子の極性表面積をコンピュータ計算すること、およびその性質を予測するためにコンピュータ計算された極性表面積を用いることを含む膜透過性のための分子の性質を予測する方法を含む。
【００１０】
薬剤を発見するための方法もまた提供される。一つの実施形態において、そのような方法は、データベースから分子の部分集合を選択することを含み、ここで、選択することは、データベース中のそれぞれの分子のＰＳＡとｌｏｇＰを数値的に評価すること、ＰＳＡ−ｌｏｇＰ平面でデータベース中のそれぞれの化合物の位置を決定すること、およびＰＳＡ−ｌｏｇＰ平面上でそれぞれの位置に基づいて化合物を分類することを含む。
【００１１】
［好適な実施形態の詳細な説明］
次に、本発明の実施形態を、添付の図面を参照して記載し、同様の符号は、全体を通して同様の構成要素を指す。本明細書に示されている説明で用いられている用語は、単に本発明のある特定の実施形態の詳細な説明に関連して用いられているので、いかなる限定または制限により解釈されるように意図されていない。さらに、本発明の実施形態は、いくつかの新規な特徴を含むことができ、それらのどれもが単独で所望の特質を担うか、または本明細書に記載された発明を実施するために必須であるものではない。
【００１２】
多くの実施形態において、本発明は、コンピュータ実施された薬剤候補の評価プロセスで有用である。これらのプロセスにおいて、化合物の１つまたは複数のデータベースからの薬剤候補は、所望の特徴または特性のために汎用コンピュータで動作するソフトウエアコードを用いて予め評価される。この目的に用いられる汎用コンピュータは、ネットワークサーバ、ワークステーション、パーソナルコンピュータ、大型コンピュータなどを含めた、広範の種々の形態をとることができる。これらの化合物の評価を実施するコンピュータの設定を行う（ｃｏｎｆｉｇｕｒｅ）コードは、典型的にはＣＤ−ＲＯＭのようなコンピュータ可読媒体上でユーザに提供される。このコードは、インターネットなどの、ローカルまたはワイドエリアネットワークの一部であるネットワークサーバからユーザによりダウンロードされることもできる。
【００１３】
ソウトウエアが動作する汎用コンピュータは、典型的には、マウスおよび／またはキーボードのような１つもしくは複数の入力装置、ディスプレイ、ならびにランダムアクセス記憶集積回路およびハードディスクドライブのようなコンピュータ可読記憶媒体を含む。コードの１つもしくは複数の部分または全ては、ユーザから離れていることができ、たとえばＬＡＮサーバ、インターネットサーバ、ネットワーク記憶装置などのネットワークリソースに常駐することができることが理解されるだろう。典型的な実施形態において、ソフトウエアは、候補薬剤化合物もしくは組成物に関する種々の情報を入力として受け取り、そしてこの情報から、候補薬剤化合物の期待される生物学的、または化学的特性を、誘導、評価または予測する。データベースは、１０，０００、１００，０００、または多分それ以上の候補化合物を含み得る。いくつかの有利な実施形態において、ソフトウエアプログラムへの情報入力は、候補化合物のそれぞれについての構造的情報を含む。この情報は、通常、原子構成成分およびそれらの間の結合、本質的には２次元分子結合ダイアグラムで見出された情報に限定されている。この情報から、生物学的および／または化学的活性の予測が、有利に行われる。
【００１４】
上述したように、データベースのどの化合物が容易に腸内吸収される可能性があるか、または血液脳関門を透過する可能性があるかを予測することが望ましい。また、上述したように、分子の極性表面積は、しばしば、この予測の一部として用いられる。極性表面積計算の従来の方法において、原子構成要素と原子間結合の配置は、既知の分子モデル化ツールを用いてエネルギー最小化３次元分子構造を生成するために用いられる。これらの計算は、真空中または溶液中で行われることができる。３次元構造が計算された後、ＰＳＡは、酸素原子、窒素原子、およびいずれの他の原子のファンデルワールス表面積内にも配置されていないそれらの結合された水素原子すべての、ファンデルワールス表面積の部分として定義され、ここで、ファンデルワールス表面は、原子のタイプのファンデルワールス半径を有する剛体球を満たす空間により定義されている。したがって、分子の「暴露された」酸素、窒素、および会合された水素の合計量が、ＰＳＡを定義する。
【００１５】
従来のＰＳＡ計算は、腸内吸収を予測するプロセスにおいて有用である。しかしながら、エネルギー最小化三次元分子構造の生成は、コンピュータ計算的には困難であり、時間を必要とする。１００，０００化合物のコンビナトリアルライブラリでの全ての化合物のＰＳＡを計算することは、広く用いられているワークステーションで、ざっと１０〜２０日のコンピュータ時間を必要とする。
【００１６】
計算を３００〜１０００倍早くし、１時間未満で１００，０００分子データベースのそれぞれの分子のＰＳＡの計算を可能にする原子および原子クラスタ分類方法によりＰＳＡを計算することができることは、本発明の一つの態様である。このプロセスは図１に図示されている。
【００１７】
次にこの図を参照すると、本方法は、複数の原子の種類を定義するブロック２０で開始する。それぞれの原子の種類は、単一の原子または原子のクラスタを含むことができる。それぞれの種類は、また典型的には、クラスタ内および／または他の原子への結合の配置により定義される。たとえば、原子の種類には、「二重結合された酸素原子」、「単結合されたＮＨ_２基」などが挙げられる。本実施形態において、種類は、窒素原子、酸素原子、および結合された水素原子を含む。これは、これらの分子構成要素が分子のＰＳＡに寄与するものであるためである。ブロック２２において、それぞれ定義された種類に当てはまる、分析されている分子の原子または原子クラスタの数の別々のカウントが行われ、したがって、それぞれ定義された種類内の原子構成要素のカウントに相当する整数のリストをもたらす。図１のブロック２４により示されているように、別々のカウントが、評価される分子の極性表面積を評価するために用いられる。以下でさらに詳述される有利な一実施形態において、カウントは、評価されたＰＳＡ値をもたらす簡単な算術計算で用いられる。したがって、エネルギー最小化三次元分子構造の関連した原子のファンデルワールス表面積をコンピュータ計算することによりＰＳＡを計算するよりも、かかる計算時間がはるかに少ない簡単なコンピュータ計算が用いられる。
【００１８】
特に有利な実施形態において、ＰＳＡは、以下のように非負の係数を有する一次方程式として表現される：
【００１９】
【数４】

【００２０】
ここで、Ｎ_ｉは、種類ｉに当てはまる分子の原子または原子クラスタのカウントであり、そしてＣ_ｉは、種類ｉに関連する係数である。このモデルにおいて、係数は、分子の全ＰＳＡに対するそれぞれの原子タイプの寄与を表す。種類が、分子のＰＳＡを増す傾向がある全ての極性原子および原子クラスタを含むので、係数は全て非負である。上の式の係数は、複数の訓練分子を用いて非負の最小二乗線形回帰法を行うことにより計算されることができる。この技法は、有機化合物の沸点の予測が一つの例である他の少数の応用において既知である。ＨａｌｌとＫｉｅｒのＥｌｅｃｔｒｏｔｏｐｏｌｏｇｉｃａｌＳｔａｔｅＩｎｄｉｃｅｓｆｏｒＡｔｏｍＴｙｐｅｓ：ＡＮｏｖｅｌＣｏｍｂｉｎａｔｉｏｎｏｆＥｌｅｃｔｒｏｎｉｃ，Ｔｏｐｏｌｏｇｉｃａｌ，ａｎｄＶａｌｅｎｃｅＳｔａｔｅＩｎｆｏｒｍａｔｉｏｎ（Ｊ．Ｃｈｅｍ．Ｉｎｆ．Ｃｏｍｐｕｔ．Ｓｃｉ．Ｖｏｌ．３５，１０３９−１０４５（１９９５））は、本明細書中でその全体が参照により援用される。係数を生成する手順は、訓練分子のセットを選択すること、およびエネルギー最小化三次元構造を計算し、かつ窒素、酸素およびそれらの結合された水素のファンデルワールス表面積をコンピュータ計算することにより、従来の方法でそれらのＰＳＡ値のすべてをコンピュータ計算することである。次いで、それぞれの種類の原子または原子クラスタのカウントを行うことが、それぞれの分子で行われる。次いで、上の式で計算されたＰＳＡの誤差の２乗の合計が、回帰係数のそれぞれがゼロより大きいという制限で訓練セットの分子の全てにわたり最小化されるように、係数がコンピュータ計算される。
【００２１】
これらの方法は、本発明に先立って、極性表面積の計算またはいかなる他の計算された（実験的に測定されたものでなくて）量には適用されていない。
全表面積または非極性表面積のような他の密接に関連した表面積量は、立体配座立体配座の変化により相当変化する可能性がある。対照的に、ＰＳＡ値の広い範囲を通して、上述のＰＳＡモデルの驚くべき正確さは、溶媒和された立体配座の極性表面積がそれらの関連する尺度よりも立体配座への依存性がかなり少ないことを示している。このような環境下でのみ、回帰計算のための適切な基礎を形成する分子のヘテロ原子の結合された状態のセットを確認することができる。
【００２２】
以下に記載されている表１は、本発明の一実施形態での、原子の分類および関連した係数のリストを記載している。
【００２３】
【表１】

【００２４】
これらの係数は、ＣｏｍｐｒｅｈｅｎｓｉｖｅＭｅｄｉｃｉｎａｌＣｈｅｍｉｓｔｒｙ（ＣＭＣ）データベースに含まれている５，３８６個の最も医薬に似ている分子のエネルギー最小化三次元構造を用い、多数の配座異性体ではなく単一の伸展された配座異性体を用いて明示的にＰＳＡを計算することにより得られた。分子は、訓練、試験および確認データセットに分離された。確認データセットは、錠剤、カプセル、または経口懸濁物形態で現在入手し得る製薬としてＰｈｙｓｉｃｉａｎ’ｓＤｅｓｋＲｅｆｅｒｅｎｃｅに列挙されている４４０個の分子から成る。確認データセットに列挙されている化合物は、回帰にバイアスをかけないために訓練および試験データセットの作成に先立ってＣＭＣデータセットから除かれた。訓練および試験データセットは、ＣＭＣからの残りの分子をそれらの明示的に計算されたＰＳＡ値の順に分類し、そして奇数番目の分子を訓練データセットに、そして偶数番目の分子を試験データセットへ割り当てることにより作成された。これは、等しいＰＳＡ範囲に広がる２つのデータセットを作成した。表１で上述した１８種の原子の分類のそれぞれのカウントを行うことが、それぞれの分子で行われた。訓練データセットの分子のカウントは、上記式（１）で述べた形態の一次方程式で独立変数として用いられた。一次方程式を用いて予測されたＰＳＡとエネルギー最小化三次元構造から計算されたＰＳＡとの間の全誤差を最小にするように、従来のおよび既知の非線形最小二乗回帰法を用いて、係数が誘導された。係数は非負の定数に限定され、そして切片はゼロに固定された。
【００２５】
図２は、上記式（１）と表１の係数とを用いて評価されたＰＳＡの、確認データセットの三次元構造で計算されたＰＳＡに対する散布図である。計算的に評価されたＰＳＡと構造的に計算されたＰＳＡとの一致は、
【数５】

式（１）の速算方法を用いたときの二乗平均平方根ＰＳＡ誤差が５．９平方オングストロームに過ぎず、非常に良好である。算術式（１）ならびに表１の原子分類および係数を用いたとき、計算の速度は、ざっと１秒あたり２０〜１００超の分子である。これは、エネルギー最小化三次元構造を用いる従来のＰＳＡ計算方法の分子あたり１０〜１５秒に対し劇的な改良である。
【００２６】
コンピュータ計算速度での大きな改善のために、ＰＳＡ計算の上述の方法は、腸内吸収のそれらの性質のための大きな化合物データベースの候補薬剤の評価に有利に応用されることができる。上述の本発明の原理を用いて、化合物の三次元構造がＰＳＡをコンピュータ計算するために作成される必要はなく、それにより候補薬剤の評価のプロセスは劇的に加速される。たとえば、生物学的に良好に吸収される可能性が高い化合物を選択するための上記に参照された一つの提案された方法は、１４０平方オングストロームのしきい値に対しＰＳＡを比較することである。このモデルによると、このしきい値を超える化合物は、吸収性が乏しい可能性が高い。上の式（１）のようなＰＳＡ計算のための一次方程式を用いて、１００，０００化合物ライブラリがスクリーニングされることができ、吸収性が乏しい可能性が高い全ての化合物が、現在これらの応用のために広く用いられているワークステーションで１時間未満のコンピュータ計算時間で、残りから分離されることができる。
【００２７】
他のモデルが、吸収性が乏しい可能性が高い化合物を同定するために提案されている。そのようなモデルは、分子記述子（それから予測が行われる）として、極性特性の数値尺度および／または親油性の数値尺度を含むことができる。極性特性の数値尺度の一つの例は、上に記載されたＰＳＡである。親油性の数値尺度の例としては、ｌｏｇＰとｌｏｇＤが挙げられる。ｌｏｇＰは上に記載されており、そしてｌｏｇＤは、イオン化中心のために電荷効果が補正されたｌｏｇＰである。以下に記載されたモデルにおいて、ＰＳＡとｌｏｇＰは、用いられている特定の記述子であるが、極性特性および親油性の尺度を提供する他の記述子も本発明の原理により首尾よく用られ得ることは、当業者により理解されるであろう。
【００２８】
ｌｏｇＰはまた、実験的に決定されることができるけれども、上記の式（１）と同じ形態の一次方程式により、良好にモデル化されることは従来から知られている。したがって、データベースの分子の評価において、ｌｏｇＰは、種々の原子分類での原子または原子クラスタのカウントおよび関連した乗法の係数に基づいて評価され得る。当業者にＡＬＯＧＰおよびＣＬＯＧＰとして知られる二つの線形モデルが、広く用いられている。例えば、本明細書中でその全体が参照により援用されるＧｈｏｓｅらのｐｒｅｄｉｃｔｉｏｎｏｆＨｙｄｒｏｐｈｉｌｉｃ（Ｌｉｐｏｐｈｉｌｉｃ）ＰｒｏｐｅｒｔｉｅｓｏｆＳｍａｌｌＯｒｇａｎｉｃＭｏｌｅｃｕｌｅｓＵｓｉｎｇＦｒａｇｍｅｎｔａｌＭｅｔｈｏｄｓ：ＡｎＡｎａｌｙｓｉｓｏｆＡＬＯＧＰａｎｄＣＬＯＧＰＭｅｔｈｏｄｓ（ＪｏｕｒｎａｌｏｆＰｈｙｓｉｃａｌＣｈｅｍｉｓｔｒｙＡ，Ｖｏｌ．１０２，３７６２−３７７２）を参照。
【００２９】
分子のパラメータＰＳＡとｌｏｇＰは、腸内吸収とｌｏｇＢＢの関連記述子である。これは、腸管へのまたは血液脳関門を通る受動拡散が、親水性および親油性領域の両方を有する脂質二重層を含む細胞膜を通した分子の拡散を必要とするためである。したがって、高親水性分子と、容易に水素結合を形成する分子とは、膜中へ容易に入ることはできない。さらに、高親油性分子は、一度親油性の内部に到達すると、容易に膜を離れない。ＰＳＡは親水性の尺度であり、そしてｌｏｇＰ（これは、親水性と親油性の両方の寄与を含む）は、したがって、膜浸透性の情報が誘導されることができるパラメータであると見出されている。
【００３０】
膜透過性に対するＰＳＡとｌｏｇＰの間の相関関係は、しかしながら高度に非線形である。上に記載したように、高いｌｏｇＰと低いｌｏｇＰの両極端は、乏しい腸内吸収に関連している。分子のＰＳＡは、腸内吸収に対してＳ字型の相関関係を示している。化学的空間の重要な部分に対する正確な生体吸収データが入手できるならば、十分な正確さで、候補薬剤の数的に測定された腸内吸収および／またはｌｏｇＢＢ特性を予測できる正確な非線形モデルが、誘導されるであろう。そのようなデータが入手できないために、ＰＳＡ値とｌｏｇＰ値に基づく新規なモデル化技法が開発されており、そして図３〜図５を参照して以下に記載されている。本発明のこの特徴により、標準の定量モデルよりむしろＰＳＡとｌｏｇＰに基づく統計ベースのパターン認識モデルが、吸収が乏しい化合物から良好に吸収される化合物を区別することに非常に成功していることが見出されている。
【００３１】
本発明の一態様により、モデルは、受動拡散を介する腸内吸収のための分子の性質が、分子のＰＳＡとｌｏｇＰの関数、特にＰＳＡとｌｏｇＰの相互作用であることを仮定している。全ての分子は、したがって、二次元ＰＳＡ−ｌｏｇＰ平面の位置を割り当てられることができる。ＰＳＡ−ｌｏｇＰ平面における位置の関数として腸内吸収を定量的に予測するよりむしろ、ＰＳＡ−ｌｏｇＰ平面の境界化領域が定義される。分子のＰＳＡとｌｏｇＰが境界化領域内にあるならば、分子は容易に腸内吸収される可能性が高いと考えられる。分子のＰＳＡとｌｏｇＰが境界化領域の外側にあるならば、分子は容易に腸内吸収される可能性が低いと考えられている。ＰＳＡ−ｌｏｇＰ平面内で高い腸内吸収のこの境界化領域を画定するために、容易に吸収されるとして知られている化合物の統計的分析が行われた。容易に吸収され、かつ細胞膜を超えて活発に輸送されないとして知られている１８２個の化合物のＰＳＡとｌｏｇＰが計算された。これらの分子の（ＰＳＡ、ｌｏｇＰ）座標についての分布は、多変量正規分布を仮定して統計的に分析された。
【００３２】
図３は、この図で記号「＋」で示されている既知の容易に吸収される化合物のＰＳＡ−ｌｏｇＰ平面での分布を示している。これらの分子の平均ＰＳＡは６４．５８６７であり、平均ｌｏｇＰは２．３２２６である。大まかに言えば、モデルは、それらの平均値に「近い」ＰＳＡとｌｏｇＰを有する、分析されている新しい分子は同様に容易に吸収され、そしてそれらの平均値から「遠い」ＰＳＡとｌｏｇＰを有する、分析されている新しい分子は容易に吸収されないだろうことを予測する。どのくらい近ければ十分近いのかを定義するために、モデルは、平均値からの距離を測定するための参照としてＨｏｔｅｌｌｉｎｇのＴ^２距離を利用する。図３に示された境界３０は、既知の容易に吸収される化合物により提供されたデータ点の標準統計的分析を用いて計算されたＨｏｔｅｌｌｉｎｇのＴ^２距離に対して９５％信頼領域である。
【００３３】
化合物のＴ^２距離をコンピュータ計算するために必要な係数は、以下のようにして決定される：１）良好に吸収される化合物の選択されたセットの平均ＰＳＡとｌｏｇＰをコンピュータ計算する。２）それらの化合物のそれぞれのＰＳＡとｌｏｇＰの個々の値を平均中心化する（平均値を減ずる）。３）この平均中心化されたデータセットを数値的に安定な固有値と固有ベクトルを提供するいずれかのアルゴリズムで分解する（特異値分解（ＳＶＤ）が用いられることができ、標準のＵ、Ｓ、およびＶ出力行列を与える）。平均値とＳＶＤの結果（またはいくつかの似た方法からの固有値／固有ベクトル）を用いて、ＲｅｎｃｈｅｒによるＭｅｔｈｏｄｓｏｆＭｕｌｔｉｖａｒｉａｔｅＡｎａｌｙｓｉｓ（ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎ，Ｉｎｃ．：ＮｅｗＹｏｒｋ，１９９５）（本明細書中でそれの全体が参照により援用される）によって平均中心化により与えられた変換および共分散行列による乗法を行うために、新規なまたはモデル作成で用いられたいずれかの化合物（複数可）のＴ^２距離（二乗されたＭａｈａｌａｎｏｂｉｓ距離としても知られている）をコンピュータ計算する。良好に吸収される化合物に対する化合物の類似性の信頼領域／確率は、ＲｅｎｃｈｅｒによるＴ^２に対するＦ分布相関関係を用いてコンピュータ計算されることができる。
【００３４】
図３の容易に吸収される化合物の分布のために、平均からのＴ^２距離は、以下のようにコンピュータ計算される：
【数６】

　ここで、ＡとＢは、行列であり、
【数７】

および
【００３５】
【数８】

【００３６】
この方法で計算されたＴ^２距離が６．１２６より大きいならば、化合物は、９５％信頼領域、ＰＳＡ−ｌｏｇＰ平面の図３の境界３０の外側になり、そしてモデルによって吸収が乏しいと予測される。
【００３７】
モデルは、吸収が乏しいとして知られている追加の分子のデータポイントをプロット（ＰＳＡ、ｌｏｇＰ）することにより試験されることができる。これらは、図３で白丸として示されており、そしてそれらのほとんど全部が、境界３０の外側にあることは直ちに明らかである。モデルの妥当性の別の証明は、腸管透過性のｉｎｖｉｖｏアッセイで通常用いられるｃａｃｏ−２細胞アッセイで、高い膜透過性または低い膜透過性を示す分子をプロットすることにより得られる。図３において、高いｃａｃｏ−２透過性を示す分子は「ｘ」記号でプロットされ、そして低いｃａｃｏ−２透過性を示す分子は白三角としてプロットされている。高い透過性の分子は境界３０の主に内側にあり、そして低いｃａｃｏ−２透過性の分子は境界３０の主に外側にあることを見ることができる。Ｔ^２距離およびそれらの関連する確率とｉｎｖｉｖｏデータとの比較は、ｃａｃｏ−２細胞膜を通る透過性が、化合物が９５％確率領域の外側に移動すると、急激に落ちることを明らかにしている。
【００３８】
この方法の重要な一態様は、多変数正規分布が、化合物が良好に吸収される特定の参照化合物に似ている確率の評価を可能にすることである。分子がＰＳＡ−ｌｏｇＰ空間の重心からさらに遠くに移動するにつれて、良好に吸収される分子に似ているその確率は減少する。図３に示されているモデルは、「二者択一」の論理を用い、しきい値に対しそのＴ^２距離を比べることにより分子を吸収が良好または乏しいとして特徴付けている。しかしながら、初めにコンピュータ計算されるＴ^２距離の基礎計算は、良好に吸収される化合物への分子の類似の確率の一つの尺度であることがまた留意されることができる。したがって、モデルは分子を単に吸収が良好または乏しいとして分類するために用いられることができるだけでなく、化合物が既知の容易に吸収される化合物のセットに似ている吸収特性を有するだろう確率を定量するためにも用いられることができる。後者の場合、データベース中の化合物は、良好に吸収される化合物に似た吸収性質を有する可能性に従い、順序付けられることができる。この順序付けは、また逆に、合成とスクリーニングのために化合物に優先順位を付けるために用いられることができる。
【００３９】
予測されたｌｏｇＢＢを計算するための改良された計算式もまた、上述した統計的モデルに基づいて開発されることができる。ｌｏｇＢＢは、変数としてＰＳＡとｌｏｇＰを有する一次式で、合理的な正確さでモデル化されることが示されている、Ｃｌａｒｋ（上記）。しかしながら、Ｃｌａｒｋにより提案されたもののような非制限線形モデルは、図３の境界３０に当てはまる化合物に対しその適用を制限することにより改良されることができる。血液脳関門の透過は、腸内吸収よりもさらに困難であることが知られており、そして図３の境界３０近辺で見られるｃａｃｏ−２透過性での急激な落下は、これが線形性が顕著に失われる可能性が高い点であることを示唆している。最小メジアン二乗（ＬＭｅｄＳ）線形回帰が、係数がＣｌａｒｋにより述べられている係数と異なる頑健線形回帰をコンピュータ計算するために用いられ、そして改良された線形モデルが、Ｒ^２がＣｌａｒｋの０．７８７ではなく０．８６１で得られている。さらに、境界３０は、透過性の非線形性を取り扱うための第２の基準として用いられ、そして線形回帰により求められるｌｏｇＢＢに対するどのような予測も、分子が境界３０の外側であれば無効であると考えられる。したがって、このｌｏｇＢＢモデルは、図３の領域の外側にある化合物のｌｏｇＢＢを数値的に予測してはいないが、そのような化合物が血液脳関門で透過性が乏しいであろうことを定性的に予測している。これらの原理により実施された線形回帰は、ｌｏｇＢＢの以下の式をもたらす：
【数９】

【００４０】
これは、図４でグラフにより示されている。境界３０の内側で、かつ線３６の左側のＰＳＡ−ｌｏｇＰ平面に存在している化合物は、１より大きいＢＢを有する（すなわち、０より大きいｌｏｇＢＢ）と予測され、そして境界３０の内側で、かつ線４０の右側のＰＳＡ−ｌｏｇＰ平面に存在している化合物は、０．５より小さいＢＢを有すると予測される。
【００４１】
ＰＳＡとｌｏｇＰに基づいてｌｏｇＢＢを予測するさらに頑健な数値モデルは、上に記載された既知の吸収される化合物のセットではなく既知のＣＮＳ浸透剤化合物を用いて、図３の境界３０のような信頼楕円を考案することにより開発されることができる。したがって、一実施形態において、信頼楕円は、ＣｏｍｐｒｅｈｅｎｓｉｖｅＭｅｄｉｃｉｎａｌＣｈｅｍｉｓｔｒｙ（ＣＭＣ）データベースからの８３６個の化合物を用いて作成された。これらの８３６個は、ＣＭＣのクラスでＣＮＳ浸透剤を意味する８８１個の化合物の部分集合を含む。８３６個の特定のリストは、頑健統計分析により確認された４５個の異常値を除くことにより得られた。４５個の異常値は、１５個の活発に輸送される化合物、１０個の４級アミン、１０個の非薬剤様化合物、および１０個のエステル／プロドラッグを含んでいた。用いられた８３６個の化合物に対し、ＰＳＡの平均値は、上に記載された線形ＰＳＡ式ではなくエネルギー最小化三次元構造で計算したときに、４５．５１３１であることが見出された。平均の計算されたｌｏｇＰ（ＡｌｏｇＰ９８数値法を用いて、上に参照したＧｈｏｓｅらを参照のこと）は、３．０８６７であることが見出された。上述したような従来の統計分析を用いると、このモデルのための行列ＡとＢは：
【数１０】

および
【００４２】
【数１１】

【００４３】
このモデルにより、新しい化合物に対し方程式２の方法で計算されたＴ^２距離が６．０２０２より大きいならば、化合物は９５％信頼領域の外側になる。この方法で新しい化合物に対し計算されたＴ^２距離が９．２７２５より大きいならば、化合物は、９９％信頼領域の外側になる。
【００４４】
このモデルは、Ｐｈｙｓｉｃｉａｎ’ｓＤｅｓｋＲｅｆｅｒｅｎｃｅ（ＰＤＲ）に記載されている４３８個の経口で投与し得る化合物を用いて検証された。これらの化合物は、ＢＢＢ浸透剤（２４２）、ＢＢＢ非浸透剤（４６）、活発に輸送される化合物（３７）もしくは流出された化合物（３０）、荷電された化合物（７）、または未知化合物（６５）として分類された。図５は、結果（７４個の活発に輸送、流出、または荷電された化合物は示されていない）を示している。６．２０２より少ないかまたは等しいＴ^２により定義される９５％信頼領域は、楕円４２により境界化されており、そして９．２７２５より少ないかまたは等しいＴ^２により定義される９９％信頼領域は、楕円４４により境界化されている。この図で見られるように、図５の２つのＢＢＢ信頼楕円は、ＢＢＢ浸透剤とＢＢＢ非浸透剤化合物を適切に分離することができる。
【００４５】
図５の信頼楕円は、また上記で誘導されかつ方程式３として示されているものよりもさらに良好なｌｏｇＢＢを数値的に予測する線形モデルを開発および使用するプロセスで用いられることもできる。
【００４６】
文献検索はｌｏｇＢＢデータを有する１２４個の化合物を確認した。頑健回帰法（最小メジアン二乗（ＬＭｅｄＳ）回帰法、たとえばＲｏｕｓｓｅｅｕｗ，Ｐ．ＪおよびＬｅｒｏｙ，Ａ．Ｍ．らのＲｏｂｕｓｔＲｅｇｒｅｓｓｉｏｎａｎｄＯｕｔｌｉｅｒＤｅｔｅｃｔｉｏｎ（ＪｏｈｎＷｉｌｅｙａｎｄＳｏｎｓ，ＮｅｗＹｏｒｋ，１９８７）（本明細書中にその全体が参照により援用される）を参照）は、最も適した線形係数のコンピュータ計算に先立って、ｌｏｇＢＢデータセットから除外される可能性のある異常値を確認するために図５のＢＢＢ信頼楕円４４と並行して用いられた。９９％ＢＢＢ信頼楕円の外側の化合物は排除され、そして２．５より大きな抵抗診断（ＲＤ）値は最小メジアン二乗（ＬＭｅｄＳ）回帰によると特定の観察のモデル空間の平面への一致が乏しいことの指標であり、したがって異常な観察である可能性が高いので、ＲＤ値＞２．５を有する化合物は、より詳細に試験された。多くの化合物が、変則的に低いｌｏｇＢＢ値を有すると観察され、それらの化合物の３個はｐ−糖タンパク質（ｐＧｐ）流出基質であり、残りはＳｅｅｌｉｎｇ（Ｅｕｒ．Ｊ．Ｂｉｏｃｈｅｍ．，１９９８，２５１，２５２−２６１）により確認されたｐＧｐ基質に共通するファルマコフォアを共有している。
【００４７】
二つの回帰法が、入手し得るｌｏｇＢＢを有する１２４個の化合物の異なる部分集合を用いて行われた。一つの回帰法において、図５の９９％信頼楕円内にあるとともに、除外のための特定の理由（たとえば、活発に輸送されると知られている）が見出されない１０２個の化合物が選択された。これは、ｌｏｇＢＢのための以下の一次式をもたらした：
【数１２】

【００４８】
この式は、０．７３２９のＲ^２を有するので、上の方程式３の一次式よりいくらか好ましくないように見える。第２の回帰は、図５の９９％信頼楕円の外側、かつＲＤ＞２．５（ＲＤ値が高くなるほど、化合物は異常値である可能性が高くなる）の化合物を全て排除した。これにより８６個の化合物が残った。これらの８６個の化合物を用いて、ｌｏｇＢＢの別の一次式が導かれた：
【数１３】

【００４９】
この式は、０．８８９２のＲ^２を有し、上の方程式３および４の両方よりも良好である。
【００５０】
吸収モデルに関し上に記載されたように、未知化合物が図５の９９％信頼楕円の外側にあるならば、数値的なｌｏｇＢＢ予測は行われず、化合物は単に非浸透剤として定性的に分類される。楕円内の未知化合物は、適切な一次式を用いて数値的なｌｏｇＢＢ予測に付されることができる。
【００５１】
上に記載されたモデルは、特に化合物の大きなライブラリの評価に適用されるときに、従来の吸収とＢＢＢ透過性予測技法に優る種々の利点を有している。モデルは、数値係数と行列要素は異なる方法でわずかに変化する場合があるものの、どのように候補化合物のＰＳＡとｌｏｇＰが誘導されるとしても、有利に用いられることができる。たとえば、線形ＰＳＡ式が（上記のようなエネルギー最小化三次元構造よりむしろ）上述の８３６個のＣＭＣ化合物でモデルを公式化するために用いられるならば、平均ＰＳＡは４５．５１３１ではなく４２．６３８１であり、そして行列Ａ、ＢおよびｌｏｇＢＢのための一次式は以下のようになる：
【数１４】

および
【００５２】
【数１５】

【００５３】
【数１６】

【００５４】
上で議論したように、線形算術的ＰＳＡ計算を用いて、ＰＳＡとｌｏｇＰの両方が、定義された原子分類に当てはまるそれぞれの分子内での原子と原子クラスタの数の線形和を用いて計算されることができ、結果的にコンピュータ計算時間がはるかに少なくなる。さらに、定性的な予測の正確性もまた改良されている。したがって、高い精度で非常に速い化学データベーススクリーニングが、本発明の原理で行われることができる。
【００５５】
式３、４、５および６の４つ全てを見ると、有用な線形ｌｏｇＢＢ式は、いくらか一般的に特徴付けられることができるように思われる。式の形態が以下のように定義される場合：
【数１７】

係数ａは、有利には約−０．０１４５〜−０．０１６５であり、係数ｂは、有利には約０．２１〜約０．３３であり、そして定数項ｃは、有利には約０．０３９〜約０．１２であり、それらの範囲内でより小さなｃ値およびより大きなｂ値が最も正確な式に関連しているように思われる。最も好適には、ａは、約−０．０１５８〜約−０．０１６１であり、ｂは、約０．３１〜約０．３３であり、そしてｃは、約０．０３９〜約０．０４０である。
【００５６】
図６は、本発明の一実施形態に従うコンピュータ実施された分子スクリーニングシステムを示している。このシステムにおいて、原子構成要素と、関連する結合とについての情報は、化合物データベース５０から検索される。この情報は、ＰＳＡ評価モジュール５２およびｌｏｇＰ評価モジュール５４へ送られる。いくつかの有利な実施形態において、ＰＳＡは、式（１）で示したような一次方程式を用いて計算され、そして表１からの係数を用いる。ｌｏｇＰは、ＡＬＯＧＰまたはＣＬＯＧＰ法を含む種々の既知の方法を用いて評価されることができる。評価されたＰＳＡ値とｌｏｇＰ値は、次いで分子選択／分類モジュール５６へ送られる。このモジュール５６は、興味のある化合物を、良好に吸収される化合物およびまたはＣＮＳ浸透剤化合物への類似の確率に従い分類する。モジュール５６は、候補分子を、上記式（２）を用いて図３〜図５の範囲の内側または外側であるとして分離することができ、そしてまたＰＳＡ−ｌｏｇＰ平面での良好に吸収される化合物および／またはＣＮＳ浸透剤化合物の重心からの化合物の距離に基づいて、良好に吸収される化合物および／またはＣＮＳ浸透剤化合物への類似性を示す化合物の確率に従い、化合物を順序付けることができる。
【００５７】
吸収が乏しい、または非ＢＢＢ浸透剤であると予測された化合物５８は、分離することができる。所望ならば、いくつかの化合物のＰＳＡ値とｌｏｇＰ値は、ｌｏｇＢＢ評価モジュール６０へ送られることができ、これは、たとえば上記の式３、４、５、または６のような一次式を用いて所望の分子のｌｏｇＢＢを数値計算する。
【００５８】
本発明は、候補分子に優先順位を付ける広い目的に用いられる。仮想の意味でのみ存在する候補分子が、合成のために優先順位が付けられることができ、一方、合成されている候補分子はスクリーニングのために優先順位が付けられることができる。さらに、このプロセスは、何回も繰り返されることができる。合成とスクリーニングの後、ｉｎ　ｖｉｔｒｏおよび／またはｉｎ　ｖｉｖｏでの吸収データが得られ、モデルに加えられることができる新しいデータポイントが作成される。したがって薬剤を発見するためのプロセスにおいて得られた新しい情報はモデル、およびその結果、合成された化合物を改良するために用いられることができる。
【００５９】
前述の記載は、本発明のある種の実施形態を詳細に述べている。しかしながら、前述の記載がどのように詳細にテキスト中に表れたとしても、本発明は、多くの方法で実施されることができることが理解されるであろう。また上に述べられたように、本発明のある種の特徴または態様を記載するときの特定の用語の使用が、用語が関連する本発明の特徴または態様のいかなる特定の特質を含むように本明細書中で限定されるように用語が再定義されていることを意味すると考えられるべきではないことを注意すべきである。したがって、本発明の範囲は、併記の請求項とその均等物に従い解釈されるべきである。
【００６０】
【図面の簡単な説明】
【図１】
図１は、本発明の一実施形態による極性表面積を計算する方法のフローチャートである。
【図２】
図２は、Ｐｈｙｓｉｃｉａｎ’ｓＤｅｓｋＲｅｆｅｒｅｎｃｅからの４４０個の化合物の極性表面積の評価対計算のプロットである。
【図３】
図３は、容易に吸収される化合物と吸収が乏しい化合物との間で統計的に画定された境界を含むＰＳＡ−ｌｏｇＰ平面での化合物の散布図である。
【図４】
図４は、図３の境界および予測された高いｌｏｇＢＢと低いｌｏｇＢＢを有する化学的空間の領域を示すＰＳＡ−ｌｏｇＰ平面の別のプロットである。
【図５】
図５は、ＣＮＳ透過剤化合物とＣＮＳ非透過剤化合物との間で統計的に画定された境界を含むＰＳＡ−ｌｏｇＰ平面での化合物の散布図である。
【図６】
図６は、本発明の一実施形態での薬剤を発見するためのシステムのブロック図である。

Claims

分子の極性表面積を評価する方法であって：
複数の原子の種類のそれぞれの定義に当てはまる前記分子中の原子または原子クラスタの数の別々のカウントを行うこと、
前記別々のカウントの少なくともいくつかを用いて前記分子の極性表面積を評価することを含む方法。
前記評価することが、前記カウントの少なくともいくつかに１つまたは複数の係数を乗じること、およびそれらの積を合計することを含む、請求項１記載の方法。
前記複数の原子の種類が、単結合されたＮＨ_２、二重結合されたＮＨ、二重に単結合されたＮＨ、芳香族結合されたＮＨ、芳香族結合されたＮ、三重結合されたＮ、単結合されたＯＨ、二重結合されたＯ、二重に単結合されたＯ、および芳香族結合されたＯのうちの１つまたは複数を含む、請求項１記載の方法。
前記複数の原子の種類が、単結合されたＮＨ_２、二重結合されたＮＨ、二重に単結合されたＮＨ、芳香族結合されたＮＨ、芳香族結合されたＮ、三重結合されたＮ、単結合されたＯＨ、二重結合されたＯ、二重に単結合されたＯ、および芳香族結合されたＯの全てを含む、請求項３記載の方法。
分子の極性表面積を評価する方法であって、前記分子中に存在する、予め定義された原子タイプおよび／または原子クラスタタイプのカウントを実行すること、および前記分子のエネルギー最小化三次元分子構造を参照することなく、係数類により重みが付けられ、かつ一緒に合計された前記カウントを用いて前記分子極性表面積を評価することを含む方法。
前記予め定義された原子タイプおよび／または原子クラスタタイプが、単結合されたＮＨ_２、二重結合されたＮＨ、二重に単結合されたＮＨ、芳香族結合されたＮＨ、芳香族結合されたＮ、三重結合されたＮ、単結合されたＯＨ、二重結合されたＯ、二重に単結合されたＯ、および芳香族結合されたＯのうちの１つまたは複数を含む、請求項５記載の方法。
膜透過性に対する分子の性質を予測する方法であって：
前記分子のエネルギー最小化三次元構造を参照することなく、前記分子の極性表面積をコンピュータ計算すること、および
前記性質を予測するために前記コンピュータ計算された極性表面積を用いることを含む方法。
薬剤を発見するための方法であって：
複数の分子の少なくともいくつかのエネルギー最小化三次元構造を参照することなく、前記分子の極性表面積をコンピュータ計算すること、および
更なる分析のために、前記分子の１つまたは複数を選択できるように、膜透過性予測モデルにおいて前記コンピュータ計算された極性表面積を用いることを含む方法。
前記複数の分子のｌｏｇＰをコンピュータ計算すること、および前記膜透過性予測モデルで該コンピュータ計算されたｌｏｇＰを用いることをさらに含む、請求項８記載の方法。
合成とスクリーニングのために化合物に優先順位をつけることを含む、請求項８記載の方法。
薬剤を発見するための方法であって：
データベースから分子の部分集合を選択することを含み、前記選択することが、
前記データベースの少なくともいくつかの分子の極性の性質の数値尺度を評価すること、
前記データベースの前記少なくともいくつかの分子の親油性の数値尺度を評価すること、
極性の性質−親油性平面で前記少なくともいくつかの分子の位置を決定すること、および
前記平面上でのそれらの位置に基づいて化合物を分類することを含む方法。
前記極性の性質の数値尺度が、ＰＳＡを含み、かつ前記親油性の数値尺度が、ｌｏｇＰを含む、請求項１１記載の方法。
前記分類することが、前記ＰＳＡ−ｌｏｇＰ平面の予め定義された境界化領域に当てはまる化合物の部分集合を選択することを含む、請求項１２記載の方法。
前記分類することが、合成とスクリーニングのために前記化合物に優先順位をつけることができるように、前記ＰＳＡ−ｌｏｇＰ平面上の予め定義された点に関連して前記ＰＳＡ−ｌｏｇＰ平面のそれらの位置に基づいて化合物を順序づけることを含む、請求項１２記載の方法。
前記選択することが、前記ＰＳＡ−ｌｏｇＰ平面において、前記データベースのそれぞれの分子と前記ＰＳＡ−ｌｏｇＰ平面中の予め定義された点との間の距離を決定することを含む、請求項１２記載の方法。
ＰＳＡを数値的に評価することが、
複数の原子の種類を定義すること、
前記種類のそれぞれの定義に当てはまる前記分子中の原子の数の別々のカウントを行うこと、
前記別々のカウントの少なくともいくつかを用いて前記分子の極性表面積を評価することを含む、請求項１２記載の方法。
汎用コンピュータに分子のＰＳＡ評価方法を実施させる命令が記録されたコンピュータ可読媒体であり、前記方法が、
複数の原子の種類のそれぞれの定義に当てはまる分子中の原子または原子クラスタの数の別々のカウントを行うこと、
複数の係数を検索すること、
前記別々のカウントに前記複数の係数の選択されたものを乗じること、およびそれらの積を合計することを含む媒体。
コンピュータ実施された薬剤を発見するためのシステムであって、
三次元分子構造を参照することなく分子の極性の性質の数値尺度を評価するための評価モジュールと、
三次元分子構造を参照することなく分子の親油性の数値尺度を評価するための評価モジュールと、
前記評価の結果に基づいて分子を分類するための分子選択モジュールとを備えるシステム。
前記分類することが、前記分子を、容易に腸内吸収されると予測される第１の組、および腸内吸収が乏しいと予測される第２の組に分離することを含む、請求項１８記載のシステム。
前記分類することが、既知の良好に吸収される化合物と似た吸収特性を有するそれらの確率に従い前記分子の少なくともいくつかを順序付けることを含む、請求項１８記載のシステム。
前記極性の性質の数値尺度が、ＰＳＡを含み、かつ前記親油性の数値尺度が、ｌｏｇＰを含む、請求項１８記載の方法。
前記分子選択モジュールが、ＰＳＡ−ｌｏｇＰ平面において、選択されている分子と前記ＰＳＡ−ｌｏｇＰ平面の予め定義された点との間の距離を計算する、請求項２１記載のシステム。
前記評価からｌｏｇＢＢを数値的に予測するために構成されたｌｏｇＢＢ評価モジュールをさらに含む、請求項１８記載のシステム。
前記分類することは、合成とスクリーニングのために化合物に優先順位をつけることを含む、請求項１８記載のシステム。
薬剤を発見するためのシステムであって、
複数の分子の原子構成要素および原子間結合に関する情報を格納するデータベース、および
前記複数の分子のいずれかのエネルギー最小化三次元構造を参照することなく前記複数の分子のそれぞれのＰＳＡを評価する手段を備えるシステム。
前記複数の分子のいずれかのエネルギー最小化三次元構造を参照することなく前記複数の分子のそれぞれのｌｏｇＰを評価する手段をさらに備える、請求項２５記載のシステム。
前記分子のそれぞれの腸内吸収の性質を予測する手段をさらに備える、請求項２５記載のシステム。
薬剤を発見するための方法であって、
分子の極性表面積（ＰＳＡ）を評価すること、
前記分子のｌｏｇＰを評価すること、
前記ＰＳＡおよび前記ｌｏｇＰの前記評価を式

に用いることによって前記分子のｌｏｇＢＢを評価することを含み、ここでａは約−０．０１４５〜約−０．０１６５の値を有する定数であり、ｂは約０．２１〜約０．３３の値を有する定数であり、ｃは約０．０３９〜約０．１２の値を有する定数である方法。
前記ＰＳＡが、エネルギー最小化三次元構造を参照することなく評価される、請求項２８記載の方法。
合成とスクリーニングのために化合物に優先順位をつけることを含む、請求項２８記載の方法。
前記ｌｏｇＢＢが、式

で評価される、請求項２８記載の方法。
前記ｌｏｇＢＢが、式

で評価される、請求項２８記載の方法。