JPH08512159A - 連続して分子群を進化させて、所望の特性を有する分子を設計する方法と装置 - Google Patents

連続して分子群を進化させて、所望の特性を有する分子を設計する方法と装置

Info

Publication number
JPH08512159A
JPH08512159A JP7503663A JP50366394A JPH08512159A JP H08512159 A JPH08512159 A JP H08512159A JP 7503663 A JP7503663 A JP 7503663A JP 50366394 A JP50366394 A JP 50366394A JP H08512159 A JPH08512159 A JP H08512159A
Authority
JP
Japan
Prior art keywords
molecule
molecules
molecular
group
evolving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7503663A
Other languages
English (en)
Inventor
デービッド ワイニンガー
Original Assignee
デイライト ケミカル インフォメーション システムズ インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by デイライト ケミカル インフォメーション システムズ インク filed Critical デイライト ケミカル インフォメーション システムズ インク
Publication of JPH08512159A publication Critical patent/JPH08512159A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/04General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length on carriers
    • C07K1/047Simultaneous synthesis of different peptide species; Peptide libraries
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J19/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J19/0046Sequential or parallel reactions, e.g. for the synthesis of polypeptides or polynucleotides; Apparatus and devices for combinatorial chemistry or for making molecular arrays
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/0068Means for controlling the apparatus of the process
    • B01J2219/007Simulation or vitual synthesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Abstract

(57)【要約】 分子構造の連続する分子群を進化させ、各分子群の進化した分子を、所望の物理的、理論的特性で評価する。初期分子群(12、14)は分子に番号が付けられている。評価は適合関数で行う(16、18)。その適合関数は、初期分子群と進化した分子の世代を、所望の特性セットで比較する。その結果、各構成に(20、22)数値評価または適合値を与える。数値評価は、所望の特性(24、26)に比較した分子構造が近似しているかを表示する。次の分子群は、適合値(28)に合わせて分子群の一部の分子の構造を変更して形成される。そしてこのプロセスは、繰り返される(30、14)。進化が進むにつれて、適合性は向上する。この進化プロセスは、分子が許容範囲内になったときに終了する。

Description

【発明の詳細な説明】 連続して分子群を進化させて所望の特性を有する分子を設計する方法と装置 この特許出願の内容は著作権の対象とされる。特許庁で特許書類または 記録として本特許出願書類または開示書類をコピーすることに関しては、異議を 申し立てないが、それ以外の行為に関しては、すべての著作権を主張する。 (発明の分野) 本発明は、ある一定の数式または、物理的、化学的、生物学的、あるい は理論的な分子構造に合致する化学的分子構造を設計する方法と装置に関する。 すなわちこれはいわゆる分子構造コンピュータ設計(CAMD)と言われる分野 に関する。そして薬品開発に応用されると、いわゆる薬品コンピュータ設計と言 われる。 (添付コンピュータプログラム) 添付のコンピュータプログラムには、1)以下に開示する方法と装置に 関する本発明を実施するための”Grok”と呼ばれるプログラムと、2)関連 する化学的機能に関する化学情報を開示する”Daylight Toolki t Programmer’s Guide”の2種類で構成されている。本発 明の譲渡人はこれらのプログラムに関し著作権を主張する。 (発明の背景) 特定の目的に対し適合する新規の化学物質を発見するために数々のアプ ローチが試みられっている。これらの方法論のほとんどは薬品の発見に関するも のであるが、すべての化学分野についてもいろいろ存在する。例えば、農業化学 、化学物質工業、燃料、香水、化粧品、写真、半導体、非線形光学等の分野であ る。化学物質を発見するここでの目的は、特定の化学反応性、生物学的特徴、あ るいは化学、物理的な特性を有した一定の化学物質を発見することである。一般 にいずれの方法も、満足いくものとは評価されていない。 通常、化学物質を発見するには2つの方法があり、一つはランダムにス クリーニングする方法であり、もう一つは理論設計する方法である。このランダ ムスクリーニングの手法は、多種類の物質をすばやくスクリーニングして1また は複数の主要物を発見し、その後のテストや理論設計による精製を行うという能 力から構成されている。このランダムスクリーニングの欠点は、非常に経費がか かり、また成功の確率が低いということである。化学物質を開発している多くの 企業でこのランダムスクリーニング手法が用いられているのは、歴史的に一番ベ ストであるという理由であり、問題ではあるが、それが唯一可能な手法というた めである。このランダムスクリーニングによる実験は、実際は理論的でない部分 が存在する。例えばスクリーニングされる化学物質は、実際には本当のランダム ではなくある組成物の大きなグループを代表する物質にすぎない。 一方、化学物質の理論設計は数々の化学物質の特性を、分子構造の点で 理論化する能力に依存している。この目的のためにすでに1930年代から厳格 なフレームワークが設定しようとする動きがあった。Chomprehensi ve Medical Chemistry、Pergamon Press plc社発行 ISBN 0−08−037060−8、1990年、Mich ael S.True氏による、”History and ObJectiv es of Quantitative Drug”参照。この分野はCorw in Hansch氏によって開発された手法であるQSAR(Quantit ative Structure−Activity Relationshi p)の出現によって1960年代に急激に発展した。このQSARによれば、化 学分子の働きが、その機能的グループの位置関係および物理的パラメーターに十 分関係づけられるようになった。そしてこの方向に沿って、さらに多くの開発が 進められた。特にコンピュータグラフィックを応用したビジュアルな三次元構造 で、この分野はいわゆる分子モデル化と呼ばれる分野になっている。 Comprehensive Medicinal Chemistr y、 第4巻 Qauntitative Drag Design(1990 )は、この分野の最近の状況について述べている。しかしながら一般的には、こ の手法によって開発されたのは、新規物質の発見というよりは分析技術である。 新たな分子がどのように働くかを予想するために、多くの努力が払われている。 すなわち主要な化学構造をさらに発展精製する多くの努力が払われてきた。しか しながらこの世の中に存在する多くの分子構造から新規な分子構造を生み出すと いう点では、ほとんど何もされないまま放置されてきたのが現状である。この新 規物質を発見するという方法がほとんど存在しない理由として、この問題が大変 難解であるという点が上げられる。例えばある特定の狭い範囲の化学物質に対し ても、実に多種多様な分子構造が考えられるためである。 現在はコンピュータにより物質の分子配列を設計する数々の手法が行わ れている。まずDOCKプログラムと呼ばれるものがある。これは”A geo metric approch to macromolecule”I.D. Kurtz氏、J.M.Blaney氏、S.J.Oatley氏、R.Lan gridge氏、T.E.Ferrin氏、共著、J.Mol.Biol.,社 、162,269(1982年)に詳述されている。またGROWプログラムと 呼ばれるものもある。これは”Computer Design of bio active melecules: a method for recep tor−besed de nove ligand design”、J.B .Moon氏、W.J.Howe氏、共著、Proteins:struct. Funct.Genet.、11,314(1991年)に開示されている。さ らにLUDIプログラムと呼ばれているものもある。これは”Computer program LUDI:A new method for the d e novo (新規な)design of enzyme inhabit ors”、H.J.Bohme氏、J.Comp.−Aided Mol。De sign、6,61(1992年)に開示されている。DOCKでは、分子の受 け手であるreceptorまたは結合位置に対し、形状、電子静電特性が合致 する分子をデータベースから選択するようになっている。そしてこの方法で いくつかの薬品発見プロジェクトにおいて、主要物質を発見することに成功して いる。ただしこのDOCKでは、化学構造についての予め決められたデーターベ ースに依存し、いわゆるde novo デザインを行っている訳ではない。ま たLUDIでは、化学的断片情報、その化学的断片と受け手であるrecept orで補完的に自己学習するルール、およびreceptorまたは結合位置で 合致する分子を組み立てる幾何学情報のデータベースを使用する。またGROW では、アミノ酸のデーターベースから結合位置へペプチードを集め、そのペプチ ードをしっかりと結合させることにより、数々の異なる酵素を生成することに成 功している。これらの3種のアプローチは、現時点での最も野心的かつ成功した アプローチではある。しかしながらそれでもまだ十分ではなく、特定の分子結合 位置での最適化を満足させるような化学合成を不便なく行う、分子のいわゆるd e novoデザインには至っていない。 遺伝子アルゴリズムの手法は、高次元空間におけるグローバル最適化 問題を解決するのに適した比較的新しい手法である。遺伝子アルゴリズムはジェ ットエンジンから競馬のハンディキャップを決めることまで広く応用されている 。前者は、”Proceedings of the Third Inter national Conference on Genetic Algor ithms”、James David Schaffer氏編、Morgan Kaufmann Pblishers社発行、POB 50490、Pal o Alto、CA 94303−9953、ISBN 1−55860−06 6−3、1989年に記載されている。また後者については、”Proceed ing of the Fourth International Conf erence on Genetic Algorithms”、Richar d K.Below氏編、Morgan Kaufmann Pblisher s社発行、POB 50490、Palo Alto、CA 94303−99 53、ISBN 1−55860−208−9、1991年に記載されている。 遺伝子アルゴリズムによる手法の背景にあるものは、進化のプロセスをシュミレ ーションすることにある。すなわち単純な自然に行われる取捨選択と遺伝的な一 定メカニズムによるいわゆる進化は、環境を変えながら生物が生存し続けるとい う非常に難解問題を解くためによく見受けられる。実際にはこの問題は、お互い に競合しあう一定の個体群を形成しながら(これらがそれぞれ解決手段である) 、再生産を繰り返し(一定の遺伝的なメカニズムに従って)新たなより良い個体 群に向かって(つまり解決手段に向かって)進化している。これをある与えられ た命題に応用しようとすると、まずその個体群を代表する一組の染色体を創造し 、次に子孫がその親の特徴を保持し得る再生手段、そしてそのような進化を可能 にさせる環境を作り上げなければならない。この点で2つの著書が遺伝子アルゴ リズムを提供している。すなわち、Handbook of GeneticA lgorithms、Lawrence Davis 編、Van Nostr and Reinhold社出版、ISBN 0−442−00173−8、1 991年、および Genetic Algorithms in Searc h、 Optimization、and Machine Learning 、著者D.E.Goldberg氏、Addison−Wesley社出版、1 989年である。 正規の遺伝子アルゴリズムでは、生物の生命体と同様な固定サイズの染 色体を操作している。従ってその用途は,固定サイズの溶剤上に遺伝子を配置す るという問題,すなわち空間に一定数の元素を相対的な位置関係に配置するとい う問題のみに限定されてしまうことになる。この点より、正規の遺伝子アルゴリ ズムは、構造分析、蛋白質の連続配列、二次配列予測等の重要な化学問題解決に は有用と考えられる。しかしながら従来の遺伝子アルゴリズムは、必ずしも新規 な化学物質を発見するという命題にはむいていない。分子はいろいろな形状とサ イズをしているため、生物をコード化する染色体ではうまく定義付けできない。 従って結果として、遺伝子アルゴリズムは化学物質の新発見よりむしろ化学分析 の諸問題解決にしか利用できない。 (発明の要約) 本発明の目的は、予め決められた物理的あるいは理論的特性を有する分 子構造を設計する新規で改良された方法を提供することである。 さらに本発明の別の目的は、所望の構造を有する分子群へ進化させる新 規で改良された方法を提供することである。 本発明は分子構造を連続的に進化させる方法と所望の物理的あるいは理 論的特性と、進化したそれぞれ群の代表分子とを比較する方法に関連する。いく つかの構成分子の代表から成る代表分子が、初期分子構造群として最初に設定さ れる。その後、初期分子構造群および進化した分子群と、所望の特性とを比較す る適合度関数によって、比較評価がされる。これによってそれぞれの進化の過程 にある分子群に対して、数値あるいは価値で適合度が算出される。この数値によ り、その代表分子が所望の特性にいかに近づいているかが判明する。適合度の数 値によりその分子構造のある分子がその後変更されてさらに次の分子群が生成さ れる。そしてこのプロセスが繰り返される。このようにして、より完全な適合度 が得られるように分子群の一部がどんどん進化していく。そして代表分子が十分 進化して満足いくレベルになった時にこのプロセスは終了する。 本発明の他の面として、上記代表分子により構成されている初期分子構 造群がランダムに生成される点にある。そして再生成された代表分子は、化学的 に安定しているかどうかが判断され、もし安定していれば次の分子構造群へ組み 込まれる。 上記次の分子構造群はいろいろな遺伝的メカニズムによって現在の代表 分子から再生成される。現分子構造群の代表分子から、あるいくつかの適合度の 高いエリート分子が選択されて、次世代の分子構造群へ引き渡される。親の代表 分子は、現分子構造群からその適合度により選択される。一つの親代表分子が選 択されて、次世代の分子構造群に入れられる一つの子代表分子が再生成されてい く、という無性繁殖が行われる。これとは別に、2つの親代表分子が選択されて 次世代分子構造群に入れられる一つの子代表分子が生成されることもある。この 生成過程では、それぞれの親代表分子の一部が選択されて、それらを合成して子 代表分子が生成される。 子代表分子はさらにその後、突然変異によっっても変化させられる。す なわち子代表分子の一つの元素が追加されたり削除されたりする。子代表分子の 結合は変更されることがある。 現分子構造群中の代表分子の適合度を決定するために、本発明に開示さ れた、1又は2以上の適合度関数により所望の特性との比較が行われる。その所 望の特性は関連する分子の類別の形式で表現されている。 さらに他の適合度関数は現分子構造群中の代表分子に対して確認のため の分析も行う。これによって個々の分子構造を構成する分子群と所望の特性を有 する結合サイトのモデル間における結合エネルギーを決定することが出来る。さ らにこの確認分析によって、各分子の電荷と結合サイトの電荷との間に生ずる電 磁気的な相互関連性を決定し、対応する数値データを提供するようになっている 。この適合度関数はさらに現分子構造群の代表分子に対して、実際の分子を合成 し、かつ引き合わせる機能を有する。これによって、合成された個々の分子とタ ーゲットとなる分子間の結合エネルギーを分析して対応する数値を得るようにな っている。このように複数の適合度関数が現分子構造群の個々の代表分子に対し て実行されて、ターゲト分子を所望の特性方向に進化させる。 (図面の簡単な説明) 本発明を実行する上で考えられるベストモード、およびこの発明を実行 する方法に関する記載は、添付の図面にその実施態様が示されている。ここで目 的行為を角張ったボックスに記載し、ステップ又はサブプロセスは角が丸いボッ クス、太線のボックスは追加のフローチャートでステップ又はサブプロセスが追 加の図面で説明されていることを示す。 図1は本発明のハイレベルでのフローチャートを示す。本発明は、連続 する分子構造を進化させ、現分子群における各分子を適合性関数を使用して評価 する。これによってある特定する分子が、予め設定された所望の物理的、又は理 論的特性にいかに近いかを示す適合度の目安を得ることが出来る。本発明ではそ の後、その適合度の目安に従い次の分子構造群へさらに進化を続ける。 図2AおよびBは、図1に示すハイレベルフローチャート中のステップ 12で一般的に示す、初期分子構成を発生させる方法の代替案を示すローレベル でのフローチャートである。これによれば、線形表示法で特性を示す線分をラン ダムに発生させ、初期的な周期テーブルから求められるノードとエッジからラン ダムな図形を作り出すことが出来る。 図3A、B、C、D、E、F、そしてGは、図1に示すハイレベルフロ ーチャート中のステップ18で一般的に示す、与えられた現分子構造群中の各分 子を、それぞれ適合関数を使用して評価する代替方法を示す。その適合関数は( A)では、オブジェクト分子の各代表分子とターゲット分子の類似性を細かく比 較し、(B)では、オブジェクト分子の各代表分子とターゲット分子のクラスの 類似性を細かく比較し、(C)では、その分子と一定の薬物モデルとの適合性を 比較し、(D)では、作ろうとする薬物のオブジェクト分子と、蛋白質および酵 素の分子モデル間の理論的結合エネルギーを計算し、(E)では、分子場の誘導 されたモデルに対する各分子の適合性を評価し、(F)では、合成した薬品の蛋 白質または酵素の実際のサンプル上で合成された薬品の結合測定値を使い、(G )では、複数の適合性関数を一つの合成適合関数に合成するために、それぞれ使 用される。 図4は、図1に示すハイレベルフローチャート中のステップ22で一般 的に示す、与えられた現分子構造群が生育していく評価方法に関するローレベル フローチャートを詳述している。 図5は、図1に示すハイレベルフローチャート中のステップ28で一般 的に示す、与えられた現分子が次世代の分子へ進化する方法に関する中間レベル でのフローチャートを詳述している。 図6は、図5に示す中間レベルフローチャート中のステップ290で一 般的に示す、生成されるべき親分子を選択する方法に関するローレベルフローチ ャートを詳述している。 図7は、図5に示す中間レベルフローチャート中のステップ294で一 般的に示す、一つの子分子を生成するための二つの親分子を作り出す方法に関す るローレベルフローチャートを詳述している。 図8は、図5に示す中間レベルフローチャート中のステップ296で一 般的に示す、一つの元素を選択的に追加、削除、変更して、あるいはランダムに 選択した元素間の結合を修正したりして、子分子を突然変化させる方法に関する ローレベルフローチャートを詳述している。 図9A−Nは、それぞれ初期群、第1、2、3、4、10、20、30 、33、34、36、そして40代の連続する世代の表し、それぞれ図1に示し 、かつ図3Aの類似性に基づく適合性関数により進化している状態を示す。この 場合、ターゲット分子はドーバミンであり、それぞれの図は単一世代の分子式を 示す。 図10は、酵素であるシヒドロフォレーテ還元酵素(DHFR)と化学 療法剤であるメトトレザト(MTX)間の複合結合部位をドット表面で表した立 体図である。このMTXはDHFRと強く結びつくことで知られている(立体図 は、特に必要ではないが、3次元図で見えるようにしている)。 図11AとBは、それぞれDHFRとMTX薬の結合部位に関する外部 正面図と切り口を表す。この図では、ファンデルワールス半径の2倍で表示され ており、結合腔内の結合構造を表している。 図12AとBは、それぞれDHFRとポリヤミンの結合部位に関する外 部正面図と切り口を表す。これは、図3Dに示す結合力適合関数を使い、図1の 進化方法で18世代を経させたものである。 図13AとBは、それぞれDHFRと多環式ポリヤミンの結合部位に関 する外部正面図と切り口を表す。これは、図3Gに示す組成物適合関数を使い、 図1の進化方法で130世代を経させたものである。 (発明の詳細な説明) 本発明では、一台または複数のコンピュータにロードされかつ実行され るコンピユータプログラムにより実施される。例えば、コンピュータはSGIC rimson R4000のような、ワークステーションが用いられる。本発明 は、所望の物理的、理論的特性を有するいかなる化学物質の分子構造を決定する ために使用する、強力な装置とその方法に関する。そして薬品設計のために使用 される。 まず特に図1に示すように、遺伝子アルゴリズムを使用して連続的に分 子構造を進化させる方法のプログラムが開示されている。本発明では、それぞれ の染色体、または群のメンバー、または世代が分子構造である。その進化過程の いくつかの世代が、図9A−Nに示されている。図9のそれぞれが世代であり、 分子構造の群を表している。この実施例では、各世代は20個の分子構造から構 成されているが、これ数は実施例により異なる。分子構造の各世代は、一度に1 分子構造毎に所望の物理的、理論的特性を比較される。これにより各世代が、そ の所望の特性にいかに近いかを示す適合度の表示ないしはシグナルを得ることが できる。本発明の方法では、特性を持つ分子構造は一定の数値で表されるように 、所望の特性に十分近づくまで連続して進化が進む。特に第1図では、フィード バックの各1ループが一世代を表し、所望の特性が得られるまでループは続けら れる。 図1では、方法10が分子構造の初期セットまたは群300をランダム に発生させるステップ12からスタートする。図9に示すように下付け番号は、 分 子構造の特定の群または世代に対して方法10が実行された世代数または回数を 意味する。図9Aはその分子構造の初期セットまたは群300を図示したもので ある。まずプログラム10はステップ16へ移動し、そこでは現在の群または世 代中のそれぞれの分子構造を、所望の物理的、理論的特性と比較評価を行う。こ の評価には後で述べるように、適合性関数の1または複数の適合値を使用する。 分子進化に有用な適合性関数の役割は、ある一定の特性と各々の分子構造を比較 してその両者がどの程度適合しているかの数値評価を与えることにある。進化方 法10で、後のステップはこの数値評価によって容易に遂行できるようになる。 さらにもし一つの適合性関数が一つの数値評価を与えられるとすると、複数の適 合性関数が一つの群中の各分子構造を評価するために使用され得る。異なった適 合性関数による数値評価は単に加算されて、合算された数値評価が図1の以後の ステップで使用される。後で詳述するが、複数の適合性関数を使用することによ って、対応する複数の特性セットに対してオブジェクト分子を進化させることが できる。分子を発見する上で、適合性関数が優れているのは、それが単一価値を 持っていることである。すなわち単一価値関数では、ある一つのインプットに対 しては常に同じ結果を生じさせることにある。したがって適合度は単に分子構造 にだけ依存して、それまでの進化過程や分子群には依存しない。この単一価値関 数の長所は、新規の分子のみを適合数関数で評価すれば足りる点である。この点 で単一価値関数は実行上大変便利であり、特定の分子構造はたった一回だけの評 価で足りることになる。 選択された適合性関数はステップ18で外部で評価されるが、これによ って本発明を実施する上で非常にフレクシブルな実行が可能となる。すなわち、 まずステップ20、24、26において使用されるコンピュータ言語は、通常ス テップ18の適合性関数で使用される言語とは異なる。以下に説明するように、 これらの異なるステップ毎に、異なるコンピュータ言語が必要とされる。特に分 子構造は、それぞれ異なる言語を必要とする異なるモデルによって表されている 。例えば図3Cで述べられているサブプロセス18Cでは、ステップ20、24 、28で分子図表で表現されているように、分子構造が薬理学的な記載で記載さ れるのが必要とされる。進化ステップ16、20、24、28は、ステップ18 で 実行される特定の適合性関数から独立しており、実際には異なる適合性関数ある いは複数の適合性関数と一緒に、これらのステップが記載されているコンピュー タ言語を変更することなく使用可能である。次にステップ18が他のステップか ら独立しているため、コンピュータアチテタチャーがよりフレクシブルになるこ とである。例えば、一つのコンピュータがステップ16、20、24、26を実 行して、他の別の一つまたは複数のコンピュータがステップ18用に使うことが できる。特に適合性関数が複雑である場合には、それぞれ各分子または各分子構 造毎に別々のコンピュータが使用でき、これらの複数のコンピュータを並列稼働 させることが出来る。図3Fで述べるように、比較ステップではコンピュータに より必ずしも理論的に行われるのではなく、むしろまず分子構造が合成されてか ら、その適合性が測定される。 プログラム10は次にステップ22に移り、ここでは現世代のそれぞれ の分子構造が実際に存在可能かどうかが評価される。すなわちステップ22では 、その構成が現実の場で存在可能かあるいは安定的かどうかの程度が決定される 。ステップ18と同様にステップ22では、評価された分子構造について安定度 の数値評価がなされる。ステップ18で得られた適合性評価値がステップ22で 得られた安定性評価値に加算されて、現世代での各分子構造の合算評価値が計算 される。現世代における各分子構造の合算評価値と最高評価値の分子構造のから なるエリート経歴がメモリーに記憶される。次にステップ26では、かの分子構 造と合算評価値がCRTに表示される。その表示内容は、図9の各図に示す内容 で、一世代の分子構造と合算評価値の両者が表示される。次にステップ28では 、遺伝子アルゴリズムが計算されて、次世代の分子構造が生成される。自然界に おけるように、合算評価値において所望の特性に一番近い分子構造が次世代に組 み込まれていく。図5から8で詳しく述べるように、選択されたより高い評価の 分子構造が次世代としてクロン(無性生殖)されるか、またはその分子構造の一 部が相互にブリード(飼育)されて次世代の文書構造を形成する。これによりそ の次世代が現世代となり(データオブジェクト30、14間で矢印で示されてい る)。そして方法10は次世代の分子を進化させ、これが繰り返される。この方 法がさ らに繰り返され、分子構造が十分高合算評価値を得て所望の特性を示すと思われ るまで繰り返される。 図1に関して述べたように、分子の連続する世代として進化させる方法 にコンピュータを使用するには、分子とその構造をデジタル表示する必要がある 。デジタル表示の第一の手法は、分子グラフエンコーディングとしてよく知られ ており、分子構造を操作、すなわち突然変異とステップ28で行う交差による分 子再生成には適している。しかしステップ16と18に示すようにプログラム間 で適合性を評価しながら分子群のやり取りを行うには不向きである。その理由は 、データ表現の特殊性に多く依存するからである。この分子グラフエンコーディ ングについては、その詳細は以下の文献を参照のこと。1)Chemical Structure 2、Wendy A.Warr編、”GEMINI、a Generalized Connection Table Languag eand lnterpreter”by D.Wieninger and A.Weininger、Springer Verlag社出版、ISBN3 −540−56369−5(1993)、2)Chemical Inform ation Systems、 Beyond the Structure Diagrams、by D.Bawden and E.M.Mitchel l、Ellis Horwood(London)、ISBN 0−13−12 6582−2(1990)。分子エンコーディングの第二の手法は、分子の対象 が線形表記法すなわち印刷可能な文字で表現されている辞書的な形式で書かれて いるものである。これはSMILES(Smplified Molecula r Input Line Entry System)と呼ばれ、詳細は”S MILES a chemical language and inform ation system.I.Introduction to metho dology and encoding rules”、D.Weinige r、J.Chem.Info.Sci.、28,31(1988)に書かれてい る。本実施例の分子遺伝アルゴリズムでは、分子群のコミュニケーションとデー タ保管には、SMILESが使用されている。SMILESは、コミュニケーシ ョンとデータ保管の点で、内部グラフエンコーディングよりも優れている。理由 は、それがテキストの文字だけで構成されており、簡便に表示されて、かつマシ ーンから独立した分子の表記方法であるためである。 この実施例では、上記分子グラフのデジタル表記により、内部の分子オ ブジェクトが表現されている。SMILESは分子オブジェクトを辞書的な形式 で表現している。ここでSMILES言語には″SMILES interpr etation”として知られている内部オブジェクトへの変換プログラムがあ る。これによってここに記載されている適合性関数が実行されている。例えばサ ブプロセス94、112、132等である。反対に内部形式からSMILESへ の変換は、”SMILES generation”があり、外部の処理過程あ るいは記憶場所へのコミュニケーションに使用される。例えばステップ16、2 4では、分子構造はステップ18、26へ行く前にSMILES形式に変換され る。 分子群のコミュニケーションを行うためにしっかりとルール付けされて いるSMILESを使うことで、単一の分子遺伝アルゴリズムがなにも変更せず に、1または複数の外部適合性関数を操作出来るようになる。例えばステップ1 6、20、24、そして28である。 最初の形式である分子グラフエンコーディングは、内部での分子構造を 表現するのに使用される。例えばステップ16、20、24そして28が分子グ ラフで表現されている。この分子グラフは複数のノード(nodes)とエッジ (edges)から成り立っている。表現されたグラフはそれぞれ異なるノード とエッジを有している。分子グラフは、元素を表現するノードと(ノードには元 素番号や電荷等の元素の特性を含む)、と結合子を表現するエッジ(結合子には 結合子とその種類を含む)により表現されている。したがって分子グラフは分子 の元素価モデルである。この分子グラフは通常は図9に図示されているように、 ”CH2”の用に文字表記されたノードと、元素を結ぶ一本線、二本線、三本線 のような結合子で構成されている。分子グラフでは、ノードは必ずしも元素に限 らない。ノードは例えばポリペプチド中のアミノ酸残基等の元素の集団も意味す る。 しかしすべての場合について、分子グラフにおけるノードは元素またはその分子 を表す個性体を意味する。 第二の形式であるSMILESは、プログラム間のコミュニケーション 及び結果のアウトプット用に、分子を外部に表現するための方法が設けられてい る。分子の適合性評価がステップ16、18で行われるが、ここではSMILE S言語で表現されている。以下にSMILESについて簡単に説明する。SMI LESは分子を表現するために、スペースなしの直線的な文字列で表現される。 これらの文字は以下に述べる5つの基本ルールに従って並べられる。 ルール1は、元素は元素記号をカッコの中に入れて表す。例えば、基本 的な鉛は、”[Pb]”で表現される。電荷や不規則な付属水素元素などはカッ コの中へ入れる。例えば、ヒドロニュームイオンは”[OH3+]”で表現され る。元素B、C、N、O、P、S、F、Cl、BrそしてIは、それらが規則的 な結合子を伴って最下位に位置する場合にはカッコは不要である。例えば、”C ”はメタンである。小文字でスタートする記号は、芳香性元素である。 ルール2は、結合子は”−”(一本)、”=”(二本)、”#”(三本 )、”:”(芳香性)を表す。例えば”C=O”はホルムアルデヒドを表す。元 素記号が並んでいる場合には、一本の結合子または芳香性結合子で結ばれている 。例えば”CO”はメタノールである。 ルール3は、枝の親元素の中にカッコで入れる。例えば”CC(=O) )”は酢酸である。枝は必要数だけ重ねることが出来る。例えば”ClC(Cl )(Cl)Cl”は炭素四塩化物である。 ルール4は、環状元素は対応のディジットを繰り返す。例えば”CCC CCC”は、ヘキサンを表す。”C2CCCCC2”’は、シクロヘキサン、” Clcccccl”はベンゼンを意味する。 ルール5は、通常の結合子でない分子の一部分は、ペリオッド(非結合 子)で表す。例えば”[Na+].[O−]clcccccl”は塩化フェノッ クサイドを表す。 以上のSMILESに関するルールで、大半の有機分子を表現できるし 、また本発明を説明するには十分である。SMILESの最も重要な特性は、文 字 列で分子を表現できるということである。 まずバイアスがかかっていない連続する分子世代を進化させるには、ラ ンダム分子群と呼ばれるランダムな集合からスタートすることが有用である。一 般にランダム分子群からスタートする方が、所望の特性に近い特性を持つ分子群 からスタートするよりも良い結果を生じさせる。これは目的物に対して、バイア スのかかりが少ないからである。方法10は所望の含有物を分子構造に近い特徴 または特性を持つ分子構造を選択し、それらを最初の世代に入れてから実行され てきた。もし類似する分子構造が含まれていると、進化構造はその類似分子に方 へバイアスがかかる。一方、もし分子構造をランダムに発生させると、進化方法 10は、梳毛の特性に完全には適合しないが、もし最初の世代の中に所望の特性 が入れてあれば得られないようなユニークな分子構造を創り出す。一般に、ラン ダムに最初の分子世代を選んだ方が、最初から所望の特性を入れておいた場合よ りも、はるかに多様性ある分子構造が得られる。以下に述べるように、ランダム に発生させた最初の分子世代の分子構造は、現存する分子構造である必要はなく 、また現実の世界に存在出来なくともよい。このランダム分子群を発生させるに は、図2AとBに述べるように、内部的にまた外部的に行うことが出来る。 まず図2Aに示すようにサブプロセス12aでは、SMILESによっ て外部的に分子構造の最初の世代がランダムに作られる。SMILESを使う利 点は、スピードと簡便さである。反対に文字列形式の欠点は、根拠のない分子、 あるいは存在し得ない分子は表せないということである。まずステップ40でN 個の分子を要求する。ステップ42では文字周期表44に入れられている特性あ るいはバイアスに従って疑似ランダム文字が選択されて、一度に一つの分子がS MILES言語で表現される。文字周期表44は自然界である化学物質が実際に 発生する周期で、化学周期表から選択される。各分子構造は、ブランクで隣の構 造から分離されている。その結果、文字周期表44は50,000種の化学物質 、約1,000,000種の文字とブランクを収納している。特にステップ42 では文字周期表44からランダムに一度に一個づつ文字が選択される。文字はブ ランクが選択されるまで続けられる。ブランクが選択されると一個の分子の終わ りを意味する。このように分子の文字とその長さがランダムに決定される。分子 一 個が決まったら、次へ進む。既知の分子に関するデータベースで見られる文字の 周期によってバイアスがかけられている。例えば有機分子の場合には、炭素を表 す文字”C”はきわめて頻繁に出現する。それは69%の確率であり、”N”に ついては11%、反対に”Z”については全く出現しない。この文字周期表を使 うと、根拠ある分子が進化するという確率が向上する。ステップ46で、ブラン クが検出されると、それまでの文字列はリスト48へ出力される。ステップ50 では、全体の分子群、すなわちN個の分子が決定される。サブプロセス12aは ステップ42、46そして50を繰り返してN個の分子が選択されるまで続けら れる。ステップ50で終了が確認できると、ステップ14に進む。ランダムに発 生させた文字列には時として根拠ある分子が出現するのは当然考えられる。しか しその場合でも、経験によれば30回から40回くらい、方法10を進化させる と次の世代からそれらの実行不可能な分子は消えて、根拠ある分子のみが残るこ とになる。 次に図2Bを参照する。ここでは 内部処理の分子グラフを使ってラン ダムな分子群を発生させている。このサブプロセス12bの特徴は、より根拠あ る分子を発生させる点にある。SMILES言語によって、サブプロセス12a によりランダムに発生させた初期分子群から方法10で進化させた分子群は、枝 や環状構造が抑えられている。しかし12bではグラフで表現されており、それ らの枝、環状構造に対するバイアスは加えられていない。この12bの場合は、 12aに比べて、より複雑で、SMILESに比べて時間がかかると言うことで ある。ステップ60でN個の初期分子群を作る要求を受けると、ステップ62で は元素も結合子も無い空の分子グラフをそれぞれ発生させる。次にステップ64 で疑似ランダム的に、元素と元素間の結合子から構成される”グラフ素子”とい うテーブル66からその分子グラフへ加える処理をする。この”素子”は、もっ とも簡単な進化すべく基本的な分子構成の構成素子で、ノードまたは元素、及び エッジまたは結合子を含んでいる。テーブル66には、自然界で出現するノード とエッジの割合か、それとも所望の特性を持った分子作り出す要望に従った一覧 表が作成されている。例えば元素OとCの間に二本線の結合子が入る確率は比較 的高く23%であり、これに反して元素Fと他のいかなる元素間に二重線結合子 が入る確率はゼロである。本実施例では、この”素子”を、”Pomana C ollege Medical Chemistry Data Base”、 Albert Leo作、Pomona College、Claremont CA.のテーブル66から選択している。もちろん他の分子データベースからで もテーブル66は作ることができる。 ステップ68では、現在作っている分子グラフが完成したかを判断する 。ステップ68ではパラメータが設定され、元素の数の最小値、最大値を例えば 2から20される。また元素あたりの結合子を例えば1.2とする。各分子を作 るために、ステップ68では最小値、最大値間の元素個数をランダムに選択し、 そして元素と結合子の要求値に合致しているかが判断される。もし合致していな ければ、サブプロセス12bは分子グラフが完成するまで、ステップ64、66 、68のループを繰り返す。ステップ68で分子グラフが完成したと判断すると 、ステップ70ではその分子グラフが根拠あるものかどうかが判断される。ステ ップ70ではその根拠有り無しの判断を、陽子、電子、そして電荷の点で、化学 法則を満足させるかどうかが判断される。しかしながら図1と4のステップ22 で行ったような、安定性や理論性については判断されない。もし根拠なしの分子 と判断されると、ステップ62に帰り新しい分子グラフを作り直す。ステップ7 0でその分子が根拠有りと判断されると、ステップ72においてその根拠有りの 分子グラフは、出力リスト74に加えられる。次にステップ76では、N個の分 子がランダムに作成されたかが判断される。もしまだならN個の分子が作成され るまで、ステップ62から76までサブプロセス12bが続けられる。そしてす べてが完成すると、出力リスト74は方法10の図1のステップ16へ戻る。分 子グラフを使うサブプロセス12bは、文字列を使う12aよりも効率がよいこ とが実証されている。サブプロセス12bは図9A−N、12AとB、13Aと Bで使用された。 ステップ12でN個の分子がランダムに作成されるか、ステップ28で N個の分子が次の世代に進化すると、方法10は図1のステップ18へ進む。こ こでは、それぞれの染色体、群または世代の分子が適合性関数によって評価され る。この評価課程の目的は、ある目的とする機能を最適化する分子構造を作り上 げることにある。進化論の用語では、これを適合性関数という。分子が進化する 上でこの適合性関数の主な目的は、対象となる分子または分子構造が、所望のま たは理論的な特性を有するかの数値評価をする事である。本実施例では、本発明 の方法10に適した適合性関数を図3A、B、C、D、E、F、Gで詳述する。 図1で示すように、方法10は分子の進化プログラムから独立したコンピュータ プログラムにより実行されるサブプロセスである、外部適合性関数のステップ1 8と簡便なインターフェースを設けている。各世代で、分子群はSMILES形 式で出力される。すなわち例えば5個の小さな分子は次のようになる。 CC(=O)OC CC(=O)OC CC(=O)NC CC(O)CC CC(N)C ステップ18の適合性関数は、各分子の適合性を数値評価により評価して、その 数値をSMILESに関係づける。すなわち CC(=O)OC −15.42 CC(=O)OC −15.42 CC(=O)NC 3.48 CC(O)CC −5.69 CC(N)C −0.21である。 ステップ28で行われる遺伝子アルゴリズムはミニマイザーであるので 、数値評価の小さな分子の方が大きな数値評価の分子より優れていると考えられ る。これは図3Dで述べる結合力適合関数に当然関連している。そこでは数値評 価はkcal/molの形式で表現されており、したがってマイナス数値がより 強力な結合力と判断される。また調整パラメータとして適合性要素を設けて、任 意の方法に適合性評価値を変換できる。例えばもし適合性要素がネガティブなら 、低いスコアへの大きな値が、よりよい評価とすることが出来る。 図3Aには、比較的簡単なステップが示されている。これが適合性関数 を実行するサブプロセス18aで、ここではある分子群の中の各分子と、すなわ ちオブジェクト分子と、与えられたターゲット分子の分子構造との類似性を判断 している。分子の類似性をベースとした適合性関数であるサブプロセス18aで は、ターゲット分子としてドパーミンが使われており、その分子構造は図9Aか らNの一連の世代を進化させるために、図9Lの左上端に掲載されている。サブ プロセス18aはステップ90からスタートして、そこでは分子の類似性をベー スとした適合性関数の要求を受け、そして与えられたターゲット分子を認識する 。次にステップ92では、ターゲット分子であるドパーミンを、あるサイズ例え ば8個の原子まで、ビット単位にコード化する。これはターゲット”指紋”96 として知られている。この”指紋”については、Clustering in Chemical Information Systems、Peter W illett著、Research Studio Press、Wile、N ew York、1987年、に記載されている。ステップ94では、同様にオ ブジェクト指紋98が現世代の各オブジェクト分子について作成される。ステッ プ100では、オブジェクト指紋とターゲット指紋の間で、距離または類似距離 の点で類似性があるかどうかが判断される。ここで使われているこの類似距離は 、分子構造をビット単位で表した下記のような、二値化Tanimoto距離で ある。 ここで、T(t,o)は、分子tとoについてのTanimoto類似度である 。 Ntはターゲット分子tの中にある構造数である。 Noはオブジェクト分子oの中にある構造数である。 Ncは分子tとoの共通する構造数である。 ステップ100では、距離値が出力される。ここでは0.0が、全く類似しない ことを意味し、1.0は完全な類似を意味する。各世代を遺伝子アルゴリズムで 進化させるステップ28で使用するために、このTanimoto類似度では、 適合性要素として−10.0を掛けてあり、これにより小さい値(すなわち最も マイナス値)が、よりよい適合性を意味するようになる。サブプロセス18aに 示す、類似性をベースとした適合性関数で求められた分子の各世代での距離は、 各世代の分子構造を示す図9A−Nに示されている。例えば、最初の世代である 図9Bに示す最初の世代における最も類似度が高い分子構造は、距離がわずか0 .1889である。この値はある分子構造の、ターゲット分子であるドパーミン からの相対的非類似度を表している。2距離が計算された後に、ステップ100 でその距離を出力リスト102へ出力する。次のステップ104では、その世代 にあるN個の各分子構造全部が”ターゲット指紋”96と比較されたかを判断し 、もし未だならサブプロセス18aは、引き続いてステップ92、94、100 、104のループを繰り返す。このようにステップではターゲット分子の”指紋 ”96を一回だけ計算すれば、それがステップ100である世代におけるオブジ ェクト指紋98と繰り返し比較される。その世代の各分子の距離がすべて計算さ れるっと、出力リスト102はステップ106に戻り、図1の進化方法10にお けるステップ24に進む。 ここで行われている類似性をベースとした適合性関数についてのサブプ ロセス18aによって、オブジェクト分子は既知のターゲット分子へ近づいて行 く。新規の分子構造に進化させる上で、ある限界はあるがこのサブプロセス18 aは、各分子の連続する世代を、より高い距離に従い進化させる遺伝子アルゴリ ズムの有用性を明らかにしている。ここで、より高いということは、一定の与え られた目的に向かって、分子構造が進化していることを意味する。図9Aから9 Nは、世代0、1、2、3、4、10、20、30、33、34、35、36、 37そして40における各分子群を表している。ここでターゲット分子は、ドパ ーミンであり、図9L、9M、9M、(つまり世代36、37、40)の左上端 に表示されている。それぞれの図は、類似スコアーと距離による適合値に従って 分類された各分子を含む分子構造群すべてを表している。適合値を理解するには 、芳香環(内部に引き込む円環)は、化学的には一本、二本の結合子による環と 同等である。この実施例では、図9Aにおける最初の分子群では、二つの元素で あるエサノールとエタンから成る一本の結合子だけで結合した分子のみで構成さ れている。この最初の分子群が再生成される際の効果を、次の図9Bに示す第一 世代で見ることが出来る。そこでは、3つの重い原子と二本結合子、つまりエセ ン と、また単純な分子、つまり水とアンモニアを持った分子が現れている。最初の 分子群はターゲット分子よりも、ずっと単純であるため、初期の進化は図9Bか ら9Eに見られるように、複雑になっていくのが特徴的である。図9FからHの 世代10、20、30で進化が進むにつれて、原子の置換分グループが進むだけ でなく、ドパーミン中の結合子が一本から二本へと変化する。図91の世代33 では、最初の芳香環が現れ、そして元うまく適合する素子を選びながら、図9J では最初の細胞分裂によっって増殖するようになる。図9Kの世代35では、3 つの素子からなる疑似環が潰れて、結果としてエリート素子となり距離値は0. 975という、大変よく適合する形態となる。図9Lの世代36でドパーミン自 体は最初に出現したにもかかわらず、それは少し適合しない素子による突然変異 の結果であり(つまり適合値0.875で分子中の炭素原子が削除された)、エ リート素子による突然変異が増加したためではない。ここで注意したいのは、ド パーミンが最初に現れた後、分子群の中にドパーミンが急激に増殖している間に も、この遺伝子アルゴリズムは高い多様性を保持している点である。図9Mから 9Nの世代37から40参照。このことは、前もって最適化の答えが解らない現 実の分子発見の問題では大変重要である。図9AからNの例では、パラメータは 、進化を促進させるようにセットされている。この方法では、適合する素子に向 けてバイアスを選択するだけで、すべての化学物質から特定の化学物質をランダ ムな方法ですばやく発見できるのは注目に値する。 次に図3Bを参照にして、ここではステップまたはサブプロセス18b について開示する。これは、サブプロセス18aでしたような、一つのターゲッ ト分子の指紋に対する類似性を決定する適合性関数ではなく、任意のターゲット 指紋に対する類似性を判断する。サブプロセス18bを含む進化方法10が繰り 返し実行されると、連続する分子の世代は、任意のターゲット指紋に画かれた分 子構造を持った新たな分子へと進化する。ステップ110で分子適合関数18b の要求を受けると、ステップ112では任意のターゲット指紋を翻訳してかつ記 憶する。サブプロセス18aに似た方法で、ステップ120はターゲット分子の 指紋を比較して、距離の類似性を基準にした適合値を算出する。ステップ120 で分子群内の各オブジェクト分子が比較された後、全体の適合値に関する出力リ スト122は、ステップ126で次のステップである進化方法10のレコーディ ングステップ24へ進む。 サブプロセス18bは、すでに述べたサブプロセス18aの変形である が、実際はサブプロセス18aを一般化したものである。サブプロセス18bは 、現存する他の方法では解決できない現実の問題を解決する上で有用な機能を有 する。その重要な点は、任意のターゲット指紋を選択できることである。ある分 子の指紋は通常、特定の分子に関する構造的な特徴を表すビットセットである。 分子が属する分類の、共通的な構造的特徴を表す特別な指紋を作り出すことは可 能である。これは”最頻度指紋”と呼ばれている。そのクラスに属するいろいろ な分子の指紋が検査されて、もし半分以上の指紋が同じビットセットを持ってい たら、特別な特徴を表す最頻度指紋として登録される。つまりそのクラスの半分 以上の分子がその特徴を持っている場合である。このように最頻度指紋は、その クラスでの共通的な特徴を表しており、現実の分子については、一致している場 合もあり、一致していない場合もある。ターゲットとして任意の最頻度指紋を用 いるサブプロセス18bによって、進化方法10が実行されると、この最頻度指 紋に類似した指紋を持った分子、あるいはオリジナルのクラスの特徴を持った分 子へと進化する。その結果、分子発見のために興味ある方法を提供する。 次に図3Cには、サブプロセス18cが開示されている。それは遺伝子 薬理学モデルとの適合性を計算するための適合性関数を、実行するためのもので ある。薬理学モデルは、三次元内のポイントと、それらのポイント間の結合子か ら構成されている。分子構造は一般に、結合性の点で原子パターンにより定義さ れる。つまりその定義は、三次元構造には依存しない。そのようなモデルは、既 知の特定の薬理学上の働きを持った分子から得ることが出来る。薬理学モデルの 特性に合致した新たな分子は、新薬開発上の候補となる。図3Cに述べる適合性 関数を使用すると、分子遺伝アルゴリズムはそのような薬理学特性に合致した新 たな分子を作り出す。 ニコチン アセチルコライン受容体についての遺伝子薬学モデルの例が 、”The Ensemble Approch to Distance G eometry:Application to the Nicotinic Pharmacophore”、R.P.Sheridan、R.Nilak antan、J.S.Dixon、and R.Venkataraghava n、J.Med.Chem.、29,899(1986)に掲載されている。こ こでは、3つの点が薬理学モデルを定義づけるのに重要であることが判明してい る。まず、陽イオンのセンター、つまり脂肪族窒素(A)、負電子原子、つまり ヒリドリン窒素またはカルボニン酸素(B)、Bと共に双極分子を形成する1ま たは複数の原子(C)、つまり芳香環またはカルボニール炭素である。このニコ チン薬理学モデルは、そのポイント、A、B、Cの間の距離が決められており、 その距離はオングストロングで表されており、4.8(A−B間)、4.0(A −C間)、1.2(B−C間)である。これらの定義に合致する構造を形成する 多くの分子は、ニコチン受容体について、作用薬または拮抗剤として実際に使用 されている。この薬理学モデルは、図3Cのデータオブジェクトについての例と してあげられる。すなわち、そのパターンの一セットは、それぞれが例えば脂肪 族窒素、ヒリドリン窒素のような対になった原子を含む複数のポイント、および この2ポイント間の距離を例えば4.8プラスマイナス0.05オングストロー ムに制限するバウンド(境界線)から構成されている。 このサブプロセス18cは、ステップ130で現分子群の分子リストに ついての薬理学適合性を要求することからスタートする。ステップ132で、各 分子をSMILES表現から反対に対応の分子グラフへ転換することで理解でき るように準備する。そしてその適合値を非常に低い値に初期設定する。ステップ 134で、136の記載された薬理学モデル中のパターンに対応する、分子のポ イントまたは原子を認識する。そして分子中で発見したすべてのコンビネーショ ンにわたり繰り返しループ処理が行われる。ニコチン薬理学モデルを例に採ると 、もしその分子で、2原子のマッチングパターンの組み合わせA(A’とA”と いう)、2原子のマッチングパターンB(B’とB”)、そして1原子のマッチ ングパターンC(C’)があると、ステップ134、138、140を含むルー プ処理は、それぞれのパターンにつき一度として、4回ループ処理することにな る。すなわち、A’B’C、A’B”C、A”B’C、そしてA”B”Cである 。例えば最初のループ処理で、その薬理学モデルは3つの遺伝子ポイントがある ため、 原子A’、B’、Cと適合し得る。二回目のループ処理では、A”、B’、Cが 試される。各ループ処理で、136に記載された薬理学定義のバウンド(境界線 )で定義された距離だけ、特定の原子が分離するような力が出るように構成され る。上述のSheridann et al資料に書かれているような方法で距 離の3次元構成がされる。適合性はバウンド(境界線)違反の回数を合計して、 一番低い値がベストな適合性とされる。その適合値は、ステップ142出出力リ スト144に出力される。ステップ146で、その分子群中のN個の分子が、す べて処理され他かどうかを判断する。もしすべて評価済みなら、図1に示す方法 10のレコーディングステップ24へ戻る。 薬理学適合関数で分子エデンアルゴリズムを操作した結果物は、三次元 的高速性を有した新規な分子群である。重要なのは遺伝子アルゴリズムに3次元 構造のデータを持たせずに行うという点である。単に外部の適合性関数だけが3 次元について関連するだけである。幾何学的な薬理学モデルに合致した分子は単 純な3次元の形式をゆうしている。以下により高度な例を開示する。 図3Dには、サブプロセス18dで薬剤と酵素または蛋白質との理論的 関連性を予見する適合性関数について述べられている。酵素または蛋白質と相互 関連を持つ薬品の有効性については、kcal/molの形式で表現される、薬 品と酵素間の予見される結合力の点で述べられている。結合サイト適合関数のサ ブプロセス18dの数値が低ければ低いだけ、進化した薬品分子はより効果的で あると予見される。特に、kcal/molのネガティブ値が大きければ、それ だけより強固な結合力が強く相性がよいことになる。まず酵素の結合サイトにつ いて、3次元表現で酵素モデルを作る必要がある。図10には、よく研究された 酵素であるジヒドロフォレーテ還元酵素(DHFR)の結合サイトに関する3次 元表現を示す。Brookhaven Protein Databank、1 992には、DHFR結晶構造に関するX線回折で得られたDHFR座標につい て述べられている。 サブプロセス18dは、現分子群の分子リストが推定される結合力適合 関数によって評価されるリクエストを受ける、ステップ150からスタートする 。ステップ150ではまた酵素のターゲト結合サイトの三次元表現に入る。サブ プ ロセス18dでは、酵素の結合サイトとしっかりと結合する薬品の分子構造を進 化させる。次のステップ152では、モデルまたは結合サイトの表現をデジタル データーに変換する。このデーターは、ステップ158によって現世代中の薬品 分子の分子構造と比較される。複雑な結合サイトが表面を決定する。その表面は 、オブジェクト分子が合致しなければならない受容体ボリュームを収納している 。これについては、Kunst et al.に各種のサイズを持つ球で受容体 ボリュームを定義づける方法について記載されている。図10には、各種の球1 70aからgが見られる。これらの球は、その受容体ボリューム内にしっかりと フィットして、その受容体ボリュームまたは結合サイトを定義づける。ステップ 152では、評価ステップ158で使用するために、結合サイトの記述154に ある部分電荷情報を追加生成する。結合サイトの記述154のデジタル表示を生 成するステップ152は、進化方法10を繰り返して実行する間に一回だけ実行 すれば足りる。 ステップ156では現世代の次のオブジェクト分子(薬品)を呼び出す 。このオブジェクト分子は、ステップ158で、ステップ152で生成された結 合サイトのデジタル記述を比較される。ステップ156では、個々の分子の表現 、すなわちSMILES表現を、ステップ158で使用するのに適したデーター へ変換する。ステップ158では、薬品分子と酵素分子が構造分析により比較さ れ、酵素分子の結合サイト記述154へその薬品分子が適合するかが判断される 。”Program 159:DGEOM”、Quantum Chemica l Program Exchange、Blaney、J.M.、Unive rsity of Indiana、Bloomington、IN(1990 )には本実施例で使われているDGEOMと呼ばれる距離測定方法を使った分子 構造の生成方法が述べられている。距離的な制約を受けながら、この距離測定方 法は他のファクターを考慮に入れながら構造的な最適化が出来るようになってい る。この他のファクターとは例えば、内部特性、水素結合、そして内部分子電磁 作用等である。ステップ158は、与えられた回数T、例えば20回、各分子の サンプル構成へランダムに繰り返し実行される。T回の実行時にステップ158 は、ランダムに3次元表現をつまり分子モデルを構成する。モデルの中の各原子 には、 3次元で表現された位置空間が与えられる。そのモデルは図10に示す球170 a−gで示されたように結合サイトに納められる。ステップ158は、適合値を Kcal/molの理論的結合エネルギー単位で計算する。それはそのモデルが どれだけ球170つまりステアリ酸形状に合致しているか、またモデル原子の電 荷と受容体分子の電荷間での電磁気相互作用、に基づいて計算される。予見結合 エネルギーはステップ158のT回のうちで、一番ネガティブ値が大きい値をベ ストな数値として取り入れられる。ステップ160では、ステップ158がT回 繰り返されたかを判断し、ステップ162では、インプッツ構造と結合エネルギ ーのベストな値を出力リストへ加える。ステップ166では現世代のN個のオブ ジェクト分子が結合エネルギー関数の対象になったかが判断される。その後、図 1の進化方法10の次のレコーディングステップ24へ、出力リストを戻す。 進化方法10の、特に結合エネルギー適応性についてのサブプロセス1 8dを使った場合の、効率性を判断するために、既知のよく知られた分子につい て結合エネルギーが推定されると共に、この方法10とサブプロセス18dによ りオブジェクト分子が既知の分子と結合する結合エネルギーを推定した。メトト レザト(MTX)はよく知られた化学療法剤であり、それはDHFRの複雑な結 合サイトとしっかりと結合することが知られている。図10で示すように、MT X分子169は、球170の中でしっかりと結合し、それはDHFR分子172 の受容体ポケットとなる。MTX分子169は、図10に示すように、テリダイ ン環システム169aを有している。図11AとBには、MTXモデル169と 球170a−bの2Xバンデルワールス表面をが見られる。DHFR分子172 は、図11AとBから除かれており、この図では、バンデルワールス表面で表さ れている。図11AとBでは、MTX分子169が、DHFR分子の結合サイト である鋭角に曲がっている部分169aを持ち、これによって球170a−g内 にしっかりと結合している。結合エネルギー適応関数についてのサブプロセス1 8dは、MTX分子169のバウンド(境界線)構造を作り上げて、また−47 kcal/molの結合エネルギーを予見した。分子間で観察される最も高い結 合エネルギーである。 進化方法10は、DHFR分子169と堅く結合する新たな分子を進化 させるために、結合エネルギー適合関数のサブプロセス18dを用いた。分子の 進化は、DHFR分子169をターゲットとして使い、8個の重い原子を含む2 0個の分子群から開始された。図12AとBに示す分子構造174は、結合エネ ルギー適合関数18fで進化させた非飽和のポリアミンであり、これは予見結合 エネルギーが−133kcal/molで第18世代に出現したものである。適 合値はステアリン酸型結合と電磁相互作用を含む。この構造174は、外表面と 球170で決まる内部結合ポケットの両方に非常にうまく適している。 次に図3Eには、molecules using Comparat ive Molecular Field Analysis(CoMFA)を 使って分子の結合を計算する適合関数のためのサブプロセス18eを示している 。CoMFAとは、既知の分子が仮説的受容体サイトにどのように結合するかの 3次元マップを作り出す方法である。この方法は、その結合サイトに結合する既 知の分子構造を作り出すことに基づいている。CoMFAは、その受容体を形成 する原子の3次元座標や受容休分子の特性を知らなくとも、仮説的な受容体に、 ある分子がどの程度うまく結合するかを予見するために使われる。CoMFAは 、2つの既存の技術の上に成り立っている。GRIDとPLS(Partial least squares)であり、前者は、分子について等しく離れたポイ ントでの排斥力に関するアルゴリズムであり、後者は、線形方程式のunder −determined setを結合させるアルゴリズムである。CoFMA の詳細については、米国特許5,025,388、Cramer et al記 載されている。これはここでも参照されている。関連事項として、CoMFAが 空間における分子場から成る配位子適合(格子ポイントでの値)のモデルと、そ の分子場に分子を整列させる方法を提供することである。これらの要素が、図3 Eのデータオブジェクト186として表現されているCoMFAモデルの記述を 構成している。CoMFAのサブプロセスが分子遺伝アルゴリズムと共に使われ ると、サブプロセス18eはCoMFA場に適合する新規な分子を生成する方法 を提供する。 オペレーションではサブプロセス18eは、与えられた3次元結合を最 適化する分子を生成するサブプロセス18cと18dで実行された適合関数のオ ペレーションと非常に類似している。サブプロセス18eは、現世代の分子のリ ストにCoMFA適合関数を用いることを要求するステップ180からスタート する。次にステップ182で、各分子をSMILES表現から反対に、対応する 分子グラフへ変換する。ステップ184、188から成るループが、ステップ1 90で決められた回数だけ実行される。各ループでは、ステップ184は図3C と3Dに示したサブプロセス18cと18dの幾何学的距離方法を使って、異な る構造を生成する。さらにステップ184では、その生成された構造をCoMF Aモデル記述186で定義された、CoMFAまたはGRIDと結合または配列 を行う。次にループのなかでステップ188が、分子回りの場を計算し、CoM FAモデルの場とその分子場の結合を評価する。この処理は、もしCoMFAモ デルが配列のための”Field Fit”法を指定すると少し異なり、配列は 場が比較されると同時に行われる。いずれの場合にも、適合性は残差の二乗の合 計をとり、これはCramer et al特許で説明されているように、Co MFA法のPLS部分で計算される。ステップ190ですべてのトライヤルが終 了すると、CoMFAモデルと一番うまく適合した分子構造、つまり一番低い残 差を持った分子構造が、ステップ192で出力リスト194へ加えられる。すね ての分子が評価されると、出力リスト194は図1記載の進化方法10のレコー ディングステップ24へ戻される。 上述したように、CoMFA適合性関数のサブプロセス18eは、もし 単純な配列ルールが無い場合には、薬理学適合性関数を使った18cや、結合子 適合性関数を使ったサブプロセス18dよりは効率がはるかに悪い。CoMFA 場を同時に配置し、そして化学的に妥当性ある構造に生成しながら同時に適合す る、3次元構造を発生させる幾何的距離ベースの方法は、ステップ184、18 8、190のような多くの構造をサンプルとして取り上げる必要性を減少または 削除することが出来る。今日まで、この試みは不成功に終わっていた。しかしな がらCoMFA分析と組み合わせた分子進化法は、他の方法が無い現在、新規な デザインのための凶器ある機会を提供する。 次に図3Fでは、結合エネルギー適合関数を実行するためのサブプロセ ス18fを開示している。ここでは、サブプロセス18dのように結合エネルギ ーを評価するのではなく、実際に各世代の分子を合成し、攻撃すべき酵素または 蛋白質との結合エネルギーを測定している。まずステップ210では、ある世代 中の各分子の結合エネルギーの要求がなされる。その後、ステップ212では、 一定のリスト中の各分子を合成する。ステップ214では、合成された分子を一 つづつ酵素サンプル216へ入れてみて、その分子の酵素に対する実際の結合エ ネルギーを試験してみる。ステップ218では、入力された構造をその測定され た結合定数を出力リスト220へ出力する。ステップ222では、与えられたリ スト中の各分子がすべて合成され、試験されたかを判断し、もしそうならステッ プ224では、出力リスト220を図1に示す進化方法10のレコーディングス テップ24へ戻す。このサブプロセス18fでは、そこでの結果は実測に基づい ており、ソフトウエアーによる適合関数でなされた近似法やエラーによるもので はない、という利点を有している。そしてここでは、実際の分子群を生成し、も し成功なら、ターゲット分子との結合は実証されている。 図Gには、適合性の合成を実行するサブプロセス18gを示す。それは 、1または複数の適合性関数から選択的に構成されている。例えば、図3Aから 3Fに示すサブプロセス18aから18fの適合性関数が使用される。サブプロ セス18gでは、図1の進化方法10は、上述の任意の適合関数に適合して分子 を単に最適化するだけでなく、他の適合関数との組み合わせである適合関数自体 を最適化する。これを合成適合関数という。以前の例に示したように、どの適合 関数も、いろいろな要素で構成することができる。例えば、薬理学適合関数では 図3Cのステップ138で実行されたように、バウンド(境界線)違反の合計で 構成されている。合成適合関数は、そのような要素適合関数とはそれらが独立し て稼働するのが保証されている点だけが異なる。合成適合関数では、いろいろな 特別関数を組み合わせて、所望の特性を有する分子群へ進化させる圧力を加える ことが出来る。そのような特別適合関数は、いろいろな特性を有する薬品を効率 的に作る薬品デザインに使用することが出来る。例えばサブプロセス18gでは 、各分子構造にいろいろな適合関数を連続的に実行することが出来る。図3で述 べた結合エネルギー関数に加えて、この合成適合関数はさらに特別な関数を加え て、所望の特性へ分子構造を進化させることが出来る。薬品デザインに関連して 、そ のような特別適合関数は、複雑さを低減させて分子をもっと効率的にし、即効性 あるものに出来る。さらに光酸化を軽減して薬品の有効期限を改善し、また水と 反応する加水分解を減らし、消化作用に対する抵抗を強めて口経剤用に薬品を改 善し、そして疎水性を最適化することでその分子を脂肪組織に強くして、所望の 核に移植出来るように改善できる。サブプロセス18gは、適合関数の数につい て分子リストの適合性の要求をステップ230で受ける。ステップ132は、リ ストにある各分子の適合性を初期化して、”セットされず”にする。このような 初期化は、要素適合関数のいくつかが、分子群中の1または複数の分子を処理で きないため必要である。ステップ234は、例えば図3Dステップ150のよう な適合関数236を要求する。要求された最初の適合関数を実行するサブプロセ ス18は、まず最初の部分的評価値を出すために実行される。ステップ238で は、その適合関数に対する部分的な適合値を測定し、それを出力リスト240に ある分子の要素適合値へ加える。その測定では、同一対象への他の異なる適合関 数の結果との相対的な重要性を調整することが必要である。これによって測定結 果を意味あるように加算出来る。ステップ242では、すべての適合関数が評価 されたかが判断される。もし未だなら、ステップ234と238が、他の異なる 適合関数236を使って繰り返される。もしすべての適合関数が評価されると、 出力リスト240は、図1の進化方法10のステップ24へ戻される。 合成適合関数のサブプロセス18gが有効であることを証明するために 、図12Aと12Bの分子構造174は、さらに追加の適合関数を使った合成適 合関数で進化させてある。この追加の適合関数は、分子中のnon−ring結 合子を最少化している。この際、各non−ring(非環)結合子に対して1 .0kcakl/molのペナルティーが課される。この機能は、図3Dの適合 関数18dへ図3Gの合成適合関数18gを使って加えられる。この追加した適 合関数の効果は、対象となる分子群に対し、環を含む分子群方向へバイアスを加 えることである。(多くの環を含む分子は環なしの分子に比べて構造的複雑性が 低い。つまり、もし両者が等しい結合サイトを持っていたとすると、多環性の分 子は、非環性の分子よりもはるかに少ない非結合構造を持ち、通常は結合が早い 。)この変更は、許容される分子の世界を低減させ、かつ幾何学的にまた電磁気 的に DHFR結合サイトに適合する多くの環を有する分子を設計するのをもっと困難 なものとする。これは、環システムの幾何学は鎖システムに比べて制限が多いた めに大変難しい問題である。 図13Aと13Bは、SGI Crimsonを11時間稼働させた後 、世代130で最初に出現した分子構造174’を示す。この分子174’では 、ほとんど完全に環構造で、6個の肪環式の環、27個の環結合子、18個の非 環結合子、を含む。それであっても、この分子174’は結合サイトにうまく適 合している。この分子174’の適合値は、−46.73であるが、それが合成 適応関数の結果であるため、結合エネルギー予測には完全には対応していない。 図12と13に示す進化した分子構造は、非常に難しくかつ複雑な機能 を最適化する分子形成のための進化方法10の能力を表している。合成適正関数 についてのサブプロセス18gの成功により、さらに追加の新規な関数を加える ことができる。それらの関数は、例えば可溶性、疎水性、合成機能等の追加所望 機能を持った分子を作り上げるのに使用することが出来る。 図4には、図1のサブプロセス22についての、下位フローチャートが 開示されている。このプロセスはオブジェクト分子が実行可能かどうかを判断す るためのものである。図1のステップ12で分子をランダムに生成させているた め、進化した分子の化学的合理性や実行可能性を判断する必要がある。これは、 たとえその分子群のすべての分子が、適正な電子を持ち、理論的可能性を有して いるという観点から有効であるとしても、なお必要である。この理由は、原子と 結合子の組み合わせのほとんどが、現実の世界では安定した分子ではないからで ある。さらに完全に孤立した分子といものは、実用的価値を持たないためである 。例えば薬品分野では、水とうまく反応しない分子は薬品の対象には不向きであ るからである。分子進化方法10においては、化学的合理性の評価は、適合関数 で非合理的な分子に対しては低い適合値を与えるだけで、理論的にこの評価はさ れている。実際には、適合関数での構造的評価を、分子の安定性に限定するのが 便利である。このアプローチは、使用される各適合関数にそのような評価機能を 、特別に付加する必要性を無くしている。 まずステップ250で、現世代のある分子の構造を一つづつ評価するリ クエストを受ける。テーブル254は、合理的な原子環境、つまり通常の原子価 の仮定、言い換えれば普通に見受けられる原子環境に基づくリストから構成され ている。ステップ252は、一度に一つづつ各原子を評価して、もし自然界で通 常見られない環境で発生した原子である場合には、その原子にペナルティーを課 している。ステップ252の最初に、合成スコアーからペナルティーポイントが 引かれる。ステップ256では、最後の原子が評価されたかを判断し、ステップ 258へ進む。同じように、ステップ258、264でもオブジェクト分子を評 価して、結合子と環の存在とサイズについて不合理な組み合わせに対してはペナ ルティーを加える。不合理な結合子を環に対するペナルティーは、それぞれステ ップ258、264で現すこあーに加えられる。ステップ268ですべての環が 評価し終え、そしてステップ264でペナルティースコアーが合計される。累計 されたペナルティースコアーはステップ270で図1の進化方法10のレコード ステップ24へ戻される。 図5には、図1に示す再生成のステップ28の詳細図である。すなわち 再生成ステップ28は、個々の適合度に基づきバイアスを掛けて、次の世代を生 成する手段である。連続して分子世代を進化させるため、相反する要素を持ちな がら、目的へ向かう必要がある。すなわち、望ましい特性は次世代へ受け継がれ なければならない。あう群の異なる複数の分子による相乗的な特性は、一体化さ れるようにしなければならない。新たな特徴は組み入れられなければならないし 、群の内部での融合性は合理的なレベルで維持されなければならない。そして、 望まない特性は削除されなければならない。現実の解決案としては、自然界(典 型的には、何千世代に渡り進化している幾百万種の動物の世界)で発見される割 合を越えて進化を加速させることが重要である。 まずステップ280で、現世代の分子を再生成または進化させるリタエ ストを受ける。ステップ282では、先の世代から次の世代へ、エリート分子を 変更せずに選択しコピーする。エリート分子の選択は、適合関数に関するサブプ ロセス18の各分子に与えられた数値により行う。先の世代のE番目のオブジェ クト分子が最高値を持っていることを見つける。ステップ284では、そのE番 目の分子をコピーする。現有する最上の特性は進化の世代で失われないように保 証されている。この実際の運用では、そのエリート分子のE番が、すべての群に コピーされる。図9、11AとB、12AとB、13AとBでは、エリート番号 は、1とセットされる。つまり各世代のベストだけがそのまま次の世代にコピー される。 次にステップ286では、クロン(無性生殖)方法かブリード(掛け合 わせ)方法かをテーブル288の頻度に従って選択する。その頻度は、調整可能 である。もしクロンが選択されると、再生成方法28はステップ290を処理す る。これは、ステップ292へ行く前に一つの親分子をコピーするか、その親か ら子分子をクロンする。もしステップ286でブリードが選択されると、ステッ プ290では同一でない2つの親分子を選択する。その選択された2つの親分子 はブリードされて一つの子分子を生成する。図7で後述するように、ブリードは 選択された親分子からその特性を選択して、それらを合併して子分子を作り上げ る。その子分子を次世代に加える前に、ステップ296は子分子の分子構造を突 然変異させる。図8で後述するように突然変異によって、選択された原子または 結合子は加えられたり、削除、変更されることがある。一つの分子が突然変異す ると、ステップ298はすべての分子が次の世代のために再生成されたかを判断 する。もし未だなら、サブプロセス28は、次の分子のためにステップ282へ 戻る。もしすべての分子が進化し終えたら、ステップ300は次の世代へその進 化した分子を渡す。 図6では、ステップ290’と290”に別れ、ステップ290”では 2つの親分子がブリードように選択され、ステップ290’ではただ一つの親が クロンように選択される。まずステップ310で、バイアスがかかった1親かそ れ以上の親の選択、現分子群の分子リスト、適合関数18で計算された関連の適 合値のリタエストを受ける。つぎにステップ312は、オブジェクト分子を適合 値に従い並べる。高いランクの分子は、最良の適合値を持った分子である。ステ ップ314では、確率テーブル315を作る。ここでは選択の確率が正常化した 分子のランクを均一化する。バイアスを掛けて選択するランキング法は、適合値 の数値の大きさは重要ではなく、単にランキングが重要である。適合値よりもラ ンキングが使用されるのは、適合値と所望の分子の持つ質は、必ずしも比例しな いからである。またランキングの方が、分子群が収束する際、比較的安定した選 択の要素となるからである。次にステップ316では、子分子がブリードされる かクロンされるかによって2または1個の親分子が確率テーブル315から選択 される。もし2個の親分子が選択されると、それらはお互いに排他的である。選 択された親分子は、ステップ318でステップ292またはステップ294へ送 られる。 図7には、ステップ294でブリードについてさらに詳述されている。 図7のブリードのステップは、外部表現には適さず、むしろデジタル化された分 子グラフに向いている。まずステップ320では、2個の親分子をブリードする 要求を受ける。ステップ322では、親分子の原子と原子の間にある結合子を、 ステップ324にセットされた消化レートに従って崩す。この消化レートが、各 親分子中の崩すべく結合子の割合を制御し、それは調整可能なパラメータである 。ステップ326では、崩した分子の破片の割合分または一部分をブリードの子 分子構造の中へ反映させる。この割合は、ステップ328で支配レートとしてセ ットされる。ステップ332では、フラグをセットする。このフラグが、分子の 破片が再編成されるかどうかを制御する。もし分離されたままの構造が、許され ていなければ、ステップ334は単一接続の分子を子分子として選択する。次に ステップ336では、ブリードされた子分子を出力リスト338へ加える。その 後ステップ340で、出力リスト338を次のステップである図5の突然変異ス テップ296へ戻す。 図8のサブプロセス296では、進化した子分子構造の突然変異につい て詳述されている。ブリードまたはクロンされた子分子の突然変異は、次の世代 のオブジェクト分子では相違点の中心である。再生成のステップ28では、分子 は分子グラフで表現されている。この分子グラフに対して、突然変異が直接作用 する。突然変異のステップ296は、単一のブリードされ又はクロンされた子分 子を単一の突然変異した子分子にする。最初にステップ350では、いろいろな 突然変異メカによってブリード又はクロンする要求を受ける。すなわち、ステッ プ364へ直接移り、突然変異しない処理、ステップ356で原子突然変異の処 理、ステップ362で原子削除の処理、ステップ360で原子移植の処理、そし てステップ362で結合子変更の処理等がある。一回の突然変異では、一つだけ の突然変異メカが使われる。それぞれの突然変異メカの確率レートが、確率テー ブル354にセットされる。このレートは、どんな種類の突然変異を望むのか、 またはどんなタイプのオブジェクト分子に進化させたいのか、に依存している。 ステップ350でリクエストを受け取ると、ステップ352は、突然変異メカテ ーブル354へアクセスして、確率レートのセットを決める。これらの確率レー トに従って、ステップ356、358、360、そして362から一つランダム に選択される。ステップ352は、ステップ356、358、360、362の いずれも選択せず従って、ブリードもクロンもせずに、そのまま突然変異無しで 次の世代へ受け渡される、という選択でもよい。原子を挿入するステップ356 では、新しい原子と結合子がランダムに選択されて、ブリード又はクロンの子分 子に加えられる。これはステップ66と同じように、原始周期表に納められてい る自然界での原子と結合子の割合に従って選択される。ランダムに選択された原 子は、現分子グラフ中のランダムに選択された原子に対して、ランダムに選択さ れた結合子で加えられる。原子削除のステップ358では、現分子グラフ中のラ ンダムに選択された原子から原子を削除する。変成突然変異のステップ360で は、現分子グラフの2つの原子をランダムに選択して、ランダムにその原子の特 性を換える。すなわちその原子を、CからNへ換える。結合子変更のステップ3 62では、現分子グラフ中の2つの原子の間にある既存の結合子は、結合子が作 られたり、削除されたり、修正されたりする。例えば、この結合子変更では、2 本の結合子から1本の結合子へ変更されることがある。図12AとB、図13A とBに示す分子は、突然変異メカテーブル354に収納されている確率レートを 選択して進化させたもので、原子挿入ステップ356、原子削除ステップ355 、原子変成突然変異ステップ360、の各確率をそれぞれ、0%(突然変異無し )、20%、20%、10%、50%に設定したものである。ステップ364で は、突然変異した分子が、図4で詳述したステップ22と同じように、実行可能 かがテストされる。最後にステップ366では、再生成され終わった子分子を次 世代へ入れるため戻される。 図1の再生成方法28は図5から8で詳述したように、いろいろな調整 用のパラメーターを有している。特に、エリート数284、生成方法の確率つま りステップ288のクロンとブリードの割合、消化レートつまりステップ324 の消化中の結合子が崩れる割合、ステップ328の支配レート、ステップ332 の非接続フラッグ、そしてステップ354の突然変異メカ確率、等である。数々 の適合関数をコンパチになるように調整パラメーターが多くあり、これによって すべての過程におけるレートを制御している。 実際には、非接続フラッグについてステップ332のセティングは、使 用される適合関数の性格に依存する。非接続構造は、もし適合関数が実施された ら無意味になるとか、実施できないとか、非接続(複合)分子つまり例えば溶剤 の可溶性を予見した適合関数である場合には、禁止されている。 ほとんどの環境下では、分子遺伝アルゴリズムの重要な目的は、出来る だけ効率的に受忍できる結果を出すことである。すなわち出来るだけ早急に結果 を出すことである。最後に、進化は次のようにパラメーターを設定すると、早く 処理が進む。非ゼロエリート値:1、ブリードとクロンの割合を中間値、つまり 50%対50%、消化レートを高く、つまり20%、支配レートを低く、つまり 0%、突然変異レートを高く、つまり0%の非稼働率、である。そのようなセッ ティングで、各世代間を構造的に大きくジャンプして、選択されたエリートで世 代から世代へ安定性が増大される。このようにすれば、進化は加速されるが、分 子群の多少の微調整は犠牲となる。適合関数が非常に早く、つまり計算能力が大 きい場合には、最良の妥協案は驚異的な加速処理をせずに、多くの分子群を使い 、クロン比を低く、つまり10%、低消化率、つまり5%、高支配レート、つま り30%、ずっと低い突然変異レート、つまり90%の突然変異無し、エリート 無し、つまりエリート数はゼロに設定することである。そのようなパラメーター を使用することで、分子進化はもっと自然進化に近づく。すなわちゆっくりと、 広範囲にできるが、計算時間はもっと必要になる。 本発明に関しては、この記述は単なる例示であり、発明の範囲は添付の 特許請求の範囲で判断されることに、ご注意いただきたい。

Claims (1)

  1. 【特許請求の範囲】 1.一連の分子群を連続的に生成することにより、所望の構造的特徴のセットを 有したターゲット分子を進化させる、一連のステップを繰り返し実行する方法で あって、当該一連の分子群は構造的特徴を持った複数の分子で構成し、当該一連 のステップは当該一連の分子群の次の分子群を生成し、当該一連のステップは、 a)当該一連の分子群と、当該所望の構造的特徴のセットを比較し、比 較した当該一連の分子群に対して、比較した当該一連の分子群と当該所望の構造 的特徴のセットがどれだけ近似しているかに依る評価数値を与えること、及び b)当該現行分子群の当該分子を当該評価数値により、当該次期分子群 に含ませて再生成すること、から構成するターゲット分子を進化させる方法。 2.ランダムに最初の一連の分子群を生成するステップをさらに加えた、請求項 1記載のターゲット分子を進化させる方法。 3.前記最初の一連の分子群は、前記a)ステップに従って、対応する評価数値 を作りだし、当該最初の一連の分子群は、前記b)ステップに従って、再生成さ れる、請求項2記載のターゲット分子を進化させる方法。 4.前記b)ステップは、前記b)ステップがさらに、再生成した分子を化学的 に安定しているかを評価するステップと、前記次期分子群に化学的に安定してい る当該再生成分子のみを入れるステップ、をさらに含む請求項1記載のターゲッ ト分子を進化させる方法。 5.前記評価のa)ステップは、現行分子群の各分子に対して、化学的安定性に ついての第二の評価数値を作りだし、第一と第二の評価数値を合計して合併評価 数値を作り出し、各分子の次期分子群を再生成する前記ステップb)が、当該合 併評価値に依存する、請求項4記載のターゲット分子を進化させる方法。 6.再生成のステップb)は、エリート分子の数値によって、現行分子群のエリ ート分子の数を選択して、当該エリート分子を次期分子群に入れる、請求項1記 載のターゲット分子を進化させる方法。 7.再生成のステップb)は、親分子の数値によって、現行分子群の親分子の数 を選択サブステップを含む、請求項1記載のターゲット分子を進化させる方法。 8.再生成のステップb)は、子分子が突然変異して次期分子群の子分子を提供 するサブステップを含む、請求項7記載のターゲット分子を進化させる方法。 9.前記選択のサブステップが、一つの親分子を選択し、この親分子からクロン された一の子分子を、次期分子群に含ませる、請求項8記載のターゲット分子を 進化させる方法。 10.再生成のステップb)は、2つの親分子を選択し、この2つの親分子がブ リードされた一つの子分子を、次期分子群に含ませる、請求項8記載のターゲッ ト分子を進化させる方法。 11.再生成のステップb)は、前記選択された2つの親分子が現行分子群の異 なる分子であることを確認するサブステップを含む、請求項10記載のターゲッ ト分子を進化させる方法。 12.ブリードのサブステップは、2つの親分子のそれぞれの一部を取り出して 、当該一部を結合して、次期分子群の新しい次期分子を生成する、請求項10記 載のターゲット分子を進化させる方法。 13.突然変異のサブステップは、ランダムに決めた特性を有する原子を取り出 し、当該原子をブリードされた子分子に加えて、当該子分子を次期分子群へ与え る第一のサブサブステップを含む、請求項8記載のターゲット分子を進化させる 方法。 14.突然変異のサブステップは、ランダムに一つの原子をブリードされた子分 子から選択し、当該原子を子分子の一つから削除する第二のサブサブステップを 含む、請求項8記載のターゲット分子を進化させる方法。 15.突然変異のサブステップは、ランダムに一つの原子をブリードされた子分 子から選択し、当該原子をランダムに選択した特性を有する原子と入れ替えて、 次期群のオブジェクト子分子を生成する第三のサブサブステップを含む、請求項 8記載のターゲット分子を進化させる方法。 16.突然変異のサブステップは、ランダムに二つの原子をブリードされた子分 子から選択し、当該二つの原子間の結合子をランダムに変更して次期分子群の子 分子を生成する第四のサブサブステップを含む、請求項8記載のターゲット分子 を進化させる方法。 17.再生成のステップb)は、一定の確率に従い現行分子群から子分子を選択 し、当該子分子が突然変異して次期分子群の子分子を提供するサブステップを含 む、請求項7記載のターゲット分子を進化させる方法。 18.突然変異のサブステップは、ランダムに決めた特性を有する原子を取り出 し、当該原子をブリードされた子分子に加えて、当該子分子を次期分子群へ与え る第一のサブサブステップを含む、請求項17記載のターゲット分子を進化させ る方法。 19.突然変異のサブステップは、ランダムに一つの原子をブリードされた子分 子から選択し、当該原子を子分子の一つから削除する第二のサブサブステップを 含む、請求項18記載のターゲット分子を進化させる方法。 20.突然変異のサブステップは、ランダムに一つの原子をブリードされた子分 子から選択し、当該原子をランダムに選択した特性を有する原子と入れ替えて、 次期群のオブジェクト子分子を生成する第三のサブサブステップを含む、請求項 19記載のターゲット分子を進化させる方法。 21.突然変異のサブステップは、ランダムに二つの原子をブリードされた子分 子から選択し、当該二つの原子間の結合子をランダムに変更して次期分子群の子 分子を生成する第四のサブサブステップを含む、請求項20記載のターゲット分 子を進化させる方法。 22.前記突然変異のサブステップは、現行分子群の親分子から第一、第二、第 三、第四、のサブサブステップの一つに従い子分子をブリードするための確率を 収納するテーブルを設け、当該テーブルから第一、第二、第三、第四、のサブサ ブステップの一つを選択し、現行分子群から選択した二つの親分子から子分子を ブリードして、次期分子群の子分子を提供するサブステップを含む、請求項21 記載のターゲット分子を進化させる方法。 23.前記比較ステップa)は、所望の特性セットをデジタル表現し、現行分子 群の分子構造ををデジタル表現し、そして両者を一つづつ比較して類似性を決定 するサブステップを含む、請求項1記載のターゲット分子を進化させる方法。 24.前記比較ステップa)は、所望の特性セットを分子構造の指紋に変換し、 現行分子群の分子構造ををデジタル表現し、そして両者を一つづつ比較してその 間の距離を決定するサブステップを含む、請求項1記載のターゲット分子を進化 させる方法。 25.前記所望の特性セットは、与えられたターゲット分子の分子構造である、 請求項24記載のターゲット分子を進化させる方法。 26.前記所望の特性セットは、関連する分子の属である、請求項24記載のタ ーゲット分子を進化させる方法。 27.前記属の分子特性を当該属の各分子が有しているかどうかを分析し、もし 共通の特性があれば、対応のビットをセットするステップをさらに含む、請求項 26記載のターゲット分子を進化させる方法。 28.前記b)ステップは、現行分子群の分子と所望の分子構造特性間の結合エ ネルギーを判断するための適合関数を実行し、当該所望の分子構造特性に従って 結合サイトのモデルを生成し、そして当該分子を所望の分子構造間の結合エネル ギーを判断するために確認分析を行うサブステップを含む、請求項1記載のター ゲット分子を進化させる方法。 29.前記結合サイトが受容体であり、前記モデルを生成するサブサブステップ は、当該受容体を入れる複数の球を生成し、当該複数の球をデジタル表現する、 サブサブステップを含む、請求項28記載のターゲット分子を進化させる方法。 30.前記確認分析のサブステップは、複数の球と現行分子群の各分子の分子構 造間の距離をランダムに測定し、確認分析のために測定値を生成するサブステッ プを含む、請求項29記載のターゲット分子を進化させる方法。 31.現行分子群の各分子は、各分子と結合する原子についての電荷から成り、 そしてモデルを生成するサブステップは、当該所望の特性セットに従い結合サイ トを形成する原子の電荷を定義づける、請求項28記載のターゲット分子を進化 させる方法。 32.前記確認分析のサブステップは、当該子分子の一つに関連する電荷と、結 合サイトの電荷かんの電磁相互作用を判断して対応の測定値を出す、請求項31 記載のターゲット分子を進化させる方法。 33.前記比較するステップa)は、現分子群の各分子のための実際の分子を合 成し、所望の特性セットを持つ実際のターゲットモデルのサンプルを導入し、合 成された分子とターゲット分子間の結合エネルギーを評価して、対応の測定値を 出す、請求項31記載のターゲット分子を進化させる方法。 34.前記比較するステップa)は、前記所望の特性セットと現分子群の各分子 間の適合値が、各分子に単一の適合値を提供するために決まっている適合関数を 少なくとも一つ実施することから成る、請求項1記載のターゲット分子を進化さ せる方法。 35.前記ステップa)は、現行分子群の各分子に、複数の適合関数を実行し、 当該適合関数は対応する所望の特性セットを持つ、請求項34記載のターゲット 分子を進化させる方法。 36.前記複数の分子に対して、適合関数を実施されると、部分的な適合値が得 られ、当該部分的適合値は現行分子群の各分子と結合される、請求項35記載の ターゲット分子を進化させる方法。 37.前記各適合関数の部分関数値は、共通ユニットの複数の適合関数から提供 された適合値を表すために評価される、請求項36記載のターゲット分子を進化 させる方法。 38.前記再生成のステップb)は、現行分子群の限られた分子からだけ、次群 の分子を提供する、請求項1記載のターゲット分子を進化させる方法。 39.前記各分子群は、一定の数の分子から構成されている、請求項1記載のタ ーゲット分子を進化させる方法。
JP7503663A 1993-06-30 1994-06-29 連続して分子群を進化させて、所望の特性を有する分子を設計する方法と装置 Pending JPH08512159A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/084,361 US5434796A (en) 1993-06-30 1993-06-30 Method and apparatus for designing molecules with desired properties by evolving successive populations
US08/084,361 1993-06-30
PCT/US1994/007453 WO1995001606A1 (en) 1993-06-30 1994-06-29 Method and apparatus for designing molecules with desired properties by evolving successive populations

Publications (1)

Publication Number Publication Date
JPH08512159A true JPH08512159A (ja) 1996-12-17

Family

ID=22184475

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7503663A Pending JPH08512159A (ja) 1993-06-30 1994-06-29 連続して分子群を進化させて、所望の特性を有する分子を設計する方法と装置

Country Status (9)

Country Link
US (1) US5434796A (ja)
EP (1) EP0708943B1 (ja)
JP (1) JPH08512159A (ja)
AT (1) ATE192863T1 (ja)
CA (1) CA2166397C (ja)
DE (1) DE69424427T2 (ja)
DK (1) DK0708943T3 (ja)
ES (1) ES2146653T3 (ja)
WO (1) WO1995001606A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015520674A (ja) * 2012-05-25 2015-07-23 ザ ユニヴァーシティー コート オブ ザ ユニヴァーシティー オブ グラスゴーThe University Court Of The University Of Glasgow 具現化された化学合成を含む進化的合成の方法
JPWO2020054840A1 (ja) * 2018-09-14 2021-08-30 富士フイルム株式会社 化合物構造の生成方法、化合物構造の生成プログラム、及び化合物構造の生成装置

Families Citing this family (130)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2012139C (en) * 1990-03-08 2004-01-13 Michael P. Teter Apparatus and method for predicting physical and chemical properties of materials
US5995908A (en) * 1990-09-20 1999-11-30 Margaret I. Pullen Integrated field modeling system
US5495423A (en) * 1993-10-25 1996-02-27 Trustees Of Boston University General strategy for vaccine and drug design
US5581657A (en) * 1994-07-29 1996-12-03 Zerox Corporation System for integrating multiple genetic algorithm applications
US5463564A (en) 1994-09-16 1995-10-31 3-Dimensional Pharmaceuticals, Inc. System and method of automatically generating chemical compounds with desired properties
US5740072A (en) * 1994-10-07 1998-04-14 The Trustees Of Columbia Universuty In The City Of New York Rapidly convergent method for boltzmann-weighted ensemble generation in free energy simulations
US5914891A (en) * 1995-01-20 1999-06-22 Board Of Trustees, The Leland Stanford Junior University System and method for simulating operation of biochemical systems
US6219622B1 (en) * 1995-03-24 2001-04-17 University Of Guelph Computational method for designing chemical structures having common functional characteristics
US5699268A (en) * 1995-03-24 1997-12-16 University Of Guelph Computational method for designing chemical structures having common functional characteristics
CA2217069A1 (en) * 1995-03-30 1996-10-03 Gregory M. Fahy Novel ice-controlling molecules and their applications
US6303388B1 (en) 1995-03-30 2001-10-16 Organ Recovery Systems, Inc. Process for preparing novel ice-controlling molecules
US6773877B2 (en) 1995-03-30 2004-08-10 Organ Recovery Systems, Inc. Methods of using ice-controlling molecules
US6341256B1 (en) * 1995-03-31 2002-01-22 Curagen Corporation Consensus configurational bias Monte Carlo method and system for pharmacophore structure determination
US5657255C1 (en) * 1995-04-14 2002-06-11 Interleukin Genetics Inc Hierarchic biological modelling system and method
EP0892963A1 (en) * 1996-01-26 1999-01-27 David E. Patterson Method of creating and searching a molecular virtual library using validated molecular structure descriptors
US6185506B1 (en) * 1996-01-26 2001-02-06 Tripos, Inc. Method for selecting an optimally diverse library of small molecules based on validated molecular structural descriptors
US6622094B2 (en) * 1996-02-15 2003-09-16 The Trustees Of Columbia University In The City Of New York Method for determining relative energies of two or more different molecules
JP2000507940A (ja) * 1996-03-22 2000-06-27 ユニバーシティー オブ グエルフ 共通の機能特性を有する化学構造をコンピューターによって設計する方法
US5835382A (en) * 1996-04-26 1998-11-10 The Scripps Research Institute Small molecule mimetics of erythropoietin
US5864633A (en) * 1996-05-17 1999-01-26 Therma-Wave, Inc. Method and apparatus for optical data analysis
US5989835A (en) 1997-02-27 1999-11-23 Cellomics, Inc. System for cell-based screening
US5946673A (en) * 1996-07-12 1999-08-31 Francone; Frank D. Computer implemented machine learning and control system
US5841947A (en) * 1996-07-12 1998-11-24 Nordin; Peter Computer implemented machine learning method and system
US6128607A (en) * 1996-07-12 2000-10-03 Nordin; Peter Computer implemented machine learning method and system
US5854992A (en) * 1996-09-26 1998-12-29 President And Fellows Of Harvard College System and method for structure-based drug design that includes accurate prediction of binding free energy
US6499022B1 (en) 1996-10-21 2002-12-24 Maxtor Corporation Method and apparatus for optimization of servo parameter values in a data storage device
US5781699A (en) * 1996-10-21 1998-07-14 Maxtor Corporation Method for optimization of channel parameters in a data storage device
AU732397B2 (en) 1996-11-04 2001-04-26 3-Dimensional Pharmaceuticals, Inc. System, method and computer program product for identifying chemical compounds having desired properties
US6571227B1 (en) * 1996-11-04 2003-05-27 3-Dimensional Pharmaceuticals, Inc. Method, system and computer program product for non-linear mapping of multi-dimensional data
US6453246B1 (en) 1996-11-04 2002-09-17 3-Dimensional Pharmaceuticals, Inc. System, method, and computer program product for representing proximity data in a multi-dimensional space
US5962669A (en) * 1997-06-02 1999-10-05 The Regents Of The University Of California Nucleic acid encoding prion protein variant
CA2287848A1 (en) 1997-06-02 1998-12-10 The Regents Of The University Of California Prion protein modulator factor (ppmf) and prion resistant animals
WO1998054665A1 (en) * 1997-06-02 1998-12-03 The Johns Hopkins University Computer method utilizing free energy calculations for ligand design and the prediction of binding targets
US6336107B1 (en) * 1997-07-31 2002-01-01 Matsushita Electric Industrial Co., Ltd Method and system of automatic arrangement of composing elements
EP1010094A4 (en) * 1997-09-03 2001-03-07 Commw Scient Ind Res Org MIXED SIGHTING SYSTEM
GB9720926D0 (en) 1997-10-03 1997-12-03 Molecular Sensors Ltd Intelligent control of nucleic amplification procedures including the polymerase chain reaction
US6051029A (en) * 1997-10-31 2000-04-18 Entelos, Inc. Method of generating a display for a dynamic simulation model utilizing node and link representations
US6078739A (en) * 1997-11-25 2000-06-20 Entelos, Inc. Method of managing objects and parameter values associated with the objects within a simulation model
US6069629A (en) * 1997-11-25 2000-05-30 Entelos, Inc. Method of providing access to object parameters within a simulation model
GB9803466D0 (en) * 1998-02-19 1998-04-15 Chemical Computing Group Inc Discrete QSAR:a machine to determine structure activity and relationships for high throughput screening
US5965352A (en) * 1998-05-08 1999-10-12 Rosetta Inpharmatics, Inc. Methods for identifying pathways of drug action
US6253168B1 (en) 1998-05-12 2001-06-26 Isis Pharmaceuticals, Inc. Generation of virtual combinatorial libraries of compounds
ATE357516T1 (de) * 1998-05-12 2007-04-15 Isis Pharmaceuticals Inc Modulation molekularer wechselwirkungspositionen in rns und anderen biomolekülen
EP1077993A4 (en) * 1998-05-12 2004-09-08 Isis Pharmaceuticals Inc GENERATION OF COMBINATORIAL LIBRARIES OF COMPOUNDS CORRESPONDING TO VIRTUAL LIBRARIES OF COMPOUNDS
US7117131B2 (en) * 1998-05-26 2006-10-03 Definiens Ag Method for characterizing a complex system
US6505180B1 (en) 1998-09-10 2003-01-07 Wm. L. Crowley & Associates, Inc. Information encoding and retrieval through synthetic genes
CA2346235A1 (en) * 1998-10-28 2000-05-04 Glaxo Group Limited Pharmacophore fingerprinting in qsar and primary library design
AU1615600A (en) * 1998-11-13 2000-06-05 Cellomics, Inc. Methods and system for efficient collection and storage of experimental data
WO2000039751A2 (en) * 1998-12-24 2000-07-06 Harvard University System and method for structure-based drug design that includes accurate prediction of binding free energy
WO2000043411A2 (en) * 1999-01-25 2000-07-27 Combimatrix Corporation Method for combinatorial materials development
US7912689B1 (en) * 1999-02-11 2011-03-22 Cambridgesoft Corporation Enhancing structure diagram generation through use of symmetry
US7295931B1 (en) * 1999-02-18 2007-11-13 Cambridgesoft Corporation Deriving fixed bond information
US20030220716A1 (en) * 1999-03-12 2003-11-27 Pharmix Corporation Method and apparatus for automated design of chemical synthesis routes
US6571226B1 (en) * 1999-03-12 2003-05-27 Pharmix Corporation Method and apparatus for automated design of chemical synthesis routes
EP1173814A2 (en) 1999-04-16 2002-01-23 Entelos, Inc. Method and apparatus for conducting linked simulation operations utilizing a computer-based system model
JP2004500614A (ja) * 1999-04-26 2004-01-08 ノヴァスクリーン バイオサイエンシズ コーポレーション レセプタ選択性マッピング
US20030083483A1 (en) * 1999-05-12 2003-05-01 Ecker David J. Molecular interaction sites of vimentin RNA and methods of modulating the same
US6969763B1 (en) 1999-05-12 2005-11-29 Isis Pharmaceuticals, Inc. Molecular interaction sites of interleukin-2 RNA and methods of modulating the same
CA2396495A1 (en) 2000-01-25 2001-08-02 Cellomics, Inc. Method and system for automated inference creation of physico-chemical interaction knowledge from databases of co-occurrence data
US7416524B1 (en) 2000-02-18 2008-08-26 Johnson & Johnson Pharmaceutical Research & Development, L.L.C. System, method and computer program product for fast and efficient searching of large chemical libraries
WO2001065462A2 (en) 2000-02-29 2001-09-07 3-Dimensional Pharmaceuticals, Inc. Method and computer program product for designing combinatorial arrays
US7039621B2 (en) 2000-03-22 2006-05-02 Johnson & Johnson Pharmaceutical Research & Development, L.L.C. System, method, and computer program product for representing object relationships in a multidimensional space
AU2001249805A1 (en) 2000-04-03 2001-10-15 3-Dimensional Pharmaceuticals, Inc. Method, system, and computer program product for representing object relationships in a multidimensional space
US6532076B1 (en) 2000-04-04 2003-03-11 Therma-Wave, Inc. Method and apparatus for multidomain data analysis
US6983233B1 (en) 2000-04-19 2006-01-03 Symyx Technologies, Inc. Combinatorial parameter space experiment design
US7356419B1 (en) 2000-05-05 2008-04-08 Cambridgesoft Corporation Deriving product information
US7272509B1 (en) 2000-05-05 2007-09-18 Cambridgesoft Corporation Managing product information
WO2001089560A1 (en) * 2000-05-24 2001-11-29 The Board Of Trustees Of The Leland Stanford Junior University Inhibitors of viral infection
CA2419600A1 (en) * 2000-08-22 2002-02-28 3-Dimensional Pharmaceuticals, Inc. Method, system, and computer program product for determining properties of combinatorial library products from features of library building blocks
JP2002082962A (ja) * 2000-09-08 2002-03-22 Hitachi Ltd エンジニアリングポータルサイトにおける情報提供方法
US6678619B2 (en) * 2000-09-20 2004-01-13 Victor S. Lobanov Method, system, and computer program product for encoding and building products of a virtual combinatorial library
WO2002044112A1 (fr) * 2000-11-30 2002-06-06 Toyo Suisan Kaisha, Ltd Procede de conception de la structure moleculaire d'un inhibiteur d'enzyme
WO2002048841A2 (en) * 2000-12-15 2002-06-20 Symyx Technologies, Inc. Methods and apparatus for designing high-dimensional combinatorial experiments
WO2002061419A1 (en) * 2001-01-29 2002-08-08 3-Dimensional Pharmaceuticals, Inc. Method, system, and computer program product for analyzing combinatorial libraries
US7043415B1 (en) * 2001-01-31 2006-05-09 Pharsight Corporation Interactive graphical environment for drug model generation
US20030032065A1 (en) * 2001-03-12 2003-02-13 Vince Hilser Ensemble-based strategy for the design of protein pharmaceuticals
EP1383799A4 (en) * 2001-04-10 2008-08-06 Transtech Pharma Inc PROBES, SYSTEMS AND METHODS FOR DISCOVERING MEDICAMENTS
AU2002344311A1 (en) * 2001-05-31 2002-12-09 The Regents Of The University Of California Analysis of macromolecules, ligands and macromolecule-ligand complexes
US7130747B1 (en) 2001-05-31 2006-10-31 Los Alamos National Security, Llc High throughput screening of ligand binding to macromolecules using high resolution powder diffraction
US20030093229A1 (en) * 2001-11-06 2003-05-15 Wang Ho Chris Meichung System and method for improved computer drug design
US20100305930A1 (en) * 2001-11-06 2010-12-02 Chris Meichung Wang Ho System and Method for Improved Computer Drug Design
US7801685B2 (en) * 2004-08-19 2010-09-21 Drug Design Methodologies, Llc System and method for improved computer drug design
US6907410B2 (en) * 2001-11-07 2005-06-14 Institute For Information Industry Transportation crew dispatch method based on single day business
US20030095151A1 (en) * 2001-11-20 2003-05-22 Shackleford J. Barry Real-time interactive adjustment of control parameters for a genetic algorithm computer
US20040002108A1 (en) * 2002-05-23 2004-01-01 Vince Hilser Predicting the significance of single nucleotide polymorphisms (SNPs) using ensemble-based structural energetics
DE10233022B4 (de) * 2002-07-20 2004-09-16 Zinn, Peter, Dr. Verfahren zur Lösung von Aufgaben der adaptiven Chemie
US20040254770A1 (en) * 2003-06-11 2004-12-16 Gilson Michael Kenneth Fast assignment of partial atomic charges
US20050143919A1 (en) * 2003-11-14 2005-06-30 Williams Robert E. Unified method and system for multi-dimensional mapping of spatial-energy relationships among micro and macro-events in the universe
US20050159900A1 (en) * 2003-11-21 2005-07-21 Pearlman Robert S. System and method for identifying structures for a chemical compound
EP1589463A1 (en) * 2004-04-21 2005-10-26 Avantium International B.V. Molecular entity design method
US20060229852A1 (en) * 2005-04-08 2006-10-12 Caterpillar Inc. Zeta statistic process method and system
US8364610B2 (en) 2005-04-08 2013-01-29 Caterpillar Inc. Process modeling and optimization method and system
US7565333B2 (en) * 2005-04-08 2009-07-21 Caterpillar Inc. Control system and method
US20060230018A1 (en) * 2005-04-08 2006-10-12 Caterpillar Inc. Mahalanobis distance genetic algorithm (MDGA) method and system
US20060229854A1 (en) * 2005-04-08 2006-10-12 Caterpillar Inc. Computer system architecture for probabilistic modeling
US20060229753A1 (en) * 2005-04-08 2006-10-12 Caterpillar Inc. Probabilistic modeling system for product design
US7877239B2 (en) * 2005-04-08 2011-01-25 Caterpillar Inc Symmetric random scatter process for probabilistic modeling system for product design
US8209156B2 (en) * 2005-04-08 2012-06-26 Caterpillar Inc. Asymmetric random scatter process for probabilistic modeling system for product design
US20060230097A1 (en) * 2005-04-08 2006-10-12 Caterpillar Inc. Process model monitoring method and system
US20070021947A1 (en) * 2005-07-22 2007-01-25 Honeywell International Inc. Model tuning system
US20070061144A1 (en) * 2005-08-30 2007-03-15 Caterpillar Inc. Batch statistics process model method and system
US7487134B2 (en) * 2005-10-25 2009-02-03 Caterpillar Inc. Medical risk stratifying method and system
US20070118487A1 (en) * 2005-11-18 2007-05-24 Caterpillar Inc. Product cost modeling method and system
US7499842B2 (en) 2005-11-18 2009-03-03 Caterpillar Inc. Process model based virtual sensor and method
US7505949B2 (en) * 2006-01-31 2009-03-17 Caterpillar Inc. Process model error correction method and system
US20070203810A1 (en) * 2006-02-13 2007-08-30 Caterpillar Inc. Supply chain modeling method and system
US8478506B2 (en) 2006-09-29 2013-07-02 Caterpillar Inc. Virtual sensor based engine control system and method
US7483774B2 (en) * 2006-12-21 2009-01-27 Caterpillar Inc. Method and system for intelligent maintenance
US20080154811A1 (en) * 2006-12-21 2008-06-26 Caterpillar Inc. Method and system for verifying virtual sensors
US7787969B2 (en) * 2007-06-15 2010-08-31 Caterpillar Inc Virtual sensor system and method
US7831416B2 (en) 2007-07-17 2010-11-09 Caterpillar Inc Probabilistic modeling system for product design
US7788070B2 (en) * 2007-07-30 2010-08-31 Caterpillar Inc. Product design optimization method and system
US7542879B2 (en) * 2007-08-31 2009-06-02 Caterpillar Inc. Virtual sensor based control system and method
US7593804B2 (en) * 2007-10-31 2009-09-22 Caterpillar Inc. Fixed-point virtual sensor control system and method
US8036764B2 (en) 2007-11-02 2011-10-11 Caterpillar Inc. Virtual sensor network (VSN) system and method
US8224468B2 (en) 2007-11-02 2012-07-17 Caterpillar Inc. Calibration certificate for virtual sensor network (VSN)
US20090114387A1 (en) * 2007-11-05 2009-05-07 Schlumberger Technology Corp. Methods for identifying compounds useful for producing heavy oils from underground reservoirs
WO2009111210A2 (en) * 2008-02-29 2009-09-11 Peak Value Sarl Data management system and method for pharmaceutical development
US20090293457A1 (en) * 2008-05-30 2009-12-03 Grichnik Anthony J System and method for controlling NOx reactant supply
US8086640B2 (en) * 2008-05-30 2011-12-27 Caterpillar Inc. System and method for improving data coverage in modeling systems
US7917333B2 (en) * 2008-08-20 2011-03-29 Caterpillar Inc. Virtual sensor network (VSN) based control system and method
US8793004B2 (en) 2011-06-15 2014-07-29 Caterpillar Inc. Virtual sensor system and method for generating output parameters
EP2795501A2 (en) * 2011-12-21 2014-10-29 Life Technologies Corporation Methods and systems for in silico experimental designing and performing a biological workflow
US20140180660A1 (en) * 2012-12-14 2014-06-26 Life Technologies Holdings Pte Limited Methods and systems for in silico design
US10430395B2 (en) * 2017-03-01 2019-10-01 International Business Machines Corporation Iterative widening search for designing chemical compounds
US10847254B2 (en) * 2017-12-05 2020-11-24 Toyota Research Institute, Inc. Artificial intelligence based stable materials discovery process
GB201805300D0 (en) * 2018-03-29 2018-05-16 Benevolentai Tech Limited Reinforcement Learning
WO2020167872A1 (en) * 2019-02-11 2020-08-20 Woodbury Neal W Systems, methods, and media for molecule design using machine learning mechanisms
US10515715B1 (en) 2019-06-25 2019-12-24 Colgate-Palmolive Company Systems and methods for evaluating compositions
WO2023055784A1 (en) * 2021-09-28 2023-04-06 D. E. Shaw Research, Llc Joint generation of a molecular graph and three-dimensional geometry

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58175077A (ja) * 1982-04-07 1983-10-14 Nippon Kagaku Gijutsu Joho Center 化合物の立体化学情報記憶方法及び装置
US4697242A (en) * 1984-06-11 1987-09-29 Holland John H Adaptive computing system capable of learning and discovery
JPS61223941A (ja) * 1985-03-29 1986-10-04 Kagaku Joho Kyokai 化学構造の検索方法
EP0213483B1 (en) * 1985-08-12 1994-07-13 Fuji Photo Film Co., Ltd. Method for processing information on chemical reactions
JPS6258331A (ja) * 1985-09-09 1987-03-14 Fuji Photo Film Co Ltd 化学反応情報の記録・検索方法
JPS6263335A (ja) * 1985-09-13 1987-03-20 Fuji Photo Film Co Ltd 化学反応情報の処理方法
US4908773A (en) * 1987-04-06 1990-03-13 Genex Corporation Computer designed stabilized proteins and method for producing same
US4881175A (en) * 1986-09-02 1989-11-14 Genex Corporation Computer based system and method for determining and displaying possible chemical structures for converting double- or multiple-chain polypeptides to single-chain polypeptides
US4704692A (en) * 1986-09-02 1987-11-03 Ladner Robert C Computer based system and method for determining and displaying possible chemical structures for converting double- or multiple-chain polypeptides to single-chain polypeptides
US4853871A (en) * 1987-04-06 1989-08-01 Genex Corporation Computer-based method for designing stablized proteins
US4852017A (en) * 1987-06-19 1989-07-25 Applied Biosystems, Inc. Determination of peptide sequences
US4939666A (en) * 1987-09-02 1990-07-03 Genex Corporation Incremental macromolecule construction methods
US4855931A (en) * 1988-03-25 1989-08-08 Yale University Stochastic method for finding molecular conformations
US4935877A (en) * 1988-05-20 1990-06-19 Koza John R Non-linear genetic algorithms for solving problems
US5148513A (en) * 1988-05-20 1992-09-15 John R. Koza Non-linear genetic process for use with plural co-evolving populations
US5343554A (en) * 1988-05-20 1994-08-30 John R. Koza Non-linear genetic process for data encoding and for solving problems using automatically defined functions
US4961152A (en) * 1988-06-10 1990-10-02 Bolt Beranek And Newman Inc. Adaptive computing system
US5025388A (en) * 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
US5008831A (en) * 1989-01-12 1991-04-16 The United States Of America As Represented By The Department Of Health And Human Services Method for producing high quality chemical structure diagrams
US5081584A (en) * 1989-03-13 1992-01-14 United States Of America Computer-assisted design of anti-peptides based on the amino acid sequence of a target peptide
US5235523A (en) * 1989-11-13 1993-08-10 The United States Of America As Represented By The Secretary Of Commerce Apparatus and methods for identifying and comparing lattice structures and determining lattice structure symmetries
WO1991014990A1 (en) * 1990-03-28 1991-10-03 Koza John R Non-linear genetic algorithms for solving problems by finding a fit composition of functions
US5048095A (en) * 1990-03-30 1991-09-10 Honeywell Inc. Adaptive image segmentation system
US5265030A (en) * 1990-04-24 1993-11-23 Scripps Clinic And Research Foundation System and method for determining three-dimensional structures of proteins
US5331573A (en) * 1990-12-14 1994-07-19 Balaji Vitukudi N Method of design of compounds that mimic conformational features of selected peptides
US5260882A (en) * 1991-01-02 1993-11-09 Rohm And Haas Company Process for the estimation of physical and chemical properties of a proposed polymeric or copolymeric substance or material

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015520674A (ja) * 2012-05-25 2015-07-23 ザ ユニヴァーシティー コート オブ ザ ユニヴァーシティー オブ グラスゴーThe University Court Of The University Of Glasgow 具現化された化学合成を含む進化的合成の方法
JPWO2020054840A1 (ja) * 2018-09-14 2021-08-30 富士フイルム株式会社 化合物構造の生成方法、化合物構造の生成プログラム、及び化合物構造の生成装置

Also Published As

Publication number Publication date
ATE192863T1 (de) 2000-05-15
EP0708943A4 (en) 1996-09-25
CA2166397C (en) 2000-03-21
WO1995001606A1 (en) 1995-01-12
DE69424427T2 (de) 2000-10-19
EP0708943B1 (en) 2000-05-10
ES2146653T3 (es) 2000-08-16
US5434796A (en) 1995-07-18
EP0708943A1 (en) 1996-05-01
CA2166397A1 (en) 1995-01-12
DK0708943T3 (da) 2000-10-02
DE69424427D1 (de) 2000-06-15

Similar Documents

Publication Publication Date Title
JPH08512159A (ja) 連続して分子群を進化させて、所望の特性を有する分子を設計する方法と装置
Hellinga et al. Construction of new ligand binding sites in proteins of known structure: I. Computer-aided modeling of sites with pre-defined geometry
Douguet et al. A genetic algorithm for the automated generation of small organic molecules: drug design using an evolutionary algorithm
Jones Genetic and evolutionary algorithms
Huey et al. Using AutoDock 4 with AutoDocktools: a tutorial
US6434542B1 (en) Statistical deconvoluting of mixtures
KR102296188B1 (ko) 화합물을 디자인하기 위한 방법 및 장치
HUE034642T2 (en) A method for selecting an optimized diverse population of variants
Rackovsky Quantitative organization of the known protein x‐ray structures. I. Methods and short‐length‐scale results
JP4543563B2 (ja) 統合データベースシステムにおける問合せ最適化方法
Qian et al. Integrating deep neural networks and symbolic inference for organic reactivity prediction
Ogata et al. A genetic algorithm based molecular modeling technique for RNA stem-loop structures
Benitez et al. Hierarchical parallel genetic algorithm applied to the three-dimensional HP side-chain protein folding problem
JP2016527481A (ja) 改善された治療リガンドの取得
WO2019235567A1 (ja) タンパク質相互作用解析装置及び解析方法
Sadowski et al. 3D structure generation and conformational searching
Plötz Advanced stochastic protein sequence analysis
JP2000507940A (ja) 共通の機能特性を有する化学構造をコンピューターによって設計する方法
Lee et al. Docking-based Multi-objective Molecular optimization Pipeline using Structure-constrained Genetic Algorithm
Valdés et al. Virtual reality high dimensional objective spaces for multi-objective optimization: An improved representation
Cofala In Silico Design of Drug-Like Molecules with Evolutionary Algorithms and Transformers
Wang New Methods for Protein Structure Prediction Using Machine Learning and Deep Learning
Qian Machine learning for drug discovery and beyond
Restrepo Spaces of mathematical chemistry
White et al. Report of the second international nomenclature workshop