JPH08512159A

JPH08512159A - 連続して分子群を進化させて、所望の特性を有する分子を設計する方法と装置

Info

Publication number: JPH08512159A
Application number: JP7503663A
Authority: JP
Inventors: デービッドワイニンガー
Original assignee: デイライトケミカルインフォメーションシステムズインク
Priority date: 1993-06-30
Filing date: 1994-06-29
Publication date: 1996-12-17
Also published as: ATE192863T1; EP0708943A4; CA2166397C; WO1995001606A1; DE69424427T2; EP0708943B1; ES2146653T3; US5434796A; EP0708943A1; CA2166397A1; DK0708943T3; DE69424427D1

Abstract

(57)【要約】分子構造の連続する分子群を進化させ、各分子群の進化した分子を、所望の物理的、理論的特性で評価する。初期分子群（１２、１４）は分子に番号が付けられている。評価は適合関数で行う（１６、１８）。その適合関数は、初期分子群と進化した分子の世代を、所望の特性セットで比較する。その結果、各構成に（２０、２２）数値評価または適合値を与える。数値評価は、所望の特性（２４、２６）に比較した分子構造が近似しているかを表示する。次の分子群は、適合値（２８）に合わせて分子群の一部の分子の構造を変更して形成される。そしてこのプロセスは、繰り返される（３０、１４）。進化が進むにつれて、適合性は向上する。この進化プロセスは、分子が許容範囲内になったときに終了する。

Description

【発明の詳細な説明】連続して分子群を進化させて所望の特性を有する分子を設計する方法と装置この特許出願の内容は著作権の対象とされる。特許庁で特許書類または記録として本特許出願書類または開示書類をコピーすることに関しては、異議を申し立てないが、それ以外の行為に関しては、すべての著作権を主張する。（発明の分野）本発明は、ある一定の数式または、物理的、化学的、生物学的、あるいは理論的な分子構造に合致する化学的分子構造を設計する方法と装置に関する。すなわちこれはいわゆる分子構造コンピュータ設計（ＣＡＭＤ）と言われる分野に関する。そして薬品開発に応用されると、いわゆる薬品コンピュータ設計と言われる。（添付コンピュータプログラム）添付のコンピュータプログラムには、１）以下に開示する方法と装置に関する本発明を実施するための”Ｇｒｏｋ”と呼ばれるプログラムと、２）関連する化学的機能に関する化学情報を開示する”ＤａｙｌｉｇｈｔＴｏｏｌｋｉｔＰｒｏｇｒａｍｍｅｒ’ｓＧｕｉｄｅ”の２種類で構成されている。本発明の譲渡人はこれらのプログラムに関し著作権を主張する。（発明の背景）特定の目的に対し適合する新規の化学物質を発見するために数々のアプローチが試みられっている。これらの方法論のほとんどは薬品の発見に関するものであるが、すべての化学分野についてもいろいろ存在する。例えば、農業化学、化学物質工業、燃料、香水、化粧品、写真、半導体、非線形光学等の分野である。化学物質を発見するここでの目的は、特定の化学反応性、生物学的特徴、あるいは化学、物理的な特性を有した一定の化学物質を発見することである。一般にいずれの方法も、満足いくものとは評価されていない。通常、化学物質を発見するには２つの方法があり、一つはランダムにスクリーニングする方法であり、もう一つは理論設計する方法である。このランダムスクリーニングの手法は、多種類の物質をすばやくスクリーニングして１または複数の主要物を発見し、その後のテストや理論設計による精製を行うという能力から構成されている。このランダムスクリーニングの欠点は、非常に経費がかかり、また成功の確率が低いということである。化学物質を開発している多くの企業でこのランダムスクリーニング手法が用いられているのは、歴史的に一番ベストであるという理由であり、問題ではあるが、それが唯一可能な手法というためである。このランダムスクリーニングによる実験は、実際は理論的でない部分が存在する。例えばスクリーニングされる化学物質は、実際には本当のランダムではなくある組成物の大きなグループを代表する物質にすぎない。一方、化学物質の理論設計は数々の化学物質の特性を、分子構造の点で理論化する能力に依存している。この目的のためにすでに１９３０年代から厳格なフレームワークが設定しようとする動きがあった。ＣｈｏｍｐｒｅｈｅｎｓｉｖｅＭｅｄｉｃａｌＣｈｅｍｉｓｔｒｙ、ＰｅｒｇａｍｏｎＰｒｅｓｓｐｌｃ社発行ＩＳＢＮ０−０８−０３７０６０−８、１９９０年、ＭｉｃｈａｅｌＳ．Ｔｒｕｅ氏による、”ＨｉｓｔｏｒｙａｎｄＯｂＪｅｃｔｉｖｅｓｏｆＱｕａｎｔｉｔａｔｉｖｅＤｒｕｇ”参照。この分野はＣｏｒｗｉｎＨａｎｓｃｈ氏によって開発された手法であるＱＳＡＲ（ＱｕａｎｔｉｔａｔｉｖｅＳｔｒｕｃｔｕｒｅ−ＡｃｔｉｖｉｔｙＲｅｌａｔｉｏｎｓｈｉｐ）の出現によって１９６０年代に急激に発展した。このＱＳＡＲによれば、化学分子の働きが、その機能的グループの位置関係および物理的パラメーターに十分関係づけられるようになった。そしてこの方向に沿って、さらに多くの開発が進められた。特にコンピュータグラフィックを応用したビジュアルな三次元構造で、この分野はいわゆる分子モデル化と呼ばれる分野になっている。ＣｏｍｐｒｅｈｅｎｓｉｖｅＭｅｄｉｃｉｎａｌＣｈｅｍｉｓｔｒｙ、第４巻ＱａｕｎｔｉｔａｔｉｖｅＤｒａｇＤｅｓｉｇｎ（１９９０）は、この分野の最近の状況について述べている。しかしながら一般的には、この手法によって開発されたのは、新規物質の発見というよりは分析技術である。新たな分子がどのように働くかを予想するために、多くの努力が払われている。すなわち主要な化学構造をさらに発展精製する多くの努力が払われてきた。しかしながらこの世の中に存在する多くの分子構造から新規な分子構造を生み出すという点では、ほとんど何もされないまま放置されてきたのが現状である。この新規物質を発見するという方法がほとんど存在しない理由として、この問題が大変難解であるという点が上げられる。例えばある特定の狭い範囲の化学物質に対しても、実に多種多様な分子構造が考えられるためである。現在はコンピュータにより物質の分子配列を設計する数々の手法が行われている。まずＤＯＣＫプログラムと呼ばれるものがある。これは”Ａｇｅｏｍｅｔｒｉｃａｐｐｒｏｃｈｔｏｍａｃｒｏｍｏｌｅｃｕｌｅ”Ｉ．Ｄ．Ｋｕｒｔｚ氏、Ｊ．Ｍ．Ｂｌａｎｅｙ氏、Ｓ．Ｊ.Ｏａｔｌｅｙ氏、Ｒ．Ｌａｎｇｒｉｄｇｅ氏、Ｔ．Ｅ．Ｆｅｒｒｉｎ氏、共著、Ｊ．Ｍｏｌ．Ｂｉｏｌ．，社、１６２，２６９（１９８２年）に詳述されている。またＧＲＯＷプログラムと呼ばれるものもある。これは”ＣｏｍｐｕｔｅｒＤｅｓｉｇｎｏｆｂｉｏａｃｔｉｖｅｍｅｌｅｃｕｌｅｓ：ａｍｅｔｈｏｄｆｏｒｒｅｃｅｐｔｏｒ−ｂｅｓｅｄｄｅｎｏｖｅｌｉｇａｎｄｄｅｓｉｇｎ”、Ｊ．Ｂ．Ｍｏｏｎ氏、Ｗ．Ｊ．Ｈｏｗｅ氏、共著、Ｐｒｏｔｅｉｎｓ：ｓｔｒｕｃｔ．Ｆｕｎｃｔ．Ｇｅｎｅｔ．、１１，３１４（１９９１年）に開示されている。さらにＬＵＤＩプログラムと呼ばれているものもある。これは”ＣｏｍｐｕｔｅｒｐｒｏｇｒａｍＬＵＤＩ：Ａｎｅｗｍｅｔｈｏｄｆｏｒｔｈｅｄｅｎｏｖｏ（新規な）ｄｅｓｉｇｎｏｆｅｎｚｙｍｅｉｎｈａｂｉｔｏｒｓ”、Ｈ．Ｊ．Ｂｏｈｍｅ氏、Ｊ．Ｃｏｍｐ．−ＡｉｄｅｄＭｏｌ。Ｄｅｓｉｇｎ、６，６１（１９９２年）に開示されている。ＤＯＣＫでは、分子の受け手であるｒｅｃｅｐｔｏｒまたは結合位置に対し、形状、電子静電特性が合致する分子をデータベースから選択するようになっている。そしてこの方法でいくつかの薬品発見プロジェクトにおいて、主要物質を発見することに成功している。ただしこのＤＯＣＫでは、化学構造についての予め決められたデーターベースに依存し、いわゆるｄｅｎｏｖｏデザインを行っている訳ではない。またＬＵＤＩでは、化学的断片情報、その化学的断片と受け手であるｒｅｃｅｐｔｏｒで補完的に自己学習するルール、およびｒｅｃｅｐｔｏｒまたは結合位置で合致する分子を組み立てる幾何学情報のデータベースを使用する。またＧＲＯＷでは、アミノ酸のデーターベースから結合位置へペプチードを集め、そのペプチードをしっかりと結合させることにより、数々の異なる酵素を生成することに成功している。これらの３種のアプローチは、現時点での最も野心的かつ成功したアプローチではある。しかしながらそれでもまだ十分ではなく、特定の分子結合位置での最適化を満足させるような化学合成を不便なく行う、分子のいわゆるｄｅｎｏｖｏデザインには至っていない。遺伝子アルゴリズムの手法は、高次元空間におけるグローバル最適化問題を解決するのに適した比較的新しい手法である。遺伝子アルゴリズムはジェットエンジンから競馬のハンディキャップを決めることまで広く応用されている。前者は、”ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＴｈｉｒｄＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＧｅｎｅｔｉｃＡｌｇｏｒｉｔｈｍｓ”、ＪａｍｅｓＤａｖｉｄＳｃｈａｆｆｅｒ氏編、ＭｏｒｇａｎＫａｕｆｍａｎｎＰｂｌｉｓｈｅｒｓ社発行、ＰＯＢ５０４９０、ＰａｌｏＡｌｔｏ、ＣＡ９４３０３−９９５３、ＩＳＢＮ１−５５８６０−０６６−３、１９８９年に記載されている。また後者については、”ＰｒｏｃｅｅｄｉｎｇｏｆｔｈｅＦｏｕｒｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＧｅｎｅｔｉｃＡｌｇｏｒｉｔｈｍｓ”、ＲｉｃｈａｒｄＫ．Ｂｅｌｏｗ氏編、ＭｏｒｇａｎＫａｕｆｍａｎｎＰｂｌｉｓｈｅｒｓ社発行、ＰＯＢ５０４９０、ＰａｌｏＡｌｔｏ、ＣＡ９４３０３−９９５３、ＩＳＢＮ１−５５８６０−２０８−９、１９９１年に記載されている。遺伝子アルゴリズムによる手法の背景にあるものは、進化のプロセスをシュミレーションすることにある。すなわち単純な自然に行われる取捨選択と遺伝的な一定メカニズムによるいわゆる進化は、環境を変えながら生物が生存し続けるという非常に難解問題を解くためによく見受けられる。実際にはこの問題は、お互いに競合しあう一定の個体群を形成しながら（これらがそれぞれ解決手段である）、再生産を繰り返し（一定の遺伝的なメカニズムに従って）新たなより良い個体群に向かって（つまり解決手段に向かって）進化している。これをある与えられた命題に応用しようとすると、まずその個体群を代表する一組の染色体を創造し、次に子孫がその親の特徴を保持し得る再生手段、そしてそのような進化を可能にさせる環境を作り上げなければならない。この点で２つの著書が遺伝子アルゴリズムを提供している。すなわち、ＨａｎｄｂｏｏｋｏｆＧｅｎｅｔｉｃＡｌｇｏｒｉｔｈｍｓ、ＬａｗｒｅｎｃｅＤａｖｉｓ編、ＶａｎＮｏｓｔｒａｎｄＲｅｉｎｈｏｌｄ社出版、ＩＳＢＮ０−４４２−００１７３−８、１９９１年、およびＧｅｎｅｔｉｃＡｌｇｏｒｉｔｈｍｓｉｎＳｅａｒｃｈ、Ｏｐｔｉｍｉｚａｔｉｏｎ、ａｎｄＭａｃｈｉｎｅＬｅａｒｎｉｎｇ、著者Ｄ．Ｅ．Ｇｏｌｄｂｅｒｇ氏、Ａｄｄｉｓｏｎ−Ｗｅｓｌｅｙ社出版、１９８９年である。正規の遺伝子アルゴリズムでは、生物の生命体と同様な固定サイズの染色体を操作している。従ってその用途は，固定サイズの溶剤上に遺伝子を配置するという問題，すなわち空間に一定数の元素を相対的な位置関係に配置するという問題のみに限定されてしまうことになる。この点より、正規の遺伝子アルゴリズムは、構造分析、蛋白質の連続配列、二次配列予測等の重要な化学問題解決には有用と考えられる。しかしながら従来の遺伝子アルゴリズムは、必ずしも新規な化学物質を発見するという命題にはむいていない。分子はいろいろな形状とサイズをしているため、生物をコード化する染色体ではうまく定義付けできない。従って結果として、遺伝子アルゴリズムは化学物質の新発見よりむしろ化学分析の諸問題解決にしか利用できない。（発明の要約）本発明の目的は、予め決められた物理的あるいは理論的特性を有する分子構造を設計する新規で改良された方法を提供することである。さらに本発明の別の目的は、所望の構造を有する分子群へ進化させる新規で改良された方法を提供することである。本発明は分子構造を連続的に進化させる方法と所望の物理的あるいは理論的特性と、進化したそれぞれ群の代表分子とを比較する方法に関連する。いくつかの構成分子の代表から成る代表分子が、初期分子構造群として最初に設定される。その後、初期分子構造群および進化した分子群と、所望の特性とを比較する適合度関数によって、比較評価がされる。これによってそれぞれの進化の過程にある分子群に対して、数値あるいは価値で適合度が算出される。この数値により、その代表分子が所望の特性にいかに近づいているかが判明する。適合度の数値によりその分子構造のある分子がその後変更されてさらに次の分子群が生成される。そしてこのプロセスが繰り返される。このようにして、より完全な適合度が得られるように分子群の一部がどんどん進化していく。そして代表分子が十分進化して満足いくレベルになった時にこのプロセスは終了する。本発明の他の面として、上記代表分子により構成されている初期分子構造群がランダムに生成される点にある。そして再生成された代表分子は、化学的に安定しているかどうかが判断され、もし安定していれば次の分子構造群へ組み込まれる。上記次の分子構造群はいろいろな遺伝的メカニズムによって現在の代表分子から再生成される。現分子構造群の代表分子から、あるいくつかの適合度の高いエリート分子が選択されて、次世代の分子構造群へ引き渡される。親の代表分子は、現分子構造群からその適合度により選択される。一つの親代表分子が選択されて、次世代の分子構造群に入れられる一つの子代表分子が再生成されていく、という無性繁殖が行われる。これとは別に、２つの親代表分子が選択されて次世代分子構造群に入れられる一つの子代表分子が生成されることもある。この生成過程では、それぞれの親代表分子の一部が選択されて、それらを合成して子代表分子が生成される。子代表分子はさらにその後、突然変異によっっても変化させられる。すなわち子代表分子の一つの元素が追加されたり削除されたりする。子代表分子の結合は変更されることがある。現分子構造群中の代表分子の適合度を決定するために、本発明に開示された、１又は２以上の適合度関数により所望の特性との比較が行われる。その所望の特性は関連する分子の類別の形式で表現されている。さらに他の適合度関数は現分子構造群中の代表分子に対して確認のための分析も行う。これによって個々の分子構造を構成する分子群と所望の特性を有する結合サイトのモデル間における結合エネルギーを決定することが出来る。さらにこの確認分析によって、各分子の電荷と結合サイトの電荷との間に生ずる電磁気的な相互関連性を決定し、対応する数値データを提供するようになっている。この適合度関数はさらに現分子構造群の代表分子に対して、実際の分子を合成し、かつ引き合わせる機能を有する。これによって、合成された個々の分子とターゲットとなる分子間の結合エネルギーを分析して対応する数値を得るようになっている。このように複数の適合度関数が現分子構造群の個々の代表分子に対して実行されて、ターゲト分子を所望の特性方向に進化させる。（図面の簡単な説明）本発明を実行する上で考えられるベストモード、およびこの発明を実行する方法に関する記載は、添付の図面にその実施態様が示されている。ここで目的行為を角張ったボックスに記載し、ステップ又はサブプロセスは角が丸いボックス、太線のボックスは追加のフローチャートでステップ又はサブプロセスが追加の図面で説明されていることを示す。図１は本発明のハイレベルでのフローチャートを示す。本発明は、連続する分子構造を進化させ、現分子群における各分子を適合性関数を使用して評価する。これによってある特定する分子が、予め設定された所望の物理的、又は理論的特性にいかに近いかを示す適合度の目安を得ることが出来る。本発明ではその後、その適合度の目安に従い次の分子構造群へさらに進化を続ける。図２ＡおよびＢは、図１に示すハイレベルフローチャート中のステップ１２で一般的に示す、初期分子構成を発生させる方法の代替案を示すローレベルでのフローチャートである。これによれば、線形表示法で特性を示す線分をランダムに発生させ、初期的な周期テーブルから求められるノードとエッジからランダムな図形を作り出すことが出来る。図３Ａ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆ、そしてＧは、図１に示すハイレベルフローチャート中のステップ１８で一般的に示す、与えられた現分子構造群中の各分子を、それぞれ適合関数を使用して評価する代替方法を示す。その適合関数は（Ａ）では、オブジェクト分子の各代表分子とターゲット分子の類似性を細かく比較し、（Ｂ）では、オブジェクト分子の各代表分子とターゲット分子のクラスの類似性を細かく比較し、（Ｃ）では、その分子と一定の薬物モデルとの適合性を比較し、（Ｄ）では、作ろうとする薬物のオブジェクト分子と、蛋白質および酵素の分子モデル間の理論的結合エネルギーを計算し、（Ｅ）では、分子場の誘導されたモデルに対する各分子の適合性を評価し、（Ｆ）では、合成した薬品の蛋白質または酵素の実際のサンプル上で合成された薬品の結合測定値を使い、（Ｇ）では、複数の適合性関数を一つの合成適合関数に合成するために、それぞれ使用される。図４は、図１に示すハイレベルフローチャート中のステップ２２で一般的に示す、与えられた現分子構造群が生育していく評価方法に関するローレベルフローチャートを詳述している。図５は、図１に示すハイレベルフローチャート中のステップ２８で一般的に示す、与えられた現分子が次世代の分子へ進化する方法に関する中間レベルでのフローチャートを詳述している。図６は、図５に示す中間レベルフローチャート中のステップ２９０で一般的に示す、生成されるべき親分子を選択する方法に関するローレベルフローチャートを詳述している。図７は、図５に示す中間レベルフローチャート中のステップ２９４で一般的に示す、一つの子分子を生成するための二つの親分子を作り出す方法に関するローレベルフローチャートを詳述している。図８は、図５に示す中間レベルフローチャート中のステップ２９６で一般的に示す、一つの元素を選択的に追加、削除、変更して、あるいはランダムに選択した元素間の結合を修正したりして、子分子を突然変化させる方法に関するローレベルフローチャートを詳述している。図９Ａ−Ｎは、それぞれ初期群、第１、２、３、４、１０、２０、３０、３３、３４、３６、そして４０代の連続する世代の表し、それぞれ図１に示し、かつ図３Ａの類似性に基づく適合性関数により進化している状態を示す。この場合、ターゲット分子はドーバミンであり、それぞれの図は単一世代の分子式を示す。図１０は、酵素であるシヒドロフォレーテ還元酵素（ＤＨＦＲ）と化学療法剤であるメトトレザト（ＭＴＸ）間の複合結合部位をドット表面で表した立体図である。このＭＴＸはＤＨＦＲと強く結びつくことで知られている（立体図は、特に必要ではないが、３次元図で見えるようにしている）。図１１ＡとＢは、それぞれＤＨＦＲとＭＴＸ薬の結合部位に関する外部正面図と切り口を表す。この図では、ファンデルワールス半径の２倍で表示されており、結合腔内の結合構造を表している。図１２ＡとＢは、それぞれＤＨＦＲとポリヤミンの結合部位に関する外部正面図と切り口を表す。これは、図３Ｄに示す結合力適合関数を使い、図１の進化方法で１８世代を経させたものである。図１３ＡとＢは、それぞれＤＨＦＲと多環式ポリヤミンの結合部位に関する外部正面図と切り口を表す。これは、図３Ｇに示す組成物適合関数を使い、図１の進化方法で１３０世代を経させたものである。（発明の詳細な説明）本発明では、一台または複数のコンピュータにロードされかつ実行されるコンピユータプログラムにより実施される。例えば、コンピュータはＳＧＩＣｒｉｍｓｏｎＲ４０００のような、ワークステーションが用いられる。本発明は、所望の物理的、理論的特性を有するいかなる化学物質の分子構造を決定するために使用する、強力な装置とその方法に関する。そして薬品設計のために使用される。まず特に図１に示すように、遺伝子アルゴリズムを使用して連続的に分子構造を進化させる方法のプログラムが開示されている。本発明では、それぞれの染色体、または群のメンバー、または世代が分子構造である。その進化過程のいくつかの世代が、図９Ａ−Ｎに示されている。図９のそれぞれが世代であり、分子構造の群を表している。この実施例では、各世代は２０個の分子構造から構成されているが、これ数は実施例により異なる。分子構造の各世代は、一度に１分子構造毎に所望の物理的、理論的特性を比較される。これにより各世代が、その所望の特性にいかに近いかを示す適合度の表示ないしはシグナルを得ることができる。本発明の方法では、特性を持つ分子構造は一定の数値で表されるように、所望の特性に十分近づくまで連続して進化が進む。特に第１図では、フィードバックの各１ループが一世代を表し、所望の特性が得られるまでループは続けられる。図１では、方法１０が分子構造の初期セットまたは群３０₀をランダムに発生させるステップ１２からスタートする。図９に示すように下付け番号は、分子構造の特定の群または世代に対して方法１０が実行された世代数または回数を意味する。図９Ａはその分子構造の初期セットまたは群３０₀を図示したものである。まずプログラム１０はステップ１６へ移動し、そこでは現在の群または世代中のそれぞれの分子構造を、所望の物理的、理論的特性と比較評価を行う。この評価には後で述べるように、適合性関数の１または複数の適合値を使用する。分子進化に有用な適合性関数の役割は、ある一定の特性と各々の分子構造を比較してその両者がどの程度適合しているかの数値評価を与えることにある。進化方法１０で、後のステップはこの数値評価によって容易に遂行できるようになる。さらにもし一つの適合性関数が一つの数値評価を与えられるとすると、複数の適合性関数が一つの群中の各分子構造を評価するために使用され得る。異なった適合性関数による数値評価は単に加算されて、合算された数値評価が図１の以後のステップで使用される。後で詳述するが、複数の適合性関数を使用することによって、対応する複数の特性セットに対してオブジェクト分子を進化させることができる。分子を発見する上で、適合性関数が優れているのは、それが単一価値を持っていることである。すなわち単一価値関数では、ある一つのインプットに対しては常に同じ結果を生じさせることにある。したがって適合度は単に分子構造にだけ依存して、それまでの進化過程や分子群には依存しない。この単一価値関数の長所は、新規の分子のみを適合数関数で評価すれば足りる点である。この点で単一価値関数は実行上大変便利であり、特定の分子構造はたった一回だけの評価で足りることになる。選択された適合性関数はステップ１８で外部で評価されるが、これによって本発明を実施する上で非常にフレクシブルな実行が可能となる。すなわち、まずステップ２０、２４、２６において使用されるコンピュータ言語は、通常ステップ１８の適合性関数で使用される言語とは異なる。以下に説明するように、これらの異なるステップ毎に、異なるコンピュータ言語が必要とされる。特に分子構造は、それぞれ異なる言語を必要とする異なるモデルによって表されている。例えば図３Ｃで述べられているサブプロセス１８Ｃでは、ステップ２０、２４、２８で分子図表で表現されているように、分子構造が薬理学的な記載で記載されるのが必要とされる。進化ステップ１６、２０、２４、２８は、ステップ１８で実行される特定の適合性関数から独立しており、実際には異なる適合性関数あるいは複数の適合性関数と一緒に、これらのステップが記載されているコンピュータ言語を変更することなく使用可能である。次にステップ１８が他のステップから独立しているため、コンピュータアチテタチャーがよりフレクシブルになることである。例えば、一つのコンピュータがステップ１６、２０、２４、２６を実行して、他の別の一つまたは複数のコンピュータがステップ１８用に使うことができる。特に適合性関数が複雑である場合には、それぞれ各分子または各分子構造毎に別々のコンピュータが使用でき、これらの複数のコンピュータを並列稼働させることが出来る。図３Ｆで述べるように、比較ステップではコンピュータにより必ずしも理論的に行われるのではなく、むしろまず分子構造が合成されてから、その適合性が測定される。プログラム１０は次にステップ２２に移り、ここでは現世代のそれぞれの分子構造が実際に存在可能かどうかが評価される。すなわちステップ２２では、その構成が現実の場で存在可能かあるいは安定的かどうかの程度が決定される。ステップ１８と同様にステップ２２では、評価された分子構造について安定度の数値評価がなされる。ステップ１８で得られた適合性評価値がステップ２２で得られた安定性評価値に加算されて、現世代での各分子構造の合算評価値が計算される。現世代における各分子構造の合算評価値と最高評価値の分子構造のからなるエリート経歴がメモリーに記憶される。次にステップ２６では、かの分子構造と合算評価値がＣＲＴに表示される。その表示内容は、図９の各図に示す内容で、一世代の分子構造と合算評価値の両者が表示される。次にステップ２８では、遺伝子アルゴリズムが計算されて、次世代の分子構造が生成される。自然界におけるように、合算評価値において所望の特性に一番近い分子構造が次世代に組み込まれていく。図５から８で詳しく述べるように、選択されたより高い評価の分子構造が次世代としてクロン（無性生殖）されるか、またはその分子構造の一部が相互にブリード（飼育）されて次世代の文書構造を形成する。これによりその次世代が現世代となり（データオブジェクト３０、１４間で矢印で示されている）。そして方法１０は次世代の分子を進化させ、これが繰り返される。この方法がさらに繰り返され、分子構造が十分高合算評価値を得て所望の特性を示すと思われるまで繰り返される。図１に関して述べたように、分子の連続する世代として進化させる方法にコンピュータを使用するには、分子とその構造をデジタル表示する必要がある。デジタル表示の第一の手法は、分子グラフエンコーディングとしてよく知られており、分子構造を操作、すなわち突然変異とステップ２８で行う交差による分子再生成には適している。しかしステップ１６と１８に示すようにプログラム間で適合性を評価しながら分子群のやり取りを行うには不向きである。その理由は、データ表現の特殊性に多く依存するからである。この分子グラフエンコーディングについては、その詳細は以下の文献を参照のこと。１）ＣｈｅｍｉｃａｌＳｔｒｕｃｔｕｒｅ２、ＷｅｎｄｙＡ．Ｗａｒｒ編、”ＧＥＭＩＮＩ、ａＧｅｎｅｒａｌｉｚｅｄＣｏｎｎｅｃｔｉｏｎＴａｂｌｅＬａｎｇｕａｇｅａｎｄｌｎｔｅｒｐｒｅｔｅｒ”ｂｙＤ．ＷｉｅｎｉｎｇｅｒａｎｄＡ．Ｗｅｉｎｉｎｇｅｒ、ＳｐｒｉｎｇｅｒＶｅｒｌａｇ社出版、ＩＳＢＮ３ −５４０−５６３６９−５（１９９３）、２）ＣｈｅｍｉｃａｌＩｎｆｏｒｍａｔｉｏｎＳｙｓｔｅｍｓ、ＢｅｙｏｎｄｔｈｅＳｔｒｕｃｔｕｒｅＤｉａｇｒａｍｓ、ｂｙＤ．ＢａｗｄｅｎａｎｄＥ．Ｍ．Ｍｉｔｃｈｅｌｌ、ＥｌｌｉｓＨｏｒｗｏｏｄ（Ｌｏｎｄｏｎ）、ＩＳＢＮ０−１３−１２６５８２−２（１９９０）。分子エンコーディングの第二の手法は、分子の対象が線形表記法すなわち印刷可能な文字で表現されている辞書的な形式で書かれているものである。これはＳＭＩＬＥＳ（ＳｍｐｌｉｆｉｅｄＭｏｌｅｃｕｌａｒＩｎｐｕｔＬｉｎｅＥｎｔｒｙＳｙｓｔｅｍ）と呼ばれ、詳細は”ＳＭＩＬＥＳａｃｈｅｍｉｃａｌｌａｎｇｕａｇｅａｎｄｉｎｆｏｒｍａｔｉｏｎｓｙｓｔｅｍ．Ｉ．Ｉｎｔｒｏｄｕｃｔｉｏｎｔｏｍｅｔｈｏｄｏｌｏｇｙａｎｄｅｎｃｏｄｉｎｇｒｕｌｅｓ”、Ｄ．Ｗｅｉｎｉｇｅｒ、Ｊ．Ｃｈｅｍ．Ｉｎｆｏ．Ｓｃｉ．、２８，３１（１９８８）に書かれている。本実施例の分子遺伝アルゴリズムでは、分子群のコミュニケーションとデータ保管には、ＳＭＩＬＥＳが使用されている。ＳＭＩＬＥＳは、コミュニケーションとデータ保管の点で、内部グラフエンコーディングよりも優れている。理由は、それがテキストの文字だけで構成されており、簡便に表示されて、かつマシーンから独立した分子の表記方法であるためである。この実施例では、上記分子グラフのデジタル表記により、内部の分子オブジェクトが表現されている。ＳＭＩＬＥＳは分子オブジェクトを辞書的な形式で表現している。ここでＳＭＩＬＥＳ言語には″ＳＭＩＬＥＳｉｎｔｅｒｐｒｅｔａｔｉｏｎ”として知られている内部オブジェクトへの変換プログラムがある。これによってここに記載されている適合性関数が実行されている。例えばサブプロセス９４、１１２、１３２等である。反対に内部形式からＳＭＩＬＥＳへの変換は、”ＳＭＩＬＥＳｇｅｎｅｒａｔｉｏｎ”があり、外部の処理過程あるいは記憶場所へのコミュニケーションに使用される。例えばステップ１６、２４では、分子構造はステップ１８、２６へ行く前にＳＭＩＬＥＳ形式に変換される。分子群のコミュニケーションを行うためにしっかりとルール付けされているＳＭＩＬＥＳを使うことで、単一の分子遺伝アルゴリズムがなにも変更せずに、１または複数の外部適合性関数を操作出来るようになる。例えばステップ１６、２０、２４、そして２８である。最初の形式である分子グラフエンコーディングは、内部での分子構造を表現するのに使用される。例えばステップ１６、２０、２４そして２８が分子グラフで表現されている。この分子グラフは複数のノード（ｎｏｄｅｓ）とエッジ（ｅｄｇｅｓ）から成り立っている。表現されたグラフはそれぞれ異なるノードとエッジを有している。分子グラフは、元素を表現するノードと（ノードには元素番号や電荷等の元素の特性を含む）、と結合子を表現するエッジ（結合子には結合子とその種類を含む）により表現されている。したがって分子グラフは分子の元素価モデルである。この分子グラフは通常は図９に図示されているように、 ”ＣＨ２”の用に文字表記されたノードと、元素を結ぶ一本線、二本線、三本線のような結合子で構成されている。分子グラフでは、ノードは必ずしも元素に限らない。ノードは例えばポリペプチド中のアミノ酸残基等の元素の集団も意味する。しかしすべての場合について、分子グラフにおけるノードは元素またはその分子を表す個性体を意味する。第二の形式であるＳＭＩＬＥＳは、プログラム間のコミュニケーション及び結果のアウトプット用に、分子を外部に表現するための方法が設けられている。分子の適合性評価がステップ１６、１８で行われるが、ここではＳＭＩＬＥＳ言語で表現されている。以下にＳＭＩＬＥＳについて簡単に説明する。ＳＭＩＬＥＳは分子を表現するために、スペースなしの直線的な文字列で表現される。これらの文字は以下に述べる５つの基本ルールに従って並べられる。ルール１は、元素は元素記号をカッコの中に入れて表す。例えば、基本的な鉛は、”［Ｐｂ］”で表現される。電荷や不規則な付属水素元素などはカッコの中へ入れる。例えば、ヒドロニュームイオンは”［ＯＨ３＋］”で表現される。元素Ｂ、Ｃ、Ｎ、Ｏ、Ｐ、Ｓ、Ｆ、Ｃｌ、ＢｒそしてＩは、それらが規則的な結合子を伴って最下位に位置する場合にはカッコは不要である。例えば、”Ｃ ”はメタンである。小文字でスタートする記号は、芳香性元素である。ルール２は、結合子は”−”（一本）、”＝”（二本）、”＃”（三本）、”：”（芳香性）を表す。例えば”Ｃ＝Ｏ”はホルムアルデヒドを表す。元素記号が並んでいる場合には、一本の結合子または芳香性結合子で結ばれている。例えば”ＣＯ”はメタノールである。ルール３は、枝の親元素の中にカッコで入れる。例えば”ＣＣ（＝Ｏ））”は酢酸である。枝は必要数だけ重ねることが出来る。例えば”ＣｌＣ（Ｃｌ）（Ｃｌ）Ｃｌ”は炭素四塩化物である。ルール４は、環状元素は対応のディジットを繰り返す。例えば”ＣＣＣＣＣＣ”は、ヘキサンを表す。”Ｃ２ＣＣＣＣＣ２”’は、シクロヘキサン、” Ｃｌｃｃｃｃｃｌ”はベンゼンを意味する。ルール５は、通常の結合子でない分子の一部分は、ペリオッド（非結合子）で表す。例えば”［Ｎａ＋］．［Ｏ−］ｃｌｃｃｃｃｃｌ”は塩化フェノックサイドを表す。以上のＳＭＩＬＥＳに関するルールで、大半の有機分子を表現できるし、また本発明を説明するには十分である。ＳＭＩＬＥＳの最も重要な特性は、文字列で分子を表現できるということである。まずバイアスがかかっていない連続する分子世代を進化させるには、ランダム分子群と呼ばれるランダムな集合からスタートすることが有用である。一般にランダム分子群からスタートする方が、所望の特性に近い特性を持つ分子群からスタートするよりも良い結果を生じさせる。これは目的物に対して、バイアスのかかりが少ないからである。方法１０は所望の含有物を分子構造に近い特徴または特性を持つ分子構造を選択し、それらを最初の世代に入れてから実行されてきた。もし類似する分子構造が含まれていると、進化構造はその類似分子に方へバイアスがかかる。一方、もし分子構造をランダムに発生させると、進化方法１０は、梳毛の特性に完全には適合しないが、もし最初の世代の中に所望の特性が入れてあれば得られないようなユニークな分子構造を創り出す。一般に、ランダムに最初の分子世代を選んだ方が、最初から所望の特性を入れておいた場合よりも、はるかに多様性ある分子構造が得られる。以下に述べるように、ランダムに発生させた最初の分子世代の分子構造は、現存する分子構造である必要はなく、また現実の世界に存在出来なくともよい。このランダム分子群を発生させるには、図２ＡとＢに述べるように、内部的にまた外部的に行うことが出来る。まず図２Ａに示すようにサブプロセス１２ａでは、ＳＭＩＬＥＳによって外部的に分子構造の最初の世代がランダムに作られる。ＳＭＩＬＥＳを使う利点は、スピードと簡便さである。反対に文字列形式の欠点は、根拠のない分子、あるいは存在し得ない分子は表せないということである。まずステップ４０でＮ個の分子を要求する。ステップ４２では文字周期表４４に入れられている特性あるいはバイアスに従って疑似ランダム文字が選択されて、一度に一つの分子がＳＭＩＬＥＳ言語で表現される。文字周期表４４は自然界である化学物質が実際に発生する周期で、化学周期表から選択される。各分子構造は、ブランクで隣の構造から分離されている。その結果、文字周期表４４は５０，０００種の化学物質、約１，０００，０００種の文字とブランクを収納している。特にステップ４２では文字周期表４４からランダムに一度に一個づつ文字が選択される。文字はブランクが選択されるまで続けられる。ブランクが選択されると一個の分子の終わりを意味する。このように分子の文字とその長さがランダムに決定される。分子一個が決まったら、次へ進む。既知の分子に関するデータベースで見られる文字の周期によってバイアスがかけられている。例えば有機分子の場合には、炭素を表す文字”Ｃ”はきわめて頻繁に出現する。それは６９％の確率であり、”Ｎ”については１１％、反対に”Ｚ”については全く出現しない。この文字周期表を使うと、根拠ある分子が進化するという確率が向上する。ステップ４６で、ブランクが検出されると、それまでの文字列はリスト４８へ出力される。ステップ５０では、全体の分子群、すなわちＮ個の分子が決定される。サブプロセス１２ａはステップ４２、４６そして５０を繰り返してＮ個の分子が選択されるまで続けられる。ステップ５０で終了が確認できると、ステップ１４に進む。ランダムに発生させた文字列には時として根拠ある分子が出現するのは当然考えられる。しかしその場合でも、経験によれば３０回から４０回くらい、方法１０を進化させると次の世代からそれらの実行不可能な分子は消えて、根拠ある分子のみが残ることになる。次に図２Ｂを参照する。ここでは内部処理の分子グラフを使ってランダムな分子群を発生させている。このサブプロセス１２ｂの特徴は、より根拠ある分子を発生させる点にある。ＳＭＩＬＥＳ言語によって、サブプロセス１２ａによりランダムに発生させた初期分子群から方法１０で進化させた分子群は、枝や環状構造が抑えられている。しかし１２ｂではグラフで表現されており、それらの枝、環状構造に対するバイアスは加えられていない。この１２ｂの場合は、１２ａに比べて、より複雑で、ＳＭＩＬＥＳに比べて時間がかかると言うことである。ステップ６０でＮ個の初期分子群を作る要求を受けると、ステップ６２では元素も結合子も無い空の分子グラフをそれぞれ発生させる。次にステップ６４で疑似ランダム的に、元素と元素間の結合子から構成される”グラフ素子”というテーブル６６からその分子グラフへ加える処理をする。この”素子”は、もっとも簡単な進化すべく基本的な分子構成の構成素子で、ノードまたは元素、及びエッジまたは結合子を含んでいる。テーブル６６には、自然界で出現するノードとエッジの割合か、それとも所望の特性を持った分子作り出す要望に従った一覧表が作成されている。例えば元素ＯとＣの間に二本線の結合子が入る確率は比較的高く２３％であり、これに反して元素Ｆと他のいかなる元素間に二重線結合子が入る確率はゼロである。本実施例では、この”素子”を、”ＰｏｍａｎａＣｏｌｌｅｇｅＭｅｄｉｃａｌＣｈｅｍｉｓｔｒｙＤａｔａＢａｓｅ”、ＡｌｂｅｒｔＬｅｏ作、ＰｏｍｏｎａＣｏｌｌｅｇｅ、ＣｌａｒｅｍｏｎｔＣＡ．のテーブル６６から選択している。もちろん他の分子データベースからでもテーブル６６は作ることができる。ステップ６８では、現在作っている分子グラフが完成したかを判断する。ステップ６８ではパラメータが設定され、元素の数の最小値、最大値を例えば２から２０される。また元素あたりの結合子を例えば１．２とする。各分子を作るために、ステップ６８では最小値、最大値間の元素個数をランダムに選択し、そして元素と結合子の要求値に合致しているかが判断される。もし合致していなければ、サブプロセス１２ｂは分子グラフが完成するまで、ステップ６４、６６、６８のループを繰り返す。ステップ６８で分子グラフが完成したと判断すると、ステップ７０ではその分子グラフが根拠あるものかどうかが判断される。ステップ７０ではその根拠有り無しの判断を、陽子、電子、そして電荷の点で、化学法則を満足させるかどうかが判断される。しかしながら図１と４のステップ２２で行ったような、安定性や理論性については判断されない。もし根拠なしの分子と判断されると、ステップ６２に帰り新しい分子グラフを作り直す。ステップ７０でその分子が根拠有りと判断されると、ステップ７２においてその根拠有りの分子グラフは、出力リスト７４に加えられる。次にステップ７６では、Ｎ個の分子がランダムに作成されたかが判断される。もしまだならＮ個の分子が作成されるまで、ステップ６２から７６までサブプロセス１２ｂが続けられる。そしてすべてが完成すると、出力リスト７４は方法１０の図１のステップ１６へ戻る。分子グラフを使うサブプロセス１２ｂは、文字列を使う１２ａよりも効率がよいことが実証されている。サブプロセス１２ｂは図９Ａ−Ｎ、１２ＡとＢ、１３ＡとＢで使用された。ステップ１２でＮ個の分子がランダムに作成されるか、ステップ２８でＮ個の分子が次の世代に進化すると、方法１０は図１のステップ１８へ進む。ここでは、それぞれの染色体、群または世代の分子が適合性関数によって評価される。この評価課程の目的は、ある目的とする機能を最適化する分子構造を作り上げることにある。進化論の用語では、これを適合性関数という。分子が進化する上でこの適合性関数の主な目的は、対象となる分子または分子構造が、所望のまたは理論的な特性を有するかの数値評価をする事である。本実施例では、本発明の方法１０に適した適合性関数を図３Ａ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆ、Ｇで詳述する。図１で示すように、方法１０は分子の進化プログラムから独立したコンピュータプログラムにより実行されるサブプロセスである、外部適合性関数のステップ１８と簡便なインターフェースを設けている。各世代で、分子群はＳＭＩＬＥＳ形式で出力される。すなわち例えば５個の小さな分子は次のようになる。ＣＣ（＝Ｏ）ＯＣＣＣ（＝Ｏ）ＯＣＣＣ（＝Ｏ）ＮＣＣＣ（Ｏ）ＣＣＣＣ（Ｎ）Ｃステップ１８の適合性関数は、各分子の適合性を数値評価により評価して、その数値をＳＭＩＬＥＳに関係づける。すなわちＣＣ（＝Ｏ）ＯＣ −１５．４２ＣＣ（＝Ｏ）ＯＣ −１５．４２ＣＣ（＝Ｏ）ＮＣ３．４８ＣＣ（Ｏ）ＣＣ −５．６９ＣＣ（Ｎ）Ｃ −０．２１である。ステップ２８で行われる遺伝子アルゴリズムはミニマイザーであるので、数値評価の小さな分子の方が大きな数値評価の分子より優れていると考えられる。これは図３Ｄで述べる結合力適合関数に当然関連している。そこでは数値評価はｋｃａｌ／ｍｏｌの形式で表現されており、したがってマイナス数値がより強力な結合力と判断される。また調整パラメータとして適合性要素を設けて、任意の方法に適合性評価値を変換できる。例えばもし適合性要素がネガティブなら、低いスコアへの大きな値が、よりよい評価とすることが出来る。図３Ａには、比較的簡単なステップが示されている。これが適合性関数を実行するサブプロセス１８ａで、ここではある分子群の中の各分子と、すなわちオブジェクト分子と、与えられたターゲット分子の分子構造との類似性を判断している。分子の類似性をベースとした適合性関数であるサブプロセス１８ａでは、ターゲット分子としてドパーミンが使われており、その分子構造は図９ＡからＮの一連の世代を進化させるために、図９Ｌの左上端に掲載されている。サブプロセス１８ａはステップ９０からスタートして、そこでは分子の類似性をベースとした適合性関数の要求を受け、そして与えられたターゲット分子を認識する。次にステップ９２では、ターゲット分子であるドパーミンを、あるサイズ例えば８個の原子まで、ビット単位にコード化する。これはターゲット”指紋”９６として知られている。この”指紋”については、ＣｌｕｓｔｅｒｉｎｇｉｎＣｈｅｍｉｃａｌＩｎｆｏｒｍａｔｉｏｎＳｙｓｔｅｍｓ、ＰｅｔｅｒＷｉｌｌｅｔｔ著、ＲｅｓｅａｒｃｈＳｔｕｄｉｏＰｒｅｓｓ、Ｗｉｌｅ、ＮｅｗＹｏｒｋ、１９８７年、に記載されている。ステップ９４では、同様にオブジェクト指紋９８が現世代の各オブジェクト分子について作成される。ステップ１００では、オブジェクト指紋とターゲット指紋の間で、距離または類似距離の点で類似性があるかどうかが判断される。ここで使われているこの類似距離は、分子構造をビット単位で表した下記のような、二値化Ｔａｎｉｍｏｔｏ距離である。ここで、Ｔ（ｔ，ｏ）は、分子ｔとｏについてのＴａｎｉｍｏｔｏ類似度である。Ｎｔはターゲット分子ｔの中にある構造数である。Ｎｏはオブジェクト分子ｏの中にある構造数である。Ｎｃは分子ｔとｏの共通する構造数である。ステップ１００では、距離値が出力される。ここでは０．０が、全く類似しないことを意味し、１．０は完全な類似を意味する。各世代を遺伝子アルゴリズムで進化させるステップ２８で使用するために、このＴａｎｉｍｏｔｏ類似度では、適合性要素として−１０．０を掛けてあり、これにより小さい値（すなわち最もマイナス値）が、よりよい適合性を意味するようになる。サブプロセス１８ａに示す、類似性をベースとした適合性関数で求められた分子の各世代での距離は、各世代の分子構造を示す図９Ａ−Ｎに示されている。例えば、最初の世代である図９Ｂに示す最初の世代における最も類似度が高い分子構造は、距離がわずか０．１８８９である。この値はある分子構造の、ターゲット分子であるドパーミンからの相対的非類似度を表している。２距離が計算された後に、ステップ１００でその距離を出力リスト１０２へ出力する。次のステップ１０４では、その世代にあるＮ個の各分子構造全部が”ターゲット指紋”９６と比較されたかを判断し、もし未だならサブプロセス１８ａは、引き続いてステップ９２、９４、１００、１０４のループを繰り返す。このようにステップではターゲット分子の”指紋 ”９６を一回だけ計算すれば、それがステップ１００である世代におけるオブジェクト指紋９８と繰り返し比較される。その世代の各分子の距離がすべて計算されるっと、出力リスト１０２はステップ１０６に戻り、図１の進化方法１０におけるステップ２４に進む。ここで行われている類似性をベースとした適合性関数についてのサブプロセス１８ａによって、オブジェクト分子は既知のターゲット分子へ近づいて行く。新規の分子構造に進化させる上で、ある限界はあるがこのサブプロセス１８ａは、各分子の連続する世代を、より高い距離に従い進化させる遺伝子アルゴリズムの有用性を明らかにしている。ここで、より高いということは、一定の与えられた目的に向かって、分子構造が進化していることを意味する。図９Ａから９Ｎは、世代０、１、２、３、４、１０、２０、３０、３３、３４、３５、３６、３７そして４０における各分子群を表している。ここでターゲット分子は、ドパーミンであり、図９Ｌ、９Ｍ、９Ｍ、（つまり世代３６、３７、４０）の左上端に表示されている。それぞれの図は、類似スコアーと距離による適合値に従って分類された各分子を含む分子構造群すべてを表している。適合値を理解するには、芳香環（内部に引き込む円環）は、化学的には一本、二本の結合子による環と同等である。この実施例では、図９Ａにおける最初の分子群では、二つの元素であるエサノールとエタンから成る一本の結合子だけで結合した分子のみで構成されている。この最初の分子群が再生成される際の効果を、次の図９Ｂに示す第一世代で見ることが出来る。そこでは、３つの重い原子と二本結合子、つまりエセンと、また単純な分子、つまり水とアンモニアを持った分子が現れている。最初の分子群はターゲット分子よりも、ずっと単純であるため、初期の進化は図９Ｂから９Ｅに見られるように、複雑になっていくのが特徴的である。図９ＦからＨの世代１０、２０、３０で進化が進むにつれて、原子の置換分グループが進むだけでなく、ドパーミン中の結合子が一本から二本へと変化する。図９１の世代３３では、最初の芳香環が現れ、そして元うまく適合する素子を選びながら、図９Ｊでは最初の細胞分裂によっって増殖するようになる。図９Ｋの世代３５では、３つの素子からなる疑似環が潰れて、結果としてエリート素子となり距離値は０．９７５という、大変よく適合する形態となる。図９Ｌの世代３６でドパーミン自体は最初に出現したにもかかわらず、それは少し適合しない素子による突然変異の結果であり（つまり適合値０．８７５で分子中の炭素原子が削除された）、エリート素子による突然変異が増加したためではない。ここで注意したいのは、ドパーミンが最初に現れた後、分子群の中にドパーミンが急激に増殖している間にも、この遺伝子アルゴリズムは高い多様性を保持している点である。図９Ｍから９Ｎの世代３７から４０参照。このことは、前もって最適化の答えが解らない現実の分子発見の問題では大変重要である。図９ＡからＮの例では、パラメータは、進化を促進させるようにセットされている。この方法では、適合する素子に向けてバイアスを選択するだけで、すべての化学物質から特定の化学物質をランダムな方法ですばやく発見できるのは注目に値する。次に図３Ｂを参照にして、ここではステップまたはサブプロセス１８ｂについて開示する。これは、サブプロセス１８ａでしたような、一つのターゲット分子の指紋に対する類似性を決定する適合性関数ではなく、任意のターゲット指紋に対する類似性を判断する。サブプロセス１８ｂを含む進化方法１０が繰り返し実行されると、連続する分子の世代は、任意のターゲット指紋に画かれた分子構造を持った新たな分子へと進化する。ステップ１１０で分子適合関数１８ｂの要求を受けると、ステップ１１２では任意のターゲット指紋を翻訳してかつ記憶する。サブプロセス１８ａに似た方法で、ステップ１２０はターゲット分子の指紋を比較して、距離の類似性を基準にした適合値を算出する。ステップ１２０で分子群内の各オブジェクト分子が比較された後、全体の適合値に関する出力リスト１２２は、ステップ１２６で次のステップである進化方法１０のレコーディングステップ２４へ進む。サブプロセス１８ｂは、すでに述べたサブプロセス１８ａの変形であるが、実際はサブプロセス１８ａを一般化したものである。サブプロセス１８ｂは、現存する他の方法では解決できない現実の問題を解決する上で有用な機能を有する。その重要な点は、任意のターゲット指紋を選択できることである。ある分子の指紋は通常、特定の分子に関する構造的な特徴を表すビットセットである。分子が属する分類の、共通的な構造的特徴を表す特別な指紋を作り出すことは可能である。これは”最頻度指紋”と呼ばれている。そのクラスに属するいろいろな分子の指紋が検査されて、もし半分以上の指紋が同じビットセットを持っていたら、特別な特徴を表す最頻度指紋として登録される。つまりそのクラスの半分以上の分子がその特徴を持っている場合である。このように最頻度指紋は、そのクラスでの共通的な特徴を表しており、現実の分子については、一致している場合もあり、一致していない場合もある。ターゲットとして任意の最頻度指紋を用いるサブプロセス１８ｂによって、進化方法１０が実行されると、この最頻度指紋に類似した指紋を持った分子、あるいはオリジナルのクラスの特徴を持った分子へと進化する。その結果、分子発見のために興味ある方法を提供する。次に図３Ｃには、サブプロセス１８ｃが開示されている。それは遺伝子薬理学モデルとの適合性を計算するための適合性関数を、実行するためのものである。薬理学モデルは、三次元内のポイントと、それらのポイント間の結合子から構成されている。分子構造は一般に、結合性の点で原子パターンにより定義される。つまりその定義は、三次元構造には依存しない。そのようなモデルは、既知の特定の薬理学上の働きを持った分子から得ることが出来る。薬理学モデルの特性に合致した新たな分子は、新薬開発上の候補となる。図３Ｃに述べる適合性関数を使用すると、分子遺伝アルゴリズムはそのような薬理学特性に合致した新たな分子を作り出す。ニコチンアセチルコライン受容体についての遺伝子薬学モデルの例が、”ＴｈｅＥｎｓｅｍｂｌｅＡｐｐｒｏｃｈｔｏＤｉｓｔａｎｃｅＧｅｏｍｅｔｒｙ：ＡｐｐｌｉｃａｔｉｏｎｔｏｔｈｅＮｉｃｏｔｉｎｉｃＰｈａｒｍａｃｏｐｈｏｒｅ”、Ｒ．Ｐ．Ｓｈｅｒｉｄａｎ、Ｒ．Ｎｉｌａｋａｎｔａｎ、Ｊ．Ｓ．Ｄｉｘｏｎ、ａｎｄＲ．Ｖｅｎｋａｔａｒａｇｈａｖａｎ、Ｊ．Ｍｅｄ．Ｃｈｅｍ．、２９，８９９（１９８６）に掲載されている。ここでは、３つの点が薬理学モデルを定義づけるのに重要であることが判明している。まず、陽イオンのセンター、つまり脂肪族窒素（Ａ）、負電子原子、つまりヒリドリン窒素またはカルボニン酸素（Ｂ）、Ｂと共に双極分子を形成する１または複数の原子（Ｃ）、つまり芳香環またはカルボニール炭素である。このニコチン薬理学モデルは、そのポイント、Ａ、Ｂ、Ｃの間の距離が決められており、その距離はオングストロングで表されており、４．８（Ａ−Ｂ間）、４．０（Ａ −Ｃ間）、１．２（Ｂ−Ｃ間）である。これらの定義に合致する構造を形成する多くの分子は、ニコチン受容体について、作用薬または拮抗剤として実際に使用されている。この薬理学モデルは、図３Ｃのデータオブジェクトについての例としてあげられる。すなわち、そのパターンの一セットは、それぞれが例えば脂肪族窒素、ヒリドリン窒素のような対になった原子を含む複数のポイント、およびこの２ポイント間の距離を例えば４．８プラスマイナス０．０５オングストロームに制限するバウンド（境界線）から構成されている。このサブプロセス１８ｃは、ステップ１３０で現分子群の分子リストについての薬理学適合性を要求することからスタートする。ステップ１３２で、各分子をＳＭＩＬＥＳ表現から反対に対応の分子グラフへ転換することで理解できるように準備する。そしてその適合値を非常に低い値に初期設定する。ステップ１３４で、１３６の記載された薬理学モデル中のパターンに対応する、分子のポイントまたは原子を認識する。そして分子中で発見したすべてのコンビネーションにわたり繰り返しループ処理が行われる。ニコチン薬理学モデルを例に採ると、もしその分子で、２原子のマッチングパターンの組み合わせＡ（Ａ’とＡ”という）、２原子のマッチングパターンＢ（Ｂ’とＢ”）、そして１原子のマッチングパターンＣ（Ｃ’）があると、ステップ１３４、１３８、１４０を含むループ処理は、それぞれのパターンにつき一度として、４回ループ処理することになる。すなわち、Ａ’Ｂ’Ｃ、Ａ’Ｂ”Ｃ、Ａ”Ｂ’Ｃ、そしてＡ”Ｂ”Ｃである。例えば最初のループ処理で、その薬理学モデルは３つの遺伝子ポイントがあるため、原子Ａ’、Ｂ’、Ｃと適合し得る。二回目のループ処理では、Ａ”、Ｂ’、Ｃが試される。各ループ処理で、１３６に記載された薬理学定義のバウンド（境界線）で定義された距離だけ、特定の原子が分離するような力が出るように構成される。上述のＳｈｅｒｉｄａｎｎｅｔａｌ資料に書かれているような方法で距離の３次元構成がされる。適合性はバウンド（境界線）違反の回数を合計して、一番低い値がベストな適合性とされる。その適合値は、ステップ１４２出出力リスト１４４に出力される。ステップ１４６で、その分子群中のＮ個の分子が、すべて処理され他かどうかを判断する。もしすべて評価済みなら、図１に示す方法１０のレコーディングステップ２４へ戻る。薬理学適合関数で分子エデンアルゴリズムを操作した結果物は、三次元的高速性を有した新規な分子群である。重要なのは遺伝子アルゴリズムに３次元構造のデータを持たせずに行うという点である。単に外部の適合性関数だけが３次元について関連するだけである。幾何学的な薬理学モデルに合致した分子は単純な３次元の形式をゆうしている。以下により高度な例を開示する。図３Ｄには、サブプロセス１８ｄで薬剤と酵素または蛋白質との理論的関連性を予見する適合性関数について述べられている。酵素または蛋白質と相互関連を持つ薬品の有効性については、ｋｃａｌ／ｍｏｌの形式で表現される、薬品と酵素間の予見される結合力の点で述べられている。結合サイト適合関数のサブプロセス１８ｄの数値が低ければ低いだけ、進化した薬品分子はより効果的であると予見される。特に、ｋｃａｌ／ｍｏｌのネガティブ値が大きければ、それだけより強固な結合力が強く相性がよいことになる。まず酵素の結合サイトについて、３次元表現で酵素モデルを作る必要がある。図１０には、よく研究された酵素であるジヒドロフォレーテ還元酵素（ＤＨＦＲ）の結合サイトに関する３次元表現を示す。ＢｒｏｏｋｈａｖｅｎＰｒｏｔｅｉｎＤａｔａｂａｎｋ、１９９２には、ＤＨＦＲ結晶構造に関するＸ線回折で得られたＤＨＦＲ座標について述べられている。サブプロセス１８ｄは、現分子群の分子リストが推定される結合力適合関数によって評価されるリクエストを受ける、ステップ１５０からスタートする。ステップ１５０ではまた酵素のターゲト結合サイトの三次元表現に入る。サブプロセス１８ｄでは、酵素の結合サイトとしっかりと結合する薬品の分子構造を進化させる。次のステップ１５２では、モデルまたは結合サイトの表現をデジタルデーターに変換する。このデーターは、ステップ１５８によって現世代中の薬品分子の分子構造と比較される。複雑な結合サイトが表面を決定する。その表面は、オブジェクト分子が合致しなければならない受容体ボリュームを収納している。これについては、Ｋｕｎｓｔｅｔａｌ．に各種のサイズを持つ球で受容体ボリュームを定義づける方法について記載されている。図１０には、各種の球１７０ａからｇが見られる。これらの球は、その受容体ボリューム内にしっかりとフィットして、その受容体ボリュームまたは結合サイトを定義づける。ステップ１５２では、評価ステップ１５８で使用するために、結合サイトの記述１５４にある部分電荷情報を追加生成する。結合サイトの記述１５４のデジタル表示を生成するステップ１５２は、進化方法１０を繰り返して実行する間に一回だけ実行すれば足りる。ステップ１５６では現世代の次のオブジェクト分子（薬品）を呼び出す。このオブジェクト分子は、ステップ１５８で、ステップ１５２で生成された結合サイトのデジタル記述を比較される。ステップ１５６では、個々の分子の表現、すなわちＳＭＩＬＥＳ表現を、ステップ１５８で使用するのに適したデーターへ変換する。ステップ１５８では、薬品分子と酵素分子が構造分析により比較され、酵素分子の結合サイト記述１５４へその薬品分子が適合するかが判断される。”Ｐｒｏｇｒａｍ１５９：ＤＧＥＯＭ”、ＱｕａｎｔｕｍＣｈｅｍｉｃａｌＰｒｏｇｒａｍＥｘｃｈａｎｇｅ、Ｂｌａｎｅｙ、Ｊ．Ｍ．、ＵｎｉｖｅｒｓｉｔｙｏｆＩｎｄｉａｎａ、Ｂｌｏｏｍｉｎｇｔｏｎ、ＩＮ（１９９０）には本実施例で使われているＤＧＥＯＭと呼ばれる距離測定方法を使った分子構造の生成方法が述べられている。距離的な制約を受けながら、この距離測定方法は他のファクターを考慮に入れながら構造的な最適化が出来るようになっている。この他のファクターとは例えば、内部特性、水素結合、そして内部分子電磁作用等である。ステップ１５８は、与えられた回数Ｔ、例えば２０回、各分子のサンプル構成へランダムに繰り返し実行される。Ｔ回の実行時にステップ１５８は、ランダムに３次元表現をつまり分子モデルを構成する。モデルの中の各原子には、３次元で表現された位置空間が与えられる。そのモデルは図１０に示す球１７０ａ−ｇで示されたように結合サイトに納められる。ステップ１５８は、適合値をＫｃａｌ／ｍｏｌの理論的結合エネルギー単位で計算する。それはそのモデルがどれだけ球１７０つまりステアリ酸形状に合致しているか、またモデル原子の電荷と受容体分子の電荷間での電磁気相互作用、に基づいて計算される。予見結合エネルギーはステップ１５８のＴ回のうちで、一番ネガティブ値が大きい値をベストな数値として取り入れられる。ステップ１６０では、ステップ１５８がＴ回繰り返されたかを判断し、ステップ１６２では、インプッツ構造と結合エネルギーのベストな値を出力リストへ加える。ステップ１６６では現世代のＮ個のオブジェクト分子が結合エネルギー関数の対象になったかが判断される。その後、図１の進化方法１０の次のレコーディングステップ２４へ、出力リストを戻す。進化方法１０の、特に結合エネルギー適応性についてのサブプロセス１８ｄを使った場合の、効率性を判断するために、既知のよく知られた分子について結合エネルギーが推定されると共に、この方法１０とサブプロセス１８ｄによりオブジェクト分子が既知の分子と結合する結合エネルギーを推定した。メトトレザト（ＭＴＸ）はよく知られた化学療法剤であり、それはＤＨＦＲの複雑な結合サイトとしっかりと結合することが知られている。図１０で示すように、ＭＴＸ分子１６９は、球１７０の中でしっかりと結合し、それはＤＨＦＲ分子１７２の受容体ポケットとなる。ＭＴＸ分子１６９は、図１０に示すように、テリダイン環システム１６９ａを有している。図１１ＡとＢには、ＭＴＸモデル１６９と球１７０ａ−ｂの２Ｘバンデルワールス表面をが見られる。ＤＨＦＲ分子１７２は、図１１ＡとＢから除かれており、この図では、バンデルワールス表面で表されている。図１１ＡとＢでは、ＭＴＸ分子１６９が、ＤＨＦＲ分子の結合サイトである鋭角に曲がっている部分１６９ａを持ち、これによって球１７０ａ−ｇ内にしっかりと結合している。結合エネルギー適応関数についてのサブプロセス１８ｄは、ＭＴＸ分子１６９のバウンド（境界線）構造を作り上げて、また−４７ｋｃａｌ／ｍｏｌの結合エネルギーを予見した。分子間で観察される最も高い結合エネルギーである。進化方法１０は、ＤＨＦＲ分子１６９と堅く結合する新たな分子を進化させるために、結合エネルギー適合関数のサブプロセス１８ｄを用いた。分子の進化は、ＤＨＦＲ分子１６９をターゲットとして使い、８個の重い原子を含む２０個の分子群から開始された。図１２ＡとＢに示す分子構造１７４は、結合エネルギー適合関数１８ｆで進化させた非飽和のポリアミンであり、これは予見結合エネルギーが−１３３ｋｃａｌ／ｍｏｌで第１８世代に出現したものである。適合値はステアリン酸型結合と電磁相互作用を含む。この構造１７４は、外表面と球１７０で決まる内部結合ポケットの両方に非常にうまく適している。次に図３Ｅには、ｍｏｌｅｃｕｌｅｓｕｓｉｎｇＣｏｍｐａｒａｔｉｖｅＭｏｌｅｃｕｌａｒＦｉｅｌｄＡｎａｌｙｓｉｓ（ＣｏＭＦＡ）を使って分子の結合を計算する適合関数のためのサブプロセス１８ｅを示している。ＣｏＭＦＡとは、既知の分子が仮説的受容体サイトにどのように結合するかの３次元マップを作り出す方法である。この方法は、その結合サイトに結合する既知の分子構造を作り出すことに基づいている。ＣｏＭＦＡは、その受容体を形成する原子の３次元座標や受容休分子の特性を知らなくとも、仮説的な受容体に、ある分子がどの程度うまく結合するかを予見するために使われる。ＣｏＭＦＡは、２つの既存の技術の上に成り立っている。ＧＲＩＤとＰＬＳ（Ｐａｒｔｉａｌｌｅａｓｔｓｑｕａｒｅｓ）であり、前者は、分子について等しく離れたポイントでの排斥力に関するアルゴリズムであり、後者は、線形方程式のｕｎｄｅｒ −ｄｅｔｅｒｍｉｎｅｄｓｅｔを結合させるアルゴリズムである。ＣｏＦＭＡの詳細については、米国特許５，０２５，３８８、Ｃｒａｍｅｒｅｔａｌ記載されている。これはここでも参照されている。関連事項として、ＣｏＭＦＡが空間における分子場から成る配位子適合（格子ポイントでの値）のモデルと、その分子場に分子を整列させる方法を提供することである。これらの要素が、図３Ｅのデータオブジェクト１８６として表現されているＣｏＭＦＡモデルの記述を構成している。ＣｏＭＦＡのサブプロセスが分子遺伝アルゴリズムと共に使われると、サブプロセス１８ｅはＣｏＭＦＡ場に適合する新規な分子を生成する方法を提供する。オペレーションではサブプロセス１８ｅは、与えられた３次元結合を最適化する分子を生成するサブプロセス１８ｃと１８ｄで実行された適合関数のオペレーションと非常に類似している。サブプロセス１８ｅは、現世代の分子のリストにＣｏＭＦＡ適合関数を用いることを要求するステップ１８０からスタートする。次にステップ１８２で、各分子をＳＭＩＬＥＳ表現から反対に、対応する分子グラフへ変換する。ステップ１８４、１８８から成るループが、ステップ１９０で決められた回数だけ実行される。各ループでは、ステップ１８４は図３Ｃと３Ｄに示したサブプロセス１８ｃと１８ｄの幾何学的距離方法を使って、異なる構造を生成する。さらにステップ１８４では、その生成された構造をＣｏＭＦＡモデル記述１８６で定義された、ＣｏＭＦＡまたはＧＲＩＤと結合または配列を行う。次にループのなかでステップ１８８が、分子回りの場を計算し、ＣｏＭＦＡモデルの場とその分子場の結合を評価する。この処理は、もしＣｏＭＦＡモデルが配列のための”ＦｉｅｌｄＦｉｔ”法を指定すると少し異なり、配列は場が比較されると同時に行われる。いずれの場合にも、適合性は残差の二乗の合計をとり、これはＣｒａｍｅｒｅｔａｌ特許で説明されているように、ＣｏＭＦＡ法のＰＬＳ部分で計算される。ステップ１９０ですべてのトライヤルが終了すると、ＣｏＭＦＡモデルと一番うまく適合した分子構造、つまり一番低い残差を持った分子構造が、ステップ１９２で出力リスト１９４へ加えられる。すねての分子が評価されると、出力リスト１９４は図１記載の進化方法１０のレコーディングステップ２４へ戻される。上述したように、ＣｏＭＦＡ適合性関数のサブプロセス１８ｅは、もし単純な配列ルールが無い場合には、薬理学適合性関数を使った１８ｃや、結合子適合性関数を使ったサブプロセス１８ｄよりは効率がはるかに悪い。ＣｏＭＦＡ場を同時に配置し、そして化学的に妥当性ある構造に生成しながら同時に適合する、３次元構造を発生させる幾何的距離ベースの方法は、ステップ１８４、１８８、１９０のような多くの構造をサンプルとして取り上げる必要性を減少または削除することが出来る。今日まで、この試みは不成功に終わっていた。しかしながらＣｏＭＦＡ分析と組み合わせた分子進化法は、他の方法が無い現在、新規なデザインのための凶器ある機会を提供する。次に図３Ｆでは、結合エネルギー適合関数を実行するためのサブプロセス１８ｆを開示している。ここでは、サブプロセス１８ｄのように結合エネルギーを評価するのではなく、実際に各世代の分子を合成し、攻撃すべき酵素または蛋白質との結合エネルギーを測定している。まずステップ２１０では、ある世代中の各分子の結合エネルギーの要求がなされる。その後、ステップ２１２では、一定のリスト中の各分子を合成する。ステップ２１４では、合成された分子を一つづつ酵素サンプル２１６へ入れてみて、その分子の酵素に対する実際の結合エネルギーを試験してみる。ステップ２１８では、入力された構造をその測定された結合定数を出力リスト２２０へ出力する。ステップ２２２では、与えられたリスト中の各分子がすべて合成され、試験されたかを判断し、もしそうならステップ２２４では、出力リスト２２０を図１に示す進化方法１０のレコーディングステップ２４へ戻す。このサブプロセス１８ｆでは、そこでの結果は実測に基づいており、ソフトウエアーによる適合関数でなされた近似法やエラーによるものではない、という利点を有している。そしてここでは、実際の分子群を生成し、もし成功なら、ターゲット分子との結合は実証されている。図Ｇには、適合性の合成を実行するサブプロセス１８ｇを示す。それは、１または複数の適合性関数から選択的に構成されている。例えば、図３Ａから３Ｆに示すサブプロセス１８ａから１８ｆの適合性関数が使用される。サブプロセス１８ｇでは、図１の進化方法１０は、上述の任意の適合関数に適合して分子を単に最適化するだけでなく、他の適合関数との組み合わせである適合関数自体を最適化する。これを合成適合関数という。以前の例に示したように、どの適合関数も、いろいろな要素で構成することができる。例えば、薬理学適合関数では図３Ｃのステップ１３８で実行されたように、バウンド（境界線）違反の合計で構成されている。合成適合関数は、そのような要素適合関数とはそれらが独立して稼働するのが保証されている点だけが異なる。合成適合関数では、いろいろな特別関数を組み合わせて、所望の特性を有する分子群へ進化させる圧力を加えることが出来る。そのような特別適合関数は、いろいろな特性を有する薬品を効率的に作る薬品デザインに使用することが出来る。例えばサブプロセス１８ｇでは、各分子構造にいろいろな適合関数を連続的に実行することが出来る。図３で述べた結合エネルギー関数に加えて、この合成適合関数はさらに特別な関数を加えて、所望の特性へ分子構造を進化させることが出来る。薬品デザインに関連して、そのような特別適合関数は、複雑さを低減させて分子をもっと効率的にし、即効性あるものに出来る。さらに光酸化を軽減して薬品の有効期限を改善し、また水と反応する加水分解を減らし、消化作用に対する抵抗を強めて口経剤用に薬品を改善し、そして疎水性を最適化することでその分子を脂肪組織に強くして、所望の核に移植出来るように改善できる。サブプロセス１８ｇは、適合関数の数について分子リストの適合性の要求をステップ２３０で受ける。ステップ１３２は、リストにある各分子の適合性を初期化して、”セットされず”にする。このような初期化は、要素適合関数のいくつかが、分子群中の１または複数の分子を処理できないため必要である。ステップ２３４は、例えば図３Ｄステップ１５０のような適合関数２３６を要求する。要求された最初の適合関数を実行するサブプロセス１８は、まず最初の部分的評価値を出すために実行される。ステップ２３８では、その適合関数に対する部分的な適合値を測定し、それを出力リスト２４０にある分子の要素適合値へ加える。その測定では、同一対象への他の異なる適合関数の結果との相対的な重要性を調整することが必要である。これによって測定結果を意味あるように加算出来る。ステップ２４２では、すべての適合関数が評価されたかが判断される。もし未だなら、ステップ２３４と２３８が、他の異なる適合関数２３６を使って繰り返される。もしすべての適合関数が評価されると、出力リスト２４０は、図１の進化方法１０のステップ２４へ戻される。合成適合関数のサブプロセス１８ｇが有効であることを証明するために、図１２Ａと１２Ｂの分子構造１７４は、さらに追加の適合関数を使った合成適合関数で進化させてある。この追加の適合関数は、分子中のｎｏｎ−ｒｉｎｇ結合子を最少化している。この際、各ｎｏｎ−ｒｉｎｇ（非環）結合子に対して１．０ｋｃａｋｌ／ｍｏｌのペナルティーが課される。この機能は、図３Ｄの適合関数１８ｄへ図３Ｇの合成適合関数１８ｇを使って加えられる。この追加した適合関数の効果は、対象となる分子群に対し、環を含む分子群方向へバイアスを加えることである。（多くの環を含む分子は環なしの分子に比べて構造的複雑性が低い。つまり、もし両者が等しい結合サイトを持っていたとすると、多環性の分子は、非環性の分子よりもはるかに少ない非結合構造を持ち、通常は結合が早い。）この変更は、許容される分子の世界を低減させ、かつ幾何学的にまた電磁気的にＤＨＦＲ結合サイトに適合する多くの環を有する分子を設計するのをもっと困難なものとする。これは、環システムの幾何学は鎖システムに比べて制限が多いために大変難しい問題である。図１３Ａと１３Ｂは、ＳＧＩＣｒｉｍｓｏｎを１１時間稼働させた後、世代１３０で最初に出現した分子構造１７４’を示す。この分子１７４’では、ほとんど完全に環構造で、６個の肪環式の環、２７個の環結合子、１８個の非環結合子、を含む。それであっても、この分子１７４’は結合サイトにうまく適合している。この分子１７４’の適合値は、−４６．７３であるが、それが合成適応関数の結果であるため、結合エネルギー予測には完全には対応していない。図１２と１３に示す進化した分子構造は、非常に難しくかつ複雑な機能を最適化する分子形成のための進化方法１０の能力を表している。合成適正関数についてのサブプロセス１８ｇの成功により、さらに追加の新規な関数を加えることができる。それらの関数は、例えば可溶性、疎水性、合成機能等の追加所望機能を持った分子を作り上げるのに使用することが出来る。図４には、図１のサブプロセス２２についての、下位フローチャートが開示されている。このプロセスはオブジェクト分子が実行可能かどうかを判断するためのものである。図１のステップ１２で分子をランダムに生成させているため、進化した分子の化学的合理性や実行可能性を判断する必要がある。これは、たとえその分子群のすべての分子が、適正な電子を持ち、理論的可能性を有しているという観点から有効であるとしても、なお必要である。この理由は、原子と結合子の組み合わせのほとんどが、現実の世界では安定した分子ではないからである。さらに完全に孤立した分子といものは、実用的価値を持たないためである。例えば薬品分野では、水とうまく反応しない分子は薬品の対象には不向きであるからである。分子進化方法１０においては、化学的合理性の評価は、適合関数で非合理的な分子に対しては低い適合値を与えるだけで、理論的にこの評価はされている。実際には、適合関数での構造的評価を、分子の安定性に限定するのが便利である。このアプローチは、使用される各適合関数にそのような評価機能を、特別に付加する必要性を無くしている。まずステップ２５０で、現世代のある分子の構造を一つづつ評価するリクエストを受ける。テーブル２５４は、合理的な原子環境、つまり通常の原子価の仮定、言い換えれば普通に見受けられる原子環境に基づくリストから構成されている。ステップ２５２は、一度に一つづつ各原子を評価して、もし自然界で通常見られない環境で発生した原子である場合には、その原子にペナルティーを課している。ステップ２５２の最初に、合成スコアーからペナルティーポイントが引かれる。ステップ２５６では、最後の原子が評価されたかを判断し、ステップ２５８へ進む。同じように、ステップ２５８、２６４でもオブジェクト分子を評価して、結合子と環の存在とサイズについて不合理な組み合わせに対してはペナルティーを加える。不合理な結合子を環に対するペナルティーは、それぞれステップ２５８、２６４で現すこあーに加えられる。ステップ２６８ですべての環が評価し終え、そしてステップ２６４でペナルティースコアーが合計される。累計されたペナルティースコアーはステップ２７０で図１の進化方法１０のレコードステップ２４へ戻される。図５には、図１に示す再生成のステップ２８の詳細図である。すなわち再生成ステップ２８は、個々の適合度に基づきバイアスを掛けて、次の世代を生成する手段である。連続して分子世代を進化させるため、相反する要素を持ちながら、目的へ向かう必要がある。すなわち、望ましい特性は次世代へ受け継がれなければならない。あう群の異なる複数の分子による相乗的な特性は、一体化されるようにしなければならない。新たな特徴は組み入れられなければならないし、群の内部での融合性は合理的なレベルで維持されなければならない。そして、望まない特性は削除されなければならない。現実の解決案としては、自然界（典型的には、何千世代に渡り進化している幾百万種の動物の世界）で発見される割合を越えて進化を加速させることが重要である。まずステップ２８０で、現世代の分子を再生成または進化させるリタエストを受ける。ステップ２８２では、先の世代から次の世代へ、エリート分子を変更せずに選択しコピーする。エリート分子の選択は、適合関数に関するサブプロセス１８の各分子に与えられた数値により行う。先の世代のＥ番目のオブジェクト分子が最高値を持っていることを見つける。ステップ２８４では、そのＥ番目の分子をコピーする。現有する最上の特性は進化の世代で失われないように保証されている。この実際の運用では、そのエリート分子のＥ番が、すべての群にコピーされる。図９、１１ＡとＢ、１２ＡとＢ、１３ＡとＢでは、エリート番号は、１とセットされる。つまり各世代のベストだけがそのまま次の世代にコピーされる。次にステップ２８６では、クロン（無性生殖）方法かブリード（掛け合わせ）方法かをテーブル２８８の頻度に従って選択する。その頻度は、調整可能である。もしクロンが選択されると、再生成方法２８はステップ２９０を処理する。これは、ステップ２９２へ行く前に一つの親分子をコピーするか、その親から子分子をクロンする。もしステップ２８６でブリードが選択されると、ステップ２９０では同一でない２つの親分子を選択する。その選択された２つの親分子はブリードされて一つの子分子を生成する。図７で後述するように、ブリードは選択された親分子からその特性を選択して、それらを合併して子分子を作り上げる。その子分子を次世代に加える前に、ステップ２９６は子分子の分子構造を突然変異させる。図８で後述するように突然変異によって、選択された原子または結合子は加えられたり、削除、変更されることがある。一つの分子が突然変異すると、ステップ２９８はすべての分子が次の世代のために再生成されたかを判断する。もし未だなら、サブプロセス２８は、次の分子のためにステップ２８２へ戻る。もしすべての分子が進化し終えたら、ステップ３００は次の世代へその進化した分子を渡す。図６では、ステップ２９０’と２９０”に別れ、ステップ２９０”では２つの親分子がブリードように選択され、ステップ２９０’ではただ一つの親がクロンように選択される。まずステップ３１０で、バイアスがかかった１親かそれ以上の親の選択、現分子群の分子リスト、適合関数１８で計算された関連の適合値のリタエストを受ける。つぎにステップ３１２は、オブジェクト分子を適合値に従い並べる。高いランクの分子は、最良の適合値を持った分子である。ステップ３１４では、確率テーブル３１５を作る。ここでは選択の確率が正常化した分子のランクを均一化する。バイアスを掛けて選択するランキング法は、適合値の数値の大きさは重要ではなく、単にランキングが重要である。適合値よりもランキングが使用されるのは、適合値と所望の分子の持つ質は、必ずしも比例しないからである。またランキングの方が、分子群が収束する際、比較的安定した選択の要素となるからである。次にステップ３１６では、子分子がブリードされるかクロンされるかによって２または１個の親分子が確率テーブル３１５から選択される。もし２個の親分子が選択されると、それらはお互いに排他的である。選択された親分子は、ステップ３１８でステップ２９２またはステップ２９４へ送られる。図７には、ステップ２９４でブリードについてさらに詳述されている。図７のブリードのステップは、外部表現には適さず、むしろデジタル化された分子グラフに向いている。まずステップ３２０では、２個の親分子をブリードする要求を受ける。ステップ３２２では、親分子の原子と原子の間にある結合子を、ステップ３２４にセットされた消化レートに従って崩す。この消化レートが、各親分子中の崩すべく結合子の割合を制御し、それは調整可能なパラメータである。ステップ３２６では、崩した分子の破片の割合分または一部分をブリードの子分子構造の中へ反映させる。この割合は、ステップ３２８で支配レートとしてセットされる。ステップ３３２では、フラグをセットする。このフラグが、分子の破片が再編成されるかどうかを制御する。もし分離されたままの構造が、許されていなければ、ステップ３３４は単一接続の分子を子分子として選択する。次にステップ３３６では、ブリードされた子分子を出力リスト３３８へ加える。その後ステップ３４０で、出力リスト３３８を次のステップである図５の突然変異ステップ２９６へ戻す。図８のサブプロセス２９６では、進化した子分子構造の突然変異について詳述されている。ブリードまたはクロンされた子分子の突然変異は、次の世代のオブジェクト分子では相違点の中心である。再生成のステップ２８では、分子は分子グラフで表現されている。この分子グラフに対して、突然変異が直接作用する。突然変異のステップ２９６は、単一のブリードされ又はクロンされた子分子を単一の突然変異した子分子にする。最初にステップ３５０では、いろいろな突然変異メカによってブリード又はクロンする要求を受ける。すなわち、ステップ３６４へ直接移り、突然変異しない処理、ステップ３５６で原子突然変異の処理、ステップ３６２で原子削除の処理、ステップ３６０で原子移植の処理、そしてステップ３６２で結合子変更の処理等がある。一回の突然変異では、一つだけの突然変異メカが使われる。それぞれの突然変異メカの確率レートが、確率テーブル３５４にセットされる。このレートは、どんな種類の突然変異を望むのか、またはどんなタイプのオブジェクト分子に進化させたいのか、に依存している。ステップ３５０でリクエストを受け取ると、ステップ３５２は、突然変異メカテーブル３５４へアクセスして、確率レートのセットを決める。これらの確率レートに従って、ステップ３５６、３５８、３６０、そして３６２から一つランダムに選択される。ステップ３５２は、ステップ３５６、３５８、３６０、３６２のいずれも選択せず従って、ブリードもクロンもせずに、そのまま突然変異無しで次の世代へ受け渡される、という選択でもよい。原子を挿入するステップ３５６では、新しい原子と結合子がランダムに選択されて、ブリード又はクロンの子分子に加えられる。これはステップ６６と同じように、原始周期表に納められている自然界での原子と結合子の割合に従って選択される。ランダムに選択された原子は、現分子グラフ中のランダムに選択された原子に対して、ランダムに選択された結合子で加えられる。原子削除のステップ３５８では、現分子グラフ中のランダムに選択された原子から原子を削除する。変成突然変異のステップ３６０では、現分子グラフの２つの原子をランダムに選択して、ランダムにその原子の特性を換える。すなわちその原子を、ＣからＮへ換える。結合子変更のステップ３６２では、現分子グラフ中の２つの原子の間にある既存の結合子は、結合子が作られたり、削除されたり、修正されたりする。例えば、この結合子変更では、２本の結合子から１本の結合子へ変更されることがある。図１２ＡとＢ、図１３ＡとＢに示す分子は、突然変異メカテーブル３５４に収納されている確率レートを選択して進化させたもので、原子挿入ステップ３５６、原子削除ステップ３５５、原子変成突然変異ステップ３６０、の各確率をそれぞれ、０％（突然変異無し）、２０％、２０％、１０％、５０％に設定したものである。ステップ３６４では、突然変異した分子が、図４で詳述したステップ２２と同じように、実行可能かがテストされる。最後にステップ３６６では、再生成され終わった子分子を次世代へ入れるため戻される。図１の再生成方法２８は図５から８で詳述したように、いろいろな調整用のパラメーターを有している。特に、エリート数２８４、生成方法の確率つまりステップ２８８のクロンとブリードの割合、消化レートつまりステップ３２４の消化中の結合子が崩れる割合、ステップ３２８の支配レート、ステップ３３２の非接続フラッグ、そしてステップ３５４の突然変異メカ確率、等である。数々の適合関数をコンパチになるように調整パラメーターが多くあり、これによってすべての過程におけるレートを制御している。実際には、非接続フラッグについてステップ３３２のセティングは、使用される適合関数の性格に依存する。非接続構造は、もし適合関数が実施されたら無意味になるとか、実施できないとか、非接続（複合）分子つまり例えば溶剤の可溶性を予見した適合関数である場合には、禁止されている。ほとんどの環境下では、分子遺伝アルゴリズムの重要な目的は、出来るだけ効率的に受忍できる結果を出すことである。すなわち出来るだけ早急に結果を出すことである。最後に、進化は次のようにパラメーターを設定すると、早く処理が進む。非ゼロエリート値：１、ブリードとクロンの割合を中間値、つまり５０％対５０％、消化レートを高く、つまり２０％、支配レートを低く、つまり０％、突然変異レートを高く、つまり０％の非稼働率、である。そのようなセッティングで、各世代間を構造的に大きくジャンプして、選択されたエリートで世代から世代へ安定性が増大される。このようにすれば、進化は加速されるが、分子群の多少の微調整は犠牲となる。適合関数が非常に早く、つまり計算能力が大きい場合には、最良の妥協案は驚異的な加速処理をせずに、多くの分子群を使い、クロン比を低く、つまり１０％、低消化率、つまり５％、高支配レート、つまり３０％、ずっと低い突然変異レート、つまり９０％の突然変異無し、エリート無し、つまりエリート数はゼロに設定することである。そのようなパラメーターを使用することで、分子進化はもっと自然進化に近づく。すなわちゆっくりと、広範囲にできるが、計算時間はもっと必要になる。本発明に関しては、この記述は単なる例示であり、発明の範囲は添付の特許請求の範囲で判断されることに、ご注意いただきたい。

Claims

【特許請求の範囲】１．一連の分子群を連続的に生成することにより、所望の構造的特徴のセットを有したターゲット分子を進化させる、一連のステップを繰り返し実行する方法であって、当該一連の分子群は構造的特徴を持った複数の分子で構成し、当該一連のステップは当該一連の分子群の次の分子群を生成し、当該一連のステップは、ａ）当該一連の分子群と、当該所望の構造的特徴のセットを比較し、比較した当該一連の分子群に対して、比較した当該一連の分子群と当該所望の構造的特徴のセットがどれだけ近似しているかに依る評価数値を与えること、及びｂ）当該現行分子群の当該分子を当該評価数値により、当該次期分子群に含ませて再生成すること、から構成するターゲット分子を進化させる方法。２．ランダムに最初の一連の分子群を生成するステップをさらに加えた、請求項１記載のターゲット分子を進化させる方法。３．前記最初の一連の分子群は、前記ａ）ステップに従って、対応する評価数値を作りだし、当該最初の一連の分子群は、前記ｂ）ステップに従って、再生成される、請求項２記載のターゲット分子を進化させる方法。４．前記ｂ）ステップは、前記ｂ）ステップがさらに、再生成した分子を化学的に安定しているかを評価するステップと、前記次期分子群に化学的に安定している当該再生成分子のみを入れるステップ、をさらに含む請求項１記載のターゲット分子を進化させる方法。５．前記評価のａ）ステップは、現行分子群の各分子に対して、化学的安定性についての第二の評価数値を作りだし、第一と第二の評価数値を合計して合併評価数値を作り出し、各分子の次期分子群を再生成する前記ステップｂ）が、当該合併評価値に依存する、請求項４記載のターゲット分子を進化させる方法。６．再生成のステップｂ）は、エリート分子の数値によって、現行分子群のエリート分子の数を選択して、当該エリート分子を次期分子群に入れる、請求項１記載のターゲット分子を進化させる方法。７．再生成のステップｂ）は、親分子の数値によって、現行分子群の親分子の数を選択サブステップを含む、請求項１記載のターゲット分子を進化させる方法。８．再生成のステップｂ）は、子分子が突然変異して次期分子群の子分子を提供するサブステップを含む、請求項７記載のターゲット分子を進化させる方法。９．前記選択のサブステップが、一つの親分子を選択し、この親分子からクロンされた一の子分子を、次期分子群に含ませる、請求項８記載のターゲット分子を進化させる方法。１０．再生成のステップｂ）は、２つの親分子を選択し、この２つの親分子がブリードされた一つの子分子を、次期分子群に含ませる、請求項８記載のターゲット分子を進化させる方法。１１．再生成のステップｂ）は、前記選択された２つの親分子が現行分子群の異なる分子であることを確認するサブステップを含む、請求項１０記載のターゲット分子を進化させる方法。１２．ブリードのサブステップは、２つの親分子のそれぞれの一部を取り出して、当該一部を結合して、次期分子群の新しい次期分子を生成する、請求項１０記載のターゲット分子を進化させる方法。１３．突然変異のサブステップは、ランダムに決めた特性を有する原子を取り出し、当該原子をブリードされた子分子に加えて、当該子分子を次期分子群へ与える第一のサブサブステップを含む、請求項８記載のターゲット分子を進化させる方法。１４．突然変異のサブステップは、ランダムに一つの原子をブリードされた子分子から選択し、当該原子を子分子の一つから削除する第二のサブサブステップを含む、請求項８記載のターゲット分子を進化させる方法。１５．突然変異のサブステップは、ランダムに一つの原子をブリードされた子分子から選択し、当該原子をランダムに選択した特性を有する原子と入れ替えて、次期群のオブジェクト子分子を生成する第三のサブサブステップを含む、請求項８記載のターゲット分子を進化させる方法。１６．突然変異のサブステップは、ランダムに二つの原子をブリードされた子分子から選択し、当該二つの原子間の結合子をランダムに変更して次期分子群の子分子を生成する第四のサブサブステップを含む、請求項８記載のターゲット分子を進化させる方法。１７．再生成のステップｂ）は、一定の確率に従い現行分子群から子分子を選択し、当該子分子が突然変異して次期分子群の子分子を提供するサブステップを含む、請求項７記載のターゲット分子を進化させる方法。１８．突然変異のサブステップは、ランダムに決めた特性を有する原子を取り出し、当該原子をブリードされた子分子に加えて、当該子分子を次期分子群へ与える第一のサブサブステップを含む、請求項１７記載のターゲット分子を進化させる方法。１９．突然変異のサブステップは、ランダムに一つの原子をブリードされた子分子から選択し、当該原子を子分子の一つから削除する第二のサブサブステップを含む、請求項１８記載のターゲット分子を進化させる方法。２０．突然変異のサブステップは、ランダムに一つの原子をブリードされた子分子から選択し、当該原子をランダムに選択した特性を有する原子と入れ替えて、次期群のオブジェクト子分子を生成する第三のサブサブステップを含む、請求項１９記載のターゲット分子を進化させる方法。２１．突然変異のサブステップは、ランダムに二つの原子をブリードされた子分子から選択し、当該二つの原子間の結合子をランダムに変更して次期分子群の子分子を生成する第四のサブサブステップを含む、請求項２０記載のターゲット分子を進化させる方法。２２．前記突然変異のサブステップは、現行分子群の親分子から第一、第二、第三、第四、のサブサブステップの一つに従い子分子をブリードするための確率を収納するテーブルを設け、当該テーブルから第一、第二、第三、第四、のサブサブステップの一つを選択し、現行分子群から選択した二つの親分子から子分子をブリードして、次期分子群の子分子を提供するサブステップを含む、請求項２１記載のターゲット分子を進化させる方法。２３．前記比較ステップａ）は、所望の特性セットをデジタル表現し、現行分子群の分子構造ををデジタル表現し、そして両者を一つづつ比較して類似性を決定するサブステップを含む、請求項１記載のターゲット分子を進化させる方法。２４．前記比較ステップａ）は、所望の特性セットを分子構造の指紋に変換し、現行分子群の分子構造ををデジタル表現し、そして両者を一つづつ比較してその間の距離を決定するサブステップを含む、請求項１記載のターゲット分子を進化させる方法。２５．前記所望の特性セットは、与えられたターゲット分子の分子構造である、請求項２４記載のターゲット分子を進化させる方法。２６．前記所望の特性セットは、関連する分子の属である、請求項２４記載のターゲット分子を進化させる方法。２７．前記属の分子特性を当該属の各分子が有しているかどうかを分析し、もし共通の特性があれば、対応のビットをセットするステップをさらに含む、請求項２６記載のターゲット分子を進化させる方法。２８．前記ｂ）ステップは、現行分子群の分子と所望の分子構造特性間の結合エネルギーを判断するための適合関数を実行し、当該所望の分子構造特性に従って結合サイトのモデルを生成し、そして当該分子を所望の分子構造間の結合エネルギーを判断するために確認分析を行うサブステップを含む、請求項１記載のターゲット分子を進化させる方法。２９．前記結合サイトが受容体であり、前記モデルを生成するサブサブステップは、当該受容体を入れる複数の球を生成し、当該複数の球をデジタル表現する、サブサブステップを含む、請求項２８記載のターゲット分子を進化させる方法。３０．前記確認分析のサブステップは、複数の球と現行分子群の各分子の分子構造間の距離をランダムに測定し、確認分析のために測定値を生成するサブステップを含む、請求項２９記載のターゲット分子を進化させる方法。３１．現行分子群の各分子は、各分子と結合する原子についての電荷から成り、そしてモデルを生成するサブステップは、当該所望の特性セットに従い結合サイトを形成する原子の電荷を定義づける、請求項２８記載のターゲット分子を進化させる方法。３２．前記確認分析のサブステップは、当該子分子の一つに関連する電荷と、結合サイトの電荷かんの電磁相互作用を判断して対応の測定値を出す、請求項３１記載のターゲット分子を進化させる方法。３３．前記比較するステップａ）は、現分子群の各分子のための実際の分子を合成し、所望の特性セットを持つ実際のターゲットモデルのサンプルを導入し、合成された分子とターゲット分子間の結合エネルギーを評価して、対応の測定値を出す、請求項３１記載のターゲット分子を進化させる方法。３４．前記比較するステップａ）は、前記所望の特性セットと現分子群の各分子間の適合値が、各分子に単一の適合値を提供するために決まっている適合関数を少なくとも一つ実施することから成る、請求項１記載のターゲット分子を進化させる方法。３５．前記ステップａ）は、現行分子群の各分子に、複数の適合関数を実行し、当該適合関数は対応する所望の特性セットを持つ、請求項３４記載のターゲット分子を進化させる方法。３６．前記複数の分子に対して、適合関数を実施されると、部分的な適合値が得られ、当該部分的適合値は現行分子群の各分子と結合される、請求項３５記載のターゲット分子を進化させる方法。３７．前記各適合関数の部分関数値は、共通ユニットの複数の適合関数から提供された適合値を表すために評価される、請求項３６記載のターゲット分子を進化させる方法。３８．前記再生成のステップｂ）は、現行分子群の限られた分子からだけ、次群の分子を提供する、請求項１記載のターゲット分子を進化させる方法。３９．前記各分子群は、一定の数の分子から構成されている、請求項１記載のターゲット分子を進化させる方法。