JP2000507940A - Method for designing chemical structures with common functional properties by computer - Google Patents

Method for designing chemical structures with common functional properties by computer

Info

Publication number
JP2000507940A
JP2000507940A JP09533880A JP53388097A JP2000507940A JP 2000507940 A JP2000507940 A JP 2000507940A JP 09533880 A JP09533880 A JP 09533880A JP 53388097 A JP53388097 A JP 53388097A JP 2000507940 A JP2000507940 A JP 2000507940A
Authority
JP
Japan
Prior art keywords
affinity
receptor
genotype
maximum
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP09533880A
Other languages
Japanese (ja)
Inventor
シュミット,ジョナサン,エム.
Original Assignee
ユニバーシティー オブ グエルフ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユニバーシティー オブ グエルフ filed Critical ユニバーシティー オブ グエルフ
Publication of JP2000507940A publication Critical patent/JP2000507940A/en
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Computing Systems (AREA)
  • Biochemistry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Saccharide Compounds (AREA)

Abstract

(57)【要約】 本発明は、立体配置と結合親和力との特定の組合せに基づいて共通した有用な機能特性を共有する化学構造を設計するためのコンピューターによる方法に係る。特に、本発明は、機能上生物学的受容体に類似するコンピューターでシミュレートされた受容体の製造方法を提供する。これらシミュレートされた受容体は、既知の標的分子に対して最適化された選択的親和力を示すように設計される。次いで、シミュレートされた受容体に対する選択的親和力を示す化学構造を作製し進化させる。 SUMMARY The present invention relates to a computer-based method for designing chemical structures that share common useful functional properties based on a particular combination of configuration and binding affinity. In particular, the present invention provides methods for making computer simulated receptors that are functionally similar to biological receptors. These simulated receptors are designed to exhibit an optimized selective affinity for a known target molecule. The chemical structures that exhibit selective affinity for the simulated receptor are then created and evolved.

Description

【発明の詳細な説明】 共通の機能特性を有する化学構造を コンピューターによって設計する方法 発明の利用分野 本発明は、立体配置と結合親和力との特定の組合せに基づいて共通した有用な 機能特性を共有する化学構造を設計するためのコンピューターによる方法に係る 。特に、本発明は、機能上生物学的受容体に類似するコンピューターでシミュレ ートされた受容体の製造方法を提供する。これらシミュレートされた受容体は既 知の標的分子に対して最適化された選択的親和力を示すように設計される。次い で、シミュレートされた受容体に対する選択的親和力を示す化学構造を作製し進 化・開発させる。 発明の背景 生物学的受容体は、折り畳まれて基質結合のための三次元エンベロープ(包み 込み構造)を作製するアミノ酸またはヌクレオチドの線状ポリマーである。これ らの線状列(linear arrays)の特定の三次元配置およびエンベロープ表面上の荷 電部位の配置は、機能効率に基づく進化上の選択の結果もたらされたものである 。 生物学的受容体の選択性は、受容体と基質との間に生成する吸引力と反発力の 強さの違いに依存する。これらの力の大きさは、受容体および基質の表面におけ る荷電部位の大きさ(magnitude)と近接さに応じて部分的に変化する。 基質はその表面に存在するかまたは誘導される荷電部位の数と大きさおよびそ れらの部位の空間配置において異なるので、結合親和力は基質の構造によって変 化し得る。同じ受容体に対して類似の結合親和力をもつ基質は、その誘導され固 定された荷電部位の少なくともいくつかで共通する空間配置を共有する可能性が 高い。受容体の機能が結合親和力と 関連しているのであれば、類似の結合親和力をもつ基質もまたその効果において 機能的に類似しているであろう。この意味で、受容体は基質間の類似性を認識ま たは定量するということができる。 受容体に対する選択的な結合親和力をもつ新規な化合物または基質を同定また は発見するために分子認識において使用されている伝統的な方法は、活性のある 基質の分子的に共通なサブグラフ(subgraph)を見出だしこれを用いて新しい類似 の化合物を予想することに基づいている。この技術の欠点は、結合に対して類似 の効力を示す基質が構造的に類似しているということを前提にしている点である 。しかし、多くの場合、構造的に類似していない基質が同じ受容体に対して類似 の結合親和力を示す可能性がある。定量的構造‐活性相関(QSAR)に基づく 最近の技術は、同じ構造クラス内で新規な化合物を進化・開発することにのみ適 しており、所望の選択的親和力を示す新しい分子構造を進化・開発する点ではあ まり適していない。たとえば、ディーン(Dean,Philip M.)の「分子認識:リガ ンド‐受容体相互作用における分子類似性の測定と探索(Molecular Recognition :The Measurement and Search For Molecular Similarity in Ligand-Receptor Interaction)」、分子類似性の概念と応用(Concepts and Applications of Mole cular Similarity)、ジョンソン(Mark A.Johnson)およびマギオラ(Geral dM.M aggiora)編、第211〜238頁(1990年)を参照されたい。 最近の努力は、原子と官能基が連結されている疑似受容体(pseudoreceptors) または連結されてない原子または官能基の組からなるミニ受容体(minireceptors )の原子モデルの構築に向けられている[スナイダー(Snyder,J.P.)、(199 3年)、ドラッグデザインにおける三次元QSAR:理論、方法および応用(3D QSAR in DrugDesign:Theory,Methods and Applications)、クビニイ(Kubinyi, H.)編、Escom,Leiden.、第336頁]。関連する方法には、既知の標的リガン ドをたくさんのモデル原子で囲み、リガンドと受容体モデルとの間に発生する分 子間力を計算することが含まれる。このようなモデルでは、計算された結合エネ ルギーと生物学的活性との間に高い相関があるが[ウェルターズ(Walters,D.E. )およびヒンズ(Hinds,R.M.)、(1994年)、J.Medic.Chem.,37:2527]、 この受容体モデルに対して選択的親和力を示す新規な化学構造を製造することが できる程までには開発されていない。 したがって、立体配置と結合親和力との特定の組合せに基づいて有用な機能特 性を有する新しい化学構造の設計の基礎として使用することができる共有する特 性を説明するのに必要充分な微細ではない(non-trivial)類似性をいろいろな化 学構造間で同定するための方法を提供することは極めて有利であろう。 発明の概要 本発明は、異なる化学構造が共有する機能特性を説明するのに必要かつ充分で あるそれらの構造間の微細でない類似性を同定する方法を提供する。本プロセス はまた、類似の機能特性を示す新規な化学構造を作製する方法も提供する。 本発明の根幹をなす基本的な概念は、立体配置と結合親和力との特定の組合せ に基づいて有用な機能特性をもつ化学構造を設計または発見するためにコンピュ ーターによる二段階プロセスを用いることである。このプロセスの最初の工程で は、抗体形成のアルゴリズムによるエミュレーシヨョン(emulation)を用いて、 選択された標的基質に対して最適化された結合親和力をもつ生物学的受容体に類 似するコンピューターで作製したシミュレートされた受容体の集団を作製するこ とである。本プロセスの第二段階では、シミュレートされたまたは仮想上(virtu al)の受容体を用いて、実在する化合物の結合親和力を評価するか、または最適 な結合を示す新規な基質を設計する。 本明細書に記載した方法は、結合選択性を最適化する進化プロセス(evolution ary process)を含む、生物学的受容体の選択された特徴と類似するシミュレート された受容体を提供する。本方法により作製される疑似体またはシミュレートさ れた受容体は、分子間の特定の類似性を認識 するのに使用することができる。抗体およびその他の生物学的受容体と同様に、 本発明により作製されるシミュレートされた受容体は特徴抽出機構(feature ext raction mechanism)である。すなわち、標的基質の共通または類似の構造的特徴 を同定または認識するのに使用することができる。受容体と標的基質との間の結 合親和力は特徴認識のための基準(metric)として使用される。標的基質は、特定 のシミュレートされた受容体との結合親和力に基づいて定量的に分類することが できる。特定の構造的特徴を共有する化合物は同じ仮想上の受容体に対して類似 の結合親和力も共有する。 生物学的受容体と基質との間の結合親和力は、隣接する受容体と基質の表面間 の立体適合の良好度、それら2つの表面の非極性領域の間の水の排除、および隣 接する荷電部位間で発生する静電力の強さによって決定される。場合によっては 、基質と受容体との間で共有結合の形成が結合親和力に寄与することもある。こ のプロセスによって作製されるシミュレートされた受容体は、それらの生物学的 相手と結合メカニズムが類似している。受容体と標的の表面間の平均的近似性、 および両表面の荷電部位間で発生した静電引力の強さを用いて結合親和力の測定 値が計算される。得られる結合親和力の値を用いて基質分子の類似性を評価する 。 結合親和力は全体として決定することができる。すなわち、結合親和力は、基 質表面全体とその基質を完全に取り囲む密接した受容体または受容体エンベロー プとの間の相互作用に依存し得る。この場合、基質間の全体的類似性の解析は有 用な定量的構造‐活性相関を確立するための基礎として適している。しかし、す べてではないがほとんどの生物学的系では、親和力は全体というよりはむしろ局 部的に決定される。基質分子と生物学的受容体との間の相互作用は通常、受容体 の孤立した断片と基質表面との間の接触に限定されている。この状況では、結合 親和力の生成に直接関与するのは基質の断片だけであるので、基質間の全体的類 似性の解析は構造‐活性相関を確立する方法として不適当である。 局部的に類似の構造は類似の構造断片を類似の相対位置および配向で 共有している。局部的に類似の構造は必ずしも全体として類似してはいない。分 子特性のサンプリングは、全体的類似性の評価を含む全サンプリング戦略、局部 的類似性の評価を含む断片サンプリング戦略、ならびに局部的および全体的な類 似性の評価を含む多数断片サンプリング戦略によって達成し得る。 局部的類似性の解析は類似の構造および電荷分布に対して基質の別々の領域を サンプリングすることに基づく。生物学的受容体の場合、局在化されたサンプリ ングは、隣接する基質と受容体の表面の不規則性または凹凸に起因する。密接し て対向した表面間の相互作用は、結合親和力を決定する際に、より離れた領域間 の相互作用より支配的である。隣接する表面の近似性はまた疎水性結合の強さも 決定する。本発明方法によって作製されるシミュレートされた有効な受容体では 、化合物間の機能的に関連する類似性を評価するために、標的基質(分子)の別 々の局部的サンプリングを使用しなければならない。 局部的類似性の解析は、次の2つのファクターのため複雑になっている。すな わち、1)特定の結合親和力に対して必要充分な関連する断片の数、位置および 種類(identity)が一般に、基質の化学構造からの簡単な推測によって確立するこ とができないこと、そして、2)サンプリングした断片の位置と配向が分子全体 の基本構造に依存すること、である。 化学基質間の類似性を分類することができるシミュレートされた受容体の作製 に関する本発明方法の一部は、本質的に、空間中の関連する位置において該基質 の関連する断片のサンプルとなる受容体の探索である。最適化のプロセスはシミ ュレートされた受容体の次の4つの特徴に基づく。1)汎用性、すなわち、受容 体は1つより多くの基質と結合することができる。2)特異性、すなわち、受容 体の結合親和力は基質構造と共に変化する。3)効率性(parsimony)、すなわち 、受容体は局部構造特徴の最小の組に基づいて基質を区別する。4)変異性、す なわち、受容体の構造の変化によって特定の基質に対するその結合親和力が変化 し得る。文字列(character string)によって表される線状の遺伝子型の形 態で受容体表現型がコードされると、シミュレートされた受容体の構造特性の変 異、組換えおよび遺伝のプロセスが容易になる。 これらの基本的評価基準を満たすシミュレートされた受容体は、進化選択育種 法(evolutionary selective breeding strategies)を用いて、局部的に類似する 基質に対する特異的結合親和力を得るように最適化することができる。これを達 成するには、受容体の空間配置および荷電部位分布を、変化または変異を受ける ことができる遺伝可能な形態でコードする。生物学的受容体と同様に、本方法に よって作製されるシミュレートされた受容体は三次元の排除空間を規定する。そ のような三次元空間は、充分な長さと湾曲の一次元の経路によって任意の分解度 で輪郭を描くことができる。アミノ酸の線状ポリマーから形成されるタンパク質 はそのような構造の一例である。同様に、シミュレートされた受容体の三次元構 造は転回指示(turning instructions)のひとつの線形列としてコードすることが できる。この受容体のコードされた一次元形態はその遺伝子型を構成する。結合 親和力を評価するために使用する解読された形態はその表現型を構成する。最適 化のプロセス中に、受容体遺伝子型に変化(変異)を施す。次に、これらの変化 が表現型の結合親和力に対して及ぼす影響を評価する。望ましい結合親和力を有 する表現型を生成する遺伝子型は、変異および選択過程の反復により、表現型の 選択した最適化度が達成されるまで、さらなる変化のために保持される。最適な 結合特性を有するシミュレートされた受容体の集団を作製するには、古典的な遺 伝子アルゴリズムを含む各種の進化戦略(evolutionary strategies)を使用でき る。 次いで、この方法によって作製した受容体を用いて、シミュレートされた受容 体を製造する際に選択基準として用いた分子標的種の特定の有用な性質を共有す る新規な化学構造(化合物)を作製または同定する。受容体との相互作用を選択 基準として使用して、受容体と最適に適合するような新規な化学構造を導く。こ れらの構造は受容体選択性に対する必要充分要件を満たさなければならないので 、元の分子標的の生物学的 活性と類似の活性ももつと思われる。増大した選択性を有するシミュレートされ た受容体の集団はまた、既存の化学構造からこれらの有用な特性を共有し得る高 い親和力をもつ化合物をスクリーニングするのにも使用できる。また同じプロセ スを用いて、選択された毒物学的または免疫学的性質を有する化合物をスクリー ニングすることもできる。 本発明のひとつの態様では、予め選択された機能特性を有する化学構造を設計 するためのコンピューターに基づく方法が提供される。この方法は、 (a)線形文字配列(linear character sequence)にコードされているシミュ レートされた受容体表現型の物理的モデルを製造し、少なくともひとつの定量可 能な機能特性を共有する一組の標的分子を用意し、 (b)各標的分子に対して、 (i)有効な親和力計算を用いて、該受容体と該標的分子との間の親和力を 複数の配向の各々で計算し、 (ii)計算された親和力を合計することによって合計親和力を計算し、 (iii)最大親和力を同定し、 (c)計算された合計親和力および最大親和力を用いて、 (i)該最大親和力と該定量可能な機能特性との間の最大親和力相関係数を 計算し、 (ii)該合計親和力と該定量可能な機能特性との間の合計親和力相関係数を 計算し、 (d)該最大相関係数および該合計相関係数を用いて適合係数(a fitness coe fficient)を計算し、 (e)受容体の構造を変化させ、予め選択された適合係数を有する受容体の集 団が得られるまで工程(b)〜(d)を繰返し、 (f)分子線形文字配列にコードされた化学構造の物理的モデルを用意し、前 記有効な親和力計算値を用いて複数の配向にある各受容体と該化学構造との間の 親和力を計算し、計算された親和力を用いて親和力適 合性スコア(an affinity fitness score)を計算し、 (g)該化学構造を変化させて化学構造の変形体を生成させ、工程(f)を繰 返し、 (h)その親和力スコアが予め選択した親和カスコアに近い化学構造の変形体 を保持し、かつさらに変化させる、 各工程を含んでなる。 本発明の別の態様では、予め選択した機能特性に関して化学構造をスクリーニ ングする方法が提供される。この方法は、 a)空間占有および電荷をコードする受容体線形文字配列を作製することによ ってシミュレートされた受容体遺伝子型を生成させ、 b)該遺伝子型を解読して受容体表現型を生成させ、選択された機能特性を示 す少なくひとつの標的分子を提供し、有効な親和力計算を用いて複数の配向で該 受容体と各標的分子との間の親和力を計算し、各標的分子と受容体との間の合計 親和力および最大親和力を計算し、該標的分子の該機能特性に対する合計親和力 の合計親和力相関係数および該機能特性に対する最大親和力の最大親和力相関係 数を計算し、該合計親和力相関係数および該最大親和力相関係数に依存する適合 係数を計算し、 c)受容体遺伝子型を変異させ、かつ工程b)を繰返し、予め選択された適合 係数をもつ受容体の集団が得られるまで、増大した適合係数を示す受容体を保持 し、かつ変異させ、そして d)該有効な親和力計算を用いて複数の配向でスクリーニングしようとする化 学構造と各受容体との間の親和力を計算し、親和力適合スコアを計算する(但し 、これは、化合物と各受容体との間の合計親和力および最大親和力を計算し、該 合計親和力および該最大親和力の少なくともひとつを該少なくともひとつの標的 と該受容体の集団との間の合計親和力および最大親和力と比較することを含み、 これによりこの比較が、該少なくともひとつの標的分子に対する該化学構造の機 能活性のレベルを示すことになる)、 各工程を含んでなる。 本発明のもうひとつ別の態様では、類似の機能特性をもつ化合物に対して選択 的親和力を示す生物学的受容体に類似するシミュレートされた受容体を設計する 方法が提供される。この方法は、 a)空間占有および電荷をコードする受容体線形文字配列を作製することによ ってシミュレートされた受容体遺伝子型を生成し、 b)該遺伝子型を解読して受容体表現型を生成させ、類似の機能特性を共有す る一組の標的分子を用意し、有効な親和力計算を用いて複数の配向で受容体と各 標的分子との間の親和力を計算し、各標的分子と受容体との間の合計親和力およ び最大親和力を計算し、各標的分子の機能特性に対する合計親和力の合計親和力 相関係数および各標的分子の該機能特性に対する最大親和力の最大親和力相関係 数を計算し、各標的分子に対する該合計親和力相関係数および該最大親和力相関 係数に依存する適合係数を計算し、そして c)該遺伝子型を変異させ、かつ工程b)を繰返し、予め選択された適合係数 をもつ受容体の集団が得られるまで、増大した適合係数を示す受容体を保持し、 かつ変異させる、 各工程を含んでなる。 本発明の別の態様では、予め選択された機能特性を有する化学構造を設計する ためのコンピューターに基づく方法が提供される。この方法は、 (a)少なくともひとつの定量可能な機能特性を共有する一組の標的分子およ び受容体の物理的モデルを用意し、 (b)各標的分子に対して、 (i)有効な親和力計算を用いて、該受容体と該標的分子との間の親和力を 複数の配向の各々で計算し、 (ii)計算された親和力を合計することによって合計親和力を計算し、 (iii)最大親和力を同定し、 (c)計算された合計親和力および最大親和力を用いて、 (i)該最大親和力と該定量可能な機能特性との間の最大親和力相関係数を 計算し、 (ii)該合計親和力と該定量可能な機能特性との間の合計親和力相関係数を 計算し、 (d)該最大相関係数および該合計相関係数を用いて適合係数を計算し、 (e)予め選択された適合係数を有する受容体の集団が得られるまで、該受容 体の構造を変化させ、かつ工程(b)〜(d)を繰返し、 (f)化学構造の物理的モデルを用意し、該有効な親和力計算を用いて複数の 配向にある各受容体と該化学構造との間の親和力を計算し、計算された親和力を 用いて親和力適合スコアを計算し、 (g)化学構造を変化させて該化学構造の変形体を生成させ、工程(f)を繰 返し、 (h)その親和力スコアが予め選択した親和力スコアに近い化学構造の変形体 を保持し、かつさらに変化させる 本発明のさらに別の態様では、原子要素を含む化学構造をコードする方法であ って、該化学構造の各原子に対する空間占有と電荷をコードする線形文字配列を 用意することを含んでなる該方法が提供される。 図面の簡単な説明 以下、単なる例示として添付の図面を参照しつつ本発明の方法を説明する。 図1は、本発明の対応する表現型形成部分を生成するための遺伝子型コードの 作製と翻訳との関係を示すフローチャートである。 図2は、本発明の点突然変異形成部分を用いて一組の基質に選択的に結合させ るための受容体の最適化における工程の概略を示すフローチャートである。 図3は、一組の化学基質に対して最適化された選択的結合親和力をもつ関連す る受容体の集団を生成し、これらの最適化された受容体を用い て共通の機能特性をもつ一組の新規な化学基質を生成するプロセスにおける工程 の概略を示すフローチャートである。 図4aは、リガンド作製の例に関連する実施例で使用したいくつかの化合物を 示す。 図4bは、リガンド作製の実施例で本発明の方法によって作製されたリガンド 1.1〜1.4を示すものであり、各リガンドは少なくともひとつの配向をもっ ており、構造上ベンズアルデヒドに類似している。 図4cは、蚊を寄せ付けない効力を示す化学構造の設計に関連するリガンド作 製の実施例で本発明の方法によって作製されたリガンド2.1〜2.4を示す。 好ましい態様の説明 本方法は2つの部分に分けることができる。すなわち、(A)共有される機能 特性をもつ化合物に対して選択的な親和力を有するシミュレートされた受容体の 集団の進化・開発(evolution)、および(B)共有される機能特性を有する新規 な化学構造の作製である。パート(A)は、1)受容体の遺伝子型および表現型 の作製、2)該受容体に対する既知の化学構造の提示、4)該化学構造に対する 該受容体の親和力の評価、5)該化学構造に対する該受容体の選択性の評価、6 )該化学構造に対して最適化された選択的親和力をもつ一群の関連受容体の確率 的な進化・開発、毒物学的および薬理学的活性に関する化学基質のスクリーニン グ、ならびに最適化された受容体を用いた、該受容体に対して選択的な結合親和 力をもつ新規な化学構造の設計を含むいくつかの工程からなっている。 本発明の最良の実施態様に関する以下の記載では、分子および原子の半径、分 極率、有効双極子値、ならびに遷移状態およびその他のファクターに関する各種 の表を参照する。これらの値は本明細書の末尾の表I〜Vに挙げる。プロセス計 算の非限定例を示すフローチャートは本明細書末尾のモジュール1〜14に添付 する。 パートA:共通の機能特性を有する標的分子に対する選択的親和力を示すシミュ レートされた受容体の集団の開発 (1)遺伝子型コード及び受容体表現型生成 シミュレートされた受容体遺伝子型及び表現型の両方が計算の目的である。シ ミュレートされた受容体の表現型は、直径が長さにおいて原子状水素のファンデ ルワールス半径(≒110pm)に等しい球形のサブユニットの折り畳まれた非分岐 のポリマーからなる。サブユニットは、それらの主軸の各々での球の切片に対応 する6つの点の任意の2つにおいて互いに結合することができる。この実例にお いては、サブユニットの間の結合は伸びることができず、あるいは転回すること ができず、2つの結合されたサブユニットの中心はそれらの側面の長さに等しい 距離(すなわち1水素半径)だけ常に隔てられている。2つのサブユニットがそ れらの共通の隣接するものの対抗する面に結合されていない場合に転回が起こる 。左、右、上、下の4種類の直角の転回が可能である。転回は主軸の1つに平行 に行われなければならない。計算を簡単にするため、転回によりポリマー中の他 のサブユニットと交差する場合は、サブユニットが他のサブユニットと同じ空間 を占めることを許容する。 完全なシミュレートされた受容体は、一以上の別々のポリマーからなる。多重 のポリマーからなる受容体の場合、個々のポリマーは空間の異なる点から始まる ことができる。計算を簡単にするため、この実例においては、単一の受容体を構 成する全てのポリマーは同じ長さを有するように選択する(=サブユニットの数) 。この限定は機能性のための要件ではなく、長さの異なるポリマーのセットは特 定の系をモデル化するために有用であり得る。 各ポリマーの構造は、転回の指示の連続的なセットとしてコードされる。この 指示は、各ポリマーにおける最初のサブユニットの当初の配向に基づいた内部参 照フレームに対する個々の転回を指定する。 この実例においては受容体及び基質の水和を明確に処理せず、その代わりに、 結合部位に存在する水分子はすべて永久的に受容体表面に結合し、その構造の一 体的な部分を構成すると仮定する。これは任意の近似であり、当業者であればよ り正確な処理に置き換えることができることを理解するであろう(例えば、VanOs s, 1995,Molecular Immunology 32:199-211参照)。 図1に示すように、コード作成モジュールは、文字のランダムな列を生成する 。各文字は、転回の指示を表すか、仮想の受容体を構成する三次元形態における 点の荷電特性あるいは反応性を決定する。デカルト(直交)座標枠に基づく受容 体の三次元形態を表す列を生成するためには、最小で5つの異なる文字が必要で ある。その他の枠組み、例えば四面体の構造も、転回の指示の異なるセットを使 用して構築することができる。文字は、三次元空間における仮想受容体構造の現 在のパスに対して定義される転回の指示を表す(すなわち、指示は仮想受容体の 内部参照フレームを引用するものであり、任意の外部参照フレームを引用するも のではない)。 転回の指示は、現在の方向とポリマーの配向に対して与えられる。左、右、上 、及び下への転回だけが許容される。転回が起こらない場合は、ポリマーは終結 するか、その現在の方向に連続することができる。 直交系については、最小の文字セットは、C1=転回なし、C2=右転回、C3=左転 回、C4=上転回、及びC5=下転回である。指示を組合せて対角線方向の転回、例え ばA1,2=C1C2、A2,1=C2C1等を形成し得ることは理解されるであろう。異なる荷電 あるいは反応性の状態を決定する異なる文字の数には制限がなく、実験的な確認 により調節することができる。コードは、長さ(文字の数)及び系列中で特定の 文字が現れる頻度の両方において異なってもよい。遺伝子型作成の例 遺伝子型コード作成と表現型発現の以下の例は、当業者によれば例示のためだ けのものであることが理解されるであろう。この例では以下の規則を使用する。 (1)コードを生成するために使用する文字セットは、転回の指示を示す5文字 と荷電部位を指定する2文字、すなわち、「0」=転回なし、「1」=右転回、「2 」=上転回、「3」=左転回、「4」=下転回、「5」=正に荷電した部位(転回なし )、及び「6」=負に荷電した部位(転回なし)からなる。 (2)サブユニットは帯電したもの、あるいは帯電してないものの2つの種類を 有する。全ての帯電したサブユニットは、正または負の単位電荷を有すると仮定 す る。電荷の均一な大きさは任意の規則である。 (3)受容体は15の別々のポリマーを含む。完全なコードの長さは常に15の倍数 である。各ポリマーの長さは、全コード長を15で割ったものに等しい。受容体は 異なる又は一定の長さの任意の数の別々のポリマーから構築され得ることは理解 されるであろう。 (4)以下のパラメーター、(a)全コード長(及びポリマー長)、(b)各文字がコ ード列中に存在する頻度、及び(c)文字の組合わせの発生は、ユーザーにより設 定される。モジュールIは遺伝子型コード作成のサンプルのフローチャートを示 す。受容体表現型作成の例 各遺伝子型コードは翻訳され、その対応する表現型すなわち仮想受容体の三次 元設計図を生成する。あらかじめ定義された開始点から、翻訳アルゴリズムを使 用して、受容体ポリマーを構成する連続したサブユニットの空間における位置を 記載する一連の座標トリプレットに転回の指示を変換する。各ポリマーの開始座 標は、翻訳に先立って与えなければならない。翻訳においては、連続したサブユ ニットの中心は水素原子の共有結合直径に等しい距離だけ離れていると仮定する 。 翻訳アルゴリズムは、コード列を逐次読み込み、連続した転回及び直線パス部 分を生成する。外部の座標系に対する連続した転回の解読は、転回に先立つ配列 に依存する。受容体を構成する各ポリマーについては、当初の配向は同じである と仮定する。この実例においては、翻訳アルゴリズムは表Iに示すが、これは入 力及び出力状態を示している。転回が起こらない場合は、Δx、Δy、Δzについ ての最も最近の値と新しい状態を使用して新しい座標トリプレットを計算する。 電荷部位は、直線状の(転回のない)部分として扱われる。古い状態の初期値は 、20である。 以下のパラメーターは、ユーザーが設定することができる。 a.受容体を構成する各ポリマーの開始座標。 出力は、 a.3つのベクトル(各軸について1つ:{x1,x2,x3...xn},{y1...yn},{z1...zn })、 b:三次元の2成分のマトリックス、 c.荷電部位座標の別のベクトル として記憶される。コード翻訳のサンプルプロセスをモジュール2に示す。 (2)標的生成 標的は、球形の原子からなる分子として表される。原子は、各原子種に特徴的 な固定された半径を有する剛体球であるとみなされる。標的原子と仮想受容体と の間の斥力が無限大であるとみなされる剛体球半径は、表2に示した露出ファン デルワールス半径によって概算される。表2に示したものの代わりに、ファンデ ルワールス半径の他の推定値を使用することもできる。 共有結合によって結合された2つの原子の、原子の中心の間の距離は、それら の共有結合半径の合計として表される。共有結合半径は、結合次数と原子種によ って変化する。結合半径の適した値の例を表3に示す。一次近似として、結合距 離は固定されたものと仮定する(すなわち結合振動は無視する)。結合の転回を 許容すると、同じ構造の多重の配置により転回状態を代表するサンプルをとるこ とが必要となる。仮想受容体との結合により、エネルギー的に不安定ではないよ うに配置が安定化され得るので、配置的な安定性は考慮しない。種々のエネルギ ー最小化アルゴリズムを標的リガンドの生成に使用することができる。 結合双極子モーメントにより生じる電荷は、原子の核に局在すると考えられる 。負電荷は、より大きい電気陰性度を有する原子が保持する。この実例において 使用された双極子値は表4に示す。表4に示したものの代わりに、双極子値のそ の他の推定値を使用することができる。 (3)標的提示 各標的のシミュレートされた受容体に対する親和力を、受容体の上部表面に対 する標的の複数の配向について試験する。この上部表面は翻訳アルゴリズムによ って定義される。結合親和力の評価の前に、標的と受容体を接触させなければな らない。受容体の少くとも1つのサブユニットと標的の少くとも1つの原子の中 心の間の距離がそれらの合わせたファンデルワールス半径と等しいとき、接触が 起こる。接触点における標的と受容体の相対的な位置を決定するために、標的を 受容体表面に向かってその表面に対して垂直な経路に沿って徐々に移動させ、受 容体と標的の幾何学的中心を通過させる。接触が起こるとき、標的は受容体に対 してその対立位置に達する。対立位置が達成されたときの標的原子の翻訳された 位置を使用して標的の原子と受容体のサブユニットの間の距離を計算する。これ らの距離は、静電的相互作用と近接度を計算するために使用される。 この実例においては、標的は受容体の方へ直線的に移動し、接触の時点でその 最初の配向を保持すると仮定する。代替的なアプローチとしては、標的が受容体 に接近するにつれてその配向を徐々に変化させ、接触の時点において最大の親和 力位置が得られるようにする。この方法は実施したものに機能的に類似している が、計算上はずっと複雑である。この実例においては、多重の配向をより小さい 計算労力で試験している。この実例では、受容体のx及び/またはy軸に沿った 経路の調節可能な置換を可能として、より大きい分子を収容する。この特徴は、 大きさが異なる分子を同じ受容体上で試験するときに、選択性を増強するために 必要である。 対立位置の計算に先立ち、標的の配向は、x、y及びz軸のそれぞれのまわりに6 °増加させるランダムな転回によって無作為化される。より大きい又はより小さ い転回の増加を使用してもよい。標的のこれらのランダムな配向のそれぞれは、 与えられた試験系列においてユニークなものである。最適化プロセスの信頼性は 、試験される標的の配向の数並びに評価される標的化合物の数に依存する。標的 提示のためのサンプルプロセスをモジュール3に示す。 (4)親和力の計算 近似方法 この実例は、比較的小さな計算労力で親和力の主成分を評価する、単純化され た近似に基づくものである。近似は、以下の節において説明する。しかし、より 正確な親和力値を与えるより正確な親和力計算方法を使用してもよいことは、当 業者であれば理解されるであろう。より正確な親和力値を計算するための公知の 計算パッケージを本プロセスに直接使用してもよい。 クラウンエーテルの研究により、より大きい化合物の電子密度を解明するため に小さい分子の電子密度分布を使用することができることが示されている (Bruning,H.And Feil,D.(1991)J.Comput.Chem.12:1)。電荷と双極子モー メントにより後に特徴づけられる、厳格に局在する電荷分布を定義するために Hirshfeldのストックホルダー法を使用することができる(Hirshfeld,F.L.(197 7)Theor.Chim.Acta 44:129)。結果は、分子の全電子密度分布の重複した原子 の部分への分裂であり、そのサイズは自由原子半径に関連する。 クラウンエーテルにおいて、静電的相互作用の主成分が原子の間の電荷の全体 的な移動ではなく局所的な移動により決定されることを示すことが可能である。 電荷分布は、異なる化学結合による狭い範囲の効果によって主として決定される 。特に、非近隣の原子は、原子の双極子モーメントにほとんど寄与しない。それ に加えて、原子間の電荷移動は全分子の静電場によっても影響されるが、クラウ ンエーテルについての計算によれば、電荷分布に対する影響は非常に小さいこと が示される。 計算されたストックホルダー原子の電荷と双極子モーメントを使用して静電相 互作用を解明することができる(Bruning,H.And Feil,D.(1991)J.Comput.Ch em.12:1)。ファンデルワールス半径を越えると、原子の四極子モーメントはわ ずかに貢献するのみである。原子の電荷だけを考慮に入れた静電電位の計算は非 常に貧弱な結果を与えるが、双極子モーメントを使用することにより改善された 値が得られる。 これらの考えに基づいて、本発明の方法は、標的リガンドとシミュレートされ た受容体の間、及びシミュレートされた受容体と2つの測定に基づいて設計され た化学構造の間の親和力の近似化を導入している。 1.シミュレートされた受容体の帯電したサブユニットと標的リガンド(化学構 造)の原子双極子の間に生成される静電気力の大きさ。帯電したサブユニットは 移動不可能な単位電荷を有すると仮定されるので、この力の大きさは原子双極子 の大きさに直接比例し、シミュレートされた受容体とリガンドの原子双極子との 間の距離に反比例する。 2.有意なロンドン分散力の生成のためのリガンドの非極性領域に十分に近いシ ミュレートされた受容体の非極性又は非荷電サブユニットの比率。この実例において親和力計算に使用した仮定 1.この実例によって評価される化学基質標的は、中性(すなわちイオン化しない) 分子であると仮定する。これは任意の限定であり、荷電及び非荷電標的に適用で きる実例は同じ方法を使用して開発することができる。 2.双極子モーメントは原子核に局在すると仮定する。親和力の類似した解析は 、双極子モーメントが共有結合の中心に位置すると仮定して行うことができる。 Allinghamら(1989)によると、これらの仮説は機能的に等価である。 3.仮想受容体の周囲の環境は、標的が溶質として存在する溶媒系であると仮定 する。標的は溶媒と仮想受容体とに有効に分配される。 4.親和力を計算する時点において、標的と受容体は互いの間で静止し、特定の 固定された配向にあると仮定する。 5.標的は、受容体表面上の2種類の部位、固定された荷電部位(負または正に 荷電した)及び非極性部位のみと相互に作用すると仮定する。 これらの仮定に基づくと、相互作用の強度に対する以下の貢献を考慮するのみ でよいことになる。 1.電荷-双極子 -Q2μ2/6(4ΠE)2kTr4 2.電荷-非極性 -Q2α/2(4ΠE)2r4 3.双極子-非極性(デバイエネルギー) -μ2/(4ΠE)2r6 4.非極性-非極性(ロンドンエネルギー) -.75[hνα2/(4ΠE)2r6] この実例においては、近似により相対的な強度のみを考慮するので、全ての定 数は無視される。さらに、固定された荷電部位は単一のものであり正または負の いずれかであると仮定される。これに基づいて、4つの成分は下記の簡略化され た形態に書き直すことができる。 1.電荷-双極子 -μ2/r4または-μ/r2 2.電荷-非極性 -α/r4 3.双極子-非極性(デバイエネルギー) -μ2α/r6または-μα.5/r3 4.非極性-非極性(ロンドンエネルギー) -α2/r6または-α/r3 一般に、上記2及び3は広範囲の相互作用にわずかにのみ貢献する。しかし、 1及び4はいずれも相互作用エネルギーに有意に寄与する。この実例においては 、非極性断片の間の大部分の相互作用は、受容体の隣接するアルキル及び芳香族 水素及び非極性サブユニットの間で起こると推定される。これらの条件下ではα の値はほぼ一定であると仮定される。疎水性強度及び水排除の貢献 溶媒和効果は、結合親和力生成における重要な考慮事項である。例えば、疎水 結合形成は、非極性の疎水基の接近した空間的結合に依存し、疎水性の領域と水 分子の間の接触を最小にする。疎水結合形成は抗体-抗原結合の全強度の半分程 度まで貢献し得る。また、受容体と基質表面の水和も有意な因子である。受容体 または基質表面の極性部位に結合された水は、表面の間の連結橋を形成すること によって結合を阻害し、あるいは親和力を増加させ得る。 疎水性相互作用は、水中での疎水性分子間の強い引力を説明するものである 。受容体-標的相互作用の場合、それは標的の非極性断片及び非極性受容体サブ ユニットの隣接する領域の間の引力をいうものである。この効果は主としてエン トロピー効果によって起こり、表面の再配列を生じ、隣接する非極性領域の間で 水が排除される。しかし、疎水性相互作用の正確な理論的処理は利用できず、疎 水性の力は、抗体と抗原の間の全引力の50%程度に貢献すると見積もられる。標 的と仮想受容体の間の疎水性相互作用を見積もるために、この実例においては標 的との結合により溶媒和から効果的に保護される受容体の比率を評価する。標的 上の非極性原子の固定された距離の範囲内にある全ての非極性(荷電していない )サブユニットは、前記の限定距離に等しいかそれより大きい直径の溶媒分子に よる溶媒和から保護されると考える。組合せによる親和力計算 この実例において使用した組合せによる親和力計算は、相互作用の2つの測定 、すなわち、電荷-双極子相互作用の合計強度及び近接度の測定を組合せたもの である。この実例においては、これらの親和力は等方性であるものと仮定する。 親和 力の異方性の計算を使用すれば、計算はより複雑であるが、より大きい区別能力 が得られ得ることは当業者により理解されるであろう。 電荷-双極子相互作用は、D=Σμi/rij v(μiは標的のi番目の原子の双極子モ ーメントであり、rijは受容体上のi番目の原子とj番目の荷電部位の間の距離 であり、係v数は2、3または4に設定することができる。)により計算される。 全親和力へのDの貢献は、vのより大きい値についての電荷分離に対してより鋭敏 になる。 近接度測定は、p=Σni/N(niは0.75デバイ以下の双極子モーメントを有する標 的のi番目の原子からの最大距離δだけ隔てられた受容体の荷電してないサブユ ニットの数である)として計算される。この実例においては、6は1〜4サブユニ ット直径(これは、水のファンデルワールス半径を近似するものである)の範囲 をとり得る。Nは受容体を構成するサブユニットの全数である。 親和力値Aは、以下の関係A=[P(D+NP/k)]0.5(kは適合定数、この実例において はk=10000)を使用してDとPから計算される。式中Pの値は2つの役割を果たす。 第一に、これは重み付け因子である。「適合度」の測定値として、標的と受容体 の非極性領域が緊密に接触しているそれらの配置に好適な親和力値にバイアスを かけるのに使用する。これらの条件下では、疎水性相互作用と非極性相互作用エ ネルギーは大きくなり、結合の安定性と強度に有意に寄与する。これらの条件下 では、標的が受容体から逃避する可能性のある経路がより少なくなり、その保持 時間が長くなる。第二に、Pは相互作用の強度に対する分散エネルギーの貢献を 評価するために使用される。分散エネルギーは荷電してない非極性領域に対して のみ有意であり、標的と受容体が互いに近接しているとき(すなわち互いにδの 範囲内にある)にのみそれが有意であると仮定する。k及び6の値を調節してP及 びDの相対的な貢献を変更できる。一般に、Pは非極性標的を支配し、Dは大きい 局所的な双極子を有する標的に有意である。水素結合は、標的ヒドロキシル、カ ルボキシルまたはアミン官能基と同時に相互作用する負または正に帯電した対に なった受容体単位により近似される。親和力計算の代替的アプローチ−結合分極率 場合によっては、親和力計算に標的原子の相対的な分極率に対応するパラメー ターを導入することが有利であり得る。この場合、A=[P(D+NP2/k)]0.5におけるP2 を計算するための式はP2=Σni/Nではなく、P2はP2=Σαini/N(niは標的のi番 目の原子からの最大距離δだけ隔てられた受容体の荷電しているか荷電していな いサブユニットの数であり、αiは標的のi番目の原子の相対分極率である)で計 算される。簡略化するため、αHは脂肪族水素について1.0に設定することができ る。分極率を使用する場合は、kの値を調節しなければならない。隣接する結合 の分極率の合計に基づいたサンプル分極率を表Vに示す。 分極率は電子雲の移動と関連するので、分子の分極率はその共有結合の特徴的 な分極率の合計として計算することができる。この加算性は、非極在化された電 子を有しない非芳香族分子にあてはまる。別の方法−官能基特異性 この実例において使用される親和力近似は、局所的電荷、分散エネルギー及び 標的−受容体分離の関係を保存する、機能的に類似した計算によって置き換える ことができる。さらに、帯電した標的についての親和力測定値を構築してもよい 。この実例では非共有結合相互作用だけを評価するが、選択された標的官能基と 特異的な共有結合形成反応をすることのできる仮想受容体サブユニットを含める ことにより方法を拡張してもよい。モジュール5は、本発明において使用される 好ましい効果的な親和力計算のサンプルフローチャートを示す。 (5)選択的親和力の評価 仮想受容体と標的基質のセットとの間の適合度は、標的の既知の活性又は親和 力値を、仮想受容体−標的複合体について得られたものと比較することによって 評価する。最適に選択的な仮想受容体の最大の親和力は、既知の親和力測定値に 強く相関していなければならない。点突然変異の連続した反復を使用して、基質 のセットと仮想受容体との間のこの相関を増強することができ(図2)、あるい は仮想受容体の集団の選択性を最適化するために生成プロセスの連続した反復を 使用してこの相関を増強することができる(図3)。 既知の値は、結合親和力に依存することが知られているか、そのように考えら れる任意の指標とすることができ、(限定するものではないが)ED50、ID50、結 合能親和力、凝集測定値等を含む。試験される値は正(positive)でなければな らない。データの対数関数的な転換が必要であり得る。重み付けされていない階 級データは使用することができない。 最大の結合親和力を与える標的の最適な配向は、試験の前には未知である。受 容体-標的親和力の範囲を代表する測定値を得るために、各標的を、受容体表面 に対する種々のランダムな配向を使用して繰り返し試験しなければならない。各 試験では、モジュール4を使用して親和力を評価する。一般に、得られる最大の 親和力値の信頼性はサンプルのサイズに依存するが、これはサンプルが真の最大 値を含む可能性が増大するからである。標的の配向の同じセットを使用して各受 容体を試験する。 この実例では、2つの方法、1)平均の(または合計の)親和力及び最大の親 和力を組合せた測定値を使用して、より高い選択性を有する受容体を選択するこ と、及び、2)最適化プロセスを連続的に反復することにより試験される配向の 数を徐々に増加させること(最適化は小さい標的配向のセットで開始し、より大 きい適合を示す受容体を作製し、さらに多くの配向を試験する)を使用して、最 適化された受容体の作製のための大きいサンプルのセットの必要性を回避する。 この実例においては、各標的の試験された全ての配向について得られた親和力 値について、合計を計算する。この合計親和力スコアは、受容体と標的との間の 平均親和力の測定値である。同時に、最大親和力値も決定する。 既知の値と合計親和力rSA 2及び最大親和力rMA 2の両者との間の相関を計算する 。活性を示さない標的化合物は仮想受容体に対する親和力を殆ど又は全く示さな いという仮定に基づいて、原点(0,0)を相関に含める。この仮定は常に有効と いうわけではなく、他の切片値が必要となる試験もあり得る。 合計親和力を使用する相関は、平均値適合度の測定値である。この相関が大き いが、最大親和力と既知の親和力との相関が弱い場合には、その結果は、仮想受 容体が選択的でないこと、すなわち標的の多重配向が効果的に受容体と相互に作 用することができることを示唆している。反対に、最大親和力が既知の親和力値 に高度に相関し、合計親和力との相関が弱い場合には、仮想受容体は非常に選択 的であり得る。合計親和力及び最大親和力の両方が既知の親和力と高度に相関す る場合は、サンプルとされた配向は限定的なエラーを有する受容体の応答特性と される可能性がある(タイプI及びタイプIIの両者のエラーが減少しており、偽 陽性あるいは偽陰性結果のいずれかの可能性)。既知の親和力と合計親和力の間 の相関を最小にし、最大親和力と既知の親和力との間の相関を増大させることが より適当である場合もある。そのような選択では、全合計から最大親和力値を差 し引いて、混乱させるバイアス源としてのこれらの値を除去する必要がある。 この実例においては、組合せによる相関値を受容体選択のための基礎として使 用する。この値は、合計親和力と最大親和力の積の平方根として計算される。 F=(rMA 2×rSA 2)0.5 この値は、仮想受容体に適用される進化プロセスによって最適化される。注:rMA 2 及びrSA 2が互いに強く相関する場合は、rSA 2に寄与している値は個々に最大親 和力値と密接に相関するか、あるいは合計に対しては無視してよい程度しか寄与 しないものでなければならない。あるいは、(合計親和力−最大親和力)対既知 の親和力の相関(rSA-MA)を計算することができ、そして測定値、 F=(rSA 2×(1-rSA-MA 2))0.5 が最大化される。この測定値を使用することにより、標的の配向の非常に限定さ れたセットについて高い親和力を有する受容体が選択される。モジュール5は、 サンプル適合度計算のフローチャートを示す。 (6)最適化プロセス 最適化プロセスの目的は、標的受容体のセットについての選択的親和力を有す る仮想受容体を開発することである。解を見つけるための非常に効率的なメカニ ズムが必要であるが、これは300の指示を含む可能な遺伝子型の総数は7300又は 約10253であるからである。以下の4つの段階は最適化プロセスにおける工程を まとめたものであり、以下に各段階をより詳細に説明し、計算例を示す。 第1段階:ランダムな遺伝子型のセットを作製し、活性の最小レベルについて スクリーニングする。遺伝的アルゴリズム(組換え)及び1方向性突然変異法を 使用した別の最適化のための基礎として選択された遺伝子型を使用する。 第2段階:選択された遺伝子型を変異させて、組換えのための異なっているが 相関する遺伝子型の育種集団を作製する。組換えのための集団から最も選択的な 突然変異体を選択する。 第3段階:選択的な突然変異体の組換えによって新しい遺伝子型を作製する。 得られた遺伝子型から最も高い親和力適合値のものを選択する。このサブ集団を 次の組換え体又は突然変異体作製のために使用する。 段階4:最良の組換え生成物をとり、点突然変異に繰り返しかけて選択性を改 良する。段階I:進化−一次コードの作成 Hollandにより開発された遺伝的アルゴリズム(Holland,J.H.(1975)Adaptati on in Natural and Artificial Systems.U.Michigan Press.Ann Arbour)を使 用して、種々の問題に最適の解を検索することができる。通常この方法は、大き い、最初はランダムな解のセットを使用して適用される。本実施例においては、 この方法をかなり変更し、高い選択性を有する仮想受容体を見つけるために必要 とされる試験回数とその反復回数を減らしている。これは、密接に関連した遺伝 子型のセットを当初の集団として使用し、各反復において突然変異の高い割合を 適用することにより達成した。標的化合物の任意のセットについて、最適な親和 特性を有する異なる受容体を開発することが可能である。例えば、受容体は最適 には同じ標的に異なる方向で結合しうる。密接に関連した遺伝子型の最初の集団 を使用することにより、最適化プロセスが単一の解に収束する可能性が増大する 。無関係な遺伝子型の組換えは、増大した適合値(fitness)を有する新しい遺伝 子型を生成し得るが、多様性を生じる可能性がより高い。 最適化プロセスの最初の段階の目的は、標的のセットに対して最小レベルの親 和力を有する遺伝子型を作成することである。この遺伝子型を、その後関連遺伝 子型の集団を作成するために使用する。最小レベルの親和力を有する遺伝子型を 作成するための代表的なプロセスのフローチャートをモジュール6に示す。段階2:進化−一番目のコード(primary code)の突然変異 遺伝子型の突然変異は、コード中の一つ以上の文字(character)を変更するこ とを含む。この実施例の突然変異は、受容体ポリマーを構成するサブユニットの 数を変更せず、遺伝子型の長さに影響を及ぼさないものである。これらの規則(c onvention)が任意のものであり、改変が有用である系もあることは理解されるで あろう。 突然変異は表現型の折り畳みパターンを変化させ得、受容体の形状空間及び結 合部位の位置あるいは露出の変化を生じる。表現型の周囲の領域の構造に影響を 及ぼす突然変異は、標的中心に対する受容体中心の移動(shift)を生じ得る。中立突然変異 全ての突然変異は表現型の構造を変えるが、全ての突然変異が受容体の機能性 を変化させるわけではない。そのような中立突然変異は、親和力に影響を及ぼさ ない受容体の成分を変化させ得る。これらの中立突然変異は、以降の突然変異と 組み合わされて相乗効果を示し得る場合もある。繁殖集団The Breeding Population) 生成プロセスの第二段階の目的は、一次遺伝子型に由来する、異なるが関連す る遺伝子型の集団を作成することである。この集団のメンバーはその後組換え体 を作成するため使用される。この繁殖集団は、一次遺伝子型の多数の突然変異に よって生成される。結果として得られる遺伝子型は、翻訳され、選択性について スクリーニングされる。最も選択的な生成物を組換えのために保存する。モジュ ール7に遺伝子型の多数の突然変異のための代表的なプロセスのフローチャート を示す。段階3:進化−組換え 組換えの目的は、適合が改善された新しい遺伝子型の作成である。組換えによ り、表現型適合に必須の遺伝子型断片の保存が容易になり、同時に指令(instruc tion)の新しい組み合わせが導入される。一般に、選択と組合わせた組換えによ り選択性の急速な最適化が得られる。モジュール8は、遺伝子型の組換えのため の代表的なプロセスのフローチャートを示す。 この実例では、モジュール8のステップ7における試験のための組換えに使用 される集団を保存する。これにより、高い選択性を有する遺伝子型がより低い選 択性を有する遺伝子型により置換されないようにすることができる。さらに、こ の実例においては、突然変異(モジュール7)を試験(ステップ7、モジュール8 )に先立ち組換え体遺伝子型の50%に適用する。このステップにより、組換え体 集団の範囲内での可変性が増大する。この実例において使用する試験集団の大き さは、10〜40の遺伝子型の範囲であする。これは、比較的小さい集団の大きさで ある。より大きい集団を必要とする条件もあり得る。段階4:進化−成熟 漸進的な小突然変異法 最適化プロセスの最終段階は、哺乳動物の免疫系における抗体の成熟を模倣す るものである。一連の単一の点突然変異を遺伝子型に適用し、そして表現型適合 に対する効果を評価する。組換えとは異なり、このプロセスは一般に表現型の選 択性に対してわずかに増加する変化しか与えない。この成熟プロセスは、Rechen berg(1+1)進化法(Rechenberg,I.(1973),Evolutionsstrategie.F.Frommann .Stuttgart)を使用する。各作成において、親遺伝子型の適合をその突然変異生 成物のものと比較し、そしてより大きい選択性をもつ遺伝子型を次の作成のため に保存する。この結果、より小さい選択性を有する突然変異体はその親に置換す ることがなく、このプロセスは厳密に1方向性のものとなる。モジュール9は遺 伝子型の成熟の非限定的なサンプルのフローチャートを示す。 成熟プロセスの各反復においては、コード中の単一の指令のみが変化する。親 とその突然変異生成物が同じ選択性を有する場合は、次の作成において親はその 生成物と置換する。この方法により、以降の突然変異とともに相乗効果を有し得 る中立突然変異の蓄積が得られる。この規則は任意のものである。 組換えあるいは成熟を反復して繰り返しても改善された選択性が得られない場 合は、繁殖集団ゲノムの可変性を増加させるために段階2を反復する必要があり 得る。選択された用途 本発明のプロセスは、1)選択された薬理学的あるいは毒物学的活性を有する 化合物のスクリーニング、2)選択された機能特性を有する新しい化学構造の開 発等の複数の分野で使用することができる。両方の用途とその具体例を以下に示 す。 1A)スクリーニング法 類似した薬理学的性質を共有する化合物の特定の基に対する選択的な親和力に ついて開発された受容体の集団は、この活性が結合親和力に依存するものであれ ば、類似した活性を有する他の化合物を同定するためのプローブとして使用する ことができる。例えば、サリチル酸塩に特異的な親和力を示す受容体の集団を開 発することができる。サリチル酸塩に対するこれらの受容体の親和力がシクロオ キシゲナーゼのサ リチル酸塩に対する親和力と密接に関連しているならば、該受容体は少くとも部 分的に前記シクロオキシゲナーゼ分子の結合部位の機能的に関連した特徴を模倣 しているに違いない。従ってこれらの受容体は、可能性のあるシクロオキシゲナ ーゼに対する結合親和力について他の化合物をスクリーニングするために使用す ることができる。 またこの方法は、潜在的な毒物学的あるいは発癌活性について化合物をスクリ ーニングするために使用することができる。例えば、ステロイドホルモン受容体 の特異的な結合親和力を模倣する受容体を開発することができる。さらにこれら の受容体は、可能性のある結合親和力について、in vitroまたはin vivo試験の 前に殺虫剤、溶媒、食品添加物、及びその他の合成物質の親和力を評価するため に使用することができる。また、シミュレーションされた受容体は、交互の標的 部位、輸送タンパク質、あるいは非標的結合についての親和力を検出するように 構築することもできる。 1B)最大未満(sub-maximal)の活性のスクリーニング 高い親和力をもつ化合物は、有害な副作用を有し、あるいは長期投与に不適当 である場合がある。このような場合、より低い結合親和力をもつ化合物が必要と なり得る。合成の組合せのような方法では、容易にそのような化合物は作成され ず、特定されない。これに対し、シミュレーションされた受容体を使用して、任 意の特定のレベルで結合親和力を示す構造を効果的にスクリーニングすることが できる。 1C)分子の類似性の測定 シミュレーションされた受容体の選択性は、分子の類似性の量的な基準として 使用することができる。シミュレーションされた受容体の例 この例においては、標的親和力の架空の試験値を選択して、活性の任意の選択 されたパターンを模倣するシミュレーションされた受容体を構築する受容体生成 プログラムの能力を示した。 この例では、全ての受容体は15のポリマーからなる。幅、長さ及び深さの値に より、受容体の中心に対する15のポリマーの原点座標を特定する。実施例1 シミュレーションされた受容体を、以下の仕様で作成した: サブユニットの数:240、幅:6、長さ:6、深さ:25 コード:各標的は、受容体に対して20回試験した。 最適化された受容体の親和カスコアは0.9358であり、比較的低かった。 受容体を最適化するために使用した標的基質は、ベンゼン、フェノール、安息 香酸及びo-サリチル酸であった。アスピリン前駆体のo-サリチル酸は、シクロオ キシゲナーゼによるプロスタグランジン合成の阻害剤である。安息香酸とフェノ ールは、同じ部位に対して相対的に非常に低い親和力を有する。受容体に対する 標的親和力値及びスコアは下記表Aに示す。これはシミュレーションされた受容 体がo-サリチル酸に対して最大の親和力を有することを示している。 表A 標的化合物 標的親和力 合計親和力スコア 最大親和力スコア ベンゼン 0.6 20.88 3.38 フェノール 1.2 8.03 4.99 安息香酸 1.6 42.23 12.98 o-サリチル酸 4.4 80.33 34.71 シミュレーションされた受容体を使用して3つの試験基質を評価した。化合物 のうちの2つはo-サリチル酸より活性が低いことが知られている、m-サリチル酸 及びp-サリチル酸である。3番目の化合物、ジフルシナール(Diflusinal)はサリ チル酸のものに等しいかそれより大きい効能を有するフッ素化サリチル酸誘導体 である。評価の結果は表Bに示す。 表B 標的化合物 合計親和力スコア 最大親和力スコア m-サリチル酸 45.9 12.3 p-サリチル酸 63.5 27.5 ジフルシナール 117 71.2 o-サリチル酸 80.33 34.71 シミュレーションされた受容体を使用して得られた結果は、これらの化合物の 薬理学的データに正確に一致しており、m-サリチル酸及びp-サリチル酸はo-サリ チル酸より低い親和力スコアを有し、ジフルシナールはo-サリチル酸より活性が 高い。活性のこれらの予測の確実性を高めるためには、シミュレーションされた 受容体をさらに精度の高いものとし、独立に最適化された別の受容体を使用する ことが必要である。 パートB:選択した機能特性を有する新規な化合物の開発 新規リガンドの進化 類似した機能特性を有する標的化合物のセットに対する選択的な親和力につい て開発されたシミュレーションされた受容体の集団を使用して、モデル化合物の 構造あるいは結合親和力に密接に関連した特性である、類似した特性を有する新 規な化合物を製造することができる。受容体との相互作用を選択基準として使用 して、受容体に最適に適合するように新しい化学構造を開発することができる。 これらの化合物は、受容体の選択性についての必要で十分な要件に適合しなけれ ばならないので、これらの新規な化合物は最初の分子標的のものに類似した活性 も有する可能性がある。プロセスの概要 1.特性化された標的化合物のセットについて最適化された選択性を有するシ ミュレーションされた受容体の集団を作成する。異なる親和特性を有する複数の 集団を作成することが望ましい場合もある。例えば、シミュレーションされた受 容体の3つの集団を作成することができ、第1のものは選択された標的部位を模 倣し、第2のものはリガンドをその一番目の標的に輸送するのに必要な部位を模 倣し、受容体の第3の集団は望ましくない副作用を媒介する標的部位を模倣する ものとすることができる。この場合における新しいリガンド構造の開発には、最 初の2つの受容体集団に対する親和力を同時に最適化することと、第3の集団に 対する親和力を最小にすることを必要とする。 2.シミュレーションされた受容体集団について新規な一次構造の親和力を測 定する。 3.一次構造を修飾し、シミュレーションされた受容体集団を使用して親和力 を評価する。修飾が親和特性を改善する場合は、修飾された構造をさらに修飾す るために保存する。そうでないならば異なる修正を試験する。先に拒絶された修 飾を別の修飾と組み合わせて再導入してもよい。 4.適した親和特性を有する化合物が得られるまでステップ3を繰り返す。 注:適当に識別されるシミュレーションされた受容体を使用して、選択された標 的部位に対する最大未満の親和力を有する化学構造を開発することが可能である 。 1)分子遺伝子型コードの作成 文字列(character string)で表される線状の遺伝子型の形態にリガンド表現型 (分子構造)をコード化することは、進化プロセスの間のリガンドの構造上の特 性の突然変異、組換え、及び継承のプロセスを容易にする。 この実例により開発されたリガンドは、置換された炭素骨格からなる。各コー ドは、3つの文字のベクトルから成る。一番目のコードベクトルは炭素骨格の作 成のための回転の指令を含み、骨格における各炭素原子の位置を決定する。二番 目のコードベクトルは、各炭素原子に結合される官能基を指定する。三番目のコ ードベクトルは、ホスト炭素に対する官能基の位置を特定する。炭素以外の原子 を結合している分子骨格(例えばエーテル、アミド及びヘテロ環)は、コードに おいて別の文字を使用して骨格の炭素原子を置換する原子種を特定することによ り同じ方法で構築することができる。 炭素骨格は、三次元四面座標系の結節点を形成する一連の点から構築される。 初期の骨格構築の間、最も近い点の間の距離は、アルキル炭素原子の間の平均結 合長に等しい。 一番目のコードベクトル:リガンド骨格決定要素 一番目のコードベクトルは、そのときの原子位置に対する回転方向を指定する 文字からなる。各回転方向は、四面マトリックスにおける次の原子の座標を特定 する。各原子から4つの方向(1,2,3,4)を取ることができ、これはsp3炭素の 満たされてい ない原子価に対応する。各炭素原子は4つの可能な状態(A,B,C,D)の一つに属 している。これらの状態は、四面座標系の異なる結節点の数に対応する。 回転方向と骨格中の次の原子の新しい座標との関係を以下の表に示す。下記の 2つの表B1及びB2は、リガンドの構築に必要な2つの回転の規則を具体的に示す 。ボート型規則は、閉鎖された6員環(シクロヘキサン)がボート型構造をとる 四面マトリックスを作成する。椅子型規則は、シクロヘキシル環が椅子型構造を とるマトリックスを作成する。コード生成の間、両方の規則を組み合わせること が可能である。ここで記載する例においてはボート型規則のみを使用する。 表B1:ボート型規則 現在位置=(x,y,z) 回転後の新しい位置 回転後の新しい状態 表B2:椅子型規則 現在位置=(x,y,z) 回転後の新しい位置 回転後の新しい状態 これらの関係を使用して、文字1、2、3及び4の列からなる一番目のコードベク トルを解読し、炭素原子の三次元の配列を形成することができる。得られる炭素 原子の列は、それ自体で折り畳まれるか閉鎖したループを形成し、短い側鎖及び 環構造を形成する。特定の環構造(例えばシクロヘキサン)は、下記に示すよう に特異的文字配列として直接導入することができる。二番目のコードベクトル:置換基 一番目のコードベクトルと同じ長さの二番目のコードベクトルを使用して、一 番目のコードベクトルにより特定された炭素原子に結合される置換基の種類を割 り当てる。各置換基は単一の文字によって特定される。置換基は単独で炭素骨格 に付加される。単一の炭素原子は1より多い置換基を有することができるが、こ れは一番目のコードにより1回より多く特定されたときのみである。 この実例においては、二番目のコードベクトルによって特定された置換基によ って満たされていない原子価は全て、リガンド構築プロセスの間に自動的に水素 原子で埋められる。空の原子価を水素以外の原子で満たすために他の規則を適用 してもよい。三番目のベクトル:置換基結合ベクトル 一番目のコードベクトルと同じ長さの三番目のコードベクトルを使用して、二 番目のコードベクトルによって指定された置換基の結合のために使用される原子 価を割り当てる。三番目のコードは文字1、2、3及び4からなり、それぞれ一番目 のコードについて特定された回転方向を示す。原子価がすでに一番目のコードベ クトルによって指定された炭素原子あるいは別の以前に割り当てられた置換基で 占められていない場合にのみ置換基が割り当てられる。あるいは、連続した置換 基により以前に割り当てられた置換基を置換してもよい。 2)コード作成 炭素骨格を形成するため、セット{「1」、「2」、「3」、「4」}に属してい る文字のランダムな配列を生成することにより一番目のコードを構築する。ヘテ ロ環構造、エーテル、アミド、イミド及びカルボキシル化合物の生成は、二番目 のコードで指定される異なる原子により骨格中の炭素原子を置換することによっ て行うことができる。 二番目のコードは、置換基の種類を指定する文字のランダムな配列から作成す る。文字の頻度はランダムであるか、コード生成に先立ち固定することができる 。 三番目のコードは、セット{「1」、「2」、「3」、「4」}に属している文字 からなる。環構造は、特定の文字配列を一番目のコードに加えることによって意 図的に(ランダムな作成に対して)構築することができる。例えば、「431413」は シクロヘキシル環をコードする。合計24列が、四面マトリックスにおけるシクロ ヘキシル環の全ての可能な方向をコードする。環の一番目のコードについての二 番目及び三番目のコードベクトルは前に記載したように作成する。モジュール10 は、環を有する炭素骨格を作成するコードの作成例のフローチャートを示す。 炭素原子骨格の部分を構成する環への入口及びそれからの出口となる点の相対 位置は、環を作成するのに使用された文字配列の長さによって決定される。具体 的には、配列が例えば431413の6つの文字を含む場合、入口及び出口点は環の同 じメンバーである。配列が部分的に繰り返されて、最初の6つの文字に付加され る場合は、入口点と出口点は環の同じメンバーではない。例えば、配列4314134 及び43141343141は 入口点に隣接した環のメンバーに出口点を有する環を作成する。 この実例においては、少なくとも6つの文字の配列をコードに加えることによ って環が骨格に加えられる。431413によって定義される環について使用される可 能な配列は以下のものである。 431413 4314134 43141343 431413431 4314134314 43141343141 431413431413 431413431413 新しいリガンド遺伝子型を形成するために示した規則を使用して、リガンド生 成プロセスでの保存のため、あるいはそれへの導入のために、直線状の形態のそ の他の化学構造をコードすることができる。例えば、公知の医薬原子団(pharmac ophore)は、線状の形態でコードされ得、類似しているかあるいは改良された機 能的特性を有する新しいリガンドを生成するための出発点として使用することが できる。同様に、共通の標的部位と相互作用する医薬原子団のセットを線状の形 態でコードすることができ、組換えのために使用することができる。 3)コード翻訳とリガンド構築 コードベクトルは、3つの別々のステップからなる翻訳プロセスにおいてリガ ンドの三次元の表現に変換される。最初のステップにおいて、一番目のコードを 使用して炭素原子骨格が構築される。二番目のステップにおいて、二番目及び三 番目のコードベクトルからの指令を使用して置換基が炭素骨格に付加される。ま た、二番目及び三番目のコードベクトルからの指令は、骨格における炭素原子の 異なる原子での置換を指定してもよい。また、二番目の及び三番目のコードから の指令は、一次骨格の部分を形成している炭素またはその他の原子上に存在する 利用可能な原子価の数と方向を変更しうる。例えば、カルボニル酸素の付加は2 つの空の原子価を占める。三番目のステップにおいては、二番目のステップの間 に置換基によって満たされなかった全 ての原子価が(特に指定されない限り)水素原子で満たされる。一次解読:リガンド骨格構築 一次解読は、一番目のコードベクトルからの回転の指令を使用して各炭素原子 の位置を特定する。最初の原子が座標系の原点に位置すると仮定する。最初の原 子がマトリックスにおいて状態Aを占めると仮定する。 解読は逐次進行する。一次解読プロセスの結果は、骨格中のn個の炭素原子の 各々のx、y及びz座標を含む3×n個のマトリックスである。ループ及び反転が許 容されるので、空間中の同じ位置が1より多い炭素で占められてもよい。この場 合、1つの炭素原子のみがその位置を占めると仮定する。この結果、完成した骨 格を形成している炭素原子の数は、一番目のコードベクトルの中の文字の数より 少なくなり得る。 一番目のコードが読み込まれるに従って、各炭素位置に結合される置換基を指 定する二番目のコードからリストが構築される。同時に、三番目のコードを使用 して平行のリストが構築され、各置換基で占められる原子価が指定される。二次解読:置換基付加 置換基は、一次解読の間、二番目のコードから生成されたリストに基づいて各 炭素原子に逐次付加される。三番目のコードからの対応する値を使用してホスト 炭素に対する置換基の原子価位置を指定する。その位置が隣接の炭素原子あるい は以前に指定された置換基すでに占められている場合は置換は実行されない。あ るいは、置換が次の空いている位置で実行されるか、置換により先に指定された 置換基を置き換える解読プロセスを構築してもよい。置換基と炭素原子との間の 距離は結合距離の照合表から計算される。位置データと結合距離を使用して置換 基の座標を計算する。ヒドロキシル、ニトロ及びアミノ基のような多成分置換基 の場合、置換基中の各原子の座標はホスト炭素に対して計算される。 二番目のコードベクトルによって指定された全ての置換基が骨格に付加された 後、骨格上に残っている全ての満たされていない位置を水素原子で満たす。水素 sp3-炭素結合長を使用して各水素原子の座標を計算する。 単一の炭素原子は1より多い非水素置換基を有することができる。これは同じ 位置が一番目のコードベクトルによって一回より多く指定される場合に起こり得 る。この 実例では直接二番目のコードを使用した多数の置換を導入していないが、これは 容易に実施することができる。 置換は、リガンド骨格を形成している炭素原子で満たされていない場所でのみ 可能である。四面マトリックスにおける全ての占められた部位の蓄積リストを維 持する。 二次解読プロセスの間、リガンドを構成する全ての原子の種類、半径及び位置 ついてリストを作製する。このリストは以降の標的作成の基礎となる。 プロセスのこの段階において、コード配列から作成された構造の実現可能性は 評価されない。一定の場合においては、原子座標をエネルギー最小化プログラム に導入してより現実的な構造を生成してもよい。しかしこの実例においては、結 合の間のリガンドの構造にかかわる仮定は設定していない。さらに本実施例は、 同じ分子の特異的な構造の構造上のユニークさを保存するものである。例えば、 本実施例はブタンの3つの回転異性体を区別し、各異性体をユニークな分子とみ なす。 コードベクトルが対応するリガンドの遺伝子型を構成し、突然変異及び組換え を経てリガンド構造の変化を生ずることができる。リガンド構造自体が、仮想受 容体の選択された集団で結合親和力を評価するために使用される表現型である。 4)標的提示 化学構造あるいは標的リガンドを最初にランダムに生成されたコードから構築 する。解読の後、標的リガンド中の各原子の座標、半径、双極子モーメント及び 分極率を値の照合表から得、リガンドと仮想受容体の選択された集団との間の結 合親和力を評価するために使用する。 仮想受容体の各々についての標的の親和力を、受容体表面に対する標的の多く の方向について試験する。リガンドとシミュレーションした受容体との相対方向 に関する仮定は設定しない。結合親和力の評価に先立ち、標的と受容体を接触さ せなければならない。標的提示の方法及び化学構造とシミュレーションされた受 容体との間の親和力の計算は、モジュール4において上で示した既知の標的分子 とシミュレーションされた受容体との間についてのものと本質的に同じものであ る。 5)結合親和力および適合度の評価 適合度の評価のために使用される各シュミレートした受容体に対する標的リガ ンドの結合親和力を、標的分子を用いたシュミレートした受容体の作製について 記載したものと同じ有効親和力計算法を使用して計算する。先に述べたように、 他の判定基準を用いた親和力計算を適合度試験法に導入することもできるが、本 発明の効力および計算効率は、部分的に、仮想的受容体の作製およびシュミレー トした受容体集団を用いた化学構造の作製のために同じ有効親和力計算を使用し たことに基づくものである。 6)リガンドの進化 適合度の試験 シュミレートした受容体の特定の集団と新規なリガンドまたは化学構造との適 合度は、リガンドに対する目標活性値または目標親和力値とシュミレートした受 容体‐リガンド複合体に対して得られたそれらの値とを比較することにより評価 する。最適に選択された仮想受容体の最大親和力は、目標親和力の測定値と強い 相関をもつはずである。 目標値は、任意のレベルの結合親和力に設定することができる。リガンドは、 選択プロセスで使用されるすべての仮想受容体に対して同じ結合親和力をもつ必 要はない。本発明の実施にあたり、既知の基質に対する最適化した仮想受容体の 最大結合親和力を使用して、目標結合親和力を計算する。例えば、目標親和力を 、特定の基質に対する仮想受容体集団の各メンバーの結合親和力の90%に設定し てもよい。このほか、リガンドと仮想受容体との相互作用を最小化する場合には 、目標結合親和力をゼロに設定してもよい。 様々な基質の組に対して最適化されたシュミレートした受容体を一緒にし、選 択された目標親和力値と各受容体とを関連付けることにより、特定の結合親和力 プロフィルについて新規なリガンドを選択することができる。リガンドの適合度 は、リガンド結合親和力の計算値と目標親和力値との一致度の尺度となる。最適 化プロセスはリガンドの適合度を最大化する。 最大結合親和力を与えるリガンドの最適配向は、試験を行うまでは不明である 。 受容体‐リガンド親和力の範囲の代表的な測定値を得るために、受容体表面に対 してランダムに様々な配向をとらせて、各新規リガンドを繰返し試験しなければ ならない。各試験では、第A部で説明したモジュール4を使用して親和力の評価 を行う。一般的には、得られる最大の親和力値の信頼性は、サンプルサイズに依 存する。なぜなら、サイズが増大するとサンプル中に真の最大値が含まれる可能 性が増大するからである。 最適化された新規なリガンドまたは化学構造を作製するために大きなサンプル 組を使用しないで済むように、本発明を実施するにあたり次の2つの技法を利用 する。 1.最適化された親和力プロフィルを有するリガンドを選択するために、平均 (または合計)親和力と最大親和力を合わせた測定値を使用する。 2.最適化プロセスを連続的に繰返し、試験される配向の数を増大させる(標 的配向の小さい組を用いて最適化を開始し、より大きい適合度のリガンドを発生 させながら、より多くの配向を試験する)。 本発明を実施する際、各リガンドの試験されたすべての配向に対して得られた 親和力値の合計を計算する。この合計親和力スコアは、受容体とリガンドの間の 平均親和力の測度である。同時に、最大親和力も求める。 合計親和力と最大親和力の両方を用いて、仮想受容体と新規なリガンドとの適 合度を試験する。合計親和力および最大親和力の計算値とこれらのパラメータの 目標値との差に従って、新規な各リガンドの適合度を評定する。本発明を実施す る場合、新規リガンド‐シュミレートした受容体対のそれぞれに対して適合性ス コアとして次の値を計算する。適合性スコアがゼロのときに適合度が最大となる。先の節で説明したように、最 大親和力の目標値および合計親和力の目標値は、最適化される仮想受容体の進化 ・開発(evolution)の過程で得られる回帰関数から得られる。目標値の求め方は 次の通りである: 最大親和力の目標値=f×仮想受容体の作製に使用された基質のうちで最 も可能性の高い基質の最大親和力 合計親和力の目標値=f×仮想受容体の作製に使用された基質のうちで最 も可能性の高い基質の合計親和力 ただし、F=スケーリング係数 リガンドの適合度を評価するために2つ以上のシュミレートした受容体を使用 する場合、リガンド‐シュミレートした受容体の対のそれぞれの適合性スコアを 合計する。 この場合、適合性スコアの合計がゼロのときに適合度が最大となる。様々なシ ュミレートした受容体のパネルに対して新規なリガンドを試験する場合、最大親 和力だけを使用することが望ましいこともある。この場合、適合度は次式で与え られる: この場合も、適合性スコアの合計がゼロのときに適合度が最大となる。一連の シュミレートした受容体に対して試験されるリガンドの合計適合度を測定するた めに、幾何学的手段を使用するなど、他の方法を利用することもできる。 シュミレートした受容体の各々について得られる最大親和力値と合計親和力値 の両方を使用することにより、仮想受容体の選択性がリガンドの適合度の評価に 確実に関係するようになる。この方法によれば、リガンドの適合度は、リガンド の親和力を反映するだけでなく、選択性の基礎となる仮想受容体の立体的要件の 満足度をも反映する。 6a)最適化方法 目的 シュミレートした受容体の組に対して所定の目標親和力を有する新規なリガン ドの進化を行うこと。25個の指令を含む候補遺伝子型の合計数は25625であるの で、解を得るために高度に効率的な手法が必要である。 方法 (1)第1段階:リガンドをコードするランダムな1組の遺伝子型を作製し、更に 、1組のシュミレートした受容体に対してスクリーニングを行い、適合度の閾レ ベルを超えるリガンドを選択する。 (2)第2段階:選択された遺伝子型を、遺伝子アルゴリズム(組換え)および 一方向突然変異法を用いて更に最適化を行うための出発点(basis)として使用す る。選択された遺伝子型に突然変異を起こさせ、組換えを行うために、異なって はいるが関連性のある遺伝子型の育種集団を発生させる。 (3)組換え用の集団から最も選択性の高い突然変異体を選択する。 (4)第3段階:選択性のある突然変異体の組換えを行うことにより新しい遺伝 子型を発生させる。得られた遺伝子型の中から最も親和力適合度の高いものを選 択する。この亜集団を、次の組換え体を発生させるために(第3段階の繰返し) 、または次の突然変異体を発生させるために(第4段階の繰返し)使用する。 (5)第4段階:最良の組換え産物を選定し、点突然変異を繰返して、選択性を 増大させる。 (6)所望の適合度のリガンドが作製された場合、この最適化プロセスを終了す る。第1段階:進化−初期コードの作製 最適化プロセスの第1段階の目的は、遺伝子型、および最小レベルの適合度を 有する対応するリガンド表現型を作製することである。続いて、この遺伝子型を 使用して、関連する遺伝子型の集団を発生する。 様々な問題に対する最適解を探索するために、Hollandにより開発された遺伝 子アルゴリズムを使用することができる。通常、この技法を適用する場合、大き な初期ランダムな組の解を使用する。本発明を実施する際は、選択性の高い親和 力を有するリガンドを見出すのに必要な試験および繰返しの数を減少させるため に、この技法に著しい改良を加える。この改良は、初期の集団として関連性の大 きい1組の遺伝子型を使用し、かつ各繰返しの際の突然変異の発生率を高くする ことにより達成してきた。標的化合物の任意の組に対して、最適親和特性を有す る独特なリガンドを開発することが可能である。例えば、受容体は、同じ標的に 対して異なる配向で最適な結合を呈することができる。関連性の高い遺伝子型の 初期集団を使用すると、最適化プロセスが単一解に収束する可能性が増大する。 関連性のない遺伝子型の組換えは、適合度の高い新規な遺伝子型を生ずる可能性 があるが、発散する可能性が大きい。第2段階:リガンドの突然変異 進化プロセスの第2段階の目的は、初期遺伝子型から誘導される異なってはい るが関連性のある遺伝子型の集団を作製することである。続いて、この集団のメ ンバーを使用して、組換え体を作製する。この育種集団は、初期遺伝子型の多重 突然変異により作製する。得られた遺伝子型を翻訳し、選択性に関してスクリー ニングを行う。最も選択性の高い産物を組換えのために保持する。 構造をコードする遺伝子型(コードベクター)の特性を変化させることにより 、リガンドを突然変異処理にかける。これらの突然変異により、リガンドの形状 、ならびにリガンド上に存在する官能基の位置およびタイプが変化する。本発明 で行われる突然変異では、リガンドの骨格を構成する炭素の数を変えることがで きる。モジュール11は、複数の点突然変異を起こすための代表的なプロセスのフ ローチャートである。 突然変異により、リガンドの表現型の折畳みパターンを変えることができ、結 果として、形状ならびに官能基の位置および露出状態が変化する。リガンドの表 現型の周辺領域の立体配置に影響を及ぼす突然変異が起こると、受容体中心に対 する位置の変化を生じる可能性がある。中立突然変異 いずれの突然変異が起こっても表現型の構造の変化は起こるが、リガンドの官 能性の変化は、必ずしもすべての突然変異の場合に起こるわけではない。このよ うな中立突然変異が起こると、親和力に影響を及ぼさないリガンドの成分の変化 を生じることがある。場合により、これらの中立突然変異は、後続の突然変異と 組合わさって相乗効果を示す可能性がある。配列突然変異 配列突然変異が起こっても、コードの特性が直接変化することはない。その代 わりに、コード中の文字の配列が再配置される。配列突然変異が起こると、リガ ンドのサイズ、立体構造、ならびに官能基の存在(有無)および位置が変化する 可能性がある。本発明を実施する際、4つのタイプの配列突然変異を使用する。 a)欠失:コードから文字の配列を欠失させる。 ABCDEA⇒ABEA b)反転:コード中の配列を構成する文字の順序を反転させる。 ABCDEA⇒ABDCEA c)重複:コードの一部分を構成する文字の配列を反復させる。 ABCDEA⇒ABCDCDEA d)挿入:文字の配列をコード中に挿入する。 ABCDEA⇒ABCDBCEA 本発明を実施する場合、突然変異を組合わせて利用する。モジール12は、代表的 な配列突然変異のフローチャートである。第3段階:組換え体コードの発生 組換え処理の際、選択された遺伝子型間で、ランダムに選ばれた相補的セクシ ョンの交換を行う。組換えの目的は、適合度の増大した新規な遺伝子型を作製す ることである。組換えを行う際、表現型の適合度に対して必須である遺伝子型断 片は保持するが、同時に、指令の新規な組合せの導入を行う。一般的には、組換 えを選択と連動させて行うと、選択性の最適化が迅速化される。モジュール13は 、組換えに対する代表的な手順を示すフローチャートである。 本発明を実施する場合、試験のための組換えに使用された集団を保持する。こ うすることにより、選択性の高い遺伝子型が適合度の低い遺伝子型と置き換わら ないようにする。本発明を実施する際、組換え体遺伝子型の50%に対して多重の 突然変異を起こしてから試験にかける。このプロセスは、組換え体集団内での多 様性を増大させる。本発明を実施する際に使用される試験集団のサイズは、遺伝 子型10個〜40個である。これは比較的小さいサイズの集団である。条件によって は、より大きな集団が必要となることもある。第4段階:リガンドの成熟 段階的微量突然変異法 最適化プロセスの最終段階では、哺乳類免疫系における抗体の成熟を模倣する 。一連の単一点突然変異を遺伝子型に適用して、表現型の適合度に及ぼす影響を 評価する。組換えとは異なり、このプロセスでは、一般的には、表現型の選択性 が極僅かに増大する。この成熟プロセスは、Rechenberg(1+1)進化戦略を利用す る。発生を行うごとに、親の遺伝子型の適合度と、その突然変異産物の適合度と を比較し、選択性のより高い遺伝子型を次の発生のために保持する。より選択性 の低い突然変異体が親と置き換わることはないため、結果として、このプロセス は極めて一方向的となる。本発明を実施する場合、成熟プロセスの各繰返しにお いてコード中の指令を1つだけを変化させる。 親およびその突然変異産物が同じ選択性をもつ場合、次の発生の中で、親をそ の突然変異産物と入れ替える。この方法を行うと、後続の突然変異と相乗効果を 示す可能性のある中立突然変異が蓄積される。この変換は任意である。モジュー ル14は、代表的な成熟プロセスを示すフローチャートである。 組換えまたは突然変異を何度か繰返した後に、選択性の改良が得られない場合 、育種集団ゲノムの多様性を増大させるために、多重突然変異(第2段階)を繰 り返さなければならないこともある。 リガンド作製の例 概要 ベンズアルデヒドは、蚊Aedes aegyptiを忌避させるが、ベンゼンおよびトル エンの忌避作用はかなり小さい(表1)。シクロヘキサンやヘキサンは、この種 を有意には忌避させない(表1)。新規なリガンドを作製させる次の試験におい て、本発明の方法を使用して、忌避作用がベンズアルデヒドと類似した化合物 を最初(ab initio)に作製させる。リガンド作製の第1段階では、ベンズアル デヒドに対して高い親和性を呈し、ベンゼンに対して低い親和性を呈するシュミ レートした受容体を構築した。第2段階では、そのシュミレートした受容体に対 する結合親和力がベンズアルデヒドの場合と類似したリガンドを進化・開発する 。蚊の反応 蚊は、発生後7〜14日目のもので、実験室で飼育され、餌は与えられていなか った。蛍光灯の照明下で20℃において6日間にわたり実験を行った。東部夏時間 で12:00〜17:00に試験を実施した。試行用の4組の試験集団は、200匹、175匹、 105匹、および95匹の雌の蚊から成っていた。蚊には飲料水を与えた。 対向する壁を形成する2つのスクリーン側面を備えた35×35×35cmの透明なPl exiglas箱中で試験を行った。スクリーンは2つの層:すなわち、粗いプラスチ ックメッシュの内層と細かいナイロンメッシュの外層とから成っていた。一方の スクリーン側面から空気が入って反対の側面から出るように、ヒュームフード中 に箱を配置した。空気の流量は<0.5cm/sであった。 蚊は、頭を上に向けて箱の壁にとまっていた。Whatman #1濾紙の三角片(4×4 ×1mm)を用いて剌激化合物を与えた。先端を試験溶液中に深さ0.5cmまで浸漬し 、その直後に使用した。試験溶液に対する反応を次のように測定した: 1.風上の方の壁の内側スクリーン上にとまっている静止した雌の蚊を試験用と して選択した。 2.処理済みの濾紙の先端をスクリーンの外側に接して配置し、蚊の後胸・節に対 向した位置に置いた。いずれの場合においても、最初に、蚊の位置の下から近づ けた。 3.先端を所定の位置に最大3秒間保持し、蚊の反応をメモした。 次に、新しい個体に対して、この手順を繰り返した。各化合物を用いて1日1 回だけ蚊の試験を行った。先端は、それぞれ5回の試験(合計使用時間<30s) に使用してから交換した。化合物の試験はランダムな順序で行い、各化合物とも 、別の日に2度試験した。処理済みの先端の場合と同じ位置に、未処理の(乾燥 した)濾紙の先端および蒸留水で湿した先端を配置し、2組の対照の試験を行っ た。これらの対照の試験は、忌避化合物の試験の間に規則的に介在させて行った 。対 照に対する反応は、実験期間中、変化しなかった(p>0.25)。 4つの行動反応を記録した: 1.反応なし:蚊は不動のままであった。 2.逃避:蚊はとまっていた場所から飛び去った。 3.同側肢の持上げ:蚊は剌激源と同一側の後胸肢を持ち上げた。 4.対側肢の持上げ:蚊は剌激源と反対側の後胸肢を持ち上げた。 同側肢の持上げの後、しばしば逃避を起こしたが、この場合には両方の動作を 記録した。試験中および化合物調製のすべての段階で、ポリエチレン手袋を着用 した。 シュミレートした受容体およびリガンドの作製 同じ選択基準を用いて、2つのシュミレートした受容体を作製した。各受容体 を独立して使用し、l組のリガンドを作製した。分子アセンブリー1 第1段階:受容体の作製 ベンアルデヒドに対して選択的親和性を有する受容体を進化・開発させた。ト レーニング標的はベンゼンおよびベンズアルデヒドであった。各標的につき15 通りの配向を用いて親和力値を計算した。進化プロセスの結果は次の通りであっ た。 標的 活性レベル 合計親和力 最大親和力 ベンゼン 1.0 6.87 2.21 ベンズアルデヒド 5.9 75.87 13.02 受容体に対する親和カスコアは0.992であった。最適化された25×6×7ベンズ アルデヒド受容体に対するコードは、次の通りであった: 第2段階:リガンドの作製 最適化されたシュミレートした受容体を、新規なリガンドの進化のための鋳型 として使用した。ランダムな突然変異および選択により、4つの異なるリガンド をアセンブルした。ベンズアルデヒドとの類似性を有するリガンドを選択した。 リガンドに対する親和力値は次の通りであった: 進化させたリガンド1.1〜1.4は、図4bに示されている。各リガンドの少なくと も1つの配向は、ベンズアルデヒドと構造的に類似したものであった。分子アセンブリー2 第1段階:受容体の作製 ベンズアルデヒドに対して選択的親和性を有する25×6×7受容体を進化・開発 した。トレーニング標的はベンゼンおよびベンズアルデヒドであった。各標的に つき15通りの配向を用いて親和力値を計算した。進化プロセスの結果は次の通り であった。 標的 活性レベル 合計親和力 最大親和力 ベンゼン 1.0 25.88 8.53 ベンズアルデヒド 5.8 162.23 42.74 受容体に対する親和力スコアは0.996であった。受容体に対するコードは、次 の通りであった: 第2段階:リガンドの作製 最適化されたシュミレートした受容体を、新規なリガンドの進化のための鋳型 として使用した。ランダムな突然変異および選択により、4つの異なるリガンド をアセンブルした。ベンズアルデヒドとの類似性を有するリガンドを選択した。 リガンドの親和力値は次の通りであった: 進化させたリガンド2.1〜2.4は、図4cに示されている。各リガンドの少なくと も1つの配向は、ベンズアルデヒドと構造的に類似したものであった。 化合物2.1および2.4は、置換シクロヘキサノン誘導体である。リガンド2.2は5 -クロロ-2,7-ノナジオンであり、リガンド2.3は2-シアノ-5-ヘキサノンである。 リガンド1.4には、構造的にメチルシクロヘキシルケトンに相当する断片が含ま れている。シクロヘキサノン、メントン、メチルシクロヘキシルケトン、および 2-オクタノンの忌避性を試験した実験(図4aを参照のこと)から、これらのリガ ンドは蚊に対して忌避性を示すことが示唆される(表E2)。 *相対的忌避性=[(逃避反応%+肢上げ反応%)×沸点]/100 予め選択された機能的特徴または性質を呈する新しい化学構造をデザインする 本明細書中に開示された方法について、実施例だけを用いて説明してきた。例え ば、この方法は、分極率、双極子モーメント、共有結合半径などの他の既知の許 容しうる値を用いて容易に実施可能である。更に、モジュール中におけるプロセ スの計算工程を示すフローチャートは、例示だけを目的としたものである。例え ば、親和力の計算は、本明細書中で使用したものよりも少ない近似を使用した入 手可能なコンピュータパッケージを用いて行うこともできる。新しい化学構造を 作製する方法は、最初に、類似の機能的特徴を有する既知の標的化合物に対して 所定の親和力を呈する1つ以上のシュミレートした受容体を作製し、これらの受 容体を用いて、所望の程度までこれらの特徴を呈する新規な化学構造を作製させ ることに基づくものであった。受容体自体を、新規な化学構造を生成させる以外 の用途に、例えば、既知の化合物の薬学的性質または毒物学的性質をスクリーニ ングする手段として、使用してもよい。従って、本発明の範囲を逸脱することな く、本明細書中に開示された方法に多くの変更を加えることができることは、当 業者には分かるであろう。 表I:遷移状態および追加因子 古い状態 追加因子 以下の回転に対する新しい状態 アルゴリズムに対する式:入力(古い状態,回転) ⇒出力(Δx,Δy,Δz,新しい状態) 例:初期位置(12,34,-18);入力:古い状態=10,回転=右: 出力:新しい状態=6,Δx=0,Δy=1,Δz=0:後続位置(12,35,-18)表2:ファンデルワールス半径 出典:N.S.Issacs,1987.Physical Organic Chemistry.Longman Scientific and Technical,New York.828 pp. 表3:共有結合半径(pm) 結合次数 N.S.Issacs(1987)中の値に基づく。表4:荷電部位の割当てに使用した代表的な有効双極子の値 *ほとんどの条件下で好ましい値 各標的原子は、8つの値の組{xi,yi,zi,ri,bri,cri,di,αi}で完全 に記述される。ただし、xi、yi、ziは、分子の幾何中心に対する位置座標であり 、ri=ファンデルワールス半径、bri=結合半径または共有結合半径、cri=衝突 半径(=ri+0.5)、αi=分極率、およびdi=有効双極子モーメントの値である 。表5:特定の標的原子に対して選択された相対有効分極率 *分子の分極率から計算した値 ?適切な分子データから値を決定することができる。 モジュール1:シュミレートした受容体に対するコードの作製 ステップ1 コード作製パラメータ:i)コード長およびii)指令頻度、を入力 する。 ステップ2 空の文字鎖で初期化してコードを保存する。 ステップ3 乱数を発生させる。 ステップ4 乱数および指令頻度に基づいて文字{‘0’,‘1’,..., ‘6’}を選択し、コード鎖に連結する。鎖長がコード長の設定 値に等しくなるまでステップ4を繰り返す。 ステップ5 コードを出力する。 モジュール2:シュミレートした受容体に対するコードの翻訳 ステップ1 受容体を含むポリマーに対する原点座標を入力する。 ステップ2 ポリマーに対するコードを入力する。 ステップ3 コードから最初の文字を読む。 ステップ4 文字が転回指令である場合、翻訳アルゴリズムを使用してサブユ ニットの座標を決定する。それ以外の場合、ステップ7に進む。 ステップ5 サブユニットの座標を保存する。サブユニットに対して荷電値0 を割当てる。 ステップ6 文字がコード中の最後の文字でない場合、ステップ3を繰り返す 。それ以外の場合、次に進む。 ステップ7 文字が荷電指令の場合、翻訳アルゴリズムを使用し、転回なしと 仮定してサブユニットの座標を決定する。 ステップ8 サブユニットの座標を保存する。文字に基づいて、サブユニット に対して荷電値+1または-1を割当てる。 ステップ9 文字がコード中の最後の文字でない場合、ステップ3を繰り返す 。それ以外の場合、次に進む。 ステップ10 受容体を含むポリマーのそれぞれに対してステップ2〜9を繰り 返す。 ステップ11 サブユニットの座標および荷電値を出力する。 モジュール3:標的の提示 ステップ1 標的原子の座標および半径(xti,yti,zti,半径i)を入力 する。 (i=標的中の原子の番号) 受容体の座標(xrj,yrj,zrj,電荷j)を入力する。 (j=受容体中のサブユニットの番号) ステップ2 ランダムな角度値(Δθ,Δφ)および並進値(kx,ky)を発 生させる。 ステップ3 ランダムな量で原子座標の回転および並進を行う。 ステップ3a 標的座標を極形式に変換する。 (xti,yti,zti,半径i)⇒(θi,φi,ρi,半径 i) ステップ3b 角度にランダムな変化を与える。 (θi,φi,ρi,半径i)⇒(θi+Δθ,φi+Δφ ,ρi,半径i) ステップ3c 直角座標に変換する。 (θi+Δθ,φi+Δφ,ρi,半径i)⇒(xi,yi, zi,半径i) ステップ3d ランダムな並進を加える。 (xni,yni,zni,半径i)=(xi+kx,yi+ky,z i,半径i) ステップ4 標的座標の中心を原点(0,0,0)に置く。 ステップ4a xni、yni、およびzniの最大値および最小値を求める。 ステップ4b 受容体の幾何中心を求める: xn中心=(xn最大値−xn最小値)/2、yn中心=(yn最大値−yn 最小値)/2、zn中心=(zn最大値−zn最小値)/2。 ステップ4c 中心移動した座標を計算する: (xncj,yncj,zncj)=(xni−xn中心,yni−yn中心 , znj−zn最大値)。 ステップ5 原子半径および変換された座標(xncj,yncj,zncj,半径 i)を用いて標的の衝突面g(xg,yg)=zgを構築する。 ステップ5a 受容体サブユニットの直径(=1)に等しい間隔のグリッドを作 製する。 グリッドの座標: xg∈{Int(xn最小値−xn中心),Int(xn最小値−xn中 心)+1...0,..Int(xn最大値−xn中心)−1,Int(xn最大値−xn中 心)} yg∈{Int(yn最小値−yn中心),Int(yn最小値−yn中 心)+1...0,..Int(yn最大値−yn中心)−1,Int(yn最大値−yn中 心)} グリッド上のすべての点において、g(xg,yg)の初期値を 0に設定する。 ステップ5b 次の規則に従って、各原子(i)に対して、各グリッド点(xg,y g)のg(xg,yg)(高さ)の値を設定する: For i=1 to 標的中の原子数 If(xnci-xp)2+(ynci+yp)2<半径i2then g(xg,yg)=最小(g(xg,yg),znci-半径i) Else If(xnci-xp)2+(ynci+yp)2<(半径i+.5)2then g(xg,yg)=最小(g(xg,yg),znci-(半径i/ 2)) Else g(xg,yg)=最小(g(xg,yg),0) Nexti ステップ6 受容体の座標の中心を原点(0,0)に置く。 ステップ6a xrj、yrj、およびzrjの最大値および最小値を求める。 ステップ6b 受容体の幾何中心を求める: xr中心=(xr最大値−xr最小値)/2、 yr中心=(yr最大値−yr最小値)/2、 zr中心=(zr最大値-zr最小値)/2。 ステップ6c 中心移動した受容体の座標を計算する: (xcj,ycj,zcj) =(xrj−x中心,yrj−y中心,zrj −z最小値)。 ステップ7 次の規則に従い、中心移動した受容体の座標を用いて受容体の衝 突面s(xs,ys)=zsを構築する: s(xcj,ycj)のすべての初期値を0に設定する。 for j=1 to 受容体中のサブユニットの数 if zcj>s(xcj,ycj) then s(xcj,ycj)=zcj next j ステップ8 受容体の衝突面と標的の衝突面との最小分離を求める。 次のように差マトリックスd(xg,yg)を計算する: xg∈{Int(xn最小値−xn中心),Int(xn最小値−xn中心) +1...0,..Int(xn最大値−xn中心)−1,Int(xn最大値−xn中 心)} および yg∈{Int(yn最小値−y中心),Int(yn最小値−yn中心)+ 1...0,..Int(yn最大値−yn中心)−1,Int(yn最大値−yn中心)} のすべてに対して、 d(xg,yg)=(h(xg,yg)−zn最小値+zn最大値)+ (s(xg,yg)−zr最小値+zr最大値) を計算する。 すべてのxg,ygに対して、d(xg,yg)の最小値=dmin を求める。 dminは最小分離距離である。 ステップ9 衝突立体配置を求めるために、標的の座標および受容体の座標を 変換する。 受容体の座標変換: (xreceptorj,yreceptorj,zreceptorj)= (xcj,ycj,zcj+z r最小値-zr最大値) 標的の座標変換: (xtargeti,ytargeti,ztargeti)= (xnci,ynci,znc i-zn最小値+zn最大値-dmin) ステツプ10 (xtargeti,ytargeti,ztargeti)および(xreceptorj,yrece ptorj,zreceptorj)を用いて親和力を計算する。 試験対象の各標的の立体配置に対して、ステップ2〜9を繰 り返す。 モジュール4:親和力の計算 ステップ1 標的および受容体の衝突座標(xtargeti,ytargeti,ztarget i)および(xreceptorj,yreceptorj,zreceptorj)を入力する 。 ただし、 i=標的中の原子の数、j=受容体中のサブユニットの数で ある。 ステップ2 標的に対する双極子モーメントの値dip(i)を入力する。 受容体に対する荷電の値charge(j)を入力する。 ステップ3 近接度計算のための閾値THRESH0LDを入力する。 ステップ4 双極子親和力値を計算する。 ステップ4a 各荷電サブユニット(charge(j)≠0)に対して、 e(i,j)=dip(i)/((xtargeti−xreceptorj)2+ (ytargeti−yreceptorj)2+(ztargeti−zreceptorj)2)1.5 を計算する。 ステップ4b charge(j)≠0であるiおよびjのすべての組合せに対して、e(i, j)の合計を計算する。 DIPOLE=Σe(i,j) ステップ5 近接度の値を計算する(このステップは、分極率に基づく計算で 置き換えることができる)。 ステップ5a │dip(j)│≦0.75である各標的原子に対して、 1(i,j)=((xtargeti−xreceptorj)2+ (ytargeti−yreceptorj)2+(ztargeti−zreceptorj ) 2)0.5 を計算する。1(i,j)<THRESHOLDのとき、prox(i,j)=1と する。 ステップ5b │dip(j)│≦0.75であるiおよびjのすべての組合せに対して、 prox(i,j)の合計を計算する。 PROXIMITY=Σprox(i,j) ステップ6 標的基質の組合せに対する親和力値=AFFINITYを計算する。 AFFINITY=(PROXIMITY/j)((PROXIMITY/10000)+DIPOLE) モジュール5:適合度の計算 ステップ1 既知の標的の効力または親和力の値(yk)を入力する。ただし、 k=試験対象の標的の数である。 ステップ2 標的および受容体の衝突座標(xtargeti,ytargeti,ztarget i)および(xreceptorj,yreceptorj,zreceptorj)を入力する 。 ただし、 ik=標的k中の原子の数、j=受容体中のサブユニットの 数である。 ステップ3 試験される標的の配向の数(=m)を入力する。 ステップ4 モジュール5を使用して、各標的および各標的の配向に対する親 和力値(AFFINITYk,m)を求める。 ステップ5 各標的に対する最大親和力値(MAk)および合計親和力値(SA k)を決定する。 ステップ6 最大親和力値(MAk)と既知の標的の効力または親和力の値(y k)との相関係数rMA 2、または合計親和力値(SAk)と既知の標 的の効力または親和力の値(yk)との相関係数rSA 2を計算する。 ステップ7 適合係数Fを計算する。 F=(rMA 2×rSA 2)0.5 別法 ステップ6’ 最大親和力値(MAk)と既知の標的の効力または親和力の値(y k)との相関係数rMA 2、または合計親和力値(SAk)−最大親和 力値と既知の標的の効力または親和力の値(yk)との相関係数rSA -MA 2を計算する。 ステップ7’ 適合係数Fを計算する。 F=(rMA 2×(1−rSAMA)2)0.5 モジユール6:最小レベルの親和力を有する遺伝子型の作製 ステップ1 適合度の最小閾値を設定する。 ステップ2 ランダムな遺伝子型を発生させる(モジュール1)。 ステップ3 遺伝子型を翻訳し、表現型を構築する(モジュール2)。 ステップ4 標的に対する表現型の親和性を試験する(モジユール3、4、5、 6)。 ステップ5 表現型の適合度が適合度の閾値を超えた場合、コードの作製を中 断し、コードを第2段階に送る。それ以外の場合はステップ1〜5 を繰り返す。 モジュール7:多重突然変異 ステップ1 初期コードを入力する(第1段階)。 ステップ2 コード1つ当たりの突然変異の数(=q)を設定する(本発明を 実施する場合、遺伝子型中の文字の2.5〜5%に突然変異を起こ す)。 ステップ3 集団のサイズ(=p)を入力する。 ステップ4 遺伝子型中の位置をランダムに選択する。 ステップ5 選択された位置のコード文字をランダムに選ばれた異なる文字と 入れ替える。 ステップ6 ステップ4および5をq回繰り返す。 ステップ7 ステップ4〜6を繰返し、合計p個の新しいコードを発生させる。 ステップ8 モジュール1〜6を適用し、突然変異体集団の適合度を試験する。 最も高い選択性を有する亜集団を選択し、第3段階で使用する。 モジュール8:組換え ステップ1 集団のサイズ(=P)を設定する。 ステップ2 第2段階で発生させた集団からランダムに2つのコードを選択す る。 ステップ3 遺伝子型中の位置をランダムに選択する。 ステップ4 交換する文字の数を決めるために乱数を発生させる。 ステップ5 コード間で、選択された位置から始まる文字を入れ替える。 ステップ6 P個の新しい遺伝子型が生じるまでステップ2〜5を繰り返す。 ステップ7 モジュール2〜6を適用し、突然変異体集団の適合度を試験する。 最も高い選択性を有する亜集団を選択し、次の組換えシリーズま たは第4段階の成熟で使用する。 モジュール9:成熟 ステップ1 第3段階から誘導された親コードを入力する。 ステップ2 繰返し回数を設定する。 ステップ3 親遺伝子型中の位置をランダムに選択する。 ステップ4 その位置のコード文字をランダムに選ばれた異なる文字と入れ替 える。 ステツプ5 モジュール2〜6を用いて親コードの選択性(Fp)および突然変 異産物の選択性(FM)を試験する。 ステップ6 FM≧Fpの場合、親遺伝子型を突然変異産物で置き換える。 ステップ7 必要な繰返し回数だけステップ3〜6を繰り返す。 モジュール10:環を有する炭素骨格を発生するコードの作製 (6員環、入口点=出口点) ステップ1 コードの長さを設定する。 v1、v2、v3、...vn(置換基の頻度)を設定する。 prob_ring(環コード配列の頻度)を設定する。 (0≦prob_ring≦1) ステップ2 prime_code=""に初期化する。 second_code=""に初期化する。 third_code=""に初期化する。 ステップ3 文字鎖を形成する。 コード長に達するまでステップ4を繰り返す。 ステツプ4a If probe_ring>random(0≦random≦1)Then 環(舟形)に対する文字を割当てる。 {'431413','314134','141343','132132','321321' ,'213213','123123','231231','312312','42141 2','214124','141242','324234','242343','423 432'}からランダムに選択されたメンバーをnew character_l に設定する。 置換基に対する文字を割当てる。 頻度v1、v2、v3、...vnを使用して、{c1,c2,c3,.. .,cn}からランダムに選択された6つのメンバーをnew chara cter_2に設定する。(cl..cnは、異なる官能基を規定する文字 である) 置換基の価数に対する文字を割当てる。 {'1','2','3','4'}からランダムに選択された6 つのメンバーをnew character 3に設定する。 Else ステップ4b 初期コードに対する単一(非環)文字を割当てる。 {'1','2','3','4'}からランダムに選択されたメンバ ーをnew character 1に設定する。 置換基に対する文字を割当てる。 頻度v1、v2、v3、...vnを使用して、{cl,...,cn}からラ ンダムに選択されたメンバーをnew character 2に設定する。 置換基の価数に対する文字を割当てる。 {'1','2','3','4'}からランダムに選択されたメンバー をnew_character_3に設定する。 ステップ4c 新しい文字をコード鎖に連結する。 Prime_code=Prime_code & new character_1 Second_code=Second_code & new character_2 Third_code=Third_code & new_ character_3 モジュール11:多重点突然変異 ステップ1 初期コードを入力する。 ステップ2 コード1つ当たりの突然変異の数(=q)を設定する(本発明を 実施する場合、遺伝子型中の文字の2.5〜5%に突然変異を起こ す)。 ステップ3 集団のサイズ(=p)を入力する。 ステップ4 遺伝子型中の位置をランダムに選択する。 ステップ5 各コードベクター中の該選択された位置のコード文字をランダム に選ばれた異なる文字と入れ替える。 ステップ6 ステップ4および5をq回繰り返す。 ステップ7 ステップ4〜6を繰返し、合計p個の新しいコードを発生させる。 ステップ8 突然変異体集団の各メンバーの適合度を試験する。最も高い適合 度を有する亜集団を選択し、組換えまたは追加の多重突然変異で 使用する。 モジユール12:配列突然変異 ステップ1 突然変異の発生に対する閾レベルとして、PDEL、PINV、PINS、お よびPDUPを設定する(0≦PX≦1)。 ステップ2 コード中のランダムな位置(=x)を発生させる(0≦p≦コードの 長 さ)。 ステップ3 ランダムな長さ(=L)の配列を発生する(0≦L≦コードの長さ−x) 。 ステップ4 位置xから始まる合計L個の文字の配列をコードからコピーする 。 ステップ5 If O≦PINV≦乱数≦1 Then 鎖中の文字の順序を反転する。 ステツプ6 If≦PDUP≦乱数≦1 Then 配列をコピーして、コピーを配列に連結する。 ステップ7 If O≦PDEL≦乱数≦1 Then 位置xから始まるL個の文字をコードから削除する。 Else コード中の配列を、ステップ5および6で発生させた 配列で置き換える。 ステップ8 If O≦PINS≦乱数≦1 Then コード中の位置(=y)をランダムに発生させる(0≦y≦ コードの長さ)。 ステップ5および6で発生させた配列を位置yに挿入 する。 モジュール13:組換え ステップ1 集団のサイズ(=P)を設定する。 ステップ2 多重突然変異で発生させた集団からランダムに2つのコードを選 択する。 ステップ3 遺伝子型中の位置をランダムに選択する。 ステップ4 交換する文字の数を決めるために乱数を発生させる。 ステップ5 3つのコードベクターのそれぞれの間で、選択された位置から始 まる文字を入れ替える。 ステップ6 P個の新しい遺伝子型が生じるまでステップ2〜5を繰り返す。 ステツプ7 得られた突然変異体集団中で各リガンドの適合度を試験する。最 も高い適合度を有する亜集団を選択し、次の組換えシリーズまた は成熟で使用する。 モジュール14:成熟 ステップ1 組換えから誘導された親コードを入力する。 ステップ2 繰返し回数を設定する。 ステップ3 親遺伝子型中の位置をランダムに選択する。 ステップ4 各コードベクター中の該選択された位置のコード文字をランダム に選ばれた異なる文字と入れ替える。 ステップ5 モジュール4および5を用いて親コードの適合度(FP)および突 然変異産物の適合度(FM)を試験する。 ステップ6 FM≧FPの場合、親遺伝子型を突然変異産物で置き換える。 ステップ7 必要な繰返し回数だけステップ3〜6を繰り返す。DETAILED DESCRIPTION OF THE INVENTION                   Chemical structures with common functional properties                   How to design by computer                               Field of application of the invention   The present invention is based on a specific useful combination of configuration and binding affinity. Computer-based method for designing chemical structures that share functional properties . In particular, the present invention is simulated on a computer that is functionally similar to a biological receptor. Provided is a method for producing a coated receptor. These simulated receptors are already It is designed to exhibit an optimized selective affinity for a known target molecule. Next Create and progress chemical structures that show selective affinity for the simulated receptor And develop it.                                 Background of the Invention   Biological receptors are folded into a three-dimensional envelope (subpackage) for substrate binding. A linear polymer of amino acids or nucleotides that make up the this Specific three-dimensional arrangement of these linear arrays and the load on the envelope surface Electrical site placement is the result of evolutionary selection based on functional efficiency .   The selectivity of a biological receptor depends on the attraction and repulsion generated between the receptor and the substrate. Depends on the difference in strength. The magnitude of these forces is at the surface of the receptor and substrate It changes partially depending on the magnitude and proximity of the charged site.   Substrates are based on the number and size of charged sites present or induced on Since the spatial arrangement of these sites varies, the binding affinity varies with the structure of the substrate. Can be Substrates with similar binding affinities for the same receptor will have their induced At least some of the defined charging sites may share a common spatial arrangement high. Receptor function and binding affinity If related, substrates with similar binding affinities will also Will be functionally similar. In this sense, receptors do not recognize similarities between substrates. Or quantification.   Identify or identify new compounds or substrates with selective binding affinity for the receptor Traditional methods used in molecular recognition to discover are active Find molecularly common subgraphs of substrates and use them to create new similarities Based on the prediction of Disadvantages of this technique are similar to bonding Is based on the premise that structurally similar substrates are effective . However, in many cases, structurally dissimilar substrates are similar for the same receptor May have a binding affinity of Based on quantitative structure-activity relationship (QSAR) Recent technologies are only suitable for evolving and developing new compounds within the same structural class. In terms of evolving and developing new molecular structures that exhibit the desired selective affinity. Not really suitable. For example, Dean (Philip M.) 'S “Molecular Recognition: Riga Measuring and exploring molecular similarity in probe-receptor interactions (Molecular Recognition : The Measurement and Search For Molecular Similarity in Ligand-Receptor Interaction), Concepts and Applications of Mole cular Similarity), Johnson (Mark A. Johnson) and Magiola (Geral dMM) aggiora), pp. 211-238 (1990).   Recent efforts have focused on pseudoreceptors in which atoms and functional groups are linked. Or minireceptors consisting of a set of unconnected atoms or functional groups ) [Snyder, J.P., (199) 3 years), 3D QSAR in drug design: theory, methods and applications (3D QSAR in DrugDesign: Theory, Methods and Applications), Kubinyi, H.), Escom, Leiden., P. 336]. Related methods include known target ligands The model with a number of model atoms, and the Calculating the child force is included. In such a model, the calculated combined energy There is a high correlation between lug and biological activity [Walters, D.E. ) And Hinds, R.M., (1994), J. Am. Medic. Chem., 37: 2527], Producing novel chemical structures that exhibit selective affinity for this receptor model It has not been developed to the extent possible.   Therefore, useful functional features are based on a particular combination of configuration and binding affinity. Shared features that can be used as the basis for designing new chemical structures Various non-trivial similarities necessary to explain It would be highly advantageous to provide a method for identifying between chemical structures.                                 Summary of the Invention   The present invention is necessary and sufficient to account for the functional properties shared by different chemical structures. A method is provided for identifying subtle similarities between certain of these structures. This process Also provide a method for making novel chemical structures that exhibit similar functional properties.   The basic concept underlying the invention is a specific combination of configuration and binding affinity Computer to design or discover chemical structures with useful functional properties based on Is to use a two-step process with the data. In the first step of this process Uses an emulation by an antibody formation algorithm, A class of biological receptors with optimized binding affinity for selected target substrates Creating a population of simulated computer-generated receptors And In the second stage of the process, a simulated or virtual (virtu al) to assess the binding affinity of existing compounds or to optimize Design new substrates that show good binding.   The method described herein is an evolutionary process that optimizes the binding selectivity. simulation of selected characteristics of biological receptors, including ary process) Provided receptors. Simulated or simulated by this method Receptors recognize specific similarities between molecules Can be used to Like antibodies and other biological receptors, The simulated receptor made according to the present invention is a feature ext raction mechanism). That is, common or similar structural features of the target substrate Can be used to identify or recognize Bond between receptor and target substrate The affinity is used as a metric for feature recognition. Target substrate is identified Can be quantitatively classified based on their binding affinity to simulated receptors it can. Compounds that share specific structural features are similar to the same hypothetical receptor Also share the binding affinity.   The binding affinity between a biological receptor and a substrate is determined between the surface of the adjacent receptor and the substrate. Good steric compatibility, exclusion of water between the non-polar regions of the two surfaces, and It is determined by the strength of the electrostatic force generated between the contacting charging sites. In some cases Alternatively, the formation of a covalent bond between the substrate and the receptor may contribute to the binding affinity. This Simulated receptors produced by the process of The binding mechanism is similar to the partner. Average closeness between the receptor and target surface, Of binding affinity using the strength of electrostatic attraction generated between charged sites on the surface and on both surfaces The value is calculated. Evaluate the similarity of substrate molecules using the resulting binding affinity values .   The binding affinity can be determined as a whole. That is, the binding affinity is A tight receptor or receptor envelope that completely surrounds the entire quality surface and its substrate May depend on the interaction with the In this case, there is no analysis of the overall similarity between the substrates. It is suitable as a basis for establishing quantitative structure-activity relationships. However, In most, if not all, biological systems, the affinity is local rather than total. Partially determined. The interaction between the substrate molecule and the biological receptor is usually Is limited to the contact between the isolated fragments of the substrate and the substrate surface. In this situation, the join Since only the fragments of the substrate are directly involved in the generation of affinity, the overall class between the substrates Similarity analysis is not suitable as a way to establish structure-activity relationships.   Locally similar structures bind similar structural fragments in similar relative positions and orientations Sharing. Locally similar structures are not necessarily entirely similar. Minute Sampling child characteristics should be based on a full sampling strategy, including assessment of overall similarity, local Fragment sampling strategies, including local similarity assessments, and local and global classes This can be achieved by a multi-fragment sampling strategy involving similarity assessment.   Local similarity analysis identifies separate regions of the substrate for similar structures and charge distributions. Based on sampling. For biological receptors, a localized sampler Is due to irregularities or irregularities on the surface of the adjacent substrate and receptor. Close The interaction between opposing surfaces can be used to determine the binding affinity between more distant regions. Is more dominant than the interaction of The similarity of adjacent surfaces also determines the strength of hydrophobic bonds decide. In a simulated effective receptor made by the method of the invention, Identify target substrates (molecules) to assess functionally related similarities between compounds Each local sampling must be used.   The analysis of local similarity is complicated by two factors: sand That is, 1) the number, position and number of relevant fragments necessary and sufficient for a specific binding affinity. The identity can generally be established by simple inference from the chemical structure of the substrate. And 2) the position and orientation of the sampled fragment is the whole molecule Depending on the basic structure of   Generation of simulated receptors that can classify similarities between chemical substrates Part of the method according to the invention relates essentially to the substrate at a relevant location in space. Search for a receptor that serves as a sample of relevant fragments of Optimization process is spot It is based on the following four characteristics of the modified receptor. 1) Versatility, ie acceptance The body can bind to more than one substrate. 2) Specificity, ie acceptance The body's binding affinity changes with substrate structure. 3) Efficiency (parsimony), ie Receptors distinguish substrates based on the smallest set of local structural features. 4) Mutability That is, changes in the receptor's structure alter its binding affinity for a particular substrate I can do it. The shape of the linear genotype represented by the character string When the receptor phenotype is coded in a state, the structural properties of the simulated receptor change. The process of heterologous, recombination and genetics is facilitated.   Simulated receptors that meet these basic criteria are evolved selective breeding Locally similar using evolutionary selective breeding strategies It can be optimized to obtain specific binding affinity for the substrate. This Changes or alters the spatial arrangement and charge site distribution of the receptor Can be encoded in a hereditable form. As with biological receptors, The simulated receptor thus created defines a three-dimensional exclusion space. So A three-dimensional space such as You can draw an outline with. Proteins formed from linear polymers of amino acids Is an example of such a structure. Similarly, the three-dimensional structure of the simulated receptor Can be coded as one linear sequence of turning instructions it can. The encoded one-dimensional form of this receptor constitutes its genotype. Join The decrypted form used to assess affinity constitutes the phenotype. Optimal During the transformation process, changes (mutations) are made to the receptor genotype. Then these changes To assess the effect of phenotype on the binding affinity of the phenotype. Has the desired binding affinity The genotype that produces the phenotype that changes It is kept for further changes until the selected degree of optimization is achieved. Optimal To create a population of simulated receptors with binding properties, the classical You can use various evolutionary strategies, including gene algorithms. You.   The simulated receptor was then used with the receptor made by this method. Share certain useful properties of the molecular target species used as selection criteria in the production of the body Create or identify new chemical structures (compounds). Select interaction with receptor Use as a reference to derive a new chemical structure that best fits the receptor. This Since these structures must meet the necessary and sufficient requirements for receptor selectivity, The original molecular target biological It appears to have activity similar to the activity. Simulated with increased selectivity Receptor populations also have high potential to share these useful properties from existing chemical structures. It can also be used to screen for compounds with high affinity. Also the same process Screen to screen for compounds with the selected toxicological or immunological properties. Can also be used.   In one aspect of the invention, a chemical structure having preselected functional properties is designed. There is provided a computer-based method for doing so. This method   (A) A simulation coded in a linear character sequence Produce a physical model of the rated receptor phenotype and Prepare a set of target molecules that share functional properties   (B) For each target molecule:     (I) Using an effective affinity calculation, determine the affinity between the receptor and the target molecule. Calculated in each of a plurality of orientations,     (Ii) calculating the total affinity by summing the calculated affinity,     (Iii) identifying the maximum affinity,   (C) Using the calculated total affinity and maximum affinity,     (I) determining the maximum affinity correlation coefficient between the maximum affinity and the quantifiable functional property; Calculate,     (Ii) calculating the total affinity correlation coefficient between the total affinity and the quantifiable functional property. Calculate,   (D) using the maximum correlation coefficient and the total correlation coefficient, fficient)   (E) a collection of receptors that alter the structure of the receptor and have a preselected fitness factor; Steps (b) to (d) are repeated until a group is obtained,   (F) preparing a physical model of the chemical structure encoded in the molecular linear character array, The effective affinity calculations are used to determine the relationship between each receptor in multiple orientations and the chemical structure. Calculate the affinity and use the calculated affinity to Calculate the affinity score (an affinity fitness score),   (G) changing the chemical structure to generate a modified chemical structure, and repeating step (f). Return   (H) variants of chemical structure whose affinity score is close to the preselected affinity score Hold and change further, Each step is included.   In another aspect of the invention, a chemical structure is screened for a preselected functional property. A method is provided for performing the This method   a) By creating a linear character array of receptors that encode space occupancy and charge To generate a simulated receptor genotype,   b) decoding the genotype to generate a receptor phenotype and exhibit selected functional properties Provide at least one target molecule and apply it in multiple orientations using effective affinity calculations. Calculate the affinity between the receptor and each target molecule and calculate the total between each target molecule and the receptor Calculate the affinity and maximum affinity and calculate the total affinity of the target molecule for the functional property Affinity Correlation Coefficient and Maximum Affinity Phase Relationship of Maximum Affinity for the Functional Property Calculate the number and fit depending on the total affinity correlation coefficient and the maximum affinity correlation coefficient Calculate the coefficient,   c) mutating the receptor genotype and repeating step b), with a preselected match Retain receptors with increased fit coefficient until a population of receptors with coefficients is obtained And mutate, and   d) Attempt to screen in multiple orientations using the effective affinity calculation Calculate the affinity between the chemical structure and each receptor and calculate the affinity match score (however, , Which calculates the total and maximum affinity between the compound and each receptor, At least one of the total affinity and the maximum affinity to the at least one target Comparing the total affinity and the maximum affinity between and the population of receptors. This allows the comparison to be a mechanism of the chemical structure for the at least one target molecule. Activity level), Each step is included.   In another aspect of the invention, a method for selecting compounds having similar functional properties A simulated receptor that mimics a biological receptor that exhibits high affinity A method is provided. This method   a) By creating a linear character array of receptors that encode space occupancy and charge To generate a simulated receptor genotype,   b) decoding the genotype to generate a receptor phenotype and share similar functional properties A set of target molecules is prepared and the receptor and Calculate the affinity for the target molecule and calculate the total affinity between each target molecule and the receptor. Calculate the maximum affinity and the total affinity for the functional properties of each target molecule Maximum affinity phase relationship of correlation coefficient and maximum affinity of each target molecule for the functional property Calculate the total affinity correlation coefficient and the maximum affinity correlation for each target molecule Calculate the coefficient of fit depending on the coefficient, and   c) mutating the genotype and repeating step b) with a preselected fitness factor Retaining a receptor exhibiting an increased fitness coefficient until a population of receptors having And mutate, Each step is included.   In another aspect of the invention, a chemical structure having preselected functional properties is designed. A computer-based method is provided for: This method   (A) a set of target molecules that share at least one quantifiable functional property and A physical model of the receptor   (B) For each target molecule:     (I) Using an effective affinity calculation, determine the affinity between the receptor and the target molecule. Calculated in each of a plurality of orientations,     (Ii) calculating the total affinity by summing the calculated affinity,     (Iii) identifying the maximum affinity,   (C) Using the calculated total affinity and maximum affinity,     (I) determining the maximum affinity correlation coefficient between the maximum affinity and the quantifiable functional property; Calculate,     (Ii) calculating the total affinity correlation coefficient between the total affinity and the quantifiable functional property. Calculate,   (D) calculating a fitness coefficient using the maximum correlation coefficient and the total correlation coefficient;   (E) until a population of receptors having a preselected fitness factor is obtained, Changing the structure of the body and repeating steps (b) to (d),   (F) preparing a physical model of the chemical structure and using the effective affinity calculation to Calculate the affinity between each receptor in the orientation and the chemical structure and calculate the calculated affinity Calculate the affinity match score using   (G) changing the chemical structure to generate a variant of the chemical structure and repeating step (f); Return   (H) variants of chemical structure whose affinity score is close to the preselected affinity score Hold and change further   In yet another aspect of the invention, a method for encoding a chemical structure comprising an atomic element is provided. Thus, a linear character array encoding space occupancy and charge for each atom of the chemical structure The method is provided comprising providing.                             BRIEF DESCRIPTION OF THE FIGURES   The method of the invention will now be described, by way of example only, with reference to the accompanying drawings.   FIG. 1 shows the genotype code for generating the corresponding phenotypic moieties of the invention. 9 is a flowchart showing the relationship between creation and translation.   FIG. 2 shows the use of the point mutagenic moiety of the present invention to selectively bind to a set of substrates. Is a flowchart showing an outline of a process in optimizing a receptor to be used.   FIG. 3 shows a related set of optimized binding affinities for a set of chemical substrates. Generate a population of receptors that use these optimized receptors In the process of producing a new set of chemical substrates with common functional properties It is a flowchart which shows the outline of.   FIG. 4a shows some of the compounds used in the examples relating to the example of making ligands. Show.   FIG. 4b is an example of ligand preparation, the ligand prepared by the method of the present invention. 1.1 to 1.4, wherein each ligand has at least one orientation. And is structurally similar to benzaldehyde.   Figure 4c shows ligand production related to the design of a chemical structure that shows mosquito repellency. Examples of ligands 2.1 to 2.4 made by the method of the present invention are shown in the examples of the present invention.                             Description of the preferred embodiment   The method can be divided into two parts. That is, (A) shared functions Of simulated receptors with selective affinity for compounds with specific properties Group evolution and (B) new with shared functional properties The production of a simple chemical structure. Part (A) is 1) Receptor genotype and phenotype 2) presentation of a known chemical structure for the receptor, 4) Evaluation of the affinity of the receptor, 5) evaluation of the selectivity of the receptor for the chemical structure, 6 ) Probabilities of a group of related receptors with optimized affinity for the chemical structure Of chemical substrates for global evolution and development, toxicological and pharmacological activities And selective binding affinity for the receptor using the optimized receptor It consists of several steps, including the design of a new chemical structure with power.   In the following description of the best mode of the invention, the radii of molecules and atoms, Variations on polarities, effective dipole values, and transition states and other factors Refer to the table. These values are listed in Tables IV at the end of this specification. Process meter A flowchart showing a non-limiting example of the calculation is attached to modules 1 to 14 at the end of this specification. I do. Part A: Simulations showing selective affinity for target molecules with common functional properties Development of a population of rated receptors (1)Genotype code and receptor phenotype generation   Both the simulated receptor genotype and phenotype are the purpose of the calculations. Shi The phenotype of the simulated receptor is the atomic hydrogen Folded unbranched spherical subunits equal to the Rewars radius (≒ 110pm) Consisting of a polymer of Subunits correspond to sections of the sphere at each of their major axes Can be connected to each other at any two of the six points. In this example The bonds between the subunits cannot extend or turn And the center of the two connected subunits is equal to the length of their sides They are always separated by a distance (ie, one hydrogen radius). Two subunits Inversion occurs when these common neighbors are not joined to opposing surfaces . Four types of right-angled turns, left, right, top, and bottom, are possible. Turn parallel to one of the spindles Must be done. To simplify the calculations, turn the other If a subunit intersects with another subunit, the subunit has the same space as the other subunits. To occupy.   The complete simulated receptor consists of one or more separate polymers. Multiple For polymers made of different polymers, each polymer starts at a different point in space be able to. For simplicity of calculation, in this example a single receptor is constructed All polymers to be formed are selected to have the same length (= number of subunits) . This limitation is not a requirement for functionality; sets of polymers of different lengths are It can be useful for modeling certain systems.   The structure of each polymer is coded as a continuous set of turn instructions. this Instructions are internal references based on the initial orientation of the first subunit in each polymer. Specify each turn for the reference frame.   In this example, the hydration of the receptor and the substrate is not explicitly treated, but instead All water molecules present at the binding site permanently bind to the receptor surface, Suppose that it constitutes a physical part. This is an arbitrary approximation and will be obvious to those skilled in the art. It will be understood that more accurate processing can be replaced (e.g., VanOs s, 1995, Molecular Immunology 32: 199-211).   As shown in FIG. 1, the code generation module generates a random sequence of characters . Each letter represents a turn instruction or a three-dimensional form that constitutes a virtual receptor Determine the charging characteristics or reactivity of the point. Acceptance based on Cartesian (Cartesian) coordinate frame To generate a sequence representing the three-dimensional form of the body, a minimum of five different characters are required. is there. Other frameworks, such as tetrahedral structures, also use different sets of turn instructions. Can be built using Characters are the representation of virtual receptor structures in three-dimensional space. Represents a turn instruction defined for the current path (ie, the instruction is a virtual receptor It refers to the internal reference frame, and refers to any external reference frame. Not).   Inversion instructions are given for the current direction and polymer orientation. Left, right, top , And only turning down is allowed. If no inversion occurs, polymer ends You can or continue in its current direction.   For orthogonal systems, the smallest character set is C1= No turn, CTwo= Right turn, CThree= Turn left Times, CFour= Upturn and CFive= Downturn. Turn diagonally by combining instructions, like A1,2= C1CTwo, A2,1= CTwoC1It will be appreciated that etc. can be formed. Different charging Alternatively, there is no limit to the number of different letters that determine the state of reactivity, and experimental confirmation Can be adjusted. The code has a length (number of characters) and a specific It may differ in both the frequency with which the character appears.Genotyping example   The following examples of genotype coding and phenotype expression are for illustration by those skilled in the art. Will be understood. This example uses the following rules: (1) The character set used to generate the code is five characters that indicate a turn And two characters that specify the charging site, ie, "0" = no turn, "1" = right turn, "2 ”= Upturn,“ 3 ”= Left turn,“ 4 ”= Downturn,“ 5 ”= Positively charged part (No turn ) And "6" = negatively charged site (no turn). (2) Two types of subunits, charged or uncharged Have. Assumed that all charged subunits have a positive or negative unit charge You You. The uniform magnitude of the charge is an arbitrary rule. (3) The receptor contains 15 separate polymers. Full code length is always a multiple of 15 It is. The length of each polymer is equal to the total code length divided by 15. The receptor is It is understood that any number of different polymers of different or fixed lengths can be constructed Will be done. (4) The following parameters, (a) total code length (and polymer length), and (b) each character The frequency of occurrence in the code string and the occurrence of (c) character combinations are set by the user. Is determined. Module I shows a flow chart of a sample for creating a genotype code. You.Examples of receptor phenotyping   Each genotype code is translated and its corresponding phenotype, the tertiary of the virtual receptor Generate the original design drawing. Use a translation algorithm from a predefined starting point The position in space of the continuous subunits that make up the receptor polymer Convert turn instructions into a series of coordinate triplets to be described. Starting site for each polymer Marks must be given prior to translation. In translation, a series of sub Assume that the centers of the knits are separated by a distance equal to the covalent diameter of the hydrogen atom .   The translation algorithm reads the code sequence one after another, Generate minutes. The decoding of successive turns in relation to an external coordinate system is an array prior to the turn Depends on. Initial orientation is the same for each polymer that makes up the receptor Assume that In this example, the translation algorithm is shown in Table I, which is 4 shows force and output states. If turning does not occur, Δx, Δy, Δz Compute a new coordinate triplet using the most recent value and the new state. Charge sites are treated as linear (non-turning) portions. The initial value of the old state is , 20.   The following parameters can be set by the user. a. Starting coordinates of each polymer that makes up the receptor. The output is a. Three vectors (one for each axis: {x1, xTwo, xThree... xn}, {Y1... yn}, {Z1... zn }), b: a three-dimensional two-component matrix, c. Another vector of charged site coordinates Is stored as Module 2 shows a sample process of code translation. (2)Target generation   Targets are represented as molecules consisting of spherical atoms. Atoms are characteristic of each atomic species Is considered to be a hard sphere having a fixed radius. Target atom and virtual receptor The radius of the hard sphere at which the repulsion between Estimated by the Delwar radius. Instead of those shown in Table 2, Other estimates of the Rewars radius can also be used.   The distance between the centers of two atoms that are joined by a covalent bond is Expressed as the sum of the covalent radii of The covalent bond radius depends on the bond order and atomic species. Change. Table 3 shows examples of suitable values of the coupling radius. As a first approximation, the coupling distance The separation is assumed to be fixed (ie, coupling oscillations are ignored). Turn of the bond If allowed, samples representative of the turning state can be taken with multiple arrangements of the same structure. Is required. Not energetically unstable due to binding to virtual receptor Since the arrangement can be stabilized as described above, the arrangement stability is not considered. Various energies -A minimization algorithm can be used to generate the target ligand.   Charge generated by the binding dipole moment is thought to be localized in the nucleus of the atom . Negative charges are carried by atoms with greater electronegativity. In this example The dipole values used are shown in Table 4. Instead of those shown in Table 4, the dipole values Other estimates of can be used. (3)Target presentation   The affinity of each target for the simulated receptor is displayed on the receptor's upper surface. Test for multiple orientations of the target. This top surface is based on the translation algorithm Is defined as Before assessing binding affinity, target and receptor must be contacted. No. In at least one subunit of the receptor and at least one atom of the target When the distance between the hearts is equal to their combined van der Waals radius, the contact Occur. To determine the relative position of the target and the receptor at the point of contact, the target is Move gradually toward the receptor surface along a path perpendicular to Pass through the geometric center of the container and target. When contact occurs, the target binds to the receptor And reach that opposition. Translated target atom when conflict position is achieved The position is used to calculate the distance between the target atom and the receptor subunit. this These distances are used to calculate electrostatic interactions and proximity.   In this example, the target moves linearly toward the receptor, and upon contact, Assume that the original orientation is retained. An alternative approach is to target the receptor Gradually changes its orientation as it approaches the maximum affinity at the point of contact. Force position is obtained. This method is functionally similar to what it did However, it is computationally much more complicated. In this example, multiple orientations are reduced Testing with computational effort. In this example, along the x and / or y axis of the receptor Accommodates larger molecules, allowing for tunable substitution of pathways. This feature To enhance selectivity when testing different sized molecules on the same receptor is necessary.   Prior to the calculation of the opposition position, the orientation of the target is 6 around each of the x, y and z axes. ° Randomized by increasing random turns. Greater than or less than An increased number of turns may be used. Each of these random orientations of the target Unique in a given test series. The reliability of the optimization process , The number of target orientations being tested as well as the number of target compounds being evaluated. target A sample process for presentation is shown in module 3. (Four)Affinity calculation Approximation method   This example is a simplified example that evaluates the principal components of affinity with relatively little computational effort. Based on the approximation. The approximation is described in the following section. But more It is important to note that more accurate affinity calculation methods that give accurate affinity values may be used. It will be understood by traders. Known to calculate more accurate affinity values The calculation package may be used directly in the process.   To study the electron density of larger compounds by studying crown ethers Shows that the electron density distribution of small molecules can be used (Bruning, H. And Feil, D. (1991) J. Comput. Chem. 12: 1). Charge and dipole mode To define a strictly localized charge distribution that is later characterized by The Hirshfeld stock holder method can be used (Hirshfeld, FL (197 7) Theor. Chim. Acta 44: 129). The result is an overlapped atom in the total electron density distribution of the molecule. And its size is related to the free atomic radius.   In crown ethers, the main component of electrostatic interaction is the total charge between atoms. It is possible to show that it is determined by local movement rather than local movement. Charge distribution is largely determined by a narrow range of effects due to different chemical bonds . In particular, non-neighboring atoms contribute little to the dipole moment of the atom. It In addition, charge transfer between atoms is also affected by the electrostatic field of all molecules, Calculations have shown that the effect on charge distribution is very small. Is shown.   Electrostatic phase using calculated stockholder atom charge and dipole moment Interactions can be elucidated (Bruning, H. And Feil, D. (1991) J. Comput. Ch. em. 12: 1). Beyond the van der Waals radius, the quadrupole moment of the atom It only contributes to it. Calculation of the electrostatic potential taking into account only the atomic charges is not Always gives poor results, but improved by using dipole moments Value is obtained.   Based on these ideas, the method of the present invention is simulated with the target ligand. Between the receptor and the simulated receptor and the two measurements An approximation of the affinity between the chemical structures that have been introduced is introduced. 1. Simulated receptor subunits and target ligands (chemical structures) The magnitude of the electrostatic force generated between the atomic dipoles. The charged subunit is Since it is assumed to have immobile unit charges, the magnitude of this force is the atomic dipole Is directly proportional to the size of the simulated receptor-ligand atomic dipole. It is inversely proportional to the distance between them. 2. Systems close enough to the nonpolar region of the ligand for the generation of significant London dispersion forces Ratio of nonpolar or uncharged subunits of the simulated receptor.Assumptions used for affinity calculations in this example 1. The chemical substrate target evaluated by this example is neutral (ie, not ionized) Assume it is a numerator. This is an optional limitation and is applicable to charged and uncharged targets. A working example can be developed using the same method. 2. Assume that the dipole moment is localized in the nucleus. A similar analysis of affinity , Assuming that the dipole moment is located at the center of the covalent bond. According to Allingham et al. (1989), these hypotheses are functionally equivalent. 3. The environment around the virtual receptor is assumed to be a solvent system where the target exists as a solute I do. The target is effectively partitioned between the solvent and the virtual receptor. Four. At the time of calculating the affinity, the target and receptor rest between each other and Assume that it is in a fixed orientation. Five. Targets are two types of sites on the receptor surface, immobilized charged sites (negative or positive). (Charged) and interact only with non-polar sites.   Based on these assumptions, only consider the following contributions to the strength of the interaction Is good. 1. Charge-dipole -QTwoμTwo/ 6 (4ΠE)TwokTrFour 2. Charge-non-polar-QTwoα / 2 (4ΠE)TworFour 3. Dipole-non-polar (Debye energy) -μTwo/ (4ΠE)Twor6 Four. Non-polar-Non-polar (London Energy) -.75 [hναTwo/ (4ΠE)Twor6]   In this example, only relative intensities are considered by approximation, Numbers are ignored. In addition, the fixed charge site is single and positive or negative It is assumed to be either. Based on this, the four components are simplified as follows: Can be rewritten in a different form. 1. Charge-dipole -μTwo/ rFourOr -μ / rTwo 2. Charge-non-polar-α / rFour 3. Dipole-non-polar (Debye energy) -μTwoα / r6Or -μα.Five/ rThree Four. Non-polar-Non-polar (London Energy) -αTwo/ r6Or -α / rThree   In general, 2 and 3 above contribute only marginally to a wide range of interactions. But, Both 1 and 4 contribute significantly to the interaction energy. In this example Most interactions between non-polar fragments are due to adjacent alkyl and aromatic It is presumed to occur between hydrogen and the non-polar subunit. Under these conditions α Is assumed to be approximately constant.Contribution of hydrophobic strength and water exclusion   The solvation effect is an important consideration in binding affinity generation. For example, hydrophobic Bond formation relies on close spatial bonds of non-polar hydrophobic groups, and the hydrophobic regions and water Minimize contact between molecules. Hydrophobic bond formation is about half of the total strength of antibody-antigen binding Can contribute to degree. Hydration of the receptor and the substrate surface is also a significant factor. Receptor Or water bound to polar sites on the substrate surface may form a connecting bridge between the surfaces Can inhibit binding or increase affinity.     Hydrophobic interactions explain strong attraction between hydrophobic molecules in water . In the case of receptor-target interaction, it is the non-polar fragment of the target and the non-polar receptor sub It refers to the attractive force between adjacent areas of the unit. This effect is mainly Caused by the tropic effect, causing surface rearrangement, between adjacent non-polar regions Water is eliminated. However, the exact theoretical treatment of hydrophobic interactions is not available and sparse The aqueous force is estimated to contribute as much as 50% of the total attraction between the antibody and the antigen. Mark To estimate the hydrophobic interaction between the target and the virtual receptor, in this example the target The percentage of receptors that are effectively protected from solvation by target binding is evaluated. target All nonpolar (uncharged) within a fixed distance of the upper nonpolar atom ) The subunits form solvent molecules with a diameter equal to or greater than the defined distance. Would be protected from solvation.Affinity calculation by combination   The affinity calculations by the combination used in this example are two measures of interaction. , That is, a combination of measuring the total strength and proximity of charge-dipole interactions It is. In this example, it is assumed that these affinities are isotropic. Affinity With the use of force anisotropy calculations, the calculations are more complicated, but with greater discriminatory power Can be obtained by those skilled in the art.   The charge-dipole interaction is D = Σμi/ rij viIs the dipole model of the i-th atom of the target And rijIs the distance between the i-th atom and the j-th charged site on the receptor And the number of engagements v can be set to 2, 3 or 4. ). D contribution to total affinity is more sensitive to charge separation for larger values of v become.   Proximity measurement is p = Σni/ N (niIs a target with a dipole moment of 0.75 Debye or less. Uncharged subunit of the receptor separated by the maximum distance δ from the i-th atom of the target Is the number of knits). In this example, 6 is 1-4 subunits. Range of cut diameters (this approximates the van der Waals radius of water) Can be taken. N is the total number of subunits that make up the receptor.   The affinity value A is expressed by the following relationship A = [P (D + NP / k)]0.5(k is a fitting constant, in this example Is calculated from D and P using k = 10000). Where the value of P plays two roles. First, it is a weighting factor. Target and receptor are measured as “fitness” measurements. Bias the affinity values suitable for those arrangements where the non-polar regions of the Use to call. Under these conditions, hydrophobic and non-polar interactions The energy is increased and contributes significantly to the stability and strength of the bond. Under these conditions Has fewer pathways for the target to escape the receptor and retains it The time gets longer. Second, P contributes the dispersion energy contribution to the strength of the interaction. Used to evaluate. Dispersion energy for uncharged nonpolar regions Only significant when the target and receptor are in close proximity to each other (ie, δ Assume that it is significant only within the range). Adjust the values of k and 6 to adjust P and And the relative contributions of D and D. In general, P dominates nonpolar targets and D is large Significant for targets with local dipoles. Hydrogen bonds form the target hydroxyl, For negative or positively charged pairs interacting simultaneously with ruboxyl or amine functions Approximated by the resulting receptor unit.An alternative approach to affinity calculations-bond polarizability   In some cases, a parameter corresponding to the relative polarizability of the target atom is included in the affinity calculation. It may be advantageous to introduce a regulator. In this case, A = [P (D + NPTwo/ k)]0.5P inTwo The formula for calculating is PTwo= ΣniP, not / NTwoIs PTwo= Σαini/ N (niIs the i-th target Charged or uncharged receptor separated by a maximum distance δ from the eye atom Number of subunits, αiIs the relative polarizability of the i-th atom of the target) Is calculated. For simplicity, αHCan be set to 1.0 for aliphatic hydrogen You. If polarizability is used, the value of k must be adjusted. Adjacent joins Table V shows the sample polarizabilities based on the sum of the polarizabilities of   Since polarizability is related to the movement of the electron cloud, the polarizability of a molecule is characteristic of its covalent bond It can be calculated as the sum of various polarizabilities. This additivity is due to the non-polarized This applies to non-aromatic molecules having no offspring.Another method-functional group specificity   The affinity approximations used in this example include local charge, dispersion energy and Replace by functionally similar calculations, preserving target-receptor separation relationships be able to. In addition, affinity measurements for charged targets may be constructed . In this example, only non-covalent interactions are evaluated, but with selected target functional groups. Includes a virtual receptor subunit capable of specific covalent bond formation Thus, the method may be extended. Module 5 is used in the present invention 4 shows a sample flow chart of a preferred effective affinity calculation. (Five)Evaluation of selective affinity   The fit between the virtual receptor and the set of target substrates depends on the known activity or affinity of the target. By comparing the force values with those obtained for the virtual receptor-target complex evaluate. The maximal affinity of the optimally selective virtual receptor is based on known affinity measurements. Must be strongly correlated. Using successive repeats of point mutations, the substrate Can enhance this correlation between the set of virtual receptors and the virtual receptor (Figure 2), or Uses successive iterations of the production process to optimize the selectivity of the population of virtual receptors. Can be used to enhance this correlation (Figure 3).   Known values are known to be dependent on binding affinity or Can be any indicator, including (but not limited to) ED50, ID50, Knot Includes synthetic affinity, aggregation measurements, etc. The value being tested must be positive No. A logarithmic transformation of the data may be required. Unweighted floor Grade data cannot be used.   The optimal orientation of the target that gives the greatest binding affinity is unknown prior to testing. Receiving Each target is labeled on the receptor surface to obtain a measurement representative of the range of Must be tested repeatedly using various random orientations for each In the test, the affinity is evaluated using the module 4. Generally, the largest available The reliability of the affinity value depends on the size of the sample, which is This is because the possibility of including the value increases. Each receiver using the same set of target orientations Test the condition.   In this example, there are two methods: 1) average (or total) affinity and maximum parent. Using combined power measurements to select for receptors with higher selectivity And 2) the orientation of the orientation to be tested by successively repeating the optimization process. Increasing the number gradually (optimization starts with a small set of target orientations, To produce a receptor with good fit and to test for more orientations). Eliminates the need for large sample sets for the production of tailored receptors.   In this example, the affinity obtained for all tested orientations of each target Calculate the sum over the values. This total affinity score is the difference between the receptor and the target It is a measure of average affinity. At the same time, the maximum affinity value is determined.   Known value and total affinity rSA TwoAnd maximum affinity rMA TwoCalculate the correlation between . Target compounds that show no activity show little or no affinity for the virtual receptor Include the origin (0,0) in the correlation based on the assumption that This assumption is always valid Of course, some tests may require other intercept values.   Correlation using total affinity is a measure of mean goodness of fit. This correlation is large However, if the correlation between the maximum affinity and the known affinity is weak, the result is That the target is not selective, i.e. multiple orientations of the target effectively interact with the receptor Suggest that it can be used. Conversely, the maximum affinity is a known affinity value Virtual receptors are highly selected if they are highly correlated with and weakly correlated with total affinity Can be targeted. Both total and maximum affinities are highly correlated with known affinities In some cases, the orientation sampled may be a response of the receptor with limited errors. (Both Type I and Type II errors are reduced and false Positive or false negative results). Between known and total affinity To minimize the correlation between the maximum affinity and the known affinity. Sometimes it is more appropriate. In such a selection, the maximum affinity value is subtracted from the total sum. Therefore, it is necessary to eliminate these values as sources of disturbing bias.   In this example, the combined correlation value is used as the basis for receptor selection. To use. This value is calculated as the square root of the product of the total affinity and the maximum affinity.                 F = (rMA Two× rSA Two)0.5 This value is optimized by the evolutionary process applied to the virtual receptor. Note: rMA Two And rSA TwoAre strongly correlated with each other, rSA TwoValues that contribute to Closely correlates with sum value or contributes negligibly to total Must not be. Alternatively, (total affinity-maximum affinity) versus known Affinity correlation (rSA-MA) Can be calculated and measurements,                 F = (rSA Two× (1-rSA-MA Two))0.5 Is maximized. The use of this measurement allows for very limited orientation of the target. Receptors with a high affinity for the selected set are selected. Module 5 5 shows a flowchart of a sample fitness calculation. (6)Optimization process   The goal of the optimization process is to have selective affinity for a set of target receptors To develop a virtual receptor. A very efficient mechanic to find a solution Mechanism, but this is a total of 7 possible genotypes containing 300 instructions.300Or About 10253Because it is. The following four steps describe the steps in the optimization process This is a summary, and each step will be described in more detail below, and a calculation example will be shown.   Step 1: Create a random set of genotypes and determine the minimum level of activity Screen. Genetic algorithm (recombination) and one-way mutation method Use the selected genotype as a basis for another optimization used.   Second step: mutating the selected genotype to provide a different but A breeding population of correlated genotypes is generated. The most selective from the population for recombination Select a mutant.   Step 3: Creating a new genotype by selective mutant recombination. The one with the highest affinity fit value is selected from the obtained genotypes. This sub-population It is used for the next recombinant or mutant production.   Step 4: Take the best recombinant product and repeat the point mutation to improve selectivity Good.Stage I: Evolution-Creating Primary Code   Genetic algorithm developed by Holland (Holland, J.H. (1975) Adaptati on in Natural and Artificial Systems. U. Michigan Press. Ann Arbor) To find the optimal solution for various problems. Usually this method is large First, it is applied using a random set of solutions. In this embodiment, Needed to significantly alter this method and find virtual receptors with high selectivity The number of tests and the number of repetitions are reduced. This is a closely related genetic Using the set of offspring as the initial population, a high percentage of mutations Achieved by applying. Optimal affinity for any set of target compounds It is possible to develop different receptors with properties. For example, the receptor is optimal May bind to the same target in different directions. First population of closely related genotypes Increases the likelihood that the optimization process will converge to a single solution . Recombination of irrelevant genotypes can lead to new genetics with increased fitness It can generate subtypes, but is more likely to create diversity.   The goal of the first stage of the optimization process is to have a minimal level parent for the set of targets. Creating a genotype that has a harmonious power. This genotype is then Used to create subpopulations. Genotypes with minimal affinity A flowchart of an exemplary process for making is shown in Module 6.Step 2: Evolution-mutation of the primary code   A genotype mutation involves changing one or more characters in the code. And The mutation in this example is a mutation of the subunits that make up the receptor polymer. It does not change the number and does not affect the length of the genotype. These rules (c onvention) is optional and modifications may be useful in some systems. There will be.   Mutations can alter the phenotypic folding pattern, altering the receptor's shape space and consequences. A change in the position or exposure of the joint site occurs. Influence the structure of the area surrounding the phenotype The effecting mutation can result in a shift of the receptor center relative to the target center.Neutral mutation   All mutations alter phenotypic structure, but all mutations affect receptor functionality Does not change. Such neutral mutations affect affinity Not all components of the receptor may be altered. These neutral mutations are In some cases, they can be combined to show a synergistic effect.Breeding population (The Breeding Population)   The purpose of the second stage of the production process is to derive a different but related Is to create a population of different genotypes. Members of this population are then Used to create This breeding population is affected by a number of mutations in the primary genotype. Is generated. The resulting genotype is translated and selected for selectivity. Screened. The most selective product is saved for recombination. Module Rule 7 shows a flow chart of a representative process for multiple mutations of genotypes Is shown.Step 3: Evolution-recombination   The purpose of recombination is to create new genotypes with improved fit. By recombination This facilitates the storage of genotype fragments essential for phenotypic matching, while new) combination is introduced. Generally, recombinants combined with selection A rapid optimization of the selectivity is obtained. Module 8 is for genotype recombination 2 shows a flowchart of a typical process of the first embodiment.   In this example, used for recombination for testing in step 8 of module 8 Save the population that will be used. This allows genotypes with high selectivity to be screened for lower selections. It can be prevented from being replaced by an alternative genotype. In addition, In the example shown, the mutation (module 7) is tested (step 7, module 8 Apply to 50% of recombinant genotypes prior to This step allows the recombinant The variability within the population is increased. The size of the test population used in this example The range is from 10 to 40 genotypes. This is a relatively small group size is there. There may be conditions that require a larger population.Stage 4: Evolution-maturity Incremental small mutation   The final step in the optimization process mimics antibody maturation in the mammalian immune system Things. Apply a series of single point mutations to a genotype and phenotype match Evaluate the effect on Unlike recombination, this process generally involves phenotypic selection. It gives only slightly increasing changes to selectivity. This maturation process is called Rechen berg (1 + 1) evolution method (Rechenberg, I. (1973), Evolutionsstrategie. F. Frommann . Stuttgart). For each generation, match the parent genotype to the mutant Genotypes with greater selectivity compared to those of the adult To save. As a result, a mutant with less selectivity replaces its parent. And the process is strictly one-way. Module 9 remains Figure 4 shows a non-limiting sample flowchart of transgenic maturation.   At each iteration of the maturation process, only a single directive in the code changes. parent If the and the mutant products have the same selectivity, the parent will Replace with product. This method can have a synergistic effect with subsequent mutations Accumulation of neutral mutations. This rule is optional.   If improved selectivity is not obtained after repeated recombination or maturation If so, it is necessary to repeat step 2 to increase the variability of the breeding population genome obtain.Selected use   The process of the present invention has 1) a selected pharmacological or toxicological activity Screening of compounds, 2) opening new chemical structures with selected functional properties It can be used in multiple fields such as development. Both uses and specific examples are shown below. You. 1A)Screening method   Selective affinity for specific groups of compounds sharing similar pharmacological properties The population of receptors that have been developed are those whose activity depends on binding affinity. If used as a probe to identify other compounds with similar activity be able to. For example, open a population of receptors with specific affinity for salicylate. Can be emitted. The affinity of these receptors for salicylate Xygenase If closely related to the affinity for lithiate, the receptor should be at least partly Partially mimics functionally related features of the binding site of the cyclooxygenase molecule Must be doing it. Therefore, these receptors are potential cyclooxygenases. Used to screen other compounds for binding affinity for Can be   This method also screens compounds for potential toxicological or carcinogenic activity. Can be used for training. For example, steroid hormone receptors Receptors can be developed that mimic the specific binding affinity of Furthermore these Receptors for potential binding affinity in in vitro or in vivo tests Prior to assessing the affinity of pesticides, solvents, food additives and other synthetic substances Can be used for Also, the simulated receptors have alternate targets To detect affinity for sites, transport proteins, or non-target binding Can also be built. 1B)Screening for sub-maximal activity   High affinity compounds have adverse side effects or are unsuitable for long-term administration It may be. In such cases, compounds with lower binding affinity are needed Can be. In methods such as synthetic combinations, such compounds are readily made. Not specified. In contrast, using simulated receptors, Effective screening for structures that exhibit binding affinity at a specific level it can. 1C)Measuring molecular similarity   Simulated receptor selectivity can be used as a quantitative measure of molecular similarity. Can be used.Simulated receptor example   In this example, a fictitious test value of the target affinity was selected to allow for arbitrary selection of activity. Generation to build a simulated receptor that mimics a patterned pattern Demonstrated the ability of the program.   In this example, all receptors consist of 15 polymers. For width, length and depth values Thus, the origin coordinates of the 15 polymers with respect to the center of the receptor are specified.Example 1   A simulated receptor was created with the following specifications: Number of subunits: 240, width: 6, length: 6, depth: 25 code:Each target was tested 20 times against the receptor.   The affinity score of the optimized receptor was 0.9358, which was relatively low.   The target substrates used to optimize the receptor were benzene, phenol, and benzoate. Oleic acid and o-salicylic acid. The aspirin precursor o-salicylic acid is It is an inhibitor of prostaglandin synthesis by xigenase. Benzoic acid and pheno Tools have a relatively very low affinity for the same site. Against the receptor The target affinity values and scores are shown in Table A below. This is a simulated acceptance This shows that the body has the greatest affinity for o-salicylic acid.                                      Table A Target compound Target affinity Total affinity score Maximum affinity score Benzene 0.6 20.88 3.38 Phenol 1.2 8.03 4.99 Benzoic acid 1.6 42.23 12.98 o-salicylic acid 4.4 80.33 34.71   Three test substrates were evaluated using the simulated receptor. Compound Two of which are known to be less active than o-salicylic acid, m-salicylic acid And p-salicylic acid. The third compound, Diflusinal, is Sari Fluorinated salicylic acid derivatives with efficacy equal to or greater than that of tilic acid It is. The results of the evaluation are shown in Table B.                                      Table B Target compound Total affinity score Maximum affinity score m-salicylic acid 45.9 12.3 p-salicylic acid 63.5 27.5 Diflucinal 117 71.2 o-salicylic acid 80.33 34.71   The results obtained using the simulated receptor show that these compounds Exactly in accordance with pharmacological data, m-salicylic acid and p-salicylic acid It has a lower affinity score than citrate, and diflucinal is more active than o-salicylate. high. To increase the certainty of these predictions of activity, simulated Make the receptor more accurate and use another independently optimized receptor It is necessary. Part B:Development of new compounds with selected functional properties Evolution of new ligands   Selective affinity for a set of target compounds with similar functional properties Using a population of simulated receptors developed in New properties with similar properties that are closely related to structure or binding affinity Specific compounds can be prepared. Use interaction with receptor as selection criteria Thus, new chemical structures can be developed to optimally fit the receptor. These compounds must meet the necessary and sufficient requirements for receptor selectivity. Therefore, these new compounds have activities similar to those of the first molecular target. May also haveProcess overview   1. Systems with optimized selectivity for a set of characterized target compounds Create a population of simulated receptors. Multiple with different affinity properties It may be desirable to create a population. For example, a simulated receiver Three populations of conditions can be created, the first mimicking the selected target site. Mimic, the second mimics the site necessary to transport the ligand to its first target. Mimics, a third population of receptors mimics target sites that mediate unwanted side effects Things. The development of new ligand structures in this case requires Simultaneous optimization of the affinity for the first two receptor populations and the third Requires minimal affinity for   2. Measure affinity of novel primary structures for simulated receptor populations Set.   3. Modify primary structure and affinity using simulated receptor populations To evaluate. If the modification improves affinity properties, further modify the modified structure. To save for. If not, test different modifications. Osamu rejected earlier The decoration may be reintroduced in combination with another modification.   Four. Step 3 is repeated until a compound with suitable affinity properties is obtained. Note: Using the appropriately identified simulated receptor, It is possible to develop chemical structures with less than maximum affinity for the target site . 1)Creating molecular genotype codes   Ligand phenotype to linear genotype morphology represented by character string Encoding (molecular structure) is a structural feature of the ligand during the evolutionary process. Facilitates the process of sex mutation, recombination, and inheritance.   The ligands developed according to this example consist of a substituted carbon skeleton. Each co C consists of three character vectors. The first code vector is a carbon skeleton Includes rotation instructions for formation and determines the position of each carbon atom in the skeleton. Second The eye code vector specifies the functional group attached to each carbon atom. Third co The load vector specifies the position of the functional group relative to the host carbon. Atoms other than carbon The molecular skeleton (e.g., ether, amide and heterocycle) linking Use different letters to identify the species that replace the carbon atoms in the backbone. Can be constructed in the same way.   The carbon skeleton is constructed from a series of points that form nodes in a three-dimensional tetrahedral coordinate system. During the initial framework construction, the distance between the closest points is the average bond between the alkyl carbon atoms. Equal to the combined length. First code vector: ligand skeleton determinant   The first code vector specifies the direction of rotation relative to the current atomic position Consists of letters. Each rotation direction specifies the coordinates of the next atom in the tetrahedral matrix I do. Four directions (1, 2, 3, 4) can be taken from each atom,ThreeCarbonaceous Satisfied Not corresponding to valence. Each carbon atom belongs to one of four possible states (A, B, C, D) are doing. These states correspond to the number of different nodes in the tetrahedral coordinate system.   The following table shows the relationship between the direction of rotation and the new coordinates of the next atom in the skeleton. below Two tables B1 and B2 illustrate the two rules of rotation required for ligand construction . The boat-type rule is that the closed 6-membered ring (cyclohexane) has a boat-type structure Create a tetrahedral matrix. The chair-type rule states that the cyclohexyl ring forms a chair-type structure. Create a matrix to take. Combine both rules during code generation Is possible. In the example described here, only the boat type rules are used. Table B1: Boat type rules Current position = (x, y, z)                              New position after rotation                              New state after rotation Table B2: Chair type rules Current position = (x, y, z)                              New position after rotation                             New state after rotation   Using these relationships, the first code vector consisting of columns of characters 1, 2, 3, and 4 Can be decoded to form a three-dimensional array of carbon atoms. The resulting carbon The rows of atoms themselves fold or form closed loops, with short side chains and Form a ring structure. Specific ring structures (eg, cyclohexane) are shown below. Can be directly introduced as a specific character sequence.Second code vector: substituent   Using a second code vector of the same length as the first code vector, The type of substituent attached to the carbon atom specified by the Guess. Each substituent is specified by a single letter. Substituent is a single carbon skeleton Is added to A single carbon atom can have more than one substituent, but This is only when it is specified more than once by the first code.   In this example, the substituent identified by the second code vector Valences that are not fully satisfied Filled with atoms. Apply other rules to fill empty valences with non-hydrogen atoms May be.Third vector: Substituent bonding vector   Using a third code vector of the same length as the first code vector, The atom used for bonding the substituent specified by the th code vector Assign value. The third code consists of the letters 1, 2, 3, and 4, each of which is the first Indicates the rotation direction specified for the code of. The valence is already the first code base At the carbon atom designated by the vector or another previously assigned substituent Substituents are only assigned if they are not occupied. Or continuous substitution The substituents previously assigned by the group may be substituted. 2)Code creation   Belongs to the set {“1”, “2”, “3”, “4”} to form a carbon skeleton Construct the first code by generating a random array of characters. Hete The formation of ring structures, ethers, amides, imides and carboxyl compounds By substituting carbon atoms in the skeleton with different atoms specified by the Can be done.   The second code is created from a random sequence of letters specifying the type of substituent. You. Character frequency can be random or fixed prior to code generation .   The third code is a character belonging to the set {“1”, “2”, “3”, “4”} Consists of Ring structures are defined by adding a specific character sequence to the first code. It can be constructed graphically (for random creation). For example, "431413" Encodes a cyclohexyl ring. A total of 24 columns represent cyclos in a four-sided matrix. Encodes all possible orientations of the hexyl ring. The second about the first code of the ring The third and third code vectors are created as described above. Module 10 Shows a flowchart of an example of creating a code for creating a carbon skeleton having a ring.   Relative to the entry and exit points to the ring that forms part of the carbon skeleton The position is determined by the length of the character array used to create the ring. Concrete Typically, if the array contains six characters, for example 431413, the entry and exit points are the same in the ring. Members. The array is partially repeated and appended to the first six characters The entry point and the exit point are not the same member of the ring. For example, the sequence 4314134 And 43141343141 are Create a ring with an exit point on a member of the ring adjacent to the entry point.   In this example, by adding an array of at least six characters to the code. A ring is added to the backbone. Can be used for rings defined by 431413 Possible arrays are:         431413         4314134         43141343         431413431         4314134314         43141343141         431413431413         431413431413   Using the rules shown to form a new ligand genotype, In its linear form for storage during or introduction to the Can encode other chemical structures. For example, known pharmaceutical groups (pharmac ophore) can be coded in a linear form and have similar or improved features. Can be used as a starting point to generate new ligands with functional properties it can. Similarly, a set of pharmacophores that interact with a common target site And can be used for recombination. 3)Code translation and ligand construction   Code vectors are triggered in a translation process consisting of three separate steps. Is converted to a three-dimensional representation of the command. In the first step, the first code The carbon atom skeleton is constructed using. In the second step, the second and third Substituents are added to the carbon skeleton using instructions from the th code vector. Ma The instructions from the second and third code vectors are Substitutions at different atoms may be specified. Also, from the second and third code Directives are on carbon or other atoms that form part of the primary skeleton The number and direction of available valences can be changed. For example, the addition of carbonyl oxygen is 2 Occupy one empty valence. In the third step, during the second step All not satisfied by the substituent All valencies are filled with hydrogen atoms (unless otherwise specified).Primary decoding: Ligand skeleton construction   Primary decryption uses the rotation command from the first code vector to determine each carbon atom Identify the location of Suppose the first atom is located at the origin of the coordinate system. First Hara Suppose the child occupies state A in the matrix.   Decryption proceeds sequentially. The result of the primary decryption process is that of the n carbon atoms in the skeleton 3 × n matrices containing respective x, y and z coordinates. Loops and inversions are allowed So that the same position in space may be occupied by more than one carbon. This place Assume that only one carbon atom occupies that position. The resulting bone The number of carbon atoms forming the case is greater than the number of letters in the first code vector. Can be less.   As the first code is read, specify the substituents attached at each carbon position. The list is constructed from the second code that you specify. At the same time, use a third code A parallel list is then constructed, specifying the valence occupied by each substituent.Secondary decoding: Addition of substituent   Substituents are used during primary decoding based on a list generated from the second code. Sequentially added to carbon atoms. Host using the corresponding value from the third code Specifies the valence position of the substituent on carbon. The position is an adjacent carbon atom or Is not substituted if the previously specified substituent is already occupied. Ah Or, the replacement is performed at the next free location, or A decoding process to replace the substituents may be constructed. Between the substituent and the carbon atom The distance is calculated from the connection distance collation table. Replace using location data and bond distance Calculate the base coordinates. Multi-component substituents such as hydroxyl, nitro and amino groups , The coordinates of each atom in the substituent are calculated relative to the host carbon.   All substituents specified by the second code vector have been added to the backbone Later, all remaining unfilled positions on the skeleton are filled with hydrogen atoms. hydrogen spThree-Calculate the coordinates of each hydrogen atom using the carbon bond length.   A single carbon atom can have more than one non-hydrogen substituent. This is the same Can occur if the position is specified more than once by the first code vector You. this Although the example doesn't introduce a large number of permutations using the second code directly, It can be easily implemented.   Substitutions should only be made where the carbon atoms forming the ligand backbone are not full It is possible. Maintain an accumulation list of all occupied sites in the four-sided matrix. Carry.   During the secondary decoding process, the types, radii and positions of all atoms that make up the ligand And make a list. This list forms the basis for further target creation.   At this stage of the process, the feasibility of the structure created from the code sequence is Not evaluated. In certain cases, the atomic coordinates can be converted to an energy minimization program. To generate a more realistic structure. However, in this example, No assumptions were made regarding the structure of the ligand during the intervening period. Further, the present embodiment It preserves the structural uniqueness of the specific structure of the same molecule. For example, This example distinguishes the three rotamers of butane and considers each isomer a unique molecule. Eggplant   The coding vector constitutes the genotype of the corresponding ligand and is mutated and recombined Can cause a change in the ligand structure. The ligand structure itself is A phenotype used to evaluate binding affinity on a selected population of conditions. Four)Target presentation   Build chemical structure or target ligand from the first randomly generated code I do. After decryption, the coordinates, radius, dipole moment, and The polarizability is obtained from a lookup table of values, and the binding between the ligand and the selected population of virtual receptors is determined. Used to evaluate affinity.   The affinity of the target for each of the virtual receptors is Test for direction. Relative orientation of ligand and simulated receptor No assumptions are made. Prior to binding affinity evaluation, target and receptor are contacted. I have to do it. Method and chemical structure of target presentation and simulated receiver Calculation of the affinity to the receptor is performed using the known target molecule shown above in Module 4. Is essentially the same as between the and the simulated receptor You. Five)Evaluation of binding affinity and fitness   Target rigger for each simulated receptor used for fitness evaluation Of simulated receptors using target molecules for binding affinity of Calculate using the same effective affinity calculation method as described. As mentioned earlier, Affinity calculations using other criteria can be introduced into the fitness test, but The potency and computational efficiency of the invention is partly due to the creation of virtual receptors and Use the same effective affinity calculation to generate a chemical structure using the It is based on that. 6)Evolution of ligand Testing for conformity   Match specific populations of simulated receptors with novel ligands or chemical structures The intensities are simulated with target activity or affinity values for the ligand. Evaluation by comparing those values obtained for the receptor-ligand complex I do. The maximal affinity of the optimally selected virtual receptor is strong with the measured target affinity They should be correlated.   The target value can be set at any level of binding affinity. The ligand is Must have the same binding affinity for all virtual receptors used in the selection process No need. In practicing the present invention, optimized virtual receptors for known substrates The maximum binding affinity is used to calculate the target binding affinity. For example, the target affinity Set to 90% of the binding affinity of each member of the virtual receptor population for a particular substrate You may. In addition, when minimizing the interaction between the ligand and the virtual receptor, , The target binding affinity may be set to zero.   Simulated receptors optimized for different sets of substrates are combined and selected. By associating a selected target affinity value with each receptor, a specific binding affinity New ligands can be selected for the profile. Ligand fitness Is a measure of the degree of agreement between the calculated value of the ligand binding affinity and the target affinity value. Optimal The optimization process maximizes the fitness of the ligand.   The optimal orientation of the ligand that gives the greatest binding affinity is unknown until testing . To obtain a representative measure of the range of receptor-ligand affinities, And randomly test various new ligands for each new ligand. No. In each test, the affinity was evaluated using module 4 described in Part A. I do. In general, the reliability of the maximum affinity value obtained depends on the sample size. Exist. Samples may contain true maximums as size increases This is because the sex is increased.   Large samples to create new optimized ligands or chemical structures The following two techniques are used in practicing the present invention so that the use of pairs is not required. I do.   1. To select ligands with optimized affinity profiles, average Use the combined (and total) affinity and maximum affinity measurements.   2. Repeat the optimization process continuously to increase the number of orientations tested (standard Start optimization with smaller set of orientations to generate ligands with greater fitness To test more orientations).   In practicing the present invention, all ligands obtained for all tested orientations were obtained. Calculate the sum of the affinity values. This total affinity score is calculated between the receptor and the ligand. It is a measure of average affinity. At the same time, find the maximum affinity.   Using both the total affinity and the maximum affinity, the fit between the virtual receptor and the new ligand Test for strength. The calculated total and maximum affinity and the values of these parameters The fitness of each new ligand is evaluated according to the difference from the target value. Implement the invention If a new ligand-simulated receptor pair Calculate the following values as core.The fitness is maximized when the fitness score is zero. As explained in the previous section, High affinity goals and total affinity goals are optimized for virtual receptor evolution Obtained from a regression function obtained during the evolution process. How to calculate the target value It is as follows:       Target value of maximum affinity = f x the maximum of the substrates used to make the virtual receptor Maximum likelihood of substrate affinity       Target value of total affinity = f x the maximum of the substrates used to make the virtual receptor Also likely the total affinity of the substrate     Where F = scaling factor   Use two or more simulated receptors to assess ligand fit The fitness score for each ligand-simulated receptor pair. Add up.   In this case, the suitability is maximized when the total of the suitability scores is zero. Various types When testing new ligands against a panel of It may be desirable to use only harmonies. In this case, the fitness is given by Is:  Also in this case, when the total of the fitness scores is zero, the fitness is maximized. Series of Determine the total fitness of the ligands tested against the simulated receptor Other methods may be used for this, such as using geometric means.   Maximum and total affinity values obtained for each of the simulated receptors By using both, the selectivity of the virtual receptor can be used to evaluate ligand suitability. Be sure to get involved. According to this method, the fitness of the ligand is Not only reflects the affinity of the receptor, but also the steric requirements of the virtual receptor underlying selectivity. It also reflects satisfaction. 6a)Optimization method Purpose   Novel Ligand with Predetermined Target Affinity for a Set of Simulated Receptors To evolve the world. Total number of candidate genotypes including 25 directives is 256twenty fiveIs Therefore, a highly efficient method is needed to obtain a solution.   Method   (1) The first step: generating a random set of genotypes encoding ligands, And screen a set of simulated receptors to determine the threshold Select ligands above the bell.   (2) Second step: The selected genotype is transformed by a genetic algorithm (recombination) and Used as a basis for further optimization using one-way mutagenesis You. To mutate the selected genotype and perform recombination, Generate a breeding population that has an associated but relevant genotype.   (3) Select the most selective mutant from the population for recombination.   (4) Third step: New genetics by recombination of mutants with selectivity Generate a subtype. Select the one with the highest affinity match from the obtained genotypes. Select. This subpopulation is used to generate the next recombinant (repeat of the third step) , Or to generate the next mutant (repeat of the fourth step).   (5) Fourth step: select the best recombinant product, repeat point mutation, Increase.   (6) If a ligand with the desired fitness is created, terminate this optimization process. You.Stage 1: Evolution-Creating the Initial Code   The goal of the first stage of the optimization process is to determine the genotype and the minimum level of goodness of fit. Is to create a corresponding ligand phenotype. Then, this genotype Use to generate a population of related genotypes.   Genetic methods developed by Holland to search for optimal solutions to various problems Child algorithms can be used. Typically, when applying this technique, Use an initial random set of solutions. When practicing the present invention, a highly selective affinity To reduce the number of tests and repetitions required to find a potent ligand Provide significant improvements to this technique. This improvement is of great relevance as an early population. Use a single set of genotypes and increase the incidence of mutations at each iteration That has been achieved. Has optimal affinity properties for any set of target compounds It is possible to develop unique ligands. For example, receptors can be Optimal bonding can be exhibited in different orientations. Of relevant genotypes Using an initial ensemble increases the probability that the optimization process will converge to a single solution. Recombination of irrelevant genotypes may result in highly compatible new genotypes There is a great possibility of divergence.Step 2: Ligand mutation   The purpose of the second stage of the evolutionary process is to differentiate between different genotypes But to create a population of related genotypes. Then, the group Recombinants are made using the members. This breeding population contains multiple early genotypes. Created by mutation. Translate the resulting genotype and screen for selectivity. Performing The most selective product is retained for recombination.   By changing the characteristics of the genotype (coding vector) that encodes the structure , Subject the ligand to mutagenesis. These mutations cause the shape of the ligand , As well as the location and type of functional groups present on the ligand. The present invention In the mutations made in the above, the number of carbons that make up the backbone of the ligand can be changed. Wear. Module 11 is a typical process flow for making multiple point mutations. It is a low chart.   Mutations can alter the phenotypic folding pattern of the ligand and consequently As a result, the shape, the position of the functional group and the state of exposure change. Ligand table Mutations that affect the configuration of the current peripheral region cause a pairing of the receptor center. May change the position of the image.Neutral mutation   Although any mutation results in a phenotypic structural change, Changes in potency do not necessarily occur with all mutations. This Changes in the components of the ligand that do not affect affinity when such neutral mutations occur May occur. In some cases, these neutral mutations are The union may have synergistic effects.Sequence mutation   Sequence mutations do not directly alter the properties of the code. That generation Instead, the array of characters in the code is rearranged. When a sequence mutation occurs, Riga The size, steric structure, presence (presence or absence) and position of functional groups there is a possibility. In practicing the present invention, four types of sequence mutations are used. a) Deletion: Deletion of a character sequence from the code.         ABCDEA⇒ABEA b) Invert: Invert the order of the characters making up the array in the code.         ABCDEA⇒ABDCEA c) duplication: repeat the sequence of characters that make up a part of the code.         ABCDEA⇒ABCDCDEA d) Insert: Insert an array of characters into the code.         ABCDEA⇒ABCDBCEA In practicing the present invention, a combination of mutations will be utilized. Mozir 12 is a representative 9 is a flowchart of a simple sequence mutation.Third step: generation of recombinant code   During recombination, randomly selected complementary sections between selected genotypes Replace the option. The purpose of recombination is to create new genotypes with increased fitness Is Rukoto. Genotyping is essential for phenotypic fitness when performing recombination Keep the pieces, but at the same time introduce a new combination of instructions. Generally, recombination Performing the selection in conjunction with the selection speeds up the optimization of the selectivity. Module 13 Fig. 4 is a flowchart showing a typical procedure for recombination.   When practicing the present invention, the population used for recombination for testing is retained. This Genotypes replace highly selective genotypes with less compatible genotypes. Not to be. In practicing the present invention, multiple 50% of recombinant genotypes Test after mutation. This process is a multiple process within the recombinant population. Increase the likelihood. The size of the test population used in practicing the invention depends on the genetic There are 10 to 40 child molds. This is a relatively small size population. As per requirement May require a larger group.Step 4: Maturation of ligand Step-wise micromutation   The final step in the optimization process mimics antibody maturation in the mammalian immune system . Applying a series of single point mutations to genotypes to determine their effect on phenotypic fitness evaluate. Unlike recombination, this process generally involves phenotypic selectivity. Increases slightly. This maturation process utilizes the Rechenberg (1 + 1) evolution strategy. You. At each outbreak, the fitness of the parent genotype and the fitness of the mutant product And retain the more selective genotype for subsequent development. More selectivity As a result, the lower mutants do not replace the parent, Is extremely one-way. When practicing the present invention, each iteration of the maturation process And change only one command in the code.   If the parent and its mutants have the same selectivity, the parent will be Replace with the mutant product of In this way, subsequent mutations and synergies Neutral mutations that may be indicated accumulate. This conversion is optional. Module Rule 14 is a flowchart showing a typical maturation process.   No improvement in selectivity after several rounds of recombination or mutation , Multiple mutations (stage 2) were performed to increase the diversity of the breeding population genome. Sometimes you have to return.                               Example of ligand preparation Overview   Benzaldehyde repels mosquito Aedes aegypti, but benzene and tol The repellent effect of ene is quite small (Table 1). Cyclohexane and hexane are Are not significantly repelled (Table 1). In the next test to create a new ligand Using the method of the invention, compounds with a repellent effect similar to benzaldehyde At the beginning (ab initio). In the first stage of ligand production, Benzual Chemistry with high affinity for aldehyde and low affinity for benzene A rated receptor was constructed. In the second step, the simulated receptor And development of a ligand whose binding affinity is similar to that of benzaldehyde .Mosquito reaction   Mosquitoes, 7 to 14 days after outbreak, are kept in the laboratory and are not fed Was. The experiment was performed at 20 ° C. for 6 days under fluorescent lighting. Eastern Daylight Time At 12: 00-17: 00. The four test populations for the trial were 200, 175, It consisted of 105 and 95 female mosquitoes. Mosquitoes were given drinking water.   35x35x35cm transparent Pl with two screen sides forming opposing walls The test was performed in an exiglas box. The screen has two layers: coarse plastic And a fine nylon mesh outer layer. One In a fume hood, allow air to enter from the side of the screen and exit from the opposite side. Was placed in the box. The air flow was <0.5 cm / s.   The mosquito stood on the wall of the box with its head up. Whatman # 1 filter paper triangle (4 × 4 × 1 mm) to give the stimulating compound. Dip the tip into the test solution to a depth of 0.5 cm. Used immediately afterwards. The response to the test solution was measured as follows: 1. A stationary female mosquito perched on the inner screen of the windward wall for testing And selected. 2. Place the end of the treated filter paper on the outside of the screen, and It was placed in the facing position. In each case, first approach from below the mosquito's position. I did. 3. The tip was held in place for a maximum of 3 seconds and the mosquito response was noted.   This procedure was then repeated for new individuals. 1 day a day with each compound The mosquito was tested only once. 5 tests on each tip (total operating time <30s) Used after replacing. Compounds are tested in random order and each compound is tested , Twice on another day. Place the untreated (dried) in the same position as the treated tip. The filter paper tip and the tip moistened with distilled water were placed and two sets of controls were tested. Was. Testing of these controls was performed with regular intervention between testing for repellent compounds . versus The response to illumination did not change during the experiment (p> 0.25). Four behavioral responses were recorded: 1. No response: the mosquito remained immobile. 2. Escape: The mosquito flew away from where it had stopped. 3. Lifting ipsilateral limb: The mosquito lifted its hind limb on the same side as the stimulus. Four. Contralateral lifting: The mosquito lifted its back limb on the opposite side of the stimulus.   Evacuation often occurred after lifting the ipsilateral limb, in which case both actions were performed. Recorded. Wear polyethylene gloves during testing and at all stages of compound preparation did. Generation of simulated receptors and ligands   Using the same selection criteria, two simulated receptors were made. Each receptor Were used independently to generate one set of ligands.Molecular assembly 1 Stage 1: Making the receptor   We have evolved and developed a receptor with selective affinity for benaldehyde. G The training targets were benzene and benzaldehyde. 15 per target Affinity values were calculated using different orientations. The consequences of the evolution process are: Was. Target Activity level Total affinity Maximum affinity Benzene 1.0 6.87 2.21 Benzaldehyde 5.9 75.87 13.02   The affinity score for the receptor was 0.992. Optimized 25x6x7 benz The code for the aldehyde receptor was as follows: Step 2: Preparation of ligand   Optimized simulated receptors as templates for the evolution of novel ligands Used as Four different ligands due to random mutation and selection Was assembled. Ligands with similarity to benzaldehyde were selected. The affinity values for the ligand were as follows:   The evolved ligands 1.1-1.4 are shown in FIG. 4b. At least for each ligand Another orientation was structurally similar to benzaldehyde.Molecular assembly 2 Stage 1: Making the receptor   Evolving and developing a 25x6x7 receptor with selective affinity for benzaldehyde did. Training targets were benzene and benzaldehyde. For each target Affinity values were calculated using 15 different orientations. The results of the evolution process are as follows Met. Target Activity level Total affinity Maximum affinity Benzene 1.0 25.88 8.53 Benzaldehyde 5.8 162.23 42.74   The affinity score for the receptor was 0.996. The code for the receptor is Was as follows: Step 2: Preparation of ligand   Optimized simulated receptors as templates for the evolution of novel ligands Used as Four different ligands due to random mutation and selection Was assembled. Ligands with similarity to benzaldehyde were selected. The affinity values for the ligands were as follows:   The evolved ligands 2.1-2.4 are shown in FIG. 4c. At least for each ligand Another orientation was structurally similar to benzaldehyde.   Compounds 2.1 and 2.4 are substituted cyclohexanone derivatives. Ligand 2.2 is 5 -Chloro-2,7-nonadione and ligand 2.3 is 2-cyano-5-hexanone. Ligand 1.4 contains a fragment structurally equivalent to methylcyclohexyl ketone Have been. Cyclohexanone, menthone, methylcyclohexyl ketone, and Experiments testing the repellency of 2-octanone (see Figure 4a) show that these Are suggested to be repellent to mosquitoes (Table E2). * Relative repellency = [(escape reaction% + limb raising reaction%) x boiling point] / 100   Design new chemical structures that exhibit pre-selected functional features or properties The method disclosed herein has been described using only examples. example If this method is used, other known permissions such as polarizability, dipole moment, covalent radius, etc. It can be easily implemented using acceptable values. In addition, the process in the module The flowchart showing the process of computing the software is for illustrative purposes only. example For example, affinity calculations may be performed using less approximations than those used herein. It can also be performed using a handy computer package. New chemical structure The method of making is first performed on a known target compound with similar functional characteristics. One or more simulated receptors exhibiting a predetermined affinity are produced and these receptors are Using containers to create novel chemical structures that exhibit these characteristics to the desired extent It was based on that. Except for generating a new chemical structure for the receptor itself For example, to screen the pharmaceutical or toxicological properties of a known compound. It may be used as a means for carrying out. Therefore, do not depart from the scope of the present invention. It will be appreciated that many changes can be made to the method disclosed herein. The trader will know.                       Table I: Transition states and additional factors   Old state additional factor new state for rotation below Expression for algorithm: input (old state, rotation) ⇒ Output (Δx, Δy, Δz, new state) Example: Initial position (12, 34, -18); Input: old state = 10, rotation = right:   Output: new state = 6, Δx = 0, Δy = 1, Δz = 0: subsequent position (12, 35, -18)Table 2: Van der Waals radii Source: N.S. Issacs, 1987. Physical Organic Chemistry. Longman Scientific and Technical, New York. 828 pp.   Table 3: Covalent radius (pm)   Coupling order     N.S. Based on values in Issacs (1987).Table 4: Typical effective dipole values used for charge site assignment *Preferred value under most conditions   Each target atom is a set of eight values {xi, Yi, Zi, Ri, Bri, Cri, Di, ΑiComplete with} Is described in Where xi, Yi, ZiIs the position coordinate with respect to the geometric center of the molecule. , Ri= Van der Waals radius, bri= Bond radius or covalent bond radius, cri= Collision Radius (= ri+0.5), αi= Polarizability and di= Value of effective dipole moment .Table 5: Relative effective polarizabilities selected for specific target atoms * Value calculated from the polarizability of molecules ? Values can be determined from the appropriate molecular data. Module 1: Generating a Code for a Simulated Receptor Step 1 Code preparation parameters: Input i) code length and ii) command frequency               I do. Step 2 Initialize with an empty character chain and save the code. Step 3 Generate random numbers. Step 4 Characters “0”, “1”,. . . ,               Select '6' and ligate to the coding strand. Chain length is code length setting               Repeat step 4 until equal to value. Step 5 Output the code. Module 2: Translating the code for the simulated receptor Step 1 Enter the origin coordinates for the polymer containing the receptor. Step 2 Enter the code for the polymer. Step 3 Read the first character from the code. Step 4 If the character is a turn command, use the translation algorithm to               Determine the coordinates of the knit. Otherwise, go to step 7. Step 5 Save the coordinates of the subunit. 0 charge value for subunit               Is assigned. Step 6 If the character is not the last character in the code, repeat step 3               . Otherwise, proceed to the next. Step 7 If the character is a charge command, use the translation algorithm and               Assuming the coordinates of the subunit are determined. Step 8 Save the coordinates of the subunit. Subunit based on letter               Is assigned a charge value of +1 or -1. Step 9 If the character is not the last character in the code, repeat Step 3               . Otherwise, proceed to the next. Step 10 Repeat steps 2-9 for each of the polymers containing the receptor.               return. Step 11 Output the coordinates and charge value of the subunit. Module 3: Target presentation Step 1 Enter coordinates and radius (xti, yti, zti, radius i) of target atom               I do.                   (I = number of atom in target)                     Enter the coordinates (xrj, yrj, zrj, charge j) of the receptor.                   (J = subunit number in the receptor) Step 2 Generate random angle values (Δθ, Δφ) and translation values (kx, ky)               Let it live. Step 3 Rotate and translate atomic coordinates by random amounts. Step 3a Convert target coordinates to polar form.                   (Xti, yti, zti, radius i) ⇒ (θi, φi, ρi, radius               i) Step 3b Randomly change the angle.                   (Θi, φi, ρi, radius i) ⇒ (θi + Δθ, φi + Δφ               , Ρi, radius i) Step 3c Convert to rectangular coordinates.                   (Θi + Δθ, φi + Δφ, ρi, radius i) ⇒ (xi, yi,               zi, radius i) Step 3d Add a random translation.                   (Xni, yni, zni, radius i) = (xi + kx, yi + ky, z               i, radius i) Step 4 Center the target coordinates at the origin (0,0,0). Step 4a Determine the maximum and minimum values of xni, yni, and zni. Step 4b Find the geometric center of the receptor:                   xn center = (xn maximum value−xn minimum value) / 2, yn center = (yn maximum value−yn              (Minimum value) / 2, zn center = (zn maximum value−zn minimum value) / 2. Step 4c Calculate the centered coordinates:                   (Xncj, yncj, zncj) = (xni−xn center, yni−yn center)              ,                znj-zn maximum). Step 5 Atomic radius and transformed coordinates (xncj, yncj, zncj, radius               Construct the target collision surface g (xg, yg) = zg using i). Step 5a Create a grid with a spacing equal to the diameter of the receptor subunit (= 1).              To make.                     Grid coordinates:                       xg∈ {Int (xn minimum-xn center), Int (xn minimum-xn               Mind) +1 ... 0, .. Int (xn maximum-xn center)-1, Int (xn maximum-xn               heart)}                       yg∈ {Int (yn minimum value-yn center), Int (yn minimum value-yn middle               Heart) +1 ... 0, .. Int (yn maximum value-yn center) -1, Int (yn maximum value-yn middle               heart)}                   For all points on the grid, the initial value of g (xg, yg) is              Set to 0. Step 5b For each atom (i), for each grid point (xg, y               Set the value of g (xg, yg) (height) of g):                      For i = 1 to number of atoms in target                      If (xnci-xp)Two+ (Ynci + yp)Two<Radius iTwothen                        g (xg, yg) = minimum (g (xg, yg), znci-radius i)                       Else                         If (xnci-xp)Two+ (Ynci + yp)Two<(Radius i + .5)Twothen                           g (xg, yg) = minimum (g (xg, yg), znci- (radius i /               2))                         Else                           g (xg, yg) = minimum (g (xg, yg), 0)                         Nexti Step 6 Center the coordinates of the receptor at the origin (0,0). Step 6a Find the maximum and minimum values of xrj, yrj and zrj. Step 6b Find the geometric center of the receptor:                   xr center = (xr maximum value-xr minimum value) / 2,                   yr center = (yr maximum-yr minimum) / 2,                   zr center = (zr maximum value−zr minimum value) / 2. Step 6c Calculate the coordinates of the centered receptor:                   (xcj, ycj, zcj) = (xrj-x center, yrj-y center, zrj              -Z minimum). Step 7 Use the coordinates of the off-centered receptor according to the following rules to              Construct a convex surface s (xs, ys) = zs:                     Set all initial values of s (xcj, ycj) to 0.                     for j = 1 to the number of subunits in the receptor                     if zcj> s (xcj, ycj) then s (xcj, ycj) = zcj                           next j Step 8 Find the minimum separation between the receptor impact surface and the target impact surface.                    Compute the difference matrix d (xg, yg) as follows:                     xg∈ {Int (xn minimum value-xn center), Int (xn minimum value-xn center)               +1 ... 0, .. Int (maximum value of xn-center of xn) -1, Int (maximum value of xn-xn               heart)}                   and                     yg∈ {Int (yn minimum value-y center), Int (yn minimum value-yn center) +               1 ... 0, .. Int (yn maximum value-yn center) -1, Int (yn maximum value-yn center)}                   For all of                     d (xg, yg) = (h (xg, yg) −zn minimum value + zn maximum value) +                                 (s (xg, yg)-zr minimum + zr maximum)                     Is calculated.                   For all xg and yg, the minimum value of d (xg, yg) = dmin               Ask for.                   dmin is the minimum separation distance. Step 9 To determine the collision configuration, the coordinates of the target and the coordinates of the receptor are               Convert.                   Receptor coordinate transformation:                     (xreceptorj, yreceptorj, zreceptorj) =                                                     (xcj, ycj, zcj + z              r minimum value-zr maximum value)                   Target coordinate transformation:                       (xtargeti, ytargeti, ztargeti) =                                                     (xnci, ynci, znc              (i-zn minimum value + zn maximum value -dmin) Step 10 (xtargeti, ytargeti, ztargeti) and (xreceptorj, yrece              The affinity is calculated using ptorj, zreceptorj).                   Repeat steps 2-9 for each target configuration to be tested.              Return. Module 4: Affinity calculation Step 1 Target and receptor collision coordinates (xtargeti, ytargeti, ztarget               i) and (xreceptorj, yreceptorj, zreceptorj)               .               However,                   i = number of atoms in target, j = number of subunits in receptor               is there. Step 2 Enter the dipole moment value dip (i) for the target.                   Enter the value of the charge for the receptor, charge (j). Step 3 A threshold value THRESH0LD for calculating the proximity is input. Step 4 Calculate the dipole affinity value. Step 4a For each charged subunit (charge (j) ≠ 0)                   e (i, j) = dip (i) / ((xtargeti−xreceptorj)Two+               (ytargeti-yreceptorj)Two+ (Ztargeti-zreceptorj)Two) 1.5                   Is calculated. Step 4b For all combinations of i and j for which charge (j) ≠ 0, e (i,               Calculate the sum of j).                      DIPOLE = Σe (i, j) Step 5 Calculate the proximity value (this step is a calculation based on polarizability)               Can be replaced). Step 5a For each target atom where │dip (j) │ ≦ 0.75,                     1 (i, j) = ((xtargeti−xreceptorj)Two+                       (ytargeti-yreceptorj)Two+ (Ztargeti-zreceptorj               )               Two)0.5                     Is calculated. When 1 (i, j) <THRESHOLD, prox (i, j) = 1               I do. Step 5b For all combinations of i and j where | dip (j) | ≦ 0.75,                     Calculate the sum of prox (i, j).                       PROXIMITY = Σprox (i, j) Step 6 Calculate the affinity value for the target substrate combination = AFFINITY.                   AFFINITY = (PROXIMITY / j) ((PROXIMITY / 10000) + DIPOLE) Module 5: Calculation of fitness Step 1 Enter a known target potency or affinity value (yk). However,               k = number of targets to be tested. Step 2 Target and receptor collision coordinates (xtargeti, ytargeti, ztarget               i) and (xreceptorj, yreceptorj, zreceptorj)               .               However,                    ik = number of atoms in target k, j = number of subunits in the receptor               Is a number. Step 3 Enter the number of target orientations to be tested (= m). Step 4 Using module 5, parent for each target and orientation of each target               Find the sum value (AFFINITYk, m). Step 5 Maximum affinity value (MAk) and total affinity value (SA) for each target               Determine k). Step 6 Maximum affinity value (MAk) and known target potency or affinity value (y               k) and correlation coefficient rMA Two, Or the total affinity value (SAk)               Correlation coefficient r with target potency or affinity value (yk)SA TwoIs calculated. Step 7 The adaptation coefficient F is calculated.                   F = (rMA Two× rSA Two)0.5 Alternative Step 6 'Maximum affinity value (MAk) and known target potency or affinity value (y               k) and correlation coefficient rMA TwoOr total affinity value (SAk)-maximum affinity               Coefficient of correlation r between the potency value and the potency or affinity value (yk) of the known targetSA -MA TwoIs calculated. Step 7 'Calculate the adaptation coefficient F.                   F = (rMA Two× (1−rSAMA)Two)0.5 Module 6: Generation of Genotype with Minimum Level of Affinity Step 1 Set the minimum threshold value of the fitness. Step 2 Generate a random genotype (module 1). Step 3 Translate genotypes and construct phenotypes (module 2). Step 4 Test the phenotypic affinity for the target (Modules 3, 4, 5,               6). Step 5: If the phenotypic fitness exceeds the fitness threshold, stop coding               And send the code to the second stage. Otherwise, steps 1-5               repeat. Module 7: Multiple Mutations Step 1 Input an initial code (first stage). Step 2 Set the number of mutations per code (= q) (this invention               If performed, mutate 2.5-5% of letters in the genotype.               ). Step 3 Enter the group size (= p). Step 4 Randomly select a position in the genotype. Step 5 Change the code character at the selected position to a different character randomly selected               Replace it. Step 6 Repeat steps 4 and 5 q times. Step 7 Steps 4-6 are repeated to generate a total of p new codes. Step 8 Apply modules 1-6 and test the fitness of the mutant population.               The subpopulation with the highest selectivity is selected and used in the third stage. Module 8: Recombination Step 1 Set the size of the group (= P). Step 2 Randomly select two codes from the population generated in the second stage               You. Step 3 Randomly select a position in the genotype. Step 4 Generate a random number to determine the number of characters to be exchanged. Step 5 Swap the characters starting from the selected position between the codes. Step 6 Repeat steps 2-5 until P new genotypes are generated. Step 7 Apply modules 2-6 and test the fitness of the mutant population.               Select the subpopulation with the highest selectivity and proceed to the next recombination series.               Or used in stage 4 maturation. Module 9: Maturity Step 1 Enter the parent code derived from the third step. Step 2 Set the number of repetitions. Step 3 Randomly select a position in the parent genotype. Step 4 Replace the code character at that position with a different character chosen at random               I can. Step 5 Select the parent code (Fp) And sudden change             Foreign product selectivity (FMTest). Step 6 FM≧ FpIn case, the parent genotype is replaced with the mutant product. Step 7 Steps 3 to 6 are repeated as many times as necessary. Module 10: Preparation of a code that generates a carbon skeleton having a ring                     (6-member ring, entrance point = exit point) Step 1 Set the code length.                   Set v1, v2, v3, ... vn (substituent frequency).                   Set prob_ring (frequency of ring code sequence).                     (0 ≦ prob_ring ≦ 1) Step 2 Initialize prime_code = "".                   Initialize second_code = "".                   Initialize third_code = "". Step 3 Form a character chain.                     Step 4 is repeated until the code length is reached. Step 4a If probe_ring> random (0 ≦ random ≦ 1) Then                         Assign a letter for a ring (boat).                       431'431413 ',' 314134 ',' 141343 ',' 132132 ',' 321321 '                         , '213213', '123123', '231231', '312312', '42141                         2 ',' 214124 ',' 141242 ',' 324234 ',' 242343 ',' 423                 New members randomly selected from 432 '} character_l                 Set to.                         Assign a letter for the substituent.                         Using the frequencies v1, v2, v3, ... vn, {c1, c2, c3, ..                 6 members randomly selected from., Cn} chara                Set to cter_2. (Cl..cn is a letter that defines different functional groups                Is)                         Assign a letter for the valency of the substituent.                        6 randomly selected from {'1', '2', '3', '4'}                 New members character Set to 3. Else Step 4b Assign a single (non-ring) character for the initial code.                    Member randomly selected from {'1', '2', '3', '4'}               New character Set to 1.                   Assign a letter for the substituent.                   Using the frequencies v1, v2, v3, ... vn, from {cl, ..., cn}               New members selected randomly character Set to 2.                   Assign a letter for the valency of the substituent.                   Member randomly selected from {'1', '2', '3', '4'}               Is set to new_character_3. Step 4c Connect the new character to the code chain.                     Prime_code = Prime_code & new character_1                     Second_code = Second_code & new character_2                     Third_code = Third_code & new_ character_3 Module 11: Multiple point mutation Step 1 Enter the initial code. Step 2 Set the number of mutations per code (= q) (this invention               If performed, mutate 2.5-5% of letters in the genotype.               ). Step 3 Enter the group size (= p). Step 4 Randomly select a position in the genotype. Step 5 Randomize the code character at the selected position in each code vector               Replace with a different character chosen for. Step 6 Repeat steps 4 and 5 q times. Step 7 Steps 4-6 are repeated to generate a total of p new codes. Step 8 Test the fitness of each member of the mutant population. Highest fit               Select subpopulations with different degrees of recombination or additional multiple mutations               use. Module 12: Sequence mutation Step 1 As a threshold level for the occurrence of mutation, PDEL, PINV, PINS,               And PDUPIs set (0 ≦ PX ≦ 1). Step 2 Generate a random position (= x) in the code (0 ≦ p ≦               Long               Sa). Step 3 Generate an array of random length (= L) (0 ≦ L ≦ code length−x)               . Step 4 Copy an array of a total of L characters starting from position x from the code               . Step 5 If O ≦ PINV≤ random number ≤ 1 Then                       Reverse the order of the characters in the chain. Step 6 If ≦ PDUP≤ random number ≤ 1 Then                       Copy the sequence and join the copy to the sequence. Step 7 If O ≦ PDEL≤ random number ≤ 1 Then                       Remove L characters starting at position x from the code.                     Else                         Sequences in the code generated in steps 5 and 6                 Replace with an array. Step 8 If O ≦ PINS≤ random number ≤ 1 Then                         Generate a position (= y) in the code at random (0 ≦ y ≦                 Cord length).                         Insert the sequence generated in steps 5 and 6 into position y                 I do. Module 13: Recombination Step 1 Set the size of the group (= P). Step 2 Two codes are randomly selected from the population generated by multiple mutation.               Select. Step 3 Randomly select a position in the genotype. Step 4 Generate a random number to determine the number of characters to be exchanged. Step 5 Start at the selected position between each of the three code vectors.               Swap whole characters. Step 6 Repeat steps 2-5 until P new genotypes are generated. Step 7 Test the fitness of each ligand in the resulting mutant population. Most               Also select a subpopulation with high fitness and               Is used at maturity. Module 14: Maturity Step 1 Enter the parent code derived from the recombination. Step 2 Set the number of repetitions. Step 3 Randomly select a position in the parent genotype. Step 4 Randomize the code character at the selected position in each code vector               Replace with a different character chosen for. Step 5 Using the modules 4 and 5, the parent code conformity (FP) And bump               The fitness of the mutant product (FMTest). Step 6 FM≧ FPIn case, the parent genotype is replaced with the mutant product. Step 7 Steps 3 to 6 are repeated as many times as necessary.

───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(KE,LS,MW,SD,S Z,UG),EA(AM,AZ,BY,KG,KZ,MD ,RU,TJ,TM),AL,AM,AT,AU,AZ ,BB,BG,BR,BY,CA,CH,CN,CZ, DE,DK,EE,ES,FI,GB,GE,HU,I S,JP,KE,KG,KP,KR,KZ,LK,LR ,LS,LT,LU,LV,MD,MG,MK,MN, MW,MX,NO,NZ,PL,PT,RO,RU,S D,SE,SG,SI,SK,TJ,TM,TR,TT ,UA,UG,UZ,VN────────────────────────────────────────────────── ─── Continuation of front page    (81) Designated countries EP (AT, BE, CH, DE, DK, ES, FI, FR, GB, GR, IE, IT, L U, MC, NL, PT, SE), OA (BF, BJ, CF) , CG, CI, CM, GA, GN, ML, MR, NE, SN, TD, TG), AP (KE, LS, MW, SD, S Z, UG), EA (AM, AZ, BY, KG, KZ, MD , RU, TJ, TM), AL, AM, AT, AU, AZ , BB, BG, BR, BY, CA, CH, CN, CZ, DE, DK, EE, ES, FI, GB, GE, HU, I S, JP, KE, KG, KP, KR, KZ, LK, LR , LS, LT, LU, LV, MD, MG, MK, MN, MW, MX, NO, NZ, PL, PT, RO, RU, S D, SE, SG, SI, SK, TJ, TM, TR, TT , UA, UG, UZ, VN

Claims (1)

【特許請求の範囲】 1. 予め選択された機能特性を有する化学構造を設計するためのコンピュー ターに基づく方法であって、 (a)線形文字配列にコードされているシミュレートされた受容体表現型の物 理的モデルを作製し、少なくともひとつの定量可能な機能特性を共有する一組の 標的分子を用意し、 (b)各標的分子に対して、 (i)有効な親和力計算を用いて、該受容体と該標的分子との間の親和力を 複数の配向の各々で計算し、 (ii)計算された親和力を合計することによって合計親和力を計算し、 (iii)最大親和力を同定し、 (c)計算された合計親和力および最大親和力を用いて、 (i)該最大親和力と該定量可能な機能特性との間の最大親和力相関係数を 計算し、 (ii)該合計親和力と該定量可能な機能特性との間の合計親和力相関係数を 計算し、 (d)該最大相関係数および該合計相関係数を用いて適合係数を計算し、 (e)該受容体の構造を変化させ、予め選択された適合係数を有する受容体の 集団が得られるまで工程(b)〜(d)を繰返し、 (f)分子線形文字配列にコードされた化学構造の物理的モデルを用意し、前 記有効な親和力計算値を用いて複数の配向にある各受容体と該化学構造との間の 親和力を計算し、計算された親和力を用いて親和力適合性スコアを計算し、 (g)該化学構造を変化させて化学構造の変形体を生成させ、工程(f)を繰 返し、 (h)その親和カスコアが予め選択した親和カスコアに近い化学構造 の変形体を保持し、かつさらに変化させる、 各工程を含んでなる前記方法。 2. 前記のシミュレートされた受容体遺伝子型を生成させる工程が空間占有 および電荷をコードする受容体線形文字配列を作製することを含み、前記の化学 構造の物理的モデルを作製する工程が空間的占有および電荷をコードする前記分 子線形文字配列を作製することを含む、請求項1記載の方法。 3. 前記有効な親和力計算が2つの測定値を含み、第一のものは、前記シミ ュレートされた受容体の非荷電部分で、前記分子構造上の非極性領域に充分近く て有効なロンドンの分散力を生じさせる部分の割合を見積もる近似測定値であり 、第二のものは、前記シミュレートされた受容体の荷電部分と前記分子構造中に 存在する双極子との間で発生する電荷‐双極子静電力相互作用の合計強さである 、請求項2記載の方法。 4. Σ{│計算された最大親和力−標的最大親和力│/標的最大親和力}で 、前記予め選択された適合スコアが実質的にゼロである。 5. 前記親和力適合スコアを計算する工程が前記分子構造と各受容体との間 の合計親和力および最大親和力を計算することを含んでおり、その適合スコアが Σ{(│計算された最大親和力−標的最大親和力│/2×標的最大親和力)+( │計算された合計親和力−標的合計親和力│/2×標的合計親和力)}で計算さ れ、前記予め選択された適合スコアが実質的にゼロである、請求項2記載の方法 。 6. 前記合計親和力相関係数がrSA 2であり、前記最大親和力相関係数がrM A 2 であり、前記適合係数がF=(rMA 2×rSA 20.5であり、前記予め選択され た適合係数が実質的に単一である、請求項2記載の方法。 7. 前記合計親和力相関係数がrSAMA 2であり、前記最大親和力相関係数 がrMA 2であり、前記適合係数がF=(r2 MA×(1−rSA 2))0.5であり、前記 予め選択された適合係数が実質的に単一である、請求項2記載の方法。 8. 前記分子線形文字配列が複数の連続文字トリプレットを含み、該トリプ レットの第一の文字が前記分子構造の分子骨格中の占有原子の位置と種類を特定 する第一の文字セットの中からランダムに選択され、該トリプレットの第二の文 字が該占有原子に結合した置換基の種類を特定する第二の文字セットの中からラ ンダムに選択され、該トリプレットの第三の文字が該トリプレットの第一の文字 によって特定される原子上の該置換基の位置を特定する第三の文字セットの中か らランダムに選択される、請求項2記載の方法。 9. 前記分子線形配列からの各トリプレットを連続的に翻訳した後で前記分 子骨格上の占められてない位置を水素原子で充填する有効分子組立アルゴリズム を用いて前記分子線形文字配列を解読する、請求項8記載の方法。 10. 前記分子構造を変異させる工程が、i)少なくともひとつのトリプレ ットの前記第一、第二および第三の文字の少なくともひとつを関連する文字セッ トの中からランダムに交換することによって前記分子遺伝子型を変異させる工程 、ii)分子遺伝子型からのトリプレットを欠失させる工程、iii)分子遺伝子型 中のトリプレットを重複させる工程、iv)ひとつ以上のトリプレットの順序を反 転させる工程、およびv)分子遺伝子型からのトリプレットを分子遺伝子型中の 異なる位置に挿入する工程の少なくともひとつの工程を含む、請求項9記載の方 法。 11. 前記分子遺伝子型を変異させる工程が、前記保持された変異分子遺伝 子型のランダムに選択された対を組換えることにより前記分子線形配列中の対応 する文字を交換することを含む、請求項10記載の方法。 12. 受容体線形文字配列中の各文字が空間転回指示のひとつおよび転回を 伴なわない荷電部位を特定する、請求項2記載の方法。 13. 前記受容体表現型が複数のサブユニットをもつ少なくともひとつの線 状ポリマーを含み、該サブユニットのひとつが該少なくともひとつの線状ポリマ ー中の第一のサブユニットである、請求項12記載の 方法。 14. 前記第一のサブユニットに続く各サブユニットに適用された転回指示 が前記第一のサブユニットの最初の位置に関して行なわれる有効受容体組立アル ゴリズムを用いて前記受容体線形文字配列を解読する、請求項13記載の方法。 15. 空間転回指示を特定する前記文字が転回なし、右転回、左転回、上転 回、下転回をコードしており、荷電部位を特定する文字が転回なしの正荷電部位 および転回なしの負荷電部位をコードする、請求項14記載の方法。 16. 前記サブユニットが水素のファンデルワールス半径に実質的に等しい ファンデルワールス半径を有する実質的な球状である、請求項14記載の方法。 17. 前記受容体遺伝子型を変異させる工程が、i)受容体遺伝子型からの 文字を欠失させる工程、ii)受容体遺伝子型中の文字を重複させる工程、iii) 受容体遺伝子型中のひとつ以上の文字の順序を反転させる工程、およびiv)受容 体遺伝子型からの文字を該遺伝子型中の異なる位置に挿入する工程の少なくとも ひとつの工程を含む、請求項15記載の方法。 18. 前記受容体遺伝子型を変異させる工程が、前記保持された変異受容体 遺伝子型のランダムに選択された対を組換えることにより前記受容体線形配列中 の対応する文字を交換することを含む、請求項17記載の方法。 19. 予め選択した機能特性に関して化学構造をスクリーニングする方法で あって、 a)空間占有および電荷をコードする受容体線形文字配列を作製することによ ってシミュレートされた受容体遺伝子型を生成させ、 b)該遺伝子型を解読して受容体表現型を生成させ、選択された機能特性を示 す少なくひとつの標的分子を提供し、有効な親和力計算を用いて複数の配向で該 受容体と各標的分子との間の親和力を計算し、各標的 分子と受容体との間の合計親和力および最大親和力を計算し、該標的分子の該機 能特性に対する合計親和力の合計親和力相関係数および該機能特性に対する最大 親和力の最大親和力相関係数を計算し、該合計親和力相関係数および該最大親和 力相関係数に依存する適合係数を計算し、 c)受容体遺伝子型を変異させ、かつ工程b)を繰返し、予め選択された適合 係数をもつ受容体の集団が得られるまで、増大した適合係数を示す受容体を保持 し、かつ変異させ、そして d)該有効な親和力計算を用いて複数の配向でスクリーニングしようとする化 学構造と各受容体との間の親和力を計算し、親和力適合スコアを計算する(但し 、これは、化合物と各受容体との間の合計親和力および最大親和力を計算し、該 合計親和力および該最大親和力の少なくともひとつを該少なくともひとつの標的 と該受容体の集団との間の合計親和力および最大親和力と比較することを含み、 これによりこの比較が、該少なくともひとつの標的分子に対する該化学構造の機 能活性のレベルを示すことになる)、 各工程を含んでなる前記方法。 20. 前記有効な親和力計算が2つの測定値を含み、第一のものは、前記シ ミュレートされた受容体の非荷電部分で、前記分子構造上の非極性領域に充分近 くて有効なロンドンの分散力を生じさせる部分の割合を見積もる近似測定値であ り、第二のものは、前記シミュレートされた受容体の荷電部分と前記分子構造中 に存在する双極子との間で発生する電荷‐双極子静電力相互作用の合計強さであ る、請求項19記載の方法。 21. 前記適合スコアが、Σ{│計算された最大親和力−標的最大親和力│ /標的最大親和力}で計算される、請求項20記載の方法。 22. 前記適合スコアが、Σ{(│計算された最大親和力−標的最大親和力 │/2×標的最大親和力)+(│計算された合計親和力−標的合計親和力│/2 ×標的合計親和力)}で計算される、請求項20記載の方法。 23. 前記合計親和力相関係数がrSA 2であり、前記最大親和力相 関係数がrMA 2であり、前記適合係数がF=(rMA 2×rsA 20.5であり、前記予 め選択された適合係数が実質的に単一である、請求項20記載の方法。 24. 前記合計親和力相関係数がrSA 2であり、前記最大親和力相関係数が rMA 2であり、前記適合係数がF=(rMA 2×(1−rSAMA 2))0.5前記予め選 択された適合係数が実質的に単一である、請求項20記載の方法。 25. 前記受容体線形文字配列中の各文字が空間転回指示のひとつおよび転 回を伴なわない荷電部位を特定する、請求項20記載の方法。 26. 前記受容体表現型が複数のサブユニットをもつ少なくともひとつの線 状ポリマーを含み、該サブユニットのひとつが該少なくともひとつの該線状ポリ マー中の第一のサブユニットである、請求項25記載の方法。 27. 前記第一のサブユニットに続く各サブユニットに適用された転回指示 が前記第一のサブユニットの最初の位置に関して行なわれる有効受容体組立アル ゴリズムを用いて前記受容体線形文字配列を解読する、請求項26記載の方法。 28. 空間転回指示を特定する前記文字が転回なし、右転回、左転回、上転 回、下転回をコードしており、荷電部位を特定する文字が転回なしの正荷電部位 および転回なしの負荷電部位をコードする、請求項27記載の方法。 29. 前記サブユニットが水素のファンデルワールス半径に実質的に等しい ファンデルワールス半径を有する実質的な球状である、請求項28記載の方法。 30. 前記受容体遺伝子型を変異させる工程が、i)受容体遺伝子型からの 文字を欠失させる工程、ii)受容体遺伝子型中の文字を二重にする工程、iii) 受容体遺伝子型中のひとつ以上の文字の順序を反転させる工程、およびiv)受容 体遺伝子型からの文字を該遺伝子型中の異なる位置に挿入する工程の少なくとも ひとつの工程を含む、請求項27 記載の方法。 31. 前記受容体遺伝子型を変異させる工程が、前記保持された変異受容体 遺伝子型のランダムに選択された対を組換えることにより前記受容体線形配列中 の対応する文字を交換することを含む、請求項30記載の方法。 32. 類似の機能特性をもつ化合物に対して選択的親和力を示す生物学的受 容体に類似するシミュレートされた受容体を設計する方法であって、 a)空間占有および電荷をコードする受容体線形文字配列を作製することによ ってシミュレートされた受容体遺伝子型を生成し、 b)該遺伝子型を解読して受容体表現型を生成させ、類似の機能特性を共有す る一組の標的分子を用意し、有効な親和力計算を用いて複数の配向で受容体と各 標的分子との間の親和力を計算し、各標的分子と受容体との間の合計親和力およ び最大親和力を計算し、各標的分子の機能特性に対する合計親和力の合計親和力 相関係数および各標的分子の該機能特性に対する最大親和力の最大親和力相関係 数を計算し、各標的分子に対する該合計親和力相関係数および該最大親和力相関 係数に依存する適合係数を計算し、そして c)該遺伝子型を変異させ、かつ工程b)を繰返し、予め選択された適合係数 をもつ受容体の集団が得られるまで、増大した適合係数を示す受容体を保持し、 かつ変異させる、 各工程を含んでなる前記方法。 33. 前記受容体線形文字配列中の各文字が空間転回指示のひとつおよび転 回を伴なわない荷電部位を特定する、請求項32記載の方法。 34. 前記受容体表現型が複数のサブユニットをもつ複数の線状ポリマーを 含み、各線状ポリマーが対応する線形文字配列によってコードされ、該サブユニ ットのひとつが該少なくともひとつの線状ポリマー中の第一のサブユニットであ る、請求項33記載の方法。 35. 前記第一のサブユニットに続く各サブユニットに適用された 転回指示が前記第一のサブユニットの最初の位置に関して行なわれる有効受容体 組立アルゴリズムを用いて前記受容体線形文字配列を解読する、請求項34記載 の方法。 36. 空間転回指示を特定する前記文字が転回なし、右転回、左転回、上転 回、下転回をコードしており、荷電部位を特定する文字が転回なしの正荷電部位 および転回なしの負荷電部位をコードする、請求項35記載の方法。 37. 前記サブユニットが水素のファンデルワールス半径に実質的に等しい ファンデルワールス半径を有する実質的な球状である、請求項36記載の方法。 38. 前記受容体遺伝子型を変異させる工程が、i)受容体遺伝子型からの 文字を欠失させる工程、ii)受容体遺伝子型中の文字を重複させる工程、iii) 受容体遺伝子型中のひとつ以上の文字の順序を反転させる工程、およびiv)受容 体遺伝子型からの文字を遺伝子型中の異なる位置に挿入する工程の少なくともひ とつの工程を含む、請求項35記載の方法。 40. 前記受容体遺伝子型を変異させる工程が、前記保持された変異受容体 遺伝子型のランダムに選択された対を組換えることにより前記受容体線形配列中 の対応する文字を交換することを含む、請求項39記載の方法。 41. 前記有効な親和力計算が2つの測定値を含み、第一のものは、前記シ ミュレートされた受容体の非荷電部分で、前記分子構造上の非極性領域に充分近 くて有効なロンドンの分散力を生じさせる部分の割合を見積もる近似測定値であ り、第二のものは、前記シミュレートされた受容体の荷電部分と前記分子構造中 に存在する双極子との間で発生する電荷‐双極子静電力相互作用の合計強さであ る、請求項33記載の方法。 42. 前記合計親和力相関係数がrSA 2であり、前記最大親和力相関係数が rMA 2であり、前記適合係数がF=(rSA 2×rMA 20.5であり、前記予め選択さ れた適合係数が実質的に単一である、請求項41記 載の方法。 43. 前記合計親和力相関係数がrSAMA 2であり、前記最大親和力相関係 数がrMA 2であり、前記適合係数がF=(rMA 2×(1−rSAMA 20.5であり、 前記予め選択された適合係数が実質的に単一である、請求項41記載の方法。 44. 予め選択された機能特性を有する化学構造を設計するためのコンピュ ーターに基づく方法であって、 (a)少なくともひとつの定量可能な機能特性を共有する一組の標的分子およ び受容体の物理的モデルを用意し、 (b)各標的分子に対して、 (i)有効な親和力計算を用いて、該受容体と該標的分子との間の親和力を 複数の配向の各々で計算し、 (ii)計算された親和力を合計することによって合計親和力を計算し、 (iii)最大親和力を同定し、 (c)計算された合計親和力および最大親和力を用いて、 (i)該最大親和力と該定量可能な機能特性との間の最大親和力相関係数を 計算し、 (ii)該合計親和力と該定量可能な機能特性との間の合計親和力相関係数を 計算し、 (d)該最大相関係数および該合計相関係数を用いて適合係数を計算し、 (e)予め選択された適合係数を有する受容体の集団が得られるまで、該受容 体の構造を変化させ、かつ工程(b)〜(d)を繰返し、 (f)化学構造の物理的モデルを用意し、該有効な親和力計算を用いて複数の 配向にある各受容体と該化学構造との間の親和力を計算し、計算された親和力を 用いて親和力適合スコアを計算し、 (g)化学構造を変化させて該化学構造の変形体を生成させ、工程(f)を繰 返し、 (h)その親和力スコアが予め選択した親和力スコアに近い化学構造の変形体 を保持し、かつさらに変化させる、 各工程を含んでなる前記方法。 45. 前記の受容体の物理的モデルを用意する工程が空間的占有および電荷 をコードする受容体線形文字配列を作製することを含み、前記の化学構造の物理 的モデルを作製する工程が空間的占有および電荷をコードする線形文字配列を作 製することを含む、請求項44記載の方法。 46. 前記化学構造の前記線形文字配列が複数の連続文字トリプレットを含 み、該トリプレットの第一の文字が前記化学構造の分子骨格中の占有原子の位置 と種類を特定する第一の文字セットの中からランダムに選択され、該トリプレッ トの第二の文字が該占有原子に結合した置換基の種類を特定する第二の文字セッ トの中からランダムに選択され、該トリプレットの第三の文字がトリプレットの 該第一の文字によって特定される原子上の該置換基の位置を特定する第三の文字 セットの中からランダムに選択される、請求項45記載の方法。 47. 前記の分子の線形配列からの各トリプレットを連続的に翻訳した後で 前記分子骨格上の占められてない位置を水素原子で充填する有効分子組立アルゴ リズムを用いて化学構造線形文字配列を解読する、請求項46記載の方法。 48. 原子要素を含む化学構造をコードする方法であって、該化学構造の各 原子に対する空間占有と電荷をコードする線形文字配列を用意することを含んで なる前記方法。 49. 前記化学構造の前記線形文字配列が複数の連続文字トリプレットを含 み、該トリプレットの第一の文字が前記化学構造の分子骨格中の占有原子の位置 と種類を特定する第一の文字セットの中から選択され、該トリプレットの第二の 文字が該占有原子に結合した置換基の種類を特定する第二の文字セットの中から 選択され、該トリプレットの第三の文字が該トリプレットの第一の文字によって 特定される原子上の該置換基の位置を特定する第三の文字セットの中から選択さ れる、請求項48記 載の方法。 50. 前記線形文字配列からの各トリプレットを連続的に翻訳した後前記分 子骨格上の占められてない位置を予め選択された原子で充填する有効分子組立ア ルゴリズムを用いて前記線形文字配列を解読する、請求項46記載の方法。 51. 前記線形文字配列をコンピューターでアクセス可能な記憶手段に保存 する工程を含む、請求項50記載の方法。 52. 前記機能特性が生物学的毒性である、請求項19記載の方法。 53. 前記機能特性が触媒活性である、請求項19記載の方法。[Claims] 1. A computer-based method for designing a chemical structure having preselected functional properties, comprising: (a) creating a physical model of a simulated receptor phenotype encoded in a linear character sequence; Providing a set of target molecules that share at least one quantifiable functional property; (b) for each target molecule: (i) using an effective affinity calculation to associate the receptor with the target molecule; Calculating the affinity between each of the plurality of orientations; (ii) calculating the total affinity by summing the calculated affinity; (iii) identifying the maximum affinity; and (c) calculating the calculated total affinity and the maximum. Using the affinity, (i) calculating a maximum affinity correlation coefficient between the maximum affinity and the quantifiable functional property; and (ii) a total affinity between the total affinity and the quantifiable functional property. Calculate the correlation coefficient (D) calculating a fitness coefficient using the maximum correlation coefficient and the total correlation coefficient; and (e) altering the structure of the receptor to obtain a population of receptors having a preselected fitness coefficient. Steps (b) to (d) are repeated until: (f) preparing a physical model of the chemical structure encoded in the molecular linear character array, and using each of the effective affinity calculations, each receptor in a plurality of orientations. Calculating the affinity between the chemical structure and the chemical structure, calculating an affinity compatibility score using the calculated affinity, and (g) changing the chemical structure to generate a variant of the chemical structure, And (h) retaining and further altering variants of the chemical structure whose affinity score is close to the preselected affinity score. 2. Generating the simulated receptor genotype comprises creating a receptor linear character sequence encoding space occupancy and charge, and creating a physical model of the chemical structure comprises spatial occupancy. 2. The method of claim 1, comprising producing the molecular linear character sequence encoding a charge. 3. The effective affinity calculation includes two measurements, the first being the uncharged part of the simulated receptor, the effective dispersive power of London close enough to the nonpolar region on the molecular structure And a second measure is the charge-dipole generated between the charged part of the simulated receptor and the dipole present in the molecular structure. 3. The method of claim 2, wherein the total strength of the electrostatic interaction is. 4. In {| calculated maximum affinity-target maximum affinity | / target maximum affinity}, the preselected match score is substantially zero. 5. The step of calculating the affinity match score includes calculating a total affinity and a maximum affinity between the molecular structure and each receptor, wherein the match score is Σ {(| calculated maximum affinity−target maximum. Wherein the pre-selected match score is substantially zero, calculated as: Affinity | / 2 x target maximum affinity) + (| calculated total affinity-target total affinity | / 2 x target total affinity) Item 3. The method according to Item 2. 6. The total affinity correlation coefficient is r SA 2 , the maximum affinity correlation coefficient is r M A 2 , the fitness coefficient is F = (r MA 2 × r SA 2 ) 0.5 , and the preselected 3. The method of claim 2, wherein the fitted coefficients are substantially unity. 7. The total affinity correlation coefficient is r SA - an MA 2, the maximum affinity correlation coefficient is r MA 2, the congruence factor is F = (r 2 MA × ( 1-r SA 2)) be 0.5 3. The method of claim 2, wherein the preselected fitness factor is substantially unity. 8. The molecular linear character array includes a plurality of contiguous character triplets, wherein a first character of the triplet is randomly selected from a first character set that specifies the location and type of occupied atoms in the molecular skeleton of the molecular structure. Wherein the second letter of the triplet is randomly selected from a second set of letters specifying the type of substituent attached to the occupied atom, and the third letter of the triplet is the first letter of the triplet. 3. The method of claim 2, wherein the method is randomly selected from a third character set that specifies the position of the substituent on the atom specified by the letter. 9. Decoding the molecular linear character array using an effective molecular assembly algorithm that fills unoccupied positions on the molecular skeleton with hydrogen atoms after successively translating each triplet from the molecular linear array. 8. The method according to 8. 10. The step of mutating the molecular structure comprises: i) mutating the molecular genotype by randomly exchanging at least one of the first, second and third characters of at least one triplet from a related character set. Ii) deleting triplets from the molecular genotype; iii) overlapping the triplets in the molecular genotype; iv) reversing the order of one or more triplets; 10. The method of claim 9, comprising the step of inserting at least one of the triplets at different positions in the molecular genotype. 11. 11. The method of mutating the molecular genotype, wherein exchanging corresponding letters in the molecular linear sequence by recombining randomly selected pairs of the retained mutant molecular genotype. the method of. 12. 3. The method of claim 2, wherein each character in the receptor linear character array identifies one of the spatial turn indications and a charge site without turn. 13. 13. The method of claim 12, wherein said receptor phenotype comprises at least one linear polymer having a plurality of subunits, one of said subunits being a first subunit in said at least one linear polymer. . 14. The decryption of the receptor linear character sequence using an effective receptor assembly algorithm wherein a turn indication applied to each subunit following the first subunit is performed with respect to an initial position of the first subunit. Item 14. The method according to Item 13. 15. The characters that specify the spatial turn instruction are no turn, right turn, left turn, upturn, and downturn, and the characters that specify the charged part are the positively charged part without turn and the negatively charged part without turn. 15. The method of claim 14, wherein the method encodes. 16. 15. The method of claim 14, wherein the subunit is substantially spherical with a van der Waals radius substantially equal to the van der Waals radius of hydrogen. 17. The step of mutating the receptor genotype comprises: i) deleting letters from the receptor genotype; ii) duplicating letters in the receptor genotype; iii) one or more of the receptor genotypes. 16. The method of claim 15, comprising reversing the order of the letters of the following, and iv) inserting letters from the receptor genotype at different locations in the genotype. 18. The step of mutating the receptor genotype comprises exchanging corresponding letters in the receptor linear sequence by recombining randomly selected pairs of the retained mutated receptor genotype. Item 18. The method according to Item 17. 19. A method of screening a chemical structure for a preselected functional property, comprising: a) generating a simulated receptor genotype by generating a receptor linear character sequence encoding space occupancy and charge; Decoding the genotype to generate a receptor phenotype, providing at least one target molecule exhibiting selected functional properties, and using effective affinity calculations to associate the receptor with each target molecule in multiple orientations Calculating the total affinity and the maximum affinity between each target molecule and the receptor, calculating the total affinity correlation coefficient of the total affinity for the functional property of the target molecule and the maximum affinity for the functional property. Calculating a maximum affinity correlation coefficient, calculating the total affinity correlation coefficient and a fitness coefficient dependent on the maximum affinity correlation coefficient, c) mutating the receptor genotype; Repeating step b), retaining and mutating receptors exhibiting an increased fitness factor until a population of receptors with a preselected fitness factor is obtained, and d) using said effective affinity calculation Calculate the affinity between the chemical structure to be screened in multiple orientations and each receptor, and calculate the affinity match score (provided that the total and maximum affinity between the compound and each receptor is calculated). Calculating and comparing at least one of said total affinity and said maximum affinity to the total affinity and maximum affinity between said at least one target and said population of receptors, whereby said comparison comprises: Which will indicate the level of functional activity of the chemical structure on the target molecule of the above). 20. The effective affinity calculation includes two measurements, the first being the uncharged part of the simulated receptor, the effective dispersive power of London close enough to the nonpolar region on the molecular structure And a second measure is the charge-dipole generated between the charged part of the simulated receptor and the dipole present in the molecular structure. 20. The method of claim 19, wherein the method is the total strength of the electrostatic interaction. 21. 21. The method of claim 20, wherein the match score is calculated as {| calculated maximum affinity-target maximum affinity | / target maximum affinity}. 22. The match score is calculated as {(│calculated maximum affinity−target maximum affinity│ / 2 × target maximum affinity) + (│calculated total affinity−target total affinity│ / 2 × target total affinity)}. 21. The method of claim 20, wherein 23. The total affinity correlation coefficient is the r SA 2, the maximum affinity correlation coefficient is r MA 2, the congruence factor is F = (r MA 2 × r sA 2) 0.5, wherein the preselected 21. The method of claim 20, wherein the fitness factor is substantially unity. 24. The total affinity correlation coefficient is the r SA 2, the maximum affinity correlation coefficient is r MA 2, the congruence factor is F = (r MA 2 × ( 1-r SA - MA 2)) 0.5 The pre 21. The method of claim 20, wherein the selected fitness factor is substantially unity. 25. 21. The method of claim 20, wherein each character in the receptor linear character array identifies one of the spatial turn indications and a charge site without turn. 26. 26. The receptor phenotype of claim 25, wherein the receptor phenotype comprises at least one linear polymer having a plurality of subunits, one of the subunits being a first subunit in the at least one linear polymer. Method. 27. The decryption of the receptor linear character sequence using an effective receptor assembly algorithm wherein a turn indication applied to each subunit following the first subunit is performed with respect to an initial position of the first subunit. Item 29. The method according to Item 26. 28. The characters that specify the spatial turn instruction are no turn, right turn, left turn, upturn, and downturn, and the characters that specify the charged part are the positively charged part without turn and the negatively charged part without turn. 28. The method of claim 27, wherein the method encodes. 29. 29. The method of claim 28, wherein the subunit is substantially spherical with a Van der Waals radius substantially equal to the van der Waals radius of hydrogen. 30. The step of mutating the receptor genotype comprises: i) deleting letters from the receptor genotype; ii) doubling letters in the receptor genotype; 30. The method of claim 28, comprising reversing the order of one or more characters and iv) inserting characters from a receptor genotype at different locations in the genotype. 31. The step of mutating the receptor genotype comprises exchanging corresponding letters in the receptor linear sequence by recombining randomly selected pairs of the retained mutated receptor genotype. Item 30. The method according to Item 30, 32. A method of designing a simulated receptor similar to a biological receptor that exhibits a selective affinity for compounds having similar functional properties, comprising: a) receptor linear characters encoding space occupancy and charge Generating a simulated receptor genotype by generating a sequence; b) providing a set of target molecules that share the same functional properties by decoding the genotype to generate a receptor phenotype. Calculate the affinity between the receptor and each target molecule in multiple orientations using effective affinity calculations, calculate the total and maximum affinity between each target molecule and the receptor, and calculate the Calculating the total affinity correlation coefficient of the total affinity for the functional property and the maximum affinity correlation coefficient of the maximum affinity of each target molecule for the functional property, and calculating the total affinity correlation coefficient and the maximum affinity for each target molecule; Calculating a fitness factor that depends on the correlation factor, and c) increasing the fitness factor until the population of receptors with the preselected fitness factor is obtained, wherein the genotype is mutated and step b) is repeated. The method comprising the steps of: retaining and mutating a receptor that exhibits: 33. 33. The method of claim 32, wherein each character in the receptor linear character array identifies one of the spatial turn indications and a charge site without turn. 34. The receptor phenotype comprises a plurality of linear polymers having a plurality of subunits, each linear polymer being encoded by a corresponding linear letter sequence, wherein one of the subunits is a first of the at least one linear polymer. 34. The method of claim 33, which is a subunit of 35. The decryption of the receptor linear character sequence using an effective receptor assembly algorithm wherein a turn indication applied to each subunit following the first subunit is performed with respect to an initial position of the first subunit. Item 34. The method according to Item 34. 36. The characters that specify the spatial turn instruction are no turn, right turn, left turn, upturn, and downturn, and the characters that specify the charged part are the positively charged part without turn and the negatively charged part without turn. 36. The method of claim 35, wherein the method encodes. 37. 37. The method of claim 36, wherein the subunit is substantially spherical with a Van der Waals radius substantially equal to the van der Waals radius of hydrogen. 38. The step of mutating the receptor genotype comprises: i) deleting letters from the receptor genotype; ii) duplicating letters in the receptor genotype; iii) one or more of the receptor genotypes. 36. The method of claim 35, comprising the steps of: inverting the order of the letters of iv) and iv) inserting letters from the receptor genotype at different locations in the genotype. 40. The step of mutating the receptor genotype comprises exchanging corresponding letters in the receptor linear sequence by recombining randomly selected pairs of the retained mutated receptor genotype. Item 39. The method according to Item 39. 41. The effective affinity calculation includes two measurements, the first being the uncharged part of the simulated receptor, the effective dispersive power of London close enough to the nonpolar region on the molecular structure And a second measure is the charge-dipole generated between the charged part of the simulated receptor and the dipole present in the molecular structure. 34. The method of claim 33, wherein the method is the total strength of the electrostatic interaction. 42. The total affinity correlation coefficient is r SA 2 , the maximum affinity correlation coefficient is r MA 2 , the fitness coefficient is F = (r SA 2 × r MA 2 ) 0.5 , and the preselected 42. The method of claim 41, wherein the fitness factor is substantially unity. 43. The total affinity correlation coefficient is r SA - an MA 2, the maximum affinity correlation coefficient is r MA 2, the congruence factor is F = (r MA 2 × ( 1-r SA - in MA 2) 0.5 42. The method of claim 41, wherein the preselected fitness factor is substantially unitary 44. A computer-based method for designing a chemical structure having preselected functional properties, (A) providing a physical model of a set of target molecules and receptors that share at least one quantifiable functional property; (b) for each target molecule: (i) using an effective affinity calculation Calculating the affinity between the receptor and the target molecule in each of a plurality of orientations; (ii) calculating the total affinity by summing the calculated affinities; (iii) identifying the maximum affinity; (C) Using the calculated total affinity and maximum affinity (I) calculating a maximum affinity correlation coefficient between the maximum affinity and the quantifiable functional property; and (ii) a total affinity correlation coefficient between the total affinity and the quantifiable functional property. (D) calculating a fitness coefficient using the maximum correlation coefficient and the total correlation coefficient; and (e) calculating the receptor coefficient until a population of receptors having a preselected fitness coefficient is obtained. And repeating steps (b)-(d), (f) providing a physical model of the chemical structure, and using each of the receptors in multiple orientations with the chemical Calculating an affinity to the structure, calculating an affinity match score using the calculated affinity, (g) changing the chemical structure to generate a variant of the chemical structure, repeating step (f), (H) deformation of the chemical structure whose affinity score is close to the preselected affinity score 45. The method comprising the steps of: holding and further altering the body comprising providing a physical model of the receptor, wherein the step of creating a physical linear model of the receptor encodes spatial occupancy and charge. 46. The method of claim 44, wherein the step of creating a physical model of the chemical structure comprises creating a linear character array encoding spatial occupancy and charge. The character sequence comprises a plurality of consecutive character triplets, wherein the first character of the triplet is randomly selected from a first character set that specifies the position and type of occupied atoms in the molecular skeleton of the chemical structure; The second letter of the triplet is randomly selected from a second set of letters specifying the type of substituent attached to the occupied atom, and the third letter of the triplet is Tsu is selected from the third character set that identifies the position of the substituent on the atom identified by said first character bets randomly 46. The method of claim 45, wherein. 47. Decoding the chemical structure linear character array using an effective molecular assembly algorithm that sequentially translates each triplet from the linear array of molecules and fills unoccupied positions on the molecular backbone with hydrogen atoms; 47. The method of claim 46. 48. A method of encoding a chemical structure comprising atomic elements, comprising providing a linear character array encoding space occupancy and charge for each atom of the chemical structure. 49. The linear character array of the chemical structure includes a plurality of consecutive character triplets, wherein a first character of the triplet is from a first character set that specifies the location and type of occupied atoms in the molecular skeleton of the chemical structure. Wherein the second letter of the triplet is selected from a second set of characters specifying the type of substituent attached to the occupied atom, and the third letter of the triplet is the first letter of the triplet. 49. The method of claim 48, wherein the method is selected from among a third character set that specifies the position of the substituent on the atom specified by 50. Decoding the linear character array using an effective molecular assembly algorithm that sequentially translates each triplet from the linear character array and then fills unoccupied positions on the molecular skeleton with preselected atoms. Item 46. The method according to Item 46. 51. The method of claim 50, comprising storing the linear character array in computer accessible storage means. 52. 20. The method of claim 19, wherein said functional property is biological toxicity. 53. 20. The method of claim 19, wherein said functional property is catalytic activity.
JP09533880A 1996-03-22 1996-03-22 Method for designing chemical structures with common functional properties by computer Pending JP2000507940A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CA1996/000166 WO1997036252A1 (en) 1996-03-22 1996-03-22 Computational method for designing chemical structures having common functional characteristics

Publications (1)

Publication Number Publication Date
JP2000507940A true JP2000507940A (en) 2000-06-27

Family

ID=4173144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09533880A Pending JP2000507940A (en) 1996-03-22 1996-03-22 Method for designing chemical structures with common functional properties by computer

Country Status (4)

Country Link
EP (1) EP0888591A1 (en)
JP (1) JP2000507940A (en)
EA (1) EA001095B1 (en)
WO (1) WO1997036252A1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005215786A (en) * 2004-01-27 2005-08-11 National Institute Of Information & Communication Technology Chemical genetic programming device and chemical genetic programming method
JP2005529158A (en) * 2002-05-28 2005-09-29 ザ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・ペンシルベニア Method, system and computer program product for computer analysis and design of amphiphilic polymers
JP2009509929A (en) * 2005-09-12 2009-03-12 ジボダン エス エー Topical composition for reducing skin irritation

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002513405A (en) * 1997-02-28 2002-05-08 ベアーズデン バイオ,インコーポレイテッド Method for determining protein-ligand interaction by computer modeling
US20040038429A1 (en) * 2000-11-14 2004-02-26 Shuichi Hirono Method of searching for novel lead compound
EP1344761A4 (en) * 2000-11-30 2008-04-16 Toyo Suisan Kaisha Method of designing the molecular structure of inhibitor to enzyme
US20180137256A1 (en) * 2016-11-16 2018-05-17 Paul MERRITHEW System and method of calculating the structure and properties of chemicals

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5025388A (en) * 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
US5434796A (en) * 1993-06-30 1995-07-18 Daylight Chemical Information Systems, Inc. Method and apparatus for designing molecules with desired properties by evolving successive populations

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005529158A (en) * 2002-05-28 2005-09-29 ザ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・ペンシルベニア Method, system and computer program product for computer analysis and design of amphiphilic polymers
JP2005215786A (en) * 2004-01-27 2005-08-11 National Institute Of Information & Communication Technology Chemical genetic programming device and chemical genetic programming method
JP4572304B2 (en) * 2004-01-27 2010-11-04 独立行政法人情報通信研究機構 Chemical genetic programming device and chemical genetic programming method
US8108151B2 (en) 2004-01-27 2012-01-31 National Institute Of Information And Communications Technology Method and apparatus for chemical genetic programming
JP2009509929A (en) * 2005-09-12 2009-03-12 ジボダン エス エー Topical composition for reducing skin irritation

Also Published As

Publication number Publication date
EP0888591A1 (en) 1999-01-07
AU712188B2 (en) 1999-10-28
EA001095B1 (en) 2000-10-30
WO1997036252A1 (en) 1997-10-02
EA199800843A1 (en) 1999-02-25
AU4935096A (en) 1997-10-17

Similar Documents

Publication Publication Date Title
JP2881711B2 (en) Genetic synthesis of neural networks
Hinds et al. A lattice model for protein structure prediction at low resolution.
Judson Genetic algorithms and their use in chemistry
Nicolaou et al. De novo drug design using multiobjective evolutionary graphs
King et al. Relating chemical activity to structure: an examination of ILP successes
US6219622B1 (en) Computational method for designing chemical structures having common functional characteristics
CN110970099A (en) Medicine molecule generation method based on regularization variational automatic encoder
US20220383993A1 (en) Method and device for designing compound
US5699268A (en) Computational method for designing chemical structures having common functional characteristics
JPH08512159A (en) Method and device for continuously evolving a group of molecules to design molecules having desired properties
A Nicolaou et al. Multi-objective optimization methods in de novo drug design
CN108475298A (en) The system and method for biasing the protein epitope that prediction error folds by collective coordinate
He et al. A divide‐and‐conquer approach to determine the Pareto frontier for optimization of protein engineering experiments
Grantham et al. Deep evolutionary learning for molecular design
CN115938488A (en) Method for identifying protein allosteric modulator based on deep learning and computational simulation
JP2000507940A (en) Method for designing chemical structures with common functional properties by computer
Li et al. Learning to design drug-like molecules in three-dimensional space using deep generative models
Jahandideh et al. Novel hybrid method for the evaluation of parameters contributing in determination of protein structural classes
JP6484612B2 (en) Obtaining improved therapeutic ligands
Singh et al. Psycho-clonal based approach to solve a TOC product mix decision problem
Petersen et al. Modelling zinc-binding proteins with GADGET: genetic algorithm and distance geometry for exploring topology
EP1010094A1 (en) Compound screening system
Ye et al. Probabilistic cross‐link analysis and experiment planning for high‐throughput elucidation of protein structure
CN113539517A (en) Prediction method of time sequence intervention effect
Hasegawa et al. 3D-QSAR study of antifungal N-myristoyltransferase inhibitors by comparative molecular surface analysis