JPH0792804B2

JPH0792804B2 - 分子検索方法およびシステム

Info

Publication number: JPH0792804B2
Application number: JP3261950A
Authority: JP
Inventors: ルイジ、ディ、パチエ; フィリッポ、ファブロチニ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1991-01-26
Filing date: 1991-10-09
Publication date: 1995-10-09
Anticipated expiration: 2010-10-09
Also published as: JPH0628409A; EP0496902A1; US5418944A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はコンピュータ支援分子設
計（Computer Aided Molecular Design（ＣＡＭＤ））
の分野に関し、詳細には分子データベースに予め記憶さ
れている分子の検索を自動的に許可するシステムおよび
方法に関する。特に、本発明は任意のデータベース内の
任意の分子構造を評価しうる構造および特性上の類似度
を照会しうるようにする知識ベース型分子検索システム
および方法に関する。本発明は分子データベースに化学
および物理特性の知識ベースを関連づけて使用するもの
である。そのような知識ベースとデータベースの結合は
最終的には標準技術ではアクセス不能な情報の検索とな
るような単純でない照会を処理しうるようにする。

【０００２】

【従来の技術】分子設計プロセスは一般に一つの最適な
分子を合成するに数百回の実験を必要とするハードタス
クと考えられている。それ故、化学および医薬産業はそ
のようなプロセスにおいて科学者を援助するに有効な新
しいコンピュータツールを待ち望んでいる。分子データ
ベースは他のツールの中でも最も広く用いられているも
のである。多数の分子データベースが現在市販されてい
る。そのようなデータベースは異った実験から集められ
た多量の分子の集積である。分子データベースは一つの
クラスの分子をそれ以上の実験を行うことなく研究しう
るようにするために入力分子に或る点で類似する一群の
ターゲット分子を検索するために頻繁に使用される。

【０００３】

【発明が解決しようとする課題】現在の分子検索システ
ムでは下位構造（substructure）のサーチ、すなわち原
子および結合性について記述される与えられた下位構造
を含む分子のサーチをユーザが行いうるにすぎない。ご
く最近モレキュラーデザイン社（MolecularDesign Limi
ted）は分子の類似度についての照会を許可する検索シ
ステムを発売している。それでもそのような類似度はデ
ータベースに各分子についての熟練者により予め記憶さ
れた共通の特徴（同一の値をもつ属性）の評価にのみも
とづいている。実際にはそのような方法は、データベー
ス内の分子の夫々を誰かが分析しそしてそれらの夫々に
ついて分子全体としてそしてユーザから入る任意の種類
の照会を満足させるに充分な分子（すべての考えられる
もの）の下位構造についての多数の特徴を記述する必要
があるため実用的でない。

【０００４】更に、データベース内の夫々の分子には１
０乃至２０種の特徴のみしか関連づけられていない。そ
のため、研究者はそのデータベース内でサーチすべき分
子の副部分（subset）を得るために一群の複雑な照会を
考えなくてはならない。しかしながらそのような手順で
は抄約および検索のための大きな負担がユーザにかかる
ことになる。しかもこの場合には、照合の結果として極
めて多数の分子が出されるのが普通であり、その殆んど
はユーザーの目的に合わないものである。他方、研究者
のアクティビティを遂行するために必要な他の分子はこ
の照会では捕えることが出来ず、それ故、システムによ
り無視されてしまう。

【０００５】

【課題を解決するための手段及び作用】本発明はより強
力な分子検索ツールを必要とする研究者のこの問題を解
決し、分子の類似度を簡単に反映しそしてデータベース
に記憶された情報を有効に使用しうるように選択的に照
会を行いうるようにするものである。

【０００６】本発明の他の利点は分子の事前の分析とデ
ータベースへの類似度特性の記憶が不要であるというこ
とである。本発明は次の多数の照会を満足させるもので
ある。１．入力分子に構造的に類似する分子。２．ユーザ定義の化学および物理特性の組合せを検査
する特性領域（property region ）を含む分子。３．特性領域と分子フラグメントを関係づける一般分
子構造として考えられるユーザ定義モデルと整合する分
子。

【０００７】一群の分子を選択すると、それらについて
システムが例えば構造上の差が最も小くそして活性度
（activity）の差が最大である分子対を選択するような
他の操作を行うことも出来る。ここで活性度は与えられ
た特性に関係した値である（それらフラグメントを所望
の活性度の主たる増大した状態にするために構造活性度
関係（Structure Activity Relationship ）問題を扱う
とき非常に有効な機構である）。

【０００８】

【実施例】図１はこの分子検索システムのハードウェア
を示し、これは動作の制御用の命令を含む記憶機構１２
と通信を行う汎用ＣＰＵ１１を含む。更に、ＣＰＵ１１
は多数の化学および物理特性が一群の分子フラグメント
に関連づけられている知識ベースを含む記憶機構１３と
通信を行う。そのようなフラグメントは三つのディクシ
ョナリ、すなわち残留ディクショナリ（ＲＳ−ディクシ
ョナリ）、官能基ディクショナリ（ＦＧ−ディクショナ
リ）、原子型ディクショナリ（ＡＴ−ディクショナリ）
に区分けされている。命令記憶手段１２と知識ベース記
憶手段１３は読取専用記憶装置またはランダムアクセス
記憶装置である。ＣＰＵ１１は図２のソースデータベー
ス２２とターゲットデータベース２３の両方を記憶する
ためのランダムアクセス型の主記憶手段１４とも通信を
行う。入力記憶手段１５は図１には示さないソースから
入る照会を記憶する。出力記憶装置１６は照会の結果を
記憶する。

【０００９】本発明のこの実施例では一群のプログラム
が入力照会を扱って類似度マッチングによりサーチされ
る分子の検索を行う。このシステムの論理アーキテクチ
ャーを図２に示す。モジュール２１，２２，２３，２４
からなるサブシステム２ａをまず説明する。サブシステ
ム２ａは、ソースデータベースが、検索中に有効に利用
されるデータベースであるターゲットデータベースを発
生するように本発明の検索システムと関連づけられると
きに使用される。ターゲットデータベース２３の発生は
１回限りの再組織化（reformulation ）プロセスとみな
ければならない。分子フラグメント認識モジュール２１
は主記憶機構１４に記憶されたソースデータベース２２
およびターゲットデータベース２３と通信を行う。モジ
ュール２１は記憶機構１３に記憶された知識ベース２４
とも通信を行う。

【００１０】分子フラグメント認識モジュール２１は１
以上のソース分子を分析してそのソース分子の階層記述
を出力として出す（後述）。モジュール２２はソースデ
ータベースすなわち情報検索システムと関連づけられる
べきデータベースである。ソースデータベース２２内の
分子は原子と結合性により記述される。ターゲットデー
タベース２３はソースデータベース２２に記憶される分
子の夫々の階層的表示を含むデータベースである。その
ような表示は三つの記述レベルすなわち、残基（residu
e ）で記述される分子、官能基で記述される分子、およ
び原子エンティティ（atomic entities ）で記述される
分子を含む。知識ベース２４は多数の既知の化学および
物理特性を関連づけたフラグメントのディクショナリで
ある。特に、このシステムは上記の表示レベル（２４
ａ，２４ｂ，２４ｃ）の数に対応する多数のディクショ
ナリを使用する。

【００１１】システム２ａの動作を次に述べる。特にモ
ジュール２１はソースデータベース２２に原子エンティ
ティで記憶された分子の夫々を読取る。次に知識ベース
２４に組込まれたＲＳ−ディクショナリ２４ａとＦＧ−
ディクショナリ２４ｂを用いてその分子の内側の対応す
るフラグメントを認識する。最終結果として、各分子の
三レベル記述が発生されてターゲットデータベース２３
に記憶される。このプロセス中、フラグメントが残基と
しても官能基としても認識されないときには原子による
式を用いてその分子の残り部分を記述する。知識ベース
２４は、システムがそのような段階を、各レベルにおい
て関連する分子の異る表示をもつ階層的エンティティと
して分子の“認識（perception）”をもつことが出来る
限りにおいて行いうるようにさせる。

【００１２】図３はこの段階後に得られる一つの分子の
階層表示を示す。分子はノードがすべて残基またはすべ
て官能基またはすべて原子でありうるグラフにより記述
され、そしてアーク（arc)がそれら分子フラグメント間
の結合を示す。特に、原子は下位レベルで分子を表示す
るために用いられる（ＡＴ−グラフ）。次のものでは分
子は例えばカルボキシル基のような官能基であるより大
きいフラグメントで表示される（ＦＧ−グラフ）。その
上のレベルではこの分子は例えばペプチド内のアミノ酸
のような残基で記述される（ＲＳ−グラフ）。最後に例
えば分子量のような分子に関連する或る特性で分子を全
体的に表わすことは常に可能である。図３は左から右に
みてまずＡＴ−グラフを、次にＦＧ−グラフをそして次
にＲＳ−グラフを示しており、夫々の円形領域が次の階
層レベルの円形領域に１対１の対応をしている。この階
層表示はＴ．Ｅ．フェリン他によりジャーナル・オブ・
モレキュラー・グラフィックス、第６巻、１９８８年３
月、ｐｐ．１−１２に与えられたＭＩＤＡＳデータベー
スシステムに用いられる表示の延長線上にある。

【００１３】ターゲットデータベース２３が発生されて
しまうと、分子検索プロセスは、ユーザインターフェー
ス２８が図１には示さない入力手段（キーボード、磁気
テープリーダ、ディスケットドライブ等）から処理され
るべき照会を受けるとスタートする。ユーザーインター
フェース２８はその照会の分析のために照会アナライザ
２５と通信を行う。アナライザ２５は構造マッチングモ
ジュール２６とモデルマッチングモジュール２７に接続
する。構造マッチングモジュール２６はグラフマッチン
グモジュール２９にも接続する。照会アナライザ２５は
サブシステム２ａに共通なサブシステム２ｂの唯一のモ
ジュールである知識ベース２４と通信を行う。

【００１４】照会アナライザ２５は制御モジュールであ
ってシステムに入れられた照会のタイプに従って適正な
サブルーチンを選ぶ。知識ベース２４はサブシステム２
ａの説明において部分的に示してある。特にモジュール
２４は上記の表示レベルの数に対応する多数のディクシ
ョナリを含む。各ディクショナリは夫々に関連する多数
の化学および物理特性を有する一群のフラグメントから
なる。このように例えばヒドロキシル基は電子ドナーで
ある水と親和性のある基で記述されるＦＧ−ディクショ
ナリ２４ｂに入る。表１、２、３はモジュール２４ｃ，
２４ｂおよび２４ａに入ると現在考えられている特性の
リストを夫々示している。

【００１５】構造マッチングモジュール２６とモデルマ
ッチングモジュール２７は共にユーザ照会を満足させ
る、ターゲットデータベース２３に入る１以上の分子が
あるかどうかを検査するために用いられる。それらの夫
々はユーザにより入れられる照会タイプに従って選ばれ
る（後述）。グラフマッチングモジュール２９は任意の
表示レベルで記述される分子を整合させるために用いら
れるグラフマッチングルーチンである。

【００１６】モジュール２４，２５，２６，２７，２
８，２９からなるサブシステム２ｂの動作を次に述べ
る。照会がモジュール２８に入ると、それを標準フォー
ムに再編成（照会ステートメント）するため処理され
る。そのような段階はユーザが通常図形モードでその照
会を入れるために必要である（例えば図４）。この照会
ステートメントは照会アナライザ２５に与えられてユー
ザ照会を満足させるためのルーチンを活性化する。ま
ず、アナライザ２５は入力照会に従って与えられた照会
を扱うための多数のサブルーチンを選択する。モジュー
ル２５は４つの照会タイプを扱うように設計されてい
る。この検索システムの動作を各照会タイプについて説
明する。

【００１７】１．入力分子と構造的に類似する分子に
ついての照会。類似度は差をつくる最大数の原子により
きまる。エンドユーザは照会において、差が適当なとこ
ろにある１からＮまでの接続した領域でなくてはならな
いことを指定しうる。この照会タイプではモジュール２
５はフラグメント認識モジュール２１を活性化させて入
力分子を分析しそれを図３について述べたように表示す
る。ＲＳ−グラフとＦＧ−グラフが入力分子の表示（Ａ
Ｆ−グラフ）と関連づけるように発生される。次にモジ
ュール２５は構造マッチングモジュール２６を呼び出し
てターゲットデータベース２３に記憶された分子に対し
入力分子の階層記述を整合させる。アナライザ２５で行
われる照会の分析によりこのマッチング処理の複雑さを
下げることが出来る。例えば、ユーザが１つの領域につ
いてのみ入力分子と異る分子を問題にしているものとす
ると、モジュール２６はこのマッチングプロセス中に入
力分子に対し異った一つの接続した領域をつくらない２
以上の残基をもつすべての分子を排除する。このよう
に、残基レベルでの高レベルマッチングにより問題の照
会に対する応答には意味のない多数の分子を排除するこ
とが出来る。特に、構造マッチングモジュール２６は入
力として前述した階層レベルで表わされる２つの分子ま
たは化合物Ｃ１とＣ２を採用し、そして出力としてもし
あればＣ１とＣ２のノード間の関連を発生する。表４は
構造マッチングルーチンの機能の詳細である。図６はこ
のルーチンのフローチャートである。その動作におい
て、モジュール２６はまずＲＳ−グラフをそして次にＦ
Ｇ−グラフを、最後にＡＴ‐グラフを整合させるためグ
ラフマッチングモジュール２９は入力として２つのグラ
フＧ１とＧ２をとる。ここにおいて、各ノードは例えば
Ｈ１のようなラベルおよび例えばＨのようなタイプで識
別され、そして各アークは例えばａｒｃ（Ｈ１，Ｈ２）
のような一対のノードラベルで識別される。このフォー
マットではＨ１はＨの一例である。出力はＧ１とＧ２の
同一のタイプのノードとＧ１とＧ２の異るノード（領
域）群の関連である。特に、グラフマッチングルーチン
は、対応するターミナルノードが同一タイプであるとき
Ｇ１のアークがＧ２のアークに整合されうるマッチング
系ユニットとして“アーク”の表記を用いる。表４構造マッチングルーチン１．ＣＡＬＬＧＲＡＰＨ₋ＭＡＴＣＨＩＮＧ（Ｃ１のＲＳ−グラフ、Ｃ２のＲＳ−グラフ）ＲＥＳＵＬＴＳ：＊同一タイプと識別されるＣ１とＣ２の対応する残基群；＊異なるタイプと識別されるＣ１とＣ２の対応する残基群。２．ＦＯＲ₋ＥＡＣＨＣ１とＣ２の異る各残基対：ａ．Ｃ１とＣ２の記述を用いてＦＧ−グラフにより残基を再編成；ｂ．ＣＡＬＬＧＲＡＰＨ₋ＭＡＴＣＨＩＮＧ（ＦＧ−グラフでのＣ１とＣ２の単一の差）ＲＥＳＵＬＴＳ：＊同一タイプと識別されるＣ１とＣ２の部分における対応する官能基群；＊異タイプと識別されるＣ１とＣ２の部分における対応する官能基群。ｃ．ＦＯＲ₋ＥＡＣＨ異る官能基Ｃ１とＣ２の対：１）Ｃ１とＣ２の記述を用いてＡＴ−グラフで両官能基を再編成；２）ＣＡＬＬＧＲＡＰＨ₋ＭＡＴＣＨＩＮＧ（ＡＴ−グラフでのＣ１とＣ２の単一の差）。ＲＥＳＵＬＴＳ：＊Ｃ１とＣ２の部分での対応する原子タイプ群；＊Ｃ１とＣ２の部分での対応する異る原子タイプ群。

【００１８】表５はグラフマッチングサブルーチンの詳
細である。表５グラフマッチングサブルーチン１．ＤＥＴＥＲＭＩＮＥ各ノードの度合を。ノードＸの度合はターミナルノードとしてＸを含むアークの数である。２．ＣＯＮＳＩＤＥＲ最大度合を有するグラフＧ１におけるノードＮ１を。３．ＦＩＮＤグラフＧ２にＮ１と同一タイプで最大度合のノードＮ２を。ＳＴＯＲＥ matching₋listに対（Ｎ１，Ｎ２）を。４．ＦＯＲ₋ＥＡＣＨＮ１を含むＧ１内のアーク、ＦＩＮＤＮ２を含むＧ２内の対応するアークを。ＩＦＧ１とＧ２内のこれら二つのアークのターミナルノードが同一タイプ、ＴＨＥＮＳＴＯＲＥ matchi ng₋listに新しい整合したノード対を、そしてＧ１とＧ２からのアークを削除。５．ＦＯＲ₋ＥＡＣＨ整合したノード（Ｎ１，Ｎ２）の新しい対、反復時にＦＩＮＤＮ１とＮ２を含むこれら新しいアークのすべてについてマッチングを：ＧＯＴＯ４。６．ＷＨＥＮＧ１のアークの接続された領域がＧ２と最大限に整合する（段階４と５にはそれ以外のマッチングアークはありえない）、ＴＨＥＮＧＯＴＯ２（グラフＧ１とＧ２はこのときすでに整合したアークから減算される）。７．ＷＨＥＮマッチング可能なアークがＧ１とＧ２にそれ以上ない、ＴＨＥＮＦＩＮＤ₋ＡＬＬＧ１とＧ２内の不整合アークの接続した領域を、そしてＤＥＴＥＲＭＩＮＥＧ１の各不整合領域とＧ２の不整合領域間のマッチングを。

【００１９】図５はグラフマッチングサブルーチンへの
呼出し出力を示す。円内のフラグメントは入力分子と構
造的にそれに類似するものとの間の共通でない領域を示
す。上記の照会タイプにより、構造についての差が最小
で任意の与えられた特性についての差が最大である分子
対についてのサーチが可能となる。そのような照会は所
望の活性度の主たる向上をフラグメントに義務づけるた
めの構造活性度関係を扱うとき非常に有効である。ユー
ザがここに述べた照会タイプの一つを用いてターゲット
データベース２３に記憶される分子の副部分からそのサ
ーチをスタートするとする。この時点で照会アナライザ
２５は構造マッチングモジュール２６を呼び出して所望
の特性については最大の差を有しそして一つの残基につ
いてのみ異るそのような副部分内のすべての対を選択す
る（この与えられた特性についての活性度値は例えば分
子量のような分子の全体としての特性と考えられる）。
そのような分子が識別されれば、構造マッチングモジュ
ール２６はそれ自体を反復的に呼び出してそのような差
を官能基で再編成する。この再編成段階はその差を実際
につくる官能基が一つの接続された領域をもつくるとい
う条件を満足するときにのみ行われる。これは官能基レ
ベルについても同じである。この場合、差がせいぜい一
つの官能基で表わされるとき、モジュール２６は再びそ
れ自体を反復して呼び出して上記の条件により原子タイ
プでそのような差を再編成する。

【００２０】２．一つの与えられた特性領域すなわち
ユーザ定義の化学および物理特性の組合せを検査する分
子の下位構造を含む分子の照会。例えばそのような照会
は４０cm³／モルより小さく、２０cm³／モルより大き
い分子容をもつ疎水性領域を含むすべての分子を必要と
する。まず、照会アナライザ２５は知識ベース２４内の
各ディクショナリをみてユーザ定義の化学および物理特
性の組合せを満足するフラグメント（残基、官能基、原
子タイプ）を選ぶ。その後、モジュール２５は構造マッ
チングモジュール２６を呼び出してそのようなフラグメ
ントの一つを含むすべての分子についてターゲットデー
タベース２３をサーチする。分子容がその領域を限定す
るために用いられる特性の一つとして認識されると、ア
ナライザ２５は予め選ばれたフラグメントのすべての組
合せを発生して照会の範囲に入るものを識別する。溶液
の数が多すぎない場合には構造マッチングモジュール２
６は予め選ばれたフラグメントまたはそれらの組合せの
内の一つを含むすべての分子についてターゲットデータ
ベース２３をサーチする。溶液の数が多すぎるときには
照会アナライザ２５がモデルマッチングモジュール２７
を呼び出してユーザ照会を満足するすべての分子につい
てターゲットデータベース２３をサーチする。（次を参
照のこと）。

【００２１】３．フラグメント（すなわち残基、官能
基、原子）と特性領域の少なくとも１つにより表わされ
るユーザ定義モデルと整合する分子の照会。特にモデル
Ｍは次のノードを有するグラフで表わされる。＊残基＊官能基＊原子＊特性領域

【００２２】図４はユーザ定義モデルの一例である。各
Ｒｉは関連する特性の数を備えたユーザ定義特性領域で
ある。記号“＊”はフラグメントを表わす。ユーザは結
合の数により分子のサブユニット（subunit ）間の距離
を定義してもよい。そのような目安はユーザ定義インタ
ーバルにわたることが出来る。モデルマッチングモジュ
ール２７のタスクはモデルＭのノードと照会アナライザ
２５によりターゲットデータベース２３から選ばれた化
合物Ｃのノートとの間の関連を、もしそれがあれば、見
つけることである。特に、モデルＭの各ノードは化合物
Ｃの対応するノードに合わせるために好適な順（まず残
基、次に官能基、それから原子、最後に特性領域）で選
ばれる。モデルマッチングモジュール２７はその入力と
して前述のように階層的に表わされるモデルＭと化合物
Ｃを受けそしてＭとＣの同一タイプのノード間の関連を
出力として出す。モデルＭの特性領域ノードを整合させ
るために、モジュール２７は知識ベースモジュール２４
を呼び出して化合物Ｃの対応するフラグメントがモデル
Ｍのノードに付される特性を検査するかどうかをチェッ
クする。表６はモデルマッチングルーチンの詳細であ
る。図７はモデルマッチングルーチンのフローチャート
である。表６モデルマッチングルーチン１．ＦＩＮＤ化合物Ｃ内の同一タイプのノードに整合しうるモデルのＲＳ−ノード、ＦＧ−ノードまたはＡＴ−ノードを。２．ＤＥＴＥＲＭＩＮＥモデルＭと化合物Ｃの接近したノード、すなわち一つの与えられたアークによりモデルと化合物のそのとき整合したノードに結合されるノード群を。化合物ＣのＲＳ−グラフ、ＦＧ−グラフおよびＡＴ−グラフのすべてが、これら接近ノードの抽出に用いられる。３．ＦＯＲ₋ＥＡＣＨこのモデルの接近ノードＮ：＊ＩＦＮが残基ノード、ＴＨＥＮＦＩＮＤ化合物ＣのＲＳ接近ノード内の対応する接近ノードを。＊ＩＦＮが官能基ノード、ＴＨＥＮＦＩＮＤ化合物ＣのＦＧ接近ノード内の対応する接近ノードを。＊ＩＦＮが原子タイプノード、ＴＨＥＮＦＩＮＤ化合物ＣのＡＴ接近ノード内の対応する接近ノードを。＊ＩＦＮが特性領域ノード、ＴＨＥＮＦＩＮＤ化合物ＣのＲＳ− ノード、ＦＧ−ノードおよびＡＴ接近ノードのすべてにおいて特性領域Ｎを特徴づける特性を検査する一つのノード（または一つのノード群）を。この場合、化学および物理特性のＫＢに当り、化合物のノードの特性を分析する。４．ＩＦモデルＭが完全には整合しない、ＴＨＥＮ、ＧＯＴＯステップ２。

【００２３】前述のすべての照会タイプについてその照
会への応答は照会アナライザ２５からユーザインターフ
ェース２８に出される。本発明は特定のコンピュータ言
語については説明していない。それ故、本発明は任意の
コンピュータ言語を用いて実施可能である。

【００２４】

【発明の効果】本発明によれば、分子の類似度を簡単に
反映しそしてデータベースに記憶された情報を有効に使
用しうるように選択的に照会を行いうる

【図面の簡単な説明】

【図１】本検索システムのハードウェアアーキテクチャ
である。

【図２】本検索システムのソフトウェアアーキテクチャ
である。

【図３】分子を記述するために用いられる階層表示を示
す図である。

【図４】ユーザ定義モデルの一例を示す図である。

【図５】２つの分子間のグラフマッチングモジュールに
より得られる部分的マッチングの結果を示す図である。

【図６】構造マッチングルーチンのフローチャートであ
る。

【図７】モデルマッチングルーチンのフローチャートで
ある。

【符号の説明】

１１ＣＰＵ１２，１３，１４，１５，１６記憶機構２ａサブシステム２１分子フラグメント認識モジュール２２ソースデータベース２３ターゲットデータベース２４知識ベース２５照会アナライザ２６構造マッチングモジュール２７モデルマッチングモジュール２８ユーザインターフェース２９グラフマッチングモジュール

Claims

【特許請求の範囲】

【請求項１】分子データベースに記憶されると共に、ユ
ーザ定義入力基準との間に要求される類似度を有する、
分子構造を検索する、という目的を持つ分子類似度照会
に応答するための、下記段階を含む分子検索方法：ａ）全体分子、残基、官能基、原子という異なる構造
レベルの記述のそれぞれにおいて、複数の分子表示の１
つの階層を限定する段階；ｂ）上記段階ａ）の各構造レベルで分子フラグメント
を識別しそして各構造レベルについての上記分子フラグ
メントのディクショナリを構成する段階；ｃ）上記ディクショナリの夫々の分子フラグメントの
化学的および物理的特性を集めそして知識ベースを構成
する段階；ｄ）上記類似度照会を分析しそして上記入力基準に対
する上記要求された類似度にもとづき適正な分子表示レ
ベルを選択する段階；ｅ）上記知識ベースを用いて上記分子データベースに
記憶されたすべての構造の、段階ｄ）で見い出されたレ
ベルにおける分子表示に対する上記入力基準の表示のマ
ッチングを行う段階；ｆ）上記要求された類似度にもとづき上記入力基準と
類似するすべての分子構造を選択する段階；ｇ）段階ｆ）で選択されたすべての分子構造を出力す
る段階。
【請求項２】前記入力基準は一つの与えられた分子であ
り、前記類似度照会は前記入力分子に構造的に類似する
すべての分子を照会する段階を含んでおり、更に前記段
階ｅ）が下記段階から成る請求項１の方法： − 前記分子データベースに記憶される分子の第１レベ
ル表示に対する前記入力分子のそのレベル表示の第一の
マッチングを行う段階； − その下の構造レベルに表示される上記入力分子の、
上記第一のマッチングで得られた異る分子フラグメント
と、上記分子データベースに記憶されそしてそれと同一
のレベルで表示される分子構造との、第二のマッチング
を行う段階； − 上記入力分子と前段階で選ばれた分子の間に最少構
造差が見い出されるまで最下構造レベルまでマッチング
をくり返す段階。
【請求項３】前記入力基準はユーザ定義分子モデルであ
って特性領域と分子フラグメントでありうるノードを有
するグラフとして表示され、前記類似度照会は上記ユー
ザ定義モデルを検査するすべての分子を求める段階を含
み、更に前記段階ｅ）が下記段階から成る請求項１の方
法： − ユーザ定義の化学および物理特性の組合せを検査す
る任意の分子構造として一つの特性領域を予め定義する
段階； − 前記知識ベースを用いて前記ユーザ定義モデルの前
記ノードの順序を識別する段階； − 上記知識ベースを用いて、上記モデルの第１ノード
と前記分子データベースに記憶されたすべての分子との
第一のマッチングを行う段階； − 上記モデルに定義づけられるすべてのノードと整合
する上記分子データベースの分子を識別するまで上記マ
ッチングを弁別するようにくり返す段階。
【請求項４】データベース（２２）に記憶されると共
に、入力基準との間に要求される類似度を有する、分子
構造を検索する、という目的を持つ分子類似度照会に応
答するための、下記要件を含む分子検索システム： − ＡＴ−グラフ、ＦＧ−グラフおよびＲＳ−グラフに
おいて階層的に記述される上記分子構造を記憶するため
の記憶機構（２３）； − 異る記述レベルとしてのＡＴ−グラフ、ＦＧ−グラ
フおよびＲＳ−グラフにおいて既知の分子フラグメント
を記憶するための、且つ、そしてそれらフラグメントの
夫々に関連する一組の物理および化学特性を記憶するた
めの、記憶機構（２４）； − 上記入力基準に生じる上記フラグメントを、それら
を階層的にＲＳ−グラフ、ＦＧ−グラフおよびＡＴ−グ
ラフとして表示するように認識するための認識手段（２
１）； − 上記類似度照会を分析し、上記入力基準に対する要
求される類似度にもとづき適正な分子表示レベルを選択
するための分析手段（２５）； − 上記分析手段（２５）により呼び出されるとき、上
記分子表示レベルで上記記憶手段（２３）に記憶された
分子構造の表示に対する上記入力基準の表示のマッチン
グを行うマッチング手段（２６，２７，２９）。
【請求項５】前記入力基準は一つの与えられた分子構造
であり、更に前記手段（２６，２９）は上記入力分子構
造と前記データベースから選ばれた一つの分子構造との
間の差が最小となるまで両者のマッチングをくり返す請
求項４のシステム。
【請求項６】前記入力基準はユーザ定義モデルであり、
前記手段（２４）が上記モデルを限定する前記ノードの
順位を識別し、前記手段（２７）が、上記モデルに定義
されるすべてのノードと整合する分子群を識別するまで
前記データベースに記憶された分子の分子表示と、上記
モデルを定義するノードの夫々とのマッチングをくり返
して行う請求項４のシステム。