JP3193383B2 - 化学構造の記憶および検索用の関係データベース管理システム - Google Patents

化学構造の記憶および検索用の関係データベース管理システム

Info

Publication number
JP3193383B2
JP3193383B2 JP50813396A JP50813396A JP3193383B2 JP 3193383 B2 JP3193383 B2 JP 3193383B2 JP 50813396 A JP50813396 A JP 50813396A JP 50813396 A JP50813396 A JP 50813396A JP 3193383 B2 JP3193383 B2 JP 3193383B2
Authority
JP
Japan
Prior art keywords
atom
starting
key
search
atoms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP50813396A
Other languages
English (en)
Other versions
JPH10507285A (ja
Inventor
ジェフリー ムーア
ジョアン ブラジル
ジェフリー アール フーバー
Original Assignee
オックスフォード モレキュラー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オックスフォード モレキュラー リミテッド filed Critical オックスフォード モレキュラー リミテッド
Publication of JPH10507285A publication Critical patent/JPH10507285A/ja
Application granted granted Critical
Publication of JP3193383B2 publication Critical patent/JP3193383B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/941Human sciences
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/954Relational
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 発明の分野 本発明は、化学構造情報の記憶および検索を迅速かつ
簡単に行う関係データベース管理システムに関する。
発明の背景 化学・製薬会社および化学関連の政府機関は、化学物
質の莫大なデータベースを共通に保有している。かかる
データベースに関連して化学構造の検索機能が提供され
る場合が多い。近年、これら組織は関係データベース管
理システム(RDBMS)を用いてデータベースの標準化を
図っている。その一例は、オラクル・コーポレーション
(本社所在地500 Oracle Pkyw.,Redwood Shores,CA
94065)製造のOracle関係データベース管理システム
などである。
化学構造情報をRDBMSに統合することにはいくつかの
利点がある。すなわち、別の関係化学データとより密接
に統合できること、化学構造データの記憶・検索が効率
化されること、および他の関係アプリケーションを用い
る化学構造へのアクセスがしやすくなること、等であ
る。
残念ながら、これまで化学情報システムの構築は特別
なデータベース技術を用いて行われてきた。この技術は
膨大な行数のカスタムコンピュータコードを必要とする
ことが多い。このタイプのシステムは概して維持が困難
で、日新月歩のハードウェア技術への適応もむずかし
い。このような維持上の問題、ならびに高度に専門化し
たシステムであるための移植性の欠如の問題により、莫
大な時間と費用を投下する割には比較的短命なシステム
しか生み出せない結果に終わっている。
関係データベース技術の導入により、上述の専門化デ
ータベースシステムから標準化した汎用技術へデータベ
ース管理の大部分を移行することができる。だがこの関
係技術は、まだ化学情報システムの基本としては用いら
れていない。この理由は、化学構造探索システムの問題
を構造問合せ言語(SQL)に投じると常にいくつかの固
有の問題が生じるためである。SQLとは関係データベー
スの標準言語である。かかる問題の一つは化学構造をデ
ータベースに記憶しかつデータベース中で表現すること
である。関係技術だけをデータベース要素として用いる
化学情報システムはまだ実現されていない。
この目的を達成するべくこれまでに複数のシステムが
試用されたが、化学構造情報を簡単かつ迅速に検索でき
る純粋な関係データベース管理システムの開発には至っ
ていない。試用されたシステムの例を以下に述べる。
モレキュラー・デザイン・リミテッド、MDL情報シス
テムズ(所在地 14600 Catalana St.,San Leandro,
CA 94577)は、分子アクセスシステム(MACCS)および
統合化学情報システム(ISIS)を製作した。これらのシ
ステムは独立型化学情報システムを提供する。このシス
テムでは化学構造は階層構造として記憶される。ただし
大量のカスタムコードが必要であり、関係データベース
中では維持できない。従って、上述した関係技術の利点
は得られない。
このようなシステムは、関係データベース管理システ
ム、例えば上述のオラクル・データベース管理システム
等に連結可能である。だが一方、これには余分なカスタ
ムコードやソフトウェアを用いて階層構造を関係データ
ベース用の関係表に変換する必要がある。このため関係
技術の利点をMACCSシステムやISISシステムに組み入れ
るのは困難である。また変換用ソフトウェアは全体の処
理速度を下げてしまう欠点がある。
総じて、これらのシステムでは本発明が実現する利点
や能力を提供できない。
本発明は上述の問題を克服し、かつ次のような利点を
有する。
(1)商業用データベースパッケージを用いることによ
り開発および維持費用を大幅に削減できる。このため開
発努力や利点をより有効にシステム設計の各方面に向け
ることができる。さらに、基本となるデータベース技術
が改良されるとそれを自動的に化学情報システムに移す
ことができる。データベース開発に焦点をおかなくても
よいため、開発および維持努力を探索方法やユーザイン
タフェースといった目にみえる側面の改良に集中でき
る。
(2)他の情報システムとの連結が簡単に行える。この
理由は、関係データベースが研究および商業分野ではす
でに多くの非構造的な化学データの記憶に用いられてい
るためである。
(3)移植性は設計上の欠点とはならない。カスタムプ
ログラミング量が非常に少なく、様々なタイプの技術に
容易に適合できるからである。つまり移植性は、主とし
てデータベース製造者自身の責任範囲内であり、化学物
質記憶システムの開発者には責任はない。
発明の概要 本発明は、既存システムの能力を拡張する化学構造検
索システムを開発して、データベース技術分野の欠点を
克服するものである。開発には関連データベース技術の
力を利用する。
本発明によれば、ユーザは関係データベース管理シス
テムにおいて様々な探索方法を用いて化学構造情報を最
適に記憶・探索できる。探索方法には、複数の値の原子
群、複数のタイプの結合、およびマーカッシュ型探索そ
の他の方法がある。
さらに、本発明は次のモジュールを含む完全な化学情
報システムを提供する。すなわち、 (1)的確な構造探索用、 (2)物質探索用、 (3)キー探索用、 (4)化学名探索用、 (5)分子式探索用、 (6)新規分子登録用、 (7)構造の輸入・輸出用、および (8)データ編集用、のモジュールである。
さらに、本発明では、標準的な関係データベース方法
によって化学構造データをインベントリ、分光分析デー
タ、臨床データ等の他の関連情報とルーチン統合でき
る。これによりあらゆるタイプの化学情報を商業上およ
び研究上の両面でより有効に利用できる。
さらに、本システムは、関係技術のデータ技術の操作
機能を利用してダイナミックな問合せ機能を導入する。
この問合せ機能は、データベースに新規に入力された化
学物質のうち以前の問合せに対応するものがあるとユー
ザに通知するものである。これにより化学構造情報用の
関係図の機能性を高める。
さらに、構造分類の実現も可能である。構造分類によ
って、ユーザはある特定タイプの化学構造、例えばステ
ロイドに関する情報を記憶させ、その後、同情報を迅速
かつ効率的に呼び出すことができる。この際、以前に行
った問合せを再度入力したり実行したりする必要はな
い。
本発明の目的、利点、および特徴は上述の通りである
が、それら以外のものも以下の説明により明らかにする
と考える。本発明の本質を明確に理解するには、以下の
詳細な説明と請求の範囲、ならびに添付の図面を参照さ
れたい。
図面の簡単な説明 図1は構造1(S1)の化学式である。
図2は構造2(S2)の化学式である。
図3は図2の構造2(S2)用の接続表である。
図4はサーチキーおよび問合せ作成用の結合原子コー
ドである。
図5は問合せ1(Q1)の化学式である。
図6は登録手順をブロックで示すフローチャートであ
る。
図7はサーチキー作成をブロックで示すフローチャー
トである。
図8はダイナミック問合せ操作をブロックで示すフロ
ーチャートである。
図9は本発明のハードウェア構造を示す。
図10は問合せ結果が画面に表示された様子を示す。
図11はキー作成の他の手順をブロックで示すフローチ
ャートである。
図12は構造S1用のサーチキーの生成をステップごとに
示す。
好適な実施形態の詳細な説明 本発明は、商業製品Oracle(上述のOracle Corporat
ion発売)で試用されているような標準的関係データベ
ース技術を利用する。情報の検索および記憶に対する全
ての照会は標準的関係データベース中で行われる。この
際、構造化問合せ言語(SQL)コマンド等の標準的手順
を使用する。本出題でとりあげる関係データベースの動
作および機能はデータベース管理分野の同業者には周知
のものである。かかる動作および機能はOracleユーザー
ズ・マニュアルや開発者用マニュアル等の様々な文献に
記載されている。
I.ハードウェア 図9は、化学構造の記憶・検索用の関係データベース
管理システムの好適な実施形態を示す。一般的なコンピ
ュータワークステーション1は、中央処理装置(CPU)
2、および主メモリ3を含む。ワークステーション1
は、磁気ディスク等の記憶装置4、キーボード5やマウ
ス等の入力装置、およびコンピュータモニタ画面6やプ
リンタ7等の出力装置に接続される。記憶装置は1つ以
上使用してもよい。
この関係データベース管理システムの好適な実施形態
では、マイクロプロセッサを使用して化学構造の記憶・
検索を行う。マイクロプロセッサには、VMS5.5−2オペ
レーティングシステムで動作し、最低2ギガバイトのデ
ィスク容量と最低32メガバイトのRAMとを持つMicrovax
3100、モデル900などを用いる。メモリを増やして全
体のアクセス速度を上げることもできる。また、任意で
同システムをローカルエリアネットワーク(LAN)など
の通信アーキテクチャまたは環境に接続して、他のコン
ピュータワークステーションとリンクさせ、他のシステ
ムからのデータアクセスを可能にすることもできる。
II.関係データベースインタフェース 先に述べたとおり、化学構造探索システムに関係デー
タベースを用いることの利点の一つは、開発者が移植性
のことを考慮しなくてもよい点である。この理由は関係
データベースはそれ自体標準化されており、様々なタイ
プのシステム間で特別なインタフェースは不要だからで
ある。
本発明では、Oracle関係データベース管理システム等
の標準的関係データベースを使用することで、移植性の
問題を最小限に抑える。これはかかるシステムが実質的
にどのプラットフォームでも利用できるためである。さ
らに、本発明はSQLが埋め込まれた標準Cを使用するた
め、移植性の程度を維持できる。
III.新規構造の登録 図6に示すように、新規構造をデータベースに登録す
るには、ユーザは化学構造を達成する原子と結合とを入
力するだけでよい。これには適当なキーをタイプする
か、またはメニューから適当な選択肢を選ぶ(ブロック
22)。入力には標準的な化学作図ソフトウェアパッケー
ジを使用する。一例として、PSI INTERNATIONAL(所在
地810 Gleneagles Court,Suite 300,Towson,MD 212
86)発売のKekule等がある。
データベースに登録(追加)した新規構造は次の各工
程を経る。(a)接続表を作成しデータベースに記憶す
る(ブロック24)、(b)登録した構造が複製ではない
とシステムが証明する(ブロック26)、(c)最低1つ
のサーチキーを作成してデータベースに記憶する(ブロ
ック28)、および(d)名称、化学式、登録キー番号等
の情報をデータベースに記憶する(ブロック30)。これ
ら手順について以下に詳述する。
a.接続表の作成 ステップ24で、データベースに登録する各構造ごとに
接続表を作成する。この表は構造中の各原子に関する情
報を記憶する。情報には原子番号、結合されたすべての
原子名、およびこれら結合された原子への各結合のタイ
プなどが含まれる。例えば、図2に示す化学構造S2を追
加する場合、この構造用の接続表は図3のようになる。
接続表は記憶される構造中の任意の2つの原子間の結
合タイプを示す。2原子間の一重結合は「1」、二重結
合は「2」、三重結合は「3」で示す。接続表は関連の
登録番号とともに圧縮疎行列形式で関係表に記憶され
る。その後、接続表は原子ごとのマッチング(ABAM)処
理に用いる。この処理については後述する。
b.複製探索 上述の処理後、ステップ26でシステムは既存の構造を
探索して、登録する構造の複製がデータベースにないこ
とを確認する。もし該構造がすでにシステムに入力され
ていれば、再度、入力されることはない。
c.サーチキーの作成 N個の原子を持つ新規の構造をシステムに登録する場
合は、その構造についてN個のサーチキーを作成しなけ
ればならない。作成されたサーチキーはデータとして関
係データベースに記憶される。各サーチキーは原子それ
ぞれに番号をつけ、各原子をそれぞれのキーの開始点と
して構成されるN個の原子それぞれに番号が付されて作
られる。つまり原子N個の構造ではN個のサーチキーが
記憶される。
有効なサーチキーを作成するには、構造または問合せ
に含まれる各原子ごとに非曖昧な文字列を導出しなけれ
ばならない。この文字列は開始原子の原子環境を表すも
のである。文字列中の文字の順序は、構造または問合せ
の欠失箇所には関係ない。つまり、欠失があれば文字列
の一部が除去(その後、問合せ中のワイルドカードと交
換)されるが、列中の残りの文字が並べ替えが行われる
ことはない。このようなアルゴリズムの一例を図7に示
す。このアルゴリズムは横形グラフ探索で接続情報を付
加して列の構築を行う。このアルゴリズムは後述する例
で用いられる。
図7に示すとおり、各開始原子ごとに次の手順でサー
チキーを作成する。手順はステップ40から始まる。ステ
ップ41ですべての原子に「未ランク」かつ「未処理」の
印が付けられる。次にステップ42で開始原子に「処理済
み」の印がつけられ、キーに加えられる。さらに、ステ
ップ43で開始原子に現在の原子として印がつけられる。
例えば図1の臭素(Br)で始まる構造S1を検査する場
合を考える。この場合、サーチ列は「Br」から始まる。
明確さを考えてキーの最初のコードは原子記号で表され
る。実際には1バイトコードが使用される。さらに臭素
原子には「処理済み」の印がつけられ現在の原子に設定
される。
ステップ44では未処理の近隣原子の検査が行われる。
本例では炭素(C1)原子が未処理である。ステップ45へ
進み、システムは未処理の近隣原子の順序づけを行う。
本例の構造では当該部分には近隣原子は1つしかない。
またステップ46で順序づけは開部位(オープン・サイ
ト)で終了しておらず、ステップ48で現在原子には開部
位は存在しない。従って、システムはステップ49へ進
み、近隣原子を順番に表すコードがキーに加えられ、
「処理済み」の印が付される。
本例では文字「c」がキーに加えられ、炭素原子
(C1)への結合が一重結合であることを示す。炭素原子
(C1)には「処理済み」の印がつけられる。その後、ス
テップ51で原子終端マーカがキーに加えられる。これで
キーは「Brc.」となる。現在の分子(Br)にはステップ
52で「ランク済み」の印がつけられる。
その後システムは、順序づけがまだ終了していなかっ
たこと、かつ開部位がなかったことを確認する。続いて
ステップ54でキーに含まれる原子で未ランクのものがあ
るかどうかを検査する。本例では炭素(C1)が未ランク
である。ステップ55でキーが長すぎない、つまり所定の
長さを越えていないと判断されるので、ステップ56で炭
素(C1)が最初の未ランク原子として選択される。次に
ステップ43から炭素(C1)原子を現在原子として手順を
繰り返す。
炭素(C1)に現在原子の印がつけられ、ステップ44で
近隣原子が検査される。今度も炭素(C2)原子への一重
結合しか存在しないから、ステップ45の順序づけは不要
である。ステップ49で「c」がキーに加えられ、ステッ
プ51で原子終端マーカが加えられる。これでキーは「Br
c..」となる。
炭素(C1)原子にはステップ52で「ランク済み」の印
が付けられる。ステップ54で未ランク原子があるかどう
かが再度検査され、ステップ56でキーに含まれる最初の
未ランク原子が選択される。ステップ43で今度は炭素
(C2)が現在の原子に設定される。ステップ44で未処理
の近隣原子の検査が行われる。未処理の近隣原子は2つ
ある。1つは炭素(O)への二重結合で「e」で示し、
もう1つは炭素(C3)への一重結合で「c」で示す。ス
テップ45でこれらの結合を順序づけし、「c」は「e」
より前にくる。その後、これらコードをキーに順序どお
りに加え、ステップ49でこれらの原子を「処理済み」に
マークする。次にステップ51で原子終端マーカがキーに
加えられる。これでキーは「Brc.c.ce.」となる。炭素
(C2)原子には「ランク済み」の印が付けられる。ステ
ップ54で未ランクの原子群(酸素原子と炭素(C3)原
子)があるかどうか検査される。
ステップ56でキーに含まれる最初の未ランク原子
(C3)が選択され、ステップ43で現在の原子に設定され
る。続いて炭素(C3)から(C4)への一重結合が検査さ
れ、「c」と「.」とがキーに加えられる。キーはこれ
で「Brc.c.ce.c.」となる。
次に、ステップ43で次の未ランク原子(酸素)が現在
の原子に設定される。ステップ44で未処理の近隣原子は
ないと判断されると、ステップ51ですぐに原子終端マー
カがキーに加えられる。続いて、C4を現在の原子として
手順を再度繰り返す。未処理の近隣原子は存在しないの
で「.」が列に加えられ、手順この開始原子で終了す
る。出来上がったキーは「Brc.c.ce.c..」となる。同様
の手順を所与の構造に含まれる各開始原子について繰り
返す。図12にこの手順をステップごとに示す。(図7の
ステップ57、58、および59については以下のV項で説明
する。) 上述のキー作成アルゴリズム(図7)を図4に示す結
合原子コードを用いて適用すると、構造S1(図1)につ
いて作成されるキーは次のようになる。
1)Brc.c.ce.c... 2)Cbc..ce.c... 3)Ccce.b.c.... 4)Od.cc.b.c... 5)Ccc..ce.b... 6)Cc.c.ce.b... また構造S2(図2)について作成されるキーは次のよ
うになる。
1)Clc.c.ce.c... 2)Cac..ce.c... 3)Ccce.a.c.... 4)Od.cc.a.c... 5)Ccc..ce.a... 6)Cc.c.ce.a... 作成されたキーはデータベースに記憶される。この
際、接続表および関連情報の登録番号に対応する関連登
録番号と共に記憶される。対称構造として複製されたキ
ーは登録時に抹消される。
探索処理に必要な各工程はサーチキー作成手順細部の
影響はうけない。つまり、本項の最初の段落で述べた条
件(構造中の各原子ごとに非曖昧な文字列を作成するな
ど)を満足するキー作成手順であれば、サーチエンジン
ソフトウェアに修正を加えることなく使用可能である。
次に別の列構築手順について説明する。この手順では
開始原子からのグラフ理論上の各距離(レベル)で認め
られる構造上の特徴を列挙して列を作成する。
図11は、構造S1を用いて探索列を作成する他の手順を
示す。まずステップ80で所与の構造中のすべての結合に
「未検討」の印が付けられる。ステップ81で開始原子が
選択され、ステップ82でキーに加えられる。開始原子は
本例では臭素(Br)である。
開始原子には開部位はないため、手順はステップ85へ
進み、システムは次レベルの原子への未検討の結合が存
在するかどうかを検査する。本例では炭素(C1)原子へ
の結合が未検討である。続いてステップ88で、システム
は現レベルで開部位のある原子は存在しないことを判定
する。なければステップ90へ進み、次レベルのすべての
原子への全未検討結合を順序づけする。
ステップ91でワイルドカード・フラグが設定されてい
ないことが判定されると、ステップ93でシステムは順序
づけした結合についてのコードをキーに加える。そして
ステップ94でレベル終端マーカをキーに加える。従っ
て、出来上がったキーは「Brc.」となる。キーに含まれ
るすべての結合には「検討済み」のマーカが付される。
続いてステップ96で、システムは炭素(C1)の次レベ
ルへ移行する。ステップ85でシステムは再度、次レベル
に未検討の結合があるかどうかを判定する。ステップ88
〜92を経たのち、最終的にステップ93および94で、シス
テムは「c」と「.」をキーに加える。
その後、システムは結合に「検討済み」の印を付け、
炭素(C2)で始まる次レベルへ移行する。ステップ85で
再度、未検討の結合が見つけられる。すなわち「e」で
示す酸素(O)への二重結合と、「c」で示す炭素
(C3)への一重結合である。これらコードはステップ90
で順序づけされ、ステップ93でキーに加えれる。この
際、「c」は「e」の前にくる。ステップ94で再度、キ
ーにレベル終端マーカが加えられる。作成された列は
「Brc.c.ce.」となる。
続いて、システムは該構造中の次レベルへ進み、炭素
(C3)原子について上述の手順を繰り返す。列には再
度、「c」と「.」が加えられる。
最後に、ステップ96でシステムは炭素C4を用いる次レ
ベルへ移行する。ステップ85でシステムは次レベルの原
子への未検討結合はないことを判定し、ステップ87で終
了する。出来上がったキーは「Brc.c.ce.c.」となる。
d.関連情報の記録 各構造に関する追加情報もデータベースに記憶でき
る。追加情報とは、ある構造の登録キーまたは独自の識
別子、名称、化学式等をさす。またユーザは任意の追加
情報を定めて、標準的RDBMS技術を用いて記憶および探
索することができる。
IV.実行上の問題 サーチキー群を含むフラグメントコードのそれぞれが
データベース中で1バイトを占有するようにできる。構
造群の大規模なサンプルにはこのようなフラグメントタ
イプが約313個存在する。1バイトには256個のタイプを
当てはめられる。ただしそのうち3つは使用不可であ
る。(バイト0はプログラミング上の重要な役割のため
使用不可。また関係データベース管理システム中でワイ
ルドカード操作用に使用される2バイトも使用不可。こ
の理由は、これら2バイトの文字探索、および同一命令
文中でのSQLの「Like(類似の)」演算子の使用は通常
困難なためである。
残りのバイトは次の3グループに分類できる。
(1)一番共通なフラグメントを表すバイト群。
(2)原子を表すバイト群。その原子の存在自体が(結
合には関係なく)有効なふるいの役割をするもの。
(3)非常に稀な原子を表すバイト群。当該原子群は同
一グループに分類できる。このためこれら原子群の探索
は、事実上、多値探索となる。
V.問合せサブ構造探索処理 サーチキーに対する問合せの実行は、比較的簡単であ
る。各問合せ構造は構造に含まれる各原子ごとに1つの
サーチキーを作成する。各サーチキーには非曖昧なフラ
グメントコードが割当てられる。問合せ構造のサーチキ
ーの作成は、上記III.b.項で説明したデータベースサー
チキーの作成と全く同じ規則を問合せ構造に適用して行
う。ただしワイルドカードの処置だけは異なる。
ワイルドカード(つまり探索に特定の原子を必要とし
ない部位)に遭遇した場合、手順は停止か続行のどちら
かになる。続行の場合は、ワイルドカードのとる可能性
のある値すべてを特定して問合せを続行する。また、ワ
イルドカードと同様の扱いで、問合せを複数の値の原
子、複数のタイプの結合、またはマーカッシュ探索に容
易に適応させられる。標準的なスクリーニング技術と比
較すると、この方法の利点は、問合せの特異性を反映で
きることである。特異性の度合いが普通の(つまりワイ
ルドカードがほとんどない)問合せでは、キーが長いた
めに非常に広範な選択が可能となる。
上述のサーチキー作成のところで説明したように、探
索手順の基本は、非曖昧な一組の規則を用いてサーチキ
ーの作成を行うことである。これら規則をまったく同一
のやり方で問合せ構造に適用すれば、各データベース構
造はその構造に含まれる各原子ごとにキーが1つ作成さ
れるから、結果は標準化される。
データベース構造が問合せ構造にマッチするには、問
合せ用に作成した各サーチキーがデータベース構造用に
作成した1つ以上のサーチキーにマッチしなければなら
ない。さらに、ある問合せサーチキーで構造の検索がで
きなかった場合、その問合せは該構造のサブ構造ではな
い可能性がある。これらの規則により、関係データベー
スにおいて1つのSELECT命令文だけで非常に選択度の高
いスクリーニング手順を行うことが可能になる。
ユーザが問合せを作成するには、新規構造を入力する
のと同じやり方で構造をタイプ入力する。この際、ワイ
ルドカード(特定の原子が不要)の位置、および許容可
能な原子や結合のタイプが複数ある箇所を示すことがで
きる。これにはどの位置にあってもよい原子および結合
を特定して行う。
上述のとおり、問合せキーの作成は構造のサーチキー
作成と同じ方法で行われる。このため許容範囲内ならど
のキー作成方法を用いてもよい。従って、図5の構造Q1
の問合せキーを図7に示す手順で作成すると、次のよう
な工程になる。
手順はステップ40から始まる。ステップ41で全原子に
「未ランク」および「未処理」の印が付けられる。ステ
ップ42で開始原子が選択され、「処理済み」の印が付け
られる。同時に、原子コードがキーに加えられる。本例
では開始原子は臭素(Br)原子である。
ステップ43で臭素(Br)原子が現在の原子としてマー
クされる。ステップ44で未処理の近隣原子の存在が判定
される。ステップ45へ進み、未処理のすべての近隣原子
が順序づけされる。
ステップ46で開部位がないことが判定され、かつステ
ップ48で現在の原子に開部位がないことが判定される。
このためステップ49で近隣原子についてのコードが順序
どおりキーに加えられ、「処理済み」の印が付けられ
る。ステップ51に進んで原子終端マーカがキーに加えら
れる。キーはこれで「Brc.」となる。ステップ52で臭素
(Br)原子には「ランク済み」の印が付けられる。
ステップ53で、順序づけが終了していないこと、かつ
現在原子に開部位が認められないことが判定される。こ
のため手順はステップ54へ進み、未ランク原子がキーに
含まれるかどうか検討する。次にシステムは原子数が最
大数に達していない(つまり、問合せキーの長さが所定
の最大長を越えていない)ことを証明し、ステップ56で
未ランクの最初の原子(C1)を選択する。
続いて手順はステップ43へ戻り、炭素(C1)原子を現
在原子に設定する。ステップ44で、すべての未処理近隣
原子が再度検査され、ステップ45で順序づけされる。シ
ステムはまだ開部位に遭遇していないので、ステップ49
でこの結合(つまり炭素への一重結合)についてのコー
ドがキーに加えられる。そしてステップ51で原子終端マ
ーカもキーに加えられる。問合せキーはこれで「Brc.
c.」となる。C1には「ランク済み」の印が付けられる。
次にステップ56でC2をキーに含まれる最初の未ランク
原子として手順を繰り返す。ステップ43でC2が現在原子
としてマークされる。ステップ44で「未処理」近隣原子
がまだ存在することが判定される。ステップ45で未処理
の近隣原子の順序づけが行われる。近隣原子の結合は
「e」で示す酸素(O)への二重結合と、ワイルドカー
ド「*」からなる。
ステップ46で順序づけは開部位で終了していないと判
定される。現在原子に開部位が存在しない場合にのみ、
ステップ46で開部位によってこの手順が終了する。現在
原子には開部位が存在するため、ステップ48−50間の
「はい」の枝に進み、近隣原子についてのコードがキー
に加えられる。この際、ワイルドカード記号を該コード
の回りに配置する。次にステップ51で原子終端マーカが
キーに加えられる。従って、現在の列は「Brc.c.%e
%」となる。C2原子には「ランク済み」の印が付けられ
る。
ステップ53で現在原子に開部位が発見されたため、シ
ステムはステップ57へ進む。この列は問合せキーである
から、ステップ58でワイルドカードがキーの最後に加え
られる。こうして手順はステップ59で終了する。最終的
に出来上がった列は「Brc.c.%e%.%」である。その
後、その他の原子すべてを開始原子として手順が繰り返
される。
上述のキー作成手順(図7)を図4に示す結合原子コ
ードを用いて適用すると、問合せQ1(図5)について作
成されるキーは次のようになる。
1)Brc.c.%e%.% 2)Cbc..%e%.% 3)C%c%e%.% 4)Od.%c%.% 上記以外に図11に示す手順も問合せ列の作成に使用で
きる。ただし大きく異なる点は、ステップ83または88で
開部位に遭遇した場合、ステップ84または89でそれぞれ
ワイルドカードフラグが設定されることである。その
後、システムはステップ91から92へ進み、列に加える各
コードの前後にワイルドカード記号(%)を加える。さ
らに列の最後にも同記号を加える。
問合せと構造との間にマッチがある時は、各問合せキ
ーは構造のサーチキー1つ以上と合致する。このためど
のサーチキーを用いてもマッチする構造を検索できる。
データベースには統計的情報が記憶されており、最適な
問合せキーを主たるふるいとして使用できる。
しかしスクリーニング段階に合格しただけではマッチ
検出を判断するには不十分である。システムは次に問合
せ構造が構造の部分集合であると証明しなければならな
い。これには原子ごとのマッチング(ABAM)方法を用い
る。まず問合せ構造用の接続表を準備する。これは上述
のIII.a.項(図3参照)で説明した新規登録構造用の接
続表の作成と同様のやり方で行う。出来上がった2つの
接続表を原子ごと、接続ごとに比較する。もし問合せ用
接続表の原子および接続がすべて構造用の接続表で見つ
かれば、システムはマッチを報告する。
以下の3つの場合が考えられる。
ケース1.問合せが検索した構造のサブ構造である場合。
例えばQ1(図5)はS1(図1)のサブ構造である。この
場合、各Q1キーはS1キーと一致(つまりQ1キー1,2,3,4
がS1キー1,2,3,4,とそれぞれ一致)する。
ケース2.選択したキーによって検索される構造が、問合
せをそのサブ構造としない構造である場合。例えば、Q1
はS2のサブ構造ではないが、Q1キー4はS2キー4と一致
している。しかしこのような構造はABAMによって消去さ
れる。
ケース3.選択した問合せキーが特定の構造のキーのどれ
とも一致しない場合。例えば、Q1キー1はS2のどのキー
とも一致しない。このためS2はマッチする構造から削除
され、ABAMは行われない。
スクリーニング手順の駆動に用いられる問合せキーは
通常1つだが、第二のふるいとしてそれ以外の問合せキ
ーを用いてもよい。上述のケース2でQ1キー1を第二の
ふるいとして用いると、構造S2が削除され、ABAMを行わ
ずにすむ。
問合せは関係データベースに記憶され、将来の使用お
よび観察に備える。この際、マッチング結果およびその
他の識別情報(問合せ主や問合せの名称など)の記憶も
行われる。
その後、ユーザはシステム中をただ進み、図10に示す
ように画面上に表示されるマッチと判定された構造すべ
てを観察する。マッチする構造がない場合は、システム
はその旨のメッセージを報告する。
作業の大半は最初のスクリーニング段階(問合せ列を
構造のサーチキーと比較する段階)で行われる。このた
め、時間のかかる原子ごとのマッチングが行われるの
は、データベース中の全構造の比較的小さな部分集合に
対してのみである。従って、この方法は同じ機能を実行
する他のシステムよりかなり速度が早い。
探索問合せとその結果はすべて関係データベースに記
憶される。このためユーザは標準的なデータベース手順
を通して、以前に実行された探索のリスト作り、編集、
更新を行い、各探索の構造を観察し、その後、以前の探
索を削除することもできる。
VI.的確な構造探索(恒等探索) 恒等探索は、一組のデータベース構造内である特定の
構造を見つけだすことに関する。この動作を実行するの
はユーザである。またこの動作は登録時にも必要であ
る。この探索は、通常は問合せに正確にマッチする構造
をデータベースから探しだすことを意図する。恒等探索
は先に概要を説明したサブ構造探索の特別なケースであ
る。ただしこの場合、問合せには開部位は含まれない。
従って、上述した現在のサブ構造探索方法は恒等探索
に適した方法であり、追って使用される。また、「的確
マッチ」の定義はユーザが決定できる。デフォルト定義
によりマッチングの実行を要素のタイプと結合とに限定
できる。またユーザは電荷や質量値などの構造の追加情
報を特定することも可能である。これは原子ごとのマッ
チング時に行われる。
VII.化学名探索 化学名の探索は化学情報システムの分野では非常に大
きな問題である。化学名の大半は長く複雑な列からな
り、標準的なサブ列探索機構では容易に探索できない。
また化学物質は系統的な名称または通称のいずれかで認
識されているものが多く、このことが問題を一層複雑に
している。
化学名の探索を行うには、慎重に定義した名称フラグ
メントにインデックスをつけて記憶させ、同時に完全な
化学名中の複雑な列にインデックスをつける。探索は標
準的関係データベース技術を用いて、化学名の一部分ま
たは全部についての問合せに対して行われる。
探索を最適化するために、問合せを構成している化学
用語ごとに分解される。これらの用語は発生頻度の昇順
に記憶される。発生頻度を知るには、記憶した表中であ
る特定の用語を持つ化合物の数を調べる。この記憶した
表を作製するには、登録時に構造の全名称をスキャンし
て頻度情報を表に記憶する。従って、この表は化学名フ
ラグメントの目次の役割を果たす。
この化学用語リストが作製できたら、探索を実行す
る。これには得られるSELECT命令文を横切るか、または
命令文を1つ用いて相互に関連するサブ問合せを駆動し
て行う。
化学名情報はすべて関係データベースによって処理さ
れるため、処理後、データはその他の化学情報と容易に
統合できる。
VIII.分子式探索およびキー探索 分子式探索は式全体または一部に対して標準的SQL列
探索方法を用いて行うことができる。キー探索(識別子
による検査)は標準的SQL動作である。
IX.データ統合およびデータの輸出入 化学情報システムの基礎を関係データベースに置くこ
との重要な利点は、構造データを簡単に関係データと組
み合わせて、完全な統合システムを作製できることであ
る。このため標準的RDBMSの機能性を利用して他のシス
テムの情報をRDBMSとの間で容易に輸出入できる。
X.ダイナミック問合せ どの関係データベースにもいえることだが、システム
の設計は、主体と、関係と、機能とからなる。関係デー
タベースの設計では照会の完全さが基本であるため、主
体間の関係の定義は厳密に行われる。関係技術を利用し
た化学情報システムの実現は、このような点を考慮して
行わなければならない。
データベース構造と、その構造から派生するサブ構造
探索との間にはある自然な関係が存在する。各探索から
は一組の化合物識別子が得られる。本発明では、データ
ベースの探索時にこの識別子の組を記憶するために関係
表を用いる。これには問合せに関する一般情報(現在の
ユーザ、日付、問合せ構造、オプション、探索戦略な
ど)を記憶する表を作製する。関係表は、問合せにマッ
チする構造の識別子の記憶に用いられる。
システムに新規の構造が登録されると、最初の探索時
には存在しなかった構造を構造データベースが含むよう
になるから、以前の問合せの結果得たものだと識別され
る構造の組は不要となる。これはある意味で照会の完全
さを損なうものといえる。なぜなら構造−問合せ間の関
係が保たれないためである。
これに対して本発明では、ダイナミック問合せの概念
を導入する。新規の構造が登録されると、システムはダ
イナミック指定された問合を検査する。その後、新規構
造にマッチする各問合せごとに設定された探索結果に識
別子を加える。関係技術によって簡略化されたこの方法
によって、これまで化学情報システムではまったく不可
能だった機能性が提供できる。
ダイナミック問合せは関係図と似ている。つまりデー
タベースの探索を常に最新の客体としてデータベースに
記憶できる。このダイナミック問合せによって可能とな
る機能性の例を以下に示す。
図8を参照する。ステップ60でユーザが探索(サブ構
造、化学名、分子式について)を実行すると、ステップ
62でシステムは探索の結果得られる化合物識別子の組を
記憶する。ユーザがこれら化合物群を検査している間、
ステップ64でシステムはユーザが観察済みの各化合物に
フラグを立てる。これによりシステムは常に探索結果を
知ることができる。同時にユーザがどこまで結果を検討
したかも知ることができる。
ある特定の構造クラス(例えばステロイド)に関心の
あるユーザは、探索を1度だけ実行する。この際、探索
をダイナミックと指定する。以後、探索はシステムによ
って自動的に維持される。実際には、ステップ66でシス
テムは新規のステロイドが登録される度にユーザに報告
する。これにはまず、ステップ68でシステムは新規登録
された分子すべてについてダイナミック問合せを実行す
る。その後、ステップ70でマッチがあればユーザに知ら
せる。その後、ステップ72でユーザはまだ見ていない結
果を観察する。この際、問合せを繰り返す必要はなく、
かつ、すでに見た結果を再度観察しなくてもよい。
ダイナミック問合せは比較的移動の少ないデータベー
スではあまり重要性を持たないが、研究環境においては
幅広い用途を有する。ダイナミック問合せを大量に行う
には、探索結果記憶用に大量のディスク容量の割当てが
必要である。また、ダイナミック問合せが大量にあると
登録手順の実行に支障をきたす場合がある。
このような問題を回避するには、資源割当てシステム
を用いる。このシステムでは各ユーザに2つの割当てが
与えられる。第一の割当てはユーザが一度に能動化でき
るダイナミック問合せの数を制御するものである。これ
により登録手順時の動作を保護する。第二の割当てはユ
ーザがダイナミック問合せによって記憶する構造識別子
の総数を制御するものである。これはディスク容量の節
約に用いる。
また、ユーザが上記のような割当てシステムを不能化
するようにもできる。ただしその場合、登録手順の速度
が遅くなったり、データベース用のディスクスペースを
使い尽くすことが考えられる。
XI.構造クラス 従来、化学分野における組織化技術として、重複規準
(官能基、環式系など)に基づく化学構造のクラス分類
が利用されている。一般に化学情報システムはこのクラ
スシステムを取り入れ、ユーザが様々な検索結果を検討
できるようにしている。かかる検討はどの化学情報シス
テムにも必要な特徴だが、化学分野で用いられる分類ス
キームの基本的重要性には対処していない。本発明で
は、分類スキームをいくつでも構造用のデータベースに
維持する機構を提供する。分類スキームや構造クラスは
個々のユーザによって独自に定義づけできる。また、シ
ステム横形検索の補助として用いても良い。
「構造クラス」とはサブ構造検索、化学名検索、分子
式検索、または該検索を組み合わせた検索から得られる
一組の構造識別子と定義できる。構造クラスはダイナミ
ック問合せの一応用であり、将来の検索範囲の制限に使
用する。例えばシステムがステロイドの構造クラスを持
つとする。この場合、検索時に、ユーザは、得られる結
果がステロイドクラスの一つでなければならないと指定
できる。従ってユーザは、ステロイド環全体を描画せず
に特定のサブ構造を持つすべてのステロイドをデータベ
ースに問合せればよい。
この方法による主たる利点は次の2点である。1つは
問合せが単純化されること、つまり複雑な問合せを引き
出す必要がないこと。2つめは構造クラスの一員である
ことがすでにわかっている化合物にだけスクリーニング
を行えばよいことである。
ダイナミック問合せおよび構造クラスは共通の利点を
有する。すなわち構造検索に関するオーバヘッドに遭遇
するのは一度だけ(ダイナミック問合せまたは構造クラ
スが定義される時だけ)である。また追加オーバヘッド
は以後の化学構造データベース更新時に均等に分配され
る。
上記のとおり、化学分野に適合した特定の実施形態に
よって本発明を詳述した。本発明は該分野において多く
の利点を認めるが、構造データを有効に記憶できるこれ
以外の分野で適用してもよい。従って、本発明の実施は
上述の好適な形態の詳細ではなく以下の請求の範囲によ
って規定される。
フロントページの続き (72)発明者 ブラジル ジョアン アメリカ合衆国 メリーランド州 ホワ イト ホール ジョリー アクレス ロ ード 4500 (72)発明者 フーバー ジェフリー アール アメリカ合衆国 メリーランド州 バル チモア ウィロー オーク ロード 8639 (56)参考文献 特開 平2−28879(JP,A) 特開 平4−98464(JP,A) 特開 昭62−145417(JP,A) 特開 昭63−296172(JP,A) 特開 平4−227573(JP,A) 「化学構造データベースにおけるデー タの表現とアクセスについて」情報処理 学会研究報告(89−FI−16−6),V ol.89,No.104,1989(平1−12 −7) (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】関係データベースに記憶された化学構造群
    を探索するために、コンピュータを用いてある化学構造
    を示すコンピュータサーチキーを作成する方法であっ
    て、 コンピュータに入力された化学構造から開始原子を選択
    するステップと、 前記開始原子についてのコードをキー列に加えるステッ
    プと、 前記開始原子に隣接する結合群を順序づけするステップ
    と、 前記順序づけされた結合群についてのコードを前記キー
    列に加えるステップと、を含み、 更に、前記開始原子を選択するステップは、前記入力さ
    れた化学構造のすべての原子から逐次開始原子を選択
    し、 更に、前記結合群を順序づけするステップは、選択され
    た開始原子毎に、選択された開始原子に隣接する原子を
    第1の近隣原子とし、第n番目に隣接する原子を第nの
    近隣原子として、第1の近隣原子から順に第nの近隣原
    子まで、開始原子から離れる方向に向かって原子ごとに
    順序づけすることにより、隣接する結合群を順序づけ、
    ここで、前記nが1以上の整数であり、 前記選択された開始原子毎に順序づけされた結合群につ
    いてのコードを用いて、前記選択された開始原子毎の結
    合情報を含む複数のサーチキー列を作成することを特徴
    とするサーチキー作成方法。
  2. 【請求項2】請求の範囲1に記載のサーチキー作成方法
    であって、 さらに前記キー列に原子終端マーカを加えるステップを
    含むサーチキー作成方法。
  3. 【請求項3】請求の範囲1又2に記載のサーチキー作成
    方法において、 前記開始原子に隣接する結合群に開部位がある場合、前
    記キーにワイルドカードマーカを加えることを特徴とす
    るサーチキー作成方法。
  4. 【請求項4】請求の範囲1〜3のいずれかに記載のサー
    チキー作成方法において、 前記化学構造群は関係データベースに記憶されることを
    特徴とするサーチキー作成方法。
  5. 【請求項5】記憶装置に記憶された化学構造群の問合せ
    を行うために、コンピュータを用いてある化学構造を示
    すコンピュータ問合せキーを作成する方法であって、 問合わせる化学構造から開始原子を選択するステップ
    と、 前記開始原子についてのコードをキー列に加えるステッ
    プと、 前記開始原子に隣接する結合群を順序づけするステップ
    と、 前記順序づけされた結合群についてのコードを前記キー
    列に加えるステップと、を含み、 更に、前記開始原子を選択するステップは、前記入力さ
    れた化学構造のすべての原子から逐次開始原子を選択
    し、 更に、前記結合群を順序づけするステップは、選択され
    た開始原子毎に、選択された開始原子に隣接する原子を
    第1の近隣原子とし、第n番目に隣接する原子を第nの
    近隣原子として、第1の近隣原子から順に第nの近隣原
    子まで、開始原子から離れる方向に向かって原子ごとに
    順序づけすることにより、隣接する結合群を順序づけ、
    ここで、前記nが1以上の整数であり、 前記選択された開始原子毎に順序づけされた結合群につ
    いてのコードを用いて、前記選択された開始原子毎の結
    合情報を含む複数の問い合わせキー列を作成することに
    より構成されることを特徴とする問合せキー作成方法。
  6. 【請求項6】請求の範囲5に記載の問合せキー作成方法
    であって、 前記開始原子に隣接する結合群に開部位がある場合、前
    記キー列にワイルドカードマーカを加えるステップをさ
    らに含む問合せキー作成方法。
  7. 【請求項7】請求の範囲5又は6に記載の問合せキー作
    成方法において、 前記開始原子選択ステップは統計技術を用いて行うこと
    を特徴とする問合せキー作成方法。
  8. 【請求項8】データベースに記憶された化学構造をコン
    ピュータを用いて検索する化学構造探索方法であって、 原子群または結合群の少なくとも一方を含む、記憶され
    た化学構造群を入力するステップと、 前記記憶された各化学構造群から開始原子を選択するス
    テップと、 前記記憶された各化学構造中の前記開始原子についての
    コードをキー列に加えるステップと、 前記記憶された各化学構造中の前記開始原子に隣接する
    結合群を順序づけするステップと、 前記順序づけされた結合群を前記キー列に加え、これに
    より前記記憶された結合群および原子群に基づいてサー
    チキーが作成されるステップと、 前記記憶された各化学構造から探索接続表を作成するス
    テップと、 所望の化学構造を表す原子または結合の少なくとも一方
    を含む問合せを入力するステップと、 前記所望の化学構造から開始原子を選択するステップ
    と、 前記所望の化学構造中の前記開始原子についてのコード
    をキー列に加えるステップと、 前記所望の化学構造中の前記開始原子に隣接する結合剤
    を順序づけするステップと、 前記順序づけされた結合群を前記キー列に加え、これに
    より前記順序づけされた原子群および結合群についての
    前記コードに基づいて問合せキーが作成されるステップ
    と、 前記所望の各化学構造から問合せ接続表を作成するステ
    ップと、 前記作成された問合せキーを、記憶された化学構造群に
    ついて作成した1つ以上のサーチキーとマッチングさせ
    るステップであって、ある化学構造に対応する少なくと
    も1つのサーチキーに前記問合せキーがマッチすればマ
    ッチが報告されるステップと、 前記マッチが報告されると、前記問合せ接続表と少なく
    とも1つの問合せキーにマッチするサーチキーを含む前
    記探索接続表とを比較するステップと、 前記比較の結果を出力するステップと、を含み、 更に、前記開始原子を選択するステップは、前記入力さ
    れた化学構造のすべての原子に「未ランク」及び「未処
    理」の印を付けたのち、前記入力された化学構造のすべ
    ての原子から逐次開始原子を選択し、 更に、前記記憶された各化学構造及び前記所望の化学構
    造における結合群を順序づけするステップは、選択され
    た開始原子毎に、選択された開始原子に隣接する原子を
    第1の近隣原子とし、第n番目に隣接する原子を第nの
    近隣原子として、第1の近隣原子から順に第nの近隣原
    子まで、開始原子から離れる方向に向かって原子ごとに
    順序づけを行い、順序づけられた近隣原子に逐次「処理
    済み」の印を付けるとともに、「処理済み」の印を付け
    た近隣原子の1つ手前に位置する現在原子に「ランク済
    み」の印を付けていくことにより、隣接する結合群を順
    序づけ、ここで、前記nが1以上の整数であり、 前記選択された開始原子毎に記憶された各化学構造及び
    所望の化学構造における順序づけされた結合群について
    のコードを用いて、前記選択された開始原子毎の結合情
    報を含む複数のサーチキー列及び問い合わせキー配列を
    作成し化学構造を検索することを特徴とする化学構造探
    索方法。
  9. 【請求項9】請求の範囲8に記載の化学構造探索方法で
    あって、 前記開始原子に隣接する結合群に開部位がある場合、前
    記問合せキーにワイルドカードマーカを加えるステップ
    をさらに含む化学構造探索方法。
  10. 【請求項10】請求の範囲8又は9に記載の化学構造探
    索方法であって、 前記化学構造群は関係データベースに記憶されることを
    特徴とする化学構造探索方法。
  11. 【請求項11】請求の範囲8から10のいずれかに記載の
    化学構造探索方法であって、 前記開始原子選択ステップは統計技術を用いて行うこと
    を特徴とする化学構造探索方法。
  12. 【請求項12】記憶装置に記憶された化学構造群を探索
    するために、コンピュータを用いてある化学構造中の各
    原子ごとにコンピュータサーチキーを作成する装置であ
    って、 入力した化学構造から開始原子を選択する選択手段と、 前記開始原子についてのコードをキー列に加える開始原
    子加入手段と、 前記開始原子に隣接する結合群を順序づけする順序づけ
    手段と、 前記順序づけされた結合群についてのコードを前記キー
    列に加える順序づけされた結合加入手段と、を含み、 更に、前記開始原子を選択するステップは、前記入力さ
    れた化学構造のすべての原子に「未ランク」及び「未処
    理」の印を付けたのち、前記入力された化学構造のすべ
    ての原子から逐次開始原子を選択し、 更に、前記記憶された各化学構造及び前記所望の化学構
    造における結合群を順序づけするステップは、選択され
    た開始原子毎に、選択された開始原子に隣接する原子を
    第1の近隣原子とし、第n番目に隣接する原子を第nの
    近隣原子として、第1の近隣原子から順に第nの近隣原
    子まで、開始原子から離れる方向に向かって原子ごとに
    順序づけを行い、順序づけられた近隣原子に逐次「処理
    済み」の印を付けるとともに、「処理済み」の印を付け
    た近隣原子の1つ手前に位置する現在原子に「ランク済
    み」の印を付けていくことにより、隣接する結合群を順
    序づけ、ここで、前記nが1以上の整数であり、 前記選択された開始原子毎に記憶された各化学構造及び
    所望の化学構造における順序づけされた結合群について
    のコードを用いて、前記選択された開始原子毎の結合情
    報を含む複数のサーチキー列を作成することを特徴とす
    るサーチキー作成装置。
  13. 【請求項13】請求の範囲12に記載のサーチキー作成装
    置であって、 さらに前記キー列に原子終端マーカを加える原子終端マ
    ーカ付加手段を含むサーチキー作成装置。
  14. 【請求項14】請求の範囲12又は13に記載のサーチキー
    作成装置において、 前記開始原子に隣接する結合群に開部位がある場合、前
    記キーにワイルドカードマーカを加えるワイルドマーカ
    付加手段を備えることを特徴とするサーチキー作成装
    置。
  15. 【請求項15】請求の範囲12から14のいずれかに記載の
    サーチキー作成装置において、 前記選択手段は統計技術に基づくことを特徴とするサー
    チキー作成装置。
JP50813396A 1994-08-10 1995-08-10 化学構造の記憶および検索用の関係データベース管理システム Expired - Lifetime JP3193383B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US08/288,503 1994-08-10
US288,503 1994-08-10
US08/288,503 US5577239A (en) 1994-08-10 1994-08-10 Chemical structure storage, searching and retrieval system
PCT/US1995/010171 WO1996006391A2 (en) 1994-08-10 1995-08-10 Relational database management system for chemical structure storage, searching and retrieval

Publications (2)

Publication Number Publication Date
JPH10507285A JPH10507285A (ja) 1998-07-14
JP3193383B2 true JP3193383B2 (ja) 2001-07-30

Family

ID=23107396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50813396A Expired - Lifetime JP3193383B2 (ja) 1994-08-10 1995-08-10 化学構造の記憶および検索用の関係データベース管理システム

Country Status (5)

Country Link
US (3) US5577239A (ja)
EP (1) EP0777882A4 (ja)
JP (1) JP3193383B2 (ja)
AU (1) AU3320295A (ja)
WO (1) WO1996006391A2 (ja)

Families Citing this family (156)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5577239A (en) * 1994-08-10 1996-11-19 Moore; Jeffrey Chemical structure storage, searching and retrieval system
CA2215193C (en) * 1995-03-17 2004-05-11 Kureha Kagaku Kogyo Kabushiki Kaisha Biochemical information processing apparatus, biochemical information processing method, and biochemical information recording medium
US5752019A (en) * 1995-12-22 1998-05-12 International Business Machines Corporation System and method for confirmationally-flexible molecular identification
WO1997027559A1 (en) 1996-01-26 1997-07-31 Patterson David E Method of creating and searching a molecular virtual library using validated molecular structure descriptors
US6185506B1 (en) 1996-01-26 2001-02-06 Tripos, Inc. Method for selecting an optimally diverse library of small molecules based on validated molecular structural descriptors
WO1997044744A1 (fr) * 1996-05-20 1997-11-27 Kureha Kagaku Kogyo Kabushiki Kaisha Generateur de donnees normalisees, methode de generation de donnees normalisees et support d'enregistrement pour la production de donnees normalisees
US5989835A (en) 1997-02-27 1999-11-23 Cellomics, Inc. System for cell-based screening
US5930791A (en) * 1996-12-09 1999-07-27 Leu; Sean Computerized blood analyzer system for storing and retrieving blood sample test results from symmetrical type databases
US6073134A (en) * 1997-05-29 2000-06-06 Oracle Corporation Method article of manufacture, and apparatus for generating a multi-dimensional record management index
US6182016B1 (en) 1997-08-22 2001-01-30 Jie Liang Molecular classification for property prediction
JP3571201B2 (ja) * 1997-12-12 2004-09-29 富士通株式会社 データベース検索装置及びデータベース検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11232291A (ja) * 1998-02-16 1999-08-27 Seibutsu Bunshi Kogaku Kenkyusho:Kk 蛋白質立体構造データベース検索方法
US6442557B1 (en) 1998-02-27 2002-08-27 Prc Inc. Evaluation of enterprise architecture model including relational database
WO2000003336A1 (en) * 1998-07-13 2000-01-20 Glaxo Group Limited Chemical compound information system
US7272604B1 (en) 1999-09-03 2007-09-18 Atle Hedloy Method, system and computer readable medium for addressing handling from an operating system
IL126373A (en) 1998-09-27 2003-06-24 Haim Zvi Melman Apparatus and method for search and retrieval of documents
US6654736B1 (en) * 1998-11-09 2003-11-25 The United States Of America As Represented By The Secretary Of The Army Chemical information systems
AU1615600A (en) 1998-11-13 2000-06-05 Cellomics, Inc. Methods and system for efficient collection and storage of experimental data
US6323852B1 (en) * 1999-01-04 2001-11-27 Leadscope, Inc. Method of analyzing organizing and visualizing chemical data with feature hierarchy
US6324490B1 (en) 1999-01-25 2001-11-27 J&L Fiber Services, Inc. Monitoring system and method for a fiber processing apparatus
US7912689B1 (en) 1999-02-11 2011-03-22 Cambridgesoft Corporation Enhancing structure diagram generation through use of symmetry
US7295931B1 (en) 1999-02-18 2007-11-13 Cambridgesoft Corporation Deriving fixed bond information
AU4216400A (en) * 1999-04-09 2000-11-14 Merck & Co., Inc. Chemical structure similarity ranking system and computer-implemented method forsame
US7219020B1 (en) 1999-04-09 2007-05-15 Axontologic, Inc. Chemical structure similarity ranking system and computer-implemented method for same
US20080133274A1 (en) * 1999-04-12 2008-06-05 Warner William Scott ELECTRONICALLY DOCUMENTED MEDICAL RECORD and MEDICARE BILLING FORMS GENERATION SYSTEM
US6327812B1 (en) * 1999-05-28 2001-12-11 David Hedman Method of killing organisms and removal of toxins in enclosures
DE19928512A1 (de) * 1999-06-22 2000-12-28 Merck Patent Gmbh Verfahren und System zum Darstellen chemischer Strukturformeln
US6952741B1 (en) * 1999-06-30 2005-10-04 Computer Sciences Corporation System and method for synchronizing copies of data in a computer system
US6741976B1 (en) * 1999-07-01 2004-05-25 Alexander Tuzhilin Method and system for the creation, application and processing of logical rules in connection with biological, medical or biochemical data
US6584412B1 (en) 1999-08-04 2003-06-24 Cambridgesoft Corporation Applying interpretations of chemical names
US7693844B1 (en) * 1999-10-29 2010-04-06 Computer Sciences Corporation Configuring processing relationships among entities of an organization
EP2341480A1 (en) 1999-10-29 2011-07-06 Computer Sciences Corporation Business transaction processing systems and methods
US7546304B1 (en) * 1999-10-29 2009-06-09 Computer Sciences Corporation Configuring keys for use in processing business data
US7526487B1 (en) 1999-10-29 2009-04-28 Computer Sciences Corporation Business transaction processing systems and methods
US7571171B1 (en) 1999-10-29 2009-08-04 Computer Sciences Corporation Smart trigger for use in processing business transactions
US7363264B1 (en) 1999-10-29 2008-04-22 Computer Sciences Corporation Processing business transactions using dynamic database packageset switching
DE60033422T2 (de) * 1999-11-19 2007-11-29 Institute Of Medicinal Molecular Design, Inc. Identifikationssymbol das einmalig für die struktur der formel einer mischung ist
WO2001055951A2 (en) * 2000-01-25 2001-08-02 Cellomics, Inc. Method and system for automated inference of physico-chemical interaction knowl edge
US6907350B2 (en) * 2000-03-13 2005-06-14 Chugai Seiyaku Kabushiki Kaisha Method, system and apparatus for handling information on chemical substances
AU2001233134A1 (en) * 2000-03-29 2001-10-08 Arena Pharmaceuticals, Inc. Universal biomolecular data system
EP1279112A2 (en) * 2000-05-01 2003-01-29 Aspen Technology, Inc. A method and a system for on-line screening of chemical customers
US8478732B1 (en) 2000-05-02 2013-07-02 International Business Machines Corporation Database aliasing in information access system
US8640017B1 (en) * 2000-05-02 2014-01-28 International Business Machines Corporation Bootstrapping in information access systems
US6711561B1 (en) * 2000-05-02 2004-03-23 Iphrase.Com, Inc. Prose feedback in information access system
US6704728B1 (en) 2000-05-02 2004-03-09 Iphase.Com, Inc. Accessing information from a collection of data
US7356419B1 (en) * 2000-05-05 2008-04-08 Cambridgesoft Corporation Deriving product information
US7272509B1 (en) * 2000-05-05 2007-09-18 Cambridgesoft Corporation Managing product information
US7428554B1 (en) 2000-05-23 2008-09-23 Ocimum Biosolutions, Inc. System and method for determining matching patterns within gene expression data
US6408277B1 (en) 2000-06-21 2002-06-18 Banter Limited System and method for automatic task prioritization
US9699129B1 (en) 2000-06-21 2017-07-04 International Business Machines Corporation System and method for increasing email productivity
US8290768B1 (en) 2000-06-21 2012-10-16 International Business Machines Corporation System and method for determining a set of attributes based on content of communications
WO2002003219A1 (en) 2000-06-30 2002-01-10 Plurimus Corporation Method and system for monitoring online computer network behavior and creating online behavior profiles
AU2001288677A1 (en) * 2000-09-05 2002-03-22 The Althexis Company, Inc. An electronic database of enzyme substrate and enzyme inhibitor structures
DE10043853A1 (de) * 2000-09-06 2002-03-14 Merck Patent Gmbh Verfahren zur Erstellung von Synthesepfaden
US6813615B1 (en) 2000-09-06 2004-11-02 Cellomics, Inc. Method and system for interpreting and validating experimental data with automated reasoning
US20020129004A1 (en) * 2000-11-09 2002-09-12 Bassett Jimmy G. Software enabled wizards
US20070226640A1 (en) * 2000-11-15 2007-09-27 Holbrook David M Apparatus and methods for organizing and/or presenting data
AU2002220172A1 (en) 2000-11-15 2002-05-27 David M. Holbrook Apparatus and method for organizing and/or presenting data
US6990501B2 (en) 2000-11-30 2006-01-24 Monsanto Technology, Llc Method for organizing laboratory information in a database
US7644057B2 (en) 2001-01-03 2010-01-05 International Business Machines Corporation System and method for electronic communication management
US20020169755A1 (en) * 2001-05-09 2002-11-14 Framroze Bomi Patel System and method for the storage, searching, and retrieval of chemical names in a relational database
US6694330B2 (en) 2001-05-09 2004-02-17 Row 2 Technologies, Inc. System and method for identifying the raw materials consumed in the manufacture of a chemical product
US7155453B2 (en) * 2002-05-22 2006-12-26 Agilent Technologies, Inc. Biotechnology information naming system
US20020178150A1 (en) * 2001-05-12 2002-11-28 X-Mine Analysis mechanism for genetic data
US20020194154A1 (en) * 2001-06-05 2002-12-19 Levy Joshua Lerner Systems, methods and computer program products for integrating biological/chemical databases using aliases
US20020194201A1 (en) * 2001-06-05 2002-12-19 Wilbanks John Thompson Systems, methods and computer program products for integrating biological/chemical databases to create an ontology network
US6556999B1 (en) * 2001-06-08 2003-04-29 Syntex (Usa) Llc System and method for bridging a clinical remote data entry product to a back-end clinical data management system
KR20030005461A (ko) * 2001-07-09 2003-01-23 인포켐스(주) 화학 물질의 데이터베이스구조 및 그 구축방법
KR20010085075A (ko) * 2001-08-01 2001-09-07 조현정 네트워크 기반의 3차원 화학정보 제공시스템 및 그 화학식에디터
WO2003025695A2 (en) 2001-09-20 2003-03-27 Hitwise Pty. Ltd Method and system for characterization of online behavior
US20030108876A1 (en) * 2001-12-11 2003-06-12 Speir Johnny Paul Method for the application of FTMS to drug testing
KR100453224B1 (ko) * 2001-12-21 2004-10-15 한국전자통신연구원 유/무선 인터넷을 이용한 수식 기호 편집장치 및 방법
AUPR981002A0 (en) * 2002-01-02 2002-01-31 Proteome Systems Ltd 2 Dimensional structure queries
US7343372B2 (en) * 2002-02-22 2008-03-11 International Business Machines Corporation Direct navigation for information retrieval
US7272545B2 (en) * 2002-05-22 2007-09-18 General Electric Company Method and apparatus for designing and locating chemical structures
US8495002B2 (en) 2003-05-06 2013-07-23 International Business Machines Corporation Software tool for training and testing a knowledge base
US20050187913A1 (en) 2003-05-06 2005-08-25 Yoram Nelken Web-based customer service interface
US7676358B2 (en) * 2003-09-24 2010-03-09 International Business Machines Corporation System and method for the recognition of organic chemical names in text documents
US20050108063A1 (en) * 2003-11-05 2005-05-19 Madill Robert P.Jr. Systems and methods for assessing the potential for fraud in business transactions
WO2005091169A1 (en) * 2004-03-05 2005-09-29 Applied Research Systems Ars Holding N.V. Method for fast substructure searching in non-enumerated chemical libraries
US7899827B2 (en) * 2004-03-09 2011-03-01 International Business Machines Corporation System and method for the indexing of organic chemical structures mined from text documents
US7505989B2 (en) 2004-09-03 2009-03-17 Biowisdom Limited System and method for creating customized ontologies
US7493333B2 (en) * 2004-09-03 2009-02-17 Biowisdom Limited System and method for parsing and/or exporting data from one or more multi-relational ontologies
US20060053175A1 (en) * 2004-09-03 2006-03-09 Biowisdom Limited System and method for creating, editing, and utilizing one or more rules for multi-relational ontology creation and maintenance
US20060053173A1 (en) * 2004-09-03 2006-03-09 Biowisdom Limited System and method for support of chemical data within multi-relational ontologies
US7496593B2 (en) 2004-09-03 2009-02-24 Biowisdom Limited Creating a multi-relational ontology having a predetermined structure
US20060053171A1 (en) * 2004-09-03 2006-03-09 Biowisdom Limited System and method for curating one or more multi-relational ontologies
US7734606B2 (en) * 2004-09-15 2010-06-08 Graematter, Inc. System and method for regulatory intelligence
US20060059021A1 (en) * 2004-09-15 2006-03-16 Jim Yulman Independent adjuster advisor
KR100609692B1 (ko) 2004-12-20 2006-08-08 한국전자통신연구원 바이오 객체 상호작용 네트워크의 통합 방법 및 장치
US7792829B2 (en) * 2005-01-28 2010-09-07 Microsoft Corporation Table querying
US8175889B1 (en) 2005-04-06 2012-05-08 Experian Information Solutions, Inc. Systems and methods for tracking changes of address based on service disconnect/connect data
US7908242B1 (en) 2005-04-11 2011-03-15 Experian Information Solutions, Inc. Systems and methods for optimizing database queries
US7676418B1 (en) * 2005-06-24 2010-03-09 Experian Information Solutions, Inc. Credit portfolio benchmarking system and method
WO2007008987A1 (en) * 2005-07-11 2007-01-18 Emolecules, Inc. Molecular keyword indexing for chemical structure database storage, searching and retrieval
US20070112833A1 (en) * 2005-11-17 2007-05-17 International Business Machines Corporation System and method for annotating patents with MeSH data
US9495349B2 (en) * 2005-11-17 2016-11-15 International Business Machines Corporation System and method for using text analytics to identify a set of related documents from a source document
US8804897B2 (en) 2006-07-21 2014-08-12 Areva Inc. Integrated method to analyze crystals in deposits
WO2008022289A2 (en) 2006-08-17 2008-02-21 Experian Information Services, Inc. System and method for providing a score for a used vehicle
WO2008066981A2 (en) * 2006-08-21 2008-06-05 Western Slope Utilities, Inc. Systems and methods for pipeline rehabilitation installation
US7912865B2 (en) 2006-09-26 2011-03-22 Experian Marketing Solutions, Inc. System and method for linking multiple entities in a business database
JP4343206B2 (ja) * 2006-09-27 2009-10-14 株式会社東芝 構造化文書検索支援装置およびプログラム
US8036979B1 (en) 2006-10-05 2011-10-11 Experian Information Solutions, Inc. System and method for generating a finance attribute from tradeline data
US20080140695A1 (en) * 2006-12-12 2008-06-12 Paragen, Inc. Intellectual property related method and computer program
US8606666B1 (en) 2007-01-31 2013-12-10 Experian Information Solutions, Inc. System and method for providing an aggregation tool
US8166389B2 (en) * 2007-02-09 2012-04-24 General Electric Company Methods and apparatus for including customized CDA attributes for searching and retrieval
US8285656B1 (en) 2007-03-30 2012-10-09 Consumerinfo.Com, Inc. Systems and methods for data verification
WO2008127288A1 (en) 2007-04-12 2008-10-23 Experian Information Solutions, Inc. Systems and methods for determining thin-file records and determining thin-file risk levels
WO2008147918A2 (en) 2007-05-25 2008-12-04 Experian Information Solutions, Inc. System and method for automated detection of never-pay data sets
US8301574B2 (en) 2007-09-17 2012-10-30 Experian Marketing Solutions, Inc. Multimedia engagement study
US9690820B1 (en) 2007-09-27 2017-06-27 Experian Information Solutions, Inc. Database system for triggering event notifications based on updates to database records
JP2011500681A (ja) * 2007-10-16 2011-01-06 デクリプト インコーポレイテッド 一般的な化学構造を処理する方法
US20090228445A1 (en) * 2008-03-04 2009-09-10 Systems Biology (1) Pvt. Ltd. Automated molecular mining and activity prediction using xml schema, xml queries, rule inference and rule engines
US8312033B1 (en) 2008-06-26 2012-11-13 Experian Marketing Solutions, Inc. Systems and methods for providing an integrated identifier
US7991689B1 (en) 2008-07-23 2011-08-02 Experian Information Solutions, Inc. Systems and methods for detecting bust out fraud using credit data
KR101200467B1 (ko) 2008-10-16 2012-11-12 주식회사 엘지화학 디스플레이 소재에 사용되는 화학물질 후보군 검색 시스템 및 방법
TW201027376A (en) * 2008-12-05 2010-07-16 Decript Inc Method for creating virtual compound libraries within markush structure patent claims
US8224764B1 (en) * 2009-06-01 2012-07-17 Gregory Albert Ouzounian Method to predict homemade explosive formulation outcomes
US20100332292A1 (en) 2009-06-30 2010-12-30 Experian Information Solutions, Inc. System and method for evaluating vehicle purchase loyalty
US8364518B1 (en) 2009-07-08 2013-01-29 Experian Ltd. Systems and methods for forecasting household economics
US8495084B2 (en) 2009-09-16 2013-07-23 International Business Machines Corporation Molecular level similarity search and computer aided drug discovery process
US20110099164A1 (en) * 2009-10-23 2011-04-28 Haim Zvi Melman Apparatus and method for search and retrieval of documents and advertising targeting
US8725613B1 (en) 2010-04-27 2014-05-13 Experian Information Solutions, Inc. Systems and methods for early account score and notification
US9152727B1 (en) 2010-08-23 2015-10-06 Experian Marketing Solutions, Inc. Systems and methods for processing consumer information for targeted marketing applications
US8538983B2 (en) * 2010-09-21 2013-09-17 Cambridgesoft Corporation Systems, methods, and apparatus for facilitating chemical analyses
US8639616B1 (en) 2010-10-01 2014-01-28 Experian Information Solutions, Inc. Business to contact linkage system
US8782217B1 (en) 2010-11-10 2014-07-15 Safetyweb, Inc. Online identity management
US9147042B1 (en) 2010-11-22 2015-09-29 Experian Information Solutions, Inc. Systems and methods for data verification
US9483606B1 (en) 2011-07-08 2016-11-01 Consumerinfo.Com, Inc. Lifescore
RU2549510C1 (ru) 2011-07-12 2015-04-27 Экспириен Инфомэйшн Солюшнз, Инк. Системы и способы создания крупномасштабной архитектуры обработки кредитной информации
US11030562B1 (en) 2011-10-31 2021-06-08 Consumerinfo.Com, Inc. Pre-data breach monitoring
US9977876B2 (en) 2012-02-24 2018-05-22 Perkinelmer Informatics, Inc. Systems, methods, and apparatus for drawing chemical structures using touch and gestures
US9853959B1 (en) 2012-05-07 2017-12-26 Consumerinfo.Com, Inc. Storage and maintenance of personal data
WO2013173826A2 (en) * 2012-05-18 2013-11-21 Georgetown University Methods and systems for populating and searching a drug informatics database
US9535583B2 (en) * 2012-12-13 2017-01-03 Perkinelmer Informatics, Inc. Draw-ahead feature for chemical structure drawing applications
US9697263B1 (en) 2013-03-04 2017-07-04 Experian Information Solutions, Inc. Consumer data request fulfillment system
US8854361B1 (en) 2013-03-13 2014-10-07 Cambridgesoft Corporation Visually augmenting a graphical rendering of a chemical structure representation or biological sequence representation with multi-dimensional information
AU2014250074B2 (en) 2013-03-13 2019-04-04 Perkinelmer Informatics, Inc. Systems and methods for gesture-based sharing of data between separate electronic devices
US9430127B2 (en) 2013-05-08 2016-08-30 Cambridgesoft Corporation Systems and methods for providing feedback cues for touch screen interface interaction with chemical and biological structure drawing applications
US9751294B2 (en) 2013-05-09 2017-09-05 Perkinelmer Informatics, Inc. Systems and methods for translating three dimensional graphic molecular models to computer aided design format
US10102536B1 (en) 2013-11-15 2018-10-16 Experian Information Solutions, Inc. Micro-geographic aggregation system
US9529851B1 (en) 2013-12-02 2016-12-27 Experian Information Solutions, Inc. Server architecture for electronic data quality processing
US10262362B1 (en) 2014-02-14 2019-04-16 Experian Information Solutions, Inc. Automatic generation of code for attributes
US9524302B2 (en) 2014-03-05 2016-12-20 Scality, S.A. Distributed consistent database implementation within an object store
US10248682B2 (en) 2015-02-20 2019-04-02 Scality, S.A. Object storage system capable of performing snapshots, branches and locking
US9576030B1 (en) 2014-05-07 2017-02-21 Consumerinfo.Com, Inc. Keeping up with the joneses
US10445152B1 (en) 2014-12-19 2019-10-15 Experian Information Solutions, Inc. Systems and methods for dynamic report generation based on automatic modeling of complex data structures
US20170300541A1 (en) * 2016-04-15 2017-10-19 Counsyl, Inc. Analytic results management database
US10678894B2 (en) 2016-08-24 2020-06-09 Experian Information Solutions, Inc. Disambiguation and authentication of device users
CA3050139A1 (en) 2017-01-31 2018-08-09 Experian Information Solutions, Inc. Massive scale heterogeneous data ingestion and user resolution
WO2018160205A1 (en) 2017-03-03 2018-09-07 Perkinelmer Informatics, Inc. Systems and methods for searching and indexing documents comprising chemical information
CA3056257A1 (en) * 2017-04-03 2018-10-11 American Chemical Society Systems and methods for query and index optimization for retrieving data in instances of a formulation data structure from a database
US10963434B1 (en) 2018-09-07 2021-03-30 Experian Information Solutions, Inc. Data architecture for supporting multiple search models
US11941065B1 (en) 2019-09-13 2024-03-26 Experian Information Solutions, Inc. Single identifier platform for storing entity data
US11880377B1 (en) 2021-03-26 2024-01-23 Experian Information Solutions, Inc. Systems and methods for entity resolution
CN113344416B (zh) * 2021-06-23 2024-05-24 曲靖师范学院 一种原材料质量管理平台

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58175077A (ja) * 1982-04-07 1983-10-14 Nippon Kagaku Gijutsu Joho Center 化合物の立体化学情報記憶方法及び装置
US4642762A (en) * 1984-05-25 1987-02-10 American Chemical Society Storage and retrieval of generic chemical structure representations
JPS61223941A (ja) * 1985-03-29 1986-10-04 Kagaku Joho Kyokai 化学構造の検索方法
EP0213483B1 (en) * 1985-08-12 1994-07-13 Fuji Photo Film Co., Ltd. Method for processing information on chemical reactions
JPS6257017A (ja) * 1985-09-05 1987-03-12 Fuji Photo Film Co Ltd 化学反応情報の処理方法
US4855931A (en) * 1988-03-25 1989-08-08 Yale University Stochastic method for finding molecular conformations
US5025388A (en) * 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
US5249137A (en) * 1990-03-23 1993-09-28 Xerox Corporation Computer-aided chemical illustration system
EP0496902A1 (en) * 1991-01-26 1992-08-05 International Business Machines Corporation Knowledge-based molecular retrieval system and method
US5386507A (en) * 1991-07-18 1995-01-31 Teig; Steven L. Computer graphics system for selectively modelling molecules and investigating the chemical and physical properties thereof
US5259137A (en) * 1991-09-27 1993-11-09 Horst Blaser Jagdwaffenfabrik Breech mechanism for a firearm especially a repeater weapon
US5367058A (en) * 1993-08-25 1994-11-22 Becton, Dickinson And Company Modified antibodies with increased affinity
US5577239A (en) * 1994-08-10 1996-11-19 Moore; Jeffrey Chemical structure storage, searching and retrieval system
US5463564A (en) * 1994-09-16 1995-10-31 3-Dimensional Pharmaceuticals, Inc. System and method of automatically generating chemical compounds with desired properties

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
「化学構造データベースにおけるデータの表現とアクセスについて」情報処理学会研究報告(89−FI−16−6),Vol.89,No.104,1989(平1−12−7)

Also Published As

Publication number Publication date
WO1996006391A2 (en) 1996-02-29
JPH10507285A (ja) 1998-07-14
US6304869B1 (en) 2001-10-16
AU3320295A (en) 1996-03-14
WO1996006391A3 (en) 1996-05-09
EP0777882A4 (en) 1997-12-29
US5577239A (en) 1996-11-19
US5950192A (en) 1999-09-07
EP0777882A2 (en) 1997-06-11

Similar Documents

Publication Publication Date Title
JP3193383B2 (ja) 化学構造の記憶および検索用の関係データベース管理システム
US6073129A (en) Method and apparatus for improving the performance of a database management system through a central cache mechanism
Batoory et al. GENESIS: An extensible database management system
US6615203B1 (en) Method, computer program product, and system for pushdown analysis during query plan generation
US6920460B1 (en) Systems and methods for managing partitioned indexes that are created and maintained by user-defined indexing schemes
US5898872A (en) Software reconfiguration engine
US7359922B2 (en) Database system and methodology for generalized order optimization
Gray et al. An object-oriented database for protein structure analysis
US6778985B1 (en) Implementing descending indexes with a descend function
Özsoyoğlu et al. Query processing techniques in the summary-table-by-example database query language
US6609132B1 (en) Object data model for a framework for creation, update and view navigation of data objects and textual annotations of relations between data objects
AU777792B2 (en) System for managing RDBM fragmentations
US7536406B2 (en) Impact analysis in an object model
US20030204513A1 (en) System and methodology for providing compact B-Tree
US20050165812A1 (en) Data store supporting creation, storage and querying of data objects and textual annotations of relations between data objects
US20030069696A1 (en) Rule based compatibility module
Pucheral et al. Efficient Main Memory Data Management Using the DBGraph Storage Model.
US20040254916A1 (en) Data query schema based on conceptual context
JPH09212353A (ja) 再利用設計支援方法および設計支援装置
US20040260696A1 (en) Job management method, information processing device, program, and recording medium
JPH08235033A (ja) オブジェクト指向データベース管理システムにおける結合演算方式
JPH07296009A (ja) データベース統合検索装置
Hagadone et al. Capturing chemical information in an extended relational database system
Richards The Advancing Art of Indexing
Hagadone et al. Integrating chemical structures into an extended relational database system

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090525

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100525

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110525

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110525

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130525

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term