以下、本発明の実施の形態を図面に基づいて説明する。化合物等の3次元構造をテキストで表す方法として、複数種類の命名法が存在する。化合物の構造の表現方法は、命名法によって異なっている。
命名規則の例として、International Union of Pure and Applied Chemistry(IUPAC)による命名規則がある。IUPACの英名では「スペース」を用いるが、IUPACの和名ではハイフン等を用いる。
化合物名の例として、化学物質排出管理把握促進法の政令番号44に示されるように、図1の全体構造を有する複合置換基化合物であるアセタート誘導体は、IUPACの命名規則に従うと、
メチル=(E)-メトキシイミノ-[2-[[[[(E)-1-[3-(トリフルオロメチル)フェニル]エチリデン]アミノ]オキシ]メチル]フェニル]アセタート ・・・1t
のようにテキストで表される。以下、アセタート誘導体の化合物名1tと言う。
IUPACの命名規則では、上記化合物名1tの、
"(E)-"に関して、
・E(entgegen)、Z(zentgegen)命名法を適用している。
・本来慣用的な、シス−トランス(cis-trans)は二置換アルケンに対してだけ名付けることができる。
・三置換、四置換アルケンに対してはEZ命名法を用いて異性体を表す。
・命名の仕方はCahn-Ingold-Prelog則に従って行う。
・cis-trans異性体が存在する場合、EZ表示が推奨される。
・EかZかは優先順位で決定する。
・優先順位が高いもの同士が同じ側ならZ、反対側ならEをつける。
また、上記Cahn-Ingold-Prelog則に関して、
(1)二重結合の二つの炭素を別々に考え、それぞれの炭素に付いている置換基の始めの原子の順位を決める。原子番号が大きい方が高い順位になる。同じ順位のものが同じ側にあるものをZ、反対側にあるものをEと表す。
(2)上記(1)では区別ができない場合は、置換基の2番目、3番目・・・・に付いている原子と区別ができるまで探す。
(3)二重、三重結合がある場合は、同じ数の単結合原子と等価であるとする。
図1のアセタート誘導体は、図2に示すように、cis-trans異性体の二重結合を2つ持つ。
上述した命名法に従ったアセタート誘導体の化合物名1tと図1に示すアセタート誘導体の全体構造1sとを照らし合わせても、即座に、置換基名とその結合位置の対応を理解するのは困難である。
化合物名の他の例として、藤沢薬品工業株式会社の特開平7−242641号公報に記載される、図3の全体構造2sを有するピペラジン誘導体は、立体配置の命名規則、接合命名法等に従うと、
(2R)−4−ベンジル−1−[3,5−ビス(トリフルオロメチル)ベンゾイル]−2−(1H−インドール−3−イルメチル)ピペラジン ・・・2t
のようにテキストで表される。以下、ピペラジン誘導体の化合物名2tと言う。
立体配置の命名規則では、
・最小の置換基が奥を向いている先頭に「R」(図4)を付ける。
接合命名法では、
・非環式部分が主基1個を持ち、その非環式部分が環式部分に単結合で結合している。
・非環式部分は飽和炭化水素鎖に基づいて命名する。
・1つの環系に複数の官能性側鎖が結合した化合物に「H」(図4)を付ける。
上述した命名法に従ったピペラジン誘導体の化合物名2tと図3に示すピペラジン誘導体の全体構造2sとを照らし合わせても、置換基名とその結合位置の対応を理解することが困難である。
上述したように、化合物名と全体構造と間において部分構造の対応を容易に理解できない場合がある。また、化合物名の末端が構造の末端位置とは限らない。多様されている多重括弧を分解することは困難である。
従って、本実施例では、化合物名の理解を分子構造図を使って支援する。また、そのために、化合物名の中に含まれる部分構造名と、構造図の部分構造との対応付けを支援する。
本実施例において、分子構造図の以下の特徴を考慮する。
(1)化合物名の末端が構造図の末端であるとは限らない。
(2)炭素及び水素は省略されることが多い。
(3)結合は、一重線、二重線、三重線等で示される。
(4)多種の環構造がある。
本実施例では、化合物名に基づいて全体構造図を構造式DBから検索し、化合物名を部分構造名に分解し、分解して得られた部分構造のうち、全体構造との対応付けに役立ちそうな構造指標を提示する。構造指標を使って部分構造名と対応付く構造図の特徴を明示する。
構造指標となりうる部分構造には、末端基、炭素及び水素以外の元素を含む基、多重結合、環構造など様々なものがある。ある化合物を見るとき、有効な構造指標がどんな場合でも有効な構造指標となるとは限らず、読もうとする全体構造によっては役に立たない場合がある。
図5は、環構造の例を示す図である。環構造を構造指標とした場合、全体構造1sにおける環構造では、化合物の構造理解を支援できそうであるが、全体構造2sでは、環構造が多く混み合っているため、構造指標として使用しても、化合物の構造理解を支援できそうにない。構造指標の有効性を判断する必要がある。
発明者等は、構造指標となりうる例について図6に示している。図6は、構造指標の例を示す図である。図6では、構造指標に対して、判別し易い特徴となる選択理由を対応付けている。また、構造指標を着目点となる特徴毎に分類している。
図6において、特徴の「結合」に着目した構造指標は、「分岐」、「位置が末端」、「多重結合」、「向き」等に分類されている。「分岐」が構造指標として選択される理由は、直鎖(紐)か否かは比較的判別しやすいことである。「位置が末端」が構造指標として選択される理由は、結合が片側のみだからである。「多重結合」が構造指標として選択される理由は、結合を表す線が多重だからである。「向き」が構造指標として選択される理由は、向きは比較的判別しやすいからである。例えば、糖鎖異性体の上下が異なるα結合とβ結合が相当する。
また、特徴の「形状」に着目した構造指標は、「環」、「かご型」、「置換基の位置」等に分類されている。「環」が構造指標として選択される理由は、線よりも環状の方がボリュームがあるので比較的判別しやすいことである。「かご型」が構造指標として選択される理由は、ボリュームがあるので比較的判別しやすいことである。例えば、10個の炭素がダイヤモンドの構造と同様に配置されている、アダマンタンが相当する。「置換基の位置」が構造指標として選択される理由は、ボリュームがあるので比較的判別しやすいことである。例えば、ベンゼン環の主官能基から距離が短い順に、「1-、5- < 2-、4- < 3-」と判断できる。
更に、特徴の「構成元素」に着目した構造指標は、「炭素・水素以外の元素」等に分類されている。「炭素・水素以外の元素」が構造指標として選択される理由は、有機化合物は、炭素を主骨格として水素が付加する構造が基本であるので、構成数が少ない傾向の他元素は判別しやすいことである。例えば、酸素、窒素、硫黄、リン、ハロゲン等が相当する。
本実施例に係る情報提供装置は、上述したような化合物名1t、2t等の入力に応じて、入力された化合物名を解析して、結合関係に基づいて化合物構造を表形式で表した化合物情報を作成し、作成した化合物情報と、入力された化合物名とを、構造指標に基づいて対応付けが視認し易いように表示する。
本実施例に係る情報提供装置は、図7に示すようなハードウェア構成を有する。図7は、情報提供装置のハードウェア構成を示す図である。図7において、情報提供装置100は、コンピュータによって制御される端末であって、CPU(Central Processing Unit)11と、主記憶装置12と、補助記憶装置13と、入力装置14と、表示装置15と、通信I/F(インターフェース)17と、ドライブ装置18とを有し、バスBに接続される。
CPU11は、主記憶装置12に格納されたプログラムに従って情報提供装置100を制御する。主記憶装置12には、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU11にて実行されるプログラム、CPU11での処理に必要なデータ、CPU11での処理にて得られたデータ等を格納する。また、主記憶装置12の一部の領域が、CPU11での処理に利用されるワークエリアとして割り付けられている。
補助記憶装置13には、ハードディスクドライブが用いられ、各種処理を実行するためのプログラム等のデータを格納する。補助記憶装置13に格納されているプログラムの一部が主記憶装置12にロードされ、CPU11に実行されることによって、各種処理が実現される。記憶部130は、主記憶装置12及び/又は補助記憶装置13を有する。
入力装置14は、マウス、キーボード等を有し、ユーザが情報提供装置100による処理に必要な各種情報を入力するために用いられる。表示装置15は、CPU11の制御のもとに必要な各種情報を表示する。通信I/F17は、例えばインターネット、LAN(Local Area Network)等に接続し、外部装置との間の通信制御をするための装置である。通信I/F17による通信は無線又は有線に限定されるものではない。
情報提供装置100によって行われる処理を実現するプログラムは、例えば、CD−ROM(Compact Disc Read-Only Memory)等の記憶媒体19によって情報提供装置100に提供される。
ドライブ装置18は、ドライブ装置18にセットされた記憶媒体19(例えば、CD−ROM等)と情報提供装置100とのインターフェースを行う。
また、記憶媒体19に、後述される本実施の形態に係る種々の処理を実現するプログラムを格納し、この記憶媒体19に格納されたプログラムは、ドライブ装置18を介して情報提供装置100にインストールされる。インストールされたプログラムは、情報提供装置100により実行可能となる。
尚、プログラムを格納する媒体としてCD−ROMに限定するものではなく、コンピュータが読み取り可能な媒体であればよい。コンピュータ読取可能な記憶媒体として、CD−ROMの他に、DVDディスク、USBメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い。
図8は、情報提供装置の機能構成例を示す図である。情報提供装置100は、化合物名入力部41と、表示処理部42と、表示情報作成部50とを有する。また、情報提供装置100の記憶部130に、化合物名30、構造式DB31、置換基テーブル32、表示優先度テーブル33等が記憶される。
化合物名入力部41は、例えば、入力画面を表示装置15に表示して、ユーザ6に化合物名30の入力を促すことによって、化合物名30を取得する。化合物30は記憶部130に格納される。上述したようなアセタート誘導体の化合物名1t、ピペラジン誘導体の化合物名2t等がユーザ6によって入力され、化合物30として記憶部130に記憶される。
表示処理部42は、表示情報作成部50によって作成された表示情報の表示装置15への表示制御を行う。
表示情報作成部50は、ユーザ6によって入力された化合物名30を分解して得られた部分構造のうち、化合物名30によって表される全体構造との対応付けに役立ちそうな構造指標を示した表示情報を作成する。
表示情報作成部50は、置換基テーブル作成部51と、構造指標判定部52と、構造指標表示部53とを有する。
置換基テーブル作成部51は、構造式DB31を参照して、化合物名30に基づいて、部分構造間の結合に従って部分構造を階層化した置換基テーブル32を作成する。置換基テーブル作成部51は、構造式DB31を用いて、化合物名30を部分構造名に分解し、置換基テーブル32を作成する。置換基テーブル作成部51は、置換基の結合、形状、構成元素に基づいて予め定められている判別に用いる構造指標に基づいて、各構造指標を含む置換基を判別する。
構造指標判定部52は、置換基テーブル32内に考え得る構造指標(図6)を含む置換基が存在するか否かを判定する。
構造指標表示部53は、各構造指標の出現回数に基づいて表示優先度を判定し、表示優先度に基づいて、化合物名30と置換基テーブル32で示される部分構造名(置換基)との対応付けを行って、表示処理部42によって表示装置15に表示させる。
化合物名30は、ユーザ6によってテキストで入力された化合物名である。
構造式DB31は、化合物を構成する構造をデータベース化し管理する。構造は、全体構造又はその部分構造である。
置換基テーブル32は、化合物名30から得られる部分構造間の結合に従って部分構造を階層化したテーブルである。
本実施例では、構造指標を含む置換基に対応付けて表示優先度欄32aが追加されている。表示優先度欄32aは、化合物名30と全体構造(即ち、本実施例では、置換基テーブル32)との対応付けに役立ちそうな構造指標を、高い表示優先度で示す。例えば、「1」が最も高く、数値が大きくなるほど表示優先度が低いことを示す。
表示優先度テーブル33は、構造指標表示部53による構造指標表示処理で作成されるテーブルであり、構造指標表示部53によって判定された、構造指標と表示優先度との対応付けを示すテーブルである。
先ず、情報提供装置100の表示情報作成部50による表示情報作成処理の全体概要を説明する。図9は、表示情報作成処理の全体概要を説明するためのフローチャート図である。図9において、置換基テーブル作成部51は、記憶部130から化合物名30を読み込む(ステップS11)。
置換基テーブル作成部51は、化合物名30に基づいて構造式DB31を参照することにより、化合物の置換基テーブル32を作成する(ステップS12)。作成された置換基テーブル32は、記憶部130に格納される。
そして、構造指標判定部52は、構造指標判定処理を行う(ステップS13)。構造指標判定処理が終了すると、置換基に構造指標があるか否かを判断する(ステップS14)。構造指標がある場合(ステップS14のYES)、構造指標表示部53は、構造指標表示処理を行う(ステップS15)。その後、情報提供装置100による表示情報作成処理が終了する。
一方、構造指標がない場合(ステップS14のNO)、構造指標表示部53は、構造指標に「該当なし」を表示する(ステップS15−2)。その後、情報提供装置100による表示情報作成処理が終了する。
ステップS13での構造指標判定処理について説明する。図10は、図9のステップS13での構造指標判定処理を説明するためのフローチャート図である。図10において、構造指標判定部52は、記憶部130から化合物の置換基テーブル32を取得する(ステップS21)。
構造指標判定部52は、置換基テーブル32から置換基を選択して(ステップS22)、構造式DB31を置換基(化合物名)で検索して、置換基(化合物名)に対応付けられた特徴から、置換基が構造指標を有するか否かを判断する(ステップS23)。構造指標がない場合(ステップS23のNO)、構造指標判定部52は、記憶部130内の構造指標フラグ9aを「0」に設定して(ステップS24−2)、ステップS25へと進む。
一方、構造指標がある場合(ステップS23のYES)、構造指標判定部52は、記憶部130において、予め定めた構造指標に対して構造指標フラグ9aを「1」に設定して(ステップS24)。ステップS25へと進む。
構造指標判定部52は、置換基テーブル32を検索して分岐があるか否かを判断する(ステップS25)。置換基テーブル32において、処理中の階層において複数の置換基が示される場合、分岐があると判断する。処理中の階層において選択中の置換基以外に置換基が存在しない場合、又は、処理中の階層の全ての置換基について処理済みである場合、分岐がないと判断する。
分岐がない場合(ステップS25のNO)、構造指標判定部52は、記憶部130内の分岐フラグ9bを「0」に設定して(ステップS26−2)、ステップS27へと進む。
一方、分岐がある場合(ステップS25のYES)、構造指標判定部52は、記憶部130内の分岐フラグ9bを「1」に設定して(ステップS26)。ステップS27へと進む。
構造指標判定部52は、分岐フラグ9bを参照して、構造指標の判定処理が終了したか否かを判断する(ステップS27)。判定処理が終了していない場合(ステップS27のNO)、即ち、分岐フラグ9bが「1」の場合、構造指標判定部52は、ステップS22へと戻り、上記同様の処理を繰り返す。
一方、判定処理が終了した場合(ステップS27のYES)、即ち、分岐フラグ9bが「0」の場合、構造指標判定部52は、この構造指標判定処理を終了する。
ステップS15での構造指標表示処理について説明する。図11は、図9のステップS15での構造指標表示処理を説明するためのフローチャート図である。図11において、構造指標表示部53は、記憶部130から化合物の置換基テーブル32を取得する(ステップS31)。
構造指標表示部53は、置換基テーブル32を参照して、構造指標の頻度を集計する(ステップS32)。構造指標表示部53は、置換基テーブル32から置換基名を取得し、各置換基名毎に構造式DB32から置換基名に対応する構造指標を取得する。構造指標毎に頻度数をカウントし、置換基テーブル32の構造指標を含む置換基名の表示優先度欄32aにカウントした値を記録する。
構造指標表示部53は、一回しか出現しない構造指標を特定する(ステップS33)。構造指標のカウント値が「1」であるか否かを判断すればよい。構造指標表示部53は、一回しか出現しない構造指標を表示優先度テーブル33に保存する(ステップS34)。
構造指標表示部53は、複数回出現する構造指標に対して標準偏差を求めて、標準偏差が大きい構造指標から表示優先度テーブル33に保存する(ステップS35)。構造指標表示部53は、二回以上出現する構造指標に対しては、偏りを求めるため、構造指標間の距離を用いて、階層数の標準偏差を求める。そして、構造指標表示部53は、標準偏差が大きい構造指標から表示優先度テーブル33に保存する。
構造指標表示部53は、表示処理部42に、表示優先度順と構造指標とを示した置換基テーブル32を表示装置15に表示させる(ステップS36)。置換基テーブル32を表示する際に、構造指標表示部53は、表示優先度テーブル33に基づいた選択ボタンテーブル6bを、表示処理部42に表示させる。
選択ボタンテーブル6bによって、自動で表示優先度順に構造指標を表示する選択と、各構造指標を指定する選択とがリスト形式で示される。
ユーザ6による選択ボタンテーブル6bに対する選択操作により、優先度順に構造指標を全表示する自動表示要求、又は、選択された構造指標を表示する選択表示要求を受け付ける(ステップS37)。
構造指標表示部53は、受け付けた要求が自動表示要求か否かを判断する(ステップS38)。自動表示要求ではなく選択表示要求の場合(ステップS38のNO)、構造指標表示部53は、選択表示要求で指定されるユーザ6によって選択された構造指標を、表示処理部42に表示させ(ステップS39−2)、ステップS41へと進み、置換基テーブル32への構造指標の表示を終了したか否かを判断する(ステップS41)。終了していない場合(ステップS41のNO)、構造指標表示部53は、ステップS36へと戻り、上述した処理を繰り返す。一方、終了した場合(ステップS41のYES)、構造指標表示部53は、この構造指標表示処理を終了する。
一方、自動表示要求の場合(ステップS38のYES)、構造指標表示部53は、表示優先度テーブル33の先頭から順に構造指標を、表示処理部42に表示させ(ステップS39)、表示優先度テーブル33の構造指標を全て表示したか否かを判断する(ステップS40)。全て表示していない場合(ステップS40のNO)、構造指標表示部53は、ステップS39に戻り、次の構造指標を表示する。
一方、全て表示した場合(ステップS40のYES)、構造指標表示部53は、置換基テーブル32への構造指標の表示を終了したか否かを判断する(ステップS41)。終了していない場合(ステップS41のNO)、構造指標表示部53は、ステップS36へと戻り、上述した処理を繰り返す。一方、終了した場合(ステップS41のYES)、構造指標表示部53は、この構造指標表示処理を終了する。
次に、構造式DB31について説明する。図12は、構造式DBのデータ例を示す図である。図12に例示される構造式DB31は、No.、化合物の種類、環、化合物名、構造式及び炭素番号、結合なし構造式、N、O、S、二重結合、三重結合、・・・、備考等の項目を有する。
No.は、構造式DB31への登録時に化合物名に与えられた番号であり、化合物名に対して一意に与えられる。化合物の種類は、化合物の分類を示し、直鎖炭化水素、芳香族炭化水素、脂環式炭化水素、縮合環等を示す。
環は、化合物の種類毎に環の有無を示す。「No」は環が無いことを示し、「Yes」は環が有ることを示す。
化合物名は、全体構造又は部分構造としての化合物の名称を示し、「メタン」、「エタン」、・・・、「ベンゼン」、「フェニル」、・・・、「シクロヘキサン」、・・・等を示す。構造式及び炭素番号は、化合物名に対応する構造式を示し、構造式には炭素番号が付されている。結合なし構造式は、化合物において結合なし構造が存在する場合は、その結合なし構造が示される。
化合物の特徴となる窒素N、酸素O、硫黄S、二重結合、三重結合等が、化合物毎にその有無が示される。「No」は無いことを示し、「Yes」は有ることを示す。備考には、適宜、付加的な情報が記録されるが、例えば、部分構造図等を記憶しておいても良い。
次に、置換基テーブル作成部51による置換基テーブル作成処理を説明する。図13は、置換基テーブル作成処理の第1の例を説明するための図である。図13において、理解を容易とするため、予め、アセタート誘導体の化合物名1tの全体構造1sを示して説明する。置換基テーブル作成処理では、化合物名1tの命名手順に従って行われる。
化合物名1tに従って、「アセタート」を母核とした第1階層を定義する((図13の(a))。第1階層の母核の「アセタート」から結合に従って、「メチル=」を第1階層の置換基1として定義し((図13の(b))、「イミノ-」を母核とした第1階層の複合置換基2を定義し((図13の(c))、そして、「フェニル」を母核とした第1階層の複合置換基3((図13の(d))を定義する。
図13の(a)において、「アセタート」を母核とし、「メチル=」が第1階層の置換基1((図13の(b))として定義される。
また、第1階層の複合置換基2において((図13の(a))、「イミノ-」を母核とし、「メトキシ」を複合置換基1とする第2階層((図13の(c))が定義される。
更に、第1階層の複合置換基3において((図13の(a))、「フェニル」を母核とし、「[[[(E)-1-[3-(トリフルオロメチル)フェニル]エチリデン]アミノ]オキシ]メチル」を複合置換基1とする第2階層((図13の(d))も定義される。
第1階層の複合置換基3((図13の(a))に相当する第2階層において((図13の(d))、
第2階層の複合置換基1に対して、「メチル」を母核とし、「[[(E)-1-[3-(トリフルオロメチル)フェニル]エチリデン]アミノ]オキシ」を複合置換基1とする第3階層((図13の(e))が定義される。
第3階層((図13の(e))の複合置換基1に対して、「オキシ」を母核とし、「[(E)-1-[3-(トリフルオロメチル)フェニル]エチリデン]アミノ」を複合置換基1とする第4階層((図13の(f))が定義される。
第4階層の複合置換基1((図13の(f))に対して、「アミノ」を母核とし、「(E)-1-[3-(トリフルオロメチル)フェニル]エチリデン」を複合置換基1とする第5階層((図13の(g))が定義される。
第5階層の複合置換基1((図13の(g))に対して、「エチリデン」を母核とし、「3-(トリフルオロメチル)フェニル」を複合置換基1とする第6階層((図13の(h))が定義される。
第6階層の複合置換基1((図13の(h))に対して、「フェニル」を母核とし、「トリフルオロメチル」を複合置換基1とする第7階層((図13の(i))が定義される。
上述したように、化合物名1tから第1階層から第7階層までを定義することによって、図14に示すような化合物名1tの置換基テーブル32−1が生成される。図14は、アセタート誘導体の置換基テーブルの例を示す図である。図14に示すアセタート誘導体の置換基テーブル32−1では、構造指標となりうる分子構造が、色別に示される。同じ構造指標を含む分子構造には同一の色で示している。
また、本実施例に係る置換基テーブル32−1では、表示優先度欄32aが設けられている。表示優先度欄32aには、構造指標としての有効性の程度が示される。例えば、「1」が最も有効であることを示し、数値が大きい程有効性が低いことを示す。
次に、構造指標表示部53による構造指標表示処理における、構造指標の表示優先度順を決定する処理(図11)を、アセタート誘導体の化合物名1tに関して図14を参照して説明する。
(I)構造指標表示部53は、構造指標の頻度を集計した後、一回しか出現しない構造指標を特定し、置換基テーブル32−1(図14)の該当する置換基の表示優先度欄32aに「1」を保存する(図11のステップS33)。保存した個数(置換基の個数)を「n」とする。
この例では、フッ素元素(F)を含む置換基が一回しか出現しない構造指標に相当する。フッ素元素(F)を含む置換基は、第7階層の「トリフルオロメチル」のみであるので、n=1である。第7階層の「トリフルオロメチル」に対する表示優先度欄32aに「1」を保存する。
(II)構造指標の頻度の集計結果に基づいて、頻度が2以上を示す構造指標の個数を「m」とする。頻度が2以上の構造指標の分布の偏りを求めて、分布の偏りが大きい方から順に、置換基テーブル32−1(図14)の該当する置換基の表示優先度欄32aに「n+1、n+2、n+3、・・・n+m」を保存する。階層数を距離として、その標準偏差を求め、分布の偏りとする。
この例では、頻度が2以上を示す構造指標に該当する置換基が5個存在するため、m=5である。標準偏差は、環は3.54、末端置換基は3.21、窒素元素(N)は2.13、(環を含まない)多重結合は2.08、酸素元素(O)は1.53である。
標準偏差が大きい方から順に、環、末端置換基、窒素元素(N)、多重結合、酸素元素(O)を含む置換基について、置換基テーブル32−1(図14)の表示優先度欄32aに「2」、「3」、「4」、「5」、「6」と順に保存する。
(III)表示優先度欄32aに従って、各構造指標を含む置換基を置換基テーブル32−1で示しながら、優先度の高い順(表示優先度欄32aの値の昇順)に順次表示する。
この例では、フッ素元素(F)、環、末端置換基、窒素元素(N)、多重結合、酸素元素(O)の各構造指標を含む置換基を置換基テーブル32−1上で順次表示する。表示する際には、図14に例示したように、色等を用いて構造指標を強調表示することによって、視認し易くできる。同時に、化合物名1tを合わせて表示し、置換基テーブル32−1内の構造指標を含む置換基に相当する化合物名を視認し易いように強調表示する。
上記(III)では、自動表示要求に応じた処理例を説明したが、選択表示要求を受けた場合には、選択表示要求で指定される構造指標を含む置換基を置換基テーブル32−1上で表示する。選択表示要求によって、構造指標は複数指定されていても良い。指定された各構造指標を含む置換基を、順に置換基テーブル32−1上で表示すればよい。
アセタート誘導体の化合物名1tに関する画面例について図15から図21で説明する。図15は、アセタート誘導体の分子構造に関して構造指標を示した画面例を示す図である。
図15では、構造指標の表示方法を選択する画面G70が示されている。画面G70は、化合物名を表示する表示領域70aと、置換基テーブル32−1と、全体構造1sと、選択ボタンテーブル6bとを有する。
表示領域70aには、ユーザ6が入力したアセタート誘導体の化合物名1tが表示される。
置換基テーブル32−1では、同じ構造指標を含む置換基には同じ色でハイライトして、構造指標が視認し易いように表示されている。異なる構造指標には異なる色が割り当てられている。
構造指標毎に、例えば、構造指標が、
・フッ素元素(F)の場合は色P
・環の場合は色Y
・末端置換基の場合は色B
・窒素元素(N)の場合は色G
・多重結合の場合は色L
・酸素元素(O)の場合は色K
で示される。
置換基テーブル32−1には、置換基毎に表示優先度欄32aが加えられている。ユーザ6は、構造指標を含む置換基と表示優先度欄32aとが強調表示されることにより、構造指標としての有効性を知ることができる。
画面G70に表示される選択ボタンテーブル6bは、表示選択、構造指標等の項目を有する。表示選択は、チェックボックスはユーザによる構造指標の選択を可能とする。
構造指標は、例えば、優先度順に全表示、フッ素元素(F)、環、末端置換基、窒素元素(N)、多重結合、酸素元素(O)が表示される。
構造指標の優先度順に全表示は、全ての構造指標を表示優先度32aの順に自動で表示することを示す。優先度順に全表示以外は、表示優先度32aの高い順に一覧されている。構造指標をユーザが個別に選択した場合は、ユーザに選択された構造指標のみが表示される。
図16は、フッ素元素(F)を構造指標として表示した画面例を示す図である。図16に示す画面例G71では、本実施例において、アセタート誘導体の化合物名1tに基づいて構造指標として最も有効そうであると判定したフッ素元素(F)の位置が、化合物名1t内と、化合物名1tに基づく置換基テーブル32−1内とに視認可能なように、例えば、色Pで示される。
置換基テーブル32−1内の第7階層(第6階層の置換基1)の置換基1「トリフルオロメチル」が構造指標となりうること、また、化合物名1t内で「トリフルオロメチル」が色Pで示される。
従って、ユーザは、置換基テーブル32−1によって、化合物名1t内の「トリフルオロメチル」に関して、分子構造における結合関係を容易に視認できる。
図17は、環を構造指標として表示した画面例を示す図である。図17に示す画面例G72では、本実施例において、アセタート誘導体の化合物名1tに基づいて構造指標として2番目に有効そうであると判定した環の位置が、化合物名1t内と、化合物名1tに基づく置換基テーブル32−1内とに視認可能なように、例えば、色Yで示される。
置換基テーブル32−1内の第2階層(第1階層の置換基3)の母核(親)及び第7階層(第5階層の置換基1)の母核(親)「フェニル」が構造指標となりうること、また、化合物名1t内で「フェニル」が色Yで示される。
従って、ユーザは、置換基テーブル32−1によって、化合物名1t内の「フェニル」に関して、分子構造における結合関係を容易に視認できる。
図18は、末端置換基を構造指標として表示した画面例を示す図である。図18に示す画面例G73では、本実施例において、アセタート誘導体の化合物名1tに基づいて構造指標として3番目に有効そうであると判定した末端置換基の位置が、化合物名1t内と、化合物名1tに基づく置換基テーブル32−1内とに視認可能なように、例えば、色Bで示される。
置換基テーブル32−1内の第1階層の置換基1「メチル」、第2階層(第1階層の置換基2)の置換基1「メトキシ」、及び第7階層(第5階層の置換基1)の置換基1「トリフルオロメチル」が構造指標となりうること、また、化合物名1t内で「メチル」、「メトキシ」、及び「トリフルオロメチル」が色Bで示される。
従って、ユーザは、置換基テーブル32−1によって、化合物名1t内の「メチル」、「メトキシ」、及び「トリフルオロメチル」に関して、分子構造における結合関係を容易に視認できる。
図19は、窒素元素(N)を構造指標として表示した画面例を示す図である。図19に示す画面例G74では、本実施例において、アセタート誘導体の化合物名1tに基づいて構造指標として4番目に有効そうであると判定した末端置換基の位置が、化合物名1t内と、化合物名1tに基づく置換基テーブル32−1内とに視認可能なように、例えば、色Gで示される。
置換基テーブル32−1内の第2階層(第1階層の置換基2)の母核(親)「イミノ-」、及び第5階層(第4階層の置換基1)の母核(親)「アミノ」が構造指標となりうること、また、化合物名1t内で「イミノ-」、及び「アミノ」が色Gで示される。
従って、ユーザは、置換基テーブル32−1によって、化合物名1t内の「イミノ-」、及び「アミノ」に関して、分子構造における結合関係を容易に視認できる。
図20は、多重結合を構造指標として表示した画面例を示す図である。図20に示す画面例G75では、本実施例において、アセタート誘導体の化合物名1tに基づいて構造指標として5番目に有効そうであると判定した末端置換基の位置が、化合物名1t内と、化合物名1tに基づく置換基テーブル32−1内とに視認可能なように、例えば、色Lで示される。
置換基テーブル32−1内の第1階層の母核(親)「アセタート」、第2階層(第1階層の置換基2)の母核(親)「イミノ-」、及び第6階層(第5階層の置換基1)の母核(親)「エチリデン」が構造指標となりうること、また、化合物名1t内で「アセタート」、「イミノ-」、及び「エチリデン」が色Lで示される。
従って、ユーザは、置換基テーブル32−1によって、化合物名1t内の「「アセタート」、「イミノ-」、及び「エチリデン」に関して、分子構造における結合関係を容易に視認できる。
図21は、酸素元素(O)を構造指標として表示した画面例を示す図である。図21に示す画面例G76では、本実施例において、アセタート誘導体の化合物名1tに基づいて構造指標として6番目に有効そうであると判定した末端置換基の位置が、化合物名1t内と、化合物名1tに基づく置換基テーブル32−1内とに視認可能なように、例えば、色Kで示される。
置換基テーブル32−1内の第1階層の母核(親)「アセタート」、第2階層(第1階層の置換基2)の置換基1「メトキシ」、及び第4階層(第3階層の置換基1)の母核(親)「オキシ」が構造指標となりうること、また、化合物名1t内で「アセタート」、「メトキシ」、及び「オキシ」が色Kで示される。
従って、ユーザは、置換基テーブル32−1によって、化合物名1t内の「「アセタート」、「メトキシ」、及び「オキシ」に関して、分子構造における結合関係を容易に視認できる。図22は、置換基テーブル作成処理の第2の例を説明するための図である。図22において、理解を容易とするため、予め、ピペラジン誘導体の化合物名2tの全体構造1sを示して説明する。置換基テーブル作成処理では、化合物名2tの命名手順に従って行われる。
化合物名2tに従って、「ピベラジン」を母核とした第1階層を定義する((図22の(a))。第1階層の母核の「ピベラジン」から結合に従って、「ベンジル」を第1階層の置換基1として定義し((図22の(b))、「ベンゾイル」を母核とした第1階層の複合置換基2を定義し((図22の(c))、「1H−インドール」を母核とした第1階層の複合置換基3を定義する((図22の(d))。
図22の(a)において、「ピベラジン」を母核とし、「ベンジル」が第1階層の置換基1((図22の(b))として定義される。
また、第1階層の複合置換基2において((図22の(a))、「ベンゾイル」を母核とし、2つの「トリフルオロメチル」を置換基1とする第2階層((図22の(c))が定義される。
更に、第1階層の複合置換基3において((図22の(a))、「1H−インドール」を母核とし、「イルメチル」を置換基1とする第2階層((図22の(d))も定義される。
上述したように、化合物名2tから第1階層から第2階層までを定義することによって、図23に示すような化合物名2tの置換基テーブル32−2が生成される。図23は、ピペラジン誘導体の置換基テーブルの例を示す図である。図23に示すピペラジン誘導体の置換基テーブル32−2では、構造指標となりうる分子構造が、色別に示される。同じ構造指標を含む分子構造には同一の色で示している。
また、本実施例に係る置換基テーブル32−2では、表示優先度欄32aが設けられている。表示優先度欄32aには、構造指標としての有効性の程度が示される。例えば、「1」が最も有効であることを示し、数値が大きい程有効性が低いことを示す。
次に、構造指標表示部53による構造指標表示処理における、構造指標の表示優先度順を決定する処理(図11)を、ピペラジン誘導体の化合物名2tに関して図23を参照して説明する。
(I)構造指標表示部53は、構造指標の頻度を集計した後、一回しか出現しない構造指標を特定し、置換基テーブル32−2(図23)の該当する置換基の表示優先度欄32aに「1」を保存する(図11のステップS33)。保存した個数を「n」とする。
この例では、酸素元素(O)を含む置換基と、(環を含まない)多重結合を含む置換基とが相当する。酸素元素(O)を含む置換基は、第2階層の「トリフルオロメチル」のみである。多重結合を含む置換基もまた、第2階層の「トリフルオロメチル」のみである。第7階層の「トリフルオロメチル」であるので、第7階層の「トリフルオロメチル」に対する表示優先度欄32aに「1」を保存する。各構造指標を含む置換基の個数は2個であるのでn=2である。
(II)構造指標の頻度の集計結果に基づいて、頻度が2以上を示す構造指標の個数を「m」とする。頻度が2以上の構造指標の分布の偏りを求めて、分布の偏りが大きい方から順に、置換基テーブル32−2(図23)の該当する置換基の表示優先度欄32aに「n+1、n+2、n+3、・・・n+m」を保存する。階層数を距離として、その標準偏差を求め、分布の偏りとする。
この例では、頻度が2以上を示す構造指標に該当する置換基が4個存在するため、m=4である。標準偏差は、フッ素元素(F)は4、窒素元素(N)は1.15、末端置換基は0.58、環は0.5である。
標準偏差が大きい方から順に、フッ素元素(F)、窒素元素(N)、末端置換基、環を含む置換基について、置換基テーブル32−2(図23)の表示優先度欄32aに「3」、「4」、「5」、「6」と順に保存する。
(III)表示優先度欄32aに従って、各構造指標を含む置換基を置換基テーブル32−2で示しながら、優先度の高い順(表示優先度欄32aの値の昇順)に順次表示する。
この例では、酸素元素(O)、多重結合、フッ素元素(F)、窒素元素(N)、末端置換基、環の各構造指標を含む置換基を置換基テーブル32−2上で順次表示する。表示する際には、図23に例示したように、色等を用いて構造指標を強調表示することによって、視認し易くできる。同時に、化合物名2tを合わせて表示し、置換基テーブル32−2内の構造指標を含む置換基に相当する化合物名を視認し易いように強調表示する。
上記(III)では、自動表示要求に応じた処理例を説明したが、選択表示要求を受けた場合には、選択表示要求で指定される構造指標を含む置換基を置換基テーブル32−2上で表示する。選択表示要求によって、構造指標は複数指定されていても良い。指定された各構造指標を含む置換基を、順に置換基テーブル32−2上で表示すればよい。
ピペラジン誘導体の化合物名2tに関する画面例について図24から図30で説明する。図24は、ピペラジン誘導体の分子構造に関して構造指標を示した画面例を示す図である。
図24では、構造指標の表示方法を選択する画面G80が示されている。画面G80は、化合物名を表示する表示領域80aと、置換基テーブル32−2と、全体構造2sと、選択ボタンテーブル6bとを有する。
表示領域80aには、ユーザ6が入力したピペラジン誘導体の化合物名2tが表示される。
置換基テーブル32−2では、同じ構造指標を含む置換基には同じ色でハイライトして、構造指標が視認し易いように表示されている。異なる構造指標には異なる色が割り当てられている。
構造指標毎に、例えば、構造指標が、
・酸素元素(O)の場合は色K
・多重結合の場合は色L
・フッ素元素(F)の場合は色P
・窒素元素(N)の場合は色G
・末端置換基の場合は色B
・環の場合は色Y
で示される。
置換基テーブル32−2には、置換基毎に表示優先度欄32aが加えられている。ユーザ6は、構造指標を含む置換基と表示優先度欄32aとが強調表示されることにより、構造指標としての有効性を知ることができる。
画面G80に表示される選択ボタンテーブル6bは、表示選択、構造指標等の項目を有する。表示選択は、チェックボックスはユーザによる構造指標の選択を可能とする。
構造指標は、例えば、優先度順に全表示、酸素元素(O)、多重結合、フッ素元素(F)、窒素元素(N)、末端置換基、環が表示される。
構造指標の優先度順に全表示は、全ての構造指標を表示優先度32aの順に自動で表示することを示す。優先度順に全表示以外は、表示優先度32aの高い順に一覧されている。構造指標をユーザが個別に選択した場合は、ユーザに選択された構造指標のみが表示される。
図25は、酸素元素(O)を構造指標として表示した画面例を示す図である。図25に示す画面例G81では、本実施例において、ピペラジン誘導体の化合物名2tに基づいて構造指標として最も有効そうであると判定した酸素元素(O)の位置が、化合物名2t内と、化合物名2tに基づく置換基テーブル32−2内とに視認可能なように、例えば、色Kで示される。
置換基テーブル32−2内の第2階層(第1階層の置換基2)の母核(親)「ベンゾイル」が構造指標となりうること、また、ピペラジン誘導体の化合物名2t内で「ベンゾイル」が色Kで示される。
従って、ユーザは、置換基テーブル32−2によって、化合物名2t内の「ベンゾイル」に関して、分子構造における結合関係を容易に視認できる。
図26は、多重結合を構造指標として表示した画面例を示す図である。図26に示す画面例G82では、本実施例において、ピペラジン誘導体の化合物名2tに基づいて構造指標として2番目に有効そうであると判定した環の位置が、化合物名2t内と、化合物名2tに基づく置換基テーブル32−2内とに視認可能なように、例えば、色Lで示される。
置換基テーブル32−2内の第2階層(第1階層の置換基3)の置換基1「イルメリル」が構造指標となりうること、また、化合物名2t内で「イルメリル」が色Lで示される。
従って、ユーザは、置換基テーブル32−2によって、化合物名2t内の「イルメリル」に関して、分子構造における結合関係を容易に視認できる。
図27は、フッ素元素(F)を構造指標として表示した画面例を示す図である。図27に示す画面例G83では、本実施例において、ピペラジン誘導体の化合物名2tに基づいて構造指標として3番目に有効そうであると判定した末端置換基の位置が、化合物名2t内と、化合物名2tに基づく置換基テーブル32−2内とに視認可能なように、例えば、色Pで示される。
置換基テーブル32−2内の第2階層(第1階層の置換基2)の置換基1「トリフルオロメチル」が構造指標となりうること、また、化合物名2t内で「トリフルオロメチル」が色Pで示される。
従って、ユーザは、置換基テーブル32−2によって、化合物名2t内の「トリフルオロメチル」に関して、分子構造における結合関係を容易に視認できる。
図28は、窒素元素(N)を構造指標として表示した画面例を示す図である。図28に示す画面例G84では、本実施例において、ピペラジン誘導体の化合物名2tに基づいて構造指標として4番目に有効そうであると判定した末端置換基の位置が、化合物名2t内と、化合物名2tに基づく置換基テーブル32−2内とに視認可能なように、例えば、色Gで示される。
置換基テーブル32−2内の第1階層の母核(親)「ピペラジン」、及び、第2階層(第1階層の置換基3)の母核(親)「1H−インドール」が構造指標となりうること、また、化合物名2t内で「ピペラジン」及び「1H−インドール」が色Gで示される。
従って、ユーザは、置換基テーブル32−2によって、化合物名2t内の「トリフルオロメチル」に関して、分子構造における結合関係を容易に視認できる。
図29は、末端置換基を構造指標として表示した画面例を示す図である。図29に示す画面例G85では、本実施例において、ピペラジン誘導体の化合物名2tに基づいて構造指標として5番目に有効そうであると判定した末端置換基の位置が、化合物名2t内と、化合物名2tに基づく置換基テーブル32−2内とに視認可能なように、例えば、色Bで示される。
置換基テーブル32−2内の第1階層の置換基1「ベンジル」、第2階層(第1階層の置換基2)の置換基1「トリフルオロメチル」、及び第2階層(第1階層の置換基3)の置換基1「1H−インドール」が構造指標となりうること、また、化合物名2t内で「ベンジル」、「トリフルオロメチル」、及び「1H−インドール」が色Bで示される。
従って、ユーザは、置換基テーブル32−2によって、化合物名2t内の「ベンジル」、「トリフルオロメチル」、及び「1H−インドール」に関して、分子構造における結合関係を容易に視認できる。
図30は、環を構造指標として表示した画面例を示す図である。図30に示す画面例G86では、本実施例において、ピペラジン誘導体の化合物名2tに基づいて構造指標として6番目に有効そうであると判定した末端置換基の位置が、化合物名2t内と、化合物名2tに基づく置換基テーブル32−2内とに視認可能なように、例えば、色Yで示される。
置換基テーブル32−2内の第1階層の母核(親)「ピペラジン」、第1階層の置換基1「ベンジル」、第2階層(第1階層の置換基2)の母核(親)「ベンゾイル」、及び第2階層(第1階層の置換基3)の母核(親)「1H−インドール」が構造指標となりうること、また、化合物名2t内で「ピペラジン」、「ベンジル」、「ベンゾイル」、及び「1H−インドール」が色Bで示される。
従って、ユーザは、置換基テーブル32−2によって、化合物名2t内の「ピペラジン」、「ベンジル」、「ベンゾイル」、及び「1H−インドール」に関して、分子構造における結合関係を容易に視認できる。
次に、本実施例に係る構造指標判定部52及び構造指標表示部53を適用せず、構造式DB31を用いて、化合物名1t及び2tにおいて、置換基と各構造とを化合物名に出現する順に図31及び図32に示す。
図31は、アセタート誘導体の化合物名に出現する構造と置換基との対応付けを示す図である。図31において、アセタート誘導体の化合物名1tに出現する(左から右の)順に、構造名「メチル」、「メトキシ」、「イミノ」、「トリフルオロメチル」、「フェニル」、「エチリデン」、「アミノ」、「オキシ」、「メチル」、「フェニル」、「アセタートCH3」の各々に対応する置換が示されている。
図32は、ピペラジン誘導体の化合物名に出現する構造と置換基との対応付けを示す図である。図32において、ピペラジン誘導体の化合物名2tに出現する(左から右の)順に、構造名「ベンジル」、「トリフルオロメチル」、「ベンゾイル」、「1H−インドール」、「イルメチル」、「ピラジン」の各々に対応する置換が示されている。
図31及び図32を参照して分かるように、部分構造のみを表示しても、結合関係が理解し難い。
一方、本実施例では、結合関係に基づいた置換基テーブル32と、化合物名とにおいて、構造指標を含む部分構造を視認し易く表示するため、ユーザは、全体構造における結合関係において、構造指標を含む部分構造の結合位置を容易に理解することができる。
従って、本実施例によって、化合物に係る情報提供の際、化合物名と化合物名に従って部分構造を階層化した置換基テーブルとに、部分構造の特徴に基づいた部分構造の判別に用いる構造指標を視認可能に表示することで、化合物の構造を理解し易くする。
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
以上の実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
部分構造名と部分構造の特徴とを対応付けた構造式データベースを記憶する記憶部と、
化合物名を部分構造名に分解して置換基テーブルを作成する置換基テーブル作成部と、
分解して得られた部分構造に対して、前記構造式データベースを用いて、前記部分構造の特徴に基づいて予め定められている前記部分構造の判別に用いる構造指標を基に、前記部分構造の各構造指標を判別する構造指標判定部と、
前記置換基テーブルと前記化合物名とを、前記構造指標を視認可能にして表示装置に表示させる構造指標表示部と、
を有することを特徴とする情報提供装置。
(付記2)
前記構造指標表示部は、各構造指標の頻度を集計して、一回しか出現しない構造指標から順に、該構造指標が前記置換基テーブルと前記化合物名とにおいて視認可能に前記表示装置に表示させることを特徴とする付記1記載の情報提供装置。
(付記3)
前記構造指標表示部は、二回以上出現する構造指標に対して前記部分構造の分布の偏りを計算し、該分布の偏りの大きい方から順に、該構造指標が前記置換基テーブルと前記化合物名とにおいて視認可能に前記表示装置に表示させることを特徴とする付記2記載の情報提供装置。
(付記4)
前記置換基テーブルは、前記化合物名に基づいて前記部分構造間の結合に従って、該部分構造間の関係を階層化したテーブルであり、
前記構造指標表示部は、前記置換基テーブルにおける同じ構造指標を含む部分構造間の階層数を距離として前記分布の偏りを計算することを特徴とする付記3記載の情報提供装置。
(付記5)
前記構造指標表示部は、ユーザによって選択可能な前記構造指標を前記頻度に基づく順で一覧にした選択テーブルを前記表示装置に表示させ、該ユーザが選択した該構造指標を、前記置換基テーブルと前記化合物名とにおいて視認可能なように前記表示装置に表示させることを特徴とする付記3又は4記載の情報提供装置。
(付記6)
前記選択テーブルは、前記構造指標表示部が、前記頻度に基づく順に、前記構造指標判定部によって判別された各構造指標を、前記置換基テーブルと前記化合物名とにおいて視認可能なように前記表示装置に表示させる選択肢を含むことを特徴とする付記3乃至5のいずれか一項記載の情報提供装置。
(付記7)
前記構造指標判定部は、前記置換基テーブルを検索して同一階層に複数の置換基が存在する場合、各置換基を前記部分構造に置き換えて構造指標を判別することを特徴とする付記1乃至6のいずれか一項記載の情報提供装置。
(付記8)
コンピュータによって実行される情報提供方法であって、
化合物名を部分構造名に分解して置換基テーブルを作成し
分解して得られた部分構造に対して、部分構造名と前記部分構造の特徴とを対応付けた構造式データベースを用いて、前記部分構造の特徴に基づいて予め定められている前記部分構造の判別に用いる構造指標を基に、前記部分構造の各構造指標を判別し、
前記置換基テーブルと前記化合物名とを、前記構造指標を視認可能にして表示装置に表示させる、
ことを特徴とする情報提供方法。
(付記9)
化合物名を部分構造名に分解して置換基テーブルを作成し
分解して得られた部分構造に対して、部分構造名と前記部分構造の特徴とを対応付けた構造式データベースを用いて、前記部分構造の特徴に基づいて予め定められている前記部分構造の判別に用いる構造指標を基に、前記部分構造の各構造指標を判別し、
前記置換基テーブルと前記化合物名とを、前記構造指標を視認可能にして表示装置に表示させる、
処理をコンピュータに実行させる情報提供プログラム。