JP5974838B2 - 情報提供方法、情報提供装置および情報提供プログラム - Google Patents

情報提供方法、情報提供装置および情報提供プログラム Download PDF

Info

Publication number
JP5974838B2
JP5974838B2 JP2012244242A JP2012244242A JP5974838B2 JP 5974838 B2 JP5974838 B2 JP 5974838B2 JP 2012244242 A JP2012244242 A JP 2012244242A JP 2012244242 A JP2012244242 A JP 2012244242A JP 5974838 B2 JP5974838 B2 JP 5974838B2
Authority
JP
Japan
Prior art keywords
compound
formula
information providing
block
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012244242A
Other languages
English (en)
Other versions
JP2014091724A (ja
Inventor
田中 一成
一成 田中
池田 紀子
紀子 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012244242A priority Critical patent/JP5974838B2/ja
Publication of JP2014091724A publication Critical patent/JP2014091724A/ja
Application granted granted Critical
Publication of JP5974838B2 publication Critical patent/JP5974838B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報提供方法、情報提供装置および情報提供プログラムに関する。
従来、ある化合物の化合物名を検索キーとして、特許文献データベースや学術論文データベースから特許文献や学術論文が検索される場合がある。この際、ある化合物と同じ物質を示す別称や、ある化合物の異性体である化合物の化合物名を検索キーに加えて、特許文献や学術論文が検索される場合がある。
関連する先行技術としては、例えば、分子構造の配座異性体を決定するものがある。また、化合物の構成する各原子の種類および原子間の結合関係、および/または異性体の種類に基づいて、化学構造式に対して実質的にユニークである固定長または可変長の文字列を生成する技術がある。
特表2002−506447号公報 国際公開第01/039041号
しかしながら、従来技術によれば、化合物の化合物名や示性式から、互いに異性体となる化合物同士の化学的な性質の違いを判断することが難しいという問題がある。
1つの側面では、本発明は、化合物の特徴的な性質を判断し易くさせる情報提供方法、情報提供装置および情報提供プログラムを提供することを目的とする。
本発明の一側面によれば、化合物の示性式を前記化合物の骨格を形成する特定の元素の直前で区切って分割し、前記示性式から分割した各々のブロックについて、前記ブロックのうち前記化合物の基本構造となる部分を除く残余の部分を特定することにより、前記基本構造に結合する部分構造を表す元素または原子団を特定し、特定した前記部分構造を表す元素または原子団を、前記示性式における前記ブロックの位置と対応付けて出力する情報提供方法、情報提供装置および情報提供プログラムが提案される。
本発明の一態様によれば、化合物の特徴的な性質を判断し易くさせることができるという効果を奏する。
図1は、実施の形態にかかる情報提供方法の一実施例を示す説明図である。 図2は、情報提供装置101のハードウェア構成例を示すブロック図である。 図3は、化学式DB300の記憶内容の一例を示す説明図である。 図4は、情報提供装置101の機能的構成例を示すブロック図である。 図5は、部分示性式の生成例を示す説明図である。 図6は、部分示性式DB600の記憶内容の一例を示す説明図である。 図7は、検索結果テーブル700の記憶内容の一例を示す説明図である。 図8は、部分構造テーブル800の記憶内容の一例を示す説明図である。 図9は、検索条件設定画面の画面例を示す説明図である。 図10は、情報提供装置101の情報提供処理手順の一例を示すフローチャートである。 図11は、部分構造特定処理の具体的処理手順の一例を示すフローチャートである。 図12は、部分構造比較処理の具体的処理手順の一例を示すフローチャートである。
以下に添付図面を参照して、本発明にかかる情報提供方法、情報提供装置および情報提供プログラムの実施の形態を詳細に説明する。
(情報提供方法の一実施例)
図1は、実施の形態にかかる情報提供方法の一実施例を示す説明図である。図1において、情報提供装置101は、化合物の特徴的な性質の理解を支援するコンピュータである。ここで、化合物とは、2種類以上の元素からなる化学物質のことである。化合物は、例えば、有機化合物と無機化合物とに分類される。
有機化合物は、炭素原子を構造の基本骨格に持つ化合物の総称である。有機化合物は、炭素「C」の連結が骨組みとなり、炭素「C」に水素「H」が結合するという基本構造を有する。なお、化合物の骨格を形成する炭素以外の元素として、シリコンや硫黄があり、無機高分子と呼ばれる。無機高分子は、シリコン「Si」または硫黄「S」の連結が骨組みとなり、シリコン「Si」または硫黄「S」に酸素「O」が結合するという基本構造を有する。
また、無機化合物は、有機化合物以外の化合物であり、炭素以外の元素で構成される化合物である。ただし、炭素化合物のうち、例えば、炭素の同素体(例えば、グラファイト、ダイヤモンド)や二酸化炭素は、無機化合物に分類される。以下の説明では、化合物として有機化合物を例に挙げて説明する。
有機化合物は、例えば、炭素骨格の長さや分岐により多様な構造をとる。炭素骨格は、有機化合物において炭素同士が結合している部分である。炭素骨格の長さは、炭素の数によって表される。また、有機化合物は、窒素(N)、酸素(O)、硫黄(S)、燐(P)、ハロゲン(F、Cl、Br、I)などが炭素に結合した多様な官能基が生成される。官能基は、有機化合物のおおよその性質を決める原子団である。
ここで、有機化合物の化合物名は、例えば、IUPAC(International Union of Pure and Applied Chemistry)が定める命名法によって命名される。IUPACが定める命名法としては、例えば、置換命名法、基官能命名法、付加命名法、減去命名法、接合命名法、代置命名法などがある。
このように、化合物名には複数の命名法があるため、全く同じ物質に対して複数の化合物名(別称)が付けられている場合がある。例えば、「1−エトキシ−2−プロパノール」の別称として、「プロピレングリコールモノエチルエーテル」がある。「1−エトキシ−2−プロパノール」と「プロピレングリコールモノエチルエーテル」は、分子式と示性式が同一のものとなる。
分子式と示性式は、元素記号等を用いて、化合物の組成や化学構造などを表現する化学式の一例である。具体的には、分子式は、化合物を構成する原子の種類と数を、元素記号を用いて表現した化学式である。また、示性式は、化合物に含まれる原子団を明示した化学式である。
また、化合物には、全く同じ物質ではなくても、含まれる元素の種類と数が同じで、構造が異なる異性体が存在する場合がある。互いに異性体となる化合物同士は、分子式が同一で示性式が異なるものとなる。異性体には、化学的な性質がほとんど変わらないものや、化学的な性質が大きく異なるものがある。
例えば、「1−エトキシ−3−プロパノール」は、「1−エトキシ−2−プロパノール」の異性体である。「1−エトキシ−2−プロパノール」および「1−エトキシ−3−プロパノール」の分子式はともに「C5H12O2」である。一方で、「1−エトキシ−2−プロパノール」の示性式は「CH3CH2OCH2CH(OH)CH3」であり、「1−エトキシ−3−プロパノール」の示性式は「CH3CH2OCH2CH2CH2(OH)」であり、互いに異なる。
また、特許文献データベースや学術論文データベース等から、特許文献や学術論文等の電子文書を検索する際に、ある化合物の化合物名とともに、その化合物の異性体となる化合物の化合物名が検索条件として設定される場合がある。この際、検索結果が膨大な数となるのを回避するために、ある化合物と性質が似ている、あるいは、性質が大きく異なる異性体を絞り込んで検索条件に設定したい場合がある。
しかし、異性体の化合物名や示性式からでは、ある化合物と性質が似ている異性体、あるいは、性質が大きく異なる異性体を判別することが困難な場合がある。このため、互いに異性体となる化合物同士の示性式の差分を示すことにより、化合物同士の化学的な性質の違いを判断し易くすることが考えられる。
例えば、「1−エトキシ−2−プロパノール」の示性式「CH3CH2OCH2CH(OH)CH3」のうち、「1−エトキシ−3−プロパノール」の示性式「CH3CH2OCH2CH2CH2(OH)」との差分として、「(OH)CH3」を示すことが考えられる。同様に、「1−エトキシ−3−プロパノール」の示性式「CH3CH2OCH2CH2CH2(OH)」のうち、「1−エトキシ−2−プロパノール」の示性式「CH3CH2OCH2CH(OH)CH3」との差分として、「2CH2(OH)」を示すことが考えられる。
しかし、互いに異性体となる化合物について、単純に示性式の差分を示すだけでは、多数の異性体がある場合などに性質の異なる特徴的な異性体を見過ごしてしまう可能性がある。例えば、比較的構造が単純な「1−エトキシ−2−プロパノール」であっても、異性体として、上述した「1−エトキシ−3−プロパノール」のほかに、「1−エトキシ−1−プロパノール」、「1−メトキシ−3−ブタノール」、「1−メトキシ−2−メチル−2−プロパノール」および「1−エトキシ−2−メトキシエタン」などが挙げられ、どの異性体を検索条件に加えるべきかを判断することが難しい。
そこで、実施の形態では、情報提供装置101は、化合物の特徴的な性質を表す部分構造を示性式から抽出し、抽出した部分構造を、その部分構造が結合する炭素「C」の炭素番号と対応付けて出力することにより、化合物の特徴的な性質を判断し易くさせる。以下、実施の形態にかかる情報提供装置101の情報提供処理の一実施例について説明する。
(1)情報提供装置101は、互いに異性体となる第1化合物の示性式および第2化合物の示性式を取得する。具体的には、例えば、情報提供装置101は、ユーザの操作入力により、または、データベースからの抽出により、互いに異性体となる第1化合物の示性式および第2化合物の示性式を取得する。
図1の例では、互いに異性体となる第1化合物「1−エトキシ−2−プロパノール」の示性式「CH3CH2OCH2CH(OH)CH3」および第2化合物「1−エトキシ−3−プロパノール」の示性式「CH3CH2OCH2CH2CH2(OH)」が取得されている。
(2)情報提供装置101は、第1化合物の示性式を炭素「C」の直前で区切って分割する。炭素「C」は、有機化合物の骨格を形成する元素である。同様に、情報提供装置101は、第2化合物の示性式を炭素「C」の直前で区切って分割する。
図1の例では、第1化合物「1−エトキシ−2−プロパノール」の示性式「CH3CH2OCH2CH(OH)CH3」がブロック111〜115に分割されている。また、第2化合物「1−エトキシ−3−プロパノール」の示性式「CH3CH2OCH2CH2CH2(OH)」がブロック121〜125に分割されている。
(3)情報提供装置101は、第1化合物の示性式から分割した各々のブロックについて、有機化合物の基本構造に結合する部分構造を表す元素または原子団を特定する。同様に、情報提供装置101は、第2化合物の示性式から分割した各々のブロックについて、有機化合物の基本構造に結合する部分構造を表す元素または原子団を特定する。
ここで、有機化合物の基本構造とは、炭素「C」に水素「H」が結合した部分であり、「CHx」という基本形で表される部分である(x=0,1,2,…)。ただし、基本形「CHx」は、「x=0」の場合には「H」が省略されて「C」となり、「x=1」の場合には「x」が省略されて「CH」となる。
また、有機化合物の基本構造に結合する部分構造とは、化合物の特徴的な性質を表す元素や原子団である。なお、原子団とは、化合物の分子内で一つの化学単位を作っている原子の集合である。化合物の特徴的な性質を表す元素としては、例えば、酸素「O」や窒素「N」がある。また、化合物の特徴的な性質を表す原子団としては、例えば、ヒドロキシ基「OH」がある。
具体的には、例えば、情報提供装置101は、第1化合物の示性式から分割した各ブロック111〜115のうち、有機化合物の基本構造となる部分「CHx」を除く残余の部分を特定する。そして、情報提供装置101は、特定した残余の部分を、基本構造に結合する部分構造を表す元素または原子団として特定する。
例えば、ブロック112を例に挙げると、情報提供装置101は、ブロック112のうち有機化合物の基本構造となる部分「CH2」を除く残余の部分「O」を特定することにより、基本構造に結合する部分構造を表す元素「O」を特定する。また、ブロック114を例に挙げると、情報提供装置101は、ブロック114のうち有機化合物の基本構造となる部分「CH」を除く残余の部分「(OH)」を特定することにより、基本構造に結合する部分構造を表す原子団「OH」を特定する。
なお、各ブロック111〜115のうち有機化合物の基本構造となる部分「CHx」を除く残余の部分が存在しない場合は、部分構造を表す元素または原子団が存在しないことを意味する。例えば、ブロック111は、部分構造を表す元素または原子団が存在しない一例である。
第2化合物の示性式から分割した各ブロック121〜125についても同様である。例えば、ブロック122を例に挙げると、情報提供装置101は、ブロック122のうち有機化合物の基本構造となる部分「CH2」を除く残余の部分「O」を特定することにより、基本構造に結合する部分構造を表す元素「O」を特定する。また、ブロック125を例に挙げると、情報提供装置101は、ブロック125のうち有機化合物の基本構造となる部分「CH2」を除く残余の部分「(OH)」を特定することにより、基本構造に結合する部分構造を表す原子団「OH」を特定する。
(4)情報提供装置101は、各々のブロックについて特定した部分構造を表す元素または原子団を、示性式におけるブロックの位置と対応付けて出力する。ここで、ブロックの位置とは、例えば、示性式におけるブロックの出現順序を表すものであり、示性式に含まれる炭素「C」の炭素番号に相当するものである。ここでは、示性式における各ブロックの位置を表すものとして、示性式の左から順に1番目、2番目、…と各ブロックの出現順序が付されている場合を想定する。
この場合、第1化合物「1−エトキシ−2−プロパノール」のブロック112について特定された部分構造を表す元素「O」が、示性式「CH3CH2OCH2CH(OH)CH3」におけるブロック112の位置「2番目」と対応付けて出力される。さらに、第1化合物「1−エトキシ−2−プロパノール」のブロック114について特定された部分構造を表す原子団「OH」が、示性式「CH3CH2OCH2CH(OH)CH3」におけるブロック114の位置「4番目」と対応付けて出力される。
また、第2化合物「1−エトキシ−3−プロパノール」のブロック122について特定された部分構造を表す元素「O」が、示性式「CH3CH2OCH2CH2CH2(OH)」におけるブロック122の位置「2番目」と対応付けて出力される。さらに、第2化合物「1−エトキシ−3−プロパノール」のブロック125について特定された部分構造を表す原子団「OH」が、示性式「CH3CH2OCH2CH2CH2(OH)」におけるブロック125の位置「5番目」と対応付けて出力される。
このように、情報提供装置101によれば、第1化合物および第2化合物の各々の化合物について、化合物の部分構造を表す元素または原子団を特定して、その部分構造が結合する炭素「C」の炭素番号と対応付けて出力することができる。これにより、化合物の特徴的な性質を判断し易くさせることができる。
例えば、第1化合物「1−エトキシ−2−プロパノール」について、ユーザは、親水性を示すヒドロキシ基が4番目の炭素に結合していることがわかる。また、第2化合物「1−エトキシ−3−プロパノール」について、ユーザは、親水性を示すヒドロキシ基が5番目の炭素に結合していることがわかる。
また、ユーザは、互いに異性体となる化合物間で、炭素に結合する部分構造や、その部分構造が結合する炭素の位置を比較することにより、化合物同士の化学的な性質の違いを判断し易くなる。例えば、上述した第1化合物および第2化合物の例では、親水性を示すヒドロキシ基がともに存在しており、ヒドロキシ基が結合する位置もあまり変わらないため、化学的な性質が似ていると判断することができる。
この結果、特許文献データベースや学術論文データベース等から、特許文献や学術論文等の電子文書を検索する際に、ユーザが、ある化合物と性質が似ている、あるいは、性質が大きく異なる異性体を選別し易くなり、検索作業の効率化を図ることができる。
なお、化合物として無機高分子を扱う場合には、上記(2)において、情報提供装置101は、例えば、化合物の示性式を無機高分子の骨格を形成するシリコン「Si」または硫黄「S」の直前で区切って分割する。また、上記(3)において、情報提供装置101は、化合物の示性式から分割した各々のブロックについて、無機高分子の基本構造に結合する部分構造を表す元素または原子団を特定する。無機高分子の基本構造は、シリコン「Si」または硫黄「S」に酸素「O」が結合した部分であり、「SiOx」または「SOx」という基本形で表される。
(情報提供装置101のハードウェア構成例)
図2は、情報提供装置101のハードウェア構成例を示すブロック図である。図2において、情報提供装置101は、CPU(Central Processing Unit)201と、ROM(Read‐Only Memory)202と、RAM(Random Access Memory)203と、磁気ディスクドライブ204と、磁気ディスク205と、I/F(Interface)206と、ディスプレイ207と、キーボード208と、マウス209と、を有する。また、各構成部はバス200によってそれぞれ接続されている。
ここで、CPU201は、情報提供装置101の全体の制御を司る。ROM202は、ブートプログラムなどのプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。磁気ディスクドライブ204は、CPU201の制御にしたがって磁気ディスク205に対するデータのリード/ライトを制御する。磁気ディスク205は、磁気ディスクドライブ204の制御で書き込まれたデータを記憶する。
I/F206は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して、他のコンピュータ、例えば、クライアント装置201に接続される。そして、I/F206は、ネットワーク210と内部のインターフェースを司り、他のコンピュータからのデータの入出力を制御する。I/F206には、例えば、モデムやLANアダプタなどを採用することができる。
ディスプレイ207は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する。ディスプレイ207は、例えば、CRT、TFT液晶ディスプレイ、プラズマディスプレイなどを採用することができる。
キーボード208は、文字、数字、各種指示などの入力のためのキーを備え、データの入力を行う。また、タッチパネル式の入力パッドやテンキーなどであってもよい。マウス209は、カーソルの移動や範囲選択、あるいはウィンドウの移動やサイズの変更などを行う。なお、情報提供装置101は、上述した構成部のうち、例えば、ディスプレイ207、キーボード208、マウス209などを有していなくてもよい。
(化学式DB300の記憶内容)
つぎに、情報提供装置101が用いる化学式DB(データベース)300の記憶内容について説明する。化学式DB300は、例えば、図2に示したROM202、RAM203、磁気ディスク205などの記憶装置により実現される。
図3は、化学式DB300の記憶内容の一例を示す説明図である。図3において、化学式DB300は、化合物名、示性式および分子式のフィールドを有し、各フィールドに情報を設定することにより、化学式情報(例えば、化学式情報300−1〜300−6)をレコードとして記憶する。
ここで、化合物名は、化合物の物質名である。示性式は、化合物に含まれる原子団を明示した化学式である。分子式は、化合物を構成する原子の種類と数を、元素記号を用いて表現した化学式である。一例として化学式情報300−1を例に挙げると、化合物名「オレイルアルコール」の示性式「C17H33CH2OH」および分子式「C18H36O」が示されている。
(情報提供装置101の機能的構成例)
図4は、情報提供装置101の機能的構成例を示すブロック図である。図4において、情報提供装置101は、取得部401と、検索部402と、分割部403と、特定部404と、比較部405と、出力部406と、を含む構成である。取得部401〜出力部406は制御部となる機能であり、具体的には、例えば、図2に示したROM202、RAM203、磁気ディスク205などの記憶装置に記憶されたプログラムをCPU201に実行させることにより、または、I/F206により、その機能を実現する。また、各機能部の処理結果は、例えば、RAM203、磁気ディスク205などの記憶装置に記憶される。
取得部401は、対象化合物の化合物名を取得する機能を有する。ここで、対象化合物の化合物名とは、例えば、特許文献データベースや学術論文データベースから特許文献や学術論文を検索する際に検索条件として設定する化合物名である。
具体的には、例えば、取得部401は、図2に示したキーボード208やマウス209を用いたユーザの操作入力により、対象化合物の化合物名を取得することにしてもよい。また、取得部401は、ネットワーク210を介して、対象化合物の化合物名を表すテキストデータを他のコンピュータ(例えば、検索者が使用するコンピュータ)から受信することにより、対象化合物の化合物名を取得することにしてもよい。
なお、以下の説明では、各機能部の具体的な処理内容を説明する場合、対象化合物の化合物名として「1−エトキシ−2−プロパノール」が取得された場合を想定する。
検索部402は、化学式DB300(図3参照)から、取得された対象化合物の化合物名に対応する示性式および分子式を検索する機能を有する。ここで、対象化合物の化合物名として「1−エトキシ−2−プロパノール」が取得された場合を想定する。この場合、検索部402は、化学式DB300から、対象化合物の化合物名「1−エトキシ−2−プロパノール」に対応する示性式「CH3CH2OCH2CH(OH)CH3」および分子式「C5H12O2」を検索する。
また、検索部402は、化学式DB300から、対象化合物と分子式が同一かつ対象化合物と示性式が異なる化合物の示性式を検索する機能を有する。具体的には、例えば、検索部402は、化学式DB300から、分子式が「C5H12O2」の化合物のうち、示性式が「CH3CH2OCH2CH(OH)CH3」とは異なる化合物の示性式を検索する。
図3に示した化学式DB300の例では、例えば、化合物「1−エトキシ−3−プロパノール」、「1−メトキシ−2−メチル−2−プロパノール」および「1−エトキシ−2−メトキシエタン」の示性式が検索される。これにより、対象化合物「1−エトキシ−2−プロパノール」の異性体となる化合物「1−エトキシ−3−プロパノール」、「1−メトキシ−2−メチル−2−プロパノール」および「1−エトキシ−2−メトキシエタン」の示性式を検索することができる。
また、検索部402は、化学式DB300から、対象化合物と示性式が同一かつ対象化合物と化合物名が異なる化合物の示性式を検索する機能を有する。具体的には、例えば、検索部402は、化学式DB300から、示性式が「CH3CH2OCH2CH(OH)CH3」の化合物のうち、化合物名が「1−エトキシ−2−プロパノール」とは異なる化合物の示性式を検索する。
図3に示した化学式DB300の例では、例えば、化合物「プロピレングリコールモノエチルエーテル」の示性式が検索される。これにより、対象化合物「1−エトキシ−2−プロパノール」と同じ物質であって、化合物名が異なる化合物「プロピレングリコールモノエチルエーテル」の示性式を検索することができる。検索された検索結果は、例えば、後述する図7に示す検索結果テーブル700に記憶される。
以下の説明では、化学式DB300から検索された対象化合物の示性式、対象化合物の異性体となる化合物の示性式および対象化合物と同一の物質であって化合物名が異なる化合物の示性式を「示性式F1〜Fn」と表記する場合がある(nは、1以上の自然数)。また、示性式F1〜Fnのうちの任意の示性式を「示性式Fi」と表記する場合がある(i=1,2,…,n)。
分割部403は、化合物の示性式Fiを炭素「C」の直前で区切って分割する機能を有する。ここで、炭素「C」は、有機化合物の骨格を形成する元素である。具体的には、例えば、分割部403は、対象化合物「1−エトキシ−2−プロパノール」の示性式「CH3CH2OCH2CH(OH)CH3」を炭素「C」の直前で区切って分割する。この場合、分割後の示性式は、『CH3|CH2O|CH2|CH(OH)|CH3』となる。『|』は、分割箇所を示している。
また、分割部403は、化合物の示性式Fiの一部が括弧(例えば、丸括弧や山括弧)を用いて表現されている場合、示性式Fiに含まれる炭素「C」のうち当該括弧内に含まれる炭素「C」を除く残余の炭素「C」の直前で区切って示性式Fiを分割することにしてもよい。ここで、示性式Fiの一部を括弧で表現する場合は、炭素の骨格構造が枝分かれしていること(側鎖)を表している。
このため、分割部403は、示性式Fiに含まれる炭素「C」のうち括弧で囲まれた部分に含まれる炭素「C」を除く残余の炭素「C」の直前で区切って示性式Fiを分割することにしてもよい。これにより、化合物の示性式Fiが側鎖を表している場合にも対応することができる。なお、示性式Fiの分割例については、図7を用いて後述する。
以下の説明では、示性式Fiを炭素「C」の直前で区切って分割された複数のブロックを「ブロックB1〜Bm」と表記する場合がある(mは、1以上の自然数)。また、ブロックB1〜Bmのうちの任意のブロックを「ブロックBj」と表記する場合がある(j=1,2,…,m)。ただし、示性式Fiにおける左側のブロックから順に、「j」が昇順となるようにブロックID「Bj」が付与される。
なお、ここでは、対象化合物の示性式Fiについても分割対象としたが、例えば、対象化合物の特徴的な部分構造をユーザが理解している場合などには、対象化合物の示性式Fiを分割対象から除外することにしてもよい。
特定部404は、示性式Fiから分割されたブロックBjについて、ブロックBjのうち有機化合物の基本構造となる部分を除く残余の部分を特定することにより、基本構造に結合する部分構造を表す元素または原子団を特定する機能を有する。
具体的には、例えば、特定部404は、ブロックBjのうち有機化合物の基本構造となる部分「CHx」を除く残余の部分を特定する(x=0,1,2,…)。そして、特定部404は、特定した残余の部分を、基本構造に結合する部分構造を表す元素または原子団として特定する。なお、部分構造の特定例については、図8を用いて後述する。
比較部405は、示性式Fiから分割されたブロックBjに対応する元素または原子団と、示性式Fk(k=1,2,…,n、k≠j)から分割されたブロックBjに対応する元素または原子団とを比較する機能を有する。すなわち、比較部405は、同一の炭素番号(j番目)の炭素「C」に結合している部分構造を化合物同士で比較する。なお、部分構造の比較例については、図8を用いて後述する。
出力部406は、示性式Fiから分割されたブロックBjについて、特定された部分構造を表す元素または原子団を、示性式FiにおけるブロックBjの位置と対応付けて出力する機能を有する。具体的には、例えば、出力部406は、各化合物のj番目の炭素「C」に結合している部分構造を表す情報を出力することにしてもよい。
また、出力部406は、比較された比較結果を出力する機能を有する。具体的には、例えば、出力部406は、対象化合物のj番目の炭素「C」に結合している部分構造と、他の化合物のj番目の炭素「C」に結合している部分構造とが一致するか否かを示す比較結果を出力することにしてもよい。
出力部406の出力形式としては、例えば、RAM203、磁気ディスク205などの記憶装置への記憶、ディスプレイ207への表示、プリンタ(不図示)への印刷出力、I/F206による他のコンピュータへの送信がある。なお、比較結果の出力例については、図9を用いて後述する。
(示性式Fiの生成)
なお、上述した説明では、化学式DB300から化合物の示性式Fiを検索することにしたが、これに限らない。具体的には、例えば、情報提供装置101は、後述する図6に示す部分示性式DB600を参照することにより、化合物の示性式Fiを生成することにしてもよい。
ここで、部分示性式DB600の作成手順例について説明する。まず、情報提供装置101は、ある化合物名とその示性式の組を生成元とし、化学反応のルールを適用することで、新たに化合物名とその示性式の組を生成する。
以下の説明では、化学反応のルールが適用された適用後の示性式を「部分示性式」と表記し、化学反応のルールが適用された適用後の化合物名を「部分名」と表記する場合がある。なお、部分示性式の生成例については、図5を用いて後述する。
また、情報提供装置101は、新たに生成された化合物名とその部分示性式の組についても、同様に化学反応のルールを適用することで、再帰的に新たに化合物名とその部分示性式の組を生成する。そして、情報提供装置101は、生成した化合物名とその部分示性式の組をデータベース化することにより、部分示性式DB600を作成する。
図5は、部分示性式の生成例を示す説明図である。図5中、「≒」は化合物名と示性式(部分示性式)との対応関係を示している。図5では、一例として、化合物名「プロパン」および示性式「CH3CH2CH3」を生成元とする。
図5において、(5−1)では、化合物名「プロパン」および示性式「CH3CH2CH3」に対し、『炭化水素CHの結合の場合に化学反応として水素が外される』というルールが適用されている。プロパンの示性式「CH3CH2CH3」には、水素Hが3箇所(計8個)存在し、いずれの箇所にもルール適用可能であるが、ここでは説明の便宜上、末尾の「CH3」から水素Hが1つ外されたこととする。これにより、化合物名「プロパン」、部分示性式「CH3CH2CH2」が得られる。
(5−2)では、(5−1)で得られた部分名「プロパン」および部分示性式「CH3CH2CH2」に対し、『水素Hが「OH」に置換され、部分名の語尾に「ノール」が追加される』というルールが適用されている。部分示性式「CH3CH2CH2」には、水素Hが3箇所(計7個)存在するが、ここでは、中央の「CH2」の水素HがOHに置換されたこととする。これにより、部分示性式「CH3CHOHCH2」が得られる。また、部分名「プロパン」の語尾には「ノール」が追加されるが、語尾追加の場合は、語幹「プロパ」に語尾「ノール」が追加され、部分名「プロパノール」が得られる。
(5−3)では、(5−1)で得られた部分名「プロパン」および部分示性式「CH3CH2CH2」に対し、『水素Hがフッ素「F」に置換され、部分名の語頭に「フルオロ」が追加される』というルールが適用されている。部分示性式「CH3CH2CH2」には、水素Hが3箇所(計7個)存在するが、ここでは、先頭の「CH3」の水素Hがフッ素Fに置換されたこととする。これにより、部分示性式「CH2FCH2CH2」が得られる。また、部分名「プロパン」の語頭には「フルオロ」が追加され、部分名「フルオロプロパン」が得られる。
(5−4)では、(5−2)で得られた部分名「プロパノール」および部分示性式「CH3CHOHCH2」に対し、『水素Hが塩素Clに置換され、部分名の語頭に「クロロ」が追加される』というルールが適用されている。部分示性式「CH3CHOHCH2」には、水素Hが4箇所(計7個)存在するが、ここでは、先頭の「CH3」の水素Hが塩素Clに置換されたこととする。これにより、部分示性式「CH2ClCHOHCH2」が得られる。また、部分名「プロパノール」の語頭には「クロロ」が追加され、部分名「クロロプロパノール」が得られる。
(5−5)では、(5−2)で得られた部分名「プロパノール」および部分示性式「CH3CHOHCH2」に対し、『水素Hがフッ素Fに置換され、部分名の語頭に「フルオロ」が追加される』というルールが適用されている。当該ルールは、上記(5−3)で適用されているが、同一ルールを複数回適用してもよい。部分示性式「CH3CHOHCH2」には、水素Hが4箇所(計7個)存在するが、ここでは、先頭の「CH3」の水素Hがフッ素Fに置換されたこととする。これにより、部分示性式「CH2FCHOHCH2」が得られる。また、部分名「プロパノール」の語頭には「フルオロ」が追加され、部分名「フルオロプロパノール」が得られる。
(5−6)では、(5−5)で得られた部分名「フルオロプロパノール」および部分示性式「CH2FCHOHCH2」に対し、『水素Hがフッ素Fに置換され、部分名の語頭に「フルオロ」が追加される』というルールが適用されている。この場合、先頭の「CH2」の水素Hがフッ素Fに置換されると、生成後の部分名および部分示性式が、生成済みの部分名「クロロフルオロプロパノール」の部分示性式「CHClFCHOHCH2」と一致することになる。このような場合は、生成処理が停止される。
図6は、部分示性式DB600の記憶内容の一例を示す説明図である。図6において、部分示性式DB600は、部分名および部分示性式のフィールドを有し、各フィールドの情報を設定することにより、部分示性式情報(例えば、部分示性式情報600−1,600−2)をレコードとして記憶する。
ここで、部分名は、化学反応のルールが適用された適用後の化合物名である。部分示性式は、化学反応のルールが適用された適用後の示性式である。例えば、部分示性式DB600の初期状態は空であり、部分名およびその部分示性式の組が生成される都度、レコードに追加される。
以下、部分示性式DB600を参照して、化合物の化合物名からその示性式Fiを生成する生成手順例について説明する。なお、化合物の化合物名は、特許文献データベースや学術論文データベースから抽出されることにしてもよく、また、ユーザの操作入力により任意に指定されることにしてもよい。
ここでは、一例として、特許文献データベースや学術論文データベース等から抽出された化合物名を「メトキシプロパノール」とする。この場合、情報提供装置101は、部分示性式DB600を検索して、部分示性式DB600内の部分名が化合物名「メトキシプロパノール」の先頭から最長一致する部分名を抽出する。ここで、部分名「メトキシ」が抽出されたとする。
つぎに、情報提供装置101は、化合物名「メトキシプロパノール」から、抽出した部分名「メトキシ」を除いた残余の文字列「プロパノール」について、同様に、部分示性式DB600を検索する。その結果、部分名「プロパノール」が最長一致検索された場合、情報提供装置101は、残余の文字列「プロパノール」から部分名「プロパノール」を抽出する。その結果、残余の文字列がなくなるため、情報提供装置101による分割は、分割成功となる。これにより、情報提供装置101は、化合物名「メトキシプロパノール」を、部分名「メトキシ」と部分名「プロパノール」に分割することができる。
つぎに、情報提供装置101は、分割で得られた部分名「メトキシ」の部分示性式「CH3O」を部分示性式DB600から検索する。また、情報提供装置101は、分割で得られた「プロパノール」の部分示性式「CH3CHOHCH2」を部分示性式DB600から検索する。
そして、情報提供装置101は、部分示性式DB600から検索した部分名「メトキシ」の部分示性式「CH3O」と、部分示性式DB600から検索した「プロパノール」の部分示性式「CH3CHOHCH2」とを連結する。連結の順序は、部分名の順序となる。したがって、部分名「メトキシ」の部分示性式「CH3O」が先頭となり、「プロパノール」の部分示性式「CH3CHOHCH2」が末尾となる。これにより、化合物名「メトキシプロパノール」の示性式「CH3OCH3CHOHCH2」を生成することができる。
このように、情報提供装置101によれば、部分示性式DB600を参照して、目的とする化合物名の示性式(示性式候補)を自動生成することができる。また、情報提供装置101によれば、特許文献データベースや学術論文データベース等から抽出された各々の化合物名について示性式を生成することにより、図3に示した化学式DB300に相当するデータベースを作成することができる。
また、情報提供装置101は、化学式DB300から目的とする化合物の示性式Fiが検索されなかった場合に、部分示性式DB600を参照して、目的とする化合物の示性式Fiを生成することにしてもよい。なお、化合物の分子式は、化合物の示性式から生成することができる。例えば、情報提供装置101は、化合物「メトキシプロパノール」の示性式「CH3OCH3CHOHCH2」を変換することにより、化合物「メトキシプロパノール」の分子式「C4H9O2」を生成することができる。
(示性式Fiの分割例)
つぎに、図7を用いて、示性式Fiの分割例について説明する。ここでは、対象化合物の化合物名として「1−エトキシ−2−プロパノール」が取得された場合を想定する。
図7は、検索結果テーブル700の記憶内容の一例を示す説明図である。図7において、検索結果テーブル700は、化合物名、示性式ID、示性式および分割示性式のフィールドを有し、各フィールドに情報を設定することにより、検索結果700−1〜700−5をレコードとして記憶する。
ここで、化合物名フィールドには、化学式DB300(図3参照)から検索された示性式Fiの化合物名が設定される。また、示性式IDフィールドには、示性式Fiを識別する示性式IDが設定される。示性式IDは、本明細書において説明上用いる示性式Fiの識別子である。また、示性式フィールドには、化学式DB300から検索された示性式Fiが設定される。また、分割示性式フィールドには、示性式Fiから分割されたブロックBjが設定される。
図7に示す(7−1)において、化学式DB300から対象化合物の化合物名に対応する示性式が検索された結果、検索結果700−1がレコードとして記憶されている。なお、この時点では、分割示性式フィールドは空である。また、化学式DB300から対象化合物の異性体となる化合物の示性式が検索された結果、検索結果700−2,700−4,700−5がレコードとして記憶されている。また、化学式DB300から対象化合物と同じ物質であって化合物名が異なる化合物の示性式が検索された結果、検索結果700−3がレコードとして記憶されている。
図7に示す(7−2)において、各示性式Fiから分割されたブロックB1〜Bmが分割示性式フィールドに設定されている。ここで、化合物「1−メトキシ−2−メチル−2−プロパノール」の示性式「CH3OCH2C(CH3)(OH)CH3」を例に挙げて、示性式Fiの分割例について説明する。
この示性式「CH3OCH2C(CH3)(OH)CH3」は、一部が括弧で表現されている示性式である。このため、分割部403は、示性式「CH3OCH2C(CH3)(OH)CH3」に含まれる炭素「C」のうち括弧で囲まれた部分に含まれる炭素「C」を除く残余の炭素「C」の直前で区切って示性式「CH3OCH2C(CH3)(OH)CH3」を分割する。この場合、分割後の示性式は、『CH3O|CH2|C(CH3)(OH)|CH3』となる。
(部分構造の特定例)
つぎに、図8を用いて、部分構造の特定例について説明する。ここでは、図7に示した検索結果テーブル700の記憶内容に基づく部分構造の特定例について説明する。
図8は、部分構造テーブル800の記憶内容の一例を示す説明図である。図8において、部分構造テーブル800は、化合物名、部分構造およびフラグのフィールドを有する。各フィールドに情報を設定することにより、部分構造情報800−1〜800−5がレコードとして記憶される。
ここで、化合物名フィールドには、化学式DB300(図3参照)から検索された示性式Fiの化合物名が設定される。また、部分構造フィールドには、示性式FiのブロックBjから特定された部分構造が設定される。部分構造フィールドの1番目、2番目、…、5番目の数字は、ブロックBjの「j」に対応している。また、フラグフィールドには、化合物名が対象化合物の化合物名の場合に「1」が設定される。フラグフィールドは、初期状態では「0」である。
図8に示す(8−1)において、部分構造テーブル800の化合物名フィールドに、図7に示した検索結果テーブル700に記憶された化合物名が設定された結果、部分構造情報800−1〜800−5がレコードとして記憶されている。また、対象化合物の化合物名「1−エトキシ−2−プロパノール」が設定された部分構造情報800−1のフラグフィールドに「1」が設定されている。なお、この時点では、部分構造フィールドは空である。
図8に示す(8−2)において、各部分構造情報800−1〜800−5の部分構造フィールドに、各化合物名に対応する示性式Fiから分割された各ブロックBjから特定された部分構造を表す元素または原子団が設定されている。
<1−エトキシ−2−プロパノール>
ここで、化合物名「1−エトキシ−2−プロパノール」を例に挙げると、示性式は「CH3CH2OCH2CH(OH)CH3」であり、ブロックB1は「CH3」である(図7参照)。このため、特定部404は、ブロックB1「CH3」のうち有機化合物の基本構造となる部分「CH3」を除く残余の部分を特定する。この場合、残余の部分は存在しない。このため、特定部404は、ブロックB1について基本構造に結合する部分構造は存在しないと判断する。
また、ブロックB2は「CH2O」である。このため、特定部404は、ブロックB2「CH2O」のうち有機化合物の基本構造となる部分「CH2」を除く残余の部分「O」を特定することにより、基本構造に結合する部分構造を表す元素「O」を特定する。
また、ブロックB3は「CH2」である。このため、特定部404は、ブロックB3「CH2」のうち有機化合物の基本構造となる部分「CH2」を除く残余の部分を特定する。この場合、残余の部分は存在しない。このため、特定部404は、ブロックB3について基本構造に結合する部分構造は存在しないと判断する。
また、ブロックB4は「CH(OH)」である。このため、特定部404は、ブロックB4「CH(OH)」のうち有機化合物の基本構造となる部分「CH」を除く残余の部分「OH」を特定することにより、基本構造に結合する部分構造を表す原子団「OH」を特定する。
また、ブロックB5は「CH3」である。このため、特定部404は、ブロックB5「CH3」のうち有機化合物の基本構造となる部分「CH3」を除く残余の部分を特定する。この場合、残余の部分は存在しない。このため、特定部404は、ブロックB5について基本構造に結合する部分構造は存在しないと判断する。
<1−メトキシ−2−メチル−2−プロパノール>
つぎに、化合物名「1−メトキシ−2−メチル−2−プロパノール」を例に挙げると、示性式は「CH3OCH2C(CH3)(OH)CH3」であり、ブロックB1は「CH3O」である(図7参照)。このため、特定部404は、ブロックB1「CH3O」のうち有機化合物の基本構造となる部分「CH3」を除く残余の部分「O」を特定することにより、基本構造に結合する部分構造を表す元素「O」を特定する。
また、ブロックB2は「CH2」である。このため、特定部404は、ブロックB2「CH2」のうち有機化合物の基本構造となる部分「CH2」を除く残余の部分を特定する。この場合、残余の部分は存在しない。このため、特定部404は、ブロックB2について基本構造に結合する部分構造は存在しないと判断する。
また、ブロックB3は「C(CH3)(OH)」である。このため、特定部404は、ブロックB3「C(CH3)(OH)」のうち有機化合物の基本構造となる部分「C」を除く残余の部分「(CH3)(OH)」を特定することにより、基本構造に結合する部分構造を表す原子団「CH3」および原子団「OH」を特定する。なお、残余の部分に括弧で囲まれた複数の部分が存在する場合は、括弧で囲まれた部分を別々の原子団として特定する。
また、ブロックB4は「CH3」である。このため、特定部404は、ブロックB4「CH3」のうち有機化合物の基本構造となる部分「CH3」を除く残余の部分を特定する。この場合、残余の部分は存在しない。このため、特定部404は、ブロックB4について基本構造に結合する部分構造は存在しないと判断する。
なお、情報提供装置101は、部分示性式DB600を参照して対象化合物の示性式Fiを生成した場合は、示性式Fiと対応付けて、示性式Fiを形成する部分示性式と部分名との対応を保持することにしてもよい。
例えば、対象化合物「1−エトキシ−2−プロパノール」の示性式「CH3CH2OCH2CH(OH)CH3」が、部分名「エトキシ」の部分示性式「CH3CH2O」と部分名「プロパノール」の部分示性式「CH2CH(OH)CH3」とを連結して生成された場合を想定する。この場合、情報提供装置101は、例えば、示性式「CH3CH2OCH2CH(OH)CH3」を形成する部分示性式「CH3CH2O」と部分名「エトキシ」との対応、および部分示性式「CH2CH(OH)CH3」と部分名「プロパノール」との対応を保持することにしてもよい。
これにより、情報提供装置101は、対象化合物「1−エトキシ−2−プロパノール」の示性式から分割された各ブロックBjが「1−エトキシ」または「2−プロパノール」のいずれに対応しているのかを判別することができる。
(部分構造の比較例)
つぎに、図8を用いて、部分構造の比較例について説明する。まず、比較部405は、部分構造テーブル800(図8参照)のフラグフィールドを参照して、対象化合物の化合物名を特定する。具体的には、例えば、比較部405は、フラグフィールドに「1」が設定されている化合物名「1−エトキシ−2−プロパノール」を特定する。
つぎに、比較部405は、対象化合物「1−エトキシ−2−プロパノール」の1番目の部分構造と、他の化合物の1番目の部分構造とを比較する。以下、対象化合物の比較対象となる他の化合物(以下、「比較対象化合物」という)として、「1−エトキシ−3−プロパノール」を例に挙げて説明する。
ここで、対象化合物「1−エトキシ−2−プロパノール」の1番目の部分構造は存在しない。同様に、比較対象化合物「1−エトキシ−3−プロパノール」の1番目の部分構造は存在しない。このため、対象化合物「1−エトキシ−2−プロパノール」の1番目の部分構造と、比較対象化合物「1−エトキシ−3−プロパノール」の1番目の部分構造とが一致すると判定する。
つぎに、対象化合物「1−エトキシ−2−プロパノール」の2番目の部分構造は元素「O」である。同様に、比較対象化合物「1−エトキシ−3−プロパノール」の2番目の部分構造は元素「O」である。このため、対象化合物「1−エトキシ−2−プロパノール」の2番目の部分構造と、比較対象化合物「1−エトキシ−3−プロパノール」の2番目の部分構造とが一致すると判定する。
つぎに、対象化合物「1−エトキシ−2−プロパノール」の3番目の部分構造は存在しない。同様に、比較対象化合物「1−エトキシ−3−プロパノール」の3番目の部分構造は存在しない。このため、対象化合物「1−エトキシ−2−プロパノール」の3番目の部分構造と、比較対象化合物「1−エトキシ−3−プロパノール」の3番目の部分構造とが一致すると判定する。
つぎに、対象化合物「1−エトキシ−2−プロパノール」の4番目の部分構造は原子団「OH」である。一方、比較対象化合物「1−エトキシ−3−プロパノール」の4番目の部分構造は存在しない。このため、対象化合物「1−エトキシ−2−プロパノール」の4番目の部分構造と、比較対象化合物「1−エトキシ−3−プロパノール」の4番目の部分構造とが一致しないと判定する。この際、比較部405は、比較対象化合物「1−エトキシ−3−プロパノール」は、原子団「OH」の結合位置(場所)が対象化合物「1−エトキシ−2−プロパノール」と異なると判定してもよい。
つぎに、対象化合物「1−エトキシ−2−プロパノール」の5番目の部分構造は存在しない。一方、比較対象化合物「1−エトキシ−3−プロパノール」の5番目の部分構造は原子団「OH」である。このため、対象化合物「1−エトキシ−2−プロパノール」の5番目の部分構造と、比較対象化合物「1−エトキシ−3−プロパノール」の5番目の部分構造とが一致しないと判定する。
(検索条件設定画面の画面例)
つぎに、検索条件設定画面の画面例について説明する。
図9は、検索条件設定画面の画面例を示す説明図である。図9において、検索条件設定画面900は、例えば、特許文献データベースや学術論文データベースから特許文献や学術論文を検索する際にディスプレイ207に表示される画面である。
検索条件設定画面900において、図2に示したキーボード208やマウス209を用いたユーザの操作入力により、ボックス901をクリックすることで、検索条件として設定する対象化合物の化合物名を入力することができる。図9の例では、検索条件として設定する対象化合物の化合物名「1−エトキシ−2−プロパノール」が入力されている。
また、検索条件設定画面900において、ユーザの操作入力により、検索条件候補表示ボタン902をクリックすることで、検索条件候補を表示させることができる。検索条件候補は、対象化合物の異性体となる化合物の化合物名や対象化合物と同一の物質であって化合物名が異なる化合物の化合物名などである。
図9の例では、検索条件候補表示ボタン902のクリックに応じて情報提供装置101の情報提供処理が実行された結果、検索条件候補一覧910が表示されている。具体的には、検索条件候補一覧910には、検索条件候補とともに、検索条件候補の特徴が表示されている。検索条件候補の特徴は、比較部405の比較結果に相当する。
また、検索条件候補一覧910では、「対象化合物と同一の化合物」、「対象化合物と部分構造の位置が異なる化合物」、「対象化合物と部分構造が異なる化合物」の順に検索条件候補がソートされて表示されている。図9の例では、対象化合物と同一の化合物は、「プロピレングリコールモノエチルエーテル」である。また、対象化合物と部分構造の位置が異なる化合物は、「1−エトキシ−3−プロパノール」である。また、対象化合物と部分構造が異なる化合物は、「1−メトキシ−2−メチル−2−プロパノール」および「1−エトキシ−2−メトキシエタン」である。
検索条件候補一覧910によれば、ユーザは、対象化合物と、検索条件候補として提示された他の化合物との化学的な性質の違いを判断することができる。なお、検索条件候補一覧910に表示する検索条件候補数は任意に設定可能である。
また、検索条件設定画面900において、ユーザの操作入力により、検索条件候補ボタン903〜906をクリックすることで、検索条件に追加する検索条件候補を選択することができる。図9の例では、検索条件候補ボタン903,904がクリックされた結果、化合物名「プロピレングリコールモノエチルエーテル」および「1−エトキシ−3−プロパノール」が検索条件に追加されている。
また、検索条件設定画面900において、ユーザの操作入力により、検索ボタン907をクリックすることで、特許文献データベースや学術論文データベースから検索条件に適合する特許文献や学術論文を検索することができる。
図9の例では、情報提供装置101は、例えば、特許文献データベースや学術論文データベースにアクセスして、化合物名「1−エトキシ−2−プロパノール」、「プロピレングリコールモノエチルエーテル」および「1−エトキシ−3−プロパノール」のうちのいずれかの化合物名に適合する特許文献や学術論文を検索することになる。
(情報提供装置101の情報提供処理手順)
つぎに、情報提供装置101の情報提供処理手順について説明する。
図10は、情報提供装置101の情報提供処理手順の一例を示すフローチャートである。図10のフローチャートにおいて、まず、情報提供装置101は、対象化合物の化合物名を取得したか否かを判断する(ステップS1001)。ここで、情報提供装置101は、対象化合物の化合物名を取得するのを待つ(ステップS1001:No)。
そして、情報提供装置101は、対象化合物の化合物名を取得した場合(ステップS1001:Yes)、化学式DB300から、取得した対象化合物の化合物名に対応する示性式および分子式を検索する(ステップS1002)。つぎに、情報提供装置101は、化学式DB300から、対象化合物と分子式が同一かつ対象化合物と示性式が異なる化合物の示性式を検索する(ステップS1003)。
つぎに、情報提供装置101は、化学式DB300から、対象化合物と示性式が同一かつ対象化合物と化合物名が異なる化合物の示性式を検索する(ステップS1004)。なお、検索された検索結果は、例えば、検索結果テーブル700に記憶される。
そして、情報提供装置101は、検索結果テーブル700を参照して、部分構造特定処理を実行する(ステップS1005)。なお、部分構造特定処理の具体的な処理手順については、図11を用いて後述する。
つぎに、情報提供装置101は、部分構造テーブル800を参照して、部分構造比較処理を実行する(ステップS1006)。なお、部分構造比較処理の具体的な処理手順については、図12を用いて後述する。
つぎに、情報提供装置101は、部分構造比較処理の処理結果に基づいて、検索条件設定画面を作成する(ステップS1007)。検索条件設定画面は、例えば、図9に示した検索条件設定画面900である。そして、情報提供装置101は、作成した検索条件設定画面を出力し(ステップS1008)、本フローチャートによる一連の処理を終了する。
これにより、特許文献データベース等から特許文献等の電子文書を検索する際に、ある化合物と性質が似ている、あるいは、性質が大きく異なる異性体をユーザに選別し易くさせることができる。
つぎに、図10に示したステップS1005の部分構造特定処理の具体的な処理手順について説明する。
図11は、部分構造特定処理の具体的処理手順の一例を示すフローチャートである。図11のフローチャートにおいて、まず、情報提供装置101は、示性式Fiの「i」を「i=1」として(ステップS1101)、検索結果テーブル700を参照して、示性式F1〜Fnから示性式Fiを選択する(ステップS1102)。
つぎに、情報提供装置101は、選択した示性式Fiを炭素「C」の直前で区切ってブロックB1〜Bmに分割する(ステップS1103)。そして、情報提供装置101は、ブロックBjの「j」を「j=1」として(ステップS1104)、示性式FiのブロックB1〜BmからブロックBjを選択する(ステップS1105)。
つぎに、情報提供装置101は、選択したブロックBjが基本形「CHx」と一致するか否かを判断する(ステップS1106)。ここで、ブロックBjが基本形「CHx」と一致する場合(ステップS1106:Yes)、情報提供装置101は、ステップS1109に移行する。
一方、ブロックBjが基本形「CHx」と不一致の場合(ステップS1106:No)、情報提供装置101は、ブロックBjのうち基本形「CHx」を除く残余の部分を特定することにより、基本構造に結合する部分構造を表す元素または原子団を特定する(ステップS1107)。
そして、情報提供装置101は、特定した部分構造を表す元素または原子団を炭素番号と対応付けて部分構造テーブル800に登録する(ステップS1108)。なお、炭素番号は、ブロックBjの「j」に相当する。つぎに、情報提供装置101は、ブロックBjの「j」をインクリメントして(ステップS1109)、「j」が「m」より大きくなったか否かを判断する(ステップS1110)。
ここで、「j」が「m」以下の場合(ステップS1110:No)、情報提供装置101は、ステップS1105に戻る。一方、「j」が「m」より大きくなった場合(ステップS1110:Yes)、情報提供装置101は、示性式Fiの「i」をインクリメントして(ステップS1111)、「i」が「n」より大きくなったか否かを判断する(ステップS1112)。
ここで、「i」が「n」以下の場合(ステップS1112:No)、情報提供装置101は、ステップS1102に戻る。一方、「i」が「n」より大きくなった場合(ステップS1112:Yes)、情報提供装置101は、本フローチャートによる一連の処理を終了して、部分構造特定処理を呼び出したステップへ戻る。
これにより、化合物の示性式Fiから分割されたブロックBjについて、基本構造に結合する部分構造を表す元素または原子団を特定することができる。
つぎに、図10に示したステップS1006の部分構造比較処理の具体的な処理手順について説明する。
図12は、部分構造比較処理の具体的処理手順の一例を示すフローチャートである。図12のフローチャートにおいて、まず、情報提供装置101は、部分構造テーブル800のフラグフィールドを参照して、対象化合物を特定する(ステップS1201)。
そして、情報提供装置101は、対象化合物の炭素番号jの「j」を「j=1」として(ステップS1202)、対象化合物のj番目の部分構造と、他の化合物のj番目の部分構造とを比較する(ステップS1203)。つぎに、情報提供装置101は、対象化合物の炭素番号jの「j」をインクリメントして(ステップS1204)、「j」が「m」より大きくなったか否かを判断する(ステップS1205)。
ここで、「j」が「m」以下の場合(ステップS1205:No)、情報提供装置101は、ステップS1203に戻る。一方、「j」が「m」より大きくなった場合(ステップS1205:Yes)、情報提供装置101は、本フローチャートによる一連の処理を終了して、部分構造比較処理を呼び出したステップへ戻る。
これにより、同一の炭素番号(j番目)の炭素「C」に結合している部分構造を化合物同士で比較することができる。
以上説明したように、実施の形態にかかる情報提供装置101によれば、化合物の示性式Fiを炭素「C」の直前で区切って分割し、分割したブロックBjについて、基本構造に結合する部分構造を表す元素または原子団を特定することができる。これにより、化合物の特徴的な性質を判断し易くさせることができる。
また、情報提供装置101によれば、示性式Fiから分割されたブロックBjに対応する元素または原子団と、示性式Fkから分割されたブロックBjに対応する元素または原子団とを比較して、比較した比較結果を出力することができる。これにより、化合物同士の化学的な性質の違いを判断し易くさせることができる。
また、情報提供装置101によれば、示性式Fiに含まれる炭素「C」のうち括弧で囲まれた部分に含まれる炭素「C」を除く残余の炭素「C」の直前で区切って示性式Fiを分割することができる。これにより、化合物の示性式Fiの一部が括弧で表現されている場合にも対応することができる。
これらのことから、情報提供装置101によれば、特許文献データベース等から、特許文献等の電子文書を検索する際に、ユーザが、ある化合物と性質が似ている、あるいは、性質が大きく異なる異性体を選別し易くなり、検索作業の効率化を図ることができる。
なお、本実施の形態で説明した情報提供方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本情報提供プログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本情報提供プログラムは、インターネット等のネットワークを介して配布してもよい。
上述した実施の形態に関し、さらに以下の付記を開示する。
(付記1)コンピュータが、
化合物の示性式を前記化合物の骨格を形成する特定の元素の直前で区切って分割し、
前記示性式から分割した各々のブロックについて、前記ブロックのうち前記化合物の基本構造となる部分を除く残余の部分を特定することにより、前記基本構造に結合する部分構造を表す元素または原子団を特定し、
特定した前記部分構造を表す元素または原子団を、前記示性式における前記ブロックの位置と対応付けて出力する、
処理を実行することを特徴とする情報提供方法。
(付記2)前記コンピュータが、
前記化合物の異性体の示性式を前記特定の元素の直前で区切って分割し、
前記異性体の示性式から分割した各々のブロックについて、前記部分構造を表す元素または原子団を特定し、
特定した前記部分構造を表す元素または原子団を、前記異性体の示性式における前記ブロックの位置と対応付けて出力することを特徴とする付記1に記載の情報提供方法。
(付記3)前記コンピュータが、
前記化合物の示性式から分割した第1ブロックに対応する元素または原子団と、前記異性体の示性式から分割したブロックのうち前記異性体の示性式における位置が前記化合物の示性式における前記第1ブロックと同一の第2ブロックに対応する元素または原子団とを比較し、
比較した比較結果を出力することを特徴とする付記1または2に記載の情報提供方法。
(付記4)前記化合物または前記異性体の示性式を分割する処理は、
前記示性式の一部が括弧で表現されている場合、前記示性式に含まれる前記特定の元素のうち当該括弧に含まれる特定の元素を除く残余の特定の元素の直前で区切って前記示性式を分割することを特徴とする付記1〜3のいずれか一つに記載の情報提供方法。
(付記5)化合物の示性式と分子式とを対応付けて記憶するデータベースから、前記化合物と分子式が同一かつ前記化合物と示性式が異なる化合物の示性式を抽出することにより、前記異性体の示性式を取得する処理を実行し、
前記異性体の示性式を分割する処理は、
取得した前記異性体の示性式を前記特定の元素の直前で区切って分割することを特徴とする付記2〜4のいずれか一つに記載の情報提供方法。
(付記6)化合物の示性式を前記化合物の骨格を形成する特定の元素の直前で区切って分割する分割部と、
前記分割部によって前記示性式から分割された各々のブロックについて、前記ブロックのうち前記化合物の基本構造となる部分を除く残余の部分を特定することにより、前記基本構造に結合する部分構造を表す元素または原子団を特定する特定部と、
前記特定部によって特定された前記部分構造を表す元素または原子団を、前記示性式における前記ブロックの位置と対応付けて出力する出力部と、
を有することを特徴とする情報提供装置。
(付記7)コンピュータに、
化合物の示性式を前記化合物の骨格を形成する特定の元素の直前で区切って分割し、
前記示性式から分割した各々のブロックについて、前記ブロックのうち前記化合物の基本構造となる部分を除く残余の部分を特定することにより、前記基本構造に結合する部分構造を表す元素または原子団を特定し、
特定した前記部分構造を表す元素または原子団を、前記示性式における前記ブロックの位置と対応付けて出力する、
処理を実行させることを特徴とする情報提供プログラム。
(付記8)コンピュータに、
化合物の示性式を前記化合物の骨格を形成する特定の元素の直前で区切って分割し、
前記示性式から分割した各々のブロックについて、前記ブロックのうち前記化合物の基本構造となる部分を除く残余の部分を特定することにより、前記基本構造に結合する部分構造を表す元素または原子団を特定し、
特定した前記部分構造を表す元素または原子団を、前記示性式における前記ブロックの位置と対応付けて出力する、
処理を実行させる情報提供プログラムを記録したことを特徴とする前記コンピュータに読み取り可能な記録媒体。
101 情報提供装置
300 化学式DB
401 取得部
402 検索部
403 分割部
404 特定部
405 比較部
406 出力部

Claims (6)

  1. コンピュータが、
    化合物の示性式を前記化合物の骨格を形成する特定の元素の直前で区切って分割し、
    前記示性式から分割した各々のブロックについて、前記ブロックのうち前記化合物の基本構造となる部分を除く残余の部分を特定することにより、前記基本構造に結合する部分構造を表す元素または原子団を特定し、
    特定した前記部分構造を表す元素または原子団を、前記示性式における前記ブロックの位置と対応付けて出力する、
    処理を実行することを特徴とする情報提供方法。
  2. 前記コンピュータが、
    前記化合物の異性体の示性式を前記特定の元素の直前で区切って分割し、
    前記異性体の示性式から分割した各々のブロックについて、前記部分構造を表す元素または原子団を特定し、
    特定した前記部分構造を表す元素または原子団を、前記異性体の示性式における前記ブロックの位置と対応付けて出力することを特徴とする請求項1に記載の情報提供方法。
  3. 前記コンピュータが、
    前記化合物の示性式から分割した第1ブロックに対応する元素または原子団と、前記異性体の示性式から分割したブロックのうち前記異性体の示性式における位置が前記化合物の示性式における前記第1ブロックと同一の第2ブロックに対応する元素または原子団とを比較し、
    比較した比較結果を出力することを特徴とする請求項1または2に記載の情報提供方法。
  4. 前記化合物または前記異性体の示性式を分割する処理は、
    前記示性式の一部が括弧で表現されている場合、前記示性式に含まれる前記特定の元素のうち当該括弧に含まれる特定の元素を除く残余の特定の元素の直前で区切って前記示性式を分割することを特徴とする請求項1〜3のいずれか一つに記載の情報提供方法。
  5. 化合物の示性式を前記化合物の骨格を形成する特定の元素の直前で区切って分割する分割部と、
    前記分割部によって前記示性式から分割された各々のブロックについて、前記ブロックのうち前記化合物の基本構造となる部分を除く残余の部分を特定することにより、前記基本構造に結合する部分構造を表す元素または原子団を特定する特定部と、
    前記特定部によって特定された前記部分構造を表す元素または原子団を、前記示性式における前記ブロックの位置と対応付けて出力する出力部と、
    を有することを特徴とする情報提供装置。
  6. コンピュータに、
    化合物の示性式を前記化合物の骨格を形成する特定の元素の直前で区切って分割し、
    前記示性式から分割した各々のブロックについて、前記ブロックのうち前記化合物の基本構造となる部分を除く残余の部分を特定することにより、前記基本構造に結合する部分構造を表す元素または原子団を特定し、
    特定した前記部分構造を表す元素または原子団を、前記示性式における前記ブロックの位置と対応付けて出力する、
    処理を実行させることを特徴とする情報提供プログラム。
JP2012244242A 2012-11-06 2012-11-06 情報提供方法、情報提供装置および情報提供プログラム Active JP5974838B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012244242A JP5974838B2 (ja) 2012-11-06 2012-11-06 情報提供方法、情報提供装置および情報提供プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012244242A JP5974838B2 (ja) 2012-11-06 2012-11-06 情報提供方法、情報提供装置および情報提供プログラム

Publications (2)

Publication Number Publication Date
JP2014091724A JP2014091724A (ja) 2014-05-19
JP5974838B2 true JP5974838B2 (ja) 2016-08-23

Family

ID=50936066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012244242A Active JP5974838B2 (ja) 2012-11-06 2012-11-06 情報提供方法、情報提供装置および情報提供プログラム

Country Status (1)

Country Link
JP (1) JP5974838B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018158916A1 (ja) * 2017-03-02 2018-09-07 富士通株式会社 化合物の原料物質の探索方法、及び探索装置、並びにプログラム
JP7081396B2 (ja) * 2018-08-30 2022-06-07 富士通株式会社 生成方法、生成プログラム、および生成装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0498464A (ja) * 1990-08-10 1992-03-31 Fujitsu Ltd 化学構造のデータ表現方式
JPH05266163A (ja) * 1992-03-19 1993-10-15 Hitachi Ltd 図形処理装置

Also Published As

Publication number Publication date
JP2014091724A (ja) 2014-05-19

Similar Documents

Publication Publication Date Title
WO2013140636A1 (ja) 検索装置、検索方法およびプログラム
JP2009521026A (ja) 探索および置換入力の派生を活用する探索および置換機能でテキストを編集するための方法およびシステム
JP2005141768A (ja) ネットワーク構造によるファイル管理システム
JP2007156965A (ja) 文書処理方法、プログラム及びシステム
JP2008090403A (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP7081396B2 (ja) 生成方法、生成プログラム、および生成装置
JP5741387B2 (ja) 情報提供装置、情報提供プログラムおよび情報提供方法
JP6996091B2 (ja) 生成プログラム、生成方法、および生成装置
JP5974838B2 (ja) 情報提供方法、情報提供装置および情報提供プログラム
JP2020035115A (ja) 検索システム、検索方法、及び検索プログラム
JP5741386B2 (ja) 生成装置、生成方法、および生成プログラム
JP6811087B2 (ja) 検索装置、検索方法、及びプログラム
JP5768669B2 (ja) 生成装置、生成方法、および生成プログラム
JP5408623B2 (ja) 検索式提供方法、プログラム、及び、検索式提供システム
JP6790773B2 (ja) 生成プログラム、生成装置、および生成方法
JP6001173B2 (ja) データ分析装置、rdfデータの拡張方法、およびデータ分析プログラム
JP2004110609A (ja) ファイル管理システム、ファイル管理プログラム、及び記録媒体
JP2008146209A (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP2011257877A (ja) 情報検索装置、情報検索方法、及びプログラム
JP6828578B2 (ja) 生成プログラム、生成方法、および生成装置
JP4607830B2 (ja) 興味情報生成装置、興味情報生成方法および興味情報生成プログラム
JP2014146076A (ja) 文字列抽出方法、文字列抽出装置、および文字列抽出プログラム
JP6589317B2 (ja) 書換装置、処理方法とそのプログラム、および、情報処理装置
JP7416256B2 (ja) 化合物置換プログラム、方法、装置
JP2019008477A (ja) 判別プログラム、判別装置及び判別方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160704

R150 Certificate of patent or registration of utility model

Ref document number: 5974838

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150