以下に図面を参照して、本発明にかかる生成プログラム、生成方法、および生成装置の実施の形態を詳細に説明する。
(実施の形態)
図1は、実施の形態にかかる生成方法の一実施例を示す説明図である。図1において、生成装置100は、化合物の構造の理解を支援するコンピュータである。生成装置100は、例えば、PC(Personal Computer)であってもよく、サーバであってもよい。
ここで、化合物は、2種類以上の元素からなる化学物質である。化合物は、例えば、有機化合物と無機化合物とに分類される。有機化合物は、炭素を含む化合物の総称である。有機化合物は、炭素の連結が骨組みとなり、炭素に水素等が結合するという基本構造を有する。なお、化合物の骨格を形成する炭素以外の元素としては、シリコンや硫黄があり、無機高分子と呼ばれる。また、無機化合物は、炭素を含まない化合物の総称である。ただし、炭素化合物のうち、例えば、炭素の同素体(グラファイト、ダイヤモンドなど)や二酸化炭素は、無機化合物に分類される。以下の説明では、化合物として「有機化合物」を例に挙げて説明する。
化合物の構造を表す化学式としては、例えば、示性式がある。示性式は、化合物の組成や化学構造などを表現する化学式の一例であり、分子内に含まれる原子団(官能基)を明示した化学式である。官能基は、有機化合物のおおよその性質を決める原子団である。示性式以外の化学式としては、例えば、分子式や構造式がある。分子式は、化合物を構成する原子の種類と数を、元素記号を用いて表現した化学式である。構造式は、分子内での原子の結合状態を図示した化学式である。
ここで、化合物の表記方法は様々存在しており、同一の物質であっても、異なる表記が用いられることがある。また、同一の物質以外にも、異性体、上位下位概念など類似する物質が存在することもある。また、化学分野は有機化学、無機化学、高分子化学、生化学などの専門分野に分かれており、化学の技術者であっても専門外の物質は把握しきれていないことが多い。
したがって、化合物の構造の理解を助けるために、化合物の化学式を示すことは有用である。例えば、様々な表記方法のうち、示性式は、分子式に比べて化合物の分子構造を読み取りやすい情報であり、示性式の構造情報から簡易図を作成するための基礎情報にもなる。また、示性式は、コンピュータにも可読なテキスト情報であるため、構造図(構造式)とは異なり、化合物の分析に活用することができる。
化合物の示性式を生成する技術としては、例えば、化合物を物質名から部分構造に分解して、部分構造ごとの部分示性式を特定し、それらの部分示性式を合成することで示性式を生成するものがある。また、示性式と物質名との対応から、既知の部分示性式と部分名を引いていき、残った部分示性式と部分名とを対応付けてデータベースに登録する技術がある。また、既知の示性式に部品化ルールを適用して部品化したものを、部分構造の部分示性式として蓄積する技術がある。
ところが、全ての部分構造についての示性式を登録した辞書を作成することは難しい。例えば、炭素数が多かったり、枝分かれするような構造など、化合物によっては示性式として特許文献や学術論文に記載されないことも多く、情報源である特許文献等から十分な情報を得ることができない。また、化合物の物質名には別称が存在することが多く、全ての別称をカバーした辞書を作成することは困難である。また、新しい物質名が日々出てきており、新しい物質名をカバーした辞書を作成することは困難である。
そこで、本実施の形態では、化合物の構造を表す化学式を物質名から直接得られない場合であっても、化合物の別称や部品化ルールを利用して、化合物の構造を表す化学式を生成する生成方法について説明する。以下、生成装置100の処理例について説明する。
(1)生成装置100は、ルールRを記憶する第1の記憶部110を参照して、対象化合物の物質名を、ルールRに規定された変換内容にしたがって変換する。ここで、対象化合物は、構造を表す化学式の生成対象となる化合物である。構造を表す化学式は、例えば、示性式である。ルールRは、化合物の物質名および化学式について化学反応に応じた変換内容を規定したものである。第1の記憶部110は、例えば、化合物の物質名および化学式の変換内容を規定したルールRと当該ルールRを適用すべき化学反応に関する条件とを対応付けて記憶する。
具体的には、例えば、生成装置100は、第1の記憶部110を参照して、対象化合物の物質名または化学式の少なくともいずれかが、ルールRを適用すべき化学反応に関する条件を満たすか否かを判断する。ここで用いる対象化合物の化学式は、例えば、分子式であり、対象化合物の物質名とともに取得される。そして、生成装置100は、ルールRを適用すべき化学反応に関する条件を満たすと判断した場合に、対象化合物の物質名を、ルールRに規定された変換内容にしたがって変換する。
図1の例では、物質名「tert−ブタン」の対象化合物が、『化学式から水素(H)を1つ引き抜いて、物質名の語尾「タン」を「チル」にする』というルールRを適用すべき化学反応に関する条件を満たす場合を想定する。そして、対象化合物の物質名「tert−ブタン」が、ルールRの変換内容にしたがって「tert−ブチル」に変換された場合を想定する。
(2)生成装置100は、第2の記憶部120を参照して、変換した変換後の物質名に対応する別称を特定する。第2の記憶部120は、化合物の物質名と別称とを対応付けて記憶する。別称は、化合物の別の呼び名である。図1の例では、変換後の物質名「tert−ブチル」に対応する別称「1,1−ジメチルエチル」が特定された場合を想定する。別称「1,1−ジメチルエチル」は、「メチル」や「エチル」といった部分構造の名前を含んでおり、変換後の物質名「tert−ブチル」に比べて解析しやすい物質名である。
(3)生成装置100は、特定した別称に対応する化合物の構造を表す化学式を取得する。化合物の構造を表す化学式は、例えば、示性式である。具体的には、例えば、生成装置100は、化合物の物質名と示性式とを対応付けて記憶するデータベースから、特定した別称に対応する示性式を取得することにしてもよい。
また、例えば、生成装置100は、特定した別称を階層的に解析(階層構造に展開)して部分構造に分解し、部分構造ごとの部分示性式を特定して、それらの部分示性式を合成することで示性式を生成することにしてもよい。なお、化合物の名称を階層構造に展開する技術としては、例えば、特開2013−101510号公報を参照することができる。
図1の例では、別称「1,1−ジメチルエチル」に対応する化学式「CH2CH(CH3)(CH3)」が取得された場合を想定する。
(4)生成装置100は、取得した化学式を、ルールRに規定された変換内容とは逆の変換内容にしたがって変換して、変換結果を出力する。例えば、ルールRに規定された変換内容が『化学式から水素(H)を1つ引き抜いて、物質名の語尾「タン」を「チル」にする』の場合、逆の変換内容は、『化学式に水素(H)を1つ追加して、物質名の語尾「チル」を「タン」にする』である。
図1の例では、別称「1,1−ジメチルエチル」に対応する化学式「CH2CH(CH3)(CH3)」が逆変換されて、化学式「CH3CH(CH3)(CH3)」となる。これにより、対象化合物の物質名「tert−ブタン」に対応する、対象化合物の構造を表す化学式「CH3CH(CH3)(CH3)」を生成することができる。
このように、生成装置100によれば、対象化合物の構造を表す化学式を物質名から直接得られなくても、対象化合物の別称や化学反応のルールRを利用して解析しやすい物質名に変換することで、対象化合物の構造を表す化学式を生成することができる。これにより、対象化合物の構造の理解を支援することができる。
なお、上記(4)において、化学式を逆変換することにしたが、これに限らない。例えば、生成装置100は、特定した別称を、ルールRに規定された変換内容とは逆の変換内容にしたがって変換することにしてもよい。図1の例では、生成装置100は、別称「1,1−ジメチルエチル」の語尾「チル」を「タン」にする変換を行って、「1,1−ジメチルエタン」とすることにしてもよい。
これにより、対象化合物の物質名「tert−ブタン」の別称「1,1−ジメチルエタン」を生成することができる。別称「1,1−ジメチルエタン」には、「メチル」や「エタン」といった部分構造の名前が含まれている。このため、別称「1,1−ジメチルエタン」を提示することで、対象化合物の物質名「tert−ブタン」に比べて、対象化合物の構造を理解しやすくさせることができる。
(生成装置100のハードウェア構成例)
図2は、生成装置100のハードウェア構成例を示すブロック図である。図2において、生成装置100は、CPU(Central Processing Unit)201と、メモリ202と、ディスクドライブ203と、ディスク204と、I/F(Interface)205と、ディスプレイ206と、入力装置207と、を有する。また、各構成部はバス200によってそれぞれ接続される。
ここで、CPU201は、生成装置100の全体の制御を司る。メモリ202は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する記憶部である。具体的には、例えば、フラッシュROMやROMが各種プログラムを記憶し、RAMがCPU201のワークエリアとして使用される。メモリ202に記憶されるプログラムは、CPU201にロードされることで、コーディングされている処理をCPU201に実行させる。
ディスクドライブ203は、CPU201の制御に従ってディスク204に対するデータのリード/ライトを制御する。ディスク204は、ディスクドライブ203の制御で書き込まれたデータを記憶する。ディスク204としては、例えば、磁気ディスク、光ディスクなどが挙げられる。
I/F205は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して外部装置に接続される。そして、I/F205は、ネットワーク210と自装置内部とのインターフェースを司り、外部装置からのデータの入出力を制御する。ネットワーク210は、例えば、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)などである。
ディスプレイ206は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する表示装置である。ディスプレイ206としては、例えば、液晶ディスプレイ、CRT(Cathode Ray Tube)などを採用することができる。
入力装置207は、文字、数字、各種指示などの入力のためのキーを有し、データの入力を行う。入力装置207は、キーボードやマウスなどであってもよく、また、タッチパネル式の入力パッドやテンキーなどであってもよい。
なお、生成装置100は、上述した構成部のうち、例えば、ディスクドライブ203、ディスク204、ディスプレイ206、入力装置207などを有さないことにしてもよい。また、生成装置100は、上述した構成部のほかに、例えば、SSD(Solid State Drive)、スキャナ、プリンタなどを有することにしてもよい。
(部分示性式辞書300の記憶内容)
つぎに、生成装置100が有する部分示性式辞書300の記憶内容について説明する。部分示性式辞書300は、例えば、図2に示したメモリ202、ディスク204などの記憶装置に記憶される。
図3は、部分示性式辞書300の記憶内容の一例を示す説明図である。図3において、部分示性式辞書300は、部分名および部分示性式のフィールドを有し、各フィールドに情報を設定することで、部分示性式情報(例えば、部分示性式情報300−1,300−2)をレコードとして記憶する。
ここで、部分名は、部分構造の物質名を示す。部分構造とは、化合物の一部または全部となる化学物質である。部分示性式は、部分名の部分構造の示性式を示す。例えば、部分示性式情報300−1は、部分名「メタン」の部分構造の部分示性式「CH3」を示す。
なお、部分名と部分示性式との組は、例えば、特許文献や学術論文などの文書情報から取得される。また、部分示性式は、例えば、既知の示性式に部品化ルール(例えば、図4参照)を適用して部品化したものであってもよい。この場合、部品化ルールが適用された適用後の物質名を「部分名」という。既知の示性式に部品化ルールを適用して部分示性式を生成する技術については、例えば、特開2013−101508号公報を参照することができる。
(部品化ルールDB400の記憶内容)
つぎに、生成装置100が有する部品化ルールDB400の記憶内容について説明する。部品化ルールDB400は、例えば、図2に示したメモリ202、ディスク204などの記憶装置に記憶される。図1に示した第1の記憶部110は、例えば、部品化ルールDB400に相当する。
図4は、部品化ルールDB400の記憶内容の一例を示す説明図である。図4において、部品化ルールDB400は、ルールID、順変換適用条件、順変換内容、逆変換適用条件および逆変換内容のフィールドを有する。各フィールドに情報を設定することで、部品化ルール情報(例えば、部品化ルール情報400−1〜400−12)がレコードとして記憶される。
ルールIDは、ルールRを一意に識別する識別子である。順変換適用条件は、ルールRに規定された順変換を適用すべき化学反応に関する条件である。順変換適用条件には「なし」が設定される場合がある。順変換内容は、ルールRに規定された順変換の内容である。逆変換適用条件は、ルールRに規定された逆変換を適用すべき化学反応に関する条件である。逆変換適用条件には「なし」が設定される場合がある。逆変換内容は、ルールRに規定された逆変換の内容である。なお、逆変換は、順変換とは逆の変換を示す。
なお、部品化ルール情報400−1〜400−6は、適用条件(順変換適用条件、逆変換適用条件)に、化合物の物質名と示性式に関する条件を含む。一方、部品化ルール情報400−7〜400−12は、適用条件に、化合物の物質名に関する条件のみを含む。部品化ルールDB400には、適用条件として、「化合物の物質名と示性式に関する条件」または「化合物の物質名に関する条件」のいずれかの条件を設定した部品化ルール情報のみが記憶されることにしてもよい。また、部品化ルールDB400には、適用条件として、「化合物の示性式に関する条件」を設定した部品化ルール情報が記憶されることにしてもよい。
(別称辞書500の記憶内容)
つぎに、生成装置100が有する別称辞書500の記憶内容について説明する。別称辞書500は、例えば、図2に示したメモリ202、ディスク204などの記憶装置に記憶される。図1に示した第2の記憶部120は、例えば、別称辞書500に相当する。
図5は、別称辞書500の記憶内容の一例を示す説明図である。図5において、別称辞書500は、物質名および別称のフィールドを有し、各フィールドに情報を設定することで、別称情報(例えば、別称情報500−1〜500−3)をレコードとして記憶する。
ここで、物質名は、化合物の名称である。物質名は、部分構造の物質名であってもよい。別称は、化合物の別称である。例えば、別称情報500−1は、物質名「tert−ブチル」の化合物の別称「1,1−ジメチルエチル」を示す。
(生成装置100の機能的構成例)
図6は、生成装置100の機能的構成例を示すブロック図である。図6において、生成装置100は、登録部601と、取得部602と、生成部603と、変換部604と、逆変換部605と、出力部606と、を含む構成である。登録部601〜出力部606は制御部となる機能であり、具体的には、例えば、図2に示したメモリ202、ディスク204などの記憶装置に記憶されたプログラムをCPU201に実行させることにより、または、I/F205により、その機能を実現する。各機能部の処理結果は、例えば、メモリ202、ディスク204などの記憶装置に記憶される。
登録部601は、化合物の物質名と対応付けて、化合物の別称を登録する。具体的には、例えば、登録部601は、既存の化合物データベースから、同一の化合物を表す物質名のペアを抽出する。既存の化合物データベースとしては、例えば、有機化合物の物質名、分子式等が登録された日本化学物質辞書を利用することができる。
一例として、物質名のペアとして、「アクリル酸4−tert−ブチルフェニル」と「アクリル酸4−(1,1−ジメチルエチル)フェニル」が抽出された場合を想定する。この場合、登録部601は、各物質名の先頭および末尾それぞれから、物質名同士で共通する文字または文字列を特定する。ここでは、先頭から共通部分「アクリル酸4−」が特定され、末尾から共通部分「フェニル」が特定される。つぎに、登録部601は、各物質名から共通部分を除いた残りの部分同士を、互いに対応する物質名(部分名)として特定する。互いに対応する物質名は、一方の物質名が他方の物質名の別称であるといえる。ここでは、「tert−ブチル」と「1,1−ジメチルエチル」が、互いに対応する物質名として特定される。この場合、登録部601は、物質名「tert−ブチル」と対応付けて、別称「1,1−ジメチルエチル」を別称辞書500(図5参照)に登録する。また、登録部601は、物質名「1,1−ジメチルエチル」と対応付けて、別称「tert−ブチル」を別称辞書500に登録する。
これにより、日本化学物質辞書等に登録されている物質名の対応関係から別称辞書500を自動生成することができる。ただし、登録部601は、例えば、図2に示した入力装置207を用いたユーザの操作入力により、化合物の物質名と別称とを対応付けて登録することにしてもよい。
取得部602は、対象化合物の物質名を取得する。ここで、対象化合物は、構造を表す化学式の生成対象となる化合物の物質名である。対象化合物は、化合物の部分構造であってもよい。構造を表す化学式は、例えば、示性式である。また、取得部602は、対象化合物の物質名とともに、対象化合物の分子式を取得することにしてもよい。
以下の説明では、構造を表す化学式として「示性式」を例に挙げて説明する。
具体的には、例えば、取得部602は、特許文献や学術論文などの文書情報から、対象化合物の物質名、または、対象化合物の物質名および分子式を取得することにしてもよい。また、取得部602は、入力装置207を用いたユーザの操作入力により、対象化合物の物質名、または、対象化合物の物質名および分子式を取得することにしてもよい。また、取得部602は、外部装置から受信することにより、対象化合物の物質名、または、対象化合物の物質名および分子式を取得することにしてもよい。
生成部603は、取得された対象化合物の物質名に基づいて、対象化合物の示性式を生成する。具体的には、例えば、生成部603は、取得された対象化合物の物質名から、部分構造ごとの部分名を検出する。より詳細に説明すると、生成部603は、例えば、既存の形態素解析等の技術を利用して、対象化合物の物質名を部分構造ごとの部分名に分割して、部分構造ごとの部分名を検出する。この際、生成部603は、対象化合物の物質名を階層的に解析して、部分構造ごとの部分名を検出することにしてもよい。
つぎに、生成部603は、部分示性式辞書300(図3参照)から、検出した部分構造の部分名に対応する部分示性式を抽出する。そして、生成部603は、抽出した各部分構造の部分名に対応する部分示性式に基づいて、対象化合物の示性式を生成する。より詳細に説明すると、生成部603は、例えば、各部分構造の部分示性式を連結して対象化合物の示性式を生成する。この際、生成部603は、対象化合物の物質名にしたがって各部分構造の部分示性式を並べて連結することにより、対象化合物の示性式を生成することにしてもよい。
ただし、部分示性式辞書300から部分構造の部分名に対応する部分示性式が抽出されない場合がある。この場合、生成部603は、例えば、登録部601による登録結果である別称辞書500を参照して、対象化合物の物質名(あるいは、対象化合物の物質名から検出した部分構造の部分名)に対応する別称を特定する。そして、生成部603は、特定した別称に基づいて、対象化合物の示性式を生成することにしてもよい。
より詳細に説明すると、生成部603は、例えば、対象化合物の物質名の別称を解析して、部分構造ごとの部分名を検出する。つぎに、生成部603は、部分示性式辞書300から、検出した部分構造の部分名に対応する部分示性式を抽出する。そして、生成部603は、各部分構造の部分示性式を連結して、対象化合物の示性式を生成する。
ただし、対象化合物の物質名に対応する別称が別称辞書500から特定されない場合がある。また、対象化合物の物質名の別称を解析して得られる部分構造の部分名に対応する部分示性式が部分示性式辞書300から抽出されない場合がある。
出力部606は、対象化合物の物質名と対応付けて、生成部603によって生成された対象化合物の示性式を出力する。出力部606の出力形式としては、例えば、メモリ202、ディスク204などの記憶装置への記憶、ディスプレイ206(図2参照)への表示、I/F205による外部装置への送信、不図示のプリンタ♯13への印刷出力などがある。
具体的には、例えば、出力部606は、対象化合物の物質名と示性式とを対応付けて、部分示性式辞書300に登録することにしてもよい。これにより、新たな部分名と部分示性式との組を部分示性式辞書300に登録することができる。
変換部604は、部品化ルールDB400(図4参照)を参照して、ルールRを適用すべき化学反応に関する条件を対象化合物が満たす場合に、対象化合物の物質名を、ルールRに規定された変換内容にしたがって変換する。ここで、ルールRは、化合物の物質名および化学式の変換内容を規定したものである。
変換部604による変換処理は、例えば、生成部603によって対象化合物の示性式が生成されなかった場合、あるいは、生成部603によって生成された対象化合物の示性式が不完全であった場合に行われる。
具体的には、例えば、変換部604は、部品化ルールDB400からいずれかのルールR(部品化ルール情報)を抽出する。なお、変換部604がどのルールRを抽出するかについては、ランダムでもよく、ルールID順でもよい。つぎに、変換部604は、対象化合物の物質名または分子式の少なくともいずれかが、ルールRの順変換適用条件を満たすか否かを判断する。順変換適用条件は、ルールRに規定された順変換を適用すべき化学反応に関する条件である。ただし、順変換適用条件「なし」の場合、変換部604は、ルールRの順変換適用条件を満たすと判断する。そして、変換部604は、ルールRの順変換適用条件を満たすと判断した場合、対象化合物の物質名を、ルールRに規定された順変換内容にしたがって変換する。
一例として、ルールR1(部品化ルール情報400−1)を例に挙げると、変換部604は、対象化合物の物質名および分子式に基づいて、順変換適用条件『「C」と「H」で構成される示性式、かつ、「タン」で終わる部分名』を満たすか否かを判断する。より詳細に説明すると、変換部604は、例えば、対象化合物の分子式が「C」と「H」で構成され、かつ、対象化合物の物質名が「タン」で終わる場合に、ルールR1の順変換適用条件を満たすと判断する。そして、変換部604は、ルールR1の順変換適用条件を満たすと判断した場合、対象化合物の物質名を、ルールR1に規定された順変換内容『「H」を1つ抜き、部分名の語尾を「タン」から「チル」に変える』にしたがって変換する。
なお、ルールRに規定された順変換内容にしたがって対象化合物の物質名を変換する変換例については、図8および図14を用いて後述する。
また、生成部603は、変換された変換後の物質名に基づいて、変換後の物質名に対応する化合物の示性式を生成する。具体的には、例えば、生成部603は、変換後の物質名から、部分構造ごとの部分名を検出する。つぎに、生成部603は、部分示性式辞書300から、検出した部分構造の部分名に対応する部分示性式を抽出する。そして、生成部603は、抽出した各部分構造の部分名に対応する部分示性式に基づいて、変換後の物質名に対応する化合物の示性式を生成する。
ただし、部分示性式辞書300から部分構造の部分名に対応する部分示性式が抽出されない場合がある。この場合、生成部603は、例えば、別称辞書500を参照して、変換後の物質名(あるいは、変換後の物質名から検出した部分構造の部分名)に対応する別称を特定する。そして、生成部603は、特定した別称に基づいて、当該別称に対応する化合物の示性式を生成する。
より詳細に説明すると、生成部603は、例えば、変換後の物質名の別称を解析して、部分構造ごとの部分名を検出する。つぎに、生成部603は、部分示性式辞書300から、検出した部分構造の部分名に対応する部分示性式を抽出する。そして、生成部603は、各部分構造の部分示性式を連結して、変換後の物質名の別称に対応する化合物の示性式を生成する。
逆変換部605は、生成された変換後の物質名の別称に対応する化合物の示性式を、ルールRに規定された逆変換内容にしたがって変換する。ここで、逆変換内容とは、ルールRに規定された順変換内容とは逆の変換内容である。これにより、対象化合物の構造を表す示性式を生成することができる。
また、逆変換部605は、変換後の物質名の別称または当該別称に対応する化合物の示性式の少なくともいずれかが、ルールRの逆変換適用条件を満たすか否かを判断することにしてもよい。逆変換適用条件は、ルールRに規定された逆変換を適用すべき化学反応に関する条件である。ただし、逆変換適用条件「なし」の場合、逆変換部605は、ルールRの逆変換適用条件を満たすと判断する。そして、逆変換部605は、ルールRの逆変換適用条件を満たすと判断した場合に、変換後の物質名の別称に対応する化合物の示性式を、ルールRに規定された逆変換内容にしたがって変換することにしてもよい。
一例として、ルールR1(部品化ルール情報400−1)を例に挙げると、逆変換部605は、変換後の物質名の別称または当該別称に対応する化合物の示性式に基づいて、逆変換適用条件『「C」と「H」で構成される示性式、かつ、「チル」で終わる部分名』を満たすか否かを判断する。より詳細に説明すると、逆変換部605は、例えば、変換後の物質名の別称に対応する化合物の示性式が「C」と「H」で構成され、かつ、変換後の物質名の別称が「チル」で終わる場合に、ルールR1の逆変換適用条件を満たすと判断する。そして、逆変換部605は、ルールR1の逆変換適用条件を満たすと判断した場合、変換後の物質名の別称に対応する化合物の示性式を、ルールR1に規定された逆変換内容『「H」を1つ加え、部分名の語尾を「チル」から「タン」に変える』にしたがって変換する。
なお、ルールRに規定された逆変換内容にしたがって、変換後の物質名の別称に対応する化合物の示性式を変換する変換例については、図11および図17を用いて後述する。
また、逆変換部605は、変換部604によって変換された変換後の物質名の別称を、ルールRに規定された逆変換内容にしたがって変換する。この際、逆変換部605は、ルールRの逆変換適用条件を満たすと判断した場合に、変換後の物質名の別称を、ルールRに規定された逆変換内容にしたがって変換することにしてもよい。これにより、対象化合物の物質名の別称を生成することができる。
なお、ルールRに規定された逆変換内容にしたがって、変換後の物質名の別称を変換する変換例については、図11および図17を用いて後述する。
また、逆変換部605は、対象化合物の分子式に基づいて、変換後の示性式の妥当性を判断することにしてもよい。ここで、対象化合物の分子式は、例えば、対象化合物の物質名とともに取得される。また、逆変換部605は、例えば、化合物の物質名と分子式とを対応付けて記憶する分子式データベース(不図示)から、対象化合物の物質名に対応する分子式を取得することにしてもよい。
具体的には、例えば、まず、逆変換部605は、変換後の示性式を分子式に変換する。つぎに、逆変換部605は、変換して得られた分子式と、対象化合物の分子式とを比較する。そして、逆変換部605は、分子式同士で原子の種類と数が一致する場合に、変換後の示性式が妥当であると判断する。一方、分子式同士で原子の種類や数が一致しない場合、逆変換部605は、変換後の示性式が妥当ではないと判断する。
また、出力部606は、逆変換部605による変換結果を出力する。具体的には、例えば、出力部606は、対象化合物の物質名と対応付けて、変換後の示性式を出力することにしてもよい。また、出力部606は、対象化合物の物質名と対応付けて、変換後の別称を出力することにしてもよい。また、出力部606は、対象化合物の物質名と対応付けて、変換後の示性式および変換後の別称を出力することにしてもよい。
より具体的には、例えば、出力部606は、対象化合物の物質名と変換後の示性式とを対応付けて、部分示性式辞書300に登録することにしてもよい。これにより、新たな部分名(対象化合物の物質名)と部分示性式(変換後の示性式)との組を部分示性式辞書300に登録することができる。
また、出力部606は、逆変換部605によって変換後の示性式が妥当であると判断された場合に、逆変換部605による変換結果を出力することにしてもよい。これにより、対象化合物の分子式との整合性がとれない示性式が出力されるのを防ぐことができる。
(対象化合物の示性式の第1の生成例)
つぎに、図7〜図12を用いて、対象化合物の示性式の第1の生成例について説明する。ここでは、対象化合物の物質名および分子式として、物質名「tert−ブタン」および分子式「C4H10」が取得された場合を例に挙げて説明する。また、生成部603によって対象化合物の示性式が生成されなかった場合を想定する。
まず、対象化合物の示性式の生成に用いられる変換用テーブル700について説明する。変換用テーブル700は、例えば、図2に示したメモリ202、ディスク204などの記憶装置に記憶される。
図7は、変換用テーブル700の記憶内容の一例を示す説明図(その1)である。図7において、変換用テーブル700は、物質名、適用ルールID、変換後物質名、別称、別称示性式、変換後示性式および変換後別称のフィールドを有し、各フィールドに情報を設定することで、変換用情報をレコードとして記憶する。
ここで、物質名は、示性式の生成対象となる対象化合物の物質名である。対象化合物は、部分構造であってもよい。適用ルールIDは、対象化合物に適用されたルールRを一意に識別する識別子である。変換後物質名は、ルールRに規定された順変換内容にしたがって、対象化合物の物質名を変換した変換後の物質名である。
別称は、変換後物質名の別称である。別称フィールドには、複数の別称が設定される場合がある。別称示性式は、別称に対応する化合物の示性式である。変換後示性式は、ルールRに規定された逆変換内容にしたがって、別称示性式を変換した変換後の示性式である。変換後別称は、ルールRに規定された逆変換内容にしたがって、別称を変換した変換後の別称である。
ここでは、取得された対象化合物の物質名「tert−ブタン」が、変換用テーブル700の物質名フィールドに設定される(図7参照)。この結果、新たな変換用情報701がレコードとして変換用テーブル700に記憶される。なお、対象化合物の分子式「C4H10」は、例えば、対象化合物の物質名「tert−ブタン」と対応付けて、メモリ202、ディスク204などの記憶装置に記憶される。
図8〜図12は、対象化合物の示性式の第1の生成例を示す説明図である。図8において、変換部604は、生成部603によって対象化合物の示性式が生成されなかった場合、部品化ルールDB400を参照して、対象化合物が適用条件を満たすルールRに規定された順変換内容にしたがって、対象化合物の物質名を変換する。
図8の例では、ルールR1に規定された順変換内容にしたがって、対象化合物の物質名「tert−ブタン」が「tert−ブチル」に変換されている。また、ルールR2に規定された順変換内容にしたがって、対象化合物の物質名「tert−ブタン」が「tert−ブタノール」に変換されている。また、ルールR3に規定された順変換内容にしたがって、対象化合物の物質名「tert−ブタン」が「tert−クロロブタン」に変換されている。
なお、図8〜図12では、参考情報として、各化合物の構造式を表示している。
変換後の物質名は、適用されたルールRのルールIDと対応付けて、変換用テーブル700の変換後物質名フィールドにそれぞれ設定される(図7参照)。ただし、異なるルールR(例えば、ルールR1とルールR1’)であっても、変換後の物質名が同じものとなることがある。このため、変換部604は、変換後の物質名が変換用テーブル700に登録済みの場合は、重複して登録しないようにしてもよい。
図9において、生成部603は、別称辞書500を参照して、変換後の物質名に対応する別称を特定する。図9の例では、変換後の物質名「tert−ブチル」に対応する別称「1,1−ジメチルエチル」が特定されている。なお、変換後の物質名(例えば、「tert−ブタノール」)が別称辞書500に未登録の場合、別称は特定されない。
特定された別称は、変換後の物質名と対応付けて、変換用テーブル700の別称フィールドに設定される(図7参照)。なお、変換後の物質名に対応する別称として、複数の別称が特定されることもある。
図10において、生成部603は、変換後の物質名に対応する別称を解析して、当該別称に対応する化合物の示性式を生成する。図10の例では、別称「1,1−ジメチルエチル」を階層的に解析した結果、別称「1,1−ジメチルエチル」に対応する化合物の示性式「CH2CH(CH3)(CH3)」が生成された場合を想定する。
生成された別称に対応する化合物の示性式は、別称と対応付けて、変換用テーブル700の別称示性式フィールドに設定される(図7参照)。
図11において、逆変換部605は、生成された変換後の物質名の別称に対応する化合物の示性式を、ルールRに規定された逆変換内容にしたがって変換する。また、逆変換部605は、変換部604によって変換された変換後の物質名の別称を、ルールRに規定された逆変換内容にしたがって変換する。
図11の例では、ルールR1に規定された逆変換内容にしたがって、別称「1,1−ジメチルエチル」に対応する化合物の示性式「CH2CH(CH3)(CH3)」に、水素(H)が追加されて、「CH3CH(CH3)(CH3)」に変換されている。また、ルールR1に規定された逆変換内容にしたがって、別称「1,1−ジメチルエチル」が「1,1−ジメチルエタン」に変換されている。
なお、水素(H)を追加する位置は、各炭素(C)の価数の余りから特定することにしてもよい。具体的には、例えば、逆変換部605は、示性式「CH2CH(CH3)(CH3)」を炭素の前で分割する。この結果、示性式「CH2CH(CH3)(CH3)」は、示性式「CH2/CH(CH3)(CH3)」となる。以下、「/」で区切られた部分を「示性式断片」と表記する。
つぎに、逆変換部605は、分割して得られた示性式断片ごとに価数の余りを算出する。ここで、価数の余りとは、化合物の骨格を形成する元素の価数(結合の手の数)の余り、例えば、炭素の価数の余りである。各元素の価数を示す情報は、例えば、メモリ202やディスク204などの記憶装置に記憶されている。
ここで、示性式断片「CH2」の炭素(C)には、1つの炭素(C)と2つの水素(H)が結合されている。このため、示性式断片「CH2」の価数の余りは「1(=4−3)」となる。また、示性式断片「CH(CH3)(CH3)」の炭素(C)には、1つの炭素(C)と1つの水素(H)と2つのメチル基(CH3)が結合されている。このため、示性式断片「CH(CH3)(CH3)」の価数の余りは「0(=4−4)」となる。この場合、逆変換部605は、示性式「CH2CH(CH3)(CH3)」のうち、価数が余っている示性式断片「CH2」の炭素(C)に水素(H)を追加する。
変換後の示性式は、別称と対応付けて、変換用テーブル700の変換後示性式フィールドに設定される(図7参照)。また、変換後の別称は、別称と対応付けて、変換用テーブル700の変換後示性式フィールドに設定される(図7参照)。
図12において、逆変換部605は、対象化合物の分子式「C4H10」に基づいて、変換後の示性式「CH3CH(CH3)(CH3)」の妥当性を判断する。具体的には、例えば、まず、逆変換部605は、変換後の示性式「CH3CH(CH3)(CH3)」を分子式「C4H10」に変換する。つぎに、逆変換部605は、変換して得られた分子式「C4H10」と、対象化合物の分子式「C4H10」とを比較する。ここでは、分子式同士で原子の種類と数が一致する。このため、逆変換部605は、変換後の示性式「CH3CH(CH3)(CH3)」が妥当であると判断する。この場合、逆変換部605は、対象化合物の物質名「tert−ブタン」と対応付けて、変換後の示性式「CH3CH(CH3)(CH3)」を部分示性式辞書300に登録する。また、逆変換部605は、対象化合物の物質名「tert−ブタン」と対応付けて、変換後の別称「1,1−ジメチルエタン」を別称辞書500に登録することにしてもよい。
(対象化合物の示性式の第2の生成例)
つぎに、図13〜図18を用いて、対象化合物の示性式の第2の生成例について説明する。ここでは、対象化合物の物質名および分子式として、物質名「塩化アニリン」および分子式「C6H6NCl」が取得された場合を例に挙げて説明する。また、生成部603によって対象化合物の示性式が生成されなかった場合を想定する。
図13は、変換用テーブル700の記憶内容の一例を示す説明図(その2)である。ここでは、取得された対象化合物の物質名「塩化アニリン」が、変換用テーブル700の物質名フィールドに設定される(図13参照)。この結果、新たな変換用情報1301がレコードとして変換用テーブル700に記憶される。なお、対象化合物の分子式「塩化アニリン」は、例えば、対象化合物の物質名「C6H6NCl」と対応付けて、メモリ202、ディスク204などの記憶装置に記憶される。
図14〜図18は、対象化合物の示性式の第2の生成例を示す説明図である。図14において、変換部604は、生成部603によって対象化合物の示性式が生成されなかった場合、部品化ルールDB400を参照して、対象化合物が適用条件を満たすルールRに規定された順変換内容にしたがって、対象化合物の物質名を変換する。
図14の例では、ルールR6に規定された順変換内容にしたがって、対象化合物の物質名「塩化アニリン」が「アニリン」に変換されている。また、ルールR7(不図示)に規定された順変換内容にしたがって、対象化合物の物質名「塩化アニリン」が「ジ塩化アニリン」に変換されている。また、ルールR8(不図示)に規定された順変換内容にしたがって、対象化合物の物質名「塩化アニリン」が「フッ化塩化アニリン」に変換されている。
なお、図14〜図18では、参考情報として、各化合物の構造式を表示している。
変換後の物質名は、適用されたルールRのルールIDと対応付けて、変換用テーブル700の変換後物質名フィールドにそれぞれ設定される(図13参照)。
図15において、生成部603は、別称辞書500を参照して、変換後の物質名に対応する別称を特定する。図15の例では、変換後の物質名「アニリン」に対応する別称「ベンゼンアミン」が特定されている。特定された別称は、変換後の物質名と対応付けて、変換用テーブル700の別称フィールドに設定される(図13参照)。
図16において、生成部603は、変換後の物質名に対応する別称を解析して、当該別称に対応する化合物の示性式を生成する。図16の例では、別称「ベンゼンアミン」を解析した結果、別称「ベンゼンアミン」に対応する化合物の示性式「C6H5NH2」が生成された場合を想定する。生成された別称に対応する化合物の示性式は、別称と対応付けて、変換用テーブル700の別称示性式フィールドに設定される(図13参照)。
図17において、逆変換部605は、生成された変換後の物質名の別称に対応する化合物の示性式を、ルールRに規定された逆変換内容にしたがって変換する。また、逆変換部605は、変換部604によって変換された変換後の物質名の別称を、ルールRに規定された逆変換内容にしたがって変換する。
図17の例では、ルールR6に規定された逆変換内容にしたがって、別称「ベンゼンアミン」に対応する化合物の示性式「C6H5NH2」の水素(H)が塩素(Cl)に置き換わって、「C6H4ClNH2」に変換されている。また、ルールR6に規定された逆変換内容にしたがって、別称「ベンゼンアミン」が「塩化ベンゼンアミン」に変換されている。
変換後の示性式は、別称と対応付けて、変換用テーブル700の変換後示性式フィールドに設定される(図13参照)。また、変換後の別称は、別称と対応付けて、変換用テーブル700の変換後示性式フィールドに設定される(図13参照)。
図18において、逆変換部605は、対象化合物の分子式「C6H6NCl」に基づいて、変換後の示性式「C6H4ClNH2」の妥当性を判断する。具体的には、例えば、まず、逆変換部605は、変換後の示性式「C6H4ClNH2」を分子式「C6H6NCl」に変換する。つぎに、逆変換部605は、変換して得られた分子式「C6H6NCl」と、対象化合物の分子式「C6H6NCl」とを比較する。ここでは、分子式同士で原子の種類と数が一致する。このため、逆変換部605は、変換後の示性式「C6H4ClNH2」が妥当であると判断する。この場合、逆変換部605は、対象化合物の物質名「塩化アニリン」と対応付けて、変換後の示性式「C6H4ClNH2」を部分示性式辞書300に登録する。また、逆変換部605は、対象化合物の物質名「塩化アニリン」と対応付けて、変換後の別称「塩化ベンゼンアミン」を別称辞書500に登録することにしてもよい。
(生成装置100の生成処理手順)
つぎに、生成装置100の生成処理手順について説明する。
図19は、生成装置100の生成処理手順の一例を示すフローチャートである。図19のフローチャートにおいて、まず、生成装置100は、対象化合物の物質名を取得する(ステップS1901)。つぎに、生成装置100は、取得した対象化合物の物質名を解析して、対象化合物の示性式を生成する(ステップS1902)。
そして、生成装置100は、対象化合物の示性式が生成されたか否かを判断する(ステップS1903)。なお、生成装置100は、生成された示性式に不完全な部分がある場合も、対象化合物の示性式が生成されなかったと判断する。
ここで、対象化合物の示性式が生成された場合(ステップS1903:Yes)、生成装置100は、ステップS1908に移行する。一方、対象化合物の示性式が生成されなかった場合(ステップS1903:No)、生成装置100は、第1の示性式生成処理を実行する(ステップS1904)。なお、第1の示性式生成処理の具体的な処理手順については、図20を用いて後述する。
そして、生成装置100は、対象化合物の示性式が生成されたか否かを判断する(ステップS1905)。ここで、対象化合物の示性式が生成された場合(ステップS1905:Yes)、生成装置100は、ステップS1908に移行する。
一方、対象化合物の示性式が生成されなかった場合(ステップS1905:No)、生成装置100は、第2の示性式生成処理を実行する(ステップS1906)。なお、第2の示性式生成処理の具体的な処理手順については、図21を用いて後述する。
そして、生成装置100は、対象化合物の示性式が生成されたか否かを判断する(ステップS1907)。ここで、対象化合物の示性式が生成されなかった場合(ステップS1907:No)、生成装置100は、本フローチャートによる一連の処理を終了する。
一方、対象化合物の示性式が生成された場合(ステップS1907:Yes)、生成装置100は、対象化合物の物質名と示性式とを対応付けて、部分示性式辞書300に登録して(ステップS1908)、本フローチャートによる一連の処理を終了する。
これにより、新たな部分名(対象化合物の物質名)と部分示性式(対象化合物の示性式)との組を部分示性式辞書300に登録することができる。
なお、ステップS1901において、生成装置100は、対象化合物の物質名とともに、対象化合物の分子式を取得してもよい。この場合、生成装置100は、対象化合物の分子式に基づいて、生成された対象化合物の示性式の妥当性を判断してもよい。そして、生成装置100は、示性式が妥当であると判断した場合に、対象化合物の物質名と示性式とを対応付けて、部分示性式辞書300に登録することにしてもよい。
また、ステップS1908において、生成装置100は、対象化合物の物質名と対応付けて、後述の図21に示すステップS2106において生成される対象化合物の物質名の別称(変換後の物質名を逆変換内容にしたがって変換したもの)を出力することにしてもよい。
つぎに、ステップS1904の第1の示性式生成処理の具体的な処理手順について説明する。
図20は、第1の示性式生成処理の具体的処理手順の一例を示すフローチャートである。図20のフローチャートにおいて、まず、生成装置100は、別称辞書500を参照して、対象化合物の物質名に対応する別称を特定する(ステップS2001)。そして、生成装置100は、別称が特定されたか否かを判断する(ステップS2002)。
ここで、別称が特定されなかった場合(ステップS2002:No)、生成装置100は、第1の示性式生成処理を呼び出したステップに戻る。一方、別称が特定された場合(ステップS2002:Yes)、生成装置100は、特定された別称のうち選択されていない未選択の別称を選択する(ステップS2003)。
つぎに、生成装置100は、選択した別称を解析して、対象化合物の示性式を生成する(ステップS2004)。そして、生成装置100は、対象化合物の示性式が生成されたか否かを判断する(ステップS2005)。ここで、対象化合物の示性式が生成された場合(ステップS2005:Yes)、生成装置100は、第1の示性式生成処理を呼び出したステップに戻る。
一方、対象化合物の示性式が生成されなかった場合(ステップS2005:No)、生成装置100は、特定された別称のうち選択されていない未選択の別称があるか否かを判断する(ステップS2006)。ここで、未選択の別称がある場合(ステップS2006:Yes)、生成装置100は、ステップS2003に戻る。
一方、未選択の別称がない場合(ステップS2006:No)、生成装置100は、第1の示性式生成処理を呼び出したステップに戻る。これにより、対象化合物の物質名から示性式が直接得られなくても、当該物質名を別称に置き換えて解析することで、対象化合物の示性式を得ることができる。
つぎに、ステップS1906の第2の示性式生成処理の具体的な処理手順について説明する。
図21は、第2の示性式生成処理の具体的処理手順の一例を示すフローチャートである。図21のフローチャートにおいて、まず、生成装置100は、部品化ルールDB400を参照して、対象化合物がルールRの適用条件を満たす場合に、対象化合物の物質名を、ルールRに規定された順変換内容にしたがって変換する(ステップS2101)。
つぎに、生成装置100は、変換した変換後の物質名のうち選択されていない未選択の変換後の物質名を選択する(ステップS2102)。そして、生成装置100は、選択した変換後の物質名に基づいて、変換後の物質名に対応する化合物の示性式を生成する第1の示性式生成処理を実行する(ステップS2103)。
なお、ステップS2103の第1の示性式生成処理の具体的な処理手順については、対象化合物の物質名の代わりに、変換後の物質名を用いること以外は、図20に示した処理手順と同様のため、図示および説明を省略する。
そして、生成装置100は、変換後の物質名に対応する化合物の示性式が生成されたか否かを判断する(ステップS2104)。ここで、示性式が生成されなかった場合(ステップS2104:No)、生成装置100は、変換した変換後の物質名のうち選択されていない未選択の変換後の物質名があるか否かを判断する(ステップS2105)。
ここで、未選択の変換後の物質名がある場合(ステップS2105:Yes)、生成装置100は、ステップS2102に戻る。一方、未選択の変換後の物質名がない場合(ステップS2105:No)、生成装置100は、第2の示性式生成処理を呼び出したステップに戻る。
また、ステップS2104において、変換後の物質名に対応する化合物の示性式が生成された場合(ステップS2104:Yes)、生成装置100は、変換後の物質名を、ルールRに規定された逆変換内容にしたがって変換する(ステップS2106)。つぎに、生成装置100は、生成された示性式を、ルールRに規定された逆変換内容にしたがって変換して(ステップS2107)、第2の示性式生成処理を呼び出したステップに戻る。
これにより、対象化合物の物質名や別称から示性式が直接得られなくても、当該物質名を化学反応のルールRにしたがって変換した変換後の物質名をさらに別称に置き換えて解析することで、対象化合物の示性式を得ることができる。
以上説明したように、実施の形態にかかる生成装置100によれば、別称辞書500を参照して、対象化合物の物質名に対応する別称を特定し、特定した別称に基づいて、対象化合物の示性式を生成することができる。これにより、対象化合物(部分構造でもよい)の物質名から示性式が直接得られなくても、当該物質名を別称に置き換えて解析することで、対象化合物の示性式を得ることができる。
また、生成装置100によれば、部品化ルールDB400を参照して、対象化合物の物質名を、ルールRに規定された順変換内容にしたがって変換することができる。また、生成装置100によれば、別称辞書500を参照して、変換後の物質名に対応する別称を特定し、部分示性式辞書300を参照して、特定した別称に対応する化合物の示性式を生成することができる。そして、生成装置100によれば、生成した示性式を、ルールRに規定された逆変換内容にしたがって変換して、変換結果を出力することができる。
これにより、対象化合物の物質名や別称から示性式が直接得られなくても、当該物質名を化学反応のルールRにしたがって変換した変換後の物質名をさらに別称に置き換えて解析することで、対象化合物の示性式を得ることができる。
また、生成装置100によれば、対象化合物の物質名または化学式の少なくともいずれかが、ルールRの順変換適用条件を満たす場合に、対象化合物の物質名を、ルールRに規定された順変換内容にしたがって変換することができる。これにより、対象化合物の物質名に対して適用できない変換をしようとしたり、自然界に存在しないような名前に対象化合物の物質名が変換されるのを防ぐことができる。
また、生成装置100によれば、特定した別称または当該別称に対応する化合物の示性式の少なくともいずれかが、ルールRの逆変換適用条件を満たす場合に、特定した別称に対応する化合物の示性式を、ルールRに規定された逆変換内容にしたがって変換することができる。これにより、別称に対応する化合物の示性式に対して適用できない変換をしようとしたり、対象化合物の示性式として自然界に存在しないようなものが生成されるのを防ぐことができる。
また、生成装置100によれば、対象化合物の物質名と対応付けて、変換した変換後の示性式を出力することができる。これにより、明示的に示性式が示されていない化合物についても示性式を得ることができ、特許文献などの文書情報を読む人の理解を助けることができるとともに、コンピュータによる化合物の分析に活用することができる。また、部分示性式辞書300に変換結果を登録することで登録種類数の増加を図り、部分示性式辞書300の記憶内容を充実させることができる。
また、生成装置100によれば、特定した変換後の物質名に対応する別称を、ルールRに規定された逆変換内容にしたがって変換し、対象化合物の物質名と対応付けて、変換後の示性式および変換後の別称を出力することができる。これにより、対象化合物の物質名の別称を提示することができ、対象化合物の構造の理解を支援することができる。
また、生成装置100によれば、対象化合物の分子式に基づいて、ルールRに規定された逆変換内容にしたがって変換した変換後の示性式の妥当性を判断することができる。そして、生成装置100によれば、変換後の化学式が妥当であると判断した場合に、対象化合物の物質名と対応付けて、変換後の示性式を出力することができる。これにより、対象化合物の分子式との整合性がとれない示性式が、対象化合物の示性式として出力されるのを防ぐことができる。
これらのことから、生成装置100によれば、対象化合物(部分構造でもよい)の物質名から示性式が直接得られなくても、化学反応のルールRや別称を利用して、対象化合物の示性式を生成することができ、対象化合物の構造の理解を支援することができる。具体的には、例えば、示性式が不明確だった部分構造についても示性式を得ることができ、化合物の物質名を解析する際により詳細な示性式を得ることが可能となる。
なお、本実施の形態で説明した生成方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本生成プログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO(Magneto−Optical disk)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本生成プログラムは、インターネット等のネットワークを介して配布してもよい。
上述した実施の形態に関し、さらに以下の付記を開示する。
(付記1)化合物の物質名と化学式とについて化学反応に応じた変換内容を規定したルールを記憶する第1の記憶部を参照して、対象化合物の物質名を前記変換内容にしたがって変換し、
化合物の物質名と別称とを対応付けて記憶する第2の記憶部を参照して、変換した変換後の物質名に対応する別称を特定し、
特定した前記別称に対応する化合物の構造を表す化学式を、前記変換内容とは逆の変換内容にしたがって変換し、
変換結果を出力する、
処理をコンピュータに実行させることを特徴とする生成プログラム。
(付記2)前記出力する処理は、
前記対象化合物の物質名と対応付けて、変換した変換後の化学式を出力する、ことを特徴とする付記1に記載の生成プログラム。
(付記3)特定した前記別称を、前記変換内容とは逆の変換内容にしたがって変換する、処理を前記コンピュータに実行させ、
前記出力する処理は、
前記対象化合物の物質名と対応付けて、変換した変換後の化学式および変換後の別称を出力する、ことを特徴とする付記1または2に記載の生成プログラム。
(付記4)化合物の物質名と当該化合物の構造を表す化学式とを対応付けて記憶する第3の記憶部を参照して、特定した前記別称に対応する化合物の構造を表す化学式を生成する、処理を前記コンピュータに実行させ、
前記逆の変換内容にしたがって変換する処理は、
生成した前記別称に対応する化合物の構造を表す化学式を、前記逆の変換内容にしたがって変換し、
前記出力する処理は、
前記対象化合物の物質名と対応付けて、変換した変換後の化学式を前記第3の記憶部に登録する、ことを特徴とする付記1〜3のいずれか一つに記載の生成プログラム。
(付記5)前記対象化合物の分子式に基づいて、変換した変換後の化学式の妥当性を判断する、処理を前記コンピュータに実行させ、
前記出力する処理は、
前記変換後の化学式が妥当であると判断した場合に、前記対象化合物の物質名と対応付けて、前記変換後の化学式を出力する、ことを特徴とする付記1〜4のいずれか一つに記載の生成プログラム。
(付記6)前記第2の記憶部を参照して、前記対象化合物の物質名に対応する別称を特定する、処理を前記コンピュータに実行させ、
前記変換内容にしたがって変換する処理は、
前記対象化合物の物質名に対応する別称が特定されなかった場合、または、特定した当該別称に対応する化合物の構造を表す化学式が取得できなかった場合に、前記対象化合物の物質名を前記変換内容にしたがって変換する、ことを特徴とする付記1〜5のいずれか一つに記載の生成プログラム。
(付記7)前記対象化合物の物質名に対応する別称に対応する化合物の構造を表す化学式を取得できた場合、前記対象化合物の物質名と対応付けて、取得した前記化学式を出力する、処理を前記コンピュータに実行させることを特徴とする付記6に記載の生成プログラム。
(付記8)前記第1の記憶部は、化合物の物質名および化学式の変換内容を規定したルールと当該ルールを適用すべき化学反応に関する条件とを対応付けて記憶しており、
前記変換内容にしたがって変換する処理は、
前記第1の記憶部を参照して、前記対象化合物の物質名または化学式の少なくともいずれかが前記条件を満たす場合に、前記対象化合物の物質名を前記変換内容にしたがって変換する、ことを特徴とする付記1〜7のいずれか一つに記載の生成プログラム。
(付記9)前記ルールは、前記変換内容とは逆の変換内容をさらに規定し、
前記条件は、前記逆の変換内容を適用すべき化学反応に関する条件を含み、
前記逆の変換内容にしたがって変換する処理は、
特定した前記別称または当該別称に対応する化合物の構造を表す化学式の少なくともいずれかが、前記逆の変換内容を適用すべき化学反応に関する条件を満たす場合に、特定した前記別称に対応する化合物の構造を表す化学式を、前記逆の変換内容にしたがって変換する、ことを特徴とする付記8に記載の生成プログラム。
(付記10)化合物の物質名について化学反応に応じた変換内容を規定したルールを記憶する第1の記憶部を参照して、対象化合物の物質名を前記変換内容にしたがって変換し、
化合物の物質名と別称とを対応付けて記憶する第2の記憶部を参照して、変換した変換後の物質名に対応する別称を特定し、
特定した前記別称を、前記変換内容とは逆の変換内容にしたがって変換し、
変換結果を出力する、
処理をコンピュータに実行させることを特徴とする生成プログラム。
(付記11)化合物の物質名と化学式とについて化学反応に応じた変換内容を規定したルールを記憶する第1の記憶部を参照して、対象化合物の物質名を前記変換内容にしたがって変換し、
化合物の物質名と別称とを対応付けて記憶する第2の記憶部を参照して、変換した変換後の物質名に対応する別称を特定し、
特定した前記別称に対応する化合物の構造を表す化学式を、前記変換内容とは逆の変換内容にしたがって変換し、
変換結果を出力する、
処理をコンピュータが実行することを特徴とする生成方法。
(付記12)化合物の物質名について化学反応に応じた変換内容を規定したルールを記憶する第1の記憶部を参照して、対象化合物の物質名を前記変換内容にしたがって変換し、
化合物の物質名と別称とを対応付けて記憶する第2の記憶部を参照して、変換した変換後の物質名に対応する別称を特定し、
特定した前記別称を、前記変換内容とは逆の変換内容にしたがって変換し、
変換結果を出力する、
処理をコンピュータが実行することを特徴とする生成方法。
(付記13)化合物の物質名と化学式とについて化学反応に応じた変換内容を規定したルールを記憶する第1の記憶部と、
化合物の物質名と別称とを対応付けて記憶する第2の記憶部と、
前記第1の記憶部を参照して、対象化合物の物質名を前記変換内容にしたがって変換し、前記第2の記憶部を参照して、変換した変換後の物質名に対応する別称を特定し、特定した前記別称に対応する化合物の構造を表す化学式を、前記変換内容とは逆の変換内容にしたがって変換して変換結果を出力する制御部と、
を有することを特徴とする生成装置。
(付記14)化合物の物質名について化学反応に応じた変換内容を規定したルールを記憶する第1の記憶部と、
化合物の物質名と別称とを対応付けて記憶する第2の記憶部と、
前記第1の記憶部を参照して、対象化合物の物質名を前記変換内容にしたがって変換し、前記第2の記憶部を参照して、変換した変換後の物質名に対応する別称を特定し、特定した前記別称を、前記変換内容とは逆の変換内容にしたがって変換して変換結果を出力する制御部と、
を有することを特徴とする生成装置。