JP7116186B2

JP7116186B2 - 化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置

Info

Publication number: JP7116186B2
Application number: JP2020546219A
Authority: JP
Inventors: 淳中林
Original assignee: Fujifilm Corp
Current assignee: Fujifilm Corp
Priority date: 2018-09-14
Filing date: 2019-09-13
Publication date: 2022-08-09
Anticipated expiration: 2039-09-13
Also published as: EP3852114A4; EP3852114A1; WO2020054841A1; CN112689878A; IL281387A; JPWO2020054841A1; US20210193274A1

Description

本発明は化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置に関し、特に所望の物性値を有する化合物の構造を探索する技術に関する。

所望の物性値を有する化合物の構造の探索は従来、主として「順問題」（問題の原因としての分子構造を与えて、結果である物性値を求める）を解くことにより行われてきたが、近年のインフォマティクスの発展に伴い「逆問題」（物性値を与えて、その物性値を有する分子構造を求めること）の解法についての研究が急速に進められている。逆問題を解くことによる構造の探索については、例えば非特許文献１が知られている。非特許文献１では、物性値の目標値を与え、（１）複数の初期構造（化学構造）を生成し、（２）各構造をランダムに変化させ、（３）各構造の物性値を見積もり、（４）物性値と目標値の距離を基準に構造の変化を採用または棄却して、目標値に近い物性値を有する構造を求めることが記載されている（この過程で、（２）から（４）の処理が繰り返される）。

非特許文献1 : “Bayesian molecular design with a chemical language model”、Hisaki Ikebata他、［２０１８年７月２３日検索］、インターネット（https://www.ncbi.nlm.nih.gov/pubmed/28281211）

非特許文献１に記載のｉｑｓｐｒ（Inverse Quantitative Structure-Property Relationship）では探索効率がすぐに低下してしまうという問題があった。例えば、図２１は波長５００ｎｍに対応する第１励起エネルギー（57.2kcal/mol）を持つ化合物の探索結果を示す図である（量子化学計算用ソフトウェア“Gaussian16”を用いてZINDOにより計算し、各試行における上位１００化合物の平均値をプロットした）。ｉｑｓｐｒでは図２１に示すように探索がすぐにローカルミニマム（構造をどのように微小変化させても物性値が目標値から遠ざかる状態）に陥ってしまい、探索が鈍化する。このように探索が鈍化する原因は、構造更新のアルゴリズム（ベイズ推定に基づく粒子フィルタ）に存在する。図２２は粒子フィルタのアルゴリズムを示す概念図であり、同図の（ａ）部分に示す初期状態から物性値に基づいて重みを計算すると同図の（ｂ）部分に示す状態になる。この状態から重みに基づいて復元抽出を行う（同じ構造の抽出を許容する）と、図２２の（ｃ）部分に示すように物性値が目標から遠かった構造Ｃ，Ｄが除去される。

また、図２３は化合物の初期構造式（左側の列）と１０試行目の構造式（右側の列）との関係の例を示す表であり、初期状態で多様な構造を与えたにもかかわらず試行を繰り返すうちに類似の構造ばかりになった状態を示している。図２１～２３に示すように、ベイズ推定に基づく構造更新では物性値は目標値に近づくが探索用構造の多様性が減少し、探索がローカルミニマムに陥って、試行を繰り返してもローカルミニマム状態を中々脱出することができない（最終的な構造に到達できない）。

このように、従来の技術は化合物の構造を効率的に探索できるものではなかった。

本発明はこのような事情に鑑みてなされたもので、化合物の構造を効率的に探索できる化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置を提供することを目的とする。

上述した目的を達成するため、本発明の第１の態様に係る化合物探索方法は、一つまたは複数の化合物の化学構造と、化学構造における一つまたは複数の物性値と、物性値の目標値と、を入力する入力工程と、化学構造を変化させて候補構造を得る候補構造取得工程と、候補構造の物性値を算出する物性値算出工程と、候補構造を採用または棄却する候補構造採用工程であって、候補構造を採用するか否かを化学構造の変化により候補構造の物性値が物性値の目標値に近づいているか否かに基づいて判断する第１の採用処理を行い、第１の採用処理により候補構造が採用されなかった場合は、候補構造を採用するか否かを化学構造の変化により化学構造及び候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第２の採用処理を行い、第１の採用処理及び第２の採用処理により候補構造が採用されなかった場合は化学構造の変化を棄却して変化をさせる前の化学構造に戻す棄却処理を行う候補構造採用工程と、終了条件を満たすまで、入力工程、候補構造取得工程、物性値算出工程、及び候補構造採用工程における処理を繰り返させる制御工程と、を有する。

第１の態様では、候補構造を採用するか否かを化学構造の変化により候補構造の物性値が物性値の目標値に近づいているか否かに基づいて判断する第１の採用処理を行い、第１の採用処理の結果候補構造が採用されなかった場合は、構造多様性が増加しているか否かに基づいて採用を判断する第２の採用処理を行い、第１の採用処理及び第２の採用処理の結果、候補構造が採用されなかった場合は化学構造の変化を棄却して変化をさせる前の化学構造に戻す棄却処理を行うので、構造の多様性に基づいてローカルミニマムからの脱出を促進し、所望の物性値（目標値）を有する化合物の構造を効率的に探索することができる。

なお第１の態様及び以下の各態様において、「化学構造」は初期状態における構造（初期構造）に加えて、初期構造が処理の繰り返しにより変化した構造を含む。

上述した目的を達成するため、本発明の第２の態様に係る化合物探索方法は、一つまたは複数の化合物の化学構造と、化学構造における一つまたは複数の物性値と、物性値の目標値と、を入力する入力工程と、化学構造を変化させて候補構造を得る候補構造取得工程と、候補構造の物性値を算出する物性値算出工程と、候補構造を採用または棄却する候補構造採用工程であって、候補構造を採用するか否かを化学構造の変化により化学構造及び候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第２の採用処理を行い、第２の採用処理により候補構造が採用されなかった場合は、候補構造を採用するか否かを化学構造の変化により候補構造の物性値が物性値の目標値に近づいているか否かに基づいて判断する第１の採用処理を行い、第１の採用処理及び第２の採用処理により候補構造が採用されなかった場合は化学構造の変化を棄却して変化をさせる前の化学構造に戻す棄却処理を行う候補構造採用工程と、終了条件を満たすまで、入力工程、候補構造取得工程、物性値算出工程、及び候補構造採用工程における処理を繰り返させる制御工程と、を有する。

第２の態様では、候補構造を採用するか否かを化学構造の変化により化学構造及び候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第２の採用処理を行い、第２の採用処理により候補構造が採用されなかった場合は、候補構造を採用するか否かを化学構造の変化により候補構造の物性値が物性値の目標値に近づいているか否かに基づいて判断する第１の採用処理を行い、第１の採用処理及び第２の採用処理により候補構造が採用されなかった場合は化学構造の変化を棄却して変化をさせる前の化学構造に戻す棄却処理を行う。すなわち、第１，第２の採用処理の順序が第１の態様と異なる（第１，第２の採用処理の内容は第１の態様と同様である）。このような態様によっても、第１の態様と同様に、構造の多様性に基づいてローカルミニマムからの脱出を促進し、所望の物性値（目標値）を有する化合物の構造を効率的に探索することができる。

第３の態様に係る化合物探索方法は第１または第２の態様において、候補構造採用工程では、第１の採用処理として、候補構造の物性値と物性値の目標値との差分（第１の差分）の絶対値が化学構造の物性値と物性値の目標値との差分（第２の差分）の絶対値以下である場合は候補構造を採用する処理を行い、候補構造の物性値と物性値の目標値との差分（第１の差分）の絶対値が化学構造の物性値と物性値の目標値との差分（第２の差分）の絶対値より大きい場合は、候補構造の物性値と物性値の目標値との差分（第１の差分）に基づいて第１の関数により第１の採用確率を算出し、候補構造を第１の採用確率で採用する処理を行う。第３の態様では、第１の差分の絶対値が第２の差分の絶対値以下である場合は、構造の変化により物性値が目標値に対し遠ざかっていない場合であり、候補構造を採用する。これに対し第１の差分の絶対値が第２の差分の絶対値より大きい場合は、構造の変化により物性値が目標値に対し遠ざかっている場合であり、第１の採用確率で採用する。

第４の態様に係る化合物探索方法は第３の態様において、第１の関数は候補構造の物性値と物性値の目標値との差分（第１の差分）の絶対値と、化学構造の物性値と物性値の目標値との差分（第２の差分）の絶対値と、の差分（第３の差分）に対する単調減少関数である。第４の態様では、第１の関数は第３の差分に対する単調減少関数なので、第３の差分が大きくなるほど（すなわち、構造の変化により物性値が目標値から遠ざかるほど）採用確率が減少する。

上述した目的を達成するため、本発明の第５の態様に係る化合物探索方法は、一つまたは複数の化合物の化学構造と、化学構造における一つまたは複数の物性値と、物性値の目標値と、を入力する入力工程と、化学構造を変化させて候補構造を得る候補構造取得工程と、候補構造の物性値を算出する物性値算出工程と、候補構造を採用または棄却する候補構造採用工程であって、化学構造の変化によって候補構造の物性値が物性値の目標値に近づいているか否かに基づいて、候補構造の採用に用いる第１の採用確率を算出する第１の算出処理と、化学構造の変化によって化学構造及び候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて、候補構造の採用に用いる第２の採用確率を算出する第２の算出処理と、を行い、候補構造を第１の採用確率及び第２の採用確率に基づいて採用する採用処理を行い、採用処理の結果、候補構造が採用されなかった場合は、化学構造の変化を棄却して変化をさせる前の化学構造に戻す棄却処理を行う候補構造採用工程と、終了条件を満たすまで、入力工程、候補構造取得工程、物性値算出工程、及び候補構造採用工程における処理を繰り返させる制御工程と、を有する。

第５の態様は、第１，第２の算出処理を並行に行い、第１，第２の採用確率に基づいて候補構造を採用する点が第１，第２の態様と異なる。このような態様によっても、第１，第２の態様と同様に、構造の多様性に基づいてローカルミニマムからの脱出を促進し、所望の物性値（目標値）を有する化合物の構造を効率的に探索することができる。

第６の態様に係る化合物探索方法は第５の態様において、候補構造採用工程では、候補構造の物性値と物性値の目標値との差分の絶対値が化学構造の物性値と物性値の目標値との差分の絶対値以下である場合は候補構造を採用する処理を行い、候補構造の物性値と物性値の目標値との差分の絶対値が化学構造の物性値と物性値の目標値との差分の絶対値より大きい場合は、候補構造の物性値と物性値の目標値との差分に基づいて第１の関数により第１の採用確率を算出する処理と、構造群の構造多様性の増減量を算出し、増減量に基づいて第２の関数により第２の採用確率を算出する処理と、を行う。

第７の態様に係る化合物探索方法は第４または第６の態様において、候補構造採用工程では、変化をする前の化学構造により構成される第１の構造群の構造多様性と、少なくとも１回の変化をした後の化学構造により構成される第２の構造群の構造多様性と、の差分を増減量として算出する。

第８の態様に係る化合物探索方法は第４または第６の態様において、候補構造採用工程では、少なくとも１回の変化をした後の構造群の少なくとも一部を含む第１の構造群の構造多様性と、第１の構造群に候補構造を加えた第２の構造群の構造多様性と、の差分を増減量として算出する。

第９の態様に係る化合物探索方法は第３または第６の態様において、第１の関数は候補構造の物性値と物性値の目標値との差分の絶対値と、化学構造の物性値と物性値の目標値との差分の絶対値と、の差分に対する単調減少関数である。

第１０の態様に係る化合物探索方法は第４または第６の態様において、第２の関数は構造多様性の増減量に対する単調増加関数である。

第１１の態様に係る化合物探索方法は第１から第１０の態様のいずれか１つにおいて、候補構造取得工程では、化学構造に原子または原子団を追加または削除して対象構造を生成し、対象構造を候補構造とする。第１１の態様は対象構造の生成方法を規定するものである。なお、追加または削除は１原子単位で行ってもよいし、原子団（２以上の原子の集団）単位で行ってもよい。

第１２の態様に係る化合物探索方法は第１から第１１の態様のうちいずれか１つにおいて、制御工程では、化学構造を変化させた回数が指定した回数に達した場合、及び／または候補構造の物性値が目標値に到達した場合に終了条件を満たしたと判定して入力工程、候補構造取得工程、物性値算出工程、及び候補構造採用工程の処理を終了させる。第１２の態様は終了条件を具体的に規定するものである。

上述した目的を達成するため、本発明の第１３の態様に係る化合物探索プログラムは第１から第１２の態様のいずれか１つに係る化合物探索方法をコンピュータに実行させる。第１３の態様によれば、第１から第１２の態様のいずれか１つに係る化合物探索方法により、所望の物性値を有する化合物の構造を効率的に探索することができる。なお、第１３の態様における「コンピュータ」は、ＣＰＵ（Central Processing Unit）等の各種プロセッサを１つ以上用いて実現することができる。

上述した目的を達成するため、本発明の第１４の態様に係る記録媒体は非一時的かつコンピュータ読取可能な記録媒体であって、記録媒体に格納された指令がコンピュータによって読み取られた場合に第１３の態様に係るプログラムをコンピュータに実行させる。第１４の態様に係る記録媒体は、第１３の態様に係るプログラムのコンピュータ読み取り可能なコードを記録することにより実現することができる。

上述した目的を達成するため、本発明の第１５の態様に係る化合物探索装置は、一つまたは複数の化合物の化学構造と、化学構造における一つまたは複数の物性値と、物性値の目標値と、を入力する入力部と、化学構造を変化させて候補構造を得る候補構造取得部と、候補構造の物性値を算出する物性値算出部と、候補構造を採用または棄却する候補構造採用部であって、候補構造を採用するか否かを化学構造の変化により候補構造の物性値が物性値の目標値に近づいているか否かに基づいて判断する第１の採用処理を行い、第１の採用処理により候補構造が採用されなかった場合は、候補構造を採用するか否かを化学構造の変化により化学構造及び候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第２の採用処理を行い、第１の採用処理及び第２の採用処理により候補構造が採用されなかった場合は化学構造の変化を棄却して変化をさせる前の化学構造に戻す棄却処理を行う候補構造採用部と、終了条件を満たすまで、入力部、候補構造取得部、物性値算出部、及び候補構造採用部における処理を繰り返させる制御部と、を有する。第１５の態様によれば、第１の態様と同様に所望の特性を有する化合物の構造を効率的に探索することができる。なお、第１５の態様に係る化合物探索装置に対し第３～第４，第７～第１２の態様と同様の構成をさらに含めてもよい。

上述した目的を達成するため、本発明の第１６の態様に係る化合物探索装置は、一つまたは複数の化合物の化学構造と、化学構造における一つまたは複数の物性値と、物性値の目標値と、を入力する入力部と、化学構造を変化させて候補構造を得る候補構造取得部と、候補構造の物性値を算出する物性値算出部と、候補構造を採用または棄却する候補構造採用部であって、候補構造を採用するか否かを化学構造の変化により化学構造及び候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第２の採用処理を行い、第２の採用処理により候補構造が採用されなかった場合は、候補構造を採用するか否かを化学構造の変化により候補構造の物性値が物性値の目標値に近づいているか否かに基づいて判断する第１の採用処理を行い、第１の採用処理及び第２の採用処理により候補構造が採用されなかった場合は化学構造の変化を棄却して変化をさせる前の化学構造に戻す棄却処理を行う候補構造採用部と、終了条件を満たすまで、入力部、候補構造取得部、物性値算出部、及び候補構造採用部における処理を繰り返させる制御部と、を有する。第１６の態様によれば、第２の態様と同様に所望の特性を有する化合物の構造を効率的に探索することができる。なお、第１６の態様に係る化合物探索装置に対し第３～第４，第７～第１２の態様と同様の構成をさらに含めてもよい。

上述した目的を達成するため、本発明の第１７の態様に係る化合物探索装置は、一つまたは複数の化合物の化学構造と、化学構造における一つまたは複数の物性値と、物性値の目標値と、を入力する入力部と、化学構造を変化させて候補構造を得る候補構造取得部と、候補構造の物性値を算出する物性値算出部と、候補構造を採用または棄却する候補構造採用部であって、候補構造を採用する第１の採用確率を化学構造の変化により候補構造の物性値が物性値の目標値に近づいているか否かに基づいて算出する第１の算出処理と、候補構造を採用する第２の採用確率を化学構造の変化により化学構造及び候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて算出する第２の算出処理と、を並行して行い、候補構造を第１の採用確率及び第２の採用確率に基づいて採用する採用処理を行い、採用処理の結果、候補構造が採用されなかった場合は、化学構造の変化を棄却して変化をさせる前の化学構造に戻す棄却処理を行う候補構造採用部と、終了条件を満たすまで、入力部、候補構造取得部、物性値算出部、及び候補構造採用部における処理を繰り返させる制御部と、を有する。第１７の態様によれば、第５の態様と同様に所望の特性を有する化合物の構造を効率的に探索することができる。なお、第１７の態様に係る化合物探索装置に対し第６～第１２の態様と同様の構成をさらに含めてもよい。

以上説明したように、本発明の化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置によれば、化合物の構造を効率的に探索することができる。

図１は、第１の実施形態に係る化合物探索装置の構成を示すブロック図である。図２は、処理部の構成を示すブロック図である。図３は、化合物探索方法の手順を示すフローチャートである。図４は、実施例における化学構造の変化を示す図である。図５は、変化前後の化学構造群を示す図である。図６は、変化前後の化学構造についてのextended fingerprintの算出結果を示す図である。図７は、構造の多様性を説明するための図である。図８は、構造変化を採用する様子を示す図である。図９は、構造変化を棄却する様子を示す図である。図１０は、構造群についての構造変化の評価結果を示す図である。図１１は、目標値に最も近い物性値を持つ化学構造を示す図である。図１２は、処理を繰り返すにつれて化学構造が変化していく様子を示す図である。図１３は、目標とする物性値を持つ他の化学構造を示す図である。図１４は、ベイズ推定及び本発明による探索結果を示す図である。図１５は、ベイズ推定及び本発明によるλmaxの変化の様子を示す図である。図１６は、ベイズ推定及び本発明による構造多様性を示す図である。図１７は、２つの多様性評価方法についての目標達成に必要な試行回数を示す図である。図１８は、多様性の比較対象にメチルイエローを入れた場合の構造探索の結果を示す表である。図１９は、第２の実施形態に係る化合物探索方法の手順を示すフローチャートである。図２０は、第３の実施形態に係る化合物探索方法の手順を示すフローチャートである。図２１は、従来の手法ではローカルミニマムに陥る様子を示す図である。図２２は、従来の手法では構造の多様性が減少する様子を示す図である。図２３は、従来の手法で構造の多様性が減少した状態を示す図である。

以下、添付図面を参照しつつ、本発明に係る化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置の実施形態について詳細に説明する。

＜第１の実施形態＞
図１は第１の実施形態に係る化合物探索装置１０（化合物探索装置）の構成を示すブロック図である。図１に示すように、化合物探索装置１０は処理部１００、記憶部２００、表示部３００、及び操作部４００を備え、互いに接続されて必要な情報が送受信される。これらの構成要素については各種の設置形態を採用することができ、各構成要素が１箇所（１筐体内、１室内等）に設置されていてもよいし、離れた場所に設置されネットワークを介して接続されていてもよい。また、化合物探索装置１０はインターネット等のネットワーク１０００を介して外部サーバ５００及び外部データベース５１０に接続され、入力データ等の必要な情報を取得することができる。

＜処理部の構成＞
図２は処理部１００の構成を示す図である。処理部１００は入力部１０２（入力部）、候補構造取得部１０４（候補構造取得部）、物性値算出部１０６（物性値算出部）、候補構造採用部１０８（候補構造採用部）、制御部１１０（制御部）、表示制御部１１２（表示制御部）、ＣＰＵ１２０（ＣＰＵ：Central Processing Unit）、ＲＯＭ１２２（ＲＯＭ：Read Only Memory）、及びＲＡＭ１２４（ＲＡＭ：Random Access Memory）を備える。これら処理部１００の各部を用いた化合物探索方法の手順については、詳細を後述する。なお、各部での処理はＣＰＵ１２０の制御の下で行われる。

上述した処理部１００の各部の機能は、各種のプロセッサ（processor）を用いて実現できる。各種のプロセッサには、例えばソフトウェア（プログラム）を実行して各種の機能を実現する汎用的なプロセッサであるＣＰＵが含まれる。また、上述した各種のプロセッサには、画像処理に特化したプロセッサであるＧＰＵ（Graphics Processing Unit）、ＦＰＧＡ（Field Programmable Gate Array）などの製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス（Programmable Logic Device：ＰＬＤ）も含まれる。さらに、ＡＳＩＣ（Application Specific Integrated Circuit）などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路なども上述した各種のプロセッサに含まれる。

各部の機能は１つのプロセッサにより実現されてもよいし、同種または異種の複数のプロセッサ（例えば、複数のＦＰＧＡ、あるいはＣＰＵとＦＰＧＡの組み合わせ、またはＣＰＵとＧＰＵの組み合わせ）で実現されてもよい。また、複数の機能を１つのプロセッサで実現してもよい。複数の機能を１つのプロセッサで構成する例としては、第１に、クライアント、サーバなどのコンピュータに代表されるように、１つ以上のＣＰＵとソフトウェアの組合せで１つのプロセッサを構成し、このプロセッサが複数の機能として実現する形態がある。第２に、システムオンチップ（System On Chip：ＳｏＣ）などに代表されるように、システム全体の機能を１つのＩＣ（Integrated Circuit）チップで実現するプロセッサを使用する形態がある。このように、各種の機能は、ハードウェア的な構造として、上述した各種のプロセッサを１つ以上用いて構成される。さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子などの回路素子を組み合わせた電気回路（circuitry）である。これらの電気回路は、論理和、論理積、論理否定、排他的論理和、及びこれらを組み合わせた論理演算を用いて上述した機能を実現する電気回路であってもよい。

上述したプロセッサあるいは電気回路がソフトウェア（プログラム）を実行する際は、実行するソフトウェアのプロセッサ読み取り可能なコード（コンピュータ読み取り可能なコード）をＲＯＭ１２２（図２を参照）等の非一時的記録媒体（記録媒体）に記憶しておき、プロセッサがそのソフトウェアを参照する。非一時的記録媒体に記憶しておくソフトウェアは、本発明に係る化合物探索方法を実行するためのプログラム（化合物探索プログラム）を含み、記録媒体に格納された指令がコンピュータによって読み取られた場合に、その指令がコンピュータに化合物探索プログラムを実行させる。ＲＯＭ１２２ではなく各種光磁気記録装置、半導体メモリ等の非一時的記録媒体にコードを記録してもよい。ソフトウェアを用いた処理の際には例えばＲＡＭ１２４が一時的記憶領域として用いられ、また例えば不図示のＥＥＰＲＯＭ（Electronically Erasable and Programmable Read Only Memory）に記憶されたデータを参照することもできる。

＜記憶部の構成＞
記憶部２００はＤＶＤ（Digital Versatile Disk）、ハードディスク（Hard Disk）、各種半導体メモリ等の非一時的記録媒体及びその制御部により構成され、化合物の化学構造（初期構造、候補構造）及びその物性値等を記憶することができる。

＜表示部及び操作部の構成＞
表示部３００はモニタ３１０（表示装置）を備えており、入力した画像、記憶部２００に記憶された情報、処理部１００による処理の結果等を表示することができる。操作部４００は入力デバイス及び／またはポインティングデバイスとしてのキーボード４１０及びマウス４２０を含んでおり、ユーザはこれらのデバイス及びモニタ３１０の画面を介して、本発明に係る化合物探索方法の実行に必要な操作を行うことができる。ユーザは、例えば処理開始指示、物性値の目標値、第１の関数及び第２の関数に用いるパラメータ、繰り返し回数の指定を行うことができる。

＜化合物探索方法の手順＞
図３は本発明に係る化合物探索方法の手順を示すフローチャートである。

＜データの入力＞
入力部１０２は、一つまたは複数の化合物の化学構造（初期構造）と、化学構造（初期構造）における一つまたは複数の物性値と、物性値の目標値と、を入力する（ステップＳ１０１０：入力工程）。これらのデータは記憶部２００に記憶されていたものを用いてもよいし、ネットワーク１０００を介して外部サーバ５００及び外部データベース５１０から取得してもよい。どのようなデータを入力するかを、操作部４００を介したユーザの指示入力に応じて決定してもよい。初期構造は１つでもよいし複数でもよい。また、物性値も１つでもよいし複数でもよい。物性値を与える方法としては、量子化学計算や分子動力学計算、あるいは機械学習の結果を用いるなど、スループットの早い方法が望ましい。一方で、化合物の合成や物性測定のスループットに実用上の問題が無ければ、実測値を用いることも可能である。

＜候補構造の取得＞
候補構造取得部１０４は、化学構造をランダムに変化させて候補構造を得る（ステップＳ１０２０：候補構造取得工程）。この際、化学構造を変化させられる方法であれば何を用いてもよい。例えば、化学構造に原子または原子団を追加または削除して対象構造を生成し、対象構造を候補構造とする方法を用いることができる。この方法は、具体的には（Ａ）合成適性を評価する基準の化合物データベース、及び化合物構造（化学構造）を準備する工程と、（Ｂ）化合物構造への原子または原子団の追加、または化合物構造からの原子の削除のいずれかを選択する工程と、（Ｃ）化合物構造への原子の追加を選択した場合、化合物構造に含まれる原子の中から選択された原子に新規原子を結合させ、または化合物構造への原子の削除を選択した場合、化合物構造に含まれる原子の中から選択された原子を削除し、改変された化合物構造を得る工程と、（Ｄ）改変された化合物構造の合成適性を、化合物データベースの情報に基づいて判断する工程と、（Ｅ）改変された化合物構造が合成適性を有する場合は改変を確率的に許容し、改変された化合物構造が合成適性を有さない場合は改変を確率的に棄却する工程と、（Ｆ）工程（Ｅ）を経た化合物構造が終了条件を満たすまで、工程（Ｂ）～（Ｅ）を繰り返す工程と、を備える化合物構造の生成方法である。なお、発生させた候補構造を表示制御部１１２によりモニタ３１０（表示装置）に表示させてもよい。また、後述するステップＳ１０９０からステップＳ１０２０に戻ってきたときに、前回発生させた構造の中で物性値が目標値に近かった構造を、合成適性を評価するための化合物データベース（構造群）に一つまたは複数追加し、ステップＳ１０２０において目標値に近い物性値を持つ構造を少しずつ発生させやすくすることもできる。

＜物性値の評価＞
物性値算出部１０６は、候補構造（ステップＳ１０２０で変化させた構造）の物性値を算出する（ステップＳ１０３０：物性値算出工程）。物性値の算出には、初期構造の物性値を見積もったときと同じ方法を用いることが好ましい。

＜第１の採用処理＞
候補構造採用部１０８は、物性値が目標値に近づいているか否かを判断する（ステップＳ１０４０：候補構造採用工程）。具体的には、構造変化前の物性値をｆ0、構造変化後の物性値をｆ1、物性値の目標値をＦとしたときに、｜Ｆ－ｆ１｜≦｜Ｆ－ｆ０｜が成り立つ場合（候補構造の物性値と物性値の目標値との差分（第１の差分）の絶対値が化学構造の物性値と物性値の目標値との差分（第２の差分）の絶対値以下である場合）は、物性値が目標値に近づいている（遠ざかっていない）のでステップＳ１０７０へ進んで構造変化を採用する（第１の採用処理）。一方、｜Ｆ－ｆ１｜＞｜Ｆ－ｆ０｜である場合（候補構造の物性値と物性値の目標値との差分（第１の差分）の絶対値が化学構造の物性値と物性値の目標値との差分（第２の差分）の絶対値より大きい場合）はステップＳ１０５０へ進む。

ステップＳ１０５０（候補構造採用工程）では、候補構造採用部１０８は候補構造の物性値と物性値の目標値との差分に基づいて第１の関数により第１の採用確率を算出する（第１の採用処理）。具体的には、候補構造採用部１０８はｄ＝｜Ｆ－ｆ１｜－｜Ｆ－ｆ０｜の単調減少関数Ｐ１（ｄ）を与え、確率ｐ１＝Ｐ１（ｄ）を見積もる。単調減少関数Ｐ１（ｄ）は本発明における「第１の関数」（候補構造の物性値と物性値の目標値との差分の絶対値と、化学構造の物性値と物性値の目標値との差分の絶対値と、の差分に対する単調減少関数）に相当し、確率ｐ１は本発明における「第１の採用確率」に相当する。

単調減少関数Ｐ１（ｄ）としては種々の関数を用いることができるが、例えば以下の式（１）で表される関数を用いることができる。σはハイパーパラメータであり、σの値を変えることで単調減少の度合いを調節することができる。操作部４００を介したユーザの指示入力によりパラメータの値を変更してもよい。

ｎ目的（ステップＳ１０１０で入力された物性値がｎ個）の場合は、各目的を表す指標をｉとして、例えば以下の式（２）及び式（３）で表される関数を用いることができる。

式（２）及び式（３）で表される関数は「１つでも目標に近づく物性値があればその構造変化を採用する」という基準であるが、他にも様々な関数を用いることができる。また、もっと単純にはｎ目的の物性値をｎ次元のベクトルｆｆ及びＦＦとして考え、Ｅｕｃｌｉｄ距離｜ＦＦ－ｆｆ｜からｄ＝｜ＦＦ－ｆｆ１｜－｜ＦＦ－ｆｆ０｜を見積もって単目的の問題として解くという方法も考えられる（ｆｆ，ｆｆ０，ｆｆ１，ＦＦはベクトルであるものとする）。この方針を取る場合には、既存のデータから各物性値の平均と分散を計算しておき、標準化を実施してから距離を計算することが望ましい。

確率ｐ１が求められたら、候補構造採用部１０８は適当に発生させた乱数を用いて、確率ｐ１でステップＳ１０７０に進んで構造変化を採用し、確率（１－ｐ１）でステップＳ１０５５に進む。すなわち、ステップＳ１０５０において、候補構造採用部１０８は候補構造を第１の採用確率で採用する（第１の採用処理）。このように確率的処理を行う（物性値が目標値から遠ざかっている場合でも、確率ｐ１で構造変化を採用する）のは、ローカルミニマムへの落ち込みを防ぐためである。ローカルミニマムとは「構造をどのように変化させても物性値が目標値から遠ざかる状態」であり、ローカルミニマムを脱出してグローバルミニマムに達するには必ず物性値が目標値から遠ざかる構造変化を経る必要がある。上述した確率的処理により、このようなパスを確保することができる。

＜第２の採用処理＞
ステップＳ１０５０において第１の採用処理の結果候補構造が採用されなかった場合（確率（１－ｐ１）で起こりうる）、候補構造採用部１０８は、候補構造を採用するか否かを「化学構造の変化により、化学構造及び候補構造により構成される構造群の構造多様性が増加しているか否か」に基づいて判断する第２の採用処理を行う（ステップＳ１０５５，Ｓ１０６０，Ｓ１０７０）。第２の採用処理について以下説明する。なお、構造を表す指標をjとして、構造群をＳ={sj}と表す。構造群Ｓの構造多様性を与える関数をＶ（Ｓ）と表記する。Ｖ（Ｓ）は構造多様性が大きいほど大きな値を取るものとする。

＜構造多様性の評価方法（その１）＞
初期構造をＮ（＞１）個与えた場合に、Ｎ個の化学構造のうちのｋ番目の化学構造の構造変化の採用または棄却を考えているとする。ｍ回目の試行において、構造変化前（ｍ－１回目）の構造群Ｓm-1={s(m-1)j}と変化後（ｍ回目）の構造群Ｓm＝｛smj｝から、ｋ番目の化学構造の構造変化後の構造群Ｓｋ＝｛s(m-1)0, s(m-1)1, ..., smk, ..., s(m-1)N｝を定義し、ｄｖ＝Ｖ（Ｓｋ）－Ｖ（Ｓm-1）を見積もる。ｄｖは構造変化による構造多様性の増減量を示す。ｄｖ≧０の場合(ｋ番目の構造変化によって多様性が向上する場合；ステップＳ１０５５でＹｅｓ)には、ｄｖ（構造多様性の増減量）に対する単調増加関数Ｐ２（ｄｖ）を与え、確率ｐ２＝Ｐ２（ｄｖ）を算出する（ステップＳ１０６０：第２の採用処理）。そして、適当に発生させた乱数を用いて確率ｐ２でステップＳ１０７０（構造変化を採用する；第２の採用処理）に進み、確率（１－ｐ２）でステップＳ１０８０（構造変化を棄却し、元の構造に戻す；棄却処理）に進む。単調増加関数Ｐ２（ｄｖ）は本発明における「第２の関数」に相当し、確率ｐ２は本発明における「第２の採用確率」に相当する。

構造多様性が増加する場合に上述した確率的処理（単調増加関数Ｐ２（ｄｖ）により算出した確率ｐ２で候補構造を算出する）を行うのは、「構造多様性が増加する場合に必ず構造変化を採用する」とした場合、物性値が目標値から遠ざかるにも関わらず構造変化が採用される頻度が高くなりすぎてしまい、結果として物性値の目標値への収束が遅くなる場合があるためである。上述した確率的処理を行うことにより、物性値の収束を早め化合物の構造を効率的に探索することができる。

なお、ステップＳ１０６０で算出したｄｖ＜０の場合(多様性が減少する場合；ステップＳ１０５５でＮｏ)にはステップＳ１０８０（構造変化を棄却し、元の構造に戻す；棄却処理）に進む。

＜構造多様性の評価方法（その２）＞
上述した「構造多様性の評価方法（その１）」に代えて、試行を表す指標をｔとして、過去ｍ回の試行で得た構造群Ｓprev＝｛Ｓt-1, Ｓt-2, ..., Ｓt-m｝（ただし、ｔ＝ｍの場合に現れるＳ0は初期構造とする）と、採用または棄却を考えている構造stを加えた構造群Ｓcurr＝｛st, Ｓt-1, ..., Ｓt-(m-1)｝とを考え、ｄｖ＝Ｖ（Ｓcurr）－Ｖ（Ｓprev）を算出し、単調増加関数Ｐ２（ｄｖ）により確率ｐ２を算出（ステップＳ１０６０：第２の採用処理）してもよい。すなわち、構造群Ｓprevは初期構造および少なくとも１回の変化をした後の化学構造により構成される構造群（第１の構造群）であり、構造群Ｓcurrは第１の構造群に候補構造を加えた構造群（第２の構造群）である。Ｓprev（第１の構造群）は、初期構造および少なくとも１回の変化をした後の構造群の少なくとも一部を含んでいればよい。また、Ｖ（Ｓprev）、Ｖ（Ｓcurr）はそれぞれ構造群Ｓprev、Ｓcurrの構造多様性であり、ｄｖは構造変化による構造多様性の増減量を示す。また、初期構造および過去の試行で得た構造群の全てではなく、性能上位（物性値が目標値に近いほど順位が高い）または下位（物性値が目標値から遠いほど順位が低い）の構造を抜粋してＳprevとするのでもよいし、既存のライブラリの化合物（構造が既知の化合物）をＳprevに混ぜてもよい。このようなSprevの選択により、構造多様性の評価基準を柔軟に設定することができる。

「構造多様性の評価方法（その２）」では、多様性の評価基準となるＳprevに含まれる化学構造とは異なる候補構造が選ばれやすくなる。例えば、既存のライブラリの化合物（構造が既知の化合物）をＳprevに含めた場合、その「既存のライブラリの化合物」との構造の類似性が低い（既知の化合物とは構造が異なる）候補構造が選ばれやすくなる。また、性能が上位（物性値が目標値に近い）の構造を抜粋してＳprevとした場合は、「既出の性能上位の構造とは異なる構造的特徴を有する、性能上位の構造」が選ばれやすくなる。このため、なるべく多様な性能上位の構造を取得したい場合にこの条件を指定することができる。また、既存の性能上位のライブラリ化合物が何らかの理由で利用困難である場合（分解しやすい、毒性がある等）にも、これらをＳprevに加えて構造探索を実施することができる。一方、性能が下位の構造を抜粋してＳprevとした場合は、「既出の性能下位の構造とは異なる構造的特徴を有する性能上位の構造」が選ばれやすくなる。この探索で得られる性能上位の構造群の多様性は、性能が上位の構造を抜粋したときよりも低くなる可能性があるが、性能下位の構造を避けるように探索が進むので、探索自体は加速することができると考えられる。このように、Ｓprevの選び方に起因して最終的に得られる構造が異なる場合がある。

＜構造群の構造多様性を与える関数＞
上述した「構造群の構造多様性を与える関数」としては、たとえばTanimoto係数（化合物の類似度を表す指標の１つ）に基づく以下のような定義が考えられる(他にも様々な定義が可能である)。具体的には、構造sをビット列（０または１の数列）のfingerprint（化合物の一定の規則にしたがって固定長のベクトルに変換したものであり、様々な生成方法が知られている）で表したものをＦsとすると、Tanimoto係数の定義は以下の式（４）で表される。

ここで|Ｆs|はＦs中で１のビット数、|Ｆs∩Ｆs’|はＦsとＦs’で共通して１のビット数である。Ｔs,s’は、ＦsとＦs’が完全に一致している場合は１、全く一致していない場合は０となる。したがって、Ｔs,s’は構造sと構造s’の類似度を表す指標である。求めたいのは非類似度であるから、構造sと構造s’の非類似度ｖs,s’を以下の式（５）で定義する。

この非類似度ｖs,s’を用いて、構造群Ｓの非類似度（すなわち、構造群の構造多様性）を以下の式（６）で定義することができる。

Ｖ（Ｓ）は０から１までの値をとり、値が大きいほど構造群の構造多様性が高いことを示す。

また、構造多様性の増減量ｄｖに対する単調増加関数Ｐ２（ｄｖ）としては、たとえば以下の式（７）で表される関数を用いることができる。σｖとＣｖはハイパーパラメータであり、値を変えることで単調増加の度合いを調節することができる。操作部４００を介したユーザの指示入力によりこれらパラメータの値を変更してもよい。

関数形より明らかに、Ｐ２はｄｖ→∞の極限でＣｖとなる。したがって、Ｃｖは「十分に多様性が向上する構造変化の際に、その構造変化が採用される確率」を意味している。

＜処理の繰り返し＞
上述した第１の採用処理、第２の採用処理、及び棄却処理を、与えられた初期構造のそれぞれについて行い、全ての化学構造について上述の処理が終了すると１回の試行が終了する。

上述した第１の採用処理、第２の採用処理、及び棄却処理の結果として候補構造が採用または棄却されたら、制御部１１０は終了条件を満たすか否か判断する（ステップＳ１０９０：制御工程）。例えば、化学構造を変化させた回数（試行回数）が指定した回数に達した場合、及び／または候補構造の物性値が目標値に到達した場合に「終了条件を満たした」と判定することができる。複数の化学構造及び／または物性値を計算していた場合、「１つでも目標値に到達した化学構造及び／または物性値があれば計算を終了する」としてもよいし、「全ての構造及び／または物性値が目標に到達するまで試行を繰り返す」としてもよい。制御部１１０は、終了条件を満たすまで（ステップＳ１０９０でＮｏの間）ステップＳ１０２０からステップＳ１０８０までの処理（入力工程、候補構造取得工程、物性値算出工程、候補構造採用工程）を繰り返し、終了条件を満たしたら（ステップＳ１０９０でＹｅｓ）化合物探索方法の処理を終了する（ステップＳ１１００）。

＜第１の実施形態の効果＞
以上説明したように、第１の実施形態に係る化合物探索装置１０、化合物探索方法、記録媒体、及び化合物探索プログラムによれば、ローカルミニマムからの脱出を促進し、また物性値の収束を早めることができるので、所望の物性値を持つ化合物の構造を効率的に探索することができる。

＜実施例：色素の探索＞
本発明について、実施例に即して具体的に説明する。この実施例についても、図１，２に示す化合物探索装置１０（化合物探索装置）及び図３に示すフローチャート（化合物探索方法及び化合物探索プログラムの処理）により探索を行うことができる。

＜入力工程＞
実施例では、図４の（ａ）部分に示すように初期構造としてフェノールを２５個与える。物性値としてはλmax（最大吸収波長）を考え、目標値を３６７ｎｍとする。構造をＰＭ６レベルで最適化後、ZINDOでλmaxを計算する。計算には量子化学計算用ソフトウェア“Gaussian16”を用いた。これらの処理が図３のフローチャートのステップＳ１０１０（入力工程）に相当する。

＜候補構造取得工程＞
上述した初期構造をランダムに変化させる（ステップＳ１０２０：候補構造取得工程）。構造変化の手法としては、第１の実施形態と同様に化学構造に原子または原子団を追加または削除して対象構造を生成し、対象構造を候補構造とする方法を用いることができる。例えば、１つ目の構造が図４の（ｂ）部分から（ｃ）部分に示すように変化したとする。

＜物性値算出工程＞
この場合に、変化させた構造の物性値を見積もった結果が図４の（ｄ）部分に示すようにλmax＝２００（ｎｍ）であったとする（ステップＳ１０３０：物性値算出工程）。

＜候補構造採用工程：第１の採用処理＞
物性値が目標値に近づいているか否かを判断する（ステップＳ１０４０：第１の採用処理）。|Ｆ－ｆ１|＝|３６７－２００|＝１６７（ｎｍ）、|Ｆ－ｆ０|＝|３６７－２０７|＝１６０（ｎｍ）より、|Ｆ－ｆ１|＞|Ｆ－ｆ０|である（第１の差分の絶対値が第２の差分の絶対値より大きく、物性値が目標値から遠ざかっている）ので、ステップＳ１０４０の判断が否定されステップＳ１０５０（確率ｐ１の計算）に進む。物性値と目標値から、上述した第１の関数（第３の差分ｄに対する単調減少関数Ｐ１（ｄ））により確率ｐ１（第１の確率）を算出する。ここでは、σ＝１０（ｎｍ）として以下の式（８）のように計算する。

よって第１の構造変化が採用される可能性はほぼ５０％である。しかしながら、乱数を発生させて評価した結果は「構造変化を採用しない」であったとする。この場合、ステップＳ１０６０（確率ｐ２の計算；第２の採用処理）に進む。

＜候補構造採用工程：第２の採用処理＞
ステップＳ１０６０では、構造多様性の増減量を算出し、上述した第２の関数により確率ｐ２（第２の採用確率）を算出する。なお、図５に示すように初期構造群をＳ０とし、１回目の構造変化を考慮した構造群をＳ１とする。

まず、fingerprintを計算する。ここではＲ（オープンソースのプログラミング言語及びその開発環境）のライブラリｒｃｄｋを用い、extended fingerprintを見積もる。ビット列の長さは１０２４である。結果を図６に示す。図中の数字は、値が１になるビットの番号である。よって、変化前の構造ｓと変化後の構造ｓ’を図７に示すように置けば、以下の式（９），（１０），及び（１１）よりTanimoto係数及び構造の非類似度が求められる。

よって、構造群の非類似度は以下の式（１２）のように求められる。

したがって構造多様性の増減量を求めると（構造多様性は、上述した「構造多様性の評価方法（その１）」により評価）、増減量ｄｖ＝Ｖ（Ｓ１）－Ｖ（Ｓ０）≒０．０１７＞０である。すなわち構造変化によって多様性が向上するので、確率ｐ２（第２の採用確率）の計算（ステップＳ１０６０：第２の採用処理）に進む。上述した式（７）においてσｖ＝０．０１、Ｃｖ＝０．５とすると、確率ｐ２は式（１３）のように計算できる。

ステップＳ１０６０において乱数を発生させて評価した結果、構造変化を採用することになった場合は、ステップＳ１０７０に進む。そして１つ目の構造変化を正式に採用し、新たな構造としてベンゼンを登録する（図８を参照）。他の２４個の構造についても同様の処理を行う。

一方、ステップＳ１０６０において構造変化が採用されなかった場合はステップＳ１０８０に進み、図９に示すように構造を構造変化前のものに戻す（構造変化を棄却する；棄却処理）。

２５個の構造全てを評価した結果、図１０に示す構造群が得られたとする。なお、図１０の構造群中で初期構造のフェノールがそのまま残っているものは、ステップＳ１０６０（構造変化を確率ｐ２で採用）で構造変化が棄却されステップＳ１０８０に進んだ結果得られたものである。図１０に示す構造の中で最も目標値に近い物性値を持つものでもλmax＝２０８（ｎｍ）であり（図１１を参照）、目標値の３６７ｎｍには達していない。よってステップＳ１０９０の判断が否定され、ステップＳ１０２０に戻る（制御工程）。

以上の処理を繰り返したときの、構造とλmaxの変化の様子を図１２に示す。１１３試行目に現れた構造ではλmaxが目標と合致しており、本発明で逆問題を解くことによって目標の物性を持つ化合物を取得できることを確認できた。なお、１１３試行目に現れた構造はメチルイエローという実在の化合物である。物性値が目標に到達したのでここで処理を終了してもよいが、ここではさらに探索を続けたものとする。そして試行回数の上限を５００回に設定していたものとし、試行回数が上限の５００回に到達した（すなわち、ここでの終了条件を満たした）時点で処理を終了する（ステップＳ１０９０でＹｅｓの場合はステップＳ１１００へ進む；制御工程）。５００回の試行により、上述したメチルイエローの他にも、目的のλmaxを持つと期待される化合物構造を多数取得することができた（例えば、図１３の（ａ）部分及び（ｂ）部分に示す構造）。

＜他の手法との比較＞
他の手法としてよく用いられるのが、ベイズ推定である。ここではベイズ推定の一種である粒子フィルタを用いて計算した結果と本発明で得られた結果を比較する。上述した実施例と同様のλmax計算条件で、粒子フィルタを用いてλmax＝３６７(ｎｍ)の化合物の探索を実施した。５００試行目までに得た化合物の中で上位５０化合物のλmaxを、本発明の結果と共に示す(図１４を参照)。ベイズ推定ではλmaxが目標値と同等の化合物はわずかにしか得られていないが、本発明では上位５０化合物全てが目標値と同等のλmaxとなっていた。したがって、「本発明のほうがベイズ推定よりも効率良く構造探索をできている」といえる。

ベイズ推定で探索効率が低かった理由を明らかにするため、試行回数に対する上位５０化合物のλmaxの平均値をプロットした（図１５を参照）。その結果、ベイズ推定では探索が２度ローカルミニマムに陥っていることがわかった。これに対し、本発明では一度もローカルミニマムに陥ることなく、スムーズに探索ができていた。さらに、５００試行目の上位５０化合物の構造多様性(上述したＶ（Ｓ）の値)を調べた結果、本発明のほうがベイズ推定の場合と比較して多様性が大きくなっていた（図１６を参照）。これは、「物性値は目標値と同等でありながら、構造的にはより多様性に富んだものを取得できている」ということを意味する。

このように、本発明によれば、一般に用いられるベイズ推定の方法と比較して探索効率が顕著に向上した。また、得られる化合物の構造多様性もより高くなった。

＜構造多様性の評価方法と構造探索の効率との関係＞
上述の実施例では「構造多様性の評価方法（その１）」により構造の多様性を評価しているが、「構造多様性の評価方法（その２）」を用いる場合においても同等の効率で構造探索を実施することができる。具体的には、各試行における上位２０化合物（物性値が目標値に近い順に１位、２位、…とする）の目標λmax（３６７ｎｍ）との平均二乗誤差を計算した結果、図１７に示すように、「構造多様性の評価方法（その１）」、「構造多様性の評価方法（その２）」のいずれを用いた場合においても２０試行程度で“平均二乗誤差＜１００（ｎｍ^２）”を達成できた。なお、「構造多様性の評価方法（その２）」において、Ｓprevは、「過去の試行で生成した構造のうち物性値が目標値に近い上位１００個」とした。

＜他の実施例＞
多様性の比較対象にメチルイエロー（上述した「既存のライブラリの化合物」の一例）を含めた場合の構造探索結果を図１８に示す。構造探索の結果、メチルイエローは発生せず、かつメチルイエローとの類似性が低い（Tanimoto係数が小さい）候補化合物を多く得ることができた。なお、図１８における数値は５００試行目における値である。また、上述のようにTanimoto係数は化合物の構造の類似度を表す指標の１つであり、０から１の値をとる（１に近いほど類似性が高い）。

＜第２の実施形態＞
次に、本発明の第２の実施形態について説明する。上述した第１の実施形態ではまず第１の採用処理を行い、第１の採用処理により候補構造が採用されなかった場合は第２の採用処理を行っているが、第２の実施形態では第１の実施形態と逆にまず第２の採用処理を行い、第２の採用処理により候補構造が採用されなかった場合は第１の採用処理を行う。

第２の実施形態において、化合物探索装置１０（化合物探索装置）の構成は第１の実施形態と同様に図１，２に示す構成を採用することができる。

図１９は、第２の実施形態に係る化合物探索方法及び化合物探索プログラムの処理を示すフローチャートである。なお、図１９において図３と同様の処理を行うステップには同一のステップ番号を付し、詳細な説明を省略する。また、非一時的かつコンピュータ読取可能な記録媒体であって、記録媒体に格納された指令がコンピュータによって読み取られた場合に図１９のフローチャートに係るプログラムをコンピュータに実行させる記録媒体も、第２の実施形態の一態様である。

候補構造採用部１０８（候補構造採用部）がステップＳ１０４０でＮｏ（物性値が目標値に近づいていない）と判断した場合、ステップＳ１０５２へ進む。ステップＳ１０５２（第２の採用処理）の内容は図３のステップＳ１０５５と同様であり、候補構造採用部１０８は、上述した「構造多様性の評価方法（その１）」または「構造多様性の評価方法（その２）」により構造多様性を評価することができる。

ステップＳ１０５２において判断が肯定されたらステップＳ１０５７へ進み、候補構造採用部１０８は、図３のステップＳ１０６０と同様に単調増加関数Ｐ２（ｄｖ）により確率ｐ２（第２の採用確率）を算出する（第２の採用処理）。確率ｐ２が求められたら、候補構造採用部１０８は適当に発生させた乱数を用いて、確率ｐ２で構造変化を採用する（ステップＳ１０７０：第２の採用処理）。ステップＳ１０５７で構造変化が採用されなかった場合はステップＳ１０６２に進む。

ステップＳ１０６２では、候補構造採用部１０８はステップＳ１０５０と同様に物性値と目標値から確率ｐ１（第１の採用確率）を計算し（第１の採用処理）、適当に発生させた乱数を用いて確率ｐ１で構造変化を採用する（ステップＳ１０７０：第１の採用処理）。構造変化が棄却された場合はステップＳ１０８０に進み、候補構造採用部１０８は構造変化を棄却して元の構造に戻す（棄却処理）。なお、ステップＳ１０５２において判断が否定された場合（構造多様性が増加していなかった場合）でも、直ちに構造変化を棄却するのではなく、物性値と目標値に基づいて採用する余地を残す（ステップＳ１０６２へ進む）。

上述した第２の実施形態の場合も、第１の実施形態と同様に、所望の物性値を持つ化合物の構造を効率的に探索することができる。

なお、図１９のフローチャートによる採用確率は、図３の場合と等価である。図３のように「物性⇒構造多様性」の順に評価した場合の構造変化の採用確率は“ｐ１＋（１－ｐ１）×ｐ２＝ｐ１＋ｐ２－ｐ１×ｐ２”であるが、図１９のように「構造多様性⇒物性」の順に評価したときの採用確率も“ｐ２＋（１－ｐ２）×ｐ１＝ｐ１＋ｐ２ーｐ１×ｐ２”である。

＜第３の実施形態＞
次に、本発明の第３の実施形態について説明する。上述した第１，第２の実施形態では、第１，第２の採用処理の一方を行って候補構造が採用されなかった場合は他方の採用処理を行うが、第３の実施形態では、第１，第２の採用処理を並行して実行する。

なお、第３の実施形態において、化合物探索装置１０（化合物探索装置）の構成は第１の実施形態と同様に図１，２に示す構成を採用することができる。

図２０は、第３の実施形態に係る化合物探索方法及び化合物探索プログラムの処理を示すフローチャートである。なお、図２０において図３と同様の処理を行うステップには同一のステップ番号を付し、詳細な説明を省略する。また、非一時的かつコンピュータ読取可能な記録媒体であって、記録媒体に格納された指令がコンピュータによって読み取られた場合に図２０のフローチャートに係るプログラムをコンピュータに実行させる記録媒体も、第３の実施形態の一態様である。

候補構造採用部１０８（候補構造採用部）がステップＳ１０４０でＮｏ（物性値が目標値に近づいていない）と判断した場合、ステップＳ１０５４へ進む。ステップＳ１０５４では、候補構造採用部１０８は上述したステップＳ１０５０，Ｓ１０６２と同様の手法により確率ｐ１（第１の採用確率）を算出する（第１の算出処理）。

また、候補構造採用部１０８（候補構造採用部）がステップＳ１０４０でＮｏと判断した場合、ステップＳ１０５９へ進む。ステップＳ１０５９において、候補構造採用部１０８は、ステップＳ１０５５，Ｓ１０５２と同様に「構造多様性の評価方法（その１）」または「構造多様性の評価方法（その２）」により構造多様性が増加しているか否かを判断することができる。一方、ステップＳ１０５９において判断が肯定された場合はステップＳ１０６４に進み、上述したステップＳ１０６０，Ｓ１０５７と同様の手法により確率ｐ２（第２の採用確率）を算出し（第２の算出処理）、ステップＳ１０６５に進む。なお、第１の算出処理及び第２の算出処理は同時に行ってもよいし、一方を先に行ってもよいが、候補構造を採用するか否かは確率ｐ１及び確率ｐ２が算出されてから判断する。

ステップＳ１０６５において、候補構造採用部１０８は、確率ｐ１（第１の採用確率）及び確率ｐ２（第２の採用確率）に基づいて、候補構造を採用するか否かを決定する（採用処理）。候補構造採用部１０８は、例えば「確率ｐ１，ｐ２のうち大きい方の確率」で候補構造を採用することができる。この他、「確率ｐ１，ｐ２のうち小さい方の確率」、「確率ｐ１，ｐ２の平均確率」、「確率ｐ１，ｐ２の同時確率（＝ｐ１×ｐ２）」等により候補構造を採用してもよい。候補構造採用部１０８は、このような確率（採用確率）でステップＳ１０７０に進んで候補構造を採用し（採用処理）、（１－採用確率）でステップＳ１０８０に進んで構造変化を棄却し元の構造に戻す（棄却処理）。

なお、ステップＳ１０５９において判断が否定された場合（構造多様性が増加していなかった場合）でも、直ちに構造変化を棄却するのではなく、構造変化を採用する余地を残す（確率ｐ２＝０とし、ステップＳ１０６５へ進む）。

上述した第３の実施形態の場合も、第１，第２の実施形態と同様に、所望の物性値を持つ化合物の構造を効率的に探索することができる。

以上で本発明の実施形態及び実施例に関して説明してきたが、本発明は上述した態様に限定されず、本発明の精神を逸脱しない範囲で種々の変形が可能である。

１０化合物探索装置
１００処理部
１０２入力部
１０４候補構造取得部
１０６物性値算出部
１０８候補構造採用部
１１０制御部
１１２表示制御部
１２０ＣＰＵ
１２２ＲＯＭ
１２４ＲＡＭ
２００記憶部
３００表示部
３１０モニタ
４００操作部
４１０キーボード
４２０マウス
５００外部サーバ
５１０外部データベース
１０００ネットワーク
Ｓ１０１０～Ｓ１１００化合物探索方法の各ステップ

Claims

プロセッサを備える化合物探索装置により実行される化合物探索方法であって、
前記プロセッサは、
一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力工程と、
前記化学構造を変化させて候補構造を得る候補構造取得工程と、
前記候補構造の前記物性値を算出する物性値算出工程と、
前記候補構造を採用または棄却する候補構造採用工程であって、前記候補構造を採用するか否かを前記化学構造の前記変化により前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて判断する第１の採用処理を行い、第１の採用処理により前記候補構造が採用されなかった場合は、前記候補構造を採用するか否かを前記化学構造の前記変化により前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第２の採用処理を行い、第１の採用処理及び第２の採用処理により前記候補構造が採用されなかった場合は前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用工程と、
終了条件を満たすまで、前記入力工程、前記候補構造取得工程、前記物性値算出工程、及び前記候補構造採用工程における処理を繰り返させる制御工程と、
を実行し、
前記プロセッサは、
前記候補構造採用工程では、前記第１の採用処理として、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第１の関数により第１の採用確率を算出し、前記候補構造を前記第１の採用確率で採用する処理を行い、
前記候補構造採用工程では、前記第２の採用処理として、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第２の関数により第２の採用確率を算出し、前記候補構造を第２の採用確率で採用する処理を行う化合物探索方法。
プロセッサを備える化合物探索装置により実行される化合物探索方法であって、
前記プロセッサは、
一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力工程と、
前記化学構造を変化させて候補構造を得る候補構造取得工程と、
前記候補構造の前記物性値を算出する物性値算出工程と、
前記候補構造を採用または棄却する候補構造採用工程であって、
前記候補構造を採用するか否かを前記化学構造の前記変化により前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第２の採用処理を行い、
前記第２の採用処理により前記候補構造が採用されなかった場合は、前記候補構造を採用するか否かを前記化学構造の前記変化により前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて判断する第１の採用処理を行い、
前記第１の採用処理及び前記第２の採用処理により前記候補構造が採用されなかった場合は前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用工程と、
終了条件を満たすまで、前記入力工程、前記候補構造取得工程、前記物性値算出工程、及び前記候補構造採用工程における処理を繰り返させる制御工程と、
を実行し、
前記プロセッサは、
前記候補構造採用工程では、前記第１の採用処理として、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第１の関数により第１の採用確率を算出し、前記候補構造を前記第１の採用確率で採用する処理を行い、
前記候補構造採用工程では、前記第２の採用処理として、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第２の関数により第２の採用確率を算出し、前記候補構造を第２の採用確率で採用する処理を行う化合物探索方法。
プロセッサを備える化合物探索装置により実行される化合物探索方法であって、
前記プロセッサは、
一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力工程と、
前記化学構造を変化させて候補構造を得る候補構造取得工程と、
前記候補構造の前記物性値を算出する物性値算出工程と、
前記候補構造を採用または棄却する候補構造採用工程であって、
前記化学構造の前記変化によって前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて、前記候補構造の採用に用いる第１の採用確率を算出する第１の算出処理と、前記化学構造の前記変化によって前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて、前記候補構造の採用に用いる第２の採用確率を算出する第２の算出処理と、を並行に行い、
前記候補構造を前記第１の採用確率及び前記第２の採用確率に基づいて採用する採用処理を行い、
前記採用処理の結果、前記候補構造が採用されなかった場合は、前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用工程と、
終了条件を満たすまで、前記入力工程、前記候補構造取得工程、前記物性値算出工程、及び前記候補構造採用工程における処理を繰り返させる制御工程と、
を実行し、
前記プロセッサは、
前記候補構造採用工程では、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第１の関数により前記第１の採用確率を算出する処理と、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第２の関数により前記第２の採用確率を算出する処理と、
を行う化合物探索方法。
前記プロセッサは、
前記候補構造採用工程では、前記変化をする前の前記化学構造により構成される第１の構造群の構造多様性と、少なくとも１回の前記変化をした後の前記化学構造により構成される第２の構造群の構造多様性と、の差分を前記増減量として算出する請求項１から３のいずれか１項に記載の化合物探索方法。
前記プロセッサは、
前記候補構造採用工程では、少なくとも１回の前記変化をした後の構造群の少なくとも一部を含む第１の構造群の構造多様性と、前記第１の構造群に前記候補構造を加えた第２の構造群の構造多様性と、の差分を前記増減量として算出する請求項１から３のいずれか１項に記載の化合物探索方法。
前記第１の関数は前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値と、前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値と、の差分に対する単調減少関数である請求項１から３のいずれか１項に記載の化合物探索方法。
前記第２の関数は前記構造多様性の前記増減量に対する単調増加関数である請求項１から３のいずれか１項に記載の化合物探索方法。
前記プロセッサは、
前記候補構造取得工程では、前記化学構造に原子または原子団を追加または削除して対象構造を生成し、前記対象構造を前記候補構造とする請求項１から７のいずれか１項に記載の化合物探索方法。
前記プロセッサは、
前記制御工程では、前記化学構造を変化させた回数が指定した回数に達した場合、及び／または前記候補構造の前記物性値が前記目標値に到達した場合に前記終了条件を満たしたと判定して前記入力工程、前記候補構造取得工程、前記物性値算出工程、及び前記候補構造採用工程の処理を終了させる請求項１から８のいずれか１項に記載の化合物探索方法。
請求項１から９のいずれか１項に記載の化合物探索方法をコンピュータに実行させる化合物探索プログラム。
非一時的かつコンピュータ読取可能な記録媒体であって、前記記録媒体に格納された指令がコンピュータによって読み取られた場合に請求項１０に記載のプログラムをコンピュータに実行させる記録媒体。
一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力部と、
前記化学構造を変化させて候補構造を得る候補構造取得部と、
前記候補構造の前記物性値を算出する物性値算出部と、
前記候補構造を採用または棄却する候補構造採用部であって、前記候補構造を採用するか否かを前記化学構造の前記変化により前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて判断する第１の採用処理を行い、第１の採用処理により前記候補構造が採用されなかった場合は、前記候補構造を採用するか否かを前記化学構造の前記変化により前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第２の採用処理を行い、第１の採用処理及び第２の採用処理により前記候補構造が採用されなかった場合は前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用部と、
終了条件を満たすまで、前記入力部、前記候補構造取得部、前記物性値算出部、及び前記候補構造採用部における処理を繰り返させる制御部と、
を有し、
前記候補構造採用部は、前記第１の採用処理として、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第１の関数により第１の採用確率を算出し、前記候補構造を前記第１の採用確率で採用する処理を行い、
前記候補構造採用部は、前記第２の採用処理として、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第２の関数により第２の採用確率を算出し、前記候補構造を第２の採用確率で採用する処理を行う化合物探索装置。
一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力部と、
前記化学構造を変化させて候補構造を得る候補構造取得部と、
前記候補構造の前記物性値を算出する物性値算出部と、
前記候補構造を採用または棄却する候補構造採用部であって、
前記候補構造を採用するか否かを前記化学構造の前記変化により前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第２の採用処理を行い、
前記第２の採用処理により前記候補構造が採用されなかった場合は、前記候補構造を採用するか否かを前記化学構造の前記変化により前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて判断する第１の採用処理を行い、
前記第１の採用処理及び前記第２の採用処理により前記候補構造が採用されなかった場合は前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用部と、
終了条件を満たすまで、前記入力部、前記候補構造取得部、前記物性値算出部、及び前記候補構造採用部における処理を繰り返させる制御部と、
を有し、
前記候補構造採用部は、前記第１の採用処理として、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第１の関数により第１の採用確率を算出し、前記候補構造を前記第１の採用確率で採用する処理を行い、
前記候補構造採用部は、前記第２の採用処理として、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第２の関数により第２の採用確率を算出し、前記候補構造を第２の採用確率で採用する処理を行う化合物探索装置。
一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力部と、
前記化学構造を変化させて候補構造を得る候補構造取得部と、
前記候補構造の前記物性値を算出する物性値算出部と、
前記候補構造を採用または棄却する候補構造採用部であって、
前記候補構造を採用する第１の採用確率を前記化学構造の前記変化により前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて算出する第１の算出処理と、前記候補構造を採用する第２の採用確率を前記化学構造の前記変化により前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて算出する第２の算出処理と、を並行して行い、
前記候補構造を前記第１の採用確率及び前記第２の採用確率に基づいて採用する採用処理を行い、
前記採用処理の結果、前記候補構造が採用されなかった場合は、前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用部と、
終了条件を満たすまで、前記入力部、前記候補構造取得部、前記物性値算出部、及び前記候補構造採用部における処理を繰り返させる制御部と、
を有し、
前記候補構造採用部は、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第１の関数により前記第１の採用確率を算出する処理と、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第２の関数により前記第２の採用確率を算出する処理と、
を行う化合物探索装置。