JP7116186B2 - 化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置 - Google Patents
化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置 Download PDFInfo
- Publication number
- JP7116186B2 JP7116186B2 JP2020546219A JP2020546219A JP7116186B2 JP 7116186 B2 JP7116186 B2 JP 7116186B2 JP 2020546219 A JP2020546219 A JP 2020546219A JP 2020546219 A JP2020546219 A JP 2020546219A JP 7116186 B2 JP7116186 B2 JP 7116186B2
- Authority
- JP
- Japan
- Prior art keywords
- physical property
- candidate
- property value
- candidate structure
- adoption
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/40—Searching chemical structures or physicochemical data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
- G16C20/64—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Library & Information Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Genetics & Genomics (AREA)
- Physiology (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Analysis (AREA)
- Pharmacology & Pharmacy (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は第1の実施形態に係る化合物探索装置10(化合物探索装置)の構成を示すブロック図である。図1に示すように、化合物探索装置10は処理部100、記憶部200、表示部300、及び操作部400を備え、互いに接続されて必要な情報が送受信される。これらの構成要素については各種の設置形態を採用することができ、各構成要素が1箇所(1筐体内、1室内等)に設置されていてもよいし、離れた場所に設置されネットワークを介して接続されていてもよい。また、化合物探索装置10はインターネット等のネットワーク1000を介して外部サーバ500及び外部データベース510に接続され、入力データ等の必要な情報を取得することができる。
図2は処理部100の構成を示す図である。処理部100は入力部102(入力部)、候補構造取得部104(候補構造取得部)、物性値算出部106(物性値算出部)、候補構造採用部108(候補構造採用部)、制御部110(制御部)、表示制御部112(表示制御部)、CPU120(CPU:Central Processing Unit)、ROM122(ROM:Read Only Memory)、及びRAM124(RAM:Random Access Memory)を備える。これら処理部100の各部を用いた化合物探索方法の手順については、詳細を後述する。なお、各部での処理はCPU120の制御の下で行われる。
記憶部200はDVD(Digital Versatile Disk)、ハードディスク(Hard Disk)、各種半導体メモリ等の非一時的記録媒体及びその制御部により構成され、化合物の化学構造(初期構造、候補構造)及びその物性値等を記憶することができる。
表示部300はモニタ310(表示装置)を備えており、入力した画像、記憶部200に記憶された情報、処理部100による処理の結果等を表示することができる。操作部400は入力デバイス及び/またはポインティングデバイスとしてのキーボード410及びマウス420を含んでおり、ユーザはこれらのデバイス及びモニタ310の画面を介して、本発明に係る化合物探索方法の実行に必要な操作を行うことができる。ユーザは、例えば処理開始指示、物性値の目標値、第1の関数及び第2の関数に用いるパラメータ、繰り返し回数の指定を行うことができる。
図3は本発明に係る化合物探索方法の手順を示すフローチャートである。
入力部102は、一つまたは複数の化合物の化学構造(初期構造)と、化学構造(初期構造)における一つまたは複数の物性値と、物性値の目標値と、を入力する(ステップS1010:入力工程)。これらのデータは記憶部200に記憶されていたものを用いてもよいし、ネットワーク1000を介して外部サーバ500及び外部データベース510から取得してもよい。どのようなデータを入力するかを、操作部400を介したユーザの指示入力に応じて決定してもよい。初期構造は1つでもよいし複数でもよい。また、物性値も1つでもよいし複数でもよい。物性値を与える方法としては、量子化学計算や分子動力学計算、あるいは機械学習の結果を用いるなど、スループットの早い方法が望ましい。一方で、化合物の合成や物性測定のスループットに実用上の問題が無ければ、実測値を用いることも可能である。
候補構造取得部104は、化学構造をランダムに変化させて候補構造を得る(ステップS1020:候補構造取得工程)。この際、化学構造を変化させられる方法であれば何を用いてもよい。例えば、化学構造に原子または原子団を追加または削除して対象構造を生成し、対象構造を候補構造とする方法を用いることができる。この方法は、具体的には(A)合成適性を評価する基準の化合物データベース、及び化合物構造(化学構造)を準備する工程と、(B)化合物構造への原子または原子団の追加、または化合物構造からの原子の削除のいずれかを選択する工程と、(C)化合物構造への原子の追加を選択した場合、化合物構造に含まれる原子の中から選択された原子に新規原子を結合させ、または化合物構造への原子の削除を選択した場合、化合物構造に含まれる原子の中から選択された原子を削除し、改変された化合物構造を得る工程と、(D)改変された化合物構造の合成適性を、化合物データベースの情報に基づいて判断する工程と、(E)改変された化合物構造が合成適性を有する場合は改変を確率的に許容し、改変された化合物構造が合成適性を有さない場合は改変を確率的に棄却する工程と、(F)工程(E)を経た化合物構造が終了条件を満たすまで、工程(B)~(E)を繰り返す工程と、を備える化合物構造の生成方法である。なお、発生させた候補構造を表示制御部112によりモニタ310(表示装置)に表示させてもよい。また、後述するステップS1090からステップS1020に戻ってきたときに、前回発生させた構造の中で物性値が目標値に近かった構造を、合成適性を評価するための化合物データベース(構造群)に一つまたは複数追加し、ステップS1020において目標値に近い物性値を持つ構造を少しずつ発生させやすくすることもできる。
物性値算出部106は、候補構造(ステップS1020で変化させた構造)の物性値を算出する(ステップS1030:物性値算出工程)。物性値の算出には、初期構造の物性値を見積もったときと同じ方法を用いることが好ましい。
候補構造採用部108は、物性値が目標値に近づいているか否かを判断する(ステップS1040:候補構造採用工程)。具体的には、構造変化前の物性値をf0、構造変化後の物性値をf1、物性値の目標値をFとしたときに、|F-f1|≦|F-f0|が成り立つ場合(候補構造の物性値と物性値の目標値との差分(第1の差分)の絶対値が化学構造の物性値と物性値の目標値との差分(第2の差分)の絶対値以下である場合)は、物性値が目標値に近づいている(遠ざかっていない)のでステップS1070へ進んで構造変化を採用する(第1の採用処理)。一方、|F-f1|>|F-f0|である場合(候補構造の物性値と物性値の目標値との差分(第1の差分)の絶対値が化学構造の物性値と物性値の目標値との差分(第2の差分)の絶対値より大きい場合)はステップS1050へ進む。
ステップS1050において第1の採用処理の結果候補構造が採用されなかった場合(確率(1-p1)で起こりうる)、候補構造採用部108は、候補構造を採用するか否かを「化学構造の変化により、化学構造及び候補構造により構成される構造群の構造多様性が増加しているか否か」に基づいて判断する第2の採用処理を行う(ステップS1055,S1060,S1070)。第2の採用処理について以下説明する。なお、構造を表す指標をjとして、構造群をS={sj}と表す。構造群Sの構造多様性を与える関数をV(S)と表記する。V(S)は構造多様性が大きいほど大きな値を取るものとする。
初期構造をN(>1)個与えた場合に、N個の化学構造のうちのk番目の化学構造の構造変化の採用または棄却を考えているとする。m回目の試行において、構造変化前(m-1回目)の構造群Sm-1={s(m-1)j}と変化後(m回目)の構造群Sm={smj}から、k番目の化学構造の構造変化後の構造群Sk={s(m-1)0, s(m-1)1, ..., smk, ..., s(m-1)N}を定義し、dv=V(Sk)-V(Sm-1)を見積もる。dvは構造変化による構造多様性の増減量を示す。dv≧0の場合(k番目の構造変化によって多様性が向上する場合;ステップS1055でYes)には、dv(構造多様性の増減量)に対する単調増加関数P2(dv)を与え、確率p2=P2(dv)を算出する(ステップS1060:第2の採用処理)。そして、適当に発生させた乱数を用いて確率p2でステップS1070(構造変化を採用する;第2の採用処理)に進み、確率(1-p2)でステップS1080(構造変化を棄却し、元の構造に戻す;棄却処理)に進む。単調増加関数P2(dv)は本発明における「第2の関数」に相当し、確率p2は本発明における「第2の採用確率」に相当する。
上述した「構造多様性の評価方法(その1)」に代えて、試行を表す指標をtとして、過去m回の試行で得た構造群Sprev={St-1, St-2, ..., St-m}(ただし、t=mの場合に現れるS0は初期構造とする)と、採用または棄却を考えている構造stを加えた構造群Scurr={st, St-1, ..., St-(m-1)}とを考え、dv=V(Scurr)-V(Sprev)を算出し、単調増加関数P2(dv)により確率p2を算出(ステップS1060:第2の採用処理)してもよい。すなわち、構造群Sprevは初期構造および少なくとも1回の変化をした後の化学構造により構成される構造群(第1の構造群)であり、構造群Scurrは第1の構造群に候補構造を加えた構造群(第2の構造群)である。Sprev(第1の構造群)は、初期構造および少なくとも1回の変化をした後の構造群の少なくとも一部を含んでいればよい。また、V(Sprev)、V(Scurr)はそれぞれ構造群Sprev、Scurrの構造多様性であり、dvは構造変化による構造多様性の増減量を示す。また、初期構造および過去の試行で得た構造群の全てではなく、性能上位(物性値が目標値に近いほど順位が高い)または下位(物性値が目標値から遠いほど順位が低い)の構造を抜粋してSprevとするのでもよいし、既存のライブラリの化合物(構造が既知の化合物)をSprevに混ぜてもよい。このようなSprevの選択により、構造多様性の評価基準を柔軟に設定することができる。
上述した「構造群の構造多様性を与える関数」としては、たとえばTanimoto係数(化合物の類似度を表す指標の1つ)に基づく以下のような定義が考えられる(他にも様々な定義が可能である)。具体的には、構造sをビット列(0または1の数列)のfingerprint(化合物の一定の規則にしたがって固定長のベクトルに変換したものであり、様々な生成方法が知られている)で表したものをFsとすると、Tanimoto係数の定義は以下の式(4)で表される。
上述した第1の採用処理、第2の採用処理、及び棄却処理を、与えられた初期構造のそれぞれについて行い、全ての化学構造について上述の処理が終了すると1回の試行が終了する。
以上説明したように、第1の実施形態に係る化合物探索装置10、化合物探索方法、記録媒体、及び化合物探索プログラムによれば、ローカルミニマムからの脱出を促進し、また物性値の収束を早めることができるので、所望の物性値を持つ化合物の構造を効率的に探索することができる。
本発明について、実施例に即して具体的に説明する。この実施例についても、図1,2に示す化合物探索装置10(化合物探索装置)及び図3に示すフローチャート(化合物探索方法及び化合物探索プログラムの処理)により探索を行うことができる。
実施例では、図4の(a)部分に示すように初期構造としてフェノールを25個与える。物性値としてはλmax(最大吸収波長)を考え、目標値を367nmとする。構造をPM6レベルで最適化後、ZINDOでλmaxを計算する。計算には量子化学計算用ソフトウェア“Gaussian16”を用いた。これらの処理が図3のフローチャートのステップS1010(入力工程)に相当する。
上述した初期構造をランダムに変化させる(ステップS1020:候補構造取得工程)。構造変化の手法としては、第1の実施形態と同様に化学構造に原子または原子団を追加または削除して対象構造を生成し、対象構造を候補構造とする方法を用いることができる。例えば、1つ目の構造が図4の(b)部分から(c)部分に示すように変化したとする。
この場合に、変化させた構造の物性値を見積もった結果が図4の(d)部分に示すようにλmax=200(nm)であったとする(ステップS1030:物性値算出工程)。
物性値が目標値に近づいているか否かを判断する(ステップS1040:第1の採用処理)。|F-f1|=|367-200|=167(nm)、|F-f0|=|367-207|=160(nm)より、|F-f1|>|F-f0|である(第1の差分の絶対値が第2の差分の絶対値より大きく、物性値が目標値から遠ざかっている)ので、ステップS1040の判断が否定されステップS1050(確率p1の計算)に進む。物性値と目標値から、上述した第1の関数(第3の差分dに対する単調減少関数P1(d))により確率p1(第1の確率)を算出する。ここでは、σ=10(nm)として以下の式(8)のように計算する。
ステップS1060では、構造多様性の増減量を算出し、上述した第2の関数により確率p2(第2の採用確率)を算出する。なお、図5に示すように初期構造群をS0とし、1回目の構造変化を考慮した構造群をS1とする。
他の手法としてよく用いられるのが、ベイズ推定である。ここではベイズ推定の一種である粒子フィルタを用いて計算した結果と本発明で得られた結果を比較する。上述した実施例と同様のλmax計算条件で、粒子フィルタを用いてλmax=367(nm)の化合物の探索を実施した。500試行目までに得た化合物の中で上位50化合物のλmaxを、本発明の結果と共に示す(図14を参照)。ベイズ推定ではλmaxが目標値と同等の化合物はわずかにしか得られていないが、本発明では上位50化合物全てが目標値と同等のλmaxとなっていた。したがって、「本発明のほうがベイズ推定よりも効率良く構造探索をできている」といえる。
上述の実施例では「構造多様性の評価方法(その1)」により構造の多様性を評価しているが、「構造多様性の評価方法(その2)」を用いる場合においても同等の効率で構造探索を実施することができる。具体的には、各試行における上位20化合物(物性値が目標値に近い順に1位、2位、…とする)の目標λmax(367nm)との平均二乗誤差を計算した結果、図17に示すように、「構造多様性の評価方法(その1)」、「構造多様性の評価方法(その2)」のいずれを用いた場合においても20試行程度で“平均二乗誤差<100(nm2)”を達成できた。なお、「構造多様性の評価方法(その2)」において、Sprevは、「過去の試行で生成した構造のうち物性値が目標値に近い上位100個」とした。
多様性の比較対象にメチルイエロー(上述した「既存のライブラリの化合物」の一例)を含めた場合の構造探索結果を図18に示す。構造探索の結果、メチルイエローは発生せず、かつメチルイエローとの類似性が低い(Tanimoto係数が小さい)候補化合物を多く得ることができた。なお、図18における数値は500試行目における値である。また、上述のようにTanimoto係数は化合物の構造の類似度を表す指標の1つであり、0から1の値をとる(1に近いほど類似性が高い)。
次に、本発明の第2の実施形態について説明する。上述した第1の実施形態ではまず第1の採用処理を行い、第1の採用処理により候補構造が採用されなかった場合は第2の採用処理を行っているが、第2の実施形態では第1の実施形態と逆にまず第2の採用処理を行い、第2の採用処理により候補構造が採用されなかった場合は第1の採用処理を行う。
次に、本発明の第3の実施形態について説明する。上述した第1,第2の実施形態では、第1,第2の採用処理の一方を行って候補構造が採用されなかった場合は他方の採用処理を行うが、第3の実施形態では、第1,第2の採用処理を並行して実行する。
100 処理部
102 入力部
104 候補構造取得部
106 物性値算出部
108 候補構造採用部
110 制御部
112 表示制御部
120 CPU
122 ROM
124 RAM
200 記憶部
300 表示部
310 モニタ
400 操作部
410 キーボード
420 マウス
500 外部サーバ
510 外部データベース
1000 ネットワーク
S1010~S1100 化合物探索方法の各ステップ
Claims (14)
- プロセッサを備える化合物探索装置により実行される化合物探索方法であって、
前記プロセッサは、
一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力工程と、
前記化学構造を変化させて候補構造を得る候補構造取得工程と、
前記候補構造の前記物性値を算出する物性値算出工程と、
前記候補構造を採用または棄却する候補構造採用工程であって、前記候補構造を採用するか否かを前記化学構造の前記変化により前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて判断する第1の採用処理を行い、第1の採用処理により前記候補構造が採用されなかった場合は、前記候補構造を採用するか否かを前記化学構造の前記変化により前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第2の採用処理を行い、第1の採用処理及び第2の採用処理により前記候補構造が採用されなかった場合は前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用工程と、
終了条件を満たすまで、前記入力工程、前記候補構造取得工程、前記物性値算出工程、及び前記候補構造採用工程における処理を繰り返させる制御工程と、
を実行し、
前記プロセッサは、
前記候補構造採用工程では、前記第1の採用処理として、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第1の関数により第1の採用確率を算出し、前記候補構造を前記第1の採用確率で採用する処理を行い、
前記候補構造採用工程では、前記第2の採用処理として、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第2の関数により第2の採用確率を算出し、前記候補構造を第2の採用確率で採用する処理を行う化合物探索方法。 - プロセッサを備える化合物探索装置により実行される化合物探索方法であって、
前記プロセッサは、
一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力工程と、
前記化学構造を変化させて候補構造を得る候補構造取得工程と、
前記候補構造の前記物性値を算出する物性値算出工程と、
前記候補構造を採用または棄却する候補構造採用工程であって、
前記候補構造を採用するか否かを前記化学構造の前記変化により前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第2の採用処理を行い、
前記第2の採用処理により前記候補構造が採用されなかった場合は、前記候補構造を採用するか否かを前記化学構造の前記変化により前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて判断する第1の採用処理を行い、
前記第1の採用処理及び前記第2の採用処理により前記候補構造が採用されなかった場合は前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用工程と、
終了条件を満たすまで、前記入力工程、前記候補構造取得工程、前記物性値算出工程、及び前記候補構造採用工程における処理を繰り返させる制御工程と、
を実行し、
前記プロセッサは、
前記候補構造採用工程では、前記第1の採用処理として、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第1の関数により第1の採用確率を算出し、前記候補構造を前記第1の採用確率で採用する処理を行い、
前記候補構造採用工程では、前記第2の採用処理として、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第2の関数により第2の採用確率を算出し、前記候補構造を第2の採用確率で採用する処理を行う化合物探索方法。 - プロセッサを備える化合物探索装置により実行される化合物探索方法であって、
前記プロセッサは、
一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力工程と、
前記化学構造を変化させて候補構造を得る候補構造取得工程と、
前記候補構造の前記物性値を算出する物性値算出工程と、
前記候補構造を採用または棄却する候補構造採用工程であって、
前記化学構造の前記変化によって前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて、前記候補構造の採用に用いる第1の採用確率を算出する第1の算出処理と、前記化学構造の前記変化によって前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて、前記候補構造の採用に用いる第2の採用確率を算出する第2の算出処理と、を並行に行い、
前記候補構造を前記第1の採用確率及び前記第2の採用確率に基づいて採用する採用処理を行い、
前記採用処理の結果、前記候補構造が採用されなかった場合は、前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用工程と、
終了条件を満たすまで、前記入力工程、前記候補構造取得工程、前記物性値算出工程、及び前記候補構造採用工程における処理を繰り返させる制御工程と、
を実行し、
前記プロセッサは、
前記候補構造採用工程では、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第1の関数により前記第1の採用確率を算出する処理と、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第2の関数により前記第2の採用確率を算出する処理と、
を行う化合物探索方法。 - 前記プロセッサは、
前記候補構造採用工程では、前記変化をする前の前記化学構造により構成される第1の構造群の構造多様性と、少なくとも1回の前記変化をした後の前記化学構造により構成される第2の構造群の構造多様性と、の差分を前記増減量として算出する請求項1から3のいずれか1項に記載の化合物探索方法。 - 前記プロセッサは、
前記候補構造採用工程では、少なくとも1回の前記変化をした後の構造群の少なくとも一部を含む第1の構造群の構造多様性と、前記第1の構造群に前記候補構造を加えた第2の構造群の構造多様性と、の差分を前記増減量として算出する請求項1から3のいずれか1項に記載の化合物探索方法。 - 前記第1の関数は前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値と、前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値と、の差分に対する単調減少関数である請求項1から3のいずれか1項に記載の化合物探索方法。
- 前記第2の関数は前記構造多様性の前記増減量に対する単調増加関数である請求項1から3のいずれか1項に記載の化合物探索方法。
- 前記プロセッサは、
前記候補構造取得工程では、前記化学構造に原子または原子団を追加または削除して対象構造を生成し、前記対象構造を前記候補構造とする請求項1から7のいずれか1項に記載の化合物探索方法。 - 前記プロセッサは、
前記制御工程では、前記化学構造を変化させた回数が指定した回数に達した場合、及び/または前記候補構造の前記物性値が前記目標値に到達した場合に前記終了条件を満たしたと判定して前記入力工程、前記候補構造取得工程、前記物性値算出工程、及び前記候補構造採用工程の処理を終了させる請求項1から8のいずれか1項に記載の化合物探索方法。 - 請求項1から9のいずれか1項に記載の化合物探索方法をコンピュータに実行させる化合物探索プログラム。
- 非一時的かつコンピュータ読取可能な記録媒体であって、前記記録媒体に格納された指令がコンピュータによって読み取られた場合に請求項10に記載のプログラムをコンピュータに実行させる記録媒体。
- 一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力部と、
前記化学構造を変化させて候補構造を得る候補構造取得部と、
前記候補構造の前記物性値を算出する物性値算出部と、
前記候補構造を採用または棄却する候補構造採用部であって、前記候補構造を採用するか否かを前記化学構造の前記変化により前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて判断する第1の採用処理を行い、第1の採用処理により前記候補構造が採用されなかった場合は、前記候補構造を採用するか否かを前記化学構造の前記変化により前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第2の採用処理を行い、第1の採用処理及び第2の採用処理により前記候補構造が採用されなかった場合は前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用部と、
終了条件を満たすまで、前記入力部、前記候補構造取得部、前記物性値算出部、及び前記候補構造採用部における処理を繰り返させる制御部と、
を有し、
前記候補構造採用部は、前記第1の採用処理として、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第1の関数により第1の採用確率を算出し、前記候補構造を前記第1の採用確率で採用する処理を行い、
前記候補構造採用部は、前記第2の採用処理として、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第2の関数により第2の採用確率を算出し、前記候補構造を第2の採用確率で採用する処理を行う化合物探索装置。 - 一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力部と、
前記化学構造を変化させて候補構造を得る候補構造取得部と、
前記候補構造の前記物性値を算出する物性値算出部と、
前記候補構造を採用または棄却する候補構造採用部であって、
前記候補構造を採用するか否かを前記化学構造の前記変化により前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて判断する第2の採用処理を行い、
前記第2の採用処理により前記候補構造が採用されなかった場合は、前記候補構造を採用するか否かを前記化学構造の前記変化により前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて判断する第1の採用処理を行い、
前記第1の採用処理及び前記第2の採用処理により前記候補構造が採用されなかった場合は前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用部と、
終了条件を満たすまで、前記入力部、前記候補構造取得部、前記物性値算出部、及び前記候補構造採用部における処理を繰り返させる制御部と、
を有し、
前記候補構造採用部は、前記第1の採用処理として、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第1の関数により第1の採用確率を算出し、前記候補構造を前記第1の採用確率で採用する処理を行い、
前記候補構造採用部は、前記第2の採用処理として、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第2の関数により第2の採用確率を算出し、前記候補構造を第2の採用確率で採用する処理を行う化合物探索装置。 - 一つまたは複数の化合物の化学構造と、前記化学構造における一つまたは複数の物性値と、前記物性値の目標値と、を入力する入力部と、
前記化学構造を変化させて候補構造を得る候補構造取得部と、
前記候補構造の前記物性値を算出する物性値算出部と、
前記候補構造を採用または棄却する候補構造採用部であって、
前記候補構造を採用する第1の採用確率を前記化学構造の前記変化により前記候補構造の前記物性値が前記物性値の前記目標値に近づいているか否かに基づいて算出する第1の算出処理と、前記候補構造を採用する第2の採用確率を前記化学構造の前記変化により前記化学構造及び前記候補構造により構成される構造群の構造多様性が増加しているか否かに基づいて算出する第2の算出処理と、を並行して行い、
前記候補構造を前記第1の採用確率及び前記第2の採用確率に基づいて採用する採用処理を行い、
前記採用処理の結果、前記候補構造が採用されなかった場合は、前記化学構造の前記変化を棄却して前記変化をさせる前の前記化学構造に戻す棄却処理を行う候補構造採用部と、
終了条件を満たすまで、前記入力部、前記候補構造取得部、前記物性値算出部、及び前記候補構造採用部における処理を繰り返させる制御部と、
を有し、
前記候補構造採用部は、
前記候補構造の前記物性値と前記物性値の前記目標値との差分の絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との差分の絶対値以下である場合は前記候補構造を採用する処理を行い、
前記候補構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値が前記化学構造の前記物性値と前記物性値の前記目標値との前記差分の前記絶対値より大きい場合は、前記候補構造の前記物性値と前記物性値の前記目標値との差分に基づいて第1の関数により前記第1の採用確率を算出する処理と、前記構造群の前記構造多様性の増減量を算出し、前記増減量が前記構造多様性が増加していることを示す場合は前記増減量に基づいて第2の関数により前記第2の採用確率を算出する処理と、
を行う化合物探索装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018172578 | 2018-09-14 | ||
JP2018172578 | 2018-09-14 | ||
PCT/JP2019/036074 WO2020054841A1 (ja) | 2018-09-14 | 2019-09-13 | 化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020054841A1 JPWO2020054841A1 (ja) | 2021-08-30 |
JP7116186B2 true JP7116186B2 (ja) | 2022-08-09 |
Family
ID=69777647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020546219A Active JP7116186B2 (ja) | 2018-09-14 | 2019-09-13 | 化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20210193274A1 (ja) |
EP (1) | EP3852114A4 (ja) |
JP (1) | JP7116186B2 (ja) |
CN (1) | CN112689878A (ja) |
IL (1) | IL281387A (ja) |
WO (1) | WO2020054841A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112133379A (zh) * | 2020-09-18 | 2020-12-25 | 武汉智化科技有限公司 | 一种化学反应搜索方法、装置及系统、图形处理器 |
CA3203480A1 (en) * | 2021-01-07 | 2022-07-14 | Fuji-Film Corporation | Information processing apparatus, information processing method, and information processing program |
CN117716431A (zh) * | 2021-07-27 | 2024-03-15 | 松下知识产权经营株式会社 | 探索方法、探索系统、程序、预测模型构建方法及预测模型构建装置 |
WO2023008173A1 (ja) * | 2021-07-27 | 2023-02-02 | パナソニックIpマネジメント株式会社 | 探索方法、探索システム、プログラム、予測モデル構築方法、及び予測モデル構築装置 |
CN115579050B (zh) * | 2022-12-08 | 2023-03-14 | 香港中文大学(深圳) | 生物分子功能性动力学中关键原子集的搜索方法、系统 |
JP7388578B1 (ja) | 2023-01-16 | 2023-11-29 | 住友ベークライト株式会社 | 化学構造提案方法、プログラム、および化学構造提案装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000029858A (ja) | 1998-07-15 | 2000-01-28 | Victor Co Of Japan Ltd | 最適化装置 |
JP2003206246A (ja) | 2002-01-07 | 2003-07-22 | Ichiro Yamato | 化合物の立体構造探索プログラム、立体構造探索装置、及び立体構造探索方法 |
US20080027652A1 (en) | 1996-01-26 | 2008-01-31 | Cramer Richard D | Computer implemented method for for selecting an optimally diverse library of small molecules based on validated molecular structural descriptors |
WO2009064015A1 (ja) | 2007-11-12 | 2009-05-22 | In-Silico Sciences, Inc. | インシリコスクリーニング装置、および、インシリコスクリーニング方法 |
WO2014034577A1 (ja) | 2012-08-27 | 2014-03-06 | 株式会社京都コンステラ・テクノロジーズ | 化合物設計装置、化合物設計方法、及びコンピュータプログラム |
JP2017091526A (ja) | 2015-11-04 | 2017-05-25 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 新規物質探索方法および装置 |
-
2019
- 2019-09-13 WO PCT/JP2019/036074 patent/WO2020054841A1/ja unknown
- 2019-09-13 CN CN201980059942.8A patent/CN112689878A/zh active Pending
- 2019-09-13 EP EP19860042.1A patent/EP3852114A4/en active Pending
- 2019-09-13 JP JP2020546219A patent/JP7116186B2/ja active Active
-
2021
- 2021-03-04 US US17/192,034 patent/US20210193274A1/en active Pending
- 2021-03-10 IL IL281387A patent/IL281387A/en unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080027652A1 (en) | 1996-01-26 | 2008-01-31 | Cramer Richard D | Computer implemented method for for selecting an optimally diverse library of small molecules based on validated molecular structural descriptors |
JP2000029858A (ja) | 1998-07-15 | 2000-01-28 | Victor Co Of Japan Ltd | 最適化装置 |
JP2003206246A (ja) | 2002-01-07 | 2003-07-22 | Ichiro Yamato | 化合物の立体構造探索プログラム、立体構造探索装置、及び立体構造探索方法 |
WO2009064015A1 (ja) | 2007-11-12 | 2009-05-22 | In-Silico Sciences, Inc. | インシリコスクリーニング装置、および、インシリコスクリーニング方法 |
WO2014034577A1 (ja) | 2012-08-27 | 2014-03-06 | 株式会社京都コンステラ・テクノロジーズ | 化合物設計装置、化合物設計方法、及びコンピュータプログラム |
JP2017091526A (ja) | 2015-11-04 | 2017-05-25 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 新規物質探索方法および装置 |
Non-Patent Citations (2)
Title |
---|
IKEBATA, Hisaki et al.,Bayesian molecular design with a chemical language model,Journal of Computer-Aided Molecular Design,2017年04月,Vol.31 No.4,pp.379-391,DOI 10.1007/s10822-016-0008-z |
松山 祐輔 外1名,多様な活性化合物発見のための化合物fingerprintアンサンブル手法の開発,情報処理学会 研究報告 バイオ情報学(BIO)[online],日本,情報処理学会,2018年03月02日,Vol.2018-BIO-53 No.9,pp.1-6 |
Also Published As
Publication number | Publication date |
---|---|
EP3852114A4 (en) | 2021-11-10 |
EP3852114A1 (en) | 2021-07-21 |
WO2020054841A1 (ja) | 2020-03-19 |
CN112689878A (zh) | 2021-04-20 |
IL281387A (en) | 2021-04-29 |
JPWO2020054841A1 (ja) | 2021-08-30 |
US20210193274A1 (en) | 2021-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7116186B2 (ja) | 化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置 | |
Yang et al. | HOP-rec: high-order proximity for implicit recommendation | |
Blaschke et al. | Memory-assisted reinforcement learning for diverse molecular de novo design | |
Bechikh et al. | Many-objective optimization using evolutionary algorithms: A survey | |
Hansen et al. | Spline adaptation in extended linear models (with comments and a rejoinder by the authors | |
WO2019186194A2 (en) | Ensemble model creation and selection | |
Gartrell et al. | Bayesian low-rank determinantal point processes | |
Bellodi et al. | Expectation Maximization over binary decision diagrams for probabilistic logic programs | |
Žilinskas et al. | Stochastic global optimization: a review on the occasion of 25 years of Informatica | |
US8010535B2 (en) | Optimization of discontinuous rank metrics | |
Aziz et al. | Pure exploration in infinitely-armed bandit models with fixed-confidence | |
CN109313720A (zh) | 具有稀疏访问的外部存储器的增强神经网络 | |
Czajkowski et al. | Evolutionary induction of global model trees with specialized operators and memetic extensions | |
Duarte et al. | Representation of context-specific causal models with observational and interventional data | |
Khan et al. | Generalized fractional strategy for recommender systems with chaotic ratings behavior | |
Sasongko et al. | Optimization of hyper parameter bandwidth on naïve Bayes kernel density estimation for the breast cancer classification | |
López et al. | Non-dominated sorting genetic-based algorithm for exploiting a large-sized fuzzy outranking relation | |
Côrte-Real et al. | SkILL-a stochastic inductive logic learner | |
Tuckey et al. | PASOCS: a parallel approximate solver for probabilistic logic programs under the credal semantics | |
Correa et al. | Particle swarm and Bayesian networks applied to attribute selection for protein functional classification | |
de Sá et al. | Towards a method for automatically evolving bayesian network classifiers | |
de Sá et al. | A hyper-heuristic evolutionary algorithm for learning Bayesian network classifiers | |
Urbanowicz et al. | Retooling fitness for noisy problems in a supervised Michigan-style learning classifier system | |
JP6721036B2 (ja) | 推論システム、推論方法、及び、プログラム | |
Fu | A comparison of state-of-the-art algorithms for learning bayesian network structure from continuous data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210427 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220624 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220706 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220728 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7116186 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |