JP2023068308A - 情報処理システム、情報処理方法、および情報処理プログラム - Google Patents
情報処理システム、情報処理方法、および情報処理プログラム Download PDFInfo
- Publication number
- JP2023068308A JP2023068308A JP2021179277A JP2021179277A JP2023068308A JP 2023068308 A JP2023068308 A JP 2023068308A JP 2021179277 A JP2021179277 A JP 2021179277A JP 2021179277 A JP2021179277 A JP 2021179277A JP 2023068308 A JP2023068308 A JP 2023068308A
- Authority
- JP
- Japan
- Prior art keywords
- reaction
- reactant
- combination
- information processing
- reactants
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 title claims description 89
- 238000006243 chemical reaction Methods 0.000 claims abstract description 465
- 125000000524 functional group Chemical group 0.000 claims abstract description 29
- 239000000376 reactant Substances 0.000 claims description 295
- 239000000047 product Substances 0.000 claims description 115
- 239000012467 final product Substances 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 17
- 230000037361 pathway Effects 0.000 claims description 14
- 239000007795 chemical reaction product Substances 0.000 claims description 8
- 238000003672 processing method Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 5
- 150000001875 compounds Chemical class 0.000 abstract description 15
- 239000000463 material Substances 0.000 abstract description 10
- 125000004429 atom Chemical group 0.000 description 138
- 230000008569 process Effects 0.000 description 46
- 238000004364 calculation method Methods 0.000 description 18
- 238000000605 extraction Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 13
- 230000008859 change Effects 0.000 description 11
- 238000005381 potential energy Methods 0.000 description 10
- 239000000126 substance Substances 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000007017 scission Effects 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 125000004432 carbon atom Chemical group C* 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 4
- WHNBDXQTMPYBAT-UHFFFAOYSA-N 2-butyloxirane Chemical compound CCCCC1CO1 WHNBDXQTMPYBAT-UHFFFAOYSA-N 0.000 description 3
- PLIKAWJENQZMHA-UHFFFAOYSA-N 4-aminophenol Chemical compound NC1=CC=C(O)C=C1 PLIKAWJENQZMHA-UHFFFAOYSA-N 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- HQABUPZFAYXKJW-UHFFFAOYSA-N butan-1-amine Chemical compound CCCCN HQABUPZFAYXKJW-UHFFFAOYSA-N 0.000 description 3
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 3
- 239000004593 Epoxy Substances 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- -1 amine compound Chemical class 0.000 description 2
- 238000006664 bond formation reaction Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 125000004433 nitrogen atom Chemical group N* 0.000 description 2
- 125000004430 oxygen atom Chemical group O* 0.000 description 2
- 238000004057 DFT-B3LYP calculation Methods 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 238000010504 bond cleavage reaction Methods 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- ZVTQWXCKQTUVPY-UHFFFAOYSA-N chloromethylcyclopropane Chemical compound ClCC1CC1 ZVTQWXCKQTUVPY-UHFFFAOYSA-N 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 125000004356 hydroxy functional group Chemical group O* 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000005610 quantum mechanics Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】合成可能な化合物を効率的に探索すること。【解決手段】一例に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の反応物を示す反応物リストを取得し、反応性官能基を有する反応物を一般式によって表現した反応式を取得し、反応式に適合する反応物の少なくとも一つの組合せを、少なくとも一つの反応物コンビネーションとして、反応物リストから選択し、少なくとも一つの反応物コンビネーションのそれぞれについて、反応式によって該反応物コンビネーションから得られる生成物を特定する。【選択図】図1
Description
本開示の一側面は情報処理システム、情報処理方法、および情報処理プログラムに関する。
合成可能な化合物を探索するための手法が知られている。例えば特許文献1には、化学反応において目的とする遷移状態の化学的構造を求めるための化学反応遷移状態探索システムが記載されている。
合成可能な化合物を効率的に探索するための手法が望まれている。
本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の反応物を示す反応物リストを取得し、反応性官能基を有する反応物を一般式によって表現した反応式を取得し、反応式に適合する反応物の少なくとも一つの組合せを、少なくとも一つの反応物コンビネーションとして、反応物リストから選択し、少なくとも一つの反応物コンビネーションのそれぞれについて、反応式によって該反応物コンビネーションから得られる生成物を特定する。
本開示の一側面に係る情報処理方法は、少なくとも一つのプロセッサを備える情報処理システムにより実行される。この情報処理方法は、複数の反応物を示す反応物リストを取得するステップと、反応性官能基を有する反応物を一般式によって表現した反応式を取得するステップと、反応式に適合する反応物の少なくとも一つの組合せを、少なくとも一つの反応物コンビネーションとして、反応物リストから選択するステップと、少なくとも一つの反応物コンビネーションのそれぞれについて、反応式によって該反応物コンビネーションから得られる生成物を特定するステップとを含む。
本開示の一側面に係る情報処理プログラムは、複数の反応物を示す反応物リストを取得するステップと、反応性官能基を有する反応物を一般式によって表現した反応式を取得するステップと、反応式に適合する反応物の少なくとも一つの組合せを、少なくとも一つの反応物コンビネーションとして、反応物リストから選択するステップと、少なくとも一つの反応物コンビネーションのそれぞれについて、反応式によって該反応物コンビネーションから得られる生成物を特定するステップとをコンピュータに実行させる。
このような側面においては、化学反応に直接に寄与する反応性官能基に着目した反応式に基づいて、反応物コンビネーションの選択と生成物の特定とが行われるので、合成可能な化合物を効率的に探索できる。
本開示の一側面によれば、合成可能な化合物を効率的に探索できる。
以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。
[システムの構成]
実施形態に係る情報処理システム10は、合成可能な化合物を探索するコンピュータシステムである。例えば、情報処理システム10は合成可能な有機化合物を探索する。情報処理システム10は、反応性官能基を有する反応物を一般式によって表現した反応式を取得し、該反応式に適合する反応物の組合せを反応物コンビネーションとして選択する。そして、情報処理システム10はその反応式および反応物コンビネーションから得られる生成物を特定する。この生成物は、合成可能であると推定される化合物である。情報処理システム10は反応性官能基を示す所与の反応式の群と所与の反応物の群とから、実現可能な化学反応および化合物を探索する。例えば、反応式の群は、実現可能な反応式の集合であり、反応物の群は、入手可能な反応物の集合である。情報処理システム10は、情報科学を通じて新規のまたは有用な化合物を効率的に探索するマテリアルズ・インフォマティクスに寄与すると期待される。
実施形態に係る情報処理システム10は、合成可能な化合物を探索するコンピュータシステムである。例えば、情報処理システム10は合成可能な有機化合物を探索する。情報処理システム10は、反応性官能基を有する反応物を一般式によって表現した反応式を取得し、該反応式に適合する反応物の組合せを反応物コンビネーションとして選択する。そして、情報処理システム10はその反応式および反応物コンビネーションから得られる生成物を特定する。この生成物は、合成可能であると推定される化合物である。情報処理システム10は反応性官能基を示す所与の反応式の群と所与の反応物の群とから、実現可能な化学反応および化合物を探索する。例えば、反応式の群は、実現可能な反応式の集合であり、反応物の群は、入手可能な反応物の集合である。情報処理システム10は、情報科学を通じて新規のまたは有用な化合物を効率的に探索するマテリアルズ・インフォマティクスに寄与すると期待される。
反応性官能基とは、化学反応における結合の生成または開裂に関係する原子集団をいう。本開示において「反応性官能基を有する反応物を一般式によって表現した反応式」とは、反応物のうち反応性官能基以外の部分が、R,R1,R2等のようなプレースホルダ記号によって表現される反応式をいう。
図1は情報処理システム10の機能構成の一例を示す図である。情報処理システム10は機能モジュールとして反応物取得部11、反応式取得部12、および反応探索部13を備える。反応物取得部11は複数の反応物を示す反応物リストを取得する機能モジュールである。反応式取得部12は、反応性官能基を有する反応物を一般式によって表現した少なくとも一つの反応式を示す反応式リストを取得する機能モジュールである。反応探索部13は、取得された反応式に適合する反応物コンビネーションを反応物リストから選択し、その反応式によって該反応物コンビネーションから得られる生成物を特定する機能モジュールである。
本開示において「反応式に適合する反応物の組合せ」および「反応式に適合する反応物コンビネーション」とは、反応式によって示される反応性官能基を有する反応物の組合せをいう。反応物コンビネーションは少なくとも二つの反応物の組合せである。例えば、反応式の左辺で示される二つの反応物の一般式を第1一般式および第2一般式というとすると、「反応式に適合する反応物の組合せ」および「反応式に適合する反応物コンビネーション」は、第1一般式の反応性官能基を有する反応物と、第2一般式の反応性官能基を有する反応物との組合せである。この例において、第1一般式と第2一般式とで反応性官能基が同じ場合には、二つの同じ反応物によって反応物コンビネーションが生成され得る。
一例では、情報処理システム10は所与の通信ネットワークを介してデータベース群20に接続する。通信ネットワークはインターネットおよびイントラネットの少なくとも一方を含んで構成されてもよい。通信ネットワークは有線ネットワークおよび無線ネットワークの少なくとも一方を用いて構成され得る。データベース群20は、情報処理システム10によって用いられるデータを記憶する非一時的な記憶装置であるデータベースの集合である。一例では、データベース群20は反応物データベース21および反応式データベース22を含む。
反応物データベース21は、個々の反応物を示す反応物データを記憶するデータベースである。一例では、反応物データは入手可能な試薬を示す。
反応式データベース22は、個々の反応式を示す反応式データを記憶するデータベースである。上述したように、個々の反応式は、反応性官能基を有する反応物を一般式によって表現する。一例では、反応式データは、実現可能な反応式と、取り扱いが容易な反応式と、収率が所与の閾値以上である反応式とのうちの少なくとも一つを示す。
図2は、情報処理システム10を構成するコンピュータ100の一般的なハードウェア構成の一例を示す図である。例えば、コンピュータ100は、オペレーティングシステム、アプリケーション・プログラム等を実行する、CPU等のプロセッサ101と、ROMおよびRAMで構成される主記憶部102と、ハードディスク、フラッシュメモリ等で構成される補助記憶部103と、ネットワークカードまたは無線通信モジュールで構成される通信制御部104と、キーボード、マウス等の入力装置105と、モニタ等の出力装置106とを備える。
情報処理システム10の各機能モジュールは、プロセッサ101または主記憶部102の上に予め定められたプログラムを読み込ませてプロセッサ101にそのプログラムを実行させることで実現される。プロセッサ101はそのプログラムに従って、通信制御部104、入力装置105、または出力装置106を動作させ、主記憶部102または補助記憶部103におけるデータの読み出しおよび書き込みを行う。処理に必要なデータまたはデータベースは主記憶部102または補助記憶部103内に格納される。
情報処理システム10は1台以上のコンピュータで構成される。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネット、イントラネット等の通信ネットワークを介して接続されることで、論理的に一つの情報処理システム10が構築される。
コンピュータを情報処理システム10として機能させるための情報処理プログラムは、情報処理システム10の各機能モジュールを実現するためのプログラムコードを含む。この情報処理プログラムは、CD-ROM、DVD-ROM、半導体メモリ等の有形の記録媒体に非一時的に記録された上で提供されてもよい。あるいは、情報処理プログラムは、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。提供された情報処理プログラムは例えば補助記憶部103に記憶される。
[システムの動作]
図3を参照しながら、情報処理システム10の動作を説明するとともに本実施形態に係る情報処理方法について説明する。図3は情報処理システム10での処理の一例を処理フローS1として示すフローチャートである。
図3を参照しながら、情報処理システム10の動作を説明するとともに本実施形態に係る情報処理方法について説明する。図3は情報処理システム10での処理の一例を処理フローS1として示すフローチャートである。
ステップS101では、反応物取得部11が反応物リストを取得する。一例では、反応物取得部11は反応物データベース21にアクセスして、複数の反応物を示す反応物データを読み出す。反応物取得部11はその反応物の集合を反応物リストとして取得する。
ステップS102では、反応式取得部12が1以上の反応式リストを取得する。一例では、反応式取得部12は反応式データベース22にアクセスして、1以上の反応式を示す反応式データを読み出す。続いて、反応式取得部12は1以上の反応式についての複数の並びパターンのそれぞれを反応式リストとして生成する。一例では、生成される反応式リストの個数は、異なるn個の反応式のうち異なるr個の反応式を用いて生成され得る順列の総数nPrである。r=nなので、その順列の総数は正数nの階乗である。例えば4個の反応式が得られた場合には、反応式取得部12は、それぞれが4個の反応式の並びを示す24個の反応式リストを生成する。反応式取得部12は他の手法で反応式の順序を設定してもよい。例えば、反応式取得部12はユーザによって指定された反応式の順序にしたがって反応式リストを生成してもよい。あるいは、反応式取得部12は反応性官能基に関する所与の順序に基づいて反応式リストを生成してもよい。反応式取得部12が反応式データベース22から一つの反応式を読み出した場合には、生成される単一の反応式リストはその単一の反応式を示す。
ステップS103では、反応探索部13が一つの反応式リストを選択する。
ステップS104では、反応探索部13が、その反応式リストから一つの反応式を選択するための変数iを1に設定する。この変数iは一つの反応式リストにおける反応式の順序を表す。
ステップS105では、反応探索部13が選択された反応式リストからi番目の反応式を選択する。
ステップS106では、反応探索部13がi番目の反応式について反応物の候補を設定する。1番目の反応式については、反応探索部13は反応物リストの全体を反応物の候補として設定する。2番目以降の反応式について反応物の候補を設定する方法については後述する。
ステップS107では、反応探索部13が、i番目の反応式に適合する反応物コンビネーションおよび生成物を探索する。反応探索部13はi番目の反応式に適合する反応物コンビネーションを反応物の候補から選択する。そして、反応探索部13はその反応式によってその反応物コンビネーションから得られる生成物を特定する。反応探索部13はその反応式について複数の反応物コンビネーションを選択する可能性があり、この場合には、該複数の反応物コンビネーションのそれぞれについて生成物を特定する。あるいは、反応探索部13はその反応式に適合する反応物コンビネーションを一つも選択しないかもしれず、この場合には、反応探索部13は生成物を特定しない。
ステップS108に示すように、i番目の反応式に適合する反応物コンビネーションが存在するか否かに応じて後続の処理が変わる。
1以上の反応物コンビネーションが選択された場合には(ステップS108においてYES)、処理はステップS109に進む。ステップS109では、反応探索部13が、現在選択されている反応式リストについての後続処理のために、i番目の反応式と、この反応式に対応する反応物コンビネーションおよび生成物とを保存する。
一方、一つの反応物コンビネーションも選択されなかった場合には(ステップS108においてNO)、処理はステップS110に進む。ステップS110では、反応探索部13がi番目の反応式を棄却する。この処理は、現在選択されている反応式リストではその反応式が考慮されないことを意味する。
ステップS111に示すように、反応探索部13は現在選択されている反応式リストのすべての反応式を処理する。未処理の反応式が存在する場合には(ステップS111においてNO)、処理はステップS112に進む。ステップS112では反応探索部13が変数iを1だけインクリメントする。これは反応探索部13が次の反応式を処理することを意味する。
ステップS112の後に処理はステップS105に戻り、反応探索部13は次の反応式についてステップS105~S111を実行する。ステップS105では、反応探索部13はi番目の反応式、すなわち次の反応式を選択する。ステップS106では、反応探索部13はその反応式について反応物の候補を設定する。2番目以降の反応式については、反応探索部13はこれまでの処理で得られた生成物と反応物リストとの和集合を、i番目の反応式についての反応物の候補として設定する。また、反応探索部13は、現在選択されている反応式リストにおいて現段階までで最後に得られた生成物を、言い換えると、(i-1)番目の反応式までにおいて最後にステップS109で保存された生成物を、直近の生成物として特定する。直近の生成物を特定する理由は、少なくとも二つの反応式で示される連続反応を探索するためである。ステップS107では、反応探索部13はi番目の反応式に適合する反応物コンビネーションを反応物の候補から選択する。連続反応を実現する2番目以降の反応式を探索する場合には、反応探索部13は、反応物コンビネーションの少なくとも一方の反応物が直近の生成物であることを拘束条件として設定して、i番目の反応式に適合する反応物コンビネーションを選択する。反応探索部13はその反応式によってその反応物コンビネーションから得られる生成物を特定する。その後、反応探索部13はステップS108~S111を実行する。
現在選択されている反応式リストのすべての反応式が処理された場合には(ステップS111においてYES)、処理はステップS113に進む。
ステップS113に示すように、反応探索部13はすべての反応式リストを処理する。未処理の反応式リストが存在する場合には(ステップS113においてNO)、処理はステップS103に戻る。反応探索部13はステップS103において次の反応式リストを選択し、その反応式リストについてステップS104~S113を実行する。
すべての反応式リストが処理された場合には(ステップS113においてYES)、処理はステップS114に進む。ステップS114では、反応探索部13が探索結果を出力する。例えば、反応探索部13は、反応物リスト内の反応物に基づいて得られる最終生成物と、その最終生成物を得るための化学反応との少なくとも一方を探索結果として出力する。最終生成物が得られる化学反応は、単一反応でもあり得るし、連続反応でもあり得る。探索結果の出力方法は限定されない。例えば、反応探索部13は探索結果を、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。あるいは、反応探索部13は情報処理システム10での後続処理のために探索結果を他の機能モジュールに出力してもよい。
上述したように、反応物データは入手可能な試薬を反応物として示してもよく、反応式データは、実現可能性、取扱性、および収率の少なくとも一つに基づいて選択された反応式を示してもよい。この場合、探索結果は実現が相対的に容易な最終生成物または化学反応を示すと期待できる。
図4~図9を参照しながら処理フローS1に関する具体例を説明する。図4はデータベース群20から取得される反応物および反応式の例を示す図である。図5は反応式リストの例を示す図である。図6は一つの反応式リストについての処理の例を示す図であり、図7はその処理によって得られる化学反応および生成物を示す図である。図8は別の反応式リストについての処理の例を示す図であり、図9はその処理によって得られる化学反応および生成物を示す図である。
ステップS101では、図4に示すように、反応物取得部11が反応物データベース21から反応物201~203を読み出し、これらの反応物を含む反応物リスト200を生成する。反応物201はエタノールである。反応物202はp-アミノフェノールであり、4-ヒドロキシアニリンともいわれる。反応物203は(クロロメチル)シクロプロパンである。
ステップS102では、図4に示すように、反応式取得部12が反応式データベース22から反応式301~303を読み出す。図5に示すように、反応式取得部12はこれらの反応式についての複数の並びパターンのそれぞれを反応式リストとして生成する。反応式301で示される二つの反応物の反応性官能基は共にヒドロキシ基である。反応式302では反応性官能基はヒドロキシ基およびアミノ基である。反応式303では反応性官能基はクロロ基およびヒドロキシ基である。反応式取得部12は反応式301~303を用いて6個の反応式リスト311~316を生成する。
ステップS103以降では、反応探索部13が反応物リスト200および反応式リスト311~316に基づいて化合物を探索する。
ステップS103~S105では、反応探索部13は反応式リスト311を選択し、このリストの1番目にある反応式301を選択する。
ステップS106では、反応探索部13はその反応式301について、反応物リスト200の全体を反応物の候補として設定する。
ステップS107では、反応探索部13は反応式301に適合する反応物コンビネーションおよび生成物を探索する。以下では、二つの反応物R1,R2から成る反応物コンビネーションを「{反応物R1、反応物R2}」と表し、この反応物コンビネーションから得られる生成物を「{反応物R1、反応物R2}→(生成物)」と表す。図6に示すように、反応探索部13は反応式301に適合する反応物コンビネーションとして、{反応物201,反応物202}、{反応物201,反応物201}、および{反応物202,反応物202}を選択する。そして、反応探索部13は以下のように生成物211~213を特定する。
・{反応物201,反応物202}→(生成物211)
・{反応物201,反応物201}→(生成物212)
・{反応物202,反応物202}→(生成物213)
・{反応物201,反応物201}→(生成物212)
・{反応物202,反応物202}→(生成物213)
反応式301に適合する反応物コンビネーションが存在するので、処理はステップS108の後にステップS109に進む。ステップS109では、反応探索部13は反応式301と、ステップS107で得られた3個の反応物コンビネーションおよび3個の生成物211~213とを保存する。
ステップS111,S112,S105では、反応探索部13は反応式リスト311の2番目にある反応式302を選択する。
ステップS106では、反応探索部13はその反応式302について、生成物211~213と反応物リスト200との和集合を反応物の候補として設定する。また、反応探索部13は、最後に得られた生成物211~213を直近の生成物として特定する。
ステップS107では、反応探索部13は反応式302に適合する反応物コンビネーションおよび生成物を探索する。反応探索部13は、反応物コンビネーションの少なくとも一方が生成物211~213のいずれかであることを拘束条件として、反応式302に適合する反応物コンビネーションを選択する。図6に示すように、反応探索部13は反応式302に適合する反応物コンビネーションとして、{反応物211,反応物201}、{反応物211,反応物202}、{反応物213,反応物201}、および{反応物213,反応物202}を選択する。そして、反応探索部13は以下のように生成物214~217を特定する。生成物216は1個の反応物213と2個の反応物201とから得られる。生成物217は1個の反応物213と2個の反応物202とから得られる。
・{反応物211,反応物201}→(生成物214)
・{反応物211,反応物202}→(生成物215)
・{反応物213,反応物201}→(生成物216)
・{反応物213,反応物202}→(生成物217)
・{反応物211,反応物202}→(生成物215)
・{反応物213,反応物201}→(生成物216)
・{反応物213,反応物202}→(生成物217)
反応式302に適合する反応物コンビネーションが存在するので、処理はステップS108の後にステップS109に進む。ステップS109では、反応探索部13は反応式302と、ステップS107で得られた4個の反応物コンビネーションおよび4個の生成物214~217とを保存する。
ステップS111,S112,S105では、反応探索部13は反応式リスト311の3番目にある反応式303を選択する。
ステップS106では、反応探索部13はその反応式303について、これまでの処理で得られた生成物211~217と反応物リスト200との和集合を反応物の候補として設定する。また、反応探索部13は、最後に得られた生成物214~217を直近の生成物として特定する。
ステップS107では、反応探索部13は反応式303に適合する反応物コンビネーションおよび生成物を探索する。反応探索部13は、反応物コンビネーションの少なくとも一方が生成物214~217のいずれかであることを拘束条件として、反応式303に適合する反応物コンビネーションを選択する。図6に示すように、生成物214~217のいずれも、反応式303で示される反応性官能基を有しないので、反応探索部13は反応式303に適合する反応物コンビネーションを一つも選択しない。
反応式303に適合する反応物コンビネーションが存在しないので、処理はステップS108の後にステップS110に進む。ステップS110では、反応探索部13は反応式303を棄却する。
図7に示すように、反応探索部13は反応式リスト311に基づいて、生成物211~217を最終生成物として特定する。反応探索部13は更に、その生成物211~217を得るための化学反応401~407を特定し得る。化学反応404~407は連続反応である。
反応式リスト311のすべての反応式が処理されたので、処理はステップS111の後にステップS113に進む。未処理の反応式リストが存在するので処理は103に戻る。
ステップS103~S105では、反応探索部13は反応式リスト312を選択し、このリストの1番目にある反応式303を選択する。
ステップS106では、反応探索部13はその反応式303について、反応物リスト200の全体を反応物の候補として設定する。
ステップS107では、反応探索部13は反応式303に適合する反応物コンビネーションおよび生成物を探索する。図8に示すように、反応探索部13は反応式303に適合する反応物コンビネーションとして、{反応物201,反応物203}および{反応物202,反応物203}を選択する。そして、反応探索部13は以下のように生成物221,222を特定する。
・{反応物201,反応物203}→(生成物221)
・{反応物202,反応物203}→(生成物222)
・{反応物202,反応物203}→(生成物222)
反応式303に適合する反応物コンビネーションが存在するので、処理はステップS108の後にステップS109に進む。ステップS109では、反応探索部13は反応式303と、ステップS107で得られた2個の反応物コンビネーションおよび2個の生成物221,222とを保存する。
ステップS111,S112,S105では、反応探索部13は反応式リスト312の2番目にある反応式301を選択する。
ステップS106では、反応探索部13はその反応式301について、生成物221,222と反応物リスト200との和集合を反応物の候補として設定する。また、反応探索部13は、最後に得られた生成物221,222を直近の生成物として特定する。
ステップS107では、反応探索部13は反応式301に適合する反応物コンビネーションおよび生成物を探索する。反応探索部13は、反応物コンビネーションの少なくとも一方が生成物221,222のいずれかであることを拘束条件として、反応式301に適合する反応物コンビネーションを選択する。図8に示すように、生成物221,222のいずれも、反応式301で示される反応性官能基を有しないので、反応探索部13は反応式301に適合する反応物コンビネーションを一つも選択しない。
反応式301に適合する反応物コンビネーションが存在しないので、処理はステップS108の後にステップS110に進む。ステップS110では、反応探索部13は反応式301を棄却する。
ステップS111,S112,S105では、反応探索部13は反応式リスト312の3番目にある反応式302を選択する。
ステップS106では、反応探索部13はその反応式302について、これまでの処理で得られた生成物221,222と反応物リスト200との和集合を反応物の候補として設定する。また、反応探索部13は、最後に得られた生成物221,222を直近の生成物として特定する。
ステップS107では、反応探索部13は反応式302に適合する反応物コンビネーションおよび生成物を探索する。反応探索部13は、反応物コンビネーションの少なくとも一方が生成物221,222のいずれかであることを拘束条件として、反応式302に適合する反応物コンビネーションを選択する。図8に示すように、反応探索部13は反応式302に適合する反応物コンビネーションとして{反応物222,反応物201}、および{反応物222,202}を選択する。さらに、反応探索部13は反応式302によってそれらの反応物コンビネーションから得られる以下の生成物223,224を特定する。
・{反応物222,反応物201}→(生成物223)
・{反応物222,反応物202}→(生成物224)
・{反応物222,反応物202}→(生成物224)
反応式302に適合する反応物コンビネーションが存在するので、処理はステップS108の後にステップS109に進む。ステップS109では、反応探索部13は反応式302と、ステップS107で得られた2個の反応物コンビネーションおよび2個の生成物223,224とを保存する。
図9に示すように、反応探索部13は反応式リスト312に基づいて、生成物221~224を最終生成物として特定する。反応探索部13は更に、その生成物221~224を得るための化学反応411~414を特定し得る。化学反応413,414は連続反応である。
反応式リスト312のすべての反応式が処理されたので、処理はステップS111の後にステップS113に進む。この後、反応探索部13は反応式リスト313~316のそれぞれについて化合物を探索する。
反応式リスト311~316が処理された場合には、ステップS114において反応探索部13は探索結果を出力する。例えば、反応探索部13は生成物211~217,221~224と、化学反応401~407,411~414とを示す探索結果を出力する。反応式リスト311~316を処理した結果、2以上の反応式リストにおいて同じ最終生成物および同じ化学反応が得られる可能性がある。この場合には、反応探索部13はその重複を除いた形式で探索結果を出力する。
図6~図9の例では、反応探索部13は反応式リスト311~316のそれぞれについて、該反応式リストによって示される複数の反応式の並び順と反応物リスト200とに基づいて、少なくとも一つの反応式を用いて示される化学反応によって得られる最終生成物を探索する。この探索において、反応探索部13は反応式に適合する少なくとも一つの反応物コンビネーションを反応物リストから選択し、該少なくとも一つの反応物コンビネーションのそれぞれについて、その反応式によって該反応物コンビネーションから得られる生成物を特定する。反応探索部13は探索された生成物211~217,221~224を最終生成物として特定する。反応探索部13は更に化学反応401~407,411~414を特定し得る。探索される最終生成物は、並び順に沿った少なくとも二つの反応式を用いて示される連続反応によって得られる最終生成物を含み得る。したがって、特定される化学反応は連続反応を含み得る。
[探索結果の利用]
上述したように、本開示に係る情報処理システムは、得られた探索結果について更なる処理を実行してもよい。図10は、その追加処理を実行する情報処理システム10Aの機能構成の一例を示す図である。情報処理システム10Aは、合成可能な化合物を探索し、探索結果として得られた1以上の化学反応のそれぞれについて反応経路を推定するコンピュータシステムである。反応経路とは、反応物から生成物までの過程をいう。
上述したように、本開示に係る情報処理システムは、得られた探索結果について更なる処理を実行してもよい。図10は、その追加処理を実行する情報処理システム10Aの機能構成の一例を示す図である。情報処理システム10Aは、合成可能な化合物を探索し、探索結果として得られた1以上の化学反応のそれぞれについて反応経路を推定するコンピュータシステムである。反応経路とは、反応物から生成物までの過程をいう。
一例では、情報処理システム10AはNudged Elastic Band(NEB)法を用いて反応経路を推定する。NEB法では、反応物および生成物の構造、すなわち初期構造および最終構造が入力データとして処理されて、これら二つの構造をつなぎ合わせるn個の中間構造が生成される。この中間構造はイメージ(image)とも呼ばれる。それぞれの中間構造は、反応経路に沿ったバネによって、隣接する別の構造と結合される。NEB法は、それぞれの中間構造に作用する力を求め、反応経路に対する垂直成分とバネによる復元力とを考慮しながら構造最適化を実行することで、活性化エネルギが最小である反応経路を最安定経路として求める。
NEB法は、活性化エネルギが最も低くなる反応経路を精度良く探索できるが、その反面、その探索に時間が掛かるという欠点を有する。情報処理システム10Aは、複数の反応物から生成物までの反応経路をより高速に推定することを可能にする。
情報処理システム10Aは機能モジュールとして、反応物取得部11、反応式取得部12、反応探索部13、構造計算部14、原子抽出部15、および経路探索部16を備える。すなわち、情報処理システム10Aは、情報処理システム10に構造計算部14、原子抽出部15、および経路探索部16を追加することで実現される。構造計算部14は複数の反応物と生成物とのそれぞれの最適構造を算出する機能モジュールである。最適構造とは、物質が最小のエネルギ状態にあるときの該物質の構造をいい、最安定構造とも呼ばれる。原子抽出部15は複数の反応物のそれぞれについて、化学反応に関係する原子を対象原子として抽出する機能モジュールである。経路探索部16は、複数の反応物から生成物への反応経路を少なくともNEB法によって推定する機能モジュールである。経路探索部16は対象原子に限定してNEB法の拘束条件を設定し、その拘束条件下でNEB法を実行して反応経路を推定する。
図11を参照しながら、情報処理システム10Aによる反応経路の推定について説明する。図11はその推定の一例を処理フローS2として示すフローチャートである。一例では、処理フローS2は、処理フローS1によって得られたそれぞれの化学反応について実行される。
ステップS201では、構造計算部14が、複数の反応物および生成物のそれぞれの最適構造を算出する。反応探索部13が少なくとも一つの生成物を特定したことに応答して、構造計算部14は反応物および生成物を示すデータを受け付け、それぞれの物質の最適構造を第一原理計算によって算出する。第一原理計算とは、経験的なパラメータ、すなわち実験データを用いることなく、量子力学に基づいて物質の物性を計算する手法をいう。第一原理計算の具体的な手法は限定されない。一例では、構造計算部14はGaussian社の計算化学用ソフトウェア「Gaussian16」を用いて実装され、B3LYP/6-31G(d)という計算条件によって最適構造が算出されてもよい。
ステップS202では、原子抽出部15が、化学反応に関係する原子を対象原子として抽出する。「化学反応に関係する原子」とは、化学反応によって変化する反応物(言い換えると、反応経路に関与する反応物)の部分構造を構成する原子である。「化学反応に関係する原子」は「反応経路に関与する原子」と言い換えることができる。したがって、それぞれの反応物について、対象原子として抽出される原子は、該反応物の全原子のうちの一部の原子のみである。化学反応に関係する原子の抽出方法は限定されず、原子抽出部15は任意の手法によって対象原子を抽出してよい。
一例では、原子抽出部15は、化学反応によって原子間距離が所与の閾値Taを跨ぐように変化する原子を選択し、この原子を対象原子として抽出してもよい。「原子間距離が閾値(Ta)を跨ぐように変化する原子」は2種類存在する。一つは、相手の原子との距離が化学反応によって、閾値Taを超える値から、閾値Ta未満の値へと変化する原子である。このような原子間距離の縮小は、結合の生成が生じたことを意味する。その結合は、より具体的には共有結合である。もう一つは、相手の原子との距離が化学反応によって、閾値Ta未満の値から、閾値Taを超える値へと変化する原子である。このような原子間距離の拡大は、結合(共有結合)の開裂が生じたことを意味する。すなわち、原子間距離が閾値を跨ぐように変化する原子は、結合の生成または開裂に関係する原子である。「結合の生成または開裂に関係する原子」は、化学反応に関係する原子の一例である。
一例では、或る二つの原子の組合せについての閾値Taは、該組合せの結合距離dと、1より大きい係数αとの積である。すなわち、Ta=d×αである。結合距離とは、共有結合を構成する二つの原子間の平均距離をいい、より具体的には、二つの原子核間の平均距離をいう。結合距離は二つの原子の組合せによって決まる。係数αは二つの原子の組合せの種類に依らない共通の値である。したがって、閾値Taは結合距離dに依存する。共通の係数αは任意の方針で定められてよく、例えば1.2であってもよい。
原子抽出部15は複数の反応物および生成物のそれぞれの最適構造を参照して、原子間距離が閾値Taを跨ぐように変化する原子を対象原子として抽出する。
別の例では、原子抽出部15は化学反応によって少なくとも一つの結合角が所与の閾値Tbを跨ぐように変化する原子を選択し、この原子を対象原子として抽出してもよい。結合角とは、原子から伸びる2つの化学結合の成す角度をいう。「少なくとも一つの結合角が閾値(Tb)を跨ぐように変化する原子」は2種類存在する。一つは、原子から伸びる2つの化学結合の成す角度が、化学反応によって、閾値Tbを超える値から、閾値Tb未満の値へと変化する原子である。もう一つは、原子から伸びる2つの化学結合の成す角度が、化学反応によって、閾値Tb未満の値から、閾値Tbを超える値へと変化する原子である。結合角が閾値Tbを跨ぐように変化する原子も、反応経路に関与する可能性がある。
別の例では、原子抽出部15は化学反応によって二面角が所与の閾値Tc以上に変化する原子群を選択し、この原子群を対象原子として抽出してもよい。「二面角が閾値(Tc)以上に変化する原子群」は、二面角を成す二つの面に共通する二つの原子と、該二つの原子の各々に結合する原子とであってよい。二面角が閾値Tc以上に変化する原子群も、反応経路に関与する可能性がある。
本開示では、原子間距離が閾値Taを跨ぐように変化する原子と、結合角が閾値Tbを跨ぐように変化する原子と、二面角が閾値Tc以上に変化する原子群とを「第1原子」ともいう。原子抽出部15は、反応物において第1原子の近くに位置する原子も対象原子として抽出してもよい。本開示ではその原子を「第2原子」という。第2原子は、結合の生成または開裂が発生する位置に近いか、あるいは該発生の可能性がある位置に近いので、第2原子も化学反応に関係する原子であり得る。一例では、原子抽出部15は、反応物において第1原子に結合する原子を第2原子として選択し、この第2原子を対象原子として抽出する。
図12は対象原子を抽出する一例を示す図である。この例は、アミン化合物とエポキシ化合物との反応における対象原子の抽出を示す。この例は、アミン化合物としてn-ブチルアミンを示し、エポキシ化合物として1,2-エポキシヘキサンを示す。この例では、原子抽出部15は化学反応によって原子間距離が所与の閾値Taを跨ぐように変化する原子を第1原子501として選択する。具体的には、原子抽出部15は、n-ブチルアミンの窒素原子および一つの水素原子と、1,2-エポキシヘキサンの酸素原子および先端の炭素原子とを第1原子501として選択する。さらに、原子抽出部15はその第1原子501に結合する原子を第2原子502として選択する。具体的には、原子抽出部15は、n-ブチルアミンについて、それぞれが窒素原子と結合するもう一つの水素原子および一つの炭素原子を第2原子502として選択する。また、原子抽出部15は、1,2-エポキシヘキサンについて、酸素原子および先端の炭素原子の双方と結合する炭素原子と、該先端の炭素原子に結合する2つの水素原子とを第2原子502として選択する。したがって、原子抽出部15は合計9個の原子を対象原子として抽出する。
図11に戻って、ステップS203では、経路探索部16がそれぞれの対象原子に限定してNEB法の拘束条件を設定する。すなわち、経路探索部16はそれぞれの反応物について一部の原子に限って拘束条件を設定する。具体的には、経路探索部16は、各対象原子の反応方向を反応経路の方向に制限するという拘束条件を設定する。この拘束条件は、それぞれの対象原子が、反応経路に沿ったバネによって、隣接する中間構造と結合されるという制約を含む。拘束条件に含まれるばね定数は、任意の方針に基づいて設定されてよい。
ステップS204では、経路探索部16が、設定された拘束条件下でNEB法を実行して仮の最安定経路を探索する。具体的には、経路探索部16は反応物と生成物との間の各原子の座標変化を示す任意の反応経路を生成する。この反応経路は初期の反応経路といえる。続いて、経路探索部16はその反応経路上に複数の中間構造を設定する。個々の中間構造は反応経路上の経由点であるといえる。続いて、経路探索部16は複数の中間構造のそれぞれについて、該中間構造のポテンシャルエネルギと、該ポテンシャルエネルギの一次微分である力とを算出する。そして、経路探索部16はその計算結果に基づいて各中間構造の構造最適化を実行して、それぞれ中間構造の各原子の座標を更新する。この結果、新たな反応経路が得られる。経路探索部16は、ポテンシャルエネルギおよび力の計算と、構造最適化と、各原子の座標の更新とを含む一連の処理を拘束条件下で実行する。経路探索部16は各中間構造においてポテンシャルエネルギの変化量が所与の閾値以下になるまでその一連の処理を繰り返し実行する。最後に得られた反応経路についてポテンシャルエネルギの変化量が所与の閾値以下である場合には、経路探索部16はその繰返し処理を終了して、該経路を仮の最安定経路として推定する。
本実施形態では、経路探索部16はCI-NEB法を用いて、NEB法により得られた経路から化学反応における遷移状態(TS)とその遷移状態を通る最安定経路とを算出する。したがって、本実施形態では、NEB法により得られた経路を「仮の最安定経路」と表現する。遷移状態とは化学反応において最もエネルギが高い状態をいう。CI-NEB法はNEB法の改良手法である。
ステップS205では、経路探索部16が、設定された拘束条件下でCI-NEB法を実行して、最安定経路および遷移状態を探索する。具体的には、経路探索部16はNEB法により得られた仮の最安定経路を示すデータを読み込む。続いて、経路探索部16は複数の中間構造のそれぞれについて、該中間構造のポテンシャルエネルギと、該ポテンシャルエネルギの一次微分である力とを算出する。この計算において経路探索部16は、最も高いエネルギを持つ中間構造(イメージ)については、バネの概念を導入せず、該中間構造がポテンシャル面を登る力を考慮する。他の中間構造については、経路探索部16はNEB法と同じ計算を実行する。このように、CI-NEB法とNEB法との違いは、最も高いエネルギを持つ中間構造についての計算手法にある。経路探索部16はその計算結果に基づいて各中間構造の構造最適化を実行することで、それぞれ中間構造の各原子の座標を更新する。この結果、新たな反応経路が得られる。経路探索部16は、ポテンシャルエネルギおよび力の計算と、構造最適化と、各原子の座標の更新とを含む一連の処理を拘束条件下で実行する。経路探索部16は各中間構造においてポテンシャルエネルギの変化量が所与の閾値以下になるまでその一連の処理を繰り返し実行する。最後に得られた反応経路についてポテンシャルエネルギの変化量が所与の閾値以下である場合には、経路探索部16はその繰返し処理を終了して、該経路を最安定経路として推定する。
ステップS206では、経路探索部16がその最安定経路を推定結果として出力する。推定結果の出力方法は限定されない。例えば、経路探索部16は推定結果を、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。あるいは、経路探索部16は情報処理システム10Aでの後続処理のために推定結果を他の機能モジュールに出力してもよい。
処理フローS2では、経路探索部16はNEB法およびCI-NEB法を用いて反応経路を推定する。しかし、情報処理システム10AはCI-NEB法を用いることなく、NEB法によって反応経路を推定してもよい。例えば、情報処理システム10Aは、ステップS204において推定される「仮の最安定経路」を最終の推定結果として出力してもよい。
[効果]
以上説明したように、本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の反応物を示す反応物リストを取得し、反応性官能基を有する反応物を一般式によって表現した反応式を取得し、反応式に適合する反応物の少なくとも一つの組合せを、少なくとも一つの反応物コンビネーションとして、反応物リストから選択し、少なくとも一つの反応物コンビネーションのそれぞれについて、反応式によって該反応物コンビネーションから得られる生成物を特定する。
以上説明したように、本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の反応物を示す反応物リストを取得し、反応性官能基を有する反応物を一般式によって表現した反応式を取得し、反応式に適合する反応物の少なくとも一つの組合せを、少なくとも一つの反応物コンビネーションとして、反応物リストから選択し、少なくとも一つの反応物コンビネーションのそれぞれについて、反応式によって該反応物コンビネーションから得られる生成物を特定する。
本開示の一側面に係る情報処理方法は、少なくとも一つのプロセッサを備える情報処理システムにより実行される。この情報処理方法は、複数の反応物を示す反応物リストを取得するステップと、反応性官能基を有する反応物を一般式によって表現した反応式を取得するステップと、反応式に適合する反応物の少なくとも一つの組合せを、少なくとも一つの反応物コンビネーションとして、反応物リストから選択するステップと、少なくとも一つの反応物コンビネーションのそれぞれについて、反応式によって該反応物コンビネーションから得られる生成物を特定するステップとを含む。
本開示の一側面に係る情報処理プログラムは、複数の反応物を示す反応物リストを取得するステップと、反応性官能基を有する反応物を一般式によって表現した反応式を取得するステップと、反応式に適合する反応物の少なくとも一つの組合せを、少なくとも一つの反応物コンビネーションとして、反応物リストから選択するステップと、少なくとも一つの反応物コンビネーションのそれぞれについて、反応式によって該反応物コンビネーションから得られる生成物を特定するステップとをコンピュータに実行させる。
このような側面においては、化学反応に直接に寄与する反応性官能基に着目した反応式に基づいて、反応物コンビネーションの選択と生成物の特定とが行われるので、合成可能な化合物を効率的に探索できる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複数の反応式を取得し、複数の反応式についての複数の並びパターンのそれぞれを反応式リストとして生成し、複数の反応式リストのそれぞれについて、該反応式リストによって示される複数の反応式の並び順と反応物リストとに基づいて、少なくとも一つの反応式を用いて示される化学反応によって得られる最終生成物を探索し、探索された最終生成物を特定してもよい。このような反応式リストを用いることで、生成され得る最終生成物を網羅的に特定できる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、最終生成物に対応する化学反応を更に特定してもよい。この処理により、最終生成物を得るための化学反応を得ることができる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複数の反応式リストのそれぞれについて、並び順に沿った少なくとも二つの反応式を用いて示される連続反応によって得られる最終生成物を探索してもよい。この場合には、連続反応によって生成され得る最終生成物を特定できる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、最終生成物に対応する連続反応を更に特定してもよい。この処理により、最終生成物を得るための連続反応を得ることができる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複数の反応式リストのそれぞれについて、i番目の反応式に適合する少なくとも一つの反応物コンビネーションが存在する場合には、該i番目の反応式と、該少なくとも一つの反応物コンビネーションと、該i番目の反応式によって該少なくとも一つの反応物コンビネーションから得られる少なくとも一つの生成物とを保存し、保存された生成物に応答して、(i+1)番目の反応式に適合する反応物コンビネーションの少なくとも一方の反応物が保存された生成物であるという拘束条件の下で、(i+1)番目の反応式に適合する少なくとも一つの反応物コンビネーションを探索してもよい。i番目の反応式によって得られる生成物が中間生成物として仮に設定され、この拘束条件の下で次の反応式に適合する反応物コンビネーションが探索される。この処理によって連続反応を網羅的に探索できる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、特定された生成物に応答して、特定された生成物に対応する反応物コンビネーションに含まれる複数の反応物のそれぞれについて、該反応物の全原子のうち、反応式によって示される化学反応に関係する一部の原子を対象原子として抽出し、対象原子に限定してNEB法の拘束条件を設定し、拘束条件下でNEB法を実行して、複数の反応物から生成物への反応経路を推定してもよい。この場合には、反応物の全原子のうち化学反応に関係する一部の原子に限定してNEB法の拘束条件が設定される。そして、その拘束条件下でのNEB法によって反応経路が推定される。拘束条件が設定される原子を限定することでNEB法の計算時間が短縮されるので、すなわち、構造最適化がより早く収束するので、複数の反応物から生成物までの反応経路を高速に推定できる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複数の反応物のそれぞれについて、化学反応によって原子間距離が所与の閾値を跨ぐように変化する原子を第1原子として選択し、該第1原子を対象原子として抽出してもよい。原子間距離の変化は結合の生成または開裂を示す。したがって、この原子間距離を考慮することで、拘束条件が設定される対象原子を適切に抽出することができる。ひいては、反応経路をより高精度に推定することが可能になる。
他の側面に係る情報処理システムでは、閾値が、結合距離と1より大きい係数との積であってもよい。このように閾値を設定することで、結合の生成または開裂に関係する原子を原子間距離に基づいて精度良く選択することができる。その結果、拘束条件が設定される対象原子を適切に抽出して、反応経路をより高精度に推定することが可能になる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複数の反応物のそれぞれについて、化学反応によって結合角が所与の閾値を跨ぐように変化する原子を第1原子として選択し、該第1原子を対象原子として抽出してもよい。結合角の変化は、その原子が反応経路に関与する可能性があることを示す。したがって、この結合角を考慮することで、拘束条件が設定される対象原子を適切に抽出することができる。ひいては、反応経路をより高精度に推定することが可能になる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複数の反応物のそれぞれについて、化学反応によって二面角が所与の閾値以上に変化する原子群を第1原子として選択し、該第1原子を対象原子として抽出してもよい。二面角の変化は、その原子群が反応経路に関与する可能性があることを示す。したがって、この二面角を考慮することで、拘束条件が設定される対象原子を適切に抽出することができる。ひいては、反応経路をより高精度に推定することが可能になる。
他の側面に係る情報処理システムでは、対象原子が、第1原子に結合する第2原子を含んでもよい。結合の生成または開裂に関係する第1原子に加えて、その第1原子に隣接する第2原子も、拘束条件を設定する対象とすることで、反応経路をより高精度に推定することができる。
[変形例]
以上、本開示の実施形態に基づいて詳細に説明した。しかし、本開示は上記の例に限定されるものではない。本開示は、その要旨を逸脱しない範囲で様々な変形が可能である。
以上、本開示の実施形態に基づいて詳細に説明した。しかし、本開示は上記の例に限定されるものではない。本開示は、その要旨を逸脱しない範囲で様々な変形が可能である。
反応探索部13は、処理フローS1のステップS101~S113によって得られた最終生成物に対して所与の制約条件を適用し、この制約条件を満たす最終生成物を最終結果として出力してもよい。この制約条件は、最終生成物が所与のn個の分子構造を含むことでもよいし、最終生成物の分子量が所与の閾値以上または以下であることでもよい。あるいは、反応探索部13は、ステップS107で特定された反応物に対して所与の制約条件を適用してもよい。この例では、反応探索部13は、i番目の反応式に適合する反応物コンビネーションが存在し、かつ生成物がその制約条件を満たす場合に、ステップS109を実行し、そうでない場合にステップS110を実行してもよい。
情報処理システムは、処理フローS2に相当する処理を、機械学習によって得られた学習済みモデルによって実行してもよい。
少なくとも一つのプロセッサにより実行される方法の処理手順は上記実施形態での例に限定されない。例えば、上述した処理またはステップの一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の2以上のステップが組み合わされてもよいし、ステップの一部が修正又は削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。
情報処理システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」の二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。
本開示において、「少なくとも一つのプロセッサが、第1の処理を実行し、第2の処理を実行し、…第nの処理を実行する。」との表現、またはこれに対応する表現は、第1の処理から第nの処理までのn個の処理を実行するプロセッサが途中で変わる場合を含む概念を示す。すなわち、この表現は、n個の処理のすべてが同じプロセッサで実行される場合と、n個の処理においてプロセッサが任意の方針で変わる場合との双方を含む概念を示す。
10,10A…情報処理システム、11…反応物取得部、12…反応式取得部、13…反応探索部、14…構造計算部、15…原子抽出部、16…経路探索部、20…データベース群、21…反応物データベース、22…反応式データベース、200…反応物リスト、311~316…反応式リスト。
Claims (9)
- 少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
複数の反応物を示す反応物リストを取得し、
反応性官能基を有する反応物を一般式によって表現した反応式を取得し、
前記反応式に適合する前記反応物の少なくとも一つの組合せを、少なくとも一つの反応物コンビネーションとして、前記反応物リストから選択し、
前記少なくとも一つの反応物コンビネーションのそれぞれについて、前記反応式によって該反応物コンビネーションから得られる生成物を特定する、
情報処理システム。 - 前記少なくとも一つのプロセッサが、
複数の前記反応式を取得し、
前記複数の反応式についての複数の並びパターンのそれぞれを反応式リストとして生成し、
複数の前記反応式リストのそれぞれについて、該反応式リストによって示される前記複数の反応式の並び順と前記反応物リストとに基づいて、少なくとも一つの前記反応式を用いて示される化学反応によって得られる最終生成物を探索し、
前記探索された最終生成物を特定する、
請求項1に記載の情報処理システム。 - 前記少なくとも一つのプロセッサが、前記最終生成物に対応する前記化学反応を更に特定する、
請求項2に記載の情報処理システム。 - 前記少なくとも一つのプロセッサが、複数の前記反応式リストのそれぞれについて、前記並び順に沿った少なくとも二つの前記反応式を用いて示される連続反応によって得られる前記最終生成物を探索する、
請求項2または3に記載の情報処理システム。 - 前記少なくとも一つのプロセッサが、前記最終生成物に対応する前記連続反応を更に特定する、
請求項4に記載の情報処理システム。 - 前記少なくとも一つのプロセッサが、複数の前記反応式リストのそれぞれについて、
i番目の反応式に適合する前記少なくとも一つの反応物コンビネーションが存在する場合には、該i番目の反応式と、該少なくとも一つの反応物コンビネーションと、該i番目の反応式によって該少なくとも一つの反応物コンビネーションから得られる少なくとも一つの前記生成物とを保存し、
前記保存された生成物に応答して、(i+1)番目の反応式に適合する前記反応物コンビネーションの少なくとも一方の反応物が前記保存された生成物であるという拘束条件の下で、(i+1)番目の反応式に適合する前記少なくとも一つの反応物コンビネーションを探索する、
請求項4または5に記載の情報処理システム。 - 前記少なくとも一つのプロセッサが、前記特定された生成物に応答して、
前記特定された生成物に対応する前記反応物コンビネーションに含まれる複数の反応物のそれぞれについて、該反応物の全原子のうち、前記反応式によって示される化学反応に関係する一部の原子を対象原子として抽出し、
前記対象原子に限定してNEB法の拘束条件を設定し、
前記拘束条件下で前記NEB法を実行して、前記複数の反応物から前記生成物への反応経路を推定する、
請求項1~6のいずれか一項に記載の情報処理システム。 - 少なくとも一つのプロセッサを備える情報処理システムにより実行される情報処理方法であって、
複数の反応物を示す反応物リストを取得するステップと、
反応性官能基を有する反応物を一般式によって表現した反応式を取得するステップと、
前記反応式に適合する前記反応物の少なくとも一つの組合せを、少なくとも一つの反応物コンビネーションとして、前記反応物リストから選択するステップと、
前記少なくとも一つの反応物コンビネーションのそれぞれについて、前記反応式によって該反応物コンビネーションから得られる生成物を特定するステップと、
を含む情報処理方法。 - 複数の反応物を示す反応物リストを取得するステップと、
反応性官能基を有する反応物を一般式によって表現した反応式を取得するステップと、
前記反応式に適合する前記反応物の少なくとも一つの組合せを、少なくとも一つの反応物コンビネーションとして、前記反応物リストから選択するステップと、
前記少なくとも一つの反応物コンビネーションのそれぞれについて、前記反応式によって該反応物コンビネーションから得られる生成物を特定するステップと、
をコンピュータに実行させる情報処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021179277A JP2023068308A (ja) | 2021-11-02 | 2021-11-02 | 情報処理システム、情報処理方法、および情報処理プログラム |
PCT/JP2022/040239 WO2023080061A1 (ja) | 2021-11-02 | 2022-10-27 | 情報処理システム、情報処理方法、および情報処理プログラム |
CN202280084385.7A CN118414668A (zh) | 2021-11-02 | 2022-10-27 | 信息处理系统、信息处理方法及信息处理程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021179277A JP2023068308A (ja) | 2021-11-02 | 2021-11-02 | 情報処理システム、情報処理方法、および情報処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023068308A true JP2023068308A (ja) | 2023-05-17 |
Family
ID=86241100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021179277A Pending JP2023068308A (ja) | 2021-11-02 | 2021-11-02 | 情報処理システム、情報処理方法、および情報処理プログラム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2023068308A (ja) |
CN (1) | CN118414668A (ja) |
WO (1) | WO2023080061A1 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09138808A (ja) * | 1995-11-15 | 1997-05-27 | Kureha Chem Ind Co Ltd | 化合物反応経路図の表示方法 |
US20020049548A1 (en) * | 2000-04-03 | 2002-04-25 | Libraria, Inc. | Chemistry resource database |
JP4623958B2 (ja) * | 2003-12-16 | 2011-02-02 | トヨタ自動車株式会社 | 化学反応経路の探索方法 |
JP5099511B2 (ja) * | 2008-06-25 | 2012-12-19 | 国立大学法人山口大学 | 合成経路評価システムとその方法とそのプログラム |
JP7021443B2 (ja) * | 2020-04-03 | 2022-02-17 | ダイキン工業株式会社 | 出発物質からの化学反応を解析する解析方法、解析装置、解析システムおよび解析プログラム |
-
2021
- 2021-11-02 JP JP2021179277A patent/JP2023068308A/ja active Pending
-
2022
- 2022-10-27 CN CN202280084385.7A patent/CN118414668A/zh active Pending
- 2022-10-27 WO PCT/JP2022/040239 patent/WO2023080061A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2023080061A1 (ja) | 2023-05-11 |
CN118414668A (zh) | 2024-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Strieth-Kalthoff et al. | Machine learning the ropes: principles, applications and directions in synthetic chemistry | |
Ramstein et al. | Breaking the curse of dimensionality to identify causal variants in Breeding 4 | |
Cho et al. | Prediction of novel synthetic pathways for the production of desired chemicals | |
CN108804869B (zh) | 基于神经网络的分子结构和化学反应能量函数构建方法 | |
Bystroff et al. | HMMSTR: a hidden Markov model for local sequence-structure correlations in proteins | |
US20210125691A1 (en) | Systems and method for designing organic synthesis pathways for desired organic molecules | |
Tropsha et al. | Integrating QSAR modelling and deep learning in drug discovery: the emergence of deep QSAR | |
Jiang et al. | Artificial intelligence for retrosynthesis prediction | |
Sun et al. | Multiple sequence alignment with hidden Markov models learned by random drift particle swarm optimization | |
Zhang et al. | Predicting linear B-cell epitopes by using sequence-derived structural and physicochemical features | |
Aderinwale et al. | RL-MLZerD: Multimeric protein docking using reinforcement learning | |
CN104156635A (zh) | 基于公共子序列的基因芯片表达数据的opsm挖掘方法 | |
Sengupta et al. | De novo design of potential reca inhibitors using multiobjective optimization | |
Shilpa et al. | Recent applications of machine learning in molecular property and chemical reaction outcome predictions | |
Wu et al. | Spatial graph attention and curiosity-driven policy for antiviral drug discovery | |
US20180060484A1 (en) | Extending assembly contigs by analyzing local assembly sub-graph topology and connections | |
CN114627980A (zh) | 一种化学逆合成分析方法及系统 | |
WO2023080061A1 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
Ma et al. | MORN: Molecular property prediction based on textual-topological-spatial multi-view learning | |
Runge et al. | Rnabench: A comprehensive library for in silico rna modelling | |
Sun et al. | Choosing the best heuristic for seeded alignment of DNA sequences | |
Wang et al. | Predpromoter-mf (2l): A novel approach of promoter prediction based on multi-source feature fusion and deep forest | |
Devaurs et al. | A multi-tree approach to compute transition paths on energy landscapes | |
Ward et al. | Benchmarking deep graph generative models for optimizing new drug molecules for covid-19 | |
Agüero-Chapin et al. | Exploring the adenylation domain repertoire of nonribosomal peptide synthetases using an ensemble of sequence-search methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240910 |