JP7109339B2 - ポリマー設計装置、プログラム、および方法 - Google Patents

ポリマー設計装置、プログラム、および方法 Download PDF

Info

Publication number
JP7109339B2
JP7109339B2 JP2018207577A JP2018207577A JP7109339B2 JP 7109339 B2 JP7109339 B2 JP 7109339B2 JP 2018207577 A JP2018207577 A JP 2018207577A JP 2018207577 A JP2018207577 A JP 2018207577A JP 7109339 B2 JP7109339 B2 JP 7109339B2
Authority
JP
Japan
Prior art keywords
polymer
physical property
structural formula
polymer structure
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018207577A
Other languages
English (en)
Other versions
JP2020071827A (ja
Inventor
拓也 南
好成 奥野
克己 室伏
俊雄 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Showa Denko KK
Original Assignee
Showa Denko KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Showa Denko KK filed Critical Showa Denko KK
Priority to JP2018207577A priority Critical patent/JP7109339B2/ja
Priority to US16/666,643 priority patent/US11126695B2/en
Publication of JP2020071827A publication Critical patent/JP2020071827A/ja
Application granted granted Critical
Publication of JP7109339B2 publication Critical patent/JP7109339B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Description

特許法第30条第2項適用 平成30年5月21日 Materials Research Society が発行した MRS ADVANCES で公開
特許法第30条第2項適用 平成30年4月3日 Phoenix Convention Center において開催された 2018 MRS Spring Meeting & Exhibit で発表
本発明は、ポリマー設計装置、プログラム、および方法に関する。
従来、機能性材料の構造を新たに開発するには、多数の候補の中から所望の物性をもつ材料の構造を特定する必要があった。そのため、新規の機能性材料の構造の開発には、通常、時間とコストがかかっていた。
近年、機械学習を用いて所望の物性を有する材料を設計する方法が注目されている。例えば、遺伝的アルゴリズムを使用して、目的とする材料機能を実現する新たな結晶構造を探索する装置が報告されている(特許文献1)。他にも、粒子群最適化手法などを使用して、タンパク質と相互作用する化合物を設計する装置が報告されている(特許文献2)。
特開2018-10428号公報 特許5946045号公報
しかしながら、従来、ポリマーの設計においては、無作為にポリマーの構造を選んで実験を行い、所望の物性を有するポリマーの構造を探索していた。このような当てのない実験は非常に効率が悪く、所望の物性を有するポリマーの構造を効率的に予測することができなかった。
そこで、本発明は、ポリマーの構造の予測を効率化することを目的とする。
本発明は、以下の示す構成を備える。
[1]ポリマーの目標物性を取得する目標物性取得部と、
ポリマー構造を取得するポリマー構造式取得部と、
所定のポリマー構造と、前記所定のポリマー構造の物性値および標準偏差との対応関係に基づいて、前記取得したポリマー構造の物性値および標準偏差を予測する回帰計算部と、
前記予測した物性値および標準偏差と前記取得した目標物性とに基づいて算出されるスコアに従い、前記取得したポリマー構造のうちの1または複数のポリマー構造を出力するスコア評価部と
を有するポリマー設計装置。
[2]前記対応関係は、所定のポリマー構造と、前記所定のポリマー構造の物性の平均値および標準偏差で決まる正規分布との対応を示している、[1]に記載のポリマー設計装置。
[3]前記所定のポリマー構造から特徴量を計算する特徴量計算部と、
前記特徴量と前記所定のポリマー構造の物性との対応関係を構築する回帰モデル構築部と
を有する[1]または[2]に記載のポリマー設計装置。
[4]回帰モデル構築部において、回帰分析として、ガウス過程回帰、ベイジアンリッジ回帰、アンサンブル回帰、ディープラーニング、のいずれかを使用する、[3]に記載のポリマー設計装置。
[5]特徴量計算部において、所定のアルゴリズムに基づいて、ポリマー構造から、Extended Connectivity Fingerprints(ECFP)、分子量、logP、脂環の数、芳香環の数、ヘテロ環の数、またはそれらをポリマー繰り返し単位の原子数で割った値、のいずれかの特徴量を計算する、[3]または[4]に記載のポリマー設計装置。
[6]前記目標物性が前記物性値の最大化である場合、前記スコアは、前記予測した物性値に前記標準偏差を加算した値である、[1]から[5]のいずれか一項に記載のポリマー設計装置。
[7]前記目標物性が前記物性値の最小化である場合、前記スコアは、前記予測した物性値から前記標準偏差を減算した値である、[1]から[5]のいずれか一項に記載のポリマー設計装置。
[8]コンピュータを
ポリマーの目標物性を取得する目標物性取得部と、
ポリマー構造を取得するポリマー構造式取得部と、
所定のポリマー構造と、前記所定のポリマー構造の物性値および標準偏差との対応関係に基づいて、前記取得したポリマー構造の物性値および標準偏差を予測する回帰計算部と、
前記予測した物性値および標準偏差と前記取得した目標物性とに基づいて算出されるスコアに従い、前記取得したポリマー構造のうちの1または複数のポリマー構造を出力するスコア評価部と
して機能させるためのプログラム。
[9]コンピュータによって実行される方法であって、
目標物性を取得するステップと、
ポリマー構造を取得するステップと、
所定のポリマー構造と、前記所定のポリマー構造の物性値および標準偏差との対応関係に基づいて、前記取得したポリマー構造の物性値および標準偏差を予測するステップと、
前記予測した物性値および標準偏差と前記取得した目標物性とに基づいて算出されるスコアに従い、前記取得したポリマー構造のうちの1または複数のポリマー構造を出力するステップと
を含む方法。
本発明では、所望の物性を得るポリマーの構造の予測を効率化する。
本実施の形態におけるシステム構成例を示す図である。 ポリマー設計装置のハードウェア構成例を示す図である。 ポリマー設計装置の第1の機能構成例を示す図である。 物性の予測例を示す図である。 ポリマー構造式・物性DBのデータ構成例を示す図である。 予測処理を説明するためのフローチャートである。 ポリマー設計装置の試行回数の評価方法を説明するためのフローチャートである。 平均試行回数の評価結果例を説明するための図である。
以下、本発明の実施の形態を図面に基づいて説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
[システム構成例]
図1は、本実施の形態におけるシステム構成例を示す図である。まず、本実施の形態に係るシステム構成例について説明する。図1において、システム100は、ポリマー設計装置101と、1または複数の端末102とを有する。ポリマー設計装置101と各端末102とは、任意のネットワーク103を介して接続可能である。
ポリマー設計装置101は、ポリマーの構造を予測するポリマー設計部300を有する情報処理装置(コンピュータ)である。ポリマー設計装置101では、ポリマー設計部300が、予め与えられたポリマー構造(例えば、ポリマー構造式。以下、「ポリマー構造式」という)およびそのポリマーが有する物性(例えば、ガラス転移点、結晶化温度、屈折率等の物性値)を示すデータを用いて、機械学習をすることで回帰モデル(学習済みモデル)を作成する。また、ポリマー設計装置101では、ポリマー設計部300が、端末102からの複数のポリマー構造(例えば、ポリマー構造式。以下、「ポリマー構造式」という)104aの受信に応じて、受信したポリマー構造104aに対して物性値とその標準偏差を回帰モデルを用いて予測し、それらの値(つまり、物性値とその標準偏差)に基づき推薦された次に検証すべきポリマーの構造(例えば、ポリマー構造式。以下、「ポリマー構造式」という)104bを端末102に送信する。
端末102は、ユーザによって使用される情報処理端末(コンピュータ)である。端末102は、ポリマー設計装置101に接続して、ポリマー設計部300による処理を利用する。
なお、システムの構成は、図1の例に限定されない。一例として、ポリマー設計装置101は、スタンドアロンで利用されてもよい。この場合、ユーザの入力装置の操作により、複数のポリマー構造104aが入力されると、その中で最も良いと予測されるポリマーの構造104bが表示装置に出力される。
[ポリマー設計装置101のハードウェア構成例]
図2は、ポリマー設計装置101のハードウェア構成例を示す図である。本実施の形態におけるポリマー設計装置101は、図2に示すようなハードウェア構成を有する。図2において、ポリマー設計装置101は、情報処理装置(コンピュータ)であって、CPU(Central Processing Unit)201と、主記憶装置202と、補助記憶装置203と、入力装置204と、表示装置205と、通信I/F(インターフェース)206と、ドライブ装置207とを有し、各ハードウェアはバス208を介して相互に接続される。
CPU201は、主記憶装置202に格納されたプログラムに従ってポリマー設計装置101を制御するプロセッサに相当する。
主記憶装置202には、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU201にて実行されるプログラム、CPU201での処理に必要なデータ、CPU201での処理にて得られたデータ等を記憶または一時保存する。補助記憶装置203には、HDD(Hard Disk Drive)等が用いられ、各種処理を実行するためのプログラム等のデータを格納する。補助記憶装置203に格納されているプログラムの一部が主記憶装置202にロードされ、CPU201に実行されることによって、各種処理が実現される。主記憶装置202、補助記憶装置203、およびポリマー設計装置101によりアクセス可能な外部の記憶媒体209を含めて、以下、総称して、記憶部という。
入力装置204は、マウス、キーボード等を有し、ユーザがポリマー設計装置101による処理に必要な各種情報を入力するために用いられる。表示装置205は、CPU201の制御のもとに必要な各種情報を表示する。入力装置204と表示装置205とは、一体化したタッチパネル等によるユーザインタフェースであってもよい。
通信I/F206は、有線または無線などのネットワークを通じて通信を行う。通信I/F206による通信は、無線または有線に限定されるものではない。
ドライブ装置207は、ドライブ装置207にセットされた記憶媒体209(例えば、CD-ROM(Compact Disc Read-Only Memory)等)とポリマー設計装置101とのインターフェースを行う。ポリマー設計装置101によって行われる処理を実現するプログラムは、例えば、CD-ROM等の記憶媒体209によってポリマー設計装置101に提供される。記憶媒体209に、後述される本実施の形態に係る種々の処理を実現するプログラムを格納し、この記憶媒体209に格納されたプログラムは、ドライブ装置207を介してポリマー設計装置101にインストールされる。インストールされたプログラムは、ポリマー設計装置101により実行可能となる。なお、プログラムを格納する記憶媒体209はCD-ROMに限定されず、コンピュータが読み取り可能な、データの構造(structure)を有する1つ以上の非一時的(non-transitory)な、有形(tangible)な媒体であればよい。コンピュータ読取可能な記憶媒体209として、CD-ROMの他に、DVD(Digital Versatile Disk)ディスク、USBメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い。
[ポリマー設計装置101の第1の機能構成例]
図3は、ポリマー設計装置101の第1の機能構成例を示す図である。図3において、ポリマー設計装置101は、ポリマー設計部300を有する。ポリマー設計部300は、CPU201が対応するプログラムを実行することで実現される。
記憶部330は、ポリマー構造式・物性データベース(DB)331、特徴量332、回帰モデル333、予測物性値334、予測標準偏差335等が記憶される。
ポリマー設計部300は、ユーザが指定するポリマー構造式の物性を予測する回帰モデルを機械学習により作成する。また、ポリマー設計部300は、作成した回帰モデルを用いて、複数のポリマー構造式の物性およびその標準偏差を予測し、ポリマーの順位付けを行い、次に検証すべきポリマーの構造式を出力する。ポリマー設計部300は、モデル作成部310と構造式予測部320とを処理部として有する。
モデル作成部310は、ポリマー構造式・物性DB 331を用いて、ポリマー構造式から特徴量を計算し、回帰モデルを定める。ポリマー構造式・物性DB 331には、ポリマーごとに、ポリマー構造式と、実験で予め得られた物性の実験値とが対応付けられて記憶されている。ポリマー構造式・物性DB 331に記憶されているポリマー構造式および物性の実験値を用いることで、入力データ:ポリマーの構造式の特徴量、出力データ:そのポリマーの物性値(平均値)およびその標準偏差、となる回帰モデル(機械学習された学習済みモデル)が定められる。ポリマーの構造式は、所定の形式で表されればよい。第1の機能構成例では、SMILES(Simplified Molecular Input Line Entry Syntax)記法で構造式を表す場合で説明するが、この表記形式に限定されない。モデル作成部310は、特徴量計算部311と、回帰モデル構築部312とを処理部として有する。
特徴量計算部311は、ポリマー構造式・物性DB 331からポリマーの構造式を取得し、取得したポリマー構造式から特徴量332を計算する。計算された特徴量332は、記憶部330に記憶される。特徴量を計算する方法としては、所定のアルゴリズムに基づき、ポリマー構造式から特徴量を計算できる手法を用いることができる。例えば、Extended Connectivity Fingerprints(ECFP)や、分子量、logP、脂環の数、芳香環の数、ヘテロ環の数、のいずれも適用可能である。また、上記特徴量をポリマーの構成原子数で割った値も適用可能である。一例として、ECFPを構成原子数で割り計算された特徴量を用いて回帰モデルを取得することができる。
回帰モデル構築部312は、ポリマー構造式から計算される特徴量を用いることにより、ポリマー構造式から計算された特徴量とそのポリマーが有する物性の実験値とを用いて、回帰モデル(機械学習の学習済みモデル)333を構築する。回帰モデル333が記憶部330に保存される。
回帰モデル構築部312で得られる回帰モデル333は、
y_mean=f(x)
y_std=g(x)
で表される。ここで、y_meanは物性の予測値である。y_stdは標準偏差であり、予測の信頼度を表す。特徴量xに代入することで、ある物性の予測値y_meanとその標準偏差y_stdを得る。回帰モデル333では、ポリマーの構造式の特徴量が入力されると、そのポリマーの物性値の平均値(y_mean)およびその標準偏差(y_std)が出力される。
回帰モデル333を取得する回帰分析には、予測値とその標準偏差を計算できる手法を用いることができる。例えば、ガウス過程回帰、ベイジアンリッジ回帰、アンサンブル回帰、ディープラーニング、のいずれも適用可能である。一例として、ガウス過程回帰により回帰モデルを取得することができる。
構造式予測部320は、ポリマー構造式取得部321と、目標物性取得部322と、回帰計算部323と、スコア評価部324と、を処理部として有する。
ポリマー構造式取得部321は、ユーザによって指定された、複数のポリマー構造式を取得し、記憶部330に記憶する。ポリマー構造式取得部321は、ポリマー構造式を、任意のネットワーク103を介して他の装置(例えば、端末102)から受信することにより取得してもよいし、ポリマー設計装置101の入力装置等によるユーザのポリマー構造式の指定に応じて取得してもよい。ポリマー構造式は、SMILES記法等によりポリマーの構造式が指定されればよい。
目標物性取得部322は、ユーザによって指定された、ポリマーの目標物性を取得し、記憶部330に記憶する。目標物性は、ユーザが所望するポリマーの物性値である。目標物性取得部322は、目標物性を、任意のネットワーク103を介して他の装置(例えば、端末102)受信することにより取得してもよいし、ポリマー設計装置101の入力装置等によるユーザの目標物性の指定に応じて取得してもよい。目標物性の設定としては、物性の最大化や、物性の最小化としても良く、また、目標とする物性値を入力しても良い。一例として、物性の最大化を行うことができる。
回帰計算部323は、ユーザにより指定された複数のポリマー構造式の取得に応じて、回帰モデル333(機械学習の学習済みモデル)を用いて、取得したポリマー構造式の物性値とその標準偏差とを予測する。
具体的には、回帰計算部323は、ポリマー構造式取得部321が取得したポリマー構造式から特徴量を計算する。特徴量を計算する方法としては、所定のアルゴリズムに基づき、ポリマー構造式から特徴量を計算できる手法を用いることができる。例えば、Extended Connectivity Fingerprints(ECFP)や、分子量、logP、脂環の数、芳香環の数、ヘテロ環の数、のいずれも適用可能である。また、上記特徴量をポリマーの構成原子数で割った値も適用可能である。一例として、ECFPを構成原子数で割り計算された特徴量を用いることができる。また、回帰計算部323は、記憶部330に記憶された回帰モデル333に基づいて、計算したポリマー構造式の特徴量から物性値(y_mean(物性の予測値))とその標準偏差(y_std)を予測する。予測した物性値334とその標準偏差335とが記憶部330に出力される。
図4は、物性の予測例を示す図である。回帰モデル333は、物性の予測値(y_mean)とその標準偏差(y_std)で決まる正規分布(確率分布)として、ポリマー構造式の物性値を出力することができる。図4では、物性(ガラス転移点)の予測値とその標準偏差で決まる正規分布(確率分布)が示されている。例えば、回帰モデル333に対して、ポリマー構造式Aが入力されるとガラス転移点A(300℃±20℃)が出力され、ポリマー構造式Bが入力されるとガラス転移点B(280℃±60℃)が出力されるとする。ポリマー構造式Aの場合、予測値(y_mean)は300℃であり、その標準偏差(y_std)は20℃である。ポリマー構造式Bの場合、予測値(y_mean)は280℃であり、その標準偏差(y_std)は60℃である。
図3に戻る。スコア評価部324は、物性の予測値とその標準偏差とを用いて、取得した複数のポリマーの順位付けを行う。ポリマーの順位付けの方法としては、ベイズ最適化として知られる方法を用いることができる。ベイズ最適化では、予測値(y_mean)だけでなく、予測標準偏差(y_std)を考慮して良し悪しを判定することができる。つまり、本実施の形態においては、予測された物性値だけでなく、その予測された物性値の標準偏差も考慮されうる。例えば、Probability of improvement(PI)、Expected value of improvement(EI)、Upper Confidence Bound(UCB)、Lower Confidence Bound(LCB)の、いずれのスコア評価も適用可能である。
スコア評価部324は、目標物性の設定が物性の最大化である場合、UCBにより、取得した複数のポリマーの順位付けを行うことができる。UCBでは、予測された物性値と、その標準偏差に係数kを乗じた値との和をスコアとして用い、スコアが大きいほど順位が高い(つまり、目標物性を満たす)ものとする。第1の機能構成例では、標準偏差に乗じる係数kを1.96とする場合で説明するが、この係数に限定されない。
Score=y_mean+k*y_std
以下、予測値に予測標準偏差が加算される理由を説明する。例えば、図4の例で説明すると、ベイズ最適化では「どちらのポリマー構造式がガラス転移点が最も高い可能性があるか?」を判定する。ポリマー構造式Aは、平均的に高いガラス転移点が予想されるが、分布が狭く、予測誤差を加算してもそれほど高いガラス転移点は期待できない。一方、ポリマー構造式Bは、平均的に少し低めのガラス転移点のように見えるが、分布の幅が広いため、予測誤差を加算した場合にはガラス転移点が高い可能性がある。したがって、目標物性の設定が物性の最大化である場合には、予測値に予測標準偏差が加算される。
あるいは、スコア評価部324は、目標物性の設定が物性の最小化である場合、LCBにより、取得した複数のポリマーの順位付けを行うことができる。LCBでは、予測された物性値から、その標準偏差に係数kを乗じた値を減算した値をスコアとして用い、スコアが小さいほど順位が高い(つまり、目標物性を満たす)ものとする。
Score=y_mean-k*y_std
このように、本実施の形態では、物性の予測値(y_mean)だけを用いるのでなく、物性の予測値(y_mean)とその標準偏差(y_std)との2つを用いて、ポリマーの順位付けを行うことができる。例えば、機械学習の教師データとなるデータが少ない場合や、教師データとは異なる新規のポリマーの物性を予測する場合、回帰モデルの予測精度が低いため、物性の予測値だけでは正しいスコアを得ることが難しい。本実施の形態のように、標準偏差を加えることによって、予想される誤差を考慮した上でスコアを評価することができる。したがって、物性の予測値だけを用いた場合よりも、信頼性の高いスコア評価が可能となる。
スコア評価部324は、上記スコアが高い(または、低い)ポリマーの構造式を取得する。取得するポリマーは一つであっても複数であっても良い。ネットワーク103を介してポリマー構造式が指定された場合には、得られたポリマー構造式はユーザの端末102に送信され表示される。ポリマー設計装置101でのユーザの操作によりポリマー構造式が指定された場合には、得られたポリマー構造式はポリマー設計装置101の表示装置に表示される。
[ポリマー構造式・物性DB 331のデータ構成例]
図5は、ポリマー構造式・物性DB 331のデータ構成例を示す図である。図5において、ポリマー構造式・物性DB 331は、ポリマーごとに、構造式、物性(例えば、屈折率、ガラス転移点等の種々の物性)の実験値等を管理するデータベースであり、ポリマー名、構造式、屈折率、ガラス転移点等の項目を有する。
「ポリマー名」は、ポリマー構造を特定する特定情報を示す。「構造式」は、そのポリマーの構造式を示す。SMILES記法で構造式を示した例で説明するが、構造式の表記方法は、SMILES記法に限定されない。「屈折率」、「ガラス転移点」等は、予め実験またはシミュレーションにより得られたポリマーの様々な物性の一例であり、物性の名称ごとに実験値またはシミュレーションで得た計算値が示される。この例では、ポリマー名「poly(ethylene)」に対して繰り返し単位「*CC*」が対応付けられ、屈折率「1.472」等の値が示されている。他のポリマーについても同様に、各物性値が示される。
なお、モデル作成部310において、参照されるデータ、生成されたデータ等を作業テーブル400で管理してもよい。作業テーブル400は、ポリマーごとに、算出した特徴量の値を記録したテーブルであり、ポリマー名、繰り返し単位、原子数、ECFP等の項目を有する。「ポリマー名」は、ポリマー構造式・物性DB 331に登録されたポリマー名を示す。「原子数」や「ECFP」は、特徴量計算部311によって得られた特徴量を示す。作業テーブル400の特徴量と、ポリマー構造式・物性DB 331の物性値とが回帰分析による機械学習に用いられる。このことから、作業テーブル400は、ポリマー名によって、ポリマー構造式・物性DB 331と関連付けられてもよい。なお、図4に示すポリマー構造式・物性DB 331および作業テーブル400のデータ構成例は、一例に過ぎず、この例に限定されない。
[予測処理を説明するためのフローチャート]
図6は、予測処理を説明するためのフローチャートである。上述より、ポリマー設計部300による予測処理は、図6に示すように行われる。
まず、モデル作成部310によりモデル作成処理を行う。
ステップ611(S611)で、モデル作成部310において、特徴量計算部311は、ポリマー構造式を取得する。
ステップ612(S612)で、特徴量計算部311は、S611で取得したポリマーの構造式の特徴量を計算する。
ステップ613(S613)で、回帰モデル構築部312は、S611で取得されたポリマーの構造式に対応する物性値を取得する。なお、S613は、S611の前に行われてもよいし、S611と同時に行われてもよい。
ステップ614(S614)で、回帰モデル構築部312は、S612で計算された特徴量を変数xとし、S613で取得した物性を変数yとして回帰モデルf(x)、g(x)を求める。回帰モデルは記憶部330に記憶される。
その後、構造式予測部320による構造式予測処理が行われる。
ステップ621(S621)で、目標物性取得部322は、目標物性を受け付ける。目標物性は記憶部330に保存される。
ステップ622(S622)で、ポリマー構造式取得部321は、ポリマー構造式を受け付ける。ポリマー構造式は記憶部330に保存される。なお、S622は、S621の前に行われてもよいし、S621と同時に行われてもよい。
ステップ623(S623)で、回帰計算部323は、S622で取得されたポリマー構造式の特徴量を計算する。この処理は、モデル作成処理におけるS612と同様の処理を行うことにより得られる。
ステップ624(S624)で、回帰計算部323部は、S623で得られた特徴量と、ステップS614で得られた回帰モデルとを用いて、物性値とその標準偏差を予測する。得られた物性値とその標準偏差は、記憶部330に保存される。
ステップ625(S625)で、スコア評価部324は、S624で得られた物性値とその標準偏差とを用いてスコアを計算し、ポリマーの順位付けを行う。
ステップ626(S626)で、スコア評価部324は、順位の高いポリマーを次に検証すべき候補のポリマーとし、そのポリマー構造式をユーザの端末102に送信し表示する。候補ポリマーの数は、一つでも複数でも良い。ポリマー設計装置101でのユーザの操作によりポリマー構造式が指定された場合、得られたポリマー構造式は表示装置に表示される。
発明者は、後述される、種々の機能構成の違いによるポリマー構造式予測の試行回数の検証を行っている。検証結果によれば、上述した第1の機能構成例が最も少ない試行回数で所望のポリマー構造式を予測できた。
(実施例1)
実施例1では、図7に示す試験により、第1の機能構成例の性能の検証を行った。予め、ポリマーのガラス転移点417データを用意した。これを評価用データセットとする。ポリマー設計試験として、評価用データセット中で最もガラス転移点が高いポリマーを設計する(つまり、目標物性が、ガラス転移点の最大化である)試験を行った。
図7に示す試験は以下の通りである。
ステップ701(S701)で、417件の評価用データセットの中から学習用データを10件、無作為に抽出してポリマー設計装置101の記憶部330の構造式・物性DB 331に保存した。
ステップ702(S702)で、S701の学習用データを用いて、第1の機能構成例のモデル作成部310により回帰モデルを作成した。
ステップ703(S703)で、評価用データセット中の、S701の学習用データ以外のポリマーの構造式を、ポリマー構造式取得部321に入力した。
ステップ704(S704)で、S703のポリマー構造式(つまり、S701の学習用データ以外のポリマー構造式)と、S702で得られた回帰モデルとを用いて、S703で入力したポリマー構造式のガラス転移点と、その標準偏差とを予測した。そして、ガラス転移点とその標準偏差および目標物性に基づきスコアを計算し、ポリマーの順位付けを行った。最もスコアが良いポリマーの構造式を次に検証すべき候補として提示した。
ステップ705(S705)で、S704で提示されたポリマーが所望のポリマー(目標物性を満たすポリマー。すなわち、評価データセット中で最もガラス転移点が高いポリマー)であるかが判定される。所望のポリマーである場合はステップ706へ、所望のポリマーではない場合はステップ707へ進む。
ステップ706(S706)で、所望のポリマーを見つけるまでに提示された構造式の数を試行回数として取得し、試行を終了した。
ステップ707(S707)で、S704で提示されたポリマー構造式に対応するガラス転移点のデータを取得する。
ステップ708(S708)で、S707のポリマー構造式およびガラス転移点のデータを構造式・物性DB 331に保存し、再び回帰モデルを構築するステップ(S702)に戻った。上記の処理(S702~S705)を、所望のポリマーの構造式が提示されるまで行った。
上記試験の結果は、最初に無作為に選択される学習データに依存する。そこで、最初の学習データの依存性を排除するために、同様の試験を500回実施した。500回の試験で得られた試行回数の平均を平均試行回数とし、ポリマー設計装置101の性能指標とした。平均試行回数の値が小さいほど、ポリマー設計装置101の性能が高いことを表す。
(実施例2)
実施例2は、図3のスコア評価部324において、標準偏差を使用せずにスコア評価を実施した場合に相当する。その他は、実施例1と同様の方法にて試験を行い、所望のポリマーの構造式を提示するまでの平均試行回数を計算した。
(実施例3)
実施例3は、図3の回帰モデル構築部312において、特徴量を削減した後に回帰モデルを構築した場合に相当する。特徴量の削減は、ラッソ回帰により実施した。すなわち、特徴量とガラス転移点とを用いて回帰モデルを構築し、回帰式の係数が0の項を除外した。この時に用いたハイパーパラメータは交差検証により求めた。特徴量を削減した後、実施例1と同様、ガウス過程回帰を用いて回帰モデルを構築した。その他は、実施例1と同様の方法にて試験を行い、所望のポリマーの構造式を提示するまでの平均試行回数を計算した。
(実施例4)
実施例4は、図3のスコア評価部324において、標準偏差を使用せずにスコア評価を実施した場合に相当する。その他は、実施例3と同様の方法にて試験を行い、所望のポリマーの構造式を提示するまでの平均試行回数を計算した。
(比較例1)
比較例1は、図3においてスコア評価部324においてはポリマーの順位付けを行わず、無作為にポリマーの構造式を提示した。その他は、実施例1と同様の方法にて試験を行い、所望のポリマーの構造式を提示するまでの平均試行回数を計算した。
図8は、評価結果例を示す図である。図8では、比較例1、実施例1、実施例2、実施例3、実施例4のそれぞれに対して行った評価結果を示している。評価結果として、所望のポリマー構造式を提示するまでの平均試行回数を示している。比較例1では平均試行回数が198回であり、実施例2は24回、実施例3は16回、実施例4は17回であったのに対して、実施例1では4.6回と非常に小さい値を示した。平均試行回数は、値が小さいほど効率よく所望のポリマーの構造式を提示できたことを表す。したがって、この評価結果より、実施例1の実施形態は、最も効率よく、所望のポリマーを設計できることがわかる。以上より、本実施の形態によれば、所望のポリマーの構造式を、少ない試行回数で提示することができる。
このように、本発明の一実施形態では、ポリマーの繰り返し単位の構造式から計算された特徴量と、ポリマーの物性との相関を学習した予測モデルを用い、逆問題の解決方法としてベイズ最適化を適用することにより、所望の物性をもつポリマーの構造式を少ない試行錯誤回数で予測することができる。
所望の物性をもつポリマーを少ない試行回数で設計できるため、ポリマーの研究開発期間を短くすることができる。
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
100 システム
101 ポリマー設計装置
102 端末
103 ネットワーク
104a ポリマー構造群
104b ポリマー構造
300 ポリマー設計部
310 モデル作成部
311 特徴量計算部
312 回帰モデル構築部
320 構造式予測部
321 ポリマー構造式取得部
322 目標物性取得部
323 回帰計算部
324 スコア評価部
330 記憶部
331 ポリマー構造式・物性データベース
332 特徴量
333 回帰モデル
334 予測物性値
335 予測標準偏差
400 作業テーブル

Claims (9)

  1. ポリマーの目標物性を取得する目標物性取得部と、
    ポリマー構造を取得するポリマー構造式取得部と、
    所定のポリマー構造と、前記所定のポリマー構造の物性値および標準偏差との対応関係に基づいて、前記取得したポリマー構造の物性値および標準偏差を予測する回帰計算部と、
    前記予測した物性値および標準偏差と前記取得した目標物性とに基づいて算出されるスコアに従い、前記取得したポリマー構造のうちの1または複数のポリマー構造を出力するスコア評価部と
    を有するポリマー設計装置。
  2. 前記対応関係は、所定のポリマー構造と、前記所定のポリマー構造の物性の平均値および標準偏差で決まる正規分布との対応を示している、請求項1に記載のポリマー設計装置。
  3. 前記所定のポリマー構造から特徴量を計算する特徴量計算部と、
    前記特徴量と前記所定のポリマー構造の物性との対応関係を構築する回帰モデル構築部と
    を有する請求項1または2に記載のポリマー設計装置。
  4. 回帰モデル構築部において、回帰分析として、ガウス過程回帰、ベイジアンリッジ回帰、アンサンブル回帰、ディープラーニング、のいずれかを使用する、請求項3に記載のポリマー設計装置。
  5. 特徴量計算部において、所定のアルゴリズムに基づいて、ポリマー構造から、Extended Connectivity Fingerprints(ECFP)、分子量、logP、脂環の数、芳香環の数、ヘテロ環の数、またはそれらをポリマー繰り返し単位の原子数で割った値、のいずれかの特徴量を計算する、請求項3または4に記載のポリマー設計装置。
  6. 前記目標物性が前記物性値の最大化である場合、前記スコアは、前記予測した物性値に前記標準偏差を加算した値である、請求項1から5のいずれか一項に記載のポリマー設計装置。
  7. 前記目標物性が前記物性値の最小化である場合、前記スコアは、前記予測した物性値から前記標準偏差を減算した値である、請求項1から5のいずれか一項に記載のポリマー設計装置。
  8. コンピュータを
    ポリマーの目標物性を取得する目標物性取得部と、
    ポリマー構造を取得するポリマー構造式取得部と、
    所定のポリマー構造と、前記所定のポリマー構造の物性値および標準偏差との対応関係に基づいて、前記取得したポリマー構造の物性値および標準偏差を予測する回帰計算部と、
    前記予測した物性値および標準偏差と前記取得した目標物性とに基づいて算出されるスコアに従い、前記取得したポリマー構造のうちの1または複数のポリマー構造を出力するスコア評価部と
    して機能させるためのプログラム。
  9. コンピュータによって実行される方法であって、
    目標物性を取得するステップと、
    ポリマー構造を取得するステップと、
    所定のポリマー構造と、前記所定のポリマー構造の物性値および標準偏差との対応関係に基づいて、前記取得したポリマー構造の物性値および標準偏差を予測するステップと、
    前記予測した物性値および標準偏差と前記取得した目標物性とに基づいて算出されるスコアに従い、前記取得したポリマー構造のうちの1または複数のポリマー構造を出力するステップと
    を含む方法。
JP2018207577A 2018-11-02 2018-11-02 ポリマー設計装置、プログラム、および方法 Active JP7109339B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018207577A JP7109339B2 (ja) 2018-11-02 2018-11-02 ポリマー設計装置、プログラム、および方法
US16/666,643 US11126695B2 (en) 2018-11-02 2019-10-29 Polymer design device, polymer design method, and non-transitory recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018207577A JP7109339B2 (ja) 2018-11-02 2018-11-02 ポリマー設計装置、プログラム、および方法

Publications (2)

Publication Number Publication Date
JP2020071827A JP2020071827A (ja) 2020-05-07
JP7109339B2 true JP7109339B2 (ja) 2022-07-29

Family

ID=70458052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018207577A Active JP7109339B2 (ja) 2018-11-02 2018-11-02 ポリマー設計装置、プログラム、および方法

Country Status (2)

Country Link
US (1) US11126695B2 (ja)
JP (1) JP7109339B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11768945B2 (en) * 2020-04-07 2023-09-26 Allstate Insurance Company Machine learning system for determining a security vulnerability in computer software
JP2021196710A (ja) * 2020-06-10 2021-12-27 昭和電工株式会社 物性予測装置、物性予測方法及び製造方法
JP2022169242A (ja) * 2021-04-27 2022-11-09 昭和電工マテリアルズ株式会社 設計支援装置、設計支援方法及び設計支援プログラム
JP7288207B2 (ja) 2021-10-04 2023-06-07 ダイキン工業株式会社 低分子化合物探索方法、プログラム、装置、およびシステム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004158008A (ja) 2002-10-28 2004-06-03 General Electric Co <Ge> 所望の特性セットに最も良くマッチする新材料を設計するシステム及び方法
JP2017182432A (ja) 2016-03-30 2017-10-05 横浜ゴム株式会社 不均質材料のシミュレーション方法、不均質材料のシミュレーション装置およびプログラム
JP2018010428A (ja) 2016-07-12 2018-01-18 株式会社日立製作所 材料創成装置、および材料創成方法
CN107862173A (zh) 2017-11-15 2018-03-30 南京邮电大学 一种先导化合物虚拟筛选方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5946045B2 (ja) 1976-08-10 1984-11-10 ソニー株式会社 磁気再生装置
JPH06271823A (ja) 1993-03-19 1994-09-27 Sekisui Chem Co Ltd 配合設計システム
WO2002044686A2 (en) 2000-11-20 2002-06-06 The Procter & Gamble Company Predictive method for polymers
WO2008116495A1 (en) 2007-03-26 2008-10-02 Molcode Ltd Method and apparatus for the design of chemical compounds with predetermined properties
US20150310162A1 (en) * 2012-08-27 2015-10-29 Kyoto Constella Technologies Co., Ltd. Compound Design Device, Compound Design Method, And Computer Program
US20200082913A1 (en) * 2017-11-29 2020-03-12 Xgenomes Corp. Systems and methods for determining sequence
WO2019195737A1 (en) * 2018-04-06 2019-10-10 Braskem America, Inc. Raman spectroscopy and machine learning for quality control
US10896744B2 (en) * 2018-08-13 2021-01-19 American Chemical Society Systems and methods for validating and predicting polymer functions using polymer properties

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004158008A (ja) 2002-10-28 2004-06-03 General Electric Co <Ge> 所望の特性セットに最も良くマッチする新材料を設計するシステム及び方法
JP2017182432A (ja) 2016-03-30 2017-10-05 横浜ゴム株式会社 不均質材料のシミュレーション方法、不均質材料のシミュレーション装置およびプログラム
JP2018010428A (ja) 2016-07-12 2018-01-18 株式会社日立製作所 材料創成装置、および材料創成方法
CN107862173A (zh) 2017-11-15 2018-03-30 南京邮电大学 一种先导化合物虚拟筛选方法和装置

Also Published As

Publication number Publication date
US20200142951A1 (en) 2020-05-07
US11126695B2 (en) 2021-09-21
JP2020071827A (ja) 2020-05-07

Similar Documents

Publication Publication Date Title
JP7109339B2 (ja) ポリマー設計装置、プログラム、および方法
Blaschke et al. Memory-assisted reinforcement learning for diverse molecular de novo design
CN109657805B (zh) 超参数确定方法、装置、电子设备及计算机可读介质
Li et al. SPRINT: ultrafast protein-protein interaction prediction of the entire human interactome
CN112735535B (zh) 预测模型训练、数据预测方法、装置和存储介质
JP6536295B2 (ja) 予測性能曲線推定プログラム、予測性能曲線推定装置および予測性能曲線推定方法
Lewis et al. Modern 2D QSAR for drug discovery
Khamis et al. Comparative assessment of machine-learning scoring functions on PDBbind 2013
Borgwardt et al. Graph kernels for disease outcome prediction from protein-protein interaction networks
JP6851460B2 (ja) 最適解判定方法、最適解判定プログラム、非一時的記録媒体及び最適解判定装置
CN116802741A (zh) 逆合成系统和方法
KR101982674B1 (ko) 밀도 수정에 기초한 대체 트레이닝 분포
Thomas et al. Probing for sparse and fast variable selection with model‐based boosting
Rashid et al. Protein secondary structure prediction using a small training set (compact model) combined with a Complex-valued neural network approach
JP2020144493A (ja) 学習モデル生成支援装置、及び学習モデル生成支援方法
Niu et al. Quantitative prediction of drug side effects based on drug-related features
Fernandez-Lozano et al. Improving enzyme regulatory protein classification by means of SVM-RFE feature selection
KR102697950B1 (ko) 화합물의 타겟 단백질을 결정하는 방법 및 상기 방법을 수행하는 타겟 단백질 결정 장치
Maduranga et al. Inferring gene regulatory networks from time-series expressions using random forests ensemble
Mooney et al. Beyond the twilight zone: automated prediction of structural properties of proteins by recursive neural networks and remote homology information
US20170039315A1 (en) Information processing apparatus and simulation method
Jian et al. Predicting ligand binding sites on protein surfaces by 3-dimensional probability density distributions of interacting atoms
GB2600251A (en) Machine learning techniques for generating hybrid risk scores
Dai et al. Parameter set selection for dynamic systems under uncertainty via dynamic optimization and hierarchical clustering
JP7339923B2 (ja) 材料の特性値を推定するシステム

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20181112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220627

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220719

R150 Certificate of patent or registration of utility model

Ref document number: 7109339

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350