JP7506790B1 - 予測方法、情報処理装置、コンピュータプログラム、物質の選別方法及び物質の製造方法 - Google Patents

予測方法、情報処理装置、コンピュータプログラム、物質の選別方法及び物質の製造方法 Download PDF

Info

Publication number
JP7506790B1
JP7506790B1 JP2023058080A JP2023058080A JP7506790B1 JP 7506790 B1 JP7506790 B1 JP 7506790B1 JP 2023058080 A JP2023058080 A JP 2023058080A JP 2023058080 A JP2023058080 A JP 2023058080A JP 7506790 B1 JP7506790 B1 JP 7506790B1
Authority
JP
Japan
Prior art keywords
substance
process information
physical properties
feature amount
simulation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023058080A
Other languages
English (en)
Inventor
靖之 栗田
淳 押木
理彦 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Chemical Co Ltd
Original Assignee
Sumitomo Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Chemical Co Ltd filed Critical Sumitomo Chemical Co Ltd
Priority to JP2023058080A priority Critical patent/JP7506790B1/ja
Application granted granted Critical
Publication of JP7506790B1 publication Critical patent/JP7506790B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】物性を予測するモデルの予測精度を向上することができる予測方法等を提供する。【解決手段】予測方法は、物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質の物性を出力する予測モデルに、取得した前記物質のシミュレーション値、特徴量及びプロセス情報を入力することにより、前記物質の物性を予測する処理をコンピュータが実行する。【選択図】図1

Description

本発明は、予測方法、情報処理装置、コンピュータプログラム、物質の選別方法及び物質の製造方法に関する。
新規物質、代替物質の研究、開発などを行う際に、機械学習等の情報処理技術を組み合わせて効率的に物質探索を行うマテリアルズ・インフォマティクスに関する技術が提案されている。
例えば特許文献1には、予測対象である化合物と、化合物データベースから選択された化合物の共通構造及び差分構造を化合物性質予測モデルへ入力することによって、予測対象である化合物の性質の予測結果を得る化合物性質予測装置が開示されている。
特開2021-076890号公報
しかしながら、特許文献1に記載の技術は、モデルの予測精度の向上という観点において改善の余地がある。
本開示の目的は、物性を予測するモデルの予測精度を向上することができる予測方法等を提供することである。
本開示の一態様に係る予測方法は、物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質の物性を出力する予測モデルに、取得した前記物質のシミュレーション値、特徴量及びプロセス情報を入力することにより、前記物質の物性を予測する処理をコンピュータが実行する。
本開示の一態様に係る情報処理装置は、物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質の物性を出力する予測モデルに、取得した前記物質のシミュレーション値、特徴量及びプロセス情報を入力することにより、前記物質の物性を予測する処理を実行する制御部を備える。
本開示の一態様に係るコンピュータプログラムは、物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質の物性を出力する予測モデルに、取得した前記物質のシミュレーション値、特徴量及びプロセス情報を入力することにより、前記物質の物性を予測する処理をコンピュータに実行させる。
本開示の一態様に係る物質の選別方法は、複数の物質について、物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質の物性を出力する予測モデルに、取得した各物質の前記シミュレーション値、特徴量及びプロセス情報を入力することにより、各物質の物性を予測し、予測した物性が所定の要求物性を満たす物質を選別する。
本開示の一態様に係る物質の製造方法は、複数の物質について、物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得する工程と、物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質の物性を出力する予測モデルに、取得した各物質の前記シミュレーション値、特徴量及びプロセス情報を入力することにより、各物質の物性を予測する工程と、予測した物性が所定の要求物性を満たす物質を選別する工程と、選別した物質を得る工程と、を含む。
本開示によれば、物性を予測するモデルの予測精度を向上することができる。
本実施形態の製造システムの構成例を示すブロック図である。 予測モデルの概要を示す説明図である。 訓練データの内容例を示す図である。 予測モデルの生成処理手順の一例を示すフローチャートである。 物性の予測及び選別に関する処理手順の一例を示すフローチャートである。
本開示をその実施の形態を示す図面を参照して具体的に説明する。
図1は、本実施形態の製造システム100の構成例を示すブロック図である。製造システム100は、予測装置1と製造装置2とを備える。本実施形態の製造システム100は、新規物質、代替物質の研究、開発などのために、複数の候補物質の物性を予測し、予測結果に基づき候補物質の中から製造対象として選別された物質を製造する。
本実施形態では一例として、物質が有機半導体材料であり、物性として有機半導体中のキャリア移動度を予測する場合について説明する。有機半導体は、例えば有機EL(Electro Luminescence)ディスプレイ、有機太陽電池、有機トランジスタ等の電子デバイスに広く用いられている。キャリア移動度とは、電荷(電子又は正孔)がどれだけ速く(又は多く)移動し得るかを示す指標となるものである。
予測装置1は、種々の情報処理、情報の送受信が可能な情報処理装置であり、例えばパーソナルコンピュータ、サーバコンピュータ、量子コンピュータ等である。予測装置1は、複数の候補物質の物性を予測し、予測結果に基づいて、候補物質の中から所望の物性を満たし得る物質を選別する。予測装置1は、情報処理装置に対応する。
製造装置2は、選別された有機半導体材料を製造する。製造装置2は、例えば有機半導体材料の原材料を混合する混合部(不図示)を備え、有機半導体材料の原材料を混合して有機半導体材料を製造する。製造装置2はさらに、有機半導体材料を含む有機半導体膜を形成する成膜部を備え、有機半導体膜を製造してもよい。なお、製造装置2は、製造対象となる物質に応じて適宜構成されてよい。
図1に示すように、予測装置1は、制御部11、記憶部12、通信部13、入力部14、及び出力部15等を備える。予測装置1は、複数台のコンピュータで構成し分散処理する構成でもよく、1台のサーバ内に設けられた複数の仮想マシンによって実現されていてもよく、クラウドサーバを用いて実現されていてもよい。
制御部11は、一又は複数のCPU(Central Processing Unit)、GPU(Graphics Processing Unit)等を用いたプロセッサを備える。制御部11は、内蔵するROM(Read Only Memory)又はRAM(Random Access Memory)等のメモリ、クロック、カウンタ等を用い、各構成部を制御して処理を実行する。なお、予測装置1の機能は、ソフトウェア的に実現してもよいし、一部又は全部を、例えばASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等のハードウェアで実現してもよい。
記憶部12は、例えばハードディスク、フラッシュメモリ、SSD(Solid State Drive)等の不揮発性メモリを備える。記憶部12は、予測装置1に接続された外部記憶装置であってもよい。記憶部12は、制御部11が参照する各種コンピュータプログラム及びデータを記憶する。
本実施形態の記憶部12は、物性の予測に関する処理をコンピュータに実行させるためのプログラム1Pと、このプログラム1Pの実行に必要な予測モデル(学習モデル)121とを記憶している。予測モデル121は、物質のシミュレーション値、特徴量及びプロセス情報等に応じた物性を予測するモデルである。予測モデル121は、機械学習により生成された学習モデルである。予測モデル121は、人工知能ソフトウェアの一部を構成するプログラムモジュールとしての利用が想定される。
プログラム1Pを含むコンピュータプログラム(コンピュータプログラム製品)は、当該コンピュータプログラムを読み取り可能に記録した非一時的な記録媒体1Aにより提供されてもよい。記憶部12は、不図示の読出装置によって記録媒体1Aから読み出されたコンピュータプログラムを記憶する。記録媒体1Aは、例えば磁気ディスク、光ディスク、半導体メモリ等である。また、通信ネットワークに接続されている外部サーバからコンピュータプログラムをダウンロードし、記憶部12に記憶させてもよい。プログラム1Pは、単一のコンピュータプログラムでも複数のコンピュータプログラムにより構成されるものでもよく、また、単一のコンピュータ上で実行されても通信ネットワークによって相互接続された複数のコンピュータ上で実行されてもよい。
通信部13は、不図示のネットワークを介して外部装置と通信するための通信モジュールを備える。制御部11は、通信部13を介して外部装置との間でデータを送受信する。通信部13は省略してもよい。
入力部14は、候補物質に対する要求物性等、物性予測の実施に必要な各種データの入力を受け付ける。入力部14は、受け付けた入力内容を制御部11へ送出する。入力部14は、例えばキーボード、マウス、ディスプレイ内蔵のタッチパネルデバイス、外部からデータを取り込むインタフェース等を備える。
出力部15は、予測モデル121を用いて予測された物性、候補物質の選別結果等、物性予測の実施に伴う各種データを出力する。出力部15は、制御部11からの指示に従って各種の情報を出力する。出力部15は、例えばディスプレイ装置を備える。
予測装置1は、外部に接続されたコンピュータを通じて操作を受付け、通知すべき情報を外部のコンピュータへ出力する構成であってもよい。この場合、予測装置1は、入力部14及び出力部15を備えていなくてもよい。
図2は、予測モデル121の概要を示す説明図である。予測モデル121は、物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力として、前記物質の物性を示す情報を目的変数として出力する。図2に示す例にて、予測モデル121は、量子化学計算値、分子記述子及びプロセス情報を入力として、キャリア移動度を予測する。量子化学計算値はシミュレーション値の一例であり、分子記述子は物質の特徴量の一例である。
予測モデル121は、例えばニューラルネットワークである。予測モデル121は、量子化学計算値、分子記述子及びプロセス情報が入力される入力層と、物性値を出力する出力層と、特徴量を抽出する中間層(隠れ層)とを備える。中間層は、畳み込み層、プーリング層及び全結合層等を含んでもよい。中間層は、入力データの特徴量を抽出する複数のノードを有し、各種パラメータを用いて抽出された特徴量を出力層に受け渡す。入力層に量子化学計算値、分子記述子及びプロセス情報が入力された場合、学習済みパラメータによって中間層で演算が行なわれ、出力層から、物性を示す出力情報が出力される。
予測モデル121の入力層は複数のノードを有し、入力層の対応するノードに、量子化学計算値、分子記述子及びプロセス情報それぞれに対応する入力情報が入力される。
シミュレーション値は、所定のアルゴリズムにより求められた有機半導体材料(有機半導体分子)の物性値である。シミュレーション値は、例えば理論計算により得られる。理論計算としては、例えば、量子化学計算、分子動力学計算、第一原理計算等が挙げられる。このような理論計算は、実験値との誤差の小さい高精度な値が得られることが知られている。各計算手法によるシミュレーション値は、公知の理論計算ソフトウェアを用いて求めることができる。シミュレーション値の物性項目は、目的変数の物性と相関する又は相関が比較的強いと考えられる物性項目であることが好ましい。説明変数となるシミュレーション値には、複数の物性項目に係るシミュレーション値が含まれてもよい。各シミュレーション値は、同じ又は異なるシミュレーション手法により算出されてよい。図2に示す例にて、シミュレーション値には、量子化学計算による再配向エネルギー及びキャリア有効質量が含まれる。
物質の特徴量とは、物質の構造を表す情報であり、例えば物質の化学的構造データ、物理的構造データ等を含む。図2に示す例では、物質の特徴量として、有機半導体材料の分子記述子を予測モデル121に入力する。分子記述子は、物質の持つ構造的特徴や物理化学的特性等を計算機で扱いやすくするために数値化したものである。分子記述子は、物質の構造式から計算可能であり、公知のソフトウェア、例えばRDKit、mordred、MOE、alvaDesc、PaDEL-Descriptor、Codessa等を用いて求めることができる。説明変数となる分子記述子には、複数の記述子項目に係る分子記述子の値が含まれてもよい。説明変数に用いる分子記述子の数及び種類は、予測対象の物質や物性に応じて適宜設定されてよい。
予測対象となる物質が高分子化合物の場合、当該高分子化合物を構成するモノマーに係る分子記述子から、高分子化合物の分子記述子を生成してもよい。予測対象となる物質がホモポリマーの場合、当該ホモポリマーを構成するモノマー又はオリゴマーについて求めた分子記述子を、ホモポリマーの分子記述子としてもよい。予測対象となる物質が共重合ポリマーの場合、当該共重合ポリマーを構成する複数のモノマーそれぞれに係る分子記述子と、各モノマーの重合比とに基づき、共重合ポリマーの分子記述子を生成してもよい。共重合ポリマーの分子記述子は、各モノマーについて求めた分子記述子を、各モノマーの重合比で加重平均した値とすることができる。
物質の特徴量は、分子記述子に限らず、例えば、化学構造式をグラフ情報に変換したもの、物理的状態(例えば固体状、液体状、気体状、膜状等)等を含んでもよい。
プロセス情報は、物質におけるプロセスに関する情報を含む。プロセス情報には、例えば、物質を生成する生成工程における合成条件、物質を作製(調製)する作製(調製)工程における作製条件等が含まれる。合成条件としては、例えば、原材料組成、重合度、原材料温度、反応温度、合成に用いる溶媒や媒質の物性等が挙げられる。作製条件としては、例えば作製工程におけるワークや製造装置の制御パラメータが挙げられる。具体的には、作製条件としては、スピンコート法による成膜時のスピンコーターの回転数、真空蒸着法による成膜時の蒸着速度、膜厚、成膜後のアニーリング温度、作製に用いる溶媒や媒質の物性等が挙げられる。図2に示す例にて、プロセス情報には、回転数、溶媒の物性、アニーリング温度、及び膜厚が含まれる。
予測モデル121の説明変数はさらに、スペクトルデータ、画像データ、カタログデータ及び物性の実験値の少なくとも1つを含んでもよい。
スペクトルデータは、物質の発光スペクトルに関する情報である。スペクトルデータとしては、例えば、スペクトル幅、スペクトル強度、第1ピーク及び第2ピークの強度比、スペクトル形状の標準偏差、スペクトル画像等が挙げられる。スペクトル幅は、発光スペクトルの半値幅であってもよい。半値幅は、半値全幅(FWHM:Full Width at Half Maximum)でも半値半幅(HWHM:Half Width at Half Maximum)でもよい。
画像データは、物質を表す画像データである。画像データとしては、例えば、走査電子顕微鏡(SEM:Scanning Electron Microscope)によって撮影されるSEM画像、透過型電子顕微鏡(TEM:Transmission Electron Microscope)によって撮影されるTEM画像等が挙げられる。
カタログデータは、例えば物質、当該物質の原材料等が掲載されるカタログから抽出された情報を含む。カタログデータは、物質の物性を表す情報を含んでもよい。カタログデータは、例えば製品カタログのテキストマイニングを行い、所定の特徴語(例えば所定の物性)を抽出することにより得られる。
物性の実験値は、例えばシミュレーション値の物性及び予測対象の物性とは異なる種類の物性に係る実験値を含む。
説明変数は、画像データから導出されるパーシステントホモロジーデータを含んでもよい。パーシステントホモロジーは、ホモロジーと呼ばれる代数学の応用領域であり、図形の連結部分、「穴」、空洞の構造に着目した数学分野であり、位相的データ解析の一つの手法である。パーシステントホモロジーデータは、例えばパーシステント図、当該パーシステント図から得られる各種特徴量等を含んでよい。
予測モデル121の出力層は1つのノードを有し、当該ノードからキャリア移動度を表す連続値を出力する。なお、予測すべきキャリア移動度に関する情報を得ることができれば、出力層の構成は特に限定されない。予測モデル121は、複数種類の物性を予測可能に構成されてもよい。予測モデル121は、例えば、キャリア移動度と、光吸収波長、発光波長、光吸収強度及び発光強度のうちの少なくとも1つとを予測する構成であってもよい。
予測モデル121は、有機半導体材料のシミュレーション値、特徴量及びプロセス情報に対し、既知のキャリア移動度を示すデータがラベリングされた訓練データを用意し、当該訓練データを用いて未学習のニューラルネットワークを機械学習させることにより生成することができる。
図3は、訓練データの内容例を示す図である。訓練データには、例えばデータIDをキーに、有機半導体材料のシミュレーション値、特徴量、プロセス情報及びキャリア移動度等の情報を紐付けたレコードが格納されている。
有機半導体材料のシミュレーション値、特徴量及びプロセス情報は、過去の製造実績から取得してもよい。例えば、過去に製造された有機半導体材料に基づいてシミュレーション値及び特徴量を求めるとともに、製造時のドライブデータ、ワーク構造等からプロセス情報を取得する。キャリア移動度は、例えば実験により得られた実験値を正解ラベルとする。
訓練データには、さらに、上述のスペクトルデータ、画像データ、カタログデータ及び物性の実験値等が含まれていてもよい。訓練データは、予測装置1の記憶部12に記憶されていてもよく、外部サーバに記憶されていてもよい。
図4は、予測モデル121の生成処理手順の一例を示すフローチャートである。以下の各フローチャートにおける処理は、予測装置1の記憶部12に記憶するプログラム1Pに従って制御部11によって実行される。
予測装置1の制御部11は、訓練用の有機半導体材料のシミュレーション値、特徴量及びプロセス情報に対し、上記有機半導体材料のキャリア移動度が付与された訓練データを取得する(ステップS11)。
制御部11は、取得した訓練データに基づき、有機半導体材料のシミュレーション値、特徴量及びプロセス情報を入力した場合に、当該有機半導体材料のキャリア移動度を出力する予測モデル121を生成する(ステップS12)。具体的には、制御部11は、訓練データに含まれるシミュレーション値、特徴量及びプロセス情報を予測モデル121の入力層に入力し、中間層での演算処理を経て、出力層から出力されるキャリア移動度を取得する。制御部11は、出力層から出力されたキャリア移動度と、訓練データに含まれるキャリア移動度とを比較し、出力層から出力されるキャリア移動度が正解値に近づくように、ニューロン間の重み(結合係数)等のパラメータを最適化する。パラメータの最適化の方法は特に限定されないが、例えば予測装置1は誤差逆伝播法を用いて各種パラメータの最適化を行う。学習が開始される前の段階では、予測モデル121を記述する定義情報には、初期設定値が与えられているものとする。誤差、学習回数等が所定基準を満たすことによって学習が完了すると、最適化されたパラメータが得られる。
学習が完了すると、制御部11は、学習済みの予測モデル121として、学習済みの予測モデル121に関する定義情報を記憶部12に記憶させ、一連の処理を終了する。上述の処理により、シミュレーション値、特徴量及びプロセス情報に対しキャリア移動度を適切に予測可能に学習された予測モデル121が構築される。
予測モデル121は、予測装置1が生成するものに限定されない。予測装置1は、外部サーバにおいて生成された学習済みの予測モデル121を取得し、記憶部12に記憶してもよい。予測モデル121は、外部サーバにおいて生成され、予測装置1において学習されてもよい。
予測モデル121の構成は限定されず、シミュレーション値、特徴量及びプロセス情報に対し、キャリア移動度を識別可能であればよい。予測モデル121は、例えば、Transformer、CNN(Convolution Neural Network)、RNN(Recurrent Neural Network)、GNN(Graph Neural Network)、サポートベクタマシン、ロジスティクス回帰、決定木、XGBoost(eXtreme Gradient Boosting )等、その他の学習アルゴリズムに基づくモデルであってもよい。
予測装置1は、物性の予測を行う運用フェーズの前段階である学習フェーズにおいて、予測モデル121を生成する。そして、運用フェーズにおいて、予測モデル121を用いて物性を予測する。
図5は、物性の予測及び選別に関する処理手順の一例を示すフローチャートである。
予測装置1の制御部11は、製造対象となる有機半導体材料(有機半導体分子)に要求されるキャリア移動度、すなわち要求物性を取得する(ステップS21)。要求物性は、例えばキャリア移動度の下限値である。制御部11は、例えば、入力部14を介して、ユーザからの入力を受け付けることで要求物性を取得してもよく、通信接続された外部装置から送信される情報を受信することにより要求物性を取得してもよい。
制御部11は、複数の候補有機半導体材料を生成する(ステップS22)。ステップS22において、候補有機半導体材料はコンピュータ上で生成される。
制御部11は、生成した候補有機半導体材料それぞれについて、シミュレーション値、分子記述子及びプロセス情報を取得する(ステップS23)。制御部11は、例えば、公知の量子化学計算ソフトウェア(例えばGaussian16(Gaussian社製))を用いて、生成した候補有機半導体材料の分子構造を表す構造式から所定の物性項目に係る量子化学計算値を算出する。制御部11は、例えば、公知のソフトウェア(例えばmordred)を用いて、生成した候補有機半導体材料の構造式から所定の記述子項目に係る分子記述子を算出する。制御部11は、例えば、予め設定されるプロセス情報を記憶部12から読み出すことによりプロセス情報を取得する。制御部11は、ユーザからの入力を受け付ける、又は製造装置2や外部装置から送信される情報を受信することによりプロセス情報を取得してもよい。
制御部11は、取得したシミュレーション値、分子記述子及びプロセス情報を予測モデル121に入力する(ステップS24)。制御部11は、予測モデル121から出力されるキャリア移動度を取得する(ステップS25)。制御部11は、生成した各候補有機半導体材料に対し上述の処理を実行して、キャリア移動度をそれぞれ予測する。
制御部11は、予測結果に基づいて、生成した候補有機半導体材料の中から要求物性を満たす有機半導体材料を選別し(ステップS26)、要求物性を満たす有機半導体材料を抽出する。ステップS26において、制御部11は、物性の予測誤差を考慮し、要求物性に対し所定のマージンを加味した物性値を、選別処理における閾値としてもよい。
制御部11は、出力部15を通じて選別結果を出力する(ステップS27)。制御部11は、例えば要求物性を満たす有機半導体材料と、キャリア移動度の予測値とを対応付けて出力する。制御部11は、各候補有機半導体材料に係る物性の予測結果を出力してもよい。制御部11は、例えば製造装置2、外部サーバ等、出力部15以外へ選別結果を出力してもよい。
製造装置2では、予測装置1で選別された有機半導体材料の組成に対応する原材料を用意し、用意した原材料を混合して、有機半導体材料を製造する。製造装置2は、公知の合成手法に従い原材料を合成することにより、有機半導体材料を得ることができる。有機半導体材料は、例えば、カップリング反応、アミノ化反応、縮合反応等の反応やハロゲン化反応等の官能基変換反応等を組み合わせることにより得られる。製造装置2はさらに、例えばスピンコート法、真空蒸着法、インクジェット法等により有機半導体材料を成膜し、有機半導体膜を製造してもよい。
予測装置1は、実際に得られた有機半導体材料のキャリア移動度の実験値に基づいて、予測モデル121の再学習を行ってもよい。予測装置1は、例えば得られた有機半導体材料のキャリア移動度の実験値の入力をユーザから受け付ける。キャリア移動度の実験値を受け付けた場合、予測装置1は、有機半導体材料のシミュレーション値、分子記述子及びプロセス情報に対し、取得したキャリア移動度をラベリングした情報を訓練データとして再学習を行い、予測モデル121を更新する。これにより、本システムの運用を通じて物性の予測精度を向上させることができる。
上述の予測モデル121により予測する物性項目は単なる例示であり、予測すべき物質に応じた各種物性を予測するものであってよい。同様に、予測モデル121に入力するシミュレーション値、特徴量及びプロセス情報はいずれも単なる例示であり、予測すべき物性に応じて適宜選択されてよい。物性予測の対象となる物質は、例えば有機化合物、無機化合物、又はそれらの混合物であってもよい。物性予測の対象となる物質は、材料物質に限定されず、例えば医薬品、生体物質、食品等であってもよい。
予測モデル121は、候補物質の選別に用いるものに限らず、各種の物性予測に適用することができる。例えば、実際に得られた物質について、実験による物性値の測定に代えて予測モデル121を用いて物性を予測してもよい。
本実施形態において、上述の予測及び選別方法を適用した物質の製造方法を提供できる。実施形態の物質の製造方法は、複数の物質について、物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質を用いるプロセスのプロセス情報を取得する工程と、物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質を用いるプロセスのプロセス情報を含む説明変数を入力した場合に前記物質の物性を目的変数として出力する予測モデルに、取得した前記シミュレーション値、特徴量及びプロセス情報を入力することにより、各物質の物性を予測する工程と、予測した物性が所定の要求物性を満たす物質を選別する工程と、選別した物質を得る工程と、を含む。
上記工程のうち、複数の物質についての各種情報を取得する工程と、予測モデルにより各物質の物性を予測する工程と、所定の要求物性を満たす物質を選別する工程とは、上述の図5で説明した予測及び選別工程に対応する。選別した物質を得る工程は、製造装置により行われる工程に対応する。
本実施形態によれば、物質に関する多様な情報に基づいて、予測モデル121を用いて精度よく物性を予測することができる。通常、予測モデル121に与える説明変数の数を増大させることで、予測モデル121の精度を向上し得る一方で、処理負荷が増大すると考えられる。従って、物性予測に適した種類の情報を効率的に使用することが重要である。物性値に寄与すると想定される必要十分な種類のデータを予測モデル121への入力とすることで、効率的且つ精度よく物性を予測することができる。
本実施形態では、予測モデル121への入力として、シミュレーション値、特徴量及びプロセス情報を用いる。物質の物性は物質の構造に強く依存することから、物質の構造を表す特徴量は物性予測に大きく寄与する。物質の特徴量は、化学的な構造を表すデータに加えて、物理的な形態を表すデータを含むことで、精度向上効果が期待できる。
また、特定の物性予測において、予測対象となる物性以外の物性値を予測モデル121への入力要素とすることで、精度向上効果が期待できる。他の物性値としてシミュレーション値を用いることで、実験を行う手間を削減することができる。
また、物性は、物質を用いたプロセスに応じて変化し得ることから、プロセスに関するプロセス情報を予測モデル121への入力要素とすることで、精度向上効果が期待できる。例えば、有機半導体中のキャリア移動度の予測に、有機半導体化合物を含む有機半導体膜の成膜条件を反映させることができる。
予測モデル121への入力として、任意選択的に、スペクトルデータ、画像データ、カタログデータ及び物性の実験値を用いることで、より精度向上を図ることができる。
(変形例)
予測モデル121は、所定項目の物性を表すシミュレーション値を含む説明変数を入力した場合に、上記所定項目の物性を目的変数として出力するよう構成されてもよい。すなわち、シミュレーション値により表される物性の項目と同じ項目の物性を、予測モデル121により予測するものであってもよい。上記構成によれば、予測モデル121を、例えば物質のシミュレーション値をより実験値に近づけるよう補正するといった用途に適用することができる。
物性予測を行うシミュレーション手法においては、モデル化された系、すなわち物質が実際に使用される系(現実系)とは差異がある系を扱っている。従って、モデル化された系(例えば孤立状態)でのシミュレーション値と、現実系(例えば固体状態)での実験値との間に誤差が生じる可能性がある。上記構成によれば、シミュレーションで得られた物質の物性に加えて、物質に関する他の情報を入力要素とする予測モデル121を用いることで、より現実系に対応する物性値を予測することが可能となる。
今回開示した実施の形態は、全ての点で例示であって、制限的なものではないと考えられるべきである。各実施例にて記載されている技術的特徴は互いに組み合わせることができ、本発明の範囲は、特許請求の範囲内での全ての変更及び特許請求の範囲と均等の範囲が含まれることが意図される。
各実施形態に示すシーケンスは限定されるものではなく、矛盾の無い範囲で、各処理手順はその順序を変更して実行されてもよく、また並行して複数の処理が実行されてもよい。各処理の処理主体は限定されるものではなく、矛盾の無い範囲で、各装置の処理を他の装置が実行してもよい。
各実施形態に記載した事項は相互に組み合わせることが可能である。また、特許請求の範囲に記載した独立請求項及び従属請求項は、引用形式に関わらず全てのあらゆる組み合わせにおいて、相互に組み合わせることが可能である。さらに、特許請求の範囲には他の2以上のクレームを引用するクレームを記載する形式(マルチクレーム形式)を用いているが、これに限るものではない。マルチクレームを少なくとも一つ引用するマルチクレーム(マルチマルチクレーム)を記載する形式を用いて記載してもよい。
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、
物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質の物性を出力する予測モデルに、取得した前記物質のシミュレーション値、特徴量及びプロセス情報を入力することにより、前記物質の物性を予測する
処理をコンピュータが実行する予測方法。
(付記2)
前記シミュレーション値は理論計算によるシミュレーション値を含む
付記1に記載の予測方法。
(付記3)
前記特徴量は分子記述子を含む
付記1又は付記2に記載の予測方法。
(付記4)
複数のモノマーそれぞれに係る分子記述子と、各モノマーの重合比とに基づき、前記物質としてのポリマーに係る前記分子記述子を生成する
付記3に記載の予測方法。
(付記5)
前記プロセス情報は、前記物質の合成工程における合成条件又は前記物質の作製工程における作製条件を含む
付記1から付記4のいずれか1つに記載の予測方法。
(付記6)
前記説明変数は、スペクトルデータ、画像データ及びカタログデータの少なくとも1つを含む
付記1から付記5のいずれか1つに記載の予測方法。
(付記7)
前記説明変数は、画像データから導出されるパーシステントホモロジーデータを含む
付記1から付記6のいずれか1つに記載の予測方法。
(付記8)
前記シミュレーション値により表される物性の項目とは異なる項目の物性を前記予測モデルにより予測する
付記1から付記7のいずれか1つに記載の予測方法。
(付記9)
前記シミュレーション値により表される物性の項目と同じ項目の物性を前記予測モデルにより予測する
付記1から付記8のいずれか1つに記載の予測方法。
(付記10)
物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、
物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質の物性を出力する予測モデルに、取得した前記物質のシミュレーション値、特徴量及びプロセス情報を入力することにより、前記物質の物性を予測する
処理を実行する制御部を備える
情報処理装置。
(付記11)
物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、
物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質の物性を出力する予測モデルに、取得した前記物質のシミュレーション値、特徴量及びプロセス情報を入力することにより、前記物質の物性を予測する
処理をコンピュータに実行させるためコンピュータプログラム。
(付記12)
複数の物質について、物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、
物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質の物性を出力する予測モデルに、取得した各物質の前記シミュレーション値、特徴量及びプロセス情報を入力することにより、各物質の物性を予測し、
予測した物性が所定の要求物性を満たす物質を選別する
物質の選別方法。
(付記13)
複数の物質について、物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得する工程と、
物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質の物性を出力する予測モデルに、取得した各物質の前記シミュレーション値、特徴量及びプロセス情報を入力することにより、各物質の物性を予測する工程と、
予測した物性が所定の要求物性を満たす物質を選別する工程と、
選別した物質を得る工程と、を含む
物質の製造方法。
1 予測装置
11 制御部
12 記憶部
13 通信部
14 入力部
15 出力部
1A 記録媒体
1P プログラム
121 予測モデル
2 製造装置

Claims (12)

  1. 物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、
    物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質のシミュレーション値、特徴量及びプロセス情報に応じた前記物質の物性を出力する予測モデルに、取得した前記物質のシミュレーション値、特徴量及びプロセス情報を入力することにより、前記物質のシミュレーション値、特徴量及びプロセス情報に応じた前記物質の物性を予測する
    処理をコンピュータが実行する予測方法。
  2. 前記物質のシミュレーション値は理論計算によるシミュレーション値を含む
    請求項1に記載の予測方法。
  3. 前記特徴量は分子記述子を含む
    請求項1又は請求項2に記載の予測方法。
  4. 複数のモノマーそれぞれに係る分子記述子と、各モノマーの重合比とに基づき、前記物質としてのポリマーに係る前記分子記述子を生成する
    請求項3に記載の予測方法。
  5. 前記プロセス情報は、前記物質の合成工程における合成条件又は前記物質の作製工程における作製条件を含む
    請求項1又は請求項2に記載の予測方法。
  6. 前記説明変数は、スペクトルデータ、画像データ及びカタログデータの少なくとも1つを含む
    請求項1又は請求項2に記載の予測方法。
  7. 前記説明変数は、画像データから導出されるパーシステントホモロジーデータを含む
    請求項1又は請求項2に記載の予測方法。
  8. 前記シミュレーション値により表される物性の項目とは異なる項目の物性を前記予測モデルにより予測する
    請求項1又は請求項2に記載の予測方法。
  9. 前記シミュレーション値により表される物性の項目と同じ項目の物性を前記予測モデルにより予測する
    請求項1又は請求項2に記載の予測方法。
  10. 物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、
    物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質のシミュレーション値、特徴量及びプロセス情報に応じた前記物質の物性を出力する予測モデルに、取得した前記物質のシミュレーション値、特徴量及びプロセス情報を入力することにより、前記物質のシミュレーション値、特徴量及びプロセス情報に応じた前記物質の物性を予測する
    処理を実行する制御部を備える
    情報処理装置。
  11. 物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、
    物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質のシミュレーション値、特徴量及びプロセス情報に応じた前記物質の物性を出力する予測モデルに、取得した前記物質のシミュレーション値、特徴量及びプロセス情報を入力することにより、前記物質のシミュレーション値、特徴量及びプロセス情報に応じた前記物質の物性を予測する
    処理をコンピュータに実行させるためコンピュータプログラム。
  12. 複数の物質について、物質の物性を表すシミュレーション値、前記物質の特徴量及び前記物質におけるプロセス情報を取得し、
    物質のシミュレーション値、特徴量及びプロセス情報を含む説明変数を入力した場合に前記物質のシミュレーション値、特徴量及びプロセス情報に応じた前記物質の物性を出力する予測モデルに、取得した各物質の前記シミュレーション値、特徴量及びプロセス情報を入力することにより、前記物質のシミュレーション値、特徴量及びプロセス情報に応じた各物質の物性を予測し、
    予測した物性が所定の要求物性を満たす物質を選別する
    物質の選別方法。
JP2023058080A 2023-03-31 2023-03-31 予測方法、情報処理装置、コンピュータプログラム、物質の選別方法及び物質の製造方法 Active JP7506790B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023058080A JP7506790B1 (ja) 2023-03-31 2023-03-31 予測方法、情報処理装置、コンピュータプログラム、物質の選別方法及び物質の製造方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2023058080A JP7506790B1 (ja) 2023-03-31 2023-03-31 予測方法、情報処理装置、コンピュータプログラム、物質の選別方法及び物質の製造方法

Publications (1)

Publication Number Publication Date
JP7506790B1 true JP7506790B1 (ja) 2024-06-26

Family

ID=91586606

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023058080A Active JP7506790B1 (ja) 2023-03-31 2023-03-31 予測方法、情報処理装置、コンピュータプログラム、物質の選別方法及び物質の製造方法

Country Status (1)

Country Link
JP (1) JP7506790B1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210233618A1 (en) 2018-06-08 2021-07-29 Covestro Llc System, method, and computer program product for predicting properties of a polymer
WO2021200281A1 (ja) 2020-03-31 2021-10-07 Mi-6株式会社 試験評価システム、プログラムおよび試験評価方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210233618A1 (en) 2018-06-08 2021-07-29 Covestro Llc System, method, and computer program product for predicting properties of a polymer
WO2021200281A1 (ja) 2020-03-31 2021-10-07 Mi-6株式会社 試験評価システム、プログラムおよび試験評価方法

Similar Documents

Publication Publication Date Title
Strieth-Kalthoff et al. Machine learning the ropes: principles, applications and directions in synthetic chemistry
Terayama et al. Black-box optimization for automated discovery
Huang et al. Machine-learning and high-throughput studies for high-entropy materials
Chen et al. A parallel genetic algorithm based feature selection and parameter optimization for support vector machine
Afzal et al. A deep neural network model for packing density predictions and its application in the study of 1.5 million organic molecules
Sun et al. Toward fast and reliable potential energy surfaces for metallic Pt clusters by hierarchical delta neural networks
Carballido et al. CGD-GA: A graph-based genetic algorithm for sensor network design
Cersonsky et al. Improving sample and feature selection with principal covariates regression
Zhang et al. A soft sensor for industrial melt index prediction based on evolutionary extreme learning machine
Kusaba et al. Crystal structure prediction with machine learning-based element substitution
US20240028795A1 (en) Design assitance device, design assitance method, and design assitance program
Lindsey et al. Active learning for robust, high-complexity reactive atomistic simulations
Fare et al. Powerful, transferable representations for molecules through intelligent task selection in deep multitask networks
US10790045B1 (en) System and method for screening homopolymers, copolymers or blends for fabrication
CN114207729A (zh) 材料特性预测系统以及材料特性预测方法
Satsangi et al. Feature blending: An approach toward generalized machine learning models for property prediction
Hofstetter et al. Graph-convolutional neural networks for (QM) ML/MM molecular dynamics simulations
Zhu et al. Multi-scale Transformer-CNN domain adaptation network for complex processes fault diagnosis
Beniwal et al. Data-Driven Phase Selection, Property Prediction and Force-Field Development in Multi-Principal Element Alloys
JP7506790B1 (ja) 予測方法、情報処理装置、コンピュータプログラム、物質の選別方法及び物質の製造方法
Mohan et al. Predictive understanding of the surface tension and velocity of sound in ionic liquids using machine learning
Agyemang et al. Deep inverse reinforcement learning for structural evolution of small molecules
JP7406664B1 (ja) 学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法
Gao et al. Data-driven machine learning for alloy research: recent applications and prospects
Guney et al. A robust ensemble feature selection technique for high‐dimensional datasets based on minimum weight threshold method