WO2021054026A1 - 材料特性予測システムおよび材料特性予測方法 - Google Patents

材料特性予測システムおよび材料特性予測方法 Download PDF

Info

Publication number
WO2021054026A1
WO2021054026A1 PCT/JP2020/031267 JP2020031267W WO2021054026A1 WO 2021054026 A1 WO2021054026 A1 WO 2021054026A1 JP 2020031267 W JP2020031267 W JP 2020031267W WO 2021054026 A1 WO2021054026 A1 WO 2021054026A1
Authority
WO
WIPO (PCT)
Prior art keywords
material property
data
prediction
prediction model
project
Prior art date
Application number
PCT/JP2020/031267
Other languages
English (en)
French (fr)
Inventor
彰規 淺原
貴之 林
拓也 金澤
秀和 森田
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to US17/621,321 priority Critical patent/US20220358438A1/en
Priority to CN202080054391.9A priority patent/CN114207729A/zh
Priority to EP20864840.2A priority patent/EP4033391A4/en
Publication of WO2021054026A1 publication Critical patent/WO2021054026A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Abstract

過去データを有効に活用して、材料特性の予測精度を向上させる手法を提供する。 材料組成、実験条件、および材料特性からなるレコードを複数含む案件データを処理して、材料特性の予測を行うためのシステムである。このシステムは、材料特性予測提示部と、案件相互特徴量生成部と、材料特性予測部とを備える。材料特性予測提示部は、材料特性が未知であるレコードを含み、第1の予測モデルによる材料特性の予測対象となる第1の案件データの指定を受け付ける。案件相互特徴量生成部は、第2の予測モデルを用いて、第1の案件データの材料組成から、特徴量を予測する。材料特性予測部は、第1の案件データの材料組成、実験条件、特徴量、および既知の材料特性を用いて、第1の予測モデルを生成する。また材料特性予測部は、第1の案件データの材料特性が未知であるレコードの材料組成、実験条件、特徴量を第1の予測モデルに入力して、未知の材料特性を予測する。

Description

材料特性予測システムおよび材料特性予測方法
 本発明は、材料科学等の実験を支援する技術に関する。
 データ分析にかかる統計処理技術の発展に伴い、材料科学においてもデータ分析を行う需要が高まっている。特に、材料科学分野では、新素材の開発を効率的に行うために、次の実験の候補の選定を、既知のデータを元にして行うスクリーニングとよばれる方法が知られている。
 特許文献1では、ナノスケール領域における知見を、材料種によらず同一概念でリンクして構造化し、それを利用して材料種に依存しない新材料設計に役立てる設計支援の手法について述べられている。
 特許文献2では、反応系を構成する元素固有の量子熱力学的状態量を統計的に処理して得られる量子統計値を使用し、反応系を構成する元素数または配合比が異なり元素数が同じ物質の同じ物性値のものだけ選択してその物質を構成する元素数またはそれ以上の数の多元連立一次方程式を誘導し、その解を求めることによって、目標とする物理的化学的特性および機能をもつ金属・非金属物質の材料設計を可能とすることについて述べられている。
 スクリーニングの方法としては、各種実験のデータを情報システムに入力して機械学習を行って実験結果の予測のモデルを構築し、モデルの予測に基づいたスクリーニングを行う。この予測には、材料設計に関する様々なパラメータを引数にとり、材料の特性を返す関数を回帰分析によって求める方法がよく知られている。
特開2003-178102号公報 特開2004-086892号公報
 材料開発においては、材料特性の予測の精度を高めることで、より的確に新材料の候補に対する有望性を見極めることができ、不要な実験を省略することで効率的な材料開発ができるようになると期待される。
 回帰分析では、関数の引数に相当する変数を説明変数、関数の返り値に相当する値を目的変数と呼ぶが、材料特性の予測では材料特性を目的変数とし、それを予測できるように材料の特徴を示す説明変数を選ぶ。この説明変数の選択いかんによって予測の精度は上下するため、様々な材料特性の予測に対応できるように説明変数のバリエーションを準備することが重要である。
 特許文献1や特許文献2では、過去のデータを利用して材料特性の予測を行う試みが開示されている。しかしながら、材料開発では、最初は特定の組成や製造プロセスで開発を開始し、有効な特性が得られた材料について、さらにその関連の組成や製造プロセスで施策を行うというプロセスが一般である。
 すなわち、開発当初の段階では案件初期には使用できるデータは極めて少ないという問題がある。過去データの情報を利用する場合、目的としている材料特性は案件ごとに異なるため、材料特性が揃ったデータは当該案件用のものしかないことがほとんどである。また、同じような特性を目的とした実験であっても、計測方法が違うケースもあり、そのまま流用が難しいことも多い。
 本発明の課題は、過去データを有効に活用して、材料特性の予測精度を向上させる手法を提供することにある。
 本発明の好ましい一側面は、材料組成、実験条件、および材料特性からなるレコードを複数含む案件データを処理して、材料特性の予測を行うためのシステムである。このシステムは、材料特性予測提示部と、案件相互特徴量生成部と、材料特性予測部とを備える。材料特性予測提示部は、材料特性が未知であるレコードを含み、第1の予測モデルによる材料特性の予測対象となる第1の案件データの指定を受け付ける。案件相互特徴量生成部は、第2の予測モデルを用いて、第1の案件データの材料組成から、特徴量を予測する。材料特性予測部は、第1の案件データの材料組成、実験条件、特徴量、および既知の材料特性を用いて、第1の予測モデルを生成する。また材料特性予測部は、第1の案件データの材料特性が未知であるレコードの材料組成、実験条件、特徴量を第1の予測モデルに入力して、未知の材料特性を予測する。
 材料組成は少なくとも材料の組成に関する情報で、より望ましくは材料の構造に関する情報、例えば構造式である。
 本発明の好ましい他の一側面は、入力装置、記憶装置およびプロセッサを含む情報処理装置により、材料特性を予測する方法である。この方法では、第1の特徴量を含む第1のデータから第1の材料特性を予測するための第1の予測モデルを生成する際に、以下のステップを行う。すなわち、第1の特徴量から第1の材料特性とは異なる定義の第2の材料特性を予測する、第2の予測モデルを準備する第1のステップ、第1のデータを第2の予測モデルに適用し、第2の材料特性を予測する第2のステップ、第1の特徴量を第1の説明変数とし、第2の材料特性を第2の説明変数とし、第1の材料特性を目的変数として、第1の予測モデルを生成する第3のステップ、を実行する。
 過去データを有効に活用して、材料特性の予測精度を向上させることができる。
実施例の構成概略の例を示す機能ブロック図。 実施例の物理的実装の構成の例を示すブロック図。 実施例の使用手順の例を示す概念図。 実施例の材料DB更新処理の例を示すフロー図。 実施例の実験データ受付の画面表示の例を示すイメージ図。 実施例の実験データの構成の例を示す表図。 実施例の材料DBの実験データテーブルの例を示す表図。 案件データの例を示す概念図。 案件間相互特徴量の概念を示す説明図。 実施例の材料特性予測処理の例を示すフロー図。 実施例の材料特性予測表示の例を示すイメージ図。 実施例の材料特性予測用データの構成の例を示す表図。
 実施の形態について、図面を用いて詳細に説明する。ただし、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。
 以下に説明する発明の構成において、同一部分又は同様な機能を有する部分には同一の符号を異なる図面間で共通して用い、重複する説明は省略することがある。
 同一あるいは同様な機能を有する要素が複数ある場合には、同一の符号に異なる添字を付して説明する場合がある。ただし、複数の要素を区別する必要がない場合には、添字を省略して説明する場合がある。
 本明細書等における「第1」、「第2」、「第3」などの表記は、構成要素を識別するために付するものであり、必ずしも、数、順序、もしくはその内容を限定するものではない。また、構成要素の識別のための番号は文脈毎に用いられ、一つの文脈で用いた番号が、他の文脈で必ずしも同一の構成を示すとは限らない。また、ある番号で識別された構成要素が、他の番号で識別された構成要素の機能を兼ねることを妨げるものではない。
 図面等において示す各構成の位置、大きさ、形状、範囲などは、発明の理解を容易にするため、実際の位置、大きさ、形状、範囲などを表していない場合がある。このため、本発明は、必ずしも、図面等に開示された位置、大きさ、形状、範囲などに限定されない。
 <1.システム構成>
 図1に、実施例1の材料特性予測装置の例を示す。本実施例の材料特性予測装置(101)は、利用者(102)の操作を受け付ける装置であって、利用者から実験データを受け取る実験データ受付部(111)、材料の特徴とその特性が格納された案件別の材料データベース(DB:Data Base)(112)を備える。ここで案件とは、ユーザが自由に定義することができるデータの集合であり、例えば作成主体や作成目的が異なる実験や開発から得られたデータである。
 また、材料特性予測装置(101)は、材料特性を予測する材料特性予測モデルを生成し、また、材料特性予測モデルを用いて未計測の材料特性を予測する材料特性予測部(113)と、材料特性予測モデルを格納する材料特性予測モデルDB(114)を備える。
 材料特性予測部(113)は、材料DB(112)の材料特性値が計測済みのデータから得た特徴量と案件間相互特徴量生成部(115)から得た特徴量を用いて、材料特性予測モデルを生成し、未知の特性を予測する。案件間相互特徴量生成部(115)は、材料DB(112)と材料特性予測モデルDB(114)のデータから新たな特徴量を生成する。材料特性予測提示部(116)は、材料特性予測部(113)の予測結果を利用者(102)に提示する。
 本実施例では材料特性予測装置(101)は、入力装置、出力装置、記憶装置、処理装置を含むサーバのような情報処理装置で構成することにした。計算や制御等の機能は、記憶装置に格納されたプログラムが処理装置によって実行されることで、定められた処理を他のハードウェアと協働して実現される。図1では、情報処理装置のハードウェア構成に代えて、機能ブロックを示している。各機能ブロックとして、計算機などが実行するプログラム、その機能、あるいはその機能を実現する手段を、「機能」、「手段」、「部」、「ユニット」、「モジュール」等と呼ぶ場合がある。
 図2に実施例1の物理的実装の構成の一例を示す。材料特性予測装置(101)は、一般的なコンピュータを用いて実装できる。すなわち、演算性能を持ったプロセッサ(201)、高速に読み書きが可能な揮発性一時記憶領域であるDRAM(Dynamic Random Access Memory)(202)、HDD(ハードディスク装置)やフラッシュメモリなどを利用した永続的な記憶領域である記憶装置(203)、操作を行うためのマウスやキーボード等の入力装置(204)、動作を使用者に示すためのモニタ(205)、外部と通信を行うためのシリアルポート等のインタフェース(206)を含む装置である。
 図1の実験データ受付部(111)、材料特性予測部(113)、案件間相互特徴量生成部(115)、材料特性予測提示部(116)は、記憶装置(203)に記録されたプログラムをプロセッサ(201)が実行することによって実現できる。材料DB(112)、材料特性予測モデルDB(114)は、データの蓄積を記憶装置(203)に行うプログラムをプロセッサ(201)が実行することで実装できる。
 図2の構成は、単体のコンピュータで構成してもよいし、あるいは、任意の部分が、ネットワークで接続された他のコンピュータで構成されてもよい。すなわち、複数のコンピュータによって、同様のシステムを構成してもよい。
 図3に実施例1のシステムの利用手順について模式的に示す。実施例1は、利用者が材料特性予測にまつわるデータを投入する材料データ投入(S310)と、材料特性予測の結果を確認する予測結果閲覧(S320)の2つの手順が実行できる。
 材料データ投入(S310)は、実験を行った材料のデータ、および、これから実験を行おうとしている材料のデータを格納したデータセットである実験データ(600)を材料特性予測装置(101)に投入する手順であり、材料特性予測装置はこれに応じて材料DB更新処理(S311)を実行することで内部に保存されている情報を更新する。
 予測結果閲覧(S320)では、材料特性予測装置は利用者(102)の求めに応じて材料特性予測提示処理(S321)を実行し、材料特性予測の結果を可視化した画面である材料特性予測表示(322)を提示する。
 <2.材料データ投入処理>
 図4に材料DB更新処理(S311)の処理手順の例を示す。材料DB更新処理(S311)では、最初に実験データ受付部(111)が利用者(102)から実験データ(600)を受け取って、案件IDを特定あるいは付加する(S401)。そして案件別に、材料DB(112)を更新または追加する(S402)。
 図5に材料DB更新処理(311)の最初のステップ(S401)で利用者(102)から実験データ(600)を受け取るために、モニタ(205)に表示する画面の一例を示す。実施例1では、利用者(102)が予め実験データをファイルに記憶しておき、そのファイルの位置をテキストボックス(501)に指定する形で実験データ(600)を受け渡す。受け渡されるファイルには、公知のCSV(Comma Separated Value)形式で表形式のデータが記述されており、それを解釈して表形式とした結果が表画面(502)に表示される。
 図5では、記述されている情報が実験の識別子である「ID」、実験時の温度を示す「Temp」、そのときの水溶性を示す「SOL」、材料の構造式を示す文字列「SMILES」が例示されている。この例では水溶性が予測を行いたい材料特性であり、SOL欄が空白のデータは未実験の条件ということを示している。なお、このデータの受け渡しは一例であり、表形式に変換可能な情報として、材料の構造式と材料特性を含む実験データを渡せる形態であれば他の方法でもよい。情報は表画面(502)に表示され、ボタン(503)により材料DB(112)に保存される。
 図6にこの実験データ(600)の1レコードの構成例を示す。1レコードは特定の組成および製造プロセスで得られた一つの材料に対応する。本例では、実験データ(600)は、材料特性(601)、例えばSMILES形式などの材料の構造式を示せる情報である材料構造式(602)、温度や圧力など実験時の条件を示す実験条件(603)の情報を1レコードとする情報であり、実験データ(600)はこのレコードを1または複数集めたものである。これらの情報は、図5の表画面(502)の各項目と対応しており、本実施例では各項目がどの要素に対応するか所定の項目名との対応をもって判定されている。この対応関係については画面から利用者(102)に入力してもらうなどしてもよい。また、材料特性(601)については、実験などによって判明している数値が格納され、未実験の場合は空白が格納される。実験データ(600)には、その他案件名等の情報を付加してもよい。
 図4の材料DB更新処理(S311)の最初のステップ(S401)では、前記実験データ(600)を解釈・整形して材料DB(112)の実験データテーブルとして格納する。
 図7に実験データテーブルの1レコードの情報を示す。このデータは、実験を一意に識別可能なように連番などで付番された実験ID(701)、実験データ(600)の材料特性(601)に由来する材料特性(702)、実験データ(600)の材料構造式(602)に由来する材料構造式(703)、実験条件(603)に由来する実験条件(704)を含む。これらは各由来となる情報に対して、単位や形式の変換を行い統一した表現に変換されるようにしてもよい。
 案件ID(700)は、案件を一意に特定する識別番号である。実施例1では、1ファイル1案件と扱う想定なので、案件IDは実質データファイルのファイル名に対応している。案件ID(700)は、材料DB(112)への登録時に連番で付加すればよい。ファイルと案件の対応が定まっていない場合には、材料DB(112)への登録時に、ユーザに「今アップロードしようとしているのはどの案件に対応するか?」という質問を提示し、対応を入力してもらい登録することもできる。実験データテーブルの形式は、追加分と登録済みのもので同一であることが必要である。材料特性(702)や実験条件(704)はユーザが任意に定義することができ、数も自由に設定可能である。
 <3.案件間相互特徴量>
 本実施例の一つの特徴は、既存案件のデータを利用することで、データ数が少ない状況でも材料特性の予測精度を向上する点である。材料の開発プロセスでは、初期の段階では使用できるデータは極めて少ない。具体的な実施例を説明する前に、本実施例の概念を説明する。
 図8には、案件別の材料データベース(112)に格納されている案件データの例を示した。図8に示すように、他案件の情報を使う場合、通常は目的となる材料特性は案件ごとに異なるため、材料特性が揃ったデータは当該案件用のものしかないことがほとんどである。また、同じような特性を目的とした実験であっても、計測方法が違うケースもあり、そのまま流用が難しいことも多い。
 図8の例では、過去案件Aと過去案件Bは、実験条件が温度と湿度で異なり、材料特性もAとBで異なるため、そのままでは互いに特性予測に利用することができない。本実施例では、過去の案件のデータを、「特徴量を作るための情報」として用いることで、説明変数を増やすことを可能にしている。ここで新たに作られる特徴量を、「案件間相互特徴量」と称する。
 図9で、過去の案件に関する情報を、「特徴量を作るための情報」として用いるプロセスを説明する。まず、過去案件Aのデータ(901)を用いて、目的変数を既知の材料特性A、説明変数を構造式として、構造式から材料特性Aを予測する予測モデル(902)を生成(学習)する。これは、たとえば回帰木、ランダムフォレスト、サポートベクター回帰、ガウシアンプロセス回帰、ニューラルネットワークなどを用い、既知の教師有り機械学習で生成することが可能である。
 次に、過去案件Bのデータ(903)の構造式を予測モデル(902)に適用し、材料特性Aを予測する。材料特性Aを過去案件Bのデータに加え、新たなデータセット(904)を生成する。過去案件Aに過去案件Bと同じ構造式があれば、過去案件Aの材料特性をそのまま新たなデータセットに加えてもよい。この材料特性Aが案件間相互特徴量に相当する。
 新たなデータセット(904)を得たら、このうち材料特性Bが既知のデータ(項番1,2,3)を教師データとして、材料特性Bを予測する予測モデル(905)を生成する。このとき、説明変数は構造式、実験条件(湿度)、材料特性Aであり、目的変数は材料特性Bである。予測モデル(905)は、既知の教師有り機械学習で生成することが可能である。
 生成した予測モデル(905)に、材料特性Bを予測したいデータ(項番4)を入力し、材料特性Bを得る。新しい特徴量(案件間相互特徴量)として材料特性Aを追加することで、過去案件Bのデータをそのまま用いる場合に比べ、予測精度の向上が期待できる。特に、材料特性AとBが相関を持つ場合に、有効であると考えられる。
  以上の概念を理解したうえで、具体的な予測結果閲覧処理のフローを説明する。
 <4.予測結果閲覧処理>
 図10を用いて、予測結果閲覧(S320)の際の材料特性予測提示処理(S321)について説明する。説明中、図9の概念との対応も、図9の900番台の参照符号を引用して説明する。
 最初に、材料特性予測提示部(116)は、材料特性予測表示(322)を利用者(102)に提示して特性を予測する対象となる実験データテーブルの指定を受ける(S1001)。この際、案件IDを用いて、材料DB(112)に格納されている実験データテーブルの内容を指定する。ここでは、実験データはすでに材料DB(112)に格納されているものとする。
 図11に、モニタ(205)に表示される、利用者(102)からの指示を受け付ける画面、および材料特性予測の結果を可視化した材料特性予測表示(322)の画面の例を示す。
 図中ドロップダウンボックス(1101)には実験データテーブルの内容が候補として表示されている。案件IDを指定して予測値更新のボタン(1102)が押されると、材料特性予測提示部(116)は材料特性予測部(113)に当該実験データテーブル(図7)のレコードのうち材料特性(702)が空白のものについて予測値により補間を実行する指示を送り、その結果が画面(1103)に表示されるようになっている。図11中、下線を施した材料特性の数値は、空白のデータを補間したことを示している。
 材料特性予測部(113)は、材料特性予測提示部(116)の前記補間を実行する指示を受けると、案件ID(700)で指定された実験データテーブルのデータを材料DB(112)から取得する(S1002)。また、図11の画面(1104)にて、案件間相互特徴量を生成するために使用する他案件を選択する。材料特性予測部(113)は、選択された他の案件の予測モデル(902)を、材料特性予測モデルDB(114)から取得する(S1003)。
 図10のフローの説明において、処理(S1002)で取得されたデータは、図9の過去案件Bのデータ(903)に相当する。また、処理(S1003)で取得された案件の予測モデルは、図9の過去案件Aのデータ(901)から生成された予測モデル(902)に相当する。
 以上の説明では、予測モデル(902)はすでに作成済みで、案件ID(700)により、材料特性予測モデルDB(114)から呼び出すことを想定している。材料特性予測モデルDB(114)に該当する予測モデル(902)がない場合には、図9に示したように、過去案件Aのデータ(901)の材料構造式を説明変数、既知の材料特性を目的変数として予測モデル(902)を学習して作成すればよい。
 次に、材料特性予測部(113)は、材料特性予測用データを生成する(S1004)。当該処理は、過去案件Bのデータ(903)の構造式を予測モデル(902)に適用し、材料特性Aを予測し、材料特性Aを過去案件Bのデータに加え、新たなデータセット(904)を生成することに相当する。このとき、案件間相互特徴量生成部(115)は、処理(S1003)で取得された予測モデル(902)を用いて材料特性A(案件間相互特徴量)の予測を実行する。
 図12に材料特性予測用データの1レコード(1500)の構造を示す。1レコードの内容は、過去案件Bのデータ(903)の実験データテーブル(図7)の、案件ID(700)、実験ID(701)、材料特性(702)、実験条件(704)を引き継ぐ。また構造式由来の特徴量(1201)を含む。構造式由来の特徴量は、材料構造式(703)から計算する。構造式から特徴量を計算する方法としては、フィンガープリント法など公知のものがある。
 材料特性予測用データは、他の案件の予測モデル(902)で作成した特徴量(1202,1203)すなわち案件間相互特徴量を含む。図9の説明では、他の案件は過去案件Aの一件、案件間相互特徴量は予測材料特性Aの一種類としている。ただし、他の案件の予測モデル(902)で作成した特徴量は一種類でもよいし、任意の複数種類あってもよい。また他の案件も複数使用してよい。
 材料特性予測部(113)は材料特性予測用データから材料特性(702)が未実測すなわち空白のものを除き、案件ID(700)と実験ID(701)と材料特性(702)を除く項目を説明変数、材料特性(702)を目的変数とおいて、公知の回帰分析を実行し予測関数を得、予測モデル(905)を学習する(S1005)。作成した予測モデル(905)は、材料特性予測モデルDB(114)に予測モデル(905)を生成したデータの案件IDとともに記憶する。
 この手順は、予測関数をy=f(x1,x2,・・・)と書くとすると、yが目的変数、x1,x2,・・・が説明変数であり、x1,x2,・・・を定めるとyが予測できるようにfの関数形を定めるということを意味する。本実施例の場合には、図12の材料特性予測用データを用いた場合、
[材料特性(702)] = f([構造式由来の特徴量(1201)], [実験条件(704)], [案件[1]の特徴量(1202)], [案件[2]の特徴量(1203)]・・・・)
として回帰分析を学習して予測モデル(905)を生成する。
 この学習は図9の最下段の予測モデル(905)の生成に相当しており、図9では実験条件(704)は湿度の1種類になっているが、データが存在することを前提に、実験条件の数や種類は任意である。実験条件としては、例えば材料の製造条件があるが、データがない場合は省略してもよい。また、前述のように図9では案件間相互特徴量は予測材料特性Aの一つのみ示しているが、上式のように複数あってもよい。
 回帰分析のアルゴリズムは公知のものでよく、回帰木、LASSO、ランダムフォレスト、ガウシアンプロセス、サポートベクター回帰、ニューラルネットワークなどを使用可能である。なお、本実施例では説明変数を増加させることになるが、説明変数を増加させる場合、サポートベクター回帰よりも、回帰木やランダムフォレストが好適である。特に非線形のランダムフォレストにより高精度の予測が期待できる。
 かくして予測モデル(905)を生成したのち、材料特性予測部(113)は、材料特性(702)が未実測すなわち空白のものを選び、前記y=f(x1,x2,・・・)の予測関数を用いて、材料特性(702)の予測値を算出する(S1006)。
 算出した予測値は、材料特性予測提示部(116)により、モニタ(205)の画面上に図11に示したように表示される(S1007)。なお、本実施例では説明変数として空間構造特徴量と実験条件のみをもちいたが、実際には他の何らかの量(例えば、分子量、電荷)を導出してくわえて用いてもよい。
 上記の実施例では、他案件の特徴量を作るときは、構造式を用いているが、案件データで共通なデータであれば、組成その他のデータを用いてもよい。また、構造式をそのまま用いて予測可能な方法も公知であり、その場合も仕組みは同様である。
 以上説明した実施例によれば、過去の他の案件で行った材料特性予測のときのデータで、今回の予測と互換性のあるモデルを作り、このモデルを介して説明変数を増やすことで精度を向上する。例えば、研究開発を開始した当初の案件(図9の過去案件B)はデータ数が少ないが、本実施例では、例えば研究開発が完了しデータ量の豊富な過去案件(図9の過去案件A)のデータを活用することができる。これにより、材料特性予測を行うとき、データが少ないと精度が低いという課題を克服することができる。このため、実験計画のスクリーニングのための予測評価において、より高精度な予測ができるようになる。その結果、実験計画がたてやすくなり、ひいては少ない実験回数でよい材料を開発可能となる。例えば、特性がよくなると予測されるパラメータを調べ、その実験条件を優先的にすすめることができる。
101 材料特性予測装置
102 利用者
111 実験データ受付部
112 材料DB
113 材料特性予測部
114 材料特性予測モデルDB
115 案件間相互特徴量生成部
116 材料特性予測提示部

Claims (15)

  1.  材料組成、実験条件、および材料特性からなるレコードを複数含む案件データを処理して、材料特性の予測を行うためのシステムであって、
     材料特性予測提示部と、案件相互特徴量生成部と、材料特性予測部とを備え、
     前記材料特性予測提示部は、
      材料特性が未知であるレコードを含み、第1の予測モデルによる材料特性の予測対象となる第1の案件データの指定を受け付け、
     前記案件相互特徴量生成部は、
      第2の予測モデルを用いて、前記第1の案件データの材料組成から、特徴量を予測し、
     前記材料特性予測部は、
      前記第1の案件データの前記材料組成、前記実験条件、前記特徴量、および既知の前記材料特性を用いて、前記第1の予測モデルを生成し、
      前記第1の案件データの材料特性が未知であるレコードの前記材料組成、前記実験条件、前記特徴量を前記第1の予測モデルに入力して、未知の材料特性を予測する、
     材料特性予測システム。
  2.  材料データベースから前記案件データを取得可能であり、
     前記材料データベースは複数の案件データを格納し、前記案件データ間で、前記実験条件と前記材料特性は、異なる定義のデータを含み、
     前記材料特性予測提示部は、
      前記第1の案件データと異なる第2の案件データの指定を受け付け、
     前記案件相互特徴量生成部は、
      前記材料データベースから前記第2の案件データを取得して、前記第2の案件データの材料組成および既知の材料特性を用いて、前記第2の予測モデルを生成し、
      前記第2の予測モデルを用いて、前記第1の案件データの材料組成から、前記第2の案件データで定義されている材料特性に基づく特徴量を予測する、
     請求項1記載の材料特性予測システム。
  3.  前記材料データベースを含み、該材料データベースには、
      材料組成、第1の実験条件、および第1の材料特性からなるレコードを複数含む前記第1の案件データと、
      材料組成および前記第1の実験条件と異なる定義の第2の実験条件を格納するレコードを複数含む前記第2の案件データと、が格納されている
     請求項2記載の材料特性予測システム。
  4.  前記材料データベースを含み、該材料データベースには、
      材料組成、第1の実験条件、および第1の材料特性からなるレコードを複数含む前記第1の案件データと、
      材料組成および前記第1の材料特性と異なる定義の第2の材料特性を格納するレコードを複数含む前記第2の案件データと、が格納されている
     請求項2記載の材料特性予測システム。
  5.  前記第1の予測モデルおよび前記第2の予測モデルの少なくとも一つを格納する材料特性予測モデルデータベースを備える、
     請求項2記載の材料特性予測システム。
  6.  前記第2の予測モデルは、前記第2の案件データと対応して管理されている、
     請求項5記載の材料特性予測システム。
  7.  前記第1の予測モデルは、ランダムフォレストで構成される、
     請求項1記載の材料特性予測システム。
  8.  入力装置、記憶装置およびプロセッサを含む情報処理装置により、材料特性を予測する方法であって、
     第1の特徴量を含む第1のデータから第1の材料特性を予測するための第1の予測モデルを生成する際に、
     前記第1の特徴量から前記第1の材料特性とは異なる定義の第2の材料特性を予測する、第2の予測モデルを準備する第1のステップ、
     前記第1のデータを前記第2の予測モデルに適用し、前記第2の材料特性を予測する第2のステップ、
     前記第1の特徴量を第1の説明変数とし、前記第2の材料特性を第2の説明変数とし、前記第1の材料特性を目的変数として、前記第1の予測モデルを生成する第3のステップ、
     を実行する材料特性予測方法。
  9.  前記第1の予測モデルと前記第1のデータを用いて、前記第1の材料特性を予測する第3のステップ、
     を実行する請求項8記載の材料特性予測方法。
  10.  前記第1の特徴量は、材料の構造式に基づく特徴量である、
     請求項8記載の材料特性予測方法。
  11.  前記第2の予測モデルは、前記第1の特徴量と前記第2の材料特性を含む第2のデータを用いて学習されたものである、
     請求項8記載の材料特性予測方法。
  12.  案件別の材料データベースを用い、
     前記材料データベースには、第1の案件に関する第1案件データと、第2の案件に関する第2案件データが格納され、
     前記第1案件データは、材料の構造に関する情報と、前記第1の材料特性を含む複数のレコードを有し、
     前記第2案件データは、材料の構造に関する情報と、前記第2の材料特性を含む複数のレコードを有し、
     前記材料の構造に関する情報から、前記第1の特徴量を生成し、
     前記第1案件データから前記第1のデータを生成し、
     前記第2案件データから前記第2のデータを生成する、
     請求項11記載の材料特性予測方法。
  13.  前記第1案件データは、さらに材料の製造条件に関する第1の情報を含む、
     請求項12記載の材料特性予測方法。
  14.  前記第2案件データは、さらに材料の製造条件に関する前記第1の情報と定義の異なる第2の情報を含む、
     請求項13記載の材料特性予測方法。
  15.  前記第1の予測モデルとしてランダムフォレストを用いる、
     請求項8記載の材料特性予測方法。
PCT/JP2020/031267 2019-09-18 2020-08-19 材料特性予測システムおよび材料特性予測方法 WO2021054026A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/621,321 US20220358438A1 (en) 2019-09-18 2020-08-19 Material property prediction system and material property prediction method
CN202080054391.9A CN114207729A (zh) 2019-09-18 2020-08-19 材料特性预测系统以及材料特性预测方法
EP20864840.2A EP4033391A4 (en) 2019-09-18 2020-08-19 SYSTEM FOR PREDICTING MATERIAL PROPERTIES AND METHOD FOR PREDICTING MATERIAL PROPERTIES

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019169651A JP7267883B2 (ja) 2019-09-18 2019-09-18 材料特性予測システムおよび材料特性予測方法
JP2019-169651 2019-09-18

Publications (1)

Publication Number Publication Date
WO2021054026A1 true WO2021054026A1 (ja) 2021-03-25

Family

ID=74878515

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/031267 WO2021054026A1 (ja) 2019-09-18 2020-08-19 材料特性予測システムおよび材料特性予測方法

Country Status (5)

Country Link
US (1) US20220358438A1 (ja)
EP (1) EP4033391A4 (ja)
JP (1) JP7267883B2 (ja)
CN (1) CN114207729A (ja)
WO (1) WO2021054026A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627036A (zh) * 2021-09-15 2021-11-09 昆明理工大学 材料介电常数预测方法、装置、计算机设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7188512B1 (ja) 2021-08-05 2022-12-13 日立金属株式会社 データベース、材料データ処理システム、およびデータベースの作成方法
JP7439872B1 (ja) 2022-09-02 2024-02-28 株式会社プロテリアル 複合材料の物性値予測装置、物性値予測プログラム及び物性値予測方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003178102A (ja) 2001-12-12 2003-06-27 Society Of Chemical Engineers Japan 材料設計支援方法ならびにそのシステム
JP2004086892A (ja) 2002-08-02 2004-03-18 Japan Science & Technology Agency 成分配合設計方法、成分配合設計プログラム及びそのプログラムを記録した記録媒体
JP2010277328A (ja) * 2009-05-28 2010-12-09 Medibic:Kk 配合設計用シミュレーションデータベース装置、配合設計用システム、方法およびプログラム
JP2017091526A (ja) * 2015-11-04 2017-05-25 三星電子株式会社Samsung Electronics Co.,Ltd. 新規物質探索方法および装置
JP2019082790A (ja) * 2017-10-30 2019-05-30 日本システム開発株式会社 情報処理装置、方法、およびプログラム
JP2019086817A (ja) * 2017-11-01 2019-06-06 株式会社日立製作所 設計支援装置及び設計支援方法
WO2019172280A1 (ja) * 2018-03-09 2019-09-12 昭和電工株式会社 ポリマーの物性予測装置、記憶媒体、及びポリマーの物性予測方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY107650A (en) * 1990-10-12 1996-05-30 Exxon Res & Engineering Company Method of estimating property and / or composition data of a test sample
US7292958B2 (en) * 2004-09-22 2007-11-06 Massachusetts Institute Of Technology Systems and methods for predicting materials properties
US8311955B2 (en) * 2007-10-30 2012-11-13 Exxonmobil Research And Engineering Company Bootstrap method for oil property prediction
US20120281096A1 (en) * 2011-05-02 2012-11-08 Honeywell-Enraf B.V. Storage tank inspection system and method
US10516725B2 (en) * 2013-09-26 2019-12-24 Synopsys, Inc. Characterizing target material properties based on properties of similar materials
US20160034614A1 (en) * 2014-08-01 2016-02-04 GM Global Technology Operations LLC Materials property predictor for cast aluminum alloys
WO2019222548A1 (en) * 2018-05-16 2019-11-21 President And Fellows Of Harvard College Volatile liquid analysis
US10515715B1 (en) * 2019-06-25 2019-12-24 Colgate-Palmolive Company Systems and methods for evaluating compositions
US11047832B2 (en) * 2019-08-29 2021-06-29 Endra Life Sciences Inc. Method and system for determining at least one parameter of interest of a material

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003178102A (ja) 2001-12-12 2003-06-27 Society Of Chemical Engineers Japan 材料設計支援方法ならびにそのシステム
JP2004086892A (ja) 2002-08-02 2004-03-18 Japan Science & Technology Agency 成分配合設計方法、成分配合設計プログラム及びそのプログラムを記録した記録媒体
JP2010277328A (ja) * 2009-05-28 2010-12-09 Medibic:Kk 配合設計用シミュレーションデータベース装置、配合設計用システム、方法およびプログラム
JP2017091526A (ja) * 2015-11-04 2017-05-25 三星電子株式会社Samsung Electronics Co.,Ltd. 新規物質探索方法および装置
JP2019082790A (ja) * 2017-10-30 2019-05-30 日本システム開発株式会社 情報処理装置、方法、およびプログラム
JP2019086817A (ja) * 2017-11-01 2019-06-06 株式会社日立製作所 設計支援装置及び設計支援方法
WO2019172280A1 (ja) * 2018-03-09 2019-09-12 昭和電工株式会社 ポリマーの物性予測装置、記憶媒体、及びポリマーの物性予測方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627036A (zh) * 2021-09-15 2021-11-09 昆明理工大学 材料介电常数预测方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
JP2021047627A (ja) 2021-03-25
EP4033391A4 (en) 2023-10-18
EP4033391A1 (en) 2022-07-27
CN114207729A (zh) 2022-03-18
JP7267883B2 (ja) 2023-05-02
US20220358438A1 (en) 2022-11-10

Similar Documents

Publication Publication Date Title
WO2021054026A1 (ja) 材料特性予測システムおよび材料特性予測方法
Guha On exploring structure–activity relationships
US10482389B2 (en) Parallel development and deployment for machine learning models
KR20210119479A (ko) 기계 학습을 사용하여 분자의 후각 특성을 예측하기 위한 시스템 및 방법
JP5338492B2 (ja) 入力変数選択支援装置
WO2021044857A1 (ja) 材料特性予測システムおよび情報処理方法
JP2018147280A (ja) データ分析装置及びデータ分析方法
WO2021044846A1 (ja) 材料特性予測装置および材料特性予測方法
KR20240001238A (ko) 산업별 머신 러닝 애플리케이션들
KR20220092551A (ko) 정보 처리 시스템, 정보 처리 방법, 및 정보 처리 프로그램
Hanser et al. Applicability domain: towards a more formal framework to express the applicability of a model and the confidence in individual predictions
US10241899B2 (en) Test input information search device and method
JP6120607B2 (ja) 要件検出装置及び要件検出プログラム
JP2016192034A (ja) 統計モデル作成装置、統計モデル作成方法及び統計モデル作成プログラム
WO2021220775A1 (ja) 材料の特性値を推定するシステム
Poelking et al. BenchML: an extensible pipelining framework for benchmarking representations of materials and molecules at scale
JP2013218381A (ja) ソフトウェア評価支援装置及びプログラム
WO2021220776A1 (ja) 材料の特性値を推定するシステム
WO2020065807A1 (ja) 情報処理装置、処理装置、情報処理方法、処理方法、決定方法、およびプログラム
Singh et al. Decision Support System for Ranking of Software Reliability Growth Models
Alcalá et al. Prots2Net: a PPIN predictor of a proteome or a metaproteome sample
CN116563278B (zh) 检测结果显示方法、装置、计算机设备和存储介质
Nicolau et al. Accuracy Assessment: Quantifying Classification Quality
Feasel Local Correlation Integral (LOCI)
Salin A Stochastic Approach Based on Rational Decision-Making for Analyzing Software Engineering Project Status

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20864840

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2020864840

Country of ref document: EP

Effective date: 20220419