WO2023171775A1 - 材料創出を支援するシステム及び方法、プログラム - Google Patents

材料創出を支援するシステム及び方法、プログラム Download PDF

Info

Publication number
WO2023171775A1
WO2023171775A1 PCT/JP2023/009175 JP2023009175W WO2023171775A1 WO 2023171775 A1 WO2023171775 A1 WO 2023171775A1 JP 2023009175 W JP2023009175 W JP 2023009175W WO 2023171775 A1 WO2023171775 A1 WO 2023171775A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
source
experimental
material creation
data source
Prior art date
Application number
PCT/JP2023/009175
Other languages
English (en)
French (fr)
Inventor
貴文 木俣
崇弘 冨田
恭平 阿閉
健司 森本
真吾 惣川
泰輔 加藤
孝文 西脇
Original Assignee
日本碍子株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本碍子株式会社 filed Critical 日本碍子株式会社
Priority to JP2023543391A priority Critical patent/JP7392208B1/ja
Publication of WO2023171775A1 publication Critical patent/WO2023171775A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation

Definitions

  • the present invention generally relates to techniques that support material creation.
  • MI Materials informatics
  • the material creation support system acquires data from the first data source and presents the target data periodically or each time an inquiry is received.
  • the target data is at least one of acquired data and data based on an inference result obtained by inputting the data into a machine learning model.
  • the material creation support system stores experimental data, which is data obtained through experiments based on the target data, in a second data source.
  • the material creation support system acquires experimental data from a second data source and converts the experimental data into data included in an existing or new first data source.
  • the more the target data is presented the more experimental data obtained through experiments based on the presented target data is acquired.
  • the target data presented is based on the experimental data obtained. Therefore, regardless of whether or not the type of material to be created is one for which highly accurate simulation data regarding structure, properties, etc. can be obtained, it is possible to increase the possibility that data useful for material creation will be presented. Can be done. As a result, the types of materials that can be supported in material creation using informatics methods will be expanded.
  • FIG. 1 shows an example of a system configuration in an embodiment of the present invention.
  • an "interface device” may be one or more interface devices.
  • the one or more interface devices may be at least one of the following: - One or more I/O (Input/Output) interface devices.
  • the I/O (Input/Output) interface device is an interface device for at least one of an I/O device and a remote display computer.
  • the I/O interface device for the display computer may be a communication interface device.
  • the at least one I/O device may be a user interface device, eg, an input device such as a keyboard and pointing device, or an output device such as a display device. - One or more communication interface devices.
  • the one or more communication interface devices may be one or more of the same type of communication interface device (for example, one or more NICs (Network Interface Cards)) or two or more different types of communication interface devices (for example, one or more NICs (Network Interface Cards)). It may also be an HBA (Host Bus Adapter).
  • HBA Hypervisor Adapter
  • memory refers to one or more memory devices that are an example of one or more storage devices, and may typically be a main storage device. At least one memory device in the memory may be a volatile memory device or a non-volatile memory device.
  • Persistent storage may be one or more persistent storage devices, which is an example of one or more storage devices.
  • Persistent storage devices typically may be non-volatile storage devices (e.g. auxiliary storage devices), and specifically include, for example, HDD (Hard Disk Drive), SSD (Solid State Drive), NVME (Non-Volatile Memory Express) drive or SCM (Storage Class Memory).
  • HDD Hard Disk Drive
  • SSD Solid State Drive
  • NVME Non-Volatile Memory Express
  • SCM Storage Class Memory
  • a “storage device” may be at least a memory and a persistent storage device.
  • a "processor” may refer to one or more processor devices.
  • the at least one processor device may typically be a microprocessor device such as a CPU (Central Processing Unit), but may also be another type of processor device such as a GPU (Graphics Processing Unit).
  • At least one processor device may be single-core or multi-core.
  • the at least one processor device may be a processor core.
  • At least one processor device is a circuit that is a collection of gate arrays (for example, FPGA (Field-Programmable Gate Array), CPLD (Complex Programmable Logic Device), or ASIC (Application It may also be a processor device in a broad sense such as Specific Integrated Circuit).
  • functions may be explained using the expression "yyy part", but functions may be realized by one or more computer programs being executed by a processor, or by one or more computer programs being executed by a processor. It may be realized by the above hardware circuit (for example, FPGA or ASIC), or a combination thereof.
  • a function is realized by a program being executed by a processor, the specified processing is performed using a storage device and/or an interface device as appropriate, so the function may be implemented as at least a part of the processor. good.
  • a process described using a function as a subject may be a process performed by a processor or a device having the processor. Programs may be installed from program source.
  • the program source may be, for example, a program distribution computer or a computer-readable recording medium (for example, a non-temporary recording medium).
  • the description of each function is an example, and a plurality of functions may be combined into one function, or one function may be divided into a plurality of functions.
  • MI is an abbreviation for materials informatics
  • DB is an abbreviation for database
  • FIG. 1 shows an example of a system configuration in an embodiment of the present invention.
  • a material creation support system 10 that supports material creation is constructed.
  • the material creation support system 10 may be a physical computer system, a logical computer system based on a physical computer system, or a combination of at least part of the physical computer system and at least part of the logical computer system. It may also be used in combination with the section.
  • a physical computer system may be composed of one or more physical computers, and may include an interface device, a storage device, and a processor connected thereto.
  • the logical computer system may include a virtual machine or a system as a cloud computing service.
  • the material creation support system 10 includes a data presentation section 50, a data acquisition section 60, and a data conversion section 70. These functions 50, 60, and 70 may be realized by a computer program being executed by a processor.
  • the data presentation unit 50 acquires data from the data mart 107 periodically or each time an inquiry is received, and presents the target data.
  • the data in the data mart 107 will be referred to as "organized data.”
  • the target data is at least one of the acquired organized data and data based on an inference result obtained by inputting the organized data into a machine learning model.
  • Data mart 107 is an example of a first data source.
  • the data preferably includes data regarding ceramic materials.
  • the data acquisition unit 60 stores experimental data, which is data obtained by an experiment based on the target data, in the electronic experiment notebook 131, the production DB 121, and the evaluation DB 122.
  • the electronic experiment notebook 131, the production DB 121, and the evaluation DB 122 are examples of the second data source.
  • "experimental data” may be data related to the experiment, such as a summary, details, results, or evaluation of the experiment.
  • the data conversion unit 70 acquires experimental data from the electronic experiment notebook 131, the production DB 121, and the evaluation DB 122, and converts the experimental data into data included in the existing or new data mart 107.
  • the target data is updated or It is based on the newly created data mart 107, that is, the organized data of experimental data of experiments conducted based on target data presented in the past. Therefore, regardless of whether or not the type of material to be created is one for which highly accurate simulation data regarding structure, properties, etc. can be obtained, it is possible to increase the possibility that data useful for material creation will be presented. Can be done. As a result, the types of materials that can be supported in material creation using informatics methods will be expanded. Specifically, for example, even if the type of material to be created is an inorganic material (ceramics), data useful for material creation can be presented.
  • the interface device may be communicably connected to at least one of the experiment system 110, the data acquisition unit 60, and the researcher terminal 11A.
  • the storage device may store at least some of the data of the electronic experiment notebook 131, the production DB 121, the evaluation DB 122, the various data 150, the data lake 102, and the data mart 107.
  • the processor may implement the functions 50, 60, and 70 described above by executing a computer program.
  • a data presentation unit 50 and a data conversion unit 70 are provided in the MI platform system 100.
  • the data acquisition unit 60 is provided outside (or inside) the MI platform system 100.
  • the MI platform system 100 may be a physical computer system, a logical computer system, or a combination of at least part of a physical computer system and at least part of a logical computer system.
  • the data presentation section 50 includes an AI (Artificial Intelligence) section 108 and an IF (Interface) section 109.
  • AI Artificial Intelligence
  • IF Interface
  • the AI unit 108 performs machine learning model learning and inference using the machine learning model.
  • the machine learning model may be a neural network such as CNN, RNN, LSTM or other types of machine learning models including random forests, gradient boosting, logistic regression, and support vector machines (SVMs), reinforcement learning models, and the like.
  • the AI unit 108 outputs to the IF unit 109 an inference result obtained by inputting the organized data acquired from the data mart 107 into a machine learning model.
  • the IF unit 109 receives an inquiry from the researcher terminal 11A, and presents the target data to the researcher terminal 11A in response to the inquiry.
  • the researcher terminal 11A is an information processing terminal (for example, a personal computer or a smartphone) of the materials researcher 5A (an example of a user).
  • the researcher terminal 11A is an example of a sender of an inquiry about the target data, and an example of a destination to which the target data is presented.
  • the IF unit 109 collects target data (organized data acquired from the data mart 107 and/or information obtained by instructing the AI unit 108). data based on the inference results obtained).
  • the target data presented may be, for example, a manufacturing recipe, a material composition, or a material development strategy.
  • the material researcher 5A creates new materials based on the presented target data and conducts experiments based on the target data.
  • the presentation destination (transmission destination) of the target data may be a system such as the experiment system 110 instead of or in addition to the researcher terminal 11A.
  • the materials researcher 5A conducts an experiment using the experimental system 110 based on the presented target data.
  • the experiment using the experiment system 110 may be a combinatorial experiment.
  • the experimental system 100 may include one or more devices, such as a ceramic manufacturing device 111 (eg, an atmospheric firing furnace) and a ceramic evaluation device 112 (eg, a device for evaluating coefficient of thermal expansion).
  • Experimental data is output from experimental devices such as the manufacturing device 111 and the evaluation device 112.
  • the output experimental data is transmitted to the data server 120 and stored.
  • a combinatorial experiment is an example of an experiment, and instead of or in addition to a combinatorial experiment, at least one of a high-throughput experiment, an automated experiment using a robot, and an experiment that mainly involves manual work is adopted. You can.
  • the data acquisition section 60 includes a data server 120 and an experiment notebook section 130.
  • the data server 120 manages a DB in which experiment data from the experiment system 110 is stored.
  • a DB managed by the data server 120 may exist for each type of experimental device.
  • a creation DB 121 that stores experimental data from the manufacturing device 111
  • an evaluation DB 122 that stores experimental data from the evaluation device 112 may be managed.
  • Experiment data from the experiment system 110 is converted into structured data by the data server 120 and stored in a DB.
  • the experiment notebook section 130 manages the experiment data acquired from the DB managed by the data server 120 as an electronic experiment notebook 131.
  • the electronic experiment notebook 131 is structured data, such as a DB.
  • the data conversion unit 70 includes a collection unit 101, a feature calculation unit 103, an image analysis unit 104, a natural language analysis unit 105, and an arrangement unit 106.
  • the collection unit 101 collects experimental data from the electronic experiment notebook 131 and the DB of the data server 120, formats the collected experimental data, and stores the formatted experimental data in the data lake 102.
  • "Formatting” as used herein means arranging the structure of experimental data into a predetermined structure.
  • the collection unit 101 may collect various data 150.
  • the various data 150 may include experimental data.
  • the various data 150 may include numerical data of past experiments, material databases available for a fee or free of charge, linguistic data representing past experiments (for example, experiment contents and experiment results), calculations such as simulations, etc. It may include at least one of the obtained material data and the language data of patent documents and papers.
  • the data source for numerical data from past experiments may be different from the data source for linguistic data from patent documents and papers.
  • the feature amount calculation unit 103 calculates feature amounts of one or more predetermined types of data in the formatted experimental data. Thereby, each of the one or more types of data is digitized, and as a result, processing by the AI unit 108 becomes possible.
  • the one or more types of data may be image data and text data.
  • the image data is analyzed by the image analysis unit 104, and based on the result of the analysis, the feature amount calculation unit 103 calculates the feature amount of the image data.
  • the text data is subjected to text mining by the natural language analysis unit 105, and the feature amount calculation unit 103 calculates the feature amount of the text data based on the result of the text mining.
  • the above-mentioned neural network may be used to calculate the feature amount.
  • a copy of the experimental data may be generated in the data lake 102, and each of one or more predetermined types of data in the copy may be converted into a calculated feature amount (numeric value).
  • a organizing unit 106 organizes the data lake 102 into one or more data marts 107 as a data set that meets predetermined conditions.
  • the data mart 107 includes organized data that can be presented as at least part of the target data not via the AI unit 108, and the data mart 107 that includes organized data that can be presented as at least part of the target data via the AI unit 108.
  • a data mart 107 may be generated.
  • the data may be presented to the materials researcher 5A without going through the MI platform system 100.
  • another materials researcher 5B may use the trainee terminal 11B to acquire experimental data from the electronic experiment notebook 131, organize the experimental data, and input the organized data to the AI section 140.
  • the AI section 140 may be implemented outside (or inside) the trainee terminal 11B.
  • the AI unit 140 may also perform inference by inputting the input organized data into a machine learning model. Data based on the results of this inference may be presented to the material researcher 5A.
  • the material researcher 5A may conduct an experiment based on this presented data. Data for this experiment may also be stored in the data server 120 from the experiment system 110 and collected in the MI platform system 100.
  • Experiments based on the presented target data may be facilitated by a predetermined function implemented within or outside the researcher terminal 11A.
  • the function may decide what kind of experiment to recommend to the materials researcher 5A, and present the determined matters to the materials researcher 5A.
  • the target data may include data representing what kind of experiment is recommended.
  • the cycle of presenting target data ⁇ experiment ⁇ collecting experimental data ⁇ converting experimental data to organized data ⁇ presenting target data based on organized data can be performed with high efficiency and speed. You can expect it. In this way, MI based on experimental data is realized. Therefore, it is possible to support the creation of materials for which it is difficult to obtain highly accurate simulation data regarding structures and properties, such as materials with complex higher-order structures such as ceramics.
  • various data internal or external to an organization (for example, a company) that provides the MI platform system 100 can be aggregated in the MI platform system 100, structured and managed, and reflected in the data mart 107. Therefore, the possibility that the presented target data is useful for material creation is increased.
  • a data presentation unit (50) that presents certain target data
  • a data acquisition unit (60) that stores experimental data, which is data obtained by an experiment based on the target data, in a second data source
  • a material creation support system comprising: a data conversion unit (70) that acquires experimental data from the second data source and converts the experimental data into data included in an existing or new first data source.
  • ⁇ Expression 2> At least one of the data acquired from the first data source, the presented target data, the experimental data, and the data included in the existing or new first data source, Contains data on ceramic materials, The material creation support system described in Expression 1.
  • ⁇ Expression 3> (A) periodically or each time a query is received, obtain data from a first data source and combine the data with data based on inference results obtained by inputting the data into a machine learning model; present target data that is at least one of the (B) storing experimental data, which is data obtained by an experiment based on the target data, in a second data source; (C) obtaining experimental data from the second data source and converting the experimental data into data contained in an existing or new first data source; Material creation support method.
  • the machine learning model acquires updated data included in an existing or new first data source by acquiring the experimental data, and learns parameters.
  • the material creation support method described in Expression 3. Specifically, for example, it is as follows.
  • the AI unit 108 may acquire update data from the data mart 107 and learn (for example, update) parameters of a machine learning model used by the AI unit 108.
  • ⁇ Expression 5> collecting existing or new experimental data and converting it into data contained in a first data source; Periodically or each time a query is received, data is obtained from a first data source, and at least the data is based on the inference result obtained by inputting the data into a machine learning model.
  • presenting certain target data Material creation support method.
  • this material creation support method may be performed by the MI platform system 100.
  • the material creation support system 10 does not need to have the data presentation section 50 and the data conversion section 70 but the data acquisition section 60.
  • ⁇ Expression 6> Among the data acquired from the first data source, the presented target data, the experimental data, the data included in the existing or new first data source, and the data based on the inference result.
  • At least one of the data includes data regarding the ceramic material; A material creation support method described in any one of Expressions 3 to 5.
  • ⁇ Expression 8> The data acquired from the first data source, the presented target data, the experimental data, the data included in the existing or new first data source, the learning data, and the recommended inference result. at least one of the data representing data includes data regarding the ceramic material; A method for generating a material creation support model described in Expression 7.
  • ⁇ Expression 9> A program for causing a computer to execute the material creation support method described in any one of Expressions 3 to 6.
  • ⁇ Expression 10> A program for causing a computer to execute the material creation support model generation method described in Expression 7 or 8.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

材料創出支援システムは、定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、対象データを提示する。対象データは、取得されたデータと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である。材料創出支援システムは、当該対象データに基づく実験により得られたデータである実験データを第2のデータソースに格納する。材料創出支援システムは、第2のデータソースから実験データを取得し、当該実験データを既存の又は新たな第1のデータソースに含まれるデータに変換する。

Description

材料創出を支援するシステム及び方法、プログラム
 本発明は、概して、材料創出を支援する技術に関する。
 材料創出支援方法の一つとして、マテリアルズインフォマティクス(MI)が知られている。MIは、インフォマティクスの手法により材料創出を支援する方法であり、一般に、材料の構造や特性等に関するデータを集約し、機械学習を用いて、新たな構造又は特性を有する材料を探索する方法である。
 例えば、有機材料に関しては、化学組成から分子の特性のシミュレーション(例えば第一原理計算)は容易である。このため、特性に関する高精度なシミュレーションデータを多く取得でき、故に、MIの適用が容易である。
 しかし、材料種類によっては、MIの適用が難しい。一つの理由として、材料の構造や特性等に関する高精度なシミュレーションデータの取得が困難であることが挙げられる。例えば、無機材料(セラミックス)に関しては、結晶粒子が多数集まった複雑な高次構造(例えば、粒径、粒度分布及び粒界相など)が特性に影響し、故に、特性のシミュレーションは困難である。このため、特性に関する高精度なシミュレーションデータを取得することは難しく、故に、MIの適用が難しい。
 材料創出支援システムは、定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、対象データを提示する。対象データは、取得されたデータと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である。
 材料創出支援システムは、当該対象データに基づく実験により得られたデータである実験データを第2のデータソースに格納する。材料創出支援システムは、第2のデータソースから実験データを取得し、当該実験データを既存の又は新たな第1のデータソースに含まれるデータに変換する。
 本発明によれば、対象データの提示が実施されればされる程に、提示された対象データに基づく実験により得られた実験データが取得される。提示される対象データは、取得された実験データに基づく。このため、創出対象の材料の種類が、構造や特性等に関する高精度なシミュレーションデータを得られる材料種類であるか否かに関わらず、材料創出に有用なデータが提示される可能性を高めることができる。結果として、インフォマティクスの手法による材料創出支援が可能な材料種類が拡張される。
本発明の一実施形態におけるシステム構成の一例を示す。
 以下の説明では、「インターフェース装置」は、1つ以上のインターフェースデバイスでよい。当該1つ以上のインターフェースデバイスは、下記のうちの少なくとも1つでよい。
・1つ以上のI/O(Input/Output)インターフェースデバイス。I/O(Input/Output)インターフェースデバイスは、I/Oデバイスと遠隔の表示用計算機とのうちの少なくとも1つに対するインターフェースデバイスである。表示用計算機に対するI/Oインターフェースデバイスは、通信インターフェースデバイスでよい。少なくとも1つのI/Oデバイスは、ユーザインターフェースデバイス、例えば、キーボード及びポインティングデバイスのような入力デバイスと、表示デバイスのような出力デバイスとのうちのいずれでもよい。
・1つ以上の通信インターフェースデバイス。1つ以上の通信インターフェースデバイスは、1つ以上の同種の通信インターフェースデバイス(例えば1つ以上のNIC(Network Interface Card))であってもよいし2つ以上の異種の通信インターフェースデバイス(例えばNICとHBA(Host Bus Adapter))であってもよい。
 また、以下の説明では、「メモリ」は、1つ以上の記憶デバイスの一例である1つ以上のメモリデバイスであり、典型的には主記憶デバイスでよい。メモリにおける少なくとも1つのメモリデバイスは、揮発性メモリデバイスであってもよいし不揮発性メモリデバイスであってもよい。
 また、以下の説明では、「永続記憶装置」は、1つ以上の記憶デバイスの一例である1つ以上の永続記憶デバイスでよい。永続記憶デバイスは、典型的には、不揮発性の記憶デバイス(例えば補助記憶デバイス)でよく、具体的には、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、NVME(Non-Volatile Memory Express)ドライブ、又は、SCM(Storage Class Memory)でよい。
 また、以下の説明では、「記憶装置」は、メモリと永続記憶装置の少なくともメモリでよい。
 また、以下の説明では、「プロセッサ」は、1つ以上のプロセッサデバイスでよい。少なくとも1つのプロセッサデバイスは、典型的には、CPU(Central Processing Unit)のようなマイクロプロセッサデバイスでよいが、GPU(Graphics Processing Unit)のような他種のプロセッサデバイスでもよい。少なくとも1つのプロセッサデバイスは、シングルコアでもよいしマルチコアでもよい。少なくとも1つのプロセッサデバイスは、プロセッサコアでもよい。少なくとも1つのプロセッサデバイスは、処理の一部又は全部を行うハードウェア記述言語によりゲートアレイの集合体である回路(例えばFPGA(Field-Programmable Gate Array)、CPLD(Complex Programmable Logic Device)又はASIC(Application Specific Integrated Circuit))といった広義のプロセッサデバイスでもよい。
 また、以下の説明では、「yyy部」の表現にて機能を説明することがあるが、機能は、1つ以上のコンピュータプログラムがプロセッサによって実行されることで実現されてもよいし、1つ以上のハードウェア回路(例えばFPGA又はASIC)によって実現されてもよいし、それらの組合せによって実現されてもよい。プログラムがプロセッサによって実行されることで機能が実現される場合、定められた処理が、適宜に記憶装置及び/又はインターフェース装置等を用いながら行われるため、機能はプロセッサの少なくとも一部とされてもよい。機能を主語として説明された処理は、プロセッサあるいはそのプロセッサを有する装置が行う処理としてもよい。プログラムは、プログラムソースからインストールされてもよい。プログラムソースは、例えば、プログラム配布計算機又は計算機が読み取り可能な記録媒体(例えば非一時的な記録媒体)であってもよい。各機能の説明は一例であり、複数の機能が1つの機能にまとめられたり、1つの機能が複数の機能に分割されたりしてもよい。
 以下、図面を参照して、本発明の一実施形態を説明する。なお、以下の説明では、「MI」は、マテリアルズインフォマティクスの略であり、「DB」は、データベースの略である。
 図1は、本発明の一実施形態におけるシステム構成の一例を示す。
 材料創出を支援する材料創出支援システム10が構築される。材料創出支援システム10は、物理的な計算機システムでもよいし、物理的な計算機システムに基づく論理的な計算機システムでもよいし、物理的な計算機システムの少なくとも一部と論理的な計算機システムの少なくとも一部との組合せでもよい。物理的な計算機システムは、一つ又は複数の物理計算機で構成されてよく、インターフェース装置、記憶装置及びそれらに接続されたプロセッサを備えてよい。論理的な計算機システムは、仮想マシンを含んでもよいし、クラウドコンピューティングサービスとしてのシステムを含んでもよい。
 材料創出支援システム10は、データ提示部50、データ取得部60及びデータ変換部70を有する。これらの機能50、60及び70は、コンピュータプログラムがプロセッサに実行されることにより実現されてよい。
 データ提示部50は、定期的に又は問合せの受信の都度に、データマート107からデータを取得し、対象データを提示する。以下、データマート107内のデータを、「整理済データ」と呼ぶ。対象データは、当該取得された整理済データと、当該整理済データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である。データマート107は、第1のデータソースの一例である。当該データとしては、セラミックス材料に関するデータを含むことが好ましい。
 データ取得部60は、当該対象データに基づく実験により得られたデータである実験データを電子実験ノート131、作製DB121及び評価DB122に格納する。電子実験ノート131、作製DB121及び評価DB122が、第2のデータソースの一例である。また、本実施形態において、「実験データ」とは、実験のサマリ、詳細、結果又は評価など実験に関わるデータでよい。
 データ変換部70は、電子実験ノート131、作製DB121及び評価DB122から実験データを取得し、当該実験データを既存の又は新たなデータマート107に含まれるデータに変換する。
 実験データに基づく整理済データが既存のデータマート107に格納された後、又は、実験データに基づく整理済データを含んだ新たなデータマート107が作成された後、対象データは、更新された又は新たに作成されたデータマート107、すなわち、過去に提示された対象データに基づき行われた実験の実験データの整理済データに基づいている。このため、創出対象の材料の種類が、構造や特性等に関する高精度なシミュレーションデータを得られる材料種類であるか否かに関わらず、材料創出に有用なデータが提示される可能性を高めることができる。結果として、インフォマティクスの手法による材料創出支援が可能な材料種類が拡張される。具体的には、例えば、創出対象の材料の種類が無機材料(セラミックス)であっても、材料創出に有用なデータを提示することができる。
 以下、本実施形態を詳細に説明する。
 材料創出支援システム10に関し、インターフェース装置は、実験システム110、データ取得部60及び研究者端末11Aの少なくとも一つと通信可能に接続されてよい。記憶装置には、電子実験ノート131、作製DB121、評価DB122、各種データ150、データレイク102及びデータマート107のうちの少なくとも一部のデータが格納されてよい。プロセッサは、コンピュータプログラムを実行することにより上述の機能50、60及び70を実現してよい。
 データ提示部50及びデータ変換部70が、MIプラットフォームシステム100に備えられる。データ取得部60は、MIプラットフォームシステム100の外(又は中)に備えられる。MIプラットフォームシステム100は、物理的な計算機システムでもよいし、論理的な計算機システムでもよいし、物理的な計算機システムの少なくとも一部と論理的な計算機システムの少なくとも一部との組合せでもよい。
 データ提示部50は、AI(Artificial Intelligence)部108及びIF(インターフェース)部109を有する。
 AI部108は、機械学習モデルの学習や、機械学習モデルを用いた推論を行う。機械学習モデルは、CNN,RNN,LSTMなどのニューラルネットワーク又はランダムフォレスト、勾配ブースティング、ロジスティック回帰、および、サポートベクタマシン(SVM)、強化学習モデルなどを含む他種の機械学習モデルでよい。AI部108は、例えばIF部109からの指示に応答して、データマート107から取得された整理済データを機械学習モデルに入力することにより得られた推論結果をIF部109に対し出力する。
 IF部109は、研究者端末11Aから問合せを受け、当該問合せに応答して対象データを研究者端末11Aに提示する。研究者端末11Aは、材料研究者5A(ユーザの一例)の情報処理端末(例えば、パーソナルコンピュータ又はスマートフォン)である。研究者端末11Aは、対象データの問合せの送信元の一例であり、また、対象データの提示先の一例である。IF部109は、研究者端末11Aから問合せを受けた場合に(又は定期的に)、対象データ(データマート107から取得された整理済データ、及び/又は、AI部108に指示することにより得られた推論結果に基づくデータ)を提示する。提示される対象データは、例えば、製法レシピ、材料組成又は材料開発戦略でよい。
 材料研究者5Aは、提示された対象データを基に、新材料を創出したり、対象データに基づく実験を行ったりする。対象データの提示先(送信先)は、研究者端末11Aに代えて又は加えて、実験システム110のようなシステムでもよい。
 材料研究者5Aにより、提示された対象データに基づき、実験システム110を用いた実験が行われる。例えば、実験システム110を用いた実験は、コンビナトリアル実験でよい。実験システム100は、一つ又は複数の装置、例えば、セラミックスの作製装置111(例えば、大気焼成炉)、及び、セラミックスの評価装置112(例えば、熱膨張率を評価する装置)を含んでよい。作製装置111及び評価装置112といった実験装置から実験データが出力される。出力された実験データは、データサーバ120に送信され格納される。また、コンビナトリアル実験は、実験の一例であり、コンビナトリアル実験に代えて又は加えて、ハイスループット実験、ロボットを用いた自動実験、及び、人手による作業が主体の実験、のうちの少なくとも一つが採用されてもよい。
 データ取得部60は、データサーバ120及び実験ノート部130を含む。
 データサーバ120は、実験システム110からの実験データが格納されるDBを管理する。データサーバ120が管理するDBは、実験装置の種類毎に存在してよい。例えば、作製装置111からの実験データが格納される作成DB121と、評価装置112からの実験データが格納される評価DB122とが管理されてよい。実験システム110からの実験データは、データサーバ120により構造化データとされ、DBに格納される。
 実験ノート部130は、データサーバ120が管理するDBから取得された実験データを電子実験ノート131として管理する。電子実験ノート131は、構造化されたデータ、例えばDBである。
 データ変換部70が、収集部101、特徴量計算部103、画像解析部104、自然言語解析部105及び整理部106を有する。
 収集部101は、電子実験ノート131やデータサーバ120のDBから実験データを収集し、収集された実験データを整形して、整形された実験データをデータレイク102に格納する。ここで言う「整形」とは、実験データの構成を所定の構成に整えることである。
 また、収集部101は、各種データ150を収集してよい。各種データ150は、実験データを含んでよい。具体的には、例えば、各種データ150は、過去実験の数値データ、有償又は無償で利用可能な材料データベース、過去の実験(例えば、実験内容及び実験結果)を表す言語データ、シミュレーション等の計算により得られた材料データ、及び、特許文献や論文の言語データ、の少なくとも一つを含んでよい。各種データ150のデータソースは一つ以上存在してよい。例えば、過去実験の数値データのデータソースと特許文献や論文の言語データのデータソースは異なっていてよい。
 特徴量計算部103は、整形された実験データにおける所定の一種類以上のデータの特徴量を算出する。これにより、当該一種類以上のデータの各々が数値化され、結果として、AI部108による処理が可能となる。例えば、一種類以上のデータは、画像データとテキストデータでよい。画像データは、画像解析部104により解析され、その解析の結果を基に、特徴量計算部103が、画像データの特徴量計算を行う。また、テキストデータは、自然言語解析部105によりテキストマイニングされ、そのテキストマイニングの結果を基に、特徴量計算部103が、テキストデータの特徴量計算を行う。特徴量計算には、上記のニューラルネットワークを用いてもよい。データレイク102内に、実験データの複製が生成され、当該複製における所定の一種類以上のデータの各々が、計算された特徴量(数値)に変換されてよい。
 整理部106が、データレイク102を、所定の条件に適合するデータ集合としての一つ又は複数のデータマート107に整理する。例えば、AI部108非経由で対象データの少なくとも一部として提示され得る整理済データを含んだデータマート107と、AI部108経由で対象データの少なくとも一部として提示され得る整理済データを含んだデータマート107とが生成されてよい。
 このように、MIプラットフォームシステム100に収集され整形された実験データに基づく整理済データが用意され、整理済データを基に対象データがMIプラットフォームシステム100により材料研究者5Aに提示される。
 また、材料研究者5Aに対するデータの提示は、MIプラットフォームシステム100非経由に行われてもよい。例えば、別の材料研究者5Bが、研修者端末11Bを用いて、電子実験ノート131から実験データを取得し、当該実験データを整理して、AI部140に入力してよい。AI部140は、研修者端末11Bの外(又は中)に実現されてよい。AI部140も、AI部108と同様に、入力された整理済データを機械学習モデルに入力することで推論を行ってよい。この推論の結果に基づくデータが材料研究者5Aに提示されてよい。この提示されたデータを基に材料研究者5Aが実験を行ってもよい。この実験のデータも、実験システム110からデータサーバ120に格納され、MIプラットフォームシステム100に収集されてよい。
 研究者端末11Aの中又は外に実現される所定の機能により、提示された対象データに基づく実験が促進されてよい。例えば、当該機能が、材料研究者5Aに対し、どのような実験を推奨するかを決定し、決定した事項を材料研究者5Aに提示してよい。或いは、対象データが、どのような実験を推奨するかを表すデータを含んでよい。
 上述の実施形態によれば、対象データの提示→実験→実験データの収集→実験データの整理済データへの変換→整理済データに基づく対象データの提示といったサイクルを高効率且つ高速に行うことが期待できる。このように、実験データを主体としたMIが実現される。このため、構造や特性に関する高精度なシミュレーションデータを取得することが困難な材料種類の材料、例えば、セラミックスの複雑な高次構造の材料の創出を支援することができる。
 また、上述した実施形態によれば、MIプラットフォームシステム100を提供する組織(例えば企業)の内部又は外部の種々のデータをMIプラットフォームシステム100に集約し構造化して管理しデータマート107に反映できる。このため、提示される対象データが材料創出に有用である可能性がより高まる。
 以上、一実施形態を説明したが、これは本発明の説明のための例示であって、本発明の範囲をこの実施形態にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実行することが可能である。例えば、上述の説明を基に下記の表現が可能である。下記の表現は、上述の説明の補足説明又は変形例の説明を含んでよい。
<表現1>
定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示するデータ提示部(50)と、
当該対象データに基づく実験により得られたデータである実験データを第2のデータソースに格納するデータ取得部(60)と、
前記第2のデータソースから実験データを取得し、当該実験データを既存の又は新たな第1のデータソースに含まれるデータに変換するデータ変換部(70)と
を備える材料創出支援システム。
<表現2>
前記第1のデータソースから取得されたデータ、前記提示された対象データ、前記実験データ、及び、前記既存の又は新たな第1のデータソースに含まれるデータ、のうちの少なくとも一つのデータが、セラミックス材料に関するデータを含む、
表現1に記載の材料創出支援システム。
<表現3>
(A)定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示し、
(B)当該対象データに基づく実験により得られたデータである実験データを第2のデータソースに格納し、
(C)前記第2のデータソースから実験データを取得し、当該実験データを既存の又は新たな第1のデータソースに含まれるデータに変換する、
材料創出支援方法。
<表現4>
前記機械学習モデルは、前記実験データの取得によって既存の又は新たな第1のデータソースに含まれる更新されたデータを取得し、パラメータを学習する、
表現3に記載の材料創出支援方法。
具体的には、例えば、次の通りである。(C)により取得された実験データ(例えばデータ変換部70により取得された実験データ)を基に、既存のデータマート107内のデータが更新される、又は、当該取得された実験データに基づくデータを含んだ新たなデータマート107が生成される。このため、既存の又は新たなデータマート107が、当該取得された実験データに基づくデータである更新データを含むこととなる。AI部108が、更新データをデータマート107から取得し、当該AI部108が使用する機械学習モデルのパラメータを学習(例えば、更新)してよい。
<表現5>
既存又は新たな実験データを収集し、第1のデータソースに含まれるデータに変換し、
定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示する、
材料創出支援方法。
例えば、この材料創出支援方法は、MIプラットフォームシステム100により行われてよい。別の言い方をすれば、材料創出支援システム10は、データ提示部50及びデータ変換部70を有しデータ取得部60を有していなくてもよい。
<表現6>
前記第1のデータソースから取得されたデータ、前記提示された対象データ、前記実験データ、前記既存の又は新たな第1のデータソースに含まれるデータ、及び、前記推論結果に基づくデータ、のうちの少なくとも一つのデータが、セラミックス材料に関するデータを含む、
表現3~5の何れか一つの表現に記載の材料創出支援方法。
<表現7>
(A)定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示し、
(B)当該対象データに基づく実験により得られたデータである実験データを第2のデータソースに格納し、
(C)前記第2のデータソースから実験データを取得し、当該実験データを既存の又は新たな第1のデータソースに含まれるデータに変換し、
(D)前記(C)の第1のデータソースに含まれる学習用データを用いて、製法レシピ又は材料組成を示す推奨推論結果を出力する機械学習モデルの学習処理を実行する、
材料創出支援モデルの生成方法。
<表現8>
前記第1のデータソースから取得されたデータ、前記提示された対象データ、前記実験データ、前記既存の又は新たな第1のデータソースに含まれるデータ、前記学習用データ、及び、前記推奨推論結果を表すデータ、のうちの少なくとも一つのデータが、セラミックス材料に関するデータを含む、
表現7に記載の材料創出支援モデルの生成方法。
<表現9>
表現3~6の何れか一つの表現に記載の材料創出支援方法をコンピュータに実行させるためのプログラム。
<表現10>
表現7又は8に記載の材料創出支援モデルの生成方法をコンピュータに実行させるためのプログラム。
10…材料創出支援システム
 

Claims (10)

  1.  定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示するデータ提示部と、
     当該対象データに基づく実験により得られたデータである実験データを第2のデータソースに格納するデータ取得部と、
     前記第2のデータソースから実験データを取得し、当該実験データを既存の又は新たな第1のデータソースに含まれるデータに変換するデータ変換部と
    を備える材料創出支援システム。
  2.  前記第1のデータソースから取得されたデータ、前記提示された対象データ、前記実験データ、及び、前記既存の又は新たな第1のデータソースに含まれるデータ、のうちの少なくとも一つのデータが、セラミックス材料に関するデータを含む、
    請求項1に記載の材料創出支援システム。
  3.  (A)定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示し、
     (B)当該対象データに基づく実験により得られたデータである実験データを第2のデータソースに格納し、
     (C)前記第2のデータソースから実験データを取得し、当該実験データを既存の又は新たな第1のデータソースに含まれるデータに変換する、
    材料創出支援方法。
  4.  前記機械学習モデルは、前記実験データの取得によって既存の又は新たな第1のデータソースに含まれる更新されたデータを取得し、パラメータを学習する、
    請求項3に記載の材料創出支援方法。
  5.  既存又は新たな実験データを収集し、第1のデータソースに含まれるデータに変換し、
     定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示する、
    材料創出支援方法。
  6.  前記第1のデータソースから取得されたデータ、前記提示された対象データ、前記実験データ、前記既存の又は新たな第1のデータソースに含まれるデータ、及び、前記推論結果に基づくデータ、のうちの少なくとも一つのデータが、セラミックス材料に関するデータを含む、
    請求項3~5のいずれか一項に記載の材料創出支援方法。
  7.  (A)定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示し、
     (B)当該対象データに基づく実験により得られたデータである実験データを第2のデータソースに格納し、
     (C)前記第2のデータソースから実験データを取得し、当該実験データを既存の又は新たな第1のデータソースに含まれるデータに変換し、
     (D)前記(C)の第1のデータソースに含まれる学習用データを用いて、製法レシピ又は材料組成を示す推奨推論結果を出力する機械学習モデルの学習処理を実行する、
    材料創出支援モデルの生成方法。
  8.  前記第1のデータソースから取得されたデータ、前記提示された対象データ、前記実験データ、前記既存の又は新たな第1のデータソースに含まれるデータ、前記学習用データ、及び、前記推奨推論結果を表すデータ、のうちの少なくとも一つのデータが、セラミックス材料に関するデータを含む、
    請求項7に記載の材料創出支援モデルの生成方法。
  9.  請求項3~6の何れか一項に記載の材料創出支援方法をコンピュータに実行させるためのプログラム。
  10.  請求項7又は8に記載の材料創出支援モデルの生成方法をコンピュータに実行させるためのプログラム。
     
PCT/JP2023/009175 2022-03-10 2023-03-09 材料創出を支援するシステム及び方法、プログラム WO2023171775A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023543391A JP7392208B1 (ja) 2022-03-10 2023-03-09 材料創出を支援するシステム及び方法、プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022-037335 2022-03-10
JP2022037335 2022-03-10

Publications (1)

Publication Number Publication Date
WO2023171775A1 true WO2023171775A1 (ja) 2023-09-14

Family

ID=87935292

Family Applications (2)

Application Number Title Priority Date Filing Date
PCT/JP2023/009175 WO2023171775A1 (ja) 2022-03-10 2023-03-09 材料創出を支援するシステム及び方法、プログラム
PCT/JP2023/009174 WO2023171774A1 (ja) 2022-03-10 2023-03-09 材料創出を支援するシステム及び方法、プログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/009174 WO2023171774A1 (ja) 2022-03-10 2023-03-09 材料創出を支援するシステム及び方法、プログラム

Country Status (2)

Country Link
JP (3) JP7392209B1 (ja)
WO (2) WO2023171775A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019186195A2 (en) * 2018-03-29 2019-10-03 Benevolentai Technology Limited Shortlist selection model for active learning
JP2020198003A (ja) * 2019-06-04 2020-12-10 ジャパンモード株式会社 生成物推定プログラム及びシステム
WO2021015134A1 (ja) * 2019-07-23 2021-01-28 昭和電工株式会社 材料設計システム、材料設計方法、及び材料設計プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7215710B2 (ja) * 2018-10-10 2023-01-31 国立研究開発法人物質・材料研究機構 予測管理システム、予測管理方法、予測管理装置及び予測実行装置
JP6741838B1 (ja) * 2019-09-11 2020-08-19 東京応化工業株式会社 情報処理システム、情報処理装置、情報処理方法及びプログラム
US20210098084A1 (en) 2019-09-30 2021-04-01 Nissan North America, Inc. Method and System for Material Screening
WO2021124392A1 (ja) 2019-12-16 2021-06-24 日本電信電話株式会社 材料開発支援装置、材料開発支援方法、および材料開発支援プログラム
WO2021126515A1 (en) 2019-12-18 2021-06-24 Dow Global Technologies Llc Machine vision for characterization based on analytical data
JP7398334B2 (ja) 2020-04-30 2023-12-14 株式会社日立製作所 ユーザに提案する材料を決定するシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019186195A2 (en) * 2018-03-29 2019-10-03 Benevolentai Technology Limited Shortlist selection model for active learning
JP2020198003A (ja) * 2019-06-04 2020-12-10 ジャパンモード株式会社 生成物推定プログラム及びシステム
WO2021015134A1 (ja) * 2019-07-23 2021-01-28 昭和電工株式会社 材料設計システム、材料設計方法、及び材料設計プログラム

Also Published As

Publication number Publication date
JPWO2023171774A1 (ja) 2023-09-14
WO2023171774A1 (ja) 2023-09-14
JP7392208B1 (ja) 2023-12-05
JP2024015482A (ja) 2024-02-02
JP7392209B1 (ja) 2023-12-05
JPWO2023171775A1 (ja) 2023-09-14

Similar Documents

Publication Publication Date Title
JP4129819B2 (ja) データベース検索システム及びその検索方法並びにプログラム
Masso et al. AUTO‐MUTE 2.0: A portable framework with enhanced capabilities for predicting protein functional consequences upon mutation
CN112102887B (zh) 多尺度集成可视化的高通量自动计算流程及数据智能系统
CN102033977A (zh) 用于基于多目标进化算法的工程设计优化的方法和系统
EP3173955A1 (en) Design space exploration with quantitative pruning and ranking system and method
Yu et al. Scalable and parallel sequential pattern mining using spark
US11797281B2 (en) Multi-language source code search engine
CN109241298A (zh) 语义数据存储调度方法
Shapovalov et al. Multifaceted analysis of training and testing convolutional neural networks for protein secondary structure prediction
Meyer et al. pypet: A python toolkit for data management of parameter explorations
Budzko et al. Symbolic-numerical analysis of equilibrium solutions in a restricted four-body problem
Cao et al. An efficient hybrid multi-objective optimization method coupling global evolutionary and local gradient searches for solving aerodynamic optimization problems
WO2023171775A1 (ja) 材料創出を支援するシステム及び方法、プログラム
Tsiatas et al. Predicting the response of laminated composite beams: A comparison of machine learning algorithms
Rasulzade et al. Computational acceleration of topology optimization using deep learning
Lewis et al. Considering dynamic pareto frontiers in decision making
Kolker et al. Classifying proteins into functional groups based on all-versus-all BLAST of 10 million proteins
Krishnan et al. Scalable visual analytics of massive textual datasets
Oujja et al. High-performance computing for SARS-CoV-2 RNAs clustering: a data science‒based genomics approach
Jiao HEAP: A holistic error assessment framework for multiple approximations using probabilistic graphical models
WO2021152715A1 (ja) 学習装置、検索装置、学習方法、検索方法及びプログラム
JP2023057945A (ja) 最適化問題求解装置及び最適化問題求解方法
Mehta Mastering Python scientific computing
Duff et al. Automated potential development workflow: Application to BaZrO3
Ricciardi et al. Multi-objective optimisation under uncertainty with unscented temporal finite elements

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2023543391

Country of ref document: JP

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23766951

Country of ref document: EP

Kind code of ref document: A1