WO2023074542A1 - 合成材料選択方法、材料製造方法、合成材料選択データ構造、及び製造方法 - Google Patents

合成材料選択方法、材料製造方法、合成材料選択データ構造、及び製造方法 Download PDF

Info

Publication number
WO2023074542A1
WO2023074542A1 PCT/JP2022/039200 JP2022039200W WO2023074542A1 WO 2023074542 A1 WO2023074542 A1 WO 2023074542A1 JP 2022039200 W JP2022039200 W JP 2022039200W WO 2023074542 A1 WO2023074542 A1 WO 2023074542A1
Authority
WO
WIPO (PCT)
Prior art keywords
feasibility
synthesis
physical property
information
database
Prior art date
Application number
PCT/JP2022/039200
Other languages
English (en)
French (fr)
Inventor
樂 白澤
弘樹 鉄川
千里 沼岡
Original Assignee
ソニーグループ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニーグループ株式会社 filed Critical ソニーグループ株式会社
Priority to EP22886869.1A priority Critical patent/EP4428866A1/en
Priority to CN202280071623.0A priority patent/CN118160042A/zh
Priority to JP2023556385A priority patent/JPWO2023074542A1/ja
Publication of WO2023074542A1 publication Critical patent/WO2023074542A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Definitions

  • the present disclosure relates to synthetic material selection methods, material manufacturing methods, synthetic material selection data structures, and manufacturing methods.
  • Patent Document 1 a method of searching for a material to be newly synthesized by searching for a combination of physical property parameters of materials.
  • the present disclosure proposes a synthesis material selection method, a material manufacturing method, a synthesis material selection data structure, and a manufacturing method that can enable material synthesis based on synthesis feasibility.
  • one aspect of the synthesis material selection method performs material selection for selecting a material to be synthesized based on material property information and feasibility information in a database, In response, instructions are given for synthesis processing of the selected materials, and feasibility information in the database is updated based on the synthesis processing result from the control device.
  • FIG. 1 is a diagram showing a configuration example of a material searching and manufacturing system of the present disclosure
  • FIG. It is a flowchart which shows the processing procedure by a material search manufacturing system.
  • Fig. 4 is a flow chart showing a process procedure for feasibility; 1 is a diagram showing an example of a physical property database according to an embodiment of the present disclosure;
  • FIG. 2 illustrates an example of a viability database according to an embodiment of the present disclosure;
  • FIG. FIG. 4 is a diagram showing an example of a material table according to an embodiment of the present disclosure;
  • FIG. FIG. 4 is a diagram showing an example of prediction of physical properties according to an embodiment of the present disclosure;
  • FIG. 2 illustrates an example of a feasibility assessment according to embodiments of the present disclosure
  • FIG. 10 is a diagram showing an example of a search using a physical property prediction model and a feasibility model
  • FIG. 11 shows a detailed example of a search using a physical property prediction model and a feasibility model
  • FIG. 11 shows a detailed example of a search using a physical property prediction model and a feasibility model
  • FIG. 11 shows a detailed example of a search using a physical property prediction model and a feasibility model
  • FIG. 11 shows a detailed example of a search using a physical property prediction model and a feasibility model
  • FIG. 11 shows a detailed example of a search using a physical property prediction model and a feasibility model
  • FIG. 11 shows a detailed example of a search using a physical property prediction model and a feasibility model
  • FIG. 11 shows a detailed example of a search using a physical property prediction model and a feasibility model
  • FIG. 4 is a diagram showing an example of a viability database
  • FIG. 4 is a diagram showing an example of a viability database
  • FIG. 4 is a diagram showing an example of a viability database
  • FIG. 4 is a diagram showing an example of a viability database
  • FIG. 4 is a diagram showing an example of a viability database
  • FIG. 4 is a sequence diagram showing an example of a processing procedure in the material searching and manufacturing system
  • FIG. 4 is a sequence diagram showing an example of a processing procedure in the material searching and manufacturing system; It is a figure which shows an example of a structure of a material search manufacturing system. It is a figure which shows the structural example of the information processing apparatus of this indication. It is a figure which shows an example of a structure of a material manufacturing apparatus. It is a figure which shows an example of a structure of a material manufacturing apparatus. It is a figure which shows an example of a structure of a material manufacturing apparatus. 1 is a hardware configuration diagram showing an example of a computer that implements functions of an information processing apparatus; FIG. It is a figure which shows an example of the material manufacture result regarding a search. It is a figure which shows an example of the material manufacture result regarding a search.
  • Embodiment 1-1 Outline of Configuration and Processing of Material Exploring and Manufacturing System According to Embodiment of Present Disclosure
  • 1-1-1 Device configuration of material searching and manufacturing system 1-1-2. Overall processing flow of material searching and manufacturing system 1-2. Components of material searching and manufacturing system 1-2-1. Material manufacturing equipment 1-2-2. Control system 1-2-2-1. Data 1-2-2-2.
  • Model 1-3 Example of database and model update processing after search and material manufacturing processing 1-3-1. Search using only physical property prediction model and update of database and model after material manufacturing process 1-3-2. Search using physical property prediction model and feasibility model and update of database and model after material manufacturing process 1-4. Details of database and model update processing after searching and material manufacturing processing 1-4-1.
  • FIG. 1 is a diagram showing a configuration example of a material searching and manufacturing system of the present disclosure.
  • the material searching and manufacturing system 1 includes a material manufacturing device 10 , a control device 20 and an external storage device 50 .
  • the material manufacturing apparatus 10 and the control apparatus 20 are communicably connected by wire or wirelessly via a predetermined communication network (the control network N in FIG. 1).
  • the control device 20 and the material manufacturing device 10 can exchange information with each other through the control network N.
  • the control network N may be a dedicated network capable of communicating wirelessly or via wires, a local area network, a wide area network called the Internet or a cloud.
  • the material manufacturing apparatus 10 has a synthesizing apparatus 11 that synthesizes materials, an analyzing apparatus 12 that identifies the synthesized materials, and a measuring apparatus 13 that evaluates physical properties.
  • Each component (each device) of the material manufacturing device 10 such as the synthesizing device 11, the analyzing device 12, and the measuring device 13 can transfer materials to each other, and the configuration thereof will be described later.
  • the external storage device 50 is a server device that holds information used for processing in the material searching and manufacturing system 1 . For example, the external storage device 50 provides information to the control device 20 .
  • the control device 20 includes a control interface 21 for controlling the material manufacturing device 10, a physical property database 22 (physical property DB in FIG. 1) holding physical property data, and a feasibility database 23 holding whether synthesis and/or measurement could be executed. (Feasibility DB in FIG.
  • search agent 26 that is a computer program (hereinafter , search agent 26), and a processing unit 202 (processor (CPU, GPU, GPGPU, neural network accelerator, or a combination of these, etc.), an operation unit 203 consisting of a user interface (keyboard, mouse, touch panel, microphone (voice input), camera (image input such as face)) for operating the control device, or A display unit 204 (such as a display) for displaying the processing result of the processing unit 202 is included.
  • processor CPU, GPU, GPGPU, neural network accelerator, or a combination of these, etc.
  • an operation unit 203 consisting of a user interface (keyboard, mouse, touch panel, microphone (voice input), camera (image input such as face) for operating the control device, or
  • a display unit 204 (such as a display) for displaying the processing result of the processing unit 202 is included.
  • the physical property prediction model 24 and the feasibility model 25 may be stored in the same storage unit 201 as the physical property database 22 (physical property DB in FIG. 1) or the feasibility database 23 (feasibility DB in FIG. 1). Alternatively, it may be stored in another storage device.
  • the physical property prediction model 24, the feasibility model 25, or the search agent 26 may also be stored in the same storage unit 201 as the physical property prediction model 24 and the feasibility model 25, or may be stored in a separate storage device.
  • part of the storage unit 201 may be configured as a device (for example, the external storage device 50 or the like) separate from the control device 20 and connected to the control network N via a network interface (not shown). Further, the storage unit 201 and another storage device (for example, the external storage device 50 or the like) may cooperate with each other to form a virtual storage using functions of an operating system (not shown).
  • communication control devices/communication infrastructure such as routers and switches are used between the control interface 21 and the control network N, and between the control network N and the synthesizing device 11, the analyzing device 12, or the measuring device 13. data communication may be performed.
  • the search agent 26 may implement its functions as a computer program, or may implement its functions by means of hardware, such as a dedicated processor (not shown). It may work. Furthermore, as will be described later, the physical property prediction model 24 and the feasibility model 25 are updated by re-learning.
  • the physical property prediction model 24 and the feasibility model 25 may be machine learning models realized by machine learning algorithms such as Bayesian optimization, neural networks, and SVM (Support Vector Machine).
  • the storage unit 201 further stores a software program for executing a machine learning algorithm (not shown).
  • the physical property prediction model 24 is read from the storage unit 201 and shown in the figure.
  • the physical property prediction model 24 can be updated using machine-learned data that does not apply.
  • the processing unit 202 copies the physical property prediction model 24 in the process of being updated to the physical property prediction model update area 24', and generates an updated model of the physical property prediction model 24.
  • an updated physical property prediction model can be generated based on the physical property prediction model 24. That is, the processing unit 202 copies the physical property prediction model 24, which is a machine learning model read from the storage unit 201, to the physical property prediction model update area 24' using a software program that executes a machine learning algorithm. By applying the machine learning data, an updated machine learning model can be produced. By writing the manufactured updated machine learning model again to the storage unit 201 as the physical property prediction model 24, the updated machine learning model can be continuously used as the physical property prediction model 24.
  • the control device 20 can perform processing for manufacturing the physical property prediction model 24, which is an updated machine learning model.
  • generation of an updated feasibility model can be performed.
  • the feasibility model update area 25' of the storage unit 201 is used. That is, the processing unit 202 copies the feasibility model 25, which is the machine learning model read from the storage unit 201, to the feasibility model update area 25' using a software program that executes a machine learning algorithm. By applying machine learning data to it, it is possible to manufacture an updated machine learning model. By writing the manufactured updated machine learning model again to the storage unit 201 as the feasibility model 25, the updated machine learning model can be continuously used as the feasibility model 25. .
  • control device 20 can perform processing for manufacturing the feasibility model 25, which is the updated machine learning model.
  • the display unit 204 can display data structures illustrated in FIGS. 4 to 20 according to the input from the operation unit 203 .
  • processing unit 202 can issue an instruction to start, stop, or modify the processing shown in FIG.
  • FIG. 2 is a flow chart showing a processing procedure by the material searching and manufacturing system.
  • FIG. 2 shows an example of a material manufacturing method performed by the material searching and manufacturing system 1 .
  • the material searching and manufacturing system 1 is driven by the searching agent 26 and searches for materials according to the following procedure.
  • the material searching and manufacturing system 1 sets the range of the material searching space and the target values of the material physical properties (step S1). Then, the material searching and manufacturing system 1 sets a material searching space (step S2). For example, the material search and manufacturing system 1 uses prediction results from the physical property prediction model 24 and/or the prediction results from the feasibility model 25 to prioritize materials included in the material search space.
  • the prediction result (output) of the physical property prediction model 24 or the feasibility model 25 may be regression analysis data, which will be described later in detail.
  • the physical property prediction model 24 and the feasibility model 25 may be machine learning models using machine learning algorithms such as Bayesian optimization, neural networks, and SVM. Details of this will be described later.
  • the material searching and manufacturing system 1 selects candidate materials based on the priority of the materials (step S3).
  • the control device 20 of the material searching and manufacturing system 1 selects a material to be synthesized based on material property information in the property database 22 and feasibility information in the feasibility database 23 .
  • the material searching and manufacturing system 1 synthesizes candidate materials (step S4).
  • the control device 20 of the material searching and manufacturing system 1 instructs the material manufacturing device 10 of the material searching and manufacturing system 1 to synthesize the selected materials, and the material manufacturing device 10 responds to the instruction from the control device 20 Synthesize the materials accordingly.
  • step S5 If the synthesis fails (step S5: No), the material searching and manufacturing system 1 updates the data in the item indicating "feasibility" of the feasibility database 23 to indicate that the synthesis has "failed", and further The feasibility model 25 is updated so that the "predicted value" of the "feasibility” of the material for which synthesis failed (step S9), and the process returns to step S2. repeat.
  • the material manufacturing device 10 of the material searching and manufacturing system 1 transmits the result of synthesis processing to the control device 20 of the material searching and manufacturing system 1, and the control device 20, based on the result of the synthesis processing from the material manufacturing device 10, Update the feasibility information in the feasibility database 23 .
  • the predicted value of "feasibility" under the same synthesis conditions is By making it lower, in the selection of candidate materials from the next time onwards, the priority will be lowered under the same conditions as the synthesis failure, and the probability that materials other than the failed synthesis material will be selected will be increased. can be done.
  • step S6 the material searching and manufacturing system 1 measures the physical properties of the material.
  • step S7 When the physical property measurement fails (step S7: No), the material searching and manufacturing system 1 indicates that the synthesis was “successful” but the measurement was “failed” in the item indicating "feasibility” of the feasibility database 23.
  • the data are updated as shown, and the feasibility model 25 is further updated so that the "predicted value" of the "feasibility” for the successfully synthesized material is lower in the conditions where the measurement failed (step S9), return to step S2 and repeat the process.
  • the predicted value of "feasibility" under the same synthesis conditions for the material whose measurement failed is By making it lower, in the selection of candidate materials from the next time onwards, the priority will be lowered under the same conditions as the physical property measurement failure, and the probability of selecting a material other than the material whose synthesis failed will be increased. be able to.
  • step S7 the material searching and manufacturing system 1 determines whether the physical property value has reached the target value (step S8).
  • step S8 the material searching and manufacturing system 1 updates the "physical property" of the physical property database 22 with the measured physical property value, and in the physical property prediction model 24, synthesis Update is performed so that the measured physical property value is predicted to be lower than the target value under the same synthesis conditions for the material for which the synthesis was successful (step S10).
  • step S10 the item indicating "feasibility" of the feasibility database 23
  • data is updated to indicate that both synthesis and measurement were “successful”
  • the “predicted value” of the "feasibility” is updated so as to be higher under the condition that the synthesis is successful (step S9), and the process returns to step S2 to repeat the process.
  • the predicted value of "physical property" under the same synthesis conditions is By making it lower than the target value, in the selection of candidate materials from the next time onwards, the priority will be lowered under the same conditions as those that failed to achieve the target value, and materials other than the materials that failed to achieve the target value material is selected.
  • the material searching and manufacturing system 1 updates the "physical property" of the physical property database 22 with the measured physical property value, and the physical property prediction model 24 succeeds in synthesis. Update is performed so that the measured physical property values are predicted under the same synthesis conditions for the materials obtained (step S11).
  • the item indicating "feasibility" in the feasibility database 23 is updated to data indicating that both the synthesis and the measurement were “successful”, and further, in the feasibility model 25, the material that was successfully synthesized is "executed
  • the feasibility model is updated so that the "predicted value” of "possibility” is 1 or a value as close to 1 as possible (step S12), and the material search is terminated.
  • the predicted value of "feasibility” will be 1 in the prediction for materials that have been synthesized successfully in the next material search. Or, by checking with the "synthesized material list" before prediction, the priority will be lowered in the selection of candidate materials from the next time onwards, and materials that have already been successfully synthesized will not be selected.
  • the prediction results based on the physical property prediction model 24 are referred to as "priority”
  • the prediction results based on the feasibility model 25 are referred to as "feasibility”. ", but it should be understood that these are one of the embodiments.
  • the selection order determined based on the prediction results of these two models is collectively referred to as "priority" as a higher concept.
  • materials search In conventional materials search technology, materials search generally uses high-precision first-principles calculations, QM/MM calculations, molecular dynamics methods, coarse-grained molecular dynamics methods, multi-scale simulations, and other computationally expensive methods. was using In the material search based on such computational theory, the feasibility of material manufacturing (synthesis feasibility, measurability) was not considered, so materials that could not actually be synthesized or measured were selected as candidate materials. , failed to synthesize and evaluate using selected materials, and could not select suitable materials. In this way, the conventional techniques for searching for materials do not consider the feasibility (synthesis feasibility, measurability) in material manufacturing, so materials that cannot actually be synthesized or measured have been used as candidate materials. , search efficiency was poor.
  • the material search in the material searching and manufacturing system 1 since the search is performed taking into consideration the feasibility of synthesis, it is possible to synthesize materials based on the feasibility of synthesis.
  • the material search in the material search and manufacturing system 1 by updating the feasibility model 25 based on the synthesis and measurement processing, by considering the possibility of success, the prediction accuracy is increased, and the number of executions is small. New materials with excellent properties (physical properties) can be discovered.
  • the material to be synthesized in consideration of the feasibility of synthesis even when searching for materials in the set search space, conventionally, it is only necessary to have no experience in synthesizing. By allowing materials that have been excluded from options to be preferentially selected as synthesis candidates, it is possible to first give opportunities for synthesis processing to materials that would not have been explored in the past. It is possible to increase the possibility of searching for new materials.
  • the material searching and manufacturing system 1 is a material searching and manufacturing system that incorporates an automatic material manufacturing device, a physical property prediction model, and a feasibility (synthesis possibility, measurability) model. Therefore, the material search and manufacturing system 1 can realize highly efficient search and synthesis of materials, confirm the feasibility of synthesizing materials, and quickly obtain a design space for materials that can be synthesized and measured, thereby improving search efficiency. can be made
  • the synthesizer 11 internally has a mixing/reaction vessel, reagent/solvent stock, and product separation function, or is connected to an external device having these functions, and these components can exchange contents with each other.
  • the synthesizer 11 also mixes reagents and solvents, synthesizes candidate materials, and separates products based on commands from the controller 20 . Further, the synthesizer 11 determines whether or not these operations are successful using a detection unit (a detection circuit or a detection software program running on a processor; the same shall apply hereinafter), and reports the determination result to the control device 20 ( Send.
  • a detection unit a detection circuit or a detection software program running on a processor; the same shall apply hereinafter
  • the analysis device 12 receives the product synthesized by the synthesis device 11 and determines whether the product matches the candidate material. Thereby, the analysis device 12 generates an analysis result.
  • the analysis device 12 also has a detection unit that determines whether the analysis is successful (generates a success determination result), and transmits the analysis result and the success determination result to the control device 20 .
  • the measuring device 13 receives the material synthesized by the synthesizing device 11 and determined by the analyzing device 12 to match the candidate material, and measures the physical properties of the material. Thereby, the measuring device 13 generates a measurement result.
  • the measurement device 13 has a detection unit that determines whether the measurement of physical properties has succeeded (generates a success determination result), and transmits the measurement result and the success determination result to the control device 20 .
  • the material manufacturing device 10 manufactures materials.
  • the material manufacturing apparatus 10 manufactures materials under the control of the control device 20 .
  • the material manufacturing apparatus 10 receives an instruction to synthesize materials selected using the material property information and the feasibility information
  • the material manufacturing apparatus 10 manufactures materials according to the instruction to synthesize the materials.
  • the material manufacturing apparatus 10 performs material manufacturing by the synthesizing apparatus 11 for the material indicated by the synthesizing process instruction.
  • the material manufacturing apparatus 10 may be configured to cooperate with a plurality of different material manufacturing apparatuses 10 in data sharing and processing control through a communication network. It suffices if it has at least one function of analysis or measurement processing.
  • the material manufacturing apparatus 10 may internally have software having a physical property evaluation function for evaluating physical properties, or may be used by connecting to an external device having this function. In that case, the material manufacturing apparatus 10 executes material simulation according to an instruction from the control device 20 . The material manufacturing apparatus 10 determines whether the material synthesis has succeeded (generates a success determination result) and transmits the success determination result and the material synthesis result to the control device 20 .
  • the material manufacturing apparatus 10 may be configured by hardware or may be configured by software. Moreover, there may be a plurality of material manufacturing apparatuses 10, and they may be connected via a predetermined network such as the Internet, but this point will be described later.
  • the physical property prediction model 24 is a regression model that is estimated from data in the physical property database 22 and predicts physical property values from materials.
  • a regression model may return only the predicted values for the material, or it may return the predicted values and the variance of the predicted values.
  • the feasibility model 25 is represented by the following formula (1).
  • F SYNTH is the Synthesizability Model (range 0-1)
  • F MEAS is the Measurability Model (range 0) -1).
  • the synthesizing possibility model F SYNTH is a model for predicting whether or not synthesis will succeed, and is represented by the following equation (2).
  • F PATH is the Synthetic Path Model
  • F Step is the Synthetic Step Model
  • NS is the number of synthetic steps.
  • the synthetic pathway model F PATH is a model indicating whether or not a synthetic pathway exists, and is represented by the following formula (3).
  • the synthetic route model F PATH has a value of 0 or 1.
  • the synthetic route model F PATH is 1 if there is a synthetic route, and 0 otherwise.
  • the number of synthesis steps N S satisfies the following equation (4).
  • N MAX indicates the maximum number of synthesis steps.
  • the step synthesis possibility model F Step is a model for predicting whether or not one step synthesis process will succeed, and is represented by the following equation (5).
  • the following term (6) is the step synthesis yield model (value range 0-1).
  • the following term (7) is a product identification model (value range 0-1).
  • the controller 20 predicts the yield of each synthesis step, predicts whether it can be determined that the product matches the target material, and predicts whether the product can be fractionated.
  • the evaluability model F MEAS is a model that predicts whether a measurement will be successful.
  • FIG. 3 corresponds to the flow of processing by the feasibility model 25 described above.
  • FIG. 3 is a flow chart illustrating the process for feasibility.
  • the feasibility model 25 derives each value in each process corresponding to steps S21 to S24 in FIG. 3, and generates an output value (score) indicating feasibility based on the value.
  • the feasibility model 25 derives a value according to the synthetic route model F PATH (step S21).
  • the feasibility model 25 derives a value according to the step synthesis feasibility model F Step according to the number of steps (steps S22 and S23).
  • the feasibility model 25 derives values according to the step synthesizing feasibility model F Step corresponding to each of the first to Ns-th synthesizing steps. . Also, the feasibility model 25 derives a value based on the evaluability model F MEAS (step S24). Then, the feasibility model 25 derives the value of the feasibility model F FS using the values of the synthesis path model F PATH , the step synthesis feasibility model F Step , the evaluability model F MEAS and the like.
  • the model group included in the feasibility model 25 may be a model estimated from values obtained in the material manufacturing process or simulation results, or may be represented by a constant or a simplified empirical formula. may be used.
  • the search agent 26 determines the priority of candidate materials based on the predicted value obtained from the physical property prediction model 24 and/or the value obtained from the feasibility model 25, and according to this priority, the candidate to be synthesized and measured next. Select materials and perform synthesis and measurement of selected candidate materials. Synthesis and measurement are performed by issuing commands from the search agent 26 to the material manufacturing apparatus 10 through the control interface 21 .
  • the control device 20 receives "whether it could be executed" (feasibility data) and "measured values” (physical property data) reported from the material manufacturing apparatus 10 through the control interface 21, and stores the feasibility database 23 and the feasibility model, respectively. 25, updating the physical property database 22 and the physical property prediction model 24;
  • the search agent 26 may reside on the same computing device as the control interface 21 or on a separate computing device.
  • the control device 20 selects materials using the material property information stored in the property database 22 and the feasibility information stored in the feasibility database 23. For example, the control device 20 instructs the material manufacturing device 10 to synthesize the selected materials. For example, the control device 20 updates the feasibility information stored in the feasibility database 23 based on the synthesizing processing result from the material manufacturing device 10 .
  • FIG. 4 is a diagram showing an example of a physical property database according to an embodiment of the present disclosure
  • a database DB1 shown in FIG. 4 corresponds to the physical property database 22 .
  • the database DB1 stores data (learning data) used for learning the physical property prediction model 24 .
  • the database DB1 includes items such as "ID”, "molecule ID”, “descriptor”, "physical property value", and "material attribute”.
  • a database DB1 which is a physical property database, contains two or more materials to be synthesized.
  • ID indicates identification information for identifying data.
  • Molecule ID indicates identification information for identifying a molecule.
  • Descriptor indicates a descriptor. The example in FIG. 4 shows a case where "LabuteASA”, “Chi0v”, “Chi0n”, “Chi0”, “Kappa1”, etc. are used as descriptors, but FIG. Any one can be used.
  • the “descriptor” item stores data (values) that quantify the chemical characteristics of the corresponding molecule.
  • Physical property value indicates the physical property value of the molecule.
  • the example in FIG. 4 shows a case where "Heat Capacity” is used as a physical property value, but FIG. 4 is only an example, and any “physical property value” can be adopted.
  • Physical properties include mechanical properties, thermal properties, electrical properties, magnetic properties, optical properties, electrochemical properties, efficacy, toxicity, antibody response, interaction with cells, and interaction with internal organs. , intracellular transportability, in vivo transportability, adsorptivity, and solubility.
  • the item “physical property value” stores data (values) relating to properties possessed by the molecule.
  • the value of the "physical property value” item is updated to the measured physical property value when the measurement of the molecule is successful. For example, the control device 20 updates the value of "physical property” based on the measurement result.
  • “Material attribute” indicates the attribute of a molecule (material) as a material.
  • “#1” storing one material attribute is shown for explanation, but "#2", “#3", etc. are provided as many as the number of material attributes.
  • “Material attributes” are small molecules, dyes, macromolecules, fluorescent/identifying isotope labels, self-organizing materials/structures, biomaterials (sugars, peptides, polypeptides, amino acids, proteins, fatty compounds, DNA (Deoxyribonucleic Acid ), etc.), organic thin films (evaporation, coating processes), inorganic materials (solid-phase method, coprecipitation method, melt quenching method, sol-gel method, etc.), nanoparticles, metal complexes, inorganic thin films (ALD (atomic layer deposition), sputtering etc.), synthetic materials based on synthetic biological techniques (genetic recombination and material synthesis using bacteria), functional materials with crystal structures, nanostructures, and microstructures.
  • the item "material attribute” stores information indicating the material attribute of the molecule (material).
  • the information (material physical property information) stored in the database DB1, which is an example of the physical property database 22, is structured to include at least two items, one of which is the material is an attribute item of
  • the database DB1 is not limited to the above, and may store various types of information depending on the purpose.
  • the database DB1 stores information indicating molecules (materials) that have been successfully synthesized in the past.
  • the database DB1 may store a flag (value) indicating a molecule (material) that has been successfully synthesized in the past in association with the molecule ID.
  • Database DB1 may exclude molecules that have been successfully synthesized in the past.
  • FIG. 5 is a diagram illustrating an example of the viability database 23 according to an embodiment of the present disclosure.
  • a database DB2 shown in FIG. 5 corresponds to the feasibility database 23 .
  • the database DB2 stores data (learning data) used for learning the feasibility model 25 .
  • the database DB2 includes items such as "ID”, "molecule ID”, "descriptor”, and "executability”.
  • ID indicates identification information for identifying data.
  • Molecule ID indicates identification information for identifying a molecule.
  • Descriptor indicates a descriptor. The example in FIG. 5 shows a case where "TPSA”, “qed”, “SlogP_VSA2”, “SlogP_VSA5", etc. are used as descriptors, but FIG. Adoptable.
  • the “descriptor” item stores data (values) that quantify the chemical characteristics of the corresponding molecule.
  • “Performance” indicates the viability of the molecule.
  • FIG. 5 shows a case where "synthesis pass/fail” is used as an item related to feasibility, FIG. 5 is only an example, and any “feasibility” can be adopted. “Feasibility” may be various elements related to feasibility such as measurability.
  • the “executability” item stores data (value) indicating whether or not the element is executable.
  • the database DB2 may store various types of information, not limited to the above, depending on the purpose.
  • the database DB2 stores information indicating molecules (materials) that have been successfully synthesized in the past.
  • the database DB2 may store flags (values) indicating molecules (materials) that have been successfully synthesized in the past in association with their molecule IDs.
  • the database DB2 may exclude molecules (materials) that have been successfully synthesized in the past. Examples of the feasibility database 23 other than the database DB2 will be described later.
  • the data of the data records contained in the physical property database 22 and the feasibility database 23 may retain reference links so that they can be accessed mutually.
  • agent software via relational database management software, may perform merge, filter operations, etc. between these two databases to provide integrated access to the data of any data record.
  • what is written as a database in the present disclosure is assumed to include a plurality of data tables of the same type, and if there is a description suggesting a data table in the specification, it is managed in the database.
  • the inclusion of the term table in a description of a database is intended to imply a broader concept of the database.
  • FIG. 6 is a diagram illustrating an example of a material table according to an embodiment of the present disclosure.
  • the control device 20 has a table DB3 shown in FIG.
  • the table DB3 stores data (learning data) used for learning the feasibility model 25 .
  • the table DB3 includes items such as "ID”, "molecule ID”, and "SMILES".
  • ID indicates identification information for identifying data.
  • Molecule ID indicates identification information for identifying a molecule.
  • SMSILES indicates a representation of a molecule in SMILES notation. The “SMILES” item stores information in which the chemical structure of a molecule is converted into character strings using alphanumeric characters in ASCII code.
  • material ID indicates identification information for identifying the material.
  • Composition ratio is a column of numerical values indicating element species constituting the material and their content ratios.
  • table DB3 may store various types of information, not limited to the above, depending on the purpose.
  • FIG. 7 is a diagram showing an example of physical property prediction according to an embodiment of the present disclosure.
  • the control device 20 derives a value corresponding to each descriptor using a character string in which the molecule identified by the molecule ID is expressed in SMILES notation. Then, the controller 20 inputs the values corresponding to the descriptors to the physical property prediction model 24, thereby causing the physical property prediction model 24 to output the predicted value of the physical property.
  • the physical property prediction model 24 inputs the values corresponding to the descriptors "LabuteASA”, “Chi0v”, “Chi0n”, “Chi0", and “Kappa1", and the average predicted for the physical property "Heat Capacity” and variance are output as the predicted value of the physical property "Heat Capacity".
  • the control device 20 outputs a predicted value of physical properties (hereinafter also referred to as a “first predicted value”) from the physical property prediction model 24 by inputting a material feature amount related to a molecule (material) to the physical property prediction model 24.
  • the physical property prediction model 24 outputs a first prediction value in response to input of material feature amounts of two or more materials constituting the material.
  • the material feature value here is, for example, a numerical sequence uniquely determined from the molecular structure, such as the molecular fingerprint (ECFP4) determined from the bonding relationship between atoms in the molecule, the Coulomb matrix, the number of atomic species contained, etc. molecular descriptors calculated from structural and structural features, molecular feature vectors extracted by a graph convolutional neural network (GCN), and the like.
  • GCN graph convolutional neural network
  • the physical property prediction model 24 may receive various information as input and output various information.
  • the physical property prediction model 24 may output standard deviation instead of variance.
  • the physical property prediction model 24 may receive a value corresponding to each descriptor as an input and output one value related to the physical property and a value indicating the degree of certainty of the value.
  • the control device 20 may average one value related to the physical property and calculate the variance based on the confidence factor. For example, the control device 20 may calculate a smaller standard deviation as the degree of certainty is higher.
  • a plurality of physical property prediction models 24 may be generated by learning for each physical property.
  • the physical property prediction model 24 may be a model trained to output multiple physical properties.
  • the controller 20 uses the data stored in the physical property database 22 as learning data to train and update the physical property prediction model 24 using a learning algorithm.
  • the learning of the physical property prediction model 24 by the control device 20 is so-called supervised learning, and a detailed description thereof will be omitted.
  • a physical property prediction model 24 may be learned.
  • FIG. 8 is a diagram illustrating an example of a feasibility assessment according to an embodiment of the disclosure.
  • the control device 20 derives a value corresponding to each descriptor using a character string in which the molecule identified by the molecule ID is expressed in SMILES notation. Then, the control device 20 inputs a value corresponding to each descriptor to the feasibility model 25 to obtain a predicted value of physical properties (hereinafter also referred to as a “second predicted value”) from the feasibility model 25. output.
  • the feasibility model 25 outputs a second predicted value in response to input of material feature quantities of each of two or more materials that make up the material.
  • the feasibility model 25 receives values corresponding to descriptors "TPSA”, “qed”, “SlogP_VSA2”, and “SlogP_VSA5" as inputs and outputs values indicating feasibility.
  • the feasibility model 25 receives a value corresponding to each descriptor as an input and outputs a value between 0 and 1 indicating feasibility.
  • the feasibility model 25 outputs a value that is closer to 1, indicating higher feasibility.
  • the control device 20 inputs a material feature quantity related to a molecule (material) to the feasibility model 25 to output a value indicating feasibility from the feasibility model 25 .
  • the control device 20 uses the data stored in the feasibility database 23 as learning data to train and update the feasibility model 25 with a learning algorithm.
  • the learning of the feasibility model 25 by the control device 20 is so-called supervised learning, and a detailed description thereof will be omitted.
  • the feasibility model 25 may be learned by a training process with a learning algorithm.
  • FIG. 9 is a diagram showing an example of searching using a physical property prediction model. The processing shown in FIG. 9 corresponds to the processing flow of the flowchart shown in FIG.
  • Each of the six tables corresponds to the state at the start of processing in each of the first to sixth times.
  • Six search tables #1 in FIG. 9 show updates of the search tables #1 after the first to sixth processes (the processes in FIG. 2).
  • the table arranged in the upper left row in FIG. 9 corresponds to the first search table #1.
  • the table arranged in the upper center row in FIG. 9 corresponds to the search table #1 for the second time, that is, the search table #1 after the first process.
  • Search table #1 has items such as "molecule ID”, "priority", and "synthesis success".
  • "Molecule ID” indicates identification information for identifying a molecule.
  • "priority” is a value indicating the priority.
  • “priority” is a value (score) output by the physical property prediction model 24 in response to input of corresponding molecular information.
  • “priority” is the first predicted value of the material based on material property information. The first predicted value is output from the physical property prediction model 24 in response to an input based on material feature amounts of each of two or more materials forming the material registered in the physical property database 22, for example.
  • priority is assigned in descending order of the value of "priority” starting from the first place.
  • the numerical value (such as “1") placed at the end of “priority” indicates the number of updates.
  • “priority” without a numerical value at the end indicates “priority” before update, that is, at the start of processing.
  • “priority 1” indicates the “priority” at the time of updating after the first processing. In this way, the number after “priority” is for convenience to indicate the number of updates, and "priority" and items with numbers at the end of “priority” are the same item “priority”.
  • Synthesis success indicates whether the synthesis is successful. Note that FIG. 9 shows a state in which a value is stored in "synthesis success” to indicate where the synthesis is successful, but the "synthesis success” value of the molecule before synthesis processing may be unknown. Note that the search table #1 may include an item such as "measurement” that indicates the success or failure of the measurement process.
  • the material searching and manufacturing system 1 performs the synthesis process on the molecule identified by the molecule ID "m100275", which has the highest priority.
  • the synthesis of the molecule identified by the molecule ID "m100275” fails, and the material searching and manufacturing system 1 does not update the data.
  • “success (DB update)” or “failure (DB unchanged)” is described together with white arrows between each search.
  • DB means the physical property database 22 . 9 to 15, “success” means success of synthesis and success of measurement (“YES” in S7 of FIG. 2), and “failure” means success of synthesis (“NO” in S5 of FIG.
  • the material searching and manufacturing system 1 performs the synthesis process, etc. on the molecule identified by the molecule ID "m059059", which has the fourth priority.
  • FIG. 9 it is assumed that the molecule identified by the molecule ID "m059059” was synthesized and measured successfully in the fourth processing.
  • the material searching and manufacturing system 1 updates the data relating to the physical property values of the molecule ID “m059059” with the fourth priority in the physical property database 22 .
  • the material searching and manufacturing system 1 further re-learns (updates) the physical property prediction model 24 using the updated physical property database 22 . Then, the material searching and manufacturing system 1 updates the value of “priority” using the updated physical property prediction model 24 .
  • “priority 1" after the table (search table #1 in the fifth search) arranged in the lower center row in FIG. 9 corresponds to the priority value derived using the physical property prediction model 24 after updating.
  • the material searching and manufacturing system 1 performs the fifth and sixth processes in order from the first in order of priority based on the value of "priority1". For example, the material searching and manufacturing system 1 repeats the above-described processing until a molecule that satisfies desired physical property values is synthesized.
  • FIG. 10 corresponds to the processing flow of the flowchart shown in FIG. 10 that are the same as those in FIG. 9 will be omitted as appropriate.
  • search table #2 Each of the six tables (hereinafter also referred to as "search table #2") in FIG. ) at the start of processing in each of the first to sixth times.
  • the six search tables #2 in FIG. 10 show updates of the search tables #2 after the first to sixth processes (the processes in FIG. 2).
  • the table arranged in the upper left row in FIG. 10 corresponds to the first search table #2.
  • the table arranged in the upper center row in FIG. 10 corresponds to the search table #2 for the second time, that is, the search table #2 after the first process.
  • Search table #2 in FIG. 10 shows an example of the synthetic material selection data structure used in the material selection process.
  • Search table #2 has items such as "molecule ID”, “priority”, “feasibility”, and “success”.
  • "Molecule ID” and “priority” are the same as in FIG.
  • "feasibility” is a value indicating feasibility.
  • "feasibility” is a value (score) output by the feasibility model 25 in response to the input of corresponding molecular information.
  • "feasibility” is the second predicted value of the material based on feasibility information. The second predicted value is output from the feasibility model 25 in response to an input based on material feature amounts of each of two or more materials forming the material registered in the feasibility database 23, for example.
  • the material searching and manufacturing system 1 treats molecules whose “feasibility” value is equal to or greater than a predetermined threshold value (for example, 0.5).
  • the number (such as "1") placed at the end of "feasibility” indicates the number of updates. For example, “feasibility” without a numerical value at the end indicates “feasibility” before update, that is, at the start of processing. Also, “feasibility 1" indicates “feasibility” at the time of one update. Thus, the number after “feasibility” is for convenience to indicate the number of updates, and "feasibility" and “feasibility” with a number at the end are the same item “feasibility”.
  • “Success” as an item in the search table indicates whether synthesis and measurement are successful.
  • FIG. 10 shows a state in which a value is stored in "success” to indicate where the process succeeds, but the value of "success” in the numerator before processing may be unknown.
  • “success” or “failure” is indicated with a hollow arrow between each search.
  • “success” means success in synthesis and success in measurement (“YES” in S7 of FIG. 2)
  • “Failure” means failure of synthesis (“NO” in S5 of FIG. 2) or failure of measurement (“NO” in S7 of FIG. 2).
  • the data is updated (physical property DB: update) regardless of whether the target value is achieved (S8 in FIG. 2).
  • the data is not updated and is unchanged (physical property DB: unchanged).
  • the execution database 23 is updated regardless of "success” or "failure” (executability DB: update).
  • the molecules with the first to third priorities are the values output by the feasibility model 25, and the value of "feasibility” meaning feasibility is less than the threshold (0.5). Therefore, these molecules are not processed, and subsequent processing is skipped. In this way, the material searching and manufacturing system 1 uses the "feasibility" information regarding feasibility, so that unnecessary molecules are not subjected to processing, so that the processing efficiency can be improved.
  • the material searching and manufacturing system 1 performs the synthesis process on the molecule identified by the molecule ID "m059059", which has the fourth priority and the value of "feasibility” is equal to or greater than the threshold value (0.5). etc.
  • the material searching and manufacturing system 1 updates the data regarding the physical property values of the molecule ID "m059059” in the physical property database 22, and adds data regarding the feasibility of the molecule ID "m059059” in the feasibility model 25. (or update).
  • the material searching and manufacturing system 1 further re-learns (updates) the physical property prediction model 24 using the updated physical property database 22 . Then, the material searching and manufacturing system 1 updates the value of “priority” using the updated physical property prediction model 24 .
  • “priority 1" after the table (search table #2 in the second search) arranged in the upper center row in FIG. 10 corresponds to the priority value derived using the physical property prediction model 24 after updating.
  • the material searching and manufacturing system 1 re-learns (updates) the feasibility model 25 using the feasibility database 23 after updating. Then, the material searching and manufacturing system 1 updates the value of “feasibility” using the updated feasibility model 25 . "feasibility 1" after the table (search table #2 in the second search) arranged in the upper center row in FIG.
  • the material searching and manufacturing system 1 uses the molecule ID "m100686" which has the highest priority in the updated search table #2 and whose "feasibility" value is equal to or greater than the threshold value (0.5). Synthesis processing and the like are performed on the identified molecules.
  • FIG. 10 it is assumed that the synthesis of the molecule identified by the molecule ID "m100686” has failed ("NO" in S7 of FIG. 2). In this case, the material searching and manufacturing system 1 adds (or updates) data on feasibility of the molecule ID “m100686” to the feasibility database 23 .
  • the material searching and manufacturing system 1 adds (or updates) the information on the feasibility of the molecule identified by the molecule ID "m100686" to the feasibility database 23 as the information on the molecule whose synthesis failed.
  • the database 23 is updated again, and the feasibility model 25 is re-learned (updated) using the updated feasibility database 23 .
  • the material searching and manufacturing system 1 updates the value of “feasibility” using the updated feasibility model 25 .
  • "feasibility 2" after the table (search table #2 for the third time) arranged in the upper right row in FIG. 10 corresponds to the value of feasibility derived using the feasibility model 25 after the second update. .
  • the material searching and manufacturing system 1 performs processing based on the values of "priority1" and "feasibility2" in the third processing.
  • the material searching and manufacturing system 1 updates the values of "priority” and "feasibility”, and uses the updated values to perform the fourth to sixth processes. is detailed.
  • the material searching and manufacturing system 1 repeats the above-described processing until a molecule that satisfies desired physical property values is synthesized.
  • the material searching and manufacturing system 1 designates materials in the form of a list containing at least one item, and selects materials in order of priority.
  • the data structure of the search table #2 shown in FIG. 10 indicates an ID for identifying a material, priority information indicating a priority based on the predicted physical property value of the material, and feasibility of synthesizing the material. It includes feasibility information and composition success/failure information indicating success or failure of composition processing.
  • the processing unit 202 of the control device 20 searches for a group of materials whose synthesis success/failure information indicates that they have not been processed, in descending order of priority based on the priority information. Perform a process to select materials that meet the criteria.
  • FIG. 11 and 12 are diagrams showing detailed examples of processing using the physical property prediction model 24.
  • FIG. 11 shows the details of the first to third processes in FIG. 9, and
  • FIG. 12 shows the details of the fourth to sixth processes in FIG. Note that detailed description of the same points as in FIG. 9 will be omitted.
  • uccess means success of synthesis and success of measurement (“YES” in S7 of FIG. 2)
  • “failure” means failure of synthesis (see FIG. 2 (“NO” in S5 of FIG. 2) or measurement failure (“NO” in S7 of FIG. 2).
  • the six tables shown in FIGS. 11 and 12 correspond to the search table #1 in FIG. It is different from the search table #1 in that it has items of "pass/fail” and "pass/fail of measurement”.
  • the items “synthesis pass/fail” and “measurement pass/fail” in the candidate material table #1 store results of actual processing. Therefore, in the search table #1, the items “synthesis pass/fail” and “measurement pass/fail” are "n/a” (value undecided) for molecules that have not been processed.
  • the material searching and manufacturing system 1 updates the items of "synthesis pass/fail” and “measurement pass/fail” of the candidate material table #1 according to the processing results for the processing target and lower molecules.
  • the material searching and manufacturing system 1 uses the initial data #0 (data of the physical property database 22 before updating) to train the initial model #0 (physical property prediction model 24) by a learning algorithm.
  • the material searching and manufacturing system 1 uses the initial model #0 to evaluate (derive) the priority of each molecule, and performs processing using the priority value.
  • various parameters can be used in the evaluation (derivation) of priority. value is undecided) can be prioritized. By doing so, it is possible to increase the possibility of searching for new materials in consideration of feasibility.
  • the material search and manufacturing system 1 performs processes such as synthesis on the molecule identified by the molecule ID "m100275" with the highest priority. Since the material searching and manufacturing system 1 failed to synthesize the molecule identified by the molecule ID "m100275", it changes the success/failure of synthesis of the molecule identified by the molecule ID "m100275" to "0". In addition, since the material searching and manufacturing system 1 failed to synthesize the molecules with the 2nd and 3rd priorities even in the second and third processes, it changes the success/failure of synthesizing the molecules with the 2nd and 3rd priorities to "0". .
  • the material searching and manufacturing system 1 performs the synthesis process on the molecule identified by the molecule ID "m059059" with the fourth priority. It is assumed that the material searching and manufacturing system 1 has successfully synthesized and measured the molecule identified by the molecule ID "m059059". In this case, the material searching and manufacturing system 1 changes the synthesis pass/fail and measurement pass/fail of the molecule identified by the molecule ID "m059059" to "1" in the candidate material table.
  • the material searching and manufacturing system 1 updates the physical property value information of the molecule identified by the molecule ID "m059059" in the physical property database 22. Further, the material searching and manufacturing system 1 re-learns (updates) the model #0 (physical property prediction model 24) using the data #1 (data of the physical property database 22 after updating). Then, the material searching and manufacturing system 1 updates the value of priority using the updated physical property prediction model 24 .
  • the material searching and manufacturing system 1 performs the fifth and sixth processes in order from the first in order of priority based on the value of "priority1". For example, the material searching and manufacturing system 1 repeats the above-described processing until a molecule that satisfies desired physical property values is synthesized.
  • FIG. 13 to 15 are diagrams showing detailed examples of processing using the physical property prediction model 24 and the feasibility model 25.
  • FIGS. 13 to 15 show an example of a manufacturing method for manufacturing the physical property prediction model 24 and the feasibility model 25, which are machine learning models, based on the synthetic processing results.
  • FIG. 13 shows details of the first and second processes in FIG. 10
  • FIG. 14 shows details of the third and fourth processes in FIG. 10
  • FIG. 15 shows the fifth process in FIG. Show the details of ⁇ 6 times. 10 to 12 will not be described in detail.
  • uccess means success of synthesis and success of measurement (“YES” in S7 of FIG. 2)
  • failure means failure of synthesis (see FIG. 2 (“NO” in S5 of FIG. 2) or measurement failure (“NO” in S7 of FIG. 2).
  • the six tables shown in FIGS. 13 to 15 correspond to the search table #2 in FIG. ” and “Measurement pass/fail” items.
  • the items “synthesis pass/fail” and “measurement pass/fail” in the candidate material table #2 store the results of the actual processing.
  • the material searching and manufacturing system 1 uses the initial data (data of the physical property database 22 before updating) to train and update the physical property prediction model #0 (physical property prediction model 24) with a learning algorithm.
  • the material searching and manufacturing system 1 evaluates (derives) the priority of each molecule using the updated physical property prediction model #0, and performs processing using the priority value.
  • the material searching and manufacturing system 1 trains a feasibility model #0 (feasibility model 25) by a learning algorithm using initial data (data of the feasibility database 23 before updating). and update.
  • the material searching and manufacturing system 1 evaluates (derives) the feasibility of each molecule using the updated feasibility model #0, and performs processing using the feasibility value.
  • various parameters can be used in the evaluation (derivation) of feasibility, but priority is given to those with "n/a” (value undecided) for both "synthesis pass/fail” and “measurement pass/fail” items. You can also make it By doing so, it is possible to increase the possibility of searching for new materials in consideration of feasibility.
  • n/a value undecided
  • Material Exploration and Manufacturing System 1 does not process molecules with 1st to 3rd priority because the "feasibility" value is less than the threshold (0.5), and skips the process. Then, the material searching and manufacturing system 1 synthesizes, etc., the molecule identified by the molecule ID "m059059” whose priority is the fourth in the first process and whose "feasibility” value is equal to or greater than the threshold value (0.5). process. In FIG. 10, it is assumed that the molecule identified by the molecule ID "m059059” has been successfully synthesized and measured. In this case, the material searching and manufacturing system 1 changes the pass/fail of synthesis and pass/fail of measurement of the molecule identified by the molecule ID "m059059” to "1".
  • the material searching and manufacturing system 1 updates the physical property value information of the molecule identified by the molecule ID "m059059" in the physical property database 22. Further, the material searching and manufacturing system 1 relearns (updates) the physical property prediction model #1 (the physical property prediction model 24) using the updated data of the physical property database 22. FIG. Then, the material searching and manufacturing system 1 updates the value of priority using the updated physical property prediction model 24 .
  • the material searching and manufacturing system 1 adds (or updates) the information on the molecule identified by the molecule ID "m059059" to the feasibility database 23 as the information on the successfully synthesized molecule, thereby making the feasibility database 23 Update.
  • the material searching and manufacturing system 1 uses the updated feasibility database 23 to re-learn (update) the feasibility model #1 (feasibility model 25). Then, the material searching and manufacturing system 1 updates the value of "feasibility" using the updated feasibility model #1.
  • the material searching and manufacturing system 1 uses the molecule ID "m100686" which has the highest priority in the updated search table #2 and whose "feasibility" value is equal to or greater than the threshold value (0.5). Synthesis processing is performed on the identified molecule. In FIG. 10, it is assumed that the molecule identified by the molecule ID "m100686” has failed in synthesis. Therefore, the material searching and manufacturing system 1 changes the synthesis success/failure of the molecule identified by the molecule ID "m100686" to "0".
  • the material searching and manufacturing system 1 updates the data. For example, the material searching and manufacturing system 1 adds (or updates) the information of the molecule identified by the molecule ID "m100686" to the feasibility database 23 as the information of the molecule whose synthesis failed, thereby making the feasibility database 23 Update again. As shown in FIG. 14, the material searching and manufacturing system 1 uses the updated feasibility database 23 to re-learn (update) the feasibility model #2 (feasibility model 25). Then, the material searching and manufacturing system 1 updates the value of "feasibility" using the updated feasibility model #2.
  • the material searching and manufacturing system 1 performs processing based on the values of "priority1" and "feasibility2" in the third processing. As shown in FIGS. 14 and 15, the material searching and manufacturing system 1 updates the values of "priority” and "feasibility", and uses the updated values to perform the fourth to sixth processes. Since the process is the same as the process described above, detailed description will be given in detail, but the material searching and manufacturing system 1 repeats the process described above until a molecule that satisfies desired physical property values is synthesized. Specifically, in the sixth process, a molecule that satisfies desired physical property values is synthesized, and an example in which the target values are achieved in S8 of FIG. 2 is shown.
  • the material searching and manufacturing system 1 changes the synthesis success/failure and measurement success/failure of the molecule identified by the molecule ID “m084127” to “1”, and furthermore, in the physical property database 22, the physical property value information of the molecule ID “m084127” is changed to Along with the update, the data of the molecule ID "m084127” is added to the feasibility database 23, and the pass/fail of synthesis and pass/fail of measurement are changed to "1". In this case, the process ends assuming that the destination has been reached.
  • a feasibility model 25 which is a machine learning model, is manufactured. In the manufacturing method shown in FIGS.
  • the control device 20 of the material searching and manufacturing system 1 selects materials according to the feasibility information output by the feasibility model 25.
  • FIG. the control device 20 instructs the material manufacturing apparatus 10 to synthesize the selected materials, and based on the result of the synthesizing process from the material manufacturing apparatus 10, the feasibility database 23 (feasibility database) update the information in Then, the control device 20 updates the feasibility model 25 based on the feasibility information of the feasibility database 23 that has been updated.
  • the manufacturing method shown in FIGS. 13-15 produces the updated feasibility model 25 .
  • FIG. FIG.30 and FIG.31 is a figure which shows an example of the material manufacture result regarding a search.
  • a material search utilizing the feasibility model 25 is performed.
  • a material search was performed with the goal of optimizing physical property values, with 133,886 molecules included in the QM9 data set, which is a data set of organic molecular structural physical properties, set as the range of the material search space.
  • the material manufacturing device 10 is realized by software (software material manufacturing device).
  • the material manufacturing device 10 receives one molecular structure in the QM9 data set as an input from the control device 20, and outputs only when synthesis/measurement succeeds/failure (True, False) as output #1.
  • the physical property values which are the measurement results, are returned to the controller 20 .
  • the success or failure of the synthesis/measurement was determined by setting a threshold value for LogP (calculated value), which is a function that indicates the dissolution behavior with respect to the solvent. This corresponds to reproducing the material production fact that synthesis and measurement succeed/fail depending on the dissolution behavior with respect to the solvent, by simple calculation values.
  • the physical property values as the measurement results, the physical property values calculated by first-principles calculation of a single molecule included in the QM9 data set were used.
  • the control device 20 was also implemented as software (see 2 in Table 1).
  • the search algorithm used by the search agent 26 includes two types of comparative examples (random search, search by the physical property prediction model 24) and an algorithm corresponding to the synthetic material selection method of the present disclosure (the physical property prediction model 24 and the executable Search by sex model 25) and each were implemented, and the performance was compared.
  • Comparative Example #1 corresponds to random search
  • comparative example #2 corresponds to search by physical property prediction model 24 .
  • Procedure #1-1 Randomly select one molecule from unevaluated molecules contained in the material space, and synthesize and measure it. Mark the molecule as evaluated.
  • Procedure #1-2 Synthesis/measurement (a): If synthesis/measurement fails: Repeat from procedure 1. (b): When the synthesis/measurement is successful: Store the molecular structure and measurement results (physical property values) in the physical property database 22 .
  • Procedure #1-3 Completed when the maximum (minimum) measured value in the physical property database 22 reaches the target value. If not, repeat from step #1-1.
  • Comparative example #2 search by physical property prediction model
  • an algorithm called Bayesian optimization using Gaussian Process regression capable of calculating the prediction mean value ( ⁇ ) and prediction variance ( ⁇ ) was implemented as a machine learning model.
  • Molecular descriptors eg, RdKit descriptors
  • the search procedure is as shown in procedure #2 below.
  • Step #2-1 Construct a physical property prediction model 24 (initial model) that gives equal outputs for all inputs.
  • Step #2-3 Prioritize the unevaluated molecules contained in the material space based on the acquisition function Fa.
  • Step #2-4 Synthesize and measure the molecule with the highest priority. Mark this molecule as evaluated.
  • Procedure #2-5 Synthesis/measurement (a): If synthesis/measurement fails: Repeat from procedure #2-4. (b): When the synthesis/measurement is successful: Store the molecular structure and measurement results (physical property values) in the physical property database 22 and update the physical property prediction model 24 .
  • Procedure #2-6 Completed when the maximum (minimum) value of the measured values in the physical property database 22 reaches the target value. If not, repeat from step #2-2.
  • Example #1 and Example #2 corresponding to the synthetic material selection method of the present disclosure will be described. Note that points similar to those described above will be described as appropriate.
  • Example #1 and Example #2 Search by physical property prediction model and feasibility model
  • Gaussian Process regression was used as the machine learning model for the property prediction model 24 and Gaussian Process classification was used as the machine learning model for the feasibility model 25 .
  • Molecular descriptors eg, RdKit descriptors
  • the search procedure is as shown in procedure #3 below.
  • the initial model of feasibility model 25 is model built using evaluated data (successfully synthesized data).
  • Procedure #3-1 A feasibility model 25 (initial model) is constructed using initial data (number of data: 100 or 10).
  • Step #3-2 Construct a physical property prediction model 24 (initial model) that gives equal outputs for all inputs.
  • Step #3-4 Prioritize the unevaluated molecules contained in the material space based on the acquisition function Fa.
  • Procedure #3-5 The feasibility model 25 evaluates the feasibility (prediction of success or failure of synthesis/measurement) of the unevaluated molecules contained in the material space.
  • Step #3-6 Synthesize and measure molecules that have high feasibility (probability of 0.5 or more, etc.) and have the highest priority. Mark this molecule as evaluated.
  • Procedure #3-7 Synthesis/measurement (a): If synthesis/measurement fails: Update feasibility database 23 and feasibility model 25, and repeat from procedure #3-5. (b): When the synthesis/measurement is successful: update the feasibility database 23 and the feasibility model 25, and update the physical property database 22 and the physical property prediction model 24 from the molecular structure and measurement results (physical property values).
  • Procedure #3-8 Completed when the maximum value (minimum value) of the measured values held in the physical property database 22 reaches the target value. If not, repeat from step #3-2.
  • the evaluation index (see 6 in Table 1) is the number of material manufacturing trials to reach the target value, 1,000 for Comparative Example #1, Comparative Example #2 and Example #1 and Example For #2, 100 trials were performed and average values were compared (see Table 1 for detailed settings).
  • Example #1 and Example #2 the initial data used to construct the initial model of the feasibility model 25 was given (number of data: 100 or 10). This corresponds to a case in which, as prior knowledge of the material manufacturing apparatus 10, the result of whether or not the synthesis/measurement is successful for 100 or 10 molecular structures included in the initial data is known.
  • the initial model of the feasibility model 25 is constructed using teacher data for 100 molecular structures.
  • the initial model of the feasibility model 25 is constructed using teacher data for 10 molecular structures.
  • FIGS. 30 and 31 show the evaluation results of molecular structure searches aimed at optimizing (maximizing) Heat Capacity.
  • the target value (45.0 kcal/mol or more) is the condition for comparison in the achievement of the target value in step S8 of FIG.
  • the search by the physical property prediction model 24 (comparison For example #2)
  • efficiency can be improved by a maximum of 13 times or more (1/13 of the time and cost). Therefore, in the synthetic material selection method and material manufacturing method of the present disclosure, material synthesis can be performed efficiently based on the feasibility of synthesis.
  • FIG. 16 to 21 are diagrams showing an example of the feasibility database 23.
  • the feasibility database 23 may be the database DB4 in FIG.
  • the database DB4 includes items such as "molecule ID” and "synthesis & measurement pass/fail".
  • “Molecule ID” indicates identification information for identifying a molecule.
  • “Synthesis & measurement pass/fail” indicates whether or not synthesis and measurement of the molecule could be executed. For example, “synthesis & measurement pass/fail” is “1” when both synthesis and measurement of a molecule can be executed, and "0” otherwise.
  • the physical property prediction model 24 is also updated. corresponds to "success" in the example of
  • the feasibility database 23 may be the database DB5 in FIG.
  • the database DB5 includes items such as "molecule ID” and "synthesis yield".
  • “Molecule ID” indicates identification information for identifying a molecule.
  • “Synthetic yield” indicates the yield in the synthesis of the molecule.
  • the feasibility database 23 may be the database DB6 in FIG.
  • the database DB6 includes items such as "molecule ID”, “synthesis pass/fail”, “preparation pass/fail”, and “absorption spectrum measurement pass/fail”.
  • “Molecule ID” indicates identification information for identifying a molecule.
  • “Synthesis pass/fail” indicates whether or not the synthesis of the molecule could be executed.
  • “Fragment of fractionation” indicates whether fractionation of molecules could be executed.
  • “Absorption spectrum measurement pass/fail” indicates whether or not the absorption spectrum of the molecule could be measured.
  • each of "synthesis acceptance/rejection”, “preparation acceptance/rejection” and “absorption spectrum measurement acceptance/rejection” is “1” if the process can be executed, and is “0” otherwise.
  • “absorption spectrum measurement pass/fail” is an example of the item “measurement pass/fail” shown in the embodiments of FIGS. 13 to 15 .
  • the feasibility database 23 may be the database DB7 in FIG.
  • the database DB7 includes items such as "molecule ID”, "solubility in solvent A”, “solubility in solvent B”, “physical property A measurement”, and “physical property B measurement”.
  • “Molecule ID” indicates identification information for identifying a molecule.
  • “Synthesis pass/fail” indicates whether or not the synthesis of the molecule could be executed.
  • “Solvent A solubility” indicates a value for the solubility of the molecule in solvent A.
  • solvent B solubility indicates a value for the solubility of the molecule in solvent B;
  • Physical property A measurement indicates whether or not the physical property A can be measured.
  • “Physical property B measurement” indicates whether or not physical property B could be measured. For example, each of “synthesis pass/fail”, “physical property A measurement”, and “physical property B measurement” is “1" when the processing can be executed, and is "0” otherwise.
  • the feasibility database 23 may be the database DB8 in FIG.
  • the database DB8 includes items such as "molecule ID”, “synthesis path ID”, “synthesis pass/fail”, “fractionation pass/fail”, and “absorption spectrum measurement pass/fail”.
  • “Molecule ID” indicates identification information for identifying a molecule.
  • “Synthesis path ID” indicates identification information for identifying a synthesis path (route) of a molecule.
  • Synthesis pass/fail indicates whether or not the synthesis of the molecule could be executed.
  • “Fragment of fractionation” indicates whether fractionation of molecules could be executed.
  • “Absorption spectrum measurement pass/fail” indicates whether or not the absorption spectrum of the molecule could be measured.
  • the feasibility database 23 may be the database DB9 in FIG.
  • the database DB9 includes items such as "synthetic path ID", "reaction step 1", and "reaction step 2".
  • “Synthesis path ID” indicates identification information for identifying a synthesis path (route) of a molecule.
  • “Reaction step 1” indicates the first step in the synthesis path identified by the synthesis path ID.
  • “Reaction Step 2” indicates the second step in the synthesis pass identified by the synthesis pass ID. Although only “reaction step 1" and “reaction step 2" are illustrated in FIG. have.
  • the material searching and manufacturing system 1 can execute arbitrary processing using the various types of information described above. This point will be described below as another embodiment different from the above-described embodiment.
  • the material searching and manufacturing system 1 calculates a priority based on information on physical properties (characteristics) and/or feasibility, and creates a synthetic material (molecule) list (including at least one) according to the priority. Each item in the list contains at least a molecule ID. Note that the list may include ⁇ molecule ID, synthetic path ID ⁇ pairs.
  • the synthesizing device 11 sends a material synthesis list to the synthesizing device 11 via the control interface 21, and instruct synthesis according to the list.
  • the synthesizing device 11 reads ⁇ molecule ID (, synthetic pass ID) ⁇ according to the priority of the list.
  • the synthesizing device 11 uses the synthesis pass ID as a key to acquire reaction steps from the synthesis pass ID table, and performs synthesis processing.
  • the synthesizer 11 If the conditions specified in the reaction step are satisfied, the synthesis process is performed. (4-1) When the synthesizer 11 receives the notification of "synthesis not possible", the synthesizer 11 notifies the control interface 21 of synthesis failure for the first molecule ID (synthesis failure in FIG. 2). , go to (6). (4-2) Otherwise, the synthesizer 11 performs the reaction step 1 process. As a result of processing, either "normal termination” or "abnormal termination” is notified. (4-3) In the case of "abnormal termination", the synthesizer 11 notifies the control interface 21 of synthesis failure for the first molecule ID (synthesis failure in FIG.
  • Synthesizer 11 confirms whether there is a next reaction step in the case of "normal completion", and if there is a next reaction step, acquires the next reaction step, and from (4) repeat. If there is no next reaction step, proceed to (5).
  • the synthesizing device 11 notifies the control interface 21 of success or failure of synthesizing.
  • the "success/failure notification” differs depending on the notification received during the synthesis process: (6-1) In the case of synthesis failure, abnormal termination, or synthesis failure, transmit "synthesis failure”. (6-2) In the case of success in synthesis, transmit "success in synthesis”.
  • the synthesizer 11 If there is a material in the list for which synthesis has not yet been attempted, the synthesizer 11 reads out the next ⁇ molecule ID (, synthesis pass ID) ⁇ and repeats from (3). (8) In parallel with the processing of the synthesizing device 11, the search agent 26 determines that synthesizing is impossible in the case of "synthesis failure", and builds or updates the "feasibility model".
  • FIG. 22 shows the detailed flow of the processes (1) to (8) described above.
  • FIG. 22 is a sequence diagram showing an example of processing procedures in the material searching and manufacturing system. It should be noted that the step numbers shown in FIG. 22 are given for the sake of convenience in explaining the processing by each processing subject, and do not prescribe the order of the processing.
  • the search agent 26 transmits the selected material synthesis list to the synthesis device 11 via the control interface 21 (step S101).
  • the search agent 26 instructs the synthesizer 11 to synthesize the materials specified in the list (step S102).
  • the search agent 26 waits for result information of one material synthesis in the list from the synthesizing device 11 (step S103).
  • the search agent 26 processes the result in accordance with the judgment in step S5 of FIG. 2 (step S104).
  • step S105: No If the search agent 26 has not finished synthesizing all the molecule IDs shown in the list (step S105: No), it returns to step S103 and repeats the process. Further, the search agent 26 ends the process when the synthesis process has been completed for all the molecule IDs shown in the list (step S105: Yes).
  • control interface 21 When the control interface 21 receives “unable to combine”, “abnormal termination”, or “failure to combine” from the combining device 11 , it transmits “failure to combine” to the search agent 26 and receives “successful combining” from the combining device 11 . If so, it transmits "synthesis failure" to the search agent 26 (step S111).
  • the synthesizer 11 receives the material synthesis list ⁇ molecule ID,... ⁇ (step S121).
  • the synthesizing device 11 reads the target ⁇ molecule ID (, synthesis path ID) ⁇ according to the priority of the list (step S122). If the conditions for the reaction step specified by the synthesis path ID are not satisfied (step S123: No), the synthesis device 11 transmits "cannot be synthesized" to the control interface 21 and selects the next synthesis target (step S120). ), return to step S122 and repeat the process.
  • step S123: Yes When the conditions for the reaction step specified by the synthesis pass ID are satisfied (step S123: Yes), the synthesizer 11 synthesizes the material for the molecule ID (step S124). When step S124 ends abnormally (step S125: Yes), the synthesizing device 11 transmits "abnormal end" to the control interface 21, selects the next synthesis target (step S120), and returns to step S122 for processing. repeat.
  • step S124 did not end abnormally (step S125: No)
  • step S126 determines whether there is a next reaction step (step S126). If there is a next reaction step (step S126: Yes), the synthesizer 11 selects the next reaction step (step S127), returns to step S123, and repeats the process.
  • step S126 If there is no next reaction step (step S126: No), the synthesizing device 11 instructs the analyzing device 12 to perform analysis processing.
  • the synthesizing device 11 notifies the analysis result (step S128).
  • the synthesizing device 11 notifies the search agent 26 via the control interface 21 of information corresponding to "synthesis success" in case of success and "synthesis failure” in case of failure.
  • step S129: Yes If the list still contains the next molecule ID to be synthesized (step S129: Yes), the synthesizer 11 returns to step S120 and repeats the process. If there is no molecule ID to be synthesized next in the list (step S129: No), the synthesizer 11 ends the process.
  • the analysis device 12 receives the synthesized material from the synthesis device 11 and performs analysis processing (step S131). The analysis device 12 then transmits the analysis result to the synthesis device 11 .
  • the material searching and manufacturing system 1 executes the following processes (11) to (16).
  • This measurement process corresponds to the "measurement" process (step S6) when the search agent performs the process shown in FIG. It is an example of a series of processing performed in .
  • the search agent 26 receives the successfully synthesized molecule ID. (12) Specifying the ID of the successfully synthesized molecule, designating the physical properties to be measured, and instructing the synthesizer 11 via the control interface 21 to measure the successfully synthesized material. (13) Synthesizing device 11 that has received the instruction automatically controls to provide measuring device 13 with the synthetic material specified by the instructed molecule ID. Instruct to start measuring physical properties.
  • the measuring device 13 notifies the synthesizing device 11 of "measurement not possible” when the measurement cannot be performed, and of "measurement completed” and the measurement result when the measurement is completed normally. 11 transmits measurement results via the control interface 21 . (15) If the measurement result is "impossible to measure", the search agent 26 determines that synthesis cannot be performed, and builds or updates the "feasibility model".
  • the search agent 26 further determines whether the target value has been achieved, and if the target value has been achieved, determines that the synthesis has succeeded, and constructs or updates the "physical property prediction model". I do. Also, if the target value is not achieved, it is determined that synthesis cannot be performed, and the "feasibility model" is constructed or updated.
  • FIG. 23 is a sequence diagram showing an example of processing procedures in the material searching and manufacturing system. It should be noted that the step numbers shown in FIG. 23 are given for the sake of convenience in explaining the processing by each processing entity, and do not prescribe the order of the processing.
  • the search agent 26 transmits the successfully synthesized molecule ID to the synthesizer 11 (step S201).
  • the search agent 26 designates the physical properties to be measured to the synthesizer 11 and instructs the measurement of the material (step S202).
  • the search agent 26 waits for result information of one material synthesis in the list from the synthesizing device 11 (step S203).
  • the search agent 26 processes the result in accordance with the judgment of step S7 in FIG. 2 (step S204), and terminates the process.
  • control interface 21 When the control interface 21 receives "measurement impossible”, it transmits "measurement failure" to the search agent 26. When it receives "measurement end”, it transmits "measurement success” to the search agent 26 (step S211). .
  • the synthesizer 11 receives the molecule ID (step S221).
  • the synthesizer 11 provides the synthesized material designated by the molecule ID to the measuring device 13 and instructs measurement of the designated physical property (step S222).
  • the synthesizing device 11 notifies the measurement result (step S223).
  • the synthesizing device 11 notifies the search agent 26 via the control interface 21 of information corresponding to "measurement completed" in case of success and "measurement not possible” in case of failure.
  • the measuring device 13 performs measurement processing of the synthesized material for the physical property specified by the synthesizing device 11 (step S231). The measuring device 13 then transmits the measurement result to the synthesizing device 11 .
  • the synthesis device 11 receives information/data/instructions via the control interface 21, and the synthesis device 11 receives the information/data/instructions.
  • Information, data, and instructions are transmitted to the measuring device 13, and the synthesizing device 11 receives the result information from the analyzing device 12 or the measuring device 13.
  • the measurement device 13 may directly exchange data with the control interface 21 .
  • the search agent 26 (or equivalent computer software or hardware) may be allowed to directly control the analysis device 12 or the measurement device 13 via the control interface 21.
  • a computer such as the information processing apparatus 100 shown in FIG. 24 may have the function of the search agent 26 .
  • FIG. 24 is a diagram showing an example of the configuration of a material searching and manufacturing system.
  • the control interface 21 may be a computer device (control device 200 or the like in FIG. 24) having a communication interface, or may be a wired/wireless communication device. Control device 200 functions as control device 20 .
  • the information processing apparatus 100 is connected to other configurations via a network N1 such as the Internet (cloud) or a network N2 such as a private cloud including virtualization technology and VPN (Virtual Private Network) technology. connect.
  • a network N1 such as the Internet (cloud) or a network N2 such as a private cloud including virtualization technology and VPN (Virtual Private Network) technology.
  • the information processing device 100 communicates with the material manufacturing device 10, database DB, etc. via the control device 200 .
  • the database DB may operate on a computer connected to the synthesizing device 11 via a network, on a computer on a cloud, or on a device integrated with the synthesizing device 11 .
  • the database DB may include the same database as the physical property database 22 (physical property DB in FIG. 1) or the performance database 23 (performance DB in FIG. 1).
  • the database DB may be on separate storages, like the physical property database 22 (physical property DB in FIG. 1) and the performance database 23 (performance DB in FIG. 1), or may be in one storage. It may be integrated as one database DB, or may be on a virtual storage device.
  • control interface 21 may have a function of accessing the database, and may perform the processing related to the material synthesis list that was performed by the synthesizing device 11 in the synthesizing phase.
  • the synthesizing device 11, the analyzing device 12, and the measuring device 13 may be a system with the same control system in one housing, or may be independent in separate housings.
  • FIG. 25 is a diagram illustrating a configuration example of an information processing apparatus according to the present disclosure;
  • the information processing device 100 functions as the control device 20 .
  • the information processing device 100 may be integrated with the control device 200 .
  • the information processing device 100 has a communication section 110, a storage section 120, and a control section .
  • the information processing apparatus 100 includes an input unit (for example, a keyboard, a mouse, etc.) that receives various operations from an administrator of the information processing apparatus 100, and a display unit (for example, a liquid crystal display, etc.) for displaying various information. may have.
  • the communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like.
  • the communication unit 110 is connected to a predetermined network (not shown) by wire or wirelessly, and transmits and receives information to and from each component of the material searching and manufacturing system 1 such as the material manufacturing apparatus 10 and the control device 20 .
  • the communication unit 110 functions as a control interface 21 that controls the material manufacturing device 10 by transmitting information to the material manufacturing device 10 .
  • the communication unit 110 controls synthesis processing by transmitting and receiving information to and from the material manufacturing apparatus 10 .
  • the communication unit 110 instructs the material manufacturing apparatus 10 to perform synthesis processing.
  • the communication unit 110 instructs the material manufacturing apparatus 10 to perform the synthesis process by transmitting information indicating materials to be subjected to the synthesis process.
  • the communication unit 110 receives the synthetic processing result from the material manufacturing apparatus 10 .
  • the communication unit 110 receives the physical property measurement processing result from (the measuring device 13 of) the material manufacturing apparatus 10 .
  • the storage unit 120 is implemented by, for example, a semiconductor memory device such as RAM (Random Access Memory) or flash memory, or a storage device such as a hard disk or optical disk.
  • the storage unit 120 includes a physical property database 22 that holds physical property data, a feasibility database 23 that holds whether synthesis and/or measurement can be executed, a physical property prediction model 24 that predicts physical properties, and whether synthesis and/or measurement can be executed. It stores various information such as a feasibility model 25 that predicts what will happen.
  • the control unit 130 uses, for example, a CPU (Central Processing Unit) or an MPU (Micro Processing Unit) to operate a program stored inside the information processing apparatus 100 (for example, an information processing program according to the present disclosure, etc.) in RAM, etc. It is realized by being executed as a region. Also, the control unit 130 is implemented by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).
  • ASIC Application Specific Integrated Circuit
  • FPGA Field Programmable Gate Array
  • the control unit 130 uses the information received from the external device by the communication unit 110 to execute each process. Also, the control unit 130 executes each process using the information stored by the storage unit 120 . Control unit 130 controls material manufacturing apparatus 10 by transmitting information to material manufacturing apparatus 10 via communication unit 110 .
  • the control unit 130 executes processing corresponding to the functions of the search agent 26 .
  • the control unit 130 executes the processing related to the synthetic material selection described above.
  • the control unit 130 executes the processing related to the production of the material described above.
  • the control unit 130 instructs the material manufacturing apparatus 10 to synthesize materials, thereby causing the material manufacturing apparatus 10 to perform processing for manufacturing materials.
  • the control unit 130 selects a material from among the materials stored in the storage unit 120 using the material physical property information and the feasibility information.
  • the control unit 130 instructs the material manufacturing apparatus 10 to synthesize the selected materials.
  • the control unit 130 controls the material synthesizing process by the material manufacturing apparatus 10 by transmitting list-format information to the material manufacturing apparatus 10 in accordance with the order of priority.
  • the control unit 130 controls the material synthesizing process by the material manufacturing apparatus 10 by transmitting the search table #2 to the material manufacturing apparatus 10 .
  • the control unit 130 designates materials to be synthesized by transmitting list-format information including designation of materials to be synthesized (materials to be synthesized) to the material manufacturing apparatus 10 .
  • control unit 130 designates a material to be synthesized by transmitting a search table #2 in which a flag is attached to the material to be synthesized to the material manufacturing apparatus 10 .
  • Control unit 130 updates the feasibility information stored in storage unit 120 based on the synthesis processing result from material manufacturing apparatus 10 .
  • the control unit 130 updates the information in the search table #2 based on the synthesizing processing result from the material manufacturing apparatus 10 .
  • the control unit 130 selects a material from two or more synthesis processing target materials stored in the storage unit 120 .
  • the control unit 130 selects materials so as not to include materials that have been successfully synthesized in the past from materials to be synthesized.
  • the control unit 130 refers to information stored in the storage unit 120, excludes materials that have been successfully synthesized in the past, and selects materials. This allows the control unit 130 to select a new material.
  • the control unit 130 selects the material according to the priority based on the first predicted value of the material based on the material physical property information.
  • the control unit 130 performs priority material selection based on the second predicted value of the material based on the feasibility information.
  • the control unit 130 selects materials whose second predicted values are equal to or greater than a predetermined threshold.
  • control unit 130 updates the feasibility information stored in the storage unit 120 for the successfully synthesized materials.
  • the control unit 130 updates the feasibility model 25 based on the updated feasibility information.
  • the control unit 130 designates the identifier of the successfully synthesized material and the physical properties to be measured, and instructs the physical property measurement process.
  • the control unit 130 updates the material physical property information.
  • the control unit 130 updates the material property information of the successfully synthesized material in the storage unit 120 based on the property measurement processing result from the material manufacturing apparatus 10 .
  • the control unit 130 updates the material physical property information for the material that satisfies the target value stored in the storage unit 120 .
  • the control unit 130 updates the physical property prediction model 24 based on the updated material physical property information.
  • the control unit 130 controls the instructed physical property measurement processing for the successfully synthesized material identified by the identifier, and provides the identifier and the measured physical property value.
  • the control unit 130 causes another device to transmit the physical property value via the communication unit 110 .
  • the control unit 130 transmits information indicating the identifier of the successfully synthesized material and the measured physical property value to another device via the communication unit 110 .
  • the control unit 130 performs material selection using data having a synthetic material selection data structure (also referred to as “synthetic material selection data”). For example, the control unit 130 selects materials using data (synthetic material selection data) such as the search table #2 in FIG. 10 or the candidate material table #2 in FIGS.
  • the control unit 130 includes an ID (for example, a molecule ID) that identifies a material, priority information (for example, a priority value) indicating a priority based on the predicted physical property value of the material, and Materials are selected using synthetic material selection data including feasibility information (for example, feasibility value) indicating feasibility and synthesis success/failure information (for example, synthesis success/failure value) indicating success or failure of synthesis processing.
  • the control unit 130 uses the synthesis material selection data, the control unit 130 searches for a group of materials in which the synthesis success/failure information indicates unprocessed materials in descending order of priority based on the priority information, and performs synthesis processing indicated by the synthesis success/failure information.
  • control unit 130 searches for a group of molecules whose synthesis pass/fail value is unknown (n/a) in order from the highest priority value, and selects materials whose feasibility value is greater than or equal to a predetermined threshold. do.
  • FIG. 26 to 28 are diagrams showing an example of the configuration of a material manufacturing apparatus.
  • material manufacturing apparatuses 10A, 10B, and 10C will be described according to the mode of the material moving mechanism. Further, regarding the material manufacturing apparatus 10, descriptions of the same points as those described above will be omitted as appropriate.
  • a material manufacturing apparatus 10A shown in FIG. 26 has a material moving path 14 as a material moving mechanism.
  • the synthesizing device 11 has a driving device 111 that drives the material moving path 14, a processor 112 that controls the driving device 111 and performs synthesizing processing, and a communication interface 113 for communicating with other devices.
  • the analysis device 12 also has a drive device 121 that drives the material transfer path 14, a processor 122 that controls the drive device 121 and executes analysis processing, and a communication interface 123 for communicating with other devices.
  • the measuring device 13 also has a driving device 131 that drives the material moving path 14, a processor 132 that controls the driving device 131 and performs measurement processing, and a communication interface 133 for communicating with other devices.
  • FIG. 26 is a belt conveyor or the like provided over the synthesizing device 11 , the analyzing device 12 and the measuring device 13 .
  • the material MT shown in FIG. 26 can move among the synthesizing device 11, the analyzing device 12 and the measuring device 13 according to the operation of the material moving path 14.
  • FIG. 26 is a belt conveyor or the like provided over the synthesizing device 11 , the analyzing device 12 and the measuring device 13 .
  • the material MT shown in FIG. 26 can move among the synthesizing device 11, the analyzing device 12 and the measuring device 13 according to the operation of the material moving path 14.
  • the material manufacturing apparatus 10B shown in FIG. 27 has a robot arm 15 as a material moving mechanism.
  • the synthesizing device 11 has a driving device 111 for driving the robot arm 15, a processor 112 for controlling the driving device 111 and performing synthesizing processing, and a communication interface 113 for communicating with other devices.
  • the analysis device 12 also has a processor 122 for executing analysis processing and a communication interface 123 for communicating with other devices.
  • the measuring device 13 also has a processor 132 for executing measurement processing and a communication interface 133 for communicating with other devices.
  • the robot arm 15 shown in FIG. 27 is driven by the driving device 111 of the synthesizer 11 .
  • the material MT shown in FIG. 27 can be moved among the synthesizing device 11 , the analyzing device 12 and the measuring device 13 according to the motion of the robot arm 15 .
  • the material manufacturing apparatus 10C shown in FIG. 28 has a flow path with a syringe pump 16 and a tube 17 as a material moving mechanism.
  • the synthesizing device 11 has a driving device 111 that drives the syringe pump 16, a processor 112 that controls the driving device 111 and performs synthesizing processing, and a communication interface 113 for communicating with other devices.
  • the analysis device 12 also has a processor 122 for executing analysis processing and a communication interface 123 for communicating with other devices.
  • the measuring device 13 also has a processor 132 for executing measurement processing and a communication interface 133 for communicating with other devices.
  • the syringe pump 16 shown in FIG. 28 is driven by the driving device 111 of the synthesizing device 11 .
  • the above is merely an example, and the material manufacturing apparatus 10 may have any form of material moving mechanism as long as the material can be moved between apparatuses.
  • the material manufacturing apparatus 10 executes processing for manufacturing materials.
  • the material manufacturing apparatus 10 executes a process of manufacturing materials according to an operation by a user of the material manufacturing apparatus 10 or the like.
  • the material manufacturing apparatus 10 executes processing for manufacturing materials according to instructions from an external device.
  • the material manufacturing device 10 executes processing for manufacturing materials according to instructions from the control device 20 .
  • the material manufacturing apparatus 10A shown in FIG. 26 the material manufacturing apparatus 10B shown in FIG. 27, or the material manufacturing apparatus 10C shown in FIG. Targeting the moved material, a process of measuring the specified physical property value is performed.
  • the measurement device 13 transmits the physical property measurement processing result generated by the measurement processing to another device.
  • the material manufacturing device 10 transmits the physical property measurement processing result to other devices such as the control device 20, the information processing device 100, and the control device 200.
  • the synthetic material selection method according to the present disclosure is based on material physical property information in the database (in the above example, information shown in database DB1, etc.; the same applies hereinafter) and feasibility information (in the above example, information shown in database DB2, etc.). hereinafter the same) is used to select the material to be synthesized, and the control device (in the above example, the material manufacturing device 10, the control device 20, the information processing device 100 or the control device 200, etc.; the same applies hereinafter), Instructions are given for synthesis processing of the selected materials, and feasibility information in the database is updated based on the synthesis processing results from the control device.
  • material physical property information in the database in the above example, information shown in database DB1, etc.; the same applies hereinafter
  • feasibility information in the above example, information shown in database DB2, etc.
  • the synthetic material selection method executed by the material searching and manufacturing system 1 includes selecting materials to be synthesized using material property information and feasibility information in the database; directing the synthesis process of the materials and updating the feasibility information in the database based on the synthesis process results. This allows the synthetic material selection method to enable material synthesis based on synthetic feasibility.
  • the database includes two or more synthetic processing target materials.
  • the synthesis material selection method can select a material using a database containing two or more synthesis process target materials.
  • the synthetic material selection method in material selection in the synthetic material selection method according to the present disclosure, selection is made so as not to include materials that have been successfully synthesized in the past. As a result, the synthetic material selection method can select materials so as not to include materials that have been successfully synthesized in the past.
  • material selection in the synthetic material selection method according to the present disclosure is performed according to the priority based on the first predicted value of the material based on the material physical property information. This allows the synthetic material selection method to select materials according to priorities based on the first predicted value of the material.
  • the first predicted value is input to the physical property prediction model (physical property prediction model 24 in the above example; the same shall apply hereinafter), and constitutes the material registered in the database. is output based on the material feature amount of each material.
  • the synthetic material selection method can select the material according to the priority based on the first predicted value of the material predicted by the physical property prediction model.
  • material selection in the synthetic material selection method according to the present disclosure is performed according to the priority based on the second predicted value of the material based on the feasibility information.
  • the synthetic material selection method can select the material according to the second predicted value of the material based on the feasibility information.
  • materials are selected from those whose second predicted values are equal to or greater than a predetermined threshold. This allows the synthetic material selection method to make an appropriate material selection.
  • the second predicted value is input to the feasibility model 25, based on the material feature amount of each of the two or more materials that constitute the material registered in the database output.
  • the synthetic material selection method can select the material according to the second predicted value of the material based on the feasibility information.
  • the selected materials are selected in order of priority, and the selected materials are specified in a list format including at least one item, the items being material identifiers and Includes priority. This allows the synthetic material selection method to appropriately select materials.
  • control device controls synthesis processing of materials provided in list form according to priority, provides synthesis processing results for each material, and the synthesis processing results are controlled. It is the identifier of the material of the synthesis process and the success/failure information of synthesis. This allows the synthetic material selection method to appropriately select materials.
  • the control of the synthesis process instructs the synthesis device (the synthesis device 11 or the material manufacturing device 10 in the above example; the same applies hereinafter) to perform synthesis processing, and the synthesis device outputs the synthesis processing result including processing to receive This allows the synthesis material selection method to make available the results of the synthesis process.
  • the feasibility information in the synthetic material selection method according to the present disclosure, if the synthesis success or failure information is successful, the feasibility information is updated for the successfully synthesized material in the database, and further updated. Based on the feasibility information, the feasibility model 25 is updated. This allows the synthetic material selection method to make appropriate material selections using the updated model.
  • the controller based on the success or failure information of synthesis, the controller is instructed to perform physical property measurement processing by designating the identifier of the successfully synthesized material and the physical property to be measured, and controlling It includes a process of updating the material property information of the successfully synthesized material in the database based on the property measurement processing result from the device. This allows the synthetic material selection method to select an appropriate material using the updated material property information.
  • the material physical property information when the physical property measurement result satisfies the target value, the material physical property information is updated in the database for the material that satisfies the target value. It includes processing to update the physical property prediction model based on the material physical property information. This allows the synthetic material selection method to select an appropriate material using the updated physical property prediction model.
  • the control device controls the instructed physical property measurement processing for the successfully synthesized material specified by the identifier, and provides the identifier and the measured physical property value. Accordingly, the synthetic material selection method can provide information indicating appropriately measured physical property values and materials corresponding to the physical property values.
  • the control of the physical property measurement process automatically moves the material synthesized by the synthesizing device to the measuring device (the measuring device 13 in the above example, the same applies hereinafter), and the instructed physical property It includes a process of instructing the measuring device to perform the measurement and receiving the physical property measurement processing result from the measuring device. This allows the synthetic material selection method to make available the results of the physical property measurement process.
  • the attributes of the material are low molecular weight, dye, high molecular weight, fluorescent/identifying isotope labeling, self-organizing material/structure, biomaterial (sugar, peptide, polypeptide, amino acids, proteins, fatty compounds, DNA, etc.), organic thin films (evaporation, coating processes), inorganic materials (solid phase method, coprecipitation method, melt quenching method, sol-gel method, etc.), nanoparticles, metal complexes, inorganic thin films (ALD , sputtering, etc.), synthetic materials based on synthetic biological techniques (genetic recombination and material synthesis using bacteria), and functional materials with crystal structures, nanostructures, and microstructures. This allows the synthetic material selection method to appropriately select materials using information about the attributes of the materials.
  • the material physical property information in the database is structured to include at least two items, and one of the at least two items is an attribute item of the material.
  • the synthetic material selection method can appropriately select the material using the information regarding the attribute of the material physical property information including two or more items.
  • the material manufacturing method performs material selection for selecting a material to be synthesized using material physical property information and feasibility information in the database, and instructs the control device to select the selected material.
  • Materials are manufactured by a process of instructing a synthesis process and updating the feasibility information in the database based on the synthesis process results from the controller. This allows the synthetic material selection method to produce synthesized materials based on synthetic feasibility.
  • the synthesis material selection data structure is an information processing device (in the above example, the control device 20, the information processing device 100, or the control device 200, etc.) that selects a material to be subjected to synthesis processing. ), which includes an ID that identifies the material, priority information that indicates the priority based on the predicted physical property value of the material, and feasibility that indicates the feasibility of synthesizing the material.
  • an information processing device searches for a group of materials in which the synthesis success/failure information indicates that the synthesis success/failure information indicates that the material has not been processed in descending order of priority based on the priority information,
  • the success or failure of the synthesizing process indicated by the synthesizing success/failure information is used in the process of selecting materials that satisfy a predetermined criterion. This allows the synthetic material selection method to enable material synthesis based on synthetic feasibility.
  • the material searching and manufacturing system 1 avoids materials that are likely to fail in synthesis/measurement and reduces unnecessary synthesis/measurement, thereby dramatically improving efficiency in terms of time and cost. material search and manufacturing system.
  • the material searching and manufacturing system 1 based on the information in the current database, a new material that has not been synthesized in the past is selected as a synthesis target, and the result of attempting synthesis with an actual synthesis apparatus is used.
  • the data can be updated in real time using the results of measuring whether the material with the expected properties can be produced, The results are used to construct a feasibility model 25 and a physical property prediction model. Therefore, when selecting materials next time, avoiding materials that are likely to fail in synthesis and measurement and reducing unnecessary synthesis and measurement will dramatically improve efficiency in terms of time and cost.
  • a material search and manufacturing system can be constructed.
  • the material searching and manufacturing system 1 is a high-precision physical property prediction system that utilizes a physical property database that stores physical property values with matching material manufacturing conditions.
  • the material searching and manufacturing system 1 is provided with a database storing physical property values, and in conjunction with the synthesizing device, the physical property prediction is performed so that the data can be updated based on the latest measurement data of the synthesized material. Models can be built and updated. Therefore, the synthesis material selection method has the effect of being able to predict the physical properties of materials that can be newly synthesized with higher accuracy than conventional methods.
  • the material searching and manufacturing system 1 utilizes the feasibility database 23 that accumulates feasibility data (success or failure of synthesis and measurement) with matching material manufacturing conditions. It is a prediction system.
  • a new material is selected based on the information in the database at the time of material selection, and the database is updated in real time using the result of trying to synthesize with an actual synthesizer.
  • the synthesis is successful, it is possible to update the data in real time using the results of measuring whether the material with the expected properties was produced, and to use the results to improve feasibility.
  • a model 25 and a physical property prediction model 24 are constructed. Therefore, it is possible to construct a material synthesis possibility prediction system and a measurement success probability prediction system by utilizing the feasibility database 23 that accumulates feasibility data (success or failure of synthesis and measurement) with matching material manufacturing conditions.
  • the material search and manufacturing system 1 can be used for low molecular weight, dye, high molecular weight, fluorescent/identifying isotope labeling, self-organizing materials/structures, biomaterials (sugars, peptides, polypeptides, amino acids, proteins, fats, etc.).
  • the material search and manufacturing system 1 is a structure search system that synthesizes, measures, and optimizes the properties of functional materials with crystal structures, nanostructures, and microstructures, and is capable of producing stable and metastable crystal structures and aggregate structures. It is a structure search system that searches.
  • the material attribute information is used to select a new material, and the result of trying to synthesize with an actual synthesizer is used to update the database in real time, Even if the synthesis is successful, the data can be updated in real time with the results of measuring whether the material with the expected properties was produced, and the results are used to generate the feasibility model 25 and A physical property prediction model 24 is constructed. Therefore, it is possible to construct a material synthesis possibility prediction system and a measurement success probability prediction system by utilizing the feasibility database 23 that accumulates feasibility data (success or failure of synthesis and measurement) with matching material manufacturing conditions.
  • the materials that can be selected in the database of the present disclosure are managed by descriptors, and the material property information of each material is structured to include at least two or more data items, and structured Some of the data items relate to material attributes.
  • the attributes are, for example, attributes related to functional materials, such as low molecules, dyes, macromolecules, fluorescent/identifying isotope labels, self-organizing materials/structures, biomaterials (sugars, peptides, polypeptides, amino acids, proteins, fatty compounds, DNA, etc.), organic thin films (evaporation, coating processes), inorganic materials (solid phase method, coprecipitation method, melt quenching method, sol-gel method, etc.), nanoparticles, metal complexes, inorganic thin films (ALD , sputtering, etc.), synthetic materials based on synthetic biological techniques (genetic recombination and material synthesis using bacteria), crystal structures, nanostructures, microstructures, and the like.
  • functional materials such as low molecules, dyes, macromolecules, fluorescent/identifying isotope labels, self-organizing materials/structures, biomaterials (sugars, peptides, polypeptides, amino acids, proteins, fatty compounds, DNA, etc.), organic thin films (
  • the material searching and manufacturing system 1 has all properties and physical properties (mechanical properties, thermal properties, electrical properties, magnetic properties, optical properties, etc.) that can be evaluated by material production by physical, chemical, and biological methods , electrochemical properties, efficacy, toxicity, antibody response, interaction with cells, interaction with internal organs, intracellular transportability, in vivo transportability, adsorption, solubility, etc.). It's a common search system.
  • Properties measured in the present disclosure include, for example, all properties and physical properties (mechanical properties, thermal properties, electrical properties, magnetic properties, optical properties, electrochemical properties, efficacy, toxicity, antibody response, interaction with cells, interaction with body organs, intracellular transportability, in vivo transportability, adsorptivity, solubility, etc.).
  • a new material is selected based on information on all properties and physical properties that can be evaluated by material manufacturing by physical, chemical, and biological methods, and synthesis is performed by an actual synthesis apparatus.
  • the database is updated in real time using the results of attempts, and even if the synthesis is successful, the data is updated in real time using the results of measuring whether materials with the expected properties were produced. and the results are used to build a feasibility model 25 and a property prediction model 24 . Therefore, it is possible to construct a new material manufacturing system utilizing the feasibility database 23 that stores feasibility data (success or failure of synthesis/measurement) with matching material manufacturing conditions.
  • the material searching and manufacturing system 1 described above is merely an example of a processing system that performs various types of processing, and the processing system may be a system that is used for various purposes.
  • the processing system may be a processing system used for the following applications.
  • the feasibility database 23 containing both successful and unsuccessful data regarding material synthesis/physical property measurement can be obtained, it is possible to find out the characteristics of materials for successful material synthesis/physical property measurement and the characteristics of materials that fail. .
  • the processing system is a search system that automatically presents the optimum equipment function expansion, such as automatic detection of problems and rate-limiting processes in the material manufacturing equipment, and indication of improvement policies, based on the analysis of success data and failure data.
  • the processing system is a material search and manufacturing system that uses multiple material manufacturing equipment that can be accessed via the Internet depending on the situation. It is a universal feasibility prediction system by mutually exchanging and integrating feasibility data.
  • an automatic material synthesis system that uses dedicated software to create a workflow for material synthesis, and in addition to device control such as material designation, dispensing amount, etc., and data management can be performed easily.
  • analysis data during material production can be used to reflect in the database, and furthermore, the success or failure of synthesis in the most recent material synthesis, furthermore, the degree of goal achievement in the analysis results, Based on the above, it is possible to automatically select the next candidate material, so that it is possible to more efficiently search for a material that can select a material with a high probability of success.
  • control network should be connected to the Internet via a wired network or a wireless network such as Wi-Fi (registered trademark) (Wireless-Fidelity), 4G/5G, or the like.
  • Wi-Fi registered trademark
  • 4G/5G Wireless-Fidelity
  • synthesizer and the like used in the present disclosure are expected to be large-scale, but these can use virtualization technology on the cloud to integrally manage the distributed material manufacturing equipment as one system. By doing so, data can be transmitted and received in real time via the control interface.
  • the next material search can be performed, and further, the material manufacturing apparatus can be continuously controlled to continue material synthesis.
  • the feasibility database 23 of the present disclosure is a comparative and reusable feasibility database based on the standardization of feasibility data.
  • the processing system is a highly accurate material development cost prediction system that utilizes the feasibility database 23 .
  • the service provided by the processing system is a highly accurate materials search service utilizing feasibility model 25 .
  • each component of each device illustrated is functionally conceptual and does not necessarily need to be physically configured as illustrated.
  • the specific form of distribution/integration of each device is not limited to the illustrated one, and all or part of them can be functionally or physically distributed/integrated in arbitrary units according to various loads and usage conditions. Can be integrated and configured.
  • FIG. 29 is a hardware configuration diagram showing an example of a computer that implements the functions of the information processing apparatus.
  • the information processing apparatus 100 will be described below as an example.
  • the computer 1000 has a CPU 1100 , a RAM 1200 , a ROM (Read Only Memory) 1300 , a HDD (Hard Disk Drive) 1400 , a communication interface 1500 and an input/output interface 1600 .
  • Each part of computer 1000 is connected by bus 1050 .
  • the CPU 1100 operates based on programs stored in the ROM 1300 or HDD 1400 and controls each section. For example, the CPU 1100 loads programs stored in the ROM 1300 or HDD 1400 into the RAM 1200 and executes processes corresponding to various programs.
  • the ROM 1300 stores a boot program such as BIOS (Basic Input Output System) executed by the CPU 1100 when the computer 1000 is started, and programs dependent on the hardware of the computer 1000.
  • BIOS Basic Input Output System
  • the HDD 1400 is a computer-readable recording medium that non-temporarily records programs executed by the CPU 1100 and data used by such programs.
  • the HDD 1400 is a recording medium that records an information processing program such as an information processing program according to the present disclosure, which is an example of the program data 1450 .
  • a communication interface 1500 is an interface for connecting the computer 1000 to an external network 1550 (for example, the Internet).
  • the CPU 1100 receives data from another device or transmits data generated by the CPU 1100 to another device via the communication interface 1500 .
  • the input/output interface 1600 is an interface for connecting the input/output device 1650 and the computer 1000 .
  • the CPU 1100 receives data from input devices such as a keyboard and mouse via the input/output interface 1600 .
  • the CPU 1100 transmits data to an output device such as a display, speaker, or printer via the input/output interface 1600 .
  • the input/output interface 1600 may function as a media interface for reading a program or the like recorded on a predetermined recording medium (media).
  • Media include, for example, optical recording media such as DVD (Digital Versatile Disc) and PD (Phase change rewritable disk), magneto-optical recording media such as MO (Magneto-Optical disk), tape media, magnetic recording media, semiconductor memories, etc. is.
  • the CPU 1100 of the computer 1000 implements the functions of the control unit 130 and the like by executing an information processing program such as an information processing program loaded on the RAM 1200 .
  • the HDD 1400 also stores an information processing program such as an information processing program according to the present disclosure, and data in the storage unit 120 .
  • CPU 1100 reads and executes program data 1450 from HDD 1400 , as another example, these programs may be obtained from another device via external network 1550 .
  • the present technology can also take the following configuration.
  • (3) The material selection is selected so as not to include materials that have been successfully synthesized in the past.
  • the material selection is performed according to the priority based on the first predicted value of the material based on the material physical property information, The synthetic material selection method according to any one of (1) to (3).
  • the first predicted value is output from a physical property prediction model in response to an input based on the material feature amount of each of two or more materials that constitute the material registered in the database, The synthetic material selection method according to (4).
  • the material selection is performed according to a priority based on a second predicted value of materials based on the feasibility information;
  • the second predicted value is selected from those above a predetermined threshold, The synthetic material selection method according to (6).
  • the second predicted value is output from the feasibility model in response to input based on material feature values of each of two or more materials that constitute the material registered in the database, The synthetic material selection method according to (6) or (7).
  • the selected materials are selected in the order of priority, and the selected materials are specified in a list format containing at least one item, wherein the item includes an identifier and a priority of the material.
  • the synthetic material selection method according to any one of (4) to (8).
  • the control device controls synthesis processing of the materials provided in the list format according to the priority, provides the synthesis processing result for each material, and the synthesis processing result is the controlled synthesis processing. material identifier and synthesis success/failure information,
  • the control of the synthesis process includes a process of instructing a synthesizing device to perform the synthesizing process and receiving the synthesizing process result from the synthesizing device.
  • the material physical property information is updated in the database with respect to the material that satisfies the target value, and based on the updated material physical property information, the physical property Including processing to update the forecast model, (13)
  • the control device controls the indicated physical property measurement process for the successfully synthesized material identified by the identifier, and provides the identifier and the measured physical property value.
  • the control of the physical property measurement process includes automatically moving the material synthesized by the synthesizing device to the measuring device, instructing the measuring device to perform the instructed physical property measurement, and performing the physical property measurement from the measuring device.
  • the synthetic material selection method according to any one of (13) to (15).
  • the material physical property information in the database is structured to include at least two items, one of the at least two items being an attribute item of the material.
  • the synthetic material selection method according to any one of (1) to (16).
  • a data structure used in an information processing system comprising a storage unit and a processing unit, stored in the storage unit, and used in the processing unit to select a material to be synthesized, ID for identifying materials, priority information indicating priority based on predicted physical property values of materials, feasibility information indicating feasibility of synthesizing materials, and synthesis success/failure information indicating success or failure of synthesis processing.
  • the processing unit searches for a group of materials in which the synthesis success/failure information indicates unprocessed materials in descending order of priority based on the priority information, and the success or failure of the synthesis process indicated by the synthesis success/failure information is a predetermined number.
  • a composite material selection data structure used in the process of selecting materials that meet the criteria.
  • Material selection is performed according to the feasibility information output by the machine learning model, instructing a control device to synthesize the selected materials; updating information in the feasibility database based on the synthesis processing result from the control device; updating the machine learning model based on the updated database feasibility information; Manufacturing methods for manufacturing updated machine learning models.
  • the attributes of the materials include low molecules, dyes, macromolecules, fluorescent/identifying isotope labels, self-organizing materials/structures, biomaterials (sugars, peptides, polypeptides, amino acids, proteins, fatty compounds, DNA, etc.), Organic thin films (evaporation, coating processes), inorganic materials (solid phase method, coprecipitation method, melt quenching method, sol-gel method, etc.), nanoparticles, metal complexes, inorganic thin films (ALD, sputtering, etc.), synthetic biological methods (including at least one of synthetic materials based on genetic recombination and material synthesis using bacteria, functional materials with crystal structures, nanostructures, and microstructures, The synthetic material selection method according to any one of (1) to (16).
  • the processing indicated by the physical property measurement processing is a property that can be evaluated by material production by physical, chemical, or biological methods.
  • the synthetic material selection method according to any one of (13) to (16).
  • the properties include mechanical properties, thermal properties, electrical properties, magnetic properties, optical properties, electrochemical properties, efficacy, toxicity, antibody response, interaction with cells, interaction with internal organs, cell including at least one of internal transportability, in vivo transportability, adsorptivity, and solubility, (22)
  • a processing unit that selects a material to be synthesized using material property information and feasibility information in a database, and instructs a control device to synthesize the selected material, and the control device a control unit that updates feasibility information in the database based on material synthesis processing results from
  • a synthetic material selection device comprising: (25) Material selection for selecting materials to be synthesized using material property information and feasibility information in the database, instructing a control device to synthesize the selected materials; updating feasibility information in the database based on synthesis processing results from the control device; Synthetic material selection program that runs the process.
  • Material search and manufacturing system (information processing system) REFERENCE SIGNS LIST 10 material manufacturing device 11 synthesis device 12 analysis device 13 measurement device 20 control device 21 control interface 22 physical property database 23 feasibility database 24 property prediction model 25 feasibility model 26 search agent N control network

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本開示に係る合成材料選択方法は、データベースの材料物性情報と実行可能性情報に基づいて合成対象の材料を選択する材料選択を行い、制御装置に対して、選択された材料の合成処理の指示を行い、制御装置からの合成処理結果に基づいて、データベースの実行可能性情報を更新する。

Description

合成材料選択方法、材料製造方法、合成材料選択データ構造、及び製造方法
 本開示は、合成材料選択方法、材料製造方法、合成材料選択データ構造、及び製造方法に関する。
 従来、新規な材料の合成に関する様々な技術が提供されている。例えば、材料の物性パラメータの組み合わせを探索することで新たに合成すべき材料を探索するような手法が知られている(例えば特許文献1)。
国際公開第2017/221444号
"Bayesian molecular design with a chemical language model" Hisaki Ikebata, Kenta Hongo, Tetsu Isomura, Ryo Maezono, Ryo Yoshida, Journal of Computer-Aided Molecular Design volume 31, pages379-391 (2017) "Machine-learned metrics for predicting the likelihood of success in materials discovery" Kim, Y., Kim, E., Antono, E. et al., npj Comput Mater 6, 131 (2020)
 しかしながら、上記の従来技術では、過去に合成したことのない材料の候補探索において、予め構築したデータベースの情報のみに基づいて、新たに合成すべき材料の候補を探索していたため、実際の材料製造設備を用いた過去の材料製造結果の事実を踏まえて判断される「合成の実行性」を考慮した上で材料探索ができないという課題があった。より具体的には、例えば、データベースを用いて、「過去に合成したことがない」材料を探索する場合において、その材料について「合成したことがない」理由については不問のまま、材料探索を行っているため、実際の材料製造設備での合成の困難さ等、合成の実行性を考慮した上で、過去に合成が成功したことのない材料を適切に探索し、選択することができないという課題があった。
 そこで、本開示では、合成の実行性に基づく材料合成を可能にすることができる合成材料選択方法、材料製造方法、合成材料選択データ構造、及び製造方法を提案する。
 上記の課題を解決するために、本開示に係る一形態の合成材料選択方法は、データベースの材料物性情報と実行可能性情報に基づいて合成対象の材料を選択する材料選択を行い、制御装置に対して、前記選択された材料の合成処理の指示を行い、前記制御装置からの合成処理結果に基づいて、前記データベースの実行可能性情報を更新する。
本開示の材料探索製造システムの構成例を示す図である。 材料探索製造システムによる処理手順を示すフローチャートである。 実行可能性に関する処理手順を示すフローチャートである。 本開示の実施形態に係る物性データベースの一例を示す図である。 本開示の実施形態に係る実行性データベースの一例を示す図である。 本開示の実施形態に係る材料テーブルの一例を示す図である。 本開示の実施形態に係る物性の予測の一例を示す図である。 本開示の実施形態に係る実行可能性の評価の一例を示す図である。 物性予測モデルを用いた探索の一例を示す図である。 物性予測モデル及び実行可能性モデルを用いた探索の一例を示す図である。 物性予測モデルを用いた処理の詳細例を示す図である。 物性予測モデルを用いた処理の詳細例を示す図である。 物性予測モデル及び実行可能性モデルを用いた探索の詳細例を示す図である。 物性予測モデル及び実行可能性モデルを用いた探索の詳細例を示す図である。 物性予測モデル及び実行可能性モデルを用いた探索の詳細例を示す図である。 実行性データベースの一例を示す図である。 実行性データベースの一例を示す図である。 実行性データベースの一例を示す図である。 実行性データベースの一例を示す図である。 実行性データベースの一例を示す図である。 実行性データベースの一例を示す図である。 材料探索製造システムにおける処理手順の一例を示すシーケンス図である。 材料探索製造システムにおける処理手順の一例を示すシーケンス図である。 材料探索製造システムの構成の一例を示す図である。 本開示の情報処理装置の構成例を示す図である。 材料製造装置の構成の一例を示す図である。 材料製造装置の構成の一例を示す図である。 材料製造装置の構成の一例を示す図である。 情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。 探索に関する材料製造結果の一例を示す図である。 探索に関する材料製造結果の一例を示す図である。
 以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、この実施形態により本願にかかる合成材料選択方法、材料製造方法、合成材料選択データ構造、及び製造方法が限定されるものではない。また、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。
 以下に示す項目順序に従って本開示を説明する。
  1.実施形態
   1-1.本開示の実施形態に係る材料探索製造システムの構成及び処理の概要
    1-1-1.材料探索製造システムの装置構成
    1-1-2.材料探索製造システムの全体処理フロー
   1-2.材料探索製造システムの各構成
    1-2-1.材料製造装置
    1-2-2.制御システム
     1-2-2-1.データ
     1-2-2-2.モデル
   1-3.探索並びに材料製造処理後のデータベース及びモデルの更新処理例
     1-3-1.物性予測モデルのみを用いた探索並びに材料製造処理後のデータベース及びモデルの更新
     1-3-2.物性予測モデルと実行可能性モデルを用いた探索並びに材料製造処理後のデータベース及びモデルの更新
   1-4.探索並びに材料製造処理後のデータベース及びモデルの更新処理の詳細
     1-4-1.物性予測モデルのみを用いた探索並びに材料製造処理後のデータベース及びモデルの更新
     1-4-2.物性予測モデルと実行可能性モデルを用いた探索並びに材料製造処理後のデータベース及びモデルの更新
   1-5.実施例及び材料製造結果
   1-6.実行性データベースの例
  2.他の処理フロー例
   2-1.合成に関する処理
   2-2.測定に関する処理
   2-3.システム構成例等
    2-3-1.情報処理装置例
    2-3-2.材料製造装置の構成例等
  3.本開示の対象及び効果
  4.その他
  5.ハードウェア構成
[1.実施形態]
[1-1.本開示の実施形態に係る材料探索製造システムの構成及び処理の概要]
 以下では、まず、図1及び図2を用いて、以下に示す各種処理を行う情報処理システム(「処理システム」ともいう)の一例である材料探索製造システム1の構成、及び材料探索製造システム1が行う処理の概要について説明した後、各構成や処理の詳細について順を追って説明する。なお、以下では、材料探索製造システム1の構成及び処理に関する点を主に説明し、材料探索及び材料合成における従来技術の内容についての詳細な説明は適宜省略する。また、以下に示す材料探索製造システム1が処理の主体として記載されている処理については、材料探索製造システム1に含まれるいずれの装置が行ってもよい。
[1-1-1.材料探索製造システムの装置構成]
 まず、図1に示す材料探索製造システム1の構成について説明する。図1は、本開示の材料探索製造システムの構成例を示す図である。図1に示すように、材料探索製造システム1には、材料製造装置10と、制御装置20と、外部記憶装置50とが含まれる。例えば、材料製造装置10と、制御装置20とは所定の通信網(図1では制御ネットワークN)を介して、有線または無線により通信可能に接続される。制御装置20と材料製造装置10とは、制御ネットワークNを通じて相互に情報のやり取りができる。制御ネットワークNは、無線、有線を介して通信できる専用ネットワーク、ローカルエリアネットワーク、インターネットあるいはクラウドと称される広域ネットワークのいずれであってもよい。
 材料製造装置10は、材料合成を行う合成装置11、合成された材料の特定を行う分析装置12、及び物性評価を行う測定装置13を有する。合成装置11、分析装置12及び測定装置13等の材料製造装置10における各構成部(各装置)は相互に材料を受け渡すことができるが、その構成については後述する。外部記憶装置50は、材料探索製造システム1での処理に用いられる情報を保有するサーバ装置である。例えば、外部記憶装置50は、制御装置20に情報を提供する。
 制御装置20は、材料製造装置10を制御する制御インターフェース21、物性データを保持する物性データベース22(図1中の物性DB)、合成及び/又は測定が実行できたかどうかを保持する実行性データベース23(図1中の実行性DB)、物性を予測する物性予測モデル24、合成及び/又は測定を実行できるかどうかを予測する実行可能性モデル25、及びコンピュータ・プログラムである探索エージェント26(以下では、探索エージェント26とする)を含む記憶部201(HDD、SSD、ROM、等)、さらに、探索エージェント26を記憶部201から読み出して処理を行う処理部202(プロセッサ(CPU、GPU、GPGPU、ニューラルネットワークアクセラレータ、またはこれらの複数の組み合わせ、等)、制御装置を操作するユーザインタフェース(キーボード、マウス、タッチパネル、マイク(音声入力)、カメラ(顔などの画像入力))等からなる操作部203、または処理部202の処理結果、等を表示する表示部204(ディスプレイ等)を含む。
 制御インターフェース21、処理部202、記憶部201、操作部203、及び表示部204等の制御装置20における各構成部は共通の制御バス・データバスを介して相互に情報のやり取りができる。なお、物性予測モデル24及び実行可能性モデル25は、物性データベース22(図1中の物性DB)または実行性データベース23(図1中の実行性DB)と同じ記憶部201に格納されていてもよいし、別の記憶装置に格納されていてもよい。物性予測モデル24、実行可能性モデル25、または探索エージェント26についても、物性予測モデル24及び実行可能性モデル25と同じ記憶部201に格納されていてもよいし、別の記憶装置に格納されていてもよい。さらに、記憶部201の一部は、制御装置20とは別装置(例えば外部記憶装置50等)として構成され、制御ネットワークNに接続された図示しないネットワークインタフェースを介して接続されていてもよい。また、図示しないオペレーティングシステムの機能を用いて、記憶部201と別の記憶装置(例えば外部記憶装置50等)が連携して仮想記憶を構成していてもよい。また図示しないが、制御インターフェース21と制御ネットワークNの間、及び制御ネットワークNと合成装置11、分析装置12、または測定装置13の間では、ルータ、スイッチ等の通信制御装置・通信インフラストラクチャを介したデータ通信を行うようにされていてもよい。
 なお、探索エージェント26は、上述したように、コンピュータ・プログラムとして機能を実現してもよいし、図示しない専用プロセッサとして、ハードウェアによりその機能を実現し、プロセッサと連携、またはプロセッサの一部として動作するようにしてもよい。さらに、後述するように、物性予測モデル24及び実行可能性モデル25は、再学習によって更新されるようにされている。物性予測モデル24及び実行可能性モデル25は、ベイズ最適化、ニューラルネットワーク、SVM(Support Vector Machine)等の機械学習アルゴリズムによって実現される機械学習モデルであってもよい。
 ここで、記憶部201は、さらに図示しない機械学習アルゴリズムを実行するソフトウェア・プログラムを格納しており、処理部202がこのプログラムを処理することにより、記憶部201から物性予測モデル24を読み出し、図示しない機械学習データを用いて、物性予測モデル24を更新することができる。この場合、処理部202は、更新途中の物性予測モデル24を物性予測モデル更新領域24‘にコピーし、物性予測モデル24の更新後のモデルを生成する。
 このようにして物性予測モデル24に基づいて、更新された物性予測モデルの生成を行うことができる。すなわち、処理部202は、機械学習アルゴリズムを実行するソフトウェア・プログラムにより、記憶部201から読み出した機械学習モデルである物性予測モデル24を物性予測モデル更新領域24‘にコピーし、このコピーに対して機械学習データを適用することにより、更新後の機械学習モデルの製造を行うことができる。製造された更新後の機械学習モデルを、再度、物性予測モデル24として、記憶部201に書き込むことによって、継続的に、更新後の機械学習モデルを物性予測モデル24として利用することができる。
 このように、制御装置20は、更新された機械学習モデルである物性予測モデル24の製造を行う処理を行うことができる。同様にして、実行可能性モデル25に基づいて、更新された実行可能性モデルの生成を行うことができる。この場合には、記憶部201の実行可能性モデル更新領域25‘を使用する。すなわち、処理部202は、機械学習アルゴリズムを実行するソフトウェア・プログラムにより、記憶部201から読み出した機械学習モデルである実行可能性モデル25を実行可能性モデル更新領域25‘にコピーし、このコピーに対して機械学習データを適用することにより、更新後の機械学習モデルの製造を行うことができる。製造された更新後の機械学習モデルを、再度、実行可能性モデル25として、記憶部201に書き込むことによって、継続的に、更新後の機械学習モデルを実行可能性モデル25として利用することができる。
 このように、制御装置20は、更新された機械学習モデルである実行可能性モデル25の製造を行う処理を行うことができる。表示部204には、操作部203からの入力に応じて、図4から図20に例示されるようなデータ構造を表示することができる。また、処理部202は、操作部203からの入力に応じて、図2に示す処理を開始、中止、または修正などの指示を行うことができる。
[1-1-2.材料探索製造システムの全体処理フロー]
 次に、図2を用いて材料探索製造システムの全体処理フローを説明する。図2は、材料探索製造システムによる処理手順を示すフローチャートである。例えば、図2は、材料探索製造システム1により行われる材料製造方法の一例を示す。例えば、材料探索製造システム1は、探索エージェント26により駆動され、次の手順通り材料探索を行う。
 図2に示すように、材料探索製造システム1は、材料探索空間の範囲、材料物性の目標値を設定する(ステップS1)。そして、材料探索製造システム1は、材料探索空間を設定する(ステップS2)。例えば、材料探索製造システム1は、物性予測モデル24による予測結果、及び(又は)実行可能性モデル25による予測結果を用いて、材料探索空間に含まれる材料の優先順位をつける。例えば、物性予測モデル24または実行可能性モデル25の予測結果(出力)は、回帰分析のデータであってもよいが、詳細は後述する。また、物性予測モデル24及び実行可能性モデル25は、ベイズ最適化、ニューラルネットワーク、SVM  等の機械学習アルゴリズムを用いた機械学習のモデルでもよい。これについての詳細については後述する。
 そして、材料探索製造システム1は、材料の優先順位に基づいて候補材料を選定する(ステップS3)。例えば、材料探索製造システム1の制御装置20は、物性データベース22の材料物性情報と実行性データベース23の実行可能性情報に基づいて合成対象の材料を選択する。材料探索製造システム1は、候補材料を合成する(ステップS4)。例えば、材料探索製造システム1の制御装置20は、材料探索製造システム1の材料製造装置10に対して、選択した材料の合成処理を指示し、材料製造装置10は、制御装置20からの指示に応じて材料の合成処理を行う。
 材料探索製造システム1は、合成に失敗した場合(ステップS5:No)、実行性データベース23の「実行性」を示す項目において、合成が「失敗」したことを示すようにデータを更新し、さらに実行可能性モデル25において、合成の失敗した材料について「実行可能性」の「予測値」が、合成が失敗した条件において低くなるように更新を行い(ステップS9)、ステップS2に戻って処理を繰り返す。例えば、材料探索製造システム1の材料製造装置10は、合成処理の結果を材料探索製造システム1の制御装置20に送信し、制御装置20は、材料製造装置10からの合成処理結果に基づいて、実行性データベース23の実行可能性情報を更新する。このように実行性データベース23及び実行可能性モデル25を更新することにより、次回の材料探索の際には、合成に失敗した材料については、同じ合成条件下では「実行可能性」の予測値が低くなるようにすることで、次回以降の候補材料の選定において、合成失敗と同一の条件下では優先順位が低くなるようにし、合成に失敗した材料以外の材料が選択される確率を高くすることができる。
 材料探索製造システム1は、合成に成功した場合(ステップS5:Yes)、材料物性の測定を行う(ステップS6)。
 材料探索製造システム1は、物性測定に失敗した場合(ステップS7:No)、実行性データベース23の「実行性」を示す項目において、合成は「成功」したが、測定が「失敗」したことを示すようにデータを更新し、さらに、実行可能性モデル25において、合成の成功した材料について「実行可能性」の「予測値」が、測定が失敗した条件において低くなるように更新を行い(ステップS9)、ステップS2に戻って処理を繰り返す。このように実行性データベース23及び実行可能性モデル25を更新することにより、次回の材料探索の際には、測定に失敗した材料については、同じ合成条件下では「実行可能性」の予測値が低くなるようにすることで、次回以降の候補材料の選定において、物性測定失敗と同一の条件下では優先順位が低くなるようにし、合成に失敗した材料以外の材料が選択される確率を高くすることができる。
 材料探索製造システム1は、測定に成功した場合(ステップS7:Yes)、物性値が目標値に到達しているか否かを判定する(ステップS8)。
 材料探索製造システム1は、物性値が目標値に到達していない場合(ステップS8:No)、物性データベース22の「物性」を測定された物性値で更新するとともに、物性予測モデル24において、合成が成功した材料について同一の合成条件において、測定された物性値が目標値よりも低く予測されるように更新を行う(ステップS10)。また、実行性データベース23の「実行性」を示す項目において、合成及び測定がともに「成功」したことを示すようにデータを更新し、さらに、実行可能性モデル25において、合成の成功した材料について「実行可能性」の「予測値」が、合成が成功した条件において高くなるように更新を行い(ステップS9)、ステップS2に戻って処理を繰り返す。このように物性データベース22及び物性予測モデル24を更新することにより、次回の材料探索の際には、目標値の達成に失敗した材料については、同じ合成条件下では、「物性」の予測値が目標値よりも低くなるようにすることで、次回以降の候補材料の選定において、目標値達成が失敗したものと同一の条件下では優先順位が低くなるようにし、目標値達成に失敗した材料以外の材料が選択される確率を高くすることができる。
 材料探索製造システム1は、物性値が目標値に到達した場合(ステップS8:Yes)、物性データベース22の「物性」を測定された物性値で更新するとともに、物性予測モデル24において、合成が成功した材料について同一の合成条件において、測定された物性値が予測されるように更新を行う(ステップS11)。また、実行性データベース23の「実行性」を示す項目において、合成及び測定がともに「成功」したことを示すデータに更新し、さらに、実行可能性モデル25において、合成の成功した材料について「実行可能性」の「予測値」が1または1に限りなく近い値となるように実行可能性モデルを更新し(ステップS12)、材料探索を終了する。このように実行性データベース23及び実行可能性モデル25を更新することにより、次回の材料探索の際には、合成成功した材料については、予測において「実行可能性」の予測値が1となることで、または、予測前に「合成済み材料リスト」と照合をすることにより、次回以降の候補材料の選定において、優先順位が低くなるようにし、さらには、すでに材料合成に成功した材料が選択されないようにすることができる。なお、以下の記載においては、例えば図10から図15において、物性予測モデル24に基づく予測結果について「優先順位(priority)」、実行可能性モデル25に基づく予測結果について「実行可能性(feasibility)」と使い分けることがあるが、これらは実施形態の一つであると理解されたい。本発明においては、これら二つのモデルの予測結果に基づいて決定される選択順序のことを、より上位的な概念として「優先順位」と総称する。
 材料探索を行う従来技術では、材料探索は、一般に、高精度第一原理計算、QM/MM計算、分子動力学法、粗視化分子動力学法、マルチスケールシミュレーション等、計算コストのかかる手法を用いていた。こうした計算理論に基づく材料探索においては、また、材料製造における実行可能性(合成可能性、測定可能性)を考慮していなかったため、実際には合成できない材料や測定できない材料を候補材料として選択し、選択された材料を用いて合成や評価しようとして失敗していたため、適切な材料を選択することができなかった。このように、材料探索を行う従来技術では、材料製造における実行可能性(合成可能性、測定可能性)を考慮していないため、実際には合成できない材料や測定できない材料を候補材料としていたため、探索効率が悪かった。
 一方で、材料探索製造システム1における材料探索では、合成の実行性を加味して探索を行うため、合成の実行性に基づく材料合成を可能にすることができる。また、材料探索製造システム1における材料探索では、合成・測定処理を踏まえて、実行可能性モデル25を更新することで、成功可能性を考慮することで、予測精度を上げるとともに、少ない実行回数で特性(物性)の優れた新規材料の発見をすることができる。さらに、合成の実行性を考慮して合成すべき材料の選択を行うため、設定された探索空間において材料探索を行う場合であっても、従来であれば、合成の実績のなかったというだけで選択肢から排除されていた材料についても、優先的に合成候補として選択されるようにすることにより、従来であれば探索される機会のなかった材料について、まずは合成処理の機会を与えることができ、新規な材料を探索できる可能性を高くすることができる。
 上述のように、材料探索製造システム1は、自動材料製造装置、物性予測モデル、実行可能性(合成可能性、測定可能性)モデルを取り込んだ材料探索製造システムである。そのため、材料探索製造システム1は、材料の高効率な探索・合成を実現でき、材料の合成可能性を確かめ、合成可能・測定可能な材料のデザインスペースを速やかに得ることにより、探索効率を向上させることができる。
[1-2.材料探索製造システムの各構成]
 ここから、材料探索製造システム1の各構成の概要について説明する。
[1-2-1.材料製造装置]
 材料製造装置10に関する点について説明する。まず、材料製造装置10に関するハードウェアについて説明する。合成装置11は、混合・反応容器、試薬・溶媒ストック、生成物分離機能を内部に持つか、これら機能を持つ外部機器と接続されており、これら構成部は相互に内容物の受け渡しができる。また、合成装置11は、制御装置20からの命令に基づいて試薬・溶媒の混合、候補材料の合成、生成物の分離を行う。また、合成装置11はこれら操作が成功したかどうか検出部(検出用回路またはプロセッサ上で動作する検出用ソフトウェア・プログラム。以下同じ)を用いて判定を行い、判定結果を制御装置20に報告(送信)する。
 分析装置12は、合成装置11によって合成された生成物を受け取り、生成物が候補材料と一致するか判定する。これにより、分析装置12は、分析結果を生成する。また、分析装置12は分析が成功したかどうかを判定する(成功判定結果を生成する)検出部がついており、分析結果及び成功判定結果を制御装置20に送信する。
 測定装置13は、合成装置11によって合成され、分析装置12によって候補材料と一致すると判定された材料を受け取り、材料物性の測定を行う。これにより、測定装置13は、測定結果を生成する。測定装置13は、物性の測定が成功したかどうかを判定する(成功判定結果を生成する)検出部がついており、測定結果と成功判定結果を制御装置20に送信する。
 材料製造装置10は、材料を製造する材料製造を行う。例えば、材料製造装置10は、制御装置20による制御に応じて、材料を製造する材料製造を行う。材料製造装置10は、材料物性情報と実行可能性情報を用いて選択された材料の合成処理の指示を受信した場合、合成処理の指示に応じた材料を製造する。例えば、材料製造装置10は、合成処理の指示が示す材料を対象として、合成装置11により材料製造を行う。なお、材料製造装置10は、複数の異なる材料製造装置10と通信ネットワークを通じてデータ共有や処理制御において連携するように構成されていてもよく、また、材料製造装置10は、材料製造に関わる合成、分析、または測定処理のうち、少なくとも一つの機能を有していればよい。
 次に、材料製造装置10に関するソフトウェアについて説明する。材料製造装置10は、物性を評価する物性評価機能を有するソフトウェアを内部に持つか、この機能を持つ外部機器と接続し利用してもよい。その場合、材料製造装置10は、制御装置20からの命令によって材料シミュレーションを実行する。材料製造装置10は、材料合成が成功したかどうかを判定し(成功判定結果を生成し)、成功判定結果と材料合成結果を制御装置20に送信する。
 なお、材料製造装置10はハードウェアで構成されていてもよいし、ソフトウェアで構成されていてもよい。また、材料製造装置10は複数あってもよく、また、インターネット等の所定のネットワーク経由で接続されていてもよいが、この点については後述する。
[1-2-2.制御システム]
 次に、制御装置20に関する点について説明する。物性予測モデル24は、物性データベース22のデータから推定され、材料から物性値を予測する回帰モデルである。回帰モデルは、材料に関して予測値のみを返すものでも、予測値と予測値の分散を返すものでもよい。
 実行可能性モデル25は、次の式(1)で表される。
Figure JPOXMLDOC01-appb-M000001
 ここで、FFSは、実行可能性モデル25に対応し、FSYNTHは、合成可能性モデル(Synthesizability Model。値域 0-1)であり、FMEASは、評価可能性モデル(Measurability Model。値域 0-1)である。合成可能性モデルFSYNTHは、合成が成功するかどうかを予測するモデルであり、次の式(2)で表される。
Figure JPOXMLDOC01-appb-M000002
 ここで、FPATHは、合成経路モデル(Synthetic Path Model)であり、FStepは、ステップ合成可能性モデル(Synthetic Step Model)であり、NSは、合成ステップ数である。合成経路モデルFPATHは、合成経路が存在するかどうかを示すモデルであり、次の式(3)で表される。
Figure JPOXMLDOC01-appb-M000003
 合成経路モデルFPATHは、0か1の値となる。例えば、合成経路モデルFPATHは、合成経路があれば1、それ以外は0となる。また、合成ステップ数NSは、次の式(4)を満たす。
Figure JPOXMLDOC01-appb-M000004
 例えば、NMAXは、合成ステップ数の最大値を示す。
 ステップ合成可能性モデルFStepは、1ステップの合成過程が成功するかどうかを予測するモデルであり、次の式(5)で表される。
Figure JPOXMLDOC01-appb-M000005
 ここで、以下の項(6)は、ステップ合成収率モデル(Yield Model。値域 0-1)である。
Figure JPOXMLDOC01-appb-M000006
 また、以下の項(7)は、生成物同一視モデル(Product Identifiability Model。値域 0-1)である。
Figure JPOXMLDOC01-appb-M000007
 また、以下の項(8)は、分取性モデル(Product Isolatability Model。値域 0-1)である。
Figure JPOXMLDOC01-appb-M000008
 制御装置20は、それぞれ合成ステップの収率の予測、生成物が目的材料と一致することを判定できるかどうかの予測、生成物を分取できるかどうかの予測を行う。評価可能性モデルFMEASは、測定が成功するかどうかを予測するモデルである。
 図3が上述した実行可能性モデル25による処理のフローに対応する。図3は、実行可能性に関する処理手順を示すフローチャートである。実行可能性モデル25は、図3中のステップS21~S24に対応する各処理で各値を導出し、その値を基に実行可能性を示す出力値(スコア)を生成する。例えば、実行可能性モデル25は、合成経路モデルFPATHによる値を導出する(ステップS21)。また、実行可能性モデル25は、ステップ数に応じてステップ合成可能性モデルFStepによる値を導出し(ステップS22、S23)。なお、図3では、合成ステップの1回目とNs回目のみを図示するが、実行可能性モデル25は、1回目からNs回目までの各々に対応するステップ合成可能性モデルFStepによる値を導出する。また、実行可能性モデル25は、評価可能性モデルFMEASによる値を導出する(ステップS24)。そして、実行可能性モデル25は、合成経路モデルFPATH、ステップ合成可能性モデルFStep、評価可能性モデルFMEAS等による各値を用いて、実行可能性モデルFFSの値を導出する。
 なお、実行可能性モデル25に含まれるモデル群は、すべて材料製造過程において得られた値やシミュレーション結果から推定するモデルを用いてもよいし、定数や簡略化された経験式で表したものを用いてもよい。
 探索エージェント26は、物性予測モデル24から得られる予測値、及び/又は実行可能性モデル25から得られる値を元に候補材料の優先順位を決定し、この優先順位に従って次に合成・測定する候補材料を選定し、選定した候補材料の合成と測定を実行する。合成と測定は、探索エージェント26から制御インターフェース21を通じて材料製造装置10に命令を出し、実行する。制御装置20は、材料製造装置10から制御インターフェース21を通じて報告される「実行できたかどうか」(実行性データ)、「測定値」(物性データ)を受け取り、それぞれ実行性データベース23と実行可能性モデル25、物性データベース22と物性予測モデル24を更新する。探索エージェント26は、制御インターフェース21と同一のコンピュータ装置に上にあってもよいし、別のコンピュータ装置上にあってもよい。
 上述したように、例えば、制御装置20は、物性データベース22に記憶された材料物性情報と、実行性データベース23に記憶された実行可能性情報を用いて材料を選択する材料選択を行う。例えば、制御装置20は、選択された材料の合成処理の指示を材料製造装置10に対して行う。例えば、制御装置20は、材料製造装置10からの合成処理結果に基づいて、実行性データベース23に記憶された実行可能性情報を更新する。
[1-2-2-1.データ]
 ここから、制御装置20が用いるデータの例について図を参照しつつ説明する。
 まず、図4を用いて、制御装置20が用いる物性データベース22の一例について説明する。図4は、本開示の実施形態に係る物性データベースの一例を示す図である。図4に示すデータベースDB1は、物性データベース22に対応する。データベースDB1は、物性予測モデル24の学習に用いるデータ(学習データ)を記憶する。図4の例では、データベースDB1は、「ID」、「分子ID」、「記述子」、「物性値」、「材料属性」といった項目が含まれる。図4に示すように、物性データベースであるデータベースDB1には、二以上の合成処理対象の材料が含まれる。
 「ID」は、データを識別するための識別情報を示す。「分子ID」は、分子を識別するための識別情報を示す。「記述子」は、記述子を示す。図4の例では、「LabuteASA」、「Chi0v」、「Chi0n」、「Chi0」、「Kappa1」等が記述子として用いられる場合を示すが、図4は一例に過ぎず、「記述子」は任意のものが採用可能である。「記述子」の項目には、対応する分子の化学的特徴等を数値化したデータ(値)が記憶される。
 「物性値」は、分子の物性値を示す。図4の例では、「Heat Capacity(熱容量)」が物性値として用いられる場合を示すが、図4は一例に過ぎず、「物性値」は任意のものが採用可能である。「物性値」は、機械的性質、熱的性質、電気的性質、磁気的性質、光学的性質、電気化学的特性、薬効、毒性、抗体反応、細胞との相互作用、体内器官との相互作用、細胞内の輸送性、生体内輸送性、吸着性、溶解性等の様々な性質に関する物性値であってもよい。「物性値」の項目には、その分子が有する性質に関するデータ(値)が記憶される。「物性値」の項目は、その分子について測定が成功した場合に、測定した物性値に値が更新(アップデート)される。例えば、制御装置20は、測定結果を基に「物性値」の値を更新する。
 なお、図4に示す「物性値」に関するデータ構造は一例に過ぎず、データ構造は、例えばリストの形式であってもよい。例えば、「物性」=>リスト(物性値:値、…)等の形式であってもよい。例えば、ID: 1、物性: {”HeatCapacity":P1、"solubility":P2、…}等の形式であってもよい。
 「材料属性」は、分子(材料)の材料としての属性を示す。図4の例では、説明のために1つの材料属性を格納する「#1」のみを示すが、「#2」、「#3」等、材料属性の数だけ設けられる。「材料属性」は、低分子、色素、 高分子、蛍光・同定同位体標識、自己組織化材料・構造体、生体材料(糖類、ペプチド、ポリペプチド、アミノ酸、タンパク質、脂肪化合物、DNA(Deoxyribonucleic Acid)等)、有機薄膜(蒸着、塗布プロセス)、無機材料(固相法、共沈法、溶融急冷法、ゾルゲル法等)、ナノ粒子、金属錯体、無機薄膜(ALD(Atomic layer deposition)、スパッタリング等)、合成生物学的手法(遺伝子組み換えと細菌利用による材料合成)に基づく合成材料、結晶構造、ナノ構造、マイクロ構造を持つ機能性材料等の様々な材料属性であってもよい。「材料属性」の項目には、その分子(材料)が有する材料属性を示す情報が記憶される。
 なお、図4に示す「材料属性」に関するデータ構造は一例に過ぎず、データ構造は、例えばリストの形式であってもよい。例えば、「属性」=>リスト(属性値:値、…)等の形式であってもよい。例えば、ID: 1、属性: {低分子、色素、…}等の形式であってもよい。このように、物性データベース22の一例であるデータベースDB1に記憶される情報(材料物性情報)は、少なくとも二の項目を含むように構造化されており、少なくとも二の項目のうちの一は、材料の属性項目である。
 なお、データベースDB1は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、データベースDB1は、過去に合成に成功した分子(材料)を示す情報を記憶する。データベースDB1は、過去に合成に成功した分子(材料)を示すフラグ(値)をその分子IDに対応付けて記憶してもよい。データベースDB1は、過去に合成に成功した分子を除外してもよい。
 次に、図5を用いて、制御装置20が用いる実行性データベース23の一例について説明する。図5は、本開示の実施形態に係る実行性データベース23の一例を示す図である。図5に示すデータベースDB2は、実行性データベース23に対応する。例えば、データベースDB2は、実行可能性モデル25の学習に用いるデータ(学習データ)を記憶する。図5の例では、データベースDB2は、「ID」、「分子ID」、「記述子」、「実行性」といった項目が含まれる。
 「ID」は、データを識別するための識別情報を示す。「分子ID」は、分子を識別するための識別情報を示す。「記述子」は、記述子を示す。図5の例では、「TPSA」、「qed」、「SlogP_VSA2」、「SlogP_VSA5」等が記述子として用いられる場合を示すが、図5は一例に過ぎず、「記述子」は任意のものが採用可能である。「記述子」の項目には、対応する分子の化学的特徴等を数値化したデータ(値)が記憶される。
 「実行性」は、分子の実行性を示す。図5の例では、「合成合否」が実行性に関する項目として用いられる場合を示すが、図5は一例に過ぎず、「実行性」は任意のものが採用可能である。「実行性」は、測定可否等の様々な実行性に関する要素であってもよい。「実行性」の項目には、その要素に関する実行可否を示すデータ(値)が記憶される。
 なお、データベースDB2は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、データベースDB2は、過去に合成に成功した分子(材料)を示す情報を記憶する。データベースDB2は、過去に合成に成功した分子(材料)を示すフラグ(値)をその分子IDに対応付けて記憶してもよい。データベースDB2は、過去に合成に成功した分子(材料)を除外してもよい。また、実行性データベース23について、データベースDB2以外の例については後述する。
 ここで、物性データベース22及び実行性データベース23に含まれるデータレコードのデータについては、相互にアクセス可能なように参照リンクを保持するようにしてもよい。またはエージェントソフトウェアが、リレーショナルデータベース管理ソフトウェアを介して、これら二つのデータベース間のマージ、フィルターオペレーション等を行い、任意のデータレコードのデータに対して、統合的にアクセス可能なようにしてもよい。なお、本開示においてデータベースと書いているものは、複数の同種のデータテーブルを含むことを想定しており、明細書中に、データテーブルを示唆する記載がある場合には、データベース中で管理されるテーブルを意味することがあるものとし、データベースの説明においてテーブルという用語が含まれている場合には、上位概念としてのデータベースを示唆するものとする。
 次に、図6を用いて、制御装置20が用いる材料テーブルの一例について説明する。図6は、本開示の実施形態に係る材料テーブルの一例を示す図である。図6に示すテーブルDB3は、制御装置20が有する。例えば、テーブルDB3は、実行可能性モデル25の学習に用いるデータ(学習データ)を記憶する。図6の例では、テーブルDB3は、「ID」、「分子ID」、「SMILES」といった項目が含まれる。
 「ID」は、データを識別するための識別情報を示す。「分子ID」は、分子を識別するための識別情報を示す。「SMILES」は、分子のSMILES記法による表現を示す。「SMILES」の項目には、分子の化学構造をASCII符号の英数字で文字列化した情報が記憶される。なお、無機材料等、有機分子以外を取り扱う場合は、「分子ID」の代わりに「材料ID」等、「SMILES」の代わりに「組成比」等を用いてもよい。「材料ID」は、材料を識別するための識別情報を示す。「組成比」は材料を構成する元素種及びその含有比率を示す数値の列である。
 なお、テーブルDB3は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
[1-2-2-2.モデル]
 次に、制御装置20によるモデルを用いた処理の概要の一例について図を参照しつつ説明する。
 まず、図7を用いて、制御装置20による物性予測モデル24を用いた物性の予測の一例について説明する。図7は、本開示の実施形態に係る物性の予測の一例を示す図である。
 図7に示すように、制御装置20は、分子IDにより識別される分子がSMILES記法による表現された文字列を用いて、各記述子に対応する値を導出する。そして、制御装置20は、各記述子に対応する値を物性予測モデル24に入力することにより、物性予測モデル24から、物性の予測値を出力させる。図7では、物性予測モデル24が「LabuteASA」、「Chi0v」、「Chi0n」、「Chi0」、「Kappa1」の各記述子に対応する値を入力として、物性「Heat Capacity」について予測される平均及び分散を、物性「Heat Capacity」の予測値として出力する。例えば、制御装置20は、分子(材料)に関する材料特徴量を物性予測モデル24に入力することにより、物性予測モデル24から、物性の予測値(以下「第一の予測値」ともいう)を出力させる。例えば、物性予測モデル24は、材料を構成する二以上の材料各々の材料特徴量の入力に応じて第一の予測値を出力する。ここでいう材料特徴量とは、例えば分子構造から一意に求まる数値列で、例えば、分子内の原子間の結合関係から求まる分子フィンガープリント(ECFP4)やクーロン行列、含まれる原子種の個数等様々な構成的、構造的特長から算出される分子記述子、グラフコンボリューショナルニューラルネット(GCN)によって抽出された分子の特徴ベクトル等であってもよい。
 上述した入力及び出力は、一例に過ぎず、物性予測モデル24は様々な情報を入力として、様々な情報を出力してもよい。例えば、物性予測モデル24は、分散ではなく、標準偏差を出力してもよい。また、物性予測モデル24は、各記述子に対応する値を入力として、物性に関する1つの値とその確信度を示す値を出力してもよい。この場合、制御装置20は、物性に関する1つの値を平均とし、確信度を基に分散を算出してもよい。例えば、制御装置20は、確信度が高い程準偏差を小さく算出してもよい。物性予測モデル24は、物性ごとに学習されることにより複数生成されてもよい。また、物性予測モデル24は、複数の物性を出力するように学習されたモデルであってもよい。
 制御装置20は、物性データベース22に記憶されたデータを学習データとして、物性予測モデル24を学習アルゴリズムにより訓練し、更新する。なお、制御装置20による物性予測モデル24の学習は、いわゆる教師有り学習であり詳細な説明は省略するが、物性予測モデル24の学習が可能であれば、制御装置20は、どのような処理により物性予測モデル24を学習してもよい。
 まず、図8を用いて、制御装置20による実行可能性モデル25を用いた実行可能性の予測の一例について説明する。図8は、本開示の実施形態に係る実行可能性の評価の一例を示す図である。
 図8に示すように、制御装置20は、分子IDにより識別される分子がSMILES記法による表現された文字列を用いて、各記述子に対応する値を導出する。そして、制御装置20は、各記述子に対応する値を実行可能性モデル25に入力することにより、実行可能性モデル25から、物性の予測値(以下「第二の予測値」ともいう)を出力させる。例えば、実行可能性モデル25は、材料を構成する二以上の材料各々の材料特徴量の入力に応じて第二の予測値を出力する。図8では、実行可能性モデル25が「TPSA」、「qed」、「SlogP_VSA2」、「SlogP_VSA5」の各記述子に対応する値を入力として、実行可能性を示す値を出力する。例えば、実行可能性モデル25は、各記述子に対応する値を入力として、0~1の間で実行可否を示す値を出力する。実行可能性モデル25は、1に近い程実行可能性が高いことを示す値を出力する。例えば、制御装置20は、分子(材料)に関する材料特徴量を実行可能性モデル25に入力することにより、実行可能性モデル25から、実行可能性を示す値を出力させる。
 制御装置20は、実行性データベース23に記憶されたデータを学習データとして、実行可能性モデル25を学習アルゴリズムにより訓練し、更新する。なお、制御装置20による実行可能性モデル25の学習は、いわゆる教師有り学習であり詳細な説明は省略するが、実行可能性モデル25の学習が可能であれば、制御装置20は、どのような学習アルゴリズムによる訓練処理により実行可能性モデル25を学習してもよい。
[1-3.探索並びに材料製造処理後のデータベース及びモデルの更新処理例]
 次に、探索並びに材料製造処理後のデータベース及びモデルの更新処理の一例について説明する。
[1-3-1.物性予測モデルのみを用いた探索並びに材料製造処理後のデータベース及びモデルの更新]
 まず、物性予測モデル24のみを用いた処理の一例について図9を用いて説明する。図9は、物性予測モデルを用いた探索の一例を示す図である。図9に示す処理は、実行性データベース23に関わる処理以外は、図2に示したフローチャートの処理の流れに対応する。
 図9中の6つのテーブル(以下「探索用テーブル#1」ともいう)の各々は、材料の選択に用いられる材料の一覧(リスト)情報であり、分子を対象とした処理(図2の処理)の1回目~6回目の各々における処理開始時点の状態に対応する。図9中の6つの探索用テーブル#1は、1回目~6回目の処理(図2の処理)後における探索用テーブル#1の更新を示す。例えば、図9中の左上段に配置されたテーブルが1回目における探索用テーブル#1に対応する。例えば、図9中の中央上段に配置されたテーブルが2回目における探索用テーブル#1、すなわち1回目の処理後における探索用テーブル#1に対応する。
 探索用テーブル#1は、「分子ID」、「priority」、「合成成功」等の項目を有する。「分子ID」は、分子を識別するための識別情報を示す。「priority」は、優先順位を示す値である。例えば、「priority」は、対応する分子の情報の入力に応じて、物性予測モデル24が出力した値(スコア)である。例えば、「priority」は、材料物性情報に基づく材料の第一の予測値である。第一の予測値は、例えば物性データベース22に登録された材料を構成する二以上の材料各々の材料特徴量に基づく入力に応じて物性予測モデル24から出力される。探索用テーブル#1では、「priority」の値が大きい方から順に1位から順に優先順位が割り当てられる。
 なお、「priority」の末尾に配置した数値(「1」等)は、更新の回数を示す。例えば、末尾に数値が無い「priority」は更新前、すなわち処理開始時点の「priority」を示す。また、「priority1」は1回目の処理後の更新が行われた時点の「priority」を示す。このように、「priority」の後ろの数字は更新回数を示すための便宜上のものであり、「priority」と「priority」の末尾に数値があるものとは、同じ項目「priority」である。
 「合成成功」は、合成が成功するか否かを示す。なお、図9では、どこで成功するかを示すために「合成成功」に値が格納された状態を示すが、合成処理前の分子の「合成成功」の値は不明であってもよい。なお、探索用テーブル#1には、「測定」等の、測定処理の成否を示す項目が含まれてもよい。
 材料探索製造システム1は、1回目の処理では優先順位が1位の分子ID「m100275」により識別される分子を対象として合成処理を行う。図9では、分子ID「m100275」により識別される分子は合成が失敗となり、材料探索製造システム1は、データの更新を行わない。なお、図9において、各探索の間の白抜きの矢印とともに「成功(DB更新)」または「失敗(DB不変)」と記載されている。この実施例においては、DBとは物性データベース22のことをいう。また、図9から図15までにおいて共通に、「成功」とは、合成の成功かつ測定の成功(図2のS7において「YES」)に該当することを意味し、「失敗」とは、合成の失敗(図2のS5において「NO」)または測定の失敗(図2のS7において「NO」)に該当することを意味する。すなわち、物性データベース22は、合成及び測定が成功した場合には、その後目標値を達成したか否か(図2のS8)に関わらず、データが更新される(DB更新)が、そうでない場合には、データは更新されず、不変である(DB不変)。なお、図9においては、測定については言及されていないが、合成に成功した場合には、必ず測定も成功していることを想定している。
 材料探索製造システム1は、2回目及び3回目の処理でも優先順位が2位及び3位の分子は合成が失敗となり、材料探索製造システム1は、データの更新を行わない。
 材料探索製造システム1は、4回目の処理では優先順位が4位の分子ID「m059059」により識別される分子を対象として合成処理等を行う。図9では、4回目の処理において、分子ID「m059059」により識別される分子は合成及び測定が成功したものとする。この場合、材料探索製造システム1は、物性データベース22において、優先順位が4位の分子ID「m059059」の物性値に関するデータの更新を行う。
 材料探索製造システム1は、さらに、更新後の物性データベース22を用いて物性予測モデル24を再学習(更新)する。そして、材料探索製造システム1は、更新後の物性予測モデル24を用いて、「priority」の値を更新する。図9中の中央下段に配置されたテーブル(5回目における探索用テーブル#1)以降の「priority1」が、更新後の物性予測モデル24を用いて導出されたpriorityの値に対応する。
 そして、材料探索製造システム1は、「priority1」の値に基づく優先順位で1位から順に5回目及び6回目の処理を行う。例えば、材料探索製造システム1は、上述した処理を所望の物性値を満たす分子が合成されるまで繰り返す。
[1-3-2.物性予測モデルと実行可能性モデルを用いた探索並びに材料製造処理後のデータベース及びモデルの更新]
 次に、物性予測モデル24と実行可能性モデル25を用いた処理の一例について図10を用いて説明する。図10に示す処理は、図2に示したフローチャートの処理の流れに対応する。なお、図10において図9と同様の点については適宜説明を省略する。
 図10中の6つのテーブル(以下「探索用テーブル#2」ともいう)の各々は、材料の選択に用いられる材料の一覧(リスト)情報であり、分子を対象とした処理(図2の処理)の1回目~6回目の各々における処理開始時点の状態に対応する。図10中の6つの探索用テーブル#2は、1回目~6回目の処理(図2の処理)後における探索用テーブル#2の更新を示す。例えば、図10中の左上段に配置されたテーブルが1回目における探索用テーブル#2に対応する。例えば、図10中の中央上段に配置されたテーブルが2回目における探索用テーブル#2、すなわち1回目の処理後における探索用テーブル#2に対応する。図10の探索用テーブル#2は、材料を選択する処理に用いられる合成材料選択データ構造の一例を示す。
 探索用テーブル#2は、「分子ID」、「priority」、「feasibility」、「成功」等の項目を有する。「分子ID」、「priority」については、図9と同様である。「feasibility」は、実行可能性を示す値である。例えば、「feasibility」は、対応する分子の情報の入力に応じて、実行可能性モデル25が出力した値(スコア)である。例えば、「feasibility」は、実行可能性情報に基づく材料の第二の予測値である。第二の予測値は、例えば実行性データベース23に登録された材料を構成する二以上の材料各々の材料特徴量に基づく入力に応じて実行可能性モデル25から出力される。例えば、材料探索製造システム1は、「feasibility」の値が所定の閾値(例えば0.5等)以上である分子を処理対象とする。
 なお、「feasibility」の末尾に配置した数値(「1」等)は、更新の回数を示す。例えば、末尾に数値が無い「feasibility」は更新前、すなわち処理開始時点の「feasibility」を示す。また、「feasibility1」は1回更新が行われた時点の「feasibility」を示す。このように、「feasibility」の後ろの数字は更新回数を示すための便宜上のものであり、「feasibility」と「feasibility」の末尾に数値があるものとは、同じ項目「feasibility」である。
 探索用テーブルにおける項目としての「成功」は、合成及び測定が成功するか否かを示す。なお、図10では、どこで成功するかを示すために「成功」に値が格納された状態を示すが、処理前の分子の「成功」の値は不明であってもよい。また、図10において、各探索の間の白抜きの矢印とともに「成功」または「失敗」と記載されている。ここで、前出の通り、図9から図15までにおいて共通に、「成功」とは、合成の成功かつ測定の成功(図2のS7において「YES」)に該当することを意味し、「失敗」とは、合成の失敗(図2のS5において「NO」)または測定の失敗(図2のS7において「NO」)に該当することを意味する。物性データベース22は、合成及び測定が成功した場合には、その後目標値を達成したか否か(図2のS8)に関わらず、データが更新される(物性DB:更新)が、そうでない場合には、データは更新されず、不変である(物性DB:不変)。一方、実行性データベース23は、「成功」または「失敗」の如何に関わらず、データが更新される(実行性DB:更新)。なお、図9においては、測定については言及されていないが、合成に成功した場合には、必ず測定も成功していることを想定している。
 材料探索製造システム1は、優先順位が1位~3位の分子は、実行可能性モデル25によって出力される値であり、実行可能性を意味する「feasibility」の値が閾値(0.5)未満であるため、それらの分子を処理対象とはせず、その後の処理をスキップする。このように、材料探索製造システム1は、実行可能性に関する「feasibility」の情報を用いることで、不要な分子を対象とする処理を行わないため、処理効率を向上させることができる。
 そして、材料探索製造システム1は、1回目の処理では優先順位が4位であり、「feasibility」の値が閾値(0.5)以上である分子ID「m059059」により識別される分子を対象として合成処理等を行う。図10では、1回目の処理において、分子ID「m059059」により識別される分子は合成及び測定が成功したものとする。そのため、材料探索製造システム1は、その後、物性データベース22において分子ID「m059059」の物性値に関するデータの更新を行うとともに、実行可能性モデル25において、分子ID「m059059」の実行性に関するデータの追加(または更新)を行う。
 材料探索製造システム1は、さらに、更新後の物性データベース22を用いて物性予測モデル24を再学習(更新)する。そして、材料探索製造システム1は、更新後の物性予測モデル24を用いて、「priority」の値を更新する。図10中の中央上段に配置されたテーブル(2回目における探索用テーブル#2)以降の「priority1」が更新後の物性予測モデル24を用いて導出されたpriorityの値に対応する。
 また、材料探索製造システム1は、更新後の実行性データベース23を用いて実行可能性モデル25を再学習(更新)する。そして、材料探索製造システム1は、更新後の実行可能性モデル25を用いて、「feasibility」の値を更新する。図10中の中央上段に配置されたテーブル(2回目における探索用テーブル#2)以降の「feasibility1」が更新後の実行可能性モデル25を用いて導出されたfeasibilityの値に対応する。
 そして、材料探索製造システム1は、2回目の処理では更新後の探索用テーブル#2において優先順位が1位であり、「feasibility」の値が閾値(0.5)以上である分子ID「m100686」により識別される分子を対象として合成処理等を行う。図10では、分子ID「m100686」により識別される分子は合成が失敗したものとする(図2のS7において「NO」)。この場合、材料探索製造システム1は、実行性データベース23において分子ID「m100686」の実行性に関するデータの追加(または更新)を行う。
 例えば、材料探索製造システム1は、分子ID「m100686」により識別される分子の実行性に関する情報を、合成に失敗した分子の情報として実行性データベース23に追加(または更新)することにより、実行性データベース23を再度更新し、更新後の実行性データベース23を用いて実行可能性モデル25を再学習(更新)する。そして、材料探索製造システム1は、更新後の実行可能性モデル25を用いて、「feasibility」の値を更新する。図10中の右上段に配置されたテーブル(3回目における探索用テーブル#2)以降の「feasibility2」が2度目の更新後の実行可能性モデル25を用いて導出されたfeasibilityの値に対応する。
 そして、材料探索製造システム1は、3回目の処理では「priority1」及び「feasibility2」の値に基づいて処理を行う。また、材料探索製造システム1は、「priority」及び「feasibility」の値を更新し、更新した値を用いて4回目~6回目の処理を行うが、上述した処理を同様であるため詳細な説明は詳細する。例えば、材料探索製造システム1は、上述した処理を所望の物性値を満たす分子が合成されるまで繰り返す。このように、材料探索製造システム1は、少なくとも一つの項目を含むリスト形式で材料を指定し、優先順位の順に材料を選択する。このように、図10に示す探索用テーブル#2のデータ構造は、記憶部201及び処理部202を備える制御装置20を含む材料探索製造システム1で用いられ、制御装置20の記憶部201に記憶され、制御装置20の処理部202における合成対象材料の選択に用いられるデータ構造である。例えば、図10に示す探索用テーブル#2のデータ構造は、材料を識別するIDと、予測される材料の物性値に基づく優先順位を示す優先順位情報と、材料の合成の実行可能性を示す実行可能性情報と、合成処理の成否を示す合成成否情報とを含む。制御装置20の処理部202は、合成成否情報が未処理を示す材料群を対象として、優先順位情報に基づく優先順位が高い方から順に探索し、合成成否情報が示す合成処理の成否が所定の基準を満たす材料を選択する処理を実行する。
[1-4.探索並びに材料製造処理後のデータベース及びモデルの更新処理の詳細]
 ここで、上述した図9及び図10における処理の詳細を図示した図11~図15を用いて、各処理の詳細について説明する。
[1-4-1.物性予測モデルのみを用いた探索並びに材料製造処理後のデータベース及びモデルの更新]
 まず、図9に示した処理の詳細を図11及び図12を用いて説明する。図11及び図12は、物性予測モデル24を用いた処理の詳細例を示す図である。具体的には、図11は、図9における1回目~3回目の処理の詳細を示し、図12は、図9における4回目~6回目の詳細を示す。なお、図9と同様の点については詳細な説明を省略する。また、前出の通り、「成功」とは、合成の成功かつ測定の成功(図2のS7において「YES」)に該当することを意味し、「失敗」とは、合成の失敗(図2のS5において「NO」)または測定の失敗(図2のS7において「NO」)に該当することを意味する。
 図11及び図12に示す6つのテーブル(以下「候補材料テーブル#1」ともいう)は、図9中の探索用テーブル#1に対応するが、「合成成功」の項目に代えて、「合成合否」及び「測定合否」の項目を有する点で、探索用テーブル#1と相違する。候補材料テーブル#1の「合成合否」及び「測定合否」の項目は、実際に処理した結果が格納される。そのため、探索用テーブル#1では、処理を行っていない分子については、「合成合否」及び「測定合否」の項目は、「n/a」(値が未定)となる。材料探索製造システム1は、処理対象と下分子について、その処理結果に応じて、候補材料テーブル#1の「合成合否」及び「測定合否」の項目を更新する。
 図11に示すように、材料探索製造システム1は、初期データ#0(更新前の物性データベース22のデータ)を用いて初期モデル#0(物性予測モデル24)を学習アルゴリズムにより訓練する。材料探索製造システム1は、初期モデル#0を用いて、各分子のpriorityの評価(導出)を行い、そのpriorityの値を用いて処理を行う。ここで、priorityの評価(導出)においては、さまざまなパラメータを用いることができるが、実行性を考慮に入れるために、「合成合否」及び「測定合否」の項目がともに「n/a」(値が未定)であるものを優先するようにすることもできる。このようにすることによって、実行性を考慮して、新規材料の探索の可能性を高くすることができる。
 材料探索製造システム1は、1回目の処理では優先順位が1位の分子ID「m100275」により識別される分子を対象として合成等の処理を行う。材料探索製造システム1は、分子ID「m100275」により識別される分子の合成を失敗したため、分子ID「m100275」により識別される分子の合成合否を「0」に変更する。また、材料探索製造システム1は、2回目及び3回目の処理でも優先順位が2位及び3位の分子の合成を失敗したため、2位及び3位の分子の合成合否を「0」に変更する。
 図12に示すように、材料探索製造システム1は、4回目の処理では優先順位が4位の分子ID「m059059」により識別される分子を対象として合成処理を行う。材料探索製造システム1は、分子ID「m059059」により識別される分子の合成及び測定が成功したものとする。この場合、材料探索製造システム1は、候補材料テーブルにおいて、分子ID「m059059」により識別される分子の合成合否及び測定合否を「1」に変更する。
 また、材料探索製造システム1は、分子ID「m059059」により識別される分子の物性値情報を物性データベース22において更新する。さらに、材料探索製造システム1は、データ#1(更新後の物性データベース22のデータ)を用いてモデル#0(物性予測モデル24)を再学習(更新)する。そして、材料探索製造システム1は、更新後の物性予測モデル24を用いて、priorityの値を更新する。
 そして、材料探索製造システム1は、「priority1」の値に基づく優先順位で1位から順に5回目及び6回目の処理を行う。例えば、材料探索製造システム1は、上述した処理を所望の物性値を満たす分子が合成されるまで繰り返す。
[1-4-2.物性予測モデルと実行可能性モデルを用いた探索並びに材料製造処理後のデータベース及びモデルの更新]
 次に、図10に示した処理の詳細を図13~図15を用いて説明する。図13~図15は、物性予測モデル24及び実行可能性モデル25を用いた処理の詳細例を示す図である。例えば、図13~図15は、機械学習モデルである物性予測モデル24及び実行可能性モデル25を合成処理結果に基づいて製造する製造方法の一例を示す。具体的には、図13は、図10における1回目~2回目の処理の詳細を示し、図14は、図10における3回目~4回目の詳細を示し、図15は、図10における5回目~6回目の詳細を示す。なお、図10~図12と同様の点については詳細な説明を省略する。また、前出の通り、「成功」とは、合成の成功かつ測定の成功(図2のS7において「YES」)に該当することを意味し、「失敗」とは、合成の失敗(図2のS5において「NO」)または測定の失敗(図2のS7において「NO」)に該当することを意味する。
 図13~図15に示す6つのテーブル(以下「候補材料テーブル#2」ともいう)は、図10中の探索用テーブル#2に対応するが、「成功」の項目に代えて、「合成合否」及び「測定合否」の項目を有する点で、探索用テーブル#2と相違する。候補材料テーブル#2の「合成合否」及び「測定合否」の項目は、実際に処理した結果が格納されるが、この点は図11及び図12と同様であるため説明を省略する。
 図13に示すように、材料探索製造システム1は、初期データ(更新前の物性データベース22のデータ)を用いて物性予測モデル#0(物性予測モデル24)を学習アルゴリズムにより訓練し、更新する。材料探索製造システム1は、更新後の物性予測モデル#0を用いて、各分子のpriorityの評価(導出)を行い、そのpriorityの値を用いて処理を行う。
 また、図13に示すように、材料探索製造システム1は、初期データ(更新前の実行性データベース23のデータ)を用いて実行可能性モデル#0(実行可能性モデル25)を学習アルゴリズムにより訓練し、更新する。材料探索製造システム1は、更新後の実行可能性モデル#0を用いて、各分子のfeasibilityの評価(導出)を行い、そのfeasibilityの値を用いて処理を行う。ここで、feasibilityの評価(導出)においては、さまざまなパラメータを用いることができるが、「合成合否」及び「測定合否」の項目がともに「n/a」(値が未定)であるものを優先するようにすることもできる。このようにすることによって、実行性を考慮して、新規材料の探索の可能性を高くすることができる。また、図11の例では、priorityの評価(導出)において、実行性を考慮するために、「合成合否」及び「測定合否」の項目を考慮するようにしたが、図13においては、priorityとfeasibilityを分けるようにしているため、priorityの評価(導出)においては、考慮しないようにすることもできる。
 材料探索製造システム1は、優先順位が1位~3位の分子は、「feasibility」の値が閾値(0.5)未満であるため、それらの分子を処理対象とはせず、処理をスキップする。そして、材料探索製造システム1は、1回目の処理では優先順位が4位であり、「feasibility」の値が閾値(0.5)以上である分子ID「m059059」により識別される分子を対象として合成等の処理を行う。図10では、分子ID「m059059」により識別される分子は合成及び測定が成功したものとする。この場合、材料探索製造システム1は、分子ID「m059059」により識別される分子の合成合否及び測定合否を「1」に変更する。
 また、材料探索製造システム1は、分子ID「m059059」により識別される分子の物性値情報を物性データベース22において更新する。さらに、材料探索製造システム1は、更新後の物性データベース22のデータを用いて物性予測モデル#1(物性予測モデル24)を再学習(更新)する。そして、材料探索製造システム1は、更新後の物性予測モデル24を用いて、priorityの値を更新する。
 また、材料探索製造システム1は、分子ID「m059059」により識別される分子の情報を、合成に成功した分子の情報として実行性データベース23に追加(または更新)することにより、実行性データベース23を更新する。材料探索製造システム1は、更新後の実行性データベース23を用いて実行可能性モデル#1(実行可能性モデル25)を再学習(更新)する。そして、材料探索製造システム1は、更新後の実行可能性モデル#1を用いて、「feasibility」の値を更新する。
 そして、材料探索製造システム1は、2回目の処理では更新後の探索用テーブル#2において優先順位が1位であり、「feasibility」の値が閾値(0.5)以上である分子ID「m100686」により識別される分子を対象として合成処理を行う。図10では、分子ID「m100686」により識別される分子は合成が失敗したものとする。そのため、材料探索製造システム1は、分子ID「m100686」により識別される分子の合成合否を「0」に変更する。
 そして、材料探索製造システム1は、データの更新を行う。例えば、材料探索製造システム1は、分子ID「m100686」により識別される分子の情報を、合成に失敗した分子の情報として実行性データベース23に追加(または更新)することにより、実行性データベース23を再度更新する。図14に示すように、材料探索製造システム1は、更新後の実行性データベース23を用いて実行可能性モデル#2(実行可能性モデル25)を再学習(更新)する。そして、材料探索製造システム1は、更新後の実行可能性モデル#2を用いて、「feasibility」の値を更新する。
 そして、材料探索製造システム1は、3回目の処理では「priority1」及び「feasibility2」の値に基づいて処理を行う。図14及び図15に示すように、材料探索製造システム1は、「priority」及び「feasibility」の値を更新し、更新した値を用いて4回目~6回目の処理を行う。上述した処理と同様であるため詳細な説明は詳細するが、材料探索製造システム1は、上述した処理を所望の物性値を満たす分子が合成されるまで繰り返す。具体的には、6回目の処理では、所望の物性値を満たす分子が合成され、図2のS8において目標値が達成した例を示している。すなわち、材料探索製造システム1は、分子ID「m084127」により識別される分子の合成合否及び測定合否を「1」に変更し、さらに、物性データベース22において、分子ID「m084127」の物性値情報を更新するとともに、実行性データベース23において、分子ID「m084127」のデータを追加し、合成合否及び測定合否を「1」に変更する。この場合においては、目的地を達成したものとして、処理を終了する。図13~図15に示す製造方法では、機械学習モデルである実行可能性モデル25が製造される。図13~図15に示す製造方法では、実行可能性モデル25の出力する実行可能性情報に応じて、例えば材料探索製造システム1の制御装置20が材料選択を行う。この場合、制御装置20は、選択した材料の合成処理の指示を、材料製造装置10に対して行い、材料製造装置10からの合成処理結果に基づいて、実行性データベース23(実行可能性データベース)の情報を更新する。そして、制御装置20は、更新した実行性データベース23の実行可能性情報に基づいて実行可能性モデル25を更新する。これにより、図13~図15に示す製造方法では、更新された実行可能性モデル25が製造される。
[1-5.実施例及び材料製造結果]
 ここで、具体的な対象とするデータセットを用いた実施例を説明し、実施例を含む複数の手法の各々の材料製造結果について、図30及び図31を用いて説明する。図30及び図31は、探索に関する材料製造結果の一例を示す図である。
 実施例では、実行可能性モデル25を活用した材料探索を行う。例えば、実施例では、有機分子構造物性のデータセットであるQM9データセットに含まれる133,886分子を材料探索空間の範囲として、物性値を最適化することを目標とした材料探索を実施した。
 実施例では、材料製造装置10はソフトウェア(ソフトウェア材料製造装置)により実現した。材料製造装置10は、制御装置20から入力としてQM9データセットにある1つの分子構造を受け取り、出力#1として合成・測定の成功/失敗(True,False)、合成・測定が成功した場合のみ出力#2として測定結果である物性値を制御装置20に戻す。合成・測定の成否は、溶媒に関する溶解挙動を示す関数であるLogP(計算値)に閾値を設けて決定した。これは、溶媒に関する溶解挙動によって合成・測定が成功/失敗するという材料製造上の事実を、単純な計算値によって再現していることに相当する。測定結果としての物性値は、QM9データセットに含まれる、単分子の第一原理計算で算出した物性値を用いた。
 制御装置20もソフトウェアとして実現した(表1中の2を参照)。探索エージェント26で使用する探索アルゴリズムは、比較例とする2種類(ランダム探索、物性予測モデル24による探索)のアルゴリズムと、本開示の合成材料選択方法に対応するアルゴリズム(物性予測モデル24及び実行可能性モデル25による探索)との各々を実装し、性能を比較した。
 以下、表1を参照しつつ、材料製造結果を示す各探索アルゴリズム(表1中の5を参照)について説明する。表1は、材料製造に関する各種情報を示す。まず、本開示の合成材料選択方法との比較対象になる比較例#1及び比較例#2について説明する。比較例#1は、ランダム探索に対応し、比較例#2は、物性予測モデル24による探索に対応する。
Figure JPOXMLDOC01-appb-T000009
(比較例#1:ランダム探索)
<手順#1>
 手順#1-1:材料空間に含まれる未評価の分子からランダムに1分子を選択し、合成・測定を行う。当該分子を評価済みとする。
 手順#1-2:合成・測定
  (ア):合成・測定が失敗した場合:手順1から繰り返す。
  (イ):合成・測定が成功した場合:分子構造と測定結果(物性値)を物性データベース22に保存する。
 手順#1-3:物性データベース22にある測定値の最大値(最小値)が目標値に到達した場合は完了。まだの場合は手順#1-1から繰り返す。
(比較例#2:物性予測モデルによる探索)
 物性予測モデル24による探索(比較例#2)では、機械学習モデルとして予測平均値(μ)と予測分散(σ)を算出できるGaussian Process回帰を利用した、ベイズ最適化と呼ばれるアルゴリズムを実装した。機械学習モデルの入力には分子記述子(例えば、RdKit記述子)を用いた。探索の手順は下記の手順#2に示す通りである。
<手順#2>
 手順#2-1:すべての入力に対して等しい出力を与える物性予測モデル24(初期モデル)を構築する。
 手順#2-2:物性予測モデル24を用いて、材料空間に含まれる未評価の分子に対して、次の定義で示される獲得関数(Acquisition Function:Fa)を計算する:
  (ア):最大化問題のときは、式(9)を用いて獲得関数Faを計算
  (イ):最小化問題のときは、式(10)を用いて獲得関数Faを計算
Figure JPOXMLDOC01-appb-M000010
Figure JPOXMLDOC01-appb-M000011
 なお、式(9)及び式(10)におけるCは定数(1~10等)である。
 手順#2-3:獲得関数Faに基づいて、材料空間に含まれる未評価分子の優先順位を決める。
 手順#2-4:最も優先順位の高い分子の合成・測定を行う。この分子を評価済みとする。
 手順#2-5:合成・測定
  (ア):合成・測定が失敗した場合:手順#2-4から繰り返す。
  (イ):合成・測定が成功した場合:分子構造と測定結果(物性値)を物性データベース22に保存し、物性予測モデル24を更新する。
 手順#2-6:物性データベース22にある測定値の最大値(最小値)が目標値に到達した場合は完了。まだの場合は手順#2-2から繰り返す。
 次に、本開示の合成材料選択方法に対応する実施例#1及び実施例#2について説明する。なお、上述した内容と同様の点については適宜説明する。
(実施例#1及び実施例#2:物性予測モデル及び実行可能性モデルによる探索)
 物性予測モデル24のための機械学習モデルとしてGaussian Process回帰、実行可能性モデル25のための機械学習モデルとしてGaussian Process分類を利用した。機械学習モデルの入力は分子記述子(例えば、RdKit記述子)を用いた。探索の手順は下記の手順#3に示す通りである。例えば、実行可能性モデル25の初期モデルは、評価済みデータ(合成成功したデータ)を用いてモデル構築される。
<手順#3>
 手順#3-1:実行可能性モデル25(初期モデル)を、初期データ(データ数:100又は10)を用いて構築する。
 手順#3-2:すべての入力に対して等しい出力を与える物性予測モデル24(初期モデル)を構築する。
 手順#3-3:物性予測モデル24を用いて、材料空間に含まれる未評価の分子に対して、次の定義で示される獲得関数(Acquisition Function:Fa)を計算する:
  (ア):最大化問題のときは、式(9)を用いて獲得関数Faを計算
  (イ):最小化問題のときは、式(10)を用いて獲得関数Faを計算
 手順#3-4:獲得関数Faに基づき、材料空間に含まれる未評価分子の優先順位を決める。
 手順#3-5:実行可能性モデル25によって、材料空間に含まれる未評価分子の実行可能性(合成・測定の成否の予測)を評価する。
 手順#3-6:実行可能性が高く(確率0.5以上、等)、かつ最も優先順位の高い分子の合成・測定を行う。この分子を評価済みとする。
 手順#3-7:合成・測定
  (ア):合成・測定が失敗した場合:実行性データベース23および実行可能性モデル25を更新し、手順#3-5から繰り返す。
  (イ):合成・測定が成功した場合:実行性データベース23および実行可能性モデル25の更新、分子構造と測定結果(物性値)から物性データベース22および物性予測モデル24を更新する。
 手順#3-8:物性データベース22に保持された測定値の最大値(最小値)が目標値に到達した場合は完了。まだの場合は手順#3-2から繰り返す。
 ここで、評価指標(表1中の6を参照)は、目標値に達するまでの材料製造試行回数であり、比較例#1に関しては1,000回、比較例#2および実施例#1及び実施例#2に関しては100回試行して平均値で比較した(詳細設定は表1を参照)。
 上述したように実施例#1及び実施例#2においては、実行可能性モデル25の初期モデルを構築するために使用する、初期データを与えた(データ数:100又は10)。これは、材料製造装置10に関する事前知識として、初期データに含まれる100個又は10個の分子構造に関して、合成・測定が成功するかどうかの結果が既知であるというケースに相当する。例えば、データ数が100個である場合に対応する実施例#1では、100個の分子構造についての教師データを用いて実行可能性モデル25の初期モデルを構築する。また、例えば、データ数が10個である場合に対応する実施例#2では、10個の分子構造についての教師データを用いて実行可能性モデル25の初期モデルを構築する。
 ここから、図30及び図31に示す材料製造結果について説明する。図30及び図31は、Heat Capacityを最適化(最大化)することを目的とした分子構造探索に関する評価結果を示す。
 目標値(45.0 kcal/mol 以上)に到達するまでに、ランダム探索である比較例#1(図30及び図31において一転鎖線で示すRandom)では平均1,000回以上の材料製造試行が必要である。また、目標値(45.0 kcal/mol 以上)に到達するまでに、物性予測モデル24による探索である比較例#2(図30及び図31において点線で示すProperty pred)では平均85回の材料製造試行が必要であった。例えば、目標値(45.0 kcal/mol 以上)は、図2のステップS8において、目標値達成で比較する条件である。
 一方で、物性予測モデル24及び実行可能性モデル25による探索である実施例#1(図30及び図31において実線で示すFeasibility (n=100))及び実施例#2(図30及び図31において破線で示すFeasibility (n=10))では平均6回(初期データ100件)~51回(初期データ10件)の材料製造試行で目標値に到達できることが分かった。
 このように、本開示の合成材料選択方法では、ランダム探索(比較例#1)に対しては最大100倍以上(時間や費用のコストが100分の1)、物性予測モデル24による探索(比較例#2)に対しては最大13倍以上(時間や費用のコストが13分の1)の効率化効果が得ることができる。したがって、本開示の合成材料選択方法及び材料製造方法では、合成の実行性に基づいて効率的に材料合成を行うことができる。
[1-6.実行性データベースの例]
 上述した実行性データベース23は一例に過ぎず、実行性データベース23には様々なデータ構造が採用されてもよい。この点について図16~図21を用いて説明する。図16~図21は、実行性データベース23の一例を示す図である。なお、上述した実行性データベース23と同様の点については適宜説明を省略する。
 実行性データベース23は、図16中のデータベースDB4であってもよい。図16の例では、データベースDB4は、「分子ID」、「合成&測定合否」といった項目が含まれる。「分子ID」は、分子を識別するための識別情報を示す。「合成&測定合否」は、分子の合成及び測定が実行できたか否かを示す。例えば、「合成&測定合否」は、分子の合成及び測定の両方が実行できた場合に「1」となり、それ以外の場合に「0」となる。なお、図2で示されるように、「合成&測定合否」の値が、「1」の場合においては、実行可能性モデル25に加えて、物性予測モデル24も更新され、図9から図15の実施例における「成功」に相当する。
 また、実行性データベース23は、図17中のデータベースDB5であってもよい。図17の例では、データベースDB5は、「分子ID」、「合成収率」といった項目が含まれる。「分子ID」は、分子を識別するための識別情報を示す。「合成収率」は、分子の合成における収率を示す。
 実行性データベース23は、図18中のデータベースDB6であってもよい。図18の例では、データベースDB6は、「分子ID」、「合成合否」、「分取合否」、「吸収スペクトル測定合否」といった項目が含まれる。「分子ID」は、分子を識別するための識別情報を示す。「合成合否」は、分子の合成が実行できたか否かを示す。「分取合否」は、分子の分取が実行できたか否かを示す。「吸収スペクトル測定合否」は、分子について吸収スペクトルによる測定が実行できたか否かを示す。例えば、「合成合否」、「分取合否」及び「吸収スペクトル測定合否」の各々は、その処理が実行できた場合に「1」となり、それ以外の場合に「0」となる。なお、「吸収スペクトル測定合否」は、図13から図15の実施例に示す「測定合否」という項目の一例である。
 実行性データベース23は、図19中のデータベースDB7であってもよい。図19の例では、データベースDB7は、「分子ID」、「溶媒A溶解性」、「溶媒B溶解性」、「物性A測定」、「物性B測定」といった項目が含まれる。「分子ID」は、分子を識別するための識別情報を示す。「合成合否」は、分子の合成が実行できたか否かを示す。「溶媒A溶解性」は、溶媒Aに対する分子の溶解性に関する値を示す。「溶媒B溶解性」は、溶媒Bに対する分子の溶解性に関する値を示す。「物性A測定」は、物性Aの測定が実行できたか否かを示す。「物性B測定」は、物性Bの測定が実行できたか否かを示す。例えば、「合成合否」、「物性A測定」及び「物性B測定」の各々は、その処理が実行できた場合に「1」となり、それ以外の場合に「0」となる。
 実行性データベース23は、図20中のデータベースDB8であってもよい。図20の例では、データベースDB8は、「分子ID」、「合成パスID」、「合成合否」、「分取合否」、「吸収スペクトル測定合否」といった項目が含まれる。「分子ID」は、分子を識別するための識別情報を示す。「合成パスID」は、分子の合成のパス(経路)を識別するための識別情報を示す。「合成合否」は、分子の合成が実行できたか否かを示す。「分取合否」は、分子の分取が実行できたか否かを示す。「吸収スペクトル測定合否」は、分子について吸収スペクトルによる測定が実行できたか否かを示す。
 実行性データベース23は、図21中のデータベースDB9であってもよい。図21の例では、データベースDB9は、「合成パスID」、「反応ステップ1」、「反応ステップ2」といった項目が含まれる。「合成パスID」は、分子の合成のパス(経路)を識別するための識別情報を示す。「反応ステップ1」は、合成パスIDにより識別される合成パスにおける1つ目のステップを示す。「反応ステップ2」は、合成パスIDにより識別される合成パスにおける2つ目のステップを示す。なお、図21では、「反応ステップ1」及び「反応ステップ2」のみを図示するが、データベースDB9は、「反応ステップ3」、「反応ステップ4」等、合成パスのステップ数に対応する項目を有する。
[2.他の処理フロー例]
 材料探索製造システム1は、上記した各種の情報を用いて任意の処理を実行可能である。この点について、上述した実施例とは別の実施例として以下説明する。材料探索製造システム1は、物性(特性)および/またはfeasibilityの情報に基づいて、priorityを計算し、priorityに従って、合成材料(分子)リスト(少なくとも一つを含む)を作成する。リストの各項目は、分子IDを少なくとも含む。なお、リストは、{分子ID、合成パスID}のペアを含んでも良い。
[2-1.合成に関する処理]
 まず、合成に関する処理例について説明する。例えば、材料探索製造システム1は、以下の処理(1)~(8)の処理を実行する。なお、この合成処理は、探索エージェントが図2の処理を行う際に、「合成」処理(ステップS4)に対応して、図1の制御インターフェース21、合成装置11、及び分析装置12との間で行われる一連の処理の一例である。
(1)材料合成リストを、制御インターフェース21を経由して、合成装置11に送信し、リストに従って合成を指示する。
(2)合成装置11は、リストの優先順位に従って、{分子ID(、合成パスID)}を読み出す。
(3)合成パスIDが指定されている場合には、合成装置11は、合成パスIDをキーとして、合成パスIDテーブルから反応ステップを取得し、合成処理を行う。
(4)反応ステップで指定された条件を満たしている場合には、合成処理を行い、そうでない場合には、「合成不可」という情報を合成装置11に通知する。
(4-1)合成装置11は、「合成不可」の通知を受けた場合、合成装置11は、制御インターフェース21に対し、最初の分子IDについて、合成失敗を通知し(図2の合成失敗)、(6)に進む。
(4-2)それ以外の場合、合成装置11は、反応ステップ1の処理を行う。処理の結果、「正常終了」または「異常終了」のいずれかの結果を通知する。
(4-3)合成装置11は、「異常終了」の場合、合成装置11は、制御インターフェース21に対し、最初の分子IDについて、合成失敗を通知し(図2の合成失敗)、(6)に進む。
(4-4)合成装置11は、「正常終了」の場合、次の反応ステップがあるかどうか確認し、次の反応ステップがある場合には、次の反応ステップを取得し、(4)から繰り返す。次の反応ステップが無い場合には、(5)に進む。
(5)合成過程が「正常終了」の場合、合成が成功したかどうか確認するために、合成された材料を分析装置12に自動的に提供し、分析装置12に対して、合成された材料が分子IDの合成に成功できているかどうか確認する分析を指示する制御を行う。
(5-1)分析装置12が、合成成功と判断する場合、合成装置11に「合成成功」を通知。それ以外の場合、「合成失敗」を通知する。
(6)合成装置11は、制御インターフェース21に合成の成否を通知する。合成処理の過程で受けた通知により「成否の通知」は異なる:
(6-1)合成不可、異常終了、合成失敗の場合、「合成失敗」を送信する。
(6-2)合成成功の場合、「合成成功」を送信する。
(7)合成装置11は、リストにまだ合成を試みていない材料がある場合、次の{分子ID(、合成パスID)}を読み出し、(3)から繰り返す。
(8)上記合成装置11の処理と並列に、探索エージェント26は、「合成失敗」の場合、合成ができないと判断し、「実行可能性モデル」の構築、または更新を行う。
 上述した処理(1)~(8)の詳細なフローを図22に示す。図22は、材料探索製造システムにおける処理手順の一例を示すシーケンス図である。なお、図22に示すステップ番号は各処理主体による処理を説明するために便宜的に付したものであり、処理の順序を規定するものではない。
 探索エージェント26は、選択された材料合成リストを、制御インターフェース21を経由して、合成装置11に送信する(ステップS101)。探索エージェント26は、合成装置11にリストに指定された材料の合成を指示する(ステップS102)。探索エージェント26は、合成装置11からのリスト中の一つの材料合成の結果情報を待つ(ステップS103)。探索エージェント26は、結果を図2のステップS5の判断に従って処理する(ステップS104)。
 探索エージェント26は、リストに示された全ての分子IDについて合成処理を終了していない場合(ステップS105:No)、ステップS103に戻って処理を繰り返す。また、探索エージェント26は、リストに示された全ての分子IDについて合成処理を終了した場合(ステップS105:Yes)、処理を終了する。
 制御インターフェース21は、合成装置11から「合成不可」、「異常終了」、「合成失敗」を受信した場合、探索エージェント26に「合成失敗」を送信し、合成装置11から「合成成功」を受信した場合、探索エージェント26に「合成失敗」を送信する(ステップS111)。
 合成装置11は、材料合成リスト{分子ID、…}を受信する(ステップS121)。合成装置11は、リストの優先順位に従って、対象の{分子ID(、合成パスID)}を読み出す(ステップS122)。合成装置11は、合成パスIDで指定される反応ステップの条件を満たさない場合(ステップS123:No)、制御インターフェース21に「合成不可」を送信するとともに、次の合成対象を選択し(ステップS120)、ステップS122に戻って処理を繰り返す。
 合成装置11は、合成パスIDで指定される反応ステップの条件を満たす場合(ステップS123:Yes)、分子IDの材料合成を行う(ステップS124)。合成装置11は、ステップS124が異常終了した場合(ステップS125:Yes)、制御インターフェース21に「異常終了」を送信するとともに、次の合成対象を選択し(ステップS120)、ステップS122に戻って処理を繰り返す。
 合成装置11は、ステップS124が異常終了しなかった場合(ステップS125:No)、次の反応ステップあるかを判定する(ステップS126)。合成装置11は、次の反応ステップがある場合(ステップS126:Yes)、次の反応ステップを選択し(ステップS127)、ステップS123に戻って処理を繰り返す。
 合成装置11は、次の反応ステップがない場合(ステップS126:No)、分析処理指示を分析装置12に行う。合成装置11は、分析結果を通知する(ステップS128)。合成装置11は、成功の場合は「合成成功」を、失敗の場合は「合成失敗」に対応する情報を、制御インターフェース21を介して探索エージェント26に通知する。
 合成装置11は、リストにまだ次の合成対象の分子IDはある場合(ステップS129:Yes)、ステップS120に戻って処理を繰り返す。合成装置11は、リストに次の合成対象の分子IDがない場合(ステップS129:No)、処理を終了する。
 分析装置12は、合成装置11から合成された材料の提供を受け、分析処理を行う(ステップS131)。そして、分析装置12は、分析結果を合成装置11に送信する。
[2-2.測定に関する処理]
 次に、測定に関する処理例について説明する。例えば、材料探索製造システム1は、以下の処理(11)~(16)の処理を実行する。なお、この測定処理は、探索エージェントが図2の処理を行う際に、「測定」処理(ステップS6)に対応して、図1の制御インターフェース21、合成装置11、及び測定装置13との間で行われる一連の処理の一例である。
(11)探索エージェント26は、合成の成功した分子IDを受信する。
(12)合成の成功した分子IDを特定し、測定すべき物性を指定して、制御インターフェース21を経由して、合成装置11に対して、合成の成功した材料の測定指示を行う。
(13)指示を受けた合成装置11は、指示された分子IDで特定される合成材料を測定装置13に提供するように自動制御し、測定装置13に対して、提供した材料について指定された物性の測定開始を指示する。
(14)測定装置13は、測定できない場合には、「測定不可」を、測定が通常終了した場合には、「測定終了」及び測定結果を合成装置11に通知し、通知を受けた合成装置11は、制御インターフェース21を介して、測定結果を送信する。
(15)探索エージェント26は、測定結果が、「測定不可」の場合、合成ができないと判断し、「実行可能性モデル」の構築、または更新を行う。
(16)探索エージェント26は、さらに、目標値を達成しているかどうかさらに判断し、目標値を達成している場合には、合成が成功したと判断し、「物性予測モデル」の構築または更新を行う。また、目標値が達成できていない場合には、合成ができないと判断し、「実行可能性モデル」の構築、または更新を行う。
 上述した処理(11)~(16)の詳細なフローを図23に示す。図23は、材料探索製造システムにおける処理手順の一例を示すシーケンス図である。なお、図23に示すステップ番号は各処理主体による処理を説明するために便宜的に付したものであり、処理の順序を規定するものではない。
 探索エージェント26は、合成の成功した分子IDを合成装置11に送信する(ステップS201)。探索エージェント26は、合成装置11に測定すべき物性を指定し、材料の測定を指示する(ステップS202)。探索エージェント26は、合成装置11からのリスト中の一つの材料合成の結果情報待を待つ(ステップS203)。探索エージェント26は、結果を図2のステップS7の判断に従って処理し(ステップS204)、処理を終了する。
 制御インターフェース21は、「測定不可」を受信した場合、探索エージェント26に「測定失敗」を送信し、「測定終了」を受信した場合、探索エージェント26に「測定成功」を送信する(ステップS211)。
 合成装置11は、分子IDを受信する(ステップS221)。合成装置11は、分子IDで指定される合成済み材料を測定装置13に提供し、指定された物性についての測定を指示する(ステップS222)。合成装置11は、測定結果を通知する(ステップS223)。合成装置11は、成功の場合は「測定終了」を、失敗の場合は「測定不可」に対応する情報を、制御インターフェース21を介して探索エージェント26に通知する。
 測定装置13は、合成装置11から指定された物性について、合成済み材料の測定処理を行う(ステップS231)。そして、測定装置13は、測定結果を合成装置11に送信する。
[2-3.システム構成例等]
 なお、上記の例では、合成フェーズと測定フェーズを分け、それぞれの指示を、探索エージェント26が、合成エージェントに行うようにしたが、探索エージェント26の合成の指示の後、合成装置11が、合成処理の「分析結果を通知」を行った後、自動的に、測定処理の「測定を指示」を行うようにしてもよい。また、上記の例では、制御インターフェース21が、情報の変換を行っているが、合成装置11が、情報変換を行ってもよい。
 合成フェーズと測定フェーズにおいて、分析装置12、測定装置13が指示を受ける場合、制御インターフェース21を介して、合成装置11が情報・データ・指示を受けるようにし、合成装置11が、分析装置12または測定装置13に情報・データ・指示を伝達し、また、合成装置11が、分析装置12または測定装置13から結果情報を受信するようにしたが、合成装置11を仲介せず、分析装置12または測定装置13が、制御インターフェース21と直接データのやり取りをするようにしてもよい。
 この場合には、探索エージェント26(またはそれに相当するコンピュータソフトウェアまたはハードウェア)が、制御インターフェース21を介して、直接、分析装置12または測定装置13を制御できるようにするようにしてもよい。例えば、探索エージェント26の機能は、図24に示す情報処理装置100のようなコンピュータが有してもよい。図24は、材料探索製造システムの構成の一例を示す図である。また、この場合、制御インターフェース21は、通信インターフェースを備えたコンピュータ装置(図24中の制御装置200等)であってもよいし、有線・無線通信装置であってもよい。制御装置200は、制御装置20として機能する。
 図24の例では、情報処理装置100は、インターネット(クラウド)等のネットワークN1、または仮想化技術やVPN(Virtual Private Network)等の技術も含むプライベートクラウド等のネットワークN2を介して他の構成と通信する。例えば、情報処理装置100は、制御装置200を介して、材料製造装置10、データベースDB等と通信する。例えば、データベースDBは、合成装置11とネットワークで接続したコンピュータ装置上であってもよいし、クラウド上のコンピュータ装置上、または合成装置11と一体化した装置上で動作しても良い。例えば、データベースDBは、物性データベース22(図1中の物性DB)または実行性データベース23(図1中の実行性DB)と同一のデータベースを含むものであってもよい。なお、データベースDBは、物性データベース22(図1中の物性DB)及び実行性データベース23(図1中の実行性DB)のように、別々のストレージ上にあってもよいし、一つのストレージに一つのデータベースDBとして一体化していてもよいし、仮想記憶装置上にあってもよい。
 また、制御インターフェース21が、データベースにアクセスする機能を有し、合成フェーズにおいて、合成装置11が行った、材料合成リストに関する処理を行うようにしてもよい。合成装置11、分析装置12、及び測定装置13は、一つの筐体内で、制御系を同一とするシステムとなっていてもよいし、別々の筐体で独立するようにしていてもよい。
[2-3-1.情報処理装置例]
 ここで、情報処理装置100の構成例について説明する。図25は、本開示の情報処理装置の構成例を示す図である。例えば、情報処理装置100は、制御装置20として機能する。情報処理装置100は、制御装置200と一体であってもよい。
 図25に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
 通信部110は、例えば、NIC(Network Interface Card)等によって実現される。通信部110は、所定のネットワーク(図示省略)と有線または無線で接続され、材料製造装置10や制御装置20等の材料探索製造システム1の各構成要素との間で情報の送受信を行う。例えば、通信部110は、材料製造装置10に情報を送信することにより、材料製造装置10を制御する制御インターフェース21として機能する。
 通信部110は、材料製造装置10との間で情報を送受信することにより合成処理の制御を行う。通信部110は、材料製造装置10に合成処理を指示する。例えば、通信部110は、合成処理の対象とする材料を示す情報を送信することにより、材料製造装置10に合成処理を指示する。通信部110は、材料製造装置10から合成処理結果を受信する。通信部110は、材料製造装置10(の測定装置13)から物性測定処理結果を受信する。
 記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、物性データを保持する物性データベース22、合成及び/又は測定が実行できたかどうかを保持する実行性データベース23、物性を予測する物性予測モデル24、合成及び/又は測定を実行できるかどうかを予測する実行可能性モデル25等の各種情報を記憶する。
 制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部に記憶されたプログラム(例えば、本開示に係る情報処理プログラム等)がRAM等を作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
 制御部130は、通信部110により外部装置から受信した情報を用いて各処理を実行する。また、制御部130は、記憶部120により記憶された情報を用いて各処理を実行する。制御部130は、通信部110を介して材料製造装置10に情報を送信することにより、材料製造装置10を制御する。
 制御部130は、探索エージェント26の機能に対応する処理を実行する。制御部130は、上述した合成材料選択に関する処理を実行する。制御部130は、上述した材料の製造に関する処理を実行する。制御部130は、材料製造装置10に材料の合成を指示することにより、材料の製造する処理を材料製造装置10に実行させる。
 制御部130は、記憶部120に記憶された材料のうち、材料物性情報と実行可能性情報を用いて材料を選択する材料選択を行う。制御部130は、選択された材料の合成処理の指示を材料製造装置10に対して行う。制御部130は、優先順位に従ってリスト形式の情報を材料製造装置10に送信することにより、材料製造装置10による材料の合成処理を制御する。例えば、制御部130は、探索用テーブル#2を材料製造装置10に送信することにより、材料製造装置10による材料の合成処理を制御する。例えば、制御部130は、合成処理の対象とする材料(合成処理対象の材料)の指定を含むリスト形式の情報を材料製造装置10に送信することにより、合成処理対象の材料を指定する。例えば、制御部130は、合成処理対象の材料にフラグが付された探索用テーブル#2を材料製造装置10に送信することにより、合成処理対象の材料を指定する。制御部130は、材料製造装置10からの合成処理結果に基づいて、記憶部120に記憶された実行可能性情報を更新する。例えば、制御部130は、材料製造装置10からの合成処理結果に基づいて、探索用テーブル#2の情報を更新する。
 制御部130は、記憶部120に記憶された二以上の合成処理対象の材料から、材料を選択する材料選択を行う。制御部130は、合成処理対象の材料から、過去に合成の成功した材料を含まないように材料選択を行う。例えば、制御部130は、記憶部120に記憶された情報を参照し、過去に合成の成功した材料を除外して、材料選択を行う。これにより、制御部130は、新規材料の選択が実現できる。制御部130は、材料物性情報に基づく材料の第一の予測値に基づく優先順位に従って材料選択を行う。制御部130は、実行可能性情報に基づく材料の第二の予測値に基づく優先順位材料選択を行う。制御部130は、第二の予測値が所定の閾値以上の材料を対象として、材料選択を行う。
 制御部130は、合成の成否情報が成功の場合には、合成の成功した材料について、記憶部120に記憶された実行可能性情報を更新する。制御部130は、更新した実行可能性情報に基づき、実行可能性モデル25を更新する。
 制御部130は、合成の成功した材料の識別子及び測定する物性を指定して、物性測定処理の指示を行う。制御部130は、材料物性情報の更新を行う。制御部130は、材料製造装置10からの物性測定処理結果に基づいて、記憶部120における合成の成功した材料の材料物性情報を更新する。制御部130は、物性測定処理結果が目標値を満たす場合には、記憶部120に記憶された目標値を満たす材料について材料物性情報を更新する。制御部130は、更新した材料物性情報に基づき、物性予測モデル24を更新する。
 制御部130は、識別子で特定される合成の成功した材料に対する、指示された物性測定処理の制御を行い、識別子及び測定された物性値を提供する。制御部130は、装置間がネットワークでつながっている場合には、通信部110を介して他の装置に物性値を送信させる。制御部130は、通信部110を介して、合成の成功した材料の識別子及び測定された物性値を示す情報を他の装置に送信する。制御部130は、合成材料選択データ構造を有するデータ(「合成材料選択データ」ともいう)を用いて材料選択を行う。例えば、制御部130は、図10中の探索用テーブル#2または図13~図15中の候補材料テーブル#2等のデータ(合成材料選択データ)を用いて材料選択を行う。具体的には、制御部130は、材料を識別するID(例えば分子ID)と、予測される材料の物性値に基づく優先順位を示す優先順位情報(例えばpriorityの値)と、材料の合成の実行可能性を示す実行可能性情報(例えばfeasibilityの値)と、合成処理の成否を示す合成成否情報(例えば合成合否の値)とを含む合成材料選択データを用いて材料選択を行う。制御部130は、合成材料選択データを用いて、合成成否情報が未処理を示す材料群を対象として、優先順位情報に基づく優先順位が高い方から順に探索し、合成成否情報が示す合成処理の成否が所定の基準を満たす材料を選択する。例えば、制御部130は、合成合否の値が不明(n/a)である分子群を対象として、priorityの値が高い方から順に探索し、feasibilityの値が所定の閾値以上である材料を選択する。
[2-3-2.材料製造装置の構成例等]
 ここで、材料製造装置10において、合成装置11と分析装置12または測定装置13との間で自動的に合成材料を移動するための機構(「材料移動機構」ともいう)を有することが望ましい。この点について、以下図26~図28を用いて説明する。図26~図28は、材料製造装置の構成の一例を示す図である。なお、以下では、材料移動機構の態様に応じて、材料製造装置10A、10B、10Cとして説明するが、材料移動機構に関する構成以外については、材料製造装置10と同様である。また、材料製造装置10について、上述した内容と同様の点については適宜説明を省略する。
 図26に示す材料製造装置10Aでは、材料移動機構として材料移動経路14を有する。合成装置11は、材料移動経路14を駆動させる駆動装置111と、駆動装置111の制御及び合成処理を実行するプロセッサ112と、他の装置と通信するための通信インターフェース113とを有する。また、分析装置12は、材料移動経路14を駆動させる駆動装置121と、駆動装置121の制御及び分析処理を実行するプロセッサ122と、他の装置と通信するための通信インターフェース123とを有する。また、測定装置13は、材料移動経路14を駆動させる駆動装置131と、駆動装置131の制御及び測定処理を実行するプロセッサ132と、他の装置と通信するための通信インターフェース133とを有する。図26に示す材料移動経路14は、合成装置11、分析装置12及び測定装置13に亘って設けられるベルトコンベヤ等である。図26に示す材料MTは、材料移動経路14の動作に従って合成装置11、分析装置12及び測定装置13の間を移動可能である。
 また、図27に示す材料製造装置10Bでは、材料移動機構としてロボットアーム15を有する。合成装置11は、ロボットアーム15を駆動させる駆動装置111と、駆動装置111の制御及び合成処理を実行するプロセッサ112と、他の装置と通信するための通信インターフェース113とを有する。また、分析装置12は、分析処理を実行するプロセッサ122と、他の装置と通信するための通信インターフェース123とを有する。また、測定装置13は、測定処理を実行するプロセッサ132と、他の装置と通信するための通信インターフェース133とを有する。図27に示すロボットアーム15は、合成装置11の駆動装置111により駆動される。図27に示す材料MTは、ロボットアーム15の動作に従って合成装置11、分析装置12及び測定装置13の間を移動可能である。
 さらに、図28に示す材料製造装置10Cでは、材料移動機構としてシリンジポンプ16とチューブ17による流路を有する。合成装置11は、シリンジポンプ16を駆動させる駆動装置111と、駆動装置111の制御及び合成処理を実行するプロセッサ112と、他の装置と通信するための通信インターフェース113とを有する。また、分析装置12は、分析処理を実行するプロセッサ122と、他の装置と通信するための通信インターフェース123とを有する。また、測定装置13は、測定処理を実行するプロセッサ132と、他の装置と通信するための通信インターフェース133とを有する。図28に示すシリンジポンプ16は、合成装置11の駆動装置111により駆動される。図28に示す合成済み材料(溶液としての試料)MTは、シリンジポンプ16の動作に従ってチューブ17による流路を通じて合成装置11、分析装置12及び測定装置13の間を移動可能である。
 なお、上記は一例に過ぎず、材料製造装置10は、材料を装置間で移動可能であれば、どのような態様の材料移動機構を有してもよい。材料製造装置10は、材料を製造する処理を実行する。材料製造装置10は、材料製造装置10の使用者等による操作に応じて、材料の製造する処理を実行する。材料製造装置10は、外部装置からの指示に応じて、材料の製造する処理を実行する。例えば、材料製造装置10は、制御装置20からの指示に応じて材料を製造する処理を実行する。
 図26に示す材料製造装置10A、図27に示す材料製造装置10Bまたは図28に示す材料製造装置10Cでは、合成装置11の合成した材料を自動的に測定装置13に移動し、測定装置13が移動された材料を対象として、指示された物性値を測定する処理を行う。測定装置13は、測定処理により生成した物性測定処理結果を他の装置へ送信する。例えば、材料製造装置10(の測定装置13)は、制御装置20、情報処理装置100、制御装置200等の他の装置へ物性測定処理結果を送信する。
[3.本開示の対象及び効果]
 上記のように、本開示に係る合成材料選択方法は、データベースの材料物性情報(上記例ではデータベースDB1に示す情報等。以下同様)と実行可能性情報(上記例ではデータベースDB2に示す情報等。以下同様)を用いて合成対象の材料を選択する材料選択を行い、制御装置(上記例では材料製造装置10、制御装置20、情報処理装置100または制御装置200等。以下同様)に対して、選択された材料の合成処理の指示を行い、制御装置からの合成処理結果に基づいて、データベースの実行可能性情報を更新する。このように、例えば、材料探索製造システム1が実行する合成材料選択方法は、データベースの材料物性情報と実行可能性情報を用いて合成対象の材料を選択する材料選択を行うことと、選択された材料の合成処理の指示を行い、合成処理結果に基づいて、データベースの実行可能性情報を更新すること、とを含む。これにより、合成材料選択方法は、合成の実行性に基づく材料合成を可能にすることができる。
 また、本開示に係る合成材料選択方法において、データベースは、二以上の合成処理対象の材料を含む。これにより、合成材料選択方法は、二以上の合成処理対象の材料を含むデータベースを用いて材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法における材料選択では、過去に合成の成功した材料を含まないように選択される。これにより、合成材料選択方法は、過去に合成の成功した材料を含まないよう材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法における材料選択では、材料物性情報に基づく材料の第一の予測値に基づく優先順位に従って行われる。これにより、合成材料選択方法は、材料の第一の予測値に基づく優先順位に応じた材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法において、第一の予測値は、物性予測モデル(上記例では物性予測モデル24。以下同様)に入力される、データベースに登録された材料を構成する二以上の材料各々の材料特徴量に基づいて出力される。これにより、合成材料選択方法は、物性予測モデルにより予測される材料の第一の予測値に基づく優先順位に応じた材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法における材料選択では、実行可能性情報に基づく材料の第二の予測値に基づく優先順位に従って行われる。これにより、合成材料選択方法は、実行可能性情報に基づく材料の第二の予測値に応じた材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法における材料選択では、第二の予測値が所定の閾値以上のものから選択される。これにより、合成材料選択方法は、適切な材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法において、第二の予測値は、実行可能性モデル25に入力される、データベースに登録された材料を構成する二以上の材料各々の材料特徴量に基づいて出力される。これにより、合成材料選択方法は、実行可能性情報に基づく材料の第二の予測値に応じた材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法において、選択された材料は、優先順位の順に選択され、選択された材料は、少なくとも一つの項目を含むリスト形式で指定され、項目は、材料の識別子及び優先順位を含む。これにより、合成材料選択方法は、適切に材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法において、制御装置は、優先順位に従ってリスト形式で提供される材料の合成処理を制御し、材料ごとに合成処理結果を提供し、合成処理結果は、制御された合成処理の材料の識別子及び合成の成否情報である。これにより、合成材料選択方法は、適切に材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法において、合成処理の制御は、合成装置(上記例では合成装置11または材料製造装置10。以下同様)に合成処理を指示し、合成装置から、合成処理結果を受信する処理を含む。これにより、合成材料選択方法は、合成処理結果を利用可能にすることができる。
 また、本開示に係る合成材料選択方法における実行可能性情報の更新では、合成の成否情報が成功の場合には、データベースにおいて、合成の成功した材料について実行可能性情報を更新し、さらに更新した実行可能性情報に基づき、実行可能性モデル25を更新する。これにより、合成材料選択方法は、更新されたモデルを用いて適切に材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法において、合成の成否情報に基づいて、制御装置に対し、合成の成功した材料の識別子及び測定する物性を指定して、物性測定処理の指示を行い、制御装置からの物性測定処理結果に基づいて、データベースにおける合成の成功した材料の材料物性情報を更新する処理を含む。これにより、合成材料選択方法は、更新された材料物性情報を用いて適切な材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法において、材料物性情報の更新は、物性測定処理結果が目標値を満たす場合には、データベースにおいて、目標値を満たす材料について材料物性情報を更新し、更新した材料物性情報に基づき、物性予測モデルを更新する処理を含む。これにより、合成材料選択方法は、更新された物性予測モデルを用いて適切な材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法において、制御装置は、識別子で特定される合成の成功した材料に対する、指示された物性測定処理の制御を行い、識別子及び測定された物性値を提供する。これにより、合成材料選択方法は、適切に測定された物性値及びその物性値に対応する材料を示す情報を提供することができる。
 また、本開示に係る合成材料選択方法において、物性測定処理の制御は、合成装置の合成した材料を自動的に測定装置(上記例では測定装置13。以下同様)に移動し、指示された物性測定を行うことを測定装置に指示し、測定装置から、物性測定処理結果を受信する処理を含む。これにより、合成材料選択方法は、物性測定処理結果を利用可能にすることができる。
 また、本開示に係る合成材料選択方法において、材料の属性は、低分子、色素、高分子、蛍光・同定同位体標識、自己組織化材料・構造体、生体材料(糖類、ペプチド、ポリペプチド、アミノ酸、タンパク質、脂肪化合物、DNA等)、有機薄膜(蒸着、塗布プロセス)、無機材料(固相法、共沈法、溶融急冷法、ゾルゲル法等)、ナノ粒子、金属錯体、無機薄膜(ALD、スパッタリング等)、合成生物学的手法(遺伝子組み換えと細菌利用による材料合成)に基づく合成材料、結晶構造、ナノ構造、マイクロ構造を持つ機能性材料のうち、少なくとも一つを含む。これにより、合成材料選択方法は、材料の属性に関する情報を用いて適切に材料の選択を行うことができる。
 また、本開示に係る合成材料選択方法において、データベースの材料物性情報は少なくとも二の項目を含むように構造化されており、少なくとも二の項目のうちの一は、材料の属性項目である。これにより、合成材料選択方法は、二の項目以上を含む材料物性情報の属性に関する情報を用いて適切に材料の選択を行うことができる。
 上記のように、本開示に係る材料製造方法は、データベースの材料物性情報と実行可能性情報を用いて合成対象の材料を選択する材料選択を行い、制御装置に対して、選択された材料の合成処理の指示を行い、制御装置からの合成処理結果に基づいて、データベースの実行可能性情報を更新する、処理により材料を製造する。これにより、合成材料選択方法は、合成の実行性に基づいて合成された材料を製造することができる。
 上記のように、本開示に係る合成材料選択データ構造は、合成処理の対象となる材料の選択を行う情報処理装置(上記例では制御装置20、情報処理装置100または制御装置200等。以下同様)で用いられる合成材料選択データ構造であって、材料を識別するIDと、予測される材料の物性値に基づく優先順位を示す優先順位情報と、材料の合成の実行可能性を示す実行可能性情報と、合成処理の成否を示す合成成否情報とを含み、情報処理装置が、合成成否情報が未処理を示す材料群を対象として、優先順位情報に基づく優先順位が高い方から順に探索し、合成成否情報が示す合成処理の成否が所定の基準を満たす材料を選択する処理に用いられる。これにより、合成材料選択方法は、合成の実行性に基づく材料合成を可能にすることができる。
 上述したように、材料探索製造システム1は、合成・測定で失敗する可能性の高い材料を回避し、不必要な合成・測定を削減することで、時間的かつ費用的に飛躍的に効率的な材料探索製造システムである。
 このように、材料探索製造システム1においては、現在のデータベースの情報に基づいて、過去に合成したことのない新規な材料を合成対象として選択し、実際の合成装置で合成を試みた結果を用いて、実時間でデータベースを更新するとともに、合成が成功した場合であっても、期待した性質の材料が生成できたかどうかを測定した結果を用いて、実時間でデータを更新することができ、その結果を用いて実行可能性モデル25及び物性予測モデルを構築するようにされている。このため、次回に材料選択を行う場合に、合成・測定で失敗する可能性の高い材料を回避し、不必要な合成・測定を削減することで、時間的かつ費用的に飛躍的に効率的な材料探索製造システムが構築できる。
 上述したように、材料探索製造システム1は、材料製造条件のそろった物性値を蓄積した物性データベースを活用した、高精度物性予測システムである。
 このように、材料探索製造システム1においては、物性値を蓄積したデータベースを備え、合成装置と連動して、最新の合成物の測定データを踏まえてデータを更新することができるように、物性予測モデルを構築し、更新することができる。このため、合成材料選択方法は、従来の手法と比較して、より高精度に新規に合成されうる材料の物性を予測することができるという効果がある。
 上述したように、材料探索製造システム1は、材料製造条件のそろった実行性データ(合成・測定の成否)を蓄積した実行性データベース23を活用した、材料の合成可能性予測システムおよび測定成功確率予測システムである。
 このように、材料探索製造システム1においては、材料選択時のデータベースの情報に基づいて、新規の材料を選択し、実際の合成装置で合成を試みた結果を用いて、実時間でデータベースを更新するとともに、合成が成功した場合であっても、期待した性質の材料が生成できたかどうかを測定した結果を用いて、実時間でデータを更新することができ、その結果を用いて実行可能性モデル25及び物性予測モデル24を構築する。このため、材料製造条件のそろった実行性データ(合成・測定の成否)を蓄積した実行性データベース23を活用した、材料の合成可能性予測システムおよび測定成功確率予測システムを構築することができる。
 上述したように、材料探索製造システム1は、低分子、色素、高分子、蛍光・同定同位体標識、自己組織化材料・構造体、生体材料(糖類、ペプチド、ポリペプチド、アミノ酸、タンパク質、脂肪化合物、DNA等)、有機薄膜(蒸着、塗布プロセス)、無機材料(固相法、共沈法、溶融急冷法、ゾルゲル法等)、ナノ粒子、金属錯体、無機薄膜(ALD、スパッタリング等)、合成生物学的手法(遺伝子組み換えと細菌利用による材料合成)に基づく合成材料、等の材料、合成プロセス、測定プロセスを高効率で最適化する材料合成・探索システムである。また、材料探索製造システム1は、結晶構造、ナノ構造、マイクロ構造を持つ機能性材料の合成・測定および特性の最適化を行う構造探索システムであり、安定、準安定な結晶構造、凝集構造を探索する構造探索システムである。
 このように、材料探索製造システム1においては、材料属性の情報を用いて、新規の材料を選択し、実際の合成装置で合成を試みた結果を用いて、実時間でデータベースを更新するとともに、合成が成功した場合であっても、期待した性質の材料が生成できたかどうかを測定した結果を用いて、実時間でデータを更新することができ、その結果を用いて実行可能性モデル25及び物性予測モデル24を構築する。このため、材料製造条件のそろった実行性データ(合成・測定の成否)を蓄積した実行性データベース23を活用した、材料の合成可能性予測システムおよび測定成功確率予測システムを構築することができる。
 上述したように、本開示のデータベースで選択できる材料は記述子によって管理されており、各材料の材料物性情報は少なくとも二つ以上のデータ項目を含むように構造化されており、構造化されたデータ項目の一部は材料の属性に関するものである。
 なお、属性については、例えば機能性材料に関する属性であり、例えば、低分子、色素、高分子、蛍光・同定同位体標識、自己組織化材料・構造体、生体材料(糖類、ペプチド、ポリペプチド、アミノ酸、タンパク質、脂肪化合物、DNA等)、有機薄膜(蒸着、塗布プロセス)、無機材料(固相法、共沈法、溶融急冷法、ゾルゲル法等)、ナノ粒子、金属錯体、無機薄膜(ALD、スパッタリング等)、合成生物学的手法(遺伝子組み換えと細菌利用による材料合成)に基づく合成材料、結晶構造、ナノ構造、マイクロ構造等がある。
 上述したように、材料探索製造システム1は、物理・化学・生物的な方法による材料製造によって評価できるあらゆる特性・物性(機械的性質、熱的性質、電気的性質、磁気的性質、光学的性質、電気化学的特性、薬効、毒性、抗体反応、細胞との相互作用、体内器官との相互作用、細胞内の輸送性、生体内輸送性、吸着性、溶解性、等)の最適化を効率よく行う探索システムである。
 本開示で測定される特性は、例えば、物理・化学・生物的な方法による材料製造によって評価できるあらゆる特性・物性(機械的性質、熱的性質、電気的性質、磁気的性質、光学的性質、電気化学的特性、薬効、毒性、抗体反応、細胞との相互作用、体内器官との相互作用、細胞内の輸送性、生体内輸送性、吸着性、溶解性、等)であってもよい。
 このように、材料探索製造システム1においては、物理・化学・生物的な方法による材料製造によって評価できるあらゆる特性・物性の情報に基づいて、新規の材料を選択し、実際の合成装置で合成を試みた結果を用いて、実時間でデータベースを更新するとともに、合成が成功した場合であっても、期待した性質の材料が生成できたかどうかを測定した結果を用いて、実時間でデータを更新することができ、その結果を用いて実行可能性モデル25及び物性予測モデル24を構築する。このため、材料製造条件のそろった実行性データ(合成・測定の成否)を蓄積した実行性データベース23を活用した、新規材料の製造システムを構築することができる。
 なお、上述した材料探索製造システム1は、各種処理を行う処理システムの一例に過ぎず、処理システムは様々な用途で用いられるシステムであってもよい。例えば、処理システムは以下のような用途で用いられる処理システムであってもよい。
 材料合成・物性測定に関して、成功データと失敗データの両方を含む実行性データベース23が得られるため、材料合成・物性測定に成功するための材料の特徴、失敗する材料の特徴をそれぞれ見出すことができる。これら材料の特徴を活用することで、材料探索空間の範囲設定の自動拡大機能を持つ材料探索製造システムが実現できる。例えば、処理システムは、成功データと失敗データの分析から、材料製造装置の課題・律速過程の自動検出、改良方針を示す等、最適な装置機能拡張を自ら提示する探索システムである。
 例えば、処理システムは、インターネットを通じてアクセス可能な複数の材料製造装置を状況に応じて使い分ける材料探索製造システム。相互に実行性データの授受を行って統合することで、ユニバーサルな実行可能性予測システムである。
 この場合、専用のソフトウェアを用いて、材料合成のワークフロー作成や、材料の指定、分注量、等の装置制御に加えてデータ管理を簡便に行えるような自動材料合成システムが存在するが、本開示の構成または処理と連携させることにより、材料製造中の分析データなどを用いて、データベースに反映でき、さらに、直近の材料合成における合成の成功・失敗、さらには、分析結果における目標達成度、等を踏まえて、自動的に、次の候補となる材料を選択することができるため、より効率的に、成功確率の高い材料を選択できる材料探索を可能にする。
 また、インターネットを通じてアクセス可能な複数の装置を状況に応じて使い分ける材料探索製造システムとすることで、装置間で、相互に実行性データの授受を行って統合することで、ユニバーサルな実行可能性予測システムを構築することができる。
 また、制御ネットワークは、インターネットに、有線またはWi-Fi(登録商標)(Wireless-Fidelity)、4G/5G等の無線ネットワークを介して接続されるようにされていれば良い。
 また、本開示で使用される合成装置等は、大規模化が想定されるが、これらは、クラウド上の仮想化技術を用いて、分散した材料製造装置を一つのシステムとして統合的に管理できるようにすることで、制御インターフェースを介して、リアルタイムにデータの送受信を行うことができる。
 これにより、ネットワークを介して、本開示の材料探索で選択した材料の合成を指示し、合成の成否についてのデータを受信し、さらに分析を指示し、分析の成否についてのデータを受信することで、次回の材料探索を行い、さらに、継続的に、材料製造装置を制御し、材料合成を継続することができる。
 例えば、本開示の実行性データベース23は、実行性データの標準化に基づいた、比較・再利用可能な実行性データベースである。また、例えば、処理システムは、実行性データベース23を活用した、高精度な材料開発のコスト予測システムである。例えば、処理システムにより提供されるサービスは、実行可能性モデル25を活用した、高精度な材料探索サービスである。
[4.その他]
 上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
 また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
 また、上述してきた各実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
 また、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。
[5.ハードウェア構成]
 上述してきた各実施形態や変形例に係る情報処理装置100、制御装置200、材料製造装置10等の情報機器は、例えば図29に示すような構成のコンピュータ1000によって実現される。図29は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。以下、情報処理装置100を例に挙げて説明する。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェース1500、及び入出力インターフェース1600を有する。コンピュータ1000の各部は、バス1050によって接続される。
 CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、CPU1100は、ROM1300又はHDD1400に格納されたプログラムをRAM1200に展開し、各種プログラムに対応した処理を実行する。
 ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるBIOS(Basic Input Output System)等のブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
 HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、HDD1400は、プログラムデータ1450の一例である本開示に係る情報処理プログラム等の情報処理プログラムを記録する記録媒体である。
 通信インターフェース1500は、コンピュータ1000が外部ネットワーク1550(例えばインターネット)と接続するためのインターフェースである。例えば、CPU1100は、通信インターフェース1500を介して、他の機器からデータを受信したり、CPU1100が生成したデータを他の機器へ送信したりする。
 入出力インターフェース1600は、入出力デバイス1650とコンピュータ1000とを接続するためのインターフェースである。例えば、CPU1100は、入出力インターフェース1600を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、CPU1100は、入出力インターフェース1600を介して、ディスプレイやスピーカーやプリンタ等の出力デバイスにデータを送信する。また、入出力インターフェース1600は、所定の記録媒体(メディア)に記録されたプログラム等を読み取るメディアインターフェースとして機能してもよい。メディアとは、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
 例えば、コンピュータ1000が情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされた情報処理プログラム等の情報処理プログラムを実行することにより、制御部130等の機能を実現する。また、HDD1400には、本開示に係る情報処理プログラム等の情報処理プログラムや、記憶部120内のデータが格納される。なお、CPU1100は、プログラムデータ1450をHDD1400から読み取って実行するが、他の例として、外部ネットワーク1550を介して、他の装置からこれらのプログラムを取得してもよい。
 なお、本技術は以下のような構成も取ることができる。
(1)
 データベースの材料物性情報と実行可能性情報に基づいて合成対象の材料を選択する材料選択を行い、
 制御装置に対して、前記選択された材料の合成処理の指示を行い、
 前記制御装置からの合成処理結果に基づいて、前記データベースの実行可能性情報を更新する、
 合成材料選択方法。
(2)
 前記データベースは、二以上の合成処理対象の材料を含む、
 (1)に記載の合成材料選択方法。
(3)
 前記材料選択では、過去に合成の成功した材料を含まないように選択される、
 (1)または(2)に記載の合成材料選択方法。
(4)
 前記材料選択では、前記材料物性情報に基づく材料の第一の予測値に基づく優先順位に従って行われる、
 (1)~(3)のいずれか1つに記載の合成材料選択方法。
(5)
 前記第一の予測値は、前記データベースに登録された材料を構成する二以上の材料各々の材料特徴量に基づく入力に応じて、物性予測モデルから出力される、
 (4)に記載の合成材料選択方法。
(6)
 前記材料選択では、前記実行可能性情報に基づく材料の第二の予測値に基づく優先順位に従って行われる、
 (4)または(5)に記載の合成材料選択方法。
(7)
 前記材料選択では、第二の予測値が所定の閾値以上のものから選択される、
 (6)に記載の合成材料選択方法。
(8)
 前記第二の予測値は、前記データベースに登録された材料を構成する二以上の材料各々の材料特徴量に基づく入力に応じて実行可能性モデルから出力される、
 (6)または(7)に記載の合成材料選択方法。
(9)
 前記選択された材料は、前記優先順位の順に選択され、選択された材料は、少なくとも一つの項目を含むリスト形式で指定され、前記項目は、前記材料の識別子及び優先順位を含む、
 (4)~(8)のいずれか1つに記載の合成材料選択方法。
(10)
 前記制御装置は、前記優先順位に従って前記リスト形式で提供される前記材料の合成処理を制御し、前記材料ごとに前記合成処理結果を提供し、前記合成処理結果は、前記制御された合成処理の材料の識別子及び合成の成否情報である、
 (9)に記載の合成材料選択方法。
(11)
 前記合成処理の制御は、合成装置に合成処理を指示し、前記合成装置から、前記合成処理結果を受信する処理を含む、
 (10)に記載の合成材料選択方法。
(12)
 前記実行可能性情報の更新では、前記合成の成否情報が成功の場合には、前記データベースにおいて、前記合成の成功した材料について前記実行可能性情報を更新し、さらに更新した実行可能性情報に基づき、実行可能性モデルを更新する、
 (11)に記載の合成材料選択方法。
(13)
 前記合成の成否情報に基づいて、前記制御装置に対し、前記合成の成功した材料の識別子及び測定する物性を指定して、物性測定処理の指示を行い、前記制御装置からの物性測定処理結果に基づいて、前記データベースにおける前記合成の成功した材料の材料物性情報を更新する処理を含む、
 (11)または(12)に記載の合成材料選択方法。
(14)
 前記材料物性情報の更新は、前記物性測定処理結果が目標値を満たす場合には、前記データベースにおいて、前記目標値を満たす材料について前記材料物性情報を更新し、更新した材料物性情報に基づき、物性予測モデルを更新する処理を含む、
 (13)に記載の合成材料選択方法。
(15)
 前記制御装置は、前記識別子で特定される前記合成の成功した材料に対する、前記指示された物性測定処理の制御を行い、前記識別子及び前記測定された物性値を提供する、
 (13)または(14)に記載の合成材料選択方法。
(16)
 前記物性測定処理の制御は、前記合成装置の合成した材料を自動的に測定装置に移動し、前記指示された物性測定を行うことを前記測定装置に指示し、前記測定装置から、前記物性測定処理結果を受信する処理を含む、
 (13)~(15)のいずれか1つに記載の合成材料選択方法。
(17)
 前記データベースの材料物性情報は少なくとも二の項目を含むように構造化されており、前記少なくとも二の項目のうちの一は、前記材料の属性項目である、
 (1)~(16)のいずれか1つに記載の合成材料選択方法。
(18)
 データベースの材料物性情報と実行可能性情報を用いて合成対象の材料を選択する材料選択を行い、
 制御装置に対して、前記選択された材料の合成処理の指示を行い、
 前記制御装置からの合成処理結果に基づいて、前記データベースの実行可能性情報を更新する、
 処理により材料を製造する材料製造方法。
(19)
 記憶部及び処理部を備える情報処理システムに用いられ、前記記憶部に記憶され、前記処理部における合成対象材料の選択に用いられるデータ構造であって、
 材料を識別するIDと、予測される材料の物性値に基づく優先順位を示す優先順位情報と、材料の合成の実行可能性を示す実行可能性情報と、合成処理の成否を示す合成成否情報とを含み、
 前記処理部が、前記合成成否情報が未処理を示す材料群を対象として、前記優先順位情報に基づく優先順位が高い方から順に探索し、前記合成成否情報が示す前記合成処理の成否が所定の基準を満たす材料を選択する処理に用いられる合成材料選択データ構造。
(20)
 機械学習モデルの出力する実行可能性情報に応じて材料選択を行い、
 制御装置に対して、前記選択された材料の合成処理の指示を行い、
 前記制御装置からの合成処理結果に基づいて、実行性データベースの情報を更新し、
 前記更新されたデータベースの実行可能性情報に基づいて前記機械学習モデルを更新し、
 更新された機械学習モデルを製造する製造方法。
(21)
 前記材料の属性は、低分子、色素、高分子、蛍光・同定同位体標識、自己組織化材料・構造体、生体材料(糖類、ペプチド、ポリペプチド、アミノ酸、タンパク質、脂肪化合物、DNA等)、有機薄膜(蒸着、塗布プロセス)、無機材料(固相法、共沈法、溶融急冷法、ゾルゲル法等)、ナノ粒子、金属錯体、無機薄膜(ALD、スパッタリング等)、合成生物学的手法(遺伝子組み換えと細菌利用による材料合成)に基づく合成材料、結晶構造、ナノ構造、マイクロ構造を持つ機能性材料のうち、少なくとも一つを含む、
 (1)~(16)のいずれか1つに記載の合成材料選択方法。
(22)
 前記物性測定処理で指示される処理は、物理・化学・生物的な方法による材料製造によって評価できる特性である、
 (13)~(16)のいずれか1つに記載の合成材料選択方法。
(23)
 前記特性は、機械的性質、熱的性質、電気的性質、磁気的性質、光学的性質、電気化学的特性、薬効、毒性、抗体反応、細胞との相互作用、体内器官との相互作用、細胞内の輸送性、生体内輸送性、吸着性、溶解性のうち、少なくとも一つを含む、
 (22)に記載の合成材料選択方法。
(24)
 データベースの材料物性情報と実行可能性情報を用いて合成対象の材料を選択する材料選択を行う処理部と、制御装置に対して、前記選択された材料の合成処理の指示を行い、前記制御装置からの材料合成処理結果に基づいて、前記データベースの実行可能性情報を更新する制御部、
 を備える合成材料選択装置。
(25)
 データベースの材料物性情報と実行可能性情報を用いて合成対象の材料を選択する材料選択を行い、
 制御装置に対して、前記選択された材料の合成処理の指示を行い、
 前記制御装置からの合成処理結果に基づいて、前記データベースの実行可能性情報を更新する、
 処理を実行させる合成材料選択プログラム。
 1 材料探索製造システム(情報処理システム)
 10 材料製造装置
 11 合成装置
 12 分析装置
 13 測定装置
 20 制御装置
 21 制御インターフェース
 22 物性データベース
 23 実行性データベース
 24 物性予測モデル
 25 実行可能性モデル
 26 探索エージェント
 N 制御ネットワーク

Claims (20)

  1.  データベースの材料物性情報と実行可能性情報に基づいて合成対象の材料を選択する材料選択を行い、
     制御装置に対して、前記選択された材料の合成処理の指示を行い、
     前記制御装置からの合成処理結果に基づいて、前記データベースの実行可能性情報を更新する、
     合成材料選択方法。
  2.  前記データベースは、二以上の合成処理対象の材料を含む、
     請求項1に記載の合成材料選択方法。
  3.  前記材料選択では、過去に合成の成功した材料を含まないように選択される、
     請求項1に記載の合成材料選択方法。
  4.  前記材料選択では、前記材料物性情報に基づく材料の第一の予測値に基づく優先順位に従って行われる、
     請求項1に記載の合成材料選択方法。
  5.  前記第一の予測値は、前記データベースに登録された材料を構成する二以上の材料各々の材料特徴量に基づく入力に応じて物性予測モデルから出力される、
     請求項4に記載の合成材料選択方法。
  6.  前記材料選択では、前記実行可能性情報に基づく材料の第二の予測値に基づく優先順位に従って行われる、
     請求項4に記載の合成材料選択方法。
  7.  前記材料選択では、第二の予測値が所定の閾値以上のものから選択される、
     請求項6に記載の合成材料選択方法。
  8.  前記第二の予測値は、前記データベースに登録された材料を構成する二以上の材料各々の材料特徴量に基づく入力に応じて実行可能性モデルから出力される、
     請求項6に記載の合成材料選択方法。
  9.  前記選択された材料は、前記優先順位の順に選択され、選択された材料は、少なくとも一つの項目を含むリスト形式で指定され、前記項目は、前記材料の識別子及び優先順位を含む、
     請求項4に記載の合成材料選択方法。
  10.  前記制御装置は、前記優先順位に従って前記リスト形式で提供される前記材料の合成処理を制御し、前記材料ごとに前記合成処理結果を提供し、前記合成処理結果は、前記制御された合成処理の材料の識別子及び合成の成否情報である、
     請求項9に記載の合成材料選択方法。
  11.  前記合成処理の制御は、合成装置に合成処理を指示し、前記合成装置から、前記合成処理結果を受信する処理を含む、
     請求項10に記載の合成材料選択方法。
  12.  前記実行可能性情報の更新では、前記合成の成否情報が成功の場合には、前記データベースにおいて、前記合成の成功した材料について前記実行可能性情報を更新し、さらに更新した実行可能性情報に基づき、実行可能性モデルを更新する、
     請求項11に記載の合成材料選択方法。
  13.  前記合成の成否情報に基づいて、前記制御装置に対し、前記合成の成功した材料の識別子及び測定する物性を指定して、物性測定処理の指示を行い、前記制御装置からの物性測定処理結果に基づいて、前記データベースにおける前記合成の成功した材料の材料物性情報を更新する処理を含む、
     請求項11に記載の合成材料選択方法。
  14.  前記材料物性情報の更新は、前記物性測定処理結果が目標値を満たす場合には、前記データベースにおいて、前記目標値を満たす材料について前記材料物性情報を更新し、更新した材料物性情報に基づき、物性予測モデルを更新する処理を含む、
     請求項13に記載の合成材料選択方法。
  15.  前記制御装置は、前記識別子で特定される前記合成の成功した材料に対する、前記指示された物性測定処理の制御を行い、前記識別子及び前記測定された物性値を提供する、
     請求項13に記載の合成材料選択方法。
  16.  前記物性測定処理の制御は、前記合成装置の合成した材料を自動的に測定装置に移動し、前記指示された物性測定を行うことを前記測定装置に指示し、前記測定装置から、前記物性測定処理結果を受信する処理を含む、
     請求項13に記載の合成材料選択方法。
  17.  前記データベースの材料物性情報は少なくとも二の項目を含むように構造化されており、前記少なくとも二の項目のうちの一は、前記材料の属性項目である、
     請求項1に記載の合成材料選択方法。
  18.  データベースの材料物性情報と実行可能性情報を用いて合成対象の材料を選択する材料選択を行い、
     制御装置に対して、前記選択された材料の合成処理の指示を行い、
     前記制御装置からの合成処理結果に基づいて、前記データベースの実行可能性情報を更新する、
     処理により材料を製造する材料製造方法。
  19.  記憶部及び処理部を備える情報処理システムに用いられ、前記記憶部に記憶され、前記処理部における合成対象材料の選択に用いられるデータ構造であって、
     材料を識別するIDと、予測される材料の物性値に基づく優先順位を示す優先順位情報と、材料の合成の実行可能性を示す実行可能性情報と、合成処理の成否を示す合成成否情報とを含み、
     前記処理部が、前記合成成否情報が未処理を示す材料群を対象として、前記優先順位情報に基づく優先順位が高い方から順に探索し、前記合成成否情報が示す前記合成処理の成否が所定の基準を満たす材料を選択する処理に用いられる合成材料選択データ構造。
  20.  機械学習モデルの出力する実行可能性情報に応じて材料選択を行い、
     制御装置に対して、前記選択された材料の合成処理の指示を行い、
     前記制御装置からの合成処理結果に基づいて、実行性データベースの情報を更新し、
     前記更新されたデータベースの実行可能性情報に基づいて前記機械学習モデルを更新し、
     更新された機械学習モデルを製造する製造方法。
PCT/JP2022/039200 2021-11-01 2022-10-20 合成材料選択方法、材料製造方法、合成材料選択データ構造、及び製造方法 WO2023074542A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP22886869.1A EP4428866A1 (en) 2021-11-01 2022-10-20 Synthesis material selection method, material production method, synthesis material selection data structure, and production method
CN202280071623.0A CN118160042A (zh) 2021-11-01 2022-10-20 合成材料选择方法、材料制造方法、合成材料选择数据结构和制造方法
JP2023556385A JPWO2023074542A1 (ja) 2021-11-01 2022-10-20

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021-178996 2021-11-01
JP2021178996 2021-11-01

Publications (1)

Publication Number Publication Date
WO2023074542A1 true WO2023074542A1 (ja) 2023-05-04

Family

ID=86159416

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/039200 WO2023074542A1 (ja) 2021-11-01 2022-10-20 合成材料選択方法、材料製造方法、合成材料選択データ構造、及び製造方法

Country Status (4)

Country Link
EP (1) EP4428866A1 (ja)
JP (1) JPWO2023074542A1 (ja)
CN (1) CN118160042A (ja)
WO (1) WO2023074542A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003014728A (ja) * 2000-06-14 2003-01-15 Pfizer Pharmaceuticals Inc 薬物動態学的物性の予測方法及びシステム
JP2005166053A (ja) * 2003-12-01 2005-06-23 Accelrys Software Inc 高速処理の実験情報をデータベースに保存する方法
WO2017221444A1 (ja) 2016-06-21 2017-12-28 国立研究開発法人物質・材料研究機構 探索システム、探索方法および物性データベース管理装置
JP2021140701A (ja) * 2020-03-09 2021-09-16 株式会社豊田中央研究所 材料設計プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003014728A (ja) * 2000-06-14 2003-01-15 Pfizer Pharmaceuticals Inc 薬物動態学的物性の予測方法及びシステム
JP2005166053A (ja) * 2003-12-01 2005-06-23 Accelrys Software Inc 高速処理の実験情報をデータベースに保存する方法
WO2017221444A1 (ja) 2016-06-21 2017-12-28 国立研究開発法人物質・材料研究機構 探索システム、探索方法および物性データベース管理装置
JP2021140701A (ja) * 2020-03-09 2021-09-16 株式会社豊田中央研究所 材料設計プログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HATANAKA, MIHO: "Achievements and challenges of materials informatics in chemistry", JOURNAL OF JAPANESE SOCIETY FOR ARTIFICIAL INTELLIGENCE, vol. 34, no. 3, 1 May 2019 (2019-05-01), pages 351 - 357, XP009545490, ISSN: 2188-2266, DOI: 10.11517/jjsai.34.3_351 *
HISAKI IKEBATAKENTA HONGOTETSU ISOMURARYO MAEZONORYO YOSHIDA: "Bayesian molecular design with a chemical language model", JOURNAL OF COMPUTER-AIDED MOLECULAR DESIGN, vol. 31, 2017, pages 379 - 391, XP036211747, DOI: 10.1007/s10822-016-0008-z
KIM, Y.KIM, E.ANTONO, E. ET AL.: "Machine-learned metrics for predicting the likelihood of success in materials discovery", NPJ COMPUT MATER, vol. 6, 2020, pages 131

Also Published As

Publication number Publication date
EP4428866A1 (en) 2024-09-11
JPWO2023074542A1 (ja) 2023-05-04
CN118160042A (zh) 2024-06-07

Similar Documents

Publication Publication Date Title
Strieth-Kalthoff et al. Machine learning the ropes: principles, applications and directions in synthetic chemistry
WO2019186194A2 (en) Ensemble model creation and selection
Tsirigos et al. PRED-TMBB2: improved topology prediction and detection of beta-barrel outer membrane proteins
Yeang et al. Physical network models
Amabilino et al. Guidelines for recurrent neural network transfer learning-based molecular generation of focused libraries
US20210090690A1 (en) Molecular design using reinforcement learning
KR20220092881A (ko) 목적하는 유기 분자에 대한 유기 합성 경로를 설계하기 위한 시스템 및 방법
Harada Simple, yet efficient conformational sampling methods for reproducing/predicting biologically rare events of proteins
Powers et al. Fragment-based ligand generation guided by geometric deep learning on protein-ligand structure
US11215467B1 (en) Method of and system for path selection
JP5211458B2 (ja) 化合物の仮想スクリーニング方法および装置
Moret et al. Perplexity-based molecule ranking and bias estimation of chemical language models
Hu et al. De novo drug design based on Stack-RNN with multi-objective reward-weighted sum and reinforcement learning
Stringer et al. PIPENN: protein interface prediction from sequence with an ensemble of neural nets
US12018948B2 (en) Method of and system for path selection
Wang et al. A transformer-based generative model for de novo molecular design
Wu et al. Spatial graph attention and curiosity-driven policy for antiviral drug discovery
WO2023074542A1 (ja) 合成材料選択方法、材料製造方法、合成材料選択データ構造、及び製造方法
Kesheri et al. Advances in soft computing approaches for gene prediction: a bioinformatics approach
Khemchandani et al. DeepGraphMol, a multi-objective, computational strategy for generating molecules with desirable properties: a graph convolution and reinforcement learning approach
Wang et al. A pre-trained conditional transformer for target-specific de novo molecular generation
Chin et al. Predicting condensate formation of protein and RNA under various environmental conditions
Ghandikota et al. Multimodal feature learning framework for disease biomarker discovery
Gambacorta et al. Machine learning resources for drug design
JP7495549B1 (ja) 物質の探索支援方法、物質の探索支援装置、コンピュータプログラム及び物質の製造方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22886869

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023556385

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 18703731

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 202280071623.0

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2022886869

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2022886869

Country of ref document: EP

Effective date: 20240603