WO2023176350A1 - 情報処理システム、情報処理装置、計算装置、情報処理方法、および計算方法 - Google Patents

情報処理システム、情報処理装置、計算装置、情報処理方法、および計算方法 Download PDF

Info

Publication number
WO2023176350A1
WO2023176350A1 PCT/JP2023/006506 JP2023006506W WO2023176350A1 WO 2023176350 A1 WO2023176350 A1 WO 2023176350A1 JP 2023006506 W JP2023006506 W JP 2023006506W WO 2023176350 A1 WO2023176350 A1 WO 2023176350A1
Authority
WO
WIPO (PCT)
Prior art keywords
relational expression
variables
calculation
information
values
Prior art date
Application number
PCT/JP2023/006506
Other languages
English (en)
French (fr)
Inventor
和秀 市川
暁 大内
智康 横山
航輝 上野
Original Assignee
パナソニックIpマネジメント株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニックIpマネジメント株式会社 filed Critical パナソニックIpマネジメント株式会社
Publication of WO2023176350A1 publication Critical patent/WO2023176350A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data

Definitions

  • the present disclosure relates to a technique for processing the structure of an aggregate of atoms, such as a crystal.
  • Non-Patent Document 1 discloses a method of calculating a stable crystal structure using a cluster expansion method and Monte Carlo simulation.
  • Patent Document 1 discloses a mixture performance optimization device and the like. In this mixture performance optimization device, an energy function formula is used in calculations for optimizing the performance of the mixture by weighting each of a plurality of physical properties of the mixture. Thereby, the mixture performance optimization device can optimize the performance of the mixture not only as a calculation result but also as an actual performance even when the mixture includes many physical properties.
  • Patent Document 2 discloses a crystal material analysis device that converts two crystal structures into a graph and calculates structural similarity.
  • Patent Document 3 discloses a design program for designing the composition of a stable perovskite crystal structure.
  • Patent Document 1 Even if the methods or devices described in Non-Patent Document 1, Patent Document 1, Patent Document 2, and Patent Document 3 are used, there is a problem in that it is difficult to improve the efficiency of processing related to searching for the structure of an aggregation of atoms. .
  • the present disclosure solves the above problems and provides an information processing system and the like that can improve the efficiency of processing related to searching for the structure of an aggregation of atoms.
  • an information processing system includes an information processing device that transmits information regarding a relational expression representing the energy of a structure of an aggregation of atoms; and a calculation device that performs a calculation using the relational expression, wherein the aggregate of atoms includes two or more atomic states, and the relational expression includes: (a) the two states included in the aggregate; A relational expression obtained based on the above atomic information regarding the atomic states and (b) positional information regarding two or more positions in which any of the two or more atomic states within the aggregate can be respectively placed.
  • a communication unit that receives from the calculation device the values of the two or more variables derived by performing calculations using the method; and structure information indicating the structure of the aggregate corresponding to the values of the two or more variables. and an output section that outputs the output.
  • the computer-readable recording medium includes a non-transitory recording medium such as a CD-ROM (Compact Disc Read-Only Memory).
  • FIG. 1 is a diagram illustrating an example of the configuration of an information processing system according to the first embodiment.
  • FIG. 2 is a block diagram showing an example of the functional configuration of the information processing device and the optimization device in the first embodiment.
  • FIG. 3 is a diagram for explaining an example of processing of the information processing apparatus in the first embodiment.
  • FIG. 4 is a diagram illustrating an example of coefficients obtained by the information processing device in the first embodiment.
  • FIG. 5 is a diagram for explaining an example of processing by the optimization device and the information processing device in the first embodiment.
  • FIG. 6 is a flowchart illustrating an example of processing operations by the information processing system in the first embodiment.
  • FIG. 7 is a flowchart showing in detail an example of the process of step S11 in FIG. FIG.
  • FIG. 8 is a diagram showing a specific example of the processing in steps S111 and S113 in FIG. 7.
  • FIG. 9 is a diagram showing a specific example of the processing in steps S114 and S115 in FIG. 7.
  • FIG. 10 is a flowchart showing in detail an example of the process of step S12 in FIG.
  • FIG. 11 is a diagram showing a specific example of the process of step S121 in FIG. 10.
  • FIG. 12 is a diagram showing a specific example of the processing in steps S122 and S123 in FIG. 10.
  • FIG. 13 is a diagram showing another specific example of the processing in steps S122 and S123 in FIG. 10.
  • FIG. 14 is a diagram showing another specific example of the process of step S121 in FIG. 10.
  • FIG. 10 is a flowchart showing in detail an example of the process of step S12 in FIG.
  • FIG. 11 is a diagram showing a specific example of the process of step S121 in FIG. 10.
  • FIG. 12 is a diagram showing a specific example of the processing in steps
  • FIG. 15 is a diagram showing another specific example of the processing in steps S122 and S123 in FIG. 10.
  • FIG. 16 is a block diagram illustrating an example of the functional configuration of an information processing device and a sampling device included in the information processing system according to the second embodiment.
  • FIG. 17 is a diagram for explaining the Boltzmann distribution.
  • FIG. 18 is a diagram for explaining an example of processing by the sampling device and the information processing device in the second embodiment.
  • FIG. 19 is a flowchart illustrating an example of processing operations by the information processing system in the second embodiment.
  • FIG. 20 is a diagram illustrating an example of an additional processing operation of the first control unit in the second embodiment.
  • FIG. 21 is a block diagram illustrating an example of the functional configuration of an information processing device and a computing device included in the information processing system according to the third embodiment.
  • FIG. 22 is a flowchart illustrating an example of processing operations by the information processing system in the third embodiment.
  • FIG. 23 is a flowchart illustrating an example of processing operations performed by the information processing system in Modification 1 of Embodiment 3.
  • oxides of transition metal elements are often used as positive electrode materials for Li-ion secondary batteries, but performance (e.g., potential, capacity, etc.) may be improved by using multiple transition metal element species; The degree of this depends on the proportion of transition metal species. In order to predict by calculation the ratio at which the performance is optimal, it is necessary to know which transition metal is stable when placed at which crystal site, so methods for determining stable structures are extremely important for material development. be. In addition, it is useful for negative electrode materials, solid electrolyte materials, high-temperature structural materials, biological materials, fusion reactor structural materials, electrolytic capacitor materials, catalyst materials, and the like.
  • a method for determining the optimal arrangement of each atom with respect to energy has been implemented.
  • the energy of the crystal structure corresponding to that combination is calculated, and the combination of configurations that minimizes the energy is determined.
  • the arrangement combination is a combination of atoms arranged at each of a plurality of sites.
  • the combination of configurations that minimizes energy is the optimal configuration for each of the atoms described above.
  • Non-Patent Document 1 discloses a method that uses a method called the cluster expansion method to calculate the energy of a crystal structure, and searches for a combination of configurations that minimizes the energy using the Monte Carlo method (specifically, the simulated annealing method). has been done.
  • the cluster expansion method by using the cluster expansion method, it is possible to reduce the cost of calculating the energy of each crystal structure without significantly reducing accuracy, and by using the Monte Carlo method, it is possible to calculate all combinations of configurations. Optimal placement can be found without any problems.
  • Non-Patent Document 1 requires a large amount of computational resources to determine a stable crystal structure.
  • Patent Document 1 discloses a method of calculating a mixing ratio so that the performance of a mixture of a plurality of materials is optimized. More specifically, the method involves acquiring the physical property values of the materials before they are mixed, converting the energy function equation into an Ising-type function to perform calculations to optimize the performance of the mixture, and then using the annealing machine. output the optimal mixing ratio.
  • Patent Document 2 discloses a method for calculating the structural similarity of two crystal structures. More specifically, the method converts two crystal structures into labeled graphs, converts these two graphs into one graph called a conflict graph, and calculates the structure by finding the largest independent set of conflict graphs. Calculate similarity. Furthermore, in Patent Document 2, when determining the maximum independent set of a conflict graph, an Ising type function is constructed from the conflict graph, and the Ising type function is solved using an annealing machine or the like.
  • Patent Document 3 discloses an optimization method using an Ising model type function regarding a perovskite crystal structure. More specifically, the composition ratio of atomic species that provides a stable perovskite crystal structure is required.
  • Patent Document 1, Patent Document 2, and Patent Document 3 do not output a crystal structure. Even with the method of Patent Document 3, only the composition ratio of the perovskite crystal structure is determined, and information indicating the crystal structure is not output. Therefore, even if the methods of Patent Document 1, Patent Document 2, and Patent Document 3 are used in addition to the method of Non-Patent Document 1, it is difficult to determine the crystal structure when the number of combinations of configurations is enormous. be.
  • an information processing system includes an information processing device that transmits information regarding a relational expression representing the energy of a structure of an aggregation of atoms; a calculation device that performs a calculation using a A relational expression obtained based on atomic information and (b) positional information regarding two or more positions where any of the two or more atomic states within the aggregate can be placed,
  • the information processing device includes two or more variables indicating states of atoms placed at each of the above positions, and the information processing device transmits information regarding the relational expression to the calculation device and performs calculation using the relational expression.
  • a communication unit that receives the values of the two or more variables derived from the calculation device, and an output unit that outputs structure information indicating the structure of the aggregate corresponding to the values of the two or more variables.
  • relational expression that includes two or more variables that indicate the state of atoms located at each of two or more positions in the aggregate, and to use two or more variables that correspond to the magnitude of the energy expressed by the relational expression.
  • the value of is derived.
  • the structure of the aggregate is searched according to the magnitude of energy.
  • a relational expression can also be said to be an Ising model type function.
  • the Ising model type function is also simply called an Ising model. Therefore, by using such a relational expression, an annealing machine can be applied to the above search, and the computational cost of the search can be kept low compared to methods that use the conventional cluster expansion method and Monte Carlo method. I can do it.
  • the aggregate according to the size of energy structure can be easily constructed. As a result, it is possible to improve the efficiency of processing related to searching for the structure of an aggregation of atoms.
  • an energy function is also used as an Ising model type function, but the energy function represents the energy of the structure (i.e., physical energy) possessed by the aggregation of atoms in the present disclosure. It's not something you have.
  • an energy function for optimization with an Ising machine (also called an annealing machine) is configured as an Ising model type function using an empirical formula called a tolerance factor that is an indirect indicator of a stable structure.
  • the term "energy function" in Patent Document 3 is a customary term for an evaluation function that is optimized by an Ising machine, and does not represent physical energy in the present disclosure.
  • an information processing device includes (a) atomic information regarding states of two or more atoms included in an aggregation of atoms, and (b) states of the two or more atoms in the aggregation.
  • the calculation device may perform a search for finding an optimal solution of the first relational expression as a calculation using the first relational expression. It may also be a conversion device.
  • the values of two or more variables are derived by energy optimization for the first relational expression that includes two or more variables each indicating the state of an atom. Therefore, an annealing machine can be used for energy optimization, and the calculation cost for energy optimization can be kept low.
  • the values of two or more variables have a one-to-one correspondence with two or more positions within the aggregate, if the values of those two or more variables are derived, it is easy to create a stable structure of the aggregate. Can be built. As a result, it is possible to improve the efficiency of processing related to searching for a stable structure of an aggregation of atoms. Note that in energy optimization, the energy represented by the relational expression is not necessarily minimized or optimized.
  • the state of the atom includes the type of the atom, the spin state of the atom, and the atomic vacancy in which the atom is missing. It may include at least one of the following.
  • the first relational expression is
  • E represents the energy of the structure of the aggregate
  • each of i and j represents the position within the aggregate
  • ⁇ i represents the position within the aggregate
  • i is the variable at position j in the ensemble
  • A is the zero-order cluster interaction coefficient
  • B i is the first-order cluster interaction coefficient
  • C ij may be a second-order cluster interaction coefficient.
  • the first relational expression includes a first coefficient and n (n is an integer of 2 or more)
  • the energy is expressed by the sum of the n terms, and the kth term (k is an integer from 1 to n) of the n terms corresponds to each set of numbers that can be taken from the two or more variables.
  • the set may be a sum of products, and the set may be composed of k variables, and the product may be a product of the k variables included in the set and a second coefficient corresponding to the set.
  • the annealing machine can be appropriately used for energy optimization, and calculation costs can be effectively kept low.
  • the acquisition unit displays information using a cluster expansion method based on the atomic information and the position information.
  • the first relational expression may be obtained by converting the second relational expression into an Ising model.
  • the first relational expression which is the Ising model
  • the cluster expansion method can be used, and the processing burden required to obtain the first relational expression is can be reduced.
  • the second relational expression is
  • E indicates the energy of the structure of the aggregate
  • is a cluster identifier
  • V ⁇ indicates the magnitude of the contribution of cluster ⁇ to the energy.
  • ⁇ ⁇ may be a correlation function of cluster ⁇ .
  • the computing device performs sampling based on a predetermined distribution in the first aspect.
  • the sampling device performs calculation using a relational expression
  • the acquisition unit further acquires distribution information regarding the predetermined distribution
  • the communication unit further transmits the distribution information to the sampling device.
  • the values of the two or more variables are each derived by performing sampling based on the predetermined distribution according to the distribution information on the first relational expression.
  • the output unit may receive a plurality of combinations including the plurality of combinations from the sampling device, and output structure information indicating a structure of the aggregate corresponding to each of the plurality of combinations.
  • the predetermined distribution is a Boltzmann distribution
  • the distribution information is information indicating the temperature used for the Boltzmann distribution.
  • the predetermined distribution is not limited to the Boltzmann distribution, and may be other distributions.
  • the distribution information is not limited to information indicating temperature, and may be any information as long as it represents the predetermined distribution.
  • a plurality of combinations are derived by sampling based on a predetermined distribution for the first relational expression that includes two or more variables indicating the states of atoms located at each of two or more positions in the aggregate.
  • sampling can also be called a search.
  • the first relational expression is an Ising model type function. Therefore, by using such a first relational expression, an annealing machine can be applied to the sampling, and the calculation cost for sampling can be kept low compared to methods using the conventional cluster expansion method and Monte Carlo method. be able to.
  • the values of two or more variables included in each of multiple combinations have a one-to-one correspondence with two or more positions within the set, so if the values of those two or more variables are derived, the set Body structures can be easily constructed. As a result, it is possible to improve the efficiency of processing related to sampling or searching for the structure of an aggregation of atoms.
  • the calculation device is configured to calculate an optimal solution of the first relational expression.
  • an optimization device that performs a search using the first relational expression; and a sampling device that performs sampling based on a predetermined distribution as a calculation using the first relational expression; , furthermore, acquiring distribution information regarding the predetermined distribution, and transmitting information regarding the first relational expression, the communication unit transmits information regarding the first relational expression to each of the optimization device and the sampling device.
  • receiving from the sampling device a plurality of combinations each including values of the two or more variables, each of which is derived by performing sampling based on a distribution of , structure information indicating the structure of the aggregate may be output.
  • the values of two or more variables derived by performing the search for the optimal solution of the first relational expression that is, the energy optimization of the first relational expression, are used as the initial values for sampling based on the predetermined distribution. used. Therefore, it is possible to improve the sampling processing speed and reduce the calculation load.
  • the calculation device is configured to calculate an optimal solution of the first relational expression.
  • an optimization device that performs a search using the first relational expression; and a sampling device that performs sampling based on a predetermined distribution as a calculation using the first relational expression; , furthermore, acquiring distribution information regarding the predetermined distribution, and transmitting information regarding the first relational expression, the communication unit transmits information regarding the first relational expression to each of the optimization device and the sampling device. and further transmitting the distribution information to the sampling device, and performing sampling on the first relational expression based on the predetermined distribution according to the distribution information, respectively.
  • a plurality of combinations including initial values of the above variables are received from the sampling device, the plurality of combinations are sent to the optimization device, and in receiving the values of the two or more variables, the plurality of combinations are used.
  • Values of the two or more variables derived by performing a search to find an optimal solution to the first relational expression may be received from the optimization device.
  • the multiple combinations derived by sampling based on the predetermined distribution for the first relational expression that is, the values of two or more variables included in each of the multiple combinations, are determined by the energy optimization of the first relational expression. Used as the initial value. Therefore, it is possible to improve the sampling processing speed and reduce the calculation load.
  • the calculation device derives the values of two or more variables included in the relational expression by performing calculation using the relational expression expressing the energy of the structure of the aggregation of atoms.
  • an arithmetic unit that outputs the values of the two or more variables derived by the arithmetic unit; and (b) positional information regarding two or more positions in which any of the two or more atomic states within the aggregate can be placed, the relational expression being obtained based on the two or more atomic states. includes the two or more variables that indicate the states of atoms located at each position.
  • relational expression can be said to be an Ising model type function, so by using such a relational expression, it is possible to apply an annealing machine to the derivation of the values of two or more variables. Calculation costs can be kept low.
  • the calculation unit may perform a search for finding an optimal solution of the relational expression as a calculation using the relational expression.
  • the calculation unit performs sampling based on a predetermined distribution for the relational expression as a calculation using the relational expression, thereby generating a plurality of combinations.
  • the output unit may output the plurality of combinations, and each of the plurality of combinations may include values of two or more variables included in the relational expression.
  • each figure is a schematic diagram and is not necessarily strictly illustrated. Further, in each figure, substantially the same configurations are denoted by the same reference numerals, and redundant explanations will be omitted or simplified.
  • FIG. 1 is a diagram showing an example of the configuration of an information processing system 1000 in this embodiment.
  • the information processing system 1000 in this embodiment includes an information processing device 100 and an optimization device 200.
  • the information processing device 100 is a computer for searching for a stable structure of an aggregate of two or more atoms. Note that the aggregation of atoms can also be said to include two or more atomic states. Examples of such aggregates are crystals, clusters, etc. Further, the information processing apparatus 100 is connected to an input device 11 and a display device 12.
  • the input device 11 is configured as, for example, a keyboard, a touch sensor, a touch pad, or a mouse, and outputs a signal according to an input operation by a user to the information processing apparatus 100.
  • the display device 12 is, for example, a liquid crystal display, a plasma display, an organic EL (Electro-Luminescence) display, or the like, and displays an image based on an image signal output from the information processing device 100.
  • Such an information processing device 100 acquires the first relational expression as the relational expression of the Ising model representing the energy of the aggregate.
  • the information processing device 100 transmits information regarding the first relational expression representing the energy of the structure of the aggregate of two or more atoms to the optimization device 200 via the communication network Nt. Then, the information processing device 100 acquires, from the optimization device 200, values of a plurality of variables that minimize, for example, the energy expressed by the first relational expression.
  • Each of the plurality of variables is a variable included in the first relational expression.
  • the information processing device 100 determines the above-mentioned stable structure according to the values of those variables.
  • the information processing apparatus 100 may output the structure information indicating the structure determined in this way to an external apparatus or device, or may output the structure information to the display device 12 as an image signal to display the structure on the display device 12. You may.
  • the optimization device 200 is a computer that communicates with the information processing device 100 via a communication network Nt such as the Internet, and performs optimization of the first relational expression described above (that is, energy optimization). That is, the optimization device 200 receives information regarding the first relational expression from the information processing device 100 via the communication network Nt, and performs a search to find the optimal solution of the first relational expression. Through this search, the energy expressed by the first relational expression is, for example, minimized. Note that in the search, that is, energy optimization, the energy expressed by the first relational expression is not necessarily minimized or optimized, but in this embodiment, it is assumed that the energy is minimized. explain. Then, the optimization device 200 derives the values of the plurality of variables that minimize the energy expressed by the first relational expression.
  • FIG. 2 is a block diagram showing an example of the functional configuration of the information processing device 100 and the optimization device 200.
  • the information processing device 100 includes an acquisition section 101, a first communication section 102, an output section 103, and a first control section 110.
  • the acquisition unit 101 acquires the above-mentioned first relational expression based on the atomic information and position information. For example, the acquisition unit 101 acquires the atomic information and position information as a signal output from the input device 11. Note that the acquisition unit 101 may read out atomic information and position information stored in a recording medium.
  • Atomic information is information regarding the states of two or more atoms included in a collection of atoms.
  • the atomic information includes, for example, at least one of the type of atom, the spin state of the atom, and an atomic vacancy in which the atom is missing.
  • the spin is, for example, electronic spin or nuclear spin. Note that this embodiment will be described on the assumption that the atom information indicates the type of atom. Further, the atom information may directly or indirectly indicate the type of the atom. For example, if the aggregate is a set of Cu (ie, copper) atoms and Au (ie, gold) atoms, the atomic information indicates Cu and Au. Further, the atom information may not only indicate the type of the atom but also the spin state of the atom.
  • the position information is information regarding two or more positions in which any of the two or more atomic states within the aggregate can be placed.
  • the location information may indicate the number of locations, or may indicate the locations directly or indirectly. Such locations may also be referred to as sites or site locations.
  • the first relational expression includes two or more variables that indicate the states of atoms located at each of these two or more positions. Further, two or more positions and two or more variables have a one-to-one correspondence. Note that the aggregation of atoms may include information regarding the states of two or more atoms and other information unrelated to the information regarding the positions of the two or more atoms.
  • the first communication unit 102 is a device that communicates with the optimization device 200 and transmits information regarding the first relational expression acquired by the acquisition unit 101 to the optimization device 200. Furthermore, the first communication unit 102 receives from the optimization device 200 the values of each of the two or more variables derived by the optimization device 200 for the first relational expression obtained from the transmitted information. . The values of these two or more variables are derived by the above-mentioned energy optimization, that is, by performing a search to find the optimal solution to the first relational expression. In this way, the first communication unit 102 transmits information regarding the first relational expression to the optimization device 200, and selects two or more variables derived by performing a search to find the optimal solution of the first relational expression. The value of is received from the optimization device 200.
  • the output unit 103 outputs structure information indicating the structure of the above-mentioned aggregate, which corresponds to the values of two or more variables derived by the optimization device 200. For example, the output unit 103 displays the structure of the aggregate on the display device 12 by outputting the structure information to the display device 12 as an image signal.
  • the first control unit 110 controls the acquisition unit 101, the first communication unit 102, and the output unit 103, and executes processes other than those performed by these components.
  • the optimization device 200 is an example of a calculation device that receives information regarding a first relational expression and performs calculation using the first relational expression, and includes an optimization unit 201, a second communication unit 202, and a second control unit. 210.
  • the second communication unit 202 is a device that communicates with the information processing device 100 and receives information regarding the above-described first relational expression from the information processing device 100. Further, the second communication unit 202 transmits the values of two or more variables derived by the optimization unit 201 to the information processing device 100. That is, the second communication unit 202 functions as an output unit that outputs the values of two or more variables derived by the optimization unit 201.
  • the optimization unit 201 acquires information regarding the first relational expression described above from the information processing device 100 via the second communication unit 202, and executes energy optimization of the first relational expression obtained from the information. In other words, the optimization unit 201 performs a search to find the optimal solution of the first relational expression representing the energy of the structure of an aggregation of atoms, and calculates the values of two or more variables included in the first relational expression. Derive. Note that the optimization unit 201 in this embodiment is an example of a calculation unit, and calculates the first relational expression by performing calculation using the first relational expression representing the energy of the structure of an aggregation of atoms. Derive the values of two or more variables included in . In this embodiment, the optimization unit 201 performs a search to find the optimal solution of the first relational expression as a calculation using the first relational expression.
  • the second control unit 210 controls the optimization unit 201 and the second communication unit 202, and executes processes other than those performed by these components.
  • Each of the information processing device 100 and the optimization device 200 includes, for example, a processor such as a CPU (Central Processing Unit), a volatile memory, a nonvolatile memory, and a program stored in the nonvolatile memory. It may be configured by In this case, the functional configurations of the information processing device 100 and the optimization device 200 are realized by a processor executing the above program.
  • FIG. 3 is a diagram for explaining an example of processing of the information processing device 100.
  • the first control unit 110 of the information processing device 100 calculates the energy of each of the plurality of crystal structures using first-principles calculation.
  • These crystal structures have a small number of sites so that the load of energy calculation can be kept small. For example, the number of sites is 16 or less.
  • an analysis tool such as ATAT (Alloy Theoretic Automated Toolkit) or VASP (Vienna Ab initio Simulation Package) may be used to calculate this energy.
  • the acquisition unit 101 acquires atomic information and position information from the input device 11, and as shown in FIG. 3(b), based on the relationship between the plurality of crystal structures and their calculated energies, An energy prediction model corresponding to the atomic information and position information is generated.
  • the atomic information indicates Cu and Au
  • the position information indicates 32 sites. That is, this energy prediction model is a model for predicting the energy of a crystal structure that has 32 sites and in which Cu or Au is placed at each of these sites.
  • This energy prediction model is generated as a second relational expression expressed by the following equation (2), for example, by machine learning based on the relationship between a plurality of crystal structures and their calculated energies.
  • E indicates the energy of the crystal structure
  • is a cluster identifier.
  • a cluster is a set of atoms contained in a crystal, and ⁇ identifies any one cluster among the plurality of clusters contained in the crystal.
  • V ⁇ is a coefficient indicating the magnitude of contribution of cluster ⁇ to energy E.
  • ⁇ ⁇ is the correlation function of cluster ⁇ . That is, the acquisition unit 101 generates the second relational expression expressed using the cluster expansion method based on the atomic information and position information. In other words, the acquisition unit 101 calculates effective cluster interaction (ECI) of cluster expansion up to a certain degree.
  • ECI effective cluster interaction
  • the acquisition unit 101 acquires the first relational expression by converting this second relational expression into an Ising model, as shown in FIG. 3(c). That is, the first relational expression is an Ising model, and is expressed, for example, by the following equation (1).
  • E represents the energy of the crystal structure
  • each of i and j represents the position within the crystal (ie, the site position).
  • ⁇ i is a variable indicating the type of atom placed at position i within the crystal
  • ⁇ j is a variable indicating the type of atom placed at position j within the crystal.
  • ⁇ i and ⁇ j represent only the difference between position i and position j, and have the same meaning as variables. Note that these variables are also called Ising variables.
  • A is an interaction coefficient of a zero-order cluster
  • Bi is an interaction coefficient of a first-order cluster
  • Cij is an interaction coefficient of a second-order cluster. Note that these interaction coefficients are also simply referred to as coefficients hereinafter.
  • the acquisition unit 101 when acquiring a first relational expression such as Equation (1) by conversion to the Ising model, the acquisition unit 101 obtains coefficients A, B i , C from the second relational expression of Equation (2).
  • the first relational expression of equation (1) is obtained by extracting ij .
  • a cluster such as a zero-order cluster, a first-order cluster, or a second-order cluster, is a set of atoms, and its order is the number of atoms included in the set.
  • a secondary cluster may be a set of two adjacent atoms contained in the crystal, or a set of two atoms separated from each other. In other words, a secondary cluster is a combination of any two atoms contained in the crystal.
  • the value of the variable ⁇ i corresponding to the position i is +1
  • the atom at position i is Cu
  • the value of the variable ⁇ i corresponding to the position i is ⁇ 1.
  • the variable ⁇ i indicates the type of atom placed at position i using two values of +1 and -1. Note that the variable ⁇ i may indicate not only the type of atom but also the spin state of the atom.
  • the first relational expression expresses the energy E by the sum of a zero-order term, a first-order term, and a second-order term, as in equation (1). That is, in Equation (1), the energy E is expressed by terms up to second order. However, the order is not limited to second order, but may be third order or higher. For example, the first relational expression expresses the energy E by the sum of a 0th order term, a 1st order term, a 2nd order term, ..., an Nth order term (N is an integer of 3 or more). You may. Note that the acquisition unit 101 may acquire a first relational expression having terms of order three or higher, and then round the first relational expression into a first relational expression having terms up to second order.
  • the first relational expression expresses the energy E by the sum of the first coefficient A and n terms (n is an integer of 2 or more).
  • the k-th term (k is an integer from 1 to n) among the n terms is the sum of products corresponding to each set of numbers that can be taken from two or more variables ⁇ .
  • the set consists of k variables ⁇ , and the product is the product of the k variables ⁇ included in the set and the second coefficient (such as B i or C ij ) corresponding to the set.
  • k corresponds to the above-mentioned order, and the order is not limited to second order, but may be third or higher.
  • Formula (1) is an example of the first relational expression when the crystal structure has 32 sites, and each of i and j represents an integer from 0 to 31.
  • the number of sites that the crystal structure has is not limited to 32, and may be 33 or more.
  • each of i and j in formula (1) represents an integer from 0 to (m-1) (m is the number of sites).
  • energy optimization is performed using the first relational expression, which is an Ising model type function, such as equation (1), for example. Therefore, an annealing machine can be appropriately used for energy optimization, and calculation costs can be effectively kept low.
  • the first relational expression which is an Ising model
  • the first relational expression is obtained by converting the second relational expression of the cluster expansion method, so the cluster expansion method can be used, and the first relational expression The processing load required for acquisition can be reduced.
  • FIG. 4 is a diagram showing an example of coefficients obtained by the information processing device 100.
  • the coefficient A is a zero-order cluster interaction coefficient as described above, and is, for example, ⁇ 0.0173730000, as shown in FIG.
  • the information processing device 100 obtains the first relational expression by extracting such coefficients A, B i , C ij from the second relational expression, and optimizes these coefficients as information regarding the first relational expression.
  • the information is transmitted to the device 200.
  • the information processing device 100 may transmit not only the coefficients A, B i , and C ij but also atomic information and position information.
  • constraints on the atomic information may be transmitted (for example, the composition ratio is fixed to a predetermined value).
  • the entire first relational expression may be sent to the optimization device 200.
  • FIG. 5 is a diagram for explaining an example of processing by the optimization device 200 and the information processing device 100.
  • the optimization device 200 receives the coefficients A, B i , and C ij transmitted from the information processing device 100 . At this time, the optimization device 200 may receive not only those coefficients but also atomic information and position information from the information processing device 100. Then, the optimization device 200 constructs a first relational expression based on those coefficients and information, and selects a variable ⁇ (here, ⁇ i ) that minimizes the energy E expressed by the first relational expression. Derive the value. In other words, the optimization device 200 determines the value of the variable ⁇ i by energy optimization. Note that when the number of sites is 32, that is, when the number of integers indicated by i is 32, it can be said that the number of variables ⁇ is also 32.
  • the optimization device 200 performs the energy optimization described above using an annealing machine, which is a computer specialized for optimizing Ising models.
  • the annealing machine may be a quantum annealing machine, a quantum inspired annealing machine, etc.
  • a gated quantum computer may be used instead of the annealing machine. This gated quantum computer may use QAOA (Quantum Approximate Optimization Algorithm).
  • a structure for example, a crystal structure
  • FIG. 6 is a flowchart illustrating an example of processing operations by the information processing system 1000.
  • Step S10 The acquisition unit 101 of the information processing device 100 acquires atomic information and position information of a collection of atoms.
  • Step S11 The acquisition unit 101 generates a second relational expression of energy expressed by the cluster expansion method.
  • Step S12 The acquisition unit 101 converts the second relational expression into an Ising model type first relational expression. That is, the acquisition unit 101 acquires the first relational expression by converting the second relational expression into an Ising model.
  • Step S13 The optimization unit 201 of the optimization device 200 uses an annealing machine to derive values of variables of the first relational expression that minimize the energy of the first relational expression.
  • the first control unit 110 of the information processing device 100 performs a process ( In other words, the optimization device 200 is caused to perform energy optimization). Note that it can also be said that the first control unit 110 of the information processing device 100 performs energy optimization using the optimization device 200.
  • Step S14 The output unit 103 of the information processing device 100 constructs the structure of the aggregate based on the values of the derived variables, and outputs structure information indicating the structure.
  • the second control unit 210 of the optimization device 200 causes the second communication unit 202 to transmit the value of the derived variable to the information processing device 100.
  • the output unit 103 constructs the structure of the aggregate using the values of the variables sent from the optimization device 200.
  • the first relational expression in order to obtain a stable structure of the aggregate, includes two or more variables indicating the states of atoms arranged at two or more positions within the aggregate. Using this, values of two or more variables are derived such that the energy expressed by the first relational expression is, for example, the minimum. That is, the values of the two or more variables are derived by energy optimization for the first relational expression that includes two or more variables each indicating the state of an atom.
  • Such a first relational expression can also be said to be an Ising model type function. Therefore, by using such a first relational expression, it is possible to apply an annealing machine to the energy optimization, and the calculation required for the energy optimization is Costs can be kept low.
  • a search is performed to find the optimal solution to the first relational expression as a calculation using the first relational expression, but calculations other than such a search may be performed.
  • values of two or more variables are derived according to the magnitude of energy expressed by the first relational expression.
  • the structure of the aggregate is searched according to the magnitude of energy.
  • an annealing machine can be applied to the above-mentioned search, and the calculation cost for the search can be kept low.
  • the values of those two or more variables are derived, it is possible to easily construct the structure of the aggregate according to the magnitude of energy. As a result, it is possible to improve the efficiency of processing related to searching for the structure of an aggregation of atoms.
  • FIG. 7 is a flowchart showing in detail an example of the process of step S11 in FIG.
  • FIG. 8 is a diagram showing a specific example of the processing in steps S111 and S113 in FIG. 7
  • FIG. 9 is a diagram showing a specific example of the processing in steps S114 and S115 in FIG.
  • the acquisition unit 101 first acquires a symmetry transformation that keeps it unchanged from the position information of the aggregation of atoms, and acquires independent clusters (figures) for the symmetry transformation (step S111 ).
  • the acquisition unit 101 determines the maximum size cluster ⁇ max to be used for generating the second relational expression among such clusters (step S112).
  • the acquisition unit 101 generates a plurality of structures (N structures) each having a smaller size than the calculation target (step S113).
  • the acquisition unit 101 calculates the energy E and the correlation function ⁇ ⁇ for the cluster group (subcluster) ⁇ included in the maximum size cluster ⁇ max for each of the N structures using first-principles calculation or the like. (Step S114).
  • the acquisition unit 101 calculates the coefficient V ⁇ of the second relational expression from the N sets of data ( ⁇ ⁇ , E) generated in this way using the method of least squares (step S115). The acquisition unit 101 then determines whether the accuracy of the coefficient V ⁇ is sufficient (step S116). If the accuracy of the coefficient V ⁇ obtained by this least squares method is not sufficient (No in step S116), the acquisition unit 101 may add a structure to increase the data. Accuracy is evaluated by, for example, cross-validation. More specifically, when calculating the coefficient V ⁇ of the second relational expression using an analysis tool such as ATAT, the acquisition unit 101 determines the accuracy when the cross validation score is 0.05 or less. is determined to be sufficient. Furthermore, when the acquisition unit 101 determines that the accuracy is sufficient (Yes in step S116), it ends the process in step S11.
  • FIGS. 8 and 9 specifically illustrate the process of step S11 using a simple two-dimensional structure (Non-Patent Literature (ed. Haruyuki Inui, "High Entropy Alloys - Various New Physical Properties Generated by Cocktail Effects" Uchida (See Old Crane Farm 2020/5/1).
  • Non-Patent Literature ed. Haruyuki Inui, "High Entropy Alloys - Various New Physical Properties Generated by Cocktail Effects” Uchida (See Old Crane Farm 2020/5/1).
  • the acquisition unit 101 calculates the energy and ⁇ 0 , ⁇ 1 , and ⁇ 2 for each of these four structures.
  • the value of zero cluster is defined as 1 for any structure.
  • [Processing in step S114] in FIG. 9 shows some calculation results.
  • the acquisition unit 101 obtains a linear equation that approximates the relationship between these four sets of correlation functions and energy data points using the method of least squares.
  • FIG. 10 is a flowchart showing in detail an example of the process of step S12 in FIG. 11 and 14 are diagrams showing specific examples of the processing in step S121 in FIG. 10, and FIGS. 12, 13, and 15 are diagrams showing specific examples of the processing in steps S122 and S123 in FIG. 10. .
  • the acquisition unit 101 first acquires the clusters considered when generating the second relational expression (step S121).
  • the cluster is the maximum size cluster ⁇ max and cluster groups (subclusters) included therein.
  • the acquisition unit 101 searches for a set of sites that match the cluster ⁇ from the sites of the structure to be calculated, and acquires all searched sets of sites (step S122). If the set of sites consists of site numbers (i, j, ..., n), then the coefficient of the term ⁇ i ⁇ j ... ⁇ n of the Ising-type function is c ⁇ V ⁇ (c ⁇ is generally a constant determined by ⁇ ).
  • the acquisition unit 101 expresses the coefficients of ⁇ i ⁇ j . . . ⁇ n of the Ising-type function using V ⁇ (step S123).
  • ⁇ i ⁇ j . . . ⁇ n represents the product of Ising variables each having a set of site numbers (i, j, .
  • the acquisition unit 101 determines the coefficients of the Ising type function representing the energy of the structure to be calculated by performing this procedure for all ⁇ (step S124).
  • step S121 shows several primary clusters and several secondary clusters.
  • Step S123 processing of FIG. 12 the terms and coefficients (ie, c 2 V 2 ) of the Ising-type function corresponding to the clusters at the site shown in [Step S122 processing] are shown.
  • FIG. 12 the terms and coefficients (ie, c 2 V 2 ) of the Ising-type function corresponding to the clusters at the site shown in [Step S122 processing] are shown.
  • FIG. 12 the terms and coefficients (ie, c 2 V 2 ) of the Ising-type function corresponding to the clusters at the site shown in [Step S122 processing] are shown.
  • a function expressed using the cluster expansion method i.e., the second relational expression
  • an Ising model type function i.e., the first relational expression
  • an annealing machine is applied to the Ising model type function. Applicable. Up until now, there has been no motivation to apply annealing machines to functions expressed using the cluster expansion method for the following reasons.
  • the first reason is that when conventional classical algorithms or classical computers are used, arithmetic processing for functions of the cluster expansion method is faster than arithmetic processing for Ising model-type functions.
  • the function of the cluster expansion method is, for example, the above-mentioned second relational expression expressed in the form of the sum of products of effective cluster interaction (ECI) and a correlation function. Therefore, it was thought that there was no need to take the trouble to convert the second relational expression into an Ising model type function.
  • the third reason is that the number of bits that an annealing machine can process is small, making it unsuitable for aggregates with a large number of atoms.
  • the annealing machine As for the first reason, if you convert the second relational expression into the first relational expression, which is an Ising model type function, as in Embodiment 1, and apply an annealing machine to the first relational expression, the annealing machine It has become clear that calculation processing is fast. In other words, the total time including the time required to convert the second relational expression to the first relational expression and the time required for calculation processing by the annealing machine is shorter than the time required for calculation processing by the classical algorithm for the function of the cluster expansion method. It became clear.
  • the number of bits n corresponds to the number of atoms in the aggregate to be processed.
  • the time required for arithmetic processing using the classical algorithm is 50 to 270 minutes, whereas the time required for arithmetic processing using an annealing machine is less than 1 second.
  • the function used to measure the time of the above-mentioned arithmetic processing is an Ising model type function, like an annealing machine, even if it is a classical algorithm.
  • the classical algorithm and annealing machine each measure the time required to process the same Ising model function.
  • calculation processing using an annealing machine is superior to calculation processing using classical algorithms for large-scale problems where the number of atoms in the set to be processed is large.
  • the average processing speed for each composition ratio of the classical algorithm is 3300 seconds, but the annealing machine The average processing speed for each composition ratio was 3.9 seconds. Further, in that case, the yield of the classical algorithm is 58.8%, and the yield of the annealing machine is 100%. That is, with the classical algorithm, a solution may not be found within the time limit of 360 minutes, but with the annealing machine, solutions can be found for all composition ratios within the time limit of 360 minutes.
  • Information processing system 1000 in the first embodiment includes optimization device 200 as a calculation device.
  • the information processing system in this embodiment includes a sampling device as a calculation device. Note that, among the constituent elements in this embodiment, the same constituent elements as in Embodiment 1 are given the same reference numerals as in Embodiment 1, and detailed description thereof will be omitted.
  • FIG. 16 is a block diagram showing an example of the functional configuration of the information processing device 100 and the sampling device included in the information processing system according to the present embodiment.
  • the information processing system 1001 in this embodiment includes an information processing device 100 and a sampling device 200b.
  • the acquisition unit 101 of the information processing device 100 in this embodiment further acquires distribution information regarding a predetermined distribution.
  • the acquisition unit 101 acquires the distribution information as a signal output from the input device 11.
  • An example of the predetermined distribution is the Boltzmann distribution
  • an example of the distribution information is information indicating the temperature used in the Boltzmann distribution. Note that the predetermined distribution is not limited to the Boltzmann distribution.
  • the distribution information may indicate the type of a predetermined distribution and the parameters used to express the distribution of that type.
  • the first communication unit 102 has the same function as in the first embodiment, and further transmits the distribution information acquired by the acquisition unit 101 to the sampling device 200b. Further, the first communication unit 102 receives a plurality of combinations from the sampling device 200b. Each of the plurality of combinations includes values of the two or more variables ⁇ (i.e., ⁇ i described above). In other words, the combination includes the value of the variable ⁇ corresponding to each site position indicated by the position information, and can be said to indicate the arrangement or structure of each atom in the aggregate. Such a combination is a combination of the above-mentioned arrangements, and may be simply referred to as a combination hereinafter. Alternatively, the combination is also described as a combination of values of the variable ⁇ .
  • the output unit 103 outputs structure information indicating the structure of the aggregate corresponding to each of the plurality of combinations. That is, the output unit 103 constructs a structure of an aggregate for each of a plurality of combinations based on the values of two or more variables ⁇ included in the combination, and outputs structure information indicating the structure.
  • the sampling device 200b is an example of a calculation device that receives information regarding the first relational expression and performs calculation using the first relational expression, and performs sampling based on the above-mentioned predetermined distribution using the first relational expression. Execute as a calculation. Specifically, the sampling device 200b samples a plurality of combinations according to the first relational expression and a predetermined distribution from among all possible combinations based on the atomic information and position information. In other words, the sampling device 200b samples a plurality of combinations according to the first relational expression and a predetermined distribution from all possible structures of an aggregation of atoms based on the atomic information and position information.
  • Such a sampling device 200b includes a third control section 210b, a third communication section 202b, and a sampling section 201b.
  • the third control unit 210b controls the sampling unit 201b and the third communication unit 202b, and executes processes other than those performed by these components.
  • the third communication unit 202b has the same function as the second communication unit 202 of the first embodiment, and receives distribution information transmitted from the first communication unit 102. Further, the third communication unit 202b transmits the plurality of combinations derived by the sampling unit 201b to the first communication unit 102 of the information processing device 100.
  • the sampling unit 201b is a calculation unit that derives the values of two or more variables ⁇ included in the first relational expression by performing calculations using the first relational expression expressing the energy of the structure of an aggregation of atoms. This is an example.
  • Such a sampling unit 201b acquires information and distribution information regarding the first relational expression described above from the information processing device 100 via the third communication unit 202b, and performs the above-mentioned sampling on the first relational expression. . That is, the sampling unit 201b derives a plurality of combinations each including two or more values of the variable ⁇ by performing sampling on the first relational expression based on a predetermined distribution according to the distribution information.
  • the sampling device 200b may be configured by, for example, a processor such as a CPU, a volatile memory, a nonvolatile memory, and a program stored in the nonvolatile memory.
  • a processor such as a CPU
  • volatile memory such as a RAM
  • nonvolatile memory such as a ROM
  • program stored in the nonvolatile memory such as a program stored in the nonvolatile memory.
  • the functional configuration of the sampling device 200b is realized by the processor executing the above program.
  • FIG. 17 is a diagram for explaining the Boltzmann distribution. Note that the graph in FIG. 17 shows the Boltzmann distribution, and the vertical and horizontal axes of the graph show the energy ⁇ and the Boltzmann distribution function f( ⁇ ), respectively. Further, the Boltzmann distribution function f( ⁇ ) is expressed by the following equation (3). In this equation (3), energy ⁇ corresponds to energy E in equations (1) and (2). Further, in equation (3), kB is a Boltzmann constant, Z is a normalization constant, and T is a parameter indicating temperature.
  • the sampling unit 201b of the sampling device 200b samples the first relational expression according to the Boltzmann distribution according to the temperature T indicated by such distribution information.
  • the sampling unit 201b selects a combination containing two or more values of the variable ⁇ that satisfies the first relational expression (that is, equation (1)) corresponding to the energy E, and selects a Boltzmann combination corresponding to the temperature T.
  • the distribution of the plurality of combinations sampled by the sampling unit 201b becomes equal to the Boltzmann distribution according to the temperature T.
  • FIG. 18 is a diagram for explaining an example of processing by the sampling device 200b and the information processing device 100.
  • the sampling device 200b receives, for example, coefficients A, B i , and C ij transmitted from the information processing device 100. Further, the sampling device 200b receives distribution information transmitted from the information processing device 100. At this time, the sampling device 200b may receive not only those coefficients but also atomic information and position information from the information processing device 100. Then, the sampling device 200b constructs a first relational expression based on those coefficients, information, and the like. Next, the sampling device 200b performs sampling on the first relational expression based on the Boltzmann distribution according to the temperature indicated by the distribution information. As a result, the plurality of combinations described above are sampled.
  • the sampling device 200b performs the above-described sampling using an annealing machine, which is a computer specialized for calculating Ising models, similarly to the optimization device 200 of the first embodiment. Moreover, the Metropolis-Hastings method may be used for the sampling. Then, the sampling device 200b transmits the plurality of sampled combinations to the information processing device 100.
  • an annealing machine which is a computer specialized for calculating Ising models, similarly to the optimization device 200 of the first embodiment.
  • the Metropolis-Hastings method may be used for the sampling. Then, the sampling device 200b transmits the plurality of sampled combinations to the information processing device 100.
  • a structure for example, a crystal structure
  • FIG. 19 is a flowchart illustrating an example of processing operations by the information processing system 1001.
  • Steps S10 to S12 The information processing device 100 executes the processes of steps S10 to S12 similarly to the flowchart shown in FIG.
  • Step S13a The sampling unit 201b of the sampling device 200b derives a plurality of combinations by sampling the first relational expression based on a predetermined distribution such as the Boltzmann distribution. Those combinations include two or more values of the variable ⁇ .
  • Step S14a For each derived combination, the output unit 103 of the information processing device 100 constructs a structure of the aggregate based on the values of two or more variables ⁇ included in the combination, and outputs structure information indicating the structure. .
  • the third control unit 210b of the sampling device 200b causes the third communication unit 202b to transmit the derived combinations to the information processing device 100.
  • the output unit 103 constructs an aggregate structure using each of the plurality of combinations transmitted from the sampling device 200b and received by the first communication unit 102.
  • FIG. 20 is a diagram illustrating an example of additional processing operations of the first control unit 110.
  • the first control unit 110 may use the plurality of structures of the aggregate constructed by the output unit 103 to derive predicted values of the physical properties of the aggregate. For example, as shown in FIG. 20, multiple structures of the aggregate are constructed based on the Boltzmann distribution of temperature T1.
  • the first control unit 110 calculates the physical property values A1 to An of the plurality of structures by performing first principles calculation or the like on the plurality of structures.
  • the physical property values A1 to An are dielectric constants and the like. Then, the first control unit 110 calculates the average value A of those physical property values A1 to An. As a result, a predicted value of the physical property value of the aggregate at temperature T1 is derived.
  • the first relational expression is an Ising model type function. Therefore, by using such a first relational expression, an annealing machine can be applied to the sampling, and the calculation cost for sampling can be kept low compared to methods using the conventional cluster expansion method and Monte Carlo method. be able to.
  • the values of two or more variables included in each of multiple combinations have a one-to-one correspondence with two or more positions within the set, so if the values of those two or more variables are derived, the set Body structures can be easily constructed. As a result, it is possible to improve the efficiency of processing related to sampling or searching for the structure of an aggregation of atoms.
  • the information processing system in this embodiment includes the optimization device 200 in the first embodiment and the sampling device 200b in the second embodiment.
  • the sampling device 200b in this embodiment uses the values of two or more variables ⁇ derived by energy optimization by the optimization device 200 for sampling based on a predetermined distribution. Note that among the constituent elements in this embodiment, the same constituent elements as in Embodiment 1 or 2 are given the same reference numerals as in Embodiment 1 or 2, and detailed description thereof will be omitted.
  • FIG. 21 is a block diagram illustrating an example of the functional configuration of the information processing device 100 and the computing device included in the information processing system according to the present embodiment.
  • the information processing system 1002 in this embodiment includes an information processing device 100 and a computing device 200a.
  • the calculation device 200a includes an optimization device 200 and a sampling device 200b.
  • the calculation device 200a performs a search for the optimal solution of the first relational expression as a calculation using the first relational expression
  • the optimization device 200a performs sampling based on a predetermined distribution based on the first relation.
  • a sampling device 200b that performs calculations using formulas.
  • FIG. 22 is a flowchart illustrating an example of processing operations by the information processing system 1002 in this embodiment.
  • Step S31 the information processing system 1002 executes energy optimization of the first relational expression.
  • the information processing system 1002 performs the same processing as in the first embodiment by the information processing device 100 and the optimization device 200, so that the energy expressed by the first relational expression is the minimum, for example, two or more variables ⁇ Derive the value of .
  • Such values of two or more variables ⁇ are derived by the optimization unit 201 of the optimization device 200, and are sent from the second communication unit 202 to the sampling device 200b via the first communication unit 102 of the information processing device 100. It is transmitted to the third communication unit 202b.
  • Step S32 the information processing system 1002 performs sampling on the first relational expression based on a predetermined distribution according to the distribution information.
  • the acquisition unit 101 of the information processing device 100 acquires distribution information indicating the temperature T of Boltzmann distribution, for example, and the first communication unit 102 transmits the distribution information to the third communication unit 202b of the sampling device 200b.
  • the third communication unit 202b of the sampling device 200b receives the distribution information and the values of the two or more variables ⁇ transmitted from the second communication unit 202 of the optimization device 200 in step S31.
  • the sampling unit 201b of the sampling device 200b uses the distribution information received by the third communication unit 202b and the values of two or more variables ⁇ for sampling.
  • a plurality of combinations of values of the variable ⁇ according to the Boltzmann distribution are derived according to the distribution information.
  • the plurality of combinations derived in this way are derived by the sampling unit 201b of the sampling device 200b, and transmitted from the third communication unit 202b to the first communication unit 102 of the information processing device 100.
  • Step S33 the information processing system 1002 outputs the structure of the aggregate corresponding to each of the plurality of combinations derived in step S32. That is, the output unit 103 of the information processing device 100 constructs an aggregate structure for each of the plurality of combinations received by the first communication unit 102 based on the values of two or more variables ⁇ included in the combination. and outputs structural information indicating its structure.
  • sampling device 200b acquires the values of two or more variables ⁇ derived through energy optimization by the optimization device 200 from the optimization device 200 via the information processing device 100. Then, the sampling device 200b performs sampling based on a predetermined distribution using the values of the two or more variables ⁇ .
  • the third communication unit 202b of the sampling device 200b acquires the values of two or more variables ⁇ from the second communication unit 202 of the optimization device 200 via the first communication unit 102 of the information processing device 100. do.
  • the sampling unit 201b performs sampling based on a predetermined distribution using the values of the two or more variables ⁇ acquired by the third communication unit 202b. As a result, multiple combinations are derived. That is, the sampling unit 201b uses the values of two or more variables ⁇ derived by energy optimization as initial values of a plurality of combinations derived by sampling. Then, the sampling unit 201b starts sampling near the initial values of the two or more variables ⁇ .
  • the information processing system 1002 in this embodiment performs energy optimization of the first function before sampling, and optimizes the energy of the low energy structure (for example, the type of atoms placed at each site position).
  • the values of two or more variables ⁇ indicating the state of Then, the sampling device 200b uses the derived values of the two or more variables ⁇ as initial values, and starts sampling from the vicinity of the initial values. Thereby, it is possible to efficiently sample an aggregate having a low energy structure, and it is possible to improve the sampling processing speed and reduce the calculation load.
  • sampling unit 201b of the sampling device 200b may perform sampling using the above-mentioned classical algorithm.
  • the third communication unit 202b outputs the plurality of combinations derived by sampling by the sampling unit 201b to the first communication unit 102 of the information processing device 100.
  • the information processing device 100 in this embodiment first performs the same process as in the first embodiment in order to cause the sampling device 200b to execute the above-described process. That is, the information processing device 100 causes the optimization device 200 to perform a search for finding the optimal solution of the first relational expression, that is, energy optimization of the first relational expression, as in the first embodiment. Then, the information processing device 100 transmits the initial values of the two or more variables ⁇ derived by the energy optimization to the sampling device 200b, thereby obtaining a predetermined distribution using the initial values of the two or more variables ⁇ . The sampling device 200b is caused to perform sampling based on .
  • the acquisition unit 101 of the information processing apparatus 100 in this embodiment acquires distribution information regarding a predetermined distribution, as in the second embodiment.
  • the first communication unit 102 transmits information regarding the first relational expression to each of the optimization device 200 and the sampling device 200b. Further, the first communication unit 102 receives from the optimization device 200 the initial values of two or more variables ⁇ derived by performing a search for finding the optimal solution of the first relational expression. Then, the first communication unit 102 transmits the initial values and distribution information of two or more variables ⁇ to the sampling device 200b. As a result, the first communication unit 102 performs sampling on the first relational expression based on the initial values of two or more variables ⁇ and a predetermined distribution according to the distribution information, respectively. A plurality of combinations including two or more values of the variable ⁇ are received from the sampling device 200b.
  • the output unit 103 outputs structure information indicating the structure of the aggregate corresponding to each of the plurality of combinations.
  • the values of two or more variables ⁇ derived by the search to find the optimal solution of the first relational expression are used as initial values for sampling based on a predetermined distribution, which improves the processing speed of the sampling. , it is possible to increase the possibility of reducing the calculation load.
  • FIG. 23 is a flowchart illustrating an example of processing operations by the information processing system 1002 in this modification.
  • Step S41 the information processing system 1002 performs sampling on the first relational expression based on a predetermined distribution according to distribution information. That is, the information processing system 1002 derives a plurality of combinations of the values of the variable ⁇ by performing the same processing as in the second embodiment by the information processing device 100 and the sampling device 200b. Specifically, the acquisition unit 101 of the information processing device 100 acquires distribution information indicating the temperature T of Boltzmann distribution, for example, and the first communication unit 102 transmits the distribution information to the third communication unit 202b of the sampling device 200b. Send. The sampling unit 201b of the sampling device 200b uses the distribution information received by the third communication unit 202b for sampling.
  • a plurality of combinations of values of the variable ⁇ according to the Boltzmann distribution are derived according to the distribution information.
  • the plurality of combinations derived in this way are derived by the sampling unit 201b of the sampling device 200b, and are sent from the third communication unit 202b to the second communication unit of the optimization device 200 via the first communication unit 102 of the information processing device 100. It is transmitted to the communication section 202.
  • Step S42 the information processing system 1002 executes energy optimization of the first relational expression.
  • the optimization unit 201 of the optimization device 200 uses the plurality of combinations received by the second communication unit 202 for energy optimization of the first relational expression.
  • the values of two or more variables ⁇ that minimize the energy expressed by the first relational expression are derived.
  • Such values of two or more variables ⁇ are transmitted from the second communication unit 202 to the first communication unit 102 of the information processing device 100.
  • Step S43 the information processing system 1002 outputs the structure of the aggregate corresponding to the values of the two or more variables ⁇ derived in step S42. That is, the output unit 103 of the information processing device 100 constructs the structure of the aggregate based on the values of two or more variables ⁇ received by the first communication unit 102, and outputs structure information indicating the structure.
  • Optimization device 200 in this embodiment acquires a plurality of combinations sampled by sampling device 200b from sampling device 200b via information processing device 100. Then, the optimization device 200 performs energy optimization of the first relational expression using the plurality of combinations.
  • the second communication unit 202 of the optimization device 200 acquires a plurality of combinations from the third communication unit 202b of the sampling device 200b via the first communication unit 102 of the information processing device 100.
  • the optimization unit 201 uses the plurality of combinations acquired by the second communication unit 202 to perform energy optimization of the first relational expression, that is, a search for finding the optimal solution of the first relational expression.
  • the values of two or more variables ⁇ included in the first relational expression are derived. That is, the optimization unit 201 uses the values of two or more variables ⁇ included in each of the plurality of sampled combinations as the initial values of the two or more variables ⁇ obtained by energy optimization.
  • the optimization unit 201 starts a search to find the optimal solution of the first relational expression from the initial values of two or more variables ⁇ included in the combination.
  • the second communication unit 202 outputs the values of two or more variables ⁇ derived by the search by the optimization unit 201 to the first communication unit 102 of the information processing device 100.
  • the information processing device 100 in this embodiment first performs the same process as in the second embodiment in order to cause the optimization device 200 to execute the above-described process. That is, the information processing device 100 causes the sampling device 200b to perform sampling based on a predetermined distribution on the first relational expression, as in the second embodiment. Then, the information processing device 100 transmits the plurality of combinations derived through the sampling to the optimization device 200, thereby causing the optimization device 200 to perform energy optimization of the first relational expression using the plurality of combinations. Let it run.
  • the acquisition unit 101 of the information processing apparatus 100 in this embodiment acquires distribution information regarding a predetermined distribution, as in the second embodiment.
  • the first communication unit 102 transmits information regarding the first relational expression to each of the optimization device 200 and the sampling device 200b. Furthermore, the first communication unit 102 transmits distribution information to the sampling device 200b.
  • the first communication unit 102 includes initial values of two or more variables ⁇ , each of which is derived by performing sampling based on a predetermined distribution according to the distribution information for the first relational expression.
  • a plurality of combinations are received from sampling device 200b.
  • the first communication unit 102 transmits the plurality of combinations to the optimization device 200.
  • the first communication unit 102 receives from the optimization device 200 the values of two or more variables ⁇ derived by performing a search to find the optimal solution of the first relational expression using a plurality of combinations. .
  • the third embodiment and the first modification may be combined. For example, energy optimization of the first relational expression is performed, then sampling is performed based on a predetermined distribution, and then energy optimization of the first relational expression is performed again. Alternatively, sampling is performed based on a predetermined distribution, then energy optimization of the first relational expression is performed, and then sampling is performed again based on the predetermined distribution. That is, energy optimization and sampling are repeatedly performed alternately. In this case, when one of the energy optimization and sampling processes is performed, the result of the other process performed immediately before is used. This potentially allows energy optimization and sampling to be performed faster.
  • the present disclosure may also include a configuration constructed by combining components in a plurality of mutually different embodiments. Further, the present disclosure may also include a configuration constructed by combining respective components of any embodiment and any modification. Furthermore, the present disclosure may also include a configuration constructed by combining components in a plurality of mutually different modifications.
  • the information processing device 100 does not perform energy optimization, and the energy optimization is performed by the optimization unit 201 of the optimization device 200.
  • the information processing device 100 may include the optimization unit 201 and perform energy optimization.
  • the information processing device 100 may include a sampling unit 201b and perform sampling.
  • the crystal as an aggregate has two types of atoms, Au and Cu, but the types of atoms included in the aggregate are limited to these. It doesn't have to be a thing, it can be of any kind. Further, the number of types of atoms included in the aggregate is not limited to two types, and may be three or more types.
  • the type of atom is used as the state of the atom, but the state of the atom is not limited to the type of the atom. That is, the state of the atom may include at least one of the type of atom, the electronic spin state of the atom, the nuclear spin state of the atom, and the atomic vacancy in which the atom is missing. In this case, it is possible to improve the efficiency of processing for searching for at least one of the types of atoms included in the stable aggregation of atoms, the electronic spin state of the atoms, the nuclear spin state of the atoms, and the atomic vacancies. .
  • the atoms may have three or more states. In this case, three or more values are selected for the variables by making them correspond one-to-one to the states of the atoms.
  • one information processing device 100 executes all the processes of steps S10 to S12 and S14 shown in FIG.
  • the information processing apparatus 100 may include a plurality of devices, and each of the plurality of devices may execute any one of steps S10 to S12 and S14.
  • the information processing system 1000 may include a plurality of information processing apparatuses, and each of the plurality of information processing apparatuses may execute a part of the processing of the information processing apparatus 100.
  • the information processing system 1000 includes a first information processing device and a second information processing device that are different from each other. The first information processing device acquires the first relational expression and transmits information regarding the first relational expression to the optimization device 200.
  • the second information processing device receives the values of the two or more variables derived by the optimization device 200, and outputs structure information indicating the structure of the aggregate corresponding to the values of the two or more variables.
  • information processing device 100 may be configured from a plurality of information processing devices.
  • each component may be configured with dedicated hardware, or may be realized by executing a software program suitable for each component.
  • Each component may be realized by a program execution unit such as a CPU or a processor reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory.
  • programs for realizing the information processing device 100, optimization device 200, sampling device 200b, etc. of the above embodiments are included in, for example, FIG. 6, FIG. 7, FIG. 10, FIG. 19, FIG. 22, or FIG.
  • the processor may execute each step.
  • each of the information processing device 100, the optimization device 200, and the sampling device 200b is configured by a computer system including a microprocessor, ROM, RAM, hard disk drive, display unit, keyboard, mouse, etc. Also good. Programs are stored in the RAM or hard disk drive.
  • a program is configured by combining a plurality of instruction codes indicating instructions to a computer in order to achieve a predetermined function.
  • each of the information processing device 100, the optimization device 200, and the sampling device 200b may be configured from one system LSI (Large Scale Integration).
  • a system LSI is a super-multifunctional LSI manufactured by integrating multiple components on a single chip, and specifically includes a microprocessor, ROM (Read Only Memory), RAM (Random Access Memory), etc.
  • a computer system that includes: A computer program is stored in the RAM. The system LSI achieves its functions by the microprocessor operating according to a computer program.
  • each of the information processing device 100, optimization device 200, and sampling device 200b may be configured from an IC card or a single module that is removable from a computer.
  • An IC card or module is a computer system composed of a microprocessor, ROM, RAM, and the like.
  • the IC card or module may include the above-mentioned super multifunctional LSI.
  • An IC card or module achieves its functions by a microprocessor operating according to a computer program. This IC card or this module may be tamper resistant.
  • the present disclosure may be a method executed by each of the above-described information processing device 100, optimization device 200, and sampling device 200b. Further, this method may be realized by a computer executing a program, or may be realized by a digital signal consisting of a program.
  • the present disclosure may be configured with a computer-readable non-transitory recording medium for storing a program or a digital signal.
  • the recording medium include a flexible disk, a hard disk, a CD-ROM, a DVD, a DVD-ROM, a DVD-RAM, a BD (Blu-ray (registered trademark) Disc), and a semiconductor memory.
  • the program may be composed of the digital signal recorded on a non-temporary recording medium.
  • the present disclosure may be configured by transmitting the program or digital signal via a telecommunication line, a wireless or wired communication line, a network typified by the Internet, or data broadcasting.
  • the present disclosure also provides a computer system including a microprocessor and a memory, wherein the memory stores a program, and the microprocessor may operate according to the program.
  • At least one of A, B, and C means "(A), (B), (C), (A and B), (A and C), (B and C), or (A and B and C).
  • the present disclosure has the effect of increasing the efficiency of processing related to searching for a stable structure of an aggregate of atoms, and is useful for devices and systems for material development.
  • Input device 12 Display device 100 Information processing device 101 Acquisition unit 102 First communication unit 103 Output unit 110 First control unit 200 Optimization device (computing device) 200a Computing device 200b Sampling device (computing device) 201 Optimization unit (operation unit) 201b Sampling section (calculation section) 202 Second communication unit 202b Third communication unit 210 Second control unit 210b Third control unit 1000, 1001, 1002 Information processing system

Abstract

情報処理システム(1000)は、原子の集合体が有する構造のエネルギーを表す関係式に関する情報を送信する情報処理装置(100)と、その関係式を用いた計算を行う計算装置の一例である最適化装置(200)とを備え、その関係式は、(a)集合体に含まれる2以上の原子の状態に関する原子情報と、(b)集合体内における原子の状態が配置され得る2以上の位置に関する位置情報とに基づいて取得された関係式であって、2以上の位置に配置される原子の状態を示す2以上の変数を含み、情報処理装置(100)は、その関係式に関する情報を最適化装置(200)に送信し、上述の計算によって導出される2以上の変数の値を最適化装置(200)から受信する第1通信部(102)と、その2以上の変数の値に対応する構造情報を出力する出力部(103)とを備える。

Description

情報処理システム、情報処理装置、計算装置、情報処理方法、および計算方法
 本開示は、例えば結晶などの原子の集合体の構造に関する処理を行う技術に関する。
 非特許文献1には、クラスター展開法とモンテカルロシミュレーションを用いて安定な結晶構造を計算で求める手法が開示されている。特許文献1には、混合物性能最適化装置等が開示されている。この混合物性能最適化装置では、混合物における複数の物性ごとに重みづけをして混合物の性能を最適化するための計算にエネルギー関数式が用いられる。これにより、その混合物性能最適化装置では、混合物が多くの物性を含む場合であっても、混合物の性能を計算結果としてだけでなく実性能として最適化することができる。特許文献2には、2つの結晶構造をグラフに変換して構造類似度を計算する結晶材料解析装置等が開示されている。特許文献3には、安定なペロブスカイト型結晶構造の組成を設計する設計プログラムが開示されている。
特開2021-127418号公報 特開2021-028780号公報 特開2021-033768号公報
Zijian Yang, Robyn E. Ward, Naoto Tanibata, Hayami Takeda, Masanobu Nakayama, and Toru Asaka, Journal of Physical Chemistry C, 2020, 124, 9746 "Arrangement in La1/3NbO3 Obtained by First-Principles Density Functional Theory with Cluster Expansion and Monte Carlo Simulation"
 しかしながら、上記非特許文献1、特許文献1、特許文献2、および特許文献3の手法または装置などを用いても、原子の集合体の構造の探索にかかる処理の効率化が難しいという課題がある。
 本開示は、上記課題を解決するものであって、原子の集合体の構造の探索にかかる処理の効率化を図ることができる情報処理システムなどを提供する。
 上記課題を解決するために、本開示の第1態様に係る情報処理システムは、原子の集合体が有する構造のエネルギーを表す関係式に関する情報を送信する情報処理装置と、前記関係式に関する情報を受信し、前記関係式を用いた計算を行う計算装置とを備え、前記原子の集合体は、2以上の原子の状態を含み、前記関係式は、(a)前記集合体に含まれる前記2以上の原子の状態に関する原子情報と、(b)前記集合体内における前記2以上の原子の状態のうちの何れかがそれぞれ配置され得る2以上の位置に関する位置情報とに基づいて取得された関係式であって、前記2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数を含み、前記情報処理装置は、前記関係式に関する情報を前記計算装置に送信し、前記関係式を用いた計算を行うことによって導出される前記2以上の変数の値を前記計算装置から受信する通信部と、前記2以上の変数の値に対応する、前記集合体が有する構造を示す構造情報を出力する出力部とを備える。
 なお、これらの包括的または具体的な態様は、装置、方法、集積回路、コンピュータプログラム、または、コンピュータ読み取り可能な記録媒体で実現されてもよく、装置、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。コンピュータ読み取り可能な記録媒体は、CD-ROM(Compact Disc Read-Only Memory)などの非一時的な記録媒体を含む。
 本開示によれば、原子の集合体の構造の探索にかかる処理の効率化を図ることができる。
 本開示の一態様における更なる利点および効果は、明細書および図面から明らかにされる。かかる利点および/または効果は、いくつかの実施の形態並びに明細書および図面に記載された構成によって提供されるが、必ずしも全ての構成が必要とはされない。
図1は、実施の形態1における情報処理システムの構成の一例を示す図である。 図2は、実施の形態1における情報処理装置および最適化装置の機能構成の一例を示すブロック図である。 図3は、実施の形態1における情報処理装置の処理の一例を説明するための図である。 図4は、実施の形態1における情報処理装置によって得られる係数の一例を示す図である。 図5は、実施の形態1における最適化装置および情報処理装置の処理の一例を説明するための図である。 図6は、実施の形態1における情報処理システムによる処理動作の一例を示すフローチャートである。 図7は、図6におけるステップS11の処理の一例を詳細に示すフローチャートである。 図8は、図7におけるステップS111およびS113の処理の具体例を示す図である。 図9は、図7におけるステップS114およびS115の処理の具体例を示す図である。 図10は、図6におけるステップS12の処理の一例を詳細に示すフローチャートである。 図11は、図10におけるステップS121の処理の具体例を示す図である。 図12は、図10におけるステップS122およびS123の処理の具体例を示す図である。 図13は、図10におけるステップS122およびS123の処理の他の具体例を示す図である。 図14は、図10におけるステップS121の処理の他の具体例を示す図である。 図15は、図10におけるステップS122およびS123の処理の他の具体例を示す図である。 図16は、実施の形態2における情報処理システムが備える情報処理装置およびサンプリング装置の機能構成の一例を示すブロック図である。 図17は、ボルツマン分布を説明するための図である。 図18は、実施の形態2におけるサンプリング装置および情報処理装置の処理の一例を説明するための図である。 図19は、実施の形態2における情報処理システムによる処理動作の一例を示すフローチャートである。 図20は、実施の形態2における第1制御部の付加的な処理動作の一例を示す図である。 図21は、実施の形態3における情報処理システムが備える情報処理装置および計算装置の機能構成の一例を示すブロック図である。 図22は、実施の形態3における情報処理システムによる処理動作の一例を示すフローチャートである。 図23は、実施の形態3の変形例1における情報処理システムによる処理動作の一例を示すフローチャートである。
 (本開示に至った知見)
 近年の材料開発においては、合成された材料の物性を計算によって裏付けたり、未知材料の物性を計算で予測することが行われている。特に、第一原理計算と呼ばれる手法では、材料の構造(材料を構成する原子の並び方)がわかればその材料の物性の多くが計算でき、広く使われている。ただし、実際に合成可能な材料の構造はエネルギー的に安定なものであるため、材料の物性を計算で予測するためには材料の安定な結晶構造を知る必要がある。ここで、材料の安定な構造とは、ほとんどの場合はエネルギーが最小となる構造でよく近似できる。しかし、2種類以上の原子の集合体である多元系の結晶またはクラスターなどでは、何れかの原子が配置され得る位置(以下、サイトまたはサイト位置とも呼ばれる)のみが既知である場合が多い。したがって、その集合体において、どのサイトにどの原子(または空孔)が配置されると、その集合体が安定な構造になるかは知られていない場合が多い。
 例えば、Liイオン二次電池の正極材料には遷移金属元素の酸化物がよく用いられるが、複数の遷移金属元素種を用いることによって性能(例えば電位・容量など)が向上する場合があり、向上の度合いは遷移金属種の割合に依存する。性能が最適となる割合を計算で予測するためには、どの遷移金属がどの結晶サイトに配置された時に安定かを知る必要があるため、安定構造を決定する手法は材料開発にとって非常に重要である。この他にも、負極材料、固体電解質材料、高温構造材料、生体用材料、核融合炉構造材料、電解コンデンサ材料、触媒用材料、等に対しても有用である。
 従来の安定な結晶構造の決定手法として、エネルギーに関する各原子の最適配置を決定する手法が実施されている。この手法では、あらゆる配置の組み合わせのそれぞれについて、その配置の組み合わせに対応する結晶構造のエネルギーを計算し、そのエネルギーが最小となる配置の組み合わせを求める。なお、配置の組み合わせは、複数のサイトのそれぞれに配置される原子の組み合わせである。エネルギーが最小となる配置の組み合わせが上述の各原子の最適配置である。
 非特許文献1には、結晶構造のエネルギー計算にクラスター展開法と呼ばれる方法を使用し、エネルギーを最小とする配置の組み合わせをモンテカルロ法(具体的にはシミュレーテッドアニーリング法)で探索する手法が開示されている。この手法では、クラスター展開法を用いることで、精度をあまり落とすことなくそれぞれの結晶構造のエネルギーの計算コストを低くすることができ、さらにモンテカルロ法を用いることで、全ての配置の組み合わせを計算することなく最適配置を求めることができる。ただし、モンテカルロ法による安定な結晶構造の探索手法においても、配置の組み合わせの数が膨大な場合には、安定な結晶構造を求めるためには非常に多くの配置の組み合わせのそれぞれに対応する結晶構造のエネルギーを計算する必要がある。その結果、非特許文献1の手法では、安定な結晶構造を決定するためには多くの計算資源を必要とする。
 一方、近年、組み合わせ最適化問題を解くために特化した専用マシンの開発が盛んに行われ、応用例が数多く開示されている。特許文献1には、複数の材料の混合物の性能が最適化されるように混合比を計算する手法が開示されている。より具体的には、その手法では、混合される前の材料の物性値を取得して、混合物の性能を最適化する計算を行うためのエネルギー関数式をイジング型関数に変換し、アニーリングマシンを用いて最適な混合比を出力する。
 また、特許文献2には、2つの結晶構造の構造類似度を計算する手法が開示されている。より具体的には、その手法では、2つの結晶構造をそれぞれラベル付きグラフに変換し、それら2つのグラフから1つのコンフリクトグラフと呼ばれるグラフに変換し、コンフリクトグラフの最大独立集合を求めることで構造類似度を計算する。また、特許文献2では、コンフリクトグラフの最大独立集合を求める際に、コンフリクトグラフからイジング型関数を構成し、そのイジング型関数をアニーリングマシンなどで解く。
 また、特許文献3には、ペロブスカイト型結晶構造に関して、イジングモデル型関数を用いた最適化手法が開示されている。より具体的には、安定なペロブスカイト型結晶構造を与える原子種の組成比が求められる。
 しかしながら、特許文献1、特許文献2、および特許文献3の手法では、結晶構造が出力されない。特許文献3の手法であっても、ペロブスカイト型結晶構造の組成比が求められるだけであって、結晶構造を示す情報が出力されることはない。したがって、上記非特許文献1の手法に、特許文献1、特許文献2および特許文献3の手法を用いても、配置の組み合わせの数が膨大な場合には、結晶構造を決定することは困難である。
 そこで、本開示の第1態様に係る情報処理システムは、原子の集合体が有する構造のエネルギーを表す関係式に関する情報を送信する情報処理装置と、前記関係式に関する情報を受信し、前記関係式を用いた計算を行う計算装置とを備え、前記原子の集合体は、2以上の原子の状態を含み、前記関係式は、(a)前記集合体に含まれる前記2以上の原子の状態に関する原子情報と、(b)前記集合体内における前記2以上の原子の状態のうちの何れかがそれぞれ配置され得る2以上の位置に関する位置情報とに基づいて取得された関係式であって、前記2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数を含み、前記情報処理装置は、前記関係式に関する情報を前記計算装置に送信し、前記関係式を用いた計算を行うことによって導出される前記2以上の変数の値を前記計算装置から受信する通信部と、前記2以上の変数の値に対応する、前記集合体が有する構造を示す構造情報を出力する出力部とを備える。なお、原子の集合体は、例えば、結晶、クラスター、分子などである。また、2以上の位置と2以上の変数とは一対一に対応している。
 これにより、集合体内における2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数を含む関係式を用い、その関係式によって表されるエネルギーの大きさに応じた2以上の変数の値が導出される。つまり、エネルギーの大きさに応じた集合体の構造の探索が行われる。このような関係式は、イジングモデル型関数であるとも言える。なお、イジングモデル型関数は、単にイジングモデルとも呼ばれる。したがって、このような関係式を用いることによって、上述の探索にアニーリングマシンを適用することができ、従来のクラスター展開法およびモンテカルロ法を用いる手法と比べて、その探索にかかる計算コストを低く抑えることができる。また、2以上の変数の値は、集合体内における2以上の位置に一対一に対応しているため、それらの2以上の変数の値が導出されれば、エネルギーの大きさに応じた集合体の構造を容易に構築することができる。その結果、原子の集合体の構造の探索にかかる処理の効率化を図ることができる。
 なお、特許文献3の手法でも、エネルギー関数がイジングモデル型関数として用いられているが、そのエネルギー関数は、本開示における原子の集合体が有する構造のエネルギー(すなわち、物理的なエネルギー)を表しているものではない。特許文献3では、安定な構造の間接的な指標となる許容因子という経験式を用いて、イジングマシン(アニーリングマシンとも呼ばれる)で最適化するためのエネルギー関数をイジングモデル型関数として構成している。このような特許文献3のエネルギー関数という用語は、イジングマシンによる最適化が行われる評価関数の習慣的な用語であり、本開示における物理的なエネルギーを表していない。
 また、本開示の第2態様に係る情報処理装置は、(a)原子の集合体に含まれる2以上の原子の状態に関する原子情報と、(b)前記集合体内における前記2以上の原子の状態のうちの何れかがそれぞれ配置され得る2以上の位置に関する位置情報とに基づいて、前記集合体が有する構造のエネルギーを表す関係式として、前記2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数を含む第1関係式を取得する取得部と、前記第1関係式に関する情報を、前記第1関係式を用いた計算を行う計算装置に送信し、前記第1関係式を用いた計算を行うことによって導出される前記2以上の変数の値を前記計算装置から受信する通信部と、前記2以上の変数の値に対応する、前記集合体が有する構造を示す構造情報を出力する出力部とを備える。
 これにより、計算装置を用いることによって、上述の情報処理システムと同様の作用効果を奏することができる。
 また、第2態様に従属する第3態様に係る情報処理装置では、前記計算装置は、前記第1関係式の最適解を求めるための探索を、前記第1関係式を用いた計算として行う最適化装置であってもよい。
 これにより、それぞれ原子の状態を示す2以上の変数を含む第1関係式に対するエネルギー最適化によって、2以上の変数の値が導出される。したがって、エネルギー最適化にアニーリングマシンを用いることができ、そのエネルギー最適化にかかる計算コストを低く抑えることができる。また、2以上の変数の値は、集合体内における2以上の位置に一対一に対応しているため、それらの2以上の変数の値が導出されれば、集合体の安定な構造を容易に構築することができる。その結果、原子の集合体の安定な構造の探索にかかる処理の効率化を図ることができる。なお、エネルギー最適化では、関係式によって表されるエネルギーが必ずしも最小化または最適化されるとは限らない。
 また、第2態様または第3態様に従属する第4態様に係る情報処理装置では、前記原子の状態は、前記原子の種類、前記原子のスピン状態、及び前記原子が欠損している原子空孔の少なくとも1つを含んでもよい。
 これにより、安定な原子の集合体に含まれる原子の種類、原子のスピン状態、および原子空孔の少なくとも1つの探索にかかる処理の効率化を図ることができる。
 また、第2態様から第4態様の何れか1つの態様に従属する第5態様に係る情報処理装置では、前記第1関係式は、
Figure JPOXMLDOC01-appb-M000003
によって表され、前記式(1)において、Eは、前記集合体が有する構造のエネルギーを示し、iおよびjのそれぞれは、前記集合体内における前記位置を示し、σは、前記集合体内の位置iにおける前記変数であり、σは、前記集合体内の位置jにおける前記変数であり、Aは、0次のクラスターの相互作用係数であり、Bは、1次のクラスターの相互作用係数であり、Cijは、2次のクラスターの相互作用係数であってもよい。または、第2態様から第4態様の何れか1つの態様に従属する第6態様に係る情報処理装置では、前記第1関係式は、第1係数とn個(nは2以上の整数)の項との和によって前記エネルギーを表し、前記n個の項のうちのk番目(kは1以上n以下の整数)の項は、前記2以上の変数から取り得る数の組のそれぞれに対応する積の和であって、前記組は、k個の変数からなり、前記積は、前記組に含まれるk個の変数と、前記組に対応する第2係数との積であってもよい。
 これにより、エネルギー最適化にアニーリングマシンを適切に用いることができ、計算コストを効果的に低く抑えることができる。
 また、第2態様から第5態様の何れか1つの態様に従属する第7態様に係る情報処理装置では、前記取得部は、前記原子情報および前記位置情報に基づいてクラスター展開法を用いて表される第2関係式を、イジングモデルに変換することによって前記第1関係式を取得してもよい。
 これにより、クラスター展開法の第2関係式からの変換によって、イジングモデルである第1関係式が取得されるため、クラスター展開法を流用することができ、第1関係式の取得にかかる処理負担を低減することができる。
 また、第7態様に従属する第8態様に係る情報処理装置では、前記第2関係式は、
Figure JPOXMLDOC01-appb-M000004
によって表され、前記式(2)において、Eは、前記集合体が有する構造のエネルギーを示し、αは、クラスターの識別子であり、Vαは、前記エネルギーに対するクラスターαの寄与の大きさを示す係数であり、φαは、クラスターαの相関関数であってもよい。
 これにより、式(2)に含まれるVαおよびφαから、第1関係式に含まれる複数種の係数を抽出することができ、その結果、第1関係式を適切に取得することができる。
 また、第2態様、第4態様から第8態様のうちの何れか1つの態様に従属する第9態様に係る情報処理装置では、前記計算装置は、所定の分布に基づくサンプリングを、前記第1関係式を用いた計算として実行するサンプリング装置であり、前記取得部は、さらに、前記所定の分布に関する分布情報を取得し、前記通信部は、さらに、前記分布情報を前記サンプリング装置に送信し、前記2以上の変数の値の受信では、前記第1関係式に対して、前記分布情報に応じた前記所定の分布に基づくサンプリングを実行することによって導出される、それぞれ前記2以上の変数の値を含む複数の組み合わせを前記サンプリング装置から受信し、前記出力部は、前記複数の組み合わせの各々に対応する、前記集合体が有する構造を示す構造情報を出力してもよい。例えば、所定の分布は、ボルツマン分布であり、分布情報は、そのボルツマン分布に用いられる温度を示す情報である。なお、所定の分布は、ボルツマン分布に限定されるものではなく、他の分布であってもよい。分布情報も、その所定の分布を表すための情報であれば、温度を示す情報に限らず、どのような情報であってもよい。
 これにより、集合体内における2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数を含む第1関係式に対する、所定の分布に基づくサンプリングによって、複数の組み合わせが導出される。なお、サンプリングは、探索とも言える。また、第1関係式は、イジングモデル型関数であるとも言える。したがって、このような第1関係式を用いることによって、そのサンプリングにアニーリングマシンを適用することができ、従来のクラスター展開法およびモンテカルロ法を用いる手法と比べて、そのサンプリングにかかる計算コストを低く抑えることができる。また、複数の組み合わせのそれぞれに含まれる2以上の変数の値は、集合体内における2以上の位置に一対一に対応しているため、それらの2以上の変数の値が導出されれば、集合体の構造を容易に構築することができる。その結果、原子の集合体の構造のサンプリングまたは探索にかかる処理の効率化を図ることができる。
 また、第2態様、第4態様から第8態様のうちの何れか1つの態様に従属する第10態様に係る情報処理装置では、前記計算装置は、前記第1関係式の最適解を求めるための探索を、前記第1関係式を用いた計算として行う最適化装置と、所定の分布に基づくサンプリングを、前記第1関係式を用いた計算として実行するサンプリング装置とを備え、前記取得部は、さらに、前記所定の分布に関する分布情報を取得し、前記通信部は、前記第1関係式に関する情報の送信では、前記第1関係式に関する情報を、前記最適化装置および前記サンプリング装置のそれぞれに送信し、さらに、前記第1関係式の最適解を求めるための探索を行うことによって導出される前記2以上の変数の初期値を前記最適化装置から受信し、前記2以上の変数の初期値および前記分布情報を前記サンプリング装置に送信し、前記2以上の変数の値の受信では、前記第1関係式に対して、前記2以上の変数の初期値と、前記分布情報に応じた前記所定の分布とに基づくサンプリングを実行することによって導出される、それぞれ前記2以上の変数の値を含む複数の組み合わせを前記サンプリング装置から受信し、前記出力部は、前記複数の組み合わせの各々に対応する、前記集合体が有する構造を示す構造情報を出力してもよい。
 これにより、第1関係式の最適解を求めるための探索、すなわち第1関係式のエネルギー最適化を行うことによって導出される2以上の変数の値が、所定の分布に基づくサンプリングの初期値として用いられる。したがって、サンプリングの処理速度の向上と、計算負荷の軽減とを図る可能性を高めることができる。
 また、第2態様、第4態様から第8態様のうちの何れか1つの態様に従属する第11態様に係る情報処理装置では、前記計算装置は、前記第1関係式の最適解を求めるための探索を、前記第1関係式を用いた計算として行う最適化装置と、所定の分布に基づくサンプリングを、前記第1関係式を用いた計算として実行するサンプリング装置とを備え、前記取得部は、さらに、前記所定の分布に関する分布情報を取得し、前記通信部は、前記第1関係式に関する情報の送信では、前記第1関係式に関する情報を、前記最適化装置および前記サンプリング装置のそれぞれに送信し、さらに、前記分布情報を前記サンプリング装置に送信し、前記第1関係式に対して、前記分布情報に応じた前記所定の分布に基づくサンプリングを実行することによって導出される、それぞれ前記2以上の変数の初期値を含む複数の組み合わせを前記サンプリング装置から受信し、前記複数の組み合わせを前記最適化装置に送信し、前記2以上の変数の値の受信では、前記複数の組み合わせを用いて前記第1関係式の最適解を求めるための探索を行うことによって導出される前記2以上の変数の値を前記最適化装置から受信してもよい。
 これにより、第1関係式に対する所定の分布に基づくサンプリングによって導出される複数の組み合わせ、すなわち、その複数の組み合わせのそれぞれに含まれる2以上の変数の値が、第1関係式のエネルギー最適化の初期値として用いられる。したがって、サンプリングの処理速度の向上と、計算負荷の軽減とを図る可能性を高めることができる。
 また、本開示の第12態様に係る計算装置は、原子の集合体が有する構造のエネルギーを表す関係式を用いた計算を行うことによって、前記関係式に含まれる2以上の変数の値を導出する演算部と、前記演算部によって導出された前記2以上の変数の値を出力する出力部とを備え、前記関係式は、(a)前記集合体に含まれる2以上の原子の状態に関する原子情報と、(b)前記集合体内における前記2以上の原子の状態のうちの何れかがそれぞれ配置され得る2以上の位置に関する位置情報とに基づいて取得された関係式であって、前記2以上の位置のそれぞれに配置される原子の状態を示す前記2以上の変数を含む。
 これにより、その関係式は、イジングモデル型関数であるとも言えるため、このような関係式を用いることによって、2以上の変数の値の導出にアニーリングマシンを適用することができ、その導出にかかる計算コストを低く抑えることができる。
 また、第12態様に従属する第13態様に係る計算装置では、前記演算部は、前記関係式の最適解を求めるための探索を、前記関係式を用いた計算として行ってもよい。
 これにより、関係式のエネルギー最適化にかかる計算コストを低く抑えることができる。
 また、第12態様に従属する第14態様に係る計算装置では、前記演算部は、前記関係式に対する所定の分布に基づくサンプリングを、前記関係式を用いた計算として実行することによって、複数の組み合わせを導出し、前記出力部は、前記複数の組み合わせを出力し、前記複数の組み合わせのそれぞれは、前記関係式に含まれる2以上の変数の値を含んでもよい。
 これにより、関係式に対する所定の分布に基づくサンプリングにかかる計算コストを低く抑えることができる。
 以下、本開示の実施の形態について、図面を参照しながら説明する。以下に説明する実施の形態は、いずれも本開示の好ましい一具体例を示すものである。したがって、以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置および接続形態などは、一例であって本開示を限定する主旨ではない。よって、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
 なお、各図は、模式図であり、必ずしも厳密に図示されたものではない。また、各図において、実質的に同一の構成に対しては同一の符号を付しており、重複する説明は省略または簡略化する。
 (実施の形態1)
 [情報処理システム1000の構成]
 図1は、本実施の形態における情報処理システム1000の構成の一例を示す図である。
 本実施の形態における情報処理システム1000は、情報処理装置100と、最適化装置200とを備える。
 情報処理装置100は、2以上の原子の集合体の安定な構造を探索するためのコンピュータである。なお、その原子の集合体は、2以上の原子の状態を含んでいるとも言える。その集合体の一例は、結晶、クラスターなどである。また、情報処理装置100は、入力デバイス11と表示デバイス12とに接続されている。入力デバイス11は、例えば、キーボード、タッチセンサ、タッチパッドまたはマウスなどとして構成され、ユーザによる入力操作に応じた信号を情報処理装置100に出力する。表示デバイス12は、例えば、液晶ディスプレイ、プラズマディスプレイ、有機EL(Electro-Luminescence)ディスプレイなどであって、情報処理装置100から出力される画像信号に基づいて画像を表示する。このような情報処理装置100は、その集合体のエネルギーを表すイジングモデルの関係式として第1関係式を取得する。情報処理装置100は、その2以上の原子の集合体が有する構造のエネルギーを表す第1関係式に関する情報を、通信ネットワークNtを介して最適化装置200に送信する。そして、情報処理装置100は、その第1関係式によって表されるエネルギーを例えば最小化する複数の変数の値を、最適化装置200から取得する。その複数の変数のそれぞれは、第1関係式に含まれる変数である。情報処理装置100は、それらの変数の値にしたがって上述の安定な構造を決定する。情報処理装置100は、このように決定された構造を示す構造情報を、外部の装置またはデバイスに出力してもよく、表示デバイス12に画像信号として出力して、その構造を表示デバイス12に表示してもよい。
 最適化装置200は、インターネットなどの通信ネットワークNtを介して情報処理装置100と通信するコンピュータであって、上述の第1関係式の最適化(すなわち、エネルギー最適化)を行う。つまり、最適化装置200は、通信ネットワークNtを介して情報処理装置100から第1関係式に関する情報を受信し、その第1関係式の最適解を求めるための探索を行う。この探索によって、第1関係式によって表されるエネルギーが例えば最小化される。なお、その探索、すなわちエネルギー最適化では、第1関係式によって表されるエネルギーが必ずしも最小化または最適化されるとは限らないが、本実施の形態では、そのエネルギーが最小化されるものとして説明する。そして、最適化装置200は、第1関係式によって表されるエネルギーが最小となる複数の変数の値を導出する。
 [情報処理装置および最適化装置の構成]
 図2は、情報処理装置100および最適化装置200の機能構成の一例を示すブロック図である。
 情報処理装置100は、取得部101、第1通信部102、出力部103、および第1制御部110を備える。
 取得部101は、原子情報と位置情報とに基づいて、上述の第1関係式を取得する。例えば、取得部101は、入力デバイス11から出力される信号として、その原子情報および位置情報を取得する。なお、取得部101は、記録媒体に格納されている原子情報および位置情報を読み出してもよい。
 原子情報は、原子の集合体に含まれるその2以上の原子の状態に関する情報である。原子情報は、例えば、原子の種類、原子のスピン状態、及び原子が欠損している原子空孔の少なくとも1つを含む。スピンは、例えば、電子スピンまたは核スピンなどである。なお、本実施の形態では、原子情報が原子の種類を示しているものとして説明する。また、原子情報は、その原子の種類を直接的または間接的に示してもよい。例えば、集合体がCu(すなわち銅)の原子と、Au(すなわち金)の原子との集合であれば、原子情報は、CuとAuとを示す。また、原子情報は、その原子の種類を示すだけでなく、その原子のスピン状態も示してもよい。位置情報は、集合体内におけるその2以上の原子の状態のうちの何れかがそれぞれ配置され得る2以上の位置に関する情報である。なお、位置情報は、その位置の数を示してもよく、その位置を直接的または間接的に示してもよい。また、そのような位置は、サイトまたはサイト位置とも呼ばれることがある。第1関係式は、このような2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数を含む。また、2以上の位置と2以上の変数とは一対一に対応している。なお、原子の集合体は、2以上の原子の状態に関する情報及び当該2以上の位置に関する情報に関係しない他の情報を含んでいてもよい。
 第1通信部102は、最適化装置200と通信するデバイスであって、取得部101で取得された第1関係式に関する情報を最適化装置200に送信する。さらに、第1通信部102は、その送信された情報から得られる第1関係式に対して最適化装置200によって導出された2以上の変数のそれぞれの値を、その最適化装置200から受信する。この2以上の変数の値は、上述のエネルギー最適化によって、すなわち、第1関係式の最適解を求めるための探索を行うことによって導出される。このように、第1通信部102は、第1関係式に関する情報を最適化装置200に送信し、その第1関係式の最適解を求めるための探索を行うことによって導出される2以上の変数の値を最適化装置200から受信する。
 出力部103は、最適化装置200によって導出された2以上の変数の値に対応する、上述の集合体が有する構造を示す構造情報を出力する。例えば、出力部103は、その構造情報を画像信号として表示デバイス12に出力することによって、その表示デバイス12にその集合体の構造を表示する。
 第1制御部110は、取得部101、第1通信部102および出力部103を制御するとともに、それらの構成要素による処理以外の処理を実行する。
 最適化装置200は、第1関係式に関する情報を受信し、その第1関係式を用いた計算を行う計算装置の一例であって、最適化部201、第2通信部202、および第2制御部210を備える。
 第2通信部202は、情報処理装置100と通信するデバイスであって、上述の第1関係式に関する情報を情報処理装置100から受信する。さらに、第2通信部202は、最適化部201によって導出された2以上の変数の値を情報処理装置100に送信する。つまり、第2通信部202は、最適化部201によって導出された2以上の変数の値を出力する出力部として機能する。
 最適化部201は、情報処理装置100から第2通信部202を介して、上述の第1関係式に関する情報を取得し、その情報から得られる第1関係式のエネルギー最適化を実行する。つまり、最適化部201は、原子の集合体が有する構造のエネルギーを表す第1関係式の最適解を求めるための探索を行うことによって、その第1関係式に含まれる2以上の変数の値を導出する。なお、本実施の形態における最適化部201は、演算部の一例であって、原子の集合体が有する構造のエネルギーを表す第1関係式を用いた計算を行うことによって、その第1関係式に含まれる2以上の変数の値を導出する。本実施の形態では、最適化部201は、第1関係式の最適解を求めるための探索を、第1関係式を用いた計算として行う。
 第2制御部210は、最適化部201および第2通信部202を制御するとともに、それらの構成要素による処理以外の処理を実行する。
 このような情報処理装置100および最適化装置200のそれぞれは、例えば、CPU(Central Processing Unit)などのプロセッサと、揮発性のメモリおよび不揮発性のメモリと、不揮発性のメモリに格納されたプログラムとによって構成されていてもよい。この場合、情報処理装置100および最適化装置200のそれぞれの機能的な構成は、プロセッサが上記プログラムを実行することで実現される。
 [情報処理システム1000の処理内容]
 図3は、情報処理装置100の処理の一例を説明するための図である。
 情報処理装置100の第1制御部110は、図3の(a)に示すように、複数の結晶構造のそれぞれについて、第一原理計算を用いてその結晶構造のエネルギーを算出する。これらの結晶構造は、エネルギーの算出の負荷が小さく抑えられるように、サイトの数が少ない構造である。例えば、そのサイトの数は、16以下である。このエネルギーの算出には、例えば、ATAT(Alloy Theoretic Automated Toolkit)またはVASP(Vienna Ab initio Simulation Package)などの解析ツールが用いられてもよい。
 次に、取得部101は、入力デバイス11から原子情報および位置情報を取得し、図3の(b)に示すように、複数の結晶構造とそれらの算出されたエネルギーとの関係に基づいて、その原子情報および位置情報に対応するエネルギー予測モデルを生成する。例えば、原子情報は、CuおよびAuを示し、位置情報は、32個のサイトを示す。つまり、このエネルギー予測モデルは、32個のサイトを有し、それらのサイトのそれぞれにCuまたはAuが配置される結晶構造のエネルギーを予測するためのモデルである。このエネルギー予測モデルは、例えば、複数の結晶構造とそれらの算出されたエネルギーとの関係に基づく機械学習によって、以下の式(2)によって示される第2関係式として生成される。
Figure JPOXMLDOC01-appb-M000005
 この式(2)において、Eは、結晶構造のエネルギーを示し、αは、クラスターの識別子である。クラスターは、結晶に含まれる原子の組であって、αによって、結晶に含まれる複数のクラスターのうちの何れか1つのクラスターが識別される。Vαは、エネルギーEに対するクラスターαの寄与の大きさを示す係数である。φαは、クラスターαの相関関数である。つまり、取得部101は、原子情報および位置情報に基づいてクラスター展開法を用いて表される第2関係式を生成する。言い換えれば、取得部101は、ある次数までのクラスター展開の有効クラスター相互作用(ECI:Effective Cluster Interaction)を計算する。図面、式における
Figure JPOXMLDOC01-appb-M000006
は、図面、式以外の箇所で、φと表現されることがある。
 次に、取得部101は、図3の(c)に示すように、この第2関係式をイジングモデルに変換することによって第1関係式を取得する。すなわち、第1関係式は、イジングモデルであって、例えば以下の式(1)によって表される。
Figure JPOXMLDOC01-appb-M000007
 この式(1)において、Eは、結晶構造のエネルギーを示し、iおよびjのそれぞれは、結晶内における位置(すなわちサイト位置)を示す。σは、結晶内の位置iに配置される原子の種類を示す変数であり、σは、結晶内の位置jに配置される原子の種類を示す変数である。ここで、σとσとは、位置iと位置jとの違いのみを表すものであり、変数としての意味は同じである。なお、これらの変数は、イジング変数とも呼ばれる。また、Aは、0次のクラスターの相互作用係数であり、Biは、1次のクラスターの相互作用係数であり、Cijは、2次のクラスターの相互作用係数である。なお、これらの相互作用係数は、以下、単に係数とも呼ばれる。具体的には、取得部101は、イジングモデルへの変換によって式(1)のような第1関係式を取得するときには、式(2)の第2関係式から、係数A、B、Cij、を抽出することによって式(1)の第1関係式を取得する。
 0次のクラスター、1次のクラスター、2次のクラスターなどのクラスターは、原子の組であって、その次数は、組に含まれる原子の数である。例えば、2次のクラスターは、その結晶に含まれる隣り合う2個の原子の組であってもよく、互いに離れている2個の原子の組であってもよい。つまり、2次のクラスターは、その結晶に含まれる任意の2個の原子の組み合わせである。また、具体的な一例では、位置iにある原子がAuである場合には、その位置iに対応する変数σの値は+1であり、位置iにある原子がCuである場合には、その位置iに対応する変数σの値は-1である。このように、変数σは、+1および-1の2値によって位置iに配置される原子の種類を示す。なお、変数σは、原子の種類だけでなく、その原子のスピン状態を示してもよい。
 第1関係式は、式(1)のように、0次の項と、1次の項と、2次の項との和によってエネルギーEを表現する。すなわち、式(1)では、エネルギーEは、2次までの項によって表現される。しかし、その次数は、2次に限定されることなく3次以上であってもよい。例えば、第1関係式は、0次の項と、1次の項と、2次の項と、・・・、N次(Nは3以上の整数)の項との和によってエネルギーEを表現してもよい。なお、取得部101は、3次以上の項を有する第1関係式を取得し、その後、その第1関係式を、2次までの項を有する第1関係式に丸め込んでもよい。
 言い換えれば、第1関係式は、第1係数Aとn個(nは2以上の整数)の項との和によってエネルギーEを表す。そのn個の項のうちのk番目(kは1以上n以下の整数)の項は、2以上の変数σから取り得る数の組のそれぞれに対応する積の和である。その組は、k個の変数σからなり、その積は、その組に含まれるk個の変数σと、その組に対応する第2係数(例えばBまたはCijなど)との積である。なお、kは、上述の次数に対応し、その次数は、2次に限定されることなく3次以上であってもよい。
 また、式(1)は、結晶構造が32個のサイトを有する場合の第1関係式の一例であって、iおよびjのそれぞれは、0~31までの整数を示す。しかし、結晶構造が有するサイトの数は、32に限らず、33以上であってもよい。この場合には、式(1)におけるiおよびjのそれぞれは、0~(m-1)(mはサイトの数)のうちの何れかの整数を示す。
 このように、本実施の形態では、例えば式(1)のようなイジングモデル型関数である第1関係式を用いたエネルギー最適化が行われる。したがって、そのエネルギー最適化にアニーリングマシンを適切に用いることができ、計算コストを効果的に低く抑えることができる。
 また、本実施の形態では、クラスター展開法の第2関係式からの変換によって、イジングモデルである第1関係式が取得されるため、クラスター展開法を流用することができ、第1関係式の取得にかかる処理負担を低減することができる。さらに、本実施の形態では、例えば式(2)のような第2関係式に含まれるVαおよびφαから、第1関係式に含まれる複数種の係数を抽出することができ、その結果、第1関係式を適切に取得することができる。
 図4は、情報処理装置100によって得られる係数の一例を示す図である。
 係数Aは、上述のとおり0次のクラスターの相互作用係数であって、図4に示すように、例えば-0.0173730000である。また、係数Bは、上述のとおり1次のクラスターの相互作用係数であって、32個のサイトを有する集合体の場合、位置i=0~31のそれぞれに対して数値を示す。また、係数Cijは、上述のとおり2次のクラスターの相互作用係数であって、32個のサイトを有する集合体の場合、i<jの条件の下で、位置i=0~31のそれぞれと位置j=0~31のそれぞれとの全ての組み合わせに対して数値を示す。情報処理装置100は、第2関係式からこのような係数A、B、Cij、を抽出することによって第1関係式を取得し、第1関係式に関する情報として、それらの係数を最適化装置200に送信する。なお、情報処理装置100は、係数A、B、Cijだけでなく、原子情報および位置情報を送信してもよい。また、原子情報に対する制約条件を送信してもよい(例えば、組成比を所定の値に固定するなど)。また、第1関係式の全てを最適化装置200に送信してもよい。
 図5は、最適化装置200および情報処理装置100の処理の一例を説明するための図である。
 最適化装置200は、情報処理装置100から送信された係数A、B、Cijを受信する。このとき、最適化装置200は、それらの係数だけでなく、原子情報および位置情報も情報処理装置100から受信してもよい。そして、最適化装置200は、それらの係数および情報などに基づいて第1関係式を構築し、その第1関係式によって表されるエネルギーEを最小化する変数σ(ここでは、σ)の値を導出する。言い換えれば、最適化装置200は、エネルギー最適化によって、変数σの値を決定する。なお、サイトの数が32個の場合、すなわちiによって示される整数の数が32個の場合、変数σの数も32個であると言える。このとき、最適化装置200は、イジングモデルの最適化に特化したコンピュータであるアニーリングマシンを用いて、上述のエネルギー最適化を行う。アニーリングマシンは、量子アニーリングマシン、量子インスパイアドアニーリングマシンなどであってもよい。また、アニーリングマシンの代わりに、ゲート型量子コンピュータが用いられてもよい。このゲート型量子コンピュータでは、QAOA(Quantum Approximate Optimization Algorithm)が用いられてもよい。そして、最適化装置200は、その導出または決定された変数σの値を情報処理装置100に送信する。例えば、最適化装置200によって第1関係式によって表されるエネルギーEが最小化されたとき、E=-490.08(×10-4)である。このとき、導出される変数σの値は、例えば、σ=-1(i=0~7、16~23)及びσ=+1(i=8~15、24~31)である。
 情報処理装置100は、最適化装置200から送信された変数σの値に基づいて、原子の集合体の構造(例えば結晶構造)を構築する。すなわち、情報処理装置100は、集合体の位置iに、変数σの値に対応する種類の原子を配置することによって、その集合体の構造を構築する。例えば、σ=‐1(i=0~7、16~23)及びσ=+1(i=8~15、24~31)である場合の、その構造の構築では、AuまたはCuの原子が各位置に配置される。そして、情報処理装置100は、その構築された集合体の構造を示す構造情報を出力する。この構造情報の出力によって、例えば、その集合体の構造が表示デバイス12に表示される。
 [処理の流れ]
 図6は、情報処理システム1000による処理動作の一例を示すフローチャートである。
 (ステップS10)
 情報処理装置100の取得部101は、原子の集合体の原子情報および位置情報を取得する。
 (ステップS11)
 取得部101は、クラスター展開法によって表されるエネルギーの第2関係式を生成する。
 (ステップS12)
 取得部101は、第2関係式をイジングモデル型の第1関係式に変換する。つまり、取得部101は、第2関係式をイジングモデルに変換することによって、第1関係式を取得する。
 (ステップS13)
 最適化装置200の最適化部201は、第1関係式のエネルギーを最小化する第1関係式の変数の値を、アニーリングマシンを用いて導出する。例えば、情報処理装置100の第1制御部110は、第1関係式に関する情報を第1通信部102から最適化装置200へ送信させることによって、その第1関係式のエネルギーを最小化する処理(すなわちエネルギー最適化)を最適化装置200に実行させる。なお、情報処理装置100の第1制御部110は、最適化装置200を用いてエネルギー最適化を行っているとも言える。
 (ステップS14)
 情報処理装置100の出力部103は、導出された変数の値に基づいて集合体の構造を構築して、その構造を示す構造情報を出力する。例えば、最適化装置200の第2制御部210は、その導出された変数の値を第2通信部202から情報処理装置100へ送信させる。出力部103は、その最適化装置200から送信された変数の値を用いて集合体の構造を構築する。
 以上のように、本実施の形態では、集合体の安定な構造を得るために、集合体内における2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数を含む第1関係式を用い、その第1関係式によって表されるエネルギーが例えば最小となる2以上の変数の値が導出される。つまり、それぞれ原子の状態を示す2以上の変数を含む第1関係式に対するエネルギー最適化によって、2以上の変数の値が導出される。このような第1関係式は、イジングモデル型関数であるとも言える。したがって、このような第1関係式を用いることによって、そのエネルギー最適化にアニーリングマシンを適用することができ、従来のクラスター展開法およびモンテカルロ法を用いる手法と比べて、そのエネルギー最適化にかかる計算コストを低く抑えることができる。また、2以上の変数の値は、集合体内における2以上の位置に一対一に対応しているため、それらの2以上の変数の値が導出されれば、集合体の安定な構造を容易に構築することができる。その結果、原子の集合体の安定な構造の探索にかかる処理の効率化を図ることができる。
 なお、本実施の形態では、第1関係式を用いた計算として、第1関係式の最適解を求めるための探索が行われるが、そのような探索以外の計算が行われてもよい。このような場合であっても、本実施の形態では、第1関係式によって表されるエネルギーの大きさに応じた2以上の変数の値が導出される。つまり、エネルギーの大きさに応じた集合体の構造の探索が行われる。また、第1関係式を用いることによって、上述の探索にアニーリングマシンを適用することができ、その探索にかかる計算コストを低く抑えることができる。また、それらの2以上の変数の値が導出されれば、エネルギーの大きさに応じた集合体の構造を容易に構築することができる。その結果、原子の集合体の構造の探索にかかる処理の効率化を図ることができる。
 [ステップS11の処理]
 以下、図6のステップS11の処理について、図7~図9を用いて詳細に説明する。なお、図7は、図6のステップS11の処理の一例を詳細に示すフローチャートである。図8は、図7のステップS111およびS113の処理の具体例を示す図であり、図9は、図7のステップS114およびS115の処理の具体例を示す図である。
 図7に示すように、まず、取得部101は、原子の集合体の位置情報から、それを不変に保つ対称変換を取得し、その対称変換について独立なクラスター(図形)を取得する(ステップS111)。取得部101は、そのようなクラスターの中で、第2関係式を生成するために使用する最大サイズのクラスターαmaxを決める(ステップS112)。次に、取得部101は、計算対象より小さいサイズの構造を複数個(N個とする)生成する(ステップS113)。取得部101は、N個の構造それぞれについて、第一原理計算などを用いてエネルギーE、および、最大サイズのクラスターαmaxに内包されるクラスター群(サブクラスター)αについて相関関数φαを計算する(ステップS114)。取得部101は、このようにして生成されたN組の(φα,E)というデータから、最小自乗法を用いて第2関係式の係数Vαを算出する(ステップS115)。そして、取得部101は、係数Vαの精度が十分か否かを判断する(ステップS116)。この最小自乗法において得られる係数Vαの精度が十分でない場合には(ステップS116のNo)、取得部101は、構造を追加してデータを増やしてもよい。精度は、例えば、交差検証による評価である。より具体的には、第2関係式の係数VαをATATなどの解析ツールを用いて算出する場合、取得部101は、交差検定スコア(Cross validation score)が0.05以下であるときに精度が十分であると判断する。また、取得部101は、精度が十分と判断すると(ステップS116のYes)、ステップS11の処理を終了する。
 図8および図9は、このステップS11の処理を、簡単な2次元の構造を用いて具体的に示す(非特許文献(乾 晴行 編著「ハイエントロピー合金―カクテル効果が生み出す多彩な新物性」内田老鶴圃 2020/5/1)参照)。
 図8の[ステップS111の処理]のように、4サイトの正方格子上に原子種が配置されている構造のエネルギーをクラスター展開法で求めることを考える。正方格子のサイトをいくつか選んで生成されるクラスターについて、正方格子を不変に保つ対称変換に関して独立なものは、図8の6通りある。なお、図8の表では、対称変換の元で移りあう図形の個数が多重度と呼ばれて示されている。この中には「サイトを選ばない」ことによって形成される図形(これをゼロクラスターと呼ぶ)も便宜上含むことにし、クラスター識別番号α=0で示されている。以降、クラスターの大きさの小さい順に識別番号を1から5まで図8のように割り当てる。今回の具体例では、αmaxを2とし、すなわち2つの最近接サイトで形成される図形を最大のクラスターとした展開を行う。サブクラスターとしてはα=0,1をいずれも考慮する。また、以下ではN=4の場合を考え、図8の[ステップS113の処理]に示したような構造をデータとする。取得部101は、この4つの構造について、それぞれエネルギーおよびφ,φ,φを計算する。ゼロクラスターの値はどの構造についても1、と定義する。図9の[ステップS114の処理]に、いくつかの計算結果を示した。最後に、取得部101は、この4組の相関関数-エネルギーデータ点の関係を近似する1次式を最小自乗法により求める。図9の[ステップS115の処理]に、この概念図を示す。これは、E=Vφ+Vφ+Vφという1次式の係数V,V,Vを定めたことになり、第2関係式を得たことになる。
 [ステップS12の処理]
 以下、図6のステップS12の処理について、図10~図15を用いて詳細に説明する。なお、図10は、図6のステップS12の処理の一例を詳細に示すフローチャートである。図11および図14は、図10のステップS121の処理の具体例を示す図であり、図12、図13および図15は、図10のステップS122およびS123の処理の具体例を示す図である。
 図10に示すように、まず、取得部101は、第2関係式を生成したときに考慮したクラスターを取得する(ステップS121)。なお、そのクラスターは、最大サイズのクラスターαmaxおよびそれに内包されるクラスター群(サブクラスター)である。取得部101は、その中の一つのクラスターαについて、計算対象の構造のサイトから、クラスターαと一致するサイトの組を探索し、探索された全てのサイトの組を取得する(ステップS122)。そのサイトの組がサイト番号(i,j,…,n)から成っていたとすると、イジング型関数のσσ・・・σという項の係数が、cααである(cαは一般にはαによる定数)。つまり、取得部101は、イジング型関数のσσ・・・σの係数を、Vαを用いて表す(ステップS123)。なお、σσ・・・σは、添字にそれぞれサイト番号の組(i,j,…,n)を持つイジング変数の積を表す。そして、取得部101は、この手順を全てのαについて行うことによって、計算対象の構造のエネルギーを表すイジング型関数の係数を決める(ステップS124)。
 図11~図15は、このステップS12の処理の一部を、32サイトのAu-Cu合金の構造を用いて具体的に示す。図11の[ステップS121の処理]には、1次のクラスターと、2次のクラスターがいくつか図示されている。α=2のクラスターは、最近接の2つのサイトから成る図形である。図12の[ステップS122の処理]では、このα=2のクラスターが合金構造のどこにあるかが一部示されている。図12の[ステップS123の処理]では、[ステップS122の処理]に示したサイトにあるクラスターに対応するイジング型関数の項と係数(すなわちc)が示されている。図13では、[ステップS122の処理]において、α=3のクラスターが合金構造に占める位置の例が図示され、[ステップS123の処理]において、[ステップS122の処理]に示したサイトにあるクラスターに対応するイジング型関数の項と係数(すなわちc)が示されている。図14の[ステップS121の処理]には、3次の(3点から成る)クラスターの例が示されている。図15では、[ステップS122の処理]において、α=M(ここで、Mは正の整数で、図14に示されているクラスターの識別番号である)のクラスターが合金構造に占める位置の例が図示され、[ステップS123の処理]において、[ステップS122の処理]に示したサイトにあるクラスターに対応するイジング型関数の項と係数(すなわちc)が示されている。このようなステップS123の処理によって得られる係数が、第1関係式の係数に用いられる。
 <補足1>
 実施の形態1では、クラスター展開法を用いて表される関数(すなわち第2関係式)がイジングモデル型関数(すなわち第1関係式)に変換され、そのイジングモデル型関数に対してアニーリングマシンが適用される。これまで、クラスター展開法を用いて表される関数に対してアニーリングマシンを適用しようとする動機がなかった背景には、以下の理由がある。
 1つ目の理由は、従来の古典アルゴリズムまたは古典コンピュータを用いた場合、クラスター展開法の関数に対する演算処理の方が、イジングモデル型関数に対する演算処理よりも速いからである。なお、そのクラスター展開法の関数は、有効クラスター相互作用(ECI)と相関関数の積和の形で表される例えば上述の第2関係式である。したがって、その第2関係式をわざわざイジングモデル型関数に変換する必要がないと考えられていた。
 2つ目の理由は、アニーリングマシンによる最適化は、メタヒューリスティックなものであるため、クラスター展開法の関数に対して効率的に良い解が得られるか不明であったからである。
 3つ目の理由は、アニーリングマシンが処理し得るビット数が少なく、原子数の多い集合体にはアニーリングマシンは適さなかったからである。
 これらの理由は、以下のように覆される。
 1つ目の理由については、実施の形態1のように第2関係式をイジングモデル型関数である第1関係式に変換し、その第1関係式にアニーリングマシンを適用すると、そのアニーリングマシンによる演算処理が速いことが明らかになった。つまり、第2関係式を第1関係式に変換する時間と、アニーリングマシンによる演算処理にかかる時間とを含む合計時間が、クラスター展開法の関数に対する古典アルゴリズムによる演算処理にかかる時間よりも短くなることが明らかになった。
 2つ目の理由については、実際の検証によって、アニーリングマシンによる最適化でも、効率的に良い解が得られることが明らかになった。
 3つ目の理由については、近年ではコンピュータ処理技術の進化により、アニーリングマシンが処理し得るビット数が従来よりも多くなってきている。
 したがって、これらの明らかになった事項に基づいて、実施の形態1による大きな効果が得られる。
 <補足2>
 アニーリングマシンによる演算処理は、古典アルゴリズムによる演算処理よりも速い。古典アルゴリズムである数理最適化ソルバーのベンチマーク条件は、以下のとおりである。
・Gurobi Optimizer(登録商標)(GUROBI(登録商標)) ver.9.12(64bit) 
・Windows(登録商標)10
・CPU:Intel(登録商標) Xeon(登録商標) Gold 6140(Skylake コア), memory:64GB
・Thread count:32 threads (36 physical cores, 72 logical processors)
 ビット数n=32およびビット数n=256の場合、古典アルゴリズムによる演算処理の時間は、1秒未満であるところ、アニーリングマシンによる演算処理の時間は、0.5秒以下である。なお、ビット数nは、処理対象の集合体の原子数に相当する。一方、ビット数n=2048の場合、古典アルゴリズムによる演算処理の時間は、50~270分であるところ、アニーリングマシンによる演算処理の時間は、1秒以下である。なお、上述の演算処理の時間の計測に用いられた関数、すなわち、処理対象の集合体に対応する関数は、古典アルゴリズムであっても、アニーリングマシンと同様、イジングモデル型関数である。つまり、古典アルゴリズムおよびアニーリングマシンのそれぞれで、同一のイジングモデル型関数に対する演算処理の時間が計測されている。
 したがって、アニーリングマシンによる演算処理は、処理対象の集合の原子数が多いような大規模問題に対して、古典アルゴリズムによる演算処理よりも優位である。
 また、集合体に含まれる原子種の組成比が固定される場合、かつ、ビット数n=2048の場合、古典アルゴリズムの各組成比に対する処理速度の平均は、3300秒であるところ、アニーリングマシンの各組成比に対する処理速度の平均は、3.9秒である。また、その場合、古典アルゴリズムの歩留は、58.8%であり、アニーリングマシンの歩留は、100%である。つまり、古典アルゴリズムでは、360分の制限時間内で解が求まらない場合があるが、アニーリングマシンでは、360分の制限時間内で全ての組成比に対して解が求まる。
 このように、組成比が固定されている場合であっても、アニーリングマシンによる演算処理は、古典アルゴリズムによる演算処理よりも優位である。
 (実施の形態2)
 実施の形態1における情報処理システム1000は、最適化装置200を計算装置として備えている。本実施の形態における情報処理システムは、サンプリング装置を計算装置として備える。なお、本実施の形態における各構成要素のうち、実施の形態1と同一の構成要素については、実施の形態1と同一の符号を付し、詳細な説明を省略する。
 [全体的なシステム構成]
 図16は、本実施の形態における情報処理システムが備える情報処理装置100およびサンプリング装置の機能構成の一例を示すブロック図である。
 本実施の形態における情報処理システム1001は、情報処理装置100およびサンプリング装置200bを備える。
 本実施の形態における情報処理装置100の取得部101は、所定の分布に関する分布情報をさらに取得する。例えば、取得部101は、入力デバイス11から出力される信号としてその分布情報を取得する。所定の分布の一例は、ボルツマン分布であり、分布情報の一例は、そのボルツマン分布に用いられる温度を示す情報である。なお、所定の分布は、ボルツマン分布に限定されない。分布情報は、所定の分布の種別と、その種別の分布を表現するために用いられるパラメータとを示してもよい。
 第1通信部102は、実施の形態1と同様の機能を有するとともに、取得部101によって取得された分布情報をサンプリング装置200bにさらに送信する。また、第1通信部102は、複数の組み合わせをサンプリング装置200bから受信する。複数の組み合わせのそれぞれは、上述の2以上の変数σ(すなわち上述のσ)の値を含む。つまり、組み合わせは、位置情報によって示される各サイト位置に対応する変数σの値を含み、集合体における各原子の配置または構造を示していると言える。このような組み合わせは、上述の配置の組み合わせであり、以下単に、組み合わせと呼ばれてもよい。あるいは、その組み合わせは、変数σの値の組み合わせとも記述される。
 出力部103は、その複数の組み合わせの各々に対応する、集合体が有する構造を示す構造情報を出力する。つまり、出力部103は、複数の組み合わせのそれぞれについて、その組み合わせに含まれる2以上の変数σの値に基づいて集合体の構造を構築して、その構造を示す構造情報を出力する。
 サンプリング装置200bは、第1関係式に関する情報を受信し、その第1関係式を用いた計算を行う計算装置の一例であって、上述の所定の分布に基づくサンプリングを、第1関係式を用いた計算として実行する。具体的には、サンプリング装置200bは、原子情報および位置情報に基づいて取り得る全ての組み合わせの中から、第1関係式および所定の分布に応じた複数の組み合わせをサンプリングする。言い換えれば、サンプリング装置200bは、原子情報および位置情報に基づいて原子の集合体が取り得る全ての構造から、第1関係式および所定の分布に応じた複数の組み合わせをサンプリングする。
 このようなサンプリング装置200bは、第3制御部210bと、第3通信部202bと、サンプリング部201bとを備える。第3制御部210bは、サンプリング部201bおよび第3通信部202bを制御するとともに、それらの構成要素による処理以外の処理を実行する。
 第3通信部202bは、実施の形態1の第2通信部202と同様の機能を有するとともに、第1通信部102から送信される分布情報を受信する。さらに、第3通信部202bは、サンプリング部201bによって導出された複数の組み合わせを情報処理装置100の第1通信部102に送信する。
 サンプリング部201bは、原子の集合体が有する構造のエネルギーを表す第1関係式を用いた計算を行うことによって、その第1関係式に含まれる2以上の変数σの値を導出する演算部の一例である。このようなサンプリング部201bは、情報処理装置100から第3通信部202bを介して、上述の第1関係式に関する情報と分布情報とを取得し、第1関係式に対して上述のサンプリングを行う。つまり、サンプリング部201bは、第1関係式に対して、分布情報に応じた所定の分布に基づくサンプリングを実行することによって、それぞれ2以上の変数σの値を含む複数の組み合わせを導出する。
 なお、サンプリング装置200bは、最適化装置200と同様、例えばCPUなどのプロセッサと、揮発性のメモリおよび不揮発性のメモリと、不揮発性のメモリに格納されたプログラムとによって構成されていてもよい。この場合、サンプリング装置200bの機能的な構成は、プロセッサが上記プログラムを実行することで実現される。
 [サンプリングの詳細]
 図17は、ボルツマン分布を説明するための図である。なお、図17のグラフは、ボルツマン分布を示し、グラフの縦軸および横軸は、エネルギーεおよびボルツマン分布関数f(ε)をそれぞれ示す。また、ボルツマン分布関数f(ε)は、以下の式(3)によって示される。この式(3)において、エネルギーεは、式(1)および式(2)のエネルギーEに相当する。また、式(3)における、kは、ボルツマン定数であり、Zは、規格化定数であり、Tは、温度を示すパラメータである。
Figure JPOXMLDOC01-appb-M000008
 図17に示すように、ボルツマン分布は、温度Tが高いほど、同じエネルギーεにおけるボルツマン分布関数f(ε)の値が大きい。具体的には、温度T1におけるボルツマン分布関数f(ε)の値よりも、温度T2(>T1)におけるボルツマン分布関数f(ε)の値の方が大きい。
 サンプリング装置200bのサンプリング部201bは、このような分布情報によって示される温度Tに応じたボルツマン分布にしたがって、第1関係式に対してサンプリングを行う。つまり、サンプリング部201bは、エネルギーEごとに、そのエネルギーEに応じた第1関係式(すなわち式(1))を満たす2以上の変数σの値を含む組み合わせを、その温度Tに応じたボルツマン分布関数f(ε=E)にしたがった数だけサンプリングする。その結果、サンプリング部201bによってサンプリングされた複数の組み合わせの分布は、その温度Tに応じたボルツマン分布と等しくなる。
 図18は、サンプリング装置200bおよび情報処理装置100の処理の一例を説明するための図である。
 サンプリング装置200bは、実施の形態1の最適化装置200と同様、情報処理装置100から送信された例えば係数A、B、Cijを受信する。さらに、サンプリング装置200bは、情報処理装置100から送信された分布情報を受信する。このとき、サンプリング装置200bは、それらの係数だけでなく、原子情報および位置情報も情報処理装置100から受信してもよい。そして、サンプリング装置200bは、それらの係数および情報などに基づいて第1関係式を構築する。次に、サンプリング装置200bは、その第1関係式に対して、分布情報によって示される温度に応じたボルツマン分布に基づくサンプリングを行う。これにより、上述の複数の組み合わせがサンプリングされる。このとき、サンプリング装置200bは、実施の形態1の最適化装置200と同様、イジングモデルの演算に特化したコンピュータであるアニーリングマシンを用いて、上述のサンプリングを行う。また、そのサンプリングには、メトロポリス・ヘイスティングス法が用いられてもよい。そして、サンプリング装置200bは、そのサンプリングされた複数の組み合わせを情報処理装置100に送信する。
 情報処理装置100は、サンプリング装置200bから送信された組み合わせごとに、その組み合わせに基づいて、原子の集合体の構造(例えば結晶構造)を構築する。すなわち、情報処理装置100は、集合体の位置iに、変数σiの値に対応する種類の原子を配置することによって、その集合体の構造を構築する。例えば、σi=‐1(i=0~7、16~23)及びσi=+1(i=8~15、24~31)である場合の、その構造の構築では、AuまたはCuの原子が各位置に配置される。そして、情報処理装置100は、組み合わせごとに構築された集合体の構造を示す構造情報を出力する。これらの構造情報の出力によって、例えば、集合体の複数の構造が表示デバイス12に表示される。
 [全体的な処理フロー]
 図19は、情報処理システム1001による処理動作の一例を示すフローチャートである。
 (ステップS10~S12)
 情報処理装置100は、図6に示すフローチャートと同様、ステップS10~S12の処理を実行する。
 (ステップS13a)
 サンプリング装置200bのサンプリング部201bは、第1関係式に対して、例えばボルツマン分布などの所定の分布に基づくサンプリングを行うことによって、複数の組み合わせを導出する。それらの組み合わせは、2以上の変数σの値を含む。
 (ステップS14a)
 情報処理装置100の出力部103は、導出された組み合わせごとに、その組み合わせに含まれる2以上の変数σの値に基づいて集合体の構造を構築して、その構造を示す構造情報を出力する。例えば、サンプリング装置200bの第3制御部210bは、その導出された複数の組み合わせを第3通信部202bから情報処理装置100へ送信させる。出力部103は、そのサンプリング装置200bから送信されて第1通信部102によって受信された複数の組み合わせのそれぞれについて、その組み合わせを用いて集合体の構造を構築する。
 [サンプリングの応用]
 図20は、第1制御部110の付加的な処理動作の一例を示す図である。
 第1制御部110は、出力部103によって構築された集合体の複数の構造を用いて、その集合体の物性の予測値を導出してもよい。例えば、図20に示すように、温度T1のボルツマン分布に基づいて、集合体の複数の構造が構築される。第1制御部110は、その複数の構造に対して、第一原理計算などを行うことによって、それらの構造が有する物性値A1~Anを算出する。例えば、物性値A1~Anは、誘電率などである。そして、第1制御部110は、それらの物性値A1~Anの平均値Aを算出する。これにより、温度T1におけるその集合体の物性値の予測値が導出される。
 このように、本実施の形態では、集合体内における2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数σを含む第1関係式に対する、所定の分布に基づくサンプリングによって、複数の組み合わせが導出される。なお、サンプリングは、探索とも言える。また、第1関係式は、イジングモデル型関数であるとも言える。したがって、このような第1関係式を用いることによって、そのサンプリングにアニーリングマシンを適用することができ、従来のクラスター展開法およびモンテカルロ法を用いる手法と比べて、そのサンプリングにかかる計算コストを低く抑えることができる。また、複数の組み合わせのそれぞれに含まれる2以上の変数の値は、集合体内における2以上の位置に一対一に対応しているため、それらの2以上の変数の値が導出されれば、集合体の構造を容易に構築することができる。その結果、原子の集合体の構造のサンプリングまたは探索にかかる処理の効率化を図ることができる。
 (実施の形態3)
 本実施の形態における情報処理システムは、実施の形態1の最適化装置200と、実施の形態2のサンプリング装置200bとを備える。そして、本実施の形態におけるサンプリング装置200bは、最適化装置200によるエネルギー最適化によって導出される2以上の変数σの値を、所定の分布に基づくサンプリングに用いる。なお、本実施の形態における各構成要素のうち、実施の形態1または2と同一の構成要素については、実施の形態1または2と同一の符号を付し、詳細な説明を省略する。
 [全体的なシステム構成と処理フロー]
 図21は、本実施の形態における情報処理システムが備える情報処理装置100および計算装置の機能構成の一例を示すブロック図である。
 本実施の形態における情報処理システム1002は、情報処理装置100および計算装置200aを備える。計算装置200aは、最適化装置200と、サンプリング装置200bとを備える。つまり、計算装置200aは、第1関係式の最適解を求めるための探索を、その第1関係式を用いた計算として行う最適化装置200と、所定の分布に基づくサンプリングを、その第1関係式を用いた計算として実行するサンプリング装置200bとを備える。
 図22は、本実施の形態における情報処理システム1002による処理動作の一例を示すフローチャートである。
 (ステップS31)
 まず、情報処理システム1002は、第1関係式のエネルギー最適化を実行する。つまり、情報処理システム1002は、情報処理装置100および最適化装置200による実施の形態1と同様の処理を行うことによって、第1関係式によって表されるエネルギーが例えば最小となる2以上の変数σの値を導出する。このような2以上の変数σの値は、最適化装置200の最適化部201によって導出され、第2通信部202から、情報処理装置100の第1通信部102を介して、サンプリング装置200bの第3通信部202bに送信される。
 (ステップS32)
 次に、情報処理システム1002は、第1関係式に対して、分布情報に応じた所定の分布に基づくサンプリングを実行する。このとき、情報処理装置100の取得部101は、例えばボルツマン分布の温度Tを示す分布情報を取得し、第1通信部102は、その分布情報をサンプリング装置200bの第3通信部202bに送信する。その結果、サンプリング装置200bの第3通信部202bは、その分布情報と、ステップS31で最適化装置200の第2通信部202から送信された2以上の変数σの値とを受信する。サンプリング装置200bのサンプリング部201bは、第3通信部202bによって受信された分布情報と、2以上の変数σの値とをそのサンプリングに用いる。これにより、分布情報に応じた例えばボルツマン分布にしたがった変数σの値の複数の組み合わせが導出される。このように導出された複数の組み合わせは、サンプリング装置200bのサンプリング部201bによって導出され、第3通信部202bから、情報処理装置100の第1通信部102に送信される。
 (ステップS33)
 次に、情報処理システム1002は、ステップS32で導出された複数の組み合わせのそれぞれに対応する集合体の構造を出力する。つまり、情報処理装置100の出力部103が、第1通信部102によって受信された複数の組み合わせのそれぞれについて、その組み合わせに含まれる2以上の変数σの値に基づいて集合体の構造を構築して、その構造を示す構造情報を出力する。
 [サンプリング装置200b]
 本実施の形態におけるサンプリング装置200bは、情報処理装置100を介して最適化装置200から、その最適化装置200によるエネルギー最適化によって導出された2以上の変数σの値を取得する。そして、サンプリング装置200bは、その2以上の変数σの値を用いて、所定の分布に基づくサンプリングを行う。
 具体的には、サンプリング装置200bの第3通信部202bは、最適化装置200の第2通信部202から、情報処理装置100の第1通信部102を介して2以上の変数σの値を取得する。サンプリング部201bは、第3通信部202bによって取得された2以上の変数σの値を用いて、所定の分布に基づくサンプリングを行う。これにより、複数の組み合わせが導出される。つまり、サンプリング部201bは、エネルギー最適化によって導出された2以上の変数σの値を、サンプリングによって導出される複数の組み合わせの初期値として用いる。そして、サンプリング部201bは、その2以上の変数σの初期値の近傍からサンプリングを開始する。
 これにより、2以上の変数σのランダムな値からサンプリングが開始される場合よりも、所定の分布に基づくサンプリングの処理速度の向上と、計算負荷の軽減とを実現できる可能性を高めることができる。
 例えば、低温のボルツマン分布に基づくサンプリングが行われる場合、ランダムな値からサンプリングが開始されると、多くの計算処理が必要となり、処理速度が遅くなる可能性がある。これは、低温のボルツマン分布では、低いエネルギーの構造を有する集合体が多く存在するにも関わらず、先に、高いエネルギーの構造を有する集合体に対するサンプリングが開始されると、そのサンプリングの計算処理に負担がかかってしまうからである。つまり、低いエネルギーの構造を有する集合体に対するサンプリングが行われるまでに時間がかかってしまうからである。
 そこで、本実施の形態における情報処理システム1002は、上述のように、サンプリングの前に、第1関数のエネルギー最適化を行い、低いエネルギーの構造(例えば、各サイト位置に配置される原子の種類などの状態)を示す2以上の変数σの値を導出する。そして、サンプリング装置200bは、その導出された2以上の変数σの値を初期値として用いて、その初期値の近傍からサンプリングを開始する。これにより、低いエネルギーの構造を有する集合体に対するサンプリングを効率的に行うことができ、サンプリングの処理速度の向上と、計算負荷の軽減とを図る可能性を高めることができる。
 なお、サンプリング装置200bのサンプリング部201bは、上述の古典アルゴリズムを用いてサンプリングを行ってもよい。
 第3通信部202bは、実施の形態2と同様、サンプリング部201bによるサンプリングによって導出された複数の組み合わせを情報処理装置100の第1通信部102に出力する。
 [情報処理装置100]
 また、本実施の形態における情報処理装置100は、サンプリング装置200bに上述の処理を実行させるために、まず、実施の形態1と同様の処理を行う。つまり、情報処理装置100は、実施の形態1のように、最適化装置200に対して、第1関係式の最適解を求めるための探索、すなわち第1関係式のエネルギー最適化を実行させる。そして、情報処理装置100は、そのエネルギー最適化によって導出された2以上の変数σの初期値を、サンプリング装置200bに送信することによって、その2以上の変数σの初期値を用いた所定の分布に基づくサンプリングをサンプリング装置200bに実行させる。
 すなわち、本実施の形態における情報処理装置100の取得部101は、実施の形態2と同様、所定の分布に関する分布情報を取得する。第1通信部102は、第1関係式に関する情報を、最適化装置200およびサンプリング装置200bのそれぞれに送信する。さらに、第1通信部102は、第1関係式の最適解を求めるための探索を行うことによって導出される2以上の変数σの初期値を最適化装置200から受信する。そして、第1通信部102は、2以上の変数σの初期値および分布情報をサンプリング装置200bに送信する。その結果、第1通信部102は、第1関係式に対して、2以上の変数σの初期値と、分布情報に応じた所定の分布とに基づくサンプリングを実行することによって導出される、それぞれ2以上の変数σの値を含む複数の組み合わせを、サンプリング装置200bから受信する。出力部103は、その複数の組み合わせの各々に対応する、集合体が有する構造を示す構造情報を出力する。
 これにより、第1関係式の最適解を求めるための探索によって導出される2以上の変数σの値が初期値として、所定の分布に基づくサンプリングに用いられるため、そのサンプリングの処理速度の向上と、計算負荷の軽減とを図る可能性を高めることができる。
 (実施の形態3の変形例1)
 上述の例では、先に、第1関係式のエネルギー最適化が行われ、その後、所定の分布に基づくサンプリングが行われる。本変形例では、その上述の例とは逆に、先に、所定の分布に基づくサンプリングが行われ、その後、第1関係式のエネルギー最適化が行われる。なお、本変形例における情報処理システム1002は、図21に示す構成を有する。
 [全体的な処理フロー]
 図23は、本変形例における情報処理システム1002による処理動作の一例を示すフローチャートである。
 (ステップS41)
 まず、情報処理システム1002は、第1関係式に対して、分布情報に応じた所定の分布に基づくサンプリングを実行する。つまり、情報処理システム1002は、情報処理装置100およびサンプリング装置200bによる実施の形態2と同様の処理を行うことによって、変数σの値の複数の組み合わせを導出する。具体的には、情報処理装置100の取得部101は、例えばボルツマン分布の温度Tを示す分布情報を取得し、第1通信部102は、その分布情報をサンプリング装置200bの第3通信部202bに送信する。サンプリング装置200bのサンプリング部201bは、第3通信部202bによって受信された分布情報をそのサンプリングに用いる。これにより、分布情報に応じた例えばボルツマン分布にしたがった変数σの値の複数の組み合わせが導出される。このように導出された複数の組み合わせは、サンプリング装置200bのサンプリング部201bによって導出され、第3通信部202bから、情報処理装置100の第1通信部102を介して、最適化装置200の第2通信部202に送信される。
 (ステップS42)
 次に、情報処理システム1002は、第1関係式のエネルギー最適化を実行する。このとき、最適化装置200の最適化部201は、第2通信部202によって受信された複数の組み合わせを、第1関係式のエネルギー最適化に用いる。これにより、第1関係式によって表されるエネルギーが例えば最小となる2以上の変数σの値が導出される。このような2以上の変数σの値は、第2通信部202から、情報処理装置100の第1通信部102に送信される。
 (ステップS43)
 次に、情報処理システム1002は、ステップS42で導出された2以上の変数σの値に対応する集合体の構造を出力する。つまり、情報処理装置100の出力部103が、第1通信部102によって受信された2以上の変数σの値に基づいて集合体の構造を構築して、その構造を示す構造情報を出力する。
 [最適化装置200]
 本実施の形態における最適化装置200は、情報処理装置100を介してサンプリング装置200bから、そのサンプリング装置200bによってサンプリングされた複数の組み合わせを取得する。そして、最適化装置200は、その複数の組み合わせを用いて第1関係式のエネルギー最適化を行う。
 具体的には、最適化装置200の第2通信部202は、サンプリング装置200bの第3通信部202bから、情報処理装置100の第1通信部102を介して複数の組み合わせを取得する。最適化部201は、第2通信部202によって取得された複数の組み合わせを用いて、第1関係式のエネルギー最適化、つまり、第1関係式の最適解を求めるための探索を行う。これにより、第1関係式に含まれる2以上の変数σの値が導出される。つまり、最適化部201は、サンプリングされた複数の組み合わせのそれぞれに含まれる2以上の変数σの値を、エネルギー最適化によって得られる2以上の変数σの値の初期値として用いる。そして、最適化部201は、複数の組み合わせのそれぞれについて、その組み合わせに含まれる2以上の変数σの初期値から、第1関係式の最適解を求めるための探索を開始する。
 これにより、2以上の変数σのランダムな値から探索(すなわちエネルギー最適化)が開始される場合よりも、最適解に辿り着くまでの時間の短縮化を図る可能性を高めることができる。また、エネルギーがより低い集合体の構造を最適解として求めることができる可能性を高めることができる。例えば、上述のランダムな値からの探索では、局所解に陥る可能性があり、局所解から抜け出すために時間を要する。しかし、本変形例では、サンプリングされた複数の組み合わせのそれぞれから探索が開始されるため、局所解に陥る可能性を低減することができる。
 第2通信部202は、最適化部201による探索によって導出された2以上の変数σの値を情報処理装置100の第1通信部102に出力する。
 [情報処理装置100]
 また、本実施の形態における情報処理装置100は、最適化装置200に上述の処理を実行させるために、まず、実施の形態2と同様の処理を行う。つまり、情報処理装置100は、実施の形態2のように、サンプリング装置200bに対して、第1関係式に対して所定の分布に基づくサンプリングを実行させる。そして、情報処理装置100は、そのサンプリングによって導出された複数の組み合わせを、最適化装置200に送信することによって、その複数の組み合わせを用いた第1関係式のエネルギー最適化を最適化装置200に実行させる。
 すなわち、本実施の形態における情報処理装置100の取得部101は、実施の形態2と同様、所定の分布に関する分布情報を取得する。第1通信部102は、第1関係式に関する情報を、最適化装置200およびサンプリング装置200bのそれぞれに送信する。さらに、第1通信部102は、分布情報をサンプリング装置200bに送信する。その結果、第1通信部102は、第1関係式に対して、その分布情報に応じた所定の分布に基づくサンプリングを実行することによって導出される、それぞれ2以上の変数σの初期値を含む複数の組み合わせをサンプリング装置200bから受信する。第1通信部102は、その複数の組み合わせを最適化装置200に送信する。その結果、第1通信部102は、複数の組み合わせを用いて第1関係式の最適解を求めるための探索を行うことによって導出される2以上の変数σの値を最適化装置200から受信する。
 これにより、最適解に辿り着くまでの時間の短縮化を図る可能性を高めることができ、エネルギーがより低い集合体の構造を最適解として求めることができる可能性を高めることができる。
 (実施の形態3の変形例2)
 上記実施の形態3と変形例1とを組み合わせてもよい。例えば、第1関係式のエネルギー最適化が行われ、その後、所定の分布に基づくサンプリングが行われ、さらにその後、再び第1関係式のエネルギー最適化が行われる。あるいは、所定の分布に基づくサンプリングが行われ、その後、第1関係式のエネルギー最適化が行われ、さらにその後、再び所定の分布に基づくサンプリングが行われる。つまり、エネルギー最適化とサンプリングとが交互に繰り返し実行される。この場合、エネルギー最適化およびサンプリングのうちの一方の処理が行われるときには、直前に実施された他方の処理の結果が用いられる。これにより、エネルギー最適化およびサンプリングをより高速に実行することができる可能性がある。
 <その他の態様>
 以上、本開示に係る情報処理システムについて、上記各実施の形態および変形例に基づいて説明したが、本開示は、これらの実施の形態および変形例に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を上記各実施の形態および変形例に施したものなども、本開示の範囲内に含まれてもよい。また、複数の互いに異なる実施の形態における構成要素を組み合わせて構築される形態も本開示に含まれてもよい。また、何れかの実施の形態と何れかの変形例のそれぞれの構成要素を組み合わせて構築される形態も本開示に含まれてもよい。さらに、複数の互いに異なる変形例における構成要素を組み合わせて構築される形態も本開示に含まれてもよい。
 例えば、上記実施の形態1では、情報処理装置100は、エネルギー最適化を行わず、そのエネルギー最適化は最適化装置200の最適化部201によって行われる。しかし、情報処理装置100は、最適化部201を備え、そのエネルギー最適化を行ってもよい。同様に、情報処理装置100は、サンプリング部201bを備え、サンプリングを行ってもよい。
 また、上記各実施の形態および変形例では、集合体である結晶がAuとCuの2種類の原子を有する例を挙げて説明したが、その集合体が有する原子の種類はそれらに限定されるものではなく、どのような種類であってもよい。また、集合体に含まれる原子の種類の数も、2種類に限定されるものではなく、3種類以上であってもよい。
 また、上記各実施の形態および変形例では、原子の状態として、原子の種類が用いられているが、その原子の状態は、原子の種類に限定されるものではない。つまり、原子の状態は、原子の種類、原子の電子スピン状態、原子の核スピン状態、および原子が欠損している原子空孔の少なくとも1つを含んでいてもよい。この場合には、安定な原子の集合体に含まれる原子の種類、原子の電子スピン状態、原子の核スピン状態、および原子空孔の少なくとも1つの探索にかかる処理の効率化を図ることができる。なお、原子の状態は、3つ以上であってもよい。この場合、変数は、原子の状態に一対一に対応させることによって、3つ以上の値を選ぶ。
 また、上記実施の形態1では、1つの情報処理装置100が、図6に示すステップS10~S12、およびS14の全ての処理を実行する。しかし、情報処理装置100は、複数の装置を備えて、その複数の装置のそれぞれがステップS10~S12、およびS14の何れかの処理を実行してもよい。言い換えれば、情報処理システム1000は、複数の情報処理装置を備え、その複数の情報処理装置のそれぞれが、情報処理装置100の一部の処理を実行してもよい。例えば、情報処理システム1000は、互いに異なる第1情報処理装置および第2情報処理装置を備える。第1情報処理装置は、第1関係式を取得し、その第1関係式に関する情報を最適化装置200に送信する。第2情報処理装置は、最適化装置200によって導出された2以上の変数の値を受信し、その2以上の変数の値に対応する、集合体が有する構造を示す構造情報を出力する。同様に、実施の形態2、実施の形態3、実施の形態3の変形例1および変形例2のそれぞれにおいても、情報処理装置100は、複数の情報処理装置から構成されていてもよい。
 また、上記実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。ここで、上記実施の形態の情報処理装置100、最適化装置200、サンプリング装置200bなどを実現するプログラムは、例えば、図6、図7、図10、図19、図22、または図23に含まれる各ステップをプロセッサに実行させてもよい。
 (ハードウェア構成)
 情報処理装置100、最適化装置200およびサンプリング装置200bのそれぞれは、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクドライブ、ディスプレイユニット、キーボード、およびマウスなどから構成されるコンピュータシステムにより構成されても良い。RAMまたはハードディスクドライブには、プログラムが記憶されている。マイクロプロセッサが、プログラムに従って動作することにより、情報処理装置100、最適化装置200およびサンプリング装置200bのそれぞれは、その機能を達成する。ここでプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
 さらに、情報処理装置100、最適化装置200およびサンプリング装置200bのそれぞれを構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されても良い。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM(Read Only Memory)、RAM(Random Access Memory)などを含んで構成されるコンピュータシステムである。RAMには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、システムLSIは、その機能を達成する。
 さらにまた、情報処理装置100、最適化装置200およびサンプリング装置200bのそれぞれを構成する構成要素の一部または全部は、コンピュータに脱着可能なICカードまたは単体のモジュールから構成されてもよい。ICカードまたはモジュールは、マイクロプロセッサ、ROM、およびRAMなどから構成されるコンピュータシステムである。ICカードまたはモジュールは、上記の超多機能LSIを含んでもよい。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、ICカードまたはモジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有してもよい。
 また、本開示は、上記の情報処理装置100、最適化装置200およびサンプリング装置200bのそれぞれにより実行される方法であるとしてもよい。また、この方法は、コンピュータがプログラムを実行することで実現されてもよいし、プログラムからなるデジタル信号で実現されてもよい。
 さらに、本開示は、プログラムまたはデジタル信号をコンピュータ読み取り可能な非一時的な記録媒体で構成されてもよい。記録媒体としては、例えば、フレキシブルディスク、ハードディスク、CD-ROM、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(登録商標) Disc)、半導体メモリなどである。また、プログラムは、非一時的な記録媒体に記録されている上記デジタル信号で構成されてもよい。
 また、本開示は、上記プログラムまたはデジタル信号を、電気通信回線、無線若しくは有線通信回線、インターネットを代表とするネットワーク、またはデータ放送などを経由して伝送することで構成されてもよい。
 また、本開示は、マイクロプロセッサとメモリとを備えたコンピュータシステムであって、上記メモリは、プログラムを記憶しており、マイクロプロセッサは、そのプログラムに従って動作するとしてもよい。
 また、プログラムもしくはデジタル信号を上記非一時的な記録媒体に記録して移送することにより、または、プログラムもしくはデジタル信号を、上記ネットワークなどを経由して移送することにより、独立した他のコンピュータシステムにより実施されてもよい。
 (その他1)
 「A、B、及びCの少なくとも1つ」は「(A)、(B)、(C)、(AとB)、(AとC)、(BとC)、または、(AとBとC)」を意味してしてもよい。
 本開示は、原子の集合体の安定な構造の探索にかかる処理の効率化を図ることができるという効果を奏し、材料開発のための装置およびシステムなどに有用である。
11  入力デバイス
12  表示デバイス
100  情報処理装置
101  取得部
102  第1通信部
103  出力部
110  第1制御部
200  最適化装置(計算装置)
200a  計算装置
200b  サンプリング装置(計算装置)
201  最適化部(演算部)
201b  サンプリング部(演算部)
202  第2通信部
202b  第3通信部
210  第2制御部
210b  第3制御部
1000、1001、1002  情報処理システム

Claims (22)

  1.  原子の集合体が有する構造のエネルギーを表す関係式に関する情報を送信する情報処理装置と、
     前記関係式に関する情報を受信し、前記関係式を用いた計算を行う計算装置とを備え、
     前記原子の集合体は、2以上の原子の状態を含み、
     前記関係式は、
     (a)前記集合体に含まれる前記2以上の原子の状態に関する原子情報と、(b)前記集合体内における前記2以上の原子の状態のうちの何れかがそれぞれ配置され得る2以上の位置に関する位置情報とに基づいて取得された関係式であって、前記2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数を含み、
     前記情報処理装置は、
     前記関係式に関する情報を前記計算装置に送信し、前記関係式を用いた計算を行うことによって導出される前記2以上の変数の値を前記計算装置から受信する通信部と、
     前記2以上の変数の値に対応する、前記集合体が有する構造を示す構造情報を出力する出力部とを備える、
     情報処理システム。
  2.  (a)原子の集合体に含まれる2以上の原子の状態に関する原子情報と、(b)前記集合体内における前記2以上の原子の状態のうちの何れかがそれぞれ配置され得る2以上の位置に関する位置情報とに基づいて、前記集合体が有する構造のエネルギーを表す関係式として、前記2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数を含む第1関係式を取得する取得部と、
     前記第1関係式に関する情報を、前記第1関係式を用いた計算を行う計算装置に送信し、前記第1関係式を用いた計算を行うことによって導出される前記2以上の変数の値を前記計算装置から受信する通信部と、
     前記2以上の変数の値に対応する、前記集合体が有する構造を示す構造情報を出力する出力部とを備える
     情報処理装置。
  3.  前記計算装置は、
     前記第1関係式の最適解を求めるための探索を、前記第1関係式を用いた計算として行う最適化装置である、
     請求項2に記載の情報処理装置。
  4.  前記原子の状態は、前記原子の種類、前記原子のスピン状態、及び前記原子が欠損している原子空孔の少なくとも1つを含む、
     請求項2に記載の情報処理装置。
  5.  前記第1関係式は、
    Figure JPOXMLDOC01-appb-M000001
    によって表され、
     前記式(1)において、
     Eは、前記集合体が有する構造のエネルギーを示し、
     iおよびjのそれぞれは、前記集合体内における前記位置を示し、
     σは、前記集合体内の位置iにおける前記変数であり、
     σは、前記集合体内の位置jにおける前記変数であり、
     Aは、0次のクラスターの相互作用係数であり、
     Bは、1次のクラスターの相互作用係数であり、
     Cijは、2次のクラスターの相互作用係数である、
     請求項2に記載の情報処理装置。
  6.  前記第1関係式は、第1係数とn個(nは2以上の整数)の項との和によって前記エネルギーを表し、
     前記n個の項のうちのk番目(kは1以上n以下の整数)の項は、前記2以上の変数から取り得る数の組のそれぞれに対応する積の和であって、前記組は、k個の変数からなり、前記積は、前記組に含まれるk個の変数と、前記組に対応する第2係数との積である、
     請求項2に記載の情報処理装置。
  7.  前記取得部は、
     前記原子情報および前記位置情報に基づいてクラスター展開法を用いて表される第2関係式を、イジングモデルに変換することによって前記第1関係式を取得する、
     請求項2に記載の情報処理装置。
  8.  前記第2関係式は、
    Figure JPOXMLDOC01-appb-M000002
    によって表され、
     前記式(2)において、
     Eは、前記集合体が有する構造のエネルギーを示し、
     αは、クラスターの識別子であり、
     Vαは、前記エネルギーに対するクラスターαの寄与の大きさを示す係数であり、
     φαは、クラスターαの相関関数である、
     請求項7に記載の情報処理装置。
  9.  前記計算装置は、
     所定の分布に基づくサンプリングを、前記第1関係式を用いた計算として実行するサンプリング装置であり、
     前記取得部は、さらに、
     前記所定の分布に関する分布情報を取得し、
     前記通信部は、さらに、
     前記分布情報を前記サンプリング装置に送信し、
     前記2以上の変数の値の受信では、
     前記第1関係式に対して、前記分布情報に応じた前記所定の分布に基づくサンプリングを実行することによって導出される、それぞれ前記2以上の変数の値を含む複数の組み合わせを前記サンプリング装置から受信し、
     前記出力部は、
     前記複数の組み合わせの各々に対応する、前記集合体が有する構造を示す構造情報を出力する、
     請求項2に記載の情報処理装置。
  10.  前記計算装置は、
     前記第1関係式の最適解を求めるための探索を、前記第1関係式を用いた計算として行う最適化装置と、所定の分布に基づくサンプリングを、前記第1関係式を用いた計算として実行するサンプリング装置とを備え、
     前記取得部は、さらに、
     前記所定の分布に関する分布情報を取得し、
     前記通信部は、
     前記第1関係式に関する情報の送信では、
     前記第1関係式に関する情報を、前記最適化装置および前記サンプリング装置のそれぞれに送信し、
     さらに、
     前記第1関係式の最適解を求めるための探索を行うことによって導出される前記2以上の変数の初期値を前記最適化装置から受信し、
     前記2以上の変数の初期値および前記分布情報を前記サンプリング装置に送信し、
     前記2以上の変数の値の受信では、
     前記第1関係式に対して、前記2以上の変数の初期値と、前記分布情報に応じた前記所定の分布とに基づくサンプリングを実行することによって導出される、それぞれ前記2以上の変数の値を含む複数の組み合わせを前記サンプリング装置から受信し、
     前記出力部は、
     前記複数の組み合わせの各々に対応する、前記集合体が有する構造を示す構造情報を出力する、
     請求項2に記載の情報処理装置。
  11.  前記計算装置は、
     前記第1関係式の最適解を求めるための探索を、前記第1関係式を用いた計算として行う最適化装置と、所定の分布に基づくサンプリングを、前記第1関係式を用いた計算として実行するサンプリング装置とを備え、
     前記取得部は、さらに、
     前記所定の分布に関する分布情報を取得し、
     前記通信部は、
     前記第1関係式に関する情報の送信では、
     前記第1関係式に関する情報を、前記最適化装置および前記サンプリング装置のそれぞれに送信し、
     さらに、
     前記分布情報を前記サンプリング装置に送信し、
     前記第1関係式に対して、前記分布情報に応じた前記所定の分布に基づくサンプリングを実行することによって導出される、それぞれ前記2以上の変数の初期値を含む複数の組み合わせを前記サンプリング装置から受信し、
     前記複数の組み合わせを前記最適化装置に送信し、
     前記2以上の変数の値の受信では、
     前記複数の組み合わせを用いて前記第1関係式の最適解を求めるための探索を行うことによって導出される前記2以上の変数の値を前記最適化装置から受信する、
     請求項2に記載の情報処理装置。
  12.  原子の集合体が有する構造のエネルギーを表す関係式を用いた計算を行うことによって、前記関係式に含まれる2以上の変数の値を導出する演算部と、
     前記演算部によって導出された前記2以上の変数の値を出力する出力部とを備え、
     前記関係式は、
     (a)前記集合体に含まれる2以上の原子の状態に関する原子情報と、(b)前記集合体内における前記2以上の原子の状態のうちの何れかがそれぞれ配置され得る2以上の位置に関する位置情報とに基づいて取得された関係式であって、前記2以上の位置のそれぞれに配置される原子の状態を示す前記2以上の変数を含む、
     計算装置。
  13.  前記演算部は、
     前記関係式の最適解を求めるための探索を、前記関係式を用いた計算として行う、
     請求項12に記載の計算装置。
  14.  前記演算部は、
     前記関係式に対する所定の分布に基づくサンプリングを、前記関係式を用いた計算として実行することによって、複数の組み合わせを導出し、
     前記出力部は、
     前記複数の組み合わせを出力し、
     前記複数の組み合わせのそれぞれは、前記関係式に含まれる2以上の変数の値を含む、
     請求項12に記載の計算装置。
  15.  (a)原子の集合体に含まれる2以上の原子の状態に関する原子情報と、(b)前記集合体内における前記2以上の原子の状態のうちの何れかがそれぞれ配置され得る2以上の位置に関する位置情報とに基づいて、前記集合体が有する構造のエネルギーを表す関係式として、前記2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数を含む関係式を取得する第1ステップと、
     前記関係式に関する情報を、前記関係式を用いた計算を行う計算装置に送信する第2ステップと、
     前記関係式を用いた計算を行うことによって導出される前記2以上の変数の値を前記計算装置から受信する第3ステップと、
     前記2以上の変数の値に対応する、前記集合体が有する構造を示す構造情報を出力する第4ステップとを、コンピュータが行う、
     情報処理方法。
  16.  (a)原子の集合体に含まれる2以上の原子の状態に関する原子情報と、(b)前記集合体内における前記2以上の原子の状態のうちの何れかがそれぞれ配置され得る2以上の位置に関する位置情報とに基づいて、前記集合体が有する構造のエネルギーを表す関係式として、前記2以上の位置のそれぞれに配置される原子の状態を示す2以上の変数を含む関係式を取得する第1ステップと、
     前記関係式に関する情報を、前記関係式を用いた計算を行う計算装置に送信する第2ステップとを、コンピュータが行い、
     前記計算装置は、請求項12に記載の計算装置である、
     情報処理方法。
  17.  請求項12に記載の計算装置によって導出された前記2以上の変数の値を受信する第1ステップと、
     前記2以上の変数の値に対応する、前記集合体が有する構造を示す構造情報を出力する第2ステップとを、コンピュータが行う、
     情報処理方法。
  18.  原子の集合体が有する構造のエネルギーを表す関係式を用いた計算を行うことによって、前記関係式に含まれる2以上の変数の値を導出する第1ステップと、
     導出された前記2以上の変数の値を出力する第2ステップとを、コンピュータが行い、
     前記関係式は、
    (a)前記集合体に含まれる2以上の原子の状態に関する原子情報と、(b)前記集合体内における前記2以上の原子の状態のうちの何れかがそれぞれ配置され得る2以上の位置に関する位置情報とに基づいて取得された関係式であって、前記2以上の位置のそれぞれに配置される原子の状態を示す前記2以上の変数を含む、
     計算方法。
  19.  前記第1ステップでは、
     前記関係式の最適解を求めるための探索を、前記関係式を用いた計算として行う、
     請求項18に記載の計算方法。
  20.  前記第1ステップでは、
     前記関係式に対する所定の分布に基づくサンプリングを、前記関係式を用いた計算として実行することによって、複数の組み合わせを導出し、
     前記第2ステップでは、
     前記複数の組み合わせを出力し、
     前記複数の組み合わせのそれぞれは、前記関係式に含まれる2以上の変数の値を含む、
     請求項18に記載の計算方法。
  21.  前記第1ステップでは、
     前記関係式の最適解を求めるための探索を、前記関係式を用いた計算として行うことによって、前記関係式に含まれる前記2以上の変数の初期値を導出し、前記関係式に対する所定の分布に基づくサンプリングを、導出された2以上の変数の初期値を用いた計算として実行することによって、複数の組み合わせを導出し、
     前記第2ステップでは、
     前記複数の組み合わせを出力し、
     前記複数の組み合わせのそれぞれは、前記関係式に含まれる2以上の変数の値を含む、
     請求項18に記載の計算方法。
  22.  前記第1ステップでは、
     前記関係式に対する所定の分布に基づくサンプリングを、前記関係式を用いた計算として実行することによって、それぞれ2以上の変数の初期値を含む複数の組み合わせを導出し、前記第1関係式の最適解を求めるための探索を、導出された前記複数の組み合わせを用いた計算として実行することによって、前記関係式に含まれる2以上の変数の値を導出する、
     請求項18に記載の計算方法。
PCT/JP2023/006506 2022-03-18 2023-02-22 情報処理システム、情報処理装置、計算装置、情報処理方法、および計算方法 WO2023176350A1 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2022-043568 2022-03-18
JP2022043568 2022-03-18
JP2023-008912 2023-01-24
JP2023008912 2023-01-24

Publications (1)

Publication Number Publication Date
WO2023176350A1 true WO2023176350A1 (ja) 2023-09-21

Family

ID=88023427

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/006506 WO2023176350A1 (ja) 2022-03-18 2023-02-22 情報処理システム、情報処理装置、計算装置、情報処理方法、および計算方法

Country Status (1)

Country Link
WO (1) WO2023176350A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021032617A (ja) * 2019-08-20 2021-03-01 国立大学法人山形大学 結晶構造算出方法、結晶構造算出プログラムおよび結晶構造算出装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021032617A (ja) * 2019-08-20 2021-03-01 国立大学法人山形大学 結晶構造算出方法、結晶構造算出プログラムおよび結晶構造算出装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
OGANOV ARTEM R, GLASS COLIN W: "Crystal structure prediction using evolutionary algorithms: principles and applications", ARXIV.ORG, 1 January 2006 (2006-01-01), pages 1 - 40, XP093092560 *

Similar Documents

Publication Publication Date Title
Ma et al. Protein contact prediction by integrating joint evolutionary coupling analysis and supervised learning
Hur et al. A global approach to analysis and interpretation of metabolic data for plant natural product discovery
Liu et al. CUSHAW3: sensitive and accurate base-space and color-space short-read alignment with hybrid seeding
Finnegan et al. Maximum entropy methods for extracting the learned features of deep neural networks
Chen et al. Diagnosis of patients with chronic kidney disease by using two fuzzy classifiers
Paulson et al. Bayesian strategies for uncertainty quantification of the thermodynamic properties of materials
JP6286111B2 (ja) データ解析装置、方法及びプログラム
CN107729555B (zh) 一种海量大数据分布式预测方法及系统
Debik et al. Multivariate analysis of NMR‐based metabolomic data
Brinkman Improving the rigor and reproducibility of flow cytometry-based clinical research and trials through automated data analysis
Woelders et al. Systems biology in animal sciences
van Loon et al. Stacked penalized logistic regression for selecting views in multi-view learning
Shu et al. Bootstrapping in-situ workflow auto-tuning via combining performance models of component applications
Chan et al. Learning from imbalanced COVID-19 chest X-ray (CXR) medical imaging data
WO2023176350A1 (ja) 情報処理システム、情報処理装置、計算装置、情報処理方法、および計算方法
CN102918522A (zh) 用于生成统计研究信息的系统、方法以及逻辑
Rahim et al. Cross-Validation and Validation Set Methods for Choosing K in KNN Algorithm for Healthcare Case Study
US20130245959A1 (en) Computer-Implementable Algorithm for Biomarker Discovery Using Bipartite Networks
Tyagi et al. Weighted Lindley multiplicative regression frailty models under random censored data
Tiwary Bioinformatics and Computational Biology
Zalikha et al. Predictive capacity of four machine learning models for in-hospital postoperative outcomes following total knee arthroplasty
Shao et al. Inference for reclassification statistics under nested and non-nested models for biomarker evaluation
Castelo et al. Inference of regulatory networks from microarray data with R and the Bioconductor package qpgraph
Kothiyal et al. Investigation of chemical space networks using graph measures and random matrix theory
Baele et al. Bayesian codon substitution modelling to identify sources of pathogen evolutionary rate variation

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23770309

Country of ref document: EP

Kind code of ref document: A1