WO2022163629A1 - Estimation device, training device, estimation method, generation method and program - Google Patents

Estimation device, training device, estimation method, generation method and program Download PDF

Info

Publication number
WO2022163629A1
WO2022163629A1 PCT/JP2022/002604 JP2022002604W WO2022163629A1 WO 2022163629 A1 WO2022163629 A1 WO 2022163629A1 JP 2022002604 W JP2022002604 W JP 2022002604W WO 2022163629 A1 WO2022163629 A1 WO 2022163629A1
Authority
WO
WIPO (PCT)
Prior art keywords
energy
molecule
graph
feature
processors
Prior art date
Application number
PCT/JP2022/002604
Other languages
French (fr)
Japanese (ja)
Inventor
幾 品川
大器 山口
Original Assignee
株式会社 Preferred Networks
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社 Preferred Networks filed Critical 株式会社 Preferred Networks
Publication of WO2022163629A1 publication Critical patent/WO2022163629A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

[Problem] To estimate HOMO energy with high accuracy and at low calculation cost. [Solution] The estimation device comprises one or a plurality of memories and one or a plurality of processors. The one or plurality of processors acquires, from a graph including a first feature amount related to a molecule, a second feature amount acquired on the basis of a first principle calculation and relating to energy allocated to atoms constituting the molecule, and acquires, on the basis of the graph and the second feature amount, a third feature amount related to one or a plurality of types of energy of the molecule.

Description

推定装置、訓練装置、推定方法、生成方法及びプログラムEstimation device, training device, estimation method, generation method and program
 本開示は、推定装置、訓練装置、推定方法、生成方法及びプログラムに関する。 The present disclosure relates to an estimation device, a training device, an estimation method, a generation method, and a program.
 HOMO(Highest Occupied Molecular Orbital)エネルギー、LUMO(Lowest Unoccupied Molecular Orbital)エネルギーは、化合物の反応性の予測等に用いられる物性値である。これらの値は、量子科学計算を用いて計算することができる。しかしながら、この計算時間は、対象となる分子の演算行列の大きさnに対してO(n3)の計算量が必要となり、計算コストが高くなる。近年、ニューラルネットワーク、特に、GNN(Graph Neural Network)を用いて予測使用とする試みがなされているが、計算コストは改善することができるものの、すでに実現されつつある分子の有する全エネルギー等の他の物性値の予測結果と比較して精度が低いことがある。 HOMO (Highest Occupied Molecular Orbital) energy and LUMO (Lowest Unoccupied Molecular Orbital) energy are physical property values used for predicting the reactivity of a compound. These values can be calculated using quantum scientific calculations. However, this calculation time requires a calculation amount of O(n 3 ) with respect to the size n of the operation matrix of the target molecule, resulting in a high calculation cost. In recent years, attempts have been made to predict use using neural networks, especially GNNs (Graph Neural Networks). Accuracy may be lower than the prediction result of the physical property value of
 本開示においては、HOMOエネルギー、LUMOエネルギー等の分子の所定の種類のエネルギーの計算におけるコストを低くし、精度を高くする技術を提案する。 This disclosure proposes a technique for reducing the cost and increasing the accuracy in the calculation of predetermined types of energy of molecules such as HOMO energy and LUMO energy.
 一実施形態によれば、推定装置は、1又は複数のメモリと、1又は複数のプロセッサと、を備える。前記1又は複数のプロセッサは、分子に関する第1特徴量を含んだグラフから、第一原理計算に基づいて取得される前記分子を構成する原子に割り当てられるエネルギーに関する第2特徴量を取得し、前記グラフ及び前記第2特徴量に基づいて、前記分子の1以上の所定の種類のエネルギーに関する第3特徴量を取得する。 According to one embodiment, the estimating device comprises one or more memories and one or more processors. The one or more processors acquire, from a graph including the first feature amount related to the molecule, a second feature amount related to the energy assigned to the atoms constituting the molecule obtained based on first-principles calculation, and Based on the graph and the second feature, a third feature for one or more predetermined types of energy of the molecule is obtained.
一実施形態に係る推定装置の処理を概略的に示す図。The figure which shows roughly the process of the estimation apparatus which concerns on one Embodiment. 一実施形態に係る推定装置の処理を概略的に示す図。The figure which shows roughly the process of the estimation apparatus which concerns on one Embodiment. 一実施形態に係る推定装置の処理を概略的に示す図。The figure which shows roughly the process of the estimation apparatus which concerns on one Embodiment. 一実施形態に係る訓練装置の処理を概略的に示す図。FIG. 4 is a diagram schematically showing processing of a training device according to one embodiment; 一実施形態に係る解析の具体例を説明するための図。FIG. 4 is a diagram for explaining a specific example of analysis according to one embodiment; 一実施形態に係る推定装置又は訓練装置の少なくとも一方のハードウェア実装の一例を示すブロック図。1 is a block diagram illustrating an example hardware implementation of an estimator and/or a training device, according to one embodiment. FIG.
 以下、図面を参照して本発明の実施形態について説明する。図面及び実施形態の説明は一例として示すものであり、本発明を限定するものではない。 Embodiments of the present invention will be described below with reference to the drawings. The drawings and description of the embodiments are given by way of example and are not intended to limit the invention.
 (推定装置)
 図1は、一実施形態に係る推定装置1の動作について概略的に説明するための図である。推定装置1においては、例えば、分子の構造を示すグラフ(以下、構造グラフとも記載する)に対して処理を実行し、HOMOエネルギーを取得する。
(Estimation device)
FIG. 1 is a diagram for schematically explaining the operation of the estimation device 1 according to one embodiment. In the estimation device 1, for example, a graph representing the structure of a molecule (hereinafter also referred to as a structure graph) is processed to obtain HOMO energy.
 構造グラフとは、化合物の構造をグラフで表現したものである。この構造グラフは、例えば、原子をノードとし、接続状態をエッジとして表現したグラフであってもよい。このグラフは、例えば、化合物を構成する原子同士の接続状態が適切に記述された隣接行列等であってもよい。この隣接行列は、例えば、複数存在し、多重結合等を表したものであってもよい。このグラフは、例えば、化合物を構成する原子同士の距離行列等の幾何的な状態を表す行列等を表したものであってもよい。これらの他、化合物における原子の3次元的な状態を適切に表現できるデータであればよい。ノードは、One-hotベクトルなど、原子を一意に特定する特徴ベクトルや、原子とその周囲を表現する特徴ベクトルを有して良い。 A structure graph is a graphical representation of the structure of a compound. This structure graph may be, for example, a graph in which atoms are represented as nodes and connection states are represented as edges. This graph may be, for example, an adjacency matrix or the like in which the state of connection between atoms constituting a compound is appropriately described. For example, there may be a plurality of adjacency matrices representing multiple connections. This graph may represent, for example, a matrix representing a geometrical state such as a distance matrix between atoms constituting a compound. In addition to these, any data that can appropriately represent the three-dimensional state of atoms in a compound may be used. A node may have a feature vector that uniquely identifies an atom, such as a one-hot vector, or a feature vector that describes an atom and its surroundings.
 推定装置1は、訓練済モデル10と、第1読出関数12と、第2読出関数14と、を用いて構造グラフからHOMOエネルギーを推定する。推定装置1は、後述で詳しく説明するように、例えば、処理を実行するプロセッサと、データを格納するメモリ(ストレージ等を含んでもよい)と、を備える。 The estimation device 1 estimates the HOMO energy from the structure graph using the trained model 10, the first readout function 12, and the second readout function 14. The estimating device 1 includes, for example, a processor that executes processing and a memory (which may include a storage or the like) that stores data, as will be described later in detail.
 訓練済モデル10は、上記の構造グラフに対応する入力層を備え、分子の構造の情報に、分子全体又は分子構造における原子の特徴量の情報(第1特徴量)を付加したグラフを出力する。すなわち、訓練済モデル10は、分子の構造に関する情報(グラフであってもよい)を、第1特徴量を含んだグラフに変換して出力する。訓練済モデル10は、例えば、グラフニューラルネットワーク、グラフコンボリューションネットワーク等により生成されたモデルであってもよい。 The trained model 10 has an input layer corresponding to the structure graph described above, and outputs a graph in which information on the structure of molecules is added with information on feature amounts of atoms in the entire molecule or molecular structure (first feature amount). . That is, the trained model 10 converts information (which may be a graph) about the structure of molecules into a graph including the first feature amount and outputs the graph. The trained model 10 may be, for example, a model generated by a graph neural network, graph convolution network, or the like.
 第1読出関数12は、上記の第2特徴量を含むグラフから、化合物を構成する原子のHOAO(Highest Occupied Atomic Orbital)エネルギーに関連する特徴量(第2特徴量)を取得するreadoutを実行する関数である。この第1読出関数12は、線形な所定の演算の組合せで表現されてもよいし、この読出関数自体がニューラルネットワークとして構成されていてもよい。以下、本開示においてHOAOエネルギーとは、化合物を構成する原子における、分子のHOMOエネルギーに対応するエネルギーのことをいう。 The first readout function 12 executes readout to acquire a feature value (second feature value) related to the HOAO (Highest Occupied Atomic Orbital) energy of the atoms constituting the compound from the graph including the second feature value. is a function. This first readout function 12 may be expressed by a combination of linear predetermined operations, or this readout function itself may be configured as a neural network. Hereinafter, in the present disclosure, the HOAO energy refers to the energy corresponding to the HOMO energy of the molecule in the atoms constituting the compound.
 この第1読出関数12は、例えば、グラフを入力すると、第2特徴量として原子のHOAOエネルギーを取得する関数であってもよい。化合物がatom 1、atom 2、・・・、atom nから構成される場合に、第1読出関数12は、一例として原子の特徴量としてHOAOエネルギーを出力する。図に示すように、atom 1の原子のHOAOエネルギーとしてEHOAO, atom 1を出力し、atom 2の原子のHOAOエネルギーとしてEHOAO, atom 2を出力し、・・・、atom nの原子のHOAOエネルギーとしてEHOAO, atom nを出力する。 This first readout function 12 may be, for example, a function that acquires the HOAO energy of an atom as a second feature quantity when a graph is input. When a compound is composed of atom 1, atom 2, . As shown in the figure, E HOAO, atom 1 is output as the HOAO energy of the atom 1 atom, E HOAO, atom 2 is output as the HOAO energy of the atom 2 atom, ..., HOAO of the atom n atom Output E HOAO, atom n as energy.
 別の例としては、第1読出関数12は、HOAOエネルギーに容易に変換することのできる特徴量を第2特徴量として出力してもよい。この場合、必要であれば、第2特徴量からHOAOエネルギーを取得する線形又は非線形の関数を別途備えていてもよい。第2特徴量は、訓練済モデル10が出力したグラフに付加情報として適切な形態であってもよい。すなわち、第2特徴量は、原子のHOAOエネルギーそのものであってもよいし、HOAOエネルギーそのものでは無くてもHOAOエネルギーに関連する特徴量としてグラフに付加できる形態であってもよい。 As another example, the first readout function 12 may output a feature quantity that can be easily converted to HOAO energy as the second feature quantity. In this case, if necessary, a linear or nonlinear function for obtaining the HOAO energy from the second feature quantity may be separately provided. The second feature amount may be in a form appropriate as additional information to the graph output by the trained model 10. FIG. That is, the second feature amount may be the HOAO energy of the atom itself, or may be in a form that can be added to the graph as a feature amount related to the HOAO energy even if it is not the HOAO energy itself.
 第2読出関数14は、訓練済モデル10が出力した特徴量を表すグラフと、第1読出関数12が取得した第2特徴量とを組み合わせた量についてreadout処理を実現し、分子のHOMOエネルギーに関連する特徴量(第3特徴量)を取得する関数である。第2読出関数14も第1読出関数と同様に、線形又は非線形の関数、一例として、訓練済のニューラルネットワークモデルとして形成されていてもよい。 The second readout function 14 implements readout processing for the combined quantity of the graph representing the feature quantity output by the trained model 10 and the second feature quantity obtained by the first readout function 12, and the HOMO energy of the molecule. This is a function that acquires a related feature amount (third feature amount). The second readout function 14, like the first readout function, may also be formed as a linear or non-linear function, for example a trained neural network model.
 第2読出関数14は、例えば、訓練済モデル10が出力したグラフと、第1読出関数12が出力した第2特徴量とを連結(concatenate)したものを入力とし、分子のHOMOエネルギーが取得可能な第3特徴量を取得する。第2特徴量と同様に、第3特徴量がHOMOエネルギーそのものであってもよいし、HOMOエネルギーに簡単に変換できる特徴量であってもよい。 The second readout function 14 can obtain the HOMO energy of the molecule by using, for example, the concatenated graph output by the trained model 10 and the second feature output by the first readout function 12 as input. to obtain a third feature. As with the second feature amount, the third feature amount may be the HOMO energy itself, or may be a feature amount that can be easily converted into the HOMO energy.
 推定装置1は、第2読出関数14が出力するHOMOエネルギー又は第3特徴量から変換されるHOMOエネルギーを出力する。 The estimation device 1 outputs the HOMO energy output by the second readout function 14 or the HOMO energy converted from the third feature quantity.
 この図を用いて、推定装置1の処理について説明する。 Using this diagram, the processing of the estimation device 1 will be explained.
 推定装置1のプロセッサは、まず、化合物(分子)の構造についての情報を取得し、必要であればこの情報を構造グラフへと変換する(S100)。情報の取得は、入出力インタフェースを介して実現されてもよい。取得した情報が構造グラフであれば、プロセッサは、取得した構造グラフを用いて以下の処理を実行する。 The processor of the estimation device 1 first acquires information about the structure of the compound (molecule), and if necessary converts this information into a structure graph (S100). Acquisition of information may be realized through an input/output interface. If the acquired information is a structure graph, the processor executes the following process using the acquired structure graph.
 取得した情報が構造グラフではない場合には、プロセッサは、化合物の構造についての情報を構造グラフへと変換する。この変換手法は、一般的に用いられている手法で実行されてもよい。プロセッサは、例えば、組成式、分子式として取得した場合には、データベース等を照合することにより構造グラフを取得してもよい。構造式として取得した場合には、この構造式から変換できるツールを用いてもよい。ツリー情報として構造式を取得した場合には、適切にツリー情報を構造グラフへと変換する。 If the acquired information is not a structure graph, the processor converts the information about the structure of the compound into a structure graph. This conversion technique may be performed by a commonly used technique. For example, when a compositional formula or a molecular formula is obtained, the processor may obtain a structure graph by collating a database or the like. When obtained as a structural formula, a tool capable of converting from this structural formula may be used. When a structural formula is acquired as tree information, the tree information is appropriately converted into a structure graph.
 次に、プロセッサは、訓練済モデル10に取得した構造グラフを入力して、第1特徴量を含むグラフを取得する(S102)。このグラフは、上述したように、分子の幾何学的な構造を示す構造グラフに、分子の幾何学的な構造から導くことができる第1特徴量を付加したデータを有するグラフである。 Next, the processor inputs the acquired structure graph to the trained model 10 to acquire a graph containing the first feature (S102). As described above, this graph is a graph having data obtained by adding the first feature amount that can be derived from the geometric structure of the molecule to the structure graph showing the geometric structure of the molecule.
 次に、プロセッサは、第1読出関数12に取得したグラフを入力する(S104)。 Next, the processor inputs the obtained graph to the first reading function 12 (S104).
 この第1読出関数12により、プロセッサは、HOAOエネルギーに関する第2特徴量を抽出する(S106)。なお、直接的に第1読出関数12においてHOAOエネルギーを取得してもよい。換言すると、第1読出関数は、第2特徴量としてHOAOエネルギーそのものを取得できる形態であってもよい。 With this first readout function 12, the processor extracts a second feature quantity related to HOAO energy (S106). Alternatively, the HOAO energy may be obtained directly in the first readout function 12 . In other words, the first readout function may be in a form capable of obtaining the HOAO energy itself as the second feature quantity.
 次に、プロセッサは、訓練済モデル10から出力されたグラフ及び第1読出関数12から出力された第2特徴量の情報を連結する(S108)。なお、連結することには限られず、適切にグラフの情報として第2特徴量が合成されればよい。第2読出関数14においてこの第2特徴量とグラフとの入力を別々に適切に受け付ける形態としてもよい。 Next, the processor concatenates the graph output from the trained model 10 and the second feature amount information output from the first readout function 12 (S108). It should be noted that the second feature amount may be appropriately combined as graph information without being limited to connecting. The second readout function 14 may be configured to appropriately receive the inputs of the second feature amount and the graph separately.
 プロセッサは、この連結した連結グラフを第2読出関数14に入力し、分子のHOMOエネルギーに関する第3特徴量を取得する(S110)。なお、直接的に第2読出関数14においてHOMOエネルギーを取得してもよい。この場合、次のS112の処理を省略することもできる。換言すると、第2読出関数は、第3特徴量としてHOMOエネルギーそのものを取得する形態であってもよい。 The processor inputs this connected connection graph to the second readout function 14 and acquires the third feature amount regarding the HOMO energy of the molecule (S110). Alternatively, the HOMO energy may be obtained directly in the second readout function 14 . In this case, the next processing of S112 can be omitted. In other words, the second readout function may be in the form of obtaining the HOMO energy itself as the third feature quantity.
 次に、プロセッサは、第2読出関数14から出力された第3特徴量に基づいて、分子のHOMOエネルギーを取得する(S112)。 Next, the processor obtains the HOMO energy of the molecule based on the third feature quantity output from the second readout function 14 (S112).
 このように、推定装置1は、化合物のHOMOエネルギーを、分子の構造と、この構造から推定されたHOAOエネルギーと、から取得する。 In this way, the estimation device 1 obtains the HOMO energy of a compound from the molecular structure and the HOAO energy estimated from this structure.
 以上のように、本実施形態によれば、HOAOエネルギーの情報を用いることにより精度の高いHOMOエネルギーの取得をすることが可能となる。推定装置1は、HOAOエネルギーとしてHOMOエネルギーと相関が高いHOAOエネルギーの最大値の情報、又は、HOAOエネルギーの最大値の情報に関する第2特徴量を用いた情報をグラフとともに第2読出関数14に入力する形態であってもよい。このようにHOMOエネルギーと相関が高いHOAOエネルギーを用いることにより、利用する情報量を削減した状態で精度の高い推定を実現することもできる。 As described above, according to the present embodiment, it is possible to obtain highly accurate HOMO energy by using information on HOAO energy. The estimating device 1 inputs, as the HOAO energy, information on the maximum value of the HOAO energy that is highly correlated with the HOMO energy, or information using the second feature value related to the information on the maximum value of the HOAO energy, together with the graph, to the second reading function 14. It may be in the form of By using the HOAO energy that is highly correlated with the HOMO energy in this way, highly accurate estimation can be realized with a reduced amount of information to be used.
 上記の例においては、HOMOエネルギーを推定するためにHOAOエネルギーを用いる推定装置1について説明したが、LUMOエネルギーでも同様のことを実現することができる。 In the above example, the estimating device 1 that uses HOAO energy to estimate HOMO energy was described, but the same can be achieved with LUMO energy.
 図2は、LUMOエネルギーを推定するための推定装置1の概略を示す。この図2に示すように、推定装置1は、プロセッサにより、訓練済モデル10に構造グラフを入力して第1特徴量を有するグラフを取得し、このグラフから第1読出関数12を用いてLUAO(Lowest Unoccupied Atomic Orbital)エネルギーに関する第2特徴量を取得し、グラフ及び第2特徴量から第2読出関数14を用いてLUMOエネルギーに関する第3特徴量を取得することができる。上述のHOMOエネルギーの取得と同様に、第2特徴量は、LUAOエネルギーあるいはその最低値であってもよいし、第3特徴量は、LUMOエネルギーそのものであってもよい。以下、本開示においてLUAOエネルギーとは、化合物を構成する原子における、分子のLUMOエネルギーに対応するエネルギーのことをいう。 Fig. 2 shows an outline of the estimation device 1 for estimating the LUMO energy. As shown in FIG. 2, the estimating device 1 obtains a graph having the first feature by inputting the structure graph to the trained model 10 by the processor, and uses the first readout function 12 from this graph to obtain the LUAO A second feature for the (Lowest Unoccupied Atomic Orbital) energy can be obtained, and a third feature for the LUMO energy can be obtained from the graph and the second feature using the second readout function 14 . Similar to obtaining the HOMO energy described above, the second feature quantity may be the LUAO energy or its lowest value, and the third feature quantity may be the LUMO energy itself. Hereinafter, in the present disclosure, LUAO energy refers to the energy corresponding to the LUMO energy of a molecule in atoms constituting a compound.
 図3は、推定装置1のさらに別の例を示す図である。この図3に示すように、推定装置1は、プロセッサにより、訓練済モデル10に構造グラフを入力して第1特徴量を有するグラフを取得し、このグラフから第1読出関数12を用いてHOAOエネルギー及びLOAOエネルギーに関する第2特徴量を取得し、グラフ及び第2特徴量から第2読出関数14を用いてHOMOエネルギー及びLUMOエネルギーに関する第3特徴量を並行して取得する形態としてもよい。上述のHOMOエネルギー、LUMOエネルギーの取得と同様に、第2特徴量は、HOAOエネルギー及びLUAOエネルギーそのものであってもよいし、第3特徴量は、HOMOエネルギー及びLUMOエネルギーそのものであってもよい。 FIG. 3 is a diagram showing still another example of the estimation device 1. FIG. As shown in FIG. 3, the estimating device 1 uses the processor to input the structure graph to the trained model 10 to obtain a graph having the first feature amount, and from this graph, the first readout function 12 is used to obtain the HOAO It is also possible to adopt a form in which a second feature amount regarding energy and LOAO energy is obtained, and a third feature amount regarding HOMO energy and LUMO energy is obtained in parallel from the graph and the second feature amount using the second readout function 14 . As in the acquisition of the HOMO energy and LUMO energy described above, the second feature quantity may be the HOAO energy and LUAO energy themselves, and the third feature quantity may be the HOMO energy and LUMO energy themselves.
 (訓練装置)
 次に、推定装置1において用いられる訓練済モデル10を生成する訓練装置2について説明する。
(training device)
Next, the training device 2 that generates the trained model 10 used in the estimation device 1 will be described.
 図4は、一実施形態に係る訓練装置2の処理について概略を模式的に示す図である。図4に示すように、訓練装置2は、モデル20と、第1読出関数22と、第2読出関数24と、を用いてモデル20の最適化を実行する。訓練装置2は、必要に応じて、第1読出関数22、第2読み出し関数24の最適化を併せて実行してもよい。訓練装置2は、推定装置1と同様に、後述で詳しく説明するように、例えば、処理を実行するプロセッサと、データを格納するメモリ(ストレージ等を含んでもよい)と、を備える。 FIG. 4 is a diagram schematically showing the outline of the processing of the training device 2 according to one embodiment. As shown in FIG. 4, training device 2 performs optimization of model 20 using model 20, first readout function 22, and second readout function . The training device 2 may perform optimization of the first readout function 22 and the second readout function 24 together, if desired. As with the estimation device 1, the training device 2 includes, for example, a processor that executes processing and a memory (which may include a storage or the like) that stores data, as will be described later in detail.
 訓練装置2により訓練されたモデル20が、前述の推定装置1における訓練済モデル10として用いられる。例えば、訓練装置2により最適化されたモデル20のハイパーパラメータ、最適化されたパラメータ等の情報に基づいて、推定装置1は、訓練済モデル10を生成して推定を実行してもよい。このため、図4におけるモデル20も、例えば、グラフニューラルネットワークの訓練に基づいたモデルであってもよい。 The model 20 trained by the training device 2 is used as the trained model 10 in the estimation device 1 described above. For example, the estimation device 1 may generate the trained model 10 and perform estimation based on information such as the hyperparameters of the model 20 optimized by the training device 2 and the optimized parameters. Thus, model 20 in FIG. 4 may also be, for example, a model based on training a graph neural network.
 推定装置1と訓練装置2は、同じプロセッサで動作するものであってもよいし、別のプロセッサで動作するものであってもよい。第1読み出し関数22、第2読み出し関数24のうち少なくとも一方が最適化される場合であっても、モデル20と訓練済モデル10と同様の処理が実行される。 The estimating device 1 and the training device 2 may operate on the same processor or may operate on different processors. Even if at least one of the first readout function 22 and the second readout function 24 is optimized, the same processing as in the model 20 and the trained model 10 is performed.
 また、一例として図1の推定装置1に対応する訓練済モデル10等を訓練する場合について説明するが、図2又は図3の推定装置1に対応する訓練済モデル10等を訓練する場合についても同様に実装することが可能である。 Further, as an example, the case of training the trained model 10 corresponding to the estimation device 1 of FIG. 1 will be described, but the case of training the trained model 10 corresponding to the estimation device 1 of FIG. A similar implementation is possible.
 図4を用いて、訓練装置2の処理について説明する。 The processing of the training device 2 will be explained using FIG.
 まず、訓練装置2のプロセッサは、前述の図1に対応する処理(順伝播処理)により、分子の構造に関する情報から、HOAOエネルギー及びHOMOエネルギーを推定する(S200)。 First, the processor of the training device 2 estimates the HOAO energy and the HOMO energy from the information on the molecular structure by the process (forward propagation process) corresponding to FIG. 1 (S200).
 次に、プロセッサは、教師データとして与えられるHOAOエネルギー及びHOMOエネルギーと、S200の処理において推定されたHOAOエネルギー及びHOMOエネルギーとのロスを算出する(S202)。教師データとして与えられるHOAOエネルギーは、例えば、NBO解析(Natural Bond Orbital Analysis)を用いてもよい。また、NBO解析には限定されず、ハミルトニアン、シュレーディンガー方程式等の波動関数から求めるものであってもよいし、他の適切な手法により取得するものであってもよい。 Next, the processor calculates the loss between the HOAO energy and HOMO energy given as teacher data and the HOAO energy and HOMO energy estimated in the processing of S200 (S202). For the HOAO energy given as teacher data, for example, NBO analysis (Natural Bond Orbital Analysis) may be used. Moreover, it is not limited to NBO analysis, and may be obtained from wave functions such as Hamiltonian and Schrödinger's equation, or may be obtained by other appropriate methods.
 ロスの算出は、例えば、分子を構成する原子のHOAOエネルギー及び分子のHOMOエネルギー値の教師データと推定値との二乗平均誤差(MSE: Mean Square Error)を用いる。使用する誤差は、MSEではなくてもよく例えば二乗平均平方根誤差(RMSE: Root Mean Square Error)、その他のノルム、又は、その他の適切な誤差評価をすることが可能な一般的な機械学習手法におけるロス関数を用いてもよい。 For calculation of the loss, for example, the mean square error (MSE) between the teacher data and the estimated values of the HOAO energy of the atoms that make up the molecule and the HOMO energy value of the molecule is used. The error used need not be the MSE, e.g. Root Mean Square Error (RMSE), some other norm, or any other suitable error estimator in common machine learning methods A loss function may be used.
 次に、プロセッサは、S202の処理において算出されたロスに基づいて、誤差逆伝播処理を実行し、モデル20のパラメータを更新する(S204)。プロセッサは、必要に応じて第1読出関数22又は第2読出関数24の少なくとも一方についてのパラメータを併せて更新してもよい。 Next, the processor executes error backpropagation processing based on the loss calculated in the processing of S202, and updates the parameters of the model 20 (S204). The processor may also update parameters for at least one of the first readout function 22 or the second readout function 24 as needed.
 モデル20に関する誤差逆伝播処理、活性化関数、ロス関数等は、一般的な機械学習の手法により実行されてもよい。 The error backpropagation processing, activation function, loss function, etc. regarding the model 20 may be executed by a general machine learning method.
 以上のように、本実施形態の訓練装置2によれば、HOAOエネルギーの推測を補助的に実行することにより、HOMOエネルギーを推定するための適切な特徴量を有するモデル20の訓練を実行することが可能となる。HOAOエネルギーを補助的に訓練に用いることにより、モデル20の訓練時に逆伝播する変数を増加させることができる。このため、モデル20等の更新を効率的に実現することが可能となる。また、HOAOエネルギーは、HOMOエネルギーと強く関連する物理量であるため、HOAOエネルギーを推定に組み込むことにより、HOMOエネルギーの推定の精度を向上させることができる。推定装置1で記載したように、HOAOエネルギーのうち最大値であるものを逆伝播において用いてもよい。 As described above, according to the training device 2 of the present embodiment, the HOAO energy estimation is performed as an auxiliary method to train the model 20 having appropriate feature values for HOMO energy estimation. becomes possible. By using the HOAO energy supplementally for training, we can increase the number of variables to backpropagate when training the model 20 . Therefore, it is possible to efficiently update the model 20 and the like. In addition, since the HOAO energy is a physical quantity that is strongly related to the HOMO energy, incorporating the HOAO energy into the estimation can improve the accuracy of the HOMO energy estimation. As described for the estimator 1, the maximum of the HOAO energies may be used in backpropagation.
 推定装置1において説明したように、モデル20、第1読出関数22、第2読出関数24は、LUAOエネルギー、LUMOエネルギーの推定をしてもよい。この場合、訓練装置2は、モデル20、第1読出関数22、第2読出関数24に対してLUAOエネルギー、LUMOエネルギーのロスを逆伝播させることにより最適化する。同様に、HOAOエネルギー及びLUAOエネルギーをHOMOエネルギー及びLUMOエネルギーとともに推定してもよい。この場合も同様に訓練装置2は、出力に応じた適切な最適化が実行される。 As described in the estimation device 1, the model 20, the first readout function 22, and the second readout function 24 may estimate LUAO energy and LUMO energy. In this case, the training device 2 optimizes the model 20, the first readout function 22, and the second readout function 24 by backpropagating the loss of LUAO energy and LUMO energy. Similarly, HOAO and LUAO energies may be estimated along with HOMO and LUMO energies. In this case as well, the training device 2 performs appropriate optimization according to the output.
 HOMOエネルギー、LUMOエネルギーは、化学反応の起こりやすさの一指標となる。このため、このように生成されたモデル20を訓練済モデル10とした推定装置1によるHOMOエネルギー、LUMOエネルギーの推定は、例えば、材料探索、反応探索等の探索にも応用することが可能である。  HOMO energy and LUMO energy are indicators of the likelihood of chemical reactions occurring. Therefore, the estimation of the HOMO energy and LUMO energy by the estimation device 1 using the model 20 generated in this way as the trained model 10 can be applied to searches such as material searches and reaction searches, for example. .
 上述したように、HOMOエネルギーは、HOAOエネルギーに基づいて推定され、同様に、LUMOエネルギーは、LUAOエネルギーに基づいて推定される。HOAOエネルギー及びLUAOエネルギーの少なくとも一方は、第一原理計算に基づいて算出された原子に割り当てられる他のエネルギーであってもよい。HOAOエネルギー、LUAOエネルギーが第一原理計算により算出されても良い。 As described above, the HOMO energy is estimated based on the HOAO energy, and similarly the LUMO energy is estimated based on the LUAO energy. At least one of the HOAO energy and the LUAO energy may be other energy assigned to atoms calculated based on first-principles calculations. HOAO energy and LUAO energy may be calculated by first-principles calculation.
 すなわち、推定装置1は、第1特徴量を含んだグラフから、第一原理計算に基づいて取得される分子を構成する原子に割り当てられるエネルギーに関する第2特徴量を取得し、このグラフ及び第2特徴量に基づいて、分子のHOMOエネルギー又はLUMOエネルギーの少なくとも一方に関する第3特徴量を取得する、と言い換えることができる。 That is, the estimating device 1 obtains, from the graph including the first feature amount, the second feature amount related to the energy assigned to the atoms forming the molecule obtained based on the first-principles calculation, and calculates the graph and the second feature amount. In other words, obtaining a third feature for at least one of the HOMO energy and the LUMO energy of the molecule based on the feature.
 同様に、訓練装置2は、分子の構造を示す構造グラフをモデルに入力して分子に関する第1特徴量を含んだグラフを取得し、このグラフから第一原理計算に基づいて取得される分子を構成する原子に割り当てられるエネルギーに関する第2特徴量を取得し、グラフ及び第2特徴量に基づいて、分子のHOMOエネルギー(又はLUMOエネルギーの少なくとも一方)を取得し、取得した原子に割り当てられるエネルギー及びHOMOエネルギー(又はLUMOエネルギーの少なくとも一方)と、教師データとを比較してモデルのパラメータを更新する、と言い換えても良い。 Similarly, the training device 2 inputs a structure graph showing the structure of a molecule to the model, acquires a graph containing the first feature amount related to the molecule, and extracts the molecule acquired based on the first-principles calculation from this graph. Acquiring a second feature value related to the energy assigned to the constituent atoms, acquiring the HOMO energy (or at least one of the LUMO energy) of the molecule based on the graph and the second feature value, and obtaining the energy assigned to the acquired atom and In other words, the HOMO energy (or at least one of the LUMO energies) is compared with teacher data to update the parameters of the model.
 また、このHOAOエネルギー又はLUAOエネルギーの少なくとも一方は、例えば、NBO解析に基づいて計算された各原子に割り当てられるエネルギーである。別の例として、NBO解析ではなく、波動関数に基づいて計算されるエネルギーであってもよい。すなわち、第一原理計算として、NBO解析又は波動関数を用いることができるが、これらに限定されるものではない。 Also, at least one of this HOAO energy or LUAO energy is, for example, the energy assigned to each atom calculated based on the NBO analysis. As another example, the energy may be calculated based on wavefunctions rather than NBO analysis. That is, NBO analysis or wave function can be used as first-principles calculation, but it is not limited to these.
 以下、具体例を挙げつつ、HOAOエネルギーとLUAOエネルギーの求め方について詳しく説明する。 Below, we will explain in detail how to obtain HOAO energy and LUAO energy while giving specific examples.
 まず、HOAOエネルギーの定義について説明する。NBO解析を行うと、原子の軌道iのエネルギーEiと占有率σiが求まる。軌道iは、原子、又は、2つの原子の結合に割り当てられる。ある原子Xに対するHOAOエネルギーは、以下の各処理により取得することができる。 First, the definition of HOAO energy will be explained. By NBO analysis, the energy E i of the atomic orbital i and the occupancy σ i can be obtained. Orbital i is assigned to an atom or a bond of two atoms. The HOAO energy for an atom X can be obtained by the following processes.
(1) 原子Xに割り当てられた軌道iのみを抽出し、エネルギーEiが高い順に並び替える。並び替えた後の順番を軌道jとする。 (1) Extract only the orbitals i assigned to the atom X, and sort them in descending order of energy Ei. Let the order after rearrangement be trajectory j.
(2) 結合に対する軌道である結合性軌道又は反結合性軌道の占有率σiは、1 / 2を乗算したものにする。 (2) The occupancy σ i of bonding orbitals or antibonding orbitals, which are orbitals for bonding, is multiplied by 1/2.
(3) Σ σi = 1となるまで、
Figure JPOXMLDOC01-appb-M000001
を算出する。
(3) Until Σ σ i = 1,
Figure JPOXMLDOC01-appb-M000001
Calculate
(4) (3)において、全ての軌道jに対してΣ σi < 1であれば、式(1)の代わりに、
Figure JPOXMLDOC01-appb-M000002
として算出する。
(4) In (3), if Σ σ i < 1 for all orbits j, instead of equation (1),
Figure JPOXMLDOC01-appb-M000002
Calculate as
 LUAOエネルギーELUAOについては、上記の(1)においてEiを低い順で並び替え、σjの代わりに(1 - σj)を用いる。 For the LUAO energy E LUAO , sort E i in descending order in (1) above, and use (1 - σ j ) instead of σ j .
 例えば、原子A、B、Cに対して、分子の構造がA - B - Cであり、以下のように軌道iのエネルギーEiが取得できたとする。
軌道0: (A - B), E = x [eV], σ = 0.05
軌道1: (B - C), E = y [eV], σ = 0.50
軌道2: B, E = z [eV], σ = 0.98
軌道3: A, E = a [eV], σ = 0.99
ここで、x > y > z > aであるとする。
For example, suppose that the molecular structure is A - B - C for atoms A, B, and C, and the energy E i of orbital i can be obtained as follows.
Trajectory 0: (A - B), E = x [eV], σ = 0.05
Trajectory 1: (B - C), E = y [eV], σ = 0.50
Trajectory 2: B, E = z [eV], σ = 0.98
Trajectory 3: A, E = a [eV], σ = 0.99
Now suppose that x > y > z > a.
 この場合、それぞれの原子のHOAOエネルギーは以下のように算出できる。
A: 0.05 / 2 × x + min(0.99, 1 - 0.05 / 2) × a
B: 0.05 / 2 × x + 0.50 / 2 × y + min(0.98, 1 - (0.05 / 2 + 0.50 / 2)) × z
C: (y × 0.50 / 2) / (0.50 / 2)
In this case, the HOAO energy of each atom can be calculated as follows.
A: 0.05/2 x x + min(0.99, 1 - 0.05/2) x a
B: 0.05 / 2 * x + 0.50 / 2 * y + min(0.98, 1 - (0.05 / 2 + 0.50 / 2)) * z
C: (y × 0.50 / 2) / (0.50 / 2)
 原子Aにおいては、エネルギーが高い順に、軌道0、軌道3が抽出される。軌道0の占有率が0.05であり、軌道3の占有率が0.99であるので、軌道3において占有率が1を越える。このため、HOAOエネルギーは、0.05 / 2 × x + (1 - 0.05 / 2) × aとなる。上記におけるmin(・) × aの項は、占有率が1を越えない範囲における軌道3のエネルギーを算出するための項である。 In atom A, orbital 0 and orbital 3 are extracted in descending order of energy. Orbital 0 has a occupancy of 0.05 and orbital 3 has a occupancy of 0.99, so the occupancy exceeds 1 at orbital 3. Therefore, the HOAO energy is 0.05 / 2 × x + (1 - 0.05 / 2) × a. The term min(·) x a in the above is a term for calculating the energy of orbital 3 in a range where the occupancy does not exceed 1.
 より詳しくは、占有率が1を越えるのは軌道3であり、式(1)に基づいて、軌道3において占有率が1となる範囲(1 - 0.05 / 2)を軌道3における占有率として、HOAOエネルギーを算出する。2で割っているのは、軌道0が原子A、Bにおける結合に対する軌道であり、上記の(2)に対応させるためである。 More specifically, the occupancy rate exceeds 1 in orbital 3, and based on formula (1), the range where the occupancy rate is 1 in orbital 3 (1 - 0.05 / 2) is the occupancy rate in orbital 3, Calculate HOAO energy. The reason for dividing by 2 is that the orbital 0 is the orbital for the bond between atoms A and B, and corresponds to (2) above.
 このように、式(1)は、占有率が1となるまでの各軌道におけるエネルギーの和を算出することを意味する。すなわち、HOAOエネルギーの算出として式(1)を用いる場合には、式(1)における最小のエネルギーを有する軌道が、それまでの軌道における占有率と1との差を占有率とみなして演算を実行する。 In this way, formula (1) means calculating the sum of the energies in each orbital until the occupancy becomes 1. That is, when formula (1) is used to calculate the HOAO energy, the orbital having the minimum energy in formula (1) is calculated by regarding the difference between the occupancy rate in the previous orbital and 1 as the occupancy rate. Run.
 原子Bについても同様であり、エネルギーが高い順に、軌道0、軌道1、軌道2が抽出される。軌道0の占有率(0.05 / 2) + 軌道1の占有率(0.50 / 2)が1よりも小さく、軌道2までの占有率が1よりも大きくなる。このため、軌道2における占有率を(1 - (0.05 / 2 + 0.50 / 2))とみなして計算をする。 The same is true for atom B, and orbital 0, orbital 1, and orbital 2 are extracted in descending order of energy. The occupancy of orbital 0 (0.05 / 2) + the occupancy of orbital 1 (0.50 / 2) is less than 1, and the occupancy up to orbital 2 is greater than 1. Therefore, the occupancy rate in orbital 2 is assumed to be (1 - (0.05 / 2 + 0.50 / 2)).
 このBに対する式は、上記の(1)~(3)の条件を合わせて考慮し、0.05 / 2 × x + min(0.50 / 2, 1 - 0.05 / 2) × y + min(0.98, 1 - (0.05 / 2 + 0.50 / 2)) × zのように変形してもよい。 This formula for B is 0.05 / 2 × x + min(0.50 / 2, 1 - 0.05 / 2) × y + min(0.98, 1 - (0.05 / 2 + 0.50 / 2)) may be transformed as x z.
 原子Cに対しては、σを全て足しても1を越えない。このため、式(2)を適用し、上記のような式により算出できる。 For atom C, the sum of all σ does not exceed 1. Therefore, by applying the formula (2), it can be calculated by the above formula.
 以下、水分子(H2O)のNBO解析結果を用いて、具体例を用いて説明する。 A specific example will be described below using the NBO analysis results of water molecules (H 2 O).
 図5は、水分子のNBO解析結果の必要部分だけ抽出した表である。 Fig. 5 is a table that extracts only the necessary parts of the NBO analysis results of water molecules.
 原子のカラムには、元素に原子インデクスを付与したものが示されている。水分子は、3つの原子から組成され、それぞれの原子の元素は、インデクス順にH、O、Hと定義されている。このため、それぞれの原子がH1、O2、H3と表される。  In the column of atoms, elements with atomic indexes are shown. A water molecule is composed of three atoms, and the elements of each atom are defined as H, O, and H in index order. Hence, the respective atoms are denoted as H1, O2 and H3.
 1つの軌道には、原則電子が2個まで入ることが可能である。このため、占有率としては、1つの軌道に電子が2個入った状態を占有率1とするように変換された値が記載されている。 In principle, up to two electrons can enter one orbital. Therefore, the occupancy is described as a value converted so that the occupancy is 1 when two electrons are in one orbital.
 軌道番号には、特に規定は存在しないが、上記の(1)~(4)に適合しやすくするため、エネルギーが高い順に軌道の番号を割り当てている。 There are no specific regulations for orbital numbers, but orbital numbers are assigned in order of increasing energy in order to facilitate compatibility with (1) to (4) above.
 原子O2のHOAOエネルギーの算出について説明する。 I will explain the calculation of the HOAO energy of atomic O2.
 原子O2が含まれている軌道は、エネルギーの高い順に1から10、13から19である。HOAOエネルギーの算出の仕方に基づいて、占有率σを足していく。上記の順番に占有率の和を算出すると、軌道1から10、13、14までにおいて、Σσj = 0.000020 < 1であり、軌道1から10、13から15までにおいて、Σσj = 1.000020 > 1となる。なお、軌道13、14においては、表の値を(2)に基づいて2で割ったものを加算している。 The orbitals containing the atom O2 are 1 to 10 and 13 to 19 in descending order of energy. The occupancy σ is added based on the method of calculating the HOAO energy. Calculating the sum of the occupancy rates in the above order, Σσ j = 0.000020 < 1 for orbitals 1 to 10, 13 and 14, and Σσ j = 1.000020 > 1 for orbitals 1 to 10 and 13 to 15. Become. In the trajectories 13 and 14, the values in the table divided by 2 based on (2) are added.
 式(1)に基づいて、HOAOエネルギーを算出する。軌道15においては、占有率は、1.000000ではなく、1.000000 - (1.000020 - 1) = 0.999980とみなして演算を実行する。この結果、原子O2のHOAOエネルギーは、-0.37941…[hartree]と算出される。より具体的には、式(3)により表現される。
Figure JPOXMLDOC01-appb-M000003
Calculate the HOAO energy based on equation (1). In orbit 15, the occupancy rate is assumed to be 1.000000 - (1.000020 - 1) = 0.999980 instead of 1.000000. As a result, the HOAO energy of atom O2 is calculated as -0.37941...[hartree]. More specifically, it is represented by Equation (3).
Figure JPOXMLDOC01-appb-M000003
 原子H1のHOAOエネルギーを同様に算出する。原子H1が含まれる軌道は、軌道11、13、17である。軌道11、13、17の全てを用いても、占有率は、0.5005075 < 1となる。このため、上記の(4)及び式(2)に基づき、原子H1のHOQOエネルギーは、-0.805638…[hartree]となる。より具体的には、式(4)により表現される。
Figure JPOXMLDOC01-appb-M000004
The HOAO energy of atom H1 is similarly calculated. Orbitals containing atom H1 are orbitals 11, 13 and 17. Even if all orbitals 11, 13 and 17 are used, the occupancy is 0.5005075<1. Therefore, based on (4) and equation (2) above, the HOQO energy of atom H1 is -0.805638...[hartree]. More specifically, it is represented by Equation (4).
Figure JPOXMLDOC01-appb-M000004
 原子H2についても同様に求めることができる。 Atomic H2 can be obtained in the same way.
 LUAOエネルギーは、軌道の並び替え(又は逆順にたどること)と、占有率を1 - σとすることにより算出できる。例えば、原子H1のLUAOエネルギーについて考える。原子H1が含まれる軌道は、エネルギーが低い順に軌道17、13、11となる。これに占有率(1 - σ)を考慮してエネルギーを算出する。占有率は、軌道17、13であると、Σ(1 - σj) = 0.5001175 < 1であり、軌道11まで含めると、Σ(1 - σj) = 1.4994925 > 1となる。軌道17の占有率を上記と同様に演算することにより、以下の式により原子H1のLUAOが取得できる。
Figure JPOXMLDOC01-appb-M000005
この結果、原子H1のLUAOエネルギーは、0.61109…[hartree]として取得することができる。
The LUAO energy can be calculated by rearranging the orbitals (or tracing them in reverse order) and taking the occupancy as 1 - σ. For example, consider the LUAO energy of atom H1. Orbitals containing atom H1 are orbitals 17, 13, and 11 in descending order of energy. The energy is calculated considering the occupancy rate (1 - σ). The occupancy is Σ(1 - σ j ) = 0.5001175 < 1 for orbitals 17 and 13, and Σ(1 - σ j ) = 1.4994925 > 1 for orbital 11. By calculating the occupancy rate of orbital 17 in the same manner as above, the LUAO of atom H1 can be obtained from the following equation.
Figure JPOXMLDOC01-appb-M000005
As a result, the LUAO energy of atom H1 can be obtained as 0.61109...[hartree].
 上記においては、分子の所定の種類のエネルギーとしてHOMOエネルギー、LUMOエネルギーの推定に言及したが、本開示における実施形態は、他の分野における分子のエネルギーに関する特徴量の推定にも応用することができる。例えば、HOMOエネルギー、LUMOエネルギー以外の示強性変数にも適用することができる。限定されない例としては、分子の分極率(HOMOエネルギーに相当)の予測に対して、原子の帯電量(HOAOエネルギーに相当)を用いることも可能である。これは一例として示したものであり、分子、化合物の示強性変数の推定において、原子に局在させた示強性変数の値を用いて訓練をする手法に、本開示における実施形態を応用することが可能である。 In the above, the estimation of HOMO energy and LUMO energy is referred to as the predetermined type of energy of the molecule, but the embodiments in the present disclosure can also be applied to the estimation of feature values related to energy of molecules in other fields. . For example, it can be applied to intensive variables other than HOMO energy and LUMO energy. As a non-limiting example, atomic charge (corresponding to HOAO energy) can be used to predict molecular polarizability (corresponding to HOMO energy). This is shown as an example, and the embodiment of the present disclosure can be applied to a method of training using the values of the tonic variables localized to atoms in estimating the tonic variables of molecules and compounds. is possible.
 なお、本開示における推定装置1又は訓練装置2における訓練済モデル10、モデル20、第1読出関数12、22、第2読出関数14、24は、離散値ではなく連続値としてエネルギー等が定義できるものであってもよい。連続値として定義する場合には、例えば、引用文献として提示したC. Chen, et. al., “Graph Networks as a Universal Machine Learning Framework for Molecules and Crystals,” https://arxiv.org/abs/1812.05055v2の手法を応用して用いることもできるし、他の適切な方法により実装することも可能である。 Note that the trained model 10, model 20, first readout functions 12, 22, and second readout functions 14, 24 in the estimation device 1 or training device 2 in the present disclosure can define energy etc. as continuous values instead of discrete values. can be anything. When defined as continuous values, see, for example, C. Chen, et. al., “Graph Networks as a Universal Machine Learning Framework for Molecules and Crystals,” https://arxiv.org/abs/ The technique of 1812.05055v2 can be adapted and used, or it can be implemented by other appropriate methods.
 上記の全ての訓練済モデルは、例えば、説明したように訓練した上で、さらに、一般的な手法により蒸留されたモデルを含む概念であってもよい。 All of the above trained models may be concepts that include, for example, models that have been trained as described and further distilled by a general method.
 前述した実施形態における各装置(推定装置1又は訓練装置2)の一部又は全部は、ハードウェアで構成されていてもよいし、CPU(Central Processing Unit)、又はGPU(Graphics Processing Unit)等が実行するソフトウェア(プログラム)の情報処理で構成されてもよい。ソフトウェアの情報処理で構成される場合には、前述した実施形態における各装置の少なくとも一部の機能を実現するソフトウェアを、フレキシブルディスク、CD-ROM(Compact Disc-Read Only Memory)又はUSB(Universal Serial Bus)メモリ等の非一時的な記憶媒体(非一時的なコンピュータ可読媒体)に収納し、コンピュータに読み込ませることにより、ソフトウェアの情報処理を実行してもよい。また、通信ネットワークを介して当該ソフトウェアがダウンロードされてもよい。さらに、ソフトウェアがASIC(Application Specific Integrated Circuit)又はFPGA(Field Programmable Gate Array)等の回路に実装されることにより、情報処理がハードウェアにより実行されてもよい。 A part or all of each device (estimation device 1 or training device 2) in the above-described embodiments may be configured by hardware, or a CPU (Central Processing Unit), GPU (Graphics Processing Unit), etc. It may be configured by information processing of software (program) to be executed. In the case of software information processing, software that realizes at least a part of the functions of each device in the above-described embodiments can be transferred to a flexible disk, CD-ROM (Compact Disc-Read Only Memory), or USB (Universal Serial Bus) memory or other non-temporary storage medium (non-temporary computer-readable medium) and read into a computer to execute software information processing. Alternatively, the software may be downloaded via a communication network. Furthermore, information processing may be performed by hardware by implementing software in a circuit such as an ASIC (Application Specific Integrated Circuit) or FPGA (Field Programmable Gate Array).
 ソフトウェアを収納する記憶媒体の種類は限定されるものではない。記憶媒体は、磁気ディスク、又は光ディスク等の着脱可能なものに限定されず、ハードディスク、又はメモリ等の固定型の記憶媒体であってもよい。また、記憶媒体は、コンピュータ内部に備えられてもよいし、コンピュータ外部に備えられてもよい。 The type of storage medium that stores the software is not limited. The storage medium is not limited to a detachable one such as a magnetic disk or an optical disk, and may be a fixed storage medium such as a hard disk or memory. Also, the storage medium may be provided inside the computer, or may be provided outside the computer.
 図6は、前述した実施形態における各装置(推定装置1又は訓練装置2)のハードウェア構成の一例を示すブロック図である。各装置は、一例として、プロセッサ71と、主記憶装置72(メモリ)と、補助記憶装置73(メモリ)と、ネットワークインタフェース74と、デバイスインタフェース75と、を備え、これらがバス76を介して接続されたコンピュータ7として実現されてもよい。 FIG. 6 is a block diagram showing an example of the hardware configuration of each device (estimating device 1 or training device 2) in the above-described embodiment. Each device includes, for example, a processor 71, a main storage device 72 (memory), an auxiliary storage device 73 (memory), a network interface 74, and a device interface 75, which are connected via a bus 76. may be implemented as a computer 7 integrated with the
 図6のコンピュータ7は、各構成要素を一つ備えているが、同じ構成要素を複数備えていてもよい。また、図6では、1台のコンピュータ7が示されているが、ソフトウェアが複数台のコンピュータにインストールされて、当該複数台のコンピュータそれぞれがソフトウェアの同一の又は異なる一部の処理を実行してもよい。この場合、コンピュータそれぞれがネットワークインタフェース74等を介して通信して処理を実行する分散コンピューティングの形態であってもよい。つまり、前述した実施形態における各装置(推定装置1又は訓練装置2)は、7又は複数の記憶装置に記憶された命令を7台又は複数台のコンピュータが実行することで機能を実現するシステムとして構成されてもよい。また、端末から送信された情報をクラウド上に設けられた1台又は複数台のコンピュータで処理し、この処理結果を端末に送信するような構成であってもよい。 The computer 7 in FIG. 6 has one of each component, but may have a plurality of the same components. In addition, although one computer 7 is shown in FIG. 6, the software may be installed in multiple computers, and each of the multiple computers may execute the same or different processing of the software. good too. In this case, it may be in the form of distributed computing in which each computer communicates via the network interface 74 or the like to execute processing. In other words, each device (estimation device 1 or training device 2) in the above-described embodiment is a system that realizes functions by seven or more computers executing instructions stored in seven or more storage devices. may be configured. Alternatively, the information transmitted from the terminal may be processed by one or more computers provided on the cloud, and the processing result may be transmitted to the terminal.
 前述した実施形態における各装置(推定装置1又は訓練装置2)の各種演算は、1又は複数のプロセッサを用いて、又は、ネットワークを介した複数台のコンピュータを用いて、並列処理で実行されてもよい。また、各種演算が、プロセッサ内に複数ある演算コアに振り分けられて、並列処理で実行されてもよい。また、本開示の処理、手段等の一部又は全部は、ネットワークを介してコンピュータ7と通信可能なクラウド上に設けられたプロセッサ及び記憶装置の少なくとも一方により実行されてもよい。このように、前述した実施形態における各装置は、1台又は複数台のコンピュータによる並列コンピューティングの形態であってもよい。 Various operations of each device (estimating device 1 or training device 2) in the above-described embodiments are executed in parallel using one or more processors or using multiple computers via a network. good too. Also, various operations may be distributed to a plurality of operation cores in the processor and executed in parallel. Also, part or all of the processing, means, etc. of the present disclosure may be executed by at least one of a processor and a storage device provided on a cloud capable of communicating with the computer 7 via a network. Thus, each device in the above-described embodiments may be in the form of parallel computing by one or more computers.
 プロセッサ71は、コンピュータの制御装置及び演算装置を含む電子回路(処理回路、Processing circuit、Processing circuitry、CPU、GPU、FPGA又はASIC等)であってもよい。また、プロセッサ71は、専用の処理回路を含む半導体装置等であってもよい。プロセッサ71は、電子論理素子を用いた電子回路に限定されるものではなく、光論理素子を用いた光回路により実現されてもよい。また、プロセッサ71は、量子コンピューティングに基づく演算機能を含むものであってもよい。 The processor 71 may be an electronic circuit (processing circuit, processing circuitry, CPU, GPU, FPGA, ASIC, etc.) including a computer control device and arithmetic device. Also, the processor 71 may be a semiconductor device or the like including a dedicated processing circuit. The processor 71 is not limited to an electronic circuit using electronic logic elements, and may be realized by an optical circuit using optical logic elements. Also, the processor 71 may include arithmetic functions based on quantum computing.
 プロセッサ71は、コンピュータ7の内部構成の各装置等から入力されたデータやソフトウェア(プログラム)に基づいて演算処理を行い、演算結果や制御信号を各装置等に出力することができる。プロセッサ71は、コンピュータ7のOS(Operating System)や、アプリケーション等を実行することにより、コンピュータ7を構成する各構成要素を制御してもよい。 The processor 71 can perform arithmetic processing based on the data and software (programs) input from each device, etc. of the internal configuration of the computer 7, and output the arithmetic result and control signal to each device, etc. The processor 71 may control each component of the computer 7 by executing the OS (Operating System) of the computer 7, applications, and the like.
 前述した実施形態における各装置(推定装置1及び/又は訓練装置2)は、1又は複数のプロセッサ71により実現されてもよい。ここで、プロセッサ71は、1チップ上に配置された1又は複数の電子回路を指してもよいし、2つ以上のチップあるいは2つ以上のデバイス上に配置された1又は複数の電子回路を指してもよい。複数の電子回路を用いる場合、各電子回路は有線又は無線により通信してもよい。 Each device (estimating device 1 and/or training device 2) in the above-described embodiments may be realized by one or more processors 71. Here, the processor 71 may refer to one or more electronic circuits arranged on one chip, or may refer to one or more electronic circuits arranged on two or more chips or two or more devices. You can point When multiple electronic circuits are used, each electronic circuit may communicate by wire or wirelessly.
 主記憶装置72は、プロセッサ71が実行する命令及び各種データ等を記憶する記憶装置であり、主記憶装置72に記憶された情報がプロセッサ71により読み出される。補助記憶装置73は、主記憶装置72以外の記憶装置である。なお、これらの記憶装置は、電子情報を格納可能な任意の電子部品を意味するものとし、半導体のメモリでもよい。半導体のメモリは、揮発性メモリ、不揮発性メモリのいずれでもよい。前述した実施形態における各装置(推定装置1又は訓練装置2)において各種データを保存するための記憶装置は、主記憶装置73又は補助記憶装置73により実現されてもよく、プロセッサ71に内蔵される内蔵メモリにより実現されてもよい。例えば、前述した実施形態における記憶部102は、主記憶装置72又は補助記憶装置73により実現されてもよい。 The main storage device 72 is a storage device that stores instructions and various data to be executed by the processor 71 , and the information stored in the main storage device 72 is read by the processor 71 . Auxiliary storage device 73 is a storage device other than main storage device 72 . These storage devices mean any electronic components capable of storing electronic information, and may be semiconductor memories. The semiconductor memory may be either volatile memory or non-volatile memory. A storage device for storing various data in each device (estimation device 1 or training device 2) in the above-described embodiments may be realized by the main storage device 73 or the auxiliary storage device 73, and is built into the processor 71. It may be realized by an internal memory. For example, the storage unit 102 in the above-described embodiment may be realized by the main storage device 72 or the auxiliary storage device 73.
 記憶装置(メモリ)1つに対して、複数のプロセッサが接続(結合)されてもよいし、単数のプロセッサが接続されてもよい。プロセッサ1つに対して、複数の記憶装置(メモリ)が接続(結合)されてもよい。前述した実施形態における各装置(推定装置1又は訓練装置2)が、少なくとも1つの記憶装置(メモリ)とこの少なくとも1つの記憶装置(メモリ)に接続(結合)される複数のプロセッサで構成される場合、複数のプロセッサのうち少なくとも1つのプロセッサが、少なくとも1つの記憶装置(メモリ)に接続(結合)される構成を含んでもよい。また、複数台のコンピュータに含まれる記憶装置(メモリ))とプロセッサによって、この構成が実現されてもよい。さらに、記憶装置(メモリ)がプロセッサと一体になっている構成(例えば、L1キャッシュ、L2キャッシュを含むキャッシュメモリ)を含んでもよい。 Multiple processors may be connected (coupled) to one storage device (memory), or a single processor may be connected. A plurality of storage devices (memories) may be connected (coupled) to one processor. Each device (estimating device 1 or training device 2) in the above-described embodiments is composed of at least one storage device (memory) and a plurality of processors connected (coupled) to this at least one storage device (memory). In this case, at least one of the plurality of processors may include a configuration connected (coupled) to at least one storage device (memory). Also, this configuration may be realized by storage devices (memory) and processors included in a plurality of computers. Furthermore, a configuration in which a storage device (memory) is integrated with a processor (for example, a cache memory including an L1 cache and an L2 cache) may be included.
 ネットワークインタフェース74は、無線又は有線により、通信ネットワーク8に接続するためのインタフェースである。ネットワークインタフェース74は、既存の通信規格に適合したもの等、適切なインタフェースを用いればよい。ネットワークインタフェース74により、通信ネットワーク8を介して接続された外部装置9Aと情報のやり取りが行われてもよい。なお、通信ネットワーク8は、WAN(Wide Area Network)、LAN(Local Area Network)、PAN(Personal Area Network)等のいずれか、又は、それらの組み合わせであってよく、コンピュータ7と外部装置9Aとの間で情報のやりとりが行われるものであればよい。WANの一例としてインターネット等があり、LANの一例としてIEEE802.11やイーサネット(登録商標)等があり、PANの一例としてBluetooth(登録商標)やNFC(Near Field Communication)等がある。 The network interface 74 is an interface for connecting to the communication network 8 wirelessly or by wire. As for the network interface 74, an appropriate interface such as one conforming to existing communication standards may be used. The network interface 74 may exchange information with the external device 9A connected via the communication network 8. FIG. The communication network 8 may be any one of WAN (Wide Area Network), LAN (Local Area Network), PAN (Personal Area Network), etc., or a combination thereof. It is sufficient if information can be exchanged between them. Examples of WAN include the Internet, examples of LAN include IEEE802.11 and Ethernet (registered trademark), and examples of PAN include Bluetooth (registered trademark) and NFC (Near Field Communication).
 デバイスインタフェース75は、外部装置9Bと直接接続するUSB等のインタフェースである。 The device interface 75 is an interface such as USB that directly connects with the external device 9B.
 外部装置9Aは、コンピュータ7とネットワークを介して接続されている装置である。外部装置9Bは、コンピュータ7と直接接続されている装置である。 The external device 9A is a device connected to the computer 7 via a network. External device 9B is a device that is directly connected to computer 7 .
 外部装置9A又は外部装置9Bは、一例として、入力装置であってもよい。入力装置は、例えば、カメラ、マイクロフォン、モーションキャプチャ、各種センサ等、キーボード、マウス、又は、タッチパネル等のデバイスであり、取得した情報をコンピュータ7に与える。また、パーソナルコンピュータ、タブレット端末、又は、スマートフォン等の入力部とメモリとプロセッサを備えるデバイスであってもよい。 For example, the external device 9A or the external device 9B may be an input device. The input device is, for example, a device such as a camera, microphone, motion capture, various sensors, a keyboard, a mouse, or a touch panel, and provides the computer 7 with acquired information. Alternatively, a device such as a personal computer, a tablet terminal, or a smartphone including an input unit, a memory, and a processor may be used.
 また、外部装置9A又は外部装置9Bは、一例として、出力装置でもよい。出力装置は、例えば、LCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、PDP(Plasma Display Panel)、又は、有機EL(Electro Luminescence)パネル等の表示装置であってもよいし、音声等を出力するスピーカ等であってもよい。また、パーソナルコンピュータ、タブレット端末、又は、スマートフォン等の出力部とメモリとプロセッサを備えるデバイスであってもよい。 Also, the external device 9A or the external device 9B may be, for example, an output device. The output device may be, for example, a display device such as LCD (Liquid Crystal Display), CRT (Cathode Ray Tube), PDP (Plasma Display Panel), or organic EL (Electro Luminescence) panel. A speaker or the like for output may be used. Alternatively, a device such as a personal computer, a tablet terminal, or a smartphone including an output unit, a memory, and a processor may be used.
 また、外部装置9A又は外部装置9Bは、記憶装置(メモリ)であってもよい。例えば、外部装置9Aは、ネットワークストレージ等であってもよく、外部装置9Bは、HDD等のストレージであってもよい。 Also, the external device 9A or the external device 9B may be a storage device (memory). For example, the external device 9A may be a network storage or the like, and the external device 9B may be a storage such as an HDD.
 また、外部装置9A又は外部装置9Bは、前述した実施形態における各装置(推定装置1又は訓練装置2)の構成要素の一部の機能を有する装置でもよい。つまり、コンピュータ7は、外部装置9A又は外部装置9Bの処理結果の一部又は全部を送信又は受信してもよい。 Also, the external device 9A or the external device 9B may be a device having the functions of some of the components of each device (the estimation device 1 or the training device 2) in the above-described embodiments. That is, the computer 7 may transmit or receive part or all of the processing results of the external device 9A or the external device 9B.
 本明細書(請求項を含む)において、「a、b及びcの少なくとも1つ(一方)」又は「a、b又はcの少なくとも1つ(一方)」の表現(同様な表現を含む)が用いられる場合は、a、b、c、a-b、a-c、b-c、又は、a-b-cのいずれかを含む。また、a-a、a-b-b、a-a-b-b-c-c等のように、いずれかの要素について複数のインスタンスを含んでもよい。さらに、a-b-c-dのようにdを有する等、列挙された要素(a、b及びc)以外の他の要素を加えることも含む。 In the present specification (including claims), the expression "at least one (one) of a, b and c" or "at least one (one) of a, b or c" (including similar expressions) Where used, includes any of a, b, c, a-b, ac, b-c, or a-b-c. Also, multiple instances of any element may be included, such as a-a, a-b-b, a-a-b-b-c-c, and so on. It also includes the addition of other elements than the listed elements (a, b and c), such as having d such as a-b-c-d.
 本明細書(請求項を含む)において、「データを入力として/データに基づいて/に従って/に応じて」等の表現(同様な表現を含む)が用いられる場合は、特に断りがない場合、各種データそのものを入力として用いる場合や、各種データに何らかの処理を行ったもの(例えば、ノイズ加算したもの、正規化したもの、各種データの中間表現等)を入力として用いる場合を含む。また「データに基づいて/に従って/に応じて」何らかの結果が得られる旨が記載されている場合、当該データのみに基づいて当該結果が得られる場合を含むとともに、当該データ以外の他のデータ、要因、条件、及び/又は状態等にも影響を受けて当該結果が得られる場合をも含み得る。また、「データを出力する」旨が記載されている場合、特に断りがない場合、各種データそのものを出力として用いる場合や、各種データに何らかの処理を行ったもの(例えば、ノイズ加算したもの、正規化したもの、各種データの中間表現等)を出力とする場合も含む。 In this specification (including claims), when expressions such as "data as input / based on data / according to / according to" (including similar expressions) are used, unless otherwise specified, It includes the case where various data itself is used as an input, and the case where various data subjected to some processing (for example, noise added, normalized, intermediate representation of various data, etc.) is used as an input. In addition, if it is stated that some result can be obtained "based on/according to/depending on the data", this includes cases where the result is obtained based only on the data, other data other than the data, It may also include cases where the result is obtained under the influence of factors, conditions, and/or states. In addition, if it is stated that "data will be output", unless otherwise specified, if the various data themselves are used as output, or if the various data have undergone some processing (for example, noise addition, normalization, etc.) This also includes the case where the output is a converted version, an intermediate representation of various data, etc.).
 本明細書(請求項を含む)において、「接続される(connected)」及び「結合される(coupled)」との用語が用いられる場合は、直接的な接続/結合、間接的な接続/結合、電気的(electrically)な接続/結合、通信的(communicatively)な接続/結合、機能的(operatively)な接続/結合、物理的(physically)な接続/結合等のいずれをも含む非限定的な用語として意図される。当該用語は、当該用語が用いられた文脈に応じて適宜解釈されるべきであるが、意図的に或いは当然に排除されるのではない接続/結合形態は、当該用語に含まれるものして非限定的に解釈されるべきである。 In this specification (including the claims), when the terms "connected" and "coupled" are used, they refer to direct connection/coupling, indirect connection/coupling , electrically connected/coupled, communicatively connected/coupled, operatively connected/coupled, physically connected/coupled, etc. intended as a term. The term should be interpreted appropriately according to the context in which the term is used, but any form of connection/bonding that is not intentionally or naturally excluded is not included in the term. should be interpreted restrictively.
 本明細書(請求項を含む)において、「AがBするよう構成される(A configured to B)」との表現が用いられる場合は、要素Aの物理的構造が、動作Bを実行可能な構成を有するとともに、要素Aの恒常的(permanent)又は一時的(temporary)な設定(setting/configuration)が、動作Bを実際に実行するように設定(configured/set)されていることを含んでよい。例えば、要素Aが汎用プロセッサである場合、当該プロセッサが動作Bを実行可能なハードウェア構成を有するとともに、恒常的(permanent)又は一時的(temporary)なプログラム(命令)の設定により、動作Bを実際に実行するように設定(configured)されていればよい。また、要素Aが専用プロセッサ又は専用演算回路等である場合、制御用命令及びデータが実際に付属しているか否かとは無関係に、当該プロセッサの回路的構造が動作Bを実際に実行するように構築(implemented)されていればよい。 In this specification (including claims), when the phrase "A configured to B" is used, the physical structure of element A is such that it is capable of performing operation B has a configuration, including that a permanent or temporary setting/configuration of element A is configured/set to actually perform action B good. For example, if element A is a general-purpose processor, the processor has a hardware configuration that can execute operation B, and operation B can be performed by setting a permanent or temporary program (instruction). It just needs to be configured to actually run. In addition, when the element A is a dedicated processor or a dedicated arithmetic circuit, etc., regardless of whether or not control instructions and data are actually attached, the circuit structure of the processor actually executes the operation B. It just needs to be implemented.
 本明細書(請求項を含む)において、含有又は所有を意味する用語(例えば、「含む(comprising/including)」及び有する「(having)等)」が用いられる場合は、当該用語の目的語により示される対象物以外の物を含有又は所有する場合を含む、open-endedな用語として意図される。これらの含有又は所有を意味する用語の目的語が数量を指定しない又は単数を示唆する表現(a又はanを冠詞とする表現)である場合は、当該表現は特定の数に限定されないものとして解釈されるべきである。 In this specification (including the claims), when terms denoting containing or possessing (e.g., "comprising/including" and "having, etc.") are used, by the object of the terms It is intended as an open-ended term, including the case of containing or possessing things other than the indicated object. When the object of these terms of inclusion or possession is an expression which does not specify a quantity or implies a singular number (expressions in which the article is a or an), the expression shall be construed as not being limited to a specific number. It should be.
 本明細書(請求項を含む)において、ある箇所において「1つ又は複数(one or more)」又は「少なくとも1つ(at least one)」等の表現が用いられ、他の箇所において数量を指定しない又は単数を示唆する表現(a又はanを冠詞とする表現)が用いられているとしても、後者の表現が「1つ」を意味することを意図しない。一般に、数量を指定しない又は単数を示唆する表現(a又はanを冠詞とする表現)は、必ずしも特定の数に限定されないものとして解釈されるべきである。 In the specification (including the claims), expressions such as "one or more" or "at least one" are used in some places, and quantities are specified in other places. Where no or suggestive of the singular (a or an articles) are used, the latter is not intended to mean "one." In general, expressions that do not specify a quantity or imply a singular number (indicative of the articles a or an) should be construed as not necessarily being limited to a particular number.
 本明細書において、ある実施例の有する特定の構成について特定の効果(advantage/result)が得られる旨が記載されている場合、別段の理由がない限り、当該構成を有する他の1つ又は複数の実施例についても当該効果が得られると理解されるべきである。但し当該効果の有無は、一般に種々の要因、条件、及び/又は状態等に依存し、当該構成により必ず当該効果が得られるものではないと理解されるべきである。当該効果は、種々の要因、条件、及び/又は状態等が満たされたときに実施例に記載の当該構成により得られるものに過ぎず、当該構成又は類似の構成を規定したクレームに係る発明において、当該効果が必ずしも得られるものではない。 In this specification, when it is stated that a particular configuration of an embodiment has a particular effect (advantage/result), unless there is a specific reason otherwise, other one or more having that configuration It should be understood that this effect can be obtained also for the embodiment of However, it should be understood that the presence or absence of the effect generally depends on various factors, conditions, and/or states, and that the configuration does not always provide the effect. The effect is only obtained by the configuration described in the embodiment when various factors, conditions, and/or states are satisfied, and in the claimed invention defining the configuration or a similar configuration , the effect is not necessarily obtained.
 本明細書(請求項を含む)において、「最適化(optimize)」等の用語が用いられる場合は、グローバルな最適値を求めること、グローバルな最適値の近似値を求めること、ローカルな最適値を求めること、及びローカルな最適値の近似値を求めることを含み、当該用語が用いられた文脈に応じて適宜解釈されるべきである。また、これら最適値の近似値を確率的又はヒューリスティックに求めることを含む。 In this specification (including claims), when terms such as "optimize" are used, finding a global optimum, finding an approximation of a global optimum, finding a local optimum and approximating a local optimum, should be interpreted appropriately depending on the context in which the term is used. It also includes stochastically or heuristically approximating these optimum values.
 本明細書(請求項を含む)において、複数のハードウェアが所定の処理を行う場合、各ハードウェアが協働して所定の処理を行ってもよいし、一部のハードウェアが所定の処理の全てを行ってもよい。また、一部のハードウェアが所定の処理の一部を行い、別のハードウェアが所定の処理の残りを行ってもよい。本明細書(請求項を含む)において、「1又は複数のハードウェアが第1の処理を行い、前記1又は複数のハードウェアが第2の処理を行う」等の表現が用いられている場合、第1の処理を行うハードウェアと第2の処理を行うハードウェアは同じものであってもよいし、異なるものであってもよい。つまり、第1の処理を行うハードウェア及び第2の処理を行うハードウェアが、前記1又は複数のハードウェアに含まれていればよい。なお、ハードウェアは、電子回路、又は、電子回路を含む装置等を含んでもよい。 In this specification (including claims), when a plurality of pieces of hardware perform predetermined processing, each piece of hardware may work together to perform the predetermined processing, or a part of the hardware may perform the predetermined processing. You may do all of Also, some hardware may perform a part of the predetermined processing, and another hardware may perform the rest of the predetermined processing. In the present specification (including claims), when expressions such as "one or more pieces of hardware perform the first process and the one or more pieces of hardware perform the second process" are used , the hardware that performs the first process and the hardware that performs the second process may be the same or different. In other words, the hardware that performs the first process and the hardware that performs the second process may be included in the one or more pieces of hardware. Note that hardware may include an electronic circuit or a device including an electronic circuit.
 以上、本開示の実施形態について詳述したが、本開示は上記した個々の実施形態に限定されるものではない。特許請求の範囲に規定された内容及びその均等物から導き出される本発明の概念的な思想と趣旨を逸脱しない範囲において種々の追加、変更、置き換え及び部分的削除等が可能である。例えば、前述した全ての実施形態において、数値又は数式を説明に用いている場合は、一例として示したものであり、これらに限られるものではない。また、実施形態における各動作の順序は、一例として示したものであり、これらに限られるものではない。 Although the embodiments of the present disclosure have been described in detail above, the present disclosure is not limited to the individual embodiments described above. Various additions, changes, replacements, partial deletions, etc. are possible without departing from the conceptual idea and spirit of the present invention derived from the content defined in the claims and equivalents thereof. For example, in all the embodiments described above, when numerical values or formulas are used for explanation, they are shown as an example and are not limited to these. Also, the order of each operation in the embodiment is shown as an example, and is not limited to these.

Claims (29)

 1又は複数のメモリと、1又は複数のプロセッサと、を備え、
 前記1又は複数のプロセッサは、
  第1分子の構造グラフを取得し、
  訓練済みモデルを用いて、前記第1分子の前記構造グラフから、前記第1分子の所定の特徴量を計算し、
 前記訓練済みモデルは、教師データの分子を構成する複数の原子それぞれについて予め計算される各原子のエネルギーに関する量を少なくとも用いて、訓練されたモデルである、
 推定装置。
comprising one or more memories and one or more processors,
The one or more processors are
Get the structure graph of the first molecule,
calculating a predetermined feature quantity of the first molecule from the structure graph of the first molecule using a trained model;
The trained model is a model that has been trained using at least a quantity related to the energy of each atom that is calculated in advance for each of a plurality of atoms that constitute molecules of teacher data,
estimation device.
 前記訓練済みモデルを用いる前記計算は、前記第1分子を構成する複数の原子に対応するエネルギーに関する量を各原子について計算し、各原子について計算された当該エネルギーに関する量を少なくとも用いて前記第1分子の前記所定の特徴量を計算する、
 請求項1に記載の推定装置。
The calculation using the trained model includes calculating, for each atom, an energy-related quantity corresponding to a plurality of atoms forming the first molecule, and using at least the energy-related quantity calculated for each atom, the first calculating the predetermined feature of the molecule;
The estimating device according to claim 1.
 前記予め計算されるエネルギーに関する量は、第一原理計算に基づいて計算されるエネルギーに関する量である、請求項1又は2に記載の推定装置。 3. The estimation device according to claim 1 or 2, wherein the precalculated energy-related quantity is an energy-related quantity calculated based on first-principles calculation.
 1又は複数のメモリと、1又は複数のプロセッサと、を備え、
 前記1又は複数のプロセッサは、
  第1分子の構造グラフを取得し、
  前記第1分子の前記構造グラフを訓練済みの第1のニューラルネットワークモデルで処理することで、第1のグラフを取得し、
  前記第1のグラフに基づいた第2の種類の演算処理を行うことで、前記第1分子の所定の特徴量を計算し、
 前記第1のニューラルネットワークモデルは、
  教師データの分子の構造グラフを前記第1のニューラルネットワークモデルで処理することで取得されるグラフに基づいた第1の種類の演算処理を行うことで計算される所定のエネルギーと、
  前記計算される所定のエネルギーの正解値と、
 に少なくとも基づいて訓練されたものである、推定装置。
comprising one or more memories and one or more processors,
The one or more processors are
Get the structure graph of the first molecule,
obtaining a first graph by processing the structure graph of the first molecule with a trained first neural network model;
calculating a predetermined feature amount of the first molecule by performing a second type of arithmetic processing based on the first graph;
The first neural network model is
a predetermined energy calculated by performing a first type of arithmetic processing based on a graph obtained by processing a structural graph of molecules of teacher data with the first neural network model;
a correct value of the calculated predetermined energy;
An estimator that has been trained at least based on
 前記第1の種類の演算処理と前記第2の種類の演算処理とは、異なる種類の演算処理である、請求項4に記載の推定装置。 The estimation device according to claim 4, wherein the first type of arithmetic processing and the second type of arithmetic processing are different types of arithmetic processing.
 前記第1の種類の演算処理は、グラフの特徴量を取得する読出関数の演算処理を含む、請求項4又は請求項5に記載の推定装置。 The estimation device according to claim 4 or claim 5, wherein the first type of arithmetic processing includes arithmetic processing of a readout function for acquiring graph feature values.
 前記計算される所定のエネルギーの正解値は、第一原理計算に基づいて計算されたものである、請求項4から請求項6のいずれかに記載の推定装置。 The estimation device according to any one of claims 4 to 6, wherein the calculated correct value of the predetermined energy is calculated based on first-principles calculation.
 前記第2の種類の演算処理は、ニューラルネットワークモデルを用いる演算処理を含む、請求項4から請求項6のいずれかに記載の推定装置。 The estimation device according to any one of claims 4 to 6, wherein the second type of arithmetic processing includes arithmetic processing using a neural network model.
 前記所定の特徴量は、分子のHOMOエネルギー又はLUMOエネルギーに関する、請求項1から請求項8のいずれかに記載の推定装置。 The estimation device according to any one of claims 1 to 8, wherein the predetermined feature amount relates to HOMO energy or LUMO energy of a molecule.
 1又は複数のメモリと、1又は複数のプロセッサと、を備え、
 前記1又は複数のプロセッサは、
  分子に関する第1特徴量を含んだグラフから、前記分子を構成する原子に割り当てられるエネルギーに関する第2特徴量を取得し、
  前記グラフ及び前記第2特徴量に基づいて、前記分子の1以上の所定の種類のエネルギーに関する第3特徴量を取得する、
 推定装置。
comprising one or more memories and one or more processors,
The one or more processors are
Obtaining a second feature value related to the energy assigned to the atoms constituting the molecule from the graph containing the first feature value related to the molecule,
obtaining a third feature for one or more predetermined types of energy of the molecule based on the graph and the second feature;
estimation device.
 前記割り当てられるエネルギーは、第一原理計算に基づいて取得される、
 請求項10に記載の推定装置。
the allocated energy is obtained based on first-principles calculations;
11. An estimating device according to claim 10.
 前記1又は複数のプロセッサは、
  前記分子の構造を示す構造グラフを訓練済モデルに入力し、前記グラフを取得する、
 請求項10又は請求項11に記載の推定装置。
The one or more processors are
inputting a structure graph showing the structure of the molecule into a trained model to obtain the graph;
12. An estimating device according to claim 10 or claim 11.
 前記訓練済モデルは、グラフニューラルネットワークに基づくモデルである、
 請求項12に記載の推定装置。
wherein the trained model is a model based on a graph neural network;
13. An estimating device according to claim 12.
 前記1又は複数のプロセッサは、
  前記第2特徴量として、HOAO(Highest Occupied Atomic Orbital)エネルギーの最大値に関する特徴量を取得する、
 請求項10から請求項13のいずれかに記載の推定装置。
The one or more processors are
Obtaining a feature value related to the maximum value of HOAO (Highest Occupied Atomic Orbital) energy as the second feature value;
14. The estimating device according to any one of claims 10 to 13.
 第一原理計算に基づいて取得されるエネルギーは、前記分子を構成する原子のHOAO(Highest Occupied Atomic Orbital)エネルギーを含む、
 請求項10から請求項14のいずれかに記載の推定装置。
The energy obtained based on the first-principles calculation includes the HOAO (Highest Occupied Atomic Orbital) energy of the atoms constituting the molecule,
The estimating device according to any one of claims 10 to 14.
 前記1又は複数のプロセッサは、
  前記第3特徴量に基づいて、前記所定の種類のエネルギーとして前記分子のHOMOエネルギーを取得する、
 請求項10から請求項15のいずれかに記載の推定装置。
The one or more processors are
obtaining the HOMO energy of the molecule as the predetermined type of energy based on the third feature;
16. The estimating device according to any one of claims 10 to 15.
 前記1又は複数のプロセッサは、
  前記第3特徴量として前記分子のLUMO(Lowest Unoccupied Molecular Orbital)エネルギーに関する情報をさらに取得する、
 請求項10から請求項16のいずれかに記載の推定装置。
The one or more processors are
further obtaining information on the LUMO (Lowest Unoccupied Molecular Orbital) energy of the molecule as the third feature quantity;
17. The estimating device according to any one of claims 10 to 16.
 第一原理計算に基づいて取得されるエネルギーは、前記分子を構成する原子のLUAO(Lowest Unoccupied Atomic Orbital)エネルギーを含む、
 請求項17に記載の推定装置。
The energy obtained based on the first-principles calculation includes the LUAO (Lowest Unoccupied Atomic Orbital) energy of the atoms that make up the molecule,
18. An estimating device according to claim 17.
 前記1又は複数のプロセッサは、
  前記第2特徴量として、LOAOエネルギーの最小値に関する特徴量を取得する、
 請求項18に記載の推定装置。
The one or more processors are
Obtaining a feature value related to the minimum value of LOAO energy as the second feature value;
19. An estimating device according to claim 18.
 第一原理計算に基づいて取得されるエネルギーは、NBO(Natural Bond Orbital)解析により取得されたエネルギーである、
 請求項15から請求項19のいずれかに記載の推定装置。
The energy obtained based on the first-principles calculation is the energy obtained by NBO (Natural Bond Orbital) analysis,
20. The estimating device according to any one of claims 15-19.
 第一原理計算に基づいて取得されるエネルギーは、波動関数に基づいて取得されたエネルギーである、
 請求項15から請求項19のいずれかに記載の推定装置。
The energy obtained based on the first-principles calculation is the energy obtained based on the wave function,
20. The estimating device according to any one of claims 15-19.
 前記1又は複数のプロセッサは、
  前記第3特徴量に基づいて、前記所定の種類のエネルギーとして前記分子のLUMOエネルギーを取得する、
 請求項10に記載の推定装置。
The one or more processors are
obtaining the LUMO energy of the molecule as the predetermined type of energy based on the third feature;
11. An estimating device according to claim 10.
 1又は複数のメモリと、1又は複数のプロセッサと、を備え、
 前記1又は複数のプロセッサは、
  分子の構造を示す構造グラフをモデルに入力して前記分子に関する第1特徴量を含んだグラフを取得し、
  前記グラフから第一原理計算に基づいて取得される前記分子を構成する原子に割り当てられるエネルギーに関する第2特徴量を取得し、
  前記グラフ及び前記第2特徴量に基づいて、前記分子の所定の種類のエネルギーを取得し、
  取得した前記原子に割り当てられるエネルギー及び前記所定の種類のエネルギーと、教師データとを比較して前記モデルのパラメータを更新する、
 訓練装置。
comprising one or more memories and one or more processors,
The one or more processors are
inputting a structure graph showing the structure of a molecule into a model to obtain a graph containing a first feature value related to the molecule;
obtaining a second feature value related to the energy assigned to the atoms constituting the molecule obtained from the graph based on first-principles calculation;
obtaining a predetermined type of energy of the molecule based on the graph and the second feature;
updating parameters of the model by comparing the obtained energy assigned to the atom and the predetermined type of energy with teacher data;
training equipment.
 前記1又は複数のプロセッサは、
  取得した前記原子に割り当てられるエネルギー及び前記所定の種類のエネルギーと、教師データとの誤差を逆伝播して前記モデルのパラメータを更新する、
 請求項23に記載の訓練装置。
The one or more processors are
Updating the parameters of the model by back propagating an error between the obtained energy assigned to the atom and the predetermined type of energy and teacher data;
24. A training device according to claim 23.
 前記所定の種類のエネルギーは、前記分子のHOMOエネルギーであり、
 前記教師データは、HOAOエネルギーのデータを含む、
 請求項23又は請求項24のいずれかに記載の訓練装置。
the predetermined type of energy is the HOMO energy of the molecule;
The training data includes HOAO energy data,
25. A training device according to either claim 23 or claim 24.
 前記教師データは、NBO解析により取得されたデータ、又は、波動関数に基づいて取得されたデータである、
 請求項25に記載の訓練装置。
The teacher data is data obtained by NBO analysis or data obtained based on a wave function,
26. A training device according to claim 25.
 前記1又は複数のプロセッサは、
  前記グラフ及び前記第2特徴量に基づいて前記分子のLUMOエネルギーをさらに取得し、
  前記原子に割り当てられるエネルギー及び前記HOMOエネルギーとともに、さらに前記LUMOエネルギーに基づいて、前記モデルのパラメータを更新する、
 請求項25に記載の訓練装置。
The one or more processors are
further obtaining the LUMO energy of the molecule based on the graph and the second feature;
updating parameters of the model based on the energy assigned to the atom and the HOMO energy as well as the LUMO energy;
26. A training device according to claim 25.
 請求項23から請求項27のいずれかに記載の訓練装置により生成された訓練済モデル。 A trained model generated by the training device according to any one of claims 23 to 27.
 1又は複数のプロセッサにより、
  分子の構造を示す構造グラフをモデルに入力して前記分子に関する第1特徴量を含んだグラフを取得し、
  前記グラフから第一原理計算に基づいて取得される前記分子を構成する原子に割り当てられるエネルギーに関する第2特徴量を取得し、
  前記グラフ及び前記第2特徴量に基づいて、前記分子の1以上の所定の種類のエネルギーを取得し、
  取得した前記原子に割り当てられるエネルギー及び前記1以上の所定の種類のエネルギーと、教師データとを比較して前記モデルのパラメータを更新する、
 前記モデルの生成方法。
by one or more processors,
inputting a structure graph showing the structure of a molecule into a model to obtain a graph containing a first feature value related to the molecule;
obtaining a second feature value related to the energy assigned to the atoms constituting the molecule obtained from the graph based on first-principles calculation;
obtaining one or more predetermined types of energy of the molecule based on the graph and the second feature;
updating parameters of the model by comparing the obtained energy assigned to the atom and the one or more predetermined types of energy with teacher data;
A method for generating the model.
PCT/JP2022/002604 2021-01-28 2022-01-25 Estimation device, training device, estimation method, generation method and program WO2022163629A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021012339 2021-01-28
JP2021-012339 2021-01-28

Publications (1)

Publication Number Publication Date
WO2022163629A1 true WO2022163629A1 (en) 2022-08-04

Family

ID=82654634

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/002604 WO2022163629A1 (en) 2021-01-28 2022-01-25 Estimation device, training device, estimation method, generation method and program

Country Status (1)

Country Link
WO (1) WO2022163629A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024037098A1 (en) * 2022-08-16 2024-02-22 腾讯科技(深圳)有限公司 Artificial intelligence-based molecular processing method and apparatus, electronic device, computer-readable storage medium, and computer program product

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004004230A (en) * 2002-05-31 2004-01-08 Canon Inc Electrophotographic photoreceptor, process cartridge and electrophotographic device
JP2011173821A (en) * 2010-02-24 2011-09-08 Sumitomo Chemical Co Ltd Method for predicting activity of chemical substance
JP2021117798A (en) * 2020-01-28 2021-08-10 国立大学法人山形大学 Molecular design support system, method for predicting molecular characteristic value, and molecular design support program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004004230A (en) * 2002-05-31 2004-01-08 Canon Inc Electrophotographic photoreceptor, process cartridge and electrophotographic device
JP2011173821A (en) * 2010-02-24 2011-09-08 Sumitomo Chemical Co Ltd Method for predicting activity of chemical substance
JP2021117798A (en) * 2020-01-28 2021-08-10 国立大学法人山形大学 Molecular design support system, method for predicting molecular characteristic value, and molecular design support program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HIROYUKI MATSUI, OKADA TOMOHARU: "Machine-Learning-Assisted Design Tool for Semiconducting and Fluorescent Molecules", THE 67TH JSAP SPRING MEETING 2020, 12 March 2020 (2020-03-12), pages 10 - 115, XP055956660, Retrieved from the Internet <URL:https://confit.atlas.jp/guide/event-img/jsap2020s/12p-A405-15/public/pdf?type=in> [retrieved on 20220831] *
TSUBAKI MASASHI, MIZOGUCHI TERUYASU: "Fast and Accurate Molecular Property Prediction: Learning Atomic Interactions and Potentials with Neural Networks", JOURNAL OF PHYSICAL CHEMISTRY LETTERS, vol. 9, no. 19, 4 October 2018 (2018-10-04), American Chemical Society, US, pages 5733 - 5741, XP055956654, ISSN: 1948-7185, DOI: 10.1021/acs.jpclett.8b01837 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024037098A1 (en) * 2022-08-16 2024-02-22 腾讯科技(深圳)有限公司 Artificial intelligence-based molecular processing method and apparatus, electronic device, computer-readable storage medium, and computer program product

Similar Documents

Publication Publication Date Title
US20220207370A1 (en) Inferring device, training device, inferring method, and training method
JP4694984B2 (en) Power load prediction method and power load prediction processing program
CN113496285A (en) Data processing method and device based on quantum circuit, electronic device and medium
CN111882068B (en) Method, device, equipment and medium for eliminating noise influence of QOA quantum circuit
Ye et al. Harnessing the Materials Project for machine-learning and accelerated discovery
CN114580647B (en) Quantum system simulation method, computing device, device and storage medium
CN113379058B (en) Quantum simulation method and device, electronic device and storage medium
Funcke et al. Review on quantum computing for lattice field theory
WO2018144534A1 (en) Hardware-based machine learning acceleration
WO2022163629A1 (en) Estimation device, training device, estimation method, generation method and program
Schäfer et al. Control of stochastic quantum dynamics by differentiable programming
CN110390390A (en) Utilize the deep learning accelerator architecture of piecemeal GEMM
WO2021093888A1 (en) Method for generating quantum circuit and related device
JP2022068327A (en) Node grouping method, apparatus therefor, and electronic device therefor
WO2022247092A1 (en) Methods and systems for congestion prediction in logic synthesis using graph neural networks
Selvanayagam et al. AI-assisted package design for improved warpage control of ultra-thin packages
CN115577777B (en) Method and device for determining device inductance energy ratio in superconducting quantum chip layout
US11922275B2 (en) System and method for determining a perturbation energy of a quantum state of a many-body system
CN114492815A (en) Method, device and medium for calculating target system energy based on quantum chemistry
JPWO2020162294A1 (en) Conversion method, training device and inference device
WO2022260171A1 (en) Estimation device and model generation method
WO2022260177A1 (en) Estimation device, training device, estimation method, training method, program, and non-transitory computer readable medium
WO2023190403A1 (en) Estimation device
WO2020217620A1 (en) Training device, estimation device, training method, estimation method, and program
JP2024054431A (en) Estimation device, training device, graph generation method, molecular structure, network generation method, and network

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22745849

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22745849

Country of ref document: EP

Kind code of ref document: A1