WO2024034688A1

WO2024034688A1 - 学習装置、推論装置及びモデル作成方法

Info

Publication number: WO2024034688A1
Application number: PCT/JP2023/029372
Authority: WO
Inventors: 清志郎小野; 伊織倉田; 聡高本
Original assignee: 株式会社Preferred Networks
Priority date: 2022-08-10
Filing date: 2023-08-10
Publication date: 2024-02-15

Abstract

実施形態に係る学習装置（１）は、少なくとも１つのメモリ（３３）、（３５）と、少なくとも１つのプロセッサ（３１）と、を備える学習装置（１）であって、少なくとも１つのプロセッサ（３１）は、物理パラメータの教師データを取得し、教師データを第１モデルに入力してポテンシャル関数を生成し、ポテンシャル関数を用いて物理パラメータの第１の値を出力し、物理パラメータの第１の値と教師データとに基づいて、第１モデルのネットワークパラメータを調整する。

Description

学習装置、推論装置及びモデル作成方法

　本開示の実施形態は、学習装置、推論装置及びモデル作成方法に関する。

　例えば多体の原子核・電子からなる物理系では、ハミルトニアンを厳密に求めることはできない。このため、係る物理系を取り扱う場合には、近似計算によってハミルトニアンを求めるのが一般的である。

　しかしながら、従来の近似計算手法による物理系のハミルトニアンの取得は、計算負荷が大きい。

ＬｉＬｉ，　Ｓｔｅｐｈａｎ　Ｈｏｙｅｒ，　Ｒｙａｎ　Ｐｅｄｅｒｓｏｎ，　Ｒｏｕｘｉ　Ｓｕｎ，　Ｅｋｉｎ　Ｄ．　Ｃｕｂｕｋ，　Ｐａｔｒｉｃｋ　Ｒｉｌｅｙ，　ａｎｄ　Ｋｉｅｒｏｎ　Ｂｕｒｋｅ　"Ｋｏｈｎ－Ｓｈａｍ　Ｅｑｕａｔｉｏｎ　ａｓ　Ｒｅｇｕｌａｒｉｚｅｒ：Ｂｕｉｌｄｉｎｇ　Ｐｒｉｏｒ　Ｋｎｏｗｌｅｄｇｅ　ｉｎｔｏ　Ｍａｃｈｉｎｅ－Ｌｅａｒｎｅｄ　Ｐｈｙｓｉｃｓ"　Ｐｈｙｓｉｃａｌ　Ｒｅｖｉｅｗ　Ｌｅｔｔｅｒｓ　１２６，　０３６４０１　（２０２１）Ｍ．　Ｆ．　Ｋａｓｉｍ，　ａｎｄ　Ｍ．　Ｖｉｎｋｏ　"Ｌｅａｒｎｉｎｇ　ｔｈｅ　ｅｘｃｈａｎｇｅ－ｃｏｒｒｅｌａｔｉｏｎ　ｆｕｎｃｔｉｏｎａｌ　ｆｒｏｍ　ｎａｔｕｒｅ　ｗｉｔｈ　ｆｕｌｌｙ　ｄｉｆｆｅｒｅｎｔｉａｂｌｅ　ｄｅｎｓｉｔｙ　ｆｕｎｃｔｉｏｎａｌ　ｔｈｅｏｒｙ"　ｈｔｔｐｓ：／／ｊｏｕｒｎａｌｓ．ａｐｓ．ｏｒｇ／ｐｒｌ／ａｂｓｔｒａｃｔ／１０．１１０３／ＰｈｙｓＲｅｖＬｅｔｔ．１２７．１２６４０３

　本開示が解決しようとする課題は、近似計算手法によって物理系のポテンシャル関数を取得する場合に、従来に比して計算負荷を小さくすることである。

　本開示に係る学習装置は、少なくとも１つのメモリと、少なくとも１つのプロセッサと、を備える学習装置であって、前記少なくとも１つのプロセッサは、物理パラメータの教師データを取得し、前記教師データを第１モデルに入力してポテンシャル関数を生成し、前記ポテンシャル関数を用いて前記物理パラメータの第１の値を出力し、前記物理パラメータの第１の値と前記教師データとに基づいて、前記第１モデルのネットワークパラメータを調整する。

図１は、本実施形態に係る学習装置のハードウェア構成の一例を示すブロック図である。図２は、実施形態に係るプロセッサにおける機能ブロックの一例を示す図である。図３は、ＳＣＦ計算処理の流れの一例を示すフローチャートである。図４は、ポテンシャル生成モデル学習処理の流れの一例を示すフローチャートである。図５は、ＳＣＦ計算処理を利用したファインチューニング処理の流れの一例を示したフローチャートである。図６は、比較例に係る学習装置のポテンシャル生成モデル学習処理の一例を示したフローチャートである。図７は、実施形態に係る学習済ポテンシャル生成モデルを用いるＳＣＦ計算処理の効果を説明するための図である。図８は、実施形態に係る学習済ポテンシャル生成モデルを用いるＳＣＦ計算処理の効果を説明するための図である。

　以下、図面を参照しながら実施形態に係る学習装置、推論装置及びモデル作成方法について説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作をおこなうものとして、重複する説明を適宜省略する。以下の実施形態は開示の技術を限定するものではない。そして、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

　実施形態に係る学習装置及び推論装置は、物理系の自由度によって決定されるポテンシャル関数（ハミルトニアン）と物理系の状態を示す物理パラメータとに基づいて、物理系の固定点（具体的には物理系のエネルギーの安定点）に対応する物理パラメータの値を再帰的計算によって取得する場合に利用されてもよい。

　以下においては、説明を具体的にするため、多数の原子核・電子からなる多体問題としての物理系を対象とする。係る物理系では、物理系の自由度によって決定されるハミルトニアンと、物理系の状態を示すパラメータとが相互に依存するため、物理系の固定点に対応する値を計算によって厳密に解くことができない。本実施形態では、ＳＣＦ（Ｓｅｌｆ　Ｃｏｎｓｉｓｔｅｎｔ　Ｆｉｅｌｄ：自己無撞着場）計算を用いて、この様な物理系の固定点に対応する値を求める。また、説明をより具体的にするため、物理系の状態を示す物理パラメータとして電子密度を用いてハミルトニアンを算出するＤＦＴ（Ｄｅｎｓｉｔｙ　Ｆｕｎｃｔｉｎａｌ　Ｔｈｅｏｒｙ：密度汎関数法）を想定する。

　図１は、本実施形態に係る学習装置１のハードウェア構成の一例を示すブロック図である。図１に示すように、学習装置１は、通信ネットワーク５を介して外部装置９Ａと接続されてもよい。また、学習装置１は、デバイスインタフェース３９を介して接続された外部装置９Ｂを備えてもよい。

　学習装置１は、コンピュータ３０と、デバイスインタフェース３９を介してコンピュータ３０に接続された外部装置９Ｂと、を有する。コンピュータ３０は、一例として、プロセッサ３１と、主記憶装置（メモリ）３３と、補助記憶装置（メモリ）３５と、ネットワークインタフェース３７と、デバイスインタフェース３９と、を備える。学習装置１は、プロセッサ３１と、主記憶装置３３と、補助記憶装置３５と、ネットワークインタフェース３７と、デバイスインタフェース３９とがバス４１を介して接続されたコンピュータ３０として実現されてもよい。

　図１に示すコンピュータ３０は、各構成要素を一つ備えているが、同じ構成要素を複数備えていてもよい。また、図１では、１台のコンピュータ３０が示されているが、ソフトウェアが複数台のコンピュータにインストールされて、当該複数台のコンピュータそれぞれがソフトウェアの同一の又は異なる一部の処理を実行してもよい。この場合、コンピュータそれぞれがネットワークインタフェース３７等を介して通信して処理を実行する分散コンピューティングの形態であってもよい。つまり、本実施形態における学習装置１は、１又は複数の記憶装置に記憶された命令を１台又は複数台のコンピュータが実行することで後述の各種機能を実現するシステムとして構成されてもよい。また、端末から送信された情報は、クラウド上に設けられた１台又は複数台のコンピュータで処理され、この処理結果は、外部装置９Ｂに相当する表示装置（表示部）などの端末に送信するような構成であってもよい。

　本実施形態における学習装置１の各種演算は、１又は複数のプロセッサを用いて、又は、ネットワークを介した複数台のコンピュータを用いて、並列処理で実行されてもよい。また、各種演算が、プロセッサ内に複数ある演算コアに振り分けられて、並列処理で実行されてもよい。また、本開示の処理、手段等の一部又は全部は、ネットワークを介してコンピュータ３０と通信可能なクラウド上に設けられたプロセッサ及び記憶装置の少なくとも一方により実行されてもよい。このように、本実施形態における後述の各種は、１台又は複数台のコンピュータによる並列コンピューティングの形態であってもよい。

　プロセッサ３１は、コンピュータ３０の制御装置及び演算装置を含む電子回路（処理回路、Ｐｒｏｃｅｓｓｉｎｇ　ｃｉｒｃｕｉｔ、Ｐｒｏｃｅｓｓｉｎｇ　ｃｉｒｃｕｉｔｒｙ、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）、又はＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）等）であってもよい。また、プロセッサ３１は、専用の処理回路を含む半導体装置等であってもよい。プロセッサ３１は、電子論理素子を用いた電子回路に限定されるものではなく、光論理素子を用いた光回路により実現されてもよい。また、プロセッサ３１は、量子コンピューティングに基づく演算機能を含むものであってもよい。

　プロセッサ３１は、コンピュータ３０の内部構成の各装置等から入力されたデータやソフトウェア（プログラム）に基づいて演算処理を行い、演算結果や制御信号を各装置等に出力することができる。プロセッサ３１は、コンピュータ３０のＯＳ（Ｏｐｅｒａｔｉｎｇ　Ｓｙｓｔｅｍ）や、アプリケーション等を実行することにより、コンピュータ３０を構成する各構成要素を制御してもよい。

　本実施形態における学習装置１は、１又は複数のプロセッサ３１により実現されてもよい。ここで、プロセッサ３１は、１チップ上に配置された１又は複数の電子回路を指してもよいし、２つ以上のチップあるいは２つ以上のデバイス上に配置された１又は複数の電子回路を指してもよい。複数の電子回路を用いる場合、各電子回路は有線又は無線により通信してもよい。

　主記憶装置３３は、プロセッサ３１が実行する命令及び各種データ等を記憶する記憶装置であり、主記憶装置３３に記憶された情報がプロセッサ３１により読み出される。補助記憶装置３５は、主記憶装置３３以外の記憶装置である。なお、これらの記憶装置は、電子情報を格納可能な任意の電子部品を意味するものとし、半導体のメモリでもよい。半導体のメモリは、揮発性メモリ、不揮発性メモリのいずれでもよい。本実施形態における学習装置１において用いられる各種データを保存するための記憶装置は、主記憶装置３３又は補助記憶装置３５により実現されてもよく、プロセッサ３１に内蔵される内蔵メモリにより実現されてもよい。例えば、本実施形態における記憶部は、主記憶装置３３又は補助記憶装置３５により実現されてもよい。

　記憶装置（メモリ）１つに対して、複数のプロセッサが接続（結合）されてもよいし、単数のプロセッサ３１が接続されてもよい。プロセッサ１つに対して、複数の記憶装置（メモリ）が接続（結合）されてもよい。本実施形態における学習装置１が、少なくとも１つの記憶装置（メモリ）とこの少なくとも１つの記憶装置（メモリ）に接続（結合）される複数のプロセッサで構成される場合、複数のプロセッサのうち少なくとも１つのプロセッサが、少なくとも１つの記憶装置（メモリ）に接続（結合）される構成を含んでもよい。また、複数台のコンピュータに含まれる記憶装置（メモリ）とプロセッサ３１とによって、この構成が実現されてもよい。さらに、記憶装置（メモリ）がプロセッサ３１と一体になっている構成（例えば、Ｌ１キャッシュ、Ｌ２キャッシュを含むキャッシュメモリ）を含んでもよい。

　ネットワークインタフェース３７は、無線又は有線により、通信ネットワーク５に接続するためのインタフェースである。ネットワークインタフェース３７は、既存の通信規格に適合したもの等、適切なインタフェースを用いればよい。ネットワークインタフェース３７により、通信ネットワーク５を介して接続された外部装置９Ａと情報のやり取りが行われてもよい。なお、通信ネットワーク５は、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＰＡＮ（Ｐｅｒｓｏｎａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）等の何れか、又は、それらの組み合わせであってよく、コンピュータ３０と外部装置９Ａとの間で情報のやり取りが行われるものであればよい。ＷＡＮの一例としてインターネット等があり、ＬＡＮの一例としてＩＥＥＥ８０２．１１やイーサネット（登録商標）等があり、ＰＡＮの一例としてＢｌｕｅｔｏｏｔｈ（登録商標）やＮＦＣ（Ｎｅａｒ　Ｆｉｅｌｄ　Ｃｏｍｍｕｎｉｃａｔｉｏｎ）等がある。

　デバイスインタフェース３９は、表示装置等の出力装置、入力装置、および外部装置９Ｂと直接接続するＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）等のインタフェースである。なお、出力装置は、音声等を出力するスピーカなどを有していてもよい。

　外部装置９Ａはコンピュータ３０とネットワークを介して接続されている装置である。外部装置９Ｂはコンピュータ３０と直接接続されている装置である。

　外部装置９Ａ又は外部装置９Ｂは、一例として、入力装置（入力部）であってもよい。入力装置は、例えば、カメラ、マイクロフォン、モーションキャプチャ、各種センサ、キーボード、マウス、又はタッチパネル等のデバイスであり、取得した情報をコンピュータ３０に与える。また、外部装置９Ａ又は外部装置９Ｂは、パーソナルコンピュータ、タブレット端末、又はスマートフォン等の入力部とメモリとプロセッサを備えるデバイス等であってもよい。

　また、外部装置９Ａ又は外部装置９Ｂは、一例として、出力装置（出力部）でもよい。出力装置は、例えば、ＬＣＤ（Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）、ＰＤＰ（Ｐｌａｓｍａ　Ｄｉｓｐｌａｙ　Ｐａｎｅｌ）、又は有機ＥＬ（Ｅｌｅｃｔｒｏ　Ｌｕｍｉｎｅｓｃｅｎｃｅ）パネル等の表示装置（表示部）であってもよいし、音声等を出力するスピーカ等であってもよい。また、外部装置９Ａ又は外部装置９Ｂは、パーソナルコンピュータ、タブレット端末、又はスマートフォン等の出力部とメモリとプロセッサを備えるデバイス等であってもよい。

　また、外部装置９Ａ又は外部装置９Ｂは、記憶装置（メモリ）であってもよい。例えば、外部装置９Ａはネットワークストレージ等であってもよく、外部装置９ＢはＨＤＤ等のストレージであってもよい。

　また、外部装置９Ａ又は外部装置９Ｂは、本実施形態における学習装置１の構成要素の一部の機能を有する装置でもよい。つまり、コンピュータ３０は、外部装置９Ａ又は外部装置９Ｂの処理結果の一部又は全部を、送信又は受信してもよい。

　図２は、プロセッサ３１における機能ブロックの一例を示す図である。プロセッサ３１は、それぞれニューラルネットワークとしてのＳＣＦ計算機能３１Ａと、ポテンシャル生成モデル学習機能３１Ｂとを備えてもよい。

　ＳＣＦ計算機能３１Ａ、ポテンシャル生成モデル学習機能３１Ｂが備える各機能は、それぞれプログラムとして、例えば、主記憶装置３３または補助記憶装置３５などに格納される。プロセッサ３１は、主記憶装置３３または補助記憶装置３５などに格納されたプログラムを読み出し、実行することで、ＳＣＦ計算機能３１Ａ、及びＳＣＦ計算機能３１Ａが備える各機能を実現してもよい。なお、ＳＣＦ計算機能３１Ａは第２モデルの一例である。

　なお、図２には、ポテンシャル生成モデル学習機能３１ＢがＳＣＦ計算機能３１Ａを含む構成として、一つのニューラルネットワークとして実現する場合を例とした。これに対し、ポテンシャル生成モデル学習機能３１ＢとＳＣＦ計算機能３１Ａとを別々のニューラルネットワークとして構成しても良い。

　以下、ＳＣＦ計算機能３１Ａ、ポテンシャル生成モデル学習機能３１Ｂについて詳しく説明する。

（ＳＣＦ計算機能）
　ＳＣＦ計算機能３１ＡはＳＣＦ計算を実行してもよい。ＳＣＦ計算では、初めに初期推定値としての電子密度を適当に決め、それに対する波動関数を計算し、得られた波動関数を用いて電子密度を更新し、更新された電子密度を用いて波動関数を計算し、得られた波動関数を用いて電子密度をさらに更新し、といった具合に、再帰的計算を逐次実行して電子密度と波動関数とを交互に求めていく。この様な再帰的計算を実行していく過程で物理系のエネルギーが固定点（物理系のエネルギーの安定点）に向かって下がって行き、収束した段階での波動関数、電子密度等を解とする。

　具体的には、ＳＣＦ計算機能３１Ａは、第１取得機能３１１、ポテンシャル生成モデル３１２、ＫＳ方程式計算機能３１３、電子密度計算機能３１４、判定機能３１５を備えてもよい。

　第１取得機能３１１は、ＳＣＦ計算に用いる初期推測値としての電子密度ｎ_jを取得してもよい。電子密度ｎ_jは、例えば、ベクトルとして表現される。

　ポテンシャル生成モデル３１２は、電子密度ｎ_ｊを入力として、物理系の自由度によって決定される第１のポテンシャル関数（ハミルトニアンＨ［ｎ_ｊ］）を生成してもよい。ポテンシャル関数は、例えば、ベクトルとして表現される。ポテンシャル生成モデル３１２は第１モデルの一例である。

　ＫＳ方程式計算機能３１３は、ポテンシャル生成モデル３１２によって生成されたハミルトニアンＨ［ｎ_ｊ］を用いて定義されるＫｏｈｎ－Ｓｈａｍ（ＫＳ）方程式を解き、波動関数Ψ_ｋを取得してもよい。なお、ＫＳ方程式計算機能３１３が解くべきＫＳ方程式は、以下の式（１）の様に表すことができる。

ここで、ｋは電子を識別する指標、ε_ｋはｋ番目の電子のエネルギー、Ψ_ｋはｋ番目の電子の波動関数を意味する。

　電子密度計算機能３１４は、ＫＳ方程式計算機能３１３が取得した波動関数Ψ_ｋを用いて、以下の式（２）を用いて電子密度ｎ_ｊ＋１を計算してもよい。

　なお、ＫＳ方程式を解いて得られた波動関数Ψ_ｋを用いて計算した電子密度ｎ_ｊ＋１は、物理系の固定点に対応する物理パラメータの一例である。

　判定機能３１５は、電子密度計算機能３１４によって得られた電子密度ｎ_ｊ＋１がハミルトニアンＨ［ｎ_ｊ］の計算に用いた電子密度ｎ_ｊに収束したか否か（例えば、電子密度ｎ_ｊ＋１と電子密度ｎ_ｊとの差が閾値を超えないか否か）を判定してもよい。

　次に、ＳＣＦ計算機能３１Ａによって実現されるＳＣＦ計算処理を説明する。

　図３は、ＳＣＦ計算処理の流れの一例を示すフローチャートである。図３に示した様に、まず、第１取得機能３１１は、初期推測値としての電子密度ｎ_jを取得してもよい（ステップＳ１１）。

　ポテンシャル生成モデル３１２は、電子密度ｎ_ｊ（＝ｎ_ｉ）を入力しハミルトニアンＨ［ｎ_j］を出力するニューラルネットワークとしてもよい（ステップＳ１２）。

　ＫＳ方程式計算機能３１３は、ハミルトニアンＨ［ｎ_j］を用いて定義されるＫＳ方程式を解き、波動関数Ψ_ｋを取得してもよい（ステップＳ１３）。

　電子密度計算機能３１４は、ＫＳ方程式計算機能３１３が取得した波動関数Ψ_ｋを用いて電子密度ｎ_ｊ＋１を計算してもよい（ステップＳ１４）。

　判定機能３１５は、電子密度ｎ_ｊ＋１が電子密度ｎ_ｊに収束したか否かを判定してもよい（ステップＳ１５）。判定機能３１５は、電子密度ｎ_ｊ＋１が電子密度ｎ_ｊに収束していないと判定した場合には（ステップＳ１５のＮｏ）、電子密度ｎ_ｊを電子密度ｎ_ｊ＋１に更新し（ステップＳ１６）、ステップＳ１２～ステップＳ１５の計算を繰り返し実行してもよい。一方、判定機能３１５は、電子密度ｎ_ｊ＋１が電子密度ｎ_ｊに収束したと判定した場合には（ステップＳ１５のＹｅｓ）、物理系の第１の固定点に対応する第１の値として、波動関数Ψ_ｋ、電子密度ｎ_ｊ＋１等の計算結果を出力してもよい（ステップＳ１７）。

（ポテンシャル生成モデル学習機能）
　ポテンシャル生成モデル学習機能３１Ｂにより、ポテンシャル生成モデル３１２は、Ｆｕｌｌ－ＣＩ（Ｆｕｌｌ－Ｃｏｎｆｉｇｕｒａｔｉｏｎ　Ｉｎｔｅｒａｃｔｉｏｎ）法、ＤＭＲＧ（Ｄｅｎｓｉｔｙ　Ｍａｔｒｉｘ　Ｒｅｎｏｒｍａｌｉｚａｔｉｏｎ　Ｇｒｏｕｐ：密度行列繰り込み群）法を用いて計算された電子密度ｎ_ｇを教師データとして学習してもよい。すなわち、ポテンシャル生成モデル学習機能３１Ｂは、図３に示したＳＣＦ計算処理を再帰的に実施することなく、厳密に計算された電子密度ｎ_ｇを教師データとしてポテンシャル生成モデルをトレーニングしてもよい。

　具体的には、ポテンシャル生成モデル学習機能３１Ｂは、ＳＣＦ計算機能３１Ａ、第２取得機能３１６、調整機能３１７を備えてもよい。

　第２取得機能３１６は、Ｆｕｌｌ－ＣＩ法等を用いて計算された教師データとしての電子密度ｎ_ｇを取得してもよい。なお、第２取得機能３１６は取得部の一例である。また、電子密度ｎ_ｇは、再帰的計算における物理パラメータの収束先としての基準値の一例である。

　調整機能３１７は、電子密度ｎ_ｇを教師データとしたポテンシャル生成モデルの学習処理において、ポテンシャル生成モデルのネットワークパラメータを調整してもよい。

　次に、ポテンシャル生成モデル学習機能３１Ｂによって実現されるポテンシャル生成モデル学習処理について説明する。

　図４は、ポテンシャル生成モデル学習処理の流れの一例を示すフローチャートである。図４に示した様に、まず、第２取得機能３１６は、Ｆｕｌｌ－ＣＩ法等を用いて計算された電子密度ｎ_ｇを取得してもよい（ステップＳ２１）。

　ポテンシャル生成モデル３１２は、電子密度ｎ_ｇを入力しハミルトニアンＨ［ｎ_ｇ］を出力してもよい（ステップＳ２２）。

　ＫＳ方程式計算機能３１３は、ハミルトニアンＨ［ｎ_ｇ］を用いて定義される式（３）のＫＳ方程式を解き、波動関数Ψ_ｋを取得してもよい（ステップＳ２３）。

　電子密度計算機能３１４は、ＫＳ方程式計算機能３１３が取得した波動関数Ψ_ｋを用いて、次の式（４）に従って電子密度ｎを計算してもよい（ステップＳ２４）。

なお、電子密度ｎは物理系の固定点に対応する物理パラメータの第１の値の一例である。

　判定機能３１５は、電子密度ｎが教師データとしての電子密度ｎ_ｇに収束したか否か（例えば、電子密度ｎと電子密度ｎ_ｇとの差が閾値を超えないか否か）を判定してもよい（ステップＳ２５）。

　電子密度ｎが教師データとしての電子密度ｎ_ｇに収束しないと判定された場合（ステップＳ２５のＮｏ）、調整機能３１７は、ハミルトニアンＨ［ｎ_ｇ］を用いて取得された電子密度ｎと電子密度ｎ_ｇとの差に基づいて、ポテンシャル生成モデル３１２のネットワークパラメータを調整してもよく（ステップＳ２６）、ステップＳ２２～ステップＳ２５の計算を繰り返し実行してもよい。一方、電子密度ｎが教師データとしての電子密度ｎ_ｇに収束したと判定された場合には（ステップＳ２５のＹｅｓ）、判定機能３１５は、ポテンシャル生成モデル３１２のネットワークパラメータを固定し学習を終了してもよい（ステップＳ２７）。

　図４に示した学習処理によって得られたポテンシャル生成モデル（学習済ポテンシャル生成モデル）は、ＳＣＦ計算処理を利用してファインチューニングすることができる。

　図５は、ＳＣＦ計算処理を利用したファインチューニング処理の流れの一例を示したフローチャートである。

　図５に示した様に、初期推測値としての電子密度ｎ_jを取得し（ステップＳ３１）、電子密度ｎ_jと学習済ポテンシャル生成モデルとを用いて、ハミルトニアンＨ［ｎ_j］を出力してもよい（ステップＳ３２）。得られたハミルトニアンＨ［ｎ_j］を用いて定義されるＫＳ方程式を解き、波動関数Ψ_ｋを取得してもよい（ステップＳ３３）。取得した波動関数Ψ_ｋを用いて電子密度ｎ_ｊ＋１を計算し（ステップＳ３４）、電子密度ｎ_ｊ＋１が電子密度ｎ_ｊに収束したか否かを判定する（ステップＳ３５）。なお、電子密度ｎ_ｊ＋１は、物理系の固定点に対応する物理パラメータの第２の値の一例である。

　電子密度ｎ_ｊ＋１が電子密度ｎ_ｊに収束していないと判定した場合には（ステップＳ３５のＮｏ）、調整機能３１７は、電子密度ｎ_ｊを電子密度ｎ_ｊ＋１に更新し（ステップＳ３６）、ステップＳ３２～ステップＳ３５の計算を繰り返し実行してもよい。一方、判定機能３１５は、電子密度ｎ_ｊ＋１が電子密度ｎ_ｊに収束したと判定した場合には（ステップＳ３５のＹｅｓ）、電子密度ｎ_ｊ＋１が電子密度ｎ_ｇに収束したかを判定し、収束していないと判定した場合には、（ステップＳ３７のＮｏ）、調整機能３１７は、学習済ポテンシャル生成モデルのネットワークパラメータを調整し（ステップＳ３８）、収束していると判定した場合には、処理を終了してもよい（ステップＳ３７のＹｅｓ）。

（比較例）
　次に、比較例に係る学習装置のポテンシャル生成モデル学習処理について説明する。

　図６は、比較例に係る学習装置のポテンシャル生成モデル学習処理の一例を示したフローチャートである。図６に示した様に、比較例に係る学習装置のポテンシャル生成モデル学習処理は、図３、図５に示したＳＣＦ計算処理と実質的に同じである。すなわち、比較例に係る学習装置は、ＳＣＦ計算処理全体を実行するニューラルネットワークを実装し、ポテンシャル生成モデルは、実行される再帰的演算のループの例えば電子密度ｎ_ｊを用いたハミルトニアンの計算において、ハミルトニアンを学習している（ステップＳ４２）。

　従って、比較例に係るポテンシャル生成モデル学習処理では、ポテンシャル生成モデルがハミルトニアンを学習する際に、計算負荷が大きいＫＳ方程式の固有値問題を解く必要がある。

　一方、実施形態に係るポテンシャル生成モデル学習処理は、ＳＣＦ計算処理を利用したファインチューニング処理を除けば、原則的に計算負荷が大きいＫＳ方程式の固有値問題を解く必要がない。従って、実施形態に係るポテンシャル生成モデル学習処理の計算負荷は、比較例に係るポテンシャル生成モデル学習処理の計算負荷に比して大幅に小さくすることができる。

　図７は、実施形態に係る学習済ポテンシャル生成モデルを用いるＳＣＦ計算処理（実施形態に係るＳＣＦ計算処理）の効果を説明するための図である。

　図７において、縦軸は教師データｎ_ｇとＳＣＦ計算処理によって得られた電子密度ｎとの誤差（ｌｏｓｓ）であり、横軸は計算時間（処理時間：秒）である。また、図７において、「ｐｒｅｔｒａｉｎｅｄ　ｔｒａｉｎ（事前学習ありｔｒａｉｎ）」はトレーニングデータを用いた実施形態に係るＳＣＦ計算処理の誤差の経時的変化を、「ｐｒｅｔｒａｉｎｅｄ　ｔｅｓｔ（事前学習ありｔｅｓｔ）」はテストデータを用いた実施形態に係るＳＣＦ計算処理の誤差の経時的変化を、「ｎｏｔ　ｐｒｅｔｒａｉｎｅｄ　ｔｒａｉｎ（事前学習なしｔｒａｉｎ）」はトレーニングデータを用いた比較例に係るＳＣＦ計算処理の誤差の経時的変化を、「ｎｏｔ　ｐｒｅｔｒａｉｎｅｄ　ｔｅｓｔ（事前学習なしｔｅｓｔ）」はテストデータを用いた比較例に係るＳＣＦ計算処理の誤差の経時的変化を、それぞれ示している。なお、いずれの場合も、ＳＣＦ計算処理のループを例えば５回に固定している。

　図７に示す様に、実施形態に係るＳＣＦ計算処理の誤差の経時的変化は、トレーニングデータ、テストデータのいずれの場合も、比較例に係るＳＣＦ計算処理の誤差の経時的変化と比較して約３倍早く収束している。また、実施形態に係るＳＣＦ計算処理の誤差の経時的変化は、トレーニングデータの場合とテストデータの場合との間で差が小さく汎化性能が高いと言える。

　図８は、実施形態に係る学習済ポテンシャル生成モデルを用いるＳＣＦ計算処理の効果を説明するための図であり、図７に示した各誤差の精度を説明するための図である。図８は、各誤差の計算を９回実行した場合の平均値、分散値を示している。図８に示した様に、実施形態に係るＳＣＦ計算処理の誤差の平均値は比較例に係るＳＣＦ計算処理の誤差の平均値よりも低く、計算精度の向上を実現している。

（推論装置）
　実施形態に係る推論装置は、実施形態に係る学習処理によって得られた学習済ポテンシャル生成モデルを実装するものである。例えば、実施形態に係る推論装置は、学習済ポテンシャル生成モデルを単独で実装するものであってもよいし、学習済ポテンシャル生成モデル用いるＳＣＦ計算処理を実行するモデルとしても実装することができる。

　以上述べた実施形態に係る学習装置１は、少なくとも１つのメモリ３３、３５と、少なくとも１つのプロセッサ３１と、を備える学習装置であって、少なくとも１つのプロセッサ３１は、物理パラメータの教師データを取得し、教師データとしての電子密度ｎ_ｇを第１モデルとしてのポテンシャル生成モデル３１２に入力してポテンシャル関数（ハミルトニアンＨ）を生成する。少なくとも１つのプロセッサ３１は、ポテンシャル関数を用いて物理パラメータの第１の値としての電子密度ｎ_ｊ＋１を出力し、物理パラメータの第１の値と教師データとに基づいて、第１モデルのネットワークパラメータを調整する。

　より具体的には、物理系の自由度によって決定されるポテンシャル関数（ハミルトニアンＨ）と物理系の状態を示す物理パラメータ（電子密度ｎ_ｊ）とに基づいて物理系の固定点に対応する物理パラメータの値を再帰的計算によって取得する場合において、ポテンシャル関数の生成に用いる第１モデルとしてのポテンシャル生成モデル３１２の学習に用いられる。学習装置１は、取得部としての第２取得機能３１６、計算部としてのＳＣＦ計算機能３１Ａ、調整部としての調整機能３１７を備える。第２取得機能３１６は、再帰的計算における電子密度ｎ_ｊの収束先としての基準値（教師データ）としての電子密度ｎ_ｇを取得する。ＳＣＦ計算機能３１Ａは、電子密度ｎ_ｇとポテンシャル生成モデル３１２とを用いてハミルトニアンＨを計算する。調整機能３１７は、計算されたハミルトニアンＨを用いて取得される物理系の固定点に対応する電子密度ｎ_ｊ＋１と基準値ｎ_ｇとの差に基づいて、ポテンシャル生成モデル３１２のネットワークパラメータを調整する。

　従って、実施形態に係る学習装置１によれば、ポテンシャル生成モデル３１２は、ＳＣＦの再帰的計算を実行せずに、事前学習として物理系のハミルトニアンを学習することができる。また、学習済ポテンシャル生成モデル３１２を実装する推論装置によれば、ＳＣＦの再帰的計算を実行せずに物理系のハミルトニアンを取得することができる。

　その結果、行列の対角化計算を含むＳＣＦの再帰的計算を実行して物理系のハミルトニアンを学習する場合に比べて、計算量を大幅に削減することができ、計算速度を向上させることができる。

　また、実施形態に係る学習装置１において、ＳＣＦ計算機能３１Ａは、ネットワークパラメータが調整された学習済ポテンシャル生成モデル３１２と電子密度の初期推定値ｎ_ｉとを用いてハミルトニアンを計算し、計算された当該ハミルトニアンに基づいて電子密度ｎを計算する。調整機能３１７は、初期推定値ｎ_ｉとＳＣＦ計算におけるハミルトニアンに基づく電子密度ｎとの差に基づいて、学習済ポテンシャル生成モデル３１２をさらに調整する。これにより、学習済ポテンシャル生成モデル３１２はファインチューニングされ、その汎化性能を向上させることができる。

　実施形態における技術的思想を学習方法で実現する場合、当該学習方法は、物理パラメータの教師データを取得し、教師データとしての電子密度ｎ_ｇを第１モデルとしてのポテンシャル生成モデル３１２に入力してポテンシャル関数（ハミルトニアンＨ）を生成する。当該学習方法は、ポテンシャル関数を用いて物理パラメータの第１の値としての電子密度ｎ_ｊ＋１を出力し、物理パラメータの第１の値と教師データとに基づいて、第１モデルのネットワークパラメータを調整する。学習方法に関する推定処理の手順および効果は、実施形態の記載と同様なため、説明は省略する。

　実施形態における技術的思想を学習プログラムで実現する場合、当該学習プログラムは、コンピュータを用いて、物理パラメータの教師データを取得し、教師データとしての電子密度ｎ_ｇを第１モデルとしてのポテンシャル生成モデル３１２に入力してポテンシャル関数（ハミルトニアンＨ）を生成する。当該学習方法は、ポテンシャル関数を用いて物理パラメータの第１の値としての電子密度ｎ_ｊ＋１を出力し、物理パラメータの第１の値と教師データとに基づいて、第１モデルのネットワークパラメータを調整する各ステップを実現させる。学習プログラムに関する推定処理の手順および効果は、実施形態の記載と同様なため、説明は省略する。

（変形例）
　上記実施形態おいては、説明を具体的にするため、物理系の状態を示すパラメータとして電子密度を用いてハミルトニアンを算出するＤＦＴを例として説明した。しかしながら、ＤＦＴは単なる一例である。すなわち、物理系の自由度によって決定されるポテンシャル関数と物理系の状態を示すパラメータとに基づいて、物理系の固定点に対応する値を再帰的計算によって取得する場合であれば、どの様な物理系であっても適用することができる。

　前述した実施形態における各装置の一部又は全部は、ハードウェアで構成されていてもよいし、ＣＰＵ、又はＧＰＵ等が実行するソフトウェア（プログラム）の情報処理で構成されてもよい。ソフトウェアの情報処理で構成される場合には、前述した実施形態における各装置の少なくとも一部の機能を実現するソフトウェアを、フレキシブルディスク、ＣＤ－ＲＯＭ（Ｃｏｍｐａｃｔ　Ｄｉｓｃ－Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、又はＵＳＢメモリ等の非一時的な記憶媒体（非一時的なコンピュータ可読媒体）に収納し、コンピュータ３０に読み込ませることにより、ソフトウェアの情報処理を実行してもよい。また、通信ネットワーク５を介して当該ソフトウェアがダウンロードされてもよい。さらに、ソフトウェアがＡＳＩＣ、又はＦＰＧＡ等の回路に実装されることにより、情報処理がハードウェアにより実行されてもよい。

　ソフトウェアを収納する記憶媒体の種類は限定されるものではない。記憶媒体は、磁気ディスク、又は光ディスク等の着脱可能なものに限定されず、ハードディスク、又はメモリ等の固定型の記憶媒体であってもよい。また、記憶媒体は、コンピュータ内部に備えられてもよいし、コンピュータ外部に備えられてもよい。

　本明細書（請求項を含む）において、「ａ、ｂ及びｃの少なくとも１つ（一方）」又は「ａ、ｂ又はｃの少なくとも１つ（一方）」の表現（同様な表現を含む）が用いられる場合は、ａ、ｂ、ｃ、ａ－ｂ、ａ－ｃ、ｂ－ｃ、又はａ－ｂ－ｃのいずれかを含む。また、ａ－ａ、ａ－ｂ－ｂ、ａ－ａ－ｂ－ｂ－ｃ－ｃ等のように、いずれかの要素について複数のインスタンスを含んでもよい。さらに、ａ－ｂ－ｃ－ｄのようにｄを有する等、列挙された要素（ａ、ｂ及びｃ）以外の他の要素を加えることも含む。

　本明細書（請求項を含む）において、「データを入力として／データに基づいて／に従って／に応じて」等の表現（同様な表現を含む）が用いられる場合は、特に断りがない場合、各種データそのものを入力として用いる場合や、各種データに何らかの処理を行ったもの（例えば、ノイズ加算したもの、正規化したもの、各種データの中間表現等）を入力として用いる場合を含む。また「データに基づいて／に従って／に応じて」何らかの結果が得られる旨が記載されている場合、当該データのみに基づいて当該結果が得られる場合を含むとともに、当該データ以外の他のデータ、要因、条件、及び／又は状態等にも影響を受けて当該結果が得られる場合をも含み得る。また、「データを出力する」旨が記載されている場合、特に断りがない場合、各種データそのものを出力として用いる場合や、各種データに何らかの処理を行ったもの（例えば、ノイズ加算したもの、正規化したもの、各種データの中間表現等）を出力とする場合も含む。

　本明細書（請求項を含む）において、「接続される（ｃｏｎｎｅｃｔｅｄ）」及び「結合される（ｃｏｕｐｌｅｄ）」との用語が用いられる場合は、直接的な接続／結合、間接的な接続／結合、電気的（ｅｌｅｃｔｒｉｃａｌｌｙ）な接続／結合、通信的（ｃｏｍｍｕｎｉｃａｔｉｖｅｌｙ）な接続／結合、機能的（ｏｐｅｒａｔｉｖｅｌｙ）な接続／結合、物理的（ｐｈｙｓｉｃａｌｌｙ）な接続／結合等のいずれをも含む非限定的な用語として意図される。当該用語は、当該用語が用いられた文脈に応じて適宜解釈されるべきであるが、意図的に或いは当然に排除されるのではない接続／結合形態は、当該用語に含まれるものして非限定的に解釈されるべきである。

　本明細書（請求項を含む）において、「ＡがＢするよう構成される（Ａ　ｃｏｎｆｉｇｕｒｅｄ　ｔｏ　Ｂ）」との表現が用いられる場合は、要素Ａの物理的構造が、動作Ｂを実行可能な構成を有するとともに、要素Ａの恒常的（ｐｅｒｍａｎｅｎｔ）又は一時的（ｔｅｍｐｏｒａｒｙ）な設定（ｓｅｔｔｉｎｇ／ｃｏｎｆｉｇｕｒａｔｉｏｎ）が、動作Ｂを実際に実行するように設定（ｃｏｎｆｉｇｕｒｅｄ／ｓｅｔ）されていることを含んでよい。例えば、要素Ａが汎用プロセッサである場合、当該プロセッサが動作Ｂを実行可能なハードウェア構成を有するとともに、恒常的（ｐｅｒｍａｎｅｎｔ）又は一時的（ｔｅｍｐｏｒａｒｙ）なプログラム（命令）の設定により、動作Ｂを実際に実行するように設定（ｃｏｎｆｉｇｕｒｅｄ）されていればよい。また、要素Ａが専用プロセッサ又は専用演算回路等である場合、制御用命令及びデータが実際に付属しているか否かとは無関係に、当該プロセッサの回路的構造が動作Ｂを実際に実行するように構築（ｉｍｐｌｅｍｅｎｔｅｄ）されていればよい。

　本明細書（請求項を含む）において、含有又は所有を意味する用語（例えば、「含む（ｃｏｍｐｒｉｓｉｎｇ／ｉｎｃｌｕｄｉｎｇ）」及び有する「（ｈａｖｉｎｇ）等）」が用いられる場合は、当該用語の目的語により示される対象物以外の物を含有又は所有する場合を含む、ｏｐｅｎ－ｅｎｄｅｄな用語として意図される。これらの含有又は所有を意味する用語の目的語が数量を指定しない又は単数を示唆する表現（ａ又はａｎを冠詞とする表現）である場合は、当該表現は特定の数に限定されないものとして解釈されるべきである。

　本明細書（請求項を含む）において、ある箇所において「１つ又は複数（ｏｎｅ　ｏｒ　ｍｏｒｅ）」又は「少なくとも１つ（ａｔ　ｌｅａｓｔ　ｏｎｅ）」等の表現が用いられ、他の箇所において数量を指定しない又は単数を示唆する表現（ａ又はａｎを冠詞とする表現）が用いられているとしても、後者の表現が「１つ」を意味することを意図しない。一般に、数量を指定しない又は単数を示唆する表現（ａ又はａｎを冠詞とする表現）は、必ずしも特定の数に限定されないものとして解釈されるべきである。

　本明細書において、ある実施例の有する特定の構成について特定の効果（ａｄｖａｎｔａｇｅ／ｒｅｓｕｌｔ）が得られる旨が記載されている場合、別段の理由がない限り、当該構成を有する他の１つ又は複数の実施例についても当該効果が得られると理解されるべきである。但し当該効果の有無は、一般に種々の要因、条件、及び／又は状態等に依存し、当該構成により必ず当該効果が得られるものではないと理解されるべきである。当該効果は、種々の要因、条件、及び／又は状態等が満たされたときに実施例に記載の当該構成により得られるものに過ぎず、当該構成又は類似の構成を規定したクレームに係る発明において、当該効果が必ずしも得られるものではない。

　本明細書（請求項を含む）において、「最大化（ｍａｘｉｍｉｚｅ）」等の用語が用いられる場合は、グローバルな最大値を求めること、グローバルな最大値の近似値を求めること、ローカルな最大値を求めること、及びローカルな最大値の近似値を求めることを含み、当該用語が用いられた文脈に応じて適宜解釈されるべきである。また、これら最大値の近似値を確率的又はヒューリスティックに求めることを含む。同様に、「最小化（ｍｉｎｉｍｉｚｅ）」等の用語が用いられる場合は、グローバルな最小値を求めること、グローバルな最小値の近似値を求めること、ローカルな最小値を求めること、及びローカルな最小値の近似値を求めることを含み、当該用語が用いられた文脈に応じて適宜解釈されるべきである。また、これら最小値の近似値を確率的又はヒューリスティックに求めることを含む。同様に、「最適化（ｏｐｔｉｍｉｚｅ）」等の用語が用いられる場合は、グローバルな最適値を求めること、グローバルな最適値の近似値を求めること、ローカルな最適値を求めること、及びローカルな最適値の近似値を求めることを含み、当該用語が用いられた文脈に応じて適宜解釈されるべきである。また、これら最適値の近似値を確率的又はヒューリスティックに求めることを含む。

　本明細書（請求項を含む）において、複数のハードウェアが所定の処理を行う場合、各ハードウェアが協働して所定の処理を行ってもよいし、一部のハードウェアが所定の処理の全てを行ってもよい。また、一部のハードウェアが所定の処理の一部を行い、別のハードウェアが所定の処理の残りを行ってもよい。本明細書（請求項を含む）において、「１又は複数のハードウェアが第１の処理を行い、前記１又は複数のハードウェアが第２の処理を行う」等の表現が用いられている場合、第１の処理を行うハードウェアと第２の処理を行うハードウェアは同じものであってもよいし、異なるものであってもよい。つまり、第１の処理を行うハードウェア及び第２の処理を行うハードウェアが、前記１又は複数のハードウェアに含まれていればよい。なお、ハードウェアは、電子回路、又は電子回路を含む装置を含んでよい。

　本明細書（請求項を含む）において、複数の記憶装置（メモリ）がデータの記憶を行う場合、複数の記憶装置（メモリ）のうち個々の記憶装置（メモリ）は、データの一部のみを記憶してもよいし、データの全体を記憶してもよい。

　以上、本開示の実施形態について詳述したが、本開示は上記した個々の実施形態に限定されるものではない。請求の範囲に規定された内容及びその均等物から導き出される本発明の概念的な思想と趣旨を逸脱しない範囲において種々の追加、変更、置き換え及び部分的削除等が可能である。例えば、前述した全ての実施形態において、数値又は数式を説明に用いている場合は、一例として示したものであり、これらに限られるものではない。また、実施形態における各動作の順序は、一例として示したものであり、これらに限られるものではない。

Claims

　少なくとも１つのメモリと、
　少なくとも１つのプロセッサと、を備える学習装置であって、
　前記少なくとも１つのプロセッサは、
　物理パラメータの教師データを取得し、
　前記教師データを第１モデルに入力してポテンシャル関数を生成し、
　前記ポテンシャル関数を用いて前記物理パラメータの第１の値を出力し、
　前記物理パラメータの第１の値と前記教師データとに基づいて、前記第１モデルのネットワークパラメータを調整する、
　学習装置。
　前記ネットワークパラメータが調整された前記第１モデルと前記物理パラメータの初期推定値とを用いて前記ポテンシャル関数を生成し、生成された当該ポテンシャル関数に基づいて、前記物理パラメータの第２の値を計算し、
　前記初期推定値と前記第２の値との差に基づいて、前記第１モデルのネットワークパラメータをさらに調整する、
　請求項１に記載の学習装置。
　前記ポテンシャル関数と前記物理パラメータとに基づいて前記物理パラメータの値を再帰的計算によって取得する第２モデルをさらに備え、
　前記第２モデルを用いて前記第２の値を計算する、
　請求項２に記載の学習装置。
　前記物理パラメータは電子密度である、
　請求項１に記載の学習装置。
　前記物理パラメータの前記教師データは、Ｆｕｌｌ－ＣＩ（Ｆｕｌｌ－Ｃｏｎｆｉｇｕｒａｔｉｏｎ　Ｉｎｔｅｒａｃｔｉｏｎ）法又はＤＭＲＧ（Ｄｅｎｓｉｔｙ　Ｍａｔｒｉｘ　Ｒｅｎｏｒｍａｌｉｚａｔｉｏｎ　Ｇｒｏｕｐ：密度行列繰り込み群）法を用いて計算された電子密度である、
　請求項１に記載の学習装置。
　前記ポテンシャル関数はハミルトニアンである、
　請求項１に記載の学習装置。
　前記第１モデルはニューラルネットワークである、
　請求項１に記載の学習装置。
　少なくとも１つのメモリと、
　少なくとも１つのプロセッサと、を備える推論装置であって、
　前記少なくとも１つのプロセッサは、
　物理パラメータの教師データを取得し、
　前記教師データを第１モデルに入力してポテンシャル関数を生成し、
　前記ポテンシャル関数を用いて前記物理パラメータの第１の値を出力し、
　前記物理パラメータの第１の値と前記教師データとに基づいて、前記第１モデルのネットワークパラメータを調整し、学習した、
　推論装置。
　請求項１に記載の学習装置を用いてモデルを生成する、
　モデル作成方法。