WO2024069839A1

WO2024069839A1 - 推定プログラム、情報処理装置および機械学習方法

Info

Publication number: WO2024069839A1
Application number: PCT/JP2022/036413
Authority: WO
Inventors: 翔竹森; 裕平梅田
Original assignee: 富士通株式会社
Priority date: 2022-09-29
Filing date: 2022-09-29
Publication date: 2024-04-04

Abstract

量子化学計算のアルゴリズムの反復回数を推定する。　コンピュータは、分子に対応するエネルギーを反復処理によって算出するアルゴリズムのうち、量子回路データを用いるアルゴリズム（１４）と異なるアルゴリズム（１３）を、分析対象の分子を示す分子情報（１６）に基づいて実行し、アルゴリズム（１３）の反復回数（１７）を特定する。コンピュータは、アルゴリズム（１３）の反復回数を説明変数とし、アルゴリズム（１４）の反復回数を目的変数として訓練された機械学習モデル（１５）に、反復回数（１７）を入力する。コンピュータは、機械学習モデル（１５）によって算出された、分子情報（１６）に基づいてアルゴリズム（１４）を実行する場合の反復回数（１８）の推定値を出力する。

Description

推定プログラム、情報処理装置および機械学習方法

　本発明は推定プログラム、情報処理装置および機械学習方法に関する。

　コンピュータは、数値計算を通じて分子の特性を分析する分子シミュレーションを行うことがある。分子シミュレーションは、材料開発や医薬品開発などの産業分野で利用されることがある。分子シミュレーションには、分子の電子状態とシュレーディンガー方程式とに基づいて微視的に分子のエネルギーを算出する量子化学計算が含まれる。

　量子化学計算のアルゴリズムには、変分量子固有値ソルバ法（ＶＱＥ：Variational Quantum Eigensolver）など、量子回路データを用いるアルゴリズムがある。量子回路データを用いるアルゴリズムは、量子コンピュータが実行することも可能である。また、量子化学計算のアルゴリズムには、配置間相互作用法（ＣＩ： Configuration Interaction）や結合クラスタ法（ＣＣ：Coupled Cluster）など、他のアルゴリズムもある。

　典型的なアルゴリズムは、電子配置を変えながら分子のエネルギーを繰り返し算出する反復処理を行う。アルゴリズムは、エネルギーの算出結果が収束するまで、反復処理を継続することがある。アルゴリズムは、エネルギーが最小になる電子配置を探索することがあり、最小のエネルギーを分子の基底エネルギーとして出力することがある。

　なお、配置間相互作用法において、分子がもつ複数の分子軌道のうち一部の分子軌道を動的に選択し、選択した分子軌道に限定した電子配置に基づいて分子のエネルギーを算出する量子化学計算装置が提案されている。

国際公開第２０２２／０９７２９８号

　コンピュータは、量子回路データを用いるアルゴリズムの反復回数を、そのアルゴリズムの実行前に推定したいことがある。例えば、コンピュータは、反復回数の推定値を利用して、分子のエネルギーを算出するジョブのスケジューリングを行うことが考えられる。

　しかし、アルゴリズムの反復回数は分析対象の分子によって大きく異なることがあり、精度よく推定することは容易でない。例えば、エネルギーの算出結果が収束するまでの反復回数は分子によって大きく異なることがあり、アルゴリズムが使用する量子回路データのみから推定することは容易でないことがある。そこで、１つの側面では、本発明は、量子化学計算のアルゴリズムの反復回数を推定することを目的とする。

　１つの態様では、以下の処理をコンピュータに実行させることを特徴とする推定プログラムが提供される。分子に対応するエネルギーを反復処理によって算出するアルゴリズムのうち、量子回路データを用いる第２のアルゴリズムと異なる第１のアルゴリズムを、分析対象の分子を示す分子情報に基づいて実行し、第１のアルゴリズムの第１の反復回数を特定する。第１のアルゴリズムの反復回数を説明変数とし、第２のアルゴリズムの反復回数を目的変数として訓練された第１の機械学習モデルに、第１の反復回数を入力する。第１の機械学習モデルによって算出された、分子情報に基づいて第２のアルゴリズムを実行する場合の第２の反復回数の推定値を出力する。また、１つの態様では、記憶部と制御部とを有することを特徴とする情報処理装置が提供される。

　また、１つの態様では、以下の処理をコンピュータが実行することを特徴とする機械学習方法が提供される。分子に対応するエネルギーを反復処理によって算出するアルゴリズムのうち、量子回路データを用いる第２のアルゴリズムと、第２のアルゴリズムと異なる第１のアルゴリズムとを、サンプルの分子を示す分子情報に基づいてそれぞれ実行し、第１のアルゴリズムの第１の反復回数と第２のアルゴリズムの第２の反復回数とを特定する。第１の反復回数および第２の反復回数を含む訓練データを用いて、第１のアルゴリズムの反復回数を説明変数とし、第２のアルゴリズムの反復回数を目的変数とする第１の機械学習モデルを訓練する。

　１つの側面では、量子化学計算のアルゴリズムの反復回数を推定できる。
　本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。

第１の実施の形態の情報処理装置を説明するための図である。第２の実施の形態の情報処理装置のハードウェア例を示す図である。異なるアルゴリズムの精度および実行時間の比較例を示す図である。ジョブスケジューリングの例を示す図である。時間モデルおよび反復モデルの入出力データの例を示す図である。情報処理装置の機能例を示すブロック図である。機械学習の手順例を示すフローチャートである。実行時間推定の手順例を示すフローチャートである。実行時間の推定精度の例を示すグラフである。

　以下、本実施の形態を図面を参照して説明する。まず、第１の実施の形態を説明する。図１は、第１の実施の形態の情報処理装置を説明するための図である。情報処理装置１０は、機械学習モデルを用いて、量子化学計算のアルゴリズムの反復回数を推定する。

　情報処理装置１０は、機械学習モデルを訓練してもよく、反復回数を推定したアルゴリズムを実行してもよい。また、情報処理装置１０は、推定した反復回数に基づいて、量子化学計算のジョブのスケジューリングを行ってもよい。情報処理装置１０は、クライアント装置でもよいしサーバ装置でもよい。情報処理装置１０が、コンピュータ、推定装置、機械学習装置、分子シミュレーション装置またはジョブスケジューラと呼ばれてもよい。

　情報処理装置１０は、記憶部１１および制御部１２を有する。記憶部１１は、ＲＡＭ（Random Access Memory）などの揮発性半導体メモリでもよいし、ＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの不揮発性ストレージでもよい。

　制御部１２は、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）などのプロセッサである。ただし、制御部１２が、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの電子回路を含んでもよい。プロセッサは、例えば、ＲＡＭなどのメモリ（記憶部１１でもよい）に記憶されたプログラムを実行する。プロセッサの集合が、マルチプロセッサまたは単に「プロセッサ」と呼ばれてもよい。

　記憶部１１は、訓練済みの機械学習モデル１５を記憶する。機械学習モデル１５は、線形回帰モデルでもよく、非線形回帰モデルでもよく、回帰モデル以外の機械学習モデルでもよい。機械学習モデル１５は、アルゴリズム１３の反復回数を説明変数とし、アルゴリズム１４の反復回数を目的変数として訓練される。よって、機械学習モデル１５は、アルゴリズム１３の反復回数からアルゴリズム１４の反復回数を推定する。説明変数は、分子に含まれる複数の原子の間の距離など、分子に関する他の特徴量を含んでもよい。

　アルゴリズム１３，１４は、量子化学計算用のアルゴリズムであり、分子に対応するエネルギーを反復処理によって算出する。アルゴリズム１３，１４は、例えば、分子の電子配置を変えながら分子のエネルギーを繰り返し算出し、その分子の最小のエネルギーを、分子が安定状態にあるときの基底エネルギーとして算出する。反復処理は、例えば、エネルギーの算出結果が収束条件を満たすまで継続される。収束条件は、例えば、最新のエネルギーと１回前のエネルギーとの差が閾値未満であることである。

　アルゴリズム１４は、量子回路データを用いるアルゴリズムである。アルゴリズム１４は、例えば、ＶＱＥである。アルゴリズム１４は、ゲート型の量子コンピュータにより実行されることがある。また、アルゴリズム１４は、ノイマン型の古典コンピュータ上で量子コンピュータの動作をシミュレートする量子シミュレータにより実行されることがある。アルゴリズム１４は、量子アルゴリズムと呼ばれてもよい。

　量子回路データは、量子ビットに対するゲート操作を規定する量子計算モデルである。例えば、量子回路データは、１以上の量子ビットを用いて量子状態を生成するアンザッツ（Ansatz）回路と、量子状態にハミルトニアンを適用してエネルギーを測定する測定回路とを規定する。アンザッツ回路および測定回路はそれぞれ、直列に並んだ１以上の量子ゲートを含む。量子ゲートには、制御ノット（ＣＮＯＴ：Controlled NOT）ゲート、制御Ｚ（ＣＺ：Controlled Z）ゲート、位相シフトゲート、アダマールゲートなどがある。

　量子回路データは、分析対象の分子を示す分子情報から生成される。例えば、アンザッツ回路は、分子軌道を表現する基底関数から生成される。測定回路は、分子の種類に応じたハミルトニアンを表現するパウリ行列から生成される。量子回路データの生成は、アルゴリズム１４の前処理と呼ばれることがある。

　アルゴリズム１３は、アルゴリズム１４と異なるアルゴリズムである。例えば、アルゴリズム１３は、量子回路データを用いない。アルゴリズム１３は、ノイマン型の古典コンピュータにより実行される。アルゴリズム１３は、古典アルゴリズムと呼ばれてもよい。アルゴリズム１３の計算量および実行時間は、アルゴリズム１４よりも十分に小さいことが好ましい。アルゴリズム１３は、例えば、配置間相互作用法または結合クラスタ法である。配置間相互作用法は、ＣＩＳＤ（Configuration Interaction Singles and Doubles）を含む。結合クラスタ法は、ＣＣＳＤ（Coupled Cluster Singles and Doubles）や、ＣＣＳＤ（Ｔ）（Coupled Cluster Singles and Doubles（and Triples））を含む。

　制御部１２は、分析対象の分子を示す分子情報１６を取得する。分子情報１６は、例えば、分子に含まれる複数の原子それぞれの種類を示す。また、分子情報１６は、例えば、分子に含まれる複数の原子それぞれの位置座標を示す。分子情報１６は、ユーザから入力されてもよく、記憶部１１に記憶されてもよい。制御部１２は、分子情報１６に基づいてアルゴリズム１４を実行する場合の反復回数を、アルゴリズム１４の実行前に推定する。

　まず、制御部１２は、分子情報１６に基づいてアルゴリズム１３を実行する。ただし、制御部１２は、アルゴリズム１３を他の情報処理装置に実行させてもよい。アルゴリズム１３により、分子情報１６が示す分子のエネルギーが算出される。このとき、制御部１２は、分子情報１６に対するアルゴリズム１３の反復回数１７を特定する。反復回数１７は、例えば、分子情報１６から算出されるエネルギーが収束するまでにアルゴリズム１３によって行われた反復処理のイテレーション数である。

　次に、制御部１２は、機械学習モデル１５に反復回数１７を入力する。機械学習モデル１５により、反復回数１７に対応する反復回数１８が算出される。反復回数１８は、分子情報１６に基づいてアルゴリズム１４を実行する場合の反復回数の推定値である。例えば、反復回数１８は、分子情報１６から算出されるエネルギーが収束するまでにアルゴリズム１４によって行われる反復処理のイテレーション数である。反復回数１８は、反復回数１７と一致しないことが多いものの、反復回数１７と正の相関をもつ。よって、反復回数１７が大きいほど、反復回数１８が大きいことが多い。

　そして、制御部１２は、推定された反復回数１８を出力する。制御部１２は、推定された反復回数１８を不揮発性ストレージに記録してもよいし、表示装置に表示してもよいし、他の情報処理装置に送信してもよい。

　また、制御部１２は、反復回数１８を用いて、分子情報１６に対するアルゴリズム１４の実行時間を推定してもよい。例えば、制御部１２は、イテレーション１回当たりの単位実行時間と反復回数１８との積を、実行時間と推定する。単位実行時間は、固定値でもよく、アルゴリズム１４が用いる量子回路データの規模から推定されてもよい。単位実行時間は、機械学習モデル１５とは別の機械学習アルゴリズムを用いて推定されてもよい。

　制御部１２は、推定された実行時間を出力してもよい。制御部１２は、推定された実行時間を不揮発性ストレージに記録してもよいし、表示装置に表示してもよいし、他の情報処理装置に送信してもよい。また、制御部１２は、推定された実行時間に基づいて、アルゴリズム１４の実行を制御してもよい。

　また、制御部１２は、分子情報１６が示す分子のエネルギーを算出するジョブのスケジューリングを行ってもよい。例えば、制御部１２は、推定された実行時間に基づいて、ジョブに割り当てるハードウェアリソースを決定する。また、例えば、制御部１２は、推定された実行時間に基づいて、ジョブの開示予定時刻や終了予定時刻を決定する。また、例えば、制御部１２は、推定された実行時間に基づいて、アルゴリズム１４を使用するか他のアルゴリズムを使用するかを決めるアルゴリズム選択を行う。

　以上説明したように、第１の実施の形態の情報処理装置１０は、分子情報１６に基づいてアルゴリズム１３を実行し、アルゴリズム１３の反復回数１７を特定する。情報処理装置１０は、アルゴリズム１３の反復回数を説明変数とし、アルゴリズム１４の反復回数を目的変数として訓練された機械学習モデル１５に、反復回数１７を入力する。情報処理装置１０は、機械学習モデル１５によって算出された、分子情報１６に基づいてアルゴリズム１４を実行する場合の反復回数１８の推定値を出力する。

　これにより、アルゴリズム１４の実行前にアルゴリズム１４の反復回数１８が推定される。よって、アルゴリズム１４の実行制御やジョブスケジューリングなどに利用可能な有用な情報が提供される。また、反復回数１８と相関のあるアルゴリズム１３の反復回数１７を使用するため、反復回数１８の推定精度が向上する。特に、量子回路データの特徴を示す特徴量のみから反復回数１８を推定する場合よりも、推定精度が向上する。

　なお、機械学習モデル１５の説明変数は、原子間距離を更に含んでもよい。情報処理装置１０は、分子情報１６が示す原子間距離を、反復回数１７に加えて機械学習モデル１５に入力してもよい。これにより、分子に含まれる原子の種類が同じであっても、原子間距離に応じて異なる反復回数１８が算出される。例えば、原子間距離が大きいほど反復回数１８が大きくなる。よって、反復回数１８の推定精度が向上する。

　また、情報処理装置１０は、分子情報１６に基づいてアルゴリズム１４を実行する場合に用いられる量子回路データの特徴量を特定してもよい。情報処理装置１０は、量子回路データの特徴量を説明変数とし、反復処理に含まれるイテレーション１回当たりの単位実行時間を目的変数として訓練された他の機械学習モデルに、特定した特徴量を入力してもよい。そして、情報処理装置１０は、当該他の機械学習モデルによって算出された、アルゴリズム１４の単位実行時間の推定値を出力してもよい。これにより、アルゴリズム１４の実行制御やジョブスケジューリングなどに利用可能な有用な情報が提供される。

　また、情報処理装置１０は、反復回数１８の推定値と単位実行時間の推定値とに基づいて、アルゴリズム１４の実行時間を推定してもよい。これにより、アルゴリズム１４の実行制御やジョブスケジューリングなどに利用可能な有用な情報が提供される。また、アルゴリズム１４の実行時間の推定精度が向上する。特に、量子回路データの特徴量のみから実行時間を推定する場合よりも、推定精度が向上する。

　また、情報処理装置１０は、推定された実行時間に基づいて、分子のエネルギーを算出するジョブのスケジューリングを行ってもよい。これにより、精度の高い推定実行時間に基づいてジョブのスケジューリングが行われ、サーバ装置やプロセッサなどのハードウェアリソースの利用効率が向上する。また、ジョブの終了時刻が早くなる。

　また、アルゴリズム１３は、配置間相互作用法または結合クラスタ法であってもよく、アルゴリズム１４は、変分量子固有値ソルバ法であってもよい。これにより、アルゴリズム１４の実行時間よりも十分に短い時間で、反復回数１８が迅速に推定される。また、反復回数１７が反復回数１８と正の相関をもち、反復回数１８の推定精度が向上する。

　また、情報処理装置１０は、以下のように機械学習モデル１５を訓練してもよい。例えば、情報処理装置１０は、アルゴリズム１３，１４を、サンプルの分子を示す分子情報に基づいてそれぞれ実行し、アルゴリズム１３の反復回数とアルゴリズム１４の反復回数とを特定する。情報処理装置１０は、特定した反復回数を含む訓練データを用いて、アルゴリズム１３の反復回数を説明変数とし、アルゴリズム１４の反復回数を目的変数とする機械学習モデル１５を訓練する。

　例えば、情報処理装置１０は、機械学習モデル１５としての回帰モデルのフィッティングを行い、機械学習モデル１５に含まれるパラメータ値を最適化する。これにより、アルゴリズム１４の反復回数の推定精度が向上する。

　次に、第２の実施の形態を説明する。第２の実施の形態の情報処理装置１００は、分子のエネルギーを算出する量子化学計算のジョブのスケジューリングを行う。情報処理装置１００は、スケジューリングのために、ＶＱＥの実行前にＶＱＥの実行時間を推定する。

　量子化学計算のアルゴリズムは、情報処理装置１００によって実行されてもよいし、他の情報処理装置によって実行されてもよい。また、実行時間の推定に用いる機械学習モデルは、情報処理装置１００によって訓練されてもよいし、他の情報処理装置によって訓練されてもよい。情報処理装置１００は、クライアント装置でもよいしサーバ装置でもよい。情報処理装置１００が、コンピュータ、推定装置、機械学習装置、分子シミュレーション装置またはジョブスケジューラと呼ばれてもよい。情報処理装置１００は、第１の実施の形態の情報処理装置１０に対応する。

　図２は、第２の実施の形態の情報処理装置のハードウェア例を示す図である。情報処理装置１００は、バスに接続されたＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ１０３、ＧＰＵ１０４、入力インタフェース１０５、媒体リーダ１０６および通信インタフェース１０７を有する。ＣＰＵ１０１は、第１の実施の形態の制御部１２に対応する。ＲＡＭ１０２またはＨＤＤ１０３は、第１の実施の形態の記憶部１１に対応する。

　ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムおよびデータをＲＡＭ１０２にロードし、プログラムを実行する。情報処理装置１００は、複数のプロセッサを有してもよい。

　ＲＡＭ１０２は、ＣＰＵ１０１で実行されるプログラムおよびＣＰＵ１０１で演算に使用されるデータを一時的に記憶する揮発性半導体メモリである。情報処理装置１００は、ＲＡＭ以外の種類の揮発性メモリを有してもよい。

　ＨＤＤ１０３は、オペレーティングシステム（ＯＳ：Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラムと、データとを記憶する不揮発性ストレージである。情報処理装置１００は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の不揮発性ストレージを有してもよい。

　ＧＰＵ１０４は、ＣＰＵ１０１と連携して画像処理を行い、情報処理装置１００に接続された表示装置１１１に画像を出力する。表示装置１１１は、例えば、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイまたはプロジェクタである。情報処理装置１００に、プリンタなどの他の種類の出力デバイスが接続されてもよい。

　また、ＧＰＵ１０４は、ＧＰＧＰＵ（General Purpose Computing on Graphics Processing Unit）として使用されてもよい。ＧＰＵ１０４は、ＣＰＵ１０１からの指示に応じてプログラムを実行し得る。情報処理装置１００は、ＲＡＭ１０２以外の揮発性半導体メモリをＧＰＵメモリとして有してもよい。

　入力インタフェース１０５は、情報処理装置１００に接続された入力デバイス１１２から入力信号を受け付ける。入力デバイス１１２は、例えば、マウス、タッチパネルまたはキーボードである。情報処理装置１００に複数の入力デバイスが接続されてもよい。

　媒体リーダ１０６は、記録媒体１１３に記録されたプログラムおよびデータを読み取る読み取り装置である。記録媒体１１３は、例えば、磁気ディスク、光ディスクまたは半導体メモリである。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）およびＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）およびＤＶＤ（Digital Versatile Disc）が含まれる。媒体リーダ１０６は、記録媒体１１３から読み取られたプログラムおよびデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、ＣＰＵ１０１によって実行されることがある。

　記録媒体１１３は、可搬型記録媒体であってもよい。記録媒体１１３は、プログラムおよびデータの配布に用いられることがある。また、記録媒体１１３およびＨＤＤ１０３が、コンピュータ読み取り可能な記録媒体と呼ばれてもよい。

　通信インタフェース１０７は、ネットワーク１１４を介して他の情報処理装置と通信する。通信インタフェース１０７は、スイッチやルータなどの有線通信装置に接続される有線通信インタフェースでもよいし、基地局やアクセスポイントなどの無線通信装置に接続される無線通信インタフェースでもよい。

　次に、量子化学計算のアルゴリズムについて説明する。量子化学計算は、分子シミュレーションの一種であり、分子構造や分子間相互作用を電子状態から解析する。量子化学計算は、材料開発の支援や医薬品開発の支援に用いられることがある。量子化学計算は、微視的な分子シミュレーションであり、解析精度が高いものの計算負荷が高い。

　量子化学計算は、シュレーディンガー方程式ＨΨ＝ＥΨを解く。Ｈはハミルトニアン、Ψは波動関数、Ｅはエネルギーである。ハミルトニアンＨは、対象の分子構造に依存する。波動関数Ψは電子の固有状態に相当し、エネルギーＥはΨに対応する固有エネルギーに相当する。量子化学計算は、分子構造が安定しているときの基底エネルギーを算出する。ただし、シュレーディンガー方程式を直接解くことは難しい。

　そこで、量子化学計算は、波動関数Ψを基底関数で表現する。基底関数は、既知関数の線形結合である。基底関数に含まれる複数の項それぞれが、分子軌道に対応する。分子軌道は、分子に含まれる電子のうち何れか１つの電子が入る可能性のある場所である。量子化学計算は、分子に含まれる複数の原子の位置座標を示す分子情報、求解アルゴリズムおよび基底関数の指定を受け付け、指定された情報に基づいて基底エネルギーを算出する。

　量子化学計算は、ポテンシャルエネルギー曲線を生成することがある。ポテンシャルエネルギー曲線は、異なる原子間距離に対応するポテンシャルエネルギーを示す。ポテンシャルエネルギーは、各原子が静止していると仮定した場合に分子がもつエネルギーである。ポテンシャルエネルギー曲線の横軸は、着目する特定の２つの原子の間の距離を表す。ポテンシャルエネルギー曲線の縦軸は、基底エネルギーを表す。

　距離の単位は、例えば、オングストローム（Å）である。エネルギーの単位は、例えば、ハートリーである。エネルギーは、一定範囲に含まれる離散的な複数の距離それぞれに対して算出される。それら複数の距離は、等間隔であってもよい。例えば、エネルギーは、０．５Åから３．０Åまで０．１Å間隔で算出される。算出されたエネルギーをプロットして線で結ぶことで、ポテンシャルエネルギー曲線が生成される。ポテンシャルエネルギー曲線の極小点は、分子の最も安定した状態を表すことがある。ポテンシャルエネルギー曲線の極大点は、分子の遷移状態を表すことがある。

　量子化学計算のジョブには、異なる種類の分子に対するエネルギーを算出するジョブが含まれることがある。また、量子化学計算のジョブには、種類が同一で距離設定が異なる分子に対するエネルギーを算出するジョブが含まれることがある。また、量子化学計算のジョブには、異なるユーザから要求されたジョブが含まれることがある。

　図３は、異なるアルゴリズムの精度および実行時間の比較例を示す図である。量子化学計算のアルゴリズムには、ノイマン型の古典コンピュータでの実行を想定した古典アルゴリズムと、ゲート型の量子コンピュータでの実行を想定した量子アルゴリズムとがある。ただし、量子アルゴリズムは、量子コンピュータの動作をシミュレートするソフトウェアと古典コンピュータとを用いて実行されることがある。第２の実施の形態では、量子アルゴリズムが、このようなシミュレータを用いて実行される場合を想定する。

　量子化学計算のアルゴリズムの例として、図３に示すように、アルゴリズム３１，３２，３３，３４が挙げられる。アルゴリズム３１は、ＶＱＥである。ＶＱＥは、量子アルゴリズムに属する。アルゴリズム３２は、ＣＩＳＤである。ＣＩＳＤは、配置間相互作用法に属する。アルゴリズム３３は、ＣＣＳＤである。アルゴリズム３４は、ＣＣＳＤ（Ｔ）である。ＣＣＳＤ，ＣＣＳＤ（Ｔ）は、結合クラスタ法に属する。ＣＩＳＤ，ＣＣＳＤ，ＣＣＳＤ（Ｔ）は、古典アルゴリズムに属する。

　ＶＱＥは、指定された基底関数に基づいて、複数の量子ビットを用いて量子状態を生成する量子回路を生成する。この量子回路は、アンザッツ回路と呼ばれることがある。また、ＶＱＥは、指定された分子情報に応じたハミルトニアンに基づいて、量子状態からエネルギーを測定する量子回路を生成する。この量子回路は、測定回路と呼ばれることがある。量子回路は、量子ゲートの組み合わせにより記述される量子計算モデルである。量子回路の生成は、ＶＱＥの前処理と呼ばれることがある。

　量子コンピュータを用いる場合、物理的な量子ビットを用いて量子回路が実装される。量子シミュレータを用いる場合、擬似的な量子ビットデータがメモリに記憶され、擬似的な量子ゲート操作が古典プログラムを用いて実装される。

　ＶＱＥは、アンザッツ回路を用いて量子状態を生成し、測定回路を用いてエネルギーを測定する。個々の測定値は、ノイズや揺らぎの影響を受けている。ＶＱＥは、同一の電子配置に関して量子状態の生成およびエネルギーの測定を複数回行い、その平均値をエネルギーの期待値として算出する。ＶＱＥは、エネルギーの期待値が小さくなるように、量子状態を生成するためのパラメータ値を変更する。パラメータ値の変更は、電子配置の変更に相当する。ＶＱＥは、上記の処理を繰り返すことで、基底エネルギーを探索する。例えば、ＶＱＥは、エネルギーの期待値が収束するまで上記の処理を繰り返す。

　量子シミュレータを用いる場合、量子ビットが１ビット増加する毎に、古典コンピュータのメモリ使用量および計算量が２倍になる。ＶＱＥの解の精度は、古典アルゴリズムよりも高い。ただし、ＶＱＥの実行時間は、古典アルゴリズムよりも顕著に長い。ＶＱＥの実行時間は、古典アルゴリズムの１０００倍になることもある。

　ＣＩＳＤは、指定された分子情報および基底関数のもとで、ボルン－オッペンハイマー近似を用いてシュレーディンガー方程式の近似解を求める。ＣＩＳＤは、電子状態として、１電子励起および２電子励起がエネルギーに与える影響を考慮し、３電子励起以上の電子励起の影響を無視する。ＣＩＳＤは、電子配置を変えながらエネルギーを繰り返し算出し、最小のエネルギーを探索する。ＣＩＳＤは、算出されるエネルギーが収束するまで反復処理を行う。例えば、ＣＩＳＤは、最新のイテレーションの解と１つ前のイテレーションの解とを比較し、両者の差が閾値未満になると反復処理を停止する。

　一般的に、ＣＩＳＤの解の精度は、ＶＱＥ，ＣＣＳＤ，ＣＣＳＤ（Ｔ）よりも低い。また、ＣＩＳＤの実行時間は、ＶＱＥ，ＣＣＳＤ，ＣＣＳＤ（Ｔ）よりも短い。ＣＩＳＤは、電子数の６乗のオーダーの計算量をもつ。

　ＣＣＳＤは、ハートリーフォック分子軌道法をベースにするアルゴリズムであり、電子相関を考慮する指数関数クラスタ演算子を用いて多電子分子の波動関数を近似する。ＣＣＳＤは、指定された分子情報および基底関数のもとで、近似した波動関数を用いて、シュレーディンガー方程式の近似解を求める。ＣＣＳＤは、１電子励起および２電子励起がエネルギーに与える影響を考慮し、３電子励起以上の電子励起の影響を無視する。ＣＩＳＤと同様に、ＣＣＳＤは、電子配置を変えながらエネルギーを繰り返し算出し、最小のエネルギーを探索する。ＣＣＳＤは、算出されるエネルギーが収束するまで反復処理を行う。

　一般的に、ＣＣＳＤの解の精度は、ＶＱＥ，ＣＣＳＤ（Ｔ）よりも低くＣＩＳＤよりも高い。また、ＣＣＳＤの実行時間は、ＶＱＥ，ＣＣＳＤ（Ｔ）よりも短くＣＩＳＤよりも長い。ＣＣＳＤは、電子数の６乗のオーダーの計算量をもつ。

　ＣＣＳＤ（Ｔ）は、ＣＣＳＤと同じ結合クラスタ法に属するアルゴリズムである。ただし、ＣＣＳＤ（Ｔ）は、考慮する電子励起がＣＣＳＤと異なる。ＣＣＳＤ（Ｔ）は、電子状態として、１電子励起および２電子励起がエネルギーに与える影響を厳密に計算し、３電子励起がエネルギーに与える影響を摂動から求める。一方、ＣＣＳＤ（Ｔ）は、４電子励起以上の電子励起の影響を無視する。

　一般的に、ＣＣＳＤ（Ｔ）の解の精度は、ＶＱＥよりも低くＣＩＳＤ，ＣＣＳＤよりも高い。また、ＣＣＳＤ（Ｔ）の実行時間は、ＶＱＥよりも短くＣＩＳＤ，ＣＣＳＤよりも長い。ＣＣＳＤ（Ｔ）は、電子数の７乗のオーダーの計算量をもつ。

　なお、シミュレーション対象の分子は「系」と呼ばれることがある。実行時間は、リソース使用量と正の相関をもち、リソース使用量と比例することがある。量子化学計算が使用するハードウェアリソースには、プロセッサの命令実行時間やメモリの記憶領域が含まれ得る。古典アルゴリズムは、量子回路を用いずに分子のエネルギーを算出し得る。

　次に、ジョブスケジューリングについて説明する。ジョブスケジューリングとして、情報処理装置１００は、同一ユーザまたは異なるユーザの２以上のＶＱＥジョブにリソースを割り当てることがある。２以上のＶＱＥジョブは、異なる計算ノードによって実行されることがあり、同一の計算ノードによって異なる時刻に実行されることがある。

　このとき、情報処理装置１００は、２以上のＶＱＥジョブそれぞれの実行時間を推定する。情報処理装置１００は、推定実行時間に基づいて、各ＶＱＥジョブの開始時刻を決定してもよく、終了予定時刻をユーザに通知してもよい。また、情報処理装置１００は、推定実行時間に基づいて、複数の計算ノードの負荷が偏らないように、複数の計算ノードにＶＱＥジョブを割り振ってもよい。また、情報処理装置１００は、推定実行時間に基づいて、ユーザが指定する期限までにＶＱＥジョブが終了することを保証してもよい。

　また、ジョブスケジューリングの一環として、情報処理装置１００は、推定実行時間に基づいてアルゴリズムを自動的に選択することがある。アルゴリズム選択は、ユーザから指定された分子のエネルギーを、ＶＱＥによって算出するか古典アルゴリズムによって算出するかを選択する。計算ノードの空きリソースに余裕がある場合、情報処理装置１００は、精度の高いＶＱＥを選択してもよい。一方、空きリソースに余裕がない場合、情報処理装置１００は、実行時間の短い古典アルゴリズムを選択してもよい。情報処理装置１００は、ユーザ指定の期限と推定実行時間とからアルゴリズムを選択してもよい。

　図４は、ジョブスケジューリングの例を示す図である。ここでは、情報処理装置１００は、ジョブ４１，４２，４３のスケジュールを決定する。ジョブ４１，４２，４３は、同一ユーザのジョブであり、分子の種類が同じで原子間距離が異なる分子のエネルギーを算出する。ジョブ４１，４２，４３は、ＶＱＥによって実行される。説明を簡単にするため、単一の計算ノードを用いてジョブ４１，４２，４３を実行する場合を考える。ジョブ４１，４２，４３を実行する計算ノードは、情報処理装置１００自身でもよい。

　情報処理装置１００は、ジョブ４１，４２，４３を順に計算ノードに実行させるスケジュールを生成する。このとき、情報処理装置１００は、指定された分子情報に基づいてジョブ４１，４２，４３それぞれの実行時間を推定する。情報処理装置１００は、推定実行時間に基づいて、ジョブ４１，４２，４３それぞれの開始時刻と終了時刻を決定する。

　例えば、情報処理装置１００は、ジョブ４１の開始時刻をＴ１に決定する。また、情報処理装置１００は、ジョブ４２の開始時刻をＴ１より後のＴ２に決定する。時刻Ｔ２は、例えば、時刻Ｔ１にジョブ４１の推定実行時間を加えた時刻である。また、情報処理装置１００は、ジョブ４３の開始時刻をＴ２より後のＴ３に決定する。時刻Ｔ３は、例えば、時刻Ｔ２にジョブ４２の推定実行時間を加えた時刻である。

　なお、情報処理装置１００は、あるジョブが次のジョブの開始時刻までに終わらない場合、当該ジョブを強制的に停止することがある。そのため、ジョブ４１，４２，４３の推定実行時間は、リスクを考慮して期待値よりも大きく算出されることがある。

　次に、ＶＱＥの実行時間の推定について説明する。情報処理装置１００は、事前に訓練された機械学習モデルを用いてＶＱＥの実行時間を推定する。機械学習モデルが推定器と呼ばれてもよい。第２の実施の形態の機械学習モデルは、ガウス過程によって生成されるガウス過程回帰モデルである。また、情報処理装置１００は、サンプルの分子情報を用いて訓練データを生成し、生成された訓練データを用いて機械学習モデルを訓練する。

　機械学習モデルは、ＶＱＥのイテレーション毎の実行時間を推定する時間モデルと、ＶＱＥの反復回数を推定する反復モデルとを含む。イテレーション毎の実行時間は、１つの電子配置に対応するエネルギーの期待値を算出する時間に相当する。反復回数は、基底エネルギーを求めて電子配置を変更する試行回数に相当する。ＶＱＥの実行時間の推定値は、時間モデルが推定する単位実行時間と反復モデルが推定する反復回数との積である。

　このように、第２の実施の形態では、反復処理の実行時間の推定が、イテレーション毎の実行時間の推定と反復回数の推定とに分割される。これは、ＶＱＥで使用される量子回路の規模のみでは、反復回数を精度よく推定することが難しいためである。また、原子間距離が同じであっても、分子の種類によって収束までの反復回数が異なることがある。

　また、実際の反復回数は、ランダム性によって揺れることがあり、期待値よりも上振れするリスクがある。また、訓練データが少ないことに起因して、反復モデルの推定結果に不確実性が生じることがある。そこで、情報処理装置１００は、ランダム性および不確実性の少なくとも一方を考慮して、期待値より多い反復回数を出力する反復モデルを使用することがある。以下、数式を用いて機械学習モデルの一例を説明する。

　まず、イテレーション毎の実行時間を推定する時間モデルについて説明する。時間モデルの説明変数は、数式（１）に示す次数３のベクトルｘである。数式（１）において、ｑは量子ビット数、ｄはアンザッツ回路の深さ、ｌはハミルトニアンの項数である。アンザッツ回路の深さは、直列に並んだ量子ゲートの段数である。ハミルトニアンの項数は、ハミルトニアンをパウリ行列の和に分解した場合の項数である。

　イテレーション毎の実行時間の期待値を算出する時間モデルは、例えば、数式（２）のように規定される。数式（２）において、ｙはイテレーション毎の実行時間を示す目的変数であり、ｎは訓練データに含まれるレコードの個数である。時間モデルを訓練するための訓練データには、（ｘ_１，ｙ_１），…，（ｘ_ｎ，ｙ_ｎ）のように、説明変数の値と目的変数の値のペアであるレコードがｎ個含まれる。

　ｋをガウス過程のカーネルとする。カーネルｋは、ベクトル間の類似度を規定する関数である。カーネルｋの例として、ＲＢＦ（Radial Basis Function）カーネルやMaternカーネルなどが挙げられる。数式（２）のＫ_ｎは、訓練データに含まれる説明変数の値から生成されるｎ×ｎの正方行列である。行列Ｋ_ｎのｉ行ｊ列の成分は、ｋ（ｘ_ｉ，ｘ_ｊ）である。行列Ｋ_ｎは、訓練データに含まれる２つの説明変数の値の間の類似度を示す。Ｉ_ｎは、ｎ×ｎの単位行列である。ｋ_ｎ（ｘ）は、ｉ行目の成分がｋ（ｘ_ｉ，ｘ）である列ベクトルである。ｋ_ｎ（ｘ）は、あるベクトルｘについて、訓練データに含まれるｎ個の説明変数の値それぞれとの類似度を示す。λは、０より大きい定数である。

　情報処理装置１００は、実際のイテレーション毎の実行時間が期待値から変動するリスクを考慮し、そのリスクに対するロバスト性を考慮した時間モデルを使用することもできる。まず、数式（３）に示すように、イテレーション毎の実行時間について、ＣＶａＲ（Conditional Value at Risk）が規定される。数式（３）において、αは０より大きく１以下の定数である。ψ_ν（ｙ）およびＵは、数式（４）のように規定される。

　ロバスト性を考慮した時間モデルは、例えば、数式（３）のＣＶａＲを用いて数式（５）のように規定される。数式（５）によって算出される推定値は、イテレーション毎の実行時間の上振れリスクが反映されており、数式（２）によって算出される期待値より大きいと想定される。ベクトルｘについての分布をρとし、分布ρに対応する累積分布関数をＦとすると、数式（５）は数式（６）の推定値を与えている。

　また、情報処理装置１００は、訓練データが不十分であることによる時間モデルの推定の不確実性を更に考慮し、ロバスト性および不確実性を考慮した時間モデルを使用することもできる。まず、数式（７）に示すように、イテレーション毎の実行時間についてσ_ｎ（ｘ）が規定される。数式（７）において、ｋ^Ｔ _ｎ（ｘ）はｋ_ｎ（ｘ）の転置行列である。

　ロバスト性および不確実性を考慮した時間モデルは、例えば、数式（７）のσ_ｎ（ｘ）を用いて数式（８）のように規定される。数式（８）において、βは正の定数である。数式（８）によって算出される推定値は、イテレーション毎の実行時間の更なる上振れリスクが反映されており、数式（５）によって算出される推定値より大きい。

　次に、反復回数を推定する反復モデルについて説明する。反復モデルの基本的構造は、時間モデルと同じである。ただし、説明変数および目的変数の意味が時間モデルと異なる。反復モデルの説明変数は、数式（９）に示す次数２のベクトルｚである。数式（９）において、ｍは古典アルゴリズムの反復回数、ｓは原子間距離である。

　古典アルゴリズムは、事前に１つ選択される。例えば、ＣＩＳＤ，ＣＣＳＤ，ＣＣＳＤ（Ｔ）の中から１つ選択される。以下の説明では、ＣＣＳＤが選択されていると仮定する。なお、広義の「ＣＣＳＤ」は、狭義のＣＣＳＤとＣＣＳＤ（Ｔ）とを包含していると解釈されることがある。分子に３以上の原子が含まれる場合、原子間距離ｓは、２つの原子の距離の平均である。距離は、例えば、ユークリッド距離である。

　反復回数を推定する反復モデルは、例えば、数式（１０）のように規定される。数式（１０）において、ｗはＶＱＥの反復回数を示す目的変数である。反復モデルを訓練するための訓練データには、（ｚ_１，ｗ_１），…，（ｚ_ｎ，ｗ_ｎ）のように、説明変数の値と目的変数の値のペアであるレコードがｎ個含まれる。

　数式（１０）について、ｌをガウス過程のカーネルとする。Ｌ_ｎは、訓練データに含まれる説明変数の値から生成されるｎ×ｎの正方行列である。行列Ｌ_ｎのｉ行ｊ列の成分は、ｌ（ｚ_ｉ，ｚ_ｊ）である。ｌ_ｎ（ｚ）は、ｉ行目の成分がｌ（ｚ_ｉ，ｚ）である列ベクトルである。λは、０より大きい定数である。

　時間モデルと同様に、情報処理装置１００は、実際の反復回数が期待値から変動するリスクを考慮し、そのリスクに対するロバスト性を考慮した反復モデルを使用することもできる。ロバスト性を考慮した反復モデルは、例えば、数式（３）のＣＶａＲを用いて数式（１１）のように規定される。ただし、数式（３）および数式（４）について、ｘがｚに置換され、ｙがｗに置換され、Ｋ_ｎがＬ_ｎに置換され、ｋ_ｎがｌ_ｎに置換される。

　また、情報処理装置１００は、訓練データが不十分であることによる反復モデルの推定の不確実性を更に考慮し、ロバスト性および不確実性を考慮した反復モデルを使用することもできる。ロバスト性および不確実性を考慮した反復モデルは、例えば、数式（７）を用いて数式（１２）のように規定される。ただし、数式（７）について、ｘがｚに置換され、Ｋ_ｎがＬ_ｎに置換され、ｋ_ｎがｌ_ｎに置換される。

　図５は、時間モデルおよび反復モデルの入出力データの例を示す図である。情報処理装置１００は、分析対象の分子についてデータ１３１を取得する。データ１３１は、分子に含まれる複数の原子それぞれの種類および座標を示す。機械学習の際には、情報処理装置１００は、サンプルデータとして、データ１３１に相当するものをｎセット取得する。

　情報処理装置１００は、データ１３１からデータ１３２を生成する。データ１３２は、量子ビット数、アンザッツ回路の深さ、ハミルトニアンの項数およびイテレーション毎の実行時間を含む。量子ビット数、アンザッツ回路の深さおよびハミルトニアンの項数は、時間モデルの入力データであり、ＶＱＥの前処理によってデータ１３１から算出される。イテレーション毎の実行時間は、時間モデルの出力データである。

　機械学習の際には、情報処理装置１００は、時間モデルを訓練するための訓練データとして、データ１３２に相当するものをｎセット生成する。その場合、イテレーション毎の実行時間は教師データに相当し、ＶＱＥを実行することで測定される。

　また、情報処理装置１００は、データ１３１からデータ１３３を生成する。データ１３３は、原子間距離、古典アルゴリズムの反復回数およびＶＱＥの反復回数を含む。原子間距離および古典アルゴリズムの反復回数は、反復モデルの入力データである。原子間距離は、データ１３１が示す各原子の座標から算出される。古典アルゴリズムの反復回数は、データ１３１に基づいて古典アルゴリズムを実行することで測定される。ＶＱＥの反復回数は、反復モデルの出力データである。

　機械学習の際には、情報処理装置１００は、反復モデルを訓練するための訓練データとして、データ１３３に相当するものをｎセット生成する。その場合、ＶＱＥの反復回数は教師データに相当し、ＶＱＥを実行することで測定される。情報処理装置１００は、イテレーション毎の実行時間とＶＱＥの反復回数を、併せて測定することが可能である。

　情報処理装置１００は、データ１３２，１３３からデータ１３４を生成する。データ１３４は、ＶＱＥの実行時間の推定値を含む。実行時間は、データ１３２に含まれるイテレーション毎の実行時間と、データ１３３に含まれるＶＱＥの反復回数との積である。なお、時間モデルが出力するイテレーション毎の実行時間および反復回数が出力するＶＱＥの反復回数の一方または両方は、期待値でもよいし、ロバスト性を考慮した推定値でもよいし、ロバスト性および不確実性を考慮した推定値でもよい。ユーザは、推定される実行時間の用途に応じて、これら推定値の種類を指定してもよい。

　次に、情報処理装置１００の機能および処理手順について説明する。図６は、情報処理装置の機能例を示すブロック図である。情報処理装置１００は、分子情報記憶部１２１、訓練データ記憶部１２２およびモデル記憶部１２３を有する。これらの記憶部は、例えば、ＲＡＭ１０２またはＨＤＤ１０３を用いて実装される。また、情報処理装置１００は、ＣＣＳＤ実行部１２４、ＶＱＥ実行部１２５、訓練データ生成部１２６、機械学習部１２７、実行時間推定部１２８およびスケジューラ１２９を有する。これらの処理部は、例えば、ＣＰＵ１０１またはＧＰＵ１０４とプログラムとを用いて実装される。

　分子情報記憶部１２１は、機械学習に用いるサンプルの分子情報を記憶する。また、分子情報記憶部１２１は、分析対象の分子を示す分子情報を記憶する。分子情報は、ユーザにより作成される。前述のデータ１３１は、分子情報記憶部１２１に記憶される。

　訓練データ記憶部１２２は、イテレーション毎の実行時間を推定する時間モデルを訓練するための訓練データを記憶する。また、訓練データ記憶部１２２は、ＶＱＥの反復回数を推定する反復モデルを訓練するための訓練データを記憶する。これら訓練データは、分子情報記憶部１２１に記憶されたサンプルの分子情報に基づいて生成される。前述のデータ１３２，１３３は、訓練データ記憶部１２２に記憶される。モデル記憶部１２３は、訓練済みの機械学習モデルとして、時間モデルおよび反復モデルを記憶する。

　ＣＣＳＤ実行部１２４は、古典アルゴリズムの代表としてＣＣＳＤを実行する。ただし、情報処理装置１００は、ＣＩＳＤまたはＣＣＳＤ（Ｔ）を実行してもよい。ＣＣＳＤ実行部１２４は、訓練データ生成部１２６から指定されるサンプルの分子情報および基底関数に基づいてＣＣＳＤを実行し、エネルギーが収束するまで反復処理を行う。ＣＣＳＤ実行部１２４は、反復回数を測定して訓練データ生成部１２６に出力する。

　また、ＣＣＳＤ実行部１２４は、実行時間推定部１２８から指定される分析対象の分子情報および基底関数に基づいてＣＣＳＤを実行し、エネルギーが収束するまで反復処理を行う。ＣＣＳＤ実行部１２４は、反復回数を測定して実行時間推定部１２８に出力する。

　ＶＱＥ実行部１２５は、量子シミュレータを用いてＶＱＥを実行する。ただし、ＶＱＥ実行部１２５は、量子コンピュータを用いてもよい。ＶＱＥ実行部１２５は、訓練データ生成部１２６から指定されるサンプルの分子情報および基底関数に基づいて前処理を行い、サンプルの分子に応じた量子回路を生成する。ＶＱＥ実行部１２５は、生成された量子回路に基づいてＶＱＥを実行し、エネルギーが収束するまで反復処理を行う。ＶＱＥ実行部１２５は、イテレーション毎の実行時間および反復回数を測定し、生成された量子回路と併せて訓練データ生成部１２６に出力する。

　また、ＶＱＥ実行部１２５は、実行時間推定部１２８から指定される分析対象の分子情報および基底関数に基づいて前処理を行い、分析対象の分子に応じた量子回路を生成する。ＶＱＥ実行部１２５は、生成された量子回路を実行時間推定部１２８に出力する。また、ＶＱＥ実行部１２５は、スケジューラ１２９から指定されるスケジュールに従い、生成された量子回路に基づいてＶＱＥを実行する。

　訓練データ生成部１２６は、時間モデルを訓練するための訓練データおよび反復モデルを訓練するための訓練データを生成し、訓練データ記憶部１２２に格納する。訓練データ生成部１２６は、サンプルの分子情報それぞれについて、ＶＱＥ実行部１２５から量子回路を取得して量子回路の特徴量を抽出し、ＶＱＥ実行部１２５からイテレーション毎の実行時間を取得する。これにより、時間モデルの訓練データが生成される。

　また、訓練データ生成部１２６は、サンプルの分子情報それぞれについて、分子情報に基づいて原子間距離を算出し、ＣＣＳＤ実行部１２４から反復回数を取得し、ＶＱＥ実行部１２５から反復回数を取得する。これにより、反復モデルの訓練データが生成される。

　機械学習部１２７は、訓練データ記憶部１２２に記憶された訓練データを用いて、ガウス過程により時間モデルおよび反復モデルを訓練し、訓練された時間モデルおよび反復モデルをモデル記憶部１２３に格納する。機械学習部１２７は、期待値を出力する機械学習モデルを訓練してもよいし、ロバスト性を考慮した機械学習モデルを訓練してもよいし、ロバスト性および不確実性を考慮した機械学習モデルを訓練してもよい。ユーザが機械学習部１２７に対し、ロバスト性および不確実性の考慮の有無を指定してもよい。

　実行時間推定部１２８は、モデル記憶部１２３に記憶された機械学習モデルを用いて、分析対象の分子情報に基づいてＶＱＥを実行した場合の実行時間を推定する。実行時間推定部１２８は、推定した実行時間をスケジューラ１２９に出力する。実行時間推定部１２８は、分析対象の分子情報について、ＶＱＥ実行部１２５から量子回路を取得して量子回路の特徴量を抽出する。実行時間推定部１２８は、量子回路の特徴量を時間モデルに入力して、イテレーション毎の実行時間を推定する。

　また、実行時間推定部１２８は、分析対象の分子情報について、分子情報に基づいて原子間距離を算出し、ＣＣＳＤ実行部１２４から反復回数を取得する。実行時間推定部１２８は、原子間距離およびＣＣＳＤの反復回数を反復モデルに入力して、ＶＱＥの反復回数を推定する。そして、実行時間推定部１２８は、推定されたイテレーション毎の実行時間とＶＱＥの反復回数とを乗じて、ＶＱＥの実行時間を推定する。

　スケジューラ１２９は、実行時間推定部１２８から取得した推定実行時間に基づいて、分析対象の分子のエネルギーを算出するジョブのスケジューリングを行う。例えば、スケジューラ１２９は、推定実行時間に基づいて、分析対象の分子のエネルギーをＶＱＥで算出するか、古典アルゴリズム（例えば、ＣＣＳＤ（Ｔ））で算出するかを選択する。また、スケジューラ１２９は、推定実行時間に基づいて、複数のＶＱＥのジョブのスケジュール（例えば、各ＶＱＥのジョブの開始時刻）を決定する。

　図７は、機械学習の手順例を示すフローチャートである。（Ｓ１０）訓練データ生成部１２６は、サンプルの分子情報を取得する。訓練データ生成部１２６は、分子情報から原子間距離の平均を算出する。

　（Ｓ１１）ＣＣＳＤ実行部１２４は、分子情報および基底関数に基づいて古典アルゴリズム（例えば、ＣＣＳＤ）を実行し、古典アルゴリズムの反復回数を測定する。
　（Ｓ１２）ＶＱＥ実行部１２５は、分子情報および基底関数に基づいてＶＱＥの前処理を行い、ＶＱＥで使用される量子回路を生成する。

　（Ｓ１３）訓練データ生成部１２６は、ステップＳ１２の前処理の結果から、量子ビット数、アンザッツ回路の深さおよびハミルトニアンの項数を特定する。
　（Ｓ１４）ＶＱＥ実行部１２５は、ステップＳ１２の前処理の結果に基づいてＶＱＥを実行し、ＶＱＥのイテレーション毎の実行時間および反復回数を測定する。

　（Ｓ１５）訓練データ生成部１２６は、ステップＳ１３で特定された量子ビット数、アンザッツ回路の深さおよびハミルトニアンの項数と、ステップＳ１４で測定されたイテレーション毎の実行時間とを含む訓練データを生成する。

　（Ｓ１６）訓練データ生成部１２６は、ステップＳ１０で算出された原子間距離と、ステップＳ１１で測定された古典アルゴリズムの反復回数と、ステップＳ１４で測定されたＶＱＥの反復回数とを含む訓練データを生成する。

　（Ｓ１７）機械学習部１２７は、ステップＳ１５で生成された訓練データを用いて、イテレーション毎の実行時間を推定する時間モデルを訓練する。
　（Ｓ１８）機械学習部１２７は、ステップＳ１６で生成された訓練データを用いて、ＶＱＥの反復回数を推定する反復モデルを訓練する。

　（Ｓ１９）機械学習部１２７は、ステップＳ１７で訓練された時間モデルと、ステップＳ１８で訓練された反復モデルとを、不揮発性ストレージに保存する。なお、機械学習部１２７は、訓練された時間モデルおよび反復モデルを表示装置１１１に表示してもよいし、他の情報処理装置に送信してもよい。

　図８は、実行時間推定の手順例を示すフローチャートである。（Ｓ２０）実行時間推定部１２８は、分析対象の分子を示す分子情報を取得する。実行時間推定部１２８は、分子情報から原子間距離の平均を算出する。

　（Ｓ２１）ＣＣＳＤ実行部１２４は、分子情報および基底関数に基づいて古典アルゴリズム（例えば、ＣＣＳＤ）を実行し、古典アルゴリズムの反復回数を測定する。
　（Ｓ２２）ＶＱＥ実行部１２５は、分子情報および基底関数に基づいてＶＱＥの前処理を行い、ＶＱＥで使用される量子回路を生成する。

　（Ｓ２３）実行時間推定部１２８は、ステップＳ２２の前処理の結果から、量子ビット数、アンザッツ回路の深さおよびハミルトニアンの項数を特定する。
　（Ｓ２４）実行時間推定部１２８は、ステップＳ２３で特定された量子ビット数、アンザッツ回路の深さおよびハミルトニアンの項数を、訓練済みの時間モデルに入力し、イテレーション毎の実行時間を推定する。

　（Ｓ２５）実行時間推定部１２８は、ステップＳ２０で算出された原子間距離と、ステップＳ２１で測定された古典アルゴリズムの反復回数とを、訓練済みの反復モデルに入力し、ＶＱＥの反復回数を推定する。

　（Ｓ２６）実行時間推定部１２８は、ステップＳ２４で推定されたイテレーション毎の実行時間とステップＳ２５で推定された反復回数とを乗じて、ＶＱＥの実行時間を推定する。実行時間推定部１２８は、推定実行時間をスケジューラ１２９に出力する。なお、実行時間推定部１２８は、推定実行時間を不揮発性ストレージに保存してもよいし、表示装置１１１に表示してもよいし、他の情報処理装置に送信してもよい。

　図９は、実行時間の推定精度の例を示すグラフである。グラフ５１，５２，５３は、ＶＱＥの推定実行時間と実際実行時間と関係を示す散布図である。ここでの推定実行時間は、実行時間の期待値である。グラフ５１，５２，５３において、横軸は推定実行時間の対数を表し、縦軸は実際実行時間の対数を表す。また、線分は、推定実行時間＝実際実行時間を表す。よって、線分に近い点ほど、推定精度が高いサンプルである。

　グラフ５１は、Ｈ２Ｏ分子のシミュレーション結果を示す。グラフ５２は、Ｈ４分子のシミュレーション結果を示す。グラフ５３は、Ｈ６分子のシミュレーション結果を示す。ＶＱＥの実行時間は、分子構造によって大きく異なる。これに対して、グラフ５１，５２，５３に示すように、情報処理装置１００は、実際実行時間に近い期待値を推定できる。

　なお、ロバスト性を考慮した推定実行時間、または、ロバスト性および不確実性を考慮した推定実行時間を算出した場合、グラフ５１，５２，５３の点は右方向に移動する。その場合、大部分の点は線分より右側に存在し、線分より左側に存在する点は少数である。そのため、ＶＱＥの実行時間が推定値を超えるリスクが十分に抑制され、情報処理装置１００は、効率的なジョブスケジューリングを行うことができる。

　以上説明したように、第２の実施の形態の情報処理装置１００は、ＶＱＥの実行前にＶＱＥの実行時間を推定する。これにより、情報処理装置１００は、推定実行時間に基づいて、量子化学計算のジョブスケジューリングを効率的に行うことができる。また、情報処理装置１００は、実行時間の推定を、イテレーション毎の実行時間の推定と反復回数の推定とに分割し、異なる機械学習モデルを用いて両者を推定する。これにより、それぞれの推定値の算出に適した特徴量が使用され、実行時間の推定精度が向上する。

　また、情報処理装置１００は、ＣＣＳＤなどの古典アルゴリズムを実行して古典アルゴリズムの反復回数を測定し、古典アルゴリズムの反復回数を用いてＶＱＥの反復回数を推定する。ＶＱＥの反復回数と相関のある古典アルゴリズムの反復回数を使用するため、量子回路の特徴量のみからＶＱＥの反復回数を推定する場合よりも推定精度が向上する。また、古典アルゴリズムの実行時間はＶＱＥよりも十分に短いため、情報処理装置１００は、ＶＱＥの実行時間を迅速に推定することができる。

　また、情報処理装置１００は、更に原子間距離を用いてＶＱＥの反復回数を推定する。これにより、機械学習モデルは、原子間距離が長いほどＶＱＥの反復回数が増加する傾向を学習することができ、反復回数の推定精度が向上する。また、情報処理装置１００は、反復回数のランダム性や訓練データの不足などにより、ＶＱＥの実行時間が期待値から上振れするリスクを考慮し、リスクをカバーした推定値を算出する。これにより、情報処理装置１００は、ＶＱＥの実行時間が推定値を超えてしまうリスクを許容可能な水準に抑制することができ、信頼性の高いジョブスケジューリングが可能となる。

　上記については単に本発明の原理を示すものである。更に、多数の変形や変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応する全ての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。

　１０　情報処理装置
　１１　記憶部
　１２　制御部
　１３，１４　アルゴリズム
　１５　機械学習モデル
　１６　分子情報
　１７，１８　反復回数

Claims

　分子に対応するエネルギーを反復処理によって算出するアルゴリズムのうち、量子回路データを用いる第２のアルゴリズムと異なる第１のアルゴリズムを、分析対象の分子を示す分子情報に基づいて実行し、前記第１のアルゴリズムの第１の反復回数を特定し、
　前記第１のアルゴリズムの反復回数を説明変数とし、前記第２のアルゴリズムの反復回数を目的変数として訓練された第１の機械学習モデルに、前記第１の反復回数を入力し、
　前記第１の機械学習モデルによって算出された、前記分子情報に基づいて前記第２のアルゴリズムを実行する場合の第２の反復回数の推定値を出力する、
　処理をコンピュータに実行させることを特徴とする推定プログラム。
　前記説明変数は、分子に含まれる複数の原子の間の距離を更に含み、前記第１の反復回数の入力は、前記分子情報が示す第１の距離を更に入力することを含む、
　ことを特徴とする請求項１に記載の推定プログラム。
　前記分子情報に基づいて前記第２のアルゴリズムを実行する場合に用いられる第１の量子回路データの特徴を示す第１の特徴量を特定し、
　前記量子回路データの特徴量を説明変数とし、前記第２のアルゴリズムの前記反復処理に含まれるイテレーション１回当たりの単位実行時間を目的変数として訓練された第２の機械学習モデルに、前記第１の特徴量を入力し、
　前記第２の機械学習モデルによって算出された、前記分子情報に基づいて前記第２のアルゴリズムを実行する場合の第１の単位実行時間の推定値を出力する、
　処理を前記コンピュータに更に実行させることを特徴とする請求項１に記載の推定プログラム。
　前記第２の反復回数の推定値と前記第１の単位実行時間の推定値とに基づいて、前記分子情報に基づいて前記第２のアルゴリズムを実行する場合の実行時間を推定する、
　処理を前記コンピュータに更に実行させることを特徴とする請求項３に記載の推定プログラム。
　前記推定された実行時間に基づいて、前記分析対象の分子に対応するエネルギーを算出するジョブのスケジューリングを行う、
　処理を前記コンピュータに更に実行させることを特徴とする請求項４に記載の推定プログラム。
　前記第１のアルゴリズムは、配置間相互作用法または結合クラスタ法であり、前記第２のアルゴリズムは、変分量子固有値ソルバ法である、
　ことを特徴とする請求項１に記載の推定プログラム。
　分子に対応するエネルギーを反復処理によって算出するアルゴリズムのうち、第１のアルゴリズムの反復回数を説明変数とし、量子回路データを用いる第２のアルゴリズムの反復回数を目的変数として訓練された第１の機械学習モデルを記憶する記憶部と、
　分析対象の分子を示す分子情報に基づいて前記第１のアルゴリズムを実行し、前記第１のアルゴリズムの第１の反復回数を特定し、前記第１の機械学習モデルに前記第１の反復回数を入力し、前記第１の機械学習モデルによって算出された、前記分子情報に基づいて前記第２のアルゴリズムを実行する場合の第２の反復回数の推定値を出力する制御部と、
　を有することを特徴とする情報処理装置。
　分子に対応するエネルギーを反復処理によって算出するアルゴリズムのうち、量子回路データを用いる第２のアルゴリズムと、前記第２のアルゴリズムと異なる第１のアルゴリズムとを、サンプルの分子を示す分子情報に基づいてそれぞれ実行し、前記第１のアルゴリズムの第１の反復回数と前記第２のアルゴリズムの第２の反復回数とを特定し、
　前記第１の反復回数および前記第２の反復回数を含む訓練データを用いて、前記第１のアルゴリズムの反復回数を説明変数とし、前記第２のアルゴリズムの反復回数を目的変数とする第１の機械学習モデルを訓練する、
　処理をコンピュータが実行することを特徴とする機械学習方法。