JP2024508076A

JP2024508076A - 量子回路シミュレーション方法、装置、コンピュータ機器及びプログラム

Info

Publication number: JP2024508076A
Application number: JP2023538707A
Authority: JP
Inventors: ヂャン，シーシン; ワン，ヂョウチェン; ヂャン，シェンユ
Original assignee: テンセント・テクノロジー・（シェンジェン）・カンパニー・リミテッド
Priority date: 2022-01-24
Filing date: 2022-11-22
Publication date: 2024-02-22
Also published as: WO2023138202A1; KR20240038064A; US20230289640A1; CN116523053A

Abstract

量子技術分野に関する、量子回路シミュレーション方法、装置、機器、記憶媒体及びプログラム製品を提供する。該方法は、量子回路シミュレーションのための元の関数を取得し、元の関数における並列化を必要とする第１の入力パラメータを決定するステップ（１１０）と、元の関数及び第１の入力パラメータに基づいて、元の関数を目的関数に変換するステップであって、目的関数の入力パラメータは、第１の入力パラメータに対応する変換後の第１の入力パラメータを含み、変換後の第１の入力パラメータに対応するテンソルは、第１の入力パラメータに対応する複数の並列化されたテンソルを結合して得られた結果である、ステップ（１２０）と、目的関数の入力パラメータに基づいて、目的関数に対応する実行結果を取得するステップ（１３０）と、目的関数に対応する実行結果に基づいて、量子回路シミュレーションを実行するステップ（１４０）とを含む。量子回路シミュレーションにベクトル並列化の思想を導入することで、シミュレーション効率を向上させることができる。【選択図】図１

Description

本発明は、２０２２年１月２４日に出願した出願番号が２０２２１００７７５８４．７であり、発明の名称が「量子回路シミュレーション方法、装置、機器、記憶媒体及びプログラム製品」である中国特許出願に基づく優先権を主張し、その全ての内容を参照により本発明に援用する。

本発明の実施例は、量子技術分野に関し、特に量子回路シミュレーション方法、装置、機器、記憶媒体及びプログラム製品に関する。

量子回路シミュレーションは、古典コンピュータと数値計算の方式により、量子コンピュータの動作をシミュレート又は近似する。

現在、量子回路シミュレーションの効率は高くない。

本発明の実施例は、量子回路シミュレーション方法、装置、機器、記憶媒体及びプログラム製品を提供する。その技術的手段は、以下の通りである。

本発明の実施例の１つの態様では、コンピュータ機器が実行する量子回路シミュレーション方法であって、量子回路シミュレーションのための元の関数を取得し、前記元の関数における並列化を必要とする第１の入力パラメータを決定するステップと、前記元の関数及び前記第１の入力パラメータに基づいて、前記元の関数を目的関数に変換するステップであって、前記目的関数の入力パラメータは、前記第１の入力パラメータに対応する変換後の第１の入力パラメータを含み、前記変換後の第１の入力パラメータに対応するテンソルは、前記第１の入力パラメータに対応する複数の並列化されたテンソルを結合して得られた結果である、ステップと、前記目的関数の入力パラメータに基づいて、前記目的関数に対応する実行結果を取得するステップと、前記目的関数に対応する実行結果に基づいて、前記量子回路シミュレーションを実行するステップと、を含む、方法を提供する。

本発明の実施例のもう１つの態様では、量子回路シミュレーション装置であって、量子回路シミュレーションのための元の関数を取得し、前記元の関数における並列化を必要とする第１の入力パラメータを決定する関数取得モジュールと、前記元の関数及び前記第１の入力パラメータに基づいて、前記元の関数を目的関数に変換する関数変換モジュールであって、前記目的関数の入力パラメータは、前記第１の入力パラメータに対応する変換後の第１の入力パラメータを含み、前記変換後の第１の入力パラメータに対応するテンソルは、前記第１の入力パラメータに対応する複数の並列化されたテンソルを結合して得られた結果である、関数変換モジュールと、前記目的関数の入力パラメータに基づいて、前記目的関数に対応する実行結果を取得する関数実行モジュールと、前記目的関数に対応する実行結果に基づいて、前記量子回路シミュレーションを実行する回路シミュレーションモジュールと、を含む、装置を提供する。

本発明の実施例のもう１つの態様では、プロセッサと、コンピュータプログラムが記憶されたメモリと、を含むコンピュータ機器であって、前記コンピュータプログラムは、上記の量子回路シミュレーション方法を実現するように前記プロセッサによりロードされて実行される、コンピュータ機器を提供する。

本発明の実施例のもう１つの態様では、コンピュータプログラムが記憶されたコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラムは、上記の量子回路シミュレーション方法を実現するように、プロセッサによりロードされて実行される、記憶媒体を提供する。

本発明の実施例のもう１つの態様では、コンピュータ読み取り可能な記憶媒体に記憶されたコンピュータプログラムを含むコンピュータプログラム製品であって、プロセッサは、上記の量子回路シミュレーション方法を実現するように、前記コンピュータ読み取り可能な記憶媒体から前記コンピュータプログラムを読み取って実行する、コンピュータプログラム製品を提供する。

本発明の実施例に係る技術的手段は、少なくとも以下の有利な効果を奏する。

量子回路シミュレーションにベクトル並列化の思想を導入し、即ち、元の関数を目的関数に変換し、該目的関数の入力パラメータは並列化を必要とする第１の入力パラメータに対応する変換後の第１の入力パラメータを含み、該変換後の第１の入力パラメータに対応するテンソルは第１の入力パラメータに対応する複数の並列化されたテンソルを結合して得られた結果であり、目的関数を実行することによって、本来の複数回実行する必要のある計算プロセスを１回の計算プロセスに並列化して実行することができるため、１回の計算と同一の時間だけで完成することができ、量子回路シミュレーションの効率を十分に向上させることができる。

本発明の１つの実施例に係る量子回路シミュレーション方法のフローチャートである。本発明の１つの実施例に係るｖｍａｐインターフェースの機能の概略図である。本発明のもう１つの実施例に係る量子回路シミュレーション方法のフローチャートである。本発明の１つの実施例に係る目標量子回路の数値シミュレーションの概略図である。本発明の１つの実施例に係る入力波動関数の並列的な処理の概略図である。本発明の１つの実施例に係る回路変分パラメータの並列的な最適化の概略図である。本発明の１つの実施例に係るテンソルネットワークに含まれるパラメータ化された構造情報の概略図である。本発明の１つの実施例に係る回路構造の並列的な生成の概略図である。本発明の１つの実施例に係る実験結果の概略図である。本発明の１つの実施例に係る量子回路シミュレーション装置のブロック図である。本発明の１つの実施例に係るコンピュータ機器の概略図である。

本発明の目的、解決手段、利点をより明確にするために、以下は、図面を参照しながら本発明の実施形態をさらに詳細に説明する。

本発明の技術的スキームを説明する前に、本発明に関連する幾つかの重要な用語を説明する。

１．量子計算：量子論理に基づく計算方式であり、データを記憶する基本ユニットは量子ビット（ｑｕｂｉｔ）である。

２．量子ビット：量子計算の基本単位である。従来のコンピュータは、バイナリの基本単位として０と１を使っている。量子計算は、それと異なって、０と１を同時に処理することができ、システムは０と１の線形重ね合わせ状態
（外１）

にあることができる。ここで、α、βは、０と１の複素数確率幅を表し、そのモジュロの２乗｜α｜^２、｜β｜^２は、それぞれ０と１の確率を表す。

３．量子回路：量子汎用コンピュータの表現の１つであり、対応する量子アルゴリズム／プログラムの量子ゲートモデルでのハードウェア実現を代表する。量子回路に量子ゲートを制御する可変パラメータが含まれる場合、パラメータ化量子回路（ＰａｒａｍｅｔｅｒｉｚｅｄＱｕａｎｔｕｍＣｉｒｃｕｉｔ：ＰＱＣ）又は変分量子回路（ＶａｒｉａｔｉｏｎａｌＱｕａｎｔｕｍＣｉｒｃｕｉｔ：ＶＱＣ）と称され、両者は同一の概念である。

４．ハミルトニアン：量子システムの総エネルギーのエルミート共役を表す行列である。ハミルトニアンは、システムの総エネルギーを表す物理学的用語であり、通常はＨで表される。

５．固有状態（ｅｉｇｅｎｓｔａｔｅ）：ハミルトニアン行列Ｈについて、方程式
（外２）

を満たす解は、Ｈの固有状態
（外３）

と称され、固有エネルギーＥを有する。基底状態は、量子システムのエネルギーが最も低い固有状態に対応する。

６．量子古典ハイブリッド計算：内層が量子回路（例えばＰＱＣ）を用いて対応する物理量又は損失関数を計算し、外層が従来の古典最適化器を用いて量子回路変分パラメータを調整する計算パラダイムであり、最大限度に量子計算の優勢を発揮でき、潜在力で量子優勢を証明する重要な方向の一つと信じられる。一般に、このような量子古典ハイブリッド計算のパラダイムは、変分量子アルゴリズムと称されることもある。

７．ＮＩＳＱ（ＮｏｉｓｙＩｎｔｅｒｍｅｄｉａｔｅ－ＳｃａｌｅＱｕａｎｔｕｍ）：最近の中規模のノイズのある量子ハードウェアであり、量子計算の発展が現在の段階と研究の重点方向である。この段階の量子計算は、一時的に規模とノイズの制限のため、汎用計算のエンジンとして適用することができないが、一部の問題では、最強の古典コンピュータを超える結果を達成することができ、通常、量子超越性又は量子優位性と称される。

８．変分量子固有ソルバー（ＶａｒｉａｔｉｏｎａｌＱｕａｎｔｕｍＥｉｇｅｎｓｏｌｖｅｒ：ＶＱＥ）：変分回路（即ちＰＱＣ／ＶＱＣ）により特定の量子システムの基底状態エネルギーの推定を実現し、典型的な量子古典ハイブリッド計算パラダイムであり、量子化学領域に広く応用されている。

９．Ｐａｕｌｉｓｔｒｉｎｇ（パウリ文字列）：異なる格子点における複数のパウリ行列の直積からなる項では、一般のハミルトニアンは、通常、１組のパウリ文字列の和に分解できる。ＶＱＥの測定も、通常、パウリ文字列分解に従って項ごとに測定される。各パウリ文字列の期待値は、量子回路で複数回の測定により平均値をとることで推定することができる。

１０．ビット文字列（ｂｉｔｓｔｒｉｎｇ、古典的なビット列とも称される）：０、１からなる数字の列である。量子回路の毎回の測定で得られた古典的な結果は、測定基底でのスピン配置の上下に応じてそれぞれ０、１で表すことができるため、全体の一回の測定結果は１つのビット文字列に対応する。各パウリ文字列を測定して得られた計測値は、ビット文字列の計算で与えられる。

１１．量子回路のソフトウェアシミュレーション：古典コンピュータと数値計算の方式により、量子コンピュータの動作をシミュレート又は近似する。量子回路のソフトウェアシミュレーションは「量子回路シミュレーション」と略称される。

１２．ベクトル並列化：ベクトル並列化は、元の関数の各演算子を一つずつハードウェアでサポートするベクトル化により実現される。これによって、上位層関数の高速並列を実現する。この実装は、通常、静的マップコンパイルと共に実行される。例えば、関数ｆ（ｘ）＝２×ｘに対して、１と入力する場合に２を返し、即ち、ｆ（１）＝２となる。ベクトル並列化バージョンｆｖ（ｘ）は、ｆｖ（［１，２］）＝［２，４］を実現できる。このプロセスは、順次計算ではなく、ハードウェアでのベクトル命令セット（ベクトル化命令セットとも称される）を用いて同時に計算できるため、ｆｖ（［１，２］）を計算する時間はｆ（１）と略同じであり、ｆ（１）、ｆ（２）を順次計算する時間に比べて半分程度になる。ベクトルの次元（並列次元／ｂａｔｃｈ次元）の大きさがさらに大きくなると、加速がより顕著になる。この例では、ｆ（ｘ）は元の関数であり、乗算は唯一に出現する演算子であり、この計算のベクトル化のサポートは、例えばＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ：中央処理装置）又はＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ：グラフィックスプロセッサ）などのハードウェアでのベクトル命令セットに依存する。上位層関数とは、ここのｆを意味し、ハードウェアの詳細やｆの下位層の実装を考慮することなく、最近の機械学習フレームワークにカプセル化されたインターフェースを利用して、そのベクトル並列化を実現することができる。静的マップのコンパイルプロセスは、最近の機械学習フレームワークにより提供される、上位層の計算ＡＰＩ（ＡｐｐｌｉｃａｔｉｏｎＰｒｏｇｒａｍｍｉｎｇＩｎｔｅｒｆａｃｅ：アプリケーションプログラミングインターフェース）のコンパイルをハードウェアの下位層操作に融合するプロセスであり、数値計算の高速化を実現することができる。

１３．パウリ演算子：パウリ行列とも呼ばれ、３つの２×２のユニタリエルミート複素行列（ユニタリ行列とも称され）であり、通常はギリシャ文字σ（シグマ）で表される。ここで、パウリＸ演算子は、
（外４）

であり、パウリＹ演算子は、
（外５）

であり、バブルＺ演算子は
（外６）

である。

１４．微分可能構造探索（ＤｉｆｆｅｒｅｎｔｉａｂｌｅＡｒｃｈｉｔｅｃｔｕｒｅＳｅａｒｃｈ：ＤＡＲＴＳ）：よく使われているＮＡＳ（ＮｅｕｒａｌＡｒｃｈｉｔｅｃｔｕｒｅＳｅａｒｃｈ：ニューラルネットワーク構造探索）スキームの一つであり、異なるノード間の複数の操作層を重みで加算することによって、スーパーネットワーク（ｓｕｐｅｒｎｅｔｗｏｒｋ）においてエンドツーエンドの微分計算と勾配降下探索を行い、ニューラルネットワーク構造探索の速度を大幅に向上させることができる。ＤＡＲＴＳは、離散的な候補構造を探索することではなく、探索空間を連続的にすることで、勾配降下により検証セットの性能に応じてネットワーク構造の最適化することができる。非効率的なブラックボックス探索と比較して、勾配に基づく最適化アルゴリズムにより、ＤＡＲＴＳは、現在の最高レベルのパフォーマンスに匹敵し、計算量が桁違いに少なくなる。

１５．量子構造探索（ＱｕａｎｔｕｍＡｒｃｈｉｔｅｃｔｕｒｅＳｅａｒｃｈ：ＱＡＳ）：量子回路の構造、モード及びレイアウトに対して自動化及びプログラム化探索を試みる一連の作業とスキームの総称である。従来の量子構造探索の作業は、通常、貪欲アルゴリズム、強化学習又は遺伝子アルゴリズムをそのコア技術とする。比較的に新しい微分可能構造探索技術は、ハイスループットでバッチごとに量子回路構造の優劣を反復的に評価することができる。

１６．テンソルネットワーク（ｔｅｎｓｏｒｎｅｔｗｏｒｋ）：一連のテンソルとそれらの間の接続の情報であり、より少ない情報で高次元のテンソルを表現することができる。また、それぞれの量子回路を１つのテンソル回路ネットワークにマッピングできるため、テンソル回路ネットワークを縮約することで、量子回路をシミュレートすることができる。

量子回路シミュレーションの応用シナリオでは、並列化を必要とする幾つかの次元について、対応する複数の計算を実現するために、通常、単純な直列的なループ計算を行い、即ち、単純なｆｏｒｌｏｏｐを行う。この方式の並列度は０である。従って、並列化すべき次元の大きさが１０００であるとすると、ソフトウェアシミュレーションを実現するためには単回計算の１０００倍の時間が必要となる。

わずかに最適化されたスキームの１つは、次元の並列化を必要とする異なる計算が異なるプロセスに分散して同時に計算されるように、マルチプロセス技術又はマルチスレッド技術を利用して並列化すべき計算部分を加速することである。しかし、このスキームは、通常、ハードウェアアーキテクチャとオペレーティングシステムにより制限され、様々なハードウェアに応じて個別に実装する必要がある。これは、マルチプロセス及びマルチスレッドにより実現される上位層のプログラムインターフェースは、ハードウェアの詳細及びオペレーティングシステムに大きく依存するため、異なるハードウェア及びソフトウェアで実行されると、コードを書き換える必要があり、コードの再利用性が低いためである。従って、開発及び使用のコストが大幅に増加すると共に、ＧＰＵやＴＰＵ（ＴｅｎｓｏｒＰｒｏｃｅｓｓｉｎｇＵｎｉｔ：テンソルプロセッサ）などの異種ハードウェアでは、マルチプロセスとマルチスレッドのサポートは十分ではない。マルチプロセスの場合、各タスクはシングルプロセスで計算されるだけであり、ベクトル操作セット（即ち、ハードウェアの元のベクトル操作セットのサポート）を十分に利用できず、計算あたりの時間にも悪影響を与えてしまう。また、このようなマルチプロセスの並列化は、ＣＰＵコアの数に制限され、単一のＣＰＵは、通常、数又は数十の計算モジュールの同時実行を可能にするだけであり、並列化されるべき次元が１０００である場合、完了するために単回計算の数十倍以上の時間を必要とする。

本発明は、ベクトル並列化の思想を量子回路シミュレーションに導入することを提案する。本発明におけるベクトル並列化は、本質的に並列次元を線形代数の１つの余分な次元と見なし、底層の演算子からバッチ（ｂａｔｃｈ）並列能力を直接的に実現し、ＧＰＵなどのハードウェアの優勢を十分に発揮することができる。例えば、並列次元サイズが１０００である場合、通常、単回計算と同じ時間で済む。そのため、大規模量子シミュレーションの効率は、従来の手法よりも遥かに高い。また、該スキームは、バックエンドのハードウェアやシステムの詳細に関係なく、優れた設計インターフェースを備えているため、使用や開発に極めて便利である。

本発明の実施例に係る量子回路シミュレーション方法では、各ステップの実行主体は、例えばＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ：パーソナルコンピュータ）などの古典コンピュータであってもよく、例えば、古典コンピュータにより対応するコンピュータプログラムを実行して該方法を実現してもよい。以下の方法の実施例では、説明の便宜上、各ステップの実行主体がコンピュータ機器であること一例として説明する。

図１は、本発明の１つの実施例に係る量子回路シミュレーション方法のフローチャートである。該方法の各ステップの実行主体は、コンピュータ機器、例えば古典コンピュータである。該方法は、以下の幾つかのステップ（１１０～１４０）を含んでもよい。

ステップ１１０において、量子回路シミュレーションのための元の関数を取得し、元の関数における並列化を必要とする第１の入力パラメータを決定する。

量子回路シミュレーションのプロセスは、入力波動関数を処理するステップ、回路変分パラメータを最適化するステップ、回路ノイズを生成するステップ、回路構造を生成するステップ、回路測定を実行するステップのうちの１つ以上を含むことができる。幾つかの態様では、元の関数は、量子回路シミュレーションにおける目標ステップを実現するために使用され、該目標ステップは、入力波動関数を処理すること、回路変分パラメータを最適化すること、回路ノイズを生成すること、回路構造を生成すること、回路測定を実行することの何れかを含むが、これらに限定されない。元の関数が入力波動関数を処理する場合、該元の関数は、目標量子回路の入力波動関数を計算して対応する計算結果を取得する。元の関数が回路変分パラメータを最適化する場合、該元の関数は、目標量子回路の回路変分パラメータを最適化し、最適化された回路変分パラメータを取得する。

元の関数の入力パラメータの数は、１つであってもよいし、複数であってもよい。上記の第１の入力パラメータとは、元の関数における並列化が必要な入力パラメータを意味する。第１の入力パラメータの数は、１つであってもよいし、複数であってもよい。一例として、元の関数ｆは、３つの入力パラメータを有する元の関数ｆ（ｘ，ｙ，ｗ）として表され、ｘ、ｙ及びｗの３つの入力パラメータを含む。この元の関数ｆの３つの入力変数のうち、並列化が必要な入力変数をｘとすると、上記の第１の入力パラメータはｘであり、他の２つのパラメータｙとｗは並列化する必要がない。或いは、この元の関数ｆの３つの入力変数のうち、並列化が必要な入力変数をｘとｙとすると、上記の第１の入力パラメータはｘとｙであり、もう１つの変数ｗは並列化する必要がない。

異なる元の関数に応じて、入力パラメータは異なり、並列化が必要な第１の入力パラメータも異なる。実際の応用では、元の関数が決定された後、その入力パラメータが決定され、実際の状況に応じて、並列化処理に適する１つ以上の入力パラメータを第１の入力パラメータとして選択することができる。

ステップ１２０において、元の関数及び第１の入力パラメータに基づいて、元の関数を目的関数に変換する。ここで、目的関数の入力パラメータは、第１の入力パラメータに対応する変換後の第１の入力パラメータを含み、変換後の第１の入力パラメータに対応するテンソルは、第１の入力パラメータに対応する複数の並列化されたテンソルを結合して得られた結果である
目的関数の入力パラメータは、並列化が必要な第１の入力パラメータに対応する変換後の第１の入力パラメータを含む。幾つかの態様では、元の関数の入力パラメータに、並列化を必要とする第１の入力パラメータに加えて、並列化を必要としない目標入力パラメータが含まれる場合、目的関数は、以下の方式で取得されてもよい。即ち、元の関数における第１の入力パラメータを変換後の第１の入力パラメータに修正し、目標入力パラメータを維持することによって、目的関数を取得する。即ち、目的関数の入力パラメータは、該第１の入力パラメータに対応する変換後の第１の入力パラメータに加えて、上述した並列化を必要としない目標入力パラメータを含む。一例として、元の関数ｆをｆ（ｘ，ｙ，ｗ）として表し、この元の関数ｆの３つの入力変数のうち、ｘとｙが並列化を必要とし、ｗが並列化を必要しないと、目的関数ｆ’はｆ’（ｘｓ，ｙｓ，ｗ）と表してもよく、ｘｓは入力変数ｘに対応する変換後ｘを表し、ｙｓは入力変数ｙに対応する変換後ｙを表し、入力変数ｗは並列化が不要であるため変換する必要がない。

幾つかの態様では、元の関数の入力パラメータに並列化を必要としない目標入力パラメータが含まれない場合、目的関数は、以下の方式で取得されてもよい。即ち、元の関数における第１の入力パラメータを変換後の第１の入力パラメータに修正することによって、目的関数を取得する。一例として、元の関数ｆはｆ（ｘ，ｙ，ｗ）と表記され、この元の関数ｆの３つの入力変数が全て並列化されると仮定すると、目的関数ｆ’はｆ’（ｘｓ，ｙｓ，ｗｓ）と表記でき、ｘｓは入力変数ｘに対応する変換後ｘを表し、ｙｓは入力変数ｙに対応する変換後ｙを表し、ｗｓは入力変数ｗに対応する変換後ｗを表す。

幾つかの態様では、第１の入力パラメータに対応する並列化サイズ（又は「バッチサイズ（ｂａｔｃｈｓｉｚｅ）」と称される）がｎであり、ｎが１より大きい整数である場合、即ち、第１の入力パラメータに対応するｎ個のテンソルに対して並列化処理を行う場合、変換後の第１の入力パラメータに対応するテンソルは、上述のｎ個のテンソルの統合結果である（「結合結果」とも称される）。本発明の実施例では、テンソルは高次元配列であり、ｎ_１×ｎ_２×ｎ_３…×ｎ_ｍ個を含み、ｍはテンソルの次数であり、ｍは正の整数である。ｍ＝１の場合、テンソルは１次元の配列、即ちベクトルである。ｍ＝２の場合、テンソルは２次元の配列、即ち行列である。なお、ｍは３以上の整数であってもよく、即ち、テンソルの配列の次元は無限に拡張されてもよい。

幾つかの態様では、第１の入力パラメータに対応する複数の並列化されたテンソルを目標次元において結合して、変換後の第１の入力パラメータに対応するテンソルを取得する。ここで、変換後の第１の入力パラメータに対応するテンソルの目標次元におけるサイズは、第１の入力パラメータに対応する並列化されたテンソルの数に対応する。

一例として、図２に示すように、元の関数ｆ（ｘ，ｙ，ｗ）において並列化される必要がある入力パラメータｘの対応する並列化サイズがｎであると仮定すると、入力パラメータｘに対応するｎ個のテンソルを目標次元において結合し、該結合して得られたテンソルはｘｓに対応するテンソルである。幾つかの態様では、上記ｎの値は、２、１０、５０、１００、２００、５００、１０００などであってもよく、具体的には実際の需要に応じて設定されてもよく、本発明はこれに限定されない。

ステップ１３０において、目的関数の入力パラメータに基づいて、目的関数に対応する実行結果を取得する。

元の関数を目的関数に変換した後、該目的関数を実行して、対応する実行結果を取得する。幾つかの態様では、ベクトル並列化方式で目的関数を実行し、目的関数に対応する実行結果を取得する。目的関数の入力パラメータに含まれる変換後の第１の入力パラメータをベクトル並列化方式で処理し、目的関数に対応する実行結果を取得する。本発明の実施例では、ベクトル並列化の思想を量子回路シミュレーションに導入する。目的関数の入力パラメータに変換後の第１の入力パラメータが含まれるため、ベクトル並列化方式を採用して該変換後の第１の入力パラメータに対応するテンソルに対して処理を行い、シングルステップの計算により目的関数に対応する実行結果を直接的に取得する。

元の関数の実行にかかる時間をｔとし、並列化サイズをｎとした場合、単純なループで元の関数をｎ回実行すると、全体の時間はｎ×ｔであるが、元の関数を目的関数に変換した後、ベクトル並列化で目的関数を実行する場合の時間は理論的にｔであるため、ｎ×ｔに比べて大幅に削減され、ｎの増加とともに削減効果が大きくなる。

ステップ１４０において、目的関数に対応する実行結果に基づいて、量子回路シミュレーションを実行する
目的関数に対する実行結果を取得した後、量子回路シミュレーションを実行してもよい。元の関数が入力波動関数を処理することを一例にすると、対応する目的関数に対応する実行結果は、複数の入力波動関数のそれぞれに対応する処理結果を含み、後続は、該複数の入力波動関数のそれぞれに対応する処理結果に基づいて、回路変分パラメータの最適化などのプロセスを行うことができる。元の関数が回路変分パラメータを最適化することを一例にすると、対応する目的関数に対応する実行結果は、複数組の回路変分パラメータのそれぞれに対応する最適化結果を含み、後続は、該複数組の回路変分パラメータのそれぞれに対応する最適化結果に基づいて、最適な１組の回路変分パラメータを最終の目標量子回路として選択することができる。

また、量子回路シミュレーションによって、古典コンピュータと数値計算の方式で、量子コンピュータ（又は量子回路）の動作をシミュレート又は近似することを実現し、量子回路に対する研究と設計を加速化すると共に、コストを節約することができる。

本発明に係る技術は、量子回路シミュレーションにベクトル並列化の思想を導入し、即ち、元の関数を目的関数に変換し、該目的関数の入力パラメータは並列化を必要とする第１の入力パラメータに対応する変換後の第１の入力パラメータを含み、該変換後の第１の入力パラメータに対応するテンソルは第１の入力パラメータに対応する複数の並列化されたテンソルを結合して得られた結果であり、目的関数を実行することによって、本来の複数回実行する必要のある計算プロセスを１回の計算プロセスに並列化して実行することができるため、１回の計算と同一の時間だけで完成することができ、量子回路シミュレーションの効率を十分に向上させることができる。

図３は、本発明のもう１つの実施例に係る量子回路シミュレーション方法のフローチャートである。該方法の各ステップの実行主体は、コンピュータ機器、例えば古典コンピュータである。この方法は、以下の幾つかのステップ（３１０～３５０）を含んでもよい。

ステップ３１０において、量子回路シミュレーションのための元の関数を取得し、元の関数における並列化を必要とする第１の入力パラメータを決定する。

ステップ３１０は、図１に示される実施例のステップ１１０と同一であり、具体的には、図１の実施例の説明を参照してもよく、本実施例ではその説明を省略する。

ステップ３２０において、関数変換インターフェースを呼び出し、関数変換インターフェースに元の関数及び第１の情報を伝送する。該第１の情報は、元の関数における並列化を必要とする第１の入力パラメータを示すために使用される。

関数変換インターフェースは、元の関数を目的の関数に変換する機能を実現するために使用される。関数変換インターフェースは、ＡＰＩ（ＡｐｐｌｉｃａｔｉｏｎＰｒｏｇｒａｍｍｉｎｇＩｎｔｅｒｆａｃｅ：アプリケーションプログラミングインターフェース）などのユーザ指向のインターフェースであってもよい。

第１の情報は、元の関数における並列化を必要とする第１の入力パラメータを示すために使用される。幾つかの態様では、第１の情報は、元の関数における並列化を必要とする第１の入力パラメータの位置を示すために使用される。例えば、元の関数ｆ（ｘ，ｙ，ｗ）における入力変数ｘ、ｙ、ｗの位置番号は順に０，１，２であり、並列化を必要とする入力変数をｘとすると、第１の情報は０である。或いは、並列化を必要とする入力変数をｘとｙとすると、第１の情報は０と１である。元の関数における並列化が必要な第１の入力パラメータを位置により示すことによって、正確かつ簡潔な指示を実現することができる。

ステップ３３０において、関数変換インターフェースにより第１の情報に基づいて元の関数を目的関数に変換する。ここで、目的関数の入力パラメータは、第１の入力パラメータに対応する変換後の第１の入力パラメータを含み、変換後の第１の入力パラメータに対応するテンソルは、第１の入力パラメータに対応する複数の並列化されたテンソルを結合して得られた結果である。

関数変換インターフェースは、第１の情報に基づいて、元の関数における並列化を必要とする第１の入力パラメータを決定し、その後、該第１の入力パラメータに基づいて元の関数を目的関数に変換する。例えば、元の関数における並列化を必要とする第１の入力パラメータについて、目標次元で第１の入力パラメータに対応する複数の並列化されたテンソルを結合し、変換後の第１の入力パラメータに対応するテンソルを取得する。元の関数における並列化を必要としない目標入力パラメータについて、該目標入力パラメータを目的関数の入力パラメータとしてそのまま保持する。このように、目的関数の入力パラメータは、変換後の第１の入力パラメータを含み、好ましくは、目標入力パラメータをさらに含む。関数変換インターフェースはベクトル並列化機能をサポートし、関数変換インターフェースの上述の変換により、目的関数は、複数の元の関数を並列に計算した結果を出力するために使用されてもよい。

幾つかの態様では、関数変換インターフェースは、ベクトル並列化機能に加えて、自動微分機能をさらにサポートする。変換された目的関数は、複数の元の関数を並列に計算した結果を出力するために使用されるだけでなく、第２の入力パラメータに対する元の関数の微分係数情報を出力するためにも使用され、該第２の入力パラメータは、元の関数の入力パラメータのうちの微分演算を必要とする入力パラメータを意味する。第２の入力パラメータの数は、１つ又は複数であってもよい。また、第２の入力パラメータと第１の入力パラメータとは、同一であってもよいし、異なっていてもよい。例えば、元の関数ｆ（ｘ，ｙ，ｗ）における入力パラメータはｘ、ｙ、ｗであり、並列化が必要な第１の入力パラメータはｘであり、微分演算を必要とする第２の入力パラメータもｘである。或いは、並列化が必要な第１の入力パラメータはｘとｙであり、微分演算を必要とする入第２の入力パラメータはｘである。或いは、並列化が必要な第１の入力パラメータはｗであり、微分演算を必要とする入第２の入力パラメータはｙである。

幾つかの態様では、関数変換インターフェースを呼び出す際に、該関数変換インターフェースに元の関数、第１の情報及び第２の情報を伝送し、該第２の情報は、元の関数における微分演算を必要とする第２の入力パラメータを示すために使用される。幾つかの態様では、第２の情報は、元の関数における微分演算を必要とする第２の入力パラメータの位置を示すために使用される。例えば、元の関数ｆ（ｘ，ｙ，ｗ）における入力変数ｘ、ｙ、ｗの位置番号は順に０，１，２であり、並列化が必要な第１の入力変数をｘとｙとし，微分演算を必要とする第２の入力変数をｘとすると、第１の情報は０と１であり、第２の情報は０である。それに応じて、関数変換インターフェースを介して、第１の情報及び第２の情報に基づいて、元の関数を目的関数に変換し、目的関数は、複数の元の関数を並列に計算した結果を出力すると共に、第２の入力パラメータに対する元の関数の微分係数情報を出力する。

幾つかの態様では、関数変換インターフェースは、第１のインターフェース及び第２のインターフェースを含む。第１のインターフェースは、第１の情報に基づいて元の関数を目的関数に変換する。第２のインターフェースは、第１の情報と第２の情報に基づいて、元の関数を目的関数に変換する。即ち、第１のインターフェースは、ベクトル並列化機能をサポートする関数変換インターフェースであり、言い換えれば、第１のインターフェースは、ベクトル並列化機能のみをサポートする関数変換インターフェースである。第２のインターフェースは、ベクトル並列化機能と自動微分機能をサポートする関数変換インターフェースである。

一例として、第１のインターフェースは、ｖｍａｐインターフェースであり、このｖｍａｐインターフェースの関数シグネチャは、例えば、ｖｍａｐ（ｆ：Ｃａｌｌａｂｌｅ［…、Ａｎｙ］、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ：Ｕｎｉｏｎ［ｉｎｔ，Ｓｅｑｕｅｎｃｅ［ｉｎｔ］］＝０）→Ｃａｌｌａｂｌｅ［…，Ａｎｙ］である。ここで、ｆは並列化されるべき元の関数を表し、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓは、並列化が必要な第１の入力パラメータを示し、例えば、並列化が必要な第１の入力パラメータの位置を示すために使用される。上記のｖｍａｐインターフェースの関数シグネチャにおいて、ｆ：Ｃａｌｌａｂｌｅ［…、Ａｎｙ］は、元の関数ｆが任意の入出力をテンソルとする関数であることを表す。ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ：Ｕｎｉｏｎ［ｉｎｔ，Ｓｅｑｕｅｎｃｅ［ｉｎｔ］］＝０は、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓが数値（例えば０又は１又は２又は３など）又は数値列（例えば０，１又は０，１，２又は１，２など）であり、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓのデフォルト値が０である。出力は、Ｃａｌｌａｂｌｅ［…、Ａｎｙ］として定義される。

図２に示すように、一例として、ｖｍａｐインターフェースの機能の概略図を示す。任意の元の関数ｆ（例えば、任意の入力と出力がテンソルの元の関数）に対して、ｖｍａｐインターフェースによる関数変換を経て、もう１つの目的関数ｆ’が出力される。ｆ’＝ｖｍａｐ（ｆ，ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ＝（０，１））であり、ここで、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ＝（０，１）は、元の関数ｆにおける並列化が必要な第１の入力変数の位置番号０と１であり、即ちｘとｙは並列化が必要であり、ｗは並列化が不要であることを表す。この目的関数ｆ’の入力形式（即ち、入力パラメータのタイプと形状）は元の関数ｆの入力形式と同一であるが、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓで指示された位置での入力パラメータについて、対応するテンソル形状は元の関数ｆの対応する入力テンソルより１次元多い（即ち、図２における縦の次元は、元の関数ｆには存在しない）、その次元の大きさをｎとし、ｎは１よりも大きい整数であり、このｎはバッチサイズとも称される。ｖｍａｐインターフェースを変換して得られた目的関数ｆ’の最終的な計算効果はｎ次の元の関数ｆを計算することと等価であり、毎回の元の関数ｆの入力は非ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ位置のパラメータとｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ位置の変数の１つ下の次元のスライスである。図２では、同一の色のテンソルは１つのスライスであり、図２の破線枠で示すように１つのスライスである。しかし、このｎ回の元の関数ｆへの呼び出しは、下位層を融合して統一的な演算子として並列に同時計算することができる。

一例として、第２のインターフェースは、ｖｅｃｔｏｒｉｚｅｄ＿ｖａｌｕｅ＿ａｎｄ＿ｇｒａｄインターフェースであり、ｖｖａｇインターフェースと略記することができる。ｖｖａｇインターフェースの関数シグネチャは、例えば、ｖｅｃｔｏｒｉｚｅｄ＿ｖａｌｕｅ＿ａｎｄ＿ｇｒａｄ（ｆ：Ｃａｌｌａｂｌｅ［…，Ａｎｙ］、ａｒｇｎｕｍｓ：Ｕｎｉｏｎ［ｉｎｔ，Ｓｅｑｕｅｎｃｅ［ｉｎｔ］］＝０，ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ：Ｕｎｉｏｎ［ｉｎｔ，ｖｅｃｔｏｒｉｚｅｄ［ｉｎｔ］］＝０）→Ｃａｌｌａｂｌｅ［…，Ｔｕｐｌｅ［Ｔｅｎｓｏｒ，Ｔｅｎｓｏｒ］］である。ここで、ｆは、並列化されるべき元の関数を表し、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓは、並列化が必要な第１の入力パラメータ、例えば、並列化が必要な第１の入力パラメータの位置を示すために使用され、ａｒｇｎｕｍｓは、微分演算が必要な第２の入力パラメータ、例えば、微分演算が必要な第２の入力パラメータの位置を示すために使用される。上記のｖｖａｇインターフェースの関数シグネチャにおいて、ｆ：Ｃａｌｌａｂｌｅ［…、Ａｎｙ］は、元の関数ｆが任意の入力と出力がテンソルである関数であることを表す。ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ：Ｕｎｉｏｎ［ｉｎｔ，Ｓｅｑｕｅｎｃｅ［ｉｎｔ］］＝０は、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓが数値（例えば、０又は１又は２又は３など）又は数値列（例えば、０，１又は０，１，２又は１，２など）であることを意味し、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓのデフォルト値は０である。Ｃａｌｌａｂｌｅ：…［ｉｎｔ，ｖｅｃｔｏｒｉｚｅｄ［ｉｎｔ］］＝０は、ａｒｇｎｕｍｓが数値（例えば、０又は１又は２又は３など）又は数値列（０，１又は０，１，２又は１，２など）であり、Ｕｎｉｏｎのデフォルト値が０であることを意味する。出力はＣａｌｌａｂｌｅ［…、Ｔｕｐｌｅ［Ｔｅｎｓｏｒ、Ｔｅｎｓｏｒ］］と定義され、出力が２つのテンソルを含むことを意味し、１つのテンソルは、元の関数ｆを複数回の並列に計算した結果であり、もう１つのテンソルは、元の関数ｆがａｒｇｎｕｍｓで示される位置に対する入力パラメータの微分係数情報である。

任意の元の関数ｆ（例えば、任意の入力と出力がテンソルである元の関数）に対して、ｖｖａｇインターフェースでの関数変換により、もう１つの目的関数ｆ’が出力される。目的関数ｆ’がｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓで指示する位置の入力変数に対応するテンソル形状が元の関数ｆに対応する入力テンソルよりも１次元多い点について、ｖｍａｐインターフェースと同様である。また、ｖｖａｇインターフェースを介して変換された目的関数ｆ’の戻り値は、複数回の元の関数ｆを並列に計算した結果を返すほか、元の関数ｆのａｒｇｎｕｍｓが指示する位置に対する入力変数の微分係数情報を返す。

一例として、ｖｖａｇインターフェースに対応する数学的表現は、元の関数がｆであり、この元の関数ｆがｖｖａｇインターフェースにより変換された目的関数がｆ’である。

ｆ’＝ｖｖａｇ（ｆ，ａｒｇｎｕｍｓ＝ｋ，ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ＝ｐ）
ｆ’（ａｒｇ［０］，…，ａｒｇ［ｐ］，…，ａｒｇ［ｋ］，…）＝（ｖ，ｇ）
ｖｉ＝ｆ（ａｒｇ［０］，…，ａｒｇ［ｐ］［ｉ］，…，ａｒｇ［ｋ］，…）

ここで、ａｒｇｎｕｍｓ＝ｋは、元の関数ｆの入力変数のうち、位置番号ｋの入力変数が微分演算を必要とする入力変数であることを表す。ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ＝ｐは、元の関数ｆの入力変数のうち、位置番号ｐの入力変数が並列化を必要とする入力変数であることを表す。ａｒｇ［０］，…，ａｒｇ［ｐ］，…，ａｒｇ［ｋ］，…は、目的関数ｆ’の入力変数を表し、その出力はｖとｇの２つのテンソルである。ここで、ｖは複数回の元の関数ｆを並列に計算した結果を表し、ｇは元の関数ｆのａｒｇｎｕｍｓが指示する位置に対する入力変数の微分係数情報を表す。ａｒｇ［ｐ］［ｉ］は、変換後の位置番号ｐの入力変数に対応するテンソルにおけるｉ番目のスライスを表し、並列化サイズがｎである場合、ｉの値は範囲［０，ｎ－１］内の整数である。ｐ≠ｋの場合、
（外７）

となり、ｐ＝ｋの場合、
（外８）

となる。

なお、上記実施例では、単に第１のインターフェースがｖｍａｐインターフェースであり、第２のインターフェースがｖｖａｇインターフェースであることを一例として、本発明に係る上記２つの異なる機能のインターフェースを説明した。本発明の実施例は、上記２つのインターフェースの名称を限定するものではなく、開発者が自ら設定することができる。

幾つかの態様では、関数変換インターフェースは、機械学習ライブラリにカプセル化されたアプリケーションプログラミングインターフェース（ＡＰＩ）であり、該機械学習ライブラリは、目的関数を実行するためのベクトル命令セットを提供する。例えば、上記の下位層の機械学習ライブラリは、ｔｅｎｓｏｒｆｌｏｗ、ｊａｘなどの機械学習ライブラリであってもよく、下位層の機械学習ライブラリには、目的関数を実行するためのベクトル命令セットが提供され、関数変換インターフェースは機械学習ライブラリにカプセル化されている。これによって、ベクトル並列化の実現が下位層のフレームワークと関係なく、関数変換インターフェースを呼び出すだけでベクトル並列化の機能を実現できることを保証する。

ステップ３４０において、ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得する。

関数変換インターフェースにより元の関数を目的関数に変換した後、さらに下位層の機械学習ライブラリにより提供されたベクトル命令セットを呼び出し、ＣＰＵ、ＧＰＵ又はＴＰＵなどのハードウェアで該ベクトル命令セットを実行することによって、変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得する。ベクトル命令セットは、プロセッサが変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行するための実行可能命令を含む。上記のベクトル命令セットは、ＣＰＵ、ＧＰＵ又はＴＰＵなどのプロセッサにより実行できる実行可能命令を提供し、これらの実行可能命令は、例えば加算、乗算などの下位演算子の機能を実現することができる。本実施例では、ＣＰＵ、ＧＰＵ又はＴＰＵなどのプロセッサでベクトル命令セットを実行する方式を採用してベクトル並列化処理を実現することで、オペレーティングシステムでマルチプロセス又はマルチスレッドを実行する場合に比べて、並列化可能数のボトルネックを克服し、並列化サイズを十分に向上させることができる。

ステップ３５０において、目的関数に対応する実行結果に基づいて、量子回路シミュレーションを実行する。

目的関数に対する実行結果を取得した後、量子回路シミュレーションを実行することができる。ステップ３５０は、図１に示す実施例におけるステップ１４０と同様であり、具体的には、図１の実施例の説明を参照してもよく、本実施例ではその説明を省略する。

本発明に係る技術は、関数変換インターフェースを呼び出し、該関数変換インターフェースに元の関数と元の関数における並列化を必要とする第１の入力パラメータを示すための第１の情報を入力することによって、該関数変換インターフェースにより元の関数を目的関数に変換することができ、ベクトル並列化処理を実現し、元の関数の計算効率を向上させ、さらに量子回路シミュレーションの効率を向上させることができる。

また、幾つかの態様では、関数変換インターフェースは、ベクトル並列化機能に加えて、自動微分機能をサポートするため、変換により得られた目的関数は、複数回の元の関数を並列に計算した結果に加えて、第２の入力パラメータに対する元の関数の微分係数情報を出力することができる。これによって、変分量子アルゴリズムのシナリオに特に適するため、変分量子アルゴリズムの開発及び研究をより容易にすることができる。

以下は、ベクトル並列化の量子回路シミュレーションへの応用シナリオについて説明する。本発明の実施例では、ベクトル並列化は、量子回路シミュレーションの入力波動関数の処理、回路変分パラメータの最適化、回路ノイズの生成、回路構造の生成、回路計測の実行などのステップに適用可能であり、以下、幾つかの実施例を通して、これらの適用シナリオをそれぞれ説明する。

図４は、本発明の１つの実施例に係る目標量子回路の数値シミュレーションの概略図である。この目標量子回路は、変分量子アルゴリズムの数値シミュレーションを実現できる。本発明に係る技術を使用することで、該シミュレーションの全ての主要な構成要素は、ベクトル並列化を好適にサポートすることができ、様々なアプリケーションシナリオにおいて量子シミュレーションを著しく加速することができる。図４に示すように、シミュレーション計算が必要となる動作として、指定された量子状態（行列積状態又はベクトルの形式）を入力し、その後、パラメータを含み、ノイズを含み得る量子回路の作用を経て、与えられたパウリ文字列を測定する形で出力状態を異なる基底で測定し、最適化の反復のために最適化関数値及び重み（ｗｅｉｇｈｔ）に関する勾配を取得する。

図４では、目標量子回路の入力量子状態は
（外９）

として表され、目標量子回路の回路パラメータはＵ_θとして表され、測定結果は
（外１０）

として表され、最適化関数
（外１１）

となり、ここで、
（外１２）

はｉ回目の測定結果であり、ｉは整数であり、
（外１３）

はＵ_θの共役転置を表す。

１．入力波動関数を並列に処理する
この例では、元の関数は、量子回路シミュレーションにおける目標ステップを実現するために使用され、該目標ステップは入力波動関数を処理するステップを含み、第１の入力パラメータは、目標量子回路の入力波動関数を含む。

幾つかの態様では、変換後の第１の入力パラメータに対応するテンソルを取得する。該変換後の第１の入力パラメータに対応するテンソルは、目標量子回路の複数の並列化された入力波動関数を結合して得られた結果である。ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得する。ここで、目的関数に対応する実行結果は、複数の並列化された入力波動関数のそれぞれに対応する処理結果を含む。

変分量子回路シミュレーションを一例にすると、変分量子回路シミュレーションは、入力波動関数、回路ユニタリ行列及び回路測定の３つの部分により構成される。多くのタスクでは、回路の入力波動関数は全０直積状態であり、この場合に入力波動関数を指定する必要がない。しかし、あるタスクでは、異なる入力波動関数を受け取って処理と出力を行うために、同一の回路構造が必要となる場合があり、このような場合には、入力波動関数というパラメータをベクトル並列化してシミュレーションすることが適している。

例えば、量子機械学習のようなタスクでは、入力されたデータセットをバッチ処理し、入力されたデータのバッチの結果を毎回同時に計算する必要がある。このデータのバッチは、入力された波動関数として量子機械学習モデルに入力される入力波動関数としてエンコードされる。そのため、入力波動関数を並列に処理することで、量子機械学習のバッチ入力を容易に処理することができ、大きなｂａｔｃｈｓｉｚｅ（バッチサイズ）での加速を実現することができる。数値実験によると、ＧＰＵの場合、ｂａｔｃｈｓｉｚｅ＝５１２とｂａｔｃｈｓｉｚｅ＝１が必要とする計算時間は略同様である。これは、ベクトル並列化の基礎アーキテクチャの最適化のため、シミュレーションを直接ｂａｔｃｈｓｉｚｅ倍加速したことに相当する。

図５は、本発明の１つの実施例に係る入力波動関数の並列的な処理の概略図である。上述したｖｖａｇインターフェースを用いることを一例として、目的関数ｆ’＝ｖｖａｇ（ｆ，ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ＝０，ａｒｇｎｕｍｓ＝１）、ここで、ｆは元の関数であり、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ＝０は、並列化が必要な入力パラメータが目標量子回路の入力波動関数であることを表し、ａｒｇｎｕｍｓ＝１は、微分演算が必要な入力パラメータが目標量子回路の重みであることを表す。目的関数ｆ’の入力パラメータは、目標量子回路の重み５１と、目標量子回路の複数の並列化された入力波動関数を結合して得られた結果５２と、この目的関数ｆ’をベクトル並列化で実行し、複数の並列化された入力波動関数のそれぞれに対応する処理結果５３と、重みの微分係数情報５４とを含む。そして、この複数の並列化された入力波動関数のそれぞれに対応する処理結果に基づいて、回路変分パラメータの最適化などのステップを行い、例えば、入力波動関数に対応する処理結果が所望の結果にできるだけ近くなるように、入力波動関数に対応する処理結果と所望の結果との差分に基づいて、目標量子回路の回路変分パラメータを調整してもよい。

この例では、入力波動関数を並列に処理することによって、量子回路シミュレーションにおける入力波動関数のバッチ処理効率を十分に向上させることができる。

２．回路変分パラメータを並列に最適化する
この例では、元の関数は、量子回路シミュレーションにおける目標ステップを実現するために使用され、この目標ステップは、回路変分パラメータを最適化することを含み、第１の入力パラメータは、目標量子回路の回路変分パラメータを含む。

幾つかの態様では、変換後の第１の入力パラメータに対応するテンソルを取得する。該変換後の第１の入力パラメータに対応するテンソルは、目標量子回路の複数組の並列化された回路変分パラメータを結合して得られた結果である。ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得する。ここで、目的関数に対応する実行結果は、複数組の並列化された回路変分パラメータのそれぞれに対応する最適化結果を含む。

変分量子最適化の問題では、勾配降下のパラメータは、しばしば局所極小値にとどまる。これによって、異なる初期パラメータから同一の問題に対して独立な最適化を複数回行い、その中から最適化関数を最適化するパラメータの組を選択することを要求する。このような複数回の独立した最適化の試みは、単純なループのスキームでは、時間のかかる最適化の数が倍になる。この場合、回路変分パラメータに対応する変数に対してベクトル並列化を行うことができる。

本発明の実施例は、並列加速を用いて複数回の独立最適化を提案する。特に、ＶＱＥのような最適化が局所的に非常に小さなアルゴリズムに対して、並列な多重の最適化を同時に行い、最後に最適な収束パラメータを選択する。このような複数回の最適化の時間は、１回の最適化時間と略完全に一致する。この最適化方式をバッチのＶＱＥ（ｂａｔｃｈｅｄＶＱＥ）最適化と称される。即ち、複数回の独立した最適化の並列的な実行を下位層の演算子から実現してもよい。

図６は、本発明の１つの実施例に係る回路変分パラメータの並列的な最適化の概略図である。上述したｖｖａｇインターフェースを用いることを一例として、目的関数ｆ’＝ｖｖａｇ（ｆ，ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ＝０，ａｒｇｎｕｍｓ＝０）、ここで、ｆは元の関数であり、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ＝０は、並列化が必要な入力パラメータが目標量子回路の回路変分パラメータ（重み）であることを表し、ａｒｇｎｕｍｓ＝０は、微分演算が必要な入力パラメータも目標量子回路の回路変分パラメータ（重み）であることを表す。目的関数ｆ’の入力パラメータは、目標量子回路の複数組の並列化された回路変分パラメータを結合して得られた結果６１と、この目的関数ｆ’をベクトル並列化で実行して得られた複数組の並列化された回路変分パラメータのそれぞれに対応する最適化結果６２と、回路変分パラメータの微分係数情報６３を取得する。そして、この複数組の並列化された回路変分パラメータのそれぞれに対応する最適化結果に基づいて、最適な一組の回路変分パラメータを最終的な目標量子回路のパラメータとして選択することができる。

この例では、回路変分パラメータを並列に最適化することによって、量子回路シミュレーションプロセスにおける回路変分パラメータに対する最適化効率を十分に向上させることができる。

３．回路ノイズを並列に生成する
この例では、元の関数は、量子回路シミュレーションにおける目標ステップを達成するために使用され、該目標ステップは、回路ノイズを生成することを含み、第１の入力パラメータは、目標量子回路の回路ノイズを生成するための乱数を含む。

幾つかの態様では、変換後の第１の入力パラメータに対応するテンソルを取得する。該変換後の第１の入力パラメータに対応するテンソルは、目標量子回路の回路ノイズを生成するための複数組の並列化された乱数を結合して得られた結果である。ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得する。ここで、目的関数に対応する実行結果は、複数の並列化された乱数のそれぞれに対応するノイズシミュレーション結果を含む。その後、目標量子回路の異なる乱数に対応するノイズシミュレーション結果での実行結果を観測し、異なるノイズ環境での該目標量子回路の実行状況及び実行結果の差異を取得することができる。

モンテカルロ軌道シミュレータのシナリオでは、ノイズの異なる確率分布の挙動を異なる乱数でシミュレートする。モンテカルロ軌道シミュレータは観測量を評価するため、大量の異なる乱数配置の観測量を平均化する必要があるため、乱数というパラメータをベクトル並列化し、数十種類又は数百種類の乱数配置を同時にシミュレートすることができる。従って、本発明のスキームは、量子ノイズのモンテカルロシミュレーションを加速し、異なる乱数入力を並列化して、ノイズのモンテカルロシミュレーションをベクトル化して並列化するために使用することができる。ここで、乱数を並列次元とする動作と入力波動関数を並列次元とする動作とは類似しており、個別に模式図を示さない。

この例では、回路ノイズを並列に生成することによって、量子回路シミュレーションプロセスにおける回路ノイズを生成する効率を十分に向上させることができる。

以上の３つのシナリオでは、実装された関数に対して特別な処理を行うことなく、ｖｍａｐ又はｖｖａｇインターフェースを直接呼び出して、並列化が必要な入力パラメータの位置を指定して、ＡＰＩにおけるｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓパラメータとしてベクトル並列化をサポートする効率的なシミュレーションに変えることができる。

以下の２つのシナリオでは、入力パラメータが異なる場合に、対応する簡略化されたテンソルネットワークの構造が異なるように、テンソルネットワークに基づく回路シミュレータをもとに、何らかのテンソルのパラメータ化の合計効果を実現する必要がある。図７に示すように、このような局所テンソルの合計をパラメータ化し、同一の局所テンソル形状を維持してテンソルネットワーク全体に埋め込むことで、異なるテンソルネットワーク構造（又は量子回路構造）のシミュレーションのパラメータ化制御の思想を実現する。図７は、テンソルネットワークに含まれるパラメータ化された構造情報のセグメントを示しており、ここで、
（外１４）

は構造パラメータである。異なるｏｎｅ－ｈｏｔ（ワンホット）ベクトルを
（外１５）

とした場合、テンソルネットワークにおける注目される局所的なものはＣＮＯＴ（制御ＮＯＴ）ゲート（
（外１６）

＝（１，０，…））又はシングルビットロータリーゲート直積（
（外１７）

＝（０，１，…））として実現できる。より多くのサブブロックのパラメータ化構造のシミュレーションでは、各局所に独立した
（外１８）

構造パラメータベクトルを導入するだけでよい。測定のパラメータ化についても同様であり、選択された測定位置の局所テンソルは、
（外１９）

であればよい。ここで、λ_ｉはｉ番目の量子ビットに対応する４次元ベクトルを表し、σ_０＝Ｉ（Ｉ演算子は
（外２０）

）、σ_１、σ_２及びσ_３はパウリ行列Ｘ、Ｙ及びＺに対応する。この場合、１組の形状が［量子ビット，４］のパラメータテンソルを入力することによって、最後の測定に対応するパウリ文字列を直接的に制御することができる。全ての計算プロセスと即時コンパイルにより作成された計算グラフは、完全に同一であり、且つ再利用することができる。例えば、測定パラメータ［［１，０，０，０］，［０，１，０，０］，［０，０，０，１］］は、測定されるべき所望のパウリ文字列がＩ_０Ｘ_１Ｚ_２であることを表し、Ｘ_１Ｚ_２として簡略化される。さらに重要なこととして、上記のスキームは、テンソルネットワークの全体的な静的構造を変更しないため、即時コンパイル及びテンソル縮退経路の事前最適化探索を完全にサポートすることができる。

４．回路構成を並列に生成する
この例では、元の関数は、量子回路シミュレーションにおける目標ステップを実現するために使用され、該目標ステップは、回路構造を生成することを含み、第１の入力パラメータは、目標量子回路の回路構造を生成するための制御パラメータを含み、異なる制御パラメータは、異なる回路構造を生成するために使用される。

幾つかの態様では、変換後の第１の入力パラメータに対応するテンソルを取得する。該変換後の第１の入力パラメータに対応するテンソルは、目標量子回路の回路構造を生成するための複数組の並列化された制御パラメータを結合して得られた結果である。ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得する。ここで、目的関数に対応する実行結果は、複数組の並列化された制御パラメータのそれぞれに対応する回路構造の生成結果を含む。

異なる回路構造の並列化を実現するために、下位層シミュレータがテンソルネットワークに基づくシミュレータである特性を十分に利用する必要があり、異なる構造の回路部分に対して、異なる構造を代表するテンソルのパラメータ化合計を行い、即ち、これらのパラメータは、回路構造を制御すると同時に、即時コンパイルの制限を満たすことができる。これは、回路構成が変わっても、最も一般化されたパラメータ化された合計で代表されるスーパネットが、全ての可能性を固定されたテンソル形状で一般化しているため、即時コンパイルが正常に実現できるからである。

ＤＡＲＴＳにトリガされた微分可能量子構造探索は、一つのｂａｔｃｈ（バッチ）において大量の異なる回路構造に対応する目標最適化関数を評価するタスクを含み、ちょうど並列化回路構造のシナリオにぴったり満足する。これによって、ベクトル並列化を有する量子ソフトウェアは、微分可能量子構造探索、即ち変分回路自動化設計の効率を著しく向上させることができる。これは、テンソルシミュレータ固有の、状態シミュレータでは実現が困難な並列パラダイムである。

図８は、本発明の１つの実施例に係る回路構造の並列的な生成の概略図である。上述したｖｖａｇインターフェースを用いることを一例として、目的関数ｆ’＝ｖｖａｇ（ｆ，ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ＝０，ａｒｇｎｕｍｓ＝１）、ここで、ｆは元の関数であり、ｖｅｃｔｏｒｉｚｅｄ＿ａｒｇｎｕｍｓ＝０は、並列化が必要な入力パラメータが目標量子回路の回路構造の制御パラメータであることを表し、ａｒｇｎｕｍｓ＝１は、微分演算が必要な入力パラメータが目標量子回路の重みであることを表す。目的関数ｆ’の入力パラメータは、目標量子回路の重み８１と、目標量子回路の回路構成の複数組の並列化された制御パラメータを結合して得られた結果８２、この目的関数ｆ’をベクトル並列化で実行して得られた複数組の並列化された制御パラメータのそれぞれに対応する回路構造の生成結果を取得して、複数組の回路構造の生成結果に基づいて得られた複数組の測定結果８３と、重みに対する測定結果の微分係数情報８４を含む。そして、上記の複数組の回路構造生成結果から、最適な回路構造生成結果を１つ選択し、それに基づいて実際のハードウェアでの目標量子回路の配置を行うことができる。

この例では、回路構造を並列化して生成することによって、量子回路シミュレーションにおける回路構造の生成効率を十分に向上させることができる。

５．回路測定を並列に実行する
この例では、元の関数は、量子回路シミュレーションにおける目標ステップを実行するために使用され、該目標ステップは、回路測定を実行することを含み、第１の入力パラメータは、目標量子回路のための回路測定を実行するための測定パラメータを含み、異なる測定パラメータは、異なる測定結果を生成するために使用される。

幾つかの態様では、変換後の第１の入力パラメータに対応するテンソルを取得する。該変換後の第１の入力パラメータに対応するテンソルは、目標量子回路についての回路測定を実行するための複数組の並列化された測定パラメータを結合して得られた結果である。ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得する。ここで、目的関数に対応する実行結果は、複数組の並列化された測定パラメータのそれぞれに対応する測定結果を含む。その後、複数組の測定パラメータのそれぞれに対応する測定結果に基づいて、目標量子回路の実行結果を観測することができる。

小さいサイズの体系に対して、数値シミュレーションは、完全に量子回路の最終状態出力の波動関数情報を保存することができる。この場合、測定結果に対する数値シミュレーションは様々なスキームがある。例えば、この波動関数情報を再利用し、それによって異なるパウリ文字列演算子の該波動関数での期待値を求めてもよい。また、より小さい体系がメモリにおいて完全にハミルトニアン演算子の行列形式を表すことができる場合、パウリ文字列の和を直接に１つの独立したハミルトニアン行列に結合して期待値を計算することができ、この場合に効率がより良い。

しかし、テンソルネットワークシミュレータのみがサポートするような大きなサイズの体系では、異なるパウリ文字列に対して所望を求めるために、最終状態の波動関数（メモリに十分なスペースがない）を再利用することはできない。また、逐次縮退テンソル回路ネットワークを用いて異なる演算子の期待値を求める場合、新たに縮退経路を探すことと即時コンパイルが必要となり、多くの時間を浪費する。従って、パラメータ化回路構造の和を求めるスキームに倣って、パラメータ化回路測定の合計を実現することができるため、入力パラメータのｏｎｅ－ｈｏｔベクトルにより対応する測定演算子のパウリ文字列を制御することができる。この場合、１回の即時コンパイルだけで、全ての異なるパウリ文字列の期待される解の求めをサポートする。さらに、測定での構造パラメータのベクトル並列化と組み合わせることで、複数のパウリ文字列を同時に効率的に計算するという期待を実現することができ、異なる測定演算子ごとに再度（即時）コンパイルする必要がない。

この例では、メモリが完全な波動関数を格納できないことにより完全な波動関数を再利用して異なるパウリ文字列を評価できない状況に対して、パラメータ化回路測定に対してベクトル並列化を行うことで、大きな体系回路シミュレーションを効率的に実現することができる。

以上は、本発明の技術の応用シナリオ及び対応する加速効果を説明した。一般には、ＧＰＵなどのハードウェアでは、ベクトル並列化は、並列の次元サイズにほぼ一致した加速を実現する。これによって、一般的なシナリオにおいて、単純なループ計算と比較して、数十倍から数百倍の効率向上を達成することができ、必要とされる追加の開発コストを無視でき、ユーザに対して友好である。以下は、この効率化の重要性を簡単な定量的結果によりさらに説明する。

１．量子機械学習タスクの加速。

上述したように、機械学習タスクでは、入力データをバッチ処理する必要があるため、入力波動関数のパラメータをベクトル並列化することで、量子機械学習の計算効率を著しく向上させることができる。異なる主流の量子ソフトウェアは、同一のパラメータ化回路をシミュレートしてＭＮＩＳＴ判別問題を行い、図９に示すように、シングルステップでかかる時間はｂａｔｃｈｓｉｚｅ（バッチサイズ）の変化に従って変化する。ここで、線９１は、本発明に係るベクトル並列化スキームを用いたＧＰＵでの実行時間のｂａｔｃｈｓｉｚｅによる変化を示し、線９２は、本発明に係るベクトル並列化スキームを用いたＣＰＵでの実行時間のｂａｔｃｈｓｉｚｅによる変化を示し、線９３は、ｐｅｎｎｙｌａｎｅスキームを用いた実行時間のｂａｔｃｈｓｉｚｅによる変化を示し、線９４は、ｔｅｎｓｏｒｆｌｏｗ－ｑｕａｎｔｕｍスキームを用いた実行時間のｂａｔｃｈｓｉｚｅによる変化を示す。この図から分かるように、本発明に係るベクトル並列化技術に基づいて、より大きいｂａｔｃｈｓｉｚｅの場合、ＧＰＵでの計算は、他の主流ソフトウェアの１００倍以上の加速を実現することができる。

２．測定並列化による超大量子系の高効率シミュレーションの実現。

ベクトル並列化技術によれば、波動関数を再利用できない状況での異なるパウリ文字列測定計算グラフの再利用を実現することによって、１枚のＶ１００で１００ビットを超える量子化学基底状態シミュレーションＶＱＥ問題をシミュレートすることができる。このような大きな体系で変分量子アルゴリズムの流れ全体を展示してシミュレートするのは世界で初めてである。対応する１００格子点における１次元横磁場イジングモデル相転移点と１次元等方性のハイゼンベルクモデルのシミュレーションの収束結果は次の表１の通りである。１００格子点ＶＱＥのような大規模な問題では、１回の最適化反復に必要な時間は秒のオーダーであり、このシミュレーションタスクは主流の量子状態に基づくシミュレータではメモリ指数の発散により実現できない。

本発明に係るスキームは、自分で研究されたＴｅｎｓｏｒＣｉｒｃｕｉｔ量子シミュレーションフレームワークに基づくものである。ＴｅｎｓｏｒＣｉｒｃｕｉｔは、最新の機械学習フレームワークに基づくものであり、マルチハードウェアプラットフォームとマルチソフトウェアバックエンドをサポートすると共に、自動微分、即時コンパイル、ベクトル並列化及び異種ハードウェアアクセラレーションをサポートする、次世代の量子コンピューティングシミュレーションソフトウェアである。それは、特にＮＩＳＱ時代のアルゴリズムの設計、研究と開発に適合し、量子古典ハイブリッド計算パラダイムのシミュレーションを完璧に支持する。それは、完全に単純なＰｙｔｈｏｎで編集され、アルゴリズムではテンソルネットをコアエンジンとし、ユーザの友好性を維持すると共に、最適化されたＣ＋＋コードを超える実行効率を有する。本発明に係るスキームは、ＴｅｎｓｏｒＣｉｒｃｕｉｔフレームワークで完全に実現され、そのまま使用することができ、同種のソフトウェアを遥かに上回る効率を達成している。

本発明のスキームとＴｅｎｓｏｒＣｉｒｃｕｉｔプラットフォームは、ＮＩＳＱ時期の量子ハードウェアの検証発展と量子ソフトウェア及びアルゴリズムの設計とテストを著しく加速、強化することができる。該スキームは、ＮＩＳＱハードウェアで有効な量子優勢を示し、大規模な変分量子計算の関連問題を検証するために基礎を築き、量子コンピュータと量子啓発商業化の応用の可能性を加速する。

以下は、本発明の装置の実施例であり、本発明の方法の実施例を実行するために使用することができる。本発明の装置の実施例において開示されていない詳細については、本発明の方法の実施例を参照されたい。

図１０は、本発明の１つの実施例に係る量子回路シミュレーション装置のブロック図である。該装置は、上記の量子回路シミュレーション方法を実現する機能を有し、該機能は、ハードウェアで実現されてもよいし、ハードウェアにより対応するソフトウェアを実行して実現されてもよい。該装置は、コンピュータ機器であってもよいし、コンピュータ機器に設けられていてもよい。装置１０００は、関数取得モジュール１０１０、関数変換モジュール１０２０、関数実行モジュール１０３０、及び回路シミュレーションモジュール１０４０を含んでもよい。

関数取得モジュール１０１０は、量子回路シミュレーションのための元の関数を取得し、元の関数における並列化を必要とする第１の入力パラメータを決定する。

関数変換モジュール１０２０は、元の関数及び第１の入力パラメータに基づいて、元の関数を目的関数に変換する。ここで、目的関数の入力パラメータは、第１の入力パラメータに対応する変換後の第１の入力パラメータを含み、変換後の第１の入力パラメータに対応するテンソルは、第１の入力パラメータに対応する複数の並列化されたテンソルを結合して得られた結果である。

関数実行モジュール１０３０は、目的関数の入力パラメータに基づいて、目的関数に対応する実行結果を取得する。

回路シミュレーションモジュール１０４０は、目的関数に対応する実行結果に基づいて、量子回路シミュレーションを実行する。

例示的な態様では、関数実行モジュール１０３０は、目的関数の入力パラメータに含まれる変換後の第１の入力パラメータをベクトル並列化方式で処理し、目的関数に対応する実行結果を取得する。

例示的な態様では、関数実行モジュール１０３０は、ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得する。ベクトル命令セットは、プロセッサが変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行するための実行可能命令を含む。

幾つかの態様では、元の関数は、量子回路シミュレーションにおける入力波動関数を処理するステップを実現するために使用され、第１の入力パラメータは、目標量子回路の入力波動関数を含む。関数実行モジュール１０３０は、変換後の第１の入力パラメータに対応するテンソルを取得し、変換後の第１の入力パラメータに対応するテンソルは、目標量子回路の複数の並列化された入力波動関数を結合して得られた結果であり、ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得し、目的関数に対応する実行結果は、複数の並列化された入力波動関数のそれぞれに対応する処理結果を含む。

幾つかの態様では、元の関数は、量子回路シミュレーションにおける回路変分パラメータを最適化するステップを実現するために使用され、第１の入力パラメータは、目標量子回路の回路変分パラメータを含む。関数実行モジュール１０３０は、変換後の第１の入力パラメータに対応するテンソルを取得し、変換後の第１の入力パラメータに対応するテンソルは、目標量子回路の複数組の並列化された回路変分パラメータを結合して得られた結果であり、ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得し、目的関数に対応する実行結果は、複数組の並列化された回路変分パラメータのそれぞれに対応する最適化結果を含む。

幾つかの態様では、元の関数は、量子回路シミュレーションにおける回路ノイズを生成するステップを実現するために使用され、第１の入力パラメータは、目標量子回路の回路ノイズを生成するための乱数を含む。関数実行モジュール１０３０は、変換後の第１の入力パラメータに対応するテンソルを取得し、変換後の第１の入力パラメータに対応するテンソルは、目標量子回路の回路ノイズを生成するための複数組の並列化された乱数を結合して得られた結果であり、ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得し、目的関数に対応する実行結果は、複数の並列化された乱数のそれぞれに対応するノイズシミュレーション結果を含む。

幾つかの態様では、元の関数は、量子回路シミュレーションにおける回路構造を生成するステップを実現するために使用され、第１の入力パラメータは、目標量子回路の回路構造を生成するための制御パラメータを含み、異なる制御パラメータは、異なる回路構造を生成するために使用される。関数実行モジュール１０３０は、変換後の第１の入力パラメータに対応するテンソルを取得し、変換後の第１の入力パラメータに対応するテンソルは、目標量子回路の回路構造を生成するための複数組の並列化された制御パラメータを結合して得られた結果であり、ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得し、目的関数に対応する実行結果は、複数組の並列化された制御パラメータのそれぞれに対応する回路構造の生成結果を含む。

幾つかの態様では、元の関数は、量子回路シミュレーションにおける回路測定を実行するステップを実現するために使用され、第１の入力パラメータは、目標量子回路についての回路測定を実行するための測定パラメータを含み、異なる測定パラメータは、異なる測定結果を生成するために使用される。関数実行モジュール１０３０は、変換後の第１の入力パラメータに対応するテンソルを取得し、変換後の第１の入力パラメータに対応するテンソルは、目標量子回路についての回路測定を実行するための複数組の並列化された測定パラメータを結合して得られた結果であり、ベクトル命令セットを用いて変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、目的関数に対応する実行結果を取得し、目的関数に対応する実行結果は、複数組の並列化された測定パラメータのそれぞれに対応する測定結果を含む。

例示的な態様では、目的関数を取得する際に、元の関数の入力パラメータに並列化を必要としない目標入力パラメータが含まれる場合、元の関数における第１の入力パラメータを変換後の第１の入力パラメータに修正し、目標入力パラメータを維持し、目的関数を取得し、或いは、元の関数の入力パラメータに並列化を必要としない目標入力パラメータが含まれない場合、元の関数における第１の入力パラメータを変換後の第１の入力パラメータに修正し、目的関数を取得する。

例示的な態様では、関数変換モジュール１０２０は、関数変換インターフェースを呼び出し、関数変換インターフェースに元の関数及び第１の情報を伝送し、第１の情報は、元の関数における並列化を必要とする第１の入力パラメータを示すために使用され、関数変換インターフェースにより第１の情報に基づいて元の関数を目的関数に変換する。

幾つかの態様では、関数変換モジュール１０２０は、関数変換インターフェースに第２の情報を伝送し、第２の情報は、元の関数における微分演算を必要とする第２の入力パラメータを示すために使用され、関数変換インターフェースにより第１の情報及び第２の情報に基づいて元の関数を目的関数に変換し、目的関数は、第２の入力パラメータに対する元の関数の微分係数情報をさらに出力する。

幾つかの態様では、関数変換インターフェースは、第１のインターフェース及び第２のインターフェースを含み、第１のインターフェースは、第１の情報に基づいて元の関数を目的関数に変換し、第２のインターフェースは、第１の情報及び第２の情報に基づいて元の関数を目的関数に変換する。

幾つかの態様では、関数変換インターフェースは、機械学習ライブラリにカプセル化されたアプリケーションプログラミングインターフェース（ＡＰＩ）であり、機械学習ライブラリは、目的関数を実行するためのベクトル命令セットを提供する。

例示的な態様では、第１の入力パラメータに対応する複数の並列化されたテンソルを目標次元において結合して、変換後の第１の入力パラメータに対応するテンソルを取得し、変換後の第１の入力パラメータに対応するテンソルの目標次元におけるサイズは、第１の入力パラメータに対応する並列化されたテンソルの数に対応する。

なお、上記の実施例に係る装置は、その機能を実現する際には、上記各機能モジュールの分割のみを例に挙げて説明したが、実際には、上記機能割り当てを必要に応じて異なる機能モジュール、即ち、機器の内部構造を異なる機能モジュールに分割して、上記機能の全部又は一部を完成させるようにしてもよい。また、上述した実施例に係る装置は、方法の実施形態と同一の概念に属するものであり、その具体的な実現過程は方法の実施形態に詳述されているので、ここでは説明しない。

図１１は、本発明の１つの実施例に係るコンピュータ機器の概略図である。このコンピュータ機器は、古典コンピュータであってもよい。該コンピュータ機器は、上記の実施例に係る量子回路シミュレーション方法を実施するために使用されてもよい。

具体的には、コンピュータ機器１１００は、処理装置（ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ：中央処理装置）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ：グラフィックスプロセッサ）、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ：フィールドプログラマブル論理ゲートアレイ）など）１１０１と、ＲＡＭ（Ｒａｎｄｏｍ－ＡｃｃｅｓｓＭｅｍｏｒｙ：ランダムアクセスメモリ）１１０２及びＲＯＭ（Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ：読み取り専用メモリ）１１０３を含むシステムメモリ１１０４と、システムメモリ１１０４と中央処理装置１１０１とを接続するシステムバス１１０５とを含む。コンピュータ機器１１００は、サーバ内の様々なデバイス間の情報の伝送をサポートする基本入力／出力システム（ＩｎｐｕｔＯｕｔｐｕｔＳｙｓｔｅｍ：Ｉ／Ｏシステム）１１０６と、オペレーティングシステム１１１３、アプリケーションプログラム１１１４及び他のプログラムモジュール１１１５を記憶するための大容量記憶装置１１０７とをさらに含む。

好ましくは、基本入力／出力システム１１０６は、情報を表示するためのディスプレイ１１０８と、ユーザが情報を入力するためのマウス、キーボードなどの入力装置１１０９とを含む。なお、ディスプレイ１１０８及び入力装置１１０９は、いずれもシステムバス１１０５に接続された入力／出力コントローラ１１１０を介して中央処理装置１１０１に接続されている。基本入力／出力システム１１０６は、キーボード、マウス、又は電子タッチペンなどの複数の他のデバイスからの入力を受け付けて処理するための入力／出力コントローラ１１１０をさらに含んでもよい。同様に、入力／出力コントローラ１１１０は、ディスプレイ、プリンタ、又は他のタイプの出力デバイスに出力を提供する。

好ましくは、大容量記憶装置１１０７は、システムバス１１０５に接続された大容量記憶コントローラ（図示せず）を介して中央処理装置１１０１に接続される。大容量記憶装置１１０７及び関連するコンピュータ読み取り可能な媒体は、コンピュータ機器１１００に不揮発性記憶を提供する。即ち、大容量記憶装置１１０７は、ハードディスク又はＣＤ－ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｃＲｅａｄ－ＯｎｌｙＭｅｍｏｒｙ：読み取り専用ＣＤ）ドライブなどのコンピュータ読み取り可能な媒体（図示せず）を含むことができる。

一般性を失うことなく、コンピュータ読み取り可能な媒体は、コンピュータ記憶媒体及び通信媒体を含むことができる。コンピュータ記憶媒体は、コンピュータ読み取り可能なプログラム、データ構造、プログラムモジュール、又は他のデータなどの情報を記憶するための任意の方法又は技術で実装される揮発性及び不揮発性、リムーバブル及び非リムーバブル媒体を含む。コンピュータの記憶媒体には、ＲＡＭ、ＲＯＭ、ＥＰＲＯＭ（ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ－ＯｎｌｙＭｅｍｏｒｙ：書き換え可能なプログラマブル読み取り専用メモリ）、ＥＥＰＲＯＭ（ＥｌｅｃｔｒｉｃａｌｌｙＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ－ＯｎｌｙＭｅｍｏｒｙ：電気的に書き換え可能なプログラマブル読み取り専用メモリ）、フラッシュメモリ又は他の固体ストレージ、ＣＤ－ＲＯＭ、ＤＶＤ（ＤｉｇｉｔａｌＶｉｄｅｏＤｉｓｃ：高密度デジタルビデオディスク）又は他の光学ストレージ、カートリッジ、磁気テープ、磁気ディスクストレージ又は他の磁気ストレージデバイスが含まれる。なお、当業者には明らかなように、このコンピュータ記憶媒体は、上記に限定されない。上述したシステムメモリ１１０４及び大容量記憶装置１１０７をメモリとして総称してもよい。

本発明の実施例によれば、コンピュータ機器１１００は、インターネットなどのネットワークを介してネットワークに接続されたリモートコンピュータで動作することもできる。即ち、コンピュータ機器１１００は、システムバス１１０５に接続されたネットワークインターフェースユニット１１１１を介してネットワーク１１１２に接続されてもよいし、ネットワークインターフェースユニット１１１１を使用して、他のタイプのネットワーク又はリモートコンピュータシステム（図示せず）に接続されてもよい。

メモリは、メモリ内に格納され、上述した量子回路シミュレーション方法を実施するために１つ又は複数のプロセッサによって実行されるように構成されたコンピュータプログラムをさらに含む。

例示的な実施例では、上述した量子回路シミュレーション方法を実現するためのコンピュータ機器をさらに提供する。幾つかの実施例では、コンピュータ機器は、古典コンピュータである。

例示的な実施例では、コンピュータ機器のプロセッサによって実行された際に、上述した量子回路シミュレーション方法を実現するコンピュータプログラムを格納したコンピュータ読み取り可能な記憶媒体をさらに提供する。

幾つかの実施例では、コンピュータ読み取り可能な記憶媒体は、ＲＯＭ（Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ：読み取り専用メモリ）、ＲＡＭ（Ｒａｎｄｏｍ－ＡｃｃｅｓｓＭｅｍｏｒｙ：ランダムアクセスメモリ）、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅｓ：ソリッドステートドライブ）、又は光ディスクなどを含むことができる。ランダムアクセスメモリは、ＲｅＲＡＭ（ＲｅｓｉｓｔａｎｃｅＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ：抵抗型ランダムアクセスメモリ）及びＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ：ダイナミックランダムアクセスメモリ）を含むことができる。

例示的な実施例では、コンピュータ読み取り可能な記憶媒体に記憶されたコンピュータプログラムを含むコンピュータプログラム製品をさらに提供する。コンピュータ機器のプロセッサは、コンピュータ読み取り可能な記憶媒体からコンピュータプログラムを読み取り、プロセッサはコンピュータプログラムを実行し、コンピュータ機器に上記の量子回路シミュレーション方法を実行させる。

なお、本明細書で言及される「複数」は、２つ以上を意味する。「及び／又は」は、係り先の係り受け関係を記述したものであり、ＡとＢのように３つの関係がありうることを表し、即ち、Ａが単独で存在する場合、ＡとＢが同時に存在する場合、Ｂが単独で存在する場合の３つを表すことができる。文字「／」は、一般に、相互関係オブジェクトが「又は」の関係であることを表す。さらに、本明細書に記載されたステップ番号は、ステップ間の実行可能な順序を例示するに過ぎず、幾つかの他の実施例では、２つの異なる番号のステップが同時に実行されてもよいし、２つの異なる番号のステップが図示された順序とは逆の順序で実行されるように、ステップが番号の順序で実行されなくてもよく、本明細書の実施例はこれらに限定されない。

上記は、本発明の例示的な実施例に過ぎず、本発明を限定するものではなく、本発明の主旨及び原則の範囲内でなされた修正、均等物の置換、改良などは、本発明の範囲内に含まれるものとする。

Claims

コンピュータ機器が実行する量子回路シミュレーション方法であって、
量子回路シミュレーションのための元の関数を取得し、前記元の関数における並列化を必要とする第１の入力パラメータを決定するステップと、
前記元の関数及び前記第１の入力パラメータに基づいて、前記元の関数を目的関数に変換するステップであって、前記目的関数の入力パラメータは、前記第１の入力パラメータに対応する変換後の第１の入力パラメータを含み、前記変換後の第１の入力パラメータに対応するテンソルは、前記第１の入力パラメータに対応する複数の並列化されたテンソルを結合して得られた結果である、ステップと、
前記目的関数の入力パラメータに基づいて、前記目的関数に対応する実行結果を取得するステップと、
前記目的関数に対応する実行結果に基づいて、前記量子回路シミュレーションを実行するステップと、を含む、方法。
前記目的関数の入力パラメータに基づいて、前記目的関数に対応する実行結果を取得するステップは、
前記目的関数の入力パラメータに含まれる前記変換後の第１の入力パラメータをベクトル並列化方式で処理し、前記目的関数に対応する実行結果を取得するステップ、を含む、請求項１に記載の方法。
前記目的関数の入力パラメータに含まれる前記変換後の第１の入力パラメータをベクトル並列化方式で処理し、前記目的関数に対応する実行結果を取得するステップは、
ベクトル命令セットを用いて前記変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、前記目的関数に対応する実行結果を取得するステップであって、前記ベクトル命令セットは、プロセッサが前記変換後の第１の入力パラメータに対応するテンソルに対して前記ベクトル並列化処理を実行するための実行可能命令を含む、ステップを含む、請求項２に記載の方法。
前記元の関数は、前記量子回路シミュレーションにおける入力波動関数を処理するステップを実現するために使用され、
前記第１の入力パラメータは、目標量子回路の入力波動関数を含み、
前記ベクトル命令セットを用いて前記変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、前記目的関数に対応する実行結果を取得するステップは、
前記変換後の第１の入力パラメータに対応するテンソルを取得するステップであって、前記変換後の第１の入力パラメータに対応するテンソルは、前記目標量子回路の複数の並列化された入力波動関数を結合して得られた結果である、ステップと、
前記ベクトル命令セットを用いて前記変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、前記目的関数に対応する実行結果を取得するステップであって、前記目的関数に対応する実行結果は、前記複数の並列化された入力波動関数のそれぞれに対応する処理結果を含む、ステップと、を含む、請求項３に記載の方法。
前記元の関数は、前記量子回路シミュレーションにおける回路変分パラメータを最適化するステップを実現するために使用され、
前記第１の入力パラメータは、目標量子回路の回路変分パラメータを含み、
前記ベクトル命令セットを用いて前記変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、前記目的関数に対応する実行結果を取得するステップは、
前記変換後の第１の入力パラメータに対応するテンソルを取得するステップであって、前記変換後の第１の入力パラメータに対応するテンソルは、前記目標量子回路の複数組の並列化された回路変分パラメータを結合して得られた結果である、ステップと、
前記ベクトル命令セットを用いて前記変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、前記目的関数に対応する実行結果を取得するステップであって、前記目的関数に対応する実行結果は、前記複数組の並列化された回路変分パラメータのそれぞれに対応する最適化結果を含む、ステップと、を含む、請求項３に記載の方法。
前記元の関数は、前記量子回路シミュレーションにおける回路ノイズを生成するステップを実現するために使用され、
前記第１の入力パラメータは、目標量子回路の回路ノイズを生成するための乱数を含み、
前記ベクトル命令セットを用いて前記変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、前記目的関数に対応する実行結果を取得するステップは、
前記変換後の第１の入力パラメータに対応するテンソルを取得するステップであって、前記変換後の第１の入力パラメータに対応するテンソルは、前記目標量子回路の回路ノイズを生成するための複数組の並列化された乱数を結合して得られた結果である、ステップと、
前記ベクトル命令セットを用いて前記変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、前記目的関数に対応する実行結果を取得するステップであって、前記目的関数に対応する実行結果は、前記複数の並列化された乱数のそれぞれに対応するノイズシミュレーション結果を含む、ステップと、を含む、請求項３に記載の方法。
前記元の関数は、前記量子回路シミュレーションにおける回路構造を生成するステップを実現するために使用され、
前記第１の入力パラメータは、目標量子回路の回路構造を生成するための制御パラメータを含み、異なる制御パラメータは、異なる回路構造を生成するために使用され、
前記ベクトル命令セットを用いて前記変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、前記目的関数に対応する実行結果を取得するステップは、
前記変換後の第１の入力パラメータに対応するテンソルを取得するステップであって、前記変換後の第１の入力パラメータに対応するテンソルは、前記目標量子回路の回路構造を生成するための複数組の並列化された制御パラメータを結合して得られた結果である、ステップと、
前記ベクトル命令セットを用いて前記変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、前記目的関数に対応する実行結果を取得するステップであって、前記目的関数に対応する実行結果は、前記複数組の並列化された制御パラメータのそれぞれに対応する回路構造の生成結果を含む、ステップと、を含む、請求項３に記載の方法。
前記元の関数は、前記量子回路シミュレーションにおける回路測定を実行するステップを実現するために使用され、
前記第１の入力パラメータは、目標量子回路についての回路測定を実行するための測定パラメータを含み、異なる測定パラメータは、異なる測定結果を生成するために使用され、
前記ベクトル命令セットを用いて前記変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、前記目的関数に対応する実行結果を取得するステップは、
前記変換後の第１の入力パラメータに対応するテンソルを取得するステップであって、前記変換後の第１の入力パラメータに対応するテンソルは、前記目標量子回路についての回路測定を実行するための複数組の並列化された測定パラメータを結合して得られた結果である、ステップと、
前記ベクトル命令セットを用いて前記変換後の第１の入力パラメータに対応するテンソルに対してベクトル並列化処理を実行し、前記目的関数に対応する実行結果を取得するステップであって、前記目的関数に対応する実行結果は、前記複数組の並列化された測定パラメータのそれぞれに対応する測定結果を含む、ステップと、を含む、請求項３に記載の方法。
前記目的関数を取得する際に、
前記元の関数の入力パラメータに並列化を必要としない目標入力パラメータが含まれる場合、前記元の関数における前記第１の入力パラメータを前記変換後の第１の入力パラメータに修正し、前記目標入力パラメータを維持し、前記目的関数を取得し、或いは、
前記元の関数の入力パラメータに並列化を必要としない目標入力パラメータが含まれない場合、前記元の関数における前記第１の入力パラメータを前記変換後の第１の入力パラメータに修正し、前記目的関数を取得する、請求項１に記載の方法。
前記元の関数及び前記第１の入力パラメータに基づいて、前記元の関数を目的関数に変換するステップは、
関数変換インターフェースを呼び出し、前記関数変換インターフェースに前記元の関数及び第１の情報を伝送するステップであって、前記第１の情報は、前記元の関数における並列化を必要とする第１の入力パラメータを示すために使用される、ステップと、
前記関数変換インターフェースにより前記第１の情報に基づいて前記元の関数を前記目的関数に変換するステップと、を含む、請求項１に記載の方法。
前記関数変換インターフェースに第２の情報を伝送するステップであって、前記第２の情報は、前記元の関数における微分演算を必要とする第２の入力パラメータを示すために使用される、ステップをさらに含み、
前記関数変換インターフェースにより前記第１の情報に基づいて前記元の関数を前記目的関数に変換するステップは、
前記関数変換インターフェースにより前記第１の情報及び前記第２の情報に基づいて前記元の関数を前記目的関数に変換するステップ、を含み、
前記目的関数は、前記第２の入力パラメータに対する前記元の関数の微分係数情報をさらに出力する、請求項１０に記載の方法。
前記関数変換インターフェースは、第１のインターフェース及び第２のインターフェースを含み、
前記第１のインターフェースは、前記第１の情報に基づいて前記元の関数を前記目的関数に変換し、
前記第２のインターフェースは、前記第１の情報及び前記第２の情報に基づいて前記元の関数を前記目的関数に変換する、請求項１１に記載の方法。
前記関数変換インターフェースは、機械学習ライブラリにカプセル化されたアプリケーションプログラミングインターフェース（ＡＰＩ）であり、
前記機械学習ライブラリは、前記目的関数を実行するためのベクトル命令セットを提供する、請求項１０に記載の方法。
前記第１の入力パラメータに対応する複数の並列化されたテンソルを目標次元において結合して、前記変換後の第１の入力パラメータに対応するテンソルを取得し、
前記変換後の第１の入力パラメータに対応するテンソルの前記目標次元におけるサイズは、前記第１の入力パラメータに対応する並列化されたテンソルの数に対応する、請求項１に記載の方法。
量子回路シミュレーション装置であって、
量子回路シミュレーションのための元の関数を取得し、前記元の関数における並列化を必要とする第１の入力パラメータを決定する関数取得モジュールと、
前記元の関数及び前記第１の入力パラメータに基づいて、前記元の関数を目的関数に変換する関数変換モジュールであって、前記目的関数の入力パラメータは、前記第１の入力パラメータに対応する変換後の第１の入力パラメータを含み、前記変換後の第１の入力パラメータに対応するテンソルは、前記第１の入力パラメータに対応する複数の並列化されたテンソルを結合して得られた結果である、関数変換モジュールと、
前記目的関数の入力パラメータに基づいて、前記目的関数に対応する実行結果を取得する関数実行モジュールと、
前記目的関数に対応する実行結果に基づいて、前記量子回路シミュレーションを実行する回路シミュレーションモジュールと、を含む、装置。
プロセッサと、コンピュータプログラムが記憶されたメモリと、を含むコンピュータ機器であって、前記コンピュータプログラムは、請求項１乃至１４の何れかに記載の方法を実現するように前記プロセッサによりロードされて実行される、コンピュータ機器。
請求項１乃至１４の何れかに記載の方法をコンピュータに実行させるためのプログラム。