JP7161066B2 - 断熱発展経路の予測方法、装置、機器及びコンピュータプログラム - Google Patents
断熱発展経路の予測方法、装置、機器及びコンピュータプログラム Download PDFInfo
- Publication number
- JP7161066B2 JP7161066B2 JP2021550058A JP2021550058A JP7161066B2 JP 7161066 B2 JP7161066 B2 JP 7161066B2 JP 2021550058 A JP2021550058 A JP 2021550058A JP 2021550058 A JP2021550058 A JP 2021550058A JP 7161066 B2 JP7161066 B2 JP 7161066B2
- Authority
- JP
- Japan
- Prior art keywords
- path
- layer
- board
- node
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 87
- 238000009413 insulation Methods 0.000 title claims description 17
- 238000004590 computer program Methods 0.000 title claims description 12
- 238000011161 development Methods 0.000 title claims description 11
- 230000005283 ground state Effects 0.000 claims description 85
- 238000013528 artificial neural network Methods 0.000 claims description 72
- 230000008569 process Effects 0.000 claims description 38
- 230000009471 action Effects 0.000 claims description 34
- 238000009826 distribution Methods 0.000 claims description 29
- 230000006870 function Effects 0.000 claims description 19
- 230000001131 transforming effect Effects 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims 3
- 238000004422 calculation algorithm Methods 0.000 description 18
- 238000003860 storage Methods 0.000 description 18
- 230000002787 reinforcement Effects 0.000 description 16
- 238000013473 artificial intelligence Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000004088 simulation Methods 0.000 description 14
- 238000013461 design Methods 0.000 description 13
- 238000002360 preparation method Methods 0.000 description 10
- 239000002096 quantum dot Substances 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 238000000342 Monte Carlo simulation Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000001788 irregular Effects 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 6
- 238000000137 annealing Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 206010048669 Terminal state Diseases 0.000 description 2
- 238000005336 cracking Methods 0.000 description 2
- 230000005281 excited state Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
- G06N10/60—Quantum algorithms, e.g. based on quantum optimisation, quantum Fourier or Hadamard transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
- G06N10/20—Models of quantum computing, e.g. quantum circuits or universal quantum computers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B82—NANOTECHNOLOGY
- B82Y—SPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
- B82Y10/00—Nanotechnology for information processing, storage or transmission, e.g. quantum computing or single electron logic
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Pure & Applied Mathematics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Physiology (AREA)
- Chemical & Material Sciences (AREA)
- Nanotechnology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Algebra (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
量子計算問題のターゲットハミルトニアンH1を取得し;
前記ターゲットハミルトニアンH1に基づいて、初期ハミルトニアンH0及びターゲット基底状態エネルギーE1を決定し;
前記初期ハミルトニアンH0から前記ターゲット基底状態エネルギーE1までの断熱発展経路に対してのサーチ(探索)をボードゲームに変換し;
ニューラルネットワークと組み合わせたモンテカルロ木探索を用いて、前記ボードゲームの最適ボード経路を求め;及び
前記最適ボード経路に基づいて前記断熱発展経路を得るステップを含む。
量子計算問題のターゲットハミルトニアンH1を取得するための取得モジュール;
前記ターゲットハミルトニアンH1に基づいて、初期ハミルトニアンH0及びターゲット基底状態エネルギーE1を決定するための決定モジュール;
前記初期ハミルトニアンH0から前記ターゲット基底状態エネルギーE1までの断熱発展経路に対してのサーチをボードゲームに変換するための変換モジュール;
ニューラルネットワークと組み合わせたモンテカルロ木探索を用いて、前記ボードゲームの最適ボード経路を求めるための木探索モジュール;
前記最適ボード経路に基づいて前記断熱発展経路を出力するための出力モジュールを含む。
1、ゲーム木;
2、モンテカルロシミュレーション;
3、基本的なモンテカルロ木探索;及び
4、ニューラルネットワークと組み合わせたモンテカルロ木探索
という流れに従って説明を行う。
ゲーム木はツリー形式のデータ構造であり、そのうち、各ノードはゲームの決定状態を表す。1つのノードからそのサブノードへの変換は1つのアクション(action)と称される。ノードのサブノード数は分岐係数(branching
factor)と称される。ゲーム木のルートノードはゲームの初期状態を表す。ゲーム木のリーフノード(leaf
node)は、サブノードを有しないノードであり、ゲームを続行できないことを表す。リーフノードの状態を評価することができ、また、こののラウンドのゲームの結果(勝ち又は負け)をまとめることができる。
モンテカルロシミュレーションは確率・統計理論に基づくシミュレーション方法である。モンテカルロシミュレーションの名前は、モナコのカジノに由来している。1つの簡単なグラフィックス問題を以ってモンテカルロシミュレーションの思想(idea)を説明する。即ち、地面上の1つの不規則な図形の面積を求めようとする場合、地面上の該不規則な図形を含む矩形の中に1つの小さなボールをランダムにドロップし、ボールをドロップする度に、ボールドロップカウント(計数)Nを1増やし、小さなボールが不規則な図形に入ったときに、成功カウント(計数)Wを1増やす。ボールを複数回ドロップした後に、不規則な図形の面積がW/Nに等しいと見なす。
モンテカルロ木探索に戻り、モンテカルロ木探索の主な概念はサーチであり、即ち、ゲーム木を下るの1組(一連)のトラバーサルプロセスである。1回トラバーサルする経路は、ルートノード(初期ゲーム状態又は現在のゲーム状態)から、今回のゲームが終わるまで、完全に展開されていないノードに延伸し得る。モンテカルロツリーにおける各ノードは1つのボードレイアウトを表し、ノードの属性“W/N”は、このノードがN回アクセスされ、W回勝ったことを表す。例えば、最初のルートノードが12/21である場合、合計21回のシミュレーションをし、且つ12回勝ったことを意味する。そのうち、Wは総シミュレーション報酬、Nは総アクセス回数と見なすことができる。
ルートノードから下へ、1つの“未展開のサブノードが存在する”ノードbiが到来するまで、各回1つの“最も価値のあるサブノード”を選択する。“未展開のサブノードが存在する”とは、このボードレイアウトには駒を置いたことのない駒置き方が存在することを指す。なな、如何に1つの“最も価値のあるサブノード”を選択するかについては後述する。
ノードbiについて、属性が“0/0”の1つのサブノード(bi+1層に位置する)を増やし、それは、1つ前のテップにおける“未展開のサブノード”に対応し、即ち、試したことのない1つの駒置き方である。
1つ前のステップで新しく増やされたサブノードから、ランダム駒置きポリシーを用いて最後のステップ(一手)に移動し、1つの勝負結果を取得する。一般的な意見によると、ランダム駒置きポリシーは、パワーがかなり弱いが、動きが速いポリシーである。
シミュレーション結果(勝利又は失敗)を、新たに増加したサブノードのすべての親ノードに加える。即ち、すべての親ノードについてN+1になり、シミュレーション結果が勝利である場合、すべての親ノードについてW+1になる。
図6及び図7から分かるように、ゲーム木の深さ(層数)及び広さ(各層のノード数)が比較的小さい場合、各分岐を列挙する形で、ゲーム木は比較的正しい最適ボード経路を求めることができる。しかし、ゲーム木の深さ及び広さが比較的大きい場合、上述の計算過程におけるサーチ空間が非常に大きいため、計算は難しくなる。
trade-off)の思想に基づいて、以下の公式3のように、第i+1層のターゲットノードの選択を行う。
1、カナダのD-waveシステムは断熱量子計算に根ざしている。本出願によるアルゴリズムは、このような計算システムの発展効率を向上させ、ターゲット基底状態の準備時間を短縮することができる。非常に不安定な量子システムについて言えば、より短い準備時間は、本出願により、発展過程全体をより良く保護し、量子の利点を維持し、断熱量子コンピュータの開発を加速化できることを意味する。
Zero)の囲碁アルゴリズムを修正して最適な“シングルプレイヤーゲーム”ポリシーをサーチする。毎回、AIアルゴリズムは、1つの発展経路を設計し、断熱量子コンピュータ/量子アニーリング機(強化学習フレームワークにおける環境とされる)を用いて1遍実行することで、この発展経路の有効性、例えば、1つのターゲットハミルトニアンの基底状態(エネルギーが最も低い量子状態)をスムーズに準備することができるかどうかを検証する。本出願では、量子ハードウェアにより提供されるエネルギー測定を使用して、今回のAIアルゴリズムにより設計される経路の良し悪しを評価することができる。自己定義の基準により、本出願では、このラウンドの設計AIが勝ったかどうかを判断することができる。量子コンピュータとの絶え間ない相互作用を通じて(AIは断熱量子計算の発展を指導し、また、その中からリアルタイムのエネルギー測定フィードバックを取得する)、強化学習に基づくAIアルゴリズムは、そのゲームポリシーを、パフォーマンスが満足のいくレベルに達するまで常に調整することができる。
ステップ1201:ターゲットハミルトニアンH1に基づいて、初期ハミルトニアンH0及びターゲット基底状態エネルギーE1を設定し;
ステップ1202:固定した断熱発展時間長Tの下で、予測した断熱発展経路s(t)に基づいて、量子シュレディンガー方程式を解き、又は、量子断熱コンピュータで発展を実行し、終態システムを測定することで、発展の終態の量子状態及び対応するエネルギー固有値Eを取得する。
ステップ1203:フーリエ変換により断熱発展経路s(t)を周波数領域のパラメータシーケンスbに変換することで、最適断熱発展経路のサーチの問題を最適パラメータシーケンスbのサーチに変換し;
ステップ1204:最適パラメータシーケンスbのサーチを離散化し、ボード空間にマッピングし、そして、量子セロ(Quantum Zero)に基づくシングルプレイヤーゲームにより最適なボードレイアウトを見つける。
ステップ1205:ポリシーネットワーク及びバリューネットワークが或るボード状態でポリシーベクトルp及び評価バリューvを生成し、そして、モンテカルロ木探索のフィードバック(b,π,z)に基づいてネットワークパラメータを更新する。
量子計算の古典的な問題であるGroverサーチについて考えてみる。n個のビットがあるとする場合、このn個のビットにより2n個の物体(object)を符号化することができ、古典的なアルゴリズムは、最悪のとき、2n回試す必要がある。しかし、量子コンピュータは、二次加速を実現することができ、つまり、本出願では、2n/2回の計算のみが要される。断熱のGroverサーチとは、以下のように与えられた2つのハミルトニアンH0及びH1について最適な断熱経路を設計することである。
コンピュータサイエンスでよく議論される3-SAT問題を考慮すると、さまざまな適用シナリオもある。この順列最適化組み合わせ問題を、1つの断熱量子計算が処理し得る問題に変換するために、本出願では、以下のように、1つのターゲットハミルトニアンH1及び1つの初期ハミルトニアンH0を与える必要がある。
決定モジュール1820:前記ターゲットハミルトニアンH1に基づいて、初期ハミルトニアンH0及びターゲット基底状態エネルギーE1を決定するために用いられ;
変換モジュール1830:前記初期ハミルトニアンH0から前記ターゲット基底状態エネルギーE1までの断熱発展経路をサーチすることをボードゲームに変換するために用いられ;
木探索モジュール1840:ニューラルネットワークと組み合わせたモンテカルロ木探索を用いて、前記ボードゲームの最適ボード経路を求めるために用いられ;
出力モジュール1850:前記最適ボード経路に基づいて前記断熱発展経路を出力するために用いられる。
前記木探索モジュール1840はさらに、前記エネルギー固有値Eが前記勝利条件を満たさないことに応じて、前記予測ボード経路を前記ニューラルネットワークの入力とし、前記ポリシーネットワークが出力するポリシーベクトルp及び前記バリューネットワークが出力するバリュー収益vを取得し;前記ポリシーベクトルpと前記アクション確率分布πとの間の類似性を最大化し、かつ前記バリュー収益vと未勝利時の報酬値zとの間の誤差を最小化することを目標とし、前記ニューラルネットワークにおけるパラメータを更新するために用いられる。
Signal Processing、デジタル信号処理)、FPGA(Field Programmable Gate Array、フィールドプログラマブルゲートアレイ)、PLA(Programmable Logic Array、プログラマブルロジックアレイ)のうちの少なくとも1つのハードウェアの形で実現され得る。プロセッサ1901はまた、メインプロセッサ及びコプロセッサを含み得る。メインプロセッサは、アウェイク状態でデータを処理するために使用されるプロセッサであり、CPU(中央処理装置)とも呼ばれる。コプロセッサは、低電力プロセッサであり、スタンバイ状態でデータを処理するために使用される。いくつかの実施例では、プロセッサ1901は、GPU(グラフィックスプロセッシングユニット、画像プロセッサ)と統合され得る。GPUは、表示画面に表示される必要のあるコンテンツをレンダリング及び描画するために使用される。いくつかの実施例では、プロセッサ1901は、AI(人工知能)プロセッサをさらに含み得る。AIプロセッサは、機械学習に関連する計算操作を処理するために使用される。
Claims (15)
- コンピュータ装置が実行する断熱発展経路の予測方法であって、
量子計算問題のターゲットハミルトニアンH1を取得するステップ;
前記ターゲットハミルトニアンH1に基づいて、初期ハミルトニアンH0及びターゲット基底状態エネルギーE1を決定するステップ;
前記初期ハミルトニアンH0から前記ターゲット基底状態エネルギーE1までの断熱発展経路をサーチすることをボードゲームに変換するステップ;
ニューラルネットワークと組み合わせたモンテカルロ木探索を用いて、前記ボードゲームの最適ボード経路を求めるステップ;及び
前記最適ボード経路に基づいて前記断熱発展経路を出力するステップを含む、方法。 - 請求項1に記載の方法であって、
前記の、ニューラルネットワークと組み合わせたモンテカルロ木探索を用いて、前記ボードゲームの最適ボード経路を求めるステップは、
前記ニューラルネットワークと組み合わせた前記モンテカルロ木探索を用いて、前記ボードゲームの予測ボード経路をサーチするステップ;
前記予測ボード経路に基づいて予測断熱発展経路を得るステップ;
量子計算環境に基づいて、前記予測断熱発展経路が終態に発展するときのエネルギー固有値Eを計算することによって取得するステップ;
前記エネルギー固有値Eが勝利条件を満足しないことに応じて、今回の予測過程に基づいて前記ニューラルネットワークにおけるパラメータを更新し、そして、更新した後に、再び、前記の、前記ニューラルネットワークと組み合わせた前記モンテカルロ木探索を用いて、前記ボードゲームの予測ボード経路をサーチするステップを実行するステップ;及び
前記エネルギー固有値Eが前記勝利条件を満足していることに応じて、前記予測ボード経路を前記ボードゲームの最適ボード経路と決定するステップを含み、
前記勝利条件は、前記エネルギー固有値Eと前記ターゲット基底状態エネルギーE1との間の差が閾値よりも小さいことを含む、方法。 - 請求項2に記載の方法であって、
前記ニューラルネットワークはポリシーネットワーク及びバリューネットワークを含み、
前記の、前記ニューラルネットワークと組み合わせた前記モンテカルロ木探索を用いて、前記ボードゲームの予測ボード経路をサーチするステップは、
前記ボードゲームに対応するゲーム木において、前記モンテカルロ木探索を用いてサーチを行い、各層のノードのアクション確率分布πを出力するステップであって、前記各層のノードのアクション確率分布πは次の一手の駒の候補駒置き位置及び確率分布を表す、ステップ;及び
各層のノードの下で前記アクション確率分布πが最も高いターゲット駒置き位置に基づいて、前記ボードゲームの予測ボード経路を得るステップを含み、
前記の、前記エネルギー固有値Eが勝利条件を満足しないことに応じて、今回の予測過程に基づいて前記ニューラルネットワークにおけるパラメータを更新することは、
前記エネルギー固有値Eが前記勝利条件を満足したいことに応じて、前記予測ボード経路を前記ニューラルネットワークの入力とし、前記ポリシーネットワークにより出力されるポリシーベクトルp及び前記バリューネットワークにより出力されるバリュー収益vを取得するステップ;及び
前記ポリシーベクトルpと前記アクション確率分布πとの間の類似性を最大化し、かつ前記バリュー収益vと未勝利時の報酬値zとの間の誤差を最小化することを目標とし、前記ニューラルネットワークにおけるパラメータを更新するステップを含む、方法。 - 請求項3に記載の方法であって、
前記の、前記ボードゲームに対応するゲーム木において、前記モンテカルロ木探索を用いてサーチを行い、各層のノードのアクション確率分布πを出力するステップは、
前記ボードゲームの第i層のターゲットノードbiの下で、前記ポリシーネットワークにより第i+1層のノードbi+1の候補駒置き位置ai+1及び駒置き確率pi+1を出力するステップであって、前記第i層のターゲットノードbiは第i層のノードのターゲット駒置き位置に対応し、iはm-1以下の整数である、ステップ;
前記候補駒置き位置ai+1に基づいて前記第i+1層のノードbi+1を展開し、前記バリューネットワークにより前記第i+1層のノードbi+1に対して評価を行い、各前記候補駒置き位置ai+1のバリュー収益vi+1を得るステップ;
前記駒置き確率pi+1、前記バリュー収益vi+1、及び信頼度上限Uに基づいて、前記第i+1層のノードbi+1のうちのターゲットノードを決定するステップ;
前記第i+1層のノードが第m層のノードでないときに、前記第i+1層のターゲットノードを新しい第i層のターゲットノードとし、上述の3つのステップを実行するステップ;及び
前記第i+1層のノードが第m層のノードであるときに、前記各層のノードのアクション確率分布πを出力するステップを含む、方法。 - 請求項4に記載の方法であって、
前記信頼度上限Uは、前記候補駒置き位置の過去サーチ回数に関連している、方法。 - 請求項1乃至5の何れか1項に記載の方法であって、
前記の、前記初期ハミルトニアンH0から前記ターゲット基底状態エネルギーE1までの断熱発展経路をサーチすることをボードゲームに変換するステップは、
前記初期ハミルトニアンH0から前記ターゲット基底状態エネルギーE1までの断熱発展経路を断熱発展関数s(t)と表すステップ;
フーリエ変換により、前記断熱発展関数s(t)を周波数領域の状態ベクトルシーケンスbに変換するステップであって、前記状態ベクトルシーケンスbはm個のベクトル次元を含み、各ベクトル次元の数値範囲は2Lである、ステップ;及び
前記ベクトル次元の次元数m及び前記各ベクトル次元の数値範囲2Lに基づいて変換することによって前記ボードゲームを得るステップであって、前記ボードゲームに対応するボードは2L/△行及びm列を含み、各列は1つの駒の駒置き位置に対応し、△は離散化するためのステップ長である、ステップを含む、方法。 - 断熱発展経路の予測装置であって、
量子計算問題のターゲットハミルトニアンH1を取得するための取得モジュール;
前記ターゲットハミルトニアンH1に基づいて、初期ハミルトニアンH0及びターゲット基底状態エネルギーE1を決定するための決定モジュール;
前記初期ハミルトニアンH0から前記ターゲット基底状態エネルギーE1までの断熱発展経路をサーチすることをボードゲームに変換するための変換モジュール;
ニューラルネットワークと組み合わせたモンテカルロ木探索を用いて、前記ボードゲームの最適ボード経路を求めるための木探索モジュール;及び
前記最適ボード経路に基づいて前記断熱発展経路を出力するための出力モジュールを含む、装置。 - 請求項7に記載の装置であって、
前記木探索モジュールは、
前記ニューラルネットワークと組み合わせた前記モンテカルロ木探索を用いて、前記ボードゲームの予測ボード経路をサーチするステップ;
前記予測ボード経路に基づいて予測断熱発展経路を取得するステップ;
量子計算環境に基づいて、前記予測断熱発展経路が終態に発展するときのエネルギー固有値Eを計算することによって取得するステップ;
前記エネルギー固有値Eが勝利条件を満足しないことに応じて、今回の予測過程に基づいて前記ニューラルネットワークにおけるパラメータを更新し、そして、更新した後に、再び、前記の、前記ニューラルネットワークと組み合わせた前記モンテカルロ木探索を用いて、前記ボードゲームの予測ボード経路をサーチするステップを実行するステップ;及び
前記エネルギー固有値Eが前記勝利条件を満足していることに応じて、前記予測ボード経路を前記ボードゲームの最適ボード経路と決定するステップを実行するために用いられ、
前記勝利条件は、前記エネルギー固有値Eと前記ターゲット基底状態エネルギーE1との間の差が閾値よりも小さいことを含む、装置。 - 請求項8に記載の装置であって、
前記ニューラルネットワークはポリシーネットワーク及びバリューネットワークを含み、
前記木探索モジュールは、
前記ボードゲームに対応するゲーム木において、前記モンテカルロ木探索を用いてサーチを行い、各層のノードのアクション確率分布πを出力するステップであって、前記各層のノードのアクション確率分布πは次の一手の駒の候補駒置き位置及び確率分布を表す、ステップ;及び
各層のノードの下で前記アクション確率分布πが最も高いターゲット駒置き位置に基づいて、前記ボードゲームの予測ボード経路を取得するために用いられ、
前記木探索モジュールは、さらに、
前記エネルギー固有値Eが前記勝利条件を満足しないことに応じて、前記予測ボード経路を前記ニューラルネットワークの入力とし、前記ポリシーネットワークにより出力されるポリシーベクトルp及び前記バリューネットワークにより出力されるバリュー収益vを取得するステップ;及び、
前記ポリシーベクトルpと前記アクション確率分布πとの間の類似性を最大化し、かつ前記バリュー収益vと未勝利時の報酬値zとの間の誤差を最小化することを目標とし、前記ニューラルネットワークにおけるパラメータを更新するステップを実行するために用いられる、装置。 - 請求項9に記載の装置であって、
前記木探索モジュールは、
前記ボードゲームの第i層のターゲットノードbiの下で、前記ポリシーネットワークにより第i+1層のノードbi+1の候補駒置き位置ai+1及び駒置き確率pi+1を出力するステップであって、前記第i層のターゲットノードbiは第i層のノードのターゲット駒置き位置に対応し、iはm-1以下の整数である、ステップ;
前記候補駒置き位置ai+1に基づいて前記第i+1層のノードbi+1を展開し、前記バリューネットワークにより前記第i+1層のノードbi+1に対して評価を行い、各前記候補駒置き位置ai+1のバリュー収益vi+1を得るステップ;
前記駒置き確率pi+1、前記バリュー収益vi+1、及び信頼度上限Uに基づいて、前記第i+1層のノードbi+1のうちのターゲットノードを決定するステップ;
前記第i+1層のノードが第m層のノードでないときに、前記第i+1層のターゲットノードを新しい第i層のターゲットノードとし、上述の3つのステップを実行するステップ;及び
前記第i+1層のノードが第m層のノードであるときに、前記各層のノードのアクション確率分布πを出力するステップを実行するために用いられる、装置。 - 請求項10に記載の装置であって、
前記信頼度上限Uは、前記候補駒置き位置の過去サーチ回数に関連している、装置。 - 請求項7乃至11のうちの何れか1項に記載の装置であって、
前記変換モジュールは、
前記初期ハミルトニアンH0から前記ターゲット基底状態エネルギーE1までの断熱発展経路を断熱発展関数s(t)と表すステップ;
フーリエ変換により、前記断熱発展関数s(t)を周波数領域の状態ベクトルシーケンスbに変換するステップであって、前記状態ベクトルシーケンスbはm個のベクトル次元を含み、各ベクトル次元の数値範囲は2Lである、ステップ;及び
前記ベクトル次元の次元数m及び前記各ベクトル次元の数値範囲2Lに基づいて変換することによって前記ボードゲームを得るステップであって、前記ボードゲームに対応するボードは2L/△行及びm列を含み、各列は1つの駒の駒置き位置に対応し、△は離散化するためのステップ長である、ステップを実行するために用いられる、装置。 - コンピュータ装置であって、
処理器;及び
前記処理器に接続される記憶器を含み、
前記記憶器には、コンピュータプログラムが記憶されており、
前記コンピュータプログラムは、前記処理器によって実行されることで、請求項1乃至6のうちの何れか1項に記載の断熱発展経路の予測方法を実現する、コンピュータ装置。 - 請求項1乃至6のうちの何れか1項に記載の断熱発展経路の予測方法により予測される断熱発展経路を用いて断熱発展を行う、量子コンピュータ。
- コンピュータに、請求項1乃至6のうちの何れか1項に記載の断熱発展経路の予測方法を実行させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010027656.8A CN112651508B (zh) | 2020-01-10 | 2020-01-10 | 绝热演化路径的预测方法、装置、设备及存储介质 |
CN202010027656.8 | 2020-01-10 | ||
PCT/CN2020/124440 WO2021139333A1 (zh) | 2020-01-10 | 2020-10-28 | 绝热演化路径的预测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022522180A JP2022522180A (ja) | 2022-04-14 |
JP7161066B2 true JP7161066B2 (ja) | 2022-10-25 |
Family
ID=75345956
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021550058A Active JP7161066B2 (ja) | 2020-01-10 | 2020-10-28 | 断熱発展経路の予測方法、装置、機器及びコンピュータプログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220004880A1 (ja) |
EP (1) | EP3920108A4 (ja) |
JP (1) | JP7161066B2 (ja) |
KR (1) | KR20210121215A (ja) |
CN (1) | CN112651508B (ja) |
WO (1) | WO2021139333A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115423107A (zh) * | 2021-05-13 | 2022-12-02 | 华为技术有限公司 | 通过量子线路确定目标对象的状态的方法和设备 |
CN113408733B (zh) * | 2021-06-29 | 2022-03-11 | 腾讯科技(深圳)有限公司 | 量子系统的基态获取方法、装置、设备及存储介质 |
CN116541947B (zh) * | 2022-01-25 | 2024-07-16 | 本源量子计算科技(合肥)股份有限公司 | 车辆配置的SAT或MAX-SAT问题的Grover求解方法及装置 |
CN114897173B (zh) * | 2022-05-18 | 2023-05-30 | 北京大学 | 基于变分量子线路确定PageRank的方法及装置 |
CN115222304A (zh) * | 2022-09-20 | 2022-10-21 | 中国电子科技集团公司第十五研究所 | 兵棋博弈策略的生成方法、装置及存储介质 |
CN115421386A (zh) * | 2022-09-22 | 2022-12-02 | 量子科技长三角产业创新中心 | 一种量子与电子混合算力网络的控制方法及随动控制装置 |
CN116011580A (zh) * | 2022-12-07 | 2023-04-25 | 阿里巴巴达摩院(杭州)科技有限公司 | 等效电感的确定方法及计算机设备 |
CN116108925B (zh) * | 2022-12-08 | 2024-08-06 | 华南师范大学 | 一种单量子比特快速量子绝热捷径操控方法 |
CN116644814B (zh) * | 2023-05-25 | 2024-07-16 | 本源量子计算科技(合肥)股份有限公司 | 一种辅助决策方法、装置、介质及电子装置 |
CN117151577B (zh) * | 2023-10-31 | 2024-02-06 | 南京职豆豆智能科技有限公司 | 考虑群体异质性的组合路径优化方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019124990A (ja) | 2018-01-12 | 2019-07-25 | 株式会社日立製作所 | 解探索処理装置および解探索処理方法 |
WO2019241879A1 (en) | 2018-06-18 | 2019-12-26 | 1Qb Information Technologies Inc. | Variationally and adiabatically navigated quantum eigensolvers |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7135701B2 (en) * | 2004-03-29 | 2006-11-14 | D-Wave Systems Inc. | Adiabatic quantum computation with superconducting qubits |
CA2840958C (en) * | 2011-07-06 | 2018-03-27 | D-Wave Systems Inc. | Quantum processor based systems and methods that minimize an objective function |
CN102883548B (zh) * | 2012-10-16 | 2015-03-18 | 南京航空航天大学 | 基于量子神经网络的贴片机元器件贴装调度优化方法 |
EP3092607B1 (en) * | 2014-01-06 | 2022-03-30 | Google LLC | Constructing and programming quantum hardware for robust quantum annealing processes |
CN103824291B (zh) * | 2014-02-24 | 2017-01-11 | 哈尔滨工程大学 | 连续量子雁群算法演化脉冲耦合神经网络系统参数的自动图像分割方法 |
WO2016182608A2 (en) * | 2015-02-10 | 2016-11-17 | D-Wave Systems Inc. | Systems, devices, articles, and methods for quantum processor architecture |
US20230370490A1 (en) * | 2015-10-28 | 2023-11-16 | Qomplx, Inc. | System and method for cyber exploitation path analysis and task plan optimization |
WO2017143195A1 (en) * | 2016-02-18 | 2017-08-24 | Microsoft Technology Licensing, Llc | Randomized gap and amplitude estimation |
CN107798413B (zh) * | 2017-06-07 | 2021-04-23 | 温州大学 | 皮革多轮廓加工快进路径优化方法 |
CN108694440A (zh) * | 2018-05-14 | 2018-10-23 | 南京邮电大学 | 一种实时搜索在线泛化方法 |
-
2020
- 2020-01-10 CN CN202010027656.8A patent/CN112651508B/zh active Active
- 2020-10-28 JP JP2021550058A patent/JP7161066B2/ja active Active
- 2020-10-28 EP EP20912840.4A patent/EP3920108A4/en active Pending
- 2020-10-28 WO PCT/CN2020/124440 patent/WO2021139333A1/zh unknown
- 2020-10-28 KR KR1020217028001A patent/KR20210121215A/ko not_active Application Discontinuation
-
2021
- 2021-09-15 US US17/476,336 patent/US20220004880A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019124990A (ja) | 2018-01-12 | 2019-07-25 | 株式会社日立製作所 | 解探索処理装置および解探索処理方法 |
WO2019241879A1 (en) | 2018-06-18 | 2019-12-26 | 1Qb Information Technologies Inc. | Variationally and adiabatically navigated quantum eigensolvers |
Non-Patent Citations (2)
Title |
---|
Jian Lin et al.,Reinforcement learning architecture for automated quantum-adiabatic-algorithm design ,arXiv,2018年12月27日,<https://arxiv.org/abs/1812.10797v1> |
Mogens Dalgaard et al.,Global optimization of quantum dynamics with AlphaZero deep exploration,arXiv,2019年11月19日,<https://arxiv.org/abs/1907.05672v2> |
Also Published As
Publication number | Publication date |
---|---|
KR20210121215A (ko) | 2021-10-07 |
EP3920108A4 (en) | 2022-05-25 |
US20220004880A1 (en) | 2022-01-06 |
WO2021139333A1 (zh) | 2021-07-15 |
CN112651508A (zh) | 2021-04-13 |
EP3920108A1 (en) | 2021-12-08 |
CN112651508B (zh) | 2022-04-15 |
JP2022522180A (ja) | 2022-04-14 |
WO2021139333A9 (zh) | 2021-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7161066B2 (ja) | 断熱発展経路の予測方法、装置、機器及びコンピュータプログラム | |
Chen et al. | An improved bat algorithm hybridized with extremal optimization and Boltzmann selection | |
Kelly et al. | Emergent solutions to high-dimensional multitask reinforcement learning | |
KR20220051132A (ko) | 양자 회로 결정 방법 및 장치, 디바이스, 및 저장 매체 | |
JP2023007366A (ja) | 分子構造取得方法、装置、電子デバイス及び記憶媒体 | |
CN110837567A (zh) | 实现知识图谱嵌入的方法和系统 | |
Zheng et al. | Chimera: An analytical optimizing framework for effective compute-intensive operators fusion | |
Rao et al. | Distributed deep reinforcement learning using tensorflow | |
US11724194B2 (en) | Initial results of a reinforcement learning model using a heuristic | |
Patel et al. | Curriculum reinforcement learning for quantum architecture search under hardware errors | |
Qu et al. | Asynchronous reinforcement learning framework for net order exploration in detailed routing | |
US20230051955A1 (en) | System and Method For Regularized Evolutionary Population-Based Training | |
US20220012291A1 (en) | Information processing system, information processing method, and non-transitory computer-readable storage medium for storing program | |
US10157346B2 (en) | Parallel Gibbs sampler using butterfly-patterned partial sums | |
Miresmaeili et al. | A novel multi-objective estimation of distribution algorithm for solving gas lift allocation problem | |
Khamesian et al. | Hybrid self-attention NEAT: a novel evolutionary self-attention approach to improve the NEAT algorithm in high dimensional inputs | |
Shuai et al. | A Self-adaptive neuroevolution approach to constructing Deep Neural Network architectures across different types | |
US11604937B2 (en) | Systems and methods for adaptive data processing associated with complex dynamics | |
KR20230132369A (ko) | 양자 회로에서의 리소스 감소 | |
Sun et al. | Computation on sparse neural networks and its implications for future hardware | |
Panou et al. | DeepFoldit--A Deep Reinforcement Learning Neural Network Folding Proteins | |
US11478715B1 (en) | User-controllable model-driven matchmaking | |
TWI851438B (zh) | 最佳化用於硬體裝置之演算法 | |
Ba et al. | Monte Carlo Tree Search with variable simulation periods for continuously running tasks | |
JP7462206B2 (ja) | 学習装置、学習方法、及び学習プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210826 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221013 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7161066 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |