JP2021144375A - システム、情報処理方法及びプログラム - Google Patents

システム、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2021144375A
JP2021144375A JP2020041480A JP2020041480A JP2021144375A JP 2021144375 A JP2021144375 A JP 2021144375A JP 2020041480 A JP2020041480 A JP 2020041480A JP 2020041480 A JP2020041480 A JP 2020041480A JP 2021144375 A JP2021144375 A JP 2021144375A
Authority
JP
Japan
Prior art keywords
time
spins
taken
interaction
actions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020041480A
Other languages
English (en)
Other versions
JP6861309B1 (ja
Inventor
翔太 永山
Shota Nagayama
翔太 永山
貴彦 佐藤
Takahiko Sato
貴彦 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mercari Inc
Original Assignee
Mercari Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mercari Inc filed Critical Mercari Inc
Priority to JP2020041480A priority Critical patent/JP6861309B1/ja
Application granted granted Critical
Publication of JP6861309B1 publication Critical patent/JP6861309B1/ja
Publication of JP2021144375A publication Critical patent/JP2021144375A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】時間の経過とともにどのように行動を選択すべきか推定するシステム、情報処理方法及びプログラムを提供する。【解決手段】システムは、第1時刻において取り得る複数の行動に対応する複数の第1スピン及び第1時刻より後の第2時刻において取り得る複数の行動に対応する複数の第2スピンをアニーリングマシンに設定し、複数の行動に関する利得を表すように、複数の第1スピンの間の相互作用及び複数の第2スピンの間の相互作用をアニーリングマシンに設定し、第1時刻から第2時刻への時間遷移を表すように、複数の第1スピン及び複数の第2スピンの間の相互作用をアニーリングマシンに設定し、アニーリングマシンによって、複数の第1スピン及び複数の第2スピンの低エネルギー状態を求めることで、第1時刻において取るべき行動及び第2時刻において取るべき行動を推定する、処理を実行する。【選択図】図1

Description

本発明は、システム、情報処理方法及びプログラムに関する。
近年、複数のスピンの間に所望の相互作用を設定し、複数のスピンの基底状態を求めることで、組み合わせ最適化問題を解くアニーリングマシンが用いられている。
例えば、下記特許文献1には、連続して入力され、時々刻々と変化する問題の解を求める情報処理装置であって、相互作用モデルにおける各素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部を情報処理装置に設け、入力される問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成し、生成した問題の係数データに基づいて、前後する問題間の類似度を表す類似度データを生成し、1つ前の問題及び今回の問題の類似度が所定の閾値以下の場合には、問題変換部から与えられた各素子の状態を相互作用モデルの初期状態に設定し、当該類似度が閾値よりも大きい場合には、直前の各素子の状態を今回の問題に対する相互作用モデルの初期状態とするようにした情報処理装置が記載されている。
国際公開第2017/037859号
特許文献1に記載の技術を用いることで、例えば、時間の経過とともに変化する移動コストを考慮して、巡回セールスマン問題の解を求めることができる。しかしながら、各時刻において適切な行動を選択する問題の場合、過去に選択した行動が現在の行動の選択に与える影響を考慮することができず、時間の経過とともにどのように行動を選択すべきか推定することは困難だった。
そこで、本発明は、時間の経過とともにどのように行動を選択すべきか推定するシステム、情報処理方法及びプログラムを提供する。
本開示の一態様に係るシステムは、メモリと、1つ又は複数のプロセッサとを含み、1つ又は複数のプロセッサが、第1時刻において取り得る複数の行動に対応する複数の第1スピン及び第1時刻より後の第2時刻において取り得る複数の行動に対応する複数の第2スピンをアニーリングマシンに設定し、複数の行動に関する利得を表すように、複数の第1スピンの間の相互作用及び複数の第2スピンの間の相互作用をアニーリングマシンに設定し、第1時刻から第2時刻への時間遷移を表すように、複数の第1スピン及び複数の第2スピンの間の相互作用をアニーリングマシンに設定し、アニーリングマシンによって、複数の第1スピン及び複数の第2スピンの低エネルギー状態を求めることで、第1時刻において取るべき行動及び第2時刻において取るべき行動を推定する、処理を実行する。
この態様によれば、第1時刻から第2時刻への時間遷移を表す相互作用を設定することで、各時刻において選択すべき行動のみならず、時間の経過とともにどのように行動を選択すべきかを推定することができる。
本発明によれば、時間の経過とともにどのように行動を選択すべきか推定するシステム、情報処理方法及びプログラムを提供することができる。
本開示の実施形態に係る行動推定システムの概要を示す図である。 本実施形態に係る行動推定システムにより設定されるアニーリングマシンのスピンを示す図である。 本実施形態に係る行動推定システムにより設定されるアニーリングマシンのスピンを模式的に示す図である。 本実施形態に係るクライアントコンピュータの構成を示す図である。 本実施形態に係るサーバコンピュータの構成を示す図である。 本実施形態に係る行動推定システムにより実行される行動推定処理のフローチャートである。
以下、本開示の実施形態について図面を参照しつつ詳細に説明する。なお、同一の要素には同一の符号を付し、重複する説明を省略する。
本実施形態では、アニーリングマシンを用いて、第1時刻において取るべき行動及び第2時刻において取るべき行動を推定する行動推定システム10について説明する。
<システムの適用例>
図1は、本開示の実施形態に係る行動推定システム10の概要を示す図である。行動推定システム10は、クライアントコンピュータ500、サーバコンピュータ600及びアニーリングマシン20を含む。クライアントコンピュータ500及びサーバコンピュータ600は、後に詳細に説明するように、汎用の古典コンピュータで構成される。アニーリングマシン20は、古典コンピュータ又は量子コンピュータで構成され、例えば、複数の量子ビットを備え、量子ビットの間の相互作用を調整することで所望のハミルトニアンを設定し、量子アニーリングを用いて量子ビットの基底状態を求める量子コンピュータであってよい。もっとも、アニーリングマシン20は、量子アニーリングを再現する古典コンピュータであってもよい。
クライアントコンピュータ500は、インターネット等の通信ネットワークを介してサーバコンピュータ600と接続される。サーバコンピュータ600は、LAN(Local Area Network)等の通信ネットワークを介してアニーリングマシン20と接続される。クライアントコンピュータ500のユーザは、クライアントコンピュータ500を操作することで、間接的にアニーリングマシン20に指令を送り、アニーリングマシン20を用いて、複数の時刻において取るべき行動を推定する。なお、行動推定システム10の構成は本適用例に示すものに限られず、例えば、アニーリングマシン20は、サーバコンピュータ600を介さずに、LAN等の通信ネットワークを介してクライアントコンピュータ500と接続されてもよい。
図2は、本実施形態に係る行動推定システム10により設定されるアニーリングマシン20のスピンを示す図である。本例では、丸印によって複数のスピンを表し、複数のスピンの間を結ぶ実線で、複数のスピンの間の相互作用を表している。
行動推定システム10は、第1時刻において取り得る複数の行動に対応する複数の第1スピン及び第1時刻より後の第2時刻において取り得る複数の行動に対応する複数の第2スピンをアニーリングマシン20に設定する。図2では、6つの第1スピン21a(符号A1〜A6)と、2つの第1補助スピン22a(符号A7及びA8)を示している。また、6つの第2スピン21b(符号B1〜B6)と、2つの第2補助スピン22b(符号B7及びB8)を示し、6つの第3スピン21c(符号C1〜C6)と、2つの第3補助スピン22c(符号C7及びC8)を示している。なお、第1補助スピン22a、第2補助スピン22b及び第3補助スピン22cは、設定されなくてもよい。また、行動推定システム10は、第N時刻(Nは任意の自然数)において取り得る複数の行動に対応する複数の第Nスピンをアニーリングマシン20に設定してよい。
第1スピン21a、第1補助スピン22a、第2スピン21b、第2補助スピン22b、第3スピン21c及び第3補助スピン22cは、それぞれ2値変数であり、例えば、−1又は1の値をとる変数である。第1スピン21a、第1補助スピン22a、第2スピン21b、第2補助スピン22b、第3スピン21c及び第3補助スピン22cは、超伝導量子回路で構成された量子ビットであってよいが、古典的なビットであってもよい。また、第1時刻及び第2時刻において取り得る複数の行動は、任意の行動であってよいが、例えば、ゲーム理論によって定式化された行動であってよい。
第1時刻及び第2時刻において取り得る複数の行動は、一人のプレイヤーが取り得る複数の行動であってよい。もっとも、第1時刻において取り得る複数の行動は、第1プレイヤーが取り得る複数の行動であり、第2時刻において取り得る複数の行動は、第2プレイヤーが取り得る複数の行動であってもよい。さらに、第1設定部11aは、第1時刻において取り得る複数の行動は、第1プレイヤーが取り得る複数の行動であり、第2時刻において取り得る複数の行動は、第2プレイヤーが取り得る複数の行動であり、第3時刻において取り得る複数の行動は、第3プレイヤーが取り得る複数の行動となるように、複数のスピンを設定してもよい。
行動推定システム10は、複数の行動に関する利得を表すように、複数の第1スピン21a,22aの間の相互作用及び複数の第2スピン21b,22bの間の相互作用を設定する。ここで、複数の行動に関する利得の大きさは、複数のスピンのエネルギーとして表され、行動推定システム10は、複数のスピンのエネルギーが小さいほど、利得が大きい行動に対応するように相互作用を設定する。行動推定システム10は、複数の第1スピン21a,22aの間の相互作用を設定することで、第1時刻における利得と行動の関係を表す関数を設定する。同様に、行動推定システム10は、複数の第2スピンの間21b,22bの相互作用を設定することで、第2時刻における利得と行動の関係を表す関数を設定する。なお、行動推定システム10は、複数の第3スピン21c,22cの間の相互作用を設定することで、第3時刻における利得と行動の関係を表す関数を設定する。
行動推定システム10は、第1時刻から第2時刻への時間遷移を表すように、複数の第1スピン及び複数の第2スピンの間の相互作用を設定する。行動推定システム10は、第1時刻において取った行動が、第2時刻において取り得る複数の行動を制限するように、複数の第1スピン21a,22a及び複数の第2スピン21b,22bの間の相互作用を設定する。行動推定システム10は、第1時刻において取った行動との関係で、第2時刻において取り得ない複数の行動に関する利得が小さくなるように(エネルギーが大きくなるように)、複数の第1スピン及び複数の第2スピンの間の相互作用を設定する。なお、行動推定システム10は、第2時刻において取った行動が、第3時刻において取り得る複数の行動を制限するように、複数の第2スピン21b,22b及び複数の第3スピン21c,22cの間の相互作用を設定してよい。
行動推定システム10は、アニーリングマシン20によって、複数の第1スピン21a,22a及び複数の第2スピン21b,22bの低エネルギー状態を求めることで、第1時刻において取るべき行動及び第2時刻において取るべき行動を推定する。行動推定システム10は、複数の第1スピン21a,22a及び複数の第2スピン21b,22bの基底状態又は低次の励起状態に基づいて、その状態に対応する行動を特定することで、第1時刻において取るべき行動及び第2時刻において取るべき行動を推定する。このように、本実施形態に係る行動推定システム10によれば、第1時刻から第2時刻への時間遷移を表す相互作用を設定することで、各時刻において選択すべき行動のみならず、時間の経過とともにどのように行動を選択すべきかも推定することができる。なお、行動推定システム10は、アニーリングマシン20によって、複数の第1スピン21a,22a、複数の第2スピン21b,22b及び複数の第3スピン21c,22cの低エネルギー状態を求めることで、第1時刻において取るべき行動、第2時刻において取るべき行動及び第3時刻において取るべき行動を推定する。
行動推定システム10は、時刻に応じた重み付けをして、複数の第1スピン21a,22aの間の相互作用及び複数の第2スピン21b,22bの間の相互作用を設定してもよい。例えば、行動推定システム10は、複数の第2スピン21b,22bの間の相互作用に関する重み付けを、複数の第1スピン21a,22aの間の相互作用に関する重み付けよりも大きくして、第1時刻よりも第2時刻における利得を優先するようにしてもよい。逆に、行動推定システム10は、複数の第1スピン21a,22aの間の相互作用に関する重み付けを、複数の第2スピン21b,22bの間の相互作用に関する重み付けよりも大きくして、第2時刻よりも第1時刻における利得を優先するようにしてもよい。
<実施例>
図3は、本実施形態に係る行動推定システム10により設定されるアニーリングマシン20のスピンを模式的に示す図である。以下では、展開型ゲームの一種である三目並べにおいて取るべき行動を行動推定システム10によって推定する実施例について説明する。
図3に示すs0〜s8は、それぞれスピン変数であり、−1又は1の値をとる。s=1であるマスは、第1プレイヤーが丸印を置いたマスに対応し、s=−1であるマスは、第2プレイヤーがバツ印を置いたマスに対応するものとする。三目並べは、丸印が直線状に3つ並んだ場合に第1プレイヤーの勝利となり、バツ印が直線状に3つ並んだ場合に第2プレイヤーの勝利となるゲームである。
行動推定システム10は、複数のスピンの間の相互作用を以下の数式(1)のように設定したハミルトニアンをアニーリングマシン20に設定する。
Figure 2021144375
ここで、solutionsは、(0,1,2)、(3,4,5)、(6,7,8)、(0,3,6)、(1,4,7)、(2,5,8)、(0,4,8)、(2,4,6)という8つのゲームに勝利する場合の配置である。また、W0は、次に説明する相手の勝利を妨害するためのハミルトニアンとの優先順位を調整するための重み係数である。数式(1)のハミルトニアンは、si,sj,skのうちいずれか2つが+1である場合に、残り1つも+1であれば最もエネルギーが低くなる。このようにして、ゲームに勝利する配置が基底状態となるようにハミルトニアンを設定し、取るべき行動を推定することができる。
行動推定システム10は、複数のスピンの間の相互作用を以下の数式(2)のように設定したハミルトニアンを、数式(1)のハミルトニアンに加えてアニーリングマシン20に設定してよい。
Figure 2021144375
ここで、W1は、ハミルトニアンH0との優先順位を調整するための重み係数である。数式(2)のハミルトニアンは、sj,skが−1である場合に、siを+1として、相手の勝利を妨害する場合に最もエネルギーが低くなる。また、W1/W0を調整することで、自らの勝利と相手の勝利の妨害との優先順位を調整することができる。このようにして、相手の勝利を妨げる配置が基底状態となるようにハミルトニアンを設定し、取るべき行動を推定することができる。
行動推定システム10は、複数のスピンの間の相互作用を以下の数式(3)のように設定したハミルトニアンを、数式(1)のハミルトニアンに加えてアニーリングマシン20に設定してよい。
Figure 2021144375
ここで、W0は、重み係数である。数式(3)の和は、solutionsに含まれる2つの配置の全ての並び替えについてとる。数式(3)のハミルトニアンは、si,sjのいずれか一方が+1である場合に、他方も+1として、複数のリーチをつくる場合に最もエネルギーが低くなる。このようにして、リーチとなる配置が低エネルギー状態となるようにハミルトニアンを設定し、取るべき行動を推定することができる。
行動推定システム10は、複数のスピンの間の相互作用を以下の数式(4)のように設定したハミルトニアンを、数式(1)のハミルトニアンに加えてアニーリングマシン20に設定してよい。
Figure 2021144375
ここで、W1は、重み係数である。数式(4)の和は、solutionsに含まれる2つの配置の全ての並び替えについてとる。数式(4)のハミルトニアンは、si,sjのいずれか一方が−1である場合に、他方を+1として、相手のリーチを妨害する場合に最もエネルギーが低くなる。このようにして、相手のリーチを妨害する配置が低エネルギー状態となるようにハミルトニアンを設定し、取るべき行動を推定することができる。
行動推定システム10は、複数のスピンの間の相互作用を以下の数式(5)のように設定したハミルトニアンを、数式(3)及び(4)のハミルトニアンに加えてアニーリングマシン20に設定してよい。
Figure 2021144375
ここで、W0及びW1は、重み係数である。数式(5)のハミルトニアンは、si,sj,skのいずれか2つについて+1と−1が含まれる場合に、残りの1つを+1とする配置のエネルギーが高くなるように設定されている。このようにして、勝利に至らない配置が高エネルギー状態となるようにハミルトニアンを設定し、取るべき行動を推定することができる。
行動推定システム10は、数式(1)〜(5)のハミルトニアンを各時刻について設定し、第1時刻tにおいて取り得る複数の行動に対応する第1スピンsi tと、第2時刻t+1において取り得る複数の行動に対応する第2スピンsi t+1との間の相互作用としてsi t−si t+1−si ti t+1という項を含むハミルトニアンを、数式(1)のハミルトニアンに加えてアニーリングマシン20に設定してよい。これにより、si tが+1である場合に、si t+1が−1となる配置が高エネルギー状態となり、盤面の時間発展が適切に表現される。
行動推定システム10は、各時刻のハミルトニアンに対して時刻に応じた重み付けをしてもよい。また、以上の説明では、時刻tから時刻t+1に向かって時間発展するものとしたが、時刻t+1から時刻tに向かって時間発展することとしてもよい。さらに、時刻tと時刻t+1のスピンのみならず、時刻tと時刻t+2等の隣接しないスピンの間に相互作用を設定してもよい。また、三目並べ等の展開型ゲームの第1プレイヤーが有利となる行動を推定する場合、行動推定システム10は、第2プレイヤーが勝利する行動が推定される場合には、その時点より前の行動に対応する複数のスピンについて、ハミルトニアンの1次項の重みを調整し、アニーリングマシン20による演算を再実行して、第2プレイヤーが勝利する行動が推定されないようにしてもよい。
本実施例では、展開型ゲームの一種である三目並べについて説明したが、行動推定システム10は、経済行動に関するゲーム理論や生物進化に関する進化ゲーム理論に適用することができる。より具体的には、行動推定システム10は、オークションの設計やマッチングの設計に適用することができる。
<構成の一例>
図4は、ある実施形態に係るクライアントコンピュータ500を示すブロック図である。クライアントコンピュータ500は典型的には、1つ又は複数の処理装置(CPU)502、1つ又は複数のネットワーク又は他の通信インタフェース508、メモリ504、及びこれらの構成要素を相互接続するための1つ又は複数の通信バス514を含む。
クライアントコンピュータ500はまた、ディスプレイ装置510及びキーボード及び/又はマウス(又は他の何らかのポインティングデバイス)512を備えるユーザインタフェース506も含み得る。
メモリ504は、例えば、DRAM、SRAM、DDR RAM又は他のランダムアクセス固体記憶装置などの高速ランダムアクセスメモリであり、また、1つ又は複数の磁気ディスク記憶装置、光ディスク記憶装置、フラッシュメモリデバイス、又は他の不揮発性固体記憶装置などの不揮発性メモリでもよい。
また、メモリ504の他の例として、CPU502から遠隔に設置される1つ又は複数の記憶装置でもよい。ある実施形態において、メモリ504は次のプログラム、モジュール及びデータ構造、又はそれらのサブセットを格納する。
オペレーティングシステム516は、例えば、様々な基本的なシステムサービスを処理するとともにハードウェアを用いてタスクを実行するためのプロシージャを含む。
ネットワーク通信モジュール518は、例えば、クライアントコンピュータ500を他のコンピュータに、1つ又は複数の通信ネットワークインタフェース508及び、インターネット、他の広域ネットワーク、ローカルエリアネットワーク、メトロポリタンエリアネットワークなどの1つ又は複数の通信ネットワークを介して接続するために使用される。
アニーリングマシン設定モジュール520は、例えば、アニーリングマシン20の複数のスピン及び当該スピンのハミルトニアンを設定するための情報の入力をキーボード及び/又はマウス512により受け付けて、サーバコンピュータ600に送信する。アニーリングマシン設定モジュール520は、少なくとも、第1時刻において取り得る複数の行動に対応する複数の第1スピン及び第1時刻より後の第2時刻において取り得る複数の行動に対応する複数の第2スピンをアニーリングマシン20に設定するための情報と、複数の行動に関する利得を表すように、複数の第1スピンの間の相互作用及び複数の第2スピンの間の相互作用をアニーリングマシン20に設定するための情報と、第1時刻から第2時刻への時間遷移を表すように、複数の第1スピン及び複数の第2スピンの間の相互作用をアニーリングマシン20に設定するための情報とを、サーバコンピュータ600に送信する。
推定モジュール522は、例えば、アニーリングマシン20によって求められたスピンの基底状態及び/又は低次の励起状態に基づいて、複数の時刻において取るべき行動を推定する。推定モジュール522は、少なくとも、アニーリングマシン20によって、複数の第1スピン及び複数の第2スピンの低エネルギー状態を求めることで、第1時刻において取るべき行動及び第2時刻において取るべき行動を推定する。
クライアントアプリケーション530は、例えば、ウェブブラウザなどを含む。
1つ又は複数の処理装置(CPU)502は、メモリ504から、必要に応じて各モジュールを読み出して実行する。例えば、1つ又は複数の処理装置(CPU)502は、メモリ504に格納されているネットワーク通信モジュール518を実行することで、通信部を構成してもよい。また、1つ又は複数の処理装置(CPU)502は、メモリ504に格納されているアニーリングマシン設定モジュール520を実行することで、アニーリングマシン設定部を構成してもよいし、推定モジュール522を実行することで、推定部を構成してもよい。ここで、アニーリングマシン設定部及び推定部は、CPU502の内部に構成してよい。
他の実施形態において、アニーリングマシン設定モジュール520及び推定モジュール522は、クライアントコンピュータ500のメモリ504に格納されるスタンドアロンアプリケーションであってもよい。スタンドアロンアプリケーションとしては、限定はされないが、アニーリングマシン設定アプリケーション及び推定アプリケーションが挙げられる。さらに他の実施形態において、アニーリングマシン設定モジュール520及び推定モジュール522は別のアプリケーションへのアドオン又はプラグインであってもよい。例えば、アニーリングマシン設定モジュール520は、ウェブブラウザアプリケーション又は電子メールアプリケーションへのプラグインであってもよい。
ある実施形態において、受信されたデータ項目はメモリ504に局所的にキャッシュされ得る。同様に、アニーリングマシン20により求められたスピンの基底状態に関する情報は、メモリ504に局所的にキャッシュされ得る。
上記に示した要素の各々は、先述の記憶装置の1つ又は複数に格納され得る。上記に示したモジュールの各々は、上述される機能を実行するための命令のセットに対応する。上記に示したモジュール又はプログラム(すなわち、命令のセット)は別個のソフトウェアプログラム、プロシージャ又はモジュールとして実装される必要はないとともに、従ってこれらのモジュールの様々なサブセットは様々な実施形態で組み合わされるか、或いは再構成されてもよい。ある実施形態において、メモリ504は上記に示されるモジュール及びデータ構造のサブセットを格納し得る。さらには、メモリ504は上述されない追加的なモジュール及びデータ構造を格納し得る。
図5は、ある実施形態に係るサーバコンピュータ600を示すブロック図である。サーバコンピュータ600は典型的には、1つ又は複数の処理装置(CPU)602、1つ又は複数のネットワーク又は他の通信インタフェース608、メモリ604、及びこれらの構成要素を相互接続するための1つ又は複数の通信バス610を含む。
サーバシステム600は場合によりユーザインタフェース606を含んでもよく、これとしては、ディスプレイ装置(図示せず)、及びキーボード及び/又はマウス(図示せず)を挙げることができる。
メモリ604は、例えば、DRAM、SRAM、DDR RAM又は他のランダムアクセス固体記憶装置などの高速ランダムアクセスメモリであり、また、1つ又は複数の磁気ディスク記憶装置、光ディスク記憶装置、フラッシュメモリデバイス、又は他の不揮発性固体記憶装置などの不揮発性メモリでもよい。
また、メモリ604の他の例は、CPU602から遠隔に設置される1つ又は複数の記憶装置を挙げることができる。ある実施形態において、メモリ604は次のプログラム、モジュール及びデータ構造、又はそれらのサブセットを格納する。
オペレーティングシステム612は、例えば、様々な基本的なシステムサービスを処理するとともにハードウェアを用いてタスクを実行するためのプロシージャを含む。
ネットワーク通信モジュール614は、例えば、サーバシステム600を他のコンピュータに、1つ又は複数の通信ネットワークインタフェース606及びインターネット、他の広域ネットワーク、ローカルエリアネットワーク、メトロポリタンエリアネットワークなどの1つ又は複数の通信ネットワークを介して接続するために使用される。
アニーリングマシン設定モジュール616は、例えば、アニーリングマシン20の複数のスピン及び当該スピンのハミルトニアンを設定するための情報をクライアントコンピュータ500から受信し、アニーリングマシン20を設定する。アニーリングマシン設定モジュール616は、少なくとも、第1時刻において取り得る複数の行動に対応する複数の第1スピン及び第1時刻より後の第2時刻において取り得る複数の行動に対応する複数の第2スピンをアニーリングマシン20に設定し、複数の行動に関する利得を表すように、複数の第1スピンの間の相互作用及び複数の第2スピンの間の相互作用をアニーリングマシン20に設定し、第1時刻から第2時刻への時間遷移を表すように、複数の第1スピン及び複数の第2スピンの間の相互作用をアニーリングマシン20に設定する。
推定モジュール618は、例えば、アニーリングマシン20によって求められたスピンの基底状態及び/又は低次の励起状態に基づいて、複数の時刻において取るべき行動を推定する。推定モジュール618は、少なくとも、アニーリングマシン20によって、複数の第1スピン及び複数の第2スピンの低エネルギー状態を求めることで、第1時刻において取るべき行動及び第2時刻において取るべき行動を推定する。
上記に示した要素の各々は先述される記憶装置の1つ又は複数に格納され得る。上記に示したモジュールの各々は、上述される機能を実行するための命令のセットに対応する。上記に示したモジュール又はプログラム(すなわち、命令のセット)は別個のソフトウェアプログラム、プロシージャ又はモジュールとして実装される必要はないとともに、従ってこれらのモジュールの様々なサブセットが様々な実施形態で組み合わされるか、或いは再構成され得る。ある実施形態において、メモリ604は上記に示されるモジュール及びデータ構造のサブセットを格納し得る。さらには、メモリ604は上述されない追加的なモジュール及びデータ構造を格納し得る。
図5は「サーバコンピュータ」を示すが、図5は、本明細書に記載される実施形態の構造的な概略としてよりも、サーバのセットに存在し得る様々な特徴についての説明が意図されている。実際には、及び当業者により認識されるとおり、別個に示される項目が組み合わされ得るであろうとともに、ある項目が別個にされ得るであろう。例えば、図5において別個に示される項目は単一サーバ上に実装され得るであろうとともに、単一の項目が1台又は複数のサーバにより実装され得るであろう。
<動作説明>
次に、本実施形態に係る行動推定システム10の動作について説明する。図6は、本実施形態に係る行動推定システム10の処理の一例を示すフローチャートである。図6に示す例では、ステップS14で、行動推定システム10は、アニーリングマシン20によって求められた基底状態に基づいて、第1時刻において取るべき行動及び第2時刻において取るべき行動を推定する。
(ステップS10)
行動推定システム10は、はじめに、第1時刻において取り得る複数の行動に対応する複数の第1スピンを設定する。
(ステップS11)
行動推定システム10は、第1時刻より後の第2時刻において取り得る複数の行動に対応する複数の第2スピンを設定する。
(ステップS12)
その後、行動推定システム10は、複数の行動に関する利得を表すように、複数の第1スピンの間の相互作用及び複数の第2スピンの間の相互作用を設定する。
(ステップS13)
また、行動推定システム10は、第1時刻から第2時刻への時間遷移を表すように、複数の第1スピン及び複数の第2スピンの間の相互作用を設定する。
(ステップS14)
最後に、行動推定システム10は、アニーリングマシン20によって、複数の第1スピン及び複数の第2スピンの低エネルギー状態を求めることで、第1時刻において取るべき行動及び第2時刻において取るべき行動を推定する。
これにより、本実施形態に係る行動推定システム10は、第1時刻から第2時刻への時間遷移を表す相互作用を設定することで、各時刻において選択すべき行動のみならず、時間の経過とともにどのように行動を選択すべきかを推定することができる。
なお、開示技術は、上述した各実施形態に限定されるものではなく、開示技術の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。このため、上記各実施形態はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。例えば、上述した各処理ステップは処理内容に矛盾を生じない範囲で任意に順番を変更し、または並列に実行することができる。
本開示の実施形態のプログラムは、コンピュータに読み取り可能な記憶媒体に記憶された状態で提供されてもよい。 記憶媒体は、「一時的でない有形の媒体」に、プログラムを記憶可能である。プログラムは、限定でなく例として、ソフトウェアプログラムやコンピュータプログラムを含む。
10…行動推定システム、20…アニーリングマシン、21a…第1スピン、21b…第2スピン、21c…第3スピン、22a…第1補助スピン、22b…第2補助スピン、22c…第3補助スピン、500…クライアントコンピュータ、502…CPU、504…メモリ、506…ユーザインタフェース、508…ネットワーク通信インタフェース、510…ディスプレイ、512…キーボード/マウス、514…通信バス、516…オペレーティングシステム、518…ネットワーク通信モジュール、520…アニーリングマシン設定モジュール、522…推定モジュール、530…クライアントアプリケーション、600…サーバコンピュータ、602…CPU、604…メモリ、606…ユーザインタフェース、608…ネットワーク通信インタフェース、610…通信バス、612…オペレーティングシステム、614…ネットワーク通信モジュール、616…アニーリングマシン設定モジュール、618…推定モジュール

Claims (6)

  1. システムであって、
    メモリと、1つ又は複数のプロセッサとを含み、
    前記1つ又は複数のプロセッサが、
    第1時刻において取り得る複数の行動に対応する複数の第1スピン及び前記第1時刻より後の第2時刻において取り得る複数の行動に対応する複数の第2スピンをアニーリングマシンに設定し、
    前記複数の行動に関する利得を表すように、前記複数の第1スピンの間の相互作用及び前記複数の第2スピンの間の相互作用を前記アニーリングマシンに設定し、
    前記第1時刻から前記第2時刻への時間遷移を表すように、前記複数の第1スピン及び前記複数の第2スピンの間の相互作用を前記アニーリングマシンに設定し、
    前記アニーリングマシンによって、前記複数の第1スピン及び前記複数の第2スピンの低エネルギー状態を求めることで、前記第1時刻において取るべき行動及び前記第2時刻において取るべき行動を推定する、
    処理を実行する、システム。
  2. 前記第1時刻において取った行動が、前記第2時刻において取り得る前記複数の行動を制限するように、前記複数の第1スピン及び前記複数の第2スピンの間の相互作用を前記アニーリングマシンに設定する、
    請求項1に記載のシステム。
  3. 前記第1時刻において取り得る複数の行動は、第1プレイヤーが取り得る複数の行動であり、
    前記第2時刻において取り得る複数の行動は、第2プレイヤーが取り得る複数の行動である、
    請求項1又は2に記載のシステム。
  4. 時刻に応じた重み付けをして、前記複数の第1スピンの間の相互作用及び前記複数の第2スピンの間の相互作用を前記アニーリングマシンに設定する、
    請求項1から3のいずれか一項に記載のシステム。
  5. メモリと、1つ又は複数のプロセッサとを含むシステムが実行する情報処理方法であって、
    前期1つ又は複数のプロセッサが、
    第1時刻において取り得る複数の行動に対応する複数の第1スピン及び前記第1時刻より後の第2時刻において取り得る複数の行動に対応する複数の第2スピンをアニーリングマシンに設定し、
    前記複数の行動に関する利得を表すように、前記複数の第1スピンの間の相互作用及び前記複数の第2スピンの間の相互作用を前記アニーリングマシンに設定し、
    前記第1時刻から前記第2時刻への時間遷移を表すように、前記複数の第1スピン及び前記複数の第2スピンの間の相互作用を前記アニーリングマシンに設定し、
    前記アニーリングマシンによって、前記複数の第1スピン及び前記複数の第2スピンの低エネルギー状態を求めることで、前記第1時刻において取るべき行動及び前記第2時刻において取るべき行動を推定する、
    処理を実行する、情報処理方法。
  6. システムに含まれる、1つ又は複数のプロセッサに、
    第1時刻において取り得る複数の行動に対応する複数の第1スピン及び前記第1時刻より後の第2時刻において取り得る複数の行動に対応する複数の第2スピンをアニーリングマシンに設定し、
    前記複数の行動に関する利得を表すように、前記複数の第1スピンの間の相互作用及び前記複数の第2スピンの間の相互作用を前記アニーリングマシンに設定し、
    前記第1時刻から前記第2時刻への時間遷移を表すように、前記複数の第1スピン及び前記複数の第2スピンの間の相互作用を前記アニーリングマシンに設定し、
    前記アニーリングマシンによって、前記複数の第1スピン及び前記複数の第2スピンの低エネルギー状態を求めることで、前記第1時刻において取るべき行動及び前記第2時刻において取るべき行動を推定する、
    処理を実行させる、プログラム。
JP2020041480A 2020-03-11 2020-03-11 システム、情報処理方法及びプログラム Active JP6861309B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020041480A JP6861309B1 (ja) 2020-03-11 2020-03-11 システム、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020041480A JP6861309B1 (ja) 2020-03-11 2020-03-11 システム、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP6861309B1 JP6861309B1 (ja) 2021-04-21
JP2021144375A true JP2021144375A (ja) 2021-09-24

Family

ID=75520919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020041480A Active JP6861309B1 (ja) 2020-03-11 2020-03-11 システム、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6861309B1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013084175A (ja) * 2011-10-12 2013-05-09 Sony Corp 情報処理装置、情報処理方法、及びプログラム
JP2019121137A (ja) * 2017-12-29 2019-07-22 富士通株式会社 最適化装置および最適化装置の制御方法
WO2019216277A1 (ja) * 2018-05-08 2019-11-14 株式会社日立製作所 情報処理装置、演算装置、及び情報処理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013084175A (ja) * 2011-10-12 2013-05-09 Sony Corp 情報処理装置、情報処理方法、及びプログラム
JP2019121137A (ja) * 2017-12-29 2019-07-22 富士通株式会社 最適化装置および最適化装置の制御方法
WO2019216277A1 (ja) * 2018-05-08 2019-11-14 株式会社日立製作所 情報処理装置、演算装置、及び情報処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大澤正彦、萩原将文: "RBMにおける未学習データ検出法の提案と追加学習への応用", 電子情報通信学会技術研究報告, vol. 114, no. 515, JPN6021010198, 9 March 2015 (2015-03-09), JP, pages 283 - 288, ISSN: 0004471030 *

Also Published As

Publication number Publication date
JP6861309B1 (ja) 2021-04-21

Similar Documents

Publication Publication Date Title
Mnih et al. Asynchronous methods for deep reinforcement learning
CN112651509A (zh) 量子线路的确定方法及装置
Kumar et al. A new QPSO based hybrid algorithm for constrained optimization problems via tournamenting process
Rao et al. Distributed deep reinforcement learning using tensorflow
Nguyen et al. Asynchronous framework with Reptile+ algorithm to meta learn partially observable Markov decision process
JP6861309B1 (ja) システム、情報処理方法及びプログラム
JP7063274B2 (ja) 情報処理装置、ニューラルネットワークの設計方法及びプログラム
Guo et al. A bare bones particle swarm optimization algorithm with dynamic local search
Zhang et al. Evolutionary stability and the evolution of cooperation on heterogeneous graphs
Lo et al. Theory of networked minority games based on strategy pattern dynamics
Ahmed et al. T-way test data generation strategy based on particle swarm optimization
Dabas et al. Solving connect 4 using artificial intelligence
Black et al. SAT over BOINC: an application-independent volunteer grid project
Roch et al. A quantum annealing algorithm for finding pure Nash equilibria in graphical games
Zaikin et al. A volunteer-computing-based grid architecture incorporating idle resources of computational clusters
Leon Emergent behaviors in social networks of adaptive agents
JP2021196863A (ja) システム、情報処理方法及びプログラム
Zhang et al. An evolutionary multiagent framework for multiobjective optimization
Artamonov Prediction of cluster system load using artificial neural networks
JP6889230B2 (ja) 情報処理装置、情報処理方法及びプログラム
Fatemi et al. Rating and generating Sudoku puzzles based on constraint satisfaction problems
Baladrón et al. At the Crossroads of Three Seemingly Divergent Approaches to Quantum Mechanics
Remondino et al. Minority game with communication: an agent based model
US11263375B2 (en) Constraint determination system and method for semiconductor circuit
WO2023062763A1 (ja) 機械学習装置、特徴量抽出装置、機械学習方法、特徴量抽出方法、機械学習プログラム及び特徴量抽出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200311

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20200407

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210323

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210329

R150 Certificate of patent or registration of utility model

Ref document number: 6861309

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250