JP7080806B2 - 機械学習装置 - Google Patents

機械学習装置 Download PDF

Info

Publication number
JP7080806B2
JP7080806B2 JP2018223630A JP2018223630A JP7080806B2 JP 7080806 B2 JP7080806 B2 JP 7080806B2 JP 2018223630 A JP2018223630 A JP 2018223630A JP 2018223630 A JP2018223630 A JP 2018223630A JP 7080806 B2 JP7080806 B2 JP 7080806B2
Authority
JP
Japan
Prior art keywords
arithmetic unit
training data
data
storage device
reservoir
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018223630A
Other languages
English (en)
Other versions
JP2020087189A (ja
Inventor
辰也 戸丸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018223630A priority Critical patent/JP7080806B2/ja
Publication of JP2020087189A publication Critical patent/JP2020087189A/ja
Application granted granted Critical
Publication of JP7080806B2 publication Critical patent/JP7080806B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Description

本発明は、機械学習装置に関する。
近年、機械学習や人工知能への期待が大きく、その中核を担っているのが深層学習である。しかし、機械学習や人工知能を担っているのは深層学習だけではなく、他の技術もある。そのひとつがリザバ・コンピューティングである。
リザバ・コンピューティングは学習時間が比較的短いのが特徴で、深層学習の課題のひとつである学習時間の長さを解決できる可能性がある。リザバ・コンピューティングの内部構成はニューラルネットワークと類似しており、構成だけを見れば深層学習と大きな差はない。
しかし、深層学習が各ノードで行う演算の係数を学習させていくのに対して、リザバ・コンピューティングでは各ノードにおける係数を固定化し、出力値に対して行う演算の係数のみを学習させる。言い換えると、深層学習が係数を多層に亘って学習させるのに対して、リザバ・コンピューティングでは1層のみを学習させる。これにより学習時間が短くなる。
リザバ・コンピューティングでは、特許文献1に記載のように、リザバ演算装置に量子系を利用する方法も提案されている。量子力学には線形重ね合わせの性質があり、その量子力学的性質はリザバ演算装置内のノード数を実効的に指数関数的に増加させることに対応し、リザバ演算装置の特性を大きく向上させる。
WO2017/131081号公報
特許文献1のリザバ演算装置に量子系を利用する方法では、リザバ演算装置を量子ビットで構成すれば出力としての測定値は0あるいは1になる。また、測定結果に依存してリザバ演算装置の内部状態も変化する。
しかし、リザバ演算装置の出力として得たい値は[0,1]の連続量であり、また、測定に伴う状態変化も無くす必要がある。その対応策として現状知られている手法は、同じ仕様のリザバ演算装置を多数用意し、全てのリザバ演算装置を一括測定して平均量としての出力値を得るものである。これにより[0,1]の連続量となり、また多数のリザバ演算装置からなる系に対してひとつの測定値を得るだけなので測定に伴う状態変化も無視できるレベルになる。
しかし、ここで必要となるリザバ演算装置の数はアボガドロ数個のレベルである。よって、量子リザバ・コンピューティングの実現は容易なことではなく、またコストに見合うだけの性能が得られるかどうかも課題である。
このように量子リザバ・コンピューティングでは多数の量子リザバ演算装置を用意しなければならない。しかし、実用的な観点からは、1個のリザバ演算装置だけで動作する必要がある。
よって、本発明の目的は1個のリザバ演算装置で動作可能な高性能な機械学習装置を提供することにある。
本発明の一態様の機械学習装置は、データを演算する一般演算装置と、前記データに対して学習を行うリザバ演算装置と、前記データを記憶する記憶装置と、前記記憶装置と前記一般演算装置との間及び前記記憶装置と前記リザバ演算装置との間で行う前記データのやり取りを制御する制御装置とを有し、前記リザバ演算装置は、少なくとも一つの振動子と、入力部と、出力部とを有し、前記入力部から入力された前記データを前記振動子により演算して前記出力部から出力することを特徴とする。
本発明の一態様によれば、1個のリザバ演算装置で動作可能な高性能な機械学習装置を提供することができる。
実施例1の機械学習装置の構成を示す図である。 機械学習装置の処理を規定したフローチャートである。 実施例2の機械学習装置に配置されるリザバ演算装置の構成を示す図である。 実施例2の機械学習装置に配置されるリザバ演算装置の構成を示す図である。 実施例2の機械学習装置に配置されるリザバ演算装置の構成を示す図である。 実施例3の機械学習装置の動作例を示すためのタスクを示す図である。 図3Aに示すリザバ演算装置の動作例を示す図である。 リザバ演算装置における訓練後の推定出力例を示す図である。 実施例4の機械学習装置において振動子にジョセフソン接合を含む例を示す図である。 ジョセフソン接合の等価回路を示す図である。 振動子にジョセフソン接合を含む他の例を示す図である。 量子ビットをスピンモデルで表し、そのダイナミクスを示した図である。 実施例5の機械学習装置においてリザバ演算装置の入力情報を出力情報の一部として利用する場合を示した図である。 実施例5の機械学習装置においてリザバ演算装置の入力情報を緩和時間τに渡って出力情報の一部として利用する場合を示した図である。 実施例5の機械学習装置においてリザバ演算装置の入力情報を局所場応答演算させた上で出力情報の一部として利用する場合を示した図である。
リザバ演算装置に量子系を利用する方法においては、量子系はシュレディンガー方程式に従い時間発展する。時間発展を表すユニタリ演算子は三角関数により記述される。量子リザバ・コンピューティングが優れた特性を示すのは時間発展がユニタリ、即ち三角関数で記述されるところにある。
実施形態では、この三角関数による時間発展に着目し、LCR回路等の振動子によりリザバ演算装置を構成する。LCR回路等の振動子の時間変化も三角関数で記述されるために、LCR回路等の振動子でリザバ演算装置を構成すれば量子リザバ演算装置と同様に優れた性能が得られる。
LCR回路等の振動子は出力値が連続量となる。また、リザバ・コンピューティングで必要とされる記憶性、再帰性及び忘却性の性質を具備する。よって、リザバ・コンピューティングで必要とされるすべての要件を満たしており、リザバ演算装置は1個だけで動作する。
1個のリザバ演算装置だけでコンピューティングが可能になれば実現が容易になると共に、コスト的にも有利になる。さらに、上述のように時間発展が量子リザバ・コンピューティングと同様に三角関数で記述されるので優れた性能が得られる。
実施形態によれば、1個のリザバ演算装置で所望の動作が可能な高性能な機械学習装置を提供することができる。
以下、図面を用いて実施例について説明する。
図1を参照して、実施例1の機械学習装置について説明する。
実施例1の機械学習装置は、通常の計算機とほぼ同様の構成を有するが、一般演算装置9002に加えてリザバ演算装置1000を有する点が通常の計算機とは異なる。演算の手順も通常の計算機と同様で、制御装置9003の制御の下で主記憶装置9001と一般演算装置9002との間で、また主記憶装置9001とリザバ演算装置1000との間でデータをやり取りして行う。
主記憶装置9001の容量が足りない場合は補助記憶装置9004を利用する。主記憶装置9001へのデータ入力は入力装置9005を通して行い、主記憶装置9001からのデータ出力は出力装置9006を通して行う。これらの操作は制御装置9003の制御の下で行う。
リザバ演算装置1000は、教師あり学習を専門に行う専用演算部である。リザバ演算装置1000は、複数の振動子201~208、入力部100及び出力部300を有する。
訓練データとして(x,y )を与えるものとする。ここで添え字のvはx及びy がベクトルであることを表し、それらを成分で表せばx=(x,x,…,xnx、y =(y ,y ,…,yny である。ここでxとy は縦ベクトルであり、Tは転置を表す。また、xを第1の訓練データ、y を第2の訓練データと呼ぶことにする。(x,y )は入力装置9005を通して主記憶装置9001に保存される。
第1の訓練データxはリザバ演算装置1000内の入力部100を通して振動子201にx,x,…,xnxの順番で入力される。よって添え字は時刻点を表す。そのことを明確に表すためにx=x(t)と書くことにする。同様にy =y(t)である。振動子201~208は矢印でつながったもの同士に相互作用がある。ここでは紙面の都合で8個の振動子のみを書いたが、数が多くなるほどリザバ演算装置1000としての性能は向上する。
また、どの振動子間で相互作用があるかの設定は任意でその大きさも任意である。振動子201に入力された第1の訓練データxは振動子201自身のダイナミクス、振動子201~208間の相互作用に基づくダイナミクス、201以外の振動子のダイナミクスにより時間発展する。ある時刻tにおける振動子i(i=202,203,…,207)に関する測定量の値をz(t)とする。ここで、z(t)は電位や誘導起電力等である。z(t)は出力部300を通して主記憶装置9001に送られて保存される。
出力信号は係数wを用いてy(t)=Σ(t)で与えられるとする。教師あり学習で行うことはy=(y(t),y(t),…,y(tny))がy に一致するようにwを決定することである。そのためにはΣ(y(t)-y(t))を最小にするwを見つければよい。wを成分とするベクトルをw、z(t)を(k,i)成分とする行列をZとすればy=Zwと書ける。
出力がy となるw=w が存在するならばy =Zw である。Zは一般に正方行列ではないので逆行列は存在しないが、擬逆行列(Moore-Penrose pseudo-inverse matrix)は定義できる。Zをm×n行列、rank(Z)=nとすればZ-1=(ZZ)-1である。擬逆行列Z-1を用いればw =Z-1 となってw が求められる。このようにして求まったw はΣ(y(t)-y(t))を最小にするwになっている。
以上の計算を主記憶装置9001と一般演算装置9002の間でデータをやり取りして行い、最終的に求まったw を主記憶装置9001に保存する。
以上の訓練は「第2の訓練データy が再現されるように係数w を決定する」過程とまとめることができる。また、振動子i(i=202,203,…,207)の出力値z(t)から第2の訓練データy を再現する過程は出力値z(t)を加工しているわけであり、係数w を決定する過程は出力値z(t)の加工の規則を決定する過程とも捉えられる。さらに、係数w を決定できたことは第2の訓練データy を再現するための出力値z(t)の加工の規則が決定できたと言える。
訓練後は得られたw を用いて入力データx から出力信号を推定でき、y を得る。即ち、x が入力部100を通して振動子201に送られ、振動子201自身のダイナミクス、振動子201~208間の相互作用に基づくダイナミクス、201以外の振動子のダイナミクスにより時間発展し、その結果であるz (t)が出力部300を通して主記憶装置9001に送られて保存される。このz (t)即ちZを用いてy =Z の関係式によりy が求まる。
この推定処理をまとめると「一般の入力データx がリザバ演算装置1000において演算され、その演算結果が訓練で得た規則に基づいて加工されて出力になる」になる。
以上の処理をまとめたものが図2のフローチャートである。上記推定は予測とも言えるし、タスクによっては判断や認識とも言える。
図2に示すように、最初に、訓練においてw を決定する。即ち、加工の規則を決定する(S200)。
次に、推定(予測、判断、認識)において、w を使ってx からy を決定する(S210)。
実施例1では、時刻tで信号が入力され、出力も時刻tごとに行った。即ち、入力と出力は同じ頻度で処理された。しかし、出力の頻度を上げて処理しても良い。このようにすれば出力数を増やすことが可能であり、これを利用して出力部300にカップルしている振動子の数を減らし、装置の構成を簡略化することも可能である。言い換えれば、出力の頻度を上げることは出力部300にカップルしている振動子の数を実効的に増やすことになる。
このように、実施例1の機械学習装置は、一般演算装置9002、リザバ演算装置1000、主記憶装置9001及び制御装置9003を有し、制御装置9003の制御により主記憶装置9001と一般演算装置9002との間で、また主記憶装置9001とリザバ演算装置1000との間でデータをやり取りする。
リザバ演算装置1000は、1個以上の振動子201~208と入力部100及び出力部300で構成される。主記憶装置9001には訓練データが保存され、訓練データは第1の訓練データ及び第2の訓練データの対になっている。第1の訓練データは入力部100を通してリザバ演算装置1000に送られ、リザバ演算装置1000内の振動子201自身のダイナミクス及び振動子201~208間の相互作用により演算される。演算結果は出力部300を通して主記憶装置9001に送られ、第2の訓練データが再現されるように一般演算装置9002において加工される。その際に得られた加工の規則は主記憶装置9001に保存される。以上の学習後、一般の入力データがリザバ演算装置1000において演算され、その演算結果が前記加工の規則に基づき加工されて出力となる。
図3A~図3Cを参照して、実施例2の機械学習装置について説明する。
実施例1ではリザバ演算装置1000が振動子201~208で構成されることを述べた。振動子201~208はLCR回路で実現することが可能である。
図3Aに示すように、リザバ演算装置1000は6振動子から構成される。振動子201~208間の相互作用はコイルのカップリング、即ち相互インダクタンスMで実現される。ここでLはコイル、Cはコンデンサ、Rは抵抗を意味する。
図3Aで相互作用があるのは、振動子201と振動子202、振動子202と振動子203、振動子203と振動子204、振動子204と振動子205、振動子205と振動子206である。
入力部100とカップルしているのは振動子201であり、出力部300とカップルしているのは振動子202、振動子204、振動子206である。入力部100はカップリング用のLに加えて、1個のRと3個のCから構成される。これは入力を終端するための所謂マッチング回路である。出力部300も同様にカップリング相手ごとにカップリング用のL、1個のRと3個のCから構成される。
リザバ・コンピューティングにおいてリザバ演算装置1000に要求される機能は、記憶性、再帰性及び忘却性である。記憶性はLC回路が共振回路であることにより保証される。再帰性は振動子間の相互作用により実現される。即ち、振動子201の情報は相互インダクタンスを通して振動子202に伝わる。
同様にして、振動子202から振動子203へ、振動子203から振動子204へ、振動子204から振動子205へ、振動子205から振動子206へ伝わる。その逆に、振動子206から振動子205へ、振動子205から振動子204へ、振動子204から振動子203へ、振動子203から振動子202へ、振動子202から振動子201へ情報は伝わる。
このようにして元々振動子201にあった情報は多くのプロセスを経て振動子201に戻る。これが再帰性である。忘却性はRにより実現される。LC共振回路ではRが加われば減衰振動となり忘却性が得られる。リザバ演算装置1000が適切に動作するためには記憶性、再帰性及び忘却性が適切にバランスしている必要がある。このバランスはL,C,R,Mの値を適切に設定することにより可能である。
図3Aでは相互インダクタンスを通して各振動子をカップルさせた。振動子をカップルさせる方法は色々と有り得る。その一つが相互インダクタンスをひとつのコイルで置き換えることであり、図3Bにその例を示す。
また、コイルによるカップリングをコンデンサによるカップリングに置き換えることも可能である。その例を示したのが図3Cである。
このように多くの変形が可能であり、実際の回路設計では制約条件等も考慮して回路を設計すればよい。
図4~図6を参照して、実施例3の機械学習装置について説明する。
実施例2ではLCR回路によりリザバ演算装置1000が実現できることを示した。実施例3ではリザバ演算装置1000として、図3AのLCR回路を動作させた例(計算機シミュレーション)を示す。
タスクは図4に示すタイマータスクとする。
入力信号はt=-400からt=-1までが0あるいは1の乱数、t=0からt=99までが0、t=100以降が1である。即ち、入力信号はt=100におけるステップ関数でt≧0に対してのみ意味のある信号である。t<0においてランダムな入力としたのは、リザバがどのような初期状態にあっても適切に動作する必要があるからである。
実施例1の記法に従えば、0≦t≦99に対してx(t)=0、100≦tに対してx(t)=1である。
訓練データの出力値y(t)は任意のある時刻tにおいてy(t)=1でそれ以外の時刻t(≠t)でy(t)=0とする。即ち、ある時刻tにおけるパルスとする。
振動子202,振動子204,振動子206の出力z(t)を示したのが図5である。時刻は98≦t≦122のみを示した。尚、出力間隔は入力の1/10とし、ひとつの入力ごとに10回出力を得ている。出力部300にカップルしているリザバ演算装置1000の振動子数が3個で、各振動子からの出力が1入力に対して10出力なので合計で1入力当たり30出力になる。
(t)の値を0≦k≦299の範囲で利用すればZは300×30の行列となる。擬逆行列Z-1を求め、w =Z-1 を計算すれば訓練は終了である。このw を利用して新たな入力信号x からy を推定した結果が図6である。訓練データy の位置に対応してピークが見られる。
リザバ演算装置1000の忘却効果のためにパルス位置がt=100からt=120に進むにつれてピークの高さが縮小するが、t=120においてもまだピークが見られる。振動子は6個使用しただけであるが、t=120においてもピークを再現できるのは振動子リザバの優れた特性に基づく。
実施例3では、最も分かり易い例としてタイマータスクの実行例を示したが、音声認識等、多くの問題に適用可能である。
図7~図9を参照して、実施例4の機械学習装置について説明する。
リザバ演算装置1000が高い性能を発揮するためにはダイナミクスがリッチなほど良い。リッチにするための一つの方法は振動子に非線形効果を持たせることである。例えば、LCR回路にジョセフソン接合を加えればよい。図7にその例を示す。
×印がジョセフソン接合を表す。ジョセフソン接合の交流特性は等価的にR及びC成分を含み、等価回路は図8のようになる。等価回路にRを含むので図7の振動子ではRを明示的に書いていないが、明確にRとCを加えてパラメタ選択の幅を広げることもできる。その場合の例が図9である。
図7及び図9は、図3Aを基にジョセフソン接合を加えた例を示すものであるが、図3Aを図3Bや図3Cに変形したように図7や図9を変形することも可能である。
図10~図13を参照して、実施例5の機械学習装置について説明する。
上述のように、本発明は量子リザバ演算装置の課題を解決すべく考案されたものである。実施例5では、量子リザバ演算装置との関連に触れながら、本発明の性能をさらに高める方法を述べる。
量子リザバ演算装置の構成要素としてスピンを考えることにする。スピンは大きさ1の3次元ベクトルでモデル化できる。図10にひとつのスピンを示す。
量子リザバは複数のスピンで構成されると共にそれらが相互作用している。スピン間相互作用がz軸方向であるとする。また、スピンのダイナミクスを生むためにy軸方向に磁場が印加されているとする。スピンはこの磁場により歳差運動と呼ばれる動きをすることになり、スピンを矢印で表すことにすれば図10の実線の矢印が示すようにy軸を中心に矢先が回転運動することになる。本発明の振動子はこの回転運動に対応する。
各スピンにはy軸方向の磁場に加えてz軸方向のスピン間相互作用が掛かるので各スピンはz軸の正方向あるいは負方向に向かって回転運動の軸を変化させようとする。本発明の振動子ではこの軸の変化分が取り入れられていない。即ち、軸変化に対応するダイナミクスをさらに加える余地が残されている。
そこで、図11に示すようにリザバ演算装置1000とは別に演算装置2000を加えて本発明の性能をさらに向上させる。演算装置2000の狙いをリザバ演算装置1000の観点で言えば、記憶性と再帰性を強化することにある。
演算装置2000に関する最も簡単な設定は入力信号をそのまま出力の一つとする方法である。演算装置2000における関数をfとすればx=f(x)になる。単純な方法であるが、使用する出力データ数が増えるのでリザバ・コンピューティングの特性を改善できる。
実施例1では係数w 決定の過程をリザバからの出力値z(t)の加工と表現した。この表現に合わせると、入力信号をそのまま出力の一つとする方法は「演算結果が加工される際に第1の訓練データも組み込んで加工する」と言える。
演算装置2000に関する上記の単純な使用法では、ある時刻tの入力x(t)はその時刻tのみで利用される。しかし、前述のようにリザバ演算装置1000には記憶性と再帰性があるので入力x(t)はt以降の時刻においても出力の一部に利用されることが好ましい。それを実現するひとつの方法はある時定数τで入力情報を継続させることである。
図12に示すように、例えば、時刻tの入力情報をx(t)、時刻tにおける出力情報をz(t)とすれば、z(t)=Σi≦kx(t)exp[-(t-t)/τ]とする。これにより入力情報がτ時間程度継続的に利用される。この継続的利用を言い換えれば「第1の訓練データが複数の時刻に亘って利用される」になる。
以上のように時定数τを利用すれば特性改善が見込めるが、このような手法では必ずしもスピンのダイナミクスを十分に反映していない。リザバ・コンピューティングの特性改善には演算装置2000からの出力を、スピンのダイナミクスを直接反映した量にすることが好ましい。
それを実現するひとつの方法としては局所場応答法と呼ばれる手法を利用することが挙げられる(例えば、WO2015/118639号公報、WO2016/157333号公報、WO2016/194221号公報、WO2017/183172号公報参照)。図13が演算装置2000に局所場応答法を利用した場合である。
局所場応答法の動作原理は以下に示す通りである。図13の振動子数6個に合わせて6個の2次元スピン変数(s ,s )と6個の有効磁場変数(B ,B )を定義する。
ここで、j=1,2,..,6である。B は図10における横磁場Bに対応する。B は、サイトi-j間のスピン間相互作用Jij、サイトjに作用する局所磁場gを用いて、B (t)=Σij (tk-1)+g(t)で与えることにする。ここで、サイト1が振動子201に対応し、g(t)=Σi≦kx(t)exp[-(t-t)/τ]とする。その他のサイトに対してはg(t)=0とする。
またJijは振動子201,202,…,206間の相互インダクタンスMに連動させて決定する。以上で定まった有効磁場変数(B ,B )を用いて各サイトのスピンをs (t)/s (t)=B (t)/B (t)として定める。時刻tのB (t)は時刻tk-1のs (tk-1)を用いて計算し、時刻tのs (t)は時刻tのB (t)を用いて計算することを繰り返すことになり、全サイトのs (t)が各時刻で求まる。ここで、時刻tは出力値を取り出す時刻を表す。前述のように入力の間隔よりも出力の間隔を小さく設定することが可能である。
この局所場応答法によるダイナミクスは、スピンモデルで考えたときの歳差運動の軸変化に関するダイナミクスに対応しており、本発明における振動子を用いたリザバ演算装置1000の性能改善に大きく寄与する。局所場応答法はスピン間の相互作用を元に時間発展させる手法であり、演算装置2000の立場で表現すれば「第1の訓練データを複数の時刻点間で相互作用させてから利用する」と言える。
以上の局所場応答演算は、演算装置2000として動作させることが可能である(例えば、WO2015/118639号公報、WO2016/157333号公報、WO2016/194221号公報、WO2017/183172号公報に記載されている構成を用いる)。しかし、局所場応答演算は、主記憶装置9001と一般演算装置9002間でデータをやり取りする一般演算として処理することも可能である。
また、局所場応答法に関してはその骨子のみを実施例5に記載したが、多くの改変が可能である(例えば、WO2015/118639号公報、WO2016/157333号公報、WO2016/194221号公報、WO2017/183172号公報参照)。
また、図11~図13は図3Aを基にしているが、図3Bや図3Cを基にすることも可能である。その際の変形は図3Aから図3Bや図3Cへの変形と同様である。
本発明ではリザバ演算装置1000に振動子を利用することにより優れた性能が得られることを述べてきた。これは量子リザバ・コンピューティングの問題点を解決すべく発明されたものである。最後に、本発明と量子力学の基本方程式との関連に言及する。
量子力学は、シュレディンガー方程式である以下の数1に従い時間発展する。
Figure 0007080806000001
数1の形式解は、以下の数2である。
Figure 0007080806000002
数2の指数関数の部分をオイラーの公式で書き換えれば、以下の数3になる。
Figure 0007080806000003
即ち、量子系は三角関数により時間発展する。本発明で着目したのはこの三角関数で時間発展することである。三角関数の時間発展は振動系で実現できる。量子系には確率的性質がありその性質を排除するために量子リザバ・コンピューティングではアボガドロ数個のリザバを用意しなければならなかったが、振動系を利用すれば1個のリザバだけで動作可能である。
実施例5では量子系をスピンモデルで考えた場合の本発明との関連性を述べた。これらの関連性及び数3に基づく議論から明らかなように、振動子からなるリザバ演算装置1000は量子リザバ演算装置と類似の動作をする。そのために、本発明は量子リザバ・コンピューティングと類似の特性を与えると共に、量子リザバ演算装置の課題を解決する。
100 入力部
201~208 振動子
300 出力部
1000 リザバ演算装置
2000 演算装置
9001 主記憶装置
9002 一般演算装置
9003 制御装置
9004 補助記憶装置
9005 入力装置
9006 出力装置

Claims (12)

  1. データを演算する一般演算装置と、
    前記データに対して学習を行うリザバ演算装置と、
    前記データを記憶する記憶装置と、
    前記記憶装置と前記一般演算装置との間及び前記記憶装置と前記リザバ演算装置との間で行う前記データのやり取りを制御する制御装置と、を有し、
    前記リザバ演算装置は、
    少なくとも一つの振動子と、
    入力部と、
    出力部と、を有し、
    前記入力部から入力された前記データを前記振動子により演算して前記出力部から出力し、
    前記少なくとも一つの振動子は、複数の振動子で構成され、
    前記リザバ演算装置は、
    前記入力部から入力された前記データを、前記振動子自身のダイナミクス及び前記振動子間の相互作用により演算して前記出力部から出力することを特徴とする機械学習装置。
  2. 前記記憶装置は、
    第1の訓練データと第2の訓練データの対を記憶し、
    前記制御装置は、
    前記記憶装置に記憶された前記第1の訓練データを前記入力部を介して前記振動子に送り、
    前記リザバ演算装置は、
    前記振動子により前記第1の訓練データを演算し、
    前記制御装置は、
    前記第1の訓練データの演算結果を前記出力部を介して前記記憶装置に送り、
    前記一般演算装置は、
    前記第1の訓練データの前記演算結果を、前記第2の訓練データが再現されるように加工し、
    前記記憶装置は、
    前記第2の訓練データの再現の際に得られた前記加工の規則を記憶し、
    前記リザバ演算装置一般のデータを演算し、前記一般演算装置が前記一般のデータの演算結果を前記加工の規則に基づいて加工して最終出力することを特徴とする請求項1に記載の機械学習装置。
  3. 前記振動子は、線形素子で構成されることを特徴とする請求項に記載の機械学習装置。
  4. 前記線形素子は、LCR回路で構成されることを特徴とする請求項に記載の機械学習装置。
  5. 前記振動子間の相互作用は、一対のコイルのカップリングにより実現されることを特徴とする請求項に記載の機械学習装置。
  6. 前記振動子間の相互作用は、振動子間で単一のコイルを共有することにより実現されることを特徴とする請求項に記載の機械学習装置。
  7. 前記振動子間の相互作用は、振動子間で単一のコンデンサを共有することにより実現されることを特徴とする請求項に記載の機械学習装置。
  8. 前記振動子は、前記線形素子としての前記LCR回路に非線形素子を付加して構成されることを特徴とする請求項に記載の機械学習装置。
  9. 前記非線形素子は、ジョセフソン接合で構成されることを特徴とする請求項に記載の機械学習装置。
  10. データを演算する一般演算装置と、
    前記データに対して学習を行うリザバ演算装置と、
    前記データを記憶する記憶装置と、
    前記記憶装置と前記一般演算装置との間及び前記記憶装置と前記リザバ演算装置との間で行う前記データのやり取りを制御する制御装置と、を有し、
    前記リザバ演算装置は、
    少なくとも一つの振動子と、
    入力部と、
    出力部と、を有し、
    前記入力部から入力された前記データを前記振動子により演算して前記出力部から出力し、
    前記記憶装置は、
    第1の訓練データと第2の訓練データの対を記憶し、
    前記制御装置は、
    前記記憶装置に記憶された前記第1の訓練データを前記入力部を介して前記振動子に送り、
    前記リザバ演算装置は、
    前記振動子により前記第1の訓練データを演算し、
    前記制御装置は、
    前記第1の訓練データの演算結果を前記出力部を介して前記記憶装置に送り、
    前記一般演算装置は、
    前記第1の訓練データの前記演算結果を、前記第2の訓練データが再現されるように加工し、
    前記記憶装置は、
    前記第2の訓練データの再現の際に得られた前記加工の規則を記憶し、
    前記リザバ演算装置は一般のデータを演算し、前記一般演算装置は前記一般のデータの演算結果を前記加工の規則に基づいて加工して出力し、
    前記一般演算装置はさらに、
    前記第2の訓練データが再現されるように前記第1の訓練データの前記演算結果を加工する際に、前記第1の訓練データを組み込んで実行することを特徴とする機械学習装置。
  11. データを演算する一般演算装置と、
    前記データに対して学習を行うリザバ演算装置と、
    前記データを記憶する記憶装置と、
    前記記憶装置と前記一般演算装置との間及び前記記憶装置と前記リザバ演算装置との間で行う前記データのやり取りを制御する制御装置と、を有し、
    前記リザバ演算装置は、
    少なくとも一つの振動子と、
    入力部と、
    出力部と、を有し、
    前記入力部から入力された前記データを前記振動子により演算して前記出力部から出力し、
    前記記憶装置は、
    第1の訓練データと第2の訓練データの対を記憶し、
    前記制御装置は、
    前記記憶装置に記憶された前記第1の訓練データを前記入力部を介して前記振動子に送り、
    前記リザバ演算装置は、
    前記振動子により前記第1の訓練データを演算し、
    前記制御装置は、
    前記第1の訓練データの演算結果を前記出力部を介して前記記憶装置に送り、
    前記一般演算装置は、
    前記第1の訓練データの前記演算結果を、前記第2の訓練データが再現されるように加工し、
    前記記憶装置は、
    前記第2の訓練データの再現の際に得られた前記加工の規則を記憶し、
    前記リザバ演算装置は一般のデータを演算し、前記一般演算装置は前記一般のデータの演算結果を前記加工の規則に基づいて加工して出力し、
    前記一般演算装置はさらに、
    前記第2の訓練データが再現されるように前記第1の訓練データの前記演算結果を加工する際に、前記第1の訓練データを複数の時刻に亘って組み込んで実行することを特徴とする機械学習装置。
  12. データを演算する一般演算装置と、
    前記データに対して学習を行うリザバ演算装置と、
    前記データを記憶する記憶装置と、
    前記記憶装置と前記一般演算装置との間及び前記記憶装置と前記リザバ演算装置との間で行う前記データのやり取りを制御する制御装置と、を有し、
    前記リザバ演算装置は、
    少なくとも一つの振動子と、
    入力部と、
    出力部と、を有し、
    前記入力部から入力された前記データを前記振動子により演算して前記出力部から出力し、
    前記記憶装置は、
    第1の訓練データと第2の訓練データの対を記憶し、
    前記制御装置は、
    前記記憶装置に記憶された前記第1の訓練データを前記入力部を介して前記振動子に送り、
    前記リザバ演算装置は、
    前記振動子により前記第1の訓練データを演算し、
    前記制御装置は、
    前記第1の訓練データの演算結果を前記出力部を介して前記記憶装置に送り、
    前記一般演算装置は、
    前記第1の訓練データの前記演算結果を、前記第2の訓練データが再現されるように加工し、
    前記記憶装置は、
    前記第2の訓練データの再現の際に得られた前記加工の規則を記憶し、
    前記リザバ演算装置は一般のデータを演算し、前記一般演算装置は前記一般のデータの演算結果を前記加工の規則に基づいて加工して出力し、
    前記第1の訓練データを複数の時刻点間に亘って相互作用させる局所場応答演算装置を更に有することを特徴とする機械学習装置。
JP2018223630A 2018-11-29 2018-11-29 機械学習装置 Active JP7080806B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018223630A JP7080806B2 (ja) 2018-11-29 2018-11-29 機械学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018223630A JP7080806B2 (ja) 2018-11-29 2018-11-29 機械学習装置

Publications (2)

Publication Number Publication Date
JP2020087189A JP2020087189A (ja) 2020-06-04
JP7080806B2 true JP7080806B2 (ja) 2022-06-06

Family

ID=70908427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018223630A Active JP7080806B2 (ja) 2018-11-29 2018-11-29 機械学習装置

Country Status (1)

Country Link
JP (1) JP7080806B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013518355A (ja) 2010-01-29 2013-05-20 サーキュラー ロジック リミテッド ライアビリティ カンパニー 勾配周波数非線形振動子ネットワークにおける学習及び聴覚情景解析
US20180285728A1 (en) 2017-04-03 2018-10-04 International Business Machines Corporation Reservoir computing system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6819320B2 (ja) * 2016-07-20 2021-01-27 株式会社リコー 情報処理システム、および情報処理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013518355A (ja) 2010-01-29 2013-05-20 サーキュラー ロジック リミテッド ライアビリティ カンパニー 勾配周波数非線形振動子ネットワークにおける学習及び聴覚情景解析
US20180285728A1 (en) 2017-04-03 2018-10-04 International Business Machines Corporation Reservoir computing system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
中野大樹 ほか,ハードウェアで実現するリザバーコンピューティング,平成30年 電気学会全国大会講演論文集,電気学会,2018年03月05日,pp.S16(13)-S16(16)

Also Published As

Publication number Publication date
JP2020087189A (ja) 2020-06-04

Similar Documents

Publication Publication Date Title
JP6910666B2 (ja) 量子制御のための制御シーケンスの生成
JP6875513B2 (ja) ロボットエージェントによって実行されるべきアクションを選択するためのニューラルネットワーク
Rahmani et al. A novel adaptive neural network integral sliding-mode control of a biped robot using bat algorithm
CN110546653B (zh) 使用管理者和工作者神经网络的用于强化学习的动作选择
US10860927B2 (en) Stacked convolutional long short-term memory for model-free reinforcement learning
KR20190077067A (ko) 강화 학습을 이용한 환경 네비게이션
CN112119409A (zh) 具有关系存储器的神经网络
JP6728495B2 (ja) 強化学習を用いた環境予測
EP3326114A1 (en) Continuous control with deep reinforcement learning
EP3559865A1 (en) Data-efficient reinforcement learning for continuous control tasks
CN110114784A (zh) 递归神经网络
Nowé et al. A gentle introduction to reinforcement learning
Bobade et al. Adaptive estimation for nonlinear systems using reproducing kernel Hilbert spaces
Ding et al. Vibration damping in manipulation of deformable linear objects using sliding mode control
CN112930541A (zh) 通过最小化妄想影响来确定控制策略
JP7080806B2 (ja) 機械学習装置
Glazier et al. Making human-like trade-offs in constrained environments by learning from demonstrations
US20200026247A1 (en) Continuous control of attention for a deep learning network
Subasri et al. Discrete direct adaptive ELM controller for active vibration control of nonlinear base isolation buildings
JP2021036395A (ja) 機械学習装置および機械学習方法
JP2017117427A (ja) 制御信号推定装置、擬似力覚発生装置、波形推定装置、制御信号推定方法、波形推定方法、およびプログラム
JP2021022231A (ja) 管理装置、管理方法、および管理プログラム
Censi Bootstrapping vehicles: a formal approach to unsupervised sensorimotor learning based on invariance
KR20220166716A (ko) 퓨샷 모방을 위한 시연 조건부 보강 학습
Oommen et al. A solution to the stochastic point location problem in metalevel nonstationary environments

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220525

R150 Certificate of patent or registration of utility model

Ref document number: 7080806

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150