WO2023062844A1

WO2023062844A1 - 情報処理装置

Info

Publication number: WO2023062844A1
Application number: PCT/JP2021/038325
Authority: WO
Inventors: 英治鈴木; 智生佐々木
Original assignee: Tdk株式会社
Priority date: 2021-10-15
Filing date: 2021-10-15
Publication date: 2023-04-20

Abstract

この情報処理装置は、入力層とレザバー層と出力層と評価回路と調整回路とを備える。レザバー層は、入力層に接続され、入力層から入力された第１信号の情報を含む特徴空間を生成する。出力層は、レザバー層に接続され、前記レザバー層から出力される第２信号に結合重みを印加する。評価回路は、前記出力層における結合重みの分布を求め、前記結合重みの分布が規定の分布であるか否かを評価する。調整回路は、前記結合重みの分布が前記規定の分布ではない場合に、前記第１信号を調整する調整パラメータを変更する。

Description

情報処理装置

　本発明は、情報処理装置に関する。

　ニューロモーフィックデバイスは、ニューラルネットワークを利用して人間の脳を模倣した素子である。ニューロモーフィックデバイスは、人間の脳におけるニューロンとシナプスとの関係を人工的に模倣している。

　ニューロモーフィックデバイスは、例えば、階層状に配置されたノード（脳におけるニューロン）と、これらの間を繋ぐ伝達手段（脳におけるシナプス）と、を有する。ニューロモーフィックデバイスは、伝達手段（シナプス）が学習することで、問題の正答率を高める。学習は将来使えそうな知識を情報から見つけることであり、ニューロモーフィックデバイスでは入力されたデータに重み付けをする。

　ニューラルネットワークの一つとして、リカレントニューラルネットワークが知られている。リカレントニューラルネットワークは、再帰的結合を内部に含み、時系列のデータを扱うことができる。時系列のデータは、時間の経過とともに値が変化するデータであり、株価等はその一例である。リカレントニューラルネットワークは、内部に非線形な活性化部を持つことも可能である。活性化部での処理は数学的には非線形空間への射影とみなすことができる。データを非線形空間へ射影することで、リカレントニューラルネットワークは、時系列信号が持つ複雑な信号変化の特徴を抽出することができる。後段の階層のニューロンでの処理結果を前段の階層のニューロンに戻すことで、リカレントニューラルネットワークは再帰的な処理を実現できる。リカレントニューラルネットワークは、再帰的な処理を行うことで、時系列のデータの背景にあるルールや支配要因を獲得することができる。

　レザバーコンピューティングは、再帰的結合と非線形活性化関数を含むリカレントニューラルネットワークの一種である（例えば、非特許文献１）。レザバーコンピューティングは、リキッドステートマシンの実装手法として発展したニューラルネットワークである。

　レザバーコンピューティングは、レザバー層を有する。ここでいう「層」とは概念的な層であり、物理構造物として層が形成されている必要はない。レザバー層は、多数の非線形ノードとノード間の再帰的結合を含むグラフ構造をなす。レザバーコンピューティングは、人間の脳のニューロン結合をレザバー層が模倣し、干渉状態の遷移として状態を表現する。

　レザバーコンピューティングの特徴の一つは、レザバー層が学習対象でないという点である。レザバーコンピューティングは、学習に必要な計算機資源が少ないため、ハードウェア資源に制約があるＩｏＴ（Internet of Things）や、エッジでの時系列信号を取り扱うシステムとして注目されている。

U. Ozertem, D. Erdogmus, and I. Santamaria, Detection of nonlinearly distorted signals using mutual information, European Signal Processing Conference. IEEE, 2005.

　教師データに対するレザバーコンピューティングからの出力値のフィッテイング精度は、パラメータ設定に応じて変動する。レザバーコンピューティングのパラメータの体系的な設計方法は、まだ確立されていない。

　本発明は上記事情に鑑みてなされたものであり、正答率の高い情報処理装置を提供することを目的とする。

（１）第１の態様にかかる情報処理装置は、入力層とレザバー層と出力層と評価回路と調整回路とを備える。レザバー層は、入力層に接続され、入力層から入力された第１信号の情報を含む特徴空間を生成する。出力層は、レザバー層に接続され、前記レザバー層から出力される第２信号に結合重みを印加する。評価回路は、前記出力層における結合重みの分布を求め、前記結合重みの分布が規定の分布であるか否かを評価する。調整回路は、前記結合重みの分布が前記規定の分布ではない場合に、前記第１信号を調整する調整パラメータを変更する。

（２）上記態様にかかる情報処理装置において、前記規定の分布は、正規分布でもよい。

（３）上記態様にかかる情報処理装置において、前記評価回路は、前記第２信号に印加する結合重みを更新する際に、更新前後のそれぞれの結合重みの変化量が閾値以下の場合に、前記結合重みの分布が規定の分布であるか否かを評価してもよい。

（４）上記態様にかかる情報処理装置において、前記調整回路は、前記調整パラメータの変更回数が規定回数に達すると、これまで変更した調整パラメータのうち最適な調整パラメータを選択してもよい。

（５）上記態様にかかる情報処理装置において、前記調整パラメータは、前記入力層に印加される入力信号に乗算する結合重みでもよい。

（６）上記態様にかかる情報処理装置において、前記調整パラメータは、前記入力層に印加される入力信号を構成する周波数成分を選択的に通過させるフィルタのフィルタ係数でもよい。

（７）上記態様にかかる情報処理装置において、前記調整パラメータの分布は正規分布でもよい。

（８）上記態様にかかる情報処理装置において、前記調整パラメータの分布は、一様分布でもよい。

　上記態様にかかる情報処理装置は、正答率が高い。

第１実施形態にかかる情報処理装置の概念図である。結合重みの分布の一例である。第１実施形態にかかる情報処理装置のフロー図である。

　以下、本実施形態について、図を適宜参照しながら詳細に説明する。以下の説明で用いる図面は、特徴をわかりやすくするために便宜上特徴となる部分を拡大して示している場合があり、各構成要素の寸法比率などは実際とは異なっていることがある。以下の説明において例示される材料、寸法等は一例であって、本発明はそれらに限定されるものではなく、本発明の効果を奏する範囲で適宜変更して実施することが可能である。

　図１は、第１実施形態にかかる情報処理装置１００の概念図である。情報処理装置１００は、リザバーコンピューティングを実現するリザバーデバイスである。情報処理装置１００は、リザバーコンピューティングをソフトウェアで実現する装置でも、リザバーコンピューティングの概念を物理デバイス（ハードウェア）に実装した装置でもよい。

　情報処理装置１００は、例えば、入力層１０とレザバー層２０と出力層３０と評価回路４０と調整回路５０と比較回路６０と指示回路７０とを備える。情報処理装置１００は、タスクに対する正答率を高める学習と学習結果に基づきタスクに対する回答を出力する演算（推論）のそれぞれを行うことができる。評価回路４０、調整回路５０、比較回路６０及び指示回路７０は、学習段階で使用され、演算（推論）段階では不要である。

　入力層１０には、入力信号Ｓｉｎ_１～Ｓｉｎ_ｎが入力される。入力信号Ｓｉｎ_１～Ｓｉｎ_ｎの数は問わず、ｎは自然数である。

　入力層１０は、例えば、単層又は多層のパーセプトロンである。入力層１０に入力された入力信号Ｓｉｎ_１～Ｓｉｎ_ｎは、第１信号Ｓ１_１～Ｓ１_ｎに変換される。第１信号Ｓ１_１～Ｓ１_ｎは問わず、ｎは自然数である。第１信号Ｓ１_１～Ｓ１_ｎの数は、入力信号Ｓｉｎ_１～Ｓｉｎ_ｎの数と同じでも異なってもよい。入力信号Ｓｉｎ_１～Ｓｉｎ_ｎから第１信号Ｓ１_１～Ｓ１_ｎへの信号の変換は、調整パラメータによって調整される。

　入力層１０は、例えば、フィルタ１１とバイアス印加部１２とを備える。フィルタ１１は、例えば、入力信号Ｓｉｎ_１～Ｓｉｎ_ｎをシグナルとノイズに区分する。シグナルとノイズの割合は、例えば、フィルタ係数ｆ_１～ｆ_ｎによって決まる。フィルタ係数ｆ_１～ｆ_ｎは、調整パラメータの一つである。フィルタ１１は、例えば、入力信号Ｓｉｎ_１～Ｓｉｎ_ｎのそれぞれに対して設けられている。

　それぞれの入力信号Ｓｉｎ_１～Ｓｉｎ_ｎに対するフィルタ係数ｆ_１～ｆ_ｎのそれぞれは、同じでも異なっていてもよい。フィルタ係数ｆ_１～ｆ_ｎは、例えば、横軸をフィルタ係数の値、縦軸を特定の値のフィルタ係数の数としてプロットした際に分布を示してもよい。フィルタ係数ｆ_１～ｆ_ｎの分布は、例えば、正規分布、一様分布、ラプラス分布等である。

　バイアス印加部１２は、入力信号Ｓｉｎ_１～Ｓｉｎ_ｎに結合重みｗａ_１～ｗａ_ｎを印加する。入力信号Ｓｉｎ_１～Ｓｉｎ_ｎのそれぞれには、結合重みｗａ_１～ｗａ_ｎのそれぞれが印加される。バイアス印加部１２は、入力信号Ｓｉｎ_１～Ｓｉｎ_ｎのそれぞれに結合重みｗａ_１～ｗａ_ｎを掛け合わせる積演算を行う。結合重みｗａ_１～ｗａ_ｎは、調整パラメータの一つである。

　結合重みｗａ_１～ｗａ_ｎのそれぞれは同じでも異なってもよい。結合重みｗａ_１～ｗａ_ｎは、例えば、横軸を結合重みの値、縦軸を特定の値の結合重みの数としてプロットした際に分布を示してもよい。結合重みｗａ_１～ｗａ_ｎの分布は、例えば、正規分布、一様分布、ラプラス分布等である。図２は、結合重みｗａ_１～ｗａ_ｎの分布の一例である。図２は、結合重みｗａ_１～ｗａ_ｎが正規分布を示す例である。

　リザバーコンピューティングの概念を物理デバイス（ハードウェア）に実装した一例において、結合重みｗａ_１～ｗａ_ｎは、例えば、伝搬する波の振幅、振動数、位相等である。波は、振動により生じるものであればよく、例えば、電磁場、磁場、スピン波、弾性波である。またリザバーコンピューティングの概念を物理デバイス（ハードウェア）に実装した別の例において、結合重みｗａ_１～ｗａ_ｎは、可変抵抗の抵抗値である。可変抵抗は、例えば、メモリスタと言われる抵抗変化型素子である。例えば、磁壁の位置で抵抗値が変化する磁壁移動型の磁気抵抗効果素子は、メモリスタの一例である。

　フィルタ係数ｆ_１～ｆ_ｎ及び結合重みｗａ_１～ｗａ_ｎは、学習段階では変動する。一方で、フィルタ係数ｆ_１～ｆ_ｎ及び結合重みｗａ_１～ｗａ_ｎは、演算（推論）段階では、学習段階におけるタスクに合わせた学習結果に基づいて固定される。

　レザバー層２０は、複数のノード２１を備える。ノード２１の数は、特に問わない。ノード２１の数が多いほど、レザバー層２０の表現力は高まる。例えば、ノード２１の数をｉ個とする。ｉは任意の自然数である。

　リザバーコンピューティングの概念を物理デバイス（ハードウェア）に実装した場合、ノード２１のそれぞれは、例えば、物理素子で代用される。物理素子は、例えば、入力された信号を振動、電磁場、磁場、スピン波等に変換できるデバイスである。ノード２１は、例えば、ＭＥＭＳマイクロフォンである。ＭＥＭＳマイクロフォンは、振動膜の振動と電気信号とを変換できる。ノード２１は、例えば、スピントルクオシレータ（ＳＴＯ）でもよい。スピントルクオシレータは、電気信号と高周波信号とを変換できる。またノード２１は、入力信号の電位の変化に対して出力状態がヒステリシスを持って変化するヒステリシス回路を有するシュミットトリガー回路やそのほかの非線形的な応答特性をもつオペアンプ等でもよい。ノード２１は、メモリスタでもよい。

　それぞれのノード２１からの信号は、周囲のノード２１からの信号と相互作用している。それぞれのノード２１の間には、例えば、結合重みｗｂ_ｍが設定されている。結合重みｗｂ_ｍの数は、ノード２１間の接続の組み合わせの数だけある。ｍは、例えば、任意の自然数である。ノード２１の間の結合重みｗｂ_ｍのそれぞれは、原則、固定されており、学習により変動するものではない。ノード２１の間の結合重みｗｂ_ｍのそれぞれは、任意であり、互いに一致していても、異なっていてもよい。複数のノード２１の間の結合重みｗｂ_ｍの一部は、学習により変動してもよい。

　リザバーコンピューティングの概念を物理デバイス（ハードウェア）に実装した一例において、結合重みｗｂ_ｍは、例えば、伝搬する波の振幅、振動数、位相等である。また結合重みｗｂ_ｍは、可変抵抗の抵抗値でもよい。

　レザバー層２０には、第１信号Ｓ１_１～Ｓ１_ｎが入力される。第1信号Ｓ１_１～Ｓ１_ｎは、レザバー層２０内で複数のノード２１間を伝搬しながら、相互作用する。第１信号Ｓ１_１～Ｓ１_ｎが相互作用するとは、あるノード２１に伝搬した信号が他のノード２１を伝搬する信号に影響を及ぼすことをいう。例えば、第１信号Ｓ１_１～Ｓ１_ｎは、ノード２１間を伝搬する際に結合重みｗｂ_ｍが印加され、変化していく。レザバー層２０は、入力された第１信号Ｓ１_１～Ｓ１_ｎを多次元の非線形空間に射影する。

　第１信号Ｓ１_１～Ｓ１_ｎが複数のノード２１間を伝搬することで、レザバー層２０は、レザバー層２０に入力された第１信号Ｓ１_１～Ｓ１_ｎの情報を含む特徴空間を生成する。レザバー層２０内おいて、入力された第１信号Ｓ１_１～Ｓ１_ｎは、第２信号Ｓ２_１～Ｓ２_ｉに変換される。ｉは、例えば、任意の自然数であり、ｎと一致していても異なっていてもよい。第２信号Ｓ２_１～Ｓ２_ｉは、第１信号Ｓ１_１～Ｓ１_ｎに含まれる情報の少なくとも一部を、形を変えて保有する。例えば、第１信号Ｓ１_１～Ｓ１_ｎは、レザバー層２０内において非線形に変化し、第２信号Ｓ２_１～Ｓ２_ｉになる。第１信号Ｓ１_１～Ｓ１_ｎがレザバー層２０内で相互作用することで、レザバー層２０の系の状態は、時間の経過とともに変化する。

　出力層３０には、レザバー層２０から信号が送られる。レザバー層２０から出力された第２信号Ｓ２_１～Ｓ２_ｉは、出力層３０に入力される。

　出力層３０は、例えば、バイアス印加部３１と和演算回路３２と活性化関数回路３３とを備える。

　バイアス印加部３１は、第２信号Ｓ２_１～Ｓ２_ｉに結合重みｗｃ_１～ｗｃ_ｉを印加する。第２信号Ｓ２_１～Ｓ２_ｉのそれぞれには、結合重みｗｃ_１～ｗｃ_ｉがそれぞれ印加される。バイアス印加部３１は、第２信号Ｓ２_１～Ｓ２_ｉのそれぞれに結合重みｗｃ_１～ｗｃ_ｉを掛け合わせる積演算を行う。

　結合重みｗｃ_１～ｗｃ_ｉのそれぞれは同じでも異なってもよい。結合重みｗｃ_１～ｗｃ_ｉは、例えば、横軸を結合重みの値、縦軸を特定の値の結合重みの数としてプロットした際に分布を示す。結合重みｗｃ_１～ｗｃ_ｉの分布は、タスクに基づいて決定される。結合重みｗｃ_１～ｗｃ_ｉの分布は、例えば、正規分布、一様分布、ラプラス分布等である。

　結合重みｗｃ_１～ｗｃ_ｉは、学習段階では変動する。一方で、結合重みｗｃ_１～ｗｃ_ｉは、演算（推論）段階では、学習段階におけるタスクに合わせた学習結果に基づいて固定される。

　リザバーコンピューティングの概念を物理デバイス（ハードウェア）に実装した一例において、結合重みｗｃ_１～ｗｃ_ｉは、例えば、伝搬する波の振幅、振動数、位相等である。波は、振動により生じるものであればよく、例えば、電磁場、磁場、スピン波、弾性波である。またリザバーコンピューティングの概念を物理デバイス（ハードウェア）に実装した別の例において、結合重みｗｃ_１～ｗｃ_ｉは、可変抵抗の抵抗値である。

　和演算回路３２は、第２信号Ｓ２_１～Ｓ２_ｉのそれぞれに結合重みｗｃ_１～ｗｃ_ｉを乗算した結果を和算する。和演算回路３２は、第２信号Ｓ２_１～Ｓ２_ｉのそれぞれに結合重みｗｃ_１～ｗｃ_ｉを乗算した結果の全てを和算してもよいし、一部を和算してもよい。和演算回路３２から出力される結果は、図１に示すように一つでもよいし、複数でもよい。例えば、波を利用して信号を伝搬する場合は、和演算回路３２で波を合流させる。例えば、電流を利用して信号を伝搬する場合は、和演算回路３２で配線をまとめ、電流を合流させる。

　活性化関数回路３３は、積和演算結果を活性化関数ｆ（ｘ）に代入して演算する。活性化関数回路３３は、積和演算結果を非線形に変換する。活性化関数回路３３は、なくてもよい。

　学習段階において、出力層３０からの出力信号Ｓ_ｏｕｔは、比較回路６０に送られる。演算（推論）段階において、出力層３０からの出力信号Ｓ_ｏｕｔは、回答として外部に出力される。出力信号Ｓ_ｏｕｔは一つに限られない。例えば、情報処理装置１００が一般的な機械学習の応用である多クラス分類問題等に対応する場合、出力層３０は各クラスに対応する複数の出力信号Ｓ_ｏｕｔを出力する。

　比較回路６０は、出力信号Ｓ_ｏｕｔを教師データｔと比較する。比較回路６０は、例えば、出力信号Ｓ_ｏｕｔと教師データｔとの相互情報量を比較する。相互情報量は、２つの確率変数の相互依存の尺度を表す量である。比較回路６０は、指示回路７０に比較結果を送信する。

　指示回路７０は、比較回路６０に基づいて、バイアス印加部３１に指示を送る。指示回路７０の指示に基づいて、バイアス印加部３１は結合重みｗｃ_１～ｗｃ_ｉを更新する。結合重みｗｃ_１～ｗｃ_ｉが変化すると、出力層３０からの出力信号Ｓ_ｏｕｔが変化する。指示回路７０は、出力信号Ｓ_ｏｕｔを教師データｔとの相互情報量が大きくなる（最大化する）ように、バイアス印加部３１に情報をフィードバックする。結合重みｗｃ_１～ｗｃ_ｉは、フィードバックされたデータに基づいて変化する。

　評価回路４０は、出力層３０における結合重みｗｃ_１～ｗｃ_ｉの分布を求め、結合重みｗｃ_１～ｗｃ_ｉの分布が規定の分布であるか否かを評価する。評価回路４０は、学習段階において、結合重みｗｃ_１～ｗｃ_ｉを更新する毎に、上記の評価を行ってもよいし、所定のルールに基づいて上記評価を行ってもよい。評価回路４０は、更新前後の結合重みｗｃ_１～ｗｃ_ｉの差を求めてもよい。

　結合重みｗｃ_１～ｗｃ_ｉの分布は、例えば、バイアス印加部３１に基準信号を印加することで求められる。例えば、第２信号Ｓ２_１～Ｓ２_ｉがバイアス印加部３１に至るまでの間にスイッチを設け、第２信号Ｓ２_１～Ｓ２_ｉと基準信号とを切り替え可能としてもよい。第２信号Ｓ２_１～Ｓ２_ｉの代わりに、値が一定の基準信号を入力することで、結合重みｗｃ_１～ｗｃ_ｉを抽出できる。基準信号は、例えば、評価回路４０から出力される。また例えば、結合重みｗｃ_１～ｗｃ_ｉがメモリスタの抵抗値の場合は、それぞれのメモリスタに基準電流を印加することで、それぞれのメモリスタの抵抗値（結合重みｗｃ_１～ｗｃ_ｉ）を求めてもよい。

　調整回路５０は、評価回路４０での評価結果に基づいて、第１信号Ｓ１_１～Ｓ１_ｎを調整する。調整回路５０は、例えば、結合重みｗｃ_１～ｗｃ_ｉの分布が規定の分布ではない場合に、入力層１０の調整パラメータを変更する。調整パラメータは、例えば、フィルタ係数ｆ_１～ｆ_ｎ、結合重みｗａ_１～ｗａ_ｎである。調整パラメータが変更されると、入力信号Ｓｉｎ_１～Ｓｉｎ_ｎから第１信号Ｓ１_１～Ｓ１_ｎへの信号の変換のルールが変化し、第１信号Ｓ１_１～Ｓ１_ｎが変化する。また調整回路５０は、調整パラメータの変更回数をカウントしてもよい。

　評価回路４０、調整回路５０、比較回路６０及び指示回路７０は、学習段階で動作し、演算（推論）段階では動作しない。

　評価回路４０、調整回路５０、比較回路６０及び指示回路７０はそれぞれ、例えば、ＣＰＵ等のプロセッサーとメモリーとを有する。評価回路４０、調整回路５０、比較回路６０及び指示回路７０のそれぞれは、プロセッサーがプログラムを実行することによって、動作する。プロセッサーは、それぞれの回路に動作を指示し、メモリーはプログラムや過去の結果を記録する。

　これらの回路の動作の全て又は一部は、ＡＳＩＣ（Application Specific Integrated Circuit）やＰＬＤ（Programmable Logic Device）やＦＰＧＡ（Field Programmable Gate Array）等のハードウェアを用いて実現されても良い。上記のプログラムは、コンピュータ読み取り可能な記録媒体に記録されても良い。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ、半導体記憶装置（例えばＳＳＤ：Solid State Drive）等の可搬媒体、コンピュータシステムに内蔵されるハードディスクや半導体記憶装置等の記憶装置である。上記のプログラムは、電気通信回線を介して送信されても良い。

　図３は、第１実施形態にかかる情報処理装置１００のフロー図である。情報処理装置１００は、学習段階において、図３に示すフロー図に従って動作する。

　情報処理装置１００は、入力信号Ｓｉｎ_１～Ｓｉｎ_ｎが入力されると、出力信号Ｓ_ｏｕｔを出力する。情報処理装置１００は、出力層３０の結合重みｗｃ_１～ｗｃ_ｉ、入力層１０の調整パラメータを変更しながら、教師データｔと出力信号Ｓ_ｏｕｔを比較する。教師データｔと出力信号Ｓ_ｏｕｔとの相互情報量が十分大きくなる（タスクに対する正答率が十分高くなる）ことで、学習は終了する。

　まず学習工程において、第１工程Ｓ１を行う。第１工程Ｓ１では、比較回路６０での比較結果が不十分な場合（タスクに対する正答率が不十分な場合）に、出力層３０の結合重みｗｃ_１～ｗｃ_ｉを更新する。出力層３０の結合重みｗｃ_１～ｗｃ_ｉは、指示回路７０からバイアス印加部３１への指示に基づいて変更する。例えば、第１工程Ｓ１は複数回行われ、結合重みｗｃ_１～ｗｃ_ｉはその度に更新される。

　次いで、第２工程Ｓ２を行う。第２工程Ｓ２では、更新前後の結合重みｗｃ_１～ｗｃ_ｉの変化量Ｄを測定する。結合重みｗｃ_１～ｗｃ_ｉの変化量Ｄは、例えば、評価回路４０で測定する。

　第２工程Ｓ２では、更新前後の結合重みｗｃ_１～ｗｃ_ｉの変化量Ｄが、それぞれ閾値Δ以下となっているかを判定する。更新前後の結合重みｗｃ_１～ｗｃ_ｉの変化量Ｄがそれぞれ閾値Δ以下であれば、出力層３０からの出力信号Ｓ_ｏｕｔは収束している。更新前後の結合重みｗｃ_１～ｗｃ_ｉの変化量Ｄが閾値Δ以下の場合は、第３工程Ｓ３に進む。結合重みｗｃ_１～ｗｃ_ｉそれぞれの閾値Δは、それぞれ別々に設定されてもよい。結合重みｗｃ_１～ｗｃ_ｉの変化量Ｄが閾値Δより大きく、出力層３０からの出力信号Ｓ_ｏｕｔが発散する場合は、再度、第１工程Ｓ１に戻り、結合重みｗｃ_１～ｗｃ_ｉを更新する。

　第３工程Ｓ３では、出力層３０における結合重みｗｃ_１～ｗｃ_ｉの分布を求める。結合重みｗｃ_１～ｗｃ_ｉの分布は、評価回路４０で求める。結合重みｗｃ_１～ｗｃ_ｉの分布は、横軸を結合重みの値、縦軸を特定の値の結合重みの数としてプロットすることで、求められる。それぞれの結合重みｗｃ_１～ｗｃ_ｉの値は、例えば、上述のように基準信号を入力することで求められる。

　そして、結合重みｗｃ_１～ｗｃ_ｉの分布が、既定の分布に該当するかを評価する。既定の分布は、例えば、例えば、正規分布、一様分布、ラプラス分布等である。規定の分布は、情報処理装置１００に与えられたタスクに応じて異なる。既定の分布は、タスクが決定された時点で決定され、評価回路４０に記憶される。

　例えば、既定の分布が正規分布の場合は、例えば、コルモゴロフ・スミノルフ検定、シャピロ・ウィルク検定に基づいて判断される。結合重みｗｃ_１～ｗｃ_ｉの分布のＰ値が０．０５未満の場合は、結合重みｗｃ_１～ｗｃ_ｉの分布は正規分布ではないと判断できる。

　結合重みｗｃ_１～ｗｃ_ｉの分布が既定の分布に該当する場合は、第４工程Ｓ４に至り、入力層１０の調整パラメータを決定する。入力層１０の調整パラメータが決定された後に、情報処理装置１００が十分な正答率を示す場合は、学習を終了する。入力層１０の調整パラメータを決定後にも、情報処理装置１００が十分な正答率を示さない場合は、再度、第１工程Ｓ１に戻り、出力層３０の結合重みｗｃ_１～ｗｃ_ｉを更新する。

　これに対し、結合重みｗｃ_１～ｗｃ_ｉの分布が既定の分布に該当しない場合は、第５工程Ｓ５に至る。第５工程Ｓ５では、調整パラメータの変更回数が規定回数以上であるかを判断する。調整回路５０は、調整パラメータの変更回数をカウントする。規定回数は、情報処理装置１００のタスク、正答の精度、計算負荷等に応じて、適宜決定される。規定回数は、調整回路５０に記憶されている。

　調整パラメータの変更回数が規定回数未満の場合は、第６工程Ｓ６に至り、入力層１０の調整パラメータを変更する。調整パラメータの変更は、調整回路５０が行う。調整回路５０は、例えば、フィルタ係数ｆ_１～ｆ_ｎを変更する。調整回路５０は、例えば、結合重みｗａ_１～ｗａ_ｎを変更してもよい。また調整回路５０は、フィルタ係数ｆ_１～ｆ_ｎと結合重みｗａ_１～ｗａ_ｎを両方変更してもよい。

　調整回路５０は、例えば、入力層１０の調整パラメータの分布を正規分布にする。調整回路５０による調整パラメータの変更が複数回に亘る場合は、正規分布を基準に、平均又は分散を変更する。

　例えば、調整回路５０による調整パラメータの調整が１回目の場合は、調整パラメータの分布を平均が０、分散が１の正規分布とする。そして、調整回路５０による調整パラメータの調整が２回目以降の場合は、分散が大きくなるように調整パラメータの分布を変更していく。例えば、調整パラメータの調整がｎ回目の場合は、ｎ－１回目の分散値に対して１０％だけ分散値を大きくする。

　また調整回路５０は、例えば、入力層１０の調整パラメータの分布を、一定の乱数幅を有する一様分布にしてもよい。調整回路５０による調整パラメータの変更が複数回に亘る場合は、乱数幅を変更する。

　例えば、調整回路５０による調整パラメータの調整が１回目の場合は、調整パラメータの分布を乱数幅が±０．１の一様分布とする。そして、調整回路５０による調整パラメータの調整が２回目以降の場合は、乱数幅が大きくなるように調整パラメータの分布を変更していく。例えば、調整パラメータの調整がｎ回目の場合は、乱数幅が±０．１×ｎの一様分布とする。

　これに対し、調整パラメータの変更回数が規定回数以上の場合は、これ以上の入力層１０の調整パラメータの変更を行わない。調整パラメータの変更回数が規定回数以上の場合は、第７工程Ｓ７に至る。第７工程Ｓ７では、入力層１０の調整パラメータとして、これまで変更した調整パラメータのうち最適な調整パラメータを選択する。これまでの変更履歴において、最も正答率が高い時の調整パラメータを最適な調整パラメータとする。

　上記の手順で、情報処理装置１００は、出力層３０の結合重みｗｃ_１～ｗｃ_ｉ、入力層１０の調整パラメータを決定し、学習を終了する。演算（推論）段階では、情報処理装置１００は、学習段階で決定された出力層３０の結合重みｗｃ_１～ｗｃ_ｉ、入力層１０の調整パラメータで、演算を行う。

　ここでは、情報処理装置１００の処理フローの一例を示したが、処理フローはこの例に限られない。例えば、結合重みｗｃ_１～ｗｃ_ｉを更新する毎に結合重みｗｃ_１～ｗｃ_ｉの分布を評価する場合は、第２工程Ｓ２を行わなくてもよい。また調整パラメータの変更回数の上限を設定しない場合は、第５工程Ｓ５及び第７工程Ｓ７を行わなくてもよい。

　本実施形態に係る情報処理装置１００は、出力層３０の結合重みｗｃ_１～ｗｃ_ｉの分布に基づいて、入力層１０の調整パラメータを調整する。情報処理装置１００は、入力層１０の調整パラメータも調整することで、タスクに対する正答率をより高めることができる。

１０…入力層、１１…フィルタ、１２，３１…バイアス印加部、２０…レザバー層、２１…ノード、３０…出力層、３２…和演算回路、３３…活性化関数回路、４０…評価回路、５０…調整回路、６０…比較回路、７０…指示回路、１００…情報処理装置、ｆ_１～ｆ_ｎ…フィルタ係数、Ｓｉｎ_１～Ｓｉｎ_ｎ…入力信号、Ｓ１_１～Ｓ１_ｎ…第１信号、Ｓ２_１～Ｓ２_ｉ…第２信号、ｗａ_１～ｗａ_ｎ，ｗｃ_１～ｗｃ_i…結合重み

Claims

　入力層と、
　前記入力層に接続され、前記入力層から入力された第１信号の情報を含む特徴空間を生成するレザバー層と、
　前記レザバー層に接続され、前記レザバー層から出力される第２信号に結合重みを印加する出力層と、
　前記出力層における結合重みの分布を求め、前記結合重みの分布が規定の分布であるか否かを評価する評価回路と、
　前記結合重みの分布が前記規定の分布ではない場合に、前記第１信号を調整する調整パラメータを変更する調整回路と、を備える、情報処理装置。
　前記規定の分布は、正規分布である、請求項１に記載の情報処理装置。
　前記評価回路は、前記第２信号に印加する結合重みを更新する際に、更新前後の結合重みの変化量が閾値以下の場合に、前記結合重みの分布が規定の分布であるか否かを評価する、請求項１又は２に記載の情報処理装置。
　前記調整回路は、前記調整パラメータの変更回数が規定回数に達すると、これまで変更した調整パラメータのうち最適な調整パラメータを選択する、請求項１～３のいずれか一項に記載の情報処理装置。
　前記調整パラメータは、前記入力層に印加される入力信号に乗算する結合重みである、請求項１～４のいずれか一項に記載の情報処理装置。
　前記調整パラメータは、前記入力層に印加される入力信号を構成する周波数成分を選択的に通過させるフィルタのフィルタ係数である、請求項１～５のいずれか一項に記載の情報処理装置。
　前記調整パラメータの分布が、正規分布である、請求項１～６のいずれか一項に記載の情報処理装置。
　前記調整パラメータの分布が、一様分布である、請求項１～６のいずれか一項に記載の情報処理装置。