JP2009053782A

JP2009053782A - データ処理装置、データ処理方法、及びプログラム

Info

Publication number: JP2009053782A
Application number: JP2007217831A
Authority: JP
Inventors: Katsuki Minamino; 活樹南野; Kazumi Aoyama; 一美青山; Yukiko Yoshiike; 由紀子吉池; Hideki Shimomura; 秀樹下村
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2007-08-24
Filing date: 2007-08-24
Publication date: 2009-03-12

Abstract

【課題】多数のダイナミクスを効率的に学習する。
【解決手段】ダイナミクス記憶ネットワークは、複数のノードによって構成され、ダイナミクスを１つのノードに保持する。媒介信号供給部１４は、ダイナミクス記憶ネットワーク処理部１３と１５それぞれのダイナミクス記憶ネットワークである下位階層ネットワークと上位階層ネットワークとの間を媒介するための媒介信号を、ダイナミクス記憶ネットワーク処理部１３と１５に供給する。ダイナミクス記憶ネットワーク処理部１３と１５それぞれの学習部２１と３１は、媒介信号を含む時系列データに基づき、下位階層ネットワーク及び上位階層ネットワークの各ダイナミクスを自己組織的に更新する。本発明は、例えば、自律型ロボット等に適用できる。
【選択図】図１

Description

本発明は、データ処理装置、データ処理方法、及びプログラムに関し、特に、例えば、多数のダイナミクスを効率的に学習し、その学習結果を利用して、データの認識や生成を行うことができるようにするデータ処理装置、データ処理方法、及びプログラムに関する。

例えば、自律的に行動する自律型ロボット等の自律エージェントは、様々なセンサ信号に基づいて、どのように振る舞うべきか、つまり、とるべき行動を決定し、その行動に応じたモータ信号を生成することで、自律的に行動する。

ここで、センサ信号とは、例えば、カメラが、センシングとしての撮像を行うことで出力する画像信号や、マイク（マイクロフォン）が、センシングとしての集音を行うことで出力する音声信号等である。また、モータ信号とは、例えば、自律エージェントの腕や脚等を駆動するモータに与えられる信号や、音声合成装置に対して与えられる、音声合成に必要な信号等である。

自律エージェントは、とるべき行動を決定するときに、センサ信号に基づいて、周囲の状態（例えば、何らかの物体がある位置等）や、自律エージェントの状態（例えば、腕や脚の状態等）等の状況を認識する。この、状況を認識することを、以下、適宜、認知ともいう。

また、自律エージェントは、認知（認識）の結果に基づき、とるべき行動を決定し、その行動に応じたモータ信号を生成する。このモータ信号が、自律エージェントの腕や脚等を駆動するモータに与えられることで、自律エージェントは、腕や脚等を動かす行動をとる。

ここで、以下、適宜、とるべき行動に応じたモータ信号を生成することを、単に、行動ともいう。

また、以下、適宜、状況を認識し、その認識結果に基づき、とるべき行動を決定して、その行動に応じたモータ信号を生成する認識生成、つまり、認知を行い、その認知の結果に基づき、行動することを、認知行動ともいい、認知行動をモデル化した計算モデルを、認知行動モデルという。

自律エージェントの認知行動は、時間発展法則により定められる力学系（dynamical systems）として記述することができ、様々な行動はその力学系が持つ特定のアトラクタダイナミクス（attractor dynamics）によって実現できることが知られている。例えば、人を模した二足型ロボットの歩行運動は、系の運動状態が様々な初期状態からある特定の周期軌道に落ち着くことを特徴とするリミットサイクルダイナミクス（limit cycle dynamics）として記述することができる（例えば、非特許文献１や２を参照）。

また、自律エージェントとしての、例えば、アームロボットがある対象物に対して手先を伸ばすようなリーチング運動は、様々な初期状態からある特定の固定点に落ち着くことを特徴とする不動点ダイナミクス（fixed-point dynamics）として記述することができる。さらに、全ての運動は、不動点ダイナミクスで実現可能な離散運動（discrete movement）とリミットサイクルダイナミクスで実現可能な周期運動（cyclic movement）の組み合わせにより実現できるとも言われている。

アトラクタダイナミクスによって自律エージェントの行動（運動）を制御する場合、まず、タスクに応じたアトラクタダイナミクスをどのように構成するのかが問題となる。次に、センサ信号を通じて得た情報に基づいて、アトラクタダイナミクスに従いながら、対応するモータ信号をどのように生成するかが問題となる。これらの問題を解決する上で、自律エージェントが環境と連続的に相互作用するかたちで行動出力（運動出力）を生成しながら、アトラクタダイナミクスを構成することが必要となる。

アトラクタダイナミクスを構成する認知行動モデルとして利用することができる計算モデルの１つに、RNN(Recurrent Neural Network)がある。

RNNは、ネットワークに回帰ループで結合されるコンテキストユニットを持ち、そこに内部状態を保持することによって、理論的には、任意の力学系を近似可能であることが知られている。

しかしながら、密結合した１つのネットワークモジュールで構成される計算モデルを、多数のアトラクタダイナミクスを学習する学習モデルとして用いることは、学習の収束性などに問題があり、現実的ではない。

そこで、複数のネットワークモジュールを組にして１つの学習モデルを構成するモジュラアーキテクチャ（modular architecture）を採用した学習モデルが提案されている。このモジュラアーキテクチャでは、原理的には、モジュールを増やすことによって記憶できるダイナミクスを容易に増やすことができるが、与えられた学習データをどのモジュールで学習（モジュール学習）するかを決定するモジュール選択の問題が生じる。

このモジュール選択を行う方法としては、どのモジュールに割り当てるかを人が決める教師あり学習（supervised learning）と、学習モデルが自律的に決める教師なし学習（unsupervised learning）の二つの方法がある。自律エージェントが自律的に学習を行うためには、教師なし学習によりモジュール学習を行う必要がある。

ところで、異なるアトラクタダイナミクスを別々のモジュールに記憶する場合、記憶の効率性が悪いことがある。

例えば、３つのアトラクタダイナミクスA,B、及びCを適宜組み合わせた組み合わせのダイナミクスAB,AC,ABC、及びACBを学習する場合、その組み合わせのダイナミクスAB,AC,ABC、及びACBのそれぞれを、異なるモジュールによって学習することは可能である。

しかしながら、この場合、組み合わせのダイナミクスAB,AC,ABC、及びACBのそれぞれを学習するモジュールが、いわば、基本的なアトラクタダイナミクスAや、B,Cを、重複して学習し、記憶することになり、ダイナミクスが効率的に記憶されているとは言い難い。

そこで、Mixture of RNN Expertと呼ばれる学習モデルを用いた階層的な学習装置が提案されている（例えば、特許文献１を参照）。

Mixture of RNN Expertと呼ばれる学習モデルは、下の階層に複数のRNNモジュール（RNNを有するモジュール）を備え、各RNNモジュールの出力をゲート機構によって統合することで最終的な出力を決定する。

学習時には、最終的な出力性能が最大化するように最尤推定法によってゲート機構の調整が行われ、同時に各RNNモジュールの学習が行われる。また、ゲート機構の時間的な変化を学習して記憶するために、上の階層が利用される。

なお、ゲート機構は、下の階層のRNNモジュールの内部状態とは切り離されたものであり、各RNNモジュールが記憶するダイナミクスに対して直接的な影響は与えない。すなわち、ゲート機構は、単に、各RNNモジュールの出力を利用するか利用しないかの切り替えを調整するだけであり、上の階層と下の階層は、ゲート機構を介してしか相互作用できないため、全体としてのネットワークは非常に制限されたものとなる。

また、階層的な学習装置としては、RNNPB(Recurrent Neural Network with Parametric Bias)を用いた学習装置が提案されている（例えば、非特許文献３を参照）。

RNNPBを用いた学習装置では、上述したようなモジュラアーキテクチャによって多数のダイナミクスを学習するのではなく、RNNPBと呼ばれる１つのネットワークによって複数のダイナミクスの学習（と記憶）を行う。

RNNPBは、入力層に、入力ユニット、及びコンテキストユニットの他、パラメトリックバイアス(PB)が入力されるユニット（以下、PBユニットという）を有する。

学習装置では、PBユニットには、ダイナミクスに応じた定常値が与えられるように学習が行われる。そして、このPBユニットに与えられる値の時間的な変化を学習して記憶するために、上の階層が利用される。上述のMixture of RNN Expertとは異なり、PBユニットに入力される値によって、下の階層のRNNPBの内部状態に影響を与えることができる。その結果、下の階層のRNNPBが記憶するダイナミクスに対して直接的に影響を与えることができる。上の階層と下の階層は、パラメトリックバイアスを介して相互作用することになり、全体として大きなネットワークが構成される。但し、RNNPBでは、１つのネットワークで複数のダイナミクスを学習することを基本とするため、多数のダイナミクスを学習することは困難である。

特開平11-126198号公報 G. Taga, 1998, "Self-organized control of bipedal locomotion by neural oscillators in unpredictable environment", Biological Cybernetics, 65, 147 - 159 多賀厳太郎著「脳と身体の動的デザイン−運動・知覚の非線形力学系と発達」、金子書房 J. Tani, M. Ito, and Y. Sugita, "Self-organization of distributedly represented multiple behavior schemata in a mirror system: reviews of robot experiments using RNNPB", Neural Networks, Vol. 17, pp.1273-1289, 2004

従来においては、多数のダイナミクスを学習するのと同時に、階層的な構造によって全体として効率的な学習を行うことができるネットワークを実現することが困難であった。

本発明は、このような状況に鑑みてなされたものであり、多数のダイナミクスを効率的に学習し、さらには、その学習結果を利用して、データの認識や生成を行うことができるようにするものである。

本発明の第１の側面のデータ処理装置、又は、プログラムは、ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段と、供給される時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する学習手段とを有する少なくとも２つのダイナミクス記憶ネットワーク処理手段と、前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記上位階層及び下位階層のダイナミクス記憶ネットワーク処理手段に供給する供給手段とを備えるデータ処理装置、又は、データ処理装置としてコンピュータを機能させるプログラムであり、前記学習手段が、前記供給手段から供給される前記媒介信号を含む時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する。

本発明の第１の側面のデータ処理方法は、ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段と、供給される時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する学習手段とを有する少なくとも２つのダイナミクス記憶ネットワーク処理手段を備えるデータ処理装置のデータ処理方法であり、前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記下位階層のダイナミクス記憶ネットワーク処理手段に供給するステップと、前記媒介信号を、前記上位階層のダイナミクス記憶ネットワーク処理手段に供給するステップと、前記学習手段が、前記媒介信号を含む時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新するステップとを含む。

本発明の第２の側面のデータ処理装置、又は、プログラムは、ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段と、供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードを表す情報を、供給される時系列データの認識結果として出力する認識手段と、前記認識手段が出力する情報が表す勝者ノードを、時系列データの生成に用いるノードである生成ノードに決定し、前記生成ノードが保持するダイナミクスを有する時系列データを生成する生成手段とを有する少なくとも２つのダイナミクス記憶ネットワーク処理手段と、前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記上位階層及び下位階層のダイナミクス記憶ネットワーク処理手段に供給する供給手段とを備えるデータ処理装置、又は、データ処理装置としてコンピュータを機能させるプログラムであり、前記認識手段が、前記供給手段から供給される前記媒介信号を含む時系列データに最も適合するダイナミクスを保持する勝者ノードを決定する。

本発明の第２の側面のデータ処理方法は、ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段と、供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードを表す情報を、供給される時系列データの認識結果として出力する認識手段と、前記認識手段が出力する情報が表す勝者ノードを、時系列データの生成に用いるノードである生成ノードに決定し、前記生成ノードが保持するダイナミクスを有する時系列データを生成する生成手段とを有する少なくとも２つのダイナミクス記憶ネットワーク処理手段を備えるデータ処理装置のデータ処理方法であり、前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記下位階層のダイナミクス記憶ネットワーク処理手段に供給するステップと、前記媒介信号を、前記上位階層のダイナミクス記憶ネットワーク処理手段に供給するステップと、前記認識手段が、前記供給手段から供給される前記媒介信号を含む時系列データに最も適合するダイナミクスを保持する勝者ノードを決定するステップとを含む。

なお、データ処理装置は、独立した装置であっても良いし、１つの装置を構成している内部ブロックであっても良い。

また、プログラムは、伝送媒体を介して伝送し、又は、記録媒体に記録して、提供することができる。

本発明の第１の側面によれば、ダイナミクスを学習することができ、特に、多数のダイナミクスを効率的に学習することができる。

本発明の第２の側面によれば、ダイナミクスの学習結果を利用して、データの認識や生成を行うことができ、特に、多数のダイナミクスを効率的に学習した学習結果を利用して、データの認識や生成を行うことができる。

以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。したがって、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。

本発明の第１の側面のデータ処理装置、又は、プログラムは、
ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段（例えば、図１のネットワーク記憶部２４や３４）と、
供給される時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する学習手段（例えば、図１の学習部２１や３１）と
を有する少なくとも２つのダイナミクス記憶ネットワーク処理手段（例えば、図１のダイナミクス記憶ネットワーク処理部１３や１５）と、
前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記上位階層及び下位階層のダイナミクス記憶ネットワーク処理手段に供給する供給手段（例えば、図１の媒介信号供給部１４）と
を備えるデータ処理装置（例えば、図１のデータ処理装置）、又は、データ処理装置としてコンピュータ（例えば、図１６のコンピュータ）を機能させるプログラムであり、
前記学習手段は、前記供給手段から供給される前記媒介信号を含む時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する。

第１の側面のデータ処理装置において、
前記学習手段には、
供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定させ（例えば、図６のステップＳ１４）、
前記勝者ノードから各ノードまでの距離に応じて、各ノードが保持するダイナミクスを更新する程度を表す学習重みを決定させ（例えば、図６のステップＳ１５）、
各ノードが保持するダイナミクスを、各ノードの学習重みに応じて、供給される時系列データのダイナミクスに近くなるように、自己組織的に更新させる（例えば、図６のステップＳ１７）
ことができる。

第１の側面のデータ処理装置には、
前記下位階層のダイナミクス記憶ネットワーク処理手段の前記ダイナミクス記憶ネットワークを構成するノードに割り当てられるダイナミクスを記憶するダイナミクス記憶手段（例えば、図１５のダイナミクス記憶部５１）をさらに設けることができ、
前記供給手段には、前記ダイナミクス記憶手段に記憶されたダイナミクスを有する時系列データを、前記媒介信号として供給させることができる。

第１の側面のデータ処理装置において、
前記ダイナミクス記憶ネットワーク処理手段には、供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードを表す情報を、供給される時系列データの認識結果として出力する認識手段（例えば、図１の認識部２２や３２）をさらに設けることができる。

第１の側面のデータ処理装置において、
前記ダイナミクス記憶ネットワーク処理手段には、時系列データの生成に用いるノードである生成ノードを決定し、前記生成ノードが保持するダイナミクスを有する時系列データを生成する生成手段（例えば、図１の生成部２３や３３）をさらに設けることができる。

第１の側面のデータ処理装置において、
前記ダイナミクス記憶ネットワーク処理手段には、
供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードを表す情報を、供給される時系列データの認識結果として出力する認識手段（例えば、図１の認識部２２や３２）と、
前記認識手段が出力する情報が表す勝者ノードを、時系列データの生成に用いるノードである生成ノードに決定し、前記生成ノードが保持するダイナミクスを有する時系列データを生成する生成手段（例えば、図１の生成部２３や３３）と
をさらに設けることができる。

本発明の第１の側面のデータ処理方法は、
ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段（例えば、図１のネットワーク記憶部２４や３４）と、
供給される時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する学習手段（例えば、図１の学習部２１や３１）と
を有する少なくとも２つのダイナミクス記憶ネットワーク処理手段（例えば、図１のダイナミクス記憶ネットワーク処理部１３や１５）
を備えるデータ処理装置（例えば、図１のデータ処理装置）のデータ処理方法であり、
前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記下位階層のダイナミクス記憶ネットワーク処理手段に供給するステップ（例えば、図６のステップＳ１２）と、
前記媒介信号を、前記上位階層のダイナミクス記憶ネットワーク処理手段に供給するステップ（例えば、図６のステップＳ１６）と、
前記学習手段が、前記媒介信号を含む時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新するステップ（例えば、図６のステップＳ１７）と
を含む。

本発明の第２の側面のデータ処理装置、又は、プログラムは、
ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段（例えば、図１のネットワーク記憶部２４や３４）と、
供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードを表す情報を、供給される時系列データの認識結果として出力する認識手段（例えば、図１の認識部２２や３２）と、
前記認識手段が出力する情報が表す勝者ノードを、時系列データの生成に用いるノードである生成ノードに決定し、前記生成ノードが保持するダイナミクスを有する時系列データを生成する生成手段（例えば、図１の生成部２３や３３）と
を有する少なくとも２つのダイナミクス記憶ネットワーク処理手段（例えば、図１のダイナミクス記憶ネットワーク処理部１３や１５）と、
前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記上位階層及び下位階層のダイナミクス記憶ネットワーク処理手段に供給する供給手段（例えば、図１の媒介信号供給部１４）と
を備えるデータ処理装置（例えば、図１のデータ処理装置）、又は、データ処理装置としてコンピュータ（図１６のコンピュータ）を機能させるプログラムであり、
前記認識手段は、前記供給手段から供給される前記媒介信号を含む時系列データに最も適合するダイナミクスを保持する勝者ノードを決定する。

第２の側面のデータ処理装置において、
前記ノードが、内部状態量を持つ力学系近似モデルによって、ダイナミクスを保持する場合には、
前記認識手段には、供給される時系列データに基づいて、前記内部状態量を更新しながら、供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定させ（例えば、図１２のステップＳ７３）、
前記ダイナミクス記憶ネットワーク処理手段には、前記勝者ノードを決定する処理において得られる前記内部状態量を記憶する内部状態記憶手段（例えば、図１の内部状態記憶部２５）をさらに設け、
前記生成手段には、前記内部状態記憶手段の記憶値に基づいて、前記生成ノードの力学系近似モデルの前記内部状態量を決定させて、その内部状態量を更新しながら、時系列データを生成させる（例えば、図１２のステップＳ７５）
ことができる。

本発明の第２の側面のデータ処理方法は、
ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段（例えば、図１のネットワーク記憶部２４や３４）と、
供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードを表す情報を、供給される時系列データの認識結果として出力する認識手段（例えば、図１の認識部２２や３２）と、
前記認識手段が出力する情報が表す勝者ノードを、時系列データの生成に用いるノードである生成ノードに決定し、前記生成ノードが保持するダイナミクスを有する時系列データを生成する生成手段（例えば、図１の生成部２３や３３）と
を有する少なくとも２つのダイナミクス記憶ネットワーク処理手段（例えば、図１のダイナミクス記憶ネットワーク処理部１３や１５）
を備えるデータ処理装置のデータ処理方法であり、
前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記下位階層のダイナミクス記憶ネットワーク処理手段に供給するステップ（例えば、図１２のステップＳ７１）と、
前記媒介信号を、前記上位階層のダイナミクス記憶ネットワーク処理手段に供給するステップ（例えば、図１２のステップＳ７４）と、
前記認識手段が、前記供給手段から供給される前記媒介信号を含む時系列データに最も適合するダイナミクスを保持する勝者ノードを決定するステップ（例えば、図１２のステップＳ７３）と
を含む。

以下、図面を参照して、本発明の実施の形態について説明する。

図１は、本発明を適用したデータ処理装置の一実施の形態の構成例を示すブロック図である。

図１のデータ処理装置は、例えば、ロボット、マニピュレータシステム、パンチルトカメラ、船舶、航空機、自動車、その他の電子機器で扱われる信号の学習、認識、及び生成に利用される。特に、図１のデータ処理装置は、自律型ロボットなどの自律エージェントその他の自律システムにおいて、センサ、及びモータなどに対して入出力する信号の学習、認識、及び生成に利用される。

図１のデータ処理装置では、観測することができる観測信号が、信号入力部１１に入力される。観測信号は、例えば音や画像の信号、LED(Light Emitting Diode)の明るさ、モータの回転角度や回転角速度などであり、自律システムに対して入出力し得る信号が、観測信号となり得る。

信号入力部１１は、観測される観測信号に対応する電気信号を出力する。具体的には、信号入力部１１は、例えば、観測信号が音の信号の場合は、センサとしてのマイクに対応し、観測信号が画像信号の場合は、センサとしてのカメラに対応する。また、モータの回転角度や回転速度の計測装置なども、信号入力部１１に対応する。

ここで、以下、適宜、信号入力部１１に入力される信号も、信号入力部１１が出力する信号も、観測信号という。

なお、観測信号は、時間的に定常的な定常信号であっても良いし、時間的に変化する（定常的でない）非定常信号であっても良い。

なお、以下では、例えば、センサモータ信号を観測信号とする。センサモータ信号とは、例えば、図示せぬ自律型ロボットが有するカメラやマイクその他のセンサが出力するセンサ信号と、自律型ロボットの腕や脚等を駆動するモータに与えられるモータ信号とを、一定の時間間隔でサンプリングして得られる、同一のサンプル点（時刻）のサンプル値をコンポーネントとするベクトルの時系列である。

信号入力部１１は、時系列のデータ（時系列データ）である観測信号を、逐次、適当な長さに区切って出力する。すなわち、信号入力部１１は、観測信号としてのセンサモータ信号から、例えば、１００サンプル（点）を、１サンプルずつシフトしながら抽出し、その１００サンプルの時系列データを、特徴量抽出部１２に供給する。

なお、センサモータ信号のサンプリングの時間間隔や、信号入力部１１がセンサモータ信号から抽出するサンプルの数（サンプル数）は、観測信号とするセンサモータ信号に応じて適切に調整される。

特徴量抽出部１２は、信号入力部１１から供給される観測信号から特徴量を抽出し、その特徴量の時系列を、ダイナミクス記憶ネットワーク処理部１３に供給する。

すなわち、観測信号が、例えば、音声信号である場合には、特徴量抽出部１２は、その音声信号の一定時間分ごとに、周波数分析その他の音響処理を施し、音声認識等で広く利用されている、例えば、メルケプストラムなどの音声の特徴量を抽出する。そして、特徴量抽出部１２は、観測信号から抽出した特徴量を、時系列に出力し、これにより、特徴量抽出部１２からダイナミクス記憶ネットワーク処理部１３に対して、特徴量の時系列データが供給される。

ダイナミクス記憶ネットワーク処理部１３には、特徴量抽出部１２から特徴量の時系列データが供給される他、媒介信号供給部１４から時系列データである媒介信号が供給される。

ダイナミクス記憶ネットワーク処理部１３は、そこに供給される時系列データに基づき、ダイナミクスを学習する学習処理を行い、さらに、その学習処理の結果を利用して、時系列データを認識する認識処理や、時系列データを生成する生成処理、時系列データを認識し、その認識結果に応じて、時系列データを生成する認識生成処理を行う。

すなわち、ダイナミクス記憶ネットワーク処理部１３は、学習部２１、認識部２２、生成部２３、ネットワーク記憶部２４、及び内部状態記憶部２５から構成される。

学習部２１は、特徴量抽出部１２から供給される時系列データと、媒介信号供給部１４から供給される時系列データとに基づき、後述するネットワーク記憶部２４に記憶されたダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する学習処理を行う。

ここで、学習処理では、ダイナミクス記憶ネットワークのパラメータの更新が行われる。パラメータの更新は、学習と呼ばれることがある。

学習部２１による学習処理の詳細は後述するが、その学習処理では、基本的には、ラベル（正解ラベル）の付与されていない時系列データを、ダイナミクス記憶ネットワークに対して、繰り返し与えていく（供給していく）と、ダイナミクス記憶ネットワークが、その時系列データの中の特徴的なダイナミクスを自己組織的に獲得していく教師なし学習が実行される。その結果、ダイナミクス記憶ネットワークには、そこに与えられた時系列データの代表的なダイナミクスが記憶される。ダイナミクス記憶ネットワークに記憶されたダイナミクスは、認識部２２や生成部２３が必要に応じていつでも利用することができる。

ここで、ダイナミクス記憶ネットワークは、例えば、後述するように、力学系近似モデルの１つであるRNNによって、ダイナミクスを保持する。例えば、ある時刻tのデータの入力に対して、次の時刻t+1のデータを出力するRNN（の後述する入力層の入力ユニット）に対して入力される、ある時刻tのデータを、入力データというとともに、その時刻tのデータに対してRNNが出力する時刻t+1のデータを、出力データということとすると、ダイナミクス記憶ネットワーク処理部１３に対して、特徴量抽出部１２から供給される時系列データは、入力データである。

なお、以下、適宜、ダイナミクス記憶ネットワーク処理部１３に対して、特徴量抽出部１２から供給される時系列データを入力時系列データともいい、媒介信号供給部１４から供給される時系列データを媒介時系列データともいう。

ダイナミクス記憶ネットワーク処理部１３では、学習部２１は、入力データとしての入力時系列データの他に、媒介時系列データを、ダイナミクス記憶ネットワークに与えて、すなわち、入力時系列データと媒介時系列データとのセットを、ダイナミクス記憶ネットワークに与えて、ダイナミクス記憶ネットワークにダイナミクスを獲得させる。

認識部２２は、入力データ、つまり、特徴量抽出部１２から供給される入力時系列データを認識の対象として、認識処理を行う。

すなわち、認識部２２は、ネットワーク記憶部２４のダイナミクス記憶ネットワークが記憶しているダイナミクスの中で、特徴量抽出部１２から供給される入力時系列データと、媒介信号供給部１４から供給される媒介時系列データとのセットに最も適合するダイナミクスを決定し、そのダイナミクスを表す情報を、入力データとしての入力時系列データの認識結果として出力する。

なお、認識部２２が出力する認識結果は、必要に応じて、信号出力部１６に供給される。

生成部２３は、ネットワーク記憶部２４のダイナミクス記憶ネットワークが記憶しているダイナミクスの中から、時系列データの生成に用いるダイナミクスを決定し、そのダイナミクスを有する時系列データを生成する生成処理を行う。

なお、生成部２３が生成処理を行うことによって得られる時系列データは、必要に応じて、信号出力部１６に供給される。

ネットワーク記憶部２４は、ダイナミクス記憶ネットワークを記憶している。

ダイナミクス記憶ネットワークは、ダイナミクスを１つのノードに保持し、複数のノードによって構成される。

ここで、ダイナミクス記憶ネットワークは、ダイナミクスを記憶（保持）するから、ダイナミクス記憶ネットワークに記憶されるものがダイナミクスである。

ダイナミクスは、時間変化する力学系を表すもので、例えば、具体的な関数によって表現することができる。ダイナミクス記憶ネットワークでは、時系列データの時間変化の特徴が、ダイナミクスとして記憶される。

なお、本実施の形態では、ダイナミクス記憶ネットワークのノードにおいて、例えば、内部状態量を持つ力学系近似モデルによってモデル化されたダイナミクスを保持することとする。この場合、ダイナミクス記憶ネットワークは、内部状態量を持つ力学系近似モデルをノードとするネットワーク（内部状態量を持つ力学系近似モデルを保持（記憶）するノードによって構成されるネットワーク）である。

ここで、内部状態量を持つ（力学系近似）モデルとは、例えば、ある入力があると、その入力に応じて出力をするモデルを考えた場合に、外部から観測することができる入力と出力とは別に、外部からは観測されない（できない）、モデルの内部の状態を表す内部状態量を有するモデルである。内部状態量を持つモデルでは、入力の他に、内部状態量をも用いて出力が求められるため、同一の入力があっても、内部状態量が異なると、異なる出力が得られる。

内部状態記憶部２５は、ネットワーク記憶部２４に記憶されたダイナミクス記憶ネットワークの内部状態量を記憶する。内部状態記憶部２５に記憶された内部状態量は、学習部２１による学習処理において、適宜更新され、必要に応じて利用される。また、内部状態記憶部２５に記憶された内部状態量は、認識生成処理において、入力時系列データの認識時に、適宜更新され、時系列データの生成時に、必要に応じて利用される。この認識生成処理によって、自律型ロボットの認知行動を実現することができる。

媒介信号供給部１４は、ダイナミクス記憶ネットワーク処理部１３と、後述するダイナミクス記憶ネットワーク処理部１５のうちの一方である、入力時系列データが供給されるダイナミクス記憶ネットワーク処理部１３を下位階層とするとともに、他方であるダイナミクス記憶ネットワーク処理部１５を上位階層として、下位階層のダイナミクス記憶ネットワーク処理部１３のダイナミクス記憶ネットワークと、上位階層のダイナミクス記憶ネットワーク処理部１５のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、下位階層のダイナミクス記憶ネットワーク処理部１３、及び、上位階層のダイナミクス記憶ネットワーク処理部１５に供給する。

すなわち、下位階層のダイナミクス記憶ネットワーク処理部１３、及び、上位階層のダイナミクス記憶ネットワーク処理部１５は、後述するように、媒介信号を出力する。下位階層のダイナミクス記憶ネットワーク処理部１３が出力する媒介信号、及び、上位階層のダイナミクス記憶ネットワーク処理部１５が出力する媒介信号は、いずれも、媒介信号供給部１４に供給される。

媒介信号供給部１４は、下位階層のダイナミクス記憶ネットワーク処理部１３からの媒介信号を、必要に応じて調整し、上位階層のダイナミクス記憶ネットワーク処理部１５に供給する。また、媒介信号供給部１４は、上位階層のダイナミクス記憶ネットワーク処理部１５からの媒介信号を、必要に応じて調整し、下位階層のダイナミクス記憶ネットワーク処理部１３に、上述した媒介時系列データとして供給する。

ここで、以下、適宜、下位階層のダイナミクス記憶ネットワーク処理部１３から媒介信号供給部１４に供給される媒介信号を下位媒介信号というとともに、上位階層のダイナミクス記憶ネットワーク処理部１５から媒介信号供給部１４に供給される媒介信号を上位媒介信号という。

ダイナミクス記憶ネットワーク処理部１５は、そこに供給される時系列データに基づき、ダイナミクスを学習する学習処理を行い、さらに、その学習処理の結果を利用して、時系列データを認識する認識処理や、時系列データを生成する生成処理、時系列データを認識し、その認識結果に応じて、時系列データを生成する認識生成処理を行う。

すなわち、上位階層のダイナミクス記憶ネットワーク処理部１５は、学習部３１、認識部３２、生成部３３、ネットワーク記憶部３４、及び内部状態記憶部３５から構成される。

学習部３１、認識部３２、生成部３３、ネットワーク記憶部３４、及び内部状態記憶部３５は、下位階層のダイナミクス記憶ネットワーク処理部１３の学習部２１、認識部２２、生成部２３、ネットワーク記憶部２４、及び内部状態記憶部２５と、それぞれ同様に構成される。

したがって、上位階層のダイナミクス記憶ネットワーク処理部１５では、下位階層のダイナミクス記憶ネットワーク処理部１３と同様の処理が行われる。

但し、図１では、下位階層のダイナミクス記憶ネットワーク処理部１３に供給される時系列データとしては、特徴量抽出部１２からの入力時系列データと、媒介信号供給部１４からの媒介時系列データとがあるのに対して、上位階層のダイナミクス記憶ネットワーク処理部１５に供給される時系列データとしては、媒介信号供給部１４からの媒介信号しかない。

上位階層のダイナミクス記憶ネットワーク処理部１５では、媒介信号供給部１４からの媒介信号を入力データとして処理が行われる。

ここで、媒介信号供給部１４は、例えば、下位階層のダイナミクス記憶ネットワーク処理部１３からの下位媒介信号を一定の時間間隔でサンプリングされた信号として扱い、その下位媒介信号から、例えば、３００サンプルを、１サンプルずつシフトしながら抽出し、その３００サンプルの時系列データを、媒介信号として、上位階層のダイナミクス記憶ネットワーク処理部１５に供給する。

学習部３１は、媒介信号供給部１４からの媒介信号を入力データとして、ネットワーク記憶部３４に記憶されたダイナミクス記憶ネットワークのパラメータの更新をする学習処理を行う。これにより、ネットワーク記憶部３４のダイナミクス記憶ネットワークには、入力データとしての、媒介信号供給部１４からの媒介信号の中の代表的なダイナミクスが記憶される。

認識部３２は、媒介信号供給部１４からの媒介信号を入力データとして、その入力データを認識する認識処理を行う。なお、認識部３２による認識の結果は、必要に応じて、信号出力部１６に供給することができる。

生成部３３は、ネットワーク記憶部３４のダイナミクス記憶ネットワークが記憶しているダイナミクスの中から、時系列データの生成に用いるダイナミクスを決定し、そのダイナミクスを有する時系列データを生成する生成処理を行う。

なお、生成部３３が生成処理を行うことによって得られる時系列データは、必要に応じて、上位媒介信号として、媒介信号供給部１４に供給される。

ネットワーク記憶部３４は、ダイナミクス記憶ネットワークを記憶している。なお、ネットワーク記憶部３４のダイナミクス記憶ネットワークでは、例えば、ネットワーク記憶部２４のダイナミクス記憶ネットワークと同様に、ノードにおいて、内部状態量を持つ力学系近似モデルによってモデル化されたダイナミクスを保持する。

内部状態記憶部３５は、ネットワーク記憶部３４に記憶されたダイナミクス記憶ネットワークの内部状態量を記憶する。内部状態記憶部２５に記憶された内部状態量は、学習部３１による学習処理において、適宜更新され、必要に応じて利用される。また、内部状態記憶部３５に記憶された内部状態量は、認識生成処理において、入力データの認識時に、適宜更新され、時系列データの生成時に、必要に応じて利用される。この認識生成処理によって、ダイナミクス記憶ネットワーク処理部１５は、媒介信号供給部１４からの媒介信号に対して、対応する上位媒介信号を生成し、媒介信号供給部１４に供給する（返す）。

信号出力部１６は、ダイナミクス記憶ネットワーク処理部１３や１５から供給される信号（情報）を、出力信号として出力する。信号出力部１６が出力する出力信号は、必要に応じて、自律型ロボットの腕や脚等を駆動するモータに与えられ、これにより、自律型ロボットは自律的に行動する。

以上のように構成される図１のデータ処理装置では、媒介信号供給部１４が、２つのダイナミクス記憶ネットワーク処理部１３及び１５のうちの、一方である、入力時系列データが供給されるダイナミクス記憶ネットワーク処理部１３を下位階層とするとともに、他方であるダイナミクス記憶ネットワーク処理部１５を上位階層として、下位階層のダイナミクス記憶ネットワーク処理部１３のダイナミクス記憶ネットワークと、上位階層のダイナミクス記憶ネットワーク処理部１５のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、下位階層のダイナミクス記憶ネットワーク処理部１３、及び、上位階層のダイナミクス記憶ネットワーク処理部１５に供給する。

上述のように、媒介信号が、２つのダイナミクス記憶ネットワーク処理部１３及び１５のダイナミクス記憶ネットワークに与えられることにより、ダイナミクス記憶ネットワーク処理部１３のダイナミクス記憶ネットワークと、ダイナミクス記憶ネットワーク処理部１５のダイナミクス記憶ネットワークとは、２階層の階層構造を構成する。

次に、図２は、図１のネットワーク記憶部２４及び３４に記憶されたダイナミクス記憶ネットワークの例を、模式的に示している。

ダイナミクス記憶ネットワークは、複数のノードとリンクによって構成される。

ノードは、ダイナミクスを保持（記憶）する。

リンクは、ノードどうしの間に結合関係を与える。

図２では、ダイナミクス記憶ネットワークは、９個のノードN₁ないしN₉を有し、各ノードN_i(i=1,2,・・・,9)には、９個のノードN₁ないしN₉が２次元の格子状に配置されるように、縦方向及び横方向に隣接するノードとの間にリンクが与えられている。

すなわち、図２では、リンクによって、９個のノードN₁ないしN₉に、２次元の配置構造が与えられている。

ここで、ダイナミクス記憶ネットワークにおいては、ノードN_iの配置構造に応じて、ノードN_iの位置を表す座標系を定義することができる。すなわち、例えば、図２に示すように、２次元の配置構造のノードN_iについては、２次元座標系を定義し、その２次元座標系上の座標によって、ノードN_iの位置を表すことができる。

例えば、いま、図２のダイナミクス記憶ネットワークについて、左下のノードN₇の位置を原点(0,0)とするとともに、左から右方向をx軸とし、下から上方向をy軸とする２次元座標系を定義して、リンクの長さを0.5とすると、図２のダイナミクス記憶ネットワークにおいて、例えば、右上のノードN₃の位置の座標は、(1,1)となる。

また、ダイナミクス記憶ネットワークを構成する任意の２つのノードN_i及びN_jそれぞれが保持するダイナミクスどうしが類似している（近い）度合いを表す尺度として、ノードN_iとN_jとの間の距離を導入する。

いま、ノードN_iとN_jとの間の距離として、ノードN_iとN_jとの間のユークリッド距離を採用することとすると、例えば、左下のノードN₇と、右上のノードN₃との間の距離は、√((0-1)²+(0-1)²)=√2となる。

なお、ネットワーク記憶部２４と３４にそれぞれ記憶されるダイナミクス記憶ネットワークは、ノードの数とリンクが同一のものであってもよいし、ノードの数や、ノードに与えられるリンクが異なるものであってもよい。

図３は、図１の下位階層のダイナミクス記憶ネットワーク処理部１３の（ネットワーク記憶部２４に記憶された）ダイナミクス記憶ネットワークのノードN_iの構成例を模式的に示している。

ノードN_iは、内部状態量を持ち、力学系を表すことができる力学系近似モデル４１と、その力学系近似モデル４１のパラメータを更新する学習を行う学習調整部４２とによって構成される。

図３では、内部状態量を持つ力学系近似モデル４１として、RNNが採用されている。

図３において、力学系近似モデル４１としてのRNNは、３層型NN(Neural Network)に、その出力層から入力層への回帰ループを持たせたものとなっており、その回帰ループによって、内部状態量が保持される。

すなわち、図３において、力学系近似モデル４１としてのRNNは、入力層、隠れ層（中間層）、及び出力層の３層により構成されている。入力層、隠れ層、及び出力層は、それぞれ任意の数の、ニューロンに相当するユニットにより構成されている。

図３において、入力層は、入力ユニット、媒介ユニット、及びコンテキストユニットを有する。

入力ユニットには、時刻tの入力データ（ベクトル）X_tとしての入力時系列データが入力される。

媒介ユニットには、時刻tの媒介時系列データ（ベクトル）V_tが入力される。

コンテキストユニットには、例えば、出力層の一部のユニットが出力するデータが、内部状態量であるコンテキストとしてフィードバックされる。すなわち、図３のRNNでは、コンテキストユニットと、出力層の一部のユニットとが、回帰ループによって接続されており、コンテキストユニットには、出力層の一部のユニットが出力するデータが、回帰ループを介して、コンテキストとして入力される。

ここで、時刻tの入力データX_tが入力ユニットに入力されるときに、コンテキストユニットに入力される時刻tのコンテキストC_tは、１時刻前の時刻t-1の入力データX_t-1に対して、出力層の一部のユニットが出力したデータである。したがって、時刻tの入力データX_tの入力に対して出力層の一部のユニットが出力したデータは、次の時刻t+1のコンテキストC_t+1となる。

隠れ層のユニットは、入力層に入力される入力データX_t、媒介時系列データV_t、及びコンテキストC_tを対象として、ニューロンとしてのユニットどうしを結合する結合重み（結合荷重）を用いた重み付け加算を行い、その重み付け加算の結果を引数とする非線形関数の演算を行って、その演算結果を、出力層のユニットに出力する。

出力層の一部のユニットからは、上述したように、次の時刻t+1のコンテキストC_t+1と
なるデータが出力され、入力層のコンテキストユニットにフィードバックされる。また、出力層の残りのユニットからは、例えば、入力データX_tに対する出力データとして、その入力データX_tの次の時刻t+1の入力データX_t+1の予測値X^* _t+1が出力される。

以上のようなRNNにおいて、入力データとしての入力時系列データと、媒介時系列データとのセットを、RNNの学習用の学習データとして用い、時刻tの入力時系列データX_t、及び媒介時系列データV_tから、次の時刻t+1の入力時系列データX_t+1を予測することを学習することにより、学習データ（入力時系列データ）の時間発展法則を学習することができる。

ここで、RNNのような内部状態量を持つ力学系近似モデル４１のパラメータを求める学習の方法としては、例えば、BPTT(Back-Propagation Through Time)法を採用することができる。BPTT法については、例えば、D. E. Rumelhart, G. E. Hinton & R. E. Williams, 1986 "Learning internal representations by error propagation", In D. E. Rumelhart & J. McClelland, "Parallel distributed processing, pp. 318-364, Cambridge, MA: MIT Press等に記載されている。

学習調整部４２は、力学系近似モデル４１としてのRNNが保持するダイナミクスが、学習データの影響を受けるように、RNNのパラメータである結合重みを更新するRNNの学習を行う。

なお、学習調整部４２は、力学系近似モデル４１としてのRNNが保持するダイナミクスが、学習データの影響を受ける度合いを強くしたり弱くしたりするための調整機能を有している。

すなわち、ダイナミクス記憶ネットワークの学習は、オンライン学習で行われ、学習データが入力されるたびに、ダイナミクス記憶ネットワークを構成するモジュールとしてのノードが有する力学系近似モデル４１としてのRNNのパラメータが少しずつ更新される。このパラメータの更新時に、図１の学習部２１（及び３１）は、ノードごとに、そのノードの学習調整部４２に対して、ノードが保持するダイナミクスを更新する程度、つまり、学習データをノードが保持するダイナミクスに影響させる程度を表す学習重みを指定する。

学習調整部４２は、学習部２１からの学習重みに応じて、ノードが保持するダイナミクスを、学習データのダイナミクスに近くなるように、自己組織的に更新する

すなわち、学習調整部４２は、ノードの力学系近似モデル４１としてのRNNが保持するダイナミクスが、学習データの影響を受ける度合いを、学習重みに応じて調整しながら、RNNのパラメータを、BPTT法により更新する。

学習調整部４２において、RNNが保持するダイナミクスが学習データの影響を受ける度合いの調整は、BPTT法によるRNNのパラメータの更新時の、パラメータを計算する繰り返し回数を、学習重みに応じて制限することによって行われる。

すなわち、BPTT法によるRNNのパラメータの更新では、一般には、例えば、RNNのパラメータが収束するまで、RNNのパラメータの計算が繰り返し行われるが、学習調整部４２は、例えば、学習重みが小さいほど、パラメータの計算の繰り返し回数を少なくする。

これにより、学習重みが大きい場合には、RNNのパラメータは、RNNが保持するダイナミクスが学習データの影響を大きく受けるように更新される。また、学習重みが小さい場合には、RNNのパラメータは、RNNが保持するダイナミクスが学習データの影響をあまり受けないように（少ししか受けないように）更新される。

次に、図４は、図１の上位階層のダイナミクス記憶ネットワーク処理部１５の（ネットワーク記憶部３４に記憶された）ダイナミクス記憶ネットワークのノードN_iの構成例を模式的に示している。

ノードN_iは、図３の場合と同様に、内部状態量を持つ力学系近似モデル４１としてのRNNと、そのRNNのパラメータを更新する学習を行う学習調整部４２とによって構成される。

但し、図４では、力学系近似モデル４１としてのRNNは、入力層に、媒介ユニットを有しないものになっている。

すなわち、上位階層のダイナミクス記憶ネットワーク処理部１５には、媒介信号供給部１４から、媒介信号が、入力データとして供給されるが、その入力データの他に、下位階層のダイナミクス記憶ネットワーク処理部１３に供給される媒介時系列データに相当するデータは、供給されない。このため、上位階層のダイナミクス記憶ネットワーク処理部１５のダイナミクス記憶ネットワークのノードN_iのRNNには、媒介時系列データが入力される媒介ユニットが設けられていない。

そして、図４の力学系近似モデル４１としてのRNNでは、入力データとしての、媒介信号供給部１４からの媒介信号を、RNNの学習用の学習データとして用い、時刻tの媒介信号X_tから、次の時刻t+1の媒介信号X_t+1を予測することが学習され、これにより、学習データ（媒介信号供給部１４から上位階層のダイナミクス記憶ネットワーク処理部１５に供給される媒介信号）の時間発展法則が学習される。

なお、図４の力学系近似モデル４１としてのRNNの学習は、図３の場合と同様に、そのRNNが保持するダイナミクスが、学習データの影響を受ける度合いを、学習重みに応じて調整しながら、BPTT法によって行われる。

また、上位階層のダイナミクス記憶ネットワーク処理部１５では、学習部３１が、RNNの学習（パラメータの更新）を行う学習調整部４２に対して、学習重みを指定する。

図５は、図１の学習部２１（及び３１）が学習重みを決定する方法を示している。

学習部２１は、ダイナミクス記憶ネットワークのノードの中から、学習データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードから各ノードまでの距離に応じて、各ノードが保持するダイナミクスを更新する程度を表す学習重みを決定する。

すなわち、学習部２１は、時刻tの学習データ（時刻tの入力時系列データX_tと媒介時系列データV_tとのセット）を、力学系近似モデル４１としてのRNNに入力したときに、そのRNNが出力する時刻t+1の学習データのうちの入力時系列データの予測値の、時刻t+1の入力時系列データ（の真値）に対する、例えば、自乗誤差の平均値を、スコアとして計算する。

ここで、所定のサンプル数をLと表すこととすると、時刻tの時系列データとは、例えば、時刻t-L+1のサンプル値から、時刻tのサンプル値までのLサンプルのサンプル値を意味する。学習部２１は、時刻tの学習データに対して、時刻t-L+2から時刻t+1までの各時刻の予測値の自乗誤差を求め、その自乗誤差の平均値（以下、適宜、予測誤差という）をスコアとする。

なお、この場合、スコアが小さいほど、予測値が真値に近いことを表す。そこで、以下、適宜、スコアが小さいことを、スコアが良い、又は高いともいい、スコアが大きいことを、スコアが悪い、又は低いともいう。

RNNのような内部状態量を持つ力学系近似モデル４１については、その内部状態量を適切な値とすることで、スコアはより良くなる。

そのため、学習部２１は、スコアの計算にあたっては、予測誤差を最小化するように、BPTT法によって、内部状態量としてのRNNのコンテキストを調整した後、そのコンテキストを更新しながら、スコアを計算する。

そして、学習部２１は、ダイナミクス記憶ネットワークのノードの中から、スコアが最も良いRNNを有するノードを、学習データに最も適合するダイナミクスを保持する勝者ノードに決定する。

さらに、学習部２１は、ダイナミクス記憶ネットワークの各ノードと、勝者ノードとの間の距離dを求める。

ここで、例えば、図２に示したダイナミクス記憶ネットワークにおいて、９個のノードN₁ないしN₉のうちの、例えば、ノードN₆が勝者ノードである場合には、勝者ノードであるノードN₆が、勝者ノードとの間の距離が最も近い（０である）ノードとなる。また、ノードN₃,N₅、及びN₉が、勝者ノードとの間の距離が２番目に近いノードとなり、ノードN₂及びN₈が、勝者ノードとの間の距離が３番目に近いノードとなる。さらに、ノードN₄が、勝者ノードとの間の距離が４番目に近いノードとなり、ノードN₁及びN₇が、勝者ノードとの間の距離が最も遠い（５番目に近いノード）となる。

学習部２１は、ダイナミクス記憶ネットワークの各ノードの、勝者ノードとの間の距離dに基づき、距離dの増加に対して学習重みαが減少する関係を表す曲線（以下、距離／重み曲線という）に従って、ノードの学習重みαを決定する。

すなわち、図５は、距離／重み曲線の例を示している。

図５の距離／重み曲線において、横軸（左から右方向）は、学習重みαを示しており、縦軸（上から下方向）は、勝者ノードからの距離dを示している。

図５の距離／重み曲線によれば、勝者ノードとの距離dが近いノードほど、大きな学習重みαが決定され、距離dが遠いノードほど、小さな学習重みαが決定される。

ここで、図５では、縦軸に沿って、ダイナミクス記憶ネットワークを構成する６個のノードN₁'ないしN₆'が、各ノードN_i'と勝者ノードとの距離dに対応する位置（縦軸の位置）に記載されている。

図５では、ダイナミクス記憶ネットワークを構成する６個のノードN₁'ないしN₆'が、その順で、勝者ノードとの距離dが近くなっている。ダイナミクス記憶ネットワークを構成する６個のノードN₁'ないしN₆'のうち、勝者ノードとの距離dが最も近いノード、即ち、勝者ノードとの距離が０のノードであるノードN₁'は、勝者ノード（となっているノード）である。

図５の距離／重み曲線は、例えば、式（１）によって与えられる。

α=γ^(d/△)
・・・（１）

ここで、式（１）において、γは０＜γ＜１の範囲の減衰係数であり、Δは、勝者ノードを中心として各ノードの学習重みαを調整するための変数（以下、適宜、調整変数という）である。

調整変数をΔを大きい値から少しずつ０に近づけていくと、学習重みαは勝者ノードから離れるにしたがってより小さい値となる。基本的には、調整変数Δは、学習の開始時は大きくし、時間の経過とともに小さくなるように調整される。

式（１）の学習重みαに基づき、勝者ノードのパラメータ（ノードが有する力学系近似モデル４１のパラメータ）は、学習データの影響を最も強く受け、勝者ノードから離れるにしたがって、学習データの影響が小さくなるように、他のノード（勝者ノード以外のノード）のパラメータの更新が行われる。

なお、学習部２１は、勝者ノードを決定するときには、入力データとしての特徴量抽出部１２からの入力時系列データと、媒介信号供給部１４からの媒介時系列データとのセットを学習データとして用いて、ダイナミクス記憶ネットワークの各ノードのスコアを求める。そして、学習部２１は、スコアが最も良いノードを勝者ノードに決定し、ダイナミクス記憶ネットワークの各ノードの、勝者ノードとの間の距離dに応じて、各ノードの学習重みαを決定する。

さらに、学習部２１は、学習調整部４２（図３）を制御し、ダイナミクス記憶ネットワークの各ノードの学習重みαに応じて、各ノードが保持するダイナミクスの自己組織的な更新、つまり、各ノードの力学系近似モデル４１としてのRNNのパラメータ（ノードのパラメータ）の更新を行うが、そのパラメータの更新には、勝者ノードの決定に用いられた学習データである、入力データとしての特徴量抽出部１２からの入力時系列データと、媒介信号供給部１４からの媒介時系列データとのセットではなく、入力データとしての特徴量抽出部１２からの入力時系列データと、勝者ノードの位置の座標(x,y)を表す定常信号とのセットが、学習データとして用いられる。

すなわち、勝者ノードの決定時には、ノードのRNNの媒介ユニット（図３）には、媒介信号供給部１４からの媒介時系列データV_tが入力されるが、ノードのRNNのパラメータの更新時には、RNNの媒介ユニットには、勝者ノードの位置の座標(x,y)を表す定常信号が、媒介信号供給部１４からの媒介時系列データの代わりに入力される。

その結果、ダイナミクス記憶ネットワークのノードのうちの勝者ノードのパラメータは、学習データとしての入力時系列データと媒介時系列データとのセットのうちの入力時系列データ、及び勝者ノードの位置の座標(x,y)の影響を最も強く受けるように更新される。また、他のノードのパラメータは、勝者ノードとの間の距離が遠いノードほど、入力時系列データ、及び勝者ノードの位置の座標(x,y)の影響が小さくなるように更新される。

次に、図６のフローチャートを参照して、図１の下位階層のダイナミクス記憶ネットワーク処理部１３による学習処理について説明する。

学習部２１は、ステップＳ１１において、ネットワーク記憶部２４に記憶されたダイナミクス記憶ネットワークのすべてのパラメータの初期化を行う。具体的には、ダイナミクス記憶ネットワークの各ノードの内部状態量を持つ力学系近似モデル４１（図３）のパラメータに適当な値が初期値として付与される。

ここで、ダイナミクス記憶ネットワークのノードが有する力学系近似モデル４１が、例えば、RNNである場合には、ステップＳ１１では、そのRNNのユニットに入力される信号に与えられる結合重み等を、力学系近似モデル４１のパラメータとして、そのパラメータに適当な初期値がセットされる。

その後、処理は、ステップＳ１１からステップＳ１２に進み、学習部２１に対して、学習データが供給される。

すなわち、信号入力部１１から特徴量抽出部１２に対して、適当な長さの観測信号が供給されると、特徴量抽出部１２は、信号入力部１１からの観測信号から特徴量を抽出し、その特徴量の時系列を、入力時系列データとして、ダイナミクス記憶ネットワーク処理部１３の学習部２１に供給する。

一方、媒介信号供給部１４は、特徴量抽出部１２から学習部２１に対しての、入力時系列データの供給のタイミングに同期して、媒介時系列データを、学習部２１に供給する。

以上のようにして、学習部２１に対して、入力時系列データと媒介時系列データとのセットである学習データが供給される。

その後、処理は、ステップＳ１２からステップＳ１３に進み、学習部２１は、学習データに対する、ネットワーク記憶部２４に記憶されたダイナミクス記憶ネットワークの各ノードのスコアの計算を、ノードが有する、内部状態量を持つ力学系近似モデル４１の内部状態量を更新しながら行う。

ここで、内部状態量を持つ力学系近似モデル４１が、例えば、RNNである場合には、所定の基準値を基準として値を変えていく（更新していく）変数の値のうちの、スコアを最も良くする値が、内部状態量としてのRNNのコンテキストの初期値に決定され、コンテキストを初期値から更新しながら、スコアの計算が行われる。

なお、コンテキストの初期値の決定に用いる所定の基準値としては、例えば、ランダムな値や、前回のRNNのパラメータの更新時に求められた、コンテキストの最終的な更新値（以下、適宜、前回更新値という）などを採用することができる。

例えば、今回のRNNのパラメータの更新時に学習部２１に供給された入力時系列データと、前回のRNNのパラメータの更新時に学習部２１に供給された入力時系列データとが、何らの関係もないことが分かっている場合には、コンテキストの初期値の決定に用いる所定の基準値としては、ランダムな値を採用することができる。

また、例えば、今回のRNNのパラメータの更新時に学習部２１に供給された入力時系列データと、前回のRNNのパラメータの更新時に学習部２１に供給された入力時系列データとが、連続する時系列データなどのように、何らかの関係を有することが分かっている場合には、コンテキストの初期値の決定に用いる所定の基準値としては、前回更新値を採用することができる。なお、前回更新値を、コンテキストの初期値の決定に用いる所定の基準値として採用する場合には、前回更新値を、そのまま、コンテキストの初期値に決定することができる。

ネットワーク記憶部２４に記憶されたダイナミクス記憶ネットワークのすべてのノードのスコアが求められると、処理は、ステップＳ１３からステップＳ１４に進み、学習部２１は、ダイナミクス記憶ネットワークを構成するノードそれぞれのスコアを比較することによって、最もスコアの良いノードを、学習データに最も適合するノードである勝者ノードに決定して、処理は、ステップＳ１５に進む。

ステップＳ１５では、学習部２１は、ネットワーク記憶部２４に記憶されたダイナミクス記憶ネットワークの各ノードの学習重みを、図５で説明したように、勝者ノードを中心として決定し、各ノード（図３）の学習調整部４２に供給する。

その後、処理は、ステップＳ１５からステップＳ１６に進み、学習部２１は、学習データとしての入力時系列データと媒介時系列データとのセットのうちの、媒介時系列データを調整し、その調整後の学習データを、ネットワーク記憶部２４に記憶されたダイナミクス記憶ネットワークの各ノード（図３）の学習調整部４２に供給する。

すなわち、ステップＳ１６では、学習部２１は、学習データのうちの媒介時系列データを、勝者ノードの位置の座標(x,y)を表す定常信号に変換し、その変換後の学習データを、各ノードの学習調整部４２に供給する。

さらに、ステップＳ１６では、学習部２１は、調整後の媒介時系列データ、すなわち、勝者ノードの位置の座標(x,y)を表す定常信号を、下位媒介信号として出力して、処理は、ステップＳ１７に進む。ここで、ステップＳ１６において、学習部２１が出力する下位媒介信号は、媒介信号供給部１４に供給され、さらに、媒介信号供給部１４から上位階層のダイナミクス記憶ネットワーク処理部１５に供給される。

ステップＳ１７では、ネットワーク記憶部２４に記憶されたダイナミクス記憶ネットワークの各ノード（図３）の学習調整部４２が、学習部２１からの学習データを用い、内部状態量を持つ力学系近似モデル４１のパラメータの更新を、学習部２１からの学習重みに応じて、BPTT法により行う。

ここで、勝者ノードのパラメータだけを更新する方法はWTA(winner-take-all)に対応し、勝者ノードの近傍のノードに対してもパラメータの更新を行う方法がSMA(soft-max adaptation)に対応する。学習部２１は、SMAで、ダイナミクス記憶ネットワーク（のノードが有する力学系近似モデル４１）のパラメータの更新を行う。

その後、信号入力部１１から特徴量抽出部１２に対して、新たな観測信号が供給されるのを待って、ステップＳ１２に戻り、以下、ステップＳ１２ないしＳ１７の処理が繰り返される。

以上のように、下位階層のダイナミクス記憶ネットワーク処理部１３において、ステップＳ１２ないしＳ１７の処理が繰り返されることで、ネットワーク記憶部２４のダイナミクス記憶ネットワークでは、入力時系列データとノードの位置の座標(x,y)とのセットのダイナミクスが自己組織的に学習され、記憶される。

さらに、勝者ノードの座標(x,y)の時系列が、下位媒介信号として、下位階層のダイナミクス記憶ネットワーク処理部１３から媒介信号供給部１４に供給される。

媒介信号供給部１４は、下位媒介信号としての勝者ノードの座標(x,y)の時系列を、適切な長さの時系列データに区切り、媒介信号として、上位階層のダイナミクス記憶ネットワーク処理部１５に供給する。

下位階層のダイナミクス記憶ネットワーク処理部１３では、上述したように、入力時系列データと媒介時系列データとのセットを、学習データとして、学習処理が行われるが、上位階層のダイナミクス記憶ネットワーク処理部１５では、媒介信号供給部１４からの媒介信号としての、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データを、学習データとして、学習処理が行われる。

図７のフローチャートを参照して、図１の上位階層のダイナミクス記憶ネットワーク処理部１５による学習処理について説明する。

学習部３１は、ステップＳ２１において、ネットワーク記憶部３４に記憶されたダイナミクス記憶ネットワークのすべてのパラメータの初期化を、図６のステップＳ１１の場合と同様に行って、処理は、ステップＳ２２に進む。

ステップＳ２２では、学習部３１に対して、学習データが供給される。

すなわち、下位階層のダイナミクス記憶ネットワーク処理部１３が図６の学習処理を行うことにより、上述したように、媒介信号供給部１４が、媒介信号として、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データを、上位階層のダイナミクス記憶ネットワーク処理部１５に供給するが、ステップＳ２２では、その媒介信号が、学習データとして、学習部３１に供給される。

その後、処理は、ステップＳ２２からステップＳ２３に進み、学習部３１は、学習データに対する、ネットワーク記憶部３４に記憶されたダイナミクス記憶ネットワークの各ノードのスコアの計算を、ノードが有する、内部状態量を持つ力学系近似モデル４１の内部状態量を更新しながら、図６のステップＳ１３の場合と同様に行う。

ネットワーク記憶部３４に記憶されたダイナミクス記憶ネットワークのすべてのノードのスコアが求められると、処理は、ステップＳ２３からステップＳ２４に進み、学習部３１は、ダイナミクス記憶ネットワークを構成するノードそれぞれのスコアを比較することによって、最もスコアの良いノードを、学習データに最も適合するノードである勝者ノードに決定して、処理は、ステップＳ２５に進む。

ステップＳ２５では、学習部３１は、ネットワーク記憶部３４に記憶されたダイナミクス記憶ネットワークの各ノードの学習重みを、図５で説明したように、勝者ノードを中心として決定し、学習データとともに、各ノード（図４）の学習調整部４２に供給して、処理は、ステップＳ２６に進む。

ステップＳ２６では、ネットワーク記憶部３４に記憶されたダイナミクス記憶ネットワークの各ノード（図４）の学習調整部４２が、学習部３１からの学習データを用い、内部状態量を持つ力学系近似モデル４１のパラメータの更新を、学習部３１からの学習重みに応じて、BPTT法により行う。

その後、媒介信号供給部１４から上位階層のダイナミクス記憶ネットワーク処理部１５に対して、新たな媒介信号が供給されるのを待って、ステップＳ２２に戻り、以下、ステップＳ２２ないしＳ２６の処理が繰り返される。

以上のように、上位階層のダイナミクス記憶ネットワーク処理部１５において、ステップＳ２２ないしＳ２６の処理が繰り返されることで、ネットワーク記憶部３４のダイナミクス記憶ネットワークでは、媒介信号供給部１４からの媒介信号のダイナミクスが自己組織的に学習され、記憶される。

ここで、媒介信号供給部１４から上位階層のダイナミクス記憶ネットワーク処理部１５に供給される媒介信号は、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データである。

したがって、上位階層のダイナミクス記憶ネットワーク処理部１５のダイナミクス記憶ネットワークでは、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データ、つまり、その勝者ノードの軌跡のダイナミクスが学習され、記憶される。

なお、下位階層のダイナミクス記憶ネットワーク処理部１３において、図６の学習処理が行われる場合には、上位階層のダイナミクス記憶ネットワーク処理部１５では、図７の学習処理の他、認識生成処理が行われる。

上位階層のダイナミクス記憶ネットワーク処理部１５が行う認識生成処理では、その詳細については後述するが、大ざっぱには、ネットワーク記憶部３４に記憶されたダイナミクス記憶ネットワークのノードのうちの、媒介信号供給部１４から供給された媒介信号に対する勝者ノードを用い、その勝者ノードが保持するダイナミクスを有する時系列データが生成される。

この時系列データは、上位媒介信号として、上位階層のダイナミクス記憶ネットワーク処理部１５から、媒介信号供給部１４に供給される。媒介信号供給部１４は、上位階層のダイナミクス記憶ネットワーク処理部１５からの上位媒介信号を、適切な長さの時系列データに区切り、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給する。

下位階層のダイナミクス記憶ネットワーク処理部１３では、以上のようにして、媒介信号供給部１４から供給される媒介時系列データを用いて、図６の学習処理が行われる。

ここで、上述したように、上位階層のダイナミクス記憶ネットワーク処理部１５のダイナミクス記憶ネットワークでは、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの軌跡のダイナミクスが学習される。

したがって、上位階層のダイナミクス記憶ネットワーク処理部１５において、ネットワーク記憶部３４に記憶されたダイナミクス記憶ネットワーク（以下、適宜、上位階層ネットワークともいう）のノードを用いて生成される、そのノードが保持するダイナミクスを有する時系列データは、下位階層のダイナミクス記憶ネットワーク処理部１３の勝者ノードの（位置の座標(x,y)の）遷移を表す。

その結果、上位階層のダイナミクス記憶ネットワーク処理部１５による認識生成処理によれば、下位階層のダイナミクス記憶ネットワーク処理部１３のネットワーク記憶部２４に記憶されたダイナミクス記憶ネットワーク（以下、適宜、下位階層ネットワークともいう）における勝者ノードの軌跡を表す時系列データが生成され、媒介信号供給部１４を経由して、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給されることになる。

一方、下位階層のダイナミクス記憶ネットワーク処理部１３による図６の学習処理によれば、下位階層ネットワークの各ノードは、入力時系列データと、そのノードの位置の座標(x,y)とのセットのダイナミクスを獲得する。

以上により、下位階層のダイナミクス記憶ネットワーク処理部１３では、上位階層のダイナミクス記憶ネットワーク処理部１５で生成された時系列データに基づき、いわば、勝者ノードの切り替えが生じる。

すなわち、下位階層のダイナミクス記憶ネットワーク処理部１３では、上位階層のダイナミクス記憶ネットワーク処理部１５で生成された時系列データが表す座標(x,y)の位置にあるノードが、勝者ノードになりやすくなる。

例えば、上位階層のダイナミクス記憶ネットワーク処理部１５において、上位階層ネットワークの、あるノードが有する力学系近似モデル４１としてのRNNから、３００サンプルの座標の時系列データが生成され、その時系列データの最初の１００サンプルのサンプル値が(0,0)（２次元空間の座標(x,y）)で、次の１００サンプルのサンプル値が(0,1)で、最後の１００サンプルのサンプル値が(1,1)であったとする。

また、下位階層ネットワークが、例えば、図２に示したように、２次元の格子状に配置された９個のノードN₁ないしN₉から構成されることとする。

この場合、上位階層のダイナミクス記憶ネットワーク処理部１５で生成された時系列データの最初の１００サンプルが、媒介信号供給部１４を経由して、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給されているとき、下位階層のダイナミクス記憶ネットワーク処理部１３では、座標(0,0)の位置にあるノードN₇が、勝者ノードになりやすくなる。

また、上位階層のダイナミクス記憶ネットワーク処理部１５で生成された時系列データの次の１００サンプルが、媒介信号供給部１４を経由して、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給されているとき、下位階層のダイナミクス記憶ネットワーク処理部１３では、座標(0,1)の位置にあるノードN₁が、勝者ノードになりやすくなり、上位階層のダイナミクス記憶ネットワーク処理部１５で生成された時系列データの最後の１００サンプルが、媒介信号供給部１４を経由して、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給されているとき、下位階層のダイナミクス記憶ネットワーク処理部１３では、座標(1,1)の位置にあるノードN₃が、勝者ノードになりやすくなる。

次に、図８のフローチャートを参照して、図１の下位階層のダイナミクス記憶ネットワーク処理部１３による認識処理について説明する。

ステップＳ３１において、認識部２２に対して、認識処理に用いる認識データが供給される。

すなわち、信号入力部１１から特徴量抽出部１２に対して、適当な長さの観測信号が供給されると、特徴量抽出部１２は、信号入力部１１からの観測信号から特徴量を抽出し、その特徴量の時系列を、入力時系列データとして、ダイナミクス記憶ネットワーク処理部１３の認識部２２に供給する。

一方、媒介信号供給部１４は、特徴量抽出部１２から認識部２２に対しての、入力時系列データの供給のタイミングに同期して、媒介時系列データを、認識部２２に供給する。

以上のようにして、認識部２２に対して、入力時系列データと媒介時系列データとのセットが、認識データとして供給される。

その後、処理は、ステップＳ３１からステップＳ３２に進み、認識部２２は、認識データに対する、下位階層ネットワークの各ノードのスコアの計算を、図６の学習処理の場合と同様に、ノードが有する、内部状態量を持つ力学系近似モデル４１の内部状態量を更新しながら行う。

下位階層ネットワークのすべてのノードのスコアが求められると、処理は、ステップＳ３２からステップＳ３３に進み、認識部２２は、下位階層ネットワークを構成するノードそれぞれのスコアを比較することによって、最もスコアの良いノードを、認識データに最も適合するノードである勝者ノードに決定して、処理は、ステップＳ３４に進む。

ステップＳ３４では、認識部２２は、認識データとしての入力時系列データと媒介時系列データとのセットのうちの、媒介時系列データを調整し、その調整後の認識データを、媒介信号供給部１４に供給する。

すなわち、ステップＳ３４では、認識部２２は、図６の学習処理の場合と同様に、認識データのうちの媒介時系列データを、勝者ノードの位置の座標(x,y)を表す定常信号に変換し、下位媒介信号として出力する。認識部２２が出力する下位媒介信号は、媒介信号供給部１４に供給される。

その後、処理は、ステップＳ３４からステップＳ３５に進み、認識部２２は、勝者ノードを表す情報を、入力時系列データの認識結果として出力して、処理は終了する。

ここで、認識部２２が出力した認識結果は、信号出力部１６（図１）を介して、例えば、外部に出力することができる。

また、その後、信号入力部１１から特徴量抽出部１２に対して、新たな観測信号が供給されると、ステップＳ３１からの認識処理が再開される。

以上のように、下位階層のダイナミクス記憶ネットワーク処理部１３において認識処理が行われることにより、下位階層ネットワークの勝者ノードの座標(x,y)の時系列が、下位媒介信号として、下位階層のダイナミクス記憶ネットワーク処理部１３から媒介信号供給部１４に供給される。

上位階層のダイナミクス記憶ネットワーク処理部１５では、媒介信号供給部１４からの媒介信号としての、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データを、認識データとして、認識処理を行うことができる。

図９のフローチャートを参照して、図１の上位階層のダイナミクス記憶ネットワーク処理部１５による認識処理について説明する。

ステップＳ４１において、認識部３２に対して、認識データが供給される。

すなわち、下位階層のダイナミクス記憶ネットワーク処理部１３が図８の認識処理を行うことにより、上述したように、媒介信号供給部１４が、媒介信号として、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データを、上位階層のダイナミクス記憶ネットワーク処理部１５に供給するが、ステップＳ４１では、その媒介信号が、認識データとして、認識部３２に供給される。

その後、処理は、ステップＳ４１からステップＳ４２に進み、認識部３２は、認識データに対する、上位階層ネットワークの各ノードのスコアの計算を、ノードが有する、内部状態量を持つ力学系近似モデル４１の内部状態量を更新しながら、図６のステップＳ１３の場合と同様に行う。

上位階層ネットワークのすべてのノードのスコアが求められると、処理は、ステップＳ４２からステップＳ４３に進み、認識部３２は、上位階層ネットワークを構成するノードそれぞれのスコアを比較することによって、最もスコアの良いノードを、認識データに最も適合するノードである勝者ノードに決定して、処理は、ステップＳ４４に進む。

ステップＳ４４では、認識部３２は、勝者ノードを表す情報を、認識データの認識結果として出力して、処理は終了する。

ここで、認識部３２が出力した認識結果は、信号出力部１６（図１）を介して、例えば、外部に出力することができる。

なお、以上のように、上位階層のダイナミクス記憶ネットワーク処理部１５は、下位階層ダイナミクス記憶ネットワーク処理部１３と同様に、認識処理を行うことができるが、上位階層のダイナミクス記憶ネットワーク処理部１５が認識処理だけを単独で行う必要はない（上位階層のダイナミクス記憶ネットワーク処理部１５が、認識処理だけを単独で行うことはない）。

また、下位階層のダイナミクス記憶ネットワーク処理部１３において、図８の認識処理が行われる場合には、上位階層のダイナミクス記憶ネットワーク処理部１５では、下位階層のダイナミクス記憶ネットワーク処理部１３で学習処理が行われる場合と同様に、認識生成処理が行われる。

上位階層のダイナミクス記憶ネットワーク処理部１５による認識生成処理では、上述したように、下位階層ネットワークにおける勝者ノードの軌跡を表す時系列データが生成され、媒介信号供給部１４を経由して、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給される。

したがって、下位階層のダイナミクス記憶ネットワーク処理部１３では、上位階層のダイナミクス記憶ネットワーク処理部１５で生成された時系列データ、つまり、下位階層ネットワークの勝者ノードの軌跡を考慮して、認識処理が行われることになる。

次に、図１０のフローチャートを参照して、図１の下位階層のダイナミクス記憶ネットワーク処理部１３による生成処理について説明する。

図６の学習処理によれば、下位階層ネットワークの各ノードは、内部状態量を持つ力学系近似モデル４１によってダイナミクスを学習し、記憶（獲得）するが、その後は、その各ノードの内部状態量を持つ力学系近似モデル４１から、その力学系近似モデル４１によってモデル化されたダイナミクスを有する時系列データ（ダイナミクスとして獲得された時系列パターンの時系列データ）を生成することができる。

内部状態量を持つ力学系近似モデル４１としてRNNを用いた場合には、所定の内部状態量をRNNに与えることで、そのRNNを有するノードに保持されるダイナミクスから時系列データを容易に生成することができる。

具体的には、RNNの入力にある時刻tの状態ベクトルを与えると、次の時刻t+1の状態ベクトルが出力される。したがって、この操作を所定の時間ステップ分を行うことで、ダイナミクス記憶ネットワークの各ノードから、その所定の時間ステップ分に相当するサンプル数の時系列データを生成することができる。

すなわち、図１０のステップＳ５１において、下位階層のダイナミクス記憶ネットワーク処理部１３では、生成部２３が、下位階層ネットワークのノードのうちの、どのダイナミクスに対応するノードから時系列データを生成するかを決定する。

ここで、時系列データの生成に用いられるノードを、以下、適宜、生成ノードともいう。生成処理では、生成部２３は、例えば、下位階層ネットワークのノードの中から、１個のノードをランダムに選択し、そのノードを、生成ノードに決定する。あるいは、生成部２３は、例えば、ユーザからの指示に応じて、下位階層ネットワークのノードの中から、生成ノードとするノードを決定する。

生成ノードが決定されると、処理は、ステップＳ５１からステップＳ５２に進み、生成部２３は、生成ノードに対して、生成ノードの位置の座標(x,y)を、媒介時系列データとして供給する（与える）。

その後、処理は、ステップＳ５２からステップＳ５３に進み、生成部２３は、生成ノードに与えた媒介時系列データを用い、生成ノードが保持する内部状態量を持つ力学系近似モデル４１のパラメータに基づき、時系列データを、力学系近似モデル４１の内部状態量を更新しながら生成して、処理は、ステップＳ５４に進む。

ステップＳ５４では、生成部２３は、生成ノードの力学系近似モデル４１から生成された時系列データを出力して、処理は終了する。

ここで、生成部２３が出力する時系列データは、センサモータ信号の特徴量であるが、そのセンサモータ信号の特徴量は、例えば、信号出力部１６（図１）において、センサモータ信号に変換され、そのセンサモータ信号のうちのモータ信号が、自律型ロボットに供給される。

なお、力学系近似モデル４１が、例えば、RNNである場合、生成部２３での時系列データの生成時には、内部状態量としてのRNNのコンテキストユニット（図３）に入力されるコンテキストの初期値、及び入力ユニット（図３）に入力されるデータの初期値として、例えば、ランダムな値が用いられる。

また、ある時刻t+1においてRNNの入力ユニット（図３）に入力されるデータとしては、直前の時刻tにおいてRNNの出力層から出力された、時刻t+1のデータの予測値が用いられる。

さらに、RNNの媒介ユニット（図３）に入力されるデータとしては、ステップＳ５２において、生成部２３が生成ノードに媒介時系列データとして供給する、生成ノードの位置の座標(x,y)が用いられる。

以上のように、下位階層のダイナミクス記憶ネットワーク処理部１３では、下位階層ネットワークが獲得したダイナミクスに基づき、必要に応じて、時系列データを生成することができる。例えば、ある生成ノードを用い、その生成ノードが有する力学系近似モデル４１としてのRNNから、１００サンプルの時系列データを生成した場合、１００サンプルの時系列データは、生成ノードが有する力学系近似モデル４１としてのRNNが獲得したダイナミクスを有する学習データと同じような特性の時系列データとなる。

次に、図１１のフローチャートを参照して、図１の上位階層のダイナミクス記憶ネットワーク処理部１５による生成処理について説明する。

ステップＳ６１において、上位階層のダイナミクス記憶ネットワーク処理部１５では、生成部３３が、上位階層ネットワークのノードから、生成ノードとするノードを、例えば、図１０のステップＳ５１の場合と同様に決定し、処理は、ステップＳ６２に進む。

ステップＳ６２では、生成部３３は、生成ノードが保持する内部状態量を持つ力学系近似モデル４１のパラメータに基づき、時系列データを、力学系近似モデル４１の内部状態量を更新しながら生成して、処理は、ステップＳ６３に進む。

ステップＳ６３では、生成部３３は、生成ノードの力学系近似モデル４１から生成された時系列データを出力して、処理は終了する。

ここで、生成部３３が出力する時系列データは、下位階層ネットワークのノードの位置の座標(x,y)の時系列データであるが、その時系列データは、例えば、信号出力部１６（図１）を介して、外部に出力することができる。

また、生成部３３が出力する時系列データは、媒介信号供給部１４を経由して、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給することができる。

この場合、下位階層のダイナミクス記憶ネットワーク処理部１３では、図１０の生成処理のステップＳ５１において、媒介信号供給部１４からの媒介時系列データが表す座標(x,y)の位置（又は、その位置に最も近い位置）にある下位階層ネットワークのノードを生成ノードに決定し、その生成ノードを用いて、時系列データを生成することができる。

例えば、いま、上位階層のダイナミクス記憶ネットワーク処理部１５において、図１１の生成処理によって、上位階層ネットワークの生成ノードとしての、あるノードが有する力学系近似モデル４１としてのRNNから、３００サンプルの座標の時系列データが生成され、その時系列データの最初の１００サンプルのサンプル値が(0,0)で、次の１００サンプルのサンプル値が(0,1)で、最後の１００サンプルのサンプル値が(1,1)であったとする。

この場合、上位階層のダイナミクス記憶ネットワーク処理部１５で生成された時系列データの最初の１００サンプルが、媒介信号供給部１４を経由して、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給されるとき、下位階層のダイナミクス記憶ネットワーク処理部１３では、図１０の生成処理において、座標(0,0)の位置にあるノードN₇を生成ノードとして用いて、時系列データが生成される。

また、上位階層のダイナミクス記憶ネットワーク処理部１５で生成された時系列データの次の１００サンプルが、媒介信号供給部１４を経由して、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給されるとき、下位階層のダイナミクス記憶ネットワーク処理部１３では、図１０の生成処理において、座標(0,1)の位置にあるノードN₁を生成ノードとして用いて、時系列データが生成され、上位階層のダイナミクス記憶ネットワーク処理部１５で生成された時系列データの最後の１００サンプルが、媒介信号供給部１４を経由して、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給されるとき、下位階層のダイナミクス記憶ネットワーク処理部１３では、図１０の生成処理において、座標(1,1)の位置にあるノードN₃を生成ノードとして用いて、時系列データが生成される。

なお、以上のように、上位階層のダイナミクス記憶ネットワーク処理部１５は、下位階層ダイナミクス記憶ネットワーク処理部１３と同様に、生成処理を行うことができるが、上位階層のダイナミクス記憶ネットワーク処理部１５が生成処理だけを単独で行う必要はない（上位階層のダイナミクス記憶ネットワーク処理部１５が、生成処理だけを単独で行うことはない）。

次に、図１２のフローチャートを参照して、図１の下位階層のダイナミクス記憶ネットワーク処理部１３による認識生成処理について説明する。

上述したように、認識生成処理によれば、自律型ロボットの認知行動を実現することができる。

下位階層のダイナミクス記憶ネットワーク処理部１３において、内部状態量を持つ力学系近似モデル４１によってダイナミクスを学習した下位階層ネットワークを用いて、認識生成を行う場合、図８の認識処理と図１０の生成処理を逐次的に組み合わせるだけでは、力学系近似モデル４１の内部状態量を考慮した認識生成を行うことは困難である。

そこで、下位階層のダイナミクス記憶ネットワーク処理部１３は、内部状態記憶部２５において、図８の認識処理において更新された力学系近似モデル４１の内部状態量（内部状態）を記憶し、その内部状態量を図１０の生成処理において用いることで、観測信号から得られる時刻tの入力時系列データに対して、次の時刻t+1の入力時系列データの予測値を生成する認識生成処理を行う。

認識生成処理では、ステップＳ７１において、認識部２２に対して、認識データが供給される。

その後、処理は、ステップＳ７１からステップＳ７２に進み、認識部２２は、認識データに対する、下位階層ネットワークの各ノードのスコアの計算を、図６の学習処理の場合と同様に、ノードが有する、内部状態量を持つ力学系近似モデル４１の内部状態量を更新しながら行う。

但し、ステップＳ７２のスコアの計算では、認識部２２は、内部状態記憶部２５から前回更新されて記憶されている内部状態量を読み込み、その内部状態記憶部２５から読み込んだ値を、力学系近似モデル４１の内部状態量（例えば、RNNのコンテキスト）の初期値とする。

下位階層ネットワークのすべてのノードのスコアが求められると、処理は、ステップＳ７２からステップＳ７３に進み、認識部２２は、下位階層ネットワークを構成するノードそれぞれのスコアを比較することによって、最もスコアの良いノードを、認識データに最も適合するノードである勝者ノードに決定する。

さらに、ステップＳ７３では、認識部２２は、勝者ノードが決定されたときの内部状態量の更新値（更新された内部状態量）と、その勝者ノードが決定されたときの内部状態量の初期値とを、内部状態記憶部２５に保存する（記憶させる）。

ここで、内部状態記憶部２５に記憶された内部状態量の更新値は、認識部２２での次回のスコアの計算を行うステップＳ７２において、力学系近似モデル４１の内部状態量（例えば、RNNのコンテキスト）の初期値として用いられる。

また、内部状態記憶部２５に記憶された内部状態量の初期値は、生成部２３において、時系列データの生成時に用いられる。

その後、認識部２２は、勝者ノードを表す情報を出力し、処理は、ステップＳ７３からステップＳ７４に進む。認識部２２が出力した情報は、生成部２３に供給される。

ステップＳ７４では、認識部２２は、認識データとしての入力時系列データと媒介時系列データとのセットのうちの、媒介時系列データを調整し、その調整後の認識データを、媒介信号供給部１４に供給する。

すなわち、ステップＳ７４では、認識部２２は、図６の学習処理の場合と同様に、認識データのうちの媒介時系列データを、勝者ノードの位置の座標(x,y)を表す定常信号に変換し、下位媒介信号として出力する。ステップＳ７４において認識部２２が出力する下位媒介信号は、媒介信号供給部１４に供給され、さらに、媒介信号供給部１４から、上位階層のダイナミクス記憶ネットワーク処理部１５に供給される。

その後、処理は、ステップＳ７４からステップＳ７５に進み、生成部２３は、下位階層ネットワークのノードのうちの、認識部２２からの情報が表す勝者ノードを、生成ノードとして、その生成ノードが保持する内部状態量を持つ力学系近似モデル４１のパラメータに基づき、時系列データを、力学系近似モデル４１の内部状態量を更新しながら生成して、処理は、ステップＳ７６に進む。

すなわち、生成部２３は、内部状態記憶部２５の記憶値を、ネットワーク記憶部２４に記憶されたダイナミクス記憶ネットワークの生成ノードの力学系近似モデル４１の内部状態量の初期値として読み込む。

つまり、生成部２３は、内部状態記憶部２５の記憶値のうちの、生成ノードが認識部２２において勝者ノードに決定されたときの内部状態量の初期値を読み出し、生成ノードの力学系近似モデル４１の内部状態量の初期値にセットする。

さらに、生成部２３は、認識データのうちの入力時系列データを、生成ノードの力学系近似モデル４１に与えるとともに、生成ノードの位置の座標(x,y)を、媒介時系列データとして、生成ノードの力学系近似モデル４１に与え、その力学系近似モデル４１の内部状態量を更新しながら、時系列データを生成する。

具体的には、力学系近似モデル４１が、例えば、RNNである場合、RNNのコンテキストユニット（図３）に対して、内部状態記憶部２５の記憶値のうちの、生成ノードが認識部２２において勝者ノードに決定されたときのコンテキストの初期値が、時系列データを生成するときのコンテキストの初期値として入力される。

さらに、RNNの入力ユニット（図３）に対して、認識データのうちの入力時系列データが入力され、RNNの媒介ユニット（図３）に対して、生成ノードの位置の座標(x,y)が入力される。

そして、力学系近似モデル４１の内部状態量を更新しながら、認識データのうちの入力時系列データの次の時刻の入力時系列データの予測値としての時系列データが生成される。

ステップＳ７６では、生成部２３は、生成ノードの力学系近似モデル４１から生成された時系列データを出力して、処理は、ステップＳ７１に戻り、以下、ステップＳ７１ないしＳ７６の処理が繰り返される。

生成部２３が出力する時系列データは、センサモータ信号の特徴量であるが、そのセンサモータ信号の特徴量は、例えば、信号出力部１６（図１）において、センサモータ信号に変換され、そのセンサモータ信号のうちのモータ信号が、自律型ロボットに供給される。

以上のような、図１２ステップＳ７１ないしＳ７６の認識生成処理が、１時刻ごとに行われることで、ロボットは認知行動を行う。

下位階層のダイナミクス記憶ネットワーク処理部１３において、図１２の認識生成処理が行われる場合（さらには、上述したように、図６の学習処理、及び図８の認識処理が行われる場合も）、上位階層のダイナミクス記憶ネットワーク処理部１５では、認識生成処理が行われる。

図１３のフローチャートを参照して、図１の上位階層のダイナミクス記憶ネットワーク処理部１５による認識生成処理について説明する。

下位階層のダイナミクス記憶ネットワーク処理部１３において、図１２の認識生成処理が行われる場合、下位階層ネットワークの勝者ノード（生成ノード）の座標(x,y)の時系列が、下位媒介信号として、下位階層のダイナミクス記憶ネットワーク処理部１３から媒介信号供給部１４に供給される。

上位階層のダイナミクス記憶ネットワーク処理部１５では、媒介信号供給部１４からの媒介信号としての、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データを、認識データとして、認識生成処理が行われる。

上位階層のダイナミクス記憶ネットワーク処理部１５の認識生成処理では、ステップＳ８１において、認識部３２に対して、認識データが供給される。

すなわち、下位階層のダイナミクス記憶ネットワーク処理部１３が図１２の認識生成処理を行うことにより、上述したように、媒介信号供給部１４が、媒介信号として、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データを、上位階層のダイナミクス記憶ネットワーク処理部１５に供給するが、ステップＳ８１では、その媒介信号が、認識データとして、認識部３２に供給される。

その後、処理は、ステップＳ８１からステップＳ８２に進み、認識部３２は、認識データに対する、上位階層ネットワークの各ノードのスコアの計算を、図６の学習処理の場合と同様に、ノードが有する、内部状態量を持つ力学系近似モデル４１の内部状態量を更新しながら行う。

但し、ステップＳ８２のスコアの計算では、認識部３２は、内部状態記憶部３５から前回更新されて記憶されている内部状態量を読み込み、その内部状態記憶部３５から読み込んだ値を、力学系近似モデル４１の内部状態量（例えば、RNNのコンテキスト）の初期値とする。

そして、認識部３２は、認識部２２が図１２の認識生成処理で行う場合と同様に、認識データを用い、ノードが有する力学系近似モデル４１の内部状態量を更新しながら、スコアの計算を行う。

上位階層ネットワークのすべてのノードのスコアが求められると、処理は、ステップＳ８２からステップＳ８３に進み、認識部３２は、上位階層ネットワークを構成するノードそれぞれのスコアを比較することによって、最もスコアの良いノードを、認識データに最も適合するノードである勝者ノードに決定する。

さらに、ステップＳ８３では、認識部３２は、勝者ノードが決定されたときの内部状態量の更新値（更新された内部状態量）と、その勝者ノードが決定されたときの内部状態量の初期値とを、内部状態記憶部３５に保存する（記憶させる）。

ここで、内部状態記憶部３５に記憶された内部状態量の更新値は、認識部３２での次回のスコアの計算を行うステップＳ８２において、力学系近似モデル４１の内部状態量（例えば、RNNのコンテキスト）の初期値として用いられる。

また、内部状態記憶部３５に記憶された内部状態量の初期値は、生成部３３において、時系列データの生成時に用いられる。

その後、認識部３２は、勝者ノードを表す情報を出力し、処理は、ステップＳ８３からステップＳ８４に進む。認識部３２が出力した情報は、生成部３３に供給される。

ステップＳ８４では、生成部３３は、上位階層ネットワークのノードのうちの、認識部３２からの情報が表す勝者ノードを、生成ノードとして、その生成ノードが保持する内部状態量を持つ力学系近似モデル４１のパラメータに基づき、時系列データを、力学系近似モデル４１の内部状態量を更新しながら生成して、処理は、ステップＳ８５に進む。

すなわち、生成部３３は、内部状態記憶部３５の記憶値を、ネットワーク記憶部２４に記憶されたダイナミクス記憶ネットワークの生成ノードの力学系近似モデル４１の内部状態量の初期値として読み込む。

つまり、生成部３３は、内部状態記憶部３５の記憶値のうちの、生成ノードが認識部３２において勝者ノードに決定されたときの内部状態量の初期値を読み出し、生成ノードの力学系近似モデル４１の内部状態量の初期値にセットする。

さらに、生成部３３は、認識データ、つまり、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データを、生成ノードの力学系近似モデル４１に与え、その力学系近似モデル４１の内部状態量を更新しながら、時系列データを生成する。

具体的には、力学系近似モデル４１が、例えば、RNNである場合、RNNのコンテキストユニット（図４）に対して、内部状態記憶部３５の記憶値のうちの、生成ノードが認識部３２において勝者ノードに決定されたときのコンテキストの初期値が、時系列データを生成するときのコンテキストの初期値として入力される。

さらに、RNNの入力ユニット（図３）に対して、認識データ、つまり、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データが入力される。

そして、力学系近似モデル４１の内部状態量を更新しながら、認識データ、つまり、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データの次の時刻の予測値としての時系列データ、すなわち、下位階層ネットワークのノードのうちの、次の時刻に勝者ノードとなるであろうノードの位置の座標(x,y)の予測値が生成される。

ステップＳ８５では、生成部３３は、生成ノードの力学系近似モデル４１から生成された時系列データを出力して、処理は、ステップＳ８１に戻り、以下、ステップＳ８１ないしＳ８６の処理が繰り返される。

生成部３３が出力する時系列データは、上位媒介信号として、媒介信号供給部１４に供給される。媒介信号供給部１４は、生成部３３からの上位媒介信号を、適切な長さに区切り、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給する。

次に、図１４を参照して、図１の媒介信号供給部１４の処理について説明する。

媒介信号供給部１４は、上位階層のダイナミクス記憶ネットワーク処理部１５から供給される上位媒介信号を、一定の時間間隔でサンプリングされた時系列データとして、その時系列データから、例えば、１００サンプル等の所定のサンプル数のサンプルを、１サンプルずつシフトしながら逐次抽出し、その結果得られる１００サンプルの時系列データを、媒介時系列データとして、下位階層のダイナミクス記憶ネットワーク処理部１３に供給する。

また、媒介信号供給部１４は、下位階層のダイナミクス記憶ネットワーク処理部１３から供給される下位媒介信号を、一定の時間間隔でサンプリングされた時系列データとして、その時系列データから、媒介時系列データよりもサンプル数が多い、例えば、３００サンプル等を、１サンプルずつシフトしながら逐次抽出し、その結果得られる３００サンプルの時系列データを、力学系近似モデル４１としての、例えば、RNNの入力層の入力ユニットに入力される入力データとして、上位階層のダイナミクス記憶ネットワーク処理部１５に供給する。

なお、媒介信号供給部１４は、下位階層のダイナミクス記憶ネットワーク処理部１３に供給する媒介時系列データの長さ（サンプル数）や、供給のタイミングを、特徴量抽出部１２が出力する入力時系列データに応じて調整する。

すなわち、例えば、特徴量抽出部１２が、各時刻において、入力時系列データとして１００サンプルを出力する場合、媒介信号供給部１４は、その入力時系列データと同一のサンプル数である１００サンプルの媒介時系列データを、特徴量抽出部１２が入力時系列データを出力するタイミングと同一のタイミングで、下位階層のダイナミクス記憶ネットワーク処理部１３に供給する。

次に、ダイナミクス記憶ネットワーク処理部１３及び１５において、例えば、認識生成処理が行われていることとして、媒介信号供給部１４の処理について説明する。

例えば、いま、下位階層のダイナミクス記憶ネットワーク処理部１３が、時刻tにおいて、時刻tの入力時系列データと、媒介信号供給部１４からの時刻tの媒介時系列データとのセットを認識データとして、図１２の認識生成処理（以下、適宜、下位階層認識生成処理という）を行ったこととすると、時刻tにおける下位階層認識生成処理では、時刻tの下位媒介信号が、下位階層のダイナミクス記憶ネットワーク処理部１３から媒介信号供給部１４に供給される（Ａ）。

ここで、時刻tの下位媒介信号は、時刻tにおける下位階層認識生成処理で、勝者ノードとなったノードの位置の座標(x,y)を表す。

媒介信号供給部１４は、下位階層のダイナミクス記憶ネットワーク処理部１３からの下位媒介信号としての時系列データから、下位階層のダイナミクス記憶ネットワーク処理部１３に供給される入力時系列データのサンプル数よりも多いサンプル数の時系列データ（例えば、上述したように、３００サンプルの時系列データ）を抽出し、入力データとして、上位階層のダイナミクス記憶ネットワーク処理部１５に供給する（Ｂ）。

以上のように、上位階層のダイナミクス記憶ネットワーク処理部１５には、下位階層のダイナミクス記憶ネットワーク処理部１５に供給される入力時系列データのサンプル数よりも多いサンプル数の時系列データが、入力データとして供給されるので、上位階層のダイナミクス記憶ネットワーク処理部１５では、下位階層のダイナミクス記憶ネットワーク処理部１３が扱う時系列データよりも時間的に長い時系列データ（ひいては、いわば、よりマクロなダイナミクス）が扱われる。

上位階層のダイナミクス記憶ネットワーク処理部１５は、時刻tにおいて、媒介信号供給部１４からの入力データを、認識データとして、図１３の認識生成処理（以下、適宜、上位階層認識生成処理という）を行い、これにより、下位階層のダイナミクス記憶ネットワーク処理部１３における勝者ノードの座標(x,y)の時系列データの次の時刻t+1の予測値としての時系列データ、すなわち、下位階層ネットワークのノードのうちの、次の時刻t+1に勝者ノードとなるであろうノードの位置の座標(x,y)の予測値が生成される。

上位階層のダイナミクス記憶ネットワーク処理部１５は、時刻t+1の下位階層ネットワークの勝者ノードの位置の座標(x,y)の予測値の時系列データを、上位媒介信号として、媒介信号供給部１４に供給する（Ｃ）。

媒介信号供給部１４は、上位階層のダイナミクス記憶ネットワーク処理部１５からの上位媒介信号から、入力時系列データのサンプル数に等しいサンプル数のサンプルを抽出し、時刻t+1の媒介時系列データとして、次の時刻t+1の入力時系列データが特徴量抽出部１２から出力されるタイミングで、下位階層のダイナミクス記憶ネットワーク処理部１３に供給する（Ｄ）。

下位階層のダイナミクス記憶ネットワーク処理部１３では、時刻t+1において、特徴量抽出部１２が出力する時刻t+1の入力時系列データと、媒介信号供給部１４からの時刻t+1の媒介時系列データとのセットを認識データとして、図１２の下位階層認識生成処理が行われる。

そして、時刻t+1における下位階層認識生成処理では、時刻t+1の下位媒介信号が、下位階層のダイナミクス記憶ネットワーク処理部１３から媒介信号供給部１４に供給され（Ａ）、以下、同様の処理が繰り返される。

なお、下位階層のダイナミクス記憶ネットワーク処理部１３において、最初に、下位階層認識生成処理が行われるときには、上位階層のダイナミクス記憶ネットワーク処理部１５では、まだ、上位階層認識処理が行われていないため、媒介信号供給部１４は、下位階層のダイナミクス記憶ネットワーク処理部１３が下位階層認識生成処理を行うために、所定の時系列データを、最初の媒介時系列データとして供給する。

最初の媒介時系列データとしては、例えば、下位階層ネットワークのノードの位置の座標としてとり得る範囲の値の乱数を採用することができる。また、最初の媒介時系列データとしては、例えば、下位階層ネットワークの各ノードごとに、そのノードの位置の座標を与えることができる。

以上のように、図１のデータ処理装置では、媒介信号供給部１４が、下位階層のダイナミクス記憶ネットワーク処理部１３と、上位階層のダイナミクス記憶ネットワーク処理部１５とに、媒介信号を供給することにより、下位階層ネットワークと上位階層ネットワークとが、密接に相互に作用する階層構造が構成され、そのような階層構造を構成する下位階層ネットワークと上位階層ネットワークにおいて、供給される時系列データの力学的な特性がダイナミクスとして記憶される。すなわち、下位階層ネットワークには、いわば基本単位となるダイナミクスが記憶され、上位階層ネットワークには、下位階層のノードの遷移がダイナミクスとして記憶される。

したがって、下位階層ネットワーク、及び上位階層ネットワークの全体において、多数のダイナミクスを効率的に、学習、記憶することができ、さらに、そのような多数のダイナミクスを利用して、認識生成処理を行うことで、多様な認知行動を行う自律型ロボットを実現することができる。

次に、図１５は、本発明を適用したデータ処理装置の他の一実施の形態の構成例を示すブロック図である。

なお、図中、図１の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図１５において、データ処理装置は、ダイナミクス記憶部５１が新たに設けられている他は、図１の場合と同様に構成されている。

なお、図１５では、信号入力部１１、特徴量抽出部１２、及び信号出力部１６の図示は、省略してある。

図１のデータ処理装置では、媒介信号として、下位階層ネットワークのノードの位置の、２次元座標系上の座標(x,y)を採用したため、媒介信号は、２次元の信号（２次元のベクトル）となる。

ここで、下位階層ネットワークのノードが有する力学系近似モデル４１（図３）としての、例えば、RNNの入力層には、媒介信号を入力することができるだけの媒介ユニットを設ける必要がある。したがって、媒介信号が２次元の信号である場合には、RNNの入力層には、２個の媒介ユニットが必要となる。

媒介信号としては、２次元の信号の他、２次元以上のN次元の信号を採用することが可能である。

すなわち、媒介信号としては、下位階層ネットワークのノードの位置の座標(x,y)を表す定常信号に代えて、例えば、下位階層ネットワークの各ノードが保持するダイナミクスに応じて、不動点ダイナミクスやリミットサイクルダイナミクスを有するN次元の時系列データを採用することができる。

媒介信号となるN次元の時系列データのダイナミクスとしては、例えば、３次元空間上において、原点を中心とする円運動を与えるリミットサイクルダイナミクスを採用することができる。このようなリミットサイクルダイナミクスとしては、円運動における半径距離や周期などの組み合わせによって、様々なリミットサイクルダイナミクスがある。

図１５において、ダイナミクス記憶部５１は、あらかじめ設計された、N次元空間上における不動点ダイナミクスやリミットサイクルダイナミクス等のダイナミクスを記憶している。

また、下位階層ネットワークの各ノードには、そのノードが保持するダイナミクスに応じて、ダイナミクス記憶部５１に記憶されたダイナミクスが割り当てられている。

この場合、媒介信号供給部１４は、ダイナミクス記憶部５１に記憶されたダイナミクスのうちの、下位階層ネットワークの勝者ノードに割り当てられたダイナミクスを有するN次元の時系列データを生成し、上位階層のダイナミクス記憶ネットワーク処理部１５に供給する。

上位階層のダイナミクス記憶ネットワーク処理部１５では、学習処理において、媒介信号供給部１４からのN次元の時系列データを学習データとして学習が行われ、これにより、上位階層ネットワークにおいて、ダイナミクス記憶部５１に記憶されたダイナミクスを組み合わせたアトラクタダイナミクスが自己組織的に学習され、記憶される。

そして、上位階層のダイナミクス記憶ネットワーク処理部１５は、認識生成処理において、上位階層ネットワークに記憶されたアトラクタダイナミクスを有する時系列データを、上位媒介信号として、媒介信号供給部１４に供給する。

媒介信号供給部１４は、上位階層のダイナミクス記憶ネットワーク処理部１５からの上位媒介信号から、媒介時系列データとなる時系列データを抽出し、下位階層のダイナミクス記憶ネットワーク処理部１３に供給する。

下位階層のダイナミクス記憶ネットワーク処理部１３では、媒介信号供給部１４から供給される媒介時系列データ、すなわち、上位階層ネットワークに記憶されたアトラクタダイナミクスを有する時系列データを用いて学習処理や認識生成処理等が行われる。

なお、下位階層のダイナミクス記憶ネットワーク処理部１３の学習処理では、下位階層ネットワークにおける各ノードのパラメータの更新が、そのノードに割り当てられたダイナミクスを有する時系列データを媒介時系列データとして用いて行われる。その結果、下位階層ネットワークにおける各ノードには、入力時系列データと、そのノードに割り当てられたダイナミクスを有する時系列データとのセットのダイナミクスが記憶される。

また、下位階層のダイナミクス記憶ネットワーク処理部１３では、下位階層ネットワークの勝者ノードの情報が、下位媒介信号として、媒介信号供給部１４に供給される。媒介信号供給部１４は、上述したように、ダイナミクス記憶部５１に記憶されたダイナミクスのうちの、下位媒介信号が表す下位階層ネットワークの勝者ノードに割り当てられたダイナミクスを有するN次元の時系列データを生成し、上位階層のダイナミクス記憶ネットワーク処理部１５に供給する。

以上のように、図１５のデータ処理装置では、媒介信号供給部１４から上位階層のダイナミクス記憶ネットワーク処理部１５に供給される媒介信号としての時系列データが、下位階層ネットワークのノードの位置の座標(x,y)ではなく、下位階層ネットワークの勝者ノードに割り当てられた、ダイナミクス記憶部５１に記憶されたダイナミクスを有するN次元の時系列データである点が、図１のデータ処理装置と異なる。

さらに、図１５のデータ処理装置では、媒介信号供給部１４から下位階層のダイナミクス記憶ネットワーク処理部１３に供給される媒介信号としての時系列データが、下位階層ネットワークのノードの位置の座標(x,y)ではなく、上位階層ネットワークにおいて、ダイナミクス記憶部５１に記憶されたダイナミクスを有するN次元の時系列データから獲得されたダイナミクスを有するN次元の時系列データである点が、図１のデータ処理装置と異なる。

なお、図１のデータ処理装置のように、媒介信号供給部１４から下位階層のダイナミクス記憶ネットワーク処理部１３、及び上位階層のダイナミクス記憶ネットワーク処理部１５に供給される媒介信号として、下位階層ネットワークのノードの位置の座標(x,y)（を表す定常信号）を採用することは、２次元空間の格子状の点に配置される不動点ダイナミクスをあらかじめ用意しておき、その浮動点ダイナミクスを、下位階層ネットワークの各ノードに、そのノードの２次元空間上の位置に応じてを割り当てることに相当する。

したがって、図１５のデータ処理装置のように、ダイナミクス記憶部５１に記憶された、N次元空間上における不動点ダイナミクスやリミットサイクルダイナミクス等のダイナミクスを、下位階層ネットワークの各ノードに割り当てる方法は、下位階層ネットワークのノードに対して割り当てられるダイナミクスを、より一般化した方法であるということができる。

図１５のデータ処理装置では、以上のように、ダイナミクス記憶部５１に記憶されたN次元空間上における不動点ダイナミクスやリミットサイクルダイナミクス等のダイナミクスを、下位階層ネットワークの各ノードに割り当て、媒介信号供給部１４から上位階層のダイナミクス記憶ネットワーク処理部１５に対して、下位階層ネットワークの勝者ノードに割り当てられた、ダイナミクス記憶部５１に記憶されたダイナミクスを有するN次元の時系列データを、媒介信号として供給するので、上位階層ネットワークは、入力時系列データのダイナミクスの遷移のダイナミクス（入力時系列データのダイナミクスを、いわばマクロに見たもの）を、ダイナミクス記憶部５１に記憶されたダイナミクスで表したものを学習し、記憶する。

したがって、ダイナミクス記憶部５１に、２次元空間や３次元空間上のダイナミクスを記憶させておくことにより、上位階層ネットワークでは、入力時系列データのダイナミクスの遷移のダイナミクスを、ダイナミクス記憶部５１に記憶されたダイナミクスに低次元化して記憶することができる。その結果、図１５のデータ処理装置全体として、多数のダイナミクスを効率的に学習し、記憶することができる。

以上のように、図１及び図１５のデータ処理装置によれば、２つのダイナミクス記憶ネットワーク処理部１３及び１５のうちの、一方のダイナミクス記憶ネットワーク処理部１３を下位階層とするとともに、他方のダイナミクス記憶ネットワーク処理部１５を上位階層として、下位階層のダイナミクス記憶ネットワーク処理部１３の下位階層ネットワークと、上位階層のダイナミクス記憶ネットワーク処理部１５の上位階層ネットワークとの間を媒介するための媒介信号を、下位階層のダイナミクス記憶ネットワーク処理部１３、及び上位階層のダイナミクス記憶ネットワーク処理部１５に供給するので、下位階層ネットワークと上位階層ネットワークとは、２階層の階層構造を構成する。

そして、学習処理では、媒介信号を含む時系列データに基づき、２階層の階層構造を構成する下位階層ネットワーク及び上位階層ネットワークの各ダイナミクスを自己組織的に更新するので、ダイナミクスを効率的に記憶することができる。

また、認識生成処理では、２階層の階層構造を構成する下位階層ネットワーク、及び上位階層ネットワークにおいて、媒介信号を含む時系列データに最も適合するダイナミクスを保持する勝者ノードを決定し、さらには、その勝者ノードが保持するダイナミクスを有する時系列データを生成するので、ダイナミクスを効率的に記憶した下位階層ネットワーク及び上位階層ネットワークを利用して、時系列データの認識や生成を行うことができる。

次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。

そこで、図１６は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。

プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク１０５やROM１０３に予め記録しておくことができる。

あるいはまた、プログラムは、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)，MO(Magneto Optical)ディスク，DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体１１１に、一時的あるいは永続的に格納（記録）しておくことができる。このようなリムーバブル記録媒体１１１は、いわゆるパッケージソフトウエアとして提供することができる。

なお、プログラムは、上述したようなリムーバブル記録媒体１１１からコンピュータにインストールする他、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部１０８で受信し、内蔵するハードディスク１０５にインストールすることができる。

コンピュータは、CPU(Central Processing Unit)１０２を内蔵している。CPU１０２には、バス１０１を介して、入出力インタフェース１１０が接続されており、CPU１０２は、入出力インタフェース１１０を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部１０７が操作等されることにより指令が入力されると、それに従って、ROM(Read Only Memory)１０３に格納されているプログラムを実行する。あるいは、また、CPU１０２は、ハードディスク１０５に格納されているプログラム、衛星若しくはネットワークから転送され、通信部１０８で受信されてハードディスク１０５にインストールされたプログラム、またはドライブ１０９に装着されたリムーバブル記録媒体１１１から読み出されてハードディスク１０５にインストールされたプログラムを、RAM(Random Access Memory)１０４にロードして実行する。これにより、CPU１０２は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU１０２は、その処理結果を、必要に応じて、例えば、入出力インタフェース１１０を介して、LCD(Liquid Crystal Display)やスピーカ等で構成される出力部１０６から出力、あるいは、通信部１０８から送信、さらには、ハードディスク１０５に記録等させる。

ここで、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含むものである。

また、プログラムは、１のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。

なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

すなわち、ダイナミクス記憶ネットワークのノードが有するモデルとしては、例えば、内部状態量を有しない力学系近似モデルや、力学系近似モデル以外のダイナミクスの学習及び記憶を行うことができるモデルを採用することができる。

また、本実施の形態では、データ処理装置（図１、及び図１５）に、２つのダイナミクス記憶ネットワーク処理部１３及び１５を設けることとしたが、３以上のダイナミクス記憶ネットワーク処理部を設けることが可能である。

例えば、図１のデータ処理装置には、２つのダイナミクス記憶ネットワーク処理部１３及び１５に加えて、ダイナミクス記憶ネットワーク処理部１５の、さらに上位階層のダイナミクス記憶ネットワーク処理部（以下、３番目のダイナミクス記憶ネットワーク処理部という）を設けることが可能である。

この場合、ダイナミクス記憶ネットワーク処理部１５と、３番目のダイナミクス記憶ネットワーク処理部との間に、媒介信号供給部１４と同様の媒介信号供給部（以下、２番目の媒介信号供給部という）が設けられる。

そして、２番目の媒介信号供給部は、ダイナミクス記憶ネットワーク処理部１５を下位階層とし、３番目のダイナミクス記憶ネットワーク処理部を上位階層として、媒介信号を供給する。

なお、２番目の媒介信号供給部が、３番目のダイナミクス記憶ネットワーク処理部に供給する媒介信号は、ダイナミクス記憶ネットワーク処理部１５のダイナミクス記憶ネットワークの勝者ノードの位置の座標であり、したがって、２番目の媒介信号供給部が、ダイナミクス記憶ネットワーク処理部１５に供給する媒介信号は、ダイナミクス記憶ネットワークのノードの位置の座標である。

そして、ダイナミクス記憶ネットワーク処理部１５のダイナミクス記憶ネットワークのノードは、ダイナミクス記憶ネットワーク処理部１３のダイナミクス記憶ネットワークのノード（図３）と同様に構成され、ダイナミクス記憶ネットワーク処理部１５は、媒介信号供給部１４から供給される媒介信号を、入力時系列データに対応する時系列データとするとともに、２番目の媒介信号供給部から供給される媒介信号を、媒介時系列データに対応する時系列データとして、その２つの時系列データのセットを対象として、ダイナミクス記憶ネットワーク処理部１３と同様の処理を行う。

また、３番目のダイナミクス記憶ネットワーク処理部のダイナミクス記憶ネットワークのノードは、ダイナミクス記憶ネットワーク処理部１５のダイナミクス記憶ネットワークのノード（図４）と同様に構成され、３番目のダイナミクス記憶ネットワーク処理部は、２番目の媒介信号供給部から供給される媒介信号を対象として、図１のデータ処理装置が、２つのダイナミクス記憶ネットワーク処理部１３及び１５で構成される場合の、ダイナミクス記憶ネットワーク処理部１５と同様の処理を行う。

以上のように、媒介信号供給部１４において、ダイナミクス記憶ネットワーク処理部１３及び１５のダイナミクス記憶ネットワークどうしの間を媒介するための媒介信号を、ダイナミクス記憶ネットワーク処理部１３及び１５に供給するとともに、２番目の媒介信号供給部において、ダイナミクス記憶ネットワーク処理部１５と３番目のダイナミクス記憶ネットワーク処理部のダイナミクス記憶ネットワークどうしの間を媒介するための媒介信号を、ダイナミクス記憶ネットワーク処理部１５と３番目のダイナミクス記憶ネットワーク処理部に供給することで、ダイナミクス記憶ネットワーク処理部１３，１５、及び、３番目のダイナミクス記憶ネットワーク処理部のダイナミクス記憶ネットワークは、ダイナミクス記憶ネットワーク処理部１３のダイナミクス記憶ネットワークを最下位階層とし、ダイナミクス記憶ネットワーク処理部１５のダイナミクス記憶ネットワークを最下位階層から２番目の階層とし、３番目のダイナミクス記憶ネットワーク処理部のダイナミクス記憶ネットワークを最上位階層とする３階層の階層構造を構成する。

本発明を適用したデータ処理装置の一実施の形態の構成例を示すブロック図である。ダイナミクス記憶ネットワークの例を、模式的に示す図である。ノードの構成例を、模式的に示す図である。ノードの構成例を、模式的に示す図である。学習重みを決定する方法を説明する図である。学習処理を説明するフローチャートである。学習処理を説明するフローチャートである。認識処理を説明するフローチャートである。認識処理を説明するフローチャートである。生成処理を説明するフローチャートである。生成処理を説明するフローチャートである。認識生成処理を説明するフローチャートである。認識生成処理を説明するフローチャートである。媒介信号供給部１４の処理を説明する図である。本発明を適用したデータ処理装置の他の一実施の形態の構成例を示すブロック図である。本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

符号の説明

１１信号入力部，１２特徴量抽出部，１３ダイナミクス記憶ネットワーク処理部，１４媒介信号供給部，１５ダイナミクス記憶ネットワーク処理部，１６信号出力部，２１学習部，２２認識部，２３生成部，２４ネットワーク記憶部，２５内部状態記憶部，３１学習部，３２認識部，３３生成部，３４ネットワーク記憶部，３５内部状態記憶部，４１力学系近似モデル，４２学習調整部，５１ダイナミクス記憶部，１０１バス，１０２ CPU，１０３ ROM，１０４ RAM，１０５ハードディスク，１０６出力部，１０７入力部，１０８通信部，１０９ドライブ，１１０入出力インタフェース，１１１リムーバブル記録媒体

Claims

ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段と、
供給される時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する学習手段と
を有する少なくとも２つのダイナミクス記憶ネットワーク処理手段と、
前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記上位階層及び下位階層のダイナミクス記憶ネットワーク処理手段に供給する供給手段と
を備え、
前記学習手段は、前記供給手段から供給される前記媒介信号を含む時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する
データ処理装置。
前記学習手段は、
供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、
前記勝者ノードから各ノードまでの距離に応じて、各ノードが保持するダイナミクスを更新する程度を表す学習重みを決定し、
各ノードが保持するダイナミクスを、各ノードの学習重みに応じて、供給される時系列データのダイナミクスに近くなるように、自己組織的に更新する
請求項１に記載のデータ処理装置。
前記ノードは、内部状態量を持つ力学系近似モデルによってモデル化されたダイナミクスを保持する
請求項１に記載のデータ処理装置。
前記ノードは、リカレントニューラルネットワークによってモデル化されたダイナミクスを保持する
請求項１に記載のデータ処理装置。
前記供給手段は、前記下位階層のダイナミクス記憶ネットワーク処理手段の前記ダイナミクス記憶ネットワークを構成するノードの位置の座標を表す信号を、前記媒介信号として供給する
請求項１に記載のデータ処理装置。
前記下位階層のダイナミクス記憶ネットワーク処理手段の前記ダイナミクス記憶ネットワークを構成するノードに割り当てられるダイナミクスを記憶するダイナミクス記憶手段をさらに備え、
前記供給手段は、前記ダイナミクス記憶手段に記憶されたダイナミクスを有する時系列データを、前記媒介信号として供給する
請求項１に記載のデータ処理装置
前記ダイナミクス記憶ネットワーク処理手段は、供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードを表す情報を、供給される時系列データの認識結果として出力する認識手段をさらに有する
請求項１に記載のデータ処理装置。
前記ダイナミクス記憶ネットワーク処理手段は、時系列データの生成に用いるノードである生成ノードを決定し、前記生成ノードが保持するダイナミクスを有する時系列データを生成する生成手段をさらに有する
請求項１に記載のデータ処理装置。
前記ダイナミクス記憶ネットワーク処理手段は、
供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードを表す情報を、供給される時系列データの認識結果として出力する認識手段と、
前記認識手段が出力する情報が表す勝者ノードを、時系列データの生成に用いるノードである生成ノードに決定し、前記生成ノードが保持するダイナミクスを有する時系列データを生成する生成手段と
をさらに有する
請求項１に記載のデータ処理装置。
ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段と、
供給される時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する学習手段と
を有する少なくとも２つのダイナミクス記憶ネットワーク処理手段
を備えるデータ処理装置のデータ処理方法において、
前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記下位階層のダイナミクス記憶ネットワーク処理手段に供給するステップと、
前記媒介信号を、前記上位階層のダイナミクス記憶ネットワーク処理手段に供給するステップと、
前記学習手段が、前記媒介信号を含む時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新するステップと
を含むデータ処理方法。
コンピュータを、
ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段と、
供給される時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する学習手段と
を有する少なくとも２つのダイナミクス記憶ネットワーク処理手段と、
前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記上位階層及び下位階層のダイナミクス記憶ネットワーク処理手段に供給する供給手段と
して機能させるためのプログラムであり、
前記学習手段が、前記供給手段から供給される前記媒介信号を含む時系列データに基づき、前記ダイナミクス記憶ネットワークの各ダイナミクスを自己組織的に更新する
プログラム。
ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段と、
供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードを表す情報を、供給される時系列データの認識結果として出力する認識手段と、
前記認識手段が出力する情報が表す勝者ノードを、時系列データの生成に用いるノードである生成ノードに決定し、前記生成ノードが保持するダイナミクスを有する時系列データを生成する生成手段と
を有する少なくとも２つのダイナミクス記憶ネットワーク処理手段と、
前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記上位階層及び下位階層のダイナミクス記憶ネットワーク処理手段に供給する供給手段と
を備え、
前記認識手段は、前記供給手段から供給される前記媒介信号を含む時系列データに最も適合するダイナミクスを保持する勝者ノードを決定する
データ処理装置。
前記ノードは、内部状態量を持つ力学系近似モデルによって、ダイナミクスを保持し、
前記認識手段は、供給される時系列データに基づいて、前記内部状態量を更新しながら、供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、
前記ダイナミクス記憶ネットワーク処理手段は、前記勝者ノードを決定する処理において得られる前記内部状態量を記憶する内部状態記憶手段をさらに有し、
前記生成手段は、前記内部状態記憶手段の記憶値に基づいて、前記生成ノードの力学系近似モデルの前記内部状態量を決定して、その内部状態量を更新しながら、時系列データを生成する
請求項１２に記載のデータ処理装置。
ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段と、
供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードを表す情報を、供給される時系列データの認識結果として出力する認識手段と、
前記認識手段が出力する情報が表す勝者ノードを、時系列データの生成に用いるノードである生成ノードに決定し、前記生成ノードが保持するダイナミクスを有する時系列データを生成する生成手段と
を有する少なくとも２つのダイナミクス記憶ネットワーク処理手段
を備えるデータ処理装置のデータ処理方法において、
前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記下位階層のダイナミクス記憶ネットワーク処理手段に供給するステップと、
前記媒介信号を、前記上位階層のダイナミクス記憶ネットワーク処理手段に供給するステップと、
前記認識手段が、前記供給手段から供給される前記媒介信号を含む時系列データに最も適合するダイナミクスを保持する勝者ノードを決定するステップと
を含むデータ処理方法。
コンピュータを、
ダイナミクスを１つのノードに保持し、複数のノードによって構成されるダイナミクス記憶ネットワークを記憶するネットワーク記憶手段と、
供給される時系列データに最も適合するダイナミクスを保持するノードである勝者ノードを決定し、その勝者ノードを表す情報を、供給される時系列データの認識結果として出力する認識手段と、
前記認識手段が出力する情報が表す勝者ノードを、時系列データの生成に用いるノードである生成ノードに決定し、前記生成ノードが保持するダイナミクスを有する時系列データを生成する生成手段と
を有する少なくとも２つのダイナミクス記憶ネットワーク処理手段と、
前記２つのダイナミクス記憶ネットワーク処理手段のうちの、一方を下位階層のダイナミクス記憶ネットワーク処理手段とするとともに、他方を上位階層のダイナミクス記憶ネットワーク処理手段として、前記下位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークと、前記上位階層のダイナミクス記憶ネットワーク処理手段のダイナミクス記憶ネットワークとの間を媒介するための媒介信号を、前記上位階層及び下位階層のダイナミクス記憶ネットワーク処理手段に供給する供給手段と
して機能させるためのプログラムであり、
前記認識手段が、前記供給手段から供給される前記媒介信号を含む時系列データに最も適合するダイナミクスを保持する勝者ノードを決定する
プログラム。