JP2007280053A

JP2007280053A - データ処理装置、データ処理方法、およびプログラム

Info

Publication number: JP2007280053A
Application number: JP2006105544A
Authority: JP
Inventors: Kazumi Aoyama; 一美青山; Kotaro Sabe; 浩太郎佐部; Hideki Shimomura; 秀樹下村
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2006-04-06
Filing date: 2006-04-06
Publication date: 2007-10-25
Anticipated expiration: 2026-04-06
Also published as: US20070280006A1; US7725412B2; JP4201012B2

Abstract

【課題】処理の負担を軽減する。
【解決手段】SOMの一種である入力ネットワークnet₁₁は、空間的な配置構造が与えられた複数のノードから構成され、各ノードは、時系列パターンを表現する時系列パターンモデルを有している。時系列データである入力データの学習時において、時刻tのフレームの入力データに対する勝者ノードN_tの決定後、次のフレームである、時刻t+1のフレームの入力データに対する勝者ノードN_t+1の決定は、その時刻t+1のフレームの入力データの直前の時刻tのフレームの入力データに対する勝者ノードN_tとの距離が所定の距離以内のノードだけを対象にして行われる。本発明は、例えば、ロボットなどに適用できる。
【選択図】図３１

Description

本発明は、データ処理装置、データ処理方法、およびプログラムに関し、特に、例えば、ロボット等における処理の負担を軽減することができるようにするデータ処理装置、データ処理方法、およびプログラムに関する。

例えば、自律的にタスクを行うロボットの実現には、順モデルまたは逆モデルを利用することができる。

図１は、順モデルと逆モデルの概念を示している。

ある時系列データ（時系列のデータ）としての入力データに対して、他の時系列データとしての出力データを出力する制御対象が与えられ、制御対象に関する詳細な情報はわからないが（制御対象の内部がわからないが）、制御対象に与えられる入力データと、その入力データに対して制御対象から得られる出力データは観測することができることとする。

ここで、制御対象に与えられる入力データと、その入力データに対して制御対象から得られる出力データとは、観測することができれば、どのような物理量でも良い。また、制御対象は、入力データを与えることができ、かつ、その入力データに対して出力データを得ることができるものであれば、どのような対象（もの）でも良い。

従って、例えば、ボールや、楽器、自動車、ガスヒータその他の種々のものが、制御対象となり得る。即ち、例えば、ボールについては、入力データとしての力を加える（与える）ことで、その入力データに対して変化する出力データとしてのボールの位置や速度が得られる。また、例えば、自動車については、入力データとしてのハンドルや、アクセル、ブレーキなどの操作をする（与える）ことで、その入力データに対して変化する出力データとしての自動車の位置や速度を得ることができる。さらに、例えば、ガスヒータについては、入力データとしての火力を調整する操作をすることで、その入力データに対して変化する出力データとしての部屋の温度を得ることができる。

以上のように、制御対象に入力データを与え、それに対して出力データが得られる場合に、その制御対象をモデル化したもの（モデル）が順モデルである。

順モデルは、入力データを入力すると（入力データが与えられると）、その入力データに対して、制御対象から得られる出力データの推定値を出力する。従って、順モデルによれば、制御対象に対して、実際の入力データを与えなくても、その入力データに対して、制御対象から得られる出力データを推定することができる。

一方、制御対象から得られる出力データの目標値を決定し、その目標値となる出力データを得るために、制御対象に与えるべき入力データを推定することができるモデルが逆モデルである。順モデルは、入力データから出力データへの写像とみなすことができるが、その逆写像が逆モデルである。

ここで、逆モデルによって求められる、目標値となる出力データを得るために、制御対象に与えるべき入力データを、以下、適宜、制御データともいう。

以上のような順モデルや逆モデルは、上述したように、ロボット（の構成）に利用することができる。

即ち、いま、ロボットが、マイク（マイクロフォン）やカメラを備え、音声（音）データや画像データを入力することができ、かつ、スピーカやアクチュエータ（モータ）を備え、音声（音声データ）を出力し、また、モータデータ（モータ信号）にしたがってモータが駆動することにより、アームを動かすことができることとする。

かかるロボットにおいて、ある音声データや画像データなどの入力データに応じて、出力データとしての音声データを出力させ、また、所望のアームの動作をさせる出力データとしてのモータデータを出力させる場合、従来においては、音声認識装置や画像認識装置を用いて、ロボットに入力される音声データや画像データを認識した認識結果に応じて、どのような音声データを出力するべきか、あるいは、どのようなモータデータを出力するべきかを、あらかじめプログラミング（デザイン）しておくことが行われる。

これに対して、順モデルを利用すれば、図２に示すように、ある音声データや画像データに応じて、所望の音声データや、所望のアーム動作をさせるモータデータを出力するロボットを制御対象として想定し、その制御対象として想定したロボット（以下、適宜、想定ロボットと呼ぶ）の順モデルとして、実際のロボットを構成することが可能となる。即ち、想定ロボットに対する入力データと出力データの関係を、実際のロボットに学習させることができれば、想定ロボットの順モデルとしてのロボットを構成することができる。

具体的には、想定ロボットに入力する音声データや画像データなどの入力データと、想定ロボットが各入力データに対応して出力すべき音声データやモータデータなどの出力データとのセットをあらかじめ用意し、実際のロボットに与える。実際のロボットにおいて、外部から与えられた入力データと出力データのセット（以下、適宜、教示データという）だけを用いて、入力データに対応する出力データを推定する（出力する）想定ロボットの順モデルを求めることができれば、実際に入力される音声データや画像データなどの入力データに応じて、所望の音声データやモータデータなどの出力データを出力することが可能となる。

また、逆モデルを利用すれば、図３に示すように、ロボットのアームを制御対象として、その制御対象であるアームを制御するアーム制御器を構成することが可能となる。

即ち、いま、ロボットのアームが、入力データとしてのモータデータに応じて駆動するモータによって動き、その結果、アームの先端の位置が変化するとする。さらに、ロボットの重心を原点とし、ロボットの前方（正面）方向をx軸と、（ロボットから見て）右方向をｙ軸と、上方向をｚ軸と、それぞれする３次元座標系に基づき、その３次元座標系の(x,y,z)座標でアームの先端の位置を表すこととする。この場合、モータデータに応じてモータが駆動し、さらにアームの先端の位置が変化することで、アームの先端がある軌跡を描く。ここで、アームの先端が描く軌跡（先端位置軌跡）の座標のシーケンスを、先端位置軌跡データという。

アームが所望の先端位置軌跡を描くようにするには、つまり、出力データとしての所望の先端位置軌跡データを出力するようにするには、アームがそのような先端位置軌跡を描くようにモータを駆動するモータデータを、入力データとしてモータに与える必要がある。

いま、入力データとしてのモータデータと、そのモータデータがモータに与えられたときの出力データとしての先端位置軌跡データとのセットである教示データだけを用いて、出力データとしての、ある先端位置軌跡データを目標値として得ることができる入力データ（制御データ）としてのモータデータを推定するアームの逆モデルを求めることができれば、その逆モデルは、目標値である先端位置軌跡データに対して、対応するモータデータを決定するアーム制御器に利用することができる。

このようなアームの逆モデルとしてのアーム制御器によれば、ロボットに対して、入力データとしての先端位置軌跡データを入力すると、ロボットは、アーム制御器を用いることで、対応するモータデータ（制御データ）を決定することができる。そして、ロボットが、このモータデータにしたがってモータを駆動すれば、ロボットのアームは、入力データとしての先端位置軌跡データに対応した軌跡を描くように移動する。

以上のように、入力データと出力データとのセット（教示データ）だけを用いて、順モデルや逆モデルを求めることができれば、その順モデルや逆モデルを用いて、各入力データに応じた出力データを出力するロボットを、容易に構成することが可能となる。

以上のような順モデルや逆モデルを求める方法としては、線形システムを用いたモデル化がある。

線形システムを用いたモデル化では、例えば、図４に示すように、時刻tにおける、制御対象への入力データをu(t)とするとともに、出力データをy(t)として、出力データy(t)と入力データu(t)との関係、つまり制御対象を、例えば、式（１）および式（２）で与えられる線形システムとして近似する。

ここで、x(t)は、時刻tにおける線形システムの状態変数と呼ばれ、A, B, C は係数である。また、ここでは、説明を簡単にするために、入力データu(t)および出力データy(t)を１次元ベクトル（スカラ）とするとともに、状態変数x(t)をn次元ベクトルとすると（ここでは、nは２以上の整数値）、A,B,Cは、それぞれn×n行列、n×1行列、1×n行列で与えられる定数の行列となる。

線形システムを用いたモデル化では、観測することができる入力データu(t)と、その入力データu(t)が制御対象に与えられたときに観測される出力データy(t)との関係が、式（１）および式（２）を満たすように、行例A,B,Cを決定することで、制御対象の順モデルが得られる。

しかしながら、線形システムを用いたモデル化は、複雑な制御対象、即ち、例えば、非線形な特性を持つ制御対象をモデル化するには十分ではない。

即ち、現実の制御対象は複雑であり、非線形な特性を有することが少なくないが、かかる制御対象を、単純な線形システムとして近似してモデル化すると、順モデルが入力データに対して推定する出力データや、逆モデルが出力データに対して推定する入力データ（制御データ）の推定誤差が大になり、高精度の推定を行うことが困難となる。

そこで、非線形な特性を持つ制御対象に対する順モデルや逆モデルを得る方法としては、例えば、ニューラルネットワークを用いて、教示データ、即ち、制御対象に与えられる入力データと、その入力データが与えられたときに制御対象から観測される出力データとのセットを学習する方法がある。ここで、ニューラルネットワークとは、生体の神経細胞（ニューロン）を模擬した人工素子を相互接続して構成されるネットワークであり、外部から与えられる教示データの関係、つまり、入力データと出力データとの関係を学習することができる。

しかしながら、ニューラルネットワークによって、制御対象を適切にモデル化するには、制御対象の複雑性に応じて、ニューラルネットワークの規模を大にする必要がある。ニューラルネットワークの規模が大になると、学習に要する時間が飛躍的に増大し、また、安定した学習も難しくなる。このことは、入力データや出力データの次元数が大である場合も同様である。

一方、入力データと出力データとのセット（教示データ）だけを用いて、順モデルや逆モデルを求める場合には、教示データを用いて学習を行い、教示データが、幾つかのパターンのうちのいずれに該当するかを認識する必要がある。即ち、教示データとしての入力データや出力データのパターンを学習して認識する必要がある。

パターンを学習して認識を行う技術は、一般にパターン認識（pattern recognition）と呼ばれ、パターン認識における学習は、教師あり学習（supervised learning）と、教師なし学習（unsupervised learning）とに分けることができる。

教師あり学習とは、各パターンの学習データがどのクラスに属するかの情報（これを正解ラベルと呼ぶ）を与えて、各パターンごとに、そのパターンに属する学習データを学習する方法であり、ニューラルネットワークや、HMM（Hidden Markov Model）などを用いた学習方法が数多く提案されている。

ここで、図５は、教師あり学習の一例を示している。

教師あり学習では、学習に利用する学習データが、想定したカテゴリ（クラス）（例えば、各音素のカテゴリや、各音韻のカテゴリ、各単語のカテゴリなど）ごとに用意される。例えば、"A"，"B"，"C"という発声の音声データを学習する場合、"A"，"B"，"C"それぞれの多数の音声データが用意されることになる。

一方、学習に利用するモデル（各カテゴリの学習データを学習させるモデル）も、想定したカテゴリごとに用意される。ここで、モデルは、パラメータによって定義される。例えば、音声データの学習には、モデルとして、ＨＭＭなどが用いられるが、HMMは、ある状態から他の状態（元の状態を含む）に遷移する状態遷移確率や、HMMから出力される観測値の確率密度を表す出力確率密度関数などによって定義される。

教師あり学習では、各カテゴリ（クラス）のモデルの学習が、そのカテゴリの学習データのみを用いて行われる。即ち、図５では、カテゴリ"A"のモデルの学習は、カテゴリ"A"の学習データのみを用いて行われ、カテゴリ"B"のモデルの学習は、カテゴリ"B"の学習データのみを用いて行われる。同様に、カテゴリ"C"のモデルの学習も、カテゴリ"C"の学習データのみを用いて行われる。

教師あり学習においては、このように、各カテゴリの学習データを用いて、そのカテゴリのモデルの学習を行う必要があるため、カテゴリごとに、そのカテゴリの学習データを用意し、各カテゴリのモデルの学習に対して、そのカテゴリの学習データを与えて、カテゴリごとのモデルを得る。その結果、教師あり学習によれば、正解ラベルに基づき、クラスごとのテンプレート（正解ラベルが表すクラス（カテゴリ）のモデル）を得ることができる。

そして、認識時には、ある認識対象のデータに対し、その認識対象のデータに最も適合(match)するテンプレート（尤度が最も高いテンプレート、または距離や誤差が最小のテンプレート）が求められ、そのテンプレートの正解ラベルが、認識結果として出力される。

一方、教師なし学習は、各パターンの学習データに正解ラベルが与えられない状況で行われる学習であり、例えば、ニューラルネットなどを用いた学習方法があるが、正解ラベルが与えられないという点で、教師あり学習とは大きく異なる。

ところで、パターン認識は、そのパターン認識によって認識しようとする認識対象のデータ（信号）が観測される信号空間の量子化と見ることができる。特に、認識対象のデータがベクトルである場合のパターン認識は、ベクトル量子化（vector quantization）と呼ばれることがある。

ベクトル量子化の学習（コードブックの生成）では、認識対象のデータが観測される信号空間上に、クラスに対応する代表的なベクトル（これをセントロイドベクトルと呼ぶ）が配置される。

ベクトル量子化の教師なし学習として代表的な手法の一つに、K-平均法（K-means clustering method）がある。K-平均法は、初期状態として、セントロイドベクトルを適当に配置し、学習データとしてのベクトルを、最も距離の近いセントロイドベクトルに割り当て、各セントロイドベクトルに割り当てられた学習データの平均ベクトルによってセントロイドベクトルを更新することを繰り返す学習手法である。なお、セントロイドベクトルの集まりは、コードブックと呼ばれる。

ここで、多数の学習データを蓄積し、そのすべてを用いて学習を行う方法は、バッチ学習（batch learning）と呼ばれ、K-平均法は、バッチ学習に分類される。バッチ学習に対して、学習データを観測するたびに、その学習データを用いて学習を行い、パラメータ（セントロイドベクトルのコンポーネントや、HMMを定義する出力確率密度関数など）を少しずつ更新する学習は、オンライン学習（on-line learning）と呼ばれる。

オンライン学習としては、コホネン(T.Kohonen)の提案したSOM（self-organization map）による学習が知られている。SOMによる学習では、SOMの入力層と出力層の結合重みが、オンライン学習により少しずつ更新（修正）されていく。

即ち、SOMにおいて、出力層は、複数のノードを有し、出力層の各ノードには、重みベクトルが与えられる。この重みベクトルをセントロイドベクトルとした場合、ベクトル量子化における学習を行うことができる。

具体的には、SOMの出力層のノードにおいて、重みベクトルと、学習データとしてのベクトルとの距離が最も近いノードが、その学習データとしてのベクトルに最も適合する勝者ノードに決定され、その勝者ノードの重みベクトルが、学習データとしてのベクトルに近づくように更新される。さらに、勝者ノードの近傍のノードの重みベクトルも、学習データに少しだけ近づくように更新される。その結果、学習が進むにつれ、重みベクトルが類似したノードどうしは近くなるように、類似しないノードは遠くなるように、出力層の上に配置されていく。従って、出力層には、あたかも学習データに含まれるパターンに応じた地図が構成されていくことになる。このように、学習が進むにつれて、類似するノード（重みベクトルが類似するノード）どうしが近い位置に集まり、学習データに含まれるパターンに応じた地図が構成されていく学習は、自己組織的または自己組織化（self-organization）と呼ばれる。

ここで、K-平均法では、学習データに最も距離の近いベクトルのみが更新されることから、その更新方法はWTA(winner-take-all)と呼ばれる。一方、SOMによる学習では、学習データに最も距離の近いノード（勝者ノード）の重みベクトルだけでなく、勝者ノードの近傍のノードの重みベクトルも更新されるから、その更新方法はSMA(soft-max adaptation)と呼ばれる。WTAで学習を行うと学習結果が局所解に陥りやすいのに対して、SMAで学習を行うと、局所解に陥る問題を改善することができることが知られている。

なお、SOMに関しては、例えば、非特許文献１に記載されている。

T.コホネン、「自己組織化マップ」、シュプリンガー・フェアラーク東京

ところで、ロボットの実世界での振る舞い（行動）をより自然にするため、ロボット自身が自分の行動を通して認知行動の構造を獲得するための枠組みの研究が行われている。ここで、認知行動とは、例えば、ロボット等が、外部の状態（ロボット自身の状態も含む）を認知（認識）し、その認知結果に応じて行動をとることを意味する。

ロボットに認知行動を行わせるには、例えば、外部の状態を検知するセンサが出力するセンサデータに対して、ロボットを駆動するモータに供給されるモータデータとして、適切なモータデータを求める必要がある。

一般に、センサが出力するセンサデータと、モータに供給されるモータデータとは、いずれも連続的な時系列データである。また、実世界での認知行動を行うロボットでは、センサデータやモータデータとして、次元数の大きなデータを扱う必要がある。また、かかるロボットで扱うセンサデータやモータデータの振る舞いは複雑であり、線形システムでモデル化することは困難である。

そこで、センサデータやモータデータのような時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される時系列パターン記憶ネットワークによって、多次元のベクトルの時系列であるセンサデータやモータデータなどの時系列データを自己組織的に学習し、さらに、入力データとしての時系列データを学習した時系列パターン記憶ネットワークと、出力データとしての時系列データを学習した時系列パターン記憶ネットワークとのノードどうしを結合し、入力データに基づき、外部の状態を認知し、その認知結果に応じてロボットがとるべき行動に対応する出力データを生成する方法について、本件出願人は、先に提案している（例えば、特願2004-353382号）。

ここで、時系列パターン記憶ネットワークは、複数のノードから構成され、自己組織的な学習を行うことができる点で、従来のSOMと共通し、従って、SOMの範疇に含まれるので、SOMの一種であるということができる。但し、時系列パターン記憶ネットワークは、ノードが時系列パターンモデルを有し、その時系列パターンモデルによって記憶構造の中に、時系列パターンを保持することができる点で、従来のSOMとは異なる。

ところで、先に提案した方法では、入力データや出力データとしての時系列データを用いて、時系列パターン記憶ネットワークの学習が行われるが、その学習は、以下のように行われていた。

即ち、時系列パターン記憶ネットワークの学習は、時系列パターン記憶ネットワークのノードが、時系列データである入力データや出力データに適合する度合いを表すスコアを求め、そのスコアが最も良いノードを、時系列データに最も適合するノードである勝者ノードに決定し、その勝者ノードに基づいて、時系列パターン記憶ネットワークを、自己組織的に更新することにより行われていた。

従って、時系列パターン記憶ネットワークの学習にあたっては、勝者ノードを決定するために、時系列パターン記憶ネットワークを構成するノードすべてについて、スコアを計算する必要があった。このため、ノードの数が増加すると、その分、スコアの計算の処理の負担も増加することになっていた。

本発明は、このような状況に鑑みてなされたものであり、処理の負担を軽減することができるようにするものである。

本発明の一側面のデータ処理装置は、時系列データの処理を行うデータ処理装置であり、時系列データから、所定の時間単位の時系列データを抽出するデータ抽出手段と、空間的な配置構造が与えられた複数のノードから構成されるSOM（Self-Organization Map）のノードが、所定の時間単位の時系列データに適合する度合いを表すスコアを求め、前記スコアが最も良いノードを、所定の時間単位の時系列データに最も適合するノードである勝者ノードに決定する処理手段とを備え、前記処理手段が、前記SOMにおいて、１の所定の時間単位の時系列データの直前の所定の時間単位の時系列データに対する勝者ノードとの距離が所定の距離以内のノードである距離制限ノードについて、前記１の所定の時間単位の時系列データに対するスコアを求め、前記距離制限ノードのうちの、前記スコアが最も良いノードを、前記１の所定の時間単位の時系列データに対する勝者ノードに決定する。

本発明の一側面のデータ処理方法、またはプログラムは、時系列データの処理を行うデータ処理装置のデータ処理方法、または時系列データの処理を行うデータ処理を、コンピュータに実行させるプログラムであり、時系列データから、所定の時間単位の時系列データを抽出するデータ抽出ステップと、空間的な配置構造が与えられた複数のノードから構成されるSOM（Self-Organization Map）のノードが、所定の時間単位の時系列データに適合する度合いを表すスコアを求め、前記スコアが最も良いノードを、所定の時間単位の時系列データに最も適合するノードである勝者ノードに決定する処理ステップとを含み、前記処理ステップにおいて、前記SOMにおいて、１の所定の時間単位の時系列データの直前の所定の時間単位の時系列データに対する勝者ノードとの距離が所定の距離以内のノードである距離制限ノードについて、前記１の所定の時間単位の時系列データに対するスコアを求め、前記距離制限ノードのうちの、前記スコアが最も良いノードを、前記１の所定の時間単位の時系列データに対する勝者ノードに決定する。

本発明の一側面においては、時系列データから、所定の時間単位の時系列データが抽出される。そして、空間的な配置構造が与えられた複数のノードから構成されるSOMのノードが、所定の時間単位の時系列データに適合する度合いを表すスコアが求められ、前記スコアが最も良いノードが、所定の時間単位の時系列データに最も適合するノードである勝者ノードに決定される。この場合において、前記SOMにおいて、１の所定の時間単位の時系列データの直前の所定の時間単位の時系列データに対する勝者ノードとの距離が所定の距離以内のノードである距離制限ノードについて、前記１の所定の時間単位の時系列データに対するスコアが求められ、前記距離制限ノードのうちの、前記スコアが最も良いノードが、前記１の所定の時間単位の時系列データに対する勝者ノードに決定される。

本発明の一側面によれば、処理の負担を軽減することができる

以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。

本発明の一側面のデータ処理装置は、
時系列データの処理を行うデータ処理装置（例えば、図３２のデータ処理装置３０１）であり、
時系列データから、所定の時間単位の時系列データを抽出するデータ抽出手段（例えば、図３２のデータ抽出部３１２や３１５など）と、
空間的な配置構造が与えられた複数のノードから構成されるSOM（Self-Organization Map）（例えば、図２５の時系列パターン記憶ネットワークnet₁₁やnet₁₂）のノードが、所定の時間単位の時系列データに適合する度合いを表すスコアを求め、前記スコアが最も良いノードを、所定の時間単位の時系列データに最も適合するノードである勝者ノードに決定する処理手段（例えば、図３２の認識学習処理部１３２１や、認識部３１６）と
を備え、
前記処理手段は、
前記SOMにおいて、１の所定の時間単位の時系列データの直前の所定の時間単位の時系列データに対する勝者ノードとの距離が所定の距離以内のノードである距離制限ノードについて、前記１の所定の時間単位の時系列データに対するスコアを求め、
前記距離制限ノードのうちの、前記スコアが最も良いノードを、前記１の所定の時間単位の時系列データに対する勝者ノードに決定する。

本発明の一側面のデータ処理方法、またはプログラムは、
時系列データの処理を行うデータ処理装置のデータ処理方法、または時系列データの処理を行うデータ処理を、コンピュータに実行させるプログラムであり、
時系列データから、所定の時間単位の時系列データを抽出するデータ抽出ステップ（例えば、図３３のステップＳ３４１や、図３５のステップＳ３８１）と、
空間的な配置構造が与えられた複数のノードから構成されるSOM（Self-Organization Map）（例えば、図２５の時系列パターン記憶ネットワークnet₁₁やnet₁₂）のノードが、所定の時間単位の時系列データに適合する度合いを表すスコアを求め、前記スコアが最も良いノードを、所定の時間単位の時系列データに最も適合するノードである勝者ノードに決定する処理ステップ（例えば、図３３のステップＳ３４２や、図３５のステップＳ３８２）と
を含み、
前記処理ステップにおいて、
前記SOMにおいて、１の所定の時間単位の時系列データの直前の所定の時間単位の時系列データに対する勝者ノードとの距離が所定の距離以内のノードである距離制限ノードについて、前記１の所定の時間単位の時系列データに対するスコアを求め、
前記距離制限ノードのうちの、前記スコアが最も良いノードを、前記１の所定の時間単位の時系列データに対する勝者ノードに決定する。

以下、図面を参照して、本発明の実施の形態について説明するが、その前段階の準備として、時系列パターン記憶ネットワークについて説明する。

図６は、時系列パターン記憶ネットワークの例を模式的に示している。

時系列パターン記憶ネットワークは、時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークで、前述したように、SOMの一種である。時系列パターン記憶ネットワークは、そのネットワーク全体で、ノードの数だけの（クラス分けを行う）時系列パターンを記憶することができる。

図６においては、時系列パターン記憶ネットワークは、ノードN₁乃至N₆の６つのノードから構成されている。

時系列パターン記憶ネットワークを構成する各ノードN_i（図６では、ｉ＝１，２，・・・，６）は、時系列パターンを表現する時系列パターンモデルを有する。また、ノードN_iは、他のノードN_j（図６では、ｊ＝１，２，・・・，６）と結合関係を持つことができる。この結合関係をリンクと呼ぶ。図６では、例えば、ノードN₁は、ノードN₂，N₃と直接の結合関係を有している。また、例えば、ノードN₃は、ノードN₁，N₂，N₅，N₆と直接の結合関係を有しており、従って、ノードN₅とN₆は、ノードN₃を介して、ノードN₁と間接的な結合関係を有している。なお、２つのノードN_iとN_jとの結合関係としては、その２つのノードN_iとN_jとの最短の結合関係を考えるものとする。

時系列パターン記憶ネットワークの学習（時系列パターン記憶ネットワークに時系列パターンを記憶させる学習）は、時系列データを、学習用の学習データとして行われるが、この学習データは、カテゴリの種類や、カテゴリの数が未知のもので、この点、時系列パターン記憶ネットワークの学習は、前述の図５で説明した教師あり学習と大きく異なる。また、時系列パターン記憶ネットワークの学習に用いられる学習データには、正解ラベルは付与されていない。このため、時系列パターン記憶ネットワークの学習には、前述の図５で説明した教師あり学習を適用することはできない。

このように、時系列パターン記憶ネットワークの学習には、教師あり学習を適用することができず、また、学習データは、そのカテゴリの種類も、カテゴリの数も未知である。そこで、時系列パターン記憶ネットワークの学習は、その全体（のノード）によって、学習データの特徴（時系列パターン）を適切に表現することができるように、自己組織的に行われる。

なお、時系列パターン記憶ネットワークの学習は、教師なし学習である。また、時系列パターン記憶ネットワークの学習は、ある１つのノードが、必ずしもある１つのカテゴリに対応するように行われるとは限らない。即ち、時系列パターン記憶ネットワークにおいては、１つのノードが１つのカテゴリに対応するように学習が行われる場合もあるし、複数のノードが１つのカテゴリに対応するように学習が行われる場合もある。さらに、１つのノードが複数のカテゴリに対応するように学習が行われる場合もある。従って、仮に、学習データが、明確にカテゴリ分けすることができないものであっても、時系列パターン記憶ネットワークによる学習は行うことができる。

次に、図７は、時系列パターン記憶ネットワークのノードN_iの構成例を模式的に示している。

ノードN_iは、時系列パターンを表現する時系列パターンモデル２１と、その時系列パターンモデル２１の学習に用いる学習データを記憶する学習データ記憶部２２とから構成される。

ここで、図７では、時系列パターンモデル２１として、状態確率遷移モデルの１つであるHMM（連続HMM）が採用されている。また、図７では、HMMは、自己ループと次状態（右隣の状態）への状態遷移だけを有するleft-to-right型の３状態S₁，S₂，S₃を有するものとなっている。図７の時系列パターンモデル２１における○印は状態を表し、矢印は状態遷移を表している。なお、時系列パターンモデル２１としてのHMMは、left-to-right型や、３状態のもの等に限定されない。

時系列パターンモデル２１が、図７に示したようなHMMである場合、その時系列パターンモデル２１としてのHMMは、状態遷移確率と出力確率密度関数（HMMが離散HMMである場合には、スカラ量である離散的なシンボルが出力される確率）とで定義される。

状態遷移確率は、HMMにおいて、状態が遷移する確率で、図７の時系列パターンモデル２１における矢印で示した状態遷移それぞれに対して与えられる。出力確率密度関数は、状態遷移時に、HMMから観測される値の確率密度を表す。出力確率密度関数としては、例えば、混合正規分布などが採用される。これらのHMMのパラメータ（状態遷移確率と出力確率密度関数）は、例えば、Baum-Welch 法によって学習（推定）することができる。

ノードN_iでは、学習データ記憶部２２に記憶された学習データの統計的な特性、即ち、学習データ記憶部２２に記憶された学習データの時系列パターンが、時系列パターンモデル２１において学習され、これにより、時系列パターンモデル２１と、学習データ記憶部２２に記憶された学習データとが、対応関係を持つことになる。

なお、時系列パターン記憶ネットワークの学習、ひいては、ノードN_iの時系列パターンモデル２１の学習は、時系列パターン記憶ネットワークに対して、時系列データが与えられるごとに学習を行うオンライン学習によって行われる。従って、時系列パターン記憶ネットワークのパラメータ、つまり、ノードN_iの時系列パターンモデル２１のパラメータ（時系列パターンモデル２１がHMMである場合には、上述したように、状態遷移確率と出力確率密度関数）は、時系列パターン記憶ネットワークに対して、時系列データが与えられるたびに、少しずつ更新される。

即ち、後述するように、時系列パターン記憶ネットワークの学習が進むにつれ、学習データ記憶部２２に記憶される学習データは、時系列パターン記憶ネットワークに与えられた時系列データによって更新され、これにより、少しずつ変化する。そして、その少しずつ変化する学習データによって、時系列パターンモデル２１の学習が行われることにより、その時系列パターンモデル２１のパラメータも、少しずつ変化していく。

次に、図８は、時系列パターン記憶ネットワークの他の例を模式的に示している。

図８では、時系列パターン記憶ネットワークは、９個のノードN₁乃至N₉で構成されており、この９個のノードN₁乃至N₉は、２次元的に配置されている。即ち、図８では、９個のノードN₁乃至N₉は、２次元平面上に、横×縦が３×３となるように配置されている。

さらに、図８では、２次元的に配置された９個のノードN₁乃至N₉の、横方向に隣接するノードどうしと、縦方向に隣接するノードどうしに対して、リンク（結合関係）が与えられている。なお、このようなリンクを与えることによって、時系列パターン記憶ネットワークを構成するノードには、空間的に、２次元的に配置される配置構造が与えられているということもできる。

時系列パターン記憶ネットワークでは、リンクによって与えられる空間的なノードの配置構造に基づき、その空間上でのある２つのノードどうしの距離を定義することができ、この２つのノードどうしの距離は、その２つのノードそれぞれが有する時系列パターンモデル２１が表現する時系列パターンのパターン間距離（時系列パターンどうしの類似性）として用いることができる。

なお、２つのノードどうしの距離によって表される時系列パターンのパターン間距離は、２つのノードの結合関係（リンク）に基づくパターン間距離ということができる。

２つのノードどうしの距離としては、例えば、その２つのノードどうしを結ぶ最短のパスを構成するリンクの数を採用することができる。この場合、あるノードに注目すると、その注目ノードとの直接のリンクを有するノード（図８では、注目ノードの横方向や縦方向に隣接するノード）は、注目ノードとの距離が最も近く、注目ノードとの直接のリンクを有するノードから先のリンクを辿っていくことで到達することができるノードは、到達するのに辿るリンクの数が多いほど、注目ノードとの距離が遠くなっていく。

なお、ノードに与えるリンクは、図６や図８に示したものに限定されるものではない。また、図６や図８に示したリンクは、ノードに対して、２次元的な配置構造を与えるが、リンクは、その他、１次元的な配置構造や３次元的な配置構造等を与えるリンクであっても良い。

次に、図９は、時系列パターン記憶ネットワークを用いて、各種の処理を行うデータ処理装置の構成例を示している。

信号入力部１には、後述する学習処理や認識処理の対象となるデータ（以下、処理対象データという）が入力される。ここで、処理対象データは、例えば、音や画像、LED(Light Emitting Diode)の明るさ、モータの回転角度や回転角速度などの観測値（外部から観測することができる値（信号））である。また、処理対象データは、例えば、図９のデータ処理装置が適用されるシステムの入力を受け付ける入力デバイス（センサ）が出力するデータであっても良いし、何らかの出力を行う出力デバイスに対して与えられるデータであっても良い。

即ち、図９のデータ処理装置が、例えば、２足歩行ロボットその他のロボットに適用され、その２足歩行ロボットが、外部の状況に応じて、何らかの処理を行う場合には、信号入力部１は、外部の状況をセンシングするセンサで構成することができる。具体的には、信号入力部１は、例えば、マイク（マイクロフォン）やカメラなどで構成することができる。

信号入力部１がマイクで構成される場合には、そのマイクに対して、外部で発生する音声（人間の音声の他、動物の鳴き声、物音、その他のあらゆる音を含む）が、２足歩行ロボット（データ処理装置が適用されているシステム）に対する入力データとして入力され、対応する音声データが、特徴抽出部２に供給される。また、信号入力部１がカメラで構成される場合には、そのカメラに対して、外部からの光が、２足歩行ロボットに対する入力データとして入力され、対応する画像データが、特徴抽出部２に供給される。

また、２足歩行ロボットが、例えば、手や足に相当する部分を、アクチュエータとしてのモータによって動かすことができる場合には、信号入力部１は、そのモータの回転角度や回転速度を計測する計測装置（回転角度や回転速度をセンシングするセンサ）で構成することができる。なお、２足歩行ロボットの手や足に相当する部分を動かすモータは、そのモータを回転駆動させる電気信号としての駆動信号を与える他、手や足に相当する部分に外部から力を加えて動かすことによっても回転するが、計測装置では、そのいずれの回転によって生じた回転角度や回転速度であっても計測することができる。

信号入力部１が計測装置で構成される場合には、その計測装置に対して、モータの回転角度や回転速度を表す信号が、２足歩行ロボットからの出力データとして入力されて計測され、その計測結果が、特徴抽出部２に供給される。

なお、信号入力部１に入力される処理対象データは、時間的な変化が一定の定常的なデータ（定常信号）であっても良いし、時間的な変化が一定でない非定常なデータ（非定常信号）であっても良い。

また、以下では、信号入力部１に対しては、例えば、時系列データの１つである音声が入力されるものとする。さらに、信号入力部１から特徴抽出部２に対しては、いわゆる音声区間の音声データだけが供給されるものとする。なお、音声区間の検出方法は、特に限定されるものではない。また、信号入力部１から特徴抽出部２に対して供給される音声データは、必ずしも、音声区間の長さである必要はなく、適切な長さに区切られていればよい。即ち、信号入力部１から特徴抽出部２に対して供給される音声データは、例えば、音素や音韻の単位であっても良いし、単語や文、ある句読点から次の句読点までであっても良い。

ここで、信号入力部１から特徴抽出部２に対して供給される処理対象データは、音声データに限定されるものではなく、その区間も、特に限定されるものではない。即ち、信号入力部１から特徴抽出部２に対しては、最も良い方法で適当な長さに区切られた処理対象データが供給されれば良い。なお、信号入力部１から特徴抽出部２に対して供給される処理対象データ（の区間）は、一定であっても良いし、一定でなくても良い。

特徴抽出部２は、信号入力部１からの処理対象データとしての時系列データである音声データから特徴量を抽出し、その結果得られる時系列データである時系列の特徴量を、認識部３と学習部４に供給する。即ち、特徴抽出部２は、信号入力部１からの音声データに対して一定時間間隔で周波数分析などの処理を施し、例えば、メルケプストラム係数（MFCC（Mel Frequency Cepstrum Coefficient））などの特徴量を抽出して、そのメルケプストラム係数の時系列データを、認識部３と学習部４に供給する。なお、特徴抽出部２から認識部３と学習部４に供給される時系列データも、外部から観測することができる観測値である。

認識部３は、記憶部５に記憶された時系列パターン記憶ネットワークに基づき、特徴抽出部２から供給される時系列データを認識（認知）し、その認識結果を出力する。

学習部４は、記憶部５に記憶された時系列パターン記憶ネットワークを、特徴抽出部２から供給される時系列データ（の観測値）に基づいて、自己組織的に更新する。即ち、学習部４は、特徴抽出部２から供給される時系列データに基づいて、記憶部５に記憶された時系列パターン記憶ネットワークのパラメータを更新する。なお、このパラメータの更新のことを学習と呼ぶ場合がある。

学習部４では、正解ラベルの付与されていない時系列データを繰り返し与えると、その与えられた時系列データの中の特徴的なパターン（時系列パターン）を自己組織的に獲得していく教師なし学習が実行される。その結果、記憶部５の時系列パターン記憶ネットワークには、代表的な時系列パターンが効率的に記憶される。即ち、特徴抽出部２が認識部３と学習部４に供給する時系列データは、幾つかのパターン（時系列パターン）に分類することができ、学習部４では、時系列パターン記憶ネットワークに、時系列データの代表的な時系列パターンを記憶（獲得）させるための学習が行われる。

記憶部５は、時系列パターン記憶ネットワークを記憶しており、この時系列パターン記憶ネットワーク（のパラメータ）は、学習部４によって適宜更新される。

生成部６には、制御データが供給される。生成部６に供給される制御データは、記憶部５の時系列パターン記憶ネットワークが記憶している時系列パターンのうちのいずれかを表すもの（例えば、後述するノードラベル）で、生成部６は、記憶部５の時系列パターン記憶ネットワークに基づき、そこに供給される制御データが表す時系列パターンの時系列データを生成して出力する。

次に、図１０は、図９の学習部４の構成例を示している。

学習部４は、時系列データ記憶部３１と学習処理部３２とから構成される。

時系列データ記憶部３１には、特徴抽出部２から、（１区間の）新たな時系列データとしての特徴量の系列が供給される。時系列データ記憶部３１は、特徴抽出部２からの新たな時系列データを、一時的に（学習処理部３２による新たな時系列データを用いた処理が終了するまで）記憶する。

学習処理部３２は、記憶部５に記憶された時系列パターン記憶ネットワークを、時系列データ記憶部３１に記憶された新たな時系列データ（の観測値）に基づいて、自己組織的に更新する。

次に、図１１は、図１０の学習処理部３２の構成例を示している。

スコア計算部４１は、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、そのノードが、時系列データ記憶部３１に記憶された時系列データ（の観測値）に適合する度合いをスコアとして求め、勝者ノード決定部４２に供給する。即ち、ノードが有する時系列パターンモデル２１が、例えば、図７に示したようにHMMである場合には、スコア計算部４１は、ノードが有する時系列パターンモデル２１としてのHMMから、時系列データ記憶部３１に記憶された時系列データが観測される尤度を求め、そのノードのスコアとして、勝者ノード決定部４２に供給する。

勝者ノード決定部４２は、記憶部５に記憶された時系列パターン記憶ネットワークにおいて、時系列データ記憶部３１に記憶された時系列データに最も適合するノードを求め、そのノードを、勝者ノードに決定する。

即ち、勝者ノード決定部４２は、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部４１からのスコアが最も高いノードを勝者ノードとして決定する。そして、勝者ノード決定部４２は、勝者ノードを表す情報を、重み決定部４３に供給する。

ここで、時系列パターン記憶ネットワークを構成するノードには、各ノードを識別するためのラベルであるノードラベルを付しておくことができる。そして、勝者ノードを表す情報、その他のノード表す情報としては、ノードラベルを採用することができる。なお、ノードラベルは、ノード自体を識別するラベルであり、正解が何であるかを表す正解ラベルとは、何ら関係がない。

重み決定部４３は、勝者ノード決定部４２から供給されるノードラベルが表す勝者ノードに基づき、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、後述する更新重みを決定し、学習データ更新部４４に供給する。

即ち、重み決定部４３は、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノード（勝者ノードを含む）の更新重みを、そのノードと、勝者ノードとのパターン間距離に基づいて決定し、学習データ更新部４４に供給する。

ここで、ノードが有する時系列パターンモデル２１（図７）は、時系列データ記憶部３１（図１０）に記憶された新たな時系列データを用いて更新されるが、ノードの更新重みとは、そのノードが有する時系列パターンモデル２１の更新によって、その時系列パターンモデル２１が受ける新たな時系列データの影響の度合いを表す。従って、ノードの更新重みが０であれば、そのノードが有する時系列パターンモデル２１は、新たな時系列データの影響を受けない（更新されない）。

学習データ更新部４４は、記憶部５に記憶された時系列パターン記憶ネットワークの各ノードが有する学習データ記憶部２２（図７）に記憶された学習データを更新する。

即ち、学習データ更新部４４は、ノードが有する学習データ記憶部２２に既に記憶されている学習データと、時系列データ記憶部３１に記憶された時系列データとを、重み決定部４３からの、対応するノードの更新重みにしたがって混合し、その混合結果を、新たな学習データとして、学習データ記憶部２２に記憶させることで、その学習データ記憶部２２の記憶内容を更新する。

学習データ更新部４４は、以上のように、学習データ記憶部２２（図７）に記憶された学習データを、更新重みにしたがって更新すると、その更新が終了した旨の終了通知を、モデル学習部４５に供給する。

モデル学習部４５は、学習データ更新部４４から終了通知を受けると、その学習データ更新部４４による更新後の学習データ記憶部２２（図７）に記憶された学習データを用いて、時系列パターンに記憶ネットワークの各ノードが有する時系列パターンモデル２１の学習を行うことにより、その時系列パターンモデル２１を更新する。

従って、モデル学習部４５による、ノードが有する時系列パターンモデル２１の更新は、そのノードが有する学習データ記憶部２２（図７）に記憶されていた学習データ（の一部）と、時系列データ記憶部３１に記憶された新たな時系列データとに基づいて行われる。なお、学習データ記憶部２２の記憶内容は、更新重みにしたがって更新されるから、モデル学習部４５による、時系列パターンモデル２１の更新は、更新重みに基づいて行われるということもできる。

次に、図１２は、図１１の重み決定部４３において更新重みを決定する決定方法を示している。

重み決定部４３は、例えば、図１２に示すような、勝者ノードとのパターン間距離dの増加に対して更新重みαが減少する関係を表す曲線（以下、距離／重み曲線という）にしたがって、ノードに対する更新重み（ノードの更新重み）αを決定する。距離／重み曲線によれば、勝者ノードとのパターン間距離dが近いノードほど、大きな更新重みαが決定され、パターン間距離dが遠いノードほど、小さな更新重みαが決定される。

図１２の距離／重み曲線において、横軸（左から右方向）は、更新重みαを示しており、縦軸（上から下方向）は、パターン間距離dを示している。

図１２では、縦軸に沿って、時系列パターン記憶ネットワークを構成する６つのノードN₁乃至N₆が、各ノードN_iと勝者ノードとのパターン間距離dに対応する位置（縦軸の位置）に記載されている。

図１２では、時系列パターン記憶ネットワークを構成する６つのノードN₁乃至N₆が、その順で、勝者ノードとのパターン間距離dが近くなっている。時系列パターン記憶ネットワークを構成する６つのノードN₁乃至N₆のうち、勝者ノードとのパターン間距離dが最も近いノード、即ち、勝者ノードとのパターン間距離dが０のノードであるノードN₁は、勝者ノード（となっているノード）である。

ここで、時系列パターン記憶ネットワークが、例えば、図８に示したような２次元的な配置構造を有し、勝者ノードが、例えば、ノードN₆であった場合には、勝者ノードN₆とノードN₆との距離は最も（１番）近い０であり、ノードN₆と勝者ノードN₆とのパターン間距離dも０となる。また、勝者ノードN₆と、ノードN₃，N₅、またはN₉それぞれとの距離は２番目に近い１であり、ノードN₃，N₅、またはN₉それぞれと勝者ノードN₆とのパターン間距離dも１となる。さらに、勝者ノードN₆と、ノードN₂，N₄、またはN₈それぞれとの距離は３番目に近い２であり、ノードN₂，N₄、またはN₈それぞれと勝者ノードN₆とのパターン間距離dも２となる。また、勝者ノードN₆と、ノードN₁またはN₇それぞれとの距離は最も遠い（４番目に近い）３であり、ノードN₁またはN₇それぞれと勝者ノードN₆とのパターン間距離dも３となる。

次に、更新重みαとパターン間距離dとの関係を表す、例えば、図１２に示したような距離／重み曲線は、例えば、式（３）によって与えられる。

ここで、式（３）において、定数Gは、勝者ノードの更新重みを表す定数であり、γは、減衰係数で、０＜γ＜１の範囲の定数である。また、変数Δは、時系列パターン記憶ネットワークを更新する更新方法として、前述したSMAを採用した場合の、勝者ノードの近傍のノード（勝者ノードとの距離が近いノード）の更新重みαを調整するための変数である。

上述したように、勝者ノードとなっているノードのパターン間距離dとして、０が与えられ、以下、他のノードのパターン間距離dとして、勝者ノードとの距離にしたがって、１，２，・・・が与えられる場合、式（３）において、例えば、G=8，γ=0.5，Δ=1であれば、勝者ノードとなっているノードの更新重みαとして、８(=G)が求められる。以下、勝者ノードとの距離が大になるにしたがって、ノードの更新重みαとしては、４，２，１，・・・と小さくなる値が求められる。

ここで、式（３）における減衰係数Δが大きな値である場合には、パターン間距離dの変化に対する更新重みαの変化は緩やかになり、逆に、減衰係数Δが０に近い値である場合には、パターン間距離dの変化に対する更新重みαの変化は急峻になる。

従って、減衰係数Δを、例えば、上述した１から少しずつ０に近づけていくように調整すると、パターン間距離dの変化に対する更新重みαの変化は急峻になっていき、更新重みαは、パターン間距離dが大きくなるにしたがって、より小さい値となる。そして、減衰係数Δが０に近くなると、勝者ノード（となっているノード）以外のノードの更新重みαは、ほとんど０となり、この場合、時系列パターン記憶ネットワークを更新する更新方法として、前述したWTAを採用した場合と（ほぼ）等価となる。

このように、減衰係数Δを調整することによって、時系列パターン記憶ネットワークを更新する更新方法としてSMAを採用した場合の、勝者ノードの近傍のノードの更新重みαを調整することができる。

減衰係数△は、例えば、時系列パターン記憶ネットワークの更新（学習）の開始時は大きな値にし、時間の経過とともに、即ち、更新の回数が増加するにしたがって小さな値にくなるようにすることができる。この場合、時系列パターン記憶ネットワークの更新の開始時は、パターン間距離dの変化に対する更新重みαの変化が緩やかな距離／重み曲線にしたがって、時系列パターン記憶ネットワークの各ノードの更新重みαが決定され、更新（学習）が進む（進行する）につれ、パターン間距離dの変化に対する更新重みαの変化が急峻になっていく距離／重み曲線にしたがって、時系列パターン記憶ネットワークの各ノードの更新重みαが決定される。

即ち、この場合、勝者ノード（が有する時系列パターンモデル２１）の更新は、学習（更新）の進行にかかわらず、時系列データ記憶部３１（図１１）に記憶された新たな時系列データの影響を強く受けるように行われる。一方、勝者ノード以外のノード（が有する時系列パターンモデル２１）の更新は、学習の開始時は、比較的広い範囲のノード（勝者ノードとのパターン間距離dが小のノードから、ある程度大のノードまで）に亘って、新たな時系列データの影響を受けるように行われる。そして、学習が進行するにつれ、勝者ノード以外のノードの更新は、徐々に狭い範囲のノードについてのみ、新たな時系列データの影響を受けるように行われる。

図１１の重み決定部４３は、以上のようにして、時系列パターン記憶ネットワークの各ノードの更新重みαを決定し、学習データ更新部４４では、各ノードが有する学習データ記憶部２２に記憶される学習データが、そのノードの更新重みαに基づいて更新される。

次に、図１３を参照して、ノードが有する学習データ記憶部２２に記憶される学習データを更新する更新方法について説明する。

いま、あるノードN_iが有する学習データ記憶部２２には、学習データが既に記憶されており、ノードN_iの時系列パターンモデル２１は、学習データ記憶部２２に既に記憶されている学習データを用いて学習が行われたものであるとする。

学習データ更新部４４は、上述したように、ノードN_iが有する学習データ記憶部２２に既に記憶されている学習データ（以下、適宜、旧学習データという）と、時系列データ記憶部３１（図１１）に記憶された新たな時系列データとを、重み決定部４３からのノードN_iの更新重みαにしたがって混合し、その混合結果を、新たな学習データとして、学習データ記憶部２２に記憶させることで、その学習データ記憶部２２の記憶内容を、新たな学習データに更新する。

即ち、学習データ更新部４４は、旧学習データに対して、新たな時系列データを追加することで、旧学習データと新たな時系列データとを混合した新たな学習データとするが、旧学習データに対する新たな時系列データの追加（旧学習データと新たな時系列データとの混合）は、ノードN_iの更新重みαに対応する比にしたがって行われる。

ここで、ノードN_iの時系列パターンモデル２１（図７）の更新は、新たな学習データを用いた学習によって行われるため、新たな時系列データと旧学習データとを混合する比率を変えることによって、更新により時系列パターンモデル２１が受ける新たな時系列データの影響の度合い（強さ）を変えることができる。

ノードN_iにおいて、新たな時系列データと旧学習データとを混合する比率としては、ノードN_iの更新重みαに対応した値が採用され、例えば、更新重みαが大であるほど、新たな時系列データの比率が大となる（旧学習データの比率が小となる）ような値とされる。

具体的には、ノードN_iの学習データ記憶部２２には、一定の数の時系列データ（学習データ）が記憶されるものとし、その一定の数をHとする。この場合、ノードN_iの時系列パターンモデル２１の学習は、常に、H個の学習データ（時系列データ）を用いて行われる。

学習データ記憶部２２に、常に、一定の数Hの学習データが記憶される場合、新たな時系列データと旧学習データとの混合によって得られる新たな学習データの個数は、H個である必要があり、そのような、新たな時系列データと旧学習データとの混合を、ノードN_iの更新重みαに対応した比率で行う方法としては、新たな時系列データと旧学習データとを、比率α:H-αで混合する方法がある。

新たな時系列データと旧学習データとを、比率α:H-αで混合する具体的な方法としては、図１３に示すように、H個の旧学習データのうちのH-α個の旧学習データに対して、α個の新たな時系列データを追加することにより、H個の新たな学習データを得る方法がある。

この場合、学習データ記憶部２２に記憶される時系列データの数Hが、例えば、１００であり、ノードN_iの更新重みαが、例えば、８であれば、学習データ記憶部２２の記憶内容は、１００個の旧学習データのうちの９２個の旧学習データに対して、８個の新たな時系列データを追加することによって得られる１００個の新たな学習データに更新される。

H個の旧学習データのうちのH-α個の旧学習データに対する、α個の新たな時系列データの追加は、α個の新たな時系列データが得られるのを待って行う方法があるが、この方法では、１個の新たな時系列データが得られるごとに、学習データ記憶部２２の記憶内容を更新することができない。

そこで、学習データ記憶部２２の記憶内容の更新は、１個の新たな時系列データが得られるごとに、その新たな時系列データをα個だけ、H-α個の旧学習データに追加することにより行うことができる。即ち、１個の新たな時系列データをコピーしてα個の新たな時系列データとし、そのα個の新たな時系列データを、H個の旧学習データから古い順にα個を除外して残ったH-α個の旧学習データに追加することにより、学習データ記憶部２２の記憶内容の更新を行う。これにより、１個の新たな時系列データが得られるごとに、学習データ記憶部２２の記憶内容を更新することができる。

以上のように、学習データ記憶部２２の記憶内容の更新を行うことにより、学習データ記憶部２２には、常に、新しい順のＨ個の時系列データだけが、学習データとして保持されることになり、その学習データに占める新たな時系列データの割合（比率）は、更新重みαによって調整されることになる。

次に、図１４のフローチャートを参照して、図９のデータ処理装置で行われる、時系列パターン記憶ネットワークを学習する学習処理について説明する。

まず最初に、ステップＳ１において、学習部４（図１０）の学習処理部３２は、記憶部５に記憶された時系列パターン記憶ネットワークのパラメータ、即ち、時系列パターン記憶ネットワークの各ノードが有する時系列パターンモデル２１（図７）としての、例えばHMMのパラメータを初期化する初期化処理を行う。この初期化処理により、HMMのパラメータ（状態遷移確率と出力確率密度関数）として、適切な初期値が与えられる。なお、初期化処理において、HMMのパラメータにおいて、どのように初期値を与えるかは、特に限定されるものではない。

その後、ステップＳ２において、１個の処理対象データ、即ち、例えば、１の音声区間の音声データが、信号入力部１に入力されると、信号入力部１は、その処理対象データを、特徴抽出部２に供給する。特徴抽出部２は、処理対象データから特徴量を抽出し、その特徴量の時系列データ（１個の新たな時系列データ）を、学習部４に供給する。

学習部４（図１０）は、特徴抽出部２からの新たな時系列データを、時系列データ記憶部３１に一時記憶させ、以下、ステップＳ３乃至Ｓ７において、記憶部５に記憶された時系列パターン記憶ネットワークを、時系列データ記憶部３１に記憶された新たな時系列データ（の観測値）に基づいて、自己組織的に更新（学習）する。

即ち、学習部４の学習処理部３２（図１１）では、ステップＳ３において、スコア計算部４１が、時系列データ記憶部３１に記憶された新たな時系列データを読み出し、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、そのノードが、新たな時系列データに適合する度合いを表すスコアを求める。

具体的には、ノードが有する時系列パターンモデル２１（図７）が、例えばHMMである場合には、そのHMMから、新たな時系列データが観測される対数尤度が、スコアとして求められる。ここで、対数尤度の計算方法としては、例えば、ビタビアルゴリズム(Viterbi algorithm)を採用することができる。

スコア計算部４１は、時系列パターン記憶ネットワークが有するすべてのノードについて、新たな時系列データに対するスコアを計算すると、その各ノードについてのスコアを、勝者ノード決定部４２に供給する。

勝者ノード決定部４２は、ステップＳ４において、時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部４１からのスコアが最も高いノードを求め、そのノードを勝者ノードに決定する。そして、勝者ノード決定部４２は、勝者ノードを表す情報としてのノードラベルを、重み決定部４３に供給する。

重み決定部４３は、ステップＳ５において、勝者ノード決定部４２からのノードラベルが表す勝者ノードを、いわば基準として、時系列パターン記憶ネットワークを構成する各ノードの更新重みを決定する。

即ち、重み決定部４３は、図１２で説明したように、時系列パターン記憶ネットワークの更新（学習）が進むにつれ、パターン間距離dの変化に対する更新重みαの変化が急峻になっていく、式（３）で表される距離／重み曲線にしたがって、時系列パターン記憶ネットワークの各ノードの更新重みαを決定し、学習データ更新部４４に供給する。

学習データ更新部４４は、ステップＳ６において、時系列パターン記憶ネットワークの各ノードが有する学習データ記憶部２２（図７）に記憶された学習データを、重み決定部４３からの、対応するノードの更新重みにしたがって更新する。即ち、学習データ更新部４４は、図１３で説明したように、時系列データ記憶部３１に記憶されている新たな時系列データと、ノードの学習データ記憶部２２に記憶されている旧学習データとを、そのノードの更新重みαに対応した比率α:H-αで混合することにより、H個の新たな学習データを得て、そのH個の新たな学習データによって、学習データ記憶部２２の記憶内容を更新する。

学習データ更新部４４は、時系列パターン記憶ネットワークのノードすべての学習データ記憶部２２（図７）の記憶内容を更新すると、その更新が終了した旨の終了通知を、モデル学習部４５に供給する。

モデル学習部４５は、学習データ更新部４４から終了通知を受けると、ステップＳ７において、時系列パターン記憶ネットワークのパラメータを更新する。

即ち、モデル学習部４５は、時系列パターン記憶ネットワークの各ノードについて、学習データ更新部４４による更新後の学習データ記憶部２２に記憶された新たな学習データを用いて、時系列パターンモデル２１の学習を行うことにより、その時系列パターンモデル２１を更新する。

具体的には、ノードが有する時系列パターンモデル２１が、例えばHMMである場合には、そのノードが有する学習データ記憶部２２に記憶された新たな学習データを用いて、HMMの学習が行われる。この学習では、例えば、HMMの現在の（旧学習データを用いた学習により得られた）状態遷移確率と出力確率密度関数を初期値とし、新たな学習データを用いて、Baum-Welch法により、新たな状態遷移確率と出力確率密度関数がそれぞれ求められる。そして、その新たな状態遷移確率と出力確率密度関数によって、HMMの状態遷移確率と出力確率密度関数がそれぞれ更新される。

その後は、ステップＳ７からステップＳ２に戻り、次の処理対象データが、信号入力部１に入力されるのを待って、以下、同様の処理が繰り返される。

図１４の学習処理によれば、１個の新たな時系列データが得られると、その新たな時系列データに対して、時系列パターン記憶ネットワークを構成するノードの中から、勝者ノードが決定される（ステップＳ４）。さらに、その勝者ノードを基準として、時系列パターン記憶ネットワークを構成する各ノードの更新重みが決定される（ステップＳ５）。そして、更新重みに基づいて、時系列パターン記憶ネットワークを構成する各ノードが有する時系列パターンモデル２１（図７）のパラメータが更新される。

即ち、図１４の学習処理では、１個の新たな時系列データに対して、時系列パターン記憶ネットワークを構成するノードのパラメータの更新が１回行われ、以下、同様に、新たな時系列データが得られるたびに、ノードのパラメータの更新が繰り返されることにより、自己組織的に学習が行われる。

そして、学習が十分に行われることにより、時系列パターン記憶ネットワークの各ノードが有する時系列パターンモデル２１は、ある時系列パターンを学習（獲得）する。時系列パターン記憶ネットワーク全体において学習される時系列パターンの数（種類）は、時系列パターン記憶ネットワークが有するノードの数と一致するので、時系列パターン記憶ネットワークが有するノードの数が、例えば１００である場合は、１００種類の時系列パターンが学習されることになる。この時系列パターンに基づき、認識部３（図９）では、時系列データ（処理対象データ）を認識する認識処理を行うことが可能となり、生成部６（図９）では、時系列データを生成する生成処理を行うことが可能となる。

次に、図１５は、図９の認識部３の構成例を示している。

認識部３には、図９で説明したように、特徴抽出部２から、（１個の）時系列データが供給され、この時系列データは、スコア計算部５１に供給される。

スコア計算部５１は、学習処理部３２（図１１）のスコア計算部４１と同様に、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、そのノードが、特徴抽出部２からの時系列データ（の観測値）に適合する度合いを表すスコアを求め、勝者ノード決定部５２に供給する。

勝者ノード決定部５２は、学習処理部３２（図１１）の勝者ノード決定部４２と同様に、記憶部５に記憶された時系列パターン記憶ネットワークにおいて、特徴抽出部２からの時系列データに最も適合するノードを求め、そのノードを、勝者ノードとして決定する。

即ち、勝者ノード決定部５２は、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部５１からのスコアが最も高いノードを勝者ノードとして決定する。そして、勝者ノード決定部５２は、勝者ノードを表す情報としてのノードラベルを、出力部５３に供給する。

出力部５３は、勝者ノード決定部５２からの勝者ノードを表すノードラベルを、特徴抽出部２からの特徴量の時系列データ、ひいては、その特徴量に対応する、信号入力部１に入力された処理対象データの認識結果として出力する。

なお、認識部３のスコア計算部５１と、学習処理部３２（図１１）のスコア計算部４１とは、いずれか一方のスコア計算部で兼用することが可能である。認識部３の勝者ノード決定部５２と、学習処理部３２（図１１）の勝者ノード決定部４２についても、同様である。

次に、図１６のフローチャートを参照して、図９のデータ処理装置で行われる、時系列データを認識する認識処理について説明する。

ステップＳ２１において、１個の処理対象データ、即ち、例えば、１の音声区間の音声データ（時系列データ）が、信号入力部１に入力されると、信号入力部１は、その処理対象データを、特徴抽出部２に供給する。特徴抽出部２は、処理対象データである時系列データから特徴量を抽出し、その特徴量の時系列データを、認識部３に供給する。

認識部３（図１５）では、ステップＳ２２において、スコア計算部５１が、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードが、特徴抽出部２からの時系列データに適合する度合いを表すスコアを求め、勝者ノード決定部５２に供給する。

勝者ノード決定部５２は、ステップＳ２３において、時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部５１からのスコアが最も高いノードを求め、そのノードを勝者ノードとして決定する。そして、勝者ノード決定部５２は、勝者ノードを表す情報としてのノードラベルを、出力部５３に供給する。

出力部５３は、勝者ノード決定部５２からのノードラベルを、特徴抽出部２からの時系列データ（信号入力部１に入力された処理対象データ）の認識（認知）結果として出力し、処理を終了する。

なお、出力部５３が出力するノードラベル（勝者ノードのノードラベル）は、例えば、制御データとして、生成部６に供給することができる。

以上のような、時系列パターン記憶ネットワークを用いた認識処理によれば、その時系列パターン記憶ネットワークのノードの数に応じた細かさの認識結果を得ることができる。

即ち、例えば、いま、時系列パターン記憶ネットワークの学習が、３つのカテゴリ"A"，"B"，"C"の発声それぞれにより得られた音声データを用いて行われたとする。

時系列パターン記憶ネットワークの学習に用いられた３つのカテゴリ"A"，"B"，"C"の音声データが、多数の話者の発話を含む場合には、例えば、カテゴリ"A"の音声データであっても、発話速度や、イントネーション、話者の年齢、性別などの違いによって、様々なバリエーションの音声データが存在する。

教師あり学習であれば、カテゴリ"A"，"B"，"C"の音声データを用いた学習は、カテゴリ"A"の音声データだけ、カテゴリ"B"の音声データだけ、カテゴリ"C"の音声データだけをそれぞれ用いて行われる。従って、各カテゴリの学習結果には、発話速度等の違いによるバリエーションは、生じ得ない。

一方、時系列パターン記憶ネットワークの学習では、カテゴリ"A"，"B"，"C"の音声データが、それらを区別（分類）することなく用いられる。そして、時系列パターン記憶ネットワークでは、上述したように、その時系列パターン記憶ネットワークが有するノードの数だけの時系列パターンが学習される。

従って、時系列パターン記憶ネットワークでは、例えば、それが有するノードの数が３より大であれば、１つのカテゴリ"A"の音声データであっても、そのカテゴリ"A"の音声データの中の、ある１つのバリエーション（の時系列パターン）が、ある１つのノードで学習され、他の１つのバリエーションが、他の１つのノードで学習されることがある。

そして、このように、複数のノードにおいて、カテゴリ"A"の音声データの様々なバリエーションが学習された場合、認識処理では、例えば、カテゴリ"A"の音声データが処理対象データとして入力されると、カテゴリ"A"の音声データが学習された複数のノードの中から、処理対象データに最も適合するノードが、勝者ノードとして決定され、その勝者ノードのノードラベルが、認識結果として出力される。

即ち、時系列パターン記憶ネットワークを用いた認識処理では、処理対象データが、カテゴリ"A"，"B"，"C"のうちのいずれのカテゴリの音声データであるかが決定されるのではなく、時系列パターン記憶ネットワークが学習によって獲得した、そのノードの数だけの時系列パターンのうちのいずれに最も適合するか（類似するか）かが決定される。

つまり、時系列パターン記憶ネットワークの学習では、時系列パターン記憶ネットワークが有するノードの数に応じた細かさで時系列パターンが獲得され、時系列パターン記憶ネットワークを用いた認識では、時系列パターン記憶ネットワークが有するノードの数に応じた細かさで、時系列データが分類（クラス分け）される。

なお、（十分な）学習が行われた時系列パターン記憶ネットワークの各ノードに対し、そのノードが獲得した時系列パターンに応じて、適切に、カテゴリ"A"，"B"，"C"の正解ラベルを付与すれば、時系列パターン記憶ネットワークを用いた認識処理において、時系列データ（処理対象データ）が、カテゴリ"A"，"B"，"C"のうちのいずれのカテゴリの音声データであるかの認識結果を得ることができる。

次に、図１７は、図９の生成部６の構成例を示している。

生成部６には、図９で説明したように、制御データが供給される。生成部６に供給される制御データは、記憶部５の時系列パターン記憶ネットワークが記憶している時系列パターン、ひいては、時系列パターン記憶ネットワークを構成するノードのうちのいずれかを表すもので、例えば、ノードラベルである。

生成部６に供給された制御データは、生成ノード決定部６１に供給される。生成ノード決定部６１は、記憶部５に記憶された時系列パターン記憶ネットワークにおいて、そこに供給される制御データが表すノードを、時系列データを生成するのに用いるノード（以下、適宜、生成ノードという）に決定し、その決定結果を、時系列生成部６２に供給する。

即ち、生成ノード決定部６１は、そこに供給される制御データとしてのノードラベルが表すノードを、生成ノードに決定し、その決定結果を、時系列生成部６２に供給する。

時系列生成部６２は、生成ノード決定部６１からの決定結果にしたがい、生成ノードが有する時系列パターンモデル２１（図７）に基づいて、時系列データを生成し、出力部６３に供給する。

ここで、時系列パターンモデル２１が、例えば、HMMである場合には、時系列生成部６２は、生成ノードが有する時系列パターンモデル２１としてのHMMにおいて時系列データが観測される尤度を表す出力確率を最大にする時系列データを生成する。なお、HMMを用いた時系列データの生成については、例えば、動的特徴量を利用することで滑らかに変化する時系列データを生成する方法があり、時系列生成部６２では、その方法によって、時系列データを生成することができる。このような時系列データの生成方法は、例えば、K. Tokuda, T. Yoshimura, T. Masuko, T. Kobayashi, T. Kitamura, "SPEECH PARAMETER GENERATION ALGORITHMS FOR HMM-BASED SPEECH SYNTHESIS", Proc. of ICASSP 2000, vol.3, pp.1315-1318, June 2000に記載されている。

なお、HMMを用いて時系列データを生成する方法としては、その他、例えば、HMMのパラメータを用いた確率的試行に基づく時系列データの生成を繰り返し行い、その平均をとることで、HMMから時系列データを生成する方法なども提案されており、その詳細については、例えば、稲邑哲也、谷江博昭、中村仁彦、「連続分布型隠れマルコフモデルを用いた時系列データのキーフレーム抽出とその復元」、日本機械学会ロボティクス・メカトロニクス講演会2003講演論文集、2P1-3F-C6，2003に記載されている。

出力部６３は、時系列生成部６２からの時系列データを、処理対象データに相当する時系列データに変換して出力する。即ち、時系列生成部６２において生成される時系列データは、ノードが有する時系列パターンモデル２１の学習に用いられた特徴量の時系列データであり、出力部６３は、その特徴量の時系列データを、処理対象データ（に相当するデータ）に変換して出力する。

具体的には、例えば、処理対象データが音声データであり、特徴抽出部２が、音声データからメルケプストラム係数を特徴量として抽出することとすると、メルケプストラムの時系列データが、時系列パターンモデル２１によって学習されるので、時系列生成部６２が生成ノードの時系列パターンモデル２１（図７）に基づいて生成する時系列データは、メルケプストラムの時系列データとなる。出力部６３は、時系列生成部６２において生成されるメルケプストラム（の時系列データ）を、処理対象データに相当する時系列データである音声データに変換する。

なお、メルケプストラムの時系列データを音声データ（時領域の音声）に変換する方法としては、例えば、MLSAフィルタ（メル対数スペクトル近似フィルタ）と呼ばれる合成フィルタによって、メルケプストラムの時系列データをフィルタリングする方法がある。MLSAフィルタの詳細については、例えば、今井聖、住田一男、古市千恵子、「音声合成のためのメル対数スペクトル近似(MLSA)フィルタ」、電子情報通信学会論文誌（Ａ）、J66-A, 2, pp.122-129, 1983や、徳田恵一、小林隆夫、斉藤博徳、深田俊明、今井聖、「メルケプストラムをパラメータとする音声のスペクトル推定」、電子情報通信学会論文誌（Ａ）、J74-A, 8, pp.1240-1248, 1991に記載されている。

次に、図１８のフローチャートを参照して、図９のデータ処理装置で行われる、時系列データ（処理対象データ）を生成する生成処理について説明する。

ステップＳ３１では、制御データが、生成部６（図１７）に入力される。この制御データは、生成ノード決定部６１に供給される。生成ノード決定部６１は、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの、制御データとしてのノードラベルが表すノードを、生成ノードに決定し、その決定結果を、時系列生成部６２に供給する。

時系列生成部６２は、ステップＳ３３において、生成ノード決定部６１からの決定結果にしたがい、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの生成ノードが有する時系列パターンモデル２１（のパラメータ）に基づいて、時系列データを生成し、出力部６３に供給する。出力部６３は、ステップＳ３４において、時系列生成部６２からの時系列データを、処理対象データに相当する時系列データに変換して出力する。

以上のような、時系列パターン記憶ネットワークを用いた生成処理によれば、その時系列パターン記憶ネットワークのノードの数に応じた（時系列パターンの）時系列データを生成することができる。

以上のように、時系列パターンモデル２１を有する複数のノードから構成される時系列パターン記憶ネットワークを、時系列データに基づいて、自己組織的に更新するようにしたので、長さが一定の時系列データは勿論、長さが一定でない時系列データの教師なし学習、つまり、時系列データの、いわば自律的な学習を、容易に（実用的に）行うことができる。

即ち、時系列パターン記憶ネットワークの各ノードは、時系列パターンモデル２１を有するから、時系列パターン記憶ネットワークの学習において、ノードの更新、つまり、そのノードが有する時系列パターンモデル２１の更新は、他のノードの更新に影響しない。従って、時系列パターン記憶ネットワークを構成するノードが１つ増えても、時系列パターン記憶ネットワークの学習に要する計算量は、単純には、１のノードの更新に要する計算量だけ増えるだけであり、時系列パターン記憶ネットワークの規模、つまり、時系列パターン記憶ネットワークを構成するノードの数を大にしても、時系列パターン記憶ネットワークの学習に要する計算量が飛躍的に増加することはない。従って、大規模な時系列パターン記憶ネットワークであっても、容易に、自己組織的に学習することができる。

さらに、かかる時系列パターン記憶ネットワークの学習によれば、各ノードに、時系列データの統計的な特性を表す時系列パターンが記憶されるので、その時系列パターンを用いて、時系列データの認識や生成を、容易に行うことができる。

なお、学習処理、認識処理、生成処理は、例えば、音声データ、画像データ、モータを駆動する信号（モータデータ）、その他の任意の時系列データを対象として行うことができる。具体的には、例えば、図９のデータ処理装置を自律型のロボットなどの自律システムに適用し、そのロボットの視覚や、聴覚、触覚に相当するセンサが出力する信号や、ロボットの手や足に相当する部分を駆動するモータを制御する信号、合成音を生成する装置や目に相当するLEDに対して与える信号等を、学習処理、認識処理、生成処理の対象とする時系列データとして採用することができる。

また、本実施の形態では、ノードが有する時系列パターンモデル２１（図７）として、状態遷移確率モデルの１つであるHMMを採用することとしたが、時系列パターンモデル２１としては、他の状態遷移確率モデルを採用することが可能である。

時系列パターンモデル２１として採用することができる他の状態遷移確率モデルとしては、例えば、ベイジアンネットワークがある。

ベイジアンネットワークでは、変数間の依存関係をグラフ構造で表し、各ノードに条件付き確率を割り当てることでモデル化が行われるが、特に、時間軸に沿った状態遷移モデルを構築することで、時系列データをモデル化することが可能となる。

なお、ベイジアンネットワークのグラフ構造の決定は、例えば、学習データの尤度とグラフ構造の複雑さとを考慮したモデルを選択することにより行われ、条件付き確率の推定には、例えば、最尤推定法やEM(Expectation Maximaization)アルゴリズムなどが利用される。ここで、ベイジアンネットワークの詳細については、例えば、本村陽一、「不確実性モデリングのための情報表現：ベイジアンネット」、２００１年、ベイジアンネットチュートリアルなどに記載されている。

さらに、時系列パターンモデル２１（図７）としては、上述のように、HMMやベイジアンネットワークなどのような状態遷移確率モデルを採用することができる他、関数を近似するモデル（以下、適宜、関数近似モデルという）を採用することもできる。

関数近似モデルは、時系列パターンを、関数f()を用い、例えば、微分方程式{x(t)}'=f(x(t))や、差分方程式x(t+1)=f(x(t))などで表現するモデルで、関数f()が、時系列パターンを特徴づける。なお、tは時間（時刻）（サンプル点）を表し、x(t)は、時刻tの時系列データのサンプル値、または時刻（０から）tまでに観測された時系列データを表す。また、{x(t)}'は、時系列データx(t)の時間tに関する１次微分を表す。

学習データ（時系列データ）から、ある時系列パターンを表す（に対応する）関数f()を求めることを、時系列パターン関数近似と呼ぶと、時系列パターン関数近似の方法としては、例えば、多項式などを用いて関数 f() を表現し、その多項式の係数を、学習データから決定する方法や、ニューラルネットワークによって関数 f() を表現し、そのニューラルネットワークのパラメータを、学習データから決定する方法などがある。

多項式で表現された関数f()の時系列パターン関数近似において、その多項式の係数の決定（推定）は、例えば、最急降下法などによって行うことができる。また、ニューラルネットワークによって表現された関数f()の時系列パターン関数近似において、そのニューラルネットワークのパラメータの決定は、例えば、バックプロパゲーション法によって行うことができる。ここで、バックプロパゲーション法では、ニューラルネットワークに入力と出力のデータを与え、その入力と出力のデータの関係を満たすように、ニューラルネットワークのパラメータの学習が行われる。

例えば、時系列パターンモデル２１として、関数f()を用いた差分方程式x(t+1)=f(x(t))で時系列パターンを表現する関数近似モデルを採用する場合、入力層x(t)と出力層x(t+1)をつなぐ重み（中間層）が、ニューラルネットワークのパラメータであり、このパラメータが、学習データ（時系列データ）を用いて学習される。ニューラルネットワークのパラメータの学習は、初期値を適当に与えて、バックプロパゲーション法により行われる。なお、ニューラルネットワークとしては、例えば、リカレントニューラルネットワークを採用することができる。

関数f()がニューラルネットワークによって表現される時系列パターンモデル２１を有するノードで構成される時系列パターン記憶ネットワークの学習等でも、上述のHMMを時系列パターンモデル２１として採用した場合と同様に、勝者ノードを決定する必要があり、勝者ノードの決定のためには、時系列パターン記憶ネットワークの各ノードの、新たな時系列データに対するスコアを計算する必要がある。

このスコアとしては、例えば、新たな時系列データの観測値（実際の値）と、関数f()がニューラルネットワークによって表現される時系列パターンモデル２１から求められる、新たな時系列データの理論値との誤差（例えば、差の二乗和など）を採用することができる。この場合、スコアの値が最も小さいノードが、新たな時系列データに最も適合するノードである勝者ノードとして決定される。

勝者ノードの決定後は、各ノードの更新重みを決定し、以下、上述のHMMを時系列パターンモデル２１として採用した場合と同様の手順で、各ノード（が有するニューラルネットワーク）のパラメータを更新することができる。

なお、スコアが、例えば、尤度である場合は、スコアが大きいほど、良いスコアとなり、スコアが、例えば、誤差や距離である場合には、スコアが小さいほど、良いスコアとなる。

次に、以上のような時系列パターン記憶ネットワークを適用した順モデルや逆モデルについて説明する。

図１９は、時系列パターン記憶ネットワークが適用された順モデルまたは逆モデルとしての入出力関係モデルの構成例を模式的に示している。

図１９において、入出力関係モデルは、２つの時系列パターン記憶ネットワークnet_inおよびnet_outを有している。さらに、図１９の入出力関係モデルは、時系列パターン記憶ネットワークnet_inの各ノードN_i（i＝１，２，・・・，ノードの総数）と、時系列パターン記憶ネットワークnet_outの各ノードN'_j（j＝１，２，・・・，ノードの総数）とが結合されている。

ここで、図１９において、時系列パターン記憶ネットワークnet_inのノードN_iと、時系列パターン記憶ネットワークnet_outのノードN'_jとの間の矢印が、そのノードN_iとN'_jとの結合を表している。

なお、時系列パターン記憶ネットワークnet_inおよびnet_outは、同一の数のノードと同一のリンク（リンクがない場合を含む）を有するものであっても良いし、異なる数のノードまたは異なるリンクを有するものであっても良い。また、時系列パターン記憶ネットワークnet_inのノードN_iが有する時系列パターンモデル２１（図７）と、時系列パターン記憶ネットワークnet_outのノードが有する時系列パターンモデル２１も、同一の時系列パターンモデルであっても良いし、異なる時系列パターンモデルであっても良い。

次に、図２０は、入出力関係モデルを用いて、各種の処理を行うデータ処理装置の構成例を示している。

図２０のデータ処理装置では、図１９の入出力関係モデルによって制御対象を順モデルまたは逆モデルにモデル化し、さらに、その順モデルまたは逆モデルとしての入出力関係モデルを用いて、制御対象から得られる出力データや、制御対象に与えるべき制御データ（入力データ）を推定する。

即ち、図２０において、データ処理装置は、記憶部２１１、学習部２１２、および認識生成部２１３から構成されている。

記憶部２１１は、例えば、図１９に示した入出力関係モデルなどを記憶する。

学習部２１２には、モデル化しようとする制御対象に与えられる入力データ（の観測値）と、その入力データに対して制御対象から得られる出力データ（の観測値）とのセットである教示データが供給されるようになっている。ここで、教示データは、ある区間の時系列データ（ある時間に亘る時系列データ）である入力データと、その区間の時系列データに対して制御対象から得られる区間の他の時系列データである出力データとのセットである。

学習部２１２は、そこに供給される教示データを用い、制御対象の順モデルまたは逆モデルとしての入出力関係モデルの学習を行う。

即ち、学習部２１２は、学習処理部２２１と結合重み更新部２２２から構成される。

学習処理部２２１は、図１１に示した学習処理部３２と同様に構成され、学習部２１２に供給される教示データのうちの入力データに基づいて、記憶部２１１に記憶された入出力関係モデル（図１９）における時系列パターン記憶ネットワークnet_inを、図９のデータ処理装置における場合と同様に、自己組織的に更新する。また、学習処理部２２１は、学習部２１２に供給される教示データのうちの出力データ（教示データにおいて、入力データとセットになっている出力データ）に基づいて、記憶部２１１に記憶された入出力関係モデル（図１９）における時系列パターン記憶ネットワークnet_outを、図９のデータ処理装置における場合と同様に、自己組織的に更新する。

さらに、学習処理部２２１は、時系列パターン記憶ネットワークnet_inを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_inのノードN_iのノードラベル（以下、適宜、入力ラベルという）と、時系列パターン記憶ネットワークnet_outを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_outのノードN'_jのノードラベル（以下、適宜、出力ラベルという）とをセットにしたラベルセットを、結合重み更新部２２２に供給する。

結合重み更新部２２２は、学習処理部２２１から供給されるラベルセットに基づき、記憶部２１１に記憶された入出力関係モデル（図１９）における時系列パターン記憶ネットワークnet_outのノードN_iと、時系列パターン記憶ネットワークnet_outのノードN'_jとの結合関係を更新する。

ここで、学習処理部２２１から結合重み更新部２２２に供給されるラベルセットは、入力ラベルと出力ラベルとのセットであり、入力ラベルは、教示データのうちの入力データに基づいて時系列パターン記憶ネットワークnet_inを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_inのノードN_iのノードラベルであるから、時系列パターン記憶ネットワークnet_inにおいて、入力データに最も適合するノードN_iのノードラベルである。

同様に、出力ラベルは、教示データのうちの出力データに基づいて時系列パターン記憶ネットワークnet_outを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_outのノードN'_jのノードラベルであるから、時系列パターン記憶ネットワークnet_outにおいて、出力データに最も適合するノードN'_jのノードラベルである。

結合重み更新部２２２では、時系列パターン記憶ネットワークnet_inのノードのうちの、教示データにおける入力データに最も適合するノードである勝者ノードN_iと、時系列パターン記憶ネットワークnet_outの各ノードとの結合関係が更新されるとともに、時系列パターン記憶ネットワークnet_outのノードのうちの、教示データにおける出力データに最も適合するノードである勝者ノードN'_jと、時系列パターン記憶ネットワークnet_inの各ノードとの結合関係が更新される。

ここで、入出力関係モデルにおける時系列パターン記憶ネットワークnet_inのノードと、時系列パターン記憶ネットワークnet_outのノードとの間の結合関係は、その結合の度合いが強いほど、大きな値となる結合重みによって表されるようになっており、ノードどうしの結合関係の更新とは、結合重みの更新を意味する。結合重み更新部２２２によるノードどうしの結合関係の更新の方法についての詳細は、後述する。

認識生成部２１３には、制御対象から得られる出力データを推定するための入力データ、または制御対象から得られる出力データをある目標値とするのに制御対象に与えるべき入力データ（制御データ）を推定するための出力データが供給される。

そして、認識生成部２１３は、入力データが供給された場合は、記憶部２１１に記憶された入出力関係モデルにおける時系列パターン記憶ネットワークnet_inにおいて、その入力データに最も適合する勝者ノードN_iを決定し、その勝者ノードN_iとの結合重みが最も強い、時系列パターン記憶ネットワークnet_outのノードを、その入力データに対する出力データの推定値としての時系列データを生成する生成ノードN'_jに決定する。さらに、認識生成部２１３は、生成ノードN'_jが有する時系列パターンモデル２１（図７）に基づいて、出力データ（の推定値）を生成して出力する。

また、認識生成部２１３は、出力データが供給された場合は、記憶部２１１に記憶された入出力関係モデルにおける時系列パターン記憶ネットワークnet_outにおいて、その出力データに最も適合する勝者ノードN'_jを決定し、その勝者ノードN'_jとの結合重みが最も強い、時系列パターン記憶ネットワークnet_inのノードを、その出力データが得られるときに制御対象に与えられる制御データ（入力データ）の推定値としての時系列データを生成する生成ノードN_iに決定する。さらに、認識生成部２１３は、生成ノードN_iが有する時系列パターンモデル２１（図７）に基づいて、制御データ（の推定値）を生成して出力する。

即ち、認識生成部２１３は、スコア計算部２３１、勝者ノード決定部２３２、生成ノード決定部２３３、および時系列生成部２３４から構成される。

なお、スコア計算部２３１、勝者ノード決定部２３２、生成ノード決定部２３３、および時系列生成部２３４は、認識生成部２１３に供給されたデータが、入力データであるのか、または出力データであるのかを認識することができるようになっているものとする。即ち、例えば、認識生成部２１３に対しては、そこに供給されるデータとは別に、あるいは、そこに供給されるデータとともに、そのデータが、入力データまたは出力データのうちのいずれであるのかを表す情報が供給されるようになっており、これにより、スコア計算部２３１、勝者ノード決定部２３２、生成ノード決定部２３３、および時系列生成部２３４は、認識生成部２１３に供給されたデータが、入力データであるのか、または出力データであるのかを認識する。

スコア計算部２３１は、認識生成部２１３に供給されたデータに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inの各ノードN_i、または時系列パターン記憶ネットワークnet_outの各ノードN'_jが適合する度合いであるスコアを、図１５の認識部３のスコア計算部５１における場合と同様にして計算し、勝者ノード決定部２３２に供給する。

即ち、スコア計算部２３１は、認識生成部２１３に供給されたデータが入力データである場合、その入力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inの各ノードN_iのスコアを計算し、勝者ノード決定部２３２に供給する。また、スコア計算部２３１は、認識生成部２１３に供給されたデータが出力データである場合、その出力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outの各ノードN'_jのスコアを計算し、勝者ノード決定部２３２に供給する。

勝者ノード決定部２３２は、図１５の認識部３の勝者ノード決定部５２における場合と同様に、スコア計算部２３１から供給されるスコアが最も高いノードを勝者ノードに決定し、その勝者ノードを表すノードラベルを、生成ノード決定部２３３に供給する。

従って、認識生成部２１３に供給されたデータが入力データである場合、勝者ノード決定部２３２では、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、スコア計算部２３１から供給される、入力データに対するスコアが最も高いノードが、勝者ノードN_iに決定され、その勝者ノードN_iを表す入力ラベルが、生成ノード決定部２３３に供給される。また、認識生成部２１３に供給されたデータが出力データである場合、勝者ノード決定部２３２では、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、スコア計算部２３１から供給される、出力データに対するスコアが最も高いノードが、勝者ノードN'_jに決定され、その勝者ノードN'_jを表す出力ラベルが、生成ノード決定部２３３に供給される。

なお、ここでは、最も高い（大きい）スコアが最も良いスコアであるとする。

生成ノード決定部２３３は、勝者ノード決定部２３２から入力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが入力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、勝者ノード決定部２３２からの入力ラベルが表すノードN_iとの結合重みが最も強い（最強の）ノードN'_jを生成ノードとして決定し、その生成ノードN'_jを表す出力ラベルを、時系列生成部２３４に供給する。また、生成ノード決定部２３３は、勝者ノード決定部２３２から出力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが出力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、勝者ノード決定部２３２からの出力ラベルが表すノードN'_jとの結合重みが最も強い（最強の）ノードN_iを生成ノードとして決定し、その生成ノードN_iを表す入力ラベルを、時系列生成部２３４に供給する。

時系列生成部２３４は、生成ノード決定部２３３から出力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが入力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードのうちの、生成ノード決定部２３３からの出力ラベルが表すノードN'_jが有する時系列パターンモデル２１（図７）に基づいて、認識生成部２１３に供給された入力データに対する出力データの推定値としての時系列データを、例えば、図１７の生成部６の時系列生成部６２における場合と同様にして生成する。

また、時系列生成部２３４は、生成ノード決定部２３３から入力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが出力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードのうちの、生成ノード決定部２３３からの入力ラベルが表すノードN_iが有する時系列パターンモデル２１に基づいて、認識生成部２１３に供給された出力データに対する制御データ（入力データ）の推定値としての時系列データを、例えば、図１７の生成部６の時系列生成部６２における場合と同様にして生成する。

次に、図２１のフローチャートを参照して、図２０のデータ処理装置で行われる、入出力関係モデルによる制御対象のモデル化、即ち、入出力関係モデルの学習について説明する。

ステップＳ１０１において、入力データと出力データとのセットである教示データが、図２０のデータ処理装置に入力されると、その教示データは、学習部２１２の学習処理部２２１に供給される。

学習処理部２２１は、ステップＳ１０２において、教示データのうちの入力データに基づいて、記憶部２１１に記憶された入出力関係モデル（図１９）における時系列パターン記憶ネットワークnet_inを、自己組織的に更新し、ステップＳ１０３に進む。ステップＳ１０３では、学習処理部２２１は、教示データのうちの出力データに基づいて、記憶部２１１に記憶された入出力関係モデルにおける時系列パターン記憶ネットワークnet_outを、自己組織的に更新する。

そして、学習処理部２２１は、時系列パターン記憶ネットワークnet_inを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_inのノードN_iの入力ラベルと、時系列パターン記憶ネットワークnet_outを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_outのノードN'_jの出力ラベルとのセットであるラベルセットを、結合重み更新部２２２に供給する。

結合重み更新部２２２は、ステップＳ１０４において、学習処理部２２１から供給されるラベルセットに基づき、記憶部２１１に記憶された入出力関係モデル（図１９）における時系列パターン記憶ネットワークnet_inの各ノードと、時系列パターン記憶ネットワークnet_outの各ノードとの結合重みを更新して、ステップＳ１０１に戻り、次の教示データが入力されるのを待って、以下、同様の処理が繰り返される。

多数の教示データが入力され、ステップＳ１０１乃至Ｓ１０４の処理が繰り返されることにより、記憶部２１１に記憶された入出力関係モデルは、制御対象に対応する順モデルとなっていくとともに、逆モデルにもなっていく。

なお、ステップＳ１０２とＳ１０３の処理は、並列して行うこともできるし、図２１の場合と逆順で行うこともできる。

次に、図２２を参照して、結合重み更新部２２２（図２０）が、図２１のステップＳ１０４で行う結合重み（ノードどうしの結合関係）の更新について説明する。

なお、以下、適宜、入出力関係モデルにおいて、入力データが与えられる時系列パターン記憶ネットワーク、つまり、入力データを用いて学習が行われ、入力データの時系列パターンを表現する時系列パターンモデル２１を有する複数のノードから構成される時系列パターン記憶ネットワーク（例えば、時系列パターン記憶ネットワークnet_in）を、入力ネットワークといい、出力データが与えられる時系列パターン記憶ネットワーク、つまり、出力データを用いて学習が行われ、出力データの時系列パターンを表現する時系列パターンモデル２１を有する複数のノードから構成される時系列パターン記憶ネットワーク（例えば、時系列パターン記憶ネットワークnet_out）を、出力ネットワークという。

さらに、以下、適宜、入力ネットワークのノードを入力ノードといい、出力ネットワークのノードを出力ノードという。

また、以下では、入出力関係モデルを、入力データを与えて出力データを推定する順モデルとして用いる場合についての説明をし、入出力関係モデルを、出力データ（目標値）を与えて入力データ（制御データ）を推定する逆モデルとして用いる場合についての説明は適宜省略する。

図２２は、図１９に示したように、入力ネットワークnet_inの入力ノードと、出力ネットワークnet_outの出力ノードとが結合している入出力関係モデルを示している。

即ち、図２２左側では、入出力関係モデルは、入力ネットワークnet_inと、出力ネットワークnet_outとを有し、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの各出力ノードとが結合している。なお、図２２では、入力ネットワークnet_in、および出力ネットワークnet_outのいずれも、８つのノードで構成されている。

図２２左側では、入力ネットワークnet_inの各入力ノードは、出力ネットワークnet_outのすべての出力ノードと結合しており（従って、出力ネットワークnet_outの各出力ノードも、入力ネットワークnet_inのすべての入力ノードと結合している）、入力ネットワークnet_inの入力ノードと、出力ネットワークnet_outの出力ノードとのすべての組み合わせについて、結合重みwが存在する。

いま、ノードどうしが結合している２つの時系列パターン記憶ネットワークについて、そのうちの一方の時系列パターン記憶ネットワークのノードを各行に対応させるとともに、他方の時系列パターン記憶ネットワークのノードを各列に対応させ、第i行第j列の要素に、一方の時系列パターン記憶ネットワークのi番目のノードと、他方の時系列パターン記憶ネットワークのj番目のノードとの結合重みwを配置した行列を、結合重み行列MTXということとすると、結合重み更新部２２２（図２０）は、この結合重み行列MTXの各要素である結合重みwを更新する。

図２２右側は、図２２左側の入出力関係モデルについての結合重み行列MTXを示している。

図２２右側の結合重み行列MTXでは、入力ノードを各行に対応させるとともに、出力ノードを各列に対応させ、第i行第j列の要素に、i番目の入力ノードと、j番目の出力ノードとの結合重みwが配置されている。結合重み更新部２２２（図２０）は、この結合重み行列MTXの各要素である結合重みwを更新する。

即ち、結合重み更新部２２２は、例えば、最初に電源がオンにされたとき等に、結合重み行列MTXにおけるすべての結合重みwを、例えば、初期値としての0に初期化する。そして、結合重み更新部２２２は、図２０のデータ処理装置に対して、教示データ、つまり、入力データと出力データとのセットが入力され、これにより、入力ネットワークnet_inにおける勝者ノードを表す入力ラベルと、出力ネットワークnet_outにおける勝者ノードを表す出力ラベルとのラベルセットが、学習処理部２２１から与えられるたびに、それらの勝者ノードどうしの結合を、いわば中心として、結合重みを更新する。

具体的には、結合重み更新部２２２は、例えば、式（４）にしたがって、結合重み行列MTXの結合重みwを更新する。

ここで、βは、結合重みwを更新する程度の表す学習率であり、0から1の範囲で与えられる。学習率βを小さくするほど、結合重みwは、あまり変化しなくなり、学習率βが0である場合には、結合重みwは変化しない。一方、学習率βを大きくするほど、結合重みwも、大きく変化し、学習率βが1である場合には、結合重みwは、更新の基準値△wに更新される。

また、基準値△wは、例えば、式（５）で与えられる。

ここで、dは、式（３）における場合と同様に、勝者ノードとのパターン間距離を表し、勝者ノードとなっているノードについては、d=0である。従って、勝者ノード（となっているノード）については、基準値△wは1となり、勝者ノードからのパターン間距離dが大のノードほど、基準値△wは0に近づく。

いま、学習処理部２２１（図２０）から結合重み更新部２２２に供給される入力ラベルが表す入力ノード、即ち、入力ネットワークnet_inにおける勝者ノードを、入力ノードN_iと表すとともに、学習処理部２２１（図２０）から結合重み更新部２２２に供給される出力ラベルが表す出力ノード、即ち、出力ネットワークnet_outにおける勝者ノードを、出力ノードN'_jと表すと、結合重み更新部２２２（図２０）は、式（４）（および式（５））にしたがい、以下のように、結合重み行列MTXの結合重みwを更新する。

即ち、結合重み更新部２２２は、出力ネットワークnet_outの各出力ノードについて、出力ネットワークnet_outにおける勝者ノードである出力ノードN'_jとのパターン間距離dを用い、式（５）にしたがって、基準値△wを求め、さらに、その基準値△wを用い、式（４）にしたがって、入力ネットワークnet_inの勝者ノードであるi番目の入力ノードN_iとの結合重みwを更新する。

これにより、入力ネットワークnet_inの勝者ノードである入力ノードN_iに対応する、結合重み行列MTXの第i行の（各列の）結合重みwが更新される。

また、結合重み更新部２２２は、入力ネットワークnet_inの各入力ノードについて、入力ネットワークnet_inにおける勝者ノードである入力ノードN_iとのパターン間距離dを用い、式（５）にしたがって、基準値△wを求め、さらに、その基準値△wを用い、式（４）にしたがって、出力ネットワークnet_outの勝者ノードであるj番目の出力ノードN'_jとの結合重みwを更新する。

これにより、出力ネットワークnet_outの勝者ノードである出力ノードN'_jに対応する、結合重み行列MTXの第j列の（各行の）結合重みwが更新される。

従って、入力ネットワークnet_inの勝者ノードN_iと、出力ネットワークnet_outの勝者ノードN'_jとの結合重みが、結合の度合いを最も強めるように更新される。

なお、入力ネットワークnet_inの勝者ノードである入力ノードN_iと、出力ネットワークnet_outの勝者ノードである出力ノードN'_jとの結合重みwの更新は、出力ネットワークnet_outの各出力ノードについての、勝者ノードである入力ノードN_iとの結合重みwの更新時か、または、入力ネットワークnet_inの各入力ノードについての、勝者ノードである出力ノードN'_jとの結合重みwの更新時のいずれか一方においてのみ行われる。

以上のような結合重みw（結合重み行列MTX）の更新は、教示データとしての入力データと出力データとのセットが、図２０のデータ処理装置に対して入力されるたびに行われる。

さらに、入出力関係モデルが有する入力ネットワークnet_inの入力データに基づく学習、および出力ネットワークnet_outの出力データに基づく学習も、教示データとしての入力データと出力データとのセットが、図２０のデータ処理装置に対して入力されるたびに行われる。

そして、入力ネットワークnet_in、および出力ネットワークnet_outの学習が進むと、入力ノードが有する時系列パターンモデル２１が、ある特定の時系列パターンを表現し、また、出力ノードが有する時系列パターンモデル２１も、他の特定の時系列パターンを表現するようになる。

その結果、ある特定の時系列パターンの入力データと、他の特定の時系列パターンの出力データとの間に、何らかの関係性がある場合、そのような入力データと出力データとのセット（教示データ）が与えられると、入力ネットワークnet_inにおいてある特定の時系列パターンを表現する時系列パターンモデル２１を有する入力ノードが勝者ノードとなるとともに、出力ネットワークnet_outにおいて他の特定の時系列パターンを表現する時系列パターンモデル２１を有する出力ノードが勝者ノードとなる。

さらに、上述したように、入力ネットワークnet_inの勝者ノードを、いわば中心として、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの勝者ノードとの結合重みが更新されるとともに、出力ネットワークnet_outの勝者ノードを中心として、出力ネットワークnet_outの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みが更新される。

即ち、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの勝者ノードとの結合重みは、入力ネットワークnet_inの勝者ノードとのパターン間距離dが近い入力ノードほど強くなる（強化する）ように更新される。また、出力ネットワークnet_outの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みは、出力ネットワークnet_outの勝者ノードとのパターン間距離dが近い出力ノードほど強くなるように更新される。

逆に言えば、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの勝者ノードとの結合重みは、入力ネットワークnet_inの勝者ノードとのパターン間距離dが遠い入力ノードほど弱くなる（弱化する）ように更新される。また、出力ネットワークnet_outの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みも、出力ネットワークnet_outの勝者ノードとのパターン間距離dが遠い出力ノードほど弱くなるように更新される。

多数の教示データが与えられ、入力ネットワークnet_in、および出力ネットワークnet_outの学習が進み、さらに、結合重みの更新が進むと、その結合重みによって、入力データ（の時系列パターン）と出力データ（の時系列パターン）とを関係付ける順モデルまたは逆モデルとしての入出力関係モデルを獲得することができる。

そして、順モデルとしての入出力関係モデルによれば、ある入力データが与えられた場合に、入力ネットワークnet_inにおいて、その入力データに最も適合する勝者ノードを決定することができ、その勝者ノードとの結合重みが最強の出力ネットワークnet_outの出力ノードを決定することができる。さらに、その出力ノード（が有する時系列パターンモデル２１）に基づき、時系列データを生成することで、与えられた入力データに対する出力データを推定することができる。

また、逆モデルとしての入出力関係モデルによれば、ある出力データ（目標値）が与えられた場合に、出力ネットワークnet_outにおいて、その出力データに最も適合する勝者ノードを決定することができ、その勝者ノードとの結合重みが最強の入力ネットワークnet_inの入力ノードを決定することができる。さらに、その入力ノード（が有する時系列パターンモデル２１）に基づき、時系列データを生成することで、与えられた出力データに対する制御データ（入力データ）を推定することができる。

なお、入力ネットワークnet_inのノードと出力ネットワークnet_outのノードとが結合されている入出力関係モデルについては、結合重み行列MTXは、入出力関係モデルの一部として、記憶部２１１（図２０）に記憶される。

次に、図２３のフローチャートを参照して、順モデルまたは逆モデルとしての入出力関係モデルを用いて、入力データに対する出力データや、出力データに対する制御データ（入力データ）を推定する処理について説明する。

まず、図２０のデータ処理装置において、入力データに対する出力データを推定する場合、ステップＳ１１１において、その入力データが、図２０のデータ処理装置に入力される。

データ処理装置に入力された入力データは、認識生成部２１３のスコア計算部２３１に供給される。

スコア計算部２３１は、ステップＳ１１２において、そこに供給された入力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inの各ノードN_iのスコアを計算し、勝者ノード決定部２３２に供給する。

勝者ノード決定部２３２は、ステップＳ１１３において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、スコア計算部２３１からのスコアが最も高いノードを、勝者ノードN_iに決定し、その勝者ノードN_iを表す入力ラベルを、生成ノード決定部２３３に供給する。

生成ノード決定部２３３は、ステップＳ１１４において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、勝者ノード決定部２３２からの入力ラベルが表すノードN_iとの結合重みが最も強いノードN'_jを生成ノードに決定し、その生成ノードN'_jを表す出力ラベルを、時系列生成部２３４に供給する。

時系列生成部２３４は、ステップＳ１１５において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードのうちの、生成ノード決定部２３３からの出力ラベルが表すノードN'_jが有する時系列パターンモデル２１（図７）に基づいて、認識生成部２１３に供給された入力データに対する出力データの推定値としての時系列データを生成して、ステップＳ１１６に進み、その時系列データを出力する。

次に、図２０のデータ処理装置において、出力データに対する制御データ（入力データ）を推定する場合には、ステップＳ１１１において、その出力データが、図２０のデータ処理装置に入力される。

データ処理装置に入力された出力データは、認識生成部２１３のスコア計算部２３１に供給される。

スコア計算部２３１は、ステップＳ１１２において、そこに供給された出力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outの各ノードN'_jのスコアを計算し、勝者ノード決定部２３２に供給する。

勝者ノード決定部２３２は、ステップＳ１１３において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、スコア計算部２３１からのスコアが最も高いノードを、勝者ノードN'_jに決定し、その勝者ノードN'_jを表す出力ラベルを、生成ノード決定部２３３に供給する。

生成ノード決定部２３３は、ステップＳ１１４において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、勝者ノード決定部２３２からの出力ラベルが表すノードN'_jとの結合重みが最も強いノードN_iを生成ノードに決定し、その生成ノードN_iを表す入力ラベルを、時系列生成部２３４に供給する。

時系列生成部２３４は、ステップＳ１１５において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードのうちの、生成ノード決定部２３３からの入力ラベルが表すノードN_iが有する時系列パターンモデル２１に基づいて、認識生成部２１３に供給された出力データに対する制御データ（入力データ）の推定値としての時系列データを生成して、ステップＳ１１６に進み、その時系列データを出力する。

以上のように、入力データと出力データとのセットを用いて、入出力関係モデルの学習を行い、制御対象を順モデルおよび逆モデルにモデル化して、制御対象を精度良く表現し、高精度に、出力データや制御データ（入力データ）を推定することが可能となる。

ところで、上述したように、図２０のデータ処理装置においては、制御対象に与えられる、ある区間の時系列データ（ある時間に亘る時系列データ）である入力データと、その区間の時系列データに対して制御対象から観測される区間の他の時系列データである出力データとのセットを、教示データとして、学習部２１２に供給し、学習部２１２において、教示データを用い、制御対象の順モデルまたは逆モデルとしての入出力関係モデルの学習を行う。

従って、例えば、制御対象をロボットとして、そのロボットに与える入力データとして、ロボットに呼びかける音声をセンサとしてのマイクで検知したセンサデータ（音声データ）の時系列を採用するとともに、ロボットに呼びかける音声に対して、ロボットが手をふるようにアームを動かす行動をとるためにモータに与えられるモータデータの時系列を採用して、入出力関係モデルの学習を行うと、学習部２１２（図２０）では、入出力関係モデルの入力ネットワークnet_inの１以上のノード（が有する時系列パターンモデル２１）が、ロボットに呼びかける音声に対応するセンサデータとしての入力データの時系列パターンを表現するように、自己組織的な学習が行われるとともに、出力ネットワークnet_outの１以上のノード（が有する時系列パターンモデル２１）が、手をふる行動に対応するモータデータとしての出力データの時系列パターンを表現するように、自己組織的な学習が行われる。

さらに、学習部２１２では、入出力関係モデルの入力ネットワークnet_inの各ノードと、出力ネットワークnet_outの勝者ノードとの結合重みが、入力ネットワークnet_inの勝者ノードとのパターン間距離dが近いノードほど強くなるように更新されるとともに、出力ネットワークnet_outの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みが、出力ネットワークnet_outの勝者ノードとのパターン間距離dが近い出力ノードほど強くなるように更新される。

その結果、入力ネットワークnet_inのノードのうちの、ロボットに呼びかける音声に対応するセンサデータとしての入力データの時系列パターンを表現する（時系列パターンモデル２１を有する）１以上のノードと、出力ネットワークnet_outのノードのうちの、手をふる行動に対応するモータデータの時系列パターンを表現する（時系列パターンモデル２１を有する）１以上のノードとの結合重みは強くなる。

その後、認識生成部２１３（図２０）に、ロボットに呼びかける音声に対応するセンサデータが、入力データとして与えられると、入出力関係モデルでは、その入力データに対して、入力ネットワークnet_inのノードのうちの、ロボットに呼びかける音声に対応するセンサデータの時系列パターンを表現する、ある１つのノードが勝者ノードとなる。そして、認識生成部２１３では、その勝者ノードとの結合重みが最も強い、出力ネットワークnet_outのノード、即ち、いまの場合、出力ネットワークnet_outのノードのうちの、手をふる行動に対応するモータデータの時系列パターンを表現する、あるノードが、生成ノードに決定され、その生成ノードを用いて、出力データ、即ち、いまの場合、手をふる行動に対応するモータデータが生成されて出力される。

図２０のデータ処理装置によれば、例えば、ロボットに、呼びかけの音声を与え、その音声に対して、手をふるようなアームの動きを与えると、上述のような学習が行われ、その結果、ロボットが、呼びかけの音声に対して、手をふる認知行動を行うようになる。

しかしながら、図２０のデータ処理装置では、認知と行動とが、比較的短時間で繰り返されることで完成する、実時間性が要求されるタスクを、ロボットに行わせることが困難であることがある。

即ち、例えば、ロボットが、目の前にあるボールを左右に転がすタスクを行う場合、ボールの状態を把握（認識）する認知と、ボールの状態に応じて適切にアームを動かす行動とを、ある短い所定の時間単位で繰り返し行う必要がある。いま、この繰り返しの単位である所定の時間を、フレームと呼ぶこととすると、時間軸上のあるフレームにおける、ボールの状態をセンサで検知したセンサデータと、そのフレームにおいてとらなければならないアームの動きに対応するモータデータとのセットを、教示データとして、図２０のデータ処理装置に与え、その教示データのうちのセンサデータの時系列パターンを表現する入力ノード（入力ネットワークnet_inのノード）と、その教示データのうちのモータデータの時系列パターンを表現する出力ノード（出力ネットワークnet_outのノード）との結合重みを強くしても、ロボットは、目の前にあるボールを左右に転がすタスクを行うことができるようにはならない。

なぜなら、あるフレームのセンサデータが与えられた時点で、そのフレームのモータデータによるアームの動きは、既に行われていなければならないからである。

従って、ロボットが、目の前にあるボールを左右に転がすタスクを行うことができるようにするには、あるフレームを注目フレームとして注目すると、ボールの状態をセンサで検知したセンサデータのうちの、注目フレームのセンサデータの時系列パターンを表現する入力ノード（以下、適宜、センサデータに対応するノードともいう）と、ボールを左右に転がすアームの動きに対応するモータデータのうちの、注目フレームの時刻から一定の時間だけ遅れたフレームのモータデータの時系列パターンを表現する出力ノード（以下、適宜、モータデータに対応するノードともいう）との結合重みを強くするように、入出力関係モデルの学習を行う必要がある。

即ち、注目フレームのセンサデータに対して、次のフレームのモータデータが生成されるように、入出力関係モデルの学習を行う必要がある。

また、ロボットが次にとるべき行動は、現在の外部の状態としてのボールの状態だけでは決められないことがある。即ち、現在のボールの状態が、ある特定の状態であっても、ロボットが現在とっている行動（状態）によっては、次にとるべき行動が異なることがある。

従って、注目フレームのセンサデータのみならず、モータデータをも考慮して、次のフレームのモータデータが生成されるように、入出力関係モデルの学習を行うことが望ましい。

そこで、図２４は、実時間性が要求されるタスクを行うことが可能なロボットの構成例を示している。

図２４において、ロボットは、データ処理装置３０１、センサ３０２、およびモータ駆動部３０３等から構成されている。

データ処理装置３０１は、センサ３０２から供給される時系列のセンサデータと、モータ駆動部３０３から供給される時系列のモータデータとを用いて、入出力関係モデルの自己組織的な学習を行う。さらに、データ処理装置３０１は、センサ３０２から供給される時系列のセンサデータ、およびモータ駆動部３０３から供給されるモータデータに対して、時系列のセンサデータおよびモータデータを生成し、モータ駆動部３０３に供給する。

センサ３０２は、カメラやマイク等であり、外部の状態を検知して、その外部の状態を表す時系列のセンサデータを、データ処理装置３０１に供給する。

モータ駆動部３０３は、データ処理装置３０１から供給されるモータデータに応じて、例えば、ロボットのアーム等を動かすための図示せぬモータを駆動する。また、モータ駆動部３０３は、例えば、ロボットのアーム等が、外部から力が加えられることによって動かされた場合に、その動きをするために、モータ駆動部３０３に与えられるべきモータデータと同一のモータデータを生成し、データ処理部３０１に供給する。さらに、モータ駆動部３０３は、上述したように、データ処理装置３０１から供給されるモータデータに応じて、モータを駆動するとともに、必要に応じて、そのモータデータを、データ処理装置３０１に供給する（戻す）。

図２４において、データ処理装置３０１は、記憶部３１１、データ抽出部３１２、学習処理部３１３、写像学習部３１４、データ抽出部３１５、認識部３１６、写像部３１７、および生成部３１８から構成されている。

記憶部３１１は、入出力関係モデルを記憶している。

ここで、図２５は、記憶部３１１が記憶している入出力関係モデルM₁₁₁₂を示している。

入出力関係モデルM₁₁₁₂は、図１９や図２２に示した入出力関係モデルと同様に、時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される時系列パターン記憶ネットワークである入力ネットワークnet₁₁（入力SOM）と、出力ネットワークnet₁₂（出力SOM）とを有する。

そして、入出力関係モデルM₁₁₁₂では、入力ネットワークnet₁₁の各ノードと、出力ネットワークのnet₁₂の各ノードとが、結合重みによって結合されている。

図２４に戻り、データ抽出部３１２には、センサ３０２が各時刻において出力するセンサデータと、モータ駆動部３０３が同一時刻において出力するモータデータとが供給される。

データ抽出部３１２は、センサ３０２からのセンサデータとモータ駆動部３０３からのモータデータをコンポーネントとするベクトルの時系列を、入力データおよび出力データとして、入力データの時系列から、フレーム単位の入力データを順次抽出するとともに、出力データの時系列から、フレーム単位の出力データを順次抽出し、それらのフレーム単位の入力データと出力データを、学習処理部３１３に供給する。

即ち、図２６は、図２４のデータ抽出部３１２が扱う入力データと出力データを示している。

上述したように、データ抽出部３１２が扱う入力データと出力データは、いずれも、センサデータとモータデータをコンポーネントとするベクトルの時系列であり、同一の時系列データである。

図２４で説明したように、データ抽出部３１２には、センサ３０２が各時刻において出力するセンサデータと、モータ駆動部３０３が同一時刻において出力するモータデータとが供給される。

例えば、フレームの長さ（時間）をTと表すこととすると、データ抽出部３１２は、センサデータとモータデータを入力データとして、その入力データの時系列を、図２６に示すように、時間T単位に区切った、フレーム単位の入力データを抽出し、学習処理部３１３に供給する。

また、データ抽出部３１２は、センサデータとモータデータを出力データとして、その出力データの時系列を、図２６に示すように、時間T単位に区切った、フレーム単位の出力データを抽出し、学習処理部３１３に供給する。

ここで、以下、適宜、時刻tを先頭の時刻とし、時刻t+T-1を終わりの時刻とする時間Tのフレームを、時刻tのフレームという。センサデータとモータデータとをコンポーネントとするベクトルの時系列の、時刻tのベクトル（サンプル値）から、時刻t+t'（の直前）のベクトルまでを、IO[t,t+t']と表すこととすると、時刻tのフレームの入力データと出力データは、いずれも、IO[t,t+T-1]と表すことができる。

なお、図２６では、入力データと出力データとが、完全に同一の時系列データであるとしたが、入力データと出力データとは、一部が同一の時系列データであっても良い。即ち、例えば、入力データが、センサデータとモータデータをコンポーネントとするベクトルの時系列であり、出力データが、モータデータ（さらには、センサデータ以外の時系列データ）をコンポーネントとするベクトルの時系列であっても良い。

また、図２６では、入力データを（出力データについても同様）、単純に、時間T単位に区切って、フレーム単位の入力データを得るようにしたが、その他、例えば、時間T未満の時間だけずらしながら、時間Tの長さの入力データを抽出することにより、一部が重複したフレーム単位の入力データを抽出することも可能である。

再び、図２４に戻り、学習処理部３１３は、認識学習処理部３２１から構成され、データ抽出部３１２から供給されるフレーム単位の入力データと出力データそれぞれを用いて、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂（図２５）が有する入力ネットワークnet₁₁と出力ネットワークnet₁₂それぞれの自己組織的な学習を行う。

即ち、認識学習処理部３２１は、図２０の学習処理部２２１と同様に、データ抽出部３１２から供給されるフレーム単位の入力データに基づいて、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂（図２５）における入力ネットワークnet₁₁を、自己組織的に更新する。

具体的には、認識学習処理部３２１は、入出力関係モデルM₁₁₁₂における入力ネットワークnet₁₁の各ノードについて、データ抽出部３１２からのフレーム単位の入力データに対するスコアを求め、入力ネットワークnet₁₁のノードの中から、スコアの最も良いノードを、勝者ノード（以下、適宜、入力勝者ノードともいう）に決定する。さらに、認識学習処理部３２１は、データ抽出部３１２からのフレーム単位の入力データに対する入力勝者ノードに基づいて、入力ネットワークnet₁₁を、自己組織的に更新する。

また、認識学習処理部３２１は、フレーム単位の入力データに対して時系列に決定した入力勝者ノードを表すノードラベルである入力ラベルを、写像学習部３１４に、時系列に供給する。

さらに、認識学習処理部３２１は、データ抽出部３１２から供給されるフレーム単位の出力データに基づいて、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂（図２５）における出力ネットワークnet₁₂を、自己組織的に更新する。

具体的には、認識学習処理部３２１は、入出力関係モデルM₁₁₁₂における出力ネットワークnet₁₂の各ノードについて、データ抽出部３１２からのフレーム単位の出力データに対するスコアを求め、出力ネットワークnet₁₂のノードの中から、スコアの最も良いノードを、勝者ノード（以下、適宜、出力勝者ノードともいう）に決定する。さらに、認識学習処理部３２１は、データ抽出部３１２からのフレーム単位の出力データに対する出力勝者ノードに基づいて、出力ネットワークnet₁₂を、自己組織的に更新する。

また、認識学習処理部３２１は、フレーム単位の出力データに対して時系列に決定した出力勝者ノードを表すノードラベルである出力ラベルを、写像学習部３１４に、時系列に供給する。

写像学習部３１４は、データバッファ３３１、読み出し部３３２、および結合重み更新部３３３から構成され、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における入力ネットワークnet₁₁のフレーム単位の入力データに対する入力勝者ノードと、出力ネットワークnet₁₂の各ノードとの結合重みを更新するとともに、出力ネットワークnet₁₂の、フレーム単位の入力データの時刻から一定の時間だけ遅れたフレーム単位の出力データに対する出力勝者ノードと、入力ネットワークnet₁₁の各ノードとの結合重みを更新する。

即ち、データバッファ３３１は、認識学習処理部３２１から供給される時系列の入力ラベルと、認識学習処理部３２１から供給される時系列の出力ラベルとを一時記憶する。

読み出し部３３２は、入力データのフレームを、順次、注目フレームとして、データバッファ３３１に記憶された入力ラベルのうちの、注目フレームの入力データに対する入力勝者ノードを表す入力ラベルと、データバッファ３３１に記憶された出力ラベルのうちの、注目フレームの時刻から一定の時間だけ遅れたフレームの出力データに対する出力勝者ノードを表す出力ラベルとを読み出して対応付け、その対応付けた入力ラベルと出力ラベルとのセットであるラベルセットを、結合重み更新部３３３に供給する。

結合重み更新部３３３は、図２０の結合重み更新部２２２と同様に、図２２で説明したようにして、読み出し部３３２から供給されるラベルセットに基づき記憶部３１１に記憶された入出力関係モデルM₁₁₁₂（図２５）における入力ネットワークnet₁₁のノードと、出力ネットワークnet₁₂のノードとの結合関係を、ヘブ則等により更新する。

即ち、結合重み更新部３３３は、入力ネットワークnet₁₁の各入力ノードと、ラベルセットの出力ラベルが表す出力ネットワークnet₁₂の出力勝者ノードとの結合重みを、ラベルセットの入力ラベルが表す入力ネットワークnet₁₁の入力勝者ノードを中心として更新するとともに、出力ネットワークnet₁₂の各出力ノードと、入力ネットワークnet₁₁の勝者ノードとの結合重みを、出力ネットワークnet₁₂の出力勝者ノードを中心として更新する。

データ抽出部３１５には、センサ３０２が各時刻において出力するセンサデータと、モータ駆動部３０２が同一時刻において出力するモータデータとをコンポーネントとするベクトルの時系列が、入力データとして供給される。データ抽出部３１５は、データ抽出部３１２と同様に、入力データの時系列から、フレーム単位の入力データを順次抽出し、認識部３１６に供給する。

認識部３１６は、スコア計算部３４１と勝者ノード決定部３４２とから構成される。

また、図２４において、写像部３１７は、生成ノード決定部３５１から構成される。さらに、生成部３１８は、時系列生成部３６１から構成される。

スコア計算部３４１、勝者ノード決定部３４２、生成ノード決定部３５１、時系列生成部３６１は、それぞれ、図２０のスコア計算部２３１、勝者ノード決定部２３２、生成ノード決定部２３３、時系列生成部２３４と同様の処理を行う。

なお、時系列生成部３６１は、図２０の時系列生成部２３４と同様にして、出力データ（の推定値）を生成するが、この出力データは、センサデータとモータデータとをコンポーネントとするベクトルであり、そのうちのモータデータが、時系列生成部３６１からモータ駆動部３０３に供給される。

次に、図２７を参照して、図２４の読み出し部３３２の処理について説明する。

読み出し部３３２は、上述したように、入力データのフレームを、順次、注目フレームとして、データバッファ３３１に記憶された入力ラベルのうちの、注目フレームの入力データに対する入力勝者ノードを表す入力ラベルと、データバッファ３３１に記憶された出力ラベルのうちの、注目フレームの時刻から一定の時間だけ遅れたフレームの出力データに対する出力勝者ノードを表す出力ラベルとを対応付ける。

即ち、注目フレームの時刻から一定の時間だけ遅れたフレームの出力データとして、例えば、フレームと同一の時間Tを採用することとすると、読み出し部３３２は、時刻tのフレームの入力データ(IO[t,t+T-1])に対する入力勝者ノードN_tを表す入力ラベルと、注目フレームの時刻tから時間Tだけ遅れた時刻t+Tのフレームの出力データ(IO[t+T,t+2T-1])に対する出力勝者ノードN'_t+Tを表す出力ラベルとを対応付ける。

但し、ここでは、入力データと出力データは、同一の時系列データ（センサデータとモータデータとをコンポーネントとするベクトルの時系列）である。

次に、図２８のフローチャートを参照して、図２４のロボットが行う学習処理、即ち、入出力関係モデルM₁₁₁₂の学習処理について説明する。

例えば、ロボットに、目の前にあるボールを左右に転がすタスクを学習させる場合、オペレータ（ロボットにタスクの学習をさせようとするユーザ）は、ロボットの前にボールをおき、ロボットのアームを持って、ボールを左右に転がすように、アームを動かす。

この場合、センサ３０２において、左右に転がるボールの状態が検知され、その状態を表す時系列のセンサデータが、データ処理装置３０１のデータ抽出部３１２に供給される。

また、モータ駆動部３０３では、オペレータが動かしているアームの動きに対応するモータデータが生成され、データ処理装置３０１のデータ抽出部３１２に供給される。

データ抽出部３１２は、ステップＳ３０１において、センサ３０２からのセンサデータと、モータ駆動部３０３からのモータデータをコンポーネントとするベクトルの時系列（以下、適宜、センサモータデータという）を、入力データとして、その入力データの時系列から、フレーム単位の入力データを抽出し、学習処理部３１３の認識学習処理部３２１に供給するとともに、センサモータデータを出力データとして、その出力データの時系列から、フレーム単位の出力データを抽出し、学習処理部３１３の認識学習処理部３２１に供給して、ステップＳ３０２に進む。

ステップＳ３０２では、学習処理部３１３の認識学習処理部３２１が、データ抽出部３１２からのフレーム単位の入力データと出力データを用いて、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂（図２５）が有する入力ネットワークnet₁₁と出力ネットワークnet₁₂の自己組織的な学習を行う。

即ち、ステップＳ３０２では、ステップＳ３０２₁とＳ３０２₂の処理が行われる。

ステップＳ３０２₁では、認識学習処理部３２１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における入力ネットワークnet₁₁の各ノードについて、データ抽出部３１２からのフレーム単位の入力データに対するスコアを求め、入力ネットワークnet₁₁のノードの中から、スコアの最も良いノードを、入力勝者ノードに決定する。さらに、認識学習処理部３２１は、データ抽出部３１２からのフレーム単位の入力データに対する入力勝者ノードに基づいて、入力ネットワークnet₁₁を、自己組織的に更新し、入力勝者ノードを表す入力ラベルを、写像学習部３１４に供給する。

ステップＳ３０２₂では、認識学習処理部３２１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における出力ネットワークnet₁₂の各ノードについて、データ抽出部３１２からのフレーム単位の出力データに対するスコアを求め、出力ネットワークnet₁₂のノードの中から、スコアの最も良いノードを、出力勝者ノードに決定する。さらに、認識学習処理部３２１は、データ抽出部３１２からのフレーム単位の出力データに対する出力勝者ノードに基づいて、出力ネットワークnet₁₂を、自己組織的に更新し、出力勝者ノードを表す出力ラベルを、写像学習部３１４に供給する。

ステップＳ３０２の処理後は、ステップＳ３０３に進み、写像学習部３１４は、入力データのフレームのうちの、まだ注目フレームとしていないフレームを、注目フレームとして、認識学習処理部３２１からの、注目フレームの入力データに対する入力勝者ノードを表す入力ラベルと、認識学習処理部３２１からの、注目フレームから時間Tだけ遅れたフレームの出力データに対する出力勝者ノードを表す出力ラベルとを対応付ける。

即ち、ステップＳ３０３では、写像学習部３１４のデータバッファ３３１において、認識学習処理部３２１からのフレーム単位の入力データに対する入力勝者ノードを表す入力ラベルと、フレーム単位の出力データに対する出力勝者ノードを表す出力ラベルとが一時記憶される。

さらに、ステップＳ３０３では、写像学習部３１４の読み出し部３３２が、データバッファ３３１に記憶された入力ラベルのうちの、注目フレームの入力データに対する入力勝者ノードを表す入力ラベルと、データバッファ３３１に記憶された出力ラベルのうちの、注目フレームの時刻から時間Tだけ遅れたフレームの出力データに対する出力勝者ノードを表す出力ラベルとを読み出して対応付け、その対応付けた入力ラベルと出力ラベルとのセットであるラベルセットを、結合重み更新部３３３に供給する。

そして、ステップＳ３０３からステップＳ３０４に進み、写像学習部３１４の結合重み更新部３３３が、読み出し部３３２から供給されるラベルセットに基づき、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂（図２５）における入力ネットワークnet₁₁のノードと、出力ネットワークnet₁₂のノードとの結合関係を更新する。

即ち、結合重み更新部３３３は、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における入力ネットワークnet₁₁の各入力ノードと、ラベルセットの出力ラベルが表す出力ネットワークnet₁₂の出力勝者ノードとの結合重みを、ラベルセットの入力ラベルが表す入力ネットワークnet₁₁の入力勝者ノードを中心として更新するとともに、出力ネットワークnet₁₂の各出力ノードと、入力ネットワークnet₁₁の入力勝者ノードとの結合重みを、出力ネットワークnet₁₂の出力勝者ノードを中心として更新する。

以上のような入出力関係モデルM₁₁₁₂の学習処理によれば、入出力関係モデルM₁₁₁₂（図２５）が有する入力ネットワークnet₁₁と出力ネットワークnet₂との結合関係は、以下のように更新される。

即ち、入力勝者ノードは、注目フレームの入力データに対する勝者ノードであり、出力勝者ノードは、注目フレームから時間Tだけ遅れたフレームの出力データに対する勝者ノードであるから、結合重み更新部３３３による結合重みの更新によれば、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂において、注目フレームの入力データに対する入力ネットワークnet₁₁の入力勝者ノードと、注目フレームから時間Tだけ遅れたフレームの出力データに対する出力ネットワークnet₂の出力勝者ノードとの結合重みが、より強くなるように更新される。

なお、図２８の学習処理は、入力データの先頭のフレームから終わりのフレームまでを、順次、注目フレームとして、ステップＳ３０２乃至Ｓ３０４の処理を繰り返し行うようにしてもよいし、入力データの先頭のフレームから終わりのフレームまでを、順次、注目フレームとして、ステップＳ３０２の処理を繰り返し行い、その後、再び、入力データの先頭のフレームから終わりのフレームまでを、順次、注目フレームとして、ステップＳ３０３およびＳ３０４の処理を繰り返し行うようにしても良い。

次に、図２９のフローチャートを参照して、図２４のロボットが行う認知行動の処理、即ち、入出力関係モデルM₁₁₁₂を用いた時系列データの生成処理（認識生成処理）について説明する。

例えば、図２８で説明したように、ロボットに、目の前にあるボールを左右に転がすタスクを学習させた後、ロボットの前にボールをおくと（さらに、必要に応じて、ボールを転がすと）、センサ３０２において、ボールの状態が検知され、その状態を表す時系列のセンサデータが、データ処理装置３０１のデータ抽出部３１５に供給される。

さらに、データ処理装置３０１のデータ抽出部３１５には、モータ駆動部３０３からモータデータも供給される。

データ抽出部３１５は、ステップＳ３２１において、センサ３０２からのセンサデータと、モータ駆動部３０３からのモータデータとをコンポーネントとするベクトルの時系列であるセンサモータデータを入力データとして、その入力データの時系列から、フレーム単位の入力データを抽出し、認識部３１６に供給して、ステップＳ３２２に進む。

認識部３１６では、ステップＳ３２２において、スコア計算部３４１が、データ抽出部３１５からのフレーム単位の入力データを、順次、注目フレームの入力データとして、その注目フレームの入力データに対して、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂を構成する入力ネットワークnet₁₁の各ノードのスコアを計算し、勝者ノード決定部３４２に供給する。

さらに、ステップＳ３２２では、勝者ノード決定部３４２が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂を構成する入力ネットワークnet₁₁のノードの中で、スコア計算部３４１からのスコアが最も良いノードを、入力勝者ノードに決定し、その入力勝者ノードを表す入力ラベルを、写像部３１７に供給して、ステップＳ３２３に進む。

ステップＳ３２３では、写像部３１７の生成ノード決定部３５１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂を構成する出力ネットワークnet₁₂のノードの中で、勝者ノード決定部３４２からの入力ラベルが表すノード（入力勝者ノード）との結合重みが最も強いノードを生成ノードに決定し、その生成ノードを表す出力ラベルを、生成部３１８に供給して、ステップＳ３２４に進む。

ステップＳ３２４では、生成部３１８の時系列生成部３６１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂を構成する出力ネットワークnet₁₂のノードのうちの、生成ノード決定部３５１からの出力ラベルが表す生成ノードが有する時系列パターンモデル２１（図７）に基づいて、注目フレームの入力データに対する出力データ（の推定値）としての、例えば、フレームの長さの時系列データを生成して出力する。

この出力データとしての時系列データは、センサモータデータであり、そのセンサモータデータのうちのモータデータが、時系列生成部３６１からモータ駆動部３０３に供給され、モータ駆動部３０３が、時系列生成部３６１からのモータデータにしたがって、モータを駆動することにより、ロボットのアームが動かされる。

以下、データ抽出部３１５から認識部３１６に対して供給されるフレーム単位の入力データについて、ステップＳ３２２乃至Ｓ３２４の処理が行われる。

以上のように、図２４のロボットでは、入力ネットワークnet₁₁のフレーム単位の入力データに対する入力勝者ノードと、出力ネットワークnet₂の、フレーム単位の入力データの時刻から一定の時間だけ遅れたフレーム単位の出力データに対する出力勝者ノードとの結合重みを強めるように更新するので、例えば、目の前にあるボールを左右に転がすタスクのような実時間性が要求されるタスクを学習し、そのようなタスクを行うことができるようになる。

即ち、上述したように図２８の学習処理によれば、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂において、注目フレームの入力データに対する入力ネットワークnet₁₁の入力勝者ノードと、注目フレームから一定の時間だけ遅れたフレームの出力データに対する出力ネットワークnet₁₂の出力勝者ノードとの結合重みが、より強くなるように更新される。

従って、図２９の認識生成処理では、入出力関係モデルM₁₁₁₂に、あるフレームFの入力データが与えられると、入出力関係モデルM₁₁₁₂では、入力ネットワークnet₁のノードのうちの、フレームFの入力データに対応するノードが入力勝者ノードとなり、出力ネットワークnet₂のノードのうちの、フレームFから一定の時間だけ遅れたフレームの出力データに対応するノードが、入力勝者ノードとの結合重みが最も強いノードとして、生成ノードに決定され、これにより、その生成ノードに基づき、フレームFから一定の時間だけ遅れたフレームの出力データに相当する時系列データが生成される。

即ち、図２４のロボットでは、フレーム単位の入力データとしてのセンサモータデータ、つまり、外部の状態とロボット自身の状態に対して、フレーム単位の入力データから一定の時間だけ遅れたフレームの出力データとしてのセンサモータデータ、つまり、その後にとるべき行動に対応するモータデータと、その後に検知されるであろう外部の状態に対応するセンサデータとを得ることができるように、学習が行われるので、目の前にあるボールを左右に転がすタスクのような実時間性が要求されるタスクを学習し、そのようなタスクを行うことができるようになる。

ここで、図２４のロボットの結合重み更新部３３３による結合重みの更新、即ち、入力ネットワークnet₁₁のフレーム単位の入力データとしてのセンサモータデータに対する入力勝者ノードと、出力ネットワークnet₁₂の、フレーム単位のセンサモータデータの時刻から一定の時間だけ遅れたフレーム単位の出力データとしてのセンサモータデータに対する出力勝者ノードとの結合重みを強めるように更新することは、フレーム単位のセンサモータデータと、そのフレーム単位のセンサモータデータの時刻から一定の時間だけ遅れたフレーム単位のセンサモータデータとを対応付けるように、入出力関係モデルM₁₁₁₂の学習を行うことになる。

そして、認知行動時において、かかる学習が行われた入出力関係モデルM₁₁₁₂にフレーム単位のセンサモータデータが与えられると、入出力関係モデルM₁₁₁₂では、そのフレーム単位のセンサモータデータに対して、そのフレーム単位のセンサモータデータの時刻から一定の時間だけ遅れたフレーム単位のセンサモータデータ（の推定値）に対応するノードが、生成ノードとして求められることになるが、これは、あるフレームFのセンサモータデータから、生成ノードに対応するセンサモータデータ、つまり、フレームFの時刻から一定の時間だけ未来のフレームのセンサモータデータを予測している、ということができる。

以上のように、図２４のロボットでは、フレーム単位の入力データとしてのセンサモータデータと、そのフレーム単位の入力データの時刻から一定の時間だけ遅れたフレーム単位の出力データとしてのセンサモータデータとを対応付けるように、入出力関係モデルM₁₁₁₂の学習を行う。

このため、ロボットの認知行動（出力データの生成）時において、入力データであるセンサモータデータとして、入出力関係モデルM₁₁₁₂（図２５）の入力ネットワークnet₁₁のいずれかのノードが表現する時系列パターンに合致する時系列パターンのセンサモータデータ（既知のセンサモータデータ）が入力される限りは、そのセンサモータデータに対して適切な出力データであるセンサモータデータが生成され、その結果、ロボットは、学習したタスクを再現することができる。

さらに、図２４のロボットでは、入力データおよび出力データとして、いずれも、センサデータとモータデータとをコンポーネントとするベクトルであるセンサモータデータが採用され、フレーム単位の入力データとしてのセンサモータデータに対して、そのフレーム単位の入力データの時刻から一定の時間だけ遅れたフレーム単位の出力データとしてのセンサモータデータ、即ち、いわば、未来のセンサモータデータ（の推定値）が生成される。

従って、図２４のロボットでは、フレーム単位の入力データとしてのセンサモータデータに基づき、現在の外部の状態と、ロボット自体の現在の行動の状態との両方を、いわば考慮して、そのフレーム単位の入力データの時刻から一定の時間だけ遅れたフレーム単位の出力データとしてのセンサモータデータの生成、つまり、一定の時間だけ未来の外部の状態の予測と、その未来の行動の決定が行われているということができ、高い安定性でタスクを行うことができる。

具体的には、例えば、ボールを左右に転がすタスクにおいて、ボールの状態だけ、即ち、センサデータだけでは、行動を定めにくい場合（例えば、ボールを左右に転がすタスクにおいて、ボールが特定の状態にあるときに、アームを左から右に動かす行動をするケースと、右から左に動かすケースとが混在する場合）、センサデータにノイズが混入した場合（例えば、ボールを左右に転がすタスクにおいて、センサ３０２が、本来検知すべきボールの状態のみならず、ロボットのアームの状態も検知して、センサデータを出力した場合）には、センサデータだけに基づいて、一定の時間だけ遅れたモータデータを生成したのでは、ロボットの行動が不安定になるおそれがある。

これに対して、センサモータデータ、つまり、センサデータとモータデータの両方に基づいて、一定の時間だけ遅れたセンサモータデータを生成する場合においては、その一定の時間だけ遅れたセンサモータデータには、現在の外部の状態のみならず、ロボット自体の現在の行動の状態も考慮されているので、安定した行動をとることが可能となる。

なお、上述の場合には、注目フレームの時刻から一定の時間だけ遅れたフレームの出力データとして、注目フレームの時刻から、フレームと同一の時間Tだけ遅れたフレームの出力データを採用することとしたが、即ち、入力データの注目フレームと、その注目フレームに対応する出力データのフレームとの時間差（以下、適宜、入出力時間差という）として、時間Tを採用したが、入出力時間差は、時間Tに限られるものではなく、例えば、時間2Tや3T、0.5Tなどを採用することができる。

また、入出力時間差としては、フレーム単位の入力データに対して勝者ノードを決定する処理に要する時間△を考慮した時間、即ち、例えば、時間T+△を採用することができる。

以上のように、入力ネットワークnet₁₁と出力ネットワークnet₁₂とを有する入出力関係モデルM₁₁₁₂によれば、フレーム単位の入力データ（の時系列パターン）を、入力ネットワークnet₁₁で学習するとともに、フレーム単位の出力データを、出力ネットワークnet₁₂で学習し、さらに、フレーム単位の入力データと、入出力時間差だけ未来のフレームの出力データとの対応を、入力ネットワークnet₁₁のノードと、出力ネットワークnet₁₂のノードとの結合重みという形で学習することができ、これにより、ロボットにおいて、現在の状態（に対応する入力データ）に基づき、次にとるべき適切な行動（に対応する出力データ（の推定値）の生成）を行うという認知行動をとることができる。

即ち、入出力関係モデルM₁₁₁₂を用いた認知行動では、図２９で説明したように、入力ネットワークnet₁₁のノードのうちの、入力データに対するスコアが最も良いノードが、勝者ノードに決定される（ステップＳ３２２）。さらに、出力ネットワークnet₁₂のノードのうちの、勝者ノードとの結合重みが最強のノードが、生成ノードに決定される（ステップＳ３２３）。そして、生成ノードを用いて、入力データの時刻から入出力時間差だけ未来の出力データ（の推定値）が生成される。

従って、入出力関係モデルM₁₁₁₂を用いた認知行動は、図３０に示すように、入力データを内部表現に変換するプロセスPro1、入力データの内部表現から、未来の出力データの内部表現を予測するプロセスPro2、および予測された内部表現から出力データ（の推定値）を生成するプロセスPro3の３つのプロセスに分けることができる。

即ち、入出力関係モデルM₁₁₁₂では、入力ネットワークnet₁₁において、入力データが、その入力データに対するスコアが最も良いノード（勝者ノード）に抽象化され、そのノードを表すノードラベル（入力ラベル）という内部表現で表される。

ここで、出力ネットワークnet₁₂においても、同様に、出力データが、その出力データに対するスコアが最も良いノードに抽象化され、そのノードを表すノードラベルという内部表現で表される、ということができる。

入力ネットワークnet₁₁のノードの中から、入力データに対する勝者ノードを決定することは、入力データを内部表現に変換するプロセスPro1に相当する。

また、勝者ノードの決定後は、その勝者ノードとの結合重みが最強の出力ネットワークnet₁₂のノードが、入出力時間差だけ未来の出力データの生成に用いられる生成ノードに決定されるが、この生成ノードの決定は、入力データの内部表現から、未来の出力データの内部表現を予測するプロセスPro2に相当する。

さらに、生成ノードの決定後は、その生成ノードを用いて出力データが生成されるが、この出力データの生成は、予測された内部表現から出力データを生成するプロセスPro3に相当する。

ところで、図２４のロボットの認知行動では、入力データを内部表現に変換するプロセスPro1において、入力ネットワークnet₁₁のすべてのノードについて、フレーム単位の入力データに対するスコアが計算され、そのスコアが最も良いノードが、そのフレーム単位の入力データに対する勝者ノードに決定される。

従って、入力ネットワークnet₁₁を構成するノードの数の増加に伴って、スコアの計算の処理の負担も増加する。

そこで、例えば、図３１に示すように、時刻tのフレームの入力データに対する勝者ノードの決定後、次のフレームである、例えば、時刻t+1のフレームの入力データに対する勝者ノードN_t+1の決定は、その時刻t+1のフレームの入力データの直前の時刻tのフレームの入力データに対する勝者ノードN_tとの距離が所定の距離以内のノード（以下、適宜、距離制限ノードという）だけを対象にして行うことができる。

この場合、時刻t+1のフレームの入力データに対するスコアの計算は、入力ネットワークnet₁₁のすべてのノードではなく、時刻tのフレームの入力データに対する勝者ノードN_tの近傍にある距離制限ノードだけを対象として行えば良いので、スコアの計算の処理の負担を軽減することができる。

なお、２つのノードどうしの距離としては、例えば、上述したように、その２つのノードどうしを結ぶ最短のパスを構成するリンクの数を採用することができる。

また、所定の距離を小にすると、スコアの計算の対象とするノードを少なくことができるが、勝者ノードとなるノードの自由度が損なわれる。一方、所定の距離を大にすると、勝者ノードとなるノードの制約が緩和されるが、スコアの計算の対象とするノードが多くなる。

ここで、所定の距離は、例えば、時系列パターンネットワークのノードの数（総数）に基づいて設定（決定）することができる。また、所定の距離は、ユーザの操作に応じて設定することができる。

図３２は、上述のように、勝者ノードの決定を、距離制限ノードだけを対象にして行うロボットの構成例を示している。

なお、図中、図２４のロボットと対応する部分については、同一の符号を付してあり、以下では、その説明は、省略する。即ち、図３２のロボットは、認識学習処理部３２１、スコア計算部３４１、勝者ノード決定部３４２に代えて、それぞれ、認識学習処理部１３２１、スコア計算部１３４１、勝者ノード決定部１３４２が設けられている他は、図２４のロボットと同様に構成されている。

即ち、認識学習処理部１３２１は、図２４の認識学習処理部３２１と同様に、データ抽出部３１２から供給されるフレーム単位の入力データと出力データに基づいて、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂（図２５）における入力ネットワークnet₁₁と出力ネットワークnet₁₂を、自己組織的に更新するが、その際に行う勝者ノードの決定を、距離制限ノードを対象として行う。

即ち、認識学習処理部１３２１は、入出力関係モデルM₁₁₁₂における入力ネットワークnet₁₁のノードのうちの、前回のフレームの入力データに対する勝者ノードとの距離が所定の距離以内の距離制限ノードについて、データ抽出部３１２からの今回のフレームの入力データに対するスコアを求め、入力ネットワークnet₁₁の距離制限ノードの中から、スコアの最も良いノードを、勝者ノード（入力勝者ノード）に決定し、その入力勝者ノードに基づいて、入力ネットワークnet₁₁を、自己組織的に更新するとともに、入力勝者ノードを表すノードラベルである入力ラベルを、写像学習部３１４に供給する。

さらに、認識学習処理部１３２１は、入出力関係モデルM₁₁₁₂における出力ネットワークnet₁₂のノードのうちの、前回のフレームの出力データに対する勝者ノードとの距離が所定の距離以内の距離制限ノードについて、データ抽出部３１２からの今回のフレームの出力データに対するスコアを求め、出力ネットワークnet₁₂の距離制限ノードの中から、スコアの最も良いノードを、勝者ノード（出力勝者ノード）に決定し、その出力勝者ノードに基づいて、出力ネットワークnet₁₂を、自己組織的に更新するとともに、出力勝者ノードを表すノードラベルである出力ラベルを、写像学習部３１４に供給する。

スコア計算部１３４１は、データ抽出部３１５からの今回のフレームの入力データを、注目フレームの入力データとして、その注目フレームの入力データに対して、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂を構成する入力ネットワークnet₁₁のノードのうちの、前回のフレームの入力データに対する勝者ノードとの距離が所定の距離以内の距離制限ノードについて、スコアを計算し、勝者ノード決定部１３４２に供給する。

勝者ノード決定部１３４２は、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂を構成する入力ネットワークnet₁₁の距離制限ノードの中で、スコア計算部１３４１からのスコアが最も良いノードを、入力勝者ノードに決定し、その入力勝者ノードを表す入力ラベルを、写像部３１７に供給する。

次に、図３３のフローチャートを参照して、図３２のロボットが行う学習処理、即ち、入出力関係モデルM₁₁₁₂の学習処理について説明する。

例えば、ロボットに、目の前にあるボールを左右に転がすタスクを学習させる場合、オペレータは、ロボットの前にボールをおき、ロボットのアームを持って、ボールを左右に転がすように、アームを動かす。

データ抽出部３１２は、ステップＳ３４１において、センサ３０２からのセンサデータと、モータ駆動部３０３からのモータデータをコンポーネントとするベクトルの時系列であるセンサモータデータを、入力データおよび出力データとして、入力データの時系列から、フレーム単位の入力データを抽出するとともに、出力データの時系列から、フレーム単位の出力データを抽出し、そのフレーム単位の入力データと出力データを、学習処理部３１３の認識学習処理部１３２１に供給して、ステップＳ３４２に進む。

ステップＳ３４２では、学習処理部３１３が、データ抽出部３１２からのフレーム単位の入力データと出力データを用いて、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂（図２５）が有する入力ネットワークnet₁₁と出力ネットワークnet₁₂の自己組織的な学習を行う。

即ち、ステップＳ３４２では、ステップＳ３４２₁とＳ３４２₂の処理が行われる。

ステップＳ３４２₁では、認識学習処理部１３２１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における入力ネットワークnet₁₁のノードのうちの、距離制限ノードについて、データ抽出部３１２からのフレーム単位の入力データに対するスコアを求め、入力ネットワークnet₁₁の距離制限ノードの中から、スコアの最も良いノードを、入力勝者ノードに決定する。さらに、認識学習処理部１３２１は、データ抽出部３１２からのフレーム単位の入力データに対する入力勝者ノードに基づいて、入力ネットワークnet₁₁を、自己組織的に更新し、入力勝者ノードを表す入力ラベルを、写像学習部３１４に供給する。

ステップＳ３４２₂では、認識学習処理部１３２１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における出力ネットワークnet₁₂のノードのうちの、距離制限ノードについて、データ抽出部３１２からのフレーム単位の出力データに対するスコアを求め、出力ネットワークnet₁₂の距離制限ノードの中から、スコアの最も良いノードを、出力勝者ノードに決定する。さらに、認識学習処理部１３２１は、データ抽出部３１２からのフレーム単位の出力データに対する出力勝者ノードに基づいて、出力ネットワークnet₁₂を、自己組織的に更新し、出力勝者ノードを表す出力ラベルを、写像学習部３１４に供給する。

ステップＳ３４２の処理後は、ステップＳ３４３，Ｓ３４４に順次進み、図２８のステップＳ３０３，Ｓ３０４とそれぞれ同様の処理が行われる。

即ち、写像学習部３１４は、ステップＳ３０３において、入力データのフレームのうちの、まだ注目フレームとしていないフレームを、注目フレームとして、学習処理部３１３からの、注目フレームの入力データに対する入力勝者ノードを表す入力ラベルと、学習処理部３１３からの、注目フレームから入出力時間差だけ遅れたフレームの出力データに対する出力勝者ノードを表す出力ラベルとを対応付ける。

具体的には、ステップＳ３４３では、写像学習部３１４のデータバッファ３３１において、学習処理部３１３からのフレーム単位の入力データに対する入力勝者ノードを表す入力ラベルと、フレーム単位の出力データに対する出力勝者ノードを表す出力ラベルとが一時記憶される。

さらに、ステップＳ３４３では、写像学習部３１４の読み出し部３３２が、データバッファ３３１に記憶された入力ラベルのうちの、注目フレームの入力データに対する入力勝者ノードを表す入力ラベルと、データバッファ３３１に記憶された出力ラベルのうちの、注目フレームの時刻から入出力時間差だけ遅れたフレームの出力データに対する出力勝者ノードを表す出力ラベルとを読み出して対応付け、その対応付けた入力ラベルと出力ラベルとのセットであるラベルセットを、結合重み更新部３３３に供給する。

そして、ステップＳ３４３からステップＳ３４４に進み、写像学習部３１４の結合重み更新部３３３が、読み出し部３３２から供給されるラベルセットに基づき、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂（図２５）における入力ネットワークnet₁₁のノードと、出力ネットワークnet₁₂のノードとの結合関係を更新する。

以上のような入出力関係モデルM₁₁₁₂の学習処理によれば、図２８で説明した学習処理と同様に、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂において、注目フレームの入力データに対する入力ネットワークnet₁₁の入力勝者ノードと、注目フレームから入出力時間差だけ遅れたフレームの出力データに対する出力ネットワークnet₂の出力勝者ノードとの結合重みが、より強くなるように更新される。

次に、図３４のフローチャートを参照して、図３３のステップＳ３４２で行われる時系列パターン記憶ネットワーク（入出力関係モデルM₁₁₁₂（図２５）が有する入力ネットワークnet₁₁と出力ネットワークnet₁₂）の自己組織的な学習の処理について、さらに説明する。

図３３のステップＳ３４２では、図３４に示すように、まず最初に、ステップＳ３６１において、認識学習処理部１３２１は、入出力関係モデルM₁₁₁₂における入力ネットワークnet₁₁のノードのうちの、前回のフレームの入力データに対する勝者ノードとの距離が所定の距離以内のノードを、距離制限ノードとして求め、その距離制限ノードについて、データ抽出部３１２からの今回のフレームの入力データに対するスコアを求めて、ステップＳ３６２に進む。

ステップＳ３６２では、認識学習処理部１３２１は、入力ネットワークnet₁₁の距離制限ノードの中から、ステップＳ３６１で求めたスコアの最も良いノードを、勝者ノードに決定し、ステップＳ３６３に進む。ステップＳ３６３では、認識学習処理部１３２１は、ステップＳ３６２で決定された勝者ノードに基づいて、入力ネットワークnet₁₁を、自己組織的に更新するとともに、勝者ノードを表すノードラベル（入力ラベル）を、写像学習部３１４に供給して、ステップＳ３６４に進む。

ステップＳ３６４では、認識学習処理部１３２１は、ステップＳ３６２で決定された勝者ノードのノードラベルを記憶し、今回のフレームの入力データを用いた入力ネットワークnet₁₁の学習の処理を終了する。

なお、ステップＳ３６４で記憶されたノードラベルは、次のステップＳ３６１の処理、つまり、次のフレームの入力データを用いた入力ネットワークnet₁₁の学習の処理において、距離制限ノードを求めるときに、前回のフレームの入力データに対する勝者ノードを認識するのに用いられる。

また、図３４のフローチャートにしたがった処理は、今回のフレームの出力データを用いた出力ネットワークnet₁₂の学習の処理としても行われる。

次に、図３５のフローチャートを参照して、図３２のロボットが行う認知行動の処理、即ち、入出力関係モデルM₁₁₁₂を用いた時系列データの生成処理（認識生成処理）について説明する。

例えば、図３３で説明したように、ロボットに、目の前にあるボールを左右に転がすタスクを学習させた後、ロボットの前にボールをおくと（さらに、必要に応じて、ボールを転がすと）、センサ３０２において、ボールの状態が検知され、その状態を表す時系列のセンサデータが、データ処理装置３０１のデータ抽出部３１５に供給される。

データ抽出部３１５は、ステップＳ３８１において、センサ３０２からのセンサデータと、モータ駆動部３０３からのモータデータとをコンポーネントとするベクトルの時系列であるセンサモータデータを入力データとして、その入力データの時系列から、フレーム単位の入力データを抽出し、認識部３１６に供給して、ステップＳ３８２に進む。

認識部３１６では、ステップＳ３８２において、スコア計算部１３４１が、データ抽出部３１５からのフレーム単位の入力データを、順次、注目フレームの入力データとして、その注目フレームの入力データに対し、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂を構成する入力ネットワークnet₁₁のノードのうちの距離制限ノードについて、スコアを計算し、勝者ノード決定部１３４２に供給する。

さらに、ステップＳ３８２では、勝者ノード決定部１３４２が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂を構成する入力ネットワークnet₁₁の距離制限ノードの中で、スコア計算部１３４１からのスコアが最も良いノードを、勝者ノードに決定し、その勝者ノードを表す入力ラベルを、写像部３１７に供給して、ステップＳ３８３に進む。

ステップＳ３８３では、写像部３１７の生成ノード決定部３５１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂を構成する出力ネットワークnet₁₂のノードの中で、勝者ノード決定部１３４２からの入力ラベルが表すノード（勝者ノード）との結合重みが最も強いノードを生成ノードに決定し、その生成ノードを表す出力ラベルを、生成部３１８に供給して、ステップＳ３８４に進む。

ステップＳ３８４では、生成部３１８の時系列生成部３６１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂を構成する出力ネットワークnet₁₂のノードのうちの、生成ノード決定部３５１からの出力ラベルが表す生成ノードが有する時系列パターンモデル２１（図７）に基づいて、注目フレームの入力データに対する出力データ（の推定値）としての、例えば、フレームの長さの時系列データを生成して出力する。

以下、データ抽出部３１５から認識部３１６に対して供給されるフレーム単位の入力データについて、ステップＳ３８２乃至Ｓ３８４の処理が行われる。

次に、図３６のフローチャートを参照して、図３５のステップＳ３８２で行われる勝者ノードの決定の処理について、さらに説明する。

図３５のステップＳ３８２では、図３６に示すように、まず最初に、ステップＳ４０１において、スコア計算部１３４１は、入出力関係モデルM₁₁₁₂における入力ネットワークnet₁₁のノードのうちの、前回のフレーム（注目フレームの直前のフレーム）の入力データに対する勝者ノードとの距離が所定の距離以内のノードを、距離制限ノードとして求める。さらに、スコア計算部１３４１は、距離制限ノードについて、データ抽出部３１５からの今回のフレーム（注目フレーム）の入力データに対するスコアを求め、勝者ノード決定部１３４２に供給して、ステップＳ４０２に進む。

ステップＳ４０２では、勝者ノード決定部１３４２は、入力ネットワークnet₁₁の距離制限ノードの中から、スコア計算部１３４１から供給されたスコアの最も良いノードを、勝者ノードに決定し、その勝者ノードを表すノードラベル（入力ラベル）を、写像部３１７とスコア計算部１３４１に供給して、ステップＳ４０３に進む。

ステップＳ４０３では、スコア計算部１３４１は、勝者ノード決定部１３４２から供給されたステップＳ３６２で決定された勝者ノードのノードラベルを記憶し、勝者ノードの決定の処理を終了する。

なお、ステップＳ４０３で記憶されたノードラベルは、次のステップＳ４０１の処理、つまり、次のフレームの入力データに対する勝者ノードの決定の処理において、距離制限ノードを求めるときに、前回のフレームの入力データに対する勝者ノードを認識するのに用いられる。

上述したように、図３３の学習処理によれば、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂において、注目フレームの入力データに対する入力ネットワークnet₁₁の入力勝者ノードと、注目フレームから一定の時間だけ遅れたフレームの出力データに対する出力ネットワークnet₁₂の出力勝者ノードとの結合重みが、より強くなるように更新される。

従って、図３５の認識生成処理では、入出力関係モデルM₁₁₁₂に、あるフレームFの入力データが与えられると、入出力関係モデルM₁₁₁₂では、入力ネットワークnet₁₁のノードのうちの、フレームFの入力データに対応するノードが入力勝者ノードとなり、出力ネットワークnet₁₂のノードのうちの、フレームFから一定の時間だけ遅れたフレームの出力データに対応するノードが、入力勝者ノードとの結合重みが最も強いノードとして、生成ノードに決定され、これにより、その生成ノードに基づき、フレームFから一定の時間だけ遅れたフレームの出力データに相当する時系列データが生成される。

即ち、図３２のロボットでも、図２４のロボット同様に、フレーム単位の入力データとしてのセンサモータデータ、つまり、外部の状態とロボット自身の状態に対して、フレーム単位の入力データから一定の時間だけ遅れたフレームの出力データとしてのセンサモータデータ、つまり、その後にとるべき行動に対応するモータデータと、その後に検知されるであろう外部の状態に対応するセンサデータとを得ることができるように、学習が行われるので、目の前にあるボールを左右に転がすタスクのような実時間性が要求されるタスクを学習し、そのようなタスクを行うことができるようになる。

さらに、図３２のロボットでは、認識学習処理部１３２１や、スコア計算部１３４１において、距離制限ノードのみを対象として、スコアの計算が行われるので、スコアの計算の処理の負担を軽減することができる。

なお、上述のような、距離制限ノードのみを対象としたスコアの計算は、図９のデータ処理装置や、図２０のデータ処理装置にも適用可能である。さらに、距離制限ノードのみを対象としたスコアの計算は、時系列パターン記憶ネットワークの他、ノードに、時系列パターンモデル２１ではなく、入力データとしてのベクトルと同一次元の重みベクトルを有する（ノードに重みベクトルが割り当てられた）SOMのスコアの計算にも適用することができる。

次に、上述した図２４のロボットの認知行動では、入力データの内部表現から、未来の出力データの内部表現を予測するプロセスPro2において、あるフレームFの入力データに対する入力ネットワークnet₁₁の勝者ノードとの結合重みが最強の出力ネットワークnet₁₂のノードが、フレームFの時刻から入出力時間差だけ未来のフレームの出力データの生成に用いられる生成ノードに決定される。

従って、図２４のロボットでは、未来の出力データの内部表現の予測のバリエーション、つまり、生成ノードとなり得るノードの数は、多くても、出力ネットワークnet₁₂を構成するノードの数に限られる。その結果、プロセスPro2に注目すれば、入出力関係モデルM₁₁₁₂を用いて生成される出力データである時系列データ、ひいては、ロボットがとり得る行動のバリエーションは、出力ネットワークnet₁₂を構成するノードの数に限られることになる。

そこで、入力データの内部表現として、ノードラベルではなく、入力データに対する、入力ネットワークnet₁₁のノードのスコアの分布である発火パターンを採用するとともに、出力データの内部表現としても、同様に、出力データに対する、出力ネットワークnet₁₂のノードのスコアの分布である発火パターンを採用し、プロセスPro2では、図３７に示すように、あるフレームFの入力データの発火パターンから、フレームFの時刻から入出力時間差だけ未来のフレームの出力データの発火パターンを予測することとする。

ここで、図３７上は、ノードラベルを内部表現として、フレームFの入力データに対する入力ネットワークnet₁₁の勝者ノードのノードラベルから、フレームFの時刻から入出力時間差だけ未来のフレームの出力データのノード（生成ノード）のノードラベルを予測するプロセスPro2を示している。

また、図３７下は、発火パターンを内部表現として、フレームFの入力データに対する入力ネットワークnet₁₁のノードのスコアの分布である発火パターンから、フレームFの時刻から入出力時間差だけ未来のフレームの出力データに対する出力ネットワークnet₁₂のノードのスコアの分布である発火パターンを予測するプロセスPro2を示している。

図３７上のプロセスPro2では、フレームFの入力データに対する入力ネットワークnet₁₁の勝者ノードから、その勝者ノードとの結合重みに基づき、その勝者ノードとの結合重みが最強の出力ネットワークnet₁₂のノードが、フレームFの時刻から入出力時間差だけ未来のフレームの出力データの生成に用いられる生成ノードに決定される。即ち、フレームFの入力データに対する入力ネットワークnet₁₁の勝者ノードのノードラベルから、結合重みに基づき、フレームFの時刻から入出力時間差だけ未来のフレームの出力データのノード（生成ノード）のノードラベルが予測される。

従って、図３７上のプロセスPro2では、出力ネットワークnet₁₂のノードの数がM個であるとすると、予測の結果は、多くても、M通りしか存在しない。

一方、図３７上のプロセスPro2では、フレームFの入力データに対する入力ネットワークnet₁₁のノードのスコアの分布である発火パターンから、フレームFの時刻から入出力時間差だけ未来のフレームの出力データに対する出力ネットワークnet₁₂のノードのスコアの分布である発火パターンが予測される。

いま、出力ネットワークnet₁₂のノードの数がM個であり、スコアがKビットで表されるとすると、出力ネットワークnet₁₂のノードのスコアの分布である発火パターンは、(2^K)^M通りだけ存在する。従って、図３７下のプロセスPro2では、予測の結果は、最大で、(2^K)^M通りだけ存在する。

ところで、入力ネットワークnet₁₁のノードのスコアの分布である発火パターンを、入力発火パターンといい、出力ネットワークnet₁₂のノードのスコアの分布である発火パターンを、出力発火パターンということとすると、入力発火パターンから出力発火パターンを予測するには、入力発火パターンと出力発火パターンとを対応付ける（入力発火パターンから出力発火パターンへの写像を求める）必要がある。

いま、入力発火パターンと出力発火パターンとを対応付ける情報を、対パターン対応情報ということとすると、対パターン対応情報は、例えば、SVR(Support Vector Regression)（サポートベクタ回帰）などの関数近似手法その他の手法によって求める（学習する）ことができる。

ここで、SVRでは、複数であるn次元の値である入力ベクトルを引数として、１次元の値としての出力スカラ値を出力する、次式で表される実数値関数f():Rⁿ→Rが推定される。

式（６）において、yは、出力スカラ値を表し、z∈Rⁿは、入力ベクトルを表す。また、K(,)は、カーネル関数を表し、bは、バイアス項と呼ばれるスカラ量である。さらに、Jは、サポートベクトルの数を表し、Ｓ_j∈Ｒ^Nは、J個のサポートベクトルのうちの、j番目のサポートベクトルを表す。

SVRの学習においては、ある数Dの学習サンプルとしての出力スカラ値y_dおよび入力ベクトルz_dのセット（d=1,2,・・・,D）と、カーネル関数K(,)が与えられると、入力ベクトルz_dから出力スカラ値y_dへの写像を適切に行う関数f()を規定するパラメータs_j,θ_j,bが求められる。なお、サポートベクタの数Jとしては、学習サンプルの数D以下の値が、SVRの学習の過程で求められる。

SVRの学習は、バッチ学習で行われることが多いが、オンライン学習で行う方法も提案されている。SVRの学習をオンライン学習で行う方法としては、例えば、AOSVR(Acurate Online SVR)と呼ばれる方法がある。

入力発火パターンと出力発火パターンとの対応付けを、SVRによって行う場合には、対パターン対応情報は、式（６）の関数f()を規定するパラメータs_j,θ_j,bとなる。

SVRによる対パターン対応情報の学習では、式（６）の関数f()が、出力ネットワークnet₁₂のノードの数だけ用意される。いま、出力ネットワークnet₁₂のノードの数がM個であり、そのうちのm番目（m=1,2,・・・,M）のノードに対応する関数f()を、f_m()と表すこととすると、その関数f_m()を規定するパラメータs_j,θ_j,bとしての対パターン対応情報は、出力ネットワークnet₁₂のm番目のノードのスコアを、学習サンプルとしての出力スカラ値yとするとともに、入力発火パターンに対応するベクトル、即ち、入力ネットワークnet₁₁の各ノードのスコアをコンポーネントとするベクトルを、学習サンプルとしての入力ベクトルzとして求められる。

なお、SVRについては、例えば、「サポートベクターマシン入門」、共立出版、pp.149-159などに記載されている。

次に、図２４のロボットの認知行動では、プロセスPro2で予測された内部表現から出力データを生成するプロセスPro3において、出力ネットワークnet₁₂のノードのうちの１つのノードを生成ノードとして、その生成ノードを用いて出力データが生成される。

従って、図２４のロボットでは、プロセスPro3に注目すれば、データ処理装置３０１において生成される出力データ（の予測値）、ひいては、ロボットがとり得る行動のバリエーションは、出力ネットワークnet₁₂のノードの数に限られることになる。

一方、図３７で説明したように、入力データの内部表現として、入力発火パターンを採用するとともに、出力データの内部表現として、出力発火パターンを採用し、プロセスPro2において、フレームFの入力データの発火パターン（入力発火パターン）から、フレームFの時刻から入出力時間差だけ未来のフレームの出力データの発火パターン（出力発火パターン）を予測する場合、プロセスPro2で予測された内部表現から出力データを生成するプロセスPro3では、図３８に示すように、出力ネットワークnet₁₂の生成ノードとされたノードからではなく、プロセスPro2で予測された出力発火パターンから、出力データを生成する必要がある。

ここで、図３８上は、ノードラベルを内部表現とし、フレームFの入力データに対する入力ネットワークnet₁₁の勝者ノードとの結合重みが最強の出力ネットワークnet₁₂のノードを生成ノードとして、その生成ノードから、出力データを生成するプロセスPro3を示している。

また、図３８下は、発火パターンを内部表現として、出力発火パターンから、出力データを生成するプロセスPro3を示している。

図３８上のプロセスPro3では、生成ノードが有する時系列パターンモデル２１（図７）が表現する時系列パターンの時系列データ（プロトタイプの時系列データ）が、出力データとして生成される。

従って、図３８上のプロセスPro3では、出力ネットワークnet₁₂のノードの数がM個であるとすると、出力データ（の推定値）として生成される時系列データは、多くても、M通りしか存在しない。

一方、図３８上のプロセスPro3では、出力発火パターンから、出力データとしての時系列データが生成される。

いま、出力ネットワークnet₁₂のノードの数がM個であり、スコアがKビットで表されるとすると、出力ネットワークnet₁₂のノードのスコアの分布である発火パターンは、(2^K)^M通りだけ存在する。従って、図３８下のプロセスPro3では、出力データとして、最大で、(2^K)^M通りの時系列データを生成することができる。

ところで、出力発火パターンから出力データとしての時系列データを生成するには、出力発火パターンと出力データとしての時系列データを対応付ける（出力発火パターンから出力データとしての時系列データへの写像を求める）必要がある。

いま、出力発火パターンと出力データとしての時系列データとを対応付ける情報を、対時系列対応情報ということとすると、対時系列対応情報は、例えば、上述した対パターン対応情報と同様に、SVRなどの関数近似手法その他の手法によって求める（学習する）ことができる。

出力発火パターンと出力データとしての時系列データとの対応付けを、SVRによって行う場合には、対時系列対応情報は、式（６）の関数f()を規定するパラメータs_j,θ_j,bとなる。

SVRによる対時系列対応情報の学習では、式（６）の関数f()が、出力発火パターンから生成する出力データとしての時系列データのサンプル点の数だけ用意される。いま、出力発火パターンから生成する出力データとしての時系列データのサンプル点の数が、例えば、フレームの時間Tに等しく、先頭からi番目（i=1,2,・・・,T）のサンプル点の時系列データ（サンプル値）に対応する関数f()を、f_i()と表すこととすると、その関数f_i()を規定するパラメータs_j,θ_j,bとしての対時系列対応情報は、i番目のサンプル点のサンプル値を、学習サンプルとしての出力スカラ値yとするとともに、出力発火パターンに対応するベクトル、即ち、出力ネットワークnet₁₂の各ノードのスコアをコンポーネントとするベクトルを、学習サンプルとしての入力ベクトルzとして求められる。

図３９は、上述したように、入力データおよび出力データの内部表現として、発火パターンを採用し、プロセスPro2において、入力発火パターンから出力発火パターンを予測するとともに、プロセスPro3において、出力発火パターンから出力データを生成するロボットの構成例を示している。

なお、図中、図２４のロボットと対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図３９において、学習処理部３１３には、図２４の認識学習処理部３２１に代えて、認識学習処理部２３２１と生成学習処理部２３２２とが設けられている。

認識学習処理部２３２１には、データ抽出部３１２からフレーム単位の入力データと出力データとが供給される。

認識学習処理部２３２１は、図２４の認識学習処理部３２１と同様に、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における入力ネットワークnet₁₁の各ノードについて、データ抽出部３１２からのフレーム単位の入力データに対するスコアを求め、入力ネットワークnet₁₁のノードの中から、スコアの最も良いノードを、勝者ノード（入力勝者ノード）に決定する。そして、認識学習処理部２３２１は、データ抽出部３１２からのフレームの入力データに対する入力勝者ノードに基づいて、入力ネットワークnet₁₁を、自己組織的に更新する。

また、認識学習処理部２３２１は、入力ネットワークnet₁₁の、フレーム単位の入力データに対するスコアの分布である入力発火パターン（を表す情報）を、写像学習部３１４のデータバッファ２３３１に時系列に供給する。

さらに、認識学習処理部２３２１は、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における出力ネットワークnet₁₂の各ノードについて、データ抽出部３１２からのフレーム単位の出力データに対するスコアを求め、出力ネットワークnet₁₂のノードの中から、スコアの最も良いノードを、勝者ノード（出力勝者ノード）に決定する。そして、認識学習処理部２３２１は、データ抽出部３１２からのフレームの出力データに対する出力勝者ノードに基づいて、出力ネットワークnet₁₂を、自己組織的に更新する。

また、認識学習処理部２３２１は、出力ネットワークnet₁₂の、フレーム単位の出力データに対するスコアの分布である出力発火パターン（を表す情報）を、生成学習処理部２３２２と、写像学習部３１４のデータバッファ２３３１とに時系列に供給する。

生成学習処理部２３２２には、認識学習処理部２３２１からフレーム単位の出力データに対する出力発火パターンが供給される他、そのフレーム単位の出力データが、データ抽出部３１２から供給されるようになっている。

生成学習処理部２３２２は、データ抽出部３１２からのフレーム単位の出力データと、認識学習処理部２３２１から供給される、そのフレーム単位の出力データに対する出力発火パターンとに基づき、フレーム単位の出力データと、そのフレーム単位の出力データに対する出力発火パターンとを対応付ける対時系列対応情報を、例えば、上述したSVRにより学習し、入出力関係モデルM₁₁₁₂の一部として、記憶部３１１に記憶させる。

ここで、生成学習処理部２３２２で学習する対時系列対応情報は、あるフレームFの出力データの（時間）T個のサンプル値のすべてと、そのフレームFに対する出力発火パターンとを対応付ける情報であっても良いし、フレームFの出力データの一部のサンプル値と、そのフレームFに対する出力発火パターンとを対応付ける情報であっても良い。後述する時系列生成部２３６１では、出力発火パターンに対応付けられたサンプル値の数だけのサンプル値からなる出力データの推定値としての時系列データが、１フレームの入力データに対して生成される。

写像学習部３１４には、図２４のデータバッファ３３１、読み出し部３３２、結合重み更新部３３３に代えて、それぞれデータバッファ２３３１、読み出し部２３３２、対パターン対応情報更新部２３３３が設けられている。

データバッファ２３３１は、認識学習処理部２３２１から時系列に供給される入力発火パターンと出力発火パターンとを一時記憶する。

読み出し部２３３２は、入力データのフレームを、順次、注目フレームとして、データバッファ２３３１に記憶された入力発火パターンのうちの、注目フレームの入力データに対する入力発火パターンと、データバッファ２３３１に記憶された出力発火パターンのうちの、注目フレームの時刻から入出力時間差だけ遅れた（未来の）フレームの出力データに対する出力発火パターンとを読み出して対応付け、その対応付けた入力発火パターンと出力発火パターンとのセットであるパターンセットを、対パターン対応情報更新部２３３３に供給する。

対パターン対応情報更新部２３３３は、読み出し部２３３２からのパターンセットの入力発火パターンと、そのパターンセットの出力発火パターンとに基づき、それらの入力発火パターンと出力発火パターンとを対応付ける対パターン対応情報を、例えば、上述したSVRにより学習し、入出力関係モデルM₁₁₁₂の結合重みの代わりに、記憶部３１１に記憶させる。

認識部３１６には、図２４の勝者ノード決定部３４２に代えて、入力発火パターン出力部２３４２が設けられている。

入力発火パターン出力部２３４２には、スコア計算部３４１から、フレーム単位の入力データに対する入力ネットワークnet₁₁の各ノードのスコアが供給されるようになっている。入力発火パターン出力部２３４２は、スコア計算部３４１から、あるフレームFの入力データに対する、入力ネットワークnet₁₁の各ノードのスコアが供給されると、そのスコアの分布である入力発火パターンを構成して出力する。入力発火パターン出力部２３４２が出力する入力発火パターンは、写像部３１７の出力発火パターン決定部２３５１に供給される。

写像部３１７には、図２４の生成ノード決定部３５１に代えて、出力発火パターン決定部２３５１が設けられている。

出力発火パターン決定部２３５１は、記憶部３１１に記憶された対パターン対応情報に基づいて、入力発火パターン出力部２３４２から供給される入力発火パターンに対応する出力発火パターンを決定し、生成部３１８の時系列生成部２３６１に供給する。

即ち、出力発火パターン決定部２３５１は、例えば、記憶部３１１に記憶された対パターン対応情報としての式（６）の関数f()を規定するパラメータs_j,θ_j,bに基づき、入力発火パターン出力部２３４２から供給されるフレームFの入力データに対する入力発火パターンを引数として、式（６）の関数f()を演算することにより、フレームFの入力データに対する入力発火パターンから、そのフレームFから入出力時間差だけ未来のフレームの出力データ（の推定値）に対する出力発火パターンを予測し、生成部３１８の時系列生成部２３６１に供給する。

生成部３１８には、図２４の時系列生成部３６１に代えて、時系列生成部２３６１が設けられている。

時系列生成部２３６１は、記憶部３１１に記憶された対時系列対応情報に基づいて、出力発火パターン決定部２３５１から供給される出力発火パターンに対応する時系列データを、出力データ（の推定値）として生成し、モータ駆動部３０３に供給する。

即ち、時系列生成部２３６１は、例えば、記憶部３１１に記憶された対時系列対応情報としての式（６）の関数f()を規定するパラメータs_j,θ_j,bに基づき、出力発火パターン出力部２３５１から供給される、フレームFの入力データに対する入力発火パターンから予測された、フレームFから入出力時間差だけ未来のフレームの出力データに対する出力発火パターンを引数として、式（６）の関数f()を演算することにより、フレームFから入出力時間差だけ未来のフレームの出力データの一部または全部の推定値としての時系列データを生成し、モータ駆動部３０３に供給する。

次に、図４０のフローチャートを参照して、図３９のロボットが行う学習処理、即ち、入出力関係モデルM₁₁₁₂の学習処理について説明する。

データ抽出部３１２は、ステップＳ４２１において、センサ３０２からのセンサデータと、モータ駆動部３０３からのモータデータをコンポーネントとするベクトルの時系列であるセンサモータデータを、入力データとして、その入力データの時系列から、フレーム単位の入力データを抽出し、学習処理部３１３の認識学習処理部３２１に供給するとともに、センサモータデータを出力データとして、その出力データの時系列から、フレーム単位の出力データを抽出し、認識学習処理部２３２１と生成学習処理部２３２２に供給して、ステップＳ４２２に進む。

ステップＳ４２２では、認識学習処理部２３２１が、データ抽出部３１２からのフレーム単位の入力データと出力データを用いて、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂（図２５）が有する入力ネットワークnet₁₁と出力ネットワークnet₁₂の自己組織的な学習を行う。

即ち、ステップＳ４２２では、ステップＳ４２２₁とＳ４２２₂の処理が行われる。

ステップＳ４２２₁では、認識学習処理部２３２１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における入力ネットワークnet₁₁の各ノードについて、データ抽出部３１２からのフレーム単位の入力データに対するスコアを求め、入力ネットワークnet₁₁のノードの中から、スコアの最も良いノードを、入力勝者ノードに決定する。さらに、認識学習処理部２３２１は、データ抽出部３１２からのフレーム単位の入力データに対する入力勝者ノードに基づいて、入力ネットワークnet₁₁を、自己組織的に更新し、入力ネットワークnet₁₁の、フレーム単位の入力データに対するスコアの分布である入力発火パターンを、データバッファ２３３１に供給する。

ステップＳ４２２₂では、認識学習処理部２３２１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における出力ネットワークnet₁₂の各ノードについて、データ抽出部３１２からのフレーム単位の出力データに対するスコアを求め、出力ネットワークnet₁₂のノードの中から、スコアの最も良いノードを、出力勝者ノードに決定する。さらに、認識学習処理部２３２１は、データ抽出部３１２からのフレーム単位の出力データに対する出力勝者ノードに基づいて、出力ネットワークnet₁₂を、自己組織的に更新し、出力ネットワークnet₁₂の、フレーム単位の出力データに対するスコアの分布である出力発火パターンを、生成学習処理部２３２２と、写像学習部３１４とに供給する。

ステップＳ４２２の処理後は、ステップＳ４２３に進み、生成学習処理部２３２２は、データ抽出部３１２から供給される出力データのフレームを注目フレームとして、その注目フレームの出力データと、認識学習処理部２３２１から供給される、その注目フレームの出力データに対する出力発火パターンとに基づき、注目フレームの出力データと、その注目フレームの出力データに対する出力発火パターンとを対応付ける対時系列対応情報を学習し、記憶部３１１に記憶させて、ステップＳ４２４に進む。

ステップＳ４２４では、写像学習部３１４は、入力データのフレームのうちの、まだ注目フレームとしていないフレームを、注目フレームとして、認識学習処理部２３２１からの、注目フレームの入力データに対する入力発火パターンと、同じく認識学習処理部２３２１からの、注目フレームから入出力時間差だけ未来のフレームの出力データに対する出力発火パターンとを対応付ける。

即ち、ステップＳ４２４では、写像学習部３１４のデータバッファ２３３１において、認識学習処理部２３２１からのフレーム単位の入力データに対する入力発火パターンと、フレーム単位の出力データに対する出力発火パターンとが一時記憶される。

さらに、ステップＳ４２４では、写像学習部３１４の読み出し部２３３２が、データバッファ２３３１に記憶された入力発火パターンのうちの、注目フレームの入力データに対する入力発火パターンと、データバッファ２３３１に記憶された出力発火パターンのうちの、注目フレームの時刻から入出力時間差だけ未来のフレームの出力データに対する出力発火パターンとを読み出して、その入力発火パターンと出力発火パターンとのセットであるパターンセットを、対パターン対応情報更新部２３３３に供給する。

そして、ステップＳ４２４からステップＳ４２５に進み、写像学習部３１４の対パターン対応情報更新部２３３３が、読み出し部２３３２から供給されるパターンセットに基づき、対パターン対応情報を学習し、記憶部３１１に記憶させる。

なお、図４０の学習処理は、入力データの先頭のフレームから終わりのフレームまでを、順次、注目フレームとして、ステップＳ４２２乃至Ｓ４２５の処理を繰り返し行うようにしてもよいし、入力データの先頭のフレームから終わりのフレームまでを、順次、注目フレームとして、ステップＳ４２２およびＳ４２３の処理を繰り返し行い、その後、再び、入力データの先頭のフレームから終わりのフレームまでを、順次、注目フレームとして、ステップＳ４２４およびＳ４２５の処理を繰り返し行うようにしても良い。

次に、図４１のフローチャートを参照して、対時系列対応情報の学習（更新）を、SVRにより行う場合の、図４０のステップＳ４２３の処理について、さらに説明する。

なお、ここでは、データ抽出部３１２から生成学習処理部２３２２に供給される注目フレームの出力データのすべてのサンプル値と、認識学習処理部２３２１から供給される、注目フレームの出力データに対する出力発火パターンとを対応付ける対時系列対応情報を学習することとする。

ステップＳ４４１において、生成学習処理部２３２２は、データ抽出部３１２から供給される注目フレームの出力データの先頭からのサンプル値の数をカウントする変数iを1に初期化し、ステップＳ４４２に進む。

ステップＳ４４２では、生成学習処理部２３２２は、フレームの先頭からi番目（i=1,2,・・・,T）のサンプル値v_iに対応する式（６）の関数f()である関数f_i()について、注目フレームのi番目のサンプル値v_iを、学習サンプルとしての出力スカラ値yとするとともに、注目フレームの出力データに対する出力発火パターンに対応するベクトル、即ち、注目フレームの出力データに対する出力ネットワークnet₁₂の各ノードのスコアをコンポーネントとするベクトルを、学習サンプルとしての入力ベクトルzとして、関数f_i()を規定するパラメータs_j,θ_j,b（以下、適宜、SVRパラメータP_iという）を学習（更新）して、ステップＳ４４３に進む。

ステップＳ４４３では、生成学習処理部２３２２は、変数iがフレームの長さTに等しいかどうかを判定する。ステップＳ４４３において、変数iがフレームの長さTに等しくないと判定された場合、ステップＳ４４４に進み、生成学習処理部２３２２は、変数iを１だけインクリメントして、ステップＳ４４２に戻り、以下、同様の処理が繰り返される。

また、ステップＳ４４３において、変数iがフレームの長さTに等しいと判定された場合、即ち、フレームのT個のサンプル点すべてについて、SVRパラメータP_iが求められた場合、生成学習処理部２３２２は、そのSVRパラメータP_iを、対時系列対応情報として、記憶部３１１に記憶させて、リターンする。

次に、図４２のフローチャートを参照して、対パターン対応情報の学習（更新）を、SVRにより行う場合の、図４０のステップＳ４２５の処理について、さらに説明する。

ステップＳ４６１において、対パターン対応情報更新部２３３３は、読み出し部２３３２から供給されるパターンセットの出力発火パターン、即ち、入力データのあるフレームを注目フレームとすると、その注目フレームから入出力時間差だけ未来のフレームの出力データに対する出力発火パターンを構成する、出力ネットワークnet₁₂のノードのスコアの数をカウントする変数mを1に初期化し、ステップＳ４６２に進む。

ステップＳ４６２では、対パターン対応情報更新部２３３３は、出力発火パターンのm番目（i=1,2,・・・,M）のスコアu_mに対応する式（６）の関数f()である関数f_m()について、注目フレームから入出力時間差だけ未来のフレームの出力データに対する出力発火パターンのm番目（i=1,2,・・・,M）のスコアu_mを、学習サンプルとしての出力スカラ値yとするとともに、注目フレームの入力データに対する入力発火パターンに対応するベクトル、即ち、注目フレームの入力データに対する入力ネットワークnet₁₁の各ノードのスコアをコンポーネントとするベクトルを、学習サンプルとしての入力ベクトルzとして、関数f_m()を規定するパラメータs_j,θ_j,b（以下、適宜、SVRパラメータQ_mという）を学習（更新）して、ステップＳ４６３に進む。

ステップＳ４６３では、対パターン対応情報更新部２３３３は、変数mが、出力ネットワークnet₁₂のノードの数Mに等しいかどうかを判定する。ステップＳ４６３において、変数mがノードの数Mに等しくないと判定された場合、ステップＳ４６４に進み、対パターン対応情報更新部２３３３は、変数mを１だけインクリメントして、ステップＳ４６２に戻り、以下、同様の処理が繰り返される。

また、ステップＳ４６３において、変数mがノードの数Mに等しいと判定された場合、即ち、出力ネットワークnet₁₂のノードすべてについて、SVRパラメータQ_mが求められた場合、対パターン対応情報更新部２３３３は、そのSVRパラメータQ_mを、対パターン対応情報として、記憶部３１１に記憶させて、リターンする。

次に、図４３のフローチャートを参照して、図３９のロボットが行う認知行動の処理、即ち、入出力関係モデルM₁₁₁₂を用いた時系列データの生成処理（認識生成処理）について説明する。

例えば、図４０で説明したように、ロボットに、目の前にあるボールを左右に転がすタスクを学習させた後、ロボットの前にボールをおくと（さらに、必要に応じて、ボールを転がすと）、センサ３０２において、ボールの状態が検知され、その状態を表す時系列のセンサデータが、データ処理装置３０１のデータ抽出部３１５に供給される。

データ抽出部３１５は、ステップＳ４８１において、センサ３０２からのセンサデータと、モータ駆動部３０３からのモータデータとをコンポーネントとするベクトルの時系列であるセンサモータデータを入力データとして、その入力データの時系列から、フレーム単位の入力データを抽出し、認識部３１６のスコア計算部３４１に供給して、ステップＳ４８２に進む。

認識部３１６では、ステップＳ４８２において、スコア計算部３４１が、データ抽出部３１５からのフレーム単位の入力データを、順次、注目フレームの入力データとして、その注目フレームの入力データに対して、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂を構成する入力ネットワークnet₁₁の各ノードのスコアを計算し、入力発火パターン出力部２３４２に供給する。

さらに、ステップＳ４８２では、入力発火パターン出力部２３４２が、スコア計算部３４１からの、注目フレームの入力データに対する入力ネットワークnet₁₁の各ノードのスコアを用いて、そのスコアの分布である入力発火パターンを構成し、出力発火パターン決定部２３５１に供給して、ステップＳ４８３に進む。

ステップＳ４８３では、出力発火パターン決定部２３５１は、記憶部３１１に記憶された対パターン対応情報としての式（６）の関数f()を規定するSVRパラメータQ_mに基づき、入力発火パターン出力部２３４２からの注目フレームの入力データに対する入力発火パターンを引数zとして、式（６）の関数f()を演算することにより、注目フレームの入力データに対する入力発火パターンから、その注目フレームから入出力時間差だけ未来のフレームの出力データ（の推定値）に対する出力発火パターンを予測し、生成部３１８の時系列生成部２３６１に供給して、ステップＳ４８４に進む。

ステップＳ４８４では、時系列生成部２３６１は、記憶部３１１に記憶された対時系列対応情報としての式（６）の関数f()を規定するSVRパラメータP_iに基づき、出力発火パターン出力部２３５１からの出力発火パターンを引数zとして、式（６）の関数f()を演算することにより、注目フレームから入出力時間差だけ未来のフレームの出力データの推定値である時系列データを生成して出力する。

この時系列データは、センサモータデータであり、そのセンサモータデータのうちのモータデータが、時系列生成部２３６１からモータ駆動部３０３に供給され、モータ駆動部３０３が、時系列生成部２３６１からのモータデータにしたがって、モータを駆動することにより、ロボットのアームが動かされる。

以下、データ抽出部３１５から認識部３１６に対して供給されるフレーム単位の入力データについて、ステップＳ４８２乃至Ｓ４８４の処理が行われる。

なお、上述のような、入力データの内部表現として、発火パターンを採用すること、および発火パターン（出力発火パターン）から時系列データ（出力データ）を生成することは、図９のデータ処理装置に適用可能である。

また、上述のような、入力データおよび出力データの内部表現として、発火パターンを採用すること、入力発火パターンから出力発火パターンを予測すること、および予測された出力発火パターンから出力データを生成することは、図２０のデータ処理装置にも適用可能である。

さらに、入力データおよび出力データの内部表現として、発火パターンを採用すること、入力発火パターンから出力発火パターンを予測すること、および予測された出力発火パターンから出力データを生成することは、時系列パターン記憶ネットワークの他、ノードに、時系列パターンモデル２１ではなく、入力データとしてのベクトルと同一次元の重みベクトルを有するSOMを対象として行うことが可能である。

ところで、入力データや出力データなどの時系列データから、フレーム単位の時系列データを抽出し、そのフレーム単位の時系列データを用いて、時系列パターン記憶ネットワークなどのSOMの学習を行うと、類似する時系列パターンを表現するノードどうしは、近い位置に配置されていく。

従って、時系列データにおいて、あるフレームFの時系列データの時系列パターンPFと、そのフレームFに時間的に近いフレームF'の時系列データの時系列パターンPF'とが、類似していない場合には、フレームFとF'とが時間的に近くても、そのフレームFの時系列データの時系列パターンPFを表現するノードと、フレームF'の時系列データの時系列パターンPF'を表現するノードとは、近い位置には配置されない。

即ち、例えば、凹形状の時系列パターンと、凸形状の時系列パターンとが、比較的短い周期で繰り返される正弦波から、その周期より短い長さのフレーム単位で、時系列データを抽出し、そのフレーム単位の時系列データを用いて、時系列パターン記憶ネットワークの学習を行うと、凹形状の時系列パターンのフレームの時系列データと、凸形状の時系列パターンのフレームの時系列データとが、時間的に近くても、凹形状の時系列パターンと凸形状の時系列パターンとが類似していないため、凹形状の時系列パターンを表現するノードと、凸形状の時系列パターンを表現するノードとは、遠い位置（互いに離れた位置）に配置される。

ここで、図４４は、凹形状の時系列パターンと、凸形状の時系列パターンとが、比較的短い周期で繰り返される正弦波から抽出したフレーム単位の時系列データを、フレーム単位の入力データとして、時系列パターン記憶ネットワークに与えたときに勝者ノードとなるノードの軌跡を求めた実験の実験結果を示している。

なお、実験では、時系列パターン記憶ネットワークとして、横×縦が１０×１０個のノードを有する時系列パターン記憶ネットワークを採用し、ノードには、図８に示したような２次元的に配置される配置構造となるリンクを与えた。

また、実験では、図４４上に示すように、時系列データとして、凹形状の時系列パターンと、凸形状の時系列パターンとが、比較的短い周期で繰り返される、式y=100sin(4t)で表される正弦波をサンプリングして得られる時系列データを用いた。サンプリングでは、正弦波の１周期、つまり、２πの区間から、314点のサンプル値を得た（0.01ごとのサンプリングを行った）。

さらに、以上のようなサンプリングによって得られる正弦波の時系列データから、連続する40サンプル点のサンプル値を、10サンプル点ずつシフトしながら抽出し、その40サンプル点のサンプル値を、フレーム単位の入力データとして、時系列パターン記憶ネットワークの学習を行った。

図４４下は、学習後の時系列パターン記憶ネットワークに、フレーム単位の入力データを与えて求めた、勝者ノード（白い部分）の軌跡を示している。

図４４下に示すように、ある１のフレームの次のフレームの入力データに対する勝者ノードが、その１のフレームの入力データに対する勝者ノードから大きく離れたノードとなることがある。

このように、あるフレームF₁の入力データに対する勝者ノードN_F1と、そのフレームF₁の次のフレームF₂の入力データに対する勝者ノードN_F2とが大きく離れている場合、フレームF₁の入力データに対する発火パターン（入力発火パターン）と、フレームF₂の入力データに対する発火パターンとは、いわば時間的な連続性のない、大きく異なった発火パターンになる。

上述したように、対パターン対応情報や対時系列対応情報の学習を、SVRなどの関数近似によって行う場合、学習に用いる学習サンプルとしての入力ベクトルzとなる発火パターンが、時間的な連続性のないものであると、近似の精度が劣化し、その結果、入力発火パターンから出力発火パターンを予測するときの予測精度や、予測された出力発火パターンから出力データとしての時系列データを生成するときの、その時系列データの精度が劣化する。

そこで、あるフレームF₁の入力データに対する勝者ノードN_F1の決定後、そのフレームF₁の次のフレームF₂の入力データに対する勝者ノードN_F2の決定は、上述したように、フレームF₁の入力データに対する勝者ノードN_F1との距離が所定の距離以内のノード（距離制限ノード）だけを対象にして行うことができる。これにより、入力発火パターンから出力発火パターンを予測するときの予測精度や、予測された出力発火パターンから出力データとしての時系列データを生成するときの、その時系列データの精度の劣化を防止することができる。

なお、以上のことは、出力データについても同様である。

ここで、図４５に、時系列データとして、４種類の正弦波を用い、勝者ノードの決定を、時系列パターン記憶ネットワークノードのうちの、距離制限ノードだけを対象に行った場合と、すべてのノードを対象に行った場合の、勝者ノードの軌跡を示す。

なお、図４５では、図４４で説明したのと同一の１０×１０個のノードで構成される時系列パターン記憶ネットワークを用い、距離制限ノードとしては、直前のフレームの時系列データに対する勝者ノードからの距離が１以内のノード、つまり、直前のフレームの時系列データに対する勝者ノードと、その勝者ノードに隣接する８個のノードを採用している。

図４５の左から１番目は、時系列データとしての４つの正弦波を示している。上から１番目は、式y=100sin(t)で表される正弦波であり、上から２番目は、式y=50sin(8t)-50で表される正弦波である。また、上から３番目は、式y=100sin(4t)で表される正弦波であり、上から４番目（下から１番目）は、式y=50sin(2t)+50で表される正弦波である。

図４５の左から２番目は、４種類の正弦波それぞれについて、勝者ノードの決定を、時系列パターン記憶ネットワークのノードのうちの距離制限ノードだけを対象に行った場合の、勝者ノードの軌跡を示している。

図４５の左から３番目（右から１番目）は、４種類の正弦波それぞれについて、勝者ノードの決定を、時系列パターン記憶ネットワークのノードのうちのすべてのノードを対象に行った場合の、勝者ノードの軌跡を示している。

図４５から、勝者ノードの決定を、時系列パターン記憶ネットワークのノードのうちの距離制限ノードだけを対象に行った場合には、すべてのノードを対象に行った場合に比べて、勝者ノードが、局所的に集まり、ある時系列データ（フレーム単位の時系列データとする前の時系列データ）が有する時系列パターンが、局所的なノードで学習（獲得）されていることがわかる。

なお、図４５によれば、時系列データから抽出したフレーム単位の時系列データに対する勝者ノードの軌跡により、時系列データを区別することができることがわかる。

図４６は、上述したように、勝者ノードの決定を、時系列パターン記憶ネットワークノードのうちの距離制限ノードだけを対象に行い、かつ、入力データおよび出力データの内部表現として、発火パターンを採用し、入力発火パターンから出力発火パターンを予測するとともに、出力発火パターンから出力データを生成するロボットの構成例を示している。

なお、図中、図２４または図３９のロボットと対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図４６において、学習処理部３１３には、図３９の認識学習処理部２３２１に代えて、認識学習処理部３３２１が設けられている。

認識学習処理部３３２１には、データ抽出部３１２からフレーム単位の入力データと出力データとが供給される。

認識学習処理部３３２１は、図３９の認識学習処理部２３２１と同様の処理を行う。但し、図３９の認識学習処理部２３２１は、入力ネットワークnet₁₁のノードの中から、データ抽出部３１２からのフレーム単位の入力データに対するスコアが最も良いノードを、入力勝者ノードに決定するとともに、出力ネットワークnet₁₂のノードの中から、データ抽出部３１２からのフレーム単位の出力データに対するスコアが最も良いノードを、出力勝者ノードに決定するのに対して、認識学習処理部３３２１は、距離制限ノードの中から、フレーム単位の入力データに対するスコアが最も良いノードを、入力勝者ノードに決定するとともに、フレーム単位の出力データに対するスコアが最も良いノードを、出力勝者ノードに決定する。

次に、図４７のフローチャートを参照して、図４６のロボットが行う学習処理、即ち、入出力関係モデルM₁₁₁₂の学習処理について説明する。

データ抽出部３１２は、ステップＳ５０１において、センサ３０２からのセンサデータと、モータ駆動部３０３からのモータデータをコンポーネントとするベクトルの時系列であるセンサモータデータを、入力データとして、その入力データの時系列から、フレーム単位の入力データを抽出し、学習処理部３１３の認識学習処理部３２１に供給するとともに、センサモータデータを出力データとして、その出力データの時系列から、フレーム単位の出力データを抽出し、認識学習処理部３３２１と生成学習処理部２３２２に供給して、ステップＳ５０２に進む。

ステップＳ５０２では、認識学習処理部３３２１が、データ抽出部３１２からのフレーム単位の入力データと出力データを用いて、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂（図２５）が有する入力ネットワークnet₁₁と出力ネットワークnet₁₂の自己組織的な学習を行う。

即ち、ステップＳ５０２では、ステップＳ５０２₁とＳ５０２₂の処理が行われる。

ステップＳ５０２₁では、認識学習処理部３３２１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における入力ネットワークnet₁₁の各ノードについて、データ抽出部３１２からのフレーム単位の入力データに対するスコアを求め、入力ネットワークnet₁₁の距離制限ノードの中から、スコアの最も良いノードを、入力勝者ノードに決定する。さらに、認識学習処理部３３２１は、データ抽出部３１２からのフレーム単位の入力データに対する入力勝者ノードに基づいて、入力ネットワークnet₁₁を、自己組織的に更新し、入力ネットワークnet₁₁の、フレーム単位の入力データに対するスコアの分布である入力発火パターンを、データバッファ２３３１に供給する。

ステップＳ５０２₂では、認識学習処理部３３２１が、記憶部３１１に記憶された入出力関係モデルM₁₁₁₂における出力ネットワークnet₁₂の各ノードについて、データ抽出部３１２からのフレーム単位の出力データに対するスコアを求め、出力ネットワークnet₁₂の距離制限ノードの中から、スコアの最も良いノードを、出力勝者ノードに決定する。さらに、認識学習処理部３３２１は、データ抽出部３１２からのフレーム単位の出力データに対する出力勝者ノードに基づいて、出力ネットワークnet₁₂を、自己組織的に更新し、出力ネットワークnet₁₂の、フレーム単位の出力データに対するスコアの分布である出力発火パターンを、生成学習処理部２３２２と、写像学習部３１４とに供給する。

ステップＳ５０２の処理後は、ステップＳ５０３，Ｓ５０４，Ｓ５０５に順次進み、図４０のステップＳ４２３，Ｓ４２４，Ｓ４２５とそれぞれ同様の処理が行われる。

なお、図４６のロボットが行う認知行動の処理、即ち、入出力関係モデルM₁₁₁₂を用いた時系列データの生成処理（認識生成処理）は、図４３で説明した、図３９のロボットが行う認知行動の処理と同様であるため、その説明は、省略する。

次に、図４８および図４９を参照して、図４６のロボットを用いて行った実験の実験結果について説明する。

図４８は、入力発火パターンから、出力発火パターンを予測した実験の実験結果を示している。

なお、図４８において、xy平面上の各位置は、時系列パターン記憶ネットワークのノードの位置を表し、z軸は、各ノードのスコアを表す。

実験では、入力データおよび出力データとするセンサモータデータとして、式y=100sin(x)で表される時系列データを用い、その時系列データからフレーム単位の入力データと出力データを抽出し、そのフレーム単位の入力データと出力データを用いて、図４４で説明した時系列パターン記憶ネットワークを入力ネットワークnet₁₁および出力ネットワークnet₁₂として有する入出力関係モデルM₁₁₁₂の学習を行った。

図４８の左から１番目は、入出力関係モデルM₁₁₁₂の学習に用いたフレーム単位の入力データのうちの、ある時刻tのフレームの入力データに対する入力発火パターンを表している。

図４８の左から２番目は、図４８の左から１番目に示した、時刻tのフレームの入力データに対する入力発火パターンから予測した、未来の時刻t+1のフレームの出力データ（の推定値）に対する出力発火パターンを示している。

図４８の左から３番目（右から１番目）は、入出力関係モデルM₁₁₁₂の学習に用いたフレーム単位の出力データのうちの、時刻t+1のフレームの出力データに対する実際の出力発火パターンを示している。

図４８の左から２番目と３番目とを比較することにより、時刻tのフレームの入力データに対する入力発火パターンから、未来の時刻t+1のフレームの出力データ（の推定値）に対する出力発火パターンを精度良く予測することができていることが分かる。

図４９は、出力発火パターンから、出力データ（の推定値）を生成した実験の実験結果を示している。

実験では、入力データおよび出力データとするセンサモータデータとして、図４５に示した４つの正弦波の時系列データを用い、その時系列データからフレーム単位の入力データと出力データを抽出し、そのフレーム単位の入力データと出力データを用いて、図４４で説明した時系列パターン記憶ネットワークを入力ネットワークnet₁₁および出力ネットワークnet₁₂として有する入出力関係モデルM₁₁₁₂の学習を行った。

また、実験では、式y=100sin(x)で表される時系列データからフレーム単位の時系列データを抽出し、そのフレーム単位の時系列データに対する出力ネットワークnet₁₂の各ノードのスコアを求め、そのスコアに基づいて得られる勝者ノードを生成ノードとして、その生成ノードを用いて、時系列データを生成するとともに、スコアに基づいて得られる発火パターンを用いて、時系列データを生成した。

図４９の上から１番目は、スコアを求めるのに用いた、式y=100sin(x)で表される時系列データを示している。

図４９の上から２番目は、生成ノードを用いて生成された時系列データを示している。

図４９の上から３番目（下から１番目）は、発火パターンを用いて生成された時系列データを示している。

図４９から、発火パターンを用いた場合の方が、生成ノードを用いた場合に比較して滑らかな時系列データを得ることができることが分かる。

次に、図４６のロボットにおいて、入出力関係モデルM₁₁₁₂の学習は、図４７で説明したように行われるが、その学習は、大きく、入出力関係モデルM₁₁₁₂が有する入力ネットワークnet₁₁および出力ネットワークnet₁₂の学習（ステップＳ５０２）、対時系列対応関係の学習（ステップＳ５０３）、並びに対パターン対応関係の学習（ステップＳ５０５）に分けることができる。

入力ネットワークnet₁₁および出力ネットワークnet₁₂の学習、対時系列対応関係の学習、並びに対パターン対応関係の学習のすべては、バッチ学習とオンライン学習のいずれによっても行うことができ、従って、入出力関係モデルM₁₁₁₂の学習も、バッチ学習とオンライン学習のいずれによっても行うことができる。

そこで、図５０のフローチャートを参照して、入出力関係モデルM₁₁₁₂の学習を、バッチ学習で行う場合について説明する。

入出力関係モデルM₁₁₁₂の学習を、バッチ学習で行う場合には、入出力関係モデルM₁₁₁₂の学習に用いる多数のセンサモータデータがあらかじめ用意される。

そして、ステップＳ１００１において、あらかじめ用意された多数のセンサモータデータをすべて用いて、入力ネットワークnet₁₁および出力ネットワークnet₁₂の学習が行われる。

次に、ステップＳ１００２において、あらかじめ用意された多数のセンサモータデータすべてを再び用いて、対パターン対応関係の学習が行われる。

そして、最後に、ステップＳ１００３において、あらかじめ用意された多数のセンサモータデータすべてを再び用いて、対時系列対応関係の学習が行われる。

次に、図５１のフローチャートを参照して、入出力関係モデルM₁₁₁₂の学習を、オンライン学習で行う場合について説明する。

入出力関係モデルM₁₁₁₂のオンライン学習は、入出力関係モデルM₁₁₁₂に用いるある長さのセンサモータデータが得られると開始される。

即ち、まずステップＳ１０２１において、センサモータデータを入力データおよび出力データとして、その先頭から終わりの方向にフレームの先頭の時刻tをずらしながら、時刻tのフレームの入力データと、次の時刻t+1のフレームの出力データとが抽出される。

そして、ステップＳ１０２２において、時刻tのフレームの入力データを用いて、入力ネットワークnet₁₁の学習（更新）が行われるとともに、時刻t+1のフレームの出力データを用いて、出力ネットワークnet₁₂の学習（更新）が行われる。

次に、ステップＳ１０２３において、時刻tのフレームの入力データに対する入力発火パターンと、時刻t+1のフレームの出力データに対する出力発火パターンとを用いて、入力発火パターンと出力発火パターンを対応付ける対パターン対応情報の学習（更新）が行われる。

その後、ステップＳ１０２４において、時刻t+1のフレームの出力データと、その出力データに対する出力発火パターンとを用いて、出力データと出力発火パターンを対応付ける対時系列対応情報の学習（更新）が行われる。

そして、時刻tが更新され、センサモータデータとしての入力データおよび出力データからフレームを抽出することができなくなるまで、ステップＳ１０２１乃至Ｓ１０２４の処理が繰り返し行われる。

なお、本実施の形態では、入出力関係モデルを、ノードに、時系列パターンモデル２１を有する時系列パターン記憶ネットワークを用いて構成するようにしたが、入出力関係モデルは、ノードに、時系列パターンモデル２１ではなく、入力データとしてのベクトルと同一次元の重みベクトルを有する（ノードに重みベクトルが割り当てられた）従来のSOMを用いて構成することもできる。

入出力関係モデルを、従来のSOMを用いて構成する場合には、ノードは、そのノードが有する重みベクトルのコンポーネントをサンプル値とする固定長の時系列パターンを表現することになる。

また、入出力関係モデルを、従来のSOMを用いて構成する場合には、ノードが有する重みベクトルの次元数（重みベクトルのコンポーネントの数）と、フレームの長さTとは一致させる必要があり、フレーム単位の時系列データに対するSOMのノードのスコアとしては、例えば、フレーム単位の時系列データを構成する各サンプル値をコンポーネントとするベクトルと、ノードが有する重みベクトルとの距離が用いられる。

さらに、本実施の形態では、時系列パターン記憶ネットワークのすべてのノードのスコアの分布を、発火パターンとしたが、発火パターンとしては、すべてのノードのスコアの分布ではなく、距離制限ノードのスコアの分布を採用することができる。発火パターンとして、距離制限ノードのスコアの分布を採用する場合、距離制限ノード以外のノードのスコアを０とすることにより、時系列パターン記憶ネットワークのすべてのノードのスコアの分布を、発火パターンとする場合と同様に処理することができる。

また、入出力関係モデルM₁₁₁₂が有する入力ネットワークnet₁₁および出力ネットワークnet₁₂は、図１９の入出力関係モデルが有する時系列パターン記憶ネットワークnet_inおよびnet_outと同様に、ノードの数や、リンク、ノードが有する時系列パターンモデル２１が同一であっても良いし、異なっていても良い。

さらに、入出力関係モデルM₁₁₁₂が有する入力ネットワークnet₁₁と出力ネットワークnet₁₂の学習を、フレーム単位のセンサモータデータを用いて行い、かつ、入力ネットワークnet₁₁と出力ネットワークnet₁₂として、同一の時系列パターン記憶ネットワークを採用する場合には、その入力ネットワークnet₁₁および出力ネットワークnet₁₂は、学習の結果が同一となるから、１つの時系列パターン記憶ネットワークで代用することができる。この場合、１つ分の時系列パターン記憶ネットワーク（入力ネットワークnet₁₁または出力ネットワークnet₁₂）を記憶するのに必要な記憶容量を節約することができる。

次に、上述した一連の処理は、専用のハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータや、いわゆる組み込み型のコンピュータ等にインストールされる。

そこで、図５２は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。

プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク１０１０５やROM１０１０３に予め記録しておくことができる。

あるいはまた、プログラムは、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)，MO(Magneto Optical)ディスク，DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体１０１１１に、一時的あるいは永続的に格納（記録）しておくことができる。このようなリムーバブル記録媒体１０１１１は、いわゆるパッケージソフトウエアとして提供することができる。

なお、プログラムは、上述したようなリムーバブル記録媒体１０１１１からコンピュータにインストールする他、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部１０１０８で受信し、内蔵するハードディスク１０１０５にインストールすることができる。

コンピュータは、CPU(Central Processing Unit)１０１０２を内蔵している。CPU１０１０２には、バス１０１０１を介して、入出力インタフェース１０１１０が接続されており、CPU１０１０２は、入出力インタフェース１０１１０を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部１０１０７が操作等されることにより指令が入力されると、それにしたがって、ROM(Read Only Memory)１０１０３に格納されているプログラムを実行する。あるいは、また、CPU１０１０２は、ハードディスク１０１０５に格納されているプログラム、衛星若しくはネットワークから転送され、通信部１０１０８で受信されてハードディスク１０１０５にインストールされたプログラム、またはドライブ１０１０９に装着されたリムーバブル記録媒体１０１１１から読み出されてハードディスク１０１０５にインストールされたプログラムを、RAM(Random Access Memory)１０１０４にロードして実行する。これにより、CPU１０１０２は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU１０１０２は、その処理結果を、必要に応じて、例えば、入出力インタフェース１０１１０を介して、LCD(Liquid Crystal Display)やスピーカ等で構成される出力部１０１０６から出力、あるいは、通信部１０１０８から送信、さらには、ハードディスク１０１０５に記録等させる。

なお、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含むものである。

また、プログラムは、１のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。

ここで、モータデータには、モータを駆動するためのデータの他、広く、外部に働きかける装置、または刺激を与える装置を駆動するためのデータを含む。外部に働きかける装置または刺激を与える装置としては、モータの他、光を発することにより画像を表示するディスプレイや、音声を出力するスピーカ等があり、従って、モータデータには、モータを駆動するためのデータの他、ディスプレイに表示させる画像に対応する画像データや、スピーカから出力する音声に対応する音声データ等が含まれる。

なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

また、本発明は、ロボットの他、例えば、テレビジョン受像機やHDレコーダなどのAV(Audio Visual)機器、コンピュータ、その他の装置における、ユーザインタフェース（ヒューマンインタフェース）に適用することが可能である。

制御対象と、順モデルおよび逆モデルとを説明するための図である。制御対象としての想定ロボットと、その想定ロボットの順モデルとを示す図である。制御対象としてのロボットのアームと、そのアームの逆モデルを利用したアーム制御器とを示す図である。線形システムを用いたモデル化を説明するための図である。教師あり学習の一例を説明するための図である。時系列パターン記憶ネットワークの第１の構成例を示す図である。ノードの構成例を示す図である。時系列パターン記憶ネットワークの第２の構成例を示す図である。時系列パターン記憶ネットワークを用いた処理を行うデータ処理装置の構成例を示すブロック図である。学習部４の構成例を示すブロック図である。学習処理部３２の構成例を示すブロック図である。更新重みを決定する決定方法を説明するための図である。学習データ記憶部２２に記憶させる学習データを更新する更新方法を説明するための図である。学習処理を説明するフローチャートである。認識部３の構成例を示すブロック図である。認識処理を説明するフローチャートである。生成部６の構成例を示すブロック図である。生成処理を説明するフローチャートである。入出力関係モデルの構成例を示す図である。入出力関係モデルを用いた処理を行うデータ処理装置の構成例を示すブロック図である。入出力関係モデルの学習を説明するフローチャートである。結合重み行列を示す図である。入出力関係モデルを用いて、出力データまたは制御データを推定する処理を説明するフローチャートである。入出力関係モデルを適用したロボットの第１の構成例を示すブロック図である。入出力関係モデルM₁₁₁₂を示す図である。データ抽出部３１２の処理を説明するための図である。読み出し部３３２の処理を説明するための図である。入出力関係モデルM₁₁₁₂の学習を説明するフローチャートである。入出力関係モデルM₁₁₁₂を用いて時系列データを生成する認識生成処理を説明するフローチャートである。入出力関係モデルM₁₁₁₂を用いた認知行動のプロセスPro1,Pro2,Pro3を説明するための図である。スコアの計算を距離制限ノードだけを対象に行うことを説明するための図である。入出力関係モデルを適用したロボットの第２の構成例を示すブロック図である。入出力関係モデルM₁₁₁₂の学習を説明するフローチャートである。時系列パターン記憶ネットワークの学習を説明するフローチャートである。入出力関係モデルM₁₁₁₂を用いて時系列データを生成する認識生成処理を説明するフローチャートである。勝者ノードの決定の処理を説明するフローチャートである。入力発火パターンから出力発火パターンを予測するプロセスPro2を説明するための図である。プロセスPro2で予測された出力発火パターンから、出力データを生成するプロセスPro3を説明するための図である。入出力関係モデルを適用したロボットの第３の構成例を示すブロック図である。入出力関係モデルM₁₁₁₂の学習を説明するフローチャートである。対時系列対応情報の学習の処理を説明するフローチャートである。対パターン対応情報の学習の処理を説明するフローチャートである。入出力関係モデルM₁₁₁₂を用いて時系列データを生成する認識生成処理を説明するフローチャートである。勝者ノードの軌跡を示す図である。勝者ノードの軌跡を示す図である。入出力関係モデルを適用したロボットの第４の構成例を示すブロック図である。入出力関係モデルM₁₁₁₂の学習を説明するフローチャートである。入力発火パターンから、出力発火パターンを予測した実験の実験結果を示す図である。出力発火パターンから、出力データ（の推定値）を生成した実験の実験結果を示す図である。入出力関係モデルM₁₁₁₂のバッチ学習を説明するフローチャートである。入出力関係モデルM₁₁₁₂のオンライン学習を説明するフローチャートである。本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

符号の説明

１信号入力部，２特徴抽出部，３認識部，４学習部，５記憶部，６生成部，２１時系列パターンモデル，２２学習データ記憶部，３１時系列データ記憶部，３２学習処理部，４１スコア計算部，４２勝者ノード決定部，４３重み決定部，４４学習データ更新部，４５モデル学習部，５１スコア計算部，５２勝者ノード決定部，５３出力部，６１生成ノード決定部，６２時系列決定部，６３出力部，２１１記憶部，２１２学習部，２１３認識生成部，２２１学習処理部，２２２結合重み更新部，２３１スコア計算部，２３２勝者ノード決定部，２３３生成ノード決定部，２３４時系列生成部，３０１データ処理装置，３０２センサ，３０３モータ駆動部，３１１記憶部，３１２データ抽出部，３１３学習処理部，３１４写像学習部，３１５データ抽出部，３１６認識部，３１７写像部，３１８生成部，３２１認識学習処理部，３３１データバッファ，３３２読み出し部，３３３結合重み更新部，３４１スコア計算部，３４２勝者ノード決定部，３５１生成ノード決定部，３６１時系列生成部，１３２１認識学習処理部，１３４１スコア計算部，１３４２勝者ノード決定部，２３２１認識学習処理部，２３２２生成学習処理部，２３３１データバッファ，２３３２読み出し部，２３３３対パターン対応情報更新部，２３４１スコア計算部，２３４２入力発火パターン出力部，２３５１出力発火パターン決定部，２３６１時系列生成部，３３２１認識学習処理部，１０１０１バス，１０１０２ CPU，１０１０３ ROM，１０１０４ RAM，１０１０５ハードディスク，１０１０６出力部，１０１０７入力部，１０１０８通信部，１０１０９ドライブ，１０１１０入出力インタフェース，１０１１１リムーバブル記録媒体

Claims

時系列データの処理を行うデータ処理装置において、
時系列データから、所定の時間単位の時系列データを抽出するデータ抽出手段と、
空間的な配置構造が与えられた複数のノードから構成されるSOM（Self-Organization Map）のノードが、所定の時間単位の時系列データに適合する度合いを表すスコアを求め、前記スコアが最も良いノードを、所定の時間単位の時系列データに最も適合するノードである勝者ノードに決定する処理手段と
を備え、
前記処理手段は、
前記SOMにおいて、１の所定の時間単位の時系列データの直前の所定の時間単位の時系列データに対する勝者ノードとの距離が所定の距離以内のノードである距離制限ノードについて、前記１の所定の時間単位の時系列データに対するスコアを求め、
前記距離制限ノードのうちの、前記スコアが最も良いノードを、前記１の所定の時間単位の時系列データに対する勝者ノードに決定する
データ処理装置。
前記処理手段は、さらに、前記勝者ノードに基づいて、前記SOMを、自己組織的に更新する
請求項１に記載のデータ処理装置。
時系列データの処理を行うデータ処理装置のデータ処理方法において、
時系列データから、所定の時間単位の時系列データを抽出するデータ抽出ステップと、
空間的な配置構造が与えられた複数のノードから構成されるSOM（Self-Organization Map）のノードが、所定の時間単位の時系列データに適合する度合いを表すスコアを求め、前記スコアが最も良いノードを、所定の時間単位の時系列データに最も適合するノードである勝者ノードに決定する処理ステップと
を含み、
前記処理ステップにおいて、
前記SOMにおいて、１の所定の時間単位の時系列データの直前の所定の時間単位の時系列データに対する勝者ノードとの距離が所定の距離以内のノードである距離制限ノードについて、前記１の所定の時間単位の時系列データに対するスコアを求め、
前記距離制限ノードのうちの、前記スコアが最も良いノードを、前記１の所定の時間単位の時系列データに対する勝者ノードに決定する
データ処理方法。
時系列データの処理を行うデータ処理を、コンピュータに実行させるプログラムにおいて、
時系列データから、所定の時間単位の時系列データを抽出するデータ抽出ステップと、
空間的な配置構造が与えられた複数のノードから構成されるSOM（Self-Organization Map）のノードが、所定の時間単位の時系列データに適合する度合いを表すスコアを求め、前記スコアが最も良いノードを、所定の時間単位の時系列データに最も適合するノードである勝者ノードに決定する処理ステップと
を含み、
前記処理ステップにおいて、
前記SOMにおいて、１の所定の時間単位の時系列データの直前の所定の時間単位の時系列データに対する勝者ノードとの距離が所定の距離以内のノードである距離制限ノードについて、前記１の所定の時間単位の時系列データに対するスコアを求め、
前記距離制限ノードのうちの、前記スコアが最も良いノードを、前記１の所定の時間単位の時系列データに対する勝者ノードに決定する
前記データ処理を、コンピュータに実行させるプログラム。