JP2006285899A

JP2006285899A - 学習装置および学習方法、生成装置および生成方法、並びにプログラム

Info

Publication number: JP2006285899A
Application number: JP2005108478A
Authority: JP
Inventors: Kazumi Aoyama; 一美青山; Katsuki Minamino; 活樹南野; Hideki Shimomura; 秀樹下村
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2005-04-05
Filing date: 2005-04-05
Publication date: 2006-10-19
Also published as: US7346595B2; US20060248026A1

Abstract

【課題】時系列データである入力データと出力データとの関係の学習を、容易に行う。
【解決手段】時系列パターンを表現する時系列パターンモデルを有する複数のノードで構成される入力ネットワークnet_in1,net_in2と出力ネットワークnet_out1,net_out2とのノードどうしが結合されている入出力関係モデルにおける入力ネットワークnet_in1,net_in2それぞれを、入力データに基づいて、自己組織的に更新するとともに、出力ネットワークnet_out1,net_out2それぞれを、出力データに基づいて、自己組織的に更新し、入力ネットワークnet_in1,net_in2のノードのうちの勝者ノードと、出力ネットワークnet_out1,net_out2の各ノードとの結合関係を更新するとともに、出力ネットワークnet_out1,net_out2のノードのうちの勝者ノードと、入力ネットワークnet_in1,net_in2の各ノードとの結合関係を更新する。本発明は、例えば、ロボットなどに適用できる。
【選択図】図２６

Description

本発明は、学習装置および学習方法、生成装置および生成方法、並びにプログラムに関し、特に、例えば、音声のような時系列のデータである時系列データの入力と出力を観測することができる制御対象について、高精度の順モデルや逆モデルを、容易に獲得すること等ができるようにする学習装置および学習方法、生成装置および生成方法、並びにプログラムに関する。

図１は、順モデルと逆モデルの概念を示している。

ある時系列データ（時系列のデータ）としての入力データに対して、他の時系列データとしての出力データを出力する制御対象が与えられ、制御対象に関する詳細な情報はわからないが（制御対象の内部がわからないが）、制御対象に与えられる入力データと、その入力データに対して制御対象から得られる出力データは観測することができることとする。

ここで、制御対象に与えられる入力データと、その入力データに対して制御対象から得られる出力データとは、観測することができれば、どのような物理量でも良い。また、制御対象は、入力データを与えることができ、かつ、その入力データに対して出力データを得ることができるものであれば、どのような対象（もの）でも良い。

従って、例えば、ボールや、楽器、自動車、ガスヒータその他の種々のものが、制御対象となり得る。即ち、例えば、ボールについては、入力データとしての力を加える（与える）ことで、その入力データに対して変化する出力データとしてのボールの位置や速度が得られる。また、例えば、自動車については、入力データとしてのハンドルや、アクセル、ブレーキなどの操作をする（与える）ことで、その入力データに対して変化する出力データとしての自動車の位置や速度を得ることができる。さらに、例えば、ガスヒータについては、入力データとしての火力を調整する操作をすることで、その入力データに対して変化する出力データとしての部屋の温度を得ることができる。

以上のように、制御対象に入力データを与え、それに対して出力データが得られる場合に、その制御対象をモデル化したもの（モデル）が順モデルである。

順モデルは、入力データを入力すると（入力データが与えられると）、その入力データに対して、制御対象から得られる出力データの推定値を出力する。従って、順モデルによれば、制御対象に対して、実際の入力データを与えなくても、その入力データに対して、制御対象から得られる出力データを推定することができる。

一方、制御対象から得られる出力データの目標値を決定し、その目標値となる出力データを得るために、制御対象に与えるべき入力データを推定することができるモデルが逆モデルである。順モデルは、入力データから出力データへの写像とみなすことができるが、その逆写像が逆モデルである。

ここで、逆モデルによって求められる、目標値となる出力データを得るために、制御対象に与えるべき入力データを、以下、適宜、制御データともいう。

以上のような順モデルや逆モデルは、例えば、ロボット（の構成）に利用することができる。

即ち、いま、ロボットが、マイク（マイクロフォン）やカメラを備え、音声（音）データや画像データを入力することができ、かつ、スピーカやアクチュエータ（モータ）を備え、音声（音声データ）を出力し、また、モータデータ（モータ信号）にしたがってモータが駆動することにより、アームを動かすことができることとする。

かかるロボットにおいて、ある音声データや画像データなどの入力データに応じて、出力データとしての音声データを出力させ、また、所望のアームの動作をさせる出力データとしてのモータデータを出力させる場合、従来においては、音声認識装置や画像認識装置を用いて、ロボットに入力される音声データや画像データを認識した認識結果に応じて、どのような音声データを出力するべきか、あるいは、どのようなモータデータを出力するべきかを、あらかじめプログラミング（デザイン）しておくことが行われる。

これに対して、順モデルを利用すれば、図２に示すように、ある音声データや画像データに応じて、所望の音声データや、所望のアーム動作をさせるモータデータを出力するロボットを制御対象として想定し、その制御対象として想定したロボット（以下、適宜、想定ロボットと呼ぶ）の順モデルとして、実際のロボットを構成することが可能となる。即ち、想定ロボットに対する入力データと出力データの関係を、実際のロボットに学習させることができれば、想定ロボットの順モデルとしてのロボットを構成することができる。

具体的には、想定ロボットに入力する音声データや画像データなどの入力データと、想定ロボットが各入力データに対応して出力すべき音声データやモータデータなどの出力データとのセットをあらかじめ用意し、実際のロボットに与える。実際のロボットにおいて、外部から与えられた入力データと出力データのセット（以下、適宜、教示データという）だけを用いて、入力データに対応する出力データを推定する（出力する）、想定ロボットの順モデルを求めることができれば、実際に入力される音声データや画像データなどの入力データに応じて、所望の音声データやモータデータなどの出力データを出力することが可能となる。

また、逆モデルを利用すれば、図３に示すように、ロボットのアームを制御対象として、その制御対象であるアームを制御するアーム制御器を構成することが可能となる。

即ち、いま、ロボットのアームが、入力データとしてのモータデータに応じて駆動するモータによって動き、その結果、アームの先端の位置が変化するとする。さらに、ロボットの重心を原点とし、ロボットの前方（正面）方向をx軸と、（ロボットから見て）右方向をｙ軸と、上方向をｚ軸と、それぞれする３次元座標系に基づき、その３次元座標系の(x,y,z)座標でアームの先端の位置を表すこととする。この場合、モータデータに応じてモータが駆動し、さらにアームの先端の位置が変化することで、アームの先端がある軌跡を描く。ここで、アームの先端が描く軌跡（先端位置軌跡）の座標のシーケンスを、先端位置軌跡データという。

アームが所望の先端位置軌跡を描くようにするには、つまり、出力データとしての所望の先端位置軌跡データを出力するようにするには、アームがそのような先端位置軌跡を描くようにモータを駆動するモータデータを、入力データとしてモータに与える必要がある。

いま、入力データとしてのモータデータと、そのモータデータがモータに与えられたときの出力データとしての先端位置軌跡データとのセットである教示データだけを用いて、出力データとしての、ある先端位置軌跡データを目標値として得ることができる入力データ（制御データ）としてのモータデータを推定する、アームの逆モデルを求めることができれば、その逆モデルは、目標値である先端位置軌跡データに対して、対応するモータデータを決定するアーム制御器に利用することができる。

このようなアームの逆モデルとしてのアーム制御器によれば、ロボットに対して、入力データとしての先端位置軌跡データを入力すると、ロボットは、アーム制御器を用いることで、対応するモータデータ（制御データ）を決定することができる。そして、ロボットが、このモータデータにしたがってモータを駆動すれば、ロボットのアームは、入力データとしての先端位置軌跡データに対応した軌跡を描くように移動する。

以上のように、入力データと出力データとのセット（教示データ）だけを用いて、順モデルや逆モデルを求めることができれば、その順モデルや逆モデルを用いて、各入力データに応じた出力データを出力するロボットを、容易に構成することが可能となる。

ところで、制御対象の順モデルや逆モデルを求める方法としては、線形システムを用いたモデル化がある。

線形システムを用いたモデル化では、例えば、図４に示すように、時刻tにおける、制御対象への入力データをu(t)とするとともに、出力データをy(t)として、出力データy(t)と入力データu(t)との関係、つまり制御対象を、例えば、式（１）および式（２）で与えられる線形システムとして近似する。

・・・（１）

・・・（２）

ここで、x(t)は、時刻tにおける線形システムの状態変数と呼ばれ、A, B, C は係数である。また、ここでは、説明を簡単にするために、入力データu(t)および出力データy(t)を１次元ベクトル（スカラ）とするとともに、状態変数x(t)をn次元ベクトルとすると（ここでは、nは２以上の整数値）、A,B,Cは、それぞれn×n行列、n×1行列、1×n行列で与えられる定数の行列となる。

線形システムを用いたモデル化では、観測することができる入力データu(t)と、その入力データu(t)が制御対象に与えられたときに観測される出力データy(t)との関係が、式（１）および式（２）を満たすように、行例A,B,Cを決定することで、制御対象の順モデルが得られる。

しかしながら、線形システムを用いたモデル化は、複雑な制御対象、即ち、例えば、非線形な特性を持つ制御対象をモデル化するには十分ではない。

即ち、現実の制御対象は複雑であり、非線形な特性を有することが少なくないが、かかる制御対象を、単純な線形システムとして近似してモデル化すると、順モデルが入力データに対して推定する出力データや、逆モデルが出力データに対して推定する入力データ（制御データ）の推定誤差が大になり、高精度の推定を行うことが困難となる。

そこで、非線形な特性を持つ制御対象に対する順モデルや逆モデルを得る方法としては、例えば、ニューラルネットワークを用いて、教示データ、即ち、制御対象に与えられる入力データと、その入力データが与えられたときに制御対象から観測される出力データとのセットを学習する方法がある。ここで、ニューラルネットワークとは、生体の神経細胞（ニューロン）を模擬した人工素子を相互接続して構成されるネットワークであり、外部から与えられる教示データの関係、つまり、入力データと出力データとの関係を学習することができる。

しかしながら、ニューラルネットワークによって、制御対象を適切にモデル化するには、制御対象の複雑性に応じて、ニューラルネットワークの規模を大にする必要がある。ニューラルネットワークの規模が大になると、学習に要する時間が飛躍的に増大し、また、安定した学習も難しくなる。このことは、入力データや出力データの次元数が大である場合も同様である。

一方、入力データと出力データとのセット（教示データ）だけを用いて、順モデルや逆モデルを求める場合には、教示データを用いて学習を行い、教示データが、幾つかのパターンのうちのいずれに該当するかを認識する必要がある。即ち、教示データとしての入力データや出力データのパターンを学習して認識する必要がある。

パターンを学習して認識を行う技術は、一般にパターン認識（pattern recognition）と呼ばれ、パターン認識における学習は、教師あり学習（supervised learning）と、教師なし学習（unsupervised learning）とに分けることができる。

教師あり学習とは、各パターンの学習データがどのクラスに属するかの情報（これを正解ラベルと呼ぶ）を与えて、各パターンごとに、そのパターンに属する学習データを学習する方法であり、ニューラルネットワークや、HMM（Hidden Markov Model）などを用いた学習方法が数多く提案されている。

ここで、図５は、従来の教師あり学習の一例を示している。

教師あり学習では、学習に利用する学習データが、想定したカテゴリ（クラス）（例えば、各音素のカテゴリや、各音韻のカテゴリ、各単語のカテゴリなど）ごとに用意される。例えば、"A"，"B"，"C"という発声の音声データを学習する場合、"A"，"B"，"C"それぞれの多数の音声データが用意されることになる。

一方、学習に利用するモデル（各カテゴリの学習データを学習させるモデル）も、想定したカテゴリごとに用意される。ここで、モデルは、パラメータによって定義される。例えば、音声データの学習には、モデルとして、ＨＭＭなどが用いられるが、HMMは、ある状態から他の状態（元の状態を含む）に遷移する状態遷移確率や、HMMから出力される観測値の確率密度を表す出力確率密度関数などによって定義される。

教師あり学習では、各カテゴリ（クラス）のモデルの学習が、そのカテゴリの学習データのみを用いて行われる。即ち、図５では、カテゴリ"A"のモデルの学習は、カテゴリ"A"の学習データのみを用いて行われ、カテゴリ"B"のモデルの学習は、カテゴリ"B"の学習データのみを用いて行われる。同様に、カテゴリ"C"のモデルの学習も、カテゴリ"C"の学習データのみを用いて行われる。

教師あり学習においては、このように、各カテゴリの学習データを用いて、そのカテゴリのモデルの学習を行う必要があるため、カテゴリごとに、そのカテゴリの学習データを用意し、各カテゴリのモデルの学習に対して、そのカテゴリの学習データを与えて、カテゴリごとのモデルを得る。このように、教師あり学習によれば、正解ラベルに基づき、クラスごとのテンプレート（正解ラベルが表すクラス（カテゴリ）のモデル）を得ることができる。

そして、認識時には、ある認識対象のデータに対し、その認識対象のデータに最も適合(match)するテンプレート（尤度が最も高いテンプレート）が求められ、そのテンプレートの正解ラベルが、認識結果として出力される。

一方、教師なし学習は、各パターンの学習データに正解ラベルが与えられない状況で行われる学習であり、例えば、ニューラルネットなどを用いた学習方法があるが、正解ラベルが与えられないという点で、教師あり学習とは大きく異なる。

ところで、パターン認識は、そのパターン認識によって認識しようとする認識対象のデータ（信号）が観測される信号空間の量子化と見ることができる。特に、認識対象のデータがベクトルである場合のパターン認識は、ベクトル量子化（vector quantization）と呼ばれることがある。

ベクトル量子化の学習では、認識対象のデータが観測される信号空間上に、クラスに対応する代表的なベクトル（これをセントロイドベクトルと呼ぶ）が配置される。

ベクトル量子化の教師なし学習として代表的な手法の一つに、K-平均法（K-means clustering method）がある。K-平均法は、初期状態として、セントロイドベクトルを適当に配置し、学習データとしてのベクトルを、最も距離の近いセントロイドベクトルに割り当て、各セントロイドベクトルに割り当てられた学習データの平均ベクトルによってセントロイドベクトルを更新することを繰り返す学習手法である。

ここで、多数の学習データを蓄積し、そのすべてを用いて学習を行う方法は、バッチ学習（batch learning）と呼ばれ、K-平均法は、バッチ学習に分類される。バッチ学習に対して、学習データを観測するたびに、その学習データを用いて学習を行い、パラメータ（セントロイドベクトルのコンポーネントや、HMMを定義する出力確率密度関数など）を少しずつ更新する学習は、オンライン学習（on-line learning）と呼ばれる。

オンライン学習としては、コホネン(T.Kohonen)の提案したSOM（self-organization map）による学習が有名である。SOMによる学習では、入力層と出力層の結合重みが、オンライン学習により少しずつ更新（修正）されていく。

即ち、SOMにおいて、出力層は、複数のノードを有し、出力層の各ノードには、入力層との結合の度合いを表す結合重みが与えられる。この結合重みをベクトルとした場合、ベクトル量子化における学習を行うことができる。

具体的には、SOMの出力層のノードにおいて、結合重みとしてのベクトルと、学習データとしてのベクトルとの距離が最も近いノードが、その学習データとしてのベクトルに最も適合する勝者ノードに決定され、その勝者ノードの結合重みとしてのベクトルが、学習データとしてのベクトルに近づくように更新される。さらに、勝者ノードの近傍のノードの結合重みも、学習データに少しだけ近づくように更新される。その結果、学習が進むにつれ、結合重みとしてのベクトルが類似したノードどうしは近くなるように、類似しないノードは遠くなるように、出力層の上に配置されていく。従って、出力層には、あたかも学習データに含まれるパターンに応じた地図が構成されていくことになる。このように、学習が進むにつれて、類似するノード（結合重みとしてのベクトルが類似するノード）どうしが近い位置に学習データに含まれるパターンに応じた地図が構成が構成されていく学習は、自己組織的または自己組織化（self-organization）と呼ばれる。

ここで、上述のような学習の結果として得られる結合重みのベクトルは、信号空間に配置されるセントロイドベクトルと見ることができる。K-平均法では、学習データに最も距離の近いベクトルのみが更新されることから、その更新方法はWTA(winner-take-all)と呼ばれる。一方、SOMによる学習では、学習データに最も距離の近いノード（勝者ノード）の結合重みだけでなく、勝者ノードの近傍のノードの結合重みも更新されるから、その更新方法はSMA(soft-max adaptation)と呼ばれる。WTAで学習を行うと学習結果が局所解に陥りやすいのに対して、SMAで学習を行うと、局所解に陥る問題を改善することができることが知られている。

なお、ＳＯＭに関しては、例えば、非特許文献１に記載されている。

ところで、上述のSOM は、いわば静的な信号パターンであるベクトル、つまり一定の長さのデータを対象とした教師なし学習を提供する。従って、音声データのような時系列のデータ（時系列データ）、つまり長さが不定の、いわば動的な信号パターンに対しては、SOM を、そのまま適用することはできない。

また、連続するベクトルの系列を連結し（連続するベクトルの要素を、１つのベクトルの要素とし）、高次元のベクトルを定義することで、時系列データとしての時系列のベクトルを、静的な信号パターンとして扱う方法が提案されているが、この方法も、音声データのように長さが固定されていない（不定の）時系列データに対しては、そのまま通用することはできない。

一方、時系列データのパターン認識、即ち、例えば、音声データの認識（音声認識）で広く利用されている技術の１つに、HMMを用いるHMM法がある（例えば、非特許文献２参照）。

HMMは、状態遷移を有する確率モデルである状態遷移確率モデルの１つであり、上述したように、状態遷移確率と、各状態における出力確率密度関数で定義され、HMM法では、学習すべき時系列データの統計的な特性がHMMによってモデル化される。なお、HMMを定義する出力確率密度関数としては、例えば混合正規分布などが用いられる。また、HMMの学習、即ち、HMMのパラメータ（HMMを定義する状態遷移確率と出力確率密度関数）の推定の方法としては、Baum-Welch 法が広く使われている。

HMM法は、現在実用化されている孤立単語音声認識から大語彙連続音声認識にまで幅広く適用されているが、HMMの学習は、通常、教師あり学習であり、図５で説明したように、正解ラベルの付与された学習データを用いて行われる。即ち、例えば、ある単語を認識するHMMの学習は、その単語に対応する学習データ（その単語の発話によって得られる音声データ）を用いて行われる。

このように、HMMの学習は、通常、教師あり学習であり、正解ラベルの付与されていない学習データが与えられた場合にHMMの学習を行うこと、つまり、HMMの教師なし学習は、非常に難しい問題となる。

T.コホネン、「自己組織化マップ」、シュプリンガー・フェアラーク東京 Laurence Rabiner, Biing-Hwang Juang 共著、「音声認識の基礎（上・下）」、ＮＴＴアドバンステクノロジ株式会社

以上のように、従来においては、SOMのような静的なパターンの教師なし学習や、HMMのような動的な時系列データの教師あり学習を実現する方法は提供されていたが、どちらも動的な時系列データの教師なし学習を実現するには不十分であった。

このため、入力データや出力データが時系列データである場合に、その入力データと出力データそれぞれの教師なし学習を行い、さらに、入力データと出力データとの関係を学習して、順モデルや逆モデルを得ることが困難であった。

本発明は、このような状況に鑑みてなされたものであり、時系列データの教師なし学習、さらには、時系列データである入力データと出力データとの関係の学習を、容易に行うことができるようにするものである。

本発明の第１の学習装置、第１の学習方法、および第１のプログラムは、所定の制御対象に入力される入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、所定の制御対象が入力データに対して出力する出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークとを有し、入力時系列パターン記憶ネットワークのノードと、出力時系列パターン記憶ネットワークのノードとが結合されている結合モデルにおける複数の入力時系列パターン記憶ネットワークそれぞれを、入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む入力データの、対応するチャネルのサブ入力データに基づいて、自己組織的に更新するとともに、複数の出力時系列パターン記憶ネットワークそれぞれを、出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む出力データの、対応するチャネルのサブ出力データに基づいて、自己組織的に更新する学習手段／ステップと、入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルのサブ入力データに最も適合するノードである入力勝者ノードと、出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルのサブ出力データに最も適合するノードである出力勝者ノードと、入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新手段／ステップとを含むことを特徴とする。

この第１の学習装置、第１の学習方法、および第１のプログラムにおいては、結合モデルにおける複数の入力時系列パターン記憶ネットワークそれぞれが、入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む入力データの、対応するチャネルのサブ入力データに基づいて、自己組織的に更新されるとともに、複数の出力時系列パターン記憶ネットワークそれぞれが、出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む出力データの、対応するチャネルのサブ出力データに基づいて、自己組織的に更新される。そして、入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルのサブ入力データに最も適合するノードである入力勝者ノードと、出力時系列パターン記憶ネットワークの各ノードとの結合関係が更新されるとともに、出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルのサブ出力データに最も適合するノードである出力勝者ノードと、入力時系列パターン記憶ネットワークの各ノードとの結合関係が更新される。

なお、結合モデルは、所定の制御対象に入力される入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、所定の制御対象が入力データに対して出力する出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークとを有し、入力時系列パターン記憶ネットワークのノードと、出力時系列パターン記憶ネットワークのノードとは結合されている。

本発明の第２の学習装置、第２の学習方法、および第２のプログラムは、所定の制御対象に入力される入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の入力時系列パターン記憶ネットワークと、所定の制御対象が入力データに対して出力する出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークとを有し、入力時系列パターン記憶ネットワークのノードと、出力時系列パターン記憶ネットワークのノードとが結合されている結合モデルにおける１の入力時系列パターン記憶ネットワークを、入力データに基づいて、自己組織的に更新するとともに、複数の出力時系列パターン記憶ネットワークそれぞれを、出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む出力データの、対応するチャネルのサブ出力データに基づいて、自己組織的に更新する学習手段／ステップと、入力時系列パターン記憶ネットワークのノードのうちの、入力データに最も適合するノードである入力勝者ノードと、出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルのサブ出力データに最も適合するノードである出力勝者ノードと、入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新手段／ステップとを含むことを特徴とする。

この第２の学習装置、第２の学習方法、および第２のプログラムにおいては、結合モデルにおける１の入力時系列パターン記憶ネットワークが、入力データに基づいて、自己組織的に更新されるとともに、複数の出力時系列パターン記憶ネットワークそれぞれが、出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む出力データの、対応するチャネルのサブ出力データに基づいて、自己組織的に更新される。そして、入力時系列パターン記憶ネットワークのノードのうちの、入力データに最も適合するノードである入力勝者ノードと、出力時系列パターン記憶ネットワークの各ノードとの結合関係が更新されるとともに、出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルのサブ出力データに最も適合するノードである出力勝者ノードと、入力時系列パターン記憶ネットワークの各ノードとの結合関係が更新される。

なお、結合モデルは、所定の制御対象に入力される入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の入力時系列パターン記憶ネットワークと、所定の制御対象が入力データに対して出力する出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークとを有し、入力時系列パターン記憶ネットワークのノードと、出力時系列パターン記憶ネットワークのノードとは結合されている。

本発明の第３の学習装置、第３の学習方法、および第３のプログラムは、所定の制御対象に入力される入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、所定の制御対象が入力データに対して出力する出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の出力時系列パターン記憶ネットワークとを有し、入力時系列パターン記憶ネットワークのノードと、出力時系列パターン記憶ネットワークのノードとが結合されている結合モデルにおける複数の入力時系列パターン記憶ネットワークそれぞれを、入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む入力データの、対応するチャネルのサブ入力データに基づいて、自己組織的に更新するとともに、１の出力時系列パターン記憶ネットワークを、出力データに基づいて、自己組織的に更新する学習手段／ステップと、入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルのサブ入力データに最も適合するノードである入力勝者ノードと、出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、出力時系列パターン記憶ネットワークのノードのうちの、出力データに最も適合するノードである出力勝者ノードと、入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新手段／ステップと含むことを特徴とする。

この本発明の第３の学習装置、第３の学習方法、および第３のプログラムにおいては、結合モデルにおける複数の入力時系列パターン記憶ネットワークそれぞれが、入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む入力データの、対応するチャネルのサブ入力データに基づいて、自己組織的に更新されるとともに、１の出力時系列パターン記憶ネットワークが、出力データに基づいて、自己組織的に更新される。そして、入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルのサブ入力データに最も適合するノードである入力勝者ノードと、出力時系列パターン記憶ネットワークの各ノードとの結合関係が更新されるとともに、出力時系列パターン記憶ネットワークのノードのうちの、出力データに最も適合するノードである出力勝者ノードと、入力時系列パターン記憶ネットワークの各ノードとの結合関係が更新される。

なお、結合モデルは、所定の制御対象に入力される入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、所定の制御対象が入力データに対して出力する出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の出力時系列パターン記憶ネットワークとを有し、入力時系列パターン記憶ネットワークのノードと、出力時系列パターン記憶ネットワークのノードとは結合されている。

本発明の第１の生成装置、第１の生成方法、および第４のプログラムは、時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークとを有し、第１の時系列パターン記憶ネットワークのノードと、第２の時系列パターン記憶ネットワークのノードとが結合されている結合モデルにおける複数の第１の時系列パターン記憶ネットワークそれぞれについて、第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定手段／ステップと、第２の時系列パターン記憶ネットワークのノードの中から、勝者ノードとの結合が最強のノードを、他の時系列データを生成する生成ノードとして決定する生成ノード決定手段／ステップと、生成ノードが有する時系列パターンモデルに基づいて、他の時系列データを生成する生成手段／ステップとを含むことを特徴とする。

この第１の生成装置、第１の生成方法、および第４のプログラムにおいては、結合モデルにおける複数の第１の時系列パターン記憶ネットワークそれぞれについて、第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードが決定され、第２の時系列パターン記憶ネットワークのノードの中から、勝者ノードとの結合が最強のノードが、他の時系列データを生成する生成ノードとして決定される。そして、生成ノードが有する時系列パターンモデルに基づいて、他の時系列データが生成される。

なお、結合モデルは、時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークとを有し、第１の時系列パターン記憶ネットワークのノードと、第２の時系列パターン記憶ネットワークのノードとは結合されている。

本発明の第２の生成装置、第２の生成方法、および第５のプログラムは、時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第１の時系列パターン記憶ネットワークと、他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークとを有し、第１の時系列パターン記憶ネットワークのノードと、第２の時系列パターン記憶ネットワークのノードとが結合されている結合モデルにおける１の第１の時系列パターン記憶ネットワークについて、時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定手段／ステップと、第２の時系列パターン記憶ネットワークのノードの中から、勝者ノードとの結合が最強のノードを、他の時系列データを生成する生成ノードとして決定する生成ノード決定手段／ステップと、生成ノードが有する時系列パターンモデルに基づいて、他の時系列データを生成する生成手段／ステップとを含むことを特徴とする。

この本発明の第２の生成装置、第２の生成方法、および第５のプログラムにおいては、結合モデルにおける１の第１の時系列パターン記憶ネットワークについて、時系列データに最も適合するノードである勝者ノードが決定され、第２の時系列パターン記憶ネットワークのノードの中から、勝者ノードとの結合が最強のノードが、他の時系列データを生成する生成ノードとして決定される。そして、生成ノードが有する時系列パターンモデルに基づいて、他の時系列データが生成される。

なお、結合モデルは、時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第１の時系列パターン記憶ネットワークと、他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークとを有し、第１の時系列パターン記憶ネットワークのノードと、第２の時系列パターン記憶ネットワークのノードとは結合されている。

本発明の第３の生成装置、第３の生成方法、および第６のプログラムは、時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第２の時系列パターン記憶ネットワークとを有し、第１の時系列パターン記憶ネットワークのノードと、第２の時系列パターン記憶ネットワークのノードとが結合されている結合モデルにおける複数の第１の時系列パターン記憶ネットワークそれぞれについて、第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定手段／ステップと、第２の時系列パターン記憶ネットワークのノードの中から、勝者ノードとの結合が最強のノードを、他の時系列データを生成する生成ノードとして決定する生成ノード決定手段／ステップと、生成ノードが有する時系列パターンモデルに基づいて、他の時系列データを生成する生成手段／ステップとを含むことを特徴とする。

この第３の生成装置、第３の生成方法、および第６のプログラムにおいては、結合モデルにおける複数の第１の時系列パターン記憶ネットワークそれぞれについて、第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードが決定され、第２の時系列パターン記憶ネットワークのノードの中から、勝者ノードとの結合が最強のノードが、他の時系列データを生成する生成ノードとして決定される。そして、生成ノードが有する時系列パターンモデルに基づいて、他の時系列データが生成される。

なお、結合モデルは、時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第２の時系列パターン記憶ネットワークとを有し、第１の時系列パターン記憶ネットワークのノードと、第２の時系列パターン記憶ネットワークのノードとは結合されている。

本発明によれば、時系列データの教師なし学習、さらには、時系列データである入力データと出力データとの関係の学習を、容易に行うことが可能となる。

以下に本発明の実施の形態を説明するが、請求項に記載の構成要件と、発明の実施の形態における具体例との対応関係を例示すると、次のようになる。この記載は、請求項に記載されている発明をサポートする具体例が、発明の実施の形態に記載されていることを確認するためのものである。従って、発明の実施の形態中には記載されているが、構成要件に対応するものとして、ここには記載されていない具体例があったとしても、そのことは、その具体例が、その構成要件に対応するものではないことを意味するものではない。逆に、具体例が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その具体例が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。

さらに、この記載は、発明の実施の形態に記載されている具体例に対応する発明が、請求項に全て記載されていることを意味するものではない。換言すれば、この記載は、発明の実施の形態に記載されている具体例に対応する発明であって、この出願の請求項には記載されていない発明の存在、すなわち、将来、分割出願されたり、補正により追加される発明の存在を否定するものではない。

請求項１に記載の学習装置は、
時系列のデータである時系列データに基づき、学習を行う学習装置（例えば、図２１の学習部２１２）において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記入力時系列パターン記憶ネットワークそれぞれを、前記入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む前記入力データの、対応するチャネルの前記サブ入力データに基づいて、自己組織的に更新するとともに、複数の前記出力時系列パターン記憶ネットワークそれぞれを、前記出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む前記出力データの、対応するチャネルの前記サブ出力データに基づいて、自己組織的に更新する学習手段（例えば、図２１の学習処理部２２１）と、
前記入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新手段（例えば、図２１の結合重み更新部２２２）と
を備えることを特徴とする。

請求項１０に記載の学習方法は、
時系列のデータである時系列データに基づき、学習を行う学習方法において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記入力時系列パターン記憶ネットワークそれぞれを、前記入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む前記入力データの、対応するチャネルの前記サブ入力データに基づいて、自己組織的に更新するとともに、複数の前記出力時系列パターン記憶ネットワークそれぞれを、前記出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む前記出力データの、対応するチャネルの前記サブ出力データに基づいて、自己組織的に更新する学習ステップ（例えば、図２８のステップＳ１２３およびＳ１２４）と、
前記入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新ステップ（例えば、図２８のステップＳ１２６）と
を含むことを特徴とする。

請求項１１に記載のプログラムの各ステップが対応する具体例は、請求項１０に記載の学習方法の各ステップが対応する具体例と同様である。

請求項１２に記載の学習装置は、
時系列のデータである時系列データに基づき、学習を行う学習装置（例えば、図２１の学習部２１２）において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける１の前記入力時系列パターン記憶ネットワークを、前記入力データに基づいて、自己組織的に更新するとともに、複数の前記出力時系列パターン記憶ネットワークそれぞれを、前記出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む前記出力データの、対応するチャネルの前記サブ出力データに基づいて、自己組織的に更新する学習手段（例えば、図２１の学習処理部２２１）と、
前記入力時系列パターン記憶ネットワークのノードのうちの、前記入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新手段（例えば、図２１の結合重み更新部２２２）と
を備えることを特徴とする。

請求項１５に記載の学習方法は、
時系列のデータである時系列データに基づき、学習を行う学習方法において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける１の前記入力時系列パターン記憶ネットワークを、前記入力データに基づいて、自己組織的に更新するとともに、複数の前記出力時系列パターン記憶ネットワークそれぞれを、前記出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む前記出力データの、対応するチャネルの前記サブ出力データに基づいて、自己組織的に更新する学習ステップ（例えば、図２８のステップＳ１２３およびＳ１２４）と、
前記入力時系列パターン記憶ネットワークのノードのうちの、前記入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新ステップ（例えば、図２８のステップＳ１２６）と
を含むことを特徴とする。

請求項１６に記載のプログラムの各ステップが対応する具体例は、請求項１５に記載の学習方法の各ステップが対応する具体例と同様である。

請求項１７に記載の学習装置は、
時系列のデータである時系列データに基づき、学習を行う学習装置（例えば、図２１の学習部２１２）において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記入力時系列パターン記憶ネットワークそれぞれを、前記入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む前記入力データの、対応するチャネルの前記サブ入力データに基づいて、自己組織的に更新するとともに、１の前記出力時系列パターン記憶ネットワークを、前記出力データに基づいて、自己組織的に更新する学習手段（例えば、図２１の学習処理部２２１）と、
前記入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、前記出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新手段（例えば、図２１の結合重み更新部２２２）と
を備えることを特徴とする。

請求項２０に記載の学習方法は、
時系列のデータである時系列データに基づき、学習を行う学習方法において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記入力時系列パターン記憶ネットワークそれぞれを、前記入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む前記入力データの、対応するチャネルの前記サブ入力データに基づいて、自己組織的に更新するとともに、１の前記出力時系列パターン記憶ネットワークを、前記出力データに基づいて、自己組織的に更新する学習ステップ（例えば、図２８のステップＳ１２３およびＳ１２４）と、
前記入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、前記出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新ステップ（例えば、図２８のステップＳ１２６）と
を含むことを特徴とする。

請求項２１に記載のプログラムの各ステップが対応する具体例は、請求項２０に記載の学習方法の各ステップが対応する具体例と同様である。

請求項２２に記載の生成装置は、
時系列のデータである時系列データに対して、他の時系列データを生成する生成装置（例えば、図２１の認識生成部２１３）において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記第１の時系列パターン記憶ネットワークそれぞれについて、前記第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む前記時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定手段（例えば、図２１の勝者ノード決定部２３２）と、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定手段（例えば、図２１の生成ノード決定部２３３）と、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成手段（例えば、図２１の時系列生成部２３４）と
を備えることを特徴とする。

請求項３２に記載の生成方法は、
時系列のデータである時系列データに対して、他の時系列データを生成する生成方法において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記第１の時系列パターン記憶ネットワークそれぞれについて、前記第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む前記時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定ステップ（例えば、図２９のステップＳ１３４）と、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定ステップ（例えば、図２９のステップＳ１３６）と、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成ステップ（例えば、図２９のステップＳ１３７）と
を含むことを特徴とする。

請求項３３に記載のプログラムの各ステップが対応する具体例は、請求項３２に記載の生成方法の各ステップが対応する具体例と同様である。

請求項３４に記載の生成装置は、
時系列のデータである時系列データに対して、他の時系列データを生成する生成装置（例えば、図２１の認識生成部２１３）において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける１の前記第１の時系列パターン記憶ネットワークについて、前記時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定手段（例えば、図２１の勝者ノード決定部２３２）と、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定手段（例えば、図２１の生成ノード決定部２３３）と、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成手段（例えば、図２１の時系列生成部２３４）と
を備えることを特徴とする。

請求項３７に記載の生成方法は、
時系列のデータである時系列データに対して、他の時系列データを生成する生成方法において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける１の前記第１の時系列パターン記憶ネットワークについて、前記時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定ステップ（例えば、図２９のステップＳ１３４）と、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定ステップ（例えば、図２９のステップＳ１３６）と、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成ステップ（例えば、図２９のステップＳ１３７）と
を含むことを特徴とする。

請求項３８に記載のプログラムの各ステップが対応する具体例は、請求項３７に記載の生成方法の各ステップが対応する具体例と同様である。

請求項３９に記載の生成装置は、
時系列のデータである時系列データに対して、他の時系列データを生成する生成装置（例えば、図２１の認識生成部２１３）において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記第１の時系列パターン記憶ネットワークそれぞれについて、前記第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む前記時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定手段（例えば、図２１の勝者ノード決定部２３２）と、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定手段（例えば、図２１の生成ノード決定部２３３）と、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成手段（例えば、図２１の時系列生成部２３４）と
を備えることを特徴とする。

請求項４１に記載の生成方法は、
時系列のデータである時系列データに対して、他の時系列データを生成する生成方法において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記第１の時系列パターン記憶ネットワークそれぞれについて、前記第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む前記時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定ステップ（例えば、図２９のステップＳ１３４）と、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定ステップ（例えば、図２９のステップＳ１３６）と、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成ステップ（例えば、図２９のステップＳ１３７）と
を含むことを特徴とする。

請求項４２に記載のプログラムの各ステップが対応する具体例は、請求項４１に記載の生成方法の各ステップが対応する具体例と同様である。

以下、図面を参照して、本発明の実施の形態について説明するが、その前段階の準備として、時系列パターン記憶ネットワークについて説明する。

図６は、時系列パターン記憶ネットワークの例を模式的に示している。

時系列パターン記憶ネットワークは、時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークで、そのネットワーク全体で、ノードの数だけの（クラス分けを行う）時系列パターンを記憶する。

図６においては、時系列パターン記憶ネットワークは、ノードN₁乃至N₆の６つのノードから構成されている。

時系列パターン記憶ネットワークを構成する各ノードN_i（図６では、ｉ＝１，２，・・・，６）は、時系列パターンを表現する時系列パターンモデルを有する。また、ノードN_iは、他のノードN_j（図６では、ｊ＝１，２，・・・，６）と結合関係を持つことができる。この結合関係をリンクと呼ぶ。図６では、例えば、ノードN₁は、ノードN₂，N₃と直接の結合関係を有している。また、例えば、ノードN₃は、ノードN₁，N₂，N₅，N₆と直接の結合関係を有しており、従って、ノードN₅とN₆は、ノードN₃を介して、ノードN₁と間接的な結合関係を有している。なお、２つのノードN_iとN_jとの結合関係としては、その２つのノードN_iとN_jとの最短の結合関係を考えるものとする。

時系列パターン記憶ネットワークの学習（時系列パターン記憶ネットワークに時系列パターンを記憶させる学習）は、時系列データを、学習用の学習データとして行われるが、この学習データは、カテゴリの種類や、カテゴリの数が未知のもので、この点、時系列パターン記憶ネットワークの学習は、前述の図５で説明した教師あり学習と大きく異なる。また、時系列パターン記憶ネットワークの学習に用いられる学習データには、正解ラベルは付与されていない。このため、時系列パターン記憶ネットワークの学習には、前述の図５で説明した教師あり学習を適用することはできない。

このように、時系列パターン記憶ネットワークの学習には、教師あり学習を適用することができず、また、学習データは、そのカテゴリの種類も、カテゴリの数も未知である。そこで、時系列パターン記憶ネットワークの学習は、その全体（のノード）によって、学習データの特徴（時系列パターン）を適切に表現することができるように、自己組織的に行われる。

なお、時系列パターン記憶ネットワークの学習は、教師なし学習である。また、時系列パターン記憶ネットワークの学習は、ある１つのノードが、必ずしもある１つのカテゴリに対応するように行われるとは限らない。即ち、時系列パターン記憶ネットワークにおいては、１つのノードが１つのカテゴリに対応するように学習が行われる場合もあるし、複数のノードが１つのカテゴリに対応するように学習が行われる場合もある。さらに、１つのノードが複数のカテゴリに対応するように学習が行われる場合もある。従って、仮に、学習データが、明確にカテゴリ分けすることができないものであっても、時系列パターン記憶ネットワークによる学習は行うことができる。

次に、図７は、時系列パターン記憶ネットワークのノードN_iの構成例を模式的に示している。

ノードN_iは、時系列パターンを表現する時系列パターンモデル２１と、その時系列パターンモデル２１の学習に用いる学習データを記憶する学習データ記憶部２２とから構成される。

ここで、図７では、時系列パターンモデル２１として、状態確率遷移モデルの１つであるHMM（連続HMM）が採用されている。また、図７では、HMMは、自己ループと次状態（右隣の状態）への状態遷移だけを有するleft-to-right型の３状態S₁，S₂，S₃を有するものとなっている。図７の時系列パターンモデル２１における○印は状態を表し、矢印は状態遷移を表している。なお、時系列パターンモデル２１としてのHMMは、left-to-right型や、３状態のもの等に限定されない。

時系列パターンモデル２１が、図７に示したようなHMMである場合、その時系列パターンモデル２１としてのHMMは、状態遷移確率と出力確率密度関数（HMMが離散HMMである場合には、スカラ量である離散的なシンボルが出力される確率）とで定義される。

状態遷移確率は、HMMにおいて、状態が遷移する確率で、図７の時系列パターンモデル２１における矢印で示した状態遷移それぞれに対して与えられる。出力確率密度関数は、状態遷移時に、HMMから観測される値の確率密度を表す。出力確率密度関数としては、例えば、混合正規分布などが採用される。これらのHMMのパラメータ（状態遷移確率と出力確率密度関数）は、例えば、Baum-Welch 法によって学習（推定）することができる。

ノードN_iでは、学習データ記憶部２２に記憶された学習データの統計的な特性、即ち、学習データ記憶部２２に記憶された学習データの時系列パターンが、時系列パターンモデル２１において学習され、これにより、時系列パターンモデル２１と、学習データ記憶部２２に記憶された学習データとが、対応関係を持つことになる。

なお、時系列パターン記憶ネットワークの学習、ひいては、ノードN_iの時系列パターンモデル２１の学習は、時系列パターン記憶ネットワークに対して、時系列データが与えられるごとに学習を行うオンライン学習によって行われる。従って、時系列パターン記憶ネットワークのパラメータ、つまり、ノードN_iの時系列パターンモデル２１のパラメータ（時系列パターンモデル２１がHMMである場合には、上述したように、状態遷移確率と出力確率密度関数）は、時系列パターン記憶ネットワークに対して、時系列データが与えられるたびに、少しずつ更新される。

即ち、後述するように、時系列パターン記憶ネットワークの学習が進むにつれ、学習データ記憶部２２に記憶される学習データは、時系列パターン記憶ネットワークに与えられた時系列データによって更新され、これにより、少しずつ変化する。そして、その少しずつ変化する学習データによって、時系列パターンモデル２１の学習が行われることにより、その時系列パターンモデル２１のパラメータも、少しずつ変化していく。

次に、図８は、時系列パターン記憶ネットワークの他の例を模式的に示している。

図８では、時系列パターン記憶ネットワークは、９個のノードN₁乃至N₉で構成されており、この９個のノードN₁乃至N₉は、２次元的に配置されている。即ち、図８では、９個のノードN₁乃至N₉は、２次元平面上に、横×縦が３×３となるように配置されている。

さらに、図８では、２次元的に配置された９個のノードN₁乃至N₉の、横方向に隣接するノードどうしと、縦方向に隣接するノードどうしに対して、リンク（結合関係）が与えられている。なお、このようなリンクを与えることによって、時系列パターン記憶ネットワークを構成するノードには、空間的に、２次元的に配置される配置構造が与えられているということもできる。

時系列パターン記憶ネットワークでは、リンクによって与えられる空間的なノードの配置構造に基づき、その空間上でのある２つのノードどうしの距離を定義することができ、この２つのノードどうしの距離は、その２つのノードそれぞれが有する時系列パターンモデル２１が表現する時系列パターンのパターン間距離（時系列パターンどうしの類似性）として用いることができる。

なお、２つのノードどうしの距離によって表される時系列パターンのパターン間距離は、２つのノードの結合関係（リンク）に基づくパターン間距離ということができる。

２つのノードどうしの距離としては、例えば、その２つのノードどうしを結ぶ最短のパスを構成するリンクの数を採用することができる。この場合、あるノードに注目すると、その注目ノードとの直接のリンクを有するノード（図８では、注目ノードの横方向や縦方向に隣接するノード）は、注目ノードとの距離が最も近く、注目ノードとの直接のリンクを有するノードから先のリンクを辿っていくことで到達することができるノードは、到達するのに辿るリンクの数が多いほど、注目ノードとの距離が遠くなっていく。

なお、ノードに与えるリンクは、図６や図８に示したものに限定されるものではない。また、図６や図８に示したリンクは、ノードに対して、２次元的な配置構造を与えるが、リンクは、その他、１次元的な配置構造や３次元的な配置構造等を与えるリンクであっても良い。さらに、ノードには、必ずしもリンクを与える必要はない。

即ち、図９は、図２の記憶部５に記憶される時系列パターン記憶ネットワークのさらに他の例を模式的に示している。

図９では、時系列パターン記憶ネットワークは、図６における場合と同様に、６個のノードN₁乃至N₆で構成されているが、これらの６個のノードN₁乃至N₆は、いずれもリンクを有していない。従って、図９の時系列パターン記憶ネットワークを構成するノードN₁乃至N₆は、リンクによって与えられる空間的な配置構造は有していない。なお、空間的な配置構造は有していないということは、空間的な制約がない配置構造が与えられているということもできる。

ここで、ある２つのノードにリンクがない場合には、空間上でのその２つのノードどうしの距離を定義することはできないから、その２つのノードそれぞれが（有する時系列パターンモデル２１が）表現する時系列パターンのパターン間距離として、結合関係（リンク）に基づくパターン間距離は用いることができない。そこで、この場合には、例えば、ノードが、ある時系列データ（の観測値）に適合する度合いに基づく順位（以下、適宜、適合順位という）に対応する値を、パターン間距離として用いることができる。

即ち、ある時系列データが与えられた場合には、その時系列データに対して、ノードが表現する時系列パターンとの類似性を、そのノードが適合する度合いとして求めることができる。いま、時系列パターン記憶ネットワークを構成するノードのうち、ある時系列データに最も適合するノードである勝者ノードについては、勝者ノードと、時系列パターン記憶ネットワークのあるノードのそれぞれが表現する時系列パターンのパターン間距離として、そのノードが時系列データに適合する順位（適合順位）に対応する値を採用することができる。

具体的には、時系列パターン記憶ネットワークを構成するノードのうち、勝者ノードとなっているノードの適合順位は第１位であり、このノード（勝者ノード）と勝者ノードとの（それぞれが表現する時系列パターンの）パターン間距離は、例えば、その適合順位から１を減算した０とすることができる。

また、時系列パターン記憶ネットワークを構成するノードのうち、適合順位が第２位のノードと勝者ノードとのパターン間距離は、例えば、その適合順位から１を減算した１とすることができる。以下、同様に、ノードの適合順位から１を減算して得られる値を、そのノードと、勝者ノード（となっているノード）とのパターン間距離とすることができる。

なお、ノードがある時系列データに適合する度合いに基づく順位（適合順位）に対応する値によって表されるパターン間距離は、ノードが時系列データに適合する度合いに基づくパターン間距離ということができる。

次に、図１０は、時系列パターン記憶ネットワークを用いて、各種の処理を行うデータ処理装置の構成例を示している。

信号入力部１には、後述する学習処理や認識処理の対象となるデータ（以下、処理対象データという）が入力される。ここで、処理対象データは、例えば、音や画像、LED(Light Emitting Diode)の明るさ、モータの回転角度や回転角速度などの観測値（外部から観測することができる値（信号））である。また、処理対象データは、例えば、図１０のデータ処理装置が適用されるシステムの入力を受け付ける入力デバイス（センサ）が出力するデータ（入力データ）であっても良いし、何らかの出力を行う出力デバイスに対して与えられるデータ（出力データ）であっても良い。

即ち、図１０のデータ処理装置が、例えば、２足歩行ロボットその他のロボットに適用され、その２足歩行ロボットが、外部の状況に応じて、何らかの処理を行う場合には、信号入力部１は、外部の状況をセンシングするセンサで構成することができる。具体的には、信号入力部１は、例えば、マイク（マイクロフォン）やカメラなどで構成することができる。

信号入力部１がマイクで構成される場合には、そのマイクに対して、外部で発生する音声（人間の音声の他、動物の鳴き声、物音、その他のあらゆる音を含む）が、２足歩行ロボット（データ処理装置が適用されているシステム）に対する入力データとして入力され、対応する音声データが、特徴抽出部２に供給される。また、信号入力部１がカメラで構成される場合には、そのカメラに対して、外部からの光が、２足歩行ロボットに対する入力データとして入力され、対応する画像データが、特徴抽出部２に供給される。

また、２足歩行ロボットが、例えば、手や足に相当する部分を、アクチュエータとしてのモータによって動かすことができる場合には、信号入力部１は、そのモータの回転角度や回転速度を計測する計測装置（回転角度や回転速度をセンシングするセンサ）で構成することができる。なお、２足歩行ロボットの手や足に相当する部分を動かすモータは、そのモータを回転駆動させる電気信号としての駆動信号を与える他、手や足に相当する部分に外部から力を加えて動かすことによっても回転するが、計測装置では、そのいずれの回転によって生じた回転角度や回転速度であっても計測することができる。

信号入力部１が計測装置で構成される場合には、その計測装置に対して、モータの回転角度や回転速度を表す信号が、２足歩行ロボットからの出力データとして入力されて計測され、その計測結果が、特徴抽出部２に供給される。

なお、信号入力部１に入力される処理対象データは、時間的な変化が一定の定常的なデータ（定常信号）であっても良いし、時間的な変化が一定でない非定常なデータ（非定常信号）であっても良い。

また、以下では、信号入力部１に対しては、例えば、時系列データの１つである音声が入力されるものとする。さらに、信号入力部１から特徴抽出部２に対しては、いわゆる音声区間の音声データだけが供給されるものとする。なお、音声区間の検出方法は、特に限定されるものではない。また、信号入力部１から特徴抽出部２に対して供給される音声データは、必ずしも、音声区間の長さである必要はなく、適切な長さに区切られていればよい。即ち、信号入力部１から特徴抽出部２に対して供給される音声データは、例えば、音素や音韻の単位であっても良いし、単語や文、ある句読点から次の句読点までであっても良い。

ここで、信号入力部１から特徴抽出部２に対して供給される処理対象データは、音声データに限定されるものではなく、その区間も、特に限定されるものではない。即ち、信号入力部１から特徴抽出部２に対しては、最も良い方法で適当な長さに区切られた処理対象データが供給されれば良い。なお、信号入力部１から特徴抽出部２に対して供給される処理対象データ（の区間）は、一定であっても良いし、一定でなくても良い。

特徴抽出部２は、信号入力部１からの処理対象データとしての時系列データである音声データから特徴量を抽出し、その結果得られる時系列データである時系列の特徴量を、認識部３と学習部４に供給する。即ち、特徴抽出部２は、信号入力部１からの音声データに対して一定時間間隔で周波数分析などの処理を施し、例えば、メルケプストラム係数（MFCC（Mel Frequency Cepstrum Coefficient））などの特徴量を抽出して、そのメルケプストラム係数の時系列データを、認識部３と学習部４に供給する。なお、特徴抽出部２から認識部３と学習部４に供給される時系列データも、外部から観測することができる観測値である。

認識部３は、記憶部５に記憶された時系列パターン記憶ネットワークに基づき、特徴抽出部２から供給される時系列データを認識し、その認識結果を出力する。

ここで、学習部４は、記憶部５に記憶された時系列パターン記憶ネットワークを、特徴抽出部２から供給される時系列データ（の観測値）に基づいて、自己組織的に更新する。即ち、学習部４は、特徴抽出部２から供給される時系列データに基づいて、記憶部５に記憶された時系列パターン記憶ネットワークのパラメータを更新する。なお、このパラメータの更新のことを学習と呼ぶ場合がある。

学習部４では、正解ラベルの付与されていない時系列データを繰り返し与えると、その与えられた時系列データの中の特徴的なパターン（時系列パターン）を自己組織的に獲得していく教師なし学習が実行される。その結果、記憶部５の時系列パターン記憶ネットワークには、代表的な時系列パターンが効率的に記憶される。即ち、特徴抽出部２が認識部３と学習部４に供給する時系列データは、幾つかのパターン（時系列パターン）に分類することができ、学習部４では、時系列パターン記憶ネットワークに、時系列データの代表的な時系列パターンを記憶させるための学習が行われる。

記憶部５は、時系列パターン記憶ネットワークを記憶しており、この時系列パターン記憶ネットワーク（のパラメータ）は、学習部４によって適宜更新される。

生成部６には、制御データが供給される。生成部６に供給される制御データは、記憶部５の時系列パターン記憶ネットワークが記憶している時系列パターンのうちのいずれかを表すもの（後述するノードラベル）で、生成部６は、記憶部５の時系列パターン記憶ネットワークに基づき、そこに供給される制御データが表す時系列パターンの時系列データを生成して出力する。

次に、図１１は、図１０の学習部４の構成例を示している。

学習部４は、時系列データ記憶部３１と学習処理部３２とから構成される。

時系列データ記憶部３１には、特徴抽出部２から、（１区間の）新たな時系列データとしての特徴量の系列が供給される。時系列データ記憶部３１は、特徴抽出部２からの新たな時系列データを、一時的に（学習処理部３２による新たな時系列データを用いた処理が終了するまで）記憶する。

学習処理部３２は、記憶部５に記憶された時系列パターン記憶ネットワークを、時系列データ記憶部３１に記憶された新たな時系列データ（の観測値）に基づいて、自己組織的に更新する。

次に、図１２は、図１１の学習処理部３２の構成例を示している。

スコア計算部４１は、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、そのノードが、時系列データ記憶部３１に記憶された時系列データ（の観測値）に適合する度合いをスコアとして求め、勝者ノード決定部４２に供給する。即ち、ノードが有する時系列パターンモデル２１が、例えば、図７に示したようにHMMである場合には、スコア計算部４１は、ノードが有する時系列パターンモデル２１としてのHMMから、時系列データ記憶部３１に記憶された時系列データが観測される尤度を求め、そのノードのスコアとして、勝者ノード決定部４２に供給する。

勝者ノード決定部４２は、記憶部５に記憶された時系列パターン記憶ネットワークにおいて、時系列データ記憶部３１に記憶された時系列データに最も適合するノードを求め、そのノードを、勝者ノードに決定する。

即ち、勝者ノード決定部４２は、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部４１からのスコアが最も高いノードを勝者ノードとして決定する。そして、勝者ノード決定部４２は、勝者ノードを表す情報を、重み決定部４３に供給する。

ここで、時系列パターン記憶ネットワークを構成するノードには、各ノードを識別するためのラベルであるノードラベルを付しておき、勝者ノードを表す情報、その他のノード表す情報としては、そのノードラベルを採用することができる。なお、ノードラベルは、ノード自体を識別するラベルであり、正解が何であるかを表す正解ラベルとは、何ら関係がない。

重み決定部４３は、勝者ノード決定部４２から供給されるノードラベルが表す勝者ノードに基づき、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、後述する更新重みを決定し、学習データ更新部４４に供給する。

即ち、重み決定部４３は、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノード（勝者ノードを含む）の更新重みを、そのノードと、勝者ノードとのパターン間距離に基づいて決定し、学習データ更新部４４に供給する。

ここで、ノードが有する時系列パターンモデル２１（図７）は、時系列データ記憶部３１（図１１）に記憶された新たな時系列データを用いて更新されるが、ノードの更新重みとは、そのノードが有する時系列パターンモデル２１の更新によって、その時系列パターンモデル２１が受ける新たな時系列データの影響の度合いを表す。従って、ノードの更新重みが０であれば、そのノードが有する時系列パターンモデル２１は、新たな時系列データの影響を受けない（更新されない）。

なお、重み決定部４３において、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードの更新重みを決定する際のパターン間距離としては、時系列パターン記憶ネットワークのノードが、図６や図８に示したように、リンクを有する場合には、そのノードと勝者ノードとの結合関係に基づくパターン間距離を採用し、また、時系列パターン記憶ネットワークのノードが、図９に示したように、リンクを有しない場合には、そのノードが、時系列データ記憶部３１（図１１）に記憶された新たな時系列データに適合する度合いに基づくパターン間距離を採用することができる。

即ち、重み決定部４３は、記憶部５に記憶された時系列パターン記憶ネットワークを参照し、時系列パターン記憶ネットワークのノードそれぞれと、勝者ノード決定部４２からのノードラベルが表す勝者ノードとの結合関係に基づくパターン間距離を求め、そのパターン間距離に基づいて、時系列パターン記憶ネットワークのノードそれぞれの更新重みを決定する。

あるいは、重み決定部４３は、記憶部５に記憶された時系列パターン記憶ネットワークを参照し、時系列パターン記憶ネットワークのノードそれぞれについて、ノードが、時系列データ記憶部３１に記憶された新たな時系列データに適合する度合いとして、例えば、スコア計算部４１が求めるのと同様のスコアを求める。さらに、重み決定部４３は、時系列パターン記憶ネットワークのノードそれぞれについて、ノードのスコアに基づく順位（適合順位）に対応する値を、新たな時系列データに適合する度合いに基づくパターン間距離として求め、そのパターン間距離に基づいて、時系列パターン記憶ネットワークのノードそれぞれの更新重みを決定する。

なお、ノードのスコアは、重み決定部４３で求めても良いが、スコア計算部４１から重み決定部４３に供給するようにしても良い。

学習データ更新部４４は、記憶部５に記憶された時系列パターン記憶ネットワークの各ノードが有する学習データ記憶部２２（図７）に記憶された学習データを更新する。

即ち、学習データ更新部４４は、ノードが有する学習データ記憶部２２に既に記憶されている学習データと、時系列データ記憶部３１に記憶された時系列データとを、重み決定部４３からの、対応するノードの更新重みにしたがって混合し、その混合結果を、新たな学習データとして、学習データ記憶部２２に記憶させることで、その学習データ記憶部２２の記憶内容を更新する。

学習データ更新部４４は、以上のように、学習データ記憶部２２（図７）に記憶された学習データを、更新重みにしたがって更新すると、その更新が終了した旨の終了通知を、モデル学習部４５に供給する。

モデル学習部４５は、学習データ更新部４４から終了通知を受けると、その学習データ更新部４４による更新後の学習データ記憶部２２（図７）に記憶された学習データを用いて、時系列パターンに記憶ネットワークの各ノードが有する時系列パターンモデル２１の学習を行うことにより、その時系列パターンモデル２１を更新する。

従って、モデル学習部４５による、ノードが有する時系列パターンモデル２１の更新は、そのノードが有する学習データ記憶部２２（図７）に記憶されていた学習データ（の一部）と、時系列データ記憶部３１に記憶された新たな時系列データとに基づいて行われる。なお、学習データ記憶部２２の記憶内容は、更新重みにしたがって更新されるから、モデル学習部４５による、時系列パターンモデル２１の更新は、更新重みに基づいて行われるということもできる。

次に、図１３は、図１２の重み決定部４３において更新重みを決定する決定方法を示している。

重み決定部４３は、例えば、図１３に示すような、勝者ノードとのパターン間距離dの増加に対して更新重みαが減少する関係を表す曲線（以下、距離／重み曲線という）にしたがって、ノードに対する更新重み（ノードの更新重み）を決定する。距離／重み曲線によれば、勝者ノードとのパターン間距離dが近いノードほど、大きな更新重みαが決定され、パターン間距離dが遠いノードほど、小さな更新重みαが決定される。

図１３の距離／重み曲線において、横軸（左から右方向）は、更新重みαを示しており、縦軸（上から下方向）は、パターン間距離dを示している。

図１３では、パターン間距離dとして、例えば、ノードとの結合関係に基づくパターン間距離、即ち、勝者ノードからの距離が採用されており、縦軸に沿って、時系列パターン記憶ネットワークを構成する６つのノードN₁乃至N₆が、各ノードN_iと勝者ノードとの距離に対応する位置（縦軸の位置）に記載されている。

図１３では、時系列パターン記憶ネットワークを構成する６つのノードN₁乃至N₆が、その順で、勝者ノードとの距離が近くなっている。時系列パターン記憶ネットワークを構成する６つのノードN₁乃至N₆のうち、勝者ノードとの距離が最も近いノード、即ち、勝者ノードとの距離が０のノードであるノードN₁は、勝者ノード（となっているノード）である。

ここで、時系列パターン記憶ネットワークが、例えば、図８に示したような２次元的な配置構造を有し、勝者ノードが、例えば、ノードN₆であった場合には、勝者ノードN₆とノードN₆との距離は最も（１番）近い０であり、ノードN₆と勝者ノードN₆とのパターン間距離dも０となる。また、勝者ノードN₆と、ノードN₃，N₅、またはN₉それぞれとの距離は２番目に近い１であり、ノードN₃，N₅、またはN₉それぞれと勝者ノードN₆とのパターン間距離dも１となる。さらに、勝者ノードN₆と、ノードN₂，N₄、またはN₈それぞれとの距離は３番目に近い２であり、ノードN₂，N₄、またはN₈それぞれと勝者ノードN₆とのパターン間距離dも２となる。また、勝者ノードN₆と、ノードN₁またはN₇それぞれとの距離は最も遠い（４番目に近い）３であり、ノードN₁またはN₇それぞれと勝者ノードN₆とのパターン間距離dも３となる。

一方、ノードがリンクを有しない、例えば、図９に示した時系列パターン記憶ネットワークについては、ノードが新たな時系列データに適合する度合いに基づくパターン間距離、即ち、ノードが新たな時系列データに適合する度合いに基づく順位（適合順位）に対応する値が、そのノードと勝者ノードとのパターン間距離dとして求められる。即ち、この場合、スコアが最も高い（一番目に高い）ノード（勝者ノード）と勝者ノードとのパターン間距離dは０とされ、スコアが２番目に高いノードと勝者ノードとのパターン間距離dは１とされる。以下、同様に、スコアがk番目に高いノードと勝者ノードとのパターン間距離dはk-1とされる。

次に、更新重みαとパターン間距離dとの関係を表す、例えば、図１３に示したような距離／重み曲線は、例えば、式（３）によって与えられる。

・・・（３）

ここで、式（３）において、定数Gは、勝者ノードの更新重みを表す定数であり、γは、減衰係数で、０＜γ＜１の範囲の定数である。また、変数Δは、時系列パターン記憶ネットワークを更新する更新方法として、前述したSMAを採用した場合の、勝者ノードの近傍のノード（勝者ノードとのパターン間距離dが近いノード）の更新重みαを調整するための変数である。

上述したように、勝者ノードとなっているノードのパターン間距離dとして、０が与えられ、以下、他のノードのパターン間距離dとして、勝者ノードとの距離、または適合順位にしたがって、１，２，・・・が与えられる場合、式（３）において、例えば、G=8，γ=0.5，Δ=1であれば、勝者ノードとなっているノードの更新重みαとして、８(=G)が求められる。以下、勝者ノードとの距離、または適合順位が大になるにしたがって、ノードの更新重みαとしては、４，２，１，・・・と小さくなる値が求められる。

ここで、式（３）における減衰係数Δが大きな値である場合には、パターン間距離dの変化に対する更新重みαの変化は緩やかになり、逆に、減衰係数Δが０に近い値である場合には、パターン間距離dの変化に対する更新重みαの変化は急峻になる。

従って、減衰係数Δを、例えば、上述した１から少しずつ０に近づけていくように調整すると、パターン間距離dの変化に対する更新重みαの変化は急峻になっていき、更新重みαは、パターン間距離dが大きくなるにしたがって、より小さい値となる。そして、減衰係数Δが０に近くなると、勝者ノード（となっているノード）以外のノードの更新重みαは、ほとんど０となり、この場合、時系列パターン記憶ネットワークを更新する更新方法として、前述したWTAを採用した場合と（ほぼ）等価となる。

このように、減衰係数Δを調整することによって、時系列パターン記憶ネットワークを更新する更新方法としてSMAを採用した場合の、勝者ノードの近傍のノードの更新重みαを調整することができる。

減衰係数△は、例えば、時系列パターン記憶ネットワークの更新（学習）の開始時は大きな値にし、時間の経過とともに、即ち、更新の回数が増加するにしたがって小さな値にくなるようにすることができる。この場合、時系列パターン記憶ネットワークの更新の開始時は、パターン間距離dの変化に対する更新重みαの変化が緩やかな距離／重み曲線にしたがって、時系列パターン記憶ネットワークの各ノードの更新重みαが決定され、更新（学習）が進む（進行する）につれ、パターン間距離dの変化に対する更新重みαの変化が急峻になっていく距離／重み曲線にしたがって、時系列パターン記憶ネットワークの各ノードの更新重みαが決定される。

即ち、この場合、勝者ノード（が有する時系列パターンモデル２１）の更新は、学習（更新）の進行にかかわらず、時系列データ記憶部３１（図１２）に記憶された新たな時系列データの影響を強く受けるように行われる。一方、勝者ノード以外のノード（が有する時系列パターンモデル２１）の更新は、学習の開始時は、比較的広い範囲のノード（勝者ノードとのパターン間距離dが小のノードから、ある程度大のノード）に亘って、新たな時系列データの影響を受けるように行われる。そして、学習が進行するにつれ、勝者ノード以外のノードの更新は、徐々に狭い範囲のノードについてのみ、新たな時系列データの影響を受けるように行われる。

図１２の重み決定部４３は、以上のようにして、時系列パターン記憶ネットワークの各ノードの更新重みαを決定し、学習データ更新部４４では、各ノードが有する学習データ記憶部２２に記憶される学習データが、そのノードの更新重みαに基づいて更新される。

次に、図１４を参照して、ノードが有する学習データ記憶部２２に記憶される学習データを更新する更新方法について説明する。

いま、あるノードN_iが有する学習データ記憶部２２には、学習データが既に記憶されており、ノードN_iの時系列パターンモデル２１は、学習データ記憶部２２に既に記憶されている学習データを用いて学習が行われたものであるとする。

学習データ更新部４４は、上述したように、ノードN_iが有する学習データ記憶部２２に既に記憶されている学習データ（以下、適宜、旧学習データという）と、時系列データ記憶部３１（図１２）に記憶された新たな時系列データとを、重み決定部４３からのノードN_iの更新重みαにしたがって混合し、その混合結果を、新たな学習データとして、学習データ記憶部２２に記憶させることで、その学習データ記憶部２２の記憶内容を、新たな学習データに更新する。

即ち、学習データ更新部４４は、旧学習データに対して、新たな時系列データを追加することで、旧学習データと新たな時系列データとを混合した新たな学習データとするが、旧学習データに対する新たな時系列データの追加（旧学習データと新たな時系列データとの混合）は、ノードN_iの更新重みαに対応する比にしたがって行われる。

ここで、新たな時系列データと旧学習データとを、１：０の比率で混合すると、その混合によって得られる新たな学習データは、新たな時系列データだけとなる。逆に、新たな時系列データと旧学習データとを、０：１の比率で混合すると、その混合によって得られる新たな学習データは、旧学習データだけとなる。ノードN_iの時系列パターンモデル２１（図７）の更新は、新たな学習データを用いた学習によって行われるため、新たな時系列データと旧学習データとを混合する比率を変えることによって、更新により時系列パターンモデル２１が受ける新たな時系列データの影響の度合い（強さ）を変えることができる。

ノードN_iにおいて、新たな時系列データと旧学習データとを混合する比率としては、ノードN_iの更新重みαに対応した値が採用され、例えば、更新重みαが大であるほど、新たな時系列データの比率が大となる（旧学習データの比率が小となる）ような値とされる。

具体的には、ノードN_iの学習データ記憶部２２には、一定の数の時系列データ（学習データ）が記憶されるものとし、その一定の数をHとする。この場合、ノードN_iの時系列パターンモデル２１の学習は、常に、H個の学習データ（時系列データ）を用いて行われる。

学習データ記憶部２２に、常に、一定の数Hの学習データが記憶される場合、新たな時系列データと旧学習データとの混合によって得られる新たな学習データの個数は、H個である必要があり、そのような、新たな時系列データと旧学習データとの混合を、ノードN_iの更新重みαに対応した比率で行う方法としては、新たな時系列データと旧学習データとを、比率α:H-αで混合する方法がある。

新たな時系列データと旧学習データとを、比率α:H-αで混合する具体的な方法としては、図１４に示すように、H個の旧学習データのうちのH-α個の旧学習データに対して、α個の新たな時系列データを追加することにより、H個の新たな学習データを得る方法がある。

この場合、学習データ記憶部２２に記憶される時系列データの数Hが、例えば、１００であり、ノードN_iの更新重みαが、例えば、８であれば、学習データ記憶部２２の記憶内容は、１００個の旧学習データのうちの９２個の旧学習データに対して、８個の新たな時系列データを追加することによって得られる１００個の新たな学習データに更新される。

H個の旧学習データのうちのH-α個の旧学習データに対する、α個の新たな時系列データの追加は、α個の新たな時系列データが得られるのを待って行う方法があるが、この方法では、１個の新たな時系列データが得られるごとに、学習データ記憶部２２の記憶内容を更新することができない。

そこで、学習データ記憶部２２の記憶内容の更新は、１個の新たな時系列データが得られるごとに、その新たな時系列データをα個だけ、H-α個の旧学習データに追加することにより行うことができる。即ち、１個の新たな時系列データをコピーしてα個の新たな時系列データとし、そのα個の新たな時系列データを、H個の旧学習データから古い順にα個を除外して残ったH-α個の旧学習データに追加することにより、学習データ記憶部２２の記憶内容の更新を行う。これにより、１個の新たな時系列データが得られるごとに、学習データ記憶部２２の記憶内容を更新することができる。

以上のように、学習データ記憶部２２の記憶内容の更新を行うことにより、学習データ記憶部２２には、常に、新しい順のＨ個の時系列データだけが、学習データとして保持されることになり、その学習データに占める新たな時系列データの割合（比率）は、更新重みαによって調整されることになる。

次に、図１５のフローチャートを参照して、図１０のデータ処理装置で行われる、時系列パターン記憶ネットワークを学習する学習処理について説明する。

まず最初に、ステップＳ１において、学習部４（図１１）の学習処理部３２は、記憶部５に記憶された時系列パターン記憶ネットワークのパラメータ、即ち、時系列パターン記憶ネットワークの各ノードが有する時系列パターンモデル２１（図７）としての、例えばHMMのパラメータを初期化する初期化処理を行う。この初期化処理により、HMMのパラメータ（状態遷移確率と出力確率密度関数）として、適切な初期値が与えられる。なお、初期化処理において、HMMのパラメータにおいて、どのように初期値を与えるかは、特に限定されるものではない。

その後、ステップＳ２において、１個の処理対象データ、即ち、例えば、１の音声区間の音声データが、信号入力部１に入力されると、信号入力部１は、その処理対象データを、特徴抽出部２に供給する。特徴抽出部２は、処理対象データから特徴量を抽出し、その特徴量の時系列データ（１個の新たな時系列データ）を、学習部４に供給する。

学習部４（図１１）は、特徴抽出部２からの新たな時系列データを、時系列データ記憶部３１に一時記憶させ、以下、ステップＳ３乃至Ｓ７において、記憶部５に記憶された時系列パターン記憶ネットワークを、時系列データ記憶部３１に記憶された新たな時系列データ（の観測値）に基づいて、自己組織的に更新（学習）する。

即ち、学習部４の学習処理部３２（図１２）では、ステップＳ３において、スコア計算部４１が、時系列データ記憶部３１に記憶された新たな時系列データを読み出し、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、そのノードが、新たな時系列データに適合する度合いを表すスコアとして求める。

具体的には、ノードが有する時系列パターンモデル２１（図７）が、例えばHMMである場合には、そのHMMから、新たな時系列データが観測される対数尤度が、スコアとして求められる。ここで、対数尤度の計算方法としては、例えば、ビタビアルゴリズム(Viterbi algorithm)を採用することができる。

スコア計算部４１は、時系列パターン記憶ネットワークが有するすべてのノードについて、新たな時系列データに対するスコアを計算すると、その各ノードについてのスコアを、勝者ノード決定部４２に供給する。

勝者ノード決定部４２は、ステップＳ４において、時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部４１からのスコアが最も高いノードを求め、そのノードを勝者ノードに決定する。そして、勝者ノード決定部４２は、勝者ノードを表す情報としてのノードラベルを、重み決定部４３に供給する。

重み決定部４３は、ステップＳ５において、勝者ノード決定部４２からのノードラベルが表す勝者ノードを、いわば基準として、時系列パターン記憶ネットワークを構成する各ノードの更新重みを決定する。

即ち、重み決定部４３は、図１３で説明したように、時系列パターン記憶ネットワークの更新（学習）が進むにつれ、パターン間距離dの変化に対する更新重みαの変化が急峻になっていく、式（３）で表される距離／重み曲線にしたがって、時系列パターン記憶ネットワークの各ノードの更新重みαを決定し、学習データ更新部４４に供給する。

学習データ更新部４４は、ステップＳ６において、時系列パターン記憶ネットワークの各ノードが有する学習データ記憶部２２（図７）に記憶された学習データを、重み決定部４３からの、対応するノードの更新重みにしたがって更新する。即ち、学習データ更新部４４は、図１４で説明したように、時系列データ記憶部３１に記憶されている新たな時系列データと、ノードの学習データ記憶部２２に記憶されている旧学習データとを、そのノードの更新重みαに対応した比率α:H-αで混合することにより、H個の新たな学習データを得て、そのH個の新たな学習データによって、学習データ記憶部２２の記憶内容を更新する。

学習データ更新部４４は、時系列パターン記憶ネットワークのノードすべての学習データ記憶部２２（図７）の記憶内容を更新すると、その更新が終了した旨の終了通知を、モデル学習部４５に供給する。

モデル学習部４５は、学習データ更新部４４から終了通知を受けると、ステップＳ７において、時系列パターン記憶ネットワークのパラメータを更新する。

即ち、モデル学習部４５は、時系列パターン記憶ネットワークの各ノードについて、学習データ更新部４４による更新後の学習データ記憶部２２に記憶された新たな学習データを用いて、時系列パターンモデル２１の学習を行うことにより、その時系列パターンモデル２１を更新する。

具体的には、ノードが有する時系列パターンモデル２１が、例えばHMMである場合には、そのノードが有する学習データ記憶部２２に記憶された新たな学習データを用いて、HMMの学習が行われる。この学習では、例えば、HMMの現在の状態遷移確率と出力確率密度関数を初期値とし、新たな学習データを用いて、Baum-Welch法により、新たな状態遷移確率と出力確率密度関数がそれぞれ求められる。そして、その新たな状態遷移確率と出力確率密度関数によって、HMMの状態遷移確率と出力確率密度関数がそれぞれ更新される。

その後は、ステップＳ７からステップＳ２に戻り、次の処理対象データが、信号入力部１に入力されるのを待って、以下、同様の処理が繰り返される。

図１５の学習処理によれば、１個の新たな時系列データが得られると、その新たな時系列データに対して、時系列パターン記憶ネットワークを構成するノードの中から、勝者ノードが決定される（ステップＳ４）。さらに、その勝者ノードを基準として、時系列パターン記憶ネットワークを構成する各ノードの更新重みが決定される（ステップＳ５）。そして、更新重みに基づいて、時系列パターン記憶ネットワークを構成する各ノードが有する時系列パターンモデル２１（図７）のパラメータが更新される。

即ち、図１５の学習処理では、１個の新たな時系列データに対して、時系列パターン記憶ネットワークを構成するノードのパラメータの更新が１回行われ、以下、同様に、新たな時系列データが得られるたびに、ノードのパラメータの更新が繰り返されることにより、自己組織的に学習が行われる。

そして、学習が十分に行われることにより、時系列パターン記憶ネットワークの各ノードが有する時系列パターンモデル２１は、ある時系列パターンを学習（獲得）する。時系列パターン記憶ネットワーク全体において学習される時系列パターンの数（種類）は、時系列パターン記憶ネットワークが有するノードの数と一致するので、時系列パターン記憶ネットワークが有するノードの数が、例えば１００である場合は、１００種類の時系列パターンが学習されることになる。この時系列パターンに基づき、認識部３（図１０）では、時系列データ（処理対象データ）を認識する認識処理を行うことが可能となり、生成部６（図１０）では、時系列データを生成する生成処理を行うことが可能となる。

なお、図１５の学習処理では、時系列データ記憶部３１に記憶されている新たな時系列データと、ノードの学習データ記憶部２２に記憶されている旧学習データとを、そのノードの更新重みαに対応した比率α:H-αで混合することにより、H個の新たな学習データを得て、そのH個の新たな学習データを用いて、ノード（が有する時系列パターンモデル２１）の学習を行うことにより、そのノード（が有する時系列パターンモデル２１）のパラメータを更新するようにしたが、ノードのパラメータの更新の方法は、ここで説明した方法に限定されるものではなく、更新重みαに応じて、新たな時系列データを、ノードのパラメータに反映させることができれば、どのような方法を用いても良い。

ここで、勝者ノード（が有する時系列パターンモデル２１）のパラメータだけを更新する方法はWTAに対応し、勝者ノード以外のノード（が有する時系列パターンモデル２１）のパラメータをも更新する方法はSMAに対応する。図１５の学習処理では、SMAによってノードのパラメータが更新される。但し、ノードのパラメータの更新はWTAによって行うことも可能である。

また、図１５の学習処理では、新たな時系列データが与えられると、その新たな時系列データを用いて、ノードの学習を行うオンライン学習を行うようにしたが、ノードの学習の方法としては、ある程度の数の新たな時系列データが得られてから、その新たな時系列データを用いて学習を行うバッチ学習を採用することも可能である。

次に、図１６は、図１０の認識部３の構成例を示している。

認識部３には、図１０で説明したように、特徴抽出部２から、（１個の）時系列データが供給され、この時系列データは、スコア計算部５１に供給される。

スコア計算部５１は、学習処理部３２（図１２）のスコア計算部４１と同様に、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、そのノードが、特徴抽出部２からの時系列データ（の観測値）に適合する度合いを表すスコアを求め、勝者ノード決定部５２に供給する。即ち、ノードが有する時系列パターンモデル２１が、例えば、図７に示したようにHMMである場合には、スコア計算部５１は、ノードが有する時系列パターンモデル２１としてのHMMから、特徴抽出部２からの時系列データが観測される対数尤度を求め、そのノードのスコアとして、勝者ノード決定部５２に供給する。

勝者ノード決定部５２は、学習処理部３２（図１２）の勝者ノード決定部４２と同様に、記憶部５に記憶された時系列パターン記憶ネットワークにおいて、特徴抽出部２からの時系列データに最も適合するノードを求め、そのノードを、勝者ノードとして決定する。

即ち、勝者ノード決定部５２は、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部５１からのスコアが最も高いノードを勝者ノードとして決定する。そして、勝者ノード決定部５２は、勝者ノードを表す情報としてのノードラベルを、出力部５３に供給する。

出力部５３は、勝者ノード決定部５２からの勝者ノードを表すノードラベルを、特徴抽出部２からの特徴量の時系列データ、ひいては、その特徴量に対応する、信号入力部１に入力された処理対象データの認識結果として出力する。

なお、認識部３のスコア計算部５１と、学習処理部３２（図１２）のスコア計算部４１とは、いずれか一方のスコア計算部で兼用することが可能である。認識部５１の勝者ノード決定部５２と、学習処理部３２（図１２）の勝者ノード決定部４２についても、同様である。

次に、図１７のフローチャートを参照して、図１０のデータ処理装置で行われる、時系列データを認識する認識処理について説明する。

ステップＳ２１において、１個の処理対象データ、即ち、例えば、１の音声区間の音声データ（時系列データ）が、信号入力部１に入力されると、信号入力部１は、その処理対象データを、特徴抽出部２に供給する。特徴抽出部２は、処理対象データである時系列データから特徴量を抽出し、その特徴量の時系列データを、認識部３に供給する。

認識部３（図１６）では、ステップＳ２２において、スコア計算部５１が、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、そのノードが、特徴抽出部２からの時系列データに適合する度合いを表すスコアを求める。

具体的には、ノードが有する時系列パターンモデル２１（図７）が、例えばHMMである場合には、そのHMMから、特徴抽出部２からの時系列データが観測される対数尤度が、例えば、ビタビアルゴリズムによって求められる。スコア計算部５１は、時系列パターン記憶ネットワークが有するすべてのノードについて、特徴抽出部２からの時系列データに対するスコアを計算すると、その各ノードについてのスコアを、勝者ノード決定部５２に供給する。

勝者ノード決定部５２は、ステップＳ２３において、時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部５１からのスコアが最も高いノードを求め、そのノードを勝者ノードとして決定する。そして、勝者ノード決定部５２は、勝者ノードを表す情報としてのノードラベルを、出力部５３に供給する。

出力部５３は、勝者ノード決定部５２からのノードラベルを、特徴抽出部２からの時系列データ（信号入力部１に入力された処理対象データ）の認識結果として出力し、処理を終了する。

なお、出力部５３が出力するノードラベル（勝者ノードのノードラベル）は、例えば、制御データとして、生成部６に供給することができる。

以上のような、時系列パターン記憶ネットワークを用いた認識処理によれば、その時系列パターン記憶ネットワークのノードの数に応じた細かさの認識結果を得ることができる。

即ち、例えば、いま、時系列パターン記憶ネットワークの学習が、３つのカテゴリ"A"，"B"，"C"の発声それぞれにより得られた音声データを用いて行われたとする。

時系列パターン記憶ネットワークの学習に用いられた３つのカテゴリ"A"，"B"，"C"の音声データが、多数の話者の発話を含む場合には、例えば、カテゴリ"A"の音声データであっても、発話速度や、イントネーション、話者の年齢、性別などの違いによって、様々なバリエーションの音声データが存在する。

教師あり学習であれば、カテゴリ"A"，"B"，"C"の音声データを用いた学習は、カテゴリ"A"の音声データだけ、カテゴリ"B"の音声データだけ、カテゴリ"C"の音声データだけをそれぞれ用いて行われる。従って、各カテゴリの学習結果には、発話速度等の違いによるバリエーションは、生じ得ない。

一方、時系列パターン記憶ネットワークの学習では、カテゴリ"A"，"B"，"C"の音声データが、それらを区別（分類）することなく用いられる。そして、時系列パターン記憶ネットワークでは、上述したように、その時系列パターン記憶ネットワークが有するノードの数だけの時系列パターンが学習される。

従って、時系列パターン記憶ネットワークでは、例えば、それが有するノードの数が３より大であれば、１つのカテゴリ"A"の音声データであっても、そのカテゴリ"A"の音声データの中の、ある１つのバリエーション（の時系列パターン）が、ある１つのノードで学習され、他の１つのバリエーションが、他の１つのノードで学習されることがある。

そして、このように、複数のノードにおいて、カテゴリ"A"の音声データの様々なバリエーションが学習された場合、認識処理では、例えば、カテゴリ"A"の音声データが処理対象データとして入力されると、カテゴリ"A"の音声データが学習された複数のノードの中から、処理対象データに最も適合するノードが、勝者ノードとして決定され、その勝者ノードのノードラベルが、認識結果として出力される。

即ち、時系列パターン記憶ネットワークを用いた認識処理では、処理対象データが、カテゴリ"A"，"B"，"C"のうちのいずれのカテゴリの音声データであるかが決定されるのではなく、時系列パターン記憶ネットワークが学習によって獲得した、そのノードの数だけの時系列パターンのうちのいずれに最も適合するか（類似するか）かが決定される。

つまり、時系列パターン記憶ネットワークの学習では、時系列パターン記憶ネットワークが有するノードの数に応じた細かさで時系列パターンが獲得され、時系列パターン記憶ネットワークを用いた認識では、時系列パターン記憶ネットワークが有するノードの数に応じた細かさで、時系列データが分類（クラス分け）される。

なお、（十分な）学習が行われた時系列パターン記憶ネットワークの各ノードに対し、そのノードが獲得した時系列パターンに応じて、適切に、カテゴリ"A"，"B"，"C"の正解ラベルを付与すれば、時系列パターン記憶ネットワークを用いた認識処理において、時系列データ（処理対象データ）が、カテゴリ"A"，"B"，"C"のうちのいずれのカテゴリの音声データであるかの認識結果を得ることができる。

次に、図１８は、図１０の生成部６の構成例を示している。

生成部６には、図１０で説明したように、制御データが供給される。生成部６に供給される制御データは、記憶部５の時系列パターン記憶ネットワークが記憶している時系列パターン、ひいては、時系列パターン記憶ネットワークを構成するノードのうちのいずれかを表すもので、例えば、ノードラベルである。

生成部６に供給された制御データは、生成ノード決定部６１に供給される。生成ノード決定部６１は、記憶部５に記憶された時系列パターン記憶ネットワークにおいて、そこに供給される制御データが表すノードを、時系列データを生成するのに用いるノード（以下、適宜、生成ノードという）に決定し、その決定結果を、時系列生成部６２に供給する。

即ち、生成ノード決定部６１は、そこに供給される制御データとしてのノードラベルが表すノードを、生成ノードに決定し、その決定結果を、時系列生成部６２に供給する。

時系列生成部６２は、生成ノード決定部６１からの決定結果にしたがい、生成ノードが有する時系列パターンモデル２１（図７）に基づいて、時系列データを生成し、出力部６３に供給する。

ここで、時系列パターンモデル２１が、例えば、HMMである場合には、時系列生成部６２は、生成ノードが有する時系列パターンモデル２１としてのHMMにおいて時系列データが観測される尤度を表す出力確率を最大にする時系列データを生成する。なお、HMMを用いた時系列データの生成については、例えば、動的特徴量を利用することで滑らかに変化する時系列データを生成する方法があり、時系列生成部６２では、その方法によって、時系列データを生成することができる。このような時系列データの生成方法は、例えば、K. Tokuda, T. Yoshimura, T. Masuko, T. Kobayashi, T. Kitamura, "SPEECH PARAMETER GENERATION ALGORITHMS FOR HMM-BASED SPEECH SYNTHESIS", Proc. of ICASSP 2000, vol.3, pp.1315-1318, June 2000に記載されている。

なお、HMMを用いて時系列データを生成する方法としては、その他、例えば、HMMのパラメータを用いた確率的試行に基づく時系列データの生成を繰り返し行い、その平均をとることで、HMMから時系列データを生成する方法なども提案されており、その詳細については、例えば、稲邑哲也、谷江博昭、中村仁彦、「連続分布型隠れマルコフモデルを用いた時系列データのキーフレーム抽出とその復元」、日本機械学会ロボティクス・メカトロニクス講演会2003講演論文集、2P1-3F-C6，2003に記載されている。

出力部６３は、時系列生成部６２からの時系列データを、処理対象データに相当する時系列データに変換して出力する。即ち、時系列生成部６２において生成される時系列データは、ノードが有する時系列パターンモデル２１の学習に用いられた特徴量の時系列データであり、出力部６３は、その特徴量の時系列データを、処理対象データ（の時系列データ）に変換して出力する。

具体的には、例えば、処理対象データが音声データであり、特徴抽出部２が、音声データからメルケプストラム係数を特徴量として抽出し、また、時系列パターンモデル２１がHMMであるとする。この場合、メルケプストラムの時系列データが、時系列パターンモデル２１によって学習されるので、時系列生成部６２が生成ノードの時系列パターンモデル２１（図７）に基づいて生成する時系列データは、メルケプストラムの時系列データとなる。出力部６３は、時系列生成部６２において生成されるメルケプストラム（の時系列データ）を、処理対象データに相当する時系列データである音声データに変換する。

なお、メルケプストラムの時系列データを音声データ（時領域の音声）に変換する方法としては、例えば、MLSAフィルタ（メル対数スペクトル近似フィルタ）と呼ばれる合成フィルタによって、メルケプストラムの時系列データをフィルタリングする方法がある。MLSAフィルタの詳細については、例えば、今井聖、住田一男、古市千恵子、「音声合成のためのメル対数スペクトル近似(MLSA)フィルタ」、電子情報通信学会論文誌（Ａ）、J66-A, 2, pp.122-129, 1983や、徳田恵一、小林隆夫、斉藤博徳、深田俊明、今井聖、「メルケプストラムをパラメータとする音声のスペクトル推定」、電子情報通信学会論文誌（Ａ）、J74-A, 8, pp.1240-1248, 1991に記載されている。

次に、図１９のフローチャートを参照して、図１０のデータ処理装置で行われる、時系列データ（処理対象データ）を生成する生成処理について説明する。

ステップＳ３１では、制御データが、生成部６（図１８）に入力される。この制御データは、生成ノード決定部６１に供給される。生成ノード決定部６１は、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの、制御データとしてのノードラベルが表すノードを、生成ノードに決定し、その決定結果を、時系列生成部６２に供給する。

時系列生成部６２は、ステップＳ３３において、生成ノード決定部６１からの決定結果にしたがい、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの生成ノードが有する時系列パターンモデル２１（のパラメータ）に基づいて、時系列データを生成し、出力部６３に供給する。出力部６３は、ステップＳ３４において、時系列生成部６２からの時系列データを、処理対象データに相当する時系列データに変換して出力する。

以上のような、時系列パターン記憶ネットワークを用いた生成処理によれば、その時系列パターン記憶ネットワークのノードの数に応じた（時系列パターンの）時系列データを生成することができる。

即ち、例えば、上述の認識処理で説明した場合と同様に、時系列パターン記憶ネットワークの学習が、３つのカテゴリ"A"，"B"，"C"の発声それぞれにより得られた音声データを用いて行われたとする。

時系列パターン記憶ネットワークの学習に用いられた３つのカテゴリ"A"，"B"，"C"の音声データが、多数の話者の発話を含む場合には、例えば、カテゴリ"A"の音声データであっても、発話速度や、イントネーション、話者の年齢、性別などの違いによって、様々なバリエーションの音声データが存在し、時系列パターン記憶ネットワークでは、カテゴリ"A"の音声データの中の、ある１つのバリエーション（の時系列パターン）が、ある１つのノードで学習され、他の１つのバリエーションが、他の１つのノードで学習されることがある。

そして、このように、複数のノードにおいて、カテゴリ"A"の音声データの様々なバリエーションが学習された場合、その複数のノードのうちのいずれかを表すノードラベルが、制御データとして与えられることにより、そのノードラベルが表すノードで学習されたバリエーションのカテゴリ"A"の音声データが出力される。従って、同一のカテゴリの音声データであっても、様々なバリエーションの音声データを出力することができる。

以上のように、時系列パターンモデル２１を有する複数のノードから構成される時系列パターン記憶ネットワークを、時系列データに基づいて、自己組織的に更新するようにしたので、長さが一定の時系列データは勿論、長さが一定でない時系列データの教師なし学習、つまり、時系列データの、いわば自律的な学習を、容易に（実用的に）行うことができる。

即ち、時系列パターン記憶ネットワークの各ノードは、時系列パターンモデル２１を有するから、時系列パターン記憶ネットワークの学習において、ノードの更新、つまり、そのノードが有する時系列パターンモデル２１の更新は、他のノードの更新に影響しない。従って、時系列パターン記憶ネットワークを構成するノードが１つ増えても、時系列パターン記憶ネットワークの学習に要する計算量は、単純には、１のノードの更新に要する計算量だけ増えるだけであり、時系列パターン記憶ネットワークの規模、つまり、時系列パターン記憶ネットワークを構成するノードの数を大にしても、時系列パターン記憶ネットワークの学習に要する計算量が飛躍的に増加することはない。従って、大規模な時系列パターン記憶ネットワークであっても、容易に、自己組織的に学習することができる。

さらに、かかる時系列パターン記憶ネットワークの学習によれば、各ノードに、時系列データの統計的な特性を表す時系列パターンが記憶されるので、その時系列パターンを用いて、時系列データの認識や生成を、容易に行うことができる。

なお、学習処理、認識処理、生成処理は、例えば、音声データ、画像データ、モータを駆動する信号（モータデータ）、その他の任意の時系列データを対象として行うことができる。具体的には、例えば、図１０のデータ処理装置を自律型のロボットなどの自律システムに適用し、そのロボットの視覚や、聴覚、触覚に相当するセンサが出力する信号や、ロボットの手や足に相当する部分を駆動するアクチュエータを制御する信号、合成音を生成する装置や目に相当するLEDに対して与える信号等を、学習処理、認識処理、生成処理の対象とする時系列データとして採用することができる。

また、本実施の形態では、ノードが有する時系列パターンモデル２１（図７）として、状態遷移確率モデルの１つであるHMMを採用することとしたが、時系列パターンモデル２１としては、他の状態遷移確率モデルを採用することが可能である。

時系列パターンモデル２１として採用することができる他の状態遷移確率モデルとしては、例えば、ベイジアンネットワークがある。

ベイジアンネットワークでは、変数間の依存関係をグラフ構造で表し、各ノードに条件
付き確率を割り当てることでモデル化が行われるが、特に、時間軸に沿った状態遷移モデ
ルを構築することで、時系列データをモデル化することが可能となる。

なお、ベイジアンネットワークのグラフ構造の決定は、例えば、学習データの尤度とグ
ラフ構造の複雑さとを考慮したモデルを選択することにより行われ、条件付き確率の推定
には、例えば、最尤推定法やEM(Expectation Maximaization)アルゴリズムなどが利用される。ここで、ベイジアンネットワークの詳細については、例えば、本村陽一、「不確実性モデリングのための情報表現：ベイジアンネット」、２００１年、ベイジアンネットチュートリアルなどに記載されている。

さらに、時系列パターンモデル２１（図７）としては、上述のように、HMMやベイジアンネットワークなどのような状態遷移確率モデルを採用することができる他、関数を近似するモデル（以下、適宜、関数近似モデルという）を採用することもできる。

関数近似モデルは、時系列パターンを、関数f()を用い、例えば、微分方程式{x(t)}'=f(x(t))や、差分方程式x(t+1)=f(x(t))などで表現するモデルで、関数f()が、時系列パターンを特徴づける。なお、tは時間（時刻）（サンプル点）を表し、x(t)は、時刻tの時系列データのサンプル値、または時刻（０から）tまでに観測された時系列データを表す。また、{x(t)}'は、時系列データx(t)の時間tに関する１次微分を表す。

学習データ（時系列データ）から、ある時系列パターンを表す（に対応する）関数f()を求めることを、関数近似と呼ぶと、関数近似の方法としては、例えば、多項式などを用いて関数 f() を表現し、その多項式の係数を、学習データから決定する方法や、ニューラルネットワークによって関数 f() を表現し、そのニューラルネットワークのパラメータを、学習データから決定する方法などがある。

多項式で表現された関数f()の関数近似において、その多項式の係数の決定（推定）は、例えば、最急降下法などによって行うことができる。また、ニューラルネットワークによって表現された関数f()の関数近似において、そのニューラルネットワークのパラメータの決定は、例えば、バックプロパゲーション法によって行うことができる。ここで、バックプロパゲーション法では、ニューラルネットワークに入力と出力のデータを与え、その入力と出力のデータの関係を満たすように、ニューラルネットワークのパラメータの学習が行われる。

例えば、時系列パターンモデル２１として、関数f()を用いた差分方程式x(t+1)=f(x(t))で時系列パターンを表現する関数近似モデルを採用する場合、入力層x(t)と出力層x(t+1)をつなぐ重み（中間層）が、ニューラルネットワークのパラメータであり、このパラメータが、学習データ（時系列データ）を用いて学習される。ニューラルネットワークのパラメータの学習は、初期値を適当に与えて、バックプロパゲーション法により行われる。なお、ニューラルネットワークとしては、例えば、リカレントニューラルネットワークを採用することができる。

関数f()がニューラルネットワークによって表現される時系列パターンモデル２１を有
するノードで構成される時系列パターン記憶ネットワークの学習等でも、上述のHMMを時系列パターンモデル２１として採用した場合と同様に、勝者ノードを決定する必要があり、勝者ノードの決定のためには、時系列パターン記憶ネットワークの各ノードの、新たな時系列データに対するスコアを計算する必要がある。

このスコアとしては、例えば、新たな時系列データの観測値（実際の値）と、関数f()がニューラルネットワークによって表現される時系列パターンモデル２１から求められる、新たな時系列データの理論値との差の二乗和などを採用することができる。この場合、スコアの値が最も小さいノードが、新たな時系列データに最も適合するノードである勝者ノードとして決定される。

勝者ノードの決定後は、各ノードの更新重みを決定し、以下、上述のHMMを時系列パターンモデル２１として採用した場合と同様の手順で、各ノード（が有するニューラルネットワーク）のパラメータを更新することができる。

次に、以上のような時系列パターン記憶ネットワークを適用した順モデルや逆モデルについて説明する。

図２０は、時系列パターン記憶ネットワークが適用された順モデルまたは逆モデルとしての入出力関係モデルの構成例を模式的に示している。

図２０において、入出力関係モデルは、２つの時系列パターン記憶ネットワークnet_inおよびnet_outを有している。さらに、入出力関係モデルは、時系列パターン記憶ネットワークnet_inの各ノードN_i（i＝１，２，・・・，ノードの総数）と、時系列パターン記憶ネットワークnet_outの各ノードN'_j（j＝１，２，・・・，ノードの総数）とが結合されている結合モデルである。

ここで、図２０において、時系列パターン記憶ネットワークnet_inのノードN_iと、時系列パターン記憶ネットワークnet_outのノードN'_jとの間の矢印が、そのノードN_iとN'_jとの結合を表している。

なお、時系列パターン記憶ネットワークnet_inおよびnet_outは、同一の数のノードと同一のリンク（リンクがない場合を含む）を有するものであっても良いし、異なる数のノードまたは異なるリンクを有する者であっても良い。また、時系列パターン記憶ネットワークnet_inのノードN_iが有する時系列パターンモデル２１（図７）と、時系列パターン記憶ネットワークnet_outのノードが有する時系列パターンモデル２１も、同一の時系列パターンモデルであっても良いし、異なる時系列パターンモデルであっても良い。

次に、図２１は、入出力関係モデルを用いて、各種の処理を行うデータ処理装置の構成例を示している。

図２１のデータ処理装置では、図２０の入出力関係モデルによって制御対象を順モデルまたは逆モデルにモデル化し、さらに、その順モデルまたは逆モデルとしての入出力関係モデルを用いて、制御対象から得られる出力データや、制御対象に与えるべき制御データ（入力データ）を推定する。

即ち、図２１において、データ処理装置は、記憶部２１１、学習部２１２、および認識生成部２１３から構成されている。

記憶部２１１は、例えば、図２０に示した入出力関係モデルなどを記憶する。

学習部２１２には、モデル化しようとする制御対象に与えられる入力データ（の観測値）と、その入力データに対して制御対象から得られる出力データ（の観測値）とのセットである教示データが供給されるようになっている。ここで、教示データは、ある区間の時系列データ（ある時間に亘る時系列データ）である入力データと、その区間の時系列データに対して制御対象から得られる区間の他の時系列データである出力データとのセットである。

学習部２１２は、そこに供給される教示データを用い、制御対象の順モデルまたは逆モデルとしての入出力関係モデルの学習を行う。

即ち、学習部２１２は、学習処理部２２１と結合重み更新部２２２から構成される。

学習処理部２２１は、図１２に示した学習処理部３２と同様に構成され、学習部２１２に供給される教示データのうちの入力データに基づいて、記憶部２１１に記憶された入出力関係モデル（図２０）における時系列パターン記憶ネットワークnet_inを、図１０のデータ処理装置における場合と同様に、自己組織的に更新する。また、学習処理部２２１は、学習部２１２に供給される教示データのうちの出力データ（教示データにおいて、入力データとセットになっている出力データ）に基づいて、記憶部２１１に記憶された入出力関係モデル（図２０）における時系列パターン記憶ネットワークnet_outを、図１０のデータ処理装置における場合と同様に、自己組織的に更新する。

さらに、学習処理部２２１は、時系列パターン記憶ネットワークnet_inを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_inのノードN_iのノードラベル（以下、適宜、入力ラベルという）と、時系列パターン記憶ネットワークnet_outを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_outのノードN'_jのノードラベル（以下、適宜、出力ラベルという）とをセットにしたラベルセットを、結合重み更新部２２２に供給する。

結合重み更新部２２２は、学習処理部２２１から供給されるラベルセットに基づき、記憶部２１１に記憶された入出力関係モデル（図２０）における時系列パターン記憶ネットワークnet_outのノードN_iと、時系列パターン記憶ネットワークnet_outのノードN'_jとの結合関係を更新する。

ここで、学習処理部２２１から結合重み更新部２２２に供給されるラベルセットは、入力ラベルと出力ラベルとのセットであり、入力ラベルは、教示データのうちの入力データに基づいて時系列パターン記憶ネットワークnet_inを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_inのノードN_iのノードラベルであるから、時系列パターン記憶ネットワークnet_inにおいて、入力データに最も適合するノードN_iのノードラベルである。

同様に、出力ラベルは、教示データのうちの出力データに基づいて時系列パターン記憶ネットワークnet_outを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_outのノードN'_jのノードラベルであるから、時系列パターン記憶ネットワークnet_outにおいて、出力データに最も適合するノードN'_jのノードラベルである。

結合重み更新部２２２では、時系列パターン記憶ネットワークnet_inのノードのうちの、教示データにおける入力データに最も適合するノードである勝者ノードN_iと、時系列パターン記憶ネットワークnet_outの各ノードとの結合関係が更新されるとともに、時系列パターン記憶ネットワークnet_outのノードのうちの、教示データにおける出力データに最も適合するノードである勝者ノードN'_jと、時系列パターン記憶ネットワークnet_inの各ノードとの結合関係が更新される。

ここで、入出力関係モデルにおける時系列パターン記憶ネットワークnet_inのノードと、時系列パターン記憶ネットワークnet_outのノードとの間の結合関係は、その結合の度合いが強いほど、大きな値となる結合重みによって表されるようになっており、ノードどうしの結合関係の更新とは、結合重みの更新を意味する。結合重み更新部２２２によるノードどうしの結合関係の更新の方法についての詳細は、後述する。

認識生成部２１３には、制御対象から得られる出力データを推定するための入力データ、または制御対象から得られる出力データをある目標値とするのに制御対象に与えるべき入力データ（制御データ）を推定するための出力データが供給される。

そして、認識生成部２１３は、入力データが供給された場合は、記憶部２１１に記憶された入出力関係モデルにおける時系列パターン記憶ネットワークnet_inにおいて、その入力データに最も適合する勝者ノードN_iを決定し、その勝者ノードN_iとの結合重みが最も強い、時系列パターン記憶ネットワークnet_outのノードを、その入力データに対する出力データの推定値としての時系列データを生成する生成ノードN'_jに決定する。さらに、認識生成部２１３は、生成ノードN'_jが有する時系列パターンモデル２１（図７）に基づいて、出力データ（の推定値）を生成して出力する。

また、認識生成部２１３は、出力データが供給された場合は、記憶部２１１に記憶された入出力関係モデルにおける時系列パターン記憶ネットワークnet_outにおいて、その出力データに最も適合する勝者ノードN'_jを決定し、その勝者ノードN'_jとの結合重みが最も強い、時系列パターン記憶ネットワークnet_inのノードを、その出力データが得られるときに制御モデルに与えられる制御データ（入力データ）の推定値としての時系列データを生成する生成ノードN_iに決定する。さらに、認識生成部２１３は、生成ノードN_iが有する時系列パターンモデル２１（図７）に基づいて、制御データ（の推定値）を生成して出力する。

即ち、認識生成部２１３は、スコア計算部２３１、勝者ノード決定部２３２、生成ノード決定部２３３、および時系列生成部２３４から構成される。

なお、スコア計算部２３１、勝者ノード決定部２３２、生成ノード決定部２３３、および時系列生成部２３４は、認識生成部２１３に供給されたデータが、入力データであるのか、または出力データであるのかを認識することができるようになっているものとする。即ち、例えば、認識生成部２１３に対しては、そこに供給されるデータとは別に、あるいは、そこに供給されるデータとともに、そのデータが、入力データまたは出力データのうちのいずれであるのかを表す情報が供給されるようになっており、これにより、スコア計算部２３１、勝者ノード決定部２３２、生成ノード決定部２３３、および時系列生成部２３４は、認識生成部２１３に供給されたデータが、入力データであるのか、または出力データであるのかを認識する。

スコア計算部２３１は、認識生成部２１３に供給されたデータに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inの各ノードN_i、または時系列パターン記憶ネットワークnet_outの各ノードN'_jが適合する度合いであるスコアを、図１６の認識部３のスコア計算部５１における場合と同様にして計算し、勝者ノード決定部２３２に供給する。

即ち、スコア計算部２３１は、認識生成部２１３に供給されたデータが入力データである場合、その入力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inの各ノードN_iのスコアを計算し、勝者ノード決定部２３２に供給する。また、スコア計算部２３１は、認識生成部２１３に供給されたデータが出力データである場合、その出力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outの各ノードN'_jのスコアを計算し、勝者ノード決定部２３２に供給する。

勝者ノード決定部２３２は、図１６の認識部３の勝者ノード決定部５２における場合と同様に、スコア計算部２３１から供給されるスコアが最も高いノードを勝者ノードに決定し、その勝者ノードを表すノードラベルを、生成ノード決定部２３３に供給する。

従って、認識生成部２１３に供給されたデータが入力データである場合、勝者ノード決定部２３２では、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、スコア計算部２３１から供給される、入力データに対するスコアが最も高いノードが、勝者ノードN_iに決定され、その勝者ノードN_iを表す入力ラベルが、生成ノード決定部２３３に供給される。また、認識生成部２１３に供給されたデータが出力データである場合、勝者ノード決定部２３２では、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、スコア計算部２３１から供給される、出力データに対するスコアが最も高いノードが、勝者ノードN'_jに決定され、その勝者ノードN'_jを表す出力ラベルが、生成ノード決定部２３３に供給される。

生成ノード決定部２３３は、勝者ノード決定部２３２から入力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが入力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、勝者ノード決定部２３２からの入力ラベルが表すノードN_iとの結合重みが最も強い（最強の）ノードN'_jを生成ノードとして決定し、その生成ノードN'_jを表す出力ラベルを、時系列生成部２３４に供給する。また、生成ノード決定部２３３は、勝者ノード決定部２３２から出力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが出力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、勝者ノード決定部２３２からの出力ラベルが表すノードN'_jとの結合重みが最も強い（最強の）ノードN_iを生成ノードとして決定し、その生成ノードN_iを表す入力ラベルを、時系列生成部２３４に供給する。

時系列生成部２３４は、生成ノード決定部２３３から出力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが入力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードのうちの、生成ノード決定部２３３からの出力ラベルが表すノードN'_jが有する時系列パターンモデル２１（図７）に基づいて、認識生成部２１３に供給された入力データに対する出力データの推定値としての時系列データを、例えば、図１８の生成部６の時系列生成部６２における場合と同様にして生成する。

また、時系列生成部２３４は、生成ノード決定部２３３から入力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが出力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードのうちの、生成ノード決定部２３３からの入力ラベルが表すノードN_iが有する時系列パターンモデル２１に基づいて、認識生成部２１３に供給された出力データに対する制御データ（入力データ）の推定値としての時系列データを、例えば、図１８の生成部６の時系列生成部６２における場合と同様にして生成する。

次に、図２２のフローチャートを参照して、図２１のデータ処理装置で行われる、入出力関係モデルによる制御対象のモデル化、即ち、入出力関係モデルの学習について説明する。

ステップＳ１０１において、入力データと出力データとのセットである教示データが、図２１のデータ処理装置に入力されると、その教示データは、学習部２１２の学習処理部２２１に供給される。

学習処理部２２１は、ステップＳ１０２において、教示データのうちの入力データに基づいて、記憶部２１１に記憶された入出力関係モデル（図２０）における時系列パターン記憶ネットワークnet_inを、自己組織的に更新し、ステップＳ１０３に進む。ステップＳ１０３では、学習処理部２２１は、教示データのうちの出力データに基づいて、記憶部２１１に記憶された入出力関係モデルにおける時系列パターン記憶ネットワークnet_outを、自己組織的に更新する。

そして、学習処理部２２１は、時系列パターン記憶ネットワークnet_inを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_inのノードN_iの入力ラベルと、時系列パターン記憶ネットワークnet_outを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_outのノードN'_jの出力ラベルとのセットであるラベルセットを、結合重み更新部２２２に供給する。

結合重み更新部２２２は、ステップＳ１０４において、学習処理部２２１から供給されるラベルセットに基づき、記憶部２１１に記憶された入出力関係モデル（図２０）における時系列パターン記憶ネットワークnet_inの各ノードと、時系列パターン記憶ネットワークnet_outの各ノードとの結合重みを更新して、ステップＳ１０１に戻り、次の教示データが入力されるのを待って、以下、同様の処理が繰り返される。

多数の教示データが入力され、ステップＳ１０１乃至Ｓ１０４の処理が繰り返されることにより、記憶部２１１に記憶された入出力関係モデルは、制御対象に対応する順モデルとなっていくとともに、逆モデルにもなっていく。

次に、図２３を参照して、結合重み更新部２２２（図２１）が、図２２のステップＳ１０４で行う結合重み（ノードどうしの結合関係）の更新について説明する。

なお、以下、適宜、入出力関係モデルにおいて、入力データが与えられる時系列パターン記憶ネットワーク、つまり、入力データを用いて学習が行われ、入力データの時系列パターンを表現する時系列パターンモデル２１を有する複数のノードから構成される時系列パターン記憶ネットワーク（例えば、時系列パターン記憶ネットワークnet_in）を、入力ネットワークといい、出力データが与えられる時系列パターン記憶ネットワーク、つまり、出力データを用いて学習が行われ、出力データの時系列パターンを表現する時系列パターンモデル２１を有する複数のノードから構成される時系列パターン記憶ネットワーク（例えば、時系列パターン記憶ネットワークnet_out）を、出力ネットワークという。

さらに、以下、適宜、入力ネットワークのノードを入力ノードといい、出力ネットワークのノードを出力ノードという。

また、以下では、入出力関係モデルを、入力データを与えて出力データを推定する順モデルとして用いる場合についての説明をし、入出力関係モデルを、出力データ（目標値）を与えて入力データ（制御データ）を推定する逆モデルとして用いる場合についての説明は適宜省略する。

図２３左側は、入出力関係モデルを示している。

図２３左側では、入出力関係モデルは、１つの入力ネットワークnet_inと、１つの出力ネットワークnet_outとを有し、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの各出力ノードとが結合している。なお、図２３では、入力ネットワークnet_in、および出力ネットワークnet_outのいずれも、８つのノードで構成されている。

図２３左側では、入力ネットワークnet_inの各入力ノードは、出力ネットワークnet_outのすべての出力ノードと結合しており（従って、出力ネットワークnet_outの各出力ノードも、入力ネットワークnet_inのすべての入力ノードと結合している）、入力ネットワークnet_inの入力ノードと、出力ネットワークnet_outの出力ノードとのすべての組み合わせについて、結合重みwが存在する。

いま、ノードどうしが結合している２つの時系列パターン記憶ネットワークに注目し、そのうちの一方の時系列パターン記憶ネットワークのノードを各行に対応させるとともに、他方の時系列パターン記憶ネットワークのノードを各列に対応させ、第i行第j列の要素に、一方の時系列パターン記憶ネットワークのi番目のノードと、他方の時系列パターン記憶ネットワークのj番目のノードとの結合重みwを配置した行列を、結合重み行列MTXということとすると、結合重み更新部２２２（図２１）は、この結合重み行列MTXの各要素である結合重みwを更新する。

図２３右側は、図２３左側の入出力関係モデルについての結合重み行列MTXを示している。

図２３右側の結合重み行列MTXでは、入力ノードを各行に対応させるとともに、出力ノードを各列に対応させ、第i行第j列の要素に、i番目の入力ノードと、j番目の出力ノードとの結合重みwが配置されている。結合重み更新部２２２（図２１）は、この結合重み行列MTXの各要素である結合重みwを更新する。

即ち、結合重み更新部２２２は、例えば、最初に電源がオンにされたときに、結合重み行列MTXにおけるすべての結合重みwを、例えば、初期値としての0に初期化する。そして、結合重み更新部２２２は、図２１のデータ処理装置に対して、教示データ、つまり、入力データと出力データとのセットが入力され、これにより、入力ネットワークnet_inにおける勝者ノードを表す入力ラベルと、出力ネットワークnet_outにおける勝者ノードを表す出力ラベルとのラベルセットが、学習処理部２２１から与えられるたびに、それらの勝者ノードどうしの結合を、いわば中心として、結合重みを更新する。

具体的には、結合重み更新部２２２は、例えば、式（４）にしたがって、結合重み行列MTXの結合重みwを更新する。

・・・（４）

ここで、βは、結合重みwを更新する程度の表す学習率であり、0から1の範囲で与えられる。学習率βを小さくするほど、結合重みwは、あまり変化しなくなり、学習率βが0である場合には、結合重みwは変化しない。一方、学習率βを大きくするほど、結合重みwも、大きく変化し、学習率βが1である場合には、結合重みwは、更新の基準値△wに更新される。

また、基準値△wは、例えば、式（５）で与えられる。

・・・（５）

ここで、dは、式（３）における場合と同様に、勝者ノードとのパターン間距離を表し、勝者ノードとなっているノードについては、d=0である。従って、勝者ノード（となっているノード）については、基準値△wは1となり、勝者ノードからのパターン間距離dが大のノードほど、基準値△wは0に近づく。

いま、学習処理部２２１（図２１）から結合重み更新部２２２に供給される入力ラベルが表す入力ノード、即ち、入力ネットワークnet_inにおける勝者ノードを、入力ノードN_iと表すとともに、学習処理部２２１（図２１）から結合重み更新部２２２に供給される出力ラベルが表す出力ノード、即ち、出力ネットワークnet_outにおける勝者ノードを、出力ノードN'_jと表すと、結合重み更新部２２２（図２１）は、式（４）（および式（５））にしたがい、以下のように、結合重み行列MTXの結合重みwを更新する。

即ち、結合重み更新部２２２は、出力ネットワークnet_outの各出力ノードについて、出力ネットワークnet_outにおける勝者ノードである出力ノードN'_jとのパターン間距離dを用い、式（５）にしたがって、基準値△wを求め、さらに、その基準値△wを用い、式（４）にしたがって、入力ネットワークnet_inの勝者ノードであるi番目の入力ノードN_iとの結合重みwを更新する。

これにより、入力ネットワークnet_inの勝者ノードである入力ノードN_iに対応する、結合重み行列MTXの第i行の（各列の）結合重みwが更新される。

また、結合重み更新部２２２は、入力ネットワークnet_inの各入力ノードについて、入力ネットワークnet_inにおける勝者ノードである入力ノードN_iとのパターン間距離dを用い、式（５）にしたがって、基準値△wを求め、さらに、その基準値△wを用い、式（４）にしたがって、出力ネットワークnet_outの勝者ノードであるj番目の出力ノードN'_jとの結合重みwを更新する。

これにより、出力ネットワークnet_outの勝者ノードである出力ノードN'_jに対応する、結合重み行列MTXの第j列の（各行の）結合重みwが更新される。

なお、入力ネットワークnet_inの勝者ノードである入力ノードN_iと、出力ネットワークnet_outの勝者ノードである出力ノードN'_jとの結合重みwの更新は、出力ネットワークnet_outの各出力ノードについての、勝者ノードである入力ノードN_iとの結合重みwの更新時か、または、入力ネットワークnet_inの各入力ノードについての、勝者ノードである出力ノードN'_jとの結合重みwの更新時のいずれか一方においてのみ行われる。

以上のような結合重みw（結合重み行列MTX）の更新は、教示データとしての入力データと出力データとのセットが、図２１のデータ処理装置に対して入力されるたびに行われる。

さらに、入出力関係モデルが有する入力ネットワークnet_inの入力データに基づく学習、および出力ネットワークnet_outの出力データに基づく学習も、教示データとしての入力データと出力データとのセットが、図２１のデータ処理装置に対して入力されるたびに行われる。

そして、入力ネットワークnet_in、および出力ネットワークnet_outの学習が進むと、入力ノードが有する時系列パターンモデル２１が、ある特定の時系列パターンを表現し、また、出力ノードが有する時系列パターンモデル２１も、他の特定の時系列パターンを表現するようになる。

その結果、ある特定の時系列パターンの入力データと、他の特定の時系列パターンの出力データとの間に、何らかの関係性がある場合、そのような入力データと出力データとのセット（教示データ）が与えられると、入力ネットワークnet_inにおいてある特定の時系列パターンを表現する時系列パターンモデル２１を有する入力ノードが勝者ノードとなるとともに、出力ネットワークnet_outにおいて他の特定の時系列パターンを表現する時系列パターンモデル２１を有する出力ノードが勝者ノードとなる。

さらに、上述したように、入力ネットワークnet_inの勝者ノードを、いわば中心として、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの勝者ノードとの結合重みが更新されるとともに、出力ネットワークnet_outの勝者ノードを中心として、出力ネットワークnet_outの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みが更新される。

即ち、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの勝者ノードとの結合重みは、入力ネットワークnet_inの勝者ノードとのパターン間距離dが近い入力ノードほど強くなる（強化する）ように更新される。また、出力ネットワークnet_outの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みは、出力ネットワークnet_outの勝者ノードとのパターン間距離dが近い出力ノードほど強くなるように更新される。

逆に言えば、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの勝者ノードとの結合重みは、入力ネットワークnet_inの勝者ノードとのパターン間距離dが遠い入力ノードほど弱くなる（弱化する）ように更新される。また、出力ネットワークnet_outの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みも、出力ネットワークnet_outの勝者ノードとのパターン間距離dが遠い出力ノードほど弱くなるように更新される。

多数の教示データが与えられ、入力ネットワークnet_in、および出力ネットワークnet_outの学習が進み、さらに、結合重みの更新が進むと、その結合重みによって、入力データ（の時系列パターン）と出力データ（の時系列パターン）とを関係付ける順モデルまたは逆モデルとしての入出力関係モデルを獲得することができる。

そして、順モデルとしての入出力関係モデルによれば、ある入力データが与えられた場合に、入力ネットワークnet_inにおいて、その入力データに最も適合する勝者ノードを決定することができ、その勝者ノードとの結合重みが最強の出力ネットワークnet_outの出力ノードを決定することができる。さらに、その出力ノード（が有する時系列パターンモデル２１）に基づき、時系列データを生成することで、与えられた入力データに対する出力データを推定することができる。

また、逆モデルとしての入出力関係モデルによれば、ある出力データ（目標値）が与えられた場合に、出力ネットワークnet_outにおいて、その出力データに最も適合する勝者ノードを決定することができ、その勝者ノードとの結合重みが最強の入力ネットワークnet_inの入力ノードを決定することができる。さらに、その入力ノード（が有する時系列パターンモデル２１）に基づき、時系列データを生成することで、与えられた出力データに対する制御データ（入力データ）を推定することができる。

なお、結合重み行列MTXは、入出力関係モデルの一部として、記憶部２１１（図２１）に記憶される。

次に、図２４のフローチャートを参照して、順モデルまたは逆モデルとしての入出力関係モデルを用いて、入力データに対する出力データや、出力データに対する制御データ（入力データ）を推定する処理について説明する。

まず、図２１のデータ処理装置において、入力データに対する出力データを推定する場合、ステップＳ１１１において、その入力データが、図２１のデータ処理装置に入力される。

データ処理装置に入力された入力データは、認識生成部２１３のスコア計算部２３１に供給される。

スコア計算部２３１は、ステップＳ１１２において、そこに供給された入力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inの各ノードN_iのスコアを計算し、勝者ノード決定部２３２に供給する。

勝者ノード決定部２３２は、ステップＳ１１３において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、スコア計算部２３１からのスコアが最も高いノードを、勝者ノードN_iに決定し、その勝者ノードN_iを表す入力ラベルを、生成ノード決定部２３３に供給する。

生成ノード決定部２３３は、ステップＳ１１４において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、勝者ノード決定部２３２からの入力ラベルが表すノードN_iとの結合重みが最も強いノードN'_jを生成ノードに決定し、その生成ノードN'_jを表す出力ラベルを、時系列生成部２３４に供給する。

時系列生成部２３４は、ステップＳ１１５において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードのうちの、生成ノード決定部２３３からの出力ラベルが表すノードN'_jが有する時系列パターンモデル２１（図７）に基づいて、認識生成部２１３に供給された入力データに対する出力データの推定値としての時系列データを生成して、ステップＳ１１６に進み、その時系列データを出力する。

次に、図２１のデータ処理装置において、出力データに対する制御データ（入力データ）を推定する場合には、ステップＳ１１１において、その出力データが、図２１のデータ処理装置に入力される。

データ処理装置に入力された出力データは、認識生成部２１３のスコア計算部２３１に供給される。

スコア計算部２３１は、ステップＳ１１２において、そこに供給された出力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outの各ノードN'_jのスコアを計算し、勝者ノード決定部２３２に供給する。

勝者ノード決定部２３２は、ステップＳ１１３において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、スコア計算部２３１からのスコアが最も高いノードを、勝者ノードN'_jに決定し、その勝者ノードN'_jを表す出力ラベルを、生成ノード決定部２３３に供給する。

生成ノード決定部２３３は、ステップＳ１１４において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、勝者ノード決定部２３２からの出力ラベルが表すノードN'_jとの結合重みが最も強いノードN_iを生成ノードに決定し、その生成ノードN_iを表す入力ラベルを、時系列生成部２３４に供給する。

時系列生成部２３４は、ステップＳ１１５において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードのうちの、生成ノード決定部２３３からの入力ラベルが表すノードN_iが有する時系列パターンモデル２１に基づいて、認識生成部２１３に供給された出力データに対する制御データ（入力データ）の推定値としての時系列データを生成して、ステップＳ１１６に進み、その時系列データを出力する。

以上のように、入力データと出力データとのセットを用いて、入出力関係モデルの学習を行い、制御対象を順モデルおよび逆モデルにモデル化して、制御対象を精度良く表現し、高精度に、出力データや制御データ（入力データ）を推定することが可能となる。

ところで、以上においては、黙示的に、入力データと出力データのいずれも、１チャネルの時系列データであるとしている。しかしながら、制御対象によっては、入力データ、または出力データが、複数のチャネルの時系列データであることがあり得る。

即ち、例えば、いま、図２５上側に示すような想定ロボットを制御対象として、その想定ロボットを、入出力関係モデルによって順モデルにモデル化することを考える。

ここで、図２５上側の想定ロボットは、音声データまたは画像データが与えられると、音声データ（に対応する合成音）を出力し、またはモータデータを出力して、そのモータデータにしたがって駆動するモータによってアームを移動させる（動かす）ようになっている。

いま、区別することができるデータを単位を、チャネルと呼ぶこととすると、図２５上側の想定ロボットには、音声データと画像データとの２つのチャネルの時系列データを含む入力データが入力される。さらに、図２５上側の想定ロボットでは、音声データとモータデータとの２つのチャネルの時系列データを含む出力データが出力される。

なお、入力データに含まれる各チャネルの時系列データを、サブ入力データということとすると、図２５上側の想定ロボットに入力される入力データには、音声データと画像データとが、サブ入力データとして含まれている。ここで、以下、適宜、入力データにサブ入力データとして含まれる音声データと画像データを、それぞれ、入力音声データと入力画像データという。

さらに、出力データに含まれる各チャネルの時系列データを、サブ出力データということとすると、図２５上側の想定ロボットが出力する出力データには、音声データとモータデータとが、サブ出力データとして含まれている。ここで、以下、適宜、出力データにサブ出力データとして含まれる音声データとモータデータを、それぞれ、出力音声データと出力モータデータという。

また、入力音声データについては、その入力音声データの特徴量としての、例えば、複数の周波数帯域それぞれのパワーを要素とするベクトル（特徴ベクトル）が、所定の時間間隔としてのフレーム単位で抽出され、サブ入力データとして、想定ロボットに入力されることとする。さらに、入力画像データについては、その入力画像データの特徴量としての、例えば、その入力画像データ（に対応する画像）に映っている物体の位置のx,y,z座標を要素とするベクトルが、例えば、入力音声データの特徴量と同一または異なる時間間隔で抽出され、サブ入力データとして、想定ロボットに入力されることとする。なお、物体の位置のx,y,z座標は、上述した３次元座標系、即ち、ロボットの重心を原点とし、ロボットの前方方向をx軸と、右方向をｙ軸と、上方向をｚ軸と、それぞれする３次元座標系で表されることとする。

また、出力音声データについては、その出力音声データの周波数成分を指定する１以上のパラメータを要素とする時系列のベクトルが、サブ出力データとして、想定ロボットから出力されることとする。

さらに、出力モータデータについては、アームを動かすモータの回転角度や回転速度などを要素とする時系列のベクトルが、サブ出力データとして、想定ロボットから出力されることとする。

ここで、上述したように、入力音声データと入力画像データとは、入力データに含まれるサブ入力データとして、想定ロボットに同時に入力されるが、例えば、入力音声データの特徴量と、入力画像データの特徴量との抽出の時間間隔が異なる場合や、特徴量の抽出の時間間隔が同一であっても、特徴量の抽出のタイミングがすれている場合等には、入力音声データの特徴量が得られるタイミングにおいて、入力画像データの特徴量が得られないことや、その逆に、入力画像データの特徴量が得られるタイミングにおいて、入力音声データの特徴量が得られないことがある。つまり、あるチャネルのサブ入力データの特徴量は存在するが、他のチャネルのサブ入力データの特徴量は存在しないことがある。この場合、特徴量が存在しないサブ入力データについては、例えば、特徴量が存在しないことを表すデータが、入力データに含められる。

また、上述したように、想定ロボットは、出力音声データと出力モータデータとを、出力データに含まれるサブ出力データとして、同時に出力するが、音声（音）の出力と、アームの移動とを、同時に行う必要がない場合がある。即ち、音声を出力する必要はあるが、アームを移動させる（動かす）必要がないことや、アームを移動させる必要はあるが、音声を出力する必要はないことがある。音声を出力する必要はあるが、アームを移動させる必要がない場合には、出力モータデータについては、アームを移動させないことを表すデータが、出力データに含められる。また、アームを移動させる必要はあるが、音声を出力する必要はない場合には、出力音声データについては、音声を出力しないことを表すデータが、出力データに含められる。

なお、ここでは、上述したように、特徴量が存在しないサブ入力データについては、特徴量が存在しないことを表すデータを、入力データに含めるようにしたが、その他、特徴量が存在しないサブ入力データは、入力データに含めないようにすることも可能である。

また、音声を出力する必要はあるが、アームを移動させる必要がない場合には、アームを移動させないことを表すデータを、出力モータデータとして出力データに含める他、出力モータデータを、出力データに含めないようにすることができる。同様に、アームを移動させる必要はあるが、音声を出力する必要はない場合には、出力音声データを、出力データに含めないようにすることができる。

次に、入出力関係モデルによれば、入力データや出力データが、複数チャネルの時系列データ（サブ入力データ、サブ出力データ）を含む場合であっても、想定ロボットの順モデルを獲得することができる。

即ち、図２５下側に示すように、想定ロボットに入力される入力データと、その入力データを想定ロボットに入力したときに想定ロボットが出力する出力データとの多数のセット（教示データ）を、入出力関係モデルに与え、その教示データを用いて、入出力関係モデルの学習を行うことにより、想定ロボットの順モデルを獲得することができる。

つまり、教示データにおける入力データに基づく入力ネットワーク（時系列パターン記憶ネットワーク）net_inの学習を自己組織的に行うとともに、教示データにおける出力データに基づく出力ネットワーク（時系列パターン記憶ネットワーク）net_outの学習を自己組織的に行い、入力ネットワークnet_inと出力ネットワークnet_outとのノードどうしの結合重みの更新を行うことにより、想定ロボットの順モデルを（逆モデルも）獲得することができる。

ところで、入力ネットワークnet_inや出力ネットワークnet_outは、時系列パターン記憶ネットワークであり、時系列パターン記憶ネットワークは、その時系列パターン記憶ネットワークが有するノードの数と同一の数の時系列パターンを記憶する。従って、時系列パターン記憶ネットワークによれば、時系列データを、その時系列パターン記憶ネットワークが有するノードの数と同一の数のクラス（クラスタ）のうちのいずれかにクラス分け（クラスタリング）することができる。

このように、時系列パターン記憶ネットワークは、時系列データを、ノードの数と同一の数のクラスのうちのいずれかにクラス分けすることから、ノードの数は、例えば、クラス分けの対象となる時系列データのパターンの数として予想される数以上とすることが望ましい。

従って、入力データが、例えば、上述したように、入力音声データと入力画像データとの２つのチャネルのサブ入力データを含む場合において、入力音声データのパターンと入力画像データのパターンとして、いずれも、例えば、100パターンが予想されるとすると、入力データ全体のパターンとしては、入力音声データの100パターンと入力画像データの100パターンとのすべての組み合わせである10000(=100×100)パターンが予想されることとなる。

この場合、入力ネットワークnet_inは、10000以上といった多数のノードで構成する必要があり、その結果、その入力ネットワークnet_inを含んで構成される入出力関係モデルを記憶する記憶部２１１（図２１）の記憶容量が大となる。さらに、入力ネットワークnet_inでは、上述のような10000パターンもの時系列パターンの学習（自己組織的な学習）を行う必要がある。

同様に、出力データが、例えば、上述したように、出力音声データと出力モータデータとの２つのチャネルのサブ出力データを含む場合において、出力音声データのパターンと出力モータデータのパターンとして、いずれも、例えば、100パターンが予想されるとすると、出力データ全体のパターンとしては、出力音声データの100パターンと出力モータデータの100パターンとのすべての組み合わせである10000パターンが予想されることとなる。

この場合、出力ネットワークnet_outは、10000以上といった多数のノードで構成する必要があり、その結果、その出力ネットワークnet_outを含んで構成される入出力関係モデルを記憶する記憶部２１１（図２１）の記憶容量が大となる。さらに、出力ネットワークnet_outでは、上述のような10000パターンもの時系列パターンの学習（自己組織的な学習）を行う必要がある。

そこで、入力データが複数チャネルのサブ入力データを含む場合には、入出力関係モデルは、その複数チャネルの数と同一の数の入力ネットワークを用いて構成することができる。同様に、出力データが複数チャネルのサブ出力データを含む場合には、入出力関係モデルは、その複数チャネルの数と同一の数の出力ネットワークを用いて構成することができる。

即ち、例えば、図２５で説明したように、入力データが、入力音声データと入力画像データとの２つのチャネルのサブ入力データを含み、出力データが、出力音声データと出力モータデータとの２つのチャネルのサブ出力データを含む場合には、入出力関係モデルは、図２６に示すように、入力データに含まれる２つのチャネルのサブ入力データに対応する２つの入力ネットワークnet_in1およびnet_in2と、出力データに含まれる２つのチャネルのサブ出力データに対応する２つの出力ネットワークnet_out1およびnet_out2とから構成することができる。

図２６において、入出力関係モデルは、入力データに含まれる２つのチャネルのサブ入力データのうちの１つのチャネルのサブ入力データである入力音声データに対応する入力ネットワークnet_in1、および他の１つのチャネルのサブ入力データである入力画像データに対応する入力ネットワークnet_in2、並びに、出力データに含まれる２つのチャネルのサブ出力データのうちの１つのチャネルのサブ出力データである出力音声データに対応する出力ネットワークnet_out1、および他の１つのチャネルのサブ出力データである出力モータデータに対応する出力ネットワークnet_out2から構成されている。

この場合、教示データを用いた入出力関係モデルの学習では、教示データにおける入力データのうちの、入力音声データは、その入力音声データ（のチャネル）に対応する入力ネットワークnet_in1に与えられるとともに、入力画像データは、その入力画像データ（のチャネル）に対応する入力ネットワークnet_in2に与えられる。さらに、教示データにおける出力データのうちの、出力音声データは、その出力音声データ（のチャネル）に対応する出力ネットワークnet_out1に与えられるとともに、出力モータデータは、その出力モータデータ（のチャネル）に対応する入力ネットワークnet_out2に与えられる。

そして、入力音声データに基づく入力ネットワークnet_in1の学習、入力画像データに基づく入力ネットワークnet_in2の学習、出力音声データに基づく出力ネットワークnet_out1の学習、および出力モータデータに基づく入力ネットワークnet_out2の学習が行われる。

なお、想定ロボットに入力される入力データに含まれるサブ入力データは、チャネルごとに区別することができることとする。即ち、上述の入力データには、入力音声データと入力画像データとが含まれるが、この入力音声データと入力画像データとは区別することができることとする。同様に、想定ロボットが出力する出力データに含まれるサブ出力データも、チャネルごとに区別することができることとする。

さらに、入力データに含まれるサブ入力データに対応する入力ネットワークは既知であるとし、入出力関係モデルの学習において、サブ入力データは、そのサブ入力データ（のチャネル）に対応する入力ネットワークに与えられることとする。同様に、出力データに含まれるサブ出力データに対応する出力ネットワークも既知であるとし、入出力関係モデルの学習において、サブ出力データは、そのサブ出力データ（のチャネル）に対応する出力ネットワークに与えられることとする。

この場合、入力ネットワークnet_in1の学習は、その入力ネットワークnet_in1に対応するチャネルのサブ入力データである入力音声データに基づいて自己組織的に行うことができ、入力ネットワークnet_in2の学習も、その入力ネットワークnet_in2に対応するチャネルのサブ入力データである入力画像データに基づいて自己組織的に行うことができる。同様に、出力ネットワークnet_out1の学習も、その出力ネットワークnet_out1に対応するチャネルのサブ出力データである出力音声データに基づいて自己組織的に行うことができ、出力ネットワークnet_out2の学習も、その出力ネットワークnet_out2に対応するチャネルのサブ出力データである出力モータデータに基づいて自己組織的に行うことができる。

以上のように、入力データに複数チャネルのサブ入力データが含まれ、または、出力データに複数チャネルのサブ出力データが含まれる場合には、それぞれ、入出力関係モデルを、入力データに含まれるサブ入力データのチャネルの数と同一の数の入力ネットワークで構成し、または、出力データに含まれるサブ出力データのチャネルの数と同一の数の出力ネットワークで構成することにより、入出力関係モデルを、１つの入力ネットワークまたは１つの出力ネットワークで構成する場合に比較して、入力ネットワークまたは出力ネットワークを、少ない数のノードで構成することができ、さらに、入力ネットワークまたは出力ネットワークでも、少ない数の時系列パターンの学習（自己組織的な学習）を行うだけで済む。

即ち、例えば、上述したように、入力データが、入力音声データと入力画像データとの２つのチャネルのサブ入力データを含み、入力音声データのパターンと入力画像データの時系列パターンとして、いずれも、100パターンが予想されるとすると、入力音声データに対応する入力ネットワークnet_in1は、100以上程度の数のノードで構成すれば良く、入力画像データに対応する入力ネットワークnet_in2も、100以上程度の数のノードで構成すれば良い。さらに、入力ネットワークnet_in1およびnet_in2のいずれでも、100パターン程度の時系列パターンの学習を行うだけで済む。

また、例えば、上述したように、出力データが、出力音声データと出力モータデータとの２つのチャネルのサブ出力データを含み、出力音声データのパターンと出力モータデータの時系列パターンとして、いずれも、100パターンが予想されるとすると、出力音声データに対応する出力ネットワークnet_out1は、100以上程度の数のノードで構成すれば良く、出力モータデータに対応する出力ネットワークnet_out2も、100以上程度の数のノードで構成すれば良い。さらに、出力ネットワークnet_out1およびnet_out2のいずれでも、100パターン程度の時系列パターンの学習を行うだけで済む。

従って、入出力関係モデルを記憶する記憶部２１１の記憶容量を小さくすることができ、さらに、入出力関係モデルの学習を、効率的に行うことができる。

次に、入力データに複数としてのm（正の整数）チャネルのサブ入力データが含まれるとともに、出力データにも複数としてのn（正の整数）チャネルのサブ出力データが含まれ、図２６で説明したように、入出力関係モデルを、入力データに含まれるmチャネルのサブ入力データと同一の数であるm個の入力ネットワークと、出力データに含まれるnチャネルのサブ出力データと同一の数であるn個の出力ネットワークとで構成する場合、その入力ネットワークと出力ネットワークとのノードどうしを、どのように結合し、さらに、入出力関係モデルの学習において、ノードの結合重みを、どのように更新するかが問題となる。

そこで、まず、あるチャネルのサブ入力データと、あるチャネルのサブ出力データとの間に関係があることがあらかじめ分かっている（既知である）場合、即ち、例えば、制御対象において、あるチャネルのサブ入力データの入力に対して、あるチャネルのサブ出力データが出力されることが既知である場合の、入力ネットワークと出力ネットワークとのノードどうしの結合について説明する。

なお、あるチャネルのサブ入力データと、あるチャネルのサブ出力データとの間に関係があることがあらかじめ分かっている場合には、例えば、制御対象があるチャネルのサブ入力データに対して、あるチャネルのサブ出力データを出力することがあらかじめ分かっている場合の他、あるチャネルのサブ入力データの入力に対して、あるチャネルのサブ出力データを出力することを、あらかじめ決めておく場合、即ち、例えば、制御対象としての想定ロボットにおいて、あるチャネルのサブ入力データの入力に対して、あるチャネルのサブ出力データを出力させることをあらかじめ決めておく場合も含まれる。

いま、上述の図２５で説明したように、入力データには、２つのチャネルのサブ入力データとしての入力音声データと入力画像データが含まれ、出力データにも、２つのチャネルのサブ出力データとしての出力音声データと出力モータデータが含まれることとする。さらに、図２６で説明したように、入出力関係モデルは、入力データに含まれる２つのチャネルの入力音声データと入力画像データそれぞれに対応する２つの入力ネットワークnet_in1とnet_in2、および出力データに含まれる２つのチャネルの出力音声データと出力モータデータそれぞれに対応する２つの出力ネットワークnet_out1とnet_out2を有することとする。

図２７は、例えば、入力音声データと出力音声データとの間に関係があることと、入力画像データと出力モータデータとの間に関係があることとがあらかじめ分かっている場合（入力音声データと出力モータデータとの間に関係がないことと、入力画像データと出力音声データとの間に関係がないこととがあらかじめ分かっている場合）の入出力関係モデルとその結合重み行列を示している。

即ち、図２７左側は、入力音声データと出力音声データとの間に関係があることと、入力画像データと出力モータデータとの間に関係があることとがあらかじめ分かっている場合の入出力関係モデルを示している。

この場合、入出力関係モデルにおいては、関係があるサブ入力データとサブ出力データにそれぞれ対応する時系列パターン記憶ネットワークのノードどうしのみが結合される。

即ち、図２７左側では、入出力関係モデルにおいて、入力音声データに対応する入力ネットワークnet_in1の入力ノードと、出力音声データに対応する出力ネットワークnet_out1の出力ノードとが結合され、入力画像データに対応する入力ネットワークnet_in2の入力ノードと、出力モータデータに対応する出力ネットワークnet_out2の出力ノードとが結合されている。

なお、図２７では（後述する図３０、図３６、図４０、図４１、および図４３においても同様）、入力ネットワークnet_in1、入力ネットワークnet_in2、出力ネットワークnet_out1、および出力ネットワークnet_out2のノードの数をいずれも８つとしてあるが、入力ネットワークnet_in1、入力ネットワークnet_in2、出力ネットワークnet_out1、出力ネットワークnet_out2それぞれのノードの数は、８つに限定されるものではないし、さらに、同一の数でなくても良い。

図２７右側は、図２７左側の入出力関係モデルについての結合重み行列を示している。

図２７左側の入出力関係モデルでは、上述したように、入力ネットワークnet_in1の入力ノードと、出力音声データに対応する出力ネットワークnet_out1の出力ノードとが結合され、入力画像データに対応する入力ネットワークnet_in2の入力ノードと、出力モータデータに対応する出力ネットワークnet_out2の出力ノードとが結合されている。

結合重み行列は、ノードどうしが結合している時系列パターン記憶ネットワークのセットの数と同一の数だけ存在する。

即ち、図２７右側の上側は、入力ネットワークnet_in1の入力ノードを各行に対応させるとともに、出力ネットワークnet_out1の出力ノードを各列に対応させ、第i行第j列の要素に、入力ネットワークnet_in1のi番目の入力ノードと、出力ネットワークnet_out1のj番目の出力ノードとの結合重みwが配置された結合重み行列MTX₁₁を示している。

また、図２７右側の下側は、入力ネットワークnet_in2の入力ノードを各行に対応させるとともに、出力ネットワークnet_out2の出力ノードを各列に対応させ、第i行第j列の要素に、入力ネットワークnet_in2のi番目の入力ノードと、出力ネットワークnet_out2のj番目の出力ノードとの結合重みwが配置された結合重み行列MTX₂₂を示している。

図２７左側の入出力関係モデルの学習時においては、結合重み更新部２２２（図２１）は、図２７右側の２つの結合重み行列MTX₁₁およびMTX₂₂の各要素である結合重みwを更新する。

そこで、図２８のフローチャートを参照して、図２１のデータ処理装置の記憶部２１１に、図２７左側に示したような入出力関係モデルが記憶されている場合の、その入出力関係モデルの学習について説明する。なお、ここでは、入出力関係モデルは、mチャネル（分）の入力ネットワークと、nチャネル（分）の出力ネットワークとから構成されることとする。

ステップＳ１２１において、入力データと出力データとのセットである教示データが、図２１のデータ処理装置に入力されると、その教示データは、学習部２１２の学習処理部２２１に供給される。

学習処理部２２１は、ステップＳ１２２において、教示データにおける入力データに含まれるmチャネルのサブ入力データを、１チャネルごとのサブ入力データに分割するとともに、教示データにおける出力データに含まれるnチャネルのサブ出力データを、１チャネルごとのサブ出力データに分割する。

そして、ステップＳ１２３において、学習処理部２２１は、記憶部２１１に記憶された入出力関係モデルにおけるm個（チャネル分）の入力ネットワークそれぞれを、入力データの、その入力ネットワークに対応するチャネルのサブ入力データに基づいて自己組織的に更新する。

ここで、入出力関係モデルが、図２７左側で説明したように、入力音声データに対応する入力ネットワークnet_in1と、入力画像データに対応する入力ネットワークnet_in2とを含んで構成され、入力データに、入力音声データと入力画像データが含まれる場合には、ステップＳ１２３では、入出力関係モデルの入力ネットワークnet_in1が、対応するサブ入力データである入力音声データに基づいて自己組織的に更新されるとともに、入出力関係モデルの入力ネットワークnet_in2が、対応するサブ入力データである入力画像データに基づいて自己組織的に更新される。

その後、ステップＳ１２４において、学習処理部２２１は、記憶部２１１に記憶された入出力関係モデルにおけるn個（チャネル分）の出力ネットワークそれぞれを、出力データの、その出力ネットワークに対応するチャネルのサブ出力データに基づいて自己組織的に更新する。

ここで、入出力関係モデルが、図２７左側で説明したように、出力音声データに対応する出力ネットワークnet_out1と、出力モータデータに対応する出力ネットワークnet_out2とを含んで構成され、出力データに、出力音声データと出力モータデータが含まれる場合には、ステップＳ１２４では、入出力関係モデルの出力ネットワークnet_out1が、対応するサブ出力データである出力音声データに基づいて自己組織的に更新されるとともに、入出力関係モデルの出力ネットワークnet_out2が、対応するサブ出力データである出力モータデータに基づいて自己組織的に更新される。

学習処理部２２１は、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとを更新するときに勝者ノードとなったノードそれぞれのノードラベルを、結合重み更新部２２２に供給する。

結合重み更新部２２２は、学習処理部２２１からのノードラベル、即ち、mチャネルの入力ネットワークのそれぞれで勝者ノードとなったノードのノードラベルと、nチャネルの出力ネットワークのそれぞれで勝者ノードとなったノードのノードラベルとを受信し、ステップＳ１２５において、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとのm×nセットのうちの、ノードどうしが結合しているセットの１つを、注目セットとして選択して、ステップＳ１２６に進む。

ステップＳ１２６では、結合重み更新部２２２は、注目セットについての結合重み行列、即ち、注目セットになっている入力ネットワークの入力ノードを各行に対応させるとともに、注目セットになっている出力ネットワークの出力ノードを各列に対応させた結合重み行列の要素になっている結合重みを、学習処理部２２１から供給されたノードラベルが表す勝者ノードに基づき、図２３で説明したように更新する。

即ち、結合重み更新部２２２は、学習処理部２２１から供給されたノードラベルに基づき、注目セットになっている入力ネットワークの勝者ノードと、注目セットになっている出力ネットワークの勝者ノードとを認識する。さらに、結合重み更新部２２２は、上述の式（４）にしたがい、入力ネットワークの勝者ノードを中心として、入力ネットワークの各入力ノードと、出力ネットワークの勝者ノードとの結合重みを更新するとともに、出力ネットワークの勝者ノードを中心として、出力ネットワークの各出力ノードと、入力ネットワークの勝者ノードとの結合重みを更新する。

ここで、図２７左側に示した入出力関係モデルについては、ノードどうしが結合している入力ネットワークnet_in1と出力ネットワークnet_out1とのセットと、入力ネットワークnet_in2と出力ネットワークnet_out2とのセットとが、注目セットとして選択され得る。

そして、入力ネットワークnet_in1と出力ネットワークnet_out1とのセットが、注目セットとして選択された場合には、ステップＳ１２６では、図２７右側の上側に示した結合重み行列MTX₁₁の要素となっている結合重みが更新される。また、入力ネットワークnet_in2と出力ネットワークnet_out2とのセットが、注目セットとして選択された場合には、ステップＳ１２６では、図２７右側の下側に示した結合重み行列MTX₂₂の要素となっている結合重みが更新される。

ステップＳ１２６の処理後は、ステップＳ１２７に進み、結合重み更新部２２２は、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとのm×nセットのうちの、ノードどうしが結合しているセットのすべてについての結合重み行列（の要素となっている結合重み）の更新が終了しかどうかを判定する。

ステップＳ１２７において、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとのm×nセットのうちの、ノードどうしが結合しているセットのすべてについての結合重み行列の更新が、まだ終了していないと判定された場合、即ち、ノードどうしが結合しているセットの中に、まだ、注目セットとして選択されていないものが存在する場合、ステップＳ１２５に戻り、結合重み更新部２２２は、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとのm×nセットのうちの、ノードどうしが結合しているセットの中で、まだ注目セットとして選択していないものの１つを、注目セットとして新たに選択し、以下、同様の処理を繰り返す。

また、ステップＳ１２７において、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとのm×nセットのうちの、ノードどうしが結合しているセットのすべてについての結合重み行列の更新が終了したと判定された場合、ステップＳ１２１に戻り、次の教示データが入力されるのを待って、以下、同様の処理が繰り返される。

多数の教示データが入力され、ステップＳ１２１乃至Ｓ１２７の処理が繰り返されることにより、記憶部２１１に記憶された入出力関係モデルは、制御対象に対応する順モデルとなっていくとともに、逆モデルにもなっていく。

ここで、上述した図２７左側の入出力関係モデルにおいては、１つの入力ネットワークnet_in1のノードが、１つの出力ネットワークnet_out1のノードにのみ結合しており、また、１つの入力ネットワークnet_in2のノードが、１つの出力ネットワークnet_out2のノードにのみ結合している。さらに、１つの出力ネットワークnet_out1のノードも、１つの入力ネットワークnet_in1のノードにのみ結合しており、１つの出力ネットワークnet_out2のノードも、１つの入力ネットワークnet_in2のノードにのみ結合している。

この場合、ノードどうしが結合している入力ネットワークnet_in1と出力ネットワークnet_out1それぞれの学習（自己組織的な更新）、およびその入力ネットワークnet_in1と出力ネットワークnet_out1とのセットについての結合重み行列MTX₁₁（の要素となっている結合重み）の更新と、同じく、ノードどうしが結合している入力ネットワークnet_in2と出力ネットワークnet_out2それぞれの学習、およびその入力ネットワークnet_in2と出力ネットワークnet_out2とのセットについての結合重み行列MTX₂₂の更新とは、独立に行うことができる。

即ち、ノードどうしが結合している入力ネットワークnet_in1と出力ネットワークnet_out1それぞれの学習、およびその入力ネットワークnet_in1と出力ネットワークnet_out1とのセットについての結合重み行列MTX₁₁の更新は、入力データに含まれる入力音声データと、出力データに含まれる出力音声データとのセットだけを与えて行うことができ、それとは独立に、ノードどうしが結合している入力ネットワークnet_in2と出力ネットワークnet_out2それぞれの学習、およびその入力ネットワークnet_in2と出力ネットワークnet_out2とのセットについての結合重み行列MTX₂₂の更新も、入力データに含まれる入力画像データと、出力データに含まれる出力モータデータとのセットだけを与えて行うことができる。

次に、図２９のフローチャートを参照して、図２１のデータ処理装置が、図２８で説明した学習がされた入出力関係モデルを順モデルとして用いて、入力データに対する出力データを推定する処理について説明する。

なお、ここでは、説明を簡単にするために、例えば、mチャネルの入力ネットワークとnチャネルの出力ネットワークを有する入出力関係モデルにおいて、１つの出力ネットワークのノードは、複数の入力ネットワークのノードに結合していることはなく、１つの入力ネットワークのみのノードに結合していることとする。従って、入力ネットワークにおいて、１つの入力ノードが、勝者ノードに決定され、出力ネットワークにおいて、勝者ノードとの結合重みが最も強い出力ノードが決定された場合に、その決定される出力ノードは、各出力ネットワークにおいて１つである。

まず、ステップＳ１３１において、出力データを推定しようとする入力データが、図２１のデータ処理装置に入力される。

データ処理装置に入力された入力データは、認識生成部２１３（図２１）のスコア計算部２３１に供給される。

スコア計算部２３１は、ステップＳ１３２において、入力データに含まれるmチャネルのサブ入力データを、１チャネルごとのサブ入力データに分割して、ステップＳ１３３に進む。

ステップＳ１３３では、スコア計算部２３１は、入力データに含まれるサブ入力データのチャネルごとのスコアを計算する。

即ち、スコア計算部２３１は、ステップＳ１３３において、入力データから分割した、あるチャネルのサブ入力データに対して、記憶部２１１に記憶されている入出力関係モデルにおけるm個の入力ネットワークのうちの、そのサブ入力データに対応する入力ネットワークの各入力ノードのスコアを計算し、勝者ノード決定部２３２に供給する。

さらに、ステップＳ１３３では、スコア計算部２３１は、他のチャネルのサブ入力データに対しても、そのサブ入力データに対応する入力ネットワークの各入力ノードのスコアを計算し、勝者ノード決定部２３２に供給して、ステップＳ１３４に進む。

ステップＳ１３４では、勝者ノード決定部２３２は、あるチャネルのサブ入力データに対応する入力ネットワークの入力ノードのうちの、スコア計算部２３１からのスコアが最も高い入力ノードを、そのチャネルのサブ入力データに最も適合する勝者ノードに決定する。

さらに、ステップＳ１３４では、勝者ノード決定部２３２は、他のチャネルのサブ入力データに対応する入力ネットワークについても、スコア計算部２３１からのスコアが最も高い入力ノードを、そのチャネルのサブ入力データに最も適合する勝者ノードに決定し、m個の入力ネットワークすべてについて、勝者ノードを決定すると、ステップＳ１３５に進む。

ステップＳ１３５では、勝者ノード決定部２３２は、m個の入力ネットワークそれぞれについての勝者ノードの中から、有効な勝者ノード（有効勝者ノード）を決定する。

即ち、勝者ノード決定部２３２は、例えば、m個の入力ネットワークそれぞれについての勝者ノードのスコアを、適当な閾値と比較し、その閾値より高いスコアの勝者ノードを有効勝者ノードに決定する。

ここで、勝者ノードのスコアは、その勝者ノードが有する時系列パターンモデル２１と、スコアの計算の対象となったサブ入力データとの類似性を表す。従って、ある閾値より高いスコアの勝者ノードを有効勝者ノードとすることは、サブ入力データとの類似性がある程度より高い時系列パターンモデル２１を有する勝者ノードのみを、有効勝者ノードとして選択することに相当する。

なお、有効勝者ノードの決定の方法は、上述したような閾値と勝者ノードのスコアとを比較する方法に限定されるものではない。

即ち、例えば、入力ネットワークに対応するサブ入力データについては、前処理として、そのサブ入力データの有効または無効を判定し、有効であると判定されたサブ入力データに対応する入力ネットワークの勝者ノードを、有効勝者ノードに決定することができる。

ここで、前処理として行われるサブ入力データの有効または無効の判定は、サブ入力データが、例えば、音声データである場合には、その音声データのパワーなどに基づき音声区間を検出し、その音声区間に基づいて行うことができる。即ち、例えば、音声区間内のサブ入力データ（音声データ）は、有効であると判定し、音声区間外のサブ入力データは、無効であると判定することができる。

また、サブ入力データが、例えば、画像データである場合には、その画像データであるサブ入力データに映っている物体の色や動きを検出し、その色や動きに基づいて、サブ入力データの有効または無効の判定を行うことができる。即ち、例えば、物体の色が特定の色である場合や、物体が動いている場合には、サブ入力データが有効であると判定し、物体の色が特定の色以外の色である場合や、物体が静止している場合には、サブ入力データが無効であると判定することができる。

なお、例えば、上述したように、サブ入力データが音声データである場合に、音声区間内のサブ入力データ（音声データ）は、有効であると判定することは、そのサブ入力データが、無音ではない、いわば有意な音声の音声データであると判定することに相当する。そして、ここでは、有効であると判定されたサブ入力データに対応する入力ネットワークの勝者ノードが、有効勝者ノードに決定されることから、有効勝者ノードの決定は、その有効勝者ノードを勝者ノードとして有する入力ネットワークに対応するチャネルのサブ入力データが有意であることを決定することに相当する。

勝者ノード決定部２３２は、ステップＳ１３５において、最小が0個で、最大がm個の有効勝者ノードを決定する。有効勝者ノードの個数が0個である場合には、認識生成部２１３（図２１）は、処理を終了する。

また、有効勝者ノードの個数が1個以上である場合には、勝者ノード決定部２３２は、その1個以上の有効勝者ノードを表すノードラベルを、生成ノード決定部２３３に供給して、ステップＳ１３６に進む。

生成ノード決定部２３３は、ステップＳ１３６において、記憶部２１１に記憶された入出力関係モデルを構成するn個の出力ネットワークの出力ノードの中で、勝者ノード決定部２３２からのノードラベルが表す1個以上の有効勝者ノードそれぞれとの結合重みが最も強い出力ノードを生成ノードとして決定する。従って、1個以上の有効勝者ノードと同一の数の出力ノードが生成ノードとして決定される。

さらに、生成ノード決定部２３３は、1個以上の生成ノードそれぞれを表すノードラベルを、時系列生成部２３４に供給して、ステップＳ１３６からステップＳ１３７に進む。

時系列生成部２３４は、ステップＳ１３７において、記憶部２１１に記憶された入出力関係モデルを構成する出力ネットワークの出力ノードのうちの、生成ノード決定部２３３からのノードラベルが表す1個以上の生成ノードそれぞれが有する時系列パターンモデル２１（図７）に基づいて、認識生成部２１３に供給された入力データに対する出力データの推定値としての時系列データを生成して、ステップＳ１３８に進み、その時系列データを出力する。

以上のように、n個の出力ネットワークの出力ノードのうちの、1以上の有効勝者ノードそれぞれとの結合重みが最も強い1以上の出力ノードが、生成ノードに決定され、その1個以上の生成ノードそれぞれが有する時系列パターンモデル２１に基づき、出力データとしての1チャネル以上の時系列データが生成される。

従って、入出力関係モデルが、例えば、図２７左側で説明したように、入力音声データに対応する入力ネットワークnet_in1、入力画像データに対応する入力ネットワークnet_in2、出力音声データに対応する出力ネットワークnet_out1、および出力モータデータに対応する出力ネットワークnet_out2とを含んで構成され、入力ネットワークnet_in1と出力ネットワークnet_out1と（のノードどうし）が結合し、かつ、入力ネットワークnet_in2と出力ネットワークnet_out2とが結合している場合において、入力ネットワークnet_in1の勝者ノードのみが、有効勝者ノードに決定されたときには、その有効勝者ノードとの結合重みが最も強い、出力ネットワークnet_out1の出力ノードが、生成ノードに決定される。そして、その生成ノードが有する時系列パターンモデル２１に基づき、出力音声データが生成され、その出力音声データを1つのチャネルのサブ出力データとして含む出力データが出力される。なお、この場合、出力データに含まれる他の1つのチャネルのサブ出力データとしての出力モータデータは、例えば、上述したように、アームを移動させないことを表すデータ（時系列データ）とされる。

また、入力ネットワークnet_in2の勝者ノードのみが、有効勝者ノードに決定されたときには、その有効勝者ノードとの結合重みが最も強い、出力ネットワークnet_out2の出力ノードが、生成ノードに決定される。そして、その生成ノードが有する時系列パターンモデル２１に基づき、出力モータデータが生成され、その出力モータデータを1つのチャネルのサブ出力データとして含む出力データが出力される。なお、この場合、出力データに含まれる他の1つのチャネルのサブ出力データとしての出力音声データは、例えば、上述したように、音声を出力しないことを表すデータ（時系列データ）とされる。

さらに、入力ネットワークnet_in1とnet_in2の両方の勝者ノードが、有効勝者ノードに決定されたときには、入力ネットワークnet_in1の有効勝者ノードとの結合重みが最も強い、出力ネットワークnet_out1の出力ノードが、生成ノードに決定されるとともに、入力ネットワークnet_in2の有効勝者ノードとの結合重みが最も強い、出力ネットワークnet_out2の出力ノードが、生成ノードに決定される。そして、出力ネットワークnet_out1の生成ノードが有する時系列パターンモデル２１に基づき、出力音声データが生成されるとともに、出力ネットワークnet_out2の生成ノードが有する時系列パターンモデル２１に基づき、出力モータデータが生成され、その出力音声データと出力モータデータを、それぞれサブ出力データとして含む出力データが出力される。

その結果、図２７左側の入出力関係モデルを順モデルとして適用したロボットにおいては、入力データに対して、音声が出力され、または、アームが移動され、あるいは、音声が出力されるとともに、アームが移動される。

なお、上述したように、入出力関係モデルは逆モデルとしても使用することができ、この場合、出力データに対する入力データ（制御データ）を推定する処理を行うことができる。出力データに対する入力データを推定する処理は、上述の図２９の説明において、「入力」を「出力」に読み替えるとともに、「出力」を「入力」に読み替えた説明となるので、その説明は、省略する。

次に、入力データのサブ入力データと、出力データのサブ出力データとの間に関係があることが、あらかじめ分かっていない（未知である）場合、つまり、入力データのあるチャネルのサブ入力データと、出力データのあるチャネルのサブ出力データとの間に関係があるかどうかが不明である場合の、入力ネットワークと出力ネットワークとのノードどうしの結合について説明する。

なお、ここでも、上述の図２５で説明したように、入力データには、２つのチャネルのサブ入力データとしての入力音声データと入力画像データが含まれ、出力データにも、２つのチャネルのサブ出力データとしての出力音声データと出力モータデータが含まれることとする。さらに、図２６で説明したように、入出力関係モデルは、入力データに含まれる２つのチャネルの入力音声データと入力画像データそれぞれに対応する２つの入力ネットワークnet_in1とnet_in2、および出力データに含まれる２つのチャネルの出力音声データと出力モータデータそれぞれに対応する２つの出力ネットワークnet_out1とnet_out2を有することとする。

図３０は、入力音声データと出力音声データまたは出力モータデータとの間に関係があるかどうか、さらには、入力画像データと出力音声データまたは出力モータデータとの間に関係があるかどうかが不明である場合の入出力関係モデルとその結合重み行列を示している。

即ち、図３０左側は、入力音声データと出力音声データまたは出力モータデータとの間に関係があるかどうか、さらには、入力画像データと出力音声データまたは出力モータデータとの間に関係があるかどうかが不明である場合の入出力関係モデルを示している。

この場合、入出力関係モデルにおいては、入力ネットワークのノードは、すべての出力ネットワークのノードと結合され、出力ネットワークのノードも、すべての入力ネットワークのノードと結合される。

即ち、図３０左側では、入出力関係モデルにおいて、入力音声データに対応する入力ネットワークnet_in1の入力ノードと、出力音声データに対応する出力ネットワークnet_out1の出力ノードとが結合され、入力音声データに対応する入力ネットワークnet_in1の入力ノードと、出力モータデータに対応する出力ネットワークnet_out2の出力ノードとが結合されている。さらに、入力画像データに対応する入力ネットワークnet_in2の入力ノードと、出力音声データに対応する出力ネットワークnet_out1の出力ノードとが結合され、入力画像データに対応する入力ネットワークnet_in2の入力ノードと、出力モータデータに対応する出力ネットワークnet_out2の出力ノードとが結合されている。

図３０右側は、図３０左側の入出力関係モデルについての結合重み行列を示している。

図３０左側の入出力関係モデルでは、上述したように、入力ネットワークnet_in1の入力ノードと、出力音声データに対応する出力ネットワークnet_out1の出力ノードとが結合され、入力画像データに対応する入力ネットワークnet_in2の入力ノードと、出力モータデータに対応する出力ネットワークnet_out2の出力ノードとが結合されている。さらに、入力ネットワークnet_in1の入力ノードと、出力モータデータに対応する出力ネットワークnet_out2の出力ノードとが結合され、入力画像データに対応する入力ネットワークnet_in2の入力ノードと、出力音声データに対応する出力ネットワークnet_out1の出力ノードとが結合されている。

即ち、図３０右側の左上側は、入力ネットワークnet_in1の入力ノードを各行に対応させるとともに、出力ネットワークnet_out1の出力ノードを各列に対応させ、第i行第j列の要素に、入力ネットワークnet_in1のi番目の入力ノードと、出力ネットワークnet_out1のj番目の出力ノードとの結合重みwが配置された結合重み行列MTX₁₁を示している。

さらに、図３０右側の右上側は、入力ネットワークnet_in1の入力ノードを各行に対応させるとともに、出力ネットワークnet_out2の出力ノードを各列に対応させ、第i行第j列の要素に、入力ネットワークnet_in1のi番目の入力ノードと、出力ネットワークnet_out2のj番目の出力ノードとの結合重みwが配置された結合重み行列MTX₁₂を示している。

また、図３０右側の左下側は、入力ネットワークnet_in2の入力ノードを各行に対応させるとともに、出力ネットワークnet_out1の出力ノードを各列に対応させ、第i行第j列の要素に、入力ネットワークnet_in2のi番目の入力ノードと、出力ネットワークnet_out1のj番目の出力ノードとの結合重みwが配置された結合重み行列MTX₂₁を示している。

さらに、図３０右側の右下側は、入力ネットワークnet_in2の入力ノードを各行に対応させるとともに、出力ネットワークnet_out2の出力ノードを各列に対応させ、第i行第j列の要素に、入力ネットワークnet_in2のi番目の入力ノードと、出力ネットワークnet_out2のj番目の出力ノードとの結合重みwが配置された結合重み行列MTX₂₂を示している。

図３０左側の入出力関係モデルの学習時においては、結合重み更新部２２２（図２１）は、図３０右側の４つの結合重み行列MTX₁₁,MTX₁₂,MTX₂₁、およびMTX₂₂の各要素である結合重みwを更新する。

ここで、例えば、図２７乃至図２９で説明したように、入力音声データと出力音声データとの間に関係があること、および入力画像データと出力モータデータとの間に関係があることが、あらかじめ分かっている場合、つまり、制御対象において、入力音声データに対応して、出力音声データが出力される（出力モータデータは出力されない）こと、および、入力画像データに対応して出力モータデータが出力される（出力音声データは出力されない）ことが、あらかじめ分かっている場合には、入出力関係モデルの学習において、関係があるサブ入力データとサブ出力データとの組み合わせの数だけの更新重み行列について、結合重みの更新を行えばよい。

つまり、図２７乃至図２９で説明したように、入力音声データと出力音声データとの間に関係があること、および入力画像データと出力モータデータとの間に関係があることが、あらかじめ分かっている場合には、関係がある入力音声データと出力音声データとの組み合わせに対応する更新重み行列MTX₁₁と、関係がある入力画像データと出力モータデータとの組み合わせに対応する更新重み行列MTX₂₂との２つの更新重み行列、即ち、入力音声データに対応する入力ネットワークnet_in1の入力ノードを各行に対応させるとともに、出力音声データに対応する出力ネットワークnet_out1の出力ノードを各列に対応させ、第i行第j列の要素に、入力ネットワークnet_in1のi番目の入力ノードと、出力ネットワークnet_out1のj番目の出力ノードとの結合重みwを配置した結合重み行列MTX₁₁（図２７）と、入力画像データに対応する入力ネットワークnet_in2の入力ノードを各行に対応させるとともに、出力モータデータに対応する出力ネットワークnet_out2の出力ノードを各列に対応させ、第i行第j列の要素に、入力ネットワークnet_in2のi番目の入力ノードと、出力ネットワークnet_out2のj番目の出力ノードとの結合重みwを配置した結合重み行列MTX₂₂（図２７）とについて、結合重みの更新を行えばよい。

一方、関係があるサブ入力データとサブ出力データが、あらかじめ分かっていない場合、即ち、例えば、制御対象において、入力音声データに対応して、出力音声データまたは出力モータデータのいずれ（両方も含む）が出力されるのかが分からず、また、入力画像データに対応して、やはり、出力音声データまたは出力モータデータのいずれが出力されるのかが分からない場合には、入出力関係モデルの学習において、入力データに含まれる各サブ入力データと、出力データに含まれる各サブ出力データとのすべての組み合わせの数だけの更新重み行列について、結合重みの更新を行う必要がある。

従って、図３０左側の入出力関係モデルの学習時においては、図３０右側に示した４つの結合重み行列MTX₁₁,MTX₁₂,MTX₂₁、およびMTX₂₂（の要素である結合重み）が更新される。

そして、入出力関係モデルを構成する入力ネットワークおよび出力ネットワークの学習が進むと、入力ノードが有する時系列パターンモデル２１が、ある特定の時系列パターンを表現し、また、出力ノードが有する時系列パターンモデル２１も、他の特定の時系列パターンを表現するようになる。

その結果、ある特定の時系列パターンの入力データと、他の特定の時系列パターンの出力データとの間に、何らかの関係性がある場合、そのような入力データと出力データとのセット（教示データ）が与えられると、入力ネットワークにおいてある特定の時系列パターンを表現する時系列パターンモデル２１を有する入力ノードが勝者ノードとなるとともに、出力ネットワークにおいて他の特定の時系列パターンを表現する時系列パターンモデル２１を有する出力ノードが勝者ノードとなる。

さらに、上述したように、入力ネットワークの勝者ノードを中心として、入力ネットワークの各入力ノードと、出力ネットワークの勝者ノードとの結合重みが更新されるとともに、出力ネットワークの勝者ノードを中心として、出力ネットワークの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みが更新される。

即ち、入力ネットワークの各入力ノードと、出力ネットワークの勝者ノードとの結合重みは、入力ネットワークの勝者ノードとのパターン間距離dが近い入力ノードほど強くなる（強化する）ように更新される。また、出力ネットワークの各出力ノードと、入力ネットワークの勝者ノードとの結合重みも、出力ネットワークの勝者ノードとのパターン間距離dが近い出力ノードほど強くなるように更新される。

逆に言えば、入力ネットワークの各入力ノードと、出力ネットワークの勝者ノードとの結合重みは、入力ネットワークの勝者ノードとのパターン間距離dが遠い入力ノードほど弱くなる（弱化する）ように更新される。また、出力ネットワークの各出力ノードと、入力ネットワークの勝者ノードとの結合重みも、出力ネットワークの勝者ノードとのパターン間距離dが遠い出力ノードほど弱くなるように更新される。

ここで、図３１は、入出力関係モデルのある時系列パターン記憶ネットワークのノードの結合重みを示している。

即ち、いま、入出力関係モデルを構成する、ノードどうしが結合されているある入力ネットワークと出力ネットワークに注目し、それぞれを、注目入力ネットワークと注目出力ネットワークと呼ぶ。さらに、ある時系列パターンを、時系列パターンPAと呼び、他の時系列パターンを、時系列パターンPBと呼ぶ。

図３１は、注目入力ネットワークnet_inのある入力ノードに注目し、その注目ノードと、注目出力ネットワークの各出力ノードとの結合重みを示している。

なお、図３１において、横軸は、注目出力ネットワークの各出力ノード（のノードラベル）を表し、縦軸は、各出力ノードについての（注目ノードとの）結合重みを表す。また、横軸において、パターン間距離dが近い出力ノードどうしは、そのパターン間距離dに応じて近い位置に配置されている。

いま、注目ノードが有する時系列パターンモデル２１（図７）が時系列パターンPAを表現し、注目出力ネットワークのある出力ノードが有する時系列パターンモデル２１が時系列パターンPBを表現するとする。

また、教示データにおける入力データに含まれるあるサブ入力データS_inは、注目入力ネットワークに対応し、その教示データにおける出力データに含まれるあるサブ出力データS_outは、注目出力ネットワークに対応することとする。

入出力関係モデルの学習において、時系列パターンPAに属する時系列データをサブ入力データS_inとするとともに、時系列パターンPBに属する時系列データをサブ出力データS_outとする多数の教示データが与えられると、その多数の教示データに対して、注目入力ネットワークでは、時系列パターンPAを表現する時系列パターンモデル２１を有する注目ノードが勝者ノードとなり、注目出力ネットワークでは、時系列パターンPBを表現する時系列パターンモデル２１を有する出力ノードが勝者ノードとなるから、その出力ノードと注目ノードとの結合重みは、強化されていく。

さらに、いま、時系列パターンPBを表現する時系列パターンモデル２１を有する出力ノードを、出力ノードN_PBと呼ぶこととすると、注目出力ネットワークの各出力ノードについての結合重みは、出力ノードN_PBとのパターン間距離dが遠い出力ノードほど弱化される。

その結果、注目出力ネットワークの各出力ノードについての結合重みは、図３１左側に示すように、出力ノードN_PBについての結合重みを最大値として、出力ノードN_PBとのパターン間距離dが遠い出力ノードについての結合重みほど、小さくなっていく。

一方、例えば、多数の教示データにおけるサブ出力データS_outが、時系列パターンPBに属する時系列データであったり、その他の時系列パターンに属する時系列データであったりといった、様々な時系列パターンに属する時系列データであると、その多数の教示データに対して、注目入力ネットワークでは、時系列パターンPAを表現する時系列パターンモデル２１を有する注目ノードは勝者ノードとなるが、注目出力ネットワークでは、出力ノードN_PBの他、様々な出力ノードが勝者ノードとなる。

この場合、注目出力ネットワークの各ノードと注目ノードとの結合重みは、注目出力ネットワークの特定の出力ノードについてだけ強化されることにはならず、その結果、図３１右側に示すように、注目出力ネットワークの出力ノードのいずれについても小さくなる。

注目出力ネットワークのある出力ノードに注目し、その出力ノードと、注目入力ネットワークの各入力ノードとの結合重みも、上述の場合と同様となる。

以上のように、注目入力ネットワークのノードと、注目出力ネットワークのノードとの結合重みには、教示データにおけるサブ入力データS_inとサブ出力データS_outとの関係が反映される。

即ち、時系列パターンPAに属する時系列データをサブ入力データS_inとするとともに、時系列パターンPBに属する時系列データをサブ出力データS_outとする多数の教示データが与えられた場合、つまり、制御対象において、時系列パターンPAに属する時系列データが、サブ入力データS_inとして入力されたときに、時系列パターンPBに属する時系列データが、サブ出力データS_outとして観測される頻度が高く、従って、サブ入力データS_inとサブ出力データS_outとに関係がある場合（何らかの相関がある場合）、注目出力ネットワークの各出力ノードと注目入力ネットワークの特定の入力ノード（注目ノード）との結合重みは、図３１左側に示したように、注目出力ネットワークの特定の出力ノードN_PBについての結合重みを最大値として、その特定の出力ノードN_PBとのパターン間距離dが遠い出力ノードについての結合重みほど、小さくなっていく。同様に、注目入力ネットワークの各入力ノードと注目出力ネットワークの特定の出力ノードとの結合重みも、注目入力ネットワークの特定の入力ノードについての結合重みを最大値として、その特定の入力ノードとのパターン間距離dが遠い入力ノードについての結合重みほど、小さくなっていく。

一方、時系列パターンPAに属する時系列データをサブ入力データS_inとするとともに、各種の時系列パターンに属する時系列データをサブ出力データS_outとする多数の教示データが与えられた場合、つまり、制御対象において、時系列パターンPAに属する時系列データが、サブ入力データS_inとして入力されたときに、様々な時系列パターンの時系列データが、サブ出力データS_outとして観測され、従って、サブ入力データS_inとサブ出力データS_outとに関係がない場合（相関がない、あるいは相関が低い場合）、注目出力ネットワークの各出力ノードと注目入力ネットワークの特定の入力ノードとの結合重みは、図３１右側に示したように、注目出力ネットワークの出力ノードのすべてについて、一様に小さくなる。同様に、注目入力ネットワークの各入力ノードと注目出力ネットワークの特定の出力ノードとの結合重みも、注目入力ネットワークの入力ノードのすべてについて、一様に小さくなる。

従って、入出力関係モデルの学習時において、例えば、入力音声データと出力音声データとの間、および入力画像データと出力モータデータとの間には相関があり、入力音声データと出力モータデータとの間、および入力画像データと出力音声データとの間には相関がない多数の教示データが与えられた場合、入力音声データに対応する入力ネットワークnet_in1の入力ノードを各行に対応させるとともに、その入力音声データと相関がある出力音声データに対応する出力ネットワークnet_out1の出力ノードを各列に対応させた結合重み行列MTX₁₁（図３０）には、入力音声データと出力音声データとの相関が反映され、その結果、入力ネットワークnet_in1の各入力ノードについては、出力ネットワークnet_out1の特定の出力ノードとの結合重みが、他の出力ノードに比較して強く、かつ、出力ネットワークnet_out1の各出力ノードについても、入力ネットワークnet_in1の特定の入力ノードとの結合重みが、他の入力ノードに比較して強い結合重み行列MTX₁₁が得られる。

同様に、入力画像データに対応する入力ネットワークnet_in2の入力ノードを各行に対応させるとともに、その入力画像データと相関がある出力モータデータに対応する出力ネットワークnet_out2の出力ノードを各列に対応させた結合重み行列MTX₂₂（図３０）にも、入力画像データと出力モータデータとの相関が反映され、その結果、入力ネットワークnet_in2の各入力ノードについては、出力ネットワークnet_out2の特定の出力ノードとの結合重みが、他の出力ノードに比較して強く、かつ、出力ネットワークnet_out2の各出力ノードについても、入力ネットワークnet_in2の特定の入力ノードとの結合重みが、他の入力ノードに比較して強い結合重み行列MTX₂₂が得られる。

一方、入力音声データに対応する入力ネットワークnet_in1の入力ノードを各行に対応させるとともに、その入力音声データと相関がない出力モータデータに対応する出力ネットワークnet_out2の出力ノードを各列に対応させた結合重み行列MTX₁₂（図３０）には、入力音声データと出力モータデータとの相関の小ささが反映され、その結果、入力ネットワークnet_in1の各入力ノードについては、出力ネットワークnet_out2のどの出力ノードとの結合重みも一様に低く、かつ、出力ネットワークnet_out2の各出力ノードについても、入力ネットワークnet_in1のどの入力ノードとの結合重みも一様に低い結合重み行列MTX₁₂が得られる。

同様に、入力画像データに対応する入力ネットワークnet_in2の入力ノードを各行に対応させるとともに、その入力画像データと相関がない出力音声データに対応する出力ネットワークnet_out1の出力ノードを各列に対応させた結合重み行列MTX₂₁（図３０）には、やはり、入力画像データと出力音声データとの相関の小ささが反映され、その結果、入力ネットワークnet_in2の各入力ノードについては、出力ネットワークnet_out1のどの出力ノードとの結合重みも一様に低く、かつ、出力ネットワークnet_out1の各出力ノードについても、入力ネットワークnet_in2のどの入力ノードとの結合重みも一様に低い結合重み行列MTX₂₁が得られる。

また、例えば、入出力関係モデルの学習時において、例えば、入力音声データと出力音声データとの間、入力音声データと出力モータデータとの間、入力画像データと出力音声データとの間、および入力画像データと出力モータデータとの間のすべてについて、相関がある多数の教示データが与えられた場合、結合重み行列MTX₁₁,MTX₁₂,MTX₂₁、およびMTX₂₂（図３０）には、いずれも、対応する相関が反映される。

その結果、結合重み行列MTX₁₁（図３０）では、入力ネットワークnet_in1の各入力ノードについては、出力ネットワークnet_out1の特定の出力ノードとの結合重みが、他の出力ノードに比較して強くなり、かつ、出力ネットワークnet_out1の各出力ノードについても、入力ネットワークnet_in1の特定の入力ノードとの結合重みが、他の入力ノードに比較して強くなる。他の結合重み行列MTX₁₂,MTX₂₁、およびMTX₂₂でも、同様である。

以上のように、結合重み行列は、教示データにおけるサブ入力データとサブ出力データとの相関を反映するように、柔軟に更新される。

ここで、以下、適宜、サブ入力データとサブ出力データとを区別することなく、サブデータという。さらに、以下、適宜、あるサブデータに対応する時系列パターン記憶ネットワークnet₁のノードを各行に対応させるとともに、他のサブデータに対応する時系列パターン記憶ネットワークnet₂のノードを各列に対応させた結合重み行列を、時系列パターン記憶ネットワークnet₁と時系列パターン記憶ネットワークnet₂との間の結合重み行列という。

次に、図３２のフローチャートを参照して、図２１のデータ処理装置の記憶部２１１に、図３０左側に示したような入出力関係モデルが記憶されている場合の、その入出力関係モデルの学習について説明する。なお、ここでも、入出力関係モデルは、mチャネル（分）の入力ネットワークと、nチャネル（分）の出力ネットワークとから構成されることとする。

ステップＳ１４１乃至Ｓ１４４において、図２８のステップＳ１２１乃至Ｓ１２４とそれぞれ同様の処理が行われる。

即ち、ステップＳ１４１において、入力データと出力データとのセットである教示データが、図２１のデータ処理装置に入力されると、その教示データは、学習部２１２の学習処理部２２１に供給される。

学習処理部２２１は、ステップＳ１４２において、教示データにおける入力データに含まれるmチャネルのサブ入力データを、１チャネルごとのサブ入力データに分割するとともに、教示データにおける出力データに含まれるnチャネルのサブ出力データを、１チャネルごとのサブ出力データに分割する。

そして、ステップＳ１４３において、学習処理部２２１は、記憶部２１１に記憶された入出力関係モデルにおけるm個（チャネル分）の入力ネットワークそれぞれを、入力データの、その入力ネットワークに対応するチャネルのサブ入力データに基づいて自己組織的に更新する。

ここで、入出力関係モデルが、図３０左側で説明したように、入力音声データに対応する入力ネットワークnet_in1と、入力画像データに対応する入力ネットワークnet_in2とを含んで構成され、入力データに、入力音声データと入力画像データが含まれる場合には、ステップＳ１４３では、入出力関係モデルの入力ネットワークnet_in1が、対応するサブ入力データである入力音声データに基づいて自己組織的に更新されるとともに、入出力関係モデルの入力ネットワークnet_in2が、対応するサブ入力データである入力画像データに基づいて自己組織的に更新される。

その後、ステップＳ１４４において、学習処理部２２１は、記憶部２１１に記憶された入出力関係モデルにおけるn個（チャネル分）の出力ネットワークそれぞれを、出力データの、その出力ネットワークに対応するチャネルのサブ出力データに基づいて自己組織的に更新する。

ここで、入出力関係モデルが、図３０左側で説明したように、出力音声データに対応する出力ネットワークnet_out1と、出力モータデータに対応する出力ネットワークnet_out2とを含んで構成され、出力データに、出力音声データと出力モータデータが含まれる場合には、ステップＳ１４４では、入出力関係モデルの出力ネットワークnet_out1が、対応するサブ出力データである出力音声データに基づいて自己組織的に更新されるとともに、入出力関係モデルの出力ネットワークnet_out2が、対応するサブ出力データである出力モータデータに基づいて自己組織的に更新される。

結合重み更新部２２２は、学習処理部２２１からのノードラベル、即ち、mチャネルの入力ネットワークのそれぞれで勝者ノードとなったノードのノードラベルと、nチャネルの出力ネットワークのそれぞれで勝者ノードとなったノードのノードラベルとを受信し、ステップＳ１４５において、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとのm×nセットのうちの、ノードどうしが結合しているセットの１つを、注目セットとして選択して、ステップＳ１４６に進む。

ここで、いまの場合、図３０左側に示したように、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとのm×nセットについては、すべて、ノードどうしが結合している。従って、ステップＳ１４５では、そのm×nセットが、順次、注目セットとして選択される。

ステップＳ１４６では、結合重み更新部２２２は、注目セットについての結合重み行列、即ち、注目セットになっている入力ネットワークと出力ネットワークとの間の結合重み行列の要素になっている結合重みを、学習処理部２２１から供給されたノードラベルが表す勝者ノードに基づき、図２３で説明したように更新する。

ここで、図３０左側に示した入出力関係モデルについては、入力ネットワークnet_in1と出力ネットワークnet_out1とのセット、入力ネットワークnet_in1と出力ネットワークnet_out2とのセット、入力ネットワークnet_in2と出力ネットワークnet_out1とのセット、および入力ネットワークnet_in2と出力ネットワークnet_out2とのセットの４セットが、注目セットとして選択され得る。

そして、入力ネットワークnet_in1と出力ネットワークnet_out1とのセットが、注目セットとして選択された場合には、ステップＳ１４６では、図３０右側の左上側に示した結合重み行列MTX₁₁の要素となっている結合重みが更新される。また、入力ネットワークnet_in1と出力ネットワークnet_out2とのセットが、注目セットとして選択された場合には、ステップＳ１４６では、図３０右側の右上側に示した結合重み行列MTX₁₂の要素となっている結合重みが更新され、入力ネットワークnet_in2と出力ネットワークnet_out1とのセットが、注目セットとして選択された場合には、ステップＳ１４６では、図３０右側の左下側に示した結合重み行列MTX₂₁の要素となっている結合重みが更新される。さらに、入力ネットワークnet_in2と出力ネットワークnet_out2とのセットが、注目セットとして選択された場合には、ステップＳ１４６では、図３０右側の右下側に示した結合重み行列MTX₂₂の要素となっている結合重みが更新される。

ステップＳ１４６の処理後は、ステップＳ１４７に進み、結合重み更新部２２２は、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとのm×nセットのうちの、ノードどうしが結合しているセット、即ち、ここでは、そのm×nセットのすべてについての結合重み行列（の要素となっている結合重み）の更新が終了しかどうかを判定する。

ステップＳ１４７において、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとのm×nセットのすべてについての結合重み行列の更新が、まだ終了していないと判定された場合、即ち、m×nセットの中に、まだ、注目セットとして選択されていないものが存在する場合、ステップＳ１４５に戻り、結合重み更新部２２２は、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとのm×nセットの中で、まだ注目セットとして選択していないものの１つを、注目セットとして新たに選択し、以下、同様の処理を繰り返す。

また、ステップＳ１４７において、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとのm×nセットのすべてについての結合重み行列の更新が終了したと判定された場合、ステップＳ１４１に戻り、次の教示データが入力されるのを待って、以下、同様の処理が繰り返される。

以上のように、入出力関係モデルを構成するmチャネルの入力ネットワークそれぞれのノードと、その入出力関係モデルを構成するnチャネルの出力ネットワークそれぞれのノードとを結合し、入力ネットワークと出力ネットワークとのm×nセットのすべてについての結合重み行列を更新することにより、自由度の高い入出力関係モデルの学習を行うことができる。

その結果、例えば、ある音声データの入力に対して、音声データを出力し、他の音声データの入力に対して、モータデータを出力し、さらに他の音声データの入力に対して、音声データとモータデータの両方を出力する入出力関係モデルや、ある画像データの入力に対して、音声データを出力し、他の画像データの入力に対して、モータデータを出力し、さらに他の画像データの入力に対して、音声データとモータデータの両方を出力する入出力関係モデルなどを獲得することができる。

なお、入出力関係モデルの学習時において、例えば、入力音声データと出力音声データとの間、および入力画像データと出力モータデータとの間には相関があり、入力音声データと出力モータデータとの間、および入力画像データと出力音声データとの間には相関がない多数の教示データを、図２７左側の入出力関係モデルと、図３０左側の入出力関係モデルとに、それぞれ与えて学習を行った場合、図２７左側の入出力関係モデルで得られる結合重み行列MTX₁₁（図２７右側の上側）と、図３０左側の入出力関係モデルで得られる結合重み行列MTX₁₁（図３０右側の左上側）は、同様の結合重み行列となる。図２７左側の入出力関係モデルで得られる結合重み行列MTX₂₂（図２７右側の下側）と、図３０左側の入出力関係モデルで得られる結合重み行列MTX₂₂（図３０右側の右下側）も、同様の結合重み行列となる。

次に、図３３のフローチャートを参照して、図２１のデータ処理装置が、図３２で説明したように学習がされた図３０左側に示したような入出力関係モデルを用いて、入力データに対する出力データを推定する処理について説明する。なお、ここでも、入出力関係モデルは、mチャネル（分）の入力ネットワークと、nチャネル（分）の出力ネットワークとから構成されることとする。

ステップＳ１５１乃至Ｓ１５５において、図２９のステップＳ１３１乃至Ｓ１３５とそれぞれ同様の処理が行われる。

そして、ステップＳ１５５において、認識生成部２１３（図２１）の勝者ノード決定部２３２が、図２９のステップＳ１３５と同様にして、m個の入力ネットワークそれぞれについての勝者ノードの中から、有効勝者ノードを決定し、その有効勝者ノードの個数が0個である場合には、認識生成部２１３（図２１）は、処理を終了する。

また、有効勝者ノードの個数が1個以上である場合には、勝者ノード決定部２３２は、その1個以上の有効勝者ノードを表すノードラベルを、生成ノード決定部２３３に供給して、ステップＳ１５５からステップＳ１５６に進む。

ステップＳ１５６では、生成ノード決定部２３３は、勝者ノード決定部２３２からの1個以上のノードラベルに基づき、生成ノードの候補となる候補ノードを決定する。

即ち、生成ノード決定部２３３は、勝者ノード決定部２３２からの1個以上のノードラベルのうちの１つを、注目ノードラベルとして選択するとともに、入出力関係モデルのnチャネルの出力ネットワークのうちの１つを、注目出力ネットワークとして選択する。さらに、生成ノード決定部２３３は、注目出力ネットワークのノードの中で、注目ノードラベルが表す有効勝者ノードとの結合重みが最も強い出力ノードを、候補ノードに決定する。

生成ノード決定部２３３は、nチャネルの出力ネットワークを、順次、注目出力ネットワークとして選択し、上述したように、候補ノードを決定する。

さらに、生成ノード決定部２３３は、勝者ノード決定部２３２からの1個以上のノードラベルを、順次、注目ノードラベルとして選択し、勝者ノード決定部２３２からの１個以上のノードラベルそれぞれについて、上述したように、候補ノードを決定する。

従って、この場合、１つの有効勝者ノードに対して、１以上の候補ノードが決定される。

即ち、例えば、図３０左側の入出力関係モデルにおいて、入力音声データに対応する入力ネットワークnet_in1のある入力ノードN_iが、有効勝者ノードとなっている場合、その有効勝者ノードN_iに対しては、出力音声データに対応する出力ネットワークnet_out1のノードの中で、有効勝者ノードN_iとの結合重みが最強の出力ノードと、出力モータデータに対応する出力ネットワークnet_out2のノードの中で、有効勝者ノードN_iとの結合重みが最強の出力ノードとが、候補ノードに決定される。

また、例えば、図３０左側の入出力関係モデルにおいて、入力画像データに対応する入力ネットワークnet_in2のある入力ノードN_iが、有効勝者ノードとなっている場合、その有効勝者ノードN_iに対しても、出力音声データに対応する出力ネットワークnet_out1のノードの中で、有効勝者ノードN_iとの結合重みが最強の出力ノードと、出力モータデータに対応する出力ネットワークnet_out2のノードの中で、有効勝者ノードN_iとの結合重みが最強の出力ノードとが、候補ノードに決定される。

従って、ある１つの出力ネットワークに注目した場合、その出力ネットワークの複数の出力ノードが、候補ノードに決定されることがあり得る。

そこで、生成ノード決定部２３３は、１つの出力ネットワークについて、多くとも１つの生成ノードを決定するために、ステップＳ１５６において候補ノードが決定された後は、ステップＳ１５７に進み、複数の候補ノードが存在する出力ネットワークについて、その複数の候補ノードのうちの１つの候補ノードを、生成ノードに仮決定する。

ここで、生成ノードに仮決定される候補ノードを、仮生成ノードということとすると、生成ノード決定部２３３は、例えば、次のようにして、１つの出力ネットワークに存在する複数の候補ノードの中から１つの候補ノードを、仮生成ノードに決定する。

即ち、生成ノード決定部２３３は、例えば、１つの出力ネットワークに存在する複数の候補ノードそれぞれの、候補ノードに決定されたときに用いられた有効勝者ノードとの結合重みを比較し、その結合重みが最も強い候補ノードを、仮生成ノードに決定する。

なお、仮生成ノードの決定には、その他、例えば、有効勝者ノードのスコアも考慮することができる。

即ち、いま、ある候補ノードに対応する有効勝者ノード（ある候補ノードの、候補ノードに決定されたときに用いられた有効勝者ノード）との結合重みをwと表すとともに、その有効勝者ノードのスコアをSと表すとすると、１つの出力ネットワークに存在する複数の候補ノードのうちの、例えば、w+σSが最大の候補ノードを、仮生成ノードに決定することができる。ここで、σは、スコアSのスケールを、結合重みwのスケールに調整するための定数（スコアSを正規化する定数）である。

ステップＳ１５７の処理が終了すると、入出力関係モデルの各出力ネットワークでは、多くとも、１つの出力ノードが、仮生成ノードとなる。なお、出力ネットワークにおいて、１つの候補ノードしか存在しない場合には、その１つの候補ノードが、そのまま仮生成ノードに決定される。また、候補ノードが存在しない出力ネットワークは、ステップＳ１５７以降の処理の対象にならない。

その後、ステップＳ１５７からステップＳ１５８に進み、生成ノード決定部２３３は、ステップＳ１５７で決定された仮生成ノードの中から、有効な仮生成ノード（出力ノード）を、生成ノードに最終決定する。

即ち、生成ノード決定部２３３は、例えば、仮生成ノードの、候補ノードに決定されたときに用いられた有効勝者ノードとの結合重みwを閾値と比較し、結合重みwが閾値以上であれば、仮生成ノードを、有効な仮生成ノードに決定し、結合重みwが閾値未満であれば、仮生成ノードを、無効な仮生成ノードに決定する。

あるいは、生成ノード決定部２３３は、例えば、仮生成ノードについて、上述の値w+σSを計算して閾値と比較し、値w+σSが閾値以上であれば、仮生成ノードを、有効な仮生成ノードに決定し、値w+σSが閾値未満であれば、仮生成ノードを、無効な仮生成ノードに決定する。

そして、生成ノード決定部２３３は、有効な仮生成ノードのみを、生成ノードに最終決定し、1個以上の生成ノードそれぞれを表すノードラベルを、時系列生成部２３４に供給して、ステップＳ１５８からステップＳ１５９に進む。

なお、ステップＳ１５８において、有効な仮生成ノードが存在しない場合には、認識生成部２１３（図２１）は、処理を終了する。

ステップＳ１５９では、時系列生成部２３４は、図２９のステップＳ１３７と同様に、記憶部２１１に記憶された入出力関係モデルを構成する出力ネットワークの出力ノードのうちの、生成ノード決定部２３３からのノードラベルが表す1個以上の生成ノードそれぞれが有する時系列パターンモデル２１（図７）に基づいて、認識生成部２１３に供給された入力データに対する出力データの推定値としての１個以上の時系列データを生成して、ステップＳ１６０に進み、その１個以上の時系列データそれぞれを、生成ノードを有する出力ネットワークに対応するチャネルのサブ出力データとして含む出力データを出力する。

なお、ある仮生成ノードが有効であるということは、その仮生成ノードを有する出力ネットワークに対応するチャネルのサブ出力データが、有意であること、即ち、例えば、有効な仮生成ノードを有する出力ネットワークに対応するチャネルのサブ出力データが出力音声データである場合には、その出力音声データが、無音ではない、いわば有意な音声の音声データであることに相当する。従って、仮生成ノードが有効であることを決定することは、その仮生成ノードを有する出力ネットワークに対応するチャネルのサブ出力データが有意であることを決定することに相当する。

以上のように、有効な仮生成ノードが決定され、その仮生成ノードを、生成ノードとして、その生成ノードが有する時系列パターンモデル２１（図７）に基づき、その生成ノードを有する出力ネットワークに対応するチャネルのサブ出力データとしての時系列データが生成されて出力される。

従って、入出力関係モデルが、図３０左側で説明したように、入力音声データに対応する入力ネットワークnet_in1、入力画像データに対応する入力ネットワークnet_in2、出力音声データに対応する出力ネットワークnet_out1、および出力モータデータに対応する出力ネットワークnet_out2とを含んで構成され、入力ネットワークnet_in1が、出力ネットワークnet_out1およびnet_out2の両方と結合し、かつ、入力ネットワークnet_in2も、出力ネットワークnet_out1およびnet_out2の両方と結合している場合において、出力ネットワークnet_out1の出力ノードだけが、有効な仮生成ノードに決定されたときには、その有効な仮生成ノードを、生成ノードとして、その生成ノードが有する時系列パターンモデル２１に基づき、出力音声データが生成され、その出力音声データを1つのチャネルのサブ出力データとして含む出力データが出力される。なお、この場合、出力データに含まれる他の1つのチャネルのサブ出力データとしての出力モータデータは、上述したように、アームを移動させないことを表すデータ（時系列データ）とされる。

また、出力ネットワークnet_out2の出力ノードだけが、有効な仮生成ノードに決定されたときには、その有効な仮生成ノードを、生成ノードとして、その生成ノードが有する時系列パターンモデル２１に基づき、出力モータデータが生成され、その出力モータデータを1つのチャネルのサブ出力データとして含む出力データが出力される。なお、この場合、出力データに含まれる他の1つのチャネルのサブ出力データとしての出力音声データは、上述したように、音声を出力しないことを表すデータ（時系列データ）とされる。

さらに、出力ネットワークnet_out1の出力ノードと、出力ネットワークnet_out2の出力ノードとが、有効な仮生成ノードに決定されたときには、それぞれの有効な仮生成ノードを、生成ノードとして、その生成ノードが有する時系列パターンモデル２１に基づき、出力音声データと出力モータデータとが生成される。そして、その出力音声データと出力モータデータを、それぞれサブ出力データとして含む出力データが出力される。

その結果、図３０左側の入出力関係モデルを順モデルとして適用したロボットにおいては、入力データに対して、音声が出力され、または、アームが移動され、あるいは、音声が出力されるとともに、アームが移動される。

なお、図３０左側の入出力関係モデルにおいて、どのような入力データに対して、どのような出力データが出力されるは、入出力関係モデルの学習に用いた教示データに大きく依存する。即ち、例えば、ある入力音声データに対して、ある出力音声データが出力されるようにするには、例えば、その入力音声データと出力音声データとがセットになっている多数の教示データを用いて、入出力関係モデルの学習を行う必要がある。また、例えば、ある入力音声データに対して、ある出力モータデータが出力されるようにするには、例えば、その入力音声データと出力モータデータとがセットになっている多数の教示データを用いて、入出力関係モデルの学習を行う必要がある。

次に、以上の説明では、入力データに含まれるサブ入力データとして、音声のデータである入力音声データと、画像のデータである入力画像データという、いわば別々のメディアのデータを採用し、出力データに含まれるサブ出力データとしても、音声のデータである出力音声データと、モータを制御するデータである出力モータデータという別々のメディアのデータを採用したが、入力データに含まれるサブ入力データや、出力データに含まれるサブ出力データとしては、同一のメディアのデータを採用することが可能である。

そこで、例えば、いま、図３４に示すような想定ロボットを制御対象として、その想定ロボットを、入出力関係モデルによって順モデルにモデル化することを考える。

図３４の想定ロボットは、入力データとしての音声データが入力されると、出力データとしての音声データ（に対応する合成音）を出力するようになっている。

但し、入力データは、音声データのピッチデータとケプストラムデータとの２つのチャネルのサブ入力データを含み、出力データは、音声データの音源パラメータと声道パラメータとの２つのチャネルのサブ出力データを含んでいる。

ここで、ピッチデータについては、音声データから、そのピッチ周波数が、フレーム単位で時系列に抽出され、１つのチャネルのサブ入力データとして、想定ロボットに入力されることとする。さらに、ケプストラムデータについては、音声データから、所定の次数のケプストラム係数が、フレーム単位で時系列に抽出され（求められ）、他の１つのチャネルのサブ入力データとして、想定ロボットに入力されることとする。なお、音声データからのピッチ周波数の抽出方法、およびケプストラム係数の抽出方法は、特に限定されるものではない。

また、図３４の想定ロボットは、音源パラメータと声道パラメータにしたがって、音声（合成音）を出力する音声出力装置を備えているとする。この音声出力装置は、例えば、物理的な音源から音を出力させるアクチュエータを駆動する第１の駆動信号が与えられることによって、音源から、ある周期（周波数）の音（音声）を発生し、フィルタとしてのチューブの形状を変形させるアクチュエータを駆動する第２の駆動信号が与えられることによって、チューブの形状を変形させるとする。さらに、音声出力装置は、音源からの音を、チューブを通過させることによって、ある周波数特性の音を出力するとする。この場合、時系列の第１の駆動信号が、音源パラメータに相当し、時系列の第２の駆動信号が、声道パラメータに相当する。

なお、音源からのある周期の音の出力や、その音を、形状が変形されたチューブを通過させることによりフィルタリングを行って、ある周波数特性の音とすることは、コンピュータにシミュレーションプログラムを実行させることにより行うことができる。

以上のような音声出力装置によれば、音源パラメータと声道パラメータが与えられることによって、音声（データ）、つまり、時系列データが出力される。

想定ロボットは、音源パラメータを、１つのチャネルのサブ出力データとし、かつ、声道パラメータを、他の１つのチャネルのサブ出力データとして含む出力データを出力し、この出力データを、音声出力装置に与えることによって、音声を出力する。

例えば、いま、図３４の想定ロボットが、入力される音声に対して、その音声をまねた（聞きまねした）音声を出力するとする。また、想定ロボットに入力される音声、および想定ロボットが出力する音声には、音韻（読み）（カテゴリ）に関して、例えば、「あ」、「い」、「う」、「え」、「お」の５種類の音声があり、韻律の１つであるイントネーションに関して、時間的にあまりピッチ周波数が変化しないイントネーション（フラットと呼ぶ）、時間的に徐々にピッチ周波数が高くなるイントネーション（アップと呼ぶ）、時間的に徐々にピッチが低くなるイントネーション（ダウンと呼ぶ）の３種類の音声があるとする。

この場合、想定ロボットに入力される音声には、音韻に関して５種類の音声があり、イントネーションに関して３種類の音声があるから、合計で、１５（＝５×３）種類の音声がある。そして、想定ロボットは、その１５種類の音声のうちのいずれかの種類の音声の入力に対して、同一の種類の音声を出力する。

図３５は、以上のような図３４の想定ロボットの順モデルとしての入出力関係モデルを示している。

図３５の入出力関係モデルは、図２６の入出力関係モデルと同様に、入力データに含まれる２つのチャネルのサブ入力データに対応する２つの入力ネットワークnet_in1およびnet_in2と、出力データに含まれる２つのチャネルのサブ出力データに対応する２つの出力ネットワークnet_out1およびnet_out2とを有している。

なお、図３５の入出力関係モデルにおいて、入力ネットワークnet_in1は、入力データのサブ入力データであるピッチデータ（のチャネル）に対応し、入力ネットワークnet_in2は、入力データのサブ入力データであるケプストラムデータ（のチャネル）に対応するとする。さらに、出力ネットワークnet_out1は、出力データのサブ出力データである音源パラメータ（のチャネル）に対応し、出力ネットワークnet_out2は、出力データのサブ出力データである声道パラメータ（のチャネル）に対応する。

図３６は、図３５の入出力関係モデルにおける時系列パターン記憶ネットワークどうしの結合関係と、結合重み行列とを示している。

ここで、図３４の想定ロボットについては、ピッチデータと音源パラメータとの間に関係があり、かつ、ケプストラムデータと声道パラメータとの間に関係がある（ピッチデータと声道パラメータとの間に関係がなく、かつ、ケプストラムデータと音源パラメータとの間に関係がない）として、入出力関係モデルを構成することが可能であるが、図３６では、ピッチデータと音源パラメータまたは声道パラメータとの間に関係があるかどうか、さらには、ケプストラムデータと音源パラメータまたは声道パラメータとの間に関係があるかどうかが不明であるとして、入出力関係モデルが構成されている。

即ち、図３６左側は、図３５の入出力関係モデルにおける時系列パターン記憶ネットワークどうしの結合関係を示している。

図３６左側の入出力関係モデルでは、図３０左側の入出力関係モデルと同様に、入力ネットワークのノードは、すべての出力ネットワークのノードと結合され、出力ネットワークのノードも、すべての入力ネットワークのノードと結合されている。

即ち、図３６左側の入出力関係モデルでは、ピッチデータに対応する入力ネットワークnet_in1の入力ノードと、音源パラメータに対応する出力ネットワークnet_out1の出力ノードとが結合され、ピッチデータに対応する入力ネットワークnet_in1の入力ノードと、声道パラメータに対応する出力ネットワークnet_out2の出力ノードとが結合されている。さらに、ケプストラムデータに対応する入力ネットワークnet_in2の入力ノードと、音源パラメータに対応する出力ネットワークnet_out1の出力ノードとが結合され、ケプストラムデータに対応する入力ネットワークnet_in2の入力ノードと、声道パラメータに対応する出力ネットワークnet_out2の出力ノードとが結合されている。

図３６右側は、図３６左側の入出力関係モデルについての結合重み行列を示している。

図３６左側の入出力関係モデルでは、上述したように、入力ネットワークnet_in1の入力ノードと、音源パラメータに対応する出力ネットワークnet_out1の出力ノードとが結合され、ケプストラムデータに対応する入力ネットワークnet_in2の入力ノードと、声道パラメータに対応する出力ネットワークnet_out2の出力ノードとが結合されている。さらに、ケプストラムデータに対応する入力ネットワークnet_in2の入力ノードと、音源パラメータに対応する出力ネットワークnet_out1の出力ノードとが結合され、ケプストラムデータに対応する入力ネットワークnet_in2の入力ノードと、声道パラメータに対応する出力ネットワークnet_out2の出力ノードとが結合されている。

このため、図３６右側の左上側に示す、入力ネットワークnet_in1と出力ネットワークnet_out1との間の結合重み行列MTX₁₁、図３６右側の右上側に示す、入力ネットワークnet_in1と出力ネットワークnet_out2との間の結合重み行列MTX₁₂、図３６右側の左下側に示す、入力ネットワークnet_in2と出力ネットワークnet_out1との間の結合重み行列MTX₂₁、図３６右側の右下側に示す、入力ネットワークnet_in2と出力ネットワークnet_out2との間の結合重み行列MTX₂₂の、合計で４つの結合重み行列が存在し、図３６左側の入出力関係モデルの学習時においては、結合重み更新部２２２（図２１）は、図３６右側の４つの結合重み行列MTX₁₁,MTX₁₂,MTX₂₁、およびMTX₂₂の各要素である結合重みwを更新する。

図３６の入出力関係モデルが、図２１のデータ処理装置の記憶部２１１に記憶されている場合、その入出力関係モデルの学習は、図３２のフローチャートで説明した、図３０の入出力関係モデルの学習と同様に行われる。

即ち、図３６の入出力関係モデルの学習の説明は、図３２の説明において、「入力音声データ」、「入力画像データ」、「出力音声データ」、「出力モータデータ」を、それぞれ、「ピッチデータ」、「ケプストラムデータ」、「音源パラメータ」、「声道パラメータ」に読み替えた説明となるので、その説明は、省略する。

次に、図３７のフローチャートを参照して、図２１のデータ処理装置が、図３４の想定ロボットの順モデルとしての図３６の入出力関係モデルを用いて、入力データに対する出力データを推定する処理について説明する。

ここで、図３４の想定ロボットにおいては、その想定ロボットに入力される音声データからは、ピッチ周波数とケプストラム係数を必ず抽出することができる。また、想定ロボットから音声を出力するには、音源パラメータと声道パラメータが必ず必要である。

そこで、図３４の想定ロボットの順モデルとしての図３６の入出力関係モデルについては、入力データには、有意なピッチデータとケプストラムデータとが、サブ入力データとして必ず含まれ、出力データには、有意な音源パラメータと声道パラメータとが、サブ出力データとして必ず含まれるという制約を課すこととする。

まず、ステップＳ１７１において、出力データを推定しようとする入力データが、図２１のデータ処理装置に入力される。即ち、時系列の音声データから順次抽出された時系列のピッチ周波数とケプストラム係数であるピッチデータとケプストラムデータを、それぞれ、１つのチャネルのサブ入力データと、他の１のチャネルのサブ入力データとして含む入力データが、図２１のデータ処理装置に入力される。

スコア計算部２３１は、ステップＳ１７２において、入力データに含まれる２つのチャネルのサブ入力データを、１チャネルごとのサブ入力データ、即ち、ピッチデータとケプストラムデータに分割して、ステップＳ１７３に進む。

ステップＳ１７３では、スコア計算部２３１は、入力データに含まれるピッチデータのチャンネルと、ケプストラムデータのチャネルのスコアを計算する。

即ち、スコア計算部２３１は、ステップＳ１７３において、ピッチデータに対して、記憶部２１１に記憶されている入出力関係モデルにおける、ピッチデータに対応する入力ネットワークnet_in1（図３６）の各入力ノードのスコアを計算し、勝者ノード決定部２３２に供給する。

さらに、ステップＳ１７３では、スコア計算部２３１は、ケプストラムデータに対して、記憶部２１１に記憶されている入出力関係モデルにおける、ケプストラムデータに対応する入力ネットワークnet_in2（図３６）の各入力ノードのスコアを計算し、勝者ノード決定部２３２に供給して、ステップＳ１７４に進む。

ステップＳ１７４では、勝者ノード決定部２３２は、ピッチデータに対応する入力ネットワークnet_in1の入力ノードのうちの、スコア計算部２３１からのスコアが最も高い入力ノードを、ピッチデータに最も適合する勝者ノードに決定する。

さらに、ステップＳ１７４では、勝者ノード決定部２３２は、ケプストラムデータに対応する入力ネットワークnet_in2についても、スコア計算部２３１からのスコアが最も高い入力ノードを、ケプストラムデータに最も適合する勝者ノードに決定して、ステップＳ１７５に進む。

ステップＳ１７５では、勝者ノード決定部２３２は、ピッチデータに対応する入力ネットワークnet_in1についての勝者ノードと、ケプストラムデータに対応する入力ネットワークnet_in2についての勝者ノードの中から、有効勝者ノードを決定する。

ここで、図３６の入出力関係モデルについては、上述したように、入力データには、有意なピッチデータとケプストラムデータとが、サブ入力データとして必ず含まれるという制約を課すので、そのような有意なピッチデータに対応する入力ネットワークnet_in1についての勝者ノードは、有効勝者ノードに必ず決定され、同様に、有意なケプストラムデータに対応する入力ネットワークnet_in2についての勝者ノードも、有効勝者ノードに必ず決定される。

勝者ノード決定部２３２は、ステップＳ１７５において、ピッチデータに対応する入力ネットワークnet_in1についての勝者ノードと、ケプストラムデータに対応する入力ネットワークnet_in2についての勝者ノードとを、有効勝者ノードに決定すると、その２つの勝者ノードそれぞれを表すノードラベルを、生成ノード決定部２３３に供給して、ステップＳ１７６に進む。

ステップＳ１７６では、生成ノード決定部２３３は、勝者ノード決定部２３２からの２つのノードラベルに基づき、生成ノードの候補となる候補ノードを決定する。

即ち、勝者ノード決定部２３２から生成ノード決定部２３３に供給された２つのノードラベルは、それぞれ、ピッチデータに対応する入力ネットワークnet_in1についての有効勝者ノードと、ケプストラムデータに対応する入力ネットワークnet_in2についての勝者ノードを表すが、生成ノード決定部２３３は、例えば、まず、ピッチデータに対応する入力ネットワークnet_in1についての有効勝者ノードに結合している、音源パラメータに対応する出力ネットワークnet_out1（図３６）の出力ノードの中で、その有効勝者ノードとの結合重みが最も強い出力ノードを、候補ノードに決定する。また、生成ノード決定部２３３は、ピッチデータに対応する入力ネットワークnet_in1についての有効勝者ノードに結合している、声道パラメータに対応する出力ネットワークnet_out2（図３６）の出力ノードの中で、その有効勝者ノードとの結合重みが最も強い出力ノードも、候補ノードに決定する。

さらに、生成ノード決定部２３３は、ケプストラムデータに対応する入力ネットワークnet_in2についての有効勝者ノードに結合している、音源パラメータに対応する出力ネットワークnet_out1の出力ノードの中で、その有効勝者ノードとの結合重みが最も強い出力ノードを、候補ノードに決定するとともに、ケプストラムデータに対応する入力ネットワークnet_in2についての有効勝者ノードに結合している、声道パラメータに対応する出力ネットワークnet_out2の出力ノードの中で、その有効勝者ノードとの結合重みが最も強い出力ノードも、候補ノードに決定する。

従って、音源パラメータに対応する出力ネットワークnet_out1の２つの出力ノードと、声道パラメータに対応する出力ネットワークnet_out2の２つの出力ノードとの、合計で４つの出力ノードが、候補ノードに決定される。

以上のようにステップＳ１７６において、候補ノードが決定された後は、ステップＳ１７７に進み、生成ノード決定部２３３は、１つの出力ネットワークについて、１つの生成ノードを決定するために、生成ノード決定部２３３は、音源パラメータに対応する出力ネットワークnet_out1の２つの候補ノードのうちのいずれか１つの候補ノードを、生成ノード（仮生成ノード）に仮決定するとともに、声道パラメータに対応する出力ネットワークnet_out2の２つの候補ノードのうちのいずれか１つの候補ノードを、生成ノードに仮決定する。

ここで、音源パラメータに対応する出力ネットワークnet_out1の２つの候補ノードは、その出力ネットワークnet_out1において、ピッチデータに対応する入力ネットワークnet_in1の有効勝者ノードとの結合重みが最も強い出力ノードN₁₁と、ケプストラムデータに対応する入力ネットワークnet_in2の有効勝者ノードとの結合重みが最も強い出力ノードN₂₁である。

そこで、生成ノード決定部２３３は、例えば、出力ネットワークnet_out1に存在する２つの候補ノードN₁₁とN₂₁それぞれの、候補ノードに決定されたときに用いられた有効勝者ノードとの結合重み、即ち、入力ネットワークnet_in1の有効勝者ノードと候補ノードN₁₁との結合重みと、入力ネットワークnet_in2の有効勝者ノードと候補ノードN₂₁との結合重みとを比較し、結合重みが強い方の候補ノードを、仮生成ノードに決定する。

同様にして、生成ノード決定部２３３は、声道パラメータに対応する出力ネットワークnet_out2の２つの候補ノードのうちのいずれか１つの候補ノードを、仮生成ノードに決定する。

以上のステップＳ１７７の処理によれば、音源パラメータに対応する出力ネットワークnet_out1については、その１つの出力ノードだけが、仮生成ノードに決定されるとともに、声道パラメータに対応する出力ネットワークnet_out2についても、その１つの出力ノードだけが、仮生成ノードに決定される。

その後、ステップＳ１７７からステップＳ１７８に進み、生成ノード決定部２３３は、ステップＳ１７７で決定された仮生成ノードの中から、有効な仮生成ノード（出力ノード）を、生成ノードに最終決定する。

ここで、図３６の入出力関係モデルについては、上述したように、出力データには、有意な音源パラメータと声道パラメータとが、サブ出力データとして必ず含まれるという制約を課すので、ステップＳ１７８では、音源パラメータに対応する出力ネットワークnet_out1に１つだけ存在する仮生成ノードとなっている出力ノードは、必ず有効な仮生成ノードであるとして、生成ノードに決定され、同様に、声道パラメータに対応する出力ネットワークnet_out2に１つだけ存在する仮生成ノードとなっている出力ノードも、必ず有効な仮生成ノードであるとして、生成ノードに決定される。

そして、生成ノード決定部２３３は、音源パラメータに対応する出力ネットワークnet_out1の出力ノードのうちの１つの生成ノードを表すノードラベルL₁と、声道パラメータに対応する出力ネットワークnet_out2の出力ノードのうちの１つの生成ノードを表すノードラベルL₂とを、時系列生成部２３４に供給して、ステップＳ１７８からステップＳ１７９に進む。

ステップＳ１７９では、時系列生成部２３４は、記憶部２１１に記憶された入出力関係モデルにおいて、音源パラメータに対応する出力ネットワークnet_out1のノードのうちの、生成ノード決定部２３３からのノードラベルL₁が表す生成ノードが有する時系列パターンモデル２１（図７）に基づいて、時系列データとしての音源パラメータを生成するとともに、声道パラメータに対応する出力ネットワークnet_out2のノードのうちの、生成ノード決定部２３３からのノードラベルL₂が表す生成ノードが有する時系列パターンモデル２１に基づいて、時系列データとしての声道パラメータを生成し、その音源パラメータと声道パラメータとを、サブ出力データとして含む時系列データとしての出力データを出力する。

この出力データは、上述した音源パラメータと声道パラメータにしたがって音声を出力する音声出力装置に供給され、音声出力装置では、その出力データに含まれる音源パラメータと声道パラメータにしたがって音声が出力される。

次に、図３８は、図３４の想定ロボットの順モデルとしての入出力関係モデルの学習を行い、その入出力関係モデルを用いて行った、入力データに対する出力データを推定する処理のシミュレーションの結果を示している。

なお、シミュレーションは、図３４で説明したように、想定ロボットに入力される音声、および想定ロボットが出力する音声には、音韻（読み）（カテゴリ）に関して、「あ」、「い」、「う」、「え」、「お」の５種類の音声があり、韻律の１つであるイントネーションに関して、フラット、アップ、ダウンの３種類の音声があるとして、その５種類の音韻と３種類のイントネーションとのすべての組み合わせである１５種類の音声、つまり、音韻が「あ」で、イントネーションがそれぞれフラット、アップ、ダウンの３種類の音声、音韻が「い」で、イントネーションがそれぞれフラット、アップ、ダウンの３種類の音声、音韻が「う」で、イントネーションがそれぞれフラット、アップ、ダウンの３種類の音声、音韻が「え」で、イントネーションがそれぞれフラット、アップ、ダウンの３種類の音声、音韻が「お」で、イントネーションがそれぞれフラット、アップ、ダウンの３種類の音声の、合計で１５種類の音声を対象として行った。

また、シミュレーションでは、上述の１５種類の音声それぞれを、男女各５人の合計で１０人に、１０回ずつ発話してもらい、その発話によって得られた1500(=15×10×10)サンプルの音声データを、入出力関係モデルの学習の教示データにおける入力データとして用いた。

即ち、1500サンプルの音声データそれぞれについて、１次元のピッチ周波数と１３次元のケプストラム係数を時系列に抽出し、その時系列のピッチ周波数とケプストラム係数であるピッチデータとケプストラムデータを、サブ入力データとして含む1500サンプルのデータを、入出力関係モデルの学習の教示データにおける入力データとして用いた。

さらに、シミュレーションでは、時系列の１次元のピッチ周波数を音源パラメータとして与えるとともに、時系列の８つ（８次元）のフォルマント周波数を声道パラメータとして与えることにより、音源パラメータとしてのピッチ周波数の正弦波等を、声道パラメータとしての８つのフォルマント周波数で指定される周波数特性のフィルタでフィルタリングした音声（音）を出力する音声出力装置（音声合成装置）を、コンピュータにプログラムを実行させることにより実現し、その音声出力装置に与える音源パラメータと声道パラメータを、サブ出力データとして含むデータを、入出力関係モデルの学習の教示データにおける出力データとして用いた。

なお、出力データも、上述の１５種類の音声それぞれについて100サンプルずつ、合計で1500サンプル用意し、入出力関係モデルの学習においては、同一種類の音声についての入力データと出力データとのセットを、入出力関係モデルに与えた。

ここで、教示データにおける入力データのピッチデータと、出力データの音源パラメータとは、いずれも、時系列のピッチ周波数であるという点で共通する。但し、入力データのピッチデータは、人が実際に発話した音声から抽出された時系列のピッチ周波数であるという点で、いわば多様性があるのに対して、出力データの音源パラメータは、音声出力装置が出力する音声（合成音）を特徴づける時系列のピッチ周波数であり、入力データのピッチデータと比較すると、多様性はない。

一方、入出力関係モデルは、入力データに含まれるピッチデータとケプストラムデータそれぞれに対応する時系列パターン記憶ネットワークとしての入力ネットワークnet_in1とnet_in2、および、出力データに含まれる音源パラメータと声道パラメータそれぞれに対応する時系列パターン記憶ネットワークとしての出力ネットワークnet_out1とnet_out2で構成した。

また、入出力関係モデルとしては、ピッチデータに対応する入力ネットワークnet_in1と音源パラメータに対応する出力ネットワークnet_out1との間を結合するとともに、ケプストラムデータに対応する入力ネットワークnet_in2と声道パラメータに対応する出力ネットワークnet_out2との間を結合した入出力関係モデルと、入力ネットワークnet_in1と出力ネットワークnet_out1との間、入力ネットワークnet_in1と出力ネットワークnet_out2との間、入力ネットワークnet_in2と出力ネットワークnet_out1との間、入力ネットワークnet_in2と出力ネットワークnet_out2との間のすべてを結合した入出力関係モデル（図３６）とを用意した。

入力ネットワークnet_in1とnet_in2、および出力ネットワークnet_out1とnet_out2は、いずれも、36個のノードで構成し、その36個のノードを、図８で説明したように、２次元平面上に、横×縦が６×６となるように配置して、横方向に隣接するノードどうしと、縦方向に隣接するノードどうしに対して、リンク（結合関係）を与えた。従って、ある入力ネットワークと、ある出力ネットワークとの間の結合重み行列は、３６行×３６列の行列である。

また、各ノードが有する時系列パターンモデル２１（図７）としては、１０状態のleft-to-right型のHMMを用い、各状態の出力確率密度関数は、ガウシアン分布に従うこととした。

シミュレーションでは、上述した入力データと、その入力データに対応する出力データのセットである1500サンプルの教示データを、ランダムに、10000回選択して、入出力関係モデルに与え、その入出力関係モデルの学習を行った。

そして、以上のような学習がされた入出力関係モデルを用いて、入力データに対する出力データを推定した。

出力データの推定においては、教示データを用意したときとは別の男女各３人の合計で６人に、上述の１５種類の音声それぞれを、１０回ずつ発話してもらい、その発話によって得られた900(=15×6×10)サンプルの音声データを、出力データを推定しようとする入力データとして用いた。

即ち、900サンプルの音声データそれぞれについて、１次元のピッチ周波数と１３次元のケプストラム係数を時系列に抽出し、その時系列のピッチ周波数とケプストラム係数であるピッチデータとケプストラムデータを、サブ入力データとして含む900サンプルのデータを、出力データを推定しようとする入力データとして用いた。

そして、シミュレーションでは、上述の900サンプルの入力データそれぞれを、入出力関係モデルに与え、各入力データに対して入出力関係モデルから出力される出力データが、入力データと同一の音韻で、かつ同一のイントネーションの音声である場合を「正解」とした。

ここで、シミュレーションでは、学習がされた入出力関係モデルの出力ネットワークnet_out1の各出力ノードから、その出力ノードが有する時系列パターンモデル２１としてのHMMに基づき、時系列データとしての音源パラメータを生成させ、その音源パラメータに対応するイントネーションが、フラット、アップ、またはダウンのいずれに該当するかを調査して、出力ネットワークnet_out1の36の各出力ノードに対して、イントネーションを表すラベル（イントネーションラベル）を、あらかじめ付与した。

同様に、学習がされた入出力関係モデルの出力ネットワークnet_out2の各出力ノードから、その出力ノードが有する時系列パターンモデル２１としてのHMMに基づき、時系列データとしての声道パラメータを生成させ、その声道パラメータに対応する音韻が、「あ」、「い」、「う」、「え」、または「お」のいずれに該当するかを調査して、出力ネットワークnet_out2の36の各出力ノードに対して、音韻を表すラベル（音韻ラベル）を、あらかじめ付与した。

なお、イントネーションラベルおよび音韻ラベルは、出力ネットワークnet_out1の出力ノードから生成した音源パラメータと、出力ネットワークnet_out2の出力ノードから生成した声道パラメータとを用いて、音声出力装置で音声を実際に出力し、その音声を聴いて付与した。

そして、シミュレーションでは、入力データが与えられた入出力関係モデルにおいて、音源パラメータが生成される出力ノードに付与されたイントネーションラベルが表すイントネーションが、入力データのイントネーションに一致し、かつ、声道パラメータが生成される出力ノードに付与された音韻ラベルが表す音韻が、入力データの音韻に一致する出力データを「正解」とした。

図３８は、入力データに対して入出力関係モデルから出力された出力データが「正解」であった割合である正解率を示している。

入出力関係モデルの入力ネットワークと出力ネットワークとの結合を制限しない場合、即ち、図３６に示した、入力ネットワークnet_in1と出力ネットワークnet_out1との間、入力ネットワークnet_in1と出力ネットワークnet_out2との間、入力ネットワークnet_in2と出力ネットワークnet_out1との間、入力ネットワークnet_in2と出力ネットワークnet_out2との間のすべてを結合した入出力関係モデルを用いた場合、図３８左欄に示すように、イントネーションに関しては８０％の正解率が、音韻に関しては７０％の正解率が得られた。

入出力関係モデルの学習は、教示データが、どのようなイントネーションの、どのような音韻の音声であるかを明示的に与えない教師なし学習であり、そのような教師なし学習によって得られた入出力関係モデルによって、上述のような高い正解率が得られることから、入出力関係モデルの学習が有効に（効果的に）行われていることが分かる。

一方、入出力関係モデルの入力ネットワークと出力ネットワークとの結合を制限した場合、即ち、ピッチデータに対応する入力ネットワークnet_in1と音源パラメータに対応する出力ネットワークnet_out1との間、および、ケプストラムデータに対応する入力ネットワークnet_in2と声道パラメータに対応する出力ネットワークnet_out2との間は結合されているが、ピッチデータに対応する入力ネットワークnet_in1と声道パラメータに対応する出力ネットワークnet_out2との間、および、ケプストラムデータに対応する入力ネットワークnet_in2と音源パラメータに対応する出力ネットワークnet_out1との間は結合されていない入出力関係モデルを用いた場合、図３８右欄に示すように、イントネーションに関しては８２％の正解率が、音韻に関しては８５％の正解率が得られた。

従って、入出力関係モデルの入力ネットワークと出力ネットワークとの結合を制限しない場合、つまり、入力データのあるチャネルのサブ入力データと、出力データのあるチャネルのサブ出力データとの間に関係があるかどうかが不明であり、入力ネットワークをすべての出力ネットワークと結合するとともに、出力ネットワークをすべての入力ネットワークと結合した入出力関係モデルを用いた場合であっても、入出力関係モデルの入力ネットワークと出力ネットワークとの結合を制限する場合、つまり、あるチャネルのサブ入力データと、あるチャネルのサブ出力データとの間に関係があることがあらかじめ分かっており、関係があるサブ入力データとサブ出力データとにそれぞれ対応する入力ネットワークと出力ネットワークとのみを結合し、関係がないサブ入力データとサブ出力データとにそれぞれ対応する入力ネットワークと出力ネットワークとは結合しない入出力関係モデルを用いた場合に比較して、それほど正解率は低下しない。このことから、あるチャネルのサブ入力データと、あるチャネルのサブ出力データとの間に関係があることが分かっているかどうかにかかわらず、入出力関係モデルの学習が有効に（効果的に）行われることが分かる。

次に、上述したように、入出力関係モデルの学習は、あるチャネルのサブ入力データと、あるチャネルのサブ出力データとの間に関係があることが分かっているかどうかにかかわらず、有効に（効果的に）行うことができ、さらに、そのような学習が行われた入出力関係モデルを用いて、制御対象が入力データに対して出力する出力データを精度良く推定することができる。

しかしながら、図３８に示したシミュレーションの結果から分かるように、あるチャネルのサブ入力データと、あるチャネルのサブ出力データとの間に関係があることが分かっている場合に比較して、関係があるかどうかが不明である場合には、正解率、即ち、出力データの推定精度が、多少なりとも劣化するおそれがある。

即ち、あるチャネルのサブ入力データと、あるチャネルのサブ出力データとの間に関係があることが分かっている場合には、例えば、図２７で説明したように、その関係があることが分かっているサブ入力データとサブ出力データとにそれぞれ対応する入力ネットワークと出力ネットワークとの間のみが結合された、入力ネットワークと出力ネットワークとの結合を制限した入出力関係モデルを用いるため、出力データの推定時において、ある入力ネットワークの勝者ノードに対して決定される生成ノードは、その入力ネットワークと結合している出力ネットワークの出力ノードでしかあり得ない。その結果、出力データの推定時において、サブ入力データに対して出力されるサブ出力データは、そのサブ入力データと関係があるサブ出力データでしかあり得ない。

一方、あるチャネルのサブ入力データと、あるチャネルのサブ出力データとの間に関係があるかどうかが不明である場合には、例えば、図３０で説明したように、各入力ネットワークと、各出力ネットワークとの間のすべてが結合された、入力ネットワークと出力ネットワークとの結合が制限されていない入出力関係モデルを用いるため、出力データの推定時において、ある入力ネットワークの勝者ノードに対して決定される生成ノードは、入出力関係モデルを構成する出力ネットワークのいずれの出力ノードでもあり得る。その結果、出力データの推定時において、サブ入力データに対して出力されるサブ出力データは、そのサブ入力データと関係がないサブ出力データであることが論理的にあり得る。

以上のように、入力ネットワークと出力ネットワークとの結合を制限した入出力関係モデルを用いる場合には、出力データの推定時において、サブ入力データに対して、そのサブ入力データと関係があるサブ出力データしか出力され得ないのに対して、入力ネットワークと出力ネットワークとの結合が制限されていない入出力関係モデルを用いる場合には、出力データの推定時において、サブ入力データに対して、そのサブ入力データと関係がないサブ出力データが出力されることがあり得る。

このため、入力ネットワークと出力ネットワークとの結合を制限した入出力関係モデルを用いる場合に比較して、入力ネットワークと出力ネットワークとの結合が制限されていない入出力関係モデルを用いる場合には、出力データの推定精度が劣化するおそれがある。

そこで、入力ネットワークと出力ネットワークとの結合が制限されていない入出力関係モデルについては、あるチャネルのサブ入力データと、あるチャネルのサブ出力データとの間に関係があるかどうかを調査し、その調査結果に応じて、入力ネットワークと出力ネットワークとの結合を制限することによって、上述のような出力データの推定精度の劣化を防止することができる。

図３９は、入力ネットワークと出力ネットワークとの結合が制限されていない入出力関係モデルについて、あるチャネルのサブ入力データと、あるチャネルのサブ出力データとの間に関係があるかどうかを調査し、その調査結果に応じて、入力ネットワークと出力ネットワークとの結合を制限する結合制限処理を説明するフローチャートである。なお、ここでも、入出力関係モデルは、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとから構成されることとする。

結合制限処理は、例えば、入力ネットワークと出力ネットワークとの結合が制限されていない入出力関係モデルについて、ある程度の学習が行われた後（ある程度の数の教示データを用いた入出力関係モデルの学習が行われた後）に、生成ノード決定部２３３（図２１）によって実行される。

即ち、図２１のデータ処理装置において、記憶部２１１に、入力ネットワークと出力ネットワークとの結合が制限されていない入出力関係モデルが記憶されており、学習部２１２によって、その入出力関係モデルの学習がある程度行われると、生成ノード決定部２３３は、ステップＳ１９１において、記憶部２１１に記憶された入出力関係モデルにおけるmチャネルの入力ネットワークのうちの１つの入力ネットワークを、注目入力ネットワークとして選択する。

そして、ステップＳ１９１からステップＳ１９２に進み、以下、注目入力ネットワークに対応するチャネルのサブ入力データと、入出力関係モデルにおけるnチャネルの出力ネットワークそれぞれに対応するサブ出力データとの間に関係があるかどうかが調査される。

ステップＳ１９２では、生成ノード決定部２３３は、注目入力ネットワークの各入力ノードについて、その入力ノードとの結合重みが最も強い出力ノードを、最強結合ノードとして検出して、ステップＳ１９３に進む。

ここで、入力ネットワークと出力ネットワークとの結合が制限されていない入出力関係モデルが、例えば、図３６に示したように、ピッチデータに対応する入力ネットワークnet_in1、ケプストラムデータに対応する入力ネットワークnet_in2、音源パラメータに対応する出力ネットワークnet_out1、および声道パラメータに対応する出力ネットワークnet_out2を有する場合において、注目入力ネットワークとして、例えば、入力ネットワークnet_in1が選択されたとき、ステップＳ１９２では、入力ネットワークnet_in1の各入力ノードについて、その入力ノードとの結合重みが最も強い出力ノード、即ち、最強結合ノードが検出される。

この場合、入力ネットワークnet_in1のある入力ノードについては、音源パラメータに対応する出力ネットワークnet_out1の出力ノードが、最強結合ノードとして検出されることがあり得るし、他の入力ノードについては、声道パラメータに対応する出力ネットワークnet_out2の出力ノードが、最強結合ノードとして検出されることがあり得る。

ステップＳ１９３では、生成ノード決定部２３３は、記憶部２１１に記憶された入出力関係モデルにおけるnチャネルの出力ネットワークそれぞれについて、最強結合ノードとなっている出力ノードの数を計算（カウント）して、ステップＳ１９４に進む。

ステップＳ１９４では、生成ノード決定部２３３は、記憶部２１１に記憶された入出力関係モデルにおけるnチャネルの出力ネットワークの中から、最強結合ノードとなっている出力ノードの数が最大の出力ネットワークを検出し、その出力ネットワークに対応するチャネルのサブ出力データと、注目入力ネットワークに対応するチャネルのサブ入力データとの間に関係があるとして、注目入力ネットワークと結合する出力ネットワークを、その、最強結合ノードとなっている出力ノードの数が最大の出力ネットワークに制限する。

即ち、生成ノード決定部２３３は、最強結合ノードとなっている出力ノードの数が最大の出力ネットワークを、注目入力ネットワークに結合している時系列パターン記憶ネットワークである結合ネットワークに決定する。

その後、ステップＳ１９４からステップＳ１９５に進み、生成ノード決定部２３３は、mチャネルの入力ネットワークすべてに対して、結合ネットワークを決定しかどうかを判定する。

ステップＳ１９５において、mチャネルの入力ネットワークすべてに対して、結合ネットワークが、まだ決定されていないと判定された場合、ステップＳ１９１に戻り、生成ノード決定部２３３は、mチャネルの入力ネットワークのうちの、まだ、注目入力ネットワークに選択されていない入力ネットワークの１つを、新たに注目入力ネットワークとして選択し、以下、同様の処理を繰り返す。

また、ステップＳ１９５において、mチャネルの入力ネットワークすべてに対して、結合ネットワークが決定されたと判定された場合、結合制限処理を終了する。

以上のような結合制限処理によれば、入力ネットワークnet_inに対して、最強結合ノードとなる出力ノードの数が最大の出力ネットワークnet_outに対応するサブ出力データと、入力ネットワークnet_inに対応するサブ入力データとの間に関係があるとして、入力ネットワークnet_inと結合する出力ネットワークが、最強結合ノードとなる出力ノードの数が最大の出力ネットワークnet_outだけに制限される。

以上のように、結合制限処理によって入力ネットワークと出力ネットワークとの結合が制限された入出力関係モデルを用いた出力データの推定は、図３３で説明した場合と基本的に同様に行われる。

但し、図３３のステップＳ１５７では、上述したように、生成ノード決定部２３３は、複数の候補ノードが存在する出力ネットワークについて、その複数の候補ノードのうちの１つの候補ノードを、仮生成ノードに決定するが、この仮生成ノードの決定に、出力ネットワークが、結合制限処理によって決定された結合ネットワークであるかどうかが考慮される。

即ち、生成ノード決定部２３３は、図３３のステップＳ１５６において、nチャネルの出力ネットワークそれぞれについて、１つの有効勝者ノードに対して、その有効勝者ノードとの結合重みが最強の出力ノードを、候補ノードに決定するから、１つの有効勝者ノードに対して、n個の候補ノードが得られる。

生成ノード決定部２３３は、結合制限処理によって、入力ネットワークに対して結合ネットワークが決定されている場合、ステップＳ１５７において、１つの有効勝者ノードに対して得られているn個の候補ノードのうちの、その有効勝者ノードを有する入力ネットワークに対して結合ネットワークになっている出力ネットワークの出力ノードのみを、候補ノードとして残し、他のn-1個の出力ネットワークの出力ノードを、候補ノードから除外する。

その後、生成ノード決定部２３３は、１つの出力ノードだけが候補ノードとなっている出力ネットワークについては、その出力ノードを、仮生成ノードに決定し、複数の出力ノードが候補ノードとなっている出力ネットワークについては、図３３で説明したように、その複数の出力ノードそれぞれの、候補ノードに決定されたときに用いられた有効勝者ノードとの結合重みを比較し、その結合重みが最も強い候補ノードを、仮生成ノードに決定する。

従って、入力ネットワークと出力ネットワークとの結合が制限されていない入出力関係モデルとして、例えば、図３６の入出力関係モデルを対象に、図３９の結合制限処理を行い、その結果、例えば、ピッチデータに対応する入力ネットワークnet_in1の結合ネットワークとして、音源パラメータに対応する出力ネットワークnet_out1が決定され、かつ、ケプストラムデータに対応する入力ネットワークnet_in2の結合ネットワークとして、声道パラメータに対応する出力ネットワークnet_out2が決定された場合、出力データの推定時においては、入力データに含まれるピッチデータに対して勝者ノードとなる入力ネットワークnet_in1の入力ノードとの結合が最も強い出力ネットワークnet_out1の出力ノードから、出力データのサブ出力データとしての音源パラメータが生成されるとともに、入力データに含まれるケプストラムデータに対して勝者ノードとなる入力ネットワークnet_in2の入力ノードとの結合が最も強い出力ネットワークnet_out2の出力ノードから、出力データのサブ出力データとしての声道パラメータが生成される。

即ち、ピッチデータに対応するサブ出力データとして、音源パラメータが生成され、ケプストラムデータに対応するサブ出力データとして、声道パラメータが生成される。

ここで、上述のように、１つの有効勝者ノードに対して得られているn個の候補ノードのうちの、その有効勝者ノードを有する入力ネットワークに対して結合ネットワークになっている出力ネットワークの出力ノードのみを、候補ノードとして残し、他のn-1個の出力ネットワークの出力ノードを、候補ノードから除外して、出力データの推定を行うことは、有効勝者ノードを有する入力ネットワークが、nチャネルの出力ネットワークのうちの、その入力ネットワークに対して結合ネットワークになっている出力ネットワークとのみ結合している入出力関係モデルを用いて、出力データの推定を行うことと等価である。

従って、入力ネットワークと出力ネットワークとの結合が制限されていない入出力関係モデルに対して、結合制限処理を施すことにより、入力ネットワークと出力ネットワークとの結合が制限されている入出力関係モデルと同等の精度で出力データを推定することができる入出力関係モデルを得られることを期待することができる。即ち、結合制限処理によれば、出力データの推定精度の劣化を防止することが可能となる。

次に、上述の入出力関係モデルでは、入力データ（サブ入力データ）の時系列パターンを記憶する時系列パターン記憶ネットワークである入力ネットワークと、出力データ（サブ出力データ）の時系列パターンを記憶する時系列パターン記憶ネットワークである出力ネットワークとを結合するようにしたが、その他、例えば、入力ネットワークどうし、または出力ネットワークどうしをも結合することができる。

そこで、まず最初に、入力ネットワークどうしをも結合した入出力関係モデルについて説明する。

例えば、図２５上側の想定ロボットを制御対象として、その想定ロボットを、入力ネットワークどうしをも結合した入出力関係モデルによって順モデルにモデル化するとする。

ここで、図２５上側の想定ロボットは、上述したように、入力音声データと入力画像データとを含む入力データが与えられると、その入力データに対して、出力音声データと出力モータデータとを含む出力データを出力する。

このため、入出力関係モデルは、図２６で説明したように、入力データに含まれる２つのチャネルのサブ入力データに対応する２つの入力ネットワークnet_in1およびnet_in2と、出力データに含まれる２つのチャネルのサブ出力データに対応する２つの出力ネットワークnet_out1およびnet_out2とから構成する。

また、ここでは、入力データのあるチャネルのサブ入力データと、出力データのあるチャネルのサブ出力データとの間に関係があるかどうかが不明であるとし、入出力関係モデルにおいて、入力ネットワークnet_in1は、出力ネットワークnet_out1およびnet_out2のいずれとも結合し、入力ネットワークnet_in2も、出力ネットワークnet_out1およびnet_out2のいずれとも結合する。

さらに、ここでは、入出力関係モデルにおいて、入力ネットワークnet_in1とnet_in2とを結合する。

この場合、入出力関係モデルは、図４０に示すようになる。

図４０の入出力関係モデルは、入力ネットワークnet_in1およびnet_in2と、出力ネットワークnet_out1およびnet_out2とで構成され、入力ネットワークnet_in1が、出力ネットワークnet_out1およびnet_out2の両方と結合しているとともに、入力ネットワークnet_in2も、出力ネットワークnet_out1およびnet_out2の両方と結合している。さらに、図４０の入出力関係モデルでは、入力ネットワークnet_in1とnet_in2も結合している。

図４１は、図４０の入出力関係モデルについての結合重み行列を示している。

図４０の入出力関係モデルでは、入力ネットワークnet_in1が、出力ネットワークnet_out1およびnet_out2の両方と結合し、入力ネットワークnet_in2も、出力ネットワークnet_out1およびnet_out2の両方と結合しているので、その入出力関係モデルについての結合重み行列としては、上述の図３０左側の入出力関係モデルと同様に、入力ネットワークnet_in1と出力ネットワークnet_out1との間の結合重み行列MTX₁₁（図４１上側の左から２番目）、入力ネットワークnet_in1と出力ネットワークnet_out2との間のMTX₁₂（図４１上側の左から３番目）、入力ネットワークnet_in2と出力ネットワークnet_out1との間の結合重み行列MTX₂₁（図４１下側の左から２番目）、および入力ネットワークnet_in2と出力ネットワークnet_out2との間の結合重み行列MTX₂₂（図４１下側の左から３番目）が存在する。

さらに、図４０の入出力関係モデルでは、入力ネットワークnet_in1とnet_in2が結合しているので、入出力関係モデルについての結合重み行列としては、入力ネットワークnet_in1とnet_in2との間の結合重み行列MTX_in12、即ち、入力ネットワークnet_in1の入力ノードを各行に対応させるとともに、入力ネットワークnet_in2の入力ノードを各列に対応させ、第i行第j列の要素に、入力ネットワークnet_in1のi番目の入力ノードと、入力ネットワークnet_in2のj番目の入力ノードとの結合重みwが配置された結合重み行列MTX_in12（図４１上側の左から１番目）も存在する。

ここで、図４１では、便宜上、図４０の入出力関係モデルについての結合重み行列として、入力ネットワークnet_in2とnet_in1との間の結合重み行列MTX_in21、即ち、入力ネットワークnet_in2の入力ノードを各行に対応させるとともに、入力ネットワークnet_in1の入力ノードを各列に対応させ、第i行第j列の要素に、入力ネットワークnet_in2のi番目の入力ノードと、入力ネットワークnet_in1のj番目の入力ノードとの結合重みwが配置された結合重み行列MTX_in21（図４１下側の左から１番目）も記載してある。

なお、結合重み行列MTX_in12と、結合重み行列MTX_in21とは、行と列とを入れ換えた転置行列の関係にあるので、実装時には、いずれか一方だけで足りる。

図４０の入出力関係モデルの学習は、基本的に、図３２で説明した、図３０の入出力関係モデルの学習と同様に行うことができる。

但し、図３０のステップＳ１４５乃至Ｓ１４７のループ処理において、図３０の入出力関係モデルについては、ノードどうしが結合している入力ネットワークと出力ネットワークとのセットだけを対象に、その入力ネットワークと出力ネットワークとの間の結合重み行列（の要素となっている結合重み）の更新が行われるが、図４０の入出力関係モデルについては、さらに、ノードどうしが結合している入力ネットワークnet_in1とnet_in2とのセットをも対象に、その結合重み行列MTX_in12(MTX_in21)の更新が行われる。

従って、図３０の入出力関係モデルで説明した場合と同様に、図４０の入出力関係モデルの学習において、例えば、入力音声データと出力音声データとの間、および入力画像データと出力モータデータとの間には相関があり、入力音声データと出力モータデータとの間、および入力画像データと出力音声データとの間には相関がない多数の教示データが与えられた場合、入力音声データに対応する入力ネットワークnet_in1と、その入力音声データと相関がある出力音声データに対応する出力ネットワークnet_out1との間の結合重み行列MTX₁₁には、入力音声データと出力音声データとの相関が反映され、その結果、入力ネットワークnet_in1の各入力ノードについては、出力ネットワークnet_out1の特定の出力ノードとの結合重みが、他の出力ノード（との結合重み）に比較して強くなり、かつ、出力ネットワークnet_out1の各出力ノードについても、入力ネットワークnet_in1の特定の入力ノードとの結合重みが、他の入力ノード（との結合重み）に比較して強くなる。

即ち、例えば、音声データ「まる」を入力音声データとして含む入力データと、同じく音声データ「まる」を出力音声データとして含む出力データとがセットになった教示データを多数用いて、図４０の入出力関係モデルの学習を行った場合、入力音声データに対応する入力ネットワークnet_in1のある入力ノードN_in1（が有する時系列パターンモデル２１）は、音声データ「まる」の時系列パターンを表現するようになり、出力音声データに対応する出力ネットワークnet_out1のある出力ノードN_out1（が有する時系列パターンモデル２１）も、音声データ「まる」の時系列パターンを表現するようになる。

さらに、入力ネットワークnet_in1と出力ネットワークnet_out1との間の結合重み行列MTX₁₁には、入力音声データ「まる」と出力音声データ「まる」との相関が反映され、その結果、入力ネットワークnet_in1の、音声データ「まる」の時系列パターンを表現する入力ノードN_in1については、出力ネットワークnet_out1の、音声データ「まる」の時系列パターンを表現する出力ノードN_out1との結合重みが、他の出力ノードに比較して強くなり、かつ、出力ネットワークnet_out1の出力ノードN_out2についても、入力ネットワークnet_in1の入力ノードN_in1との結合重みが、他の入力ノードに比較して強くなる。

同様に、入力画像データに対応する入力ネットワークnet_in2と、その入力画像データと相関がある出力モータデータに対応する出力ネットワークnet_out2との間の結合重み行列MTX₂₂にも、入力画像データと出力モータデータとの相関が反映され、その結果、入力ネットワークnet_in2の各入力ノードについては、出力ネットワークnet_out2の特定の出力ノードとの結合重みが、他の出力ノードに比較して強くなり、かつ、出力ネットワークnet_out2の各出力ノードについても、入力ネットワークnet_in2の特定の入力ノードとの結合重みが、他の入力ノードに比較して強くなる。

即ち、例えば、物体が「まる」の軌道を描く様子が映っている画像データを入力画像データとして含む入力データと、想定ロボットのアームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータ（信号）を出力モータデータとして含む出力データとがセットになった教示データを多数用いて、図４０の入出力関係モデルの学習を行った場合、入力画像データに対応する入力ネットワークnet_in2のある入力ノードN_in2は、「まる」の軌道を描く様子が映っている画像データの時系列パターンを表現するようになり、出力モータデータに対応する出力ネットワークnet_out2のある出力ノードN_out2は、アームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータの時系列パターンを表現するようになる。

さらに、入力ネットワークnet_in2と出力ネットワークnet_out2との間の結合重み行列MTX₂₂には、物体が「まる」の軌道を描く様子が映っている入力画像データと、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータとの相関が反映され、その結果、入力ネットワークnet_in2の、「まる」の軌道を描く様子が映っている画像データの時系列パターンを表現する入力ノードN_in2については、出力ネットワークnet_out2の、アームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータの時系列パターンを表現する出力ノードN_out2との結合重みが、他の出力ノードに比較して強くなり、かつ、出力ネットワークnet_out2の出力ノードN_out2についても、入力ネットワークnet_in2の入力ノードN_in2との結合重みが、他の入力ノードに比較して強くなる。

一方、入力音声データに対応する入力ネットワークnet_in1と、その入力音声データと相関がない出力モータデータに対応する出力ネットワークnet_out2との間の結合重み行列MTX₁₂には、入力音声データと出力モータデータとの相関の小ささが反映され、その結果、入力ネットワークnet_in1の各入力ノードについては、出力ネットワークnet_out2のどの出力ノードとの結合重みも一様に低くなり、かつ、出力ネットワークnet_out2の各出力ノードについても、入力ネットワークnet_in1のどの入力ノードとの結合重みも一様に低くなる。

同様に、入力画像データに対応する入力ネットワークnet_in2と、その入力画像データと相関がない出力音声データに対応する出力ネットワークnet_out1との間の結合重み行列MTX₂₁には、やはり、入力画像データと出力音声データとの相関の小ささが反映され、その結果、入力ネットワークnet_in2の各入力ノードについては、出力ネットワークnet_out1のどの出力ノードとの結合重みも一様に低くなり、かつ、出力ネットワークnet_out1の各出力ノードについても、入力ネットワークnet_in2のどの入力ノードとの結合重みも一様に低くなる。

さらに、図４０の入出力関係モデルの学習に与えられた多数の教示データにおいて、例えば、入力音声データと入力画像データとの間に相関がある場合には、入力音声データに対応する入力ネットワークnet_in1と、その入力音声データと相関がある入力画像データに対応する入力ネットワークnet_in2との間の結合重み行列MTX_in12(MTX_in21)には、入力音声データと入力画像データとの相関が反映され、その結果、入力ネットワークnet_in1の各入力ノードについては、入力ネットワークnet_in2の特定の入力ノードとの結合重みが、入力ネットワークnet_in2の他の入力ノードに比較して強くなり、かつ、入力ネットワークnet_in2の各入力ノードについても、入力ネットワークnet_in1の特定の入力ノードとの結合重みが、入力ネットワークnet_in1の他の入力ノードに比較して強くなる。

即ち、例えば、教示データにおける入力データとして、音声データ「まる」を入力音声データとして含むとともに、物体が「まる」の軌道を描く様子が映っている画像データを入力画像データとして含む入力データを多数用いて、図４０の入出力関係モデルの学習を行った場合、入力音声データに対応する入力ネットワークnet_in1のある入力ノードN_in1は、音声データ「まる」の時系列パターンを表現するようになり、入力画像データに対応する入力ネットワークnet_in2のある入力ノードN_in2は、「まる」の軌道を描く様子が映っている画像データの時系列パターンを表現するようになる。

さらに、入力ネットワークnet_in1と入力ネットワークnet_in2との間の結合重み行列MTX_in12には、入力音声データ「まる」と、物体が「まる」の軌道を描く様子が映っている入力画像データとの相関が反映され、その結果、入力ネットワークnet_in1の、音声データ「まる」の時系列パターンを表現する入力ノードN_in1については、入力ネットワークnet_in2の、「まる」の軌道を描く様子が映っている画像データの時系列パターンを表現する入力ノードN_in2との結合重みが、入力ネットワークnet_in2の他の入力ノードに比較して強くなり、かつ、入力ネットワークnet_in2の入力ノードN_in2についても、入力ネットワークnet_in1の入力ノードN_in1との結合重みが、入力ネットワークnet_in1の他の入力ノードに比較して強くなる。

次に、図４２のフローチャートを参照して、図２１のデータ処理装置が、上述のような学習がされた図４０に示したような入出力関係モデルを用いて、入力データに対する出力データを推定する処理について説明する。なお、ここでも、入出力関係モデルは、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとを有することとする。

ステップＳ２０１乃至Ｓ２０４において、図２９のステップＳ１３１乃至Ｓ１３４とそれぞれ同様の処理が行われ、ステップＳ２０５に進む。

即ち、ステップＳ２０１乃至Ｓ２０４の処理が行われることにより、認識生成部２１３（図２１）の勝者ノード決定部２３２において、m個の入力ネットワークそれぞれについて、勝者ノードが決定されると、ステップＳ２０５に進み、勝者ノード決定部２３２は、図２９のステップＳ１３５と同様にして、m個の入力ネットワークそれぞれについての勝者ノードの中から、有効勝者ノードを決定する。そして、有効勝者ノードの個数が0個である場合には、認識生成部２１３（図２１）は、処理を終了する。

一方、有効勝者ノードの個数が1個以上である場合には、ステップＳ２０５からステップＳ２０６に進み、勝者ノード決定部２３２は、有効勝者ノードと結合している、その有効勝者ノードを有する入力ネットワークとは別の入力ネットワークの入力ノードのうちの、有効勝者ノードとの結合重みが最も強い入力ノードを、準勝者ノードに決定する。

例えば、図４０の入出力関係モデルにおいて、ある有効勝者ノードが、入力ネットワークnet_in1のある入力ノードであるとすると、その有効勝者ノードとの結合重みが最も強い入力ネットワークnet_in2の入力ノードが、準勝者ノードに決定される。

ステップＳ２０６において、勝者ノード決定部２３２は、有効勝者ノードすべてについて、準勝者ノードを決定し、ステップＳ２０７に進む。

ここで、以下、適宜、有効勝者ノードと準勝者ノードとをまとめて、発火ノードという。

ステップＳ２０７では、勝者ノード決定部２３２は、各入力ネットワークについて、多くとも１つの発火ノードを、最適ノードに決定する。

即ち、上述したように、ある有効勝者ノードに対して準勝者ノードに決定された入力ノードを有する入力ネットワークには、他の有効勝者ノードが存在することがあり、この場合、その入力ネットワークには、有効勝者ノードとなっている入力ノードと、準勝者ノードとなっている入力ノードとの２つの発火ノードが存在する。ステップＳ２０７では、１つの入力ネットワークにおける発火ノードを、多くとも１つに制限するために、各入力ネットワークについて、多くとも１つの発火ノードが、最適ノードに決定される。

具体的には、例えば、１つの入力ノードだけが発火ノードになっている入力ネットワークについては、その発火ノードが、最適ノードに決定される。

さらに、例えば、複数の入力ノードが発火ノードになっている入力ネットワークについては、その複数の発火ノードの中に、有効勝者ノードが存在する場合には、その有効勝者ノードが、最適ノードに決定される。

また、複数の発火ノードの中に、有効勝者ノードが存在しない場合、即ち、複数の発火ノードが、すべて、準勝者ノードである場合には、その複数の準勝者ノードについて、準勝者ノードとなっている入力ノードが準勝者ノードに決定されるときに用いられた有効勝者ノードとの結合重みを比較し、その結合重みが最も強い準勝者ノードが、最適ノードに決定される。

以上のように、ステップＳ２０７において、各入力ネットワークについて、多くとも１つの発火ノードが、最適ノードに決定されると、ステップＳ２０８に進み、勝者ノード決定部２３２は、最適ノードとなっている入力ノードを、後述するステップＳ２０９での候補ノードの決定に用いる有効ノードとするかどうかを決定する。

即ち、勝者ノード決定部２３２は、例えば、最適ノードが有効勝者ノードである場合、その最適ノードを、有効ノードに決定する。

また、勝者ノード決定部２３２は、例えば、最適ノードが有効勝者ノードでない場合、つまり、最適ノードが準勝者ノードである場合、その準勝者ノードとなっている入力ノードが準勝者ノードに決定されるときに用いられた有効勝者ノードとの結合重みに基づき、その最適ノードを、有効ノードとするかどうかを決定する。

即ち、勝者ノード決定部２３２は、最適ノードが準勝者ノードである場合、その準勝者ノードとなっている入力ノードが準勝者ノードに決定されるときに用いられた有効勝者ノードとの結合重みを閾値と比較し、結合重みが閾値以上であるときのみ、その最適ノードを、有効ノードに決定する。

勝者ノード決定部２３２は、以上のようにして、１以上の有効ノードを決定し、その有効ノードを表すノードラベルを、生成ノード決定部２３３に供給して、ステップＳ２０８からステップＳ２０９に進む。

ステップＳ２０９では、生成ノード決定部２３３は、図３３のステップＳ１５６と同様に、勝者ノード決定部２３２からの1個以上のノードラベルに基づき、生成ノードの候補となる候補ノードを決定する。

即ち、生成ノード決定部２３３は、勝者ノード決定部２３２からの1個以上のノードラベルのうちの１つを、注目ノードラベルとして選択するとともに、入出力関係モデルのnチャネルの出力ネットワークのうちの１つを、注目出力ネットワークとして選択する。さらに、生成ノード決定部２３３は、注目出力ネットワークのノードの中で、注目ノードラベルが表す有効ノードとの結合重みが最も強い出力ノードを、候補ノードに決定する。

さらに、生成ノード決定部２３３は、勝者ノード決定部２３２からの1個以上のノードラベルを、順次、注目ノードラベルとして選択し、上述したように、候補ノードを決定する。

以上のように、ステップＳ２０９において候補ノードが決定された後は、ステップＳ２１０乃至Ｓ２１３に順次進み、図３３のステップＳ１５７乃至Ｓ１６０とそれぞれ同様の処理が行われ、これにより、出力データが出力される。

ここで、例えば、音声データ「まる」を入力音声データとして含むとともに、任意の画像データを入力画像データとして含む入力データと、音声データ「まる」を出力音声データとして含むとともに、任意のモータデータを出力モータデータとして含む出力データとがセットになった第１の教示データ、任意の音声データを入力音声データとして含むとともに、物体が「まる」の軌道を描く様子が映っている画像データを入力画像データとして含む入力データと、任意の音声データを出力音声データとして含むとともに、想定ロボットのアームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータを出力モータデータとして含む出力データとがセットになった第２の教示データ、音声データ「まる」を入力音声データとして含むとともに、物体が「まる」の軌道を描く様子が映っている画像データを入力画像データとして含む入力データと、任意の出力データとがセットになった第３の教示データとの、合計で３種類の教示データを多数用いて、図４０の入出力関係モデルの学習を行った場合、第１の教示データによって、入力音声データに対応する入力ネットワークnet_in1のある入力ノードN_in1は、音声データ「まる」の時系列パターンを表現するようになり、出力音声データに対応する出力ネットワークnet_out1のある出力ノードN_out1も、音声データ「まる」の時系列パターンを表現するようになる。

さらに、第１の教示データによれば、入力ネットワークnet_in1と出力ネットワークnet_out1との間の結合重み行列MTX₁₁の中で、入力ネットワークnet_in1の、音声データ「まる」の時系列パターンを表現する入力ノードN_in1との結合重みは、出力ネットワークnet_out1の、音声データ「まる」の時系列パターンを表現する出力ノードN_out1との結合重みが最も強くなるように更新される。

また、第２の教示データによって、入力画像データに対応する入力ネットワークnet_in2のある入力ノードN_in2は、「まる」の軌道を描く様子が映っている画像データの時系列パターンを表現するようになり、出力モータデータに対応する出力ネットワークnet_out2のある出力ノードN_out2は、アームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータの時系列パターンを表現するようになる。

さらに、第２の教示データによれば、入力ネットワークnet_in2と出力ネットワークnet_out2との間の結合重み行列MTX₂₂の中で、入力ネットワークnet_in2の、「まる」の軌道を描く様子が映っている画像データの時系列パターンを表現する入力ノードN_in2との結合重みは、出力ネットワークnet_out2の、アームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータの時系列パターンを表現する出力ノードN_out2との結合重みが最も強くなるように更新される。

そして、第３の教示データによって、入力ネットワークnet_in1と入力ネットワークnet_in2との間の結合重み行列MTX_in12の中で、入力ネットワークnet_in1の、音声データ「まる」の時系列パターンを表現する入力ノードN_in1との結合重みは、入力ネットワークnet_in2の、「まる」の軌道を描く様子が映っている画像データの時系列パターンを表現する入力ノードN_in2との結合重みが最も強くなるように更新される。

従って、以上のような学習がされた図４０の入出力関係モデルを用いて、図４２の出力データを推定する処理が行われた場合、例えば、次のような出力データが出力される。

即ち、例えば、音声データ「まる」を入力音声データとして含むとともに、物体が静止している様子が映っている画像データを入力画像データとして含む入力データが、入出力関係モデルに与えられたとすると、ステップＳ２０４において、入力音声データに対応する入力ネットワークnet_in1の、音声データ「まる」の時系列パターンを表現する入力ノードN_in1が勝者ノードに決定される。

さらに、ステップＳ２０５において、勝者ノードとなった入力ノードN_in1が、有効勝者ノードに決定されたとすると、ステップＳ２０６において、入力ネットワークnet_in2の入力ノードのうちの、有効勝者ノードN_in1との結合重みが最も強い入力ノードN_in2が準勝者ノードに決定される。

そして、ステップＳ２０７において、準勝者ノードN_in2が最適ノードに決定され、さらに、ステップＳ２０８において、有効ノードに決定されたとすると、ステップＳ２０９において、出力ネットワークnet_out2の出力ノードのうちの、有効ノードN_in2との結合重みが最も強い出力ノードN_out2が候補ノードに決定される。

この候補ノードN_out2が、ステップＳ２１０において、仮生成ノードに決定され、さらに、ステップＳ２１１において、生成ノードに決定されたとすると、ステップＳ２１２では、その生成ノードN_out2から時系列データが生成され、ステップＳ２１３において、その時系列データが出力される。

その結果、ステップＳ２１３では、生成ノードN_out2が表現する時系列パターンに属する時系列データ、つまり、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータが出力される。

即ち、音声データ「まる」を入力音声データとして含むとともに、物体が静止している様子が映っている画像データを入力画像データとして含む入力データに対して、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータを含む出力データが出力される。

以上のように、図４０の入出力関係モデルによれば、入力ネットワークnet_in1とnet_in2とが結合されていることで、音声データ「まる」を入力音声データとして含む入力データと、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータを含む出力データとがセットになった第４の教示データを与えて、学習を行わなくても、音声データ「まる」を入力音声データとして含む入力データに対して、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータを含む出力データを出力することができる。

即ち、例えば、図４０の入出力関係モデルをロボットに適用したとすると、そのロボットでは、第１乃至第３の教示データを用いた学習を行えば、第４の教示データを用いた学習を行わなくても、音声データ「まる」を入力音声データとして含む入力データに対して、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータを含む出力データを出力することができる。

つまり、第１の教示データを用いた学習は、音声「まる」を聴いた場合に、音声「まる」を出力することを、ロボットに教えることに相当する。また、第２の教示データを用いた学習は、物体が「まる」の軌道を描くシーンを見た場合に、アームの先端の位置が「まる」の軌道を描くようにモータを駆動して、アームを動かすことを、ロボットに教えることに相当する。さらに、第３の教示データを用いた学習は、音声「まる」と、物体が「まる」の軌道を描くシーンとに関係あることを、ロボットに教えることに相当する。

そして、第４の教示データを用いた学習は、音声「まる」を聴いた場合に、アームの先端の位置が「まる」の軌道を描くようにモータを駆動して、アームを動かすことを、ロボットに教えることに相当する。

図４０の入出力関係モデルを適用したロボットによれば、第１乃至第３の教示データを用いた学習を行えば、第４の教示データを用いた学習を行わなくても、即ち、音声「まる」を聴いた場合に、アームの先端の位置が「まる」の軌道を描くようにモータを駆動して、アームを動かすことを教えなくても、音声「まる」を聴いた場合に、アームの先端の位置が「まる」の軌道を描くようにモータを駆動して、アームを動かすことができる。

つまり、ロボットは、ある入力に対して行うことを教えられていない行動を行うことができる。

以上のように、入出力関係モデルにおいて、入力ネットワークどうしをも結合することにより、いわば、あるサブ入力データから他のサブ入力データを推定することが可能となる。例えば、音声「まる」が入力されると、物体が「まる」の軌道を描きながら動いているシーン（画像）を推定することが可能となる。また、例えば、物体が「まる」の軌道を描きながら動いている画像が入力されると、音声「まる」を推定することができる。

その結果、例えば、入力データに、あるサブ入力データaが存在しない場合に、他のサブ入力データbから、サブ入力データaを推定して、入力データにサブ入力データaが存在するとして、入力データを扱い、あるいは、入力データに、あるサブ入力データaが含まれているが、そのサブ入力データaが雑音などで乱されている場合に、他のサブ入力データbから、雑音がないサブ入力データaを推定すること等が可能となる。

なお、図４０の入出力関係モデルによれば、例えば、上述したように、入力音声データに対して、その入力音声データに関係がある入力画像データを、いわば媒介として、その入力画像データに関係がある出力モータデータを推定することができるので、サブ入力データに対して複雑な関係にあるサブ出力データを推定することが可能となる。

次に、出力ネットワークどうしをも結合した入出力関係モデルについて説明する。

例えば、入力ネットワークどうしをも結合した入出力関係モデルと同様に、図２５上側の想定ロボットを制御対象として、その想定ロボットを、出力ネットワークどうしをも結合した入出力関係モデルによって順モデルにモデル化するとする。

この場合も、入出力関係モデルは、図２６で説明したように、入力データに含まれる入力音声データと入力画像データにそれぞれ対応する入力ネットワークnet_in1とnet_in2、および出力データに含まれる出力音声データと出力モータデータにそれぞれ対応する出力ネットワークnet_out1とnet_out2とから構成される。

なお、ここでも、入力ネットワークどうしをも結合した入出力関係モデルと同様に、入力データのあるチャネルのサブ入力データと、出力データのあるチャネルのサブ出力データとの間に関係があるかどうかが不明であるとし、入出力関係モデルにおいて、入力ネットワークnet_in1は、出力ネットワークnet_out1およびnet_out2のいずれとも結合し、入力ネットワークnet_in2も、出力ネットワークnet_out1およびnet_out2のいずれとも結合する。

さらに、ここでは、入出力関係モデルにおいて、出力ネットワークnet_out1とnet_out2も結合する。

この場合、入出力関係モデルは、図４３に示すようになる。

図４３の入出力関係モデルは、入力ネットワークnet_in1およびnet_in2と、出力ネットワークnet_out1およびnet_out2とで構成され、入力ネットワークnet_in1が、出力ネットワークnet_out1およびnet_out2の両方と結合しているとともに、入力ネットワークnet_in2も、出力ネットワークnet_out1およびnet_out2の両方と結合している。さらに、図４３の入出力関係モデルでは、出力ネットワークnet_out1とnet_out2も結合している。

図４４は、図４３の入出力関係モデルについての結合重み行列を示している。

図４３の入出力関係モデルでは、入力ネットワークnet_in1が、出力ネットワークnet_out1およびnet_out2の両方と結合し、入力ネットワークnet_in2も、出力ネットワークnet_out1およびnet_out2の両方と結合しているので、その入出力関係モデルについての結合重み行列としては、上述の図３０左側の入出力関係モデルと同様に、入力ネットワークnet_in1と出力ネットワークnet_out1との間の結合重み行列MTX₁₁（図４４上側の左から１番目）、入力ネットワークnet_in1と出力ネットワークnet_out2との間のMTX₁₂（図４４上側の左から２番目）、入力ネットワークnet_in2と出力ネットワークnet_out1との間の結合重み行列MTX₂₁（図４４下側の左から１番目）、および入力ネットワークnet_in2と出力ネットワークnet_out2との間の結合重み行列MTX₂₂（図４４下側の左から２番目）が存在する。

さらに、図４３の入出力関係モデルでは、出力ネットワークnet_out1とnet_out2が結合しているので、入出力関係モデルについての結合重み行列としては、出力ネットワークnet_out1とnet_out2との間の結合重み行列MTX_out12、即ち、出力ネットワークnet_out1の出力ノードを各行に対応させるとともに、出力ネットワークnet_out2の出力ノードを各列に対応させ、第i行第j列の要素に、出力ネットワークnet_out1のi番目の出力ノードと、出力ネットワークnet_out2のj番目の出力ノードとの結合重みwが配置された結合重み行列MTX_out12（図４４上側の左から３番目）も存在する。

ここで、図４４では、便宜上、図４３の入出力関係モデルについての結合重み行列として、出力ネットワークnet_out2とnet_out1との間の結合重み行列MTX_out21、即ち、出力ネットワークnet_out2の出力ノードを各行に対応させるとともに、出力ネットワークnet_out1の出力ノードを各列に対応させ、第i行第j列の要素に、出力ネットワークnet_out2のi番目の出力ノードと、出力ネットワークnet_out1のj番目の出力ノードとの結合重みwが配置された結合重み行列MTX_out21（図４４下側の左から３番目）も記載してある。

なお、結合重み行列MTX_out12と、結合重み行列MTX_out21とは、行と列とを入れ換えた転置行列の関係にあるので、実装時には、いずれか一方だけで足りる。

図４３の入出力関係モデルの学習は、基本的に、図３２で説明した、図３０の入出力関係モデルの学習と同様に行うことができる。

但し、図３０のステップＳ１４５乃至Ｓ１４７のループ処理において、図３０の入出力関係モデルについては、ノードどうしが結合している入力ネットワークと出力ネットワークとのセットだけを対象に、その入力ネットワークと出力ネットワークとの間の結合重み行列（の要素となっている結合重み）の更新が行われるが、図４３の入出力関係モデルについては、さらに、ノードどうしが結合している出力ネットワークnet_out1とnet_out2とのセットをも対象に、その結合重み行列MTX_out12(MTX_out21)の更新が行われる。

従って、図３０の入出力関係モデルで説明した場合と同様に、図４３の入出力関係モデルの学習において、例えば、入力音声データと出力音声データとの間、および入力画像データと出力モータデータとの間には相関があり、入力音声データと出力モータデータとの間、および入力画像データと出力音声データとの間には相関がない多数の教示データが与えられた場合、入力音声データに対応する入力ネットワークnet_in1と、その入力音声データと相関がある出力音声データに対応する出力ネットワークnet_out1との間の結合重み行列MTX₁₁には、入力音声データと出力音声データとの相関が反映され、その結果、入力ネットワークnet_in1の各入力ノードについては、出力ネットワークnet_out1の特定の出力ノードとの結合重みが、他の出力ノードに比較して強くなり、かつ、出力ネットワークnet_out1の各出力ノードについても、入力ネットワークnet_in1の特定の入力ノードとの結合重みが、他の入力ノードに比較して強くなる。

即ち、例えば、音声データ「まる」を入力音声データとして含む入力データと、同じく音声データ「まる」を出力音声データとして含む出力データとがセットになった教示データを多数用いて、図４３の入出力関係モデルの学習を行った場合、入力音声データに対応する入力ネットワークnet_in1のある入力ノードN_in1（が有する時系列パターンモデル２１）は、音声データ「まる」の時系列パターンを表現するようになり、出力音声データに対応する出力ネットワークnet_out1のある出力ノードN_out1（が有する時系列パターンモデル２１）も、音声データ「まる」の時系列パターンを表現するようになる。

即ち、例えば、物体が「まる」の軌道を描く様子が映っている画像データを入力画像データとして含む入力データと、想定ロボットのアームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータ（信号）を出力モータデータとして含む出力データとがセットになった教示データを多数用いて、図４３の入出力関係モデルの学習を行った場合、入力画像データに対応する入力ネットワークnet_in2のある入力ノードN_in2は、「まる」の軌道を描く様子が映っている画像データの時系列パターンを表現するようになり、出力モータデータに対応する出力ネットワークnet_out2のある出力ノードN_out2は、アームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータの時系列パターンを表現するようになる。

さらに、図４３の入出力関係モデルの学習に与えられた多数の教示データにおいて、例えば、出力音声データと出力モータデータとの間に相関がある場合には、出力音声データに対応する出力ネットワークnet_out1と、その出力音声データと相関がある出力モータデータに対応する出力ネットワークnet_out2との間の結合重み行列MTX_out12(MTX_out21)には、出力音声データと出力モータデータとの相関が反映され、その結果、出力ネットワークnet_out1の各出力ノードについては、出力ネットワークnet_out2の特定の出力ノードとの結合重みが、出力ネットワークnet_out2の他の出力ノードに比較して強くなり、かつ、出力ネットワークnet_out2の各出力ノードについても、出力ネットワークnet_out1の特定の出力ノードとの結合重みが、出力ネットワークnet_out1の他の出力ノードに比較して強くなる。

即ち、例えば、教示データにおける出力データとして、音声データ「まる」を出力音声データとして含むとともに、アームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータを出力モータデータとして含む出力データを多数用いて、図４３の入出力関係モデルの学習を行った場合、出力音声データに対応する出力ネットワークnet_out1のある出力ノードN_out1は、音声データ「まる」の時系列パターンを表現するようになり、出力モータデータに対応する出力ネットワークnet_out2のある出力ノードN_out2は、アームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータの時系列パターンを表現するようになる。

さらに、出力ネットワークnet_out1と出力ネットワークnet_out2との間の結合重み行列MTX_out12には、出力音声データ「まる」と、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータとの相関が反映され、その結果、出力ネットワークnet_out1の、音声データ「まる」の時系列パターンを表現する出力ノードN_out1については、出力ネットワークnet_out2の、アームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータの時系列パターンを表現する出力ノードN_out2との結合重みが、出力ネットワークnet_out2の他の出力ノードに比較して強くなり、かつ、出力ネットワークnet_out2の出力ノードN_out2についても、出力ネットワークnet_out1の出力ノードN_out1との結合重みが、出力ネットワークnet_out1の他の出力ノードに比較して強くなる。

次に、図４５のフローチャートを参照して、図２１のデータ処理装置が、上述のような学習がされた図４３に示したような入出力関係モデルを用いて、入力データに対する出力データを推定する処理について説明する。なお、入出力関係モデルは、mチャネルの入力ネットワークと、nチャネルの出力ネットワークとを有することとする。

ステップＳ２２１乃至Ｓ２２７において、図３３のステップＳ１５１乃至Ｓ１５７とそれぞれ同様の処理が行われ、これにより、生成ノード決定部２３３（図２１）は、仮生成ノードを決定して、ステップＳ２２８に進む。

ステップＳ２２８では、生成ノード決定部２３３は、仮生成ノードから、有効生成ノードを決定する。ここで、仮生成ノードから有効生成ノードを決定する方法としては、図３３のステップＳ１５８において、仮生成ノードから生成ノードを最終的に決定する場合と同様の方法を採用することができる。

ステップＳ２２８において、有効生成ノードが決定されると、ステップＳ２２９に進み、生成ノード決定部２３３は、有効生成ノードと結合している、その有効生成ノードを有する出力ネットワークとは別の出力ネットワークの出力ノードのうちの、有効生成ノードとの結合重みが最も強い出力ノードを、準生成ノードに決定する。

例えば、図４３の入出力関係モデルにおいて、ある有効生成ノードが、出力ネットワークnet_out1のある出力ノードであるとすると、その有効生成ノードとの結合重みが最も強い出力ネットワークnet_out2の出力ノードが、準生成ノードに決定される。

ステップＳ２２９において、生成ノード決定部２３３は、有効生成ノードすべてについて、準生成ノードを決定し、ステップＳ２３０に進む。

ここで、以下、適宜、有効生成ノードと準生成ノードとについても、それらをまとめて、発火ノードという。

ステップＳ２３０では、生成ノード決定部２３３は、各出力ネットワークについて、多くとも１つの発火ノードを、最適ノードに決定する。

即ち、上述したように、ある有効生成ノードに対して準生成ノードに決定された出力ノードを有する出力ネットワークには、他の有効生成ノードが存在することがあり、この場合、その出力ネットワークには、有効生成ノードとなっている出力ノードと、準生成ノードとなっている出力ノードとの２つの発火ノードが存在する。ステップＳ２３０では、１つの出力ネットワークにおける発火ノードを、多くとも１つに制限するために、各出力ネットワークについて、多くとも１つの発火ノードが、最適ノードに決定される。

具体的には、例えば、１つの出力ノードだけが発火ノードになっている出力ネットワークについては、その発火ノードが、最適ノードに決定される。

さらに、例えば、複数の出力ノードが発火ノードになっている出力ネットワークについては、その複数の発火ノードの中に、有効生成ノードが存在する場合には、その有効生成ノードが、最適ノードに決定される。

また、複数の発火ノードの中に、有効生成ノードが存在しない場合、即ち、複数の発火ノードが、すべて、準生成ノードである場合には、その複数の準生成ノードについて、準生成ノードとなっている出力ノードが準生成ノードに決定されるときに用いられた有効生成ノードとの結合重みを比較し、その結合重みが最も強い準生成ノードが、最適ノードに決定される。

以上のように、ステップＳ２３０において、各出力ネットワークについて、多くとも１つの発火ノードが、最適ノードに決定されると、ステップＳ２３１に進み、生成ノード決定部２３４は、最適ノードとなっている出力ノードを、時系列データを生成するのに用いる生成ノードとするかどうかを決定する。

即ち、生成ノード決定部２３３は、例えば、最適ノードが有効生成ノードである場合、その最適ノードを、生成ノードに決定する。

また、生成ノード決定部２３３は、例えば、最適ノードが有効生成ノードでない場合、つまり、最適ノードが準生成ノードである場合、その準生成ノードとなっている出力ノードが準生成ノードに決定されるときに用いられた有効生成ノードとの結合重みに基づき、その最適ノードを、生成ノードとするかどうかを決定する。

即ち、生成ノード決定部２３３は、最適ノードが準生成ノードである場合、その準生成ノードとなっている出力ノードが準生成ノードに決定されるときに用いられた有効生成ノードとの結合重みを閾値と比較し、結合重みが閾値以上であるときのみ、その最適ノードを、生成ノードに決定する。

生成ノード決定部２３３は、以上のようにして、１以上の生成ノードを決定し、その生成ノードを表すノードラベルを、時系列生成部２３４（図２１）に供給する。

そして、ステップＳ２３１からステップＳ２３２，Ｓ２３３に順次進み、図３３のステップＳ１５９，Ｓ１６０とそれぞれ同様の処理が行われ、これにより、出力データが出力される。

ここで、例えば、音声データ「まる」を入力音声データとして含むとともに、任意の画像データを入力画像データとして含む入力データと、音声データ「まる」を出力音声データとして含むとともに、任意のモータデータを出力モータデータとして含む出力データとがセットになった第１の教示データ、任意の音声データを入力音声データとして含むとともに、物体が「まる」の軌道を描く様子が映っている画像データを入力画像データとして含む入力データと、任意の音声データを出力音声データとして含むとともに、想定ロボットのアームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータを出力モータデータとして含む出力データとがセットになった第２の教示データ、任意の入力データと、音声データ「まる」を出力音声データとして含むとともに、想定ロボットのアームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータを出力モータデータとして含む出力データとがセットになった第３の教示データとの、合計で３種類の教示データを多数用いて、図４３の入出力関係モデルの学習を行った場合、第１の教示データによって、入力音声データに対応する入力ネットワークnet_in1のある入力ノードN_in1は、音声データ「まる」の時系列パターンを表現するようになり、出力音声データに対応する出力ネットワークnet_out1のある出力ノードN_out1も、音声データ「まる」の時系列パターンを表現するようになる。

そして、第３の教示データによって、出力ネットワークnet_out1と出力ネットワークnet_out2との間の結合重み行列MTX_out12の中で、出力ネットワークnet_out1の、音声データ「まる」の時系列パターンを表現する出力ノードN_out1との結合重みは、出力ネットワークnet_out2の、アームの先端の位置が「まる」の軌道を描くようにモータを駆動するモータデータの時系列パターンを表現する出力ノードN_out2との結合重みが最も強くなるように更新される。

従って、以上のような学習がされた図４３の入出力関係モデルを用いて、図４５の出力データを推定する処理が行われた場合、例えば、次のような出力データが出力される。

即ち、例えば、音声データ「まる」を入力音声データとして含むとともに、物体が静止している様子が映っている画像データを入力画像データとして含む入力データが、入出力関係モデルに与えられたとすると、ステップＳ２２４において、入力音声データに対応する入力ネットワークnet_in1の、音声データ「まる」の時系列パターンを表現する入力ノードN_in1が勝者ノードに決定される。

さらに、ステップＳ２２５において、勝者ノードとなった入力ノードN_in1が、有効勝者ノードに決定されたとすると、ステップＳ２２６において、出力ネットワークnet_out1の出力ノードのうちの、有効勝者ノードN_in1との結合重みが最も強い出力ノードN_out1が候補ノードに決定される。

そして、ステップＳ２２７において、候補ノードN_out1が仮生成ノードに決定され、さらに、ステップＳ２２８において、有効生成ノードに決定されたとすると、ステップＳ２２９において、出力ネットワークnet_out2の出力ノードのうちの、有効生成ノードN_out1との結合重みが最も強い出力ノードN_out2が準生成ノードに決定される。

さらに、ステップＳ２３０において、準生成ノードN_out2が、最適ノードに決定され、その後、ステップＳ２３１において、生成ノードに決定されたとすると、ステップＳ２３２では、その生成ノードN_out2から時系列データが生成され、ステップＳ２３３において、その時系列データが出力される。

その結果、ステップＳ２３３では、生成ノードN_out2が表現する時系列パターンに属する時系列データ、つまり、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータが出力される。

以上のように、図４３の入出力関係モデルによれば、出力ネットワークnet_out1とnet_out2とが結合されていることで、音声データ「まる」を入力音声データとして含む入力データと、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータを含む出力データとがセットになった第４の教示データを与えて、学習を行わなくても、音声データ「まる」を入力音声データとして含む入力データに対して、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータを含む出力データを出力することができる。

即ち、例えば、図４３の入出力関係モデルをロボットに適用したとすると、そのロボットでは、第１乃至第３の教示データを用いた学習を行えば、第４の教示データを用いた学習を行わなくても、音声データ「まる」を入力音声データとして含む入力データに対して、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータを含む出力データを出力することができる。

つまり、第１の教示データを用いた学習は、音声「まる」を聴いた場合に、音声「まる」を出力することを、ロボットに教えることに相当する。また、第２の教示データを用いた学習は、物体が「まる」の軌道を描くシーンを見た場合に、アームの先端の位置が「まる」の軌道を描くようにモータを駆動して、アームを動かすことを、ロボットに教えることに相当する。さらに、第３の教示データを用いた学習は、音声「まる」の出力と、アームの先端の位置が「まる」の軌道を描くようにモータを駆動して、アームを動かすこととに関係あることを、ロボットに教えることに相当する。

図４３の入出力関係モデルを適用したロボットによれば、第１乃至第３の教示データを用いた学習を行えば、第４の教示データを用いた学習を行わなくても、即ち、音声「まる」を聴いた場合に、アームの先端の位置が「まる」の軌道を描くようにモータを駆動して、アームを動かすことを教えなくても、音声「まる」を聴いた場合に、アームの先端の位置が「まる」の軌道を描くようにモータを駆動して、アームを動かすことができる。

以上のように、入出力関係モデルにおいて、出力ネットワークどうしをも結合することにより、いわば、あるサブ出力データから他のサブ出力データを推定することが可能となる。例えば、音声「まる」を出力するときに、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータを推定し、その出力モータデータにしたがってアームを動かすことが可能となる。また、アームの先端の位置が「まる」の軌道を描くようにモータを駆動する出力モータデータを出力するときに、音声「まる」の出力音声データを推定して、音声「まる」を出力することも可能となる。

なお、図４３の入出力関係モデルによれば、例えば、上述したように、入力音声データに対して、その入力音声データに関係がある出力音声データを、いわば媒介として、その入力音声データに関係がある出力モータデータを推定することができるので、サブ入力データに対して複雑な関係にあるサブ出力データを推定することが可能となる。

以上のように、図２１のデータ処理装置の学習部２１２によれば、複数の入力ネットワークと複数の出力ネットワークとを有し、入力ネットワークの入力ノードと、出力ネットワークの出力ノードとが結合されている入出力関係モデル（結合モデル）における複数の入力ネットワークそれぞれを、入力ネットワークの数と同一の数のチャネルのサブ入力データを含む入力データの、対応するチャネルのサブ入力データに基づいて、自己組織的に更新するとともに、複数の出力ネットワークそれぞれを、出力ネットワークの数と同一の数のチャネルのサブ出力データを含む出力データの、対応するチャネルのサブ出力データに基づいて、自己組織的に更新し、入力ネットワークの入力ノードのうちの、その入力ネットワークに対応するチャネルのサブ入力データに最も適合する勝者ノードと、出力ネットワークの各出力ノードとの結合関係を更新するとともに、出力ネットワークの出力ノードのうちの、その出力ネットワークに対応するチャネルのサブ出力データに最も適合する勝者ノードと、入力ネットワークの各入力ノードとの結合関係を更新するようにしたので、時系列データの教師なし学習、さらには、時系列データである入力データと出力データとの関係の学習を、容易に行うことができる。さらに、その結果、線形システムによっては正確にモデル化することができないような制御対象について、精度の良い順モデルや逆モデルを、容易に得ることができる。

また、図２１のデータ処理装置の認識生成部２１３によれば、上述のような入出力関係モデルにおける複数の入力ネットワークそれぞれについて、入力ネットワークの数と同一の数のチャネルのサブ時系列データを含む時系列データのうちの、対応するチャネルのサブ時系列データに最も適合する勝者ノードを決定し、出力ネットワークの出力ノードの中から、勝者ノードとの結合が最強のノードを、時系列データを生成する生成ノードとして決定して、その生成ノードが有する時系列パターンモデルに基づいて、時系列データを生成するので、制御対象が、ある時系列データの入力に対して出力する時系列データを、精度良く推定することができる。

さらに、図２１のデータ処理装置の認識生成部２１３によれば、上述のような入出力関係モデルにおける複数の出力ネットワークそれぞれについて、出力ネットワークの数と同一の数のチャネルのサブ時系列データを含む時系列データのうちの、対応するチャネルのサブ時系列データに最も適合する勝者ノードを決定し、入力ネットワークの入力ノードの中から、勝者ノードとの結合が最強のノードを、時系列データを生成する生成ノードとして決定して、その生成ノードが有する時系列パターンモデルに基づいて、時系列データを生成することもでき、この場合、制御対象に、目標値としての時系列データ（出力データ）を出力させるのに入力する必要がある時系列データ（入力データ（制御データ））を、精度良く推定することができる。

次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。

そこで、図４６は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。

プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク３０５やＲＯＭ３０３に予め記録しておくことができる。

あるいはまた、プログラムは、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)，MO(Magneto Optical)ディスク，DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体３１１に、一時的あるいは永続的に格納（記録）しておくことができる。このようなリムーバブル記録媒体３１１は、いわゆるパッケージソフトウエアとして提供することができる。

なお、プログラムは、上述したようなリムーバブル記録媒体３１１からコンピュータにインストールする他、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部３０８で受信し、内蔵するハードディスク３０５にインストールすることができる。

コンピュータは、CPU(Central Processing Unit)３０２を内蔵している。CPU３０２には、バス３０１を介して、入出力インタフェース３１０が接続されており、CPU３０２は、入出力インタフェース３１０を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部３０７が操作等されることにより指令が入力されると、それにしたがって、ROM(Read Only Memory)３０３に格納されているプログラムを実行する。あるいは、また、CPU３０２は、ハードディスク３０５に格納されているプログラム、衛星若しくはネットワークから転送され、通信部３０８で受信されてハードディスク３０５にインストールされたプログラム、またはドライブ３０９に装着されたリムーバブル記録媒体３１１から読み出されてハードディスク３０５にインストールされたプログラムを、RAM(Random Access Memory)３０４にロードして実行する。これにより、CPU３０２は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU３０２は、その処理結果を、必要に応じて、例えば、入出力インタフェース３１０を介して、LCD(Liquid Crystal Display)やスピーカ等で構成される出力部３０６から出力、あるいは、通信部３０８から送信、さらには、ハードディスク３０５に記録等させる。

ここで、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含むものである。

また、プログラムは、１のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。

なお、本実施の形態では、入出力関係モデルを、複数の入力ネットワークと複数の出力ネットワークとで構成するようにしたが、入出力関係モデルは、その他、１つの入力ネットワークと１つの出力ネットワークとで構成することは勿論、１つの入力ネットワークと複数の出力ネットワークとで構成することもできるし、複数の入力ネットワークと１つの出力ネットワークとで構成することもできる。

さらに、入出力関係モデルにおいて、入力ネットワークと出力ネットワークとを、どのように結合するか、つまり、ノードどうしを結合する入力ネットワークと出力ネットワークをどのように選択するかは、特に限定されるものではない。

即ち、入出力関係モデルでは、１つの入力ネットワークに注目した場合に、その１つの入力ネットワークを、１つの出力ネットワークのみに結合しても良いし、２以上の出力ネットワーク（入力関係モデルが有するすべての出力ネットワークを含む）それぞれに結合しても良い。さらに、１つの出力ネットワークに注目した場合に、その１つの出力ネットワークを、１つの入力ネットワークのみと結合しても良いし、２以上の入力ネットワーク（入力関係モデルが有するすべての入力ネットワークを含む）それぞれに結合しても良い。

また、入出力関係モデルでは、上述したように、入力ネットワークと出力ネットワークとを結合するとともに、入力ネットワークどうしを結合し、または、出力ネットワークどうしを結合する他、入力ネットワークどうしを結合し、かつ、出力ネットワークどうしも結合しても良い。

さらに、入出力関係モデルを用いて出力データを推定する、例えば、図３３等で説明した方法は、一例であり、その方法に限定されるものではない。即ち、例えば、図３３では、１つの出力ネットワークについて、多くとも１つの出力ノードを生成ノードに決定し、その１つの生成ノードを用いてサブ出力データを生成するようにしたが、その他、例えば、１つの出力ネットワークについて、複数の出力ノードを生成ノードに決定し、その複数の生成ノードを用いてサブ出力データを生成することが可能である。

また、サブデータ（サブ入力データ、サブ出力データ）とするデータは、上述したデータに限定されるものではない。

さらに、サブデータは、あるデータの一部であっても良いし、異なる２種類のデータであっても良い。即ち、例えば、ケプストラムの一部としての高次のケプストラム係数を１つのサブデータとし、ケプストラム係数の他の一部としての低次のケプストラム係数を他の１つのサブデータとすることができる。さらに、例えば、異なる２種類のデータとしてのケプストラム係数とメルケプストラム係数とを要素としたベクトルを、１つのサブデータとすることもできる。

なお、入力データまたは出力データに含まれる複数のサブデータとして、異なるモーダルのデータ（信号）を採用することにより、入出力関係モデルによって、マルチモーダルの入力データと出力データとの関係を学習し、さらに、マルチモーダルの入力データに対して、その入力データと関係があるマルチモーダルの出力データを出力することが可能となる。

これにより、例えば、ユーザがロボットを見ずに話をしているとき、つまり、ユーザの音声と、ユーザの視線がロボットの方向を向いているユーザの画像ではない画像の入力があったときは、何らの反応もしないが、ユーザがロボットを見ながら話をしているとき、つまり、ユーザの音声と、ユーザの視線がロボットの方向を向いているユーザの画像の入力があったは、ユーザの音声に応答する音声を出力し、かつ、その応答する音声に関係するような動きをするロボットを、容易に実現することができる。

制御対象と、順モデルおよび逆モデルとを説明するための図である。制御対象としての想定ロボットと、その想定ロボットの順モデルとを示す図である。制御対象としてのロボットのアームと、そのアームの逆モデルを利用したアーム制御器とを示す図である。線形システムを用いたモデル化を説明するための図である。従来の教師あり学習の一例を説明するための図である。時系列パターン記憶ネットワークの第１の構成例を示す図である。ノードの構成例を示す図である。時系列パターン記憶ネットワークの第２の構成例を示す図である。時系列パターン記憶ネットワークの第３の構成例を示す図である。時系列パターン記憶ネットワークを用いた処理を行うデータ処理装置の構成例を示すブロック図である。学習部４の構成例を示すブロック図である。学習処理部３２の構成例を示すブロック図である。更新重みを決定する決定方法を説明するための図である。学習データ記憶部２２に記憶させる学習データを更新する更新方法を説明するための図である。学習処理を説明するフローチャートである。認識部３の構成例を示すブロック図である。認識処理を説明するフローチャートである。生成部６の構成例を示すブロック図である。生成処理を説明するフローチャートである。入出力関係モデルの構成例を示す図である。入出力関係モデルを用いた処理を行うデータ処理装置の構成例を示すブロック図である。入出力関係モデルの学習を説明するフローチャートである。結合重み行列を示す図である。入出力関係モデルを用いて、出力データまたは制御データを推定する処理を説明するフローチャートである。制御対象としての想定ロボットと、その想定ロボットの順モデルとしての入出力関係モデルとを示す図である。想定ロボットの順モデルとしての入出力関係モデルを示す図である。入出力関係モデルを示す図である。入出力関係モデルの学習を説明するためのフローチャートである。入出力関係モデルを用いて出力データを推定する処理を説明するフローチャートである。入出力関係モデルを示す図である。入出力関係モデルにおける時系列パターン記憶ネットワークのノードの結合重みを説明するための図である。入出力関係モデルの学習を説明するためのフローチャートである。入出力関係モデルを用いて出力データを推定する処理を説明するフローチャートである。制御対象としての想定ロボットを示す図である。想定ロボットの順モデルとしての入出力関係モデルを示す図である。入出力関係モデルを示す図である。入出力関係モデルを用いて出力データを推定する処理を説明するフローチャートである。シミュレーションの結果を示す図である。結合制限処理を説明するフローチャートである。入出力関係モデルを示す図である。結合重み行列を示す図である。入出力関係モデルを用いて出力データを推定する処理を説明するフローチャートである。入出力関係モデルを示す図である。結合重み行列を示す図である。入出力関係モデルを用いて出力データを推定する処理を説明するフローチャートである。本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

符号の説明

１信号入力部，２特徴抽出部，３認識部，４学習部，５記憶部，６生成部，２１時系列パターンモデル，２２学習データ記憶部，３１時系列データ記憶部，３２学習処理部，４１スコア計算部，４２勝者ノード決定部，４３重み決定部，４４学習データ更新部，４５モデル学習部，５１スコア計算部，５２勝者ノード決定部，５３出力部，６１生成ノード決定部，６２時系列決定部，６３出力部，２１１記憶部，２１２学習部，２１３認識生成部，２２１学習処理部，２２２結合重み更新部，２３１スコア計算部，２３２勝者ノード決定部，２３３生成ノード決定部，２３４時系列生成部，３０１バス，３０２ CPU，３０３ ROM，３０４ RAM，３０５ハードディスク，３０６出力部，３０７入力部，３０８通信部，３０９ドライブ，３１０入出力インタフェース，３１１リムーバブル記録媒体

Claims

時系列のデータである時系列データに基づき、学習を行う学習装置において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記入力時系列パターン記憶ネットワークそれぞれを、前記入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む前記入力データの、対応するチャネルの前記サブ入力データに基づいて、自己組織的に更新するとともに、複数の前記出力時系列パターン記憶ネットワークそれぞれを、前記出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む前記出力データの、対応するチャネルの前記サブ出力データに基づいて、自己組織的に更新する学習手段と、
前記入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新手段と
を備えることを特徴とする学習装置。
１の前記入力時系列パターン記憶ネットワークの前記ノードは、１の前記出力時系列パターン記憶ネットワークのみの前記ノードと結合している
ことを特徴とする請求項１に記載の学習装置。
１の前記出力時系列パターン記憶ネットワークの前記ノードは、１の前記入力時系列パターン記憶ネットワークのみの前記ノードと結合している
ことを特徴とする請求項１に記載の学習装置。
１の前記入力時系列パターン記憶ネットワークの前記ノードは、２以上の前記出力時系列パターン記憶ネットワークそれぞれの前記ノードと結合している
ことを特徴とする請求項１に記載の学習装置。
１の前記出力時系列パターン記憶ネットワークの前記ノードは、２以上の前記入力時系列パターン記憶ネットワークそれぞれの前記ノードと結合している
ことを特徴とする請求項１に記載の学習装置。
複数の前記入力時系列パターン記憶ネットワークの前記ノードは、すべての前記出力時系列パターン記憶ネットワークの前記ノードと結合している
ことを特徴とする請求項１に記載の学習装置。
前記結合関係更新手段は、前記入力時系列パターン記憶ネットワークの入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を、その出力時系列パターン記憶ネットワークの各ノードと前記出力勝者ノードとの間の所定の距離に基づいて更新するとともに、前記出力時系列パターン記憶ネットワークの出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を、その入力時系列パターン記憶ネットワークの各ノードと前記入力勝者ノードとの間の所定の距離に基づいて更新する
ことを特徴とする請求項１に記載の学習装置。
前記入力時系列パターン記憶ネットワークどうしのノードも結合しており、
前記結合関係更新手段は、さらに、１の入力時系列パターン記憶ネットワークのノードのうちの、前記１の入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである第１の入力勝者ノードと、他の１の入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記他の１の入力時系列パターン記憶ネットワークのノードのうちの、前記他の１の入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである第２の入力勝者ノードと、前記１の入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する
ことを特徴とする請求項１に記載の学習装置。
前記出力時系列パターン記憶ネットワークどうしのノードも結合しており、
前記結合関係更新手段は、さらに、１の出力時系列パターン記憶ネットワークのノードのうちの、前記１の出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである第１の出力勝者ノードと、他の１の出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記他の１の出力時系列パターン記憶ネットワークのノードのうちの、前記他の１の出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである第２の出力勝者ノードと、前記１の出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する
ことを特徴とする請求項１に記載の学習装置。
時系列のデータである時系列データに基づき、学習を行う学習方法において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記入力時系列パターン記憶ネットワークそれぞれを、前記入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む前記入力データの、対応するチャネルの前記サブ入力データに基づいて、自己組織的に更新するとともに、複数の前記出力時系列パターン記憶ネットワークそれぞれを、前記出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む前記出力データの、対応するチャネルの前記サブ出力データに基づいて、自己組織的に更新する学習ステップと、
前記入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新ステップと
を含むことを特徴とする学習方法。
時系列のデータである時系列データに基づき、学習を行う学習処理を、コンピュータに実行させるプログラムにおいて、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記入力時系列パターン記憶ネットワークそれぞれを、前記入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む前記入力データの、対応するチャネルの前記サブ入力データに基づいて、自己組織的に更新するとともに、複数の前記出力時系列パターン記憶ネットワークそれぞれを、前記出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む前記出力データの、対応するチャネルの前記サブ出力データに基づいて、自己組織的に更新する学習ステップと、
前記入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新ステップと
を含むことを特徴とする学習処理を、コンピュータに実行させるプログラム。
時系列のデータである時系列データに基づき、学習を行う学習装置において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける１の前記入力時系列パターン記憶ネットワークを、前記入力データに基づいて、自己組織的に更新するとともに、複数の前記出力時系列パターン記憶ネットワークそれぞれを、前記出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む前記出力データの、対応するチャネルの前記サブ出力データに基づいて、自己組織的に更新する学習手段と、
前記入力時系列パターン記憶ネットワークのノードのうちの、前記入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新手段と
を備えることを特徴とする学習装置。
前記結合関係更新手段は、前記入力時系列パターン記憶ネットワークの入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を、その出力時系列パターン記憶ネットワークの各ノードと前記出力勝者ノードとの間の所定の距離に基づいて更新するとともに、前記出力時系列パターン記憶ネットワークの出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を、その入力時系列パターン記憶ネットワークの各ノードと前記入力勝者ノードとの間の所定の距離に基づいて更新する
ことを特徴とする請求項１２に記載の学習装置。
前記出力時系列パターン記憶ネットワークどうしのノードも結合しており、
前記結合関係更新手段は、さらに、１の出力時系列パターン記憶ネットワークのノードのうちの、前記１の出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである第１の出力勝者ノードと、他の１の出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記他の１の出力時系列パターン記憶ネットワークのノードのうちの、前記他の１の出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである第２の出力勝者ノードと、前記１の出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する
ことを特徴とする請求項１２に記載の学習装置。
時系列のデータである時系列データに基づき、学習を行う学習方法において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける１の前記入力時系列パターン記憶ネットワークを、前記入力データに基づいて、自己組織的に更新するとともに、複数の前記出力時系列パターン記憶ネットワークそれぞれを、前記出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む前記出力データの、対応するチャネルの前記サブ出力データに基づいて、自己組織的に更新する学習ステップと、
前記入力時系列パターン記憶ネットワークのノードのうちの、前記入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新ステップと
を含むことを特徴とする学習方法。
時系列のデータである時系列データに基づき、学習を行う学習処理を、コンピュータに実行させるプログラムにおいて、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける１の前記入力時系列パターン記憶ネットワークを、前記入力データに基づいて、自己組織的に更新するとともに、複数の前記出力時系列パターン記憶ネットワークそれぞれを、前記出力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ出力データを含む前記出力データの、対応するチャネルの前記サブ出力データに基づいて、自己組織的に更新する学習ステップと、
前記入力時系列パターン記憶ネットワークのノードのうちの、前記入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、その出力時系列パターン記憶ネットワークに対応するチャネルの前記サブ出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新ステップと
を含むことを特徴とする学習処理を、コンピュータに実行させるプログラム。
時系列のデータである時系列データに基づき、学習を行う学習装置において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記入力時系列パターン記憶ネットワークそれぞれを、前記入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む前記入力データの、対応するチャネルの前記サブ入力データに基づいて、自己組織的に更新するとともに、１の前記出力時系列パターン記憶ネットワークを、前記出力データに基づいて、自己組織的に更新する学習手段と、
前記入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、前記出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新手段と
を備えることを特徴とする学習装置。
前記結合関係更新手段は、前記入力時系列パターン記憶ネットワークの入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を、その出力時系列パターン記憶ネットワークの各ノードと前記出力勝者ノードとの間の所定の距離に基づいて更新するとともに、前記出力時系列パターン記憶ネットワークの出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を、その入力時系列パターン記憶ネットワークの各ノードと前記入力勝者ノードとの間の所定の距離に基づいて更新する
ことを特徴とする請求項１７に記載の学習装置。
前記入力時系列パターン記憶ネットワークどうしのノードも結合しており、
前記結合関係更新手段は、さらに、１の入力時系列パターン記憶ネットワークのノードのうちの、前記１の入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである第１の入力勝者ノードと、他の１の入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記他の１の入力時系列パターン記憶ネットワークのノードのうちの、前記他の１の入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである第２の入力勝者ノードと、前記１の入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する
ことを特徴とする請求項１７に記載の学習装置。
時系列のデータである時系列データに基づき、学習を行う学習方法において、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記入力時系列パターン記憶ネットワークそれぞれを、前記入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む前記入力データの、対応するチャネルの前記サブ入力データに基づいて、自己組織的に更新するとともに、１の前記出力時系列パターン記憶ネットワークを、前記出力データに基づいて、自己組織的に更新する学習ステップと、
前記入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、前記出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新ステップと
を含むことを特徴とする学習方法。
時系列のデータである時系列データに基づき、学習を行う学習処理を、コンピュータに実行させるプログラムにおいて、
所定の制御対象に入力される入力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される複数の入力時系列パターン記憶ネットワークと、
前記所定の制御対象が前記入力データに対して出力する出力データとしての前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される１の出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークの前記ノードと、前記出力時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記入力時系列パターン記憶ネットワークそれぞれを、前記入力時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ入力データを含む前記入力データの、対応するチャネルの前記サブ入力データに基づいて、自己組織的に更新するとともに、１の前記出力時系列パターン記憶ネットワークを、前記出力データに基づいて、自己組織的に更新する学習ステップと、
前記入力時系列パターン記憶ネットワークのノードのうちの、その入力時系列パターン記憶ネットワークに対応するチャネルの前記サブ入力データに最も適合するノードである入力勝者ノードと、前記出力時系列パターン記憶ネットワークの各ノードとの結合関係を更新するとともに、前記出力時系列パターン記憶ネットワークのノードのうちの、前記出力データに最も適合するノードである出力勝者ノードと、前記入力時系列パターン記憶ネットワークの各ノードとの結合関係を更新する結合関係更新ステップと
を含むことを特徴とする学習処理を、コンピュータに実行させるプログラム。
時系列のデータである時系列データに対して、他の時系列データを生成する生成装置において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記第１の時系列パターン記憶ネットワークそれぞれについて、前記第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む前記時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定手段と、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定手段と、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成手段と
を備えることを特徴とする生成装置。
１の前記第１の時系列パターン記憶ネットワークの前記ノードは、１の前記第２の時系列パターン記憶ネットワークのみの前記ノードと結合している
ことを特徴とする請求項２２に記載の生成装置。
１の前記第２の時系列パターン記憶ネットワークの前記ノードは、１の前記第１の時系列パターン記憶ネットワークのみの前記ノードと結合している
ことを特徴とする請求項２２に記載の生成装置。
１の前記第１の時系列パターン記憶ネットワークの前記ノードは、２以上の前記第２の時系列パターン記憶ネットワークそれぞれの前記ノードと結合している
ことを特徴とする請求項２２に記載の生成装置。
１の前記第２の時系列パターン記憶ネットワークの前記ノードは、２以上の前記第１の時系列パターン記憶ネットワークそれぞれの前記ノードと結合している
ことを特徴とする請求項２２に記載の生成装置。
複数の前記第１の時系列パターン記憶ネットワークの前記ノードは、すべての前記第２の時系列パターン記憶ネットワークの前記ノードと結合している
ことを特徴とする請求項２２に記載の生成装置。
前記生成ノード決定手段は、１の前記第２の時系列パターン記憶ネットワークにつき、多くとも１の前記ノードを、前記生成手段において前記他の時系列データを生成するのに用いる前記生成ノードとして決定する
ことを特徴とする請求項２２に記載の生成装置。
前記生成ノード決定手段は、
１の前記第１の時系列パターン記憶ネットワークのノードと結合している複数の前記第２の時系列パターン記憶ネットワークそれぞれのノードの中で、１の前記第１の時系列パターン記憶ネットワークのノードとの結合が最強のノードのノード数を、複数の前記第２の時系列パターン記憶ネットワークそれぞれについて求め、
１の前記第１の時系列パターン記憶ネットワークのノードとの結合が最強のノードのノード数が最も多い前記第２の時系列パターン記憶ネットワークのノードの中から、１の前記第１の時系列パターン記憶ネットワークの勝者ノードとの結合が最強のノードを、前記生成ノードとして決定する
ことを特徴とする請求項２２に記載の生成装置。
前記第１の時系列パターン記憶ネットワークどうしのノードも結合しており、
前記生成ノード決定手段は、
１の第１の時系列パターン記憶ネットワークのノードにおいて、前記１の第１の時系列パターン記憶ネットワークに対応するチャネルの前記サブ時系列データに最も適合する前記勝者ノード、
または、他の１の第１の時系列パターン記憶ネットワークにおいて、前記他の１の第１の時系列パターン記憶ネットワークに対応するチャネルの前記サブ時系列データに最も適合する前記勝者ノードとの結合が最強の、前記１の第１の時系列パターン記憶ネットワークのノード
との結合が最強の、前記第２の時系列パターン記憶ネットワークのノードを、前記生成ノードとして決定する
ことを特徴とする請求項２２に記載の生成装置。
前記第２の時系列パターン記憶ネットワークどうしのノードも結合しており、
前記生成ノード決定手段は、
１の勝者ノードとの結合が最強の、１の第２の時系列パターン記憶ネットワークのノード、
または、他の１の第２の時系列パターン記憶ネットワークにおいて他の１の勝者ノードとの結合が最強のノードとの結合が最強の、前記１の第２の時系列パターン記憶ネットワークのノード
を、前記生成ノードとして決定する
ことを特徴とする請求項２２に記載の生成装置。
時系列のデータである時系列データに対して、他の時系列データを生成する生成方法において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記第１の時系列パターン記憶ネットワークそれぞれについて、前記第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む前記時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定ステップと、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定ステップと、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成ステップと
を含むことを特徴とする生成方法。
時系列のデータである時系列データに対して、他の時系列データを生成する生成処理を、コンピュータに実行させるプログラムにおいて、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記第１の時系列パターン記憶ネットワークそれぞれについて、前記第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む前記時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定ステップと、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定ステップと、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成ステップと
を含むことを特徴とする生成処理を、コンピュータに実行させるプログラム。
時系列のデータである時系列データに対して、他の時系列データを生成する生成装置において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける１の前記第１の時系列パターン記憶ネットワークについて、前記時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定手段と、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定手段と、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成手段と
を備えることを特徴とする生成装置。
前記生成ノード決定手段は、
前記第１の時系列パターン記憶ネットワークのノードと結合している複数の前記第２の時系列パターン記憶ネットワークそれぞれのノードの中で、前記第１の時系列パターン記憶ネットワークのノードとの結合が最強のノードのノード数を、複数の前記第２の時系列パターン記憶ネットワークそれぞれについて求め、
前記第１の時系列パターン記憶ネットワークのノードとの結合が最強のノードのノード数が最も多い前記第２の時系列パターン記憶ネットワークのノードの中から、前記第１の時系列パターン記憶ネットワークの勝者ノードとの結合が最強のノードを、前記生成ノードとして決定する
ことを特徴とする請求項３４に記載の生成装置。
前記第２の時系列パターン記憶ネットワークどうしのノードも結合しており、
前記生成ノード決定手段は、
１の第２の時系列パターン記憶ネットワークにおいて、前記勝者ノードとの結合が最強のノード、
または、１の第２の時系列パターン記憶ネットワークにおいて、前記勝者ノードとの結合が最強のノードとの結合が最強の、他の１の第２の時系列パターン記憶ネットワークのノード
を、前記生成ノードとして決定する
ことを特徴とする請求項３４に記載の生成装置。
時系列のデータである時系列データに対して、他の時系列データを生成する生成方法において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける１の前記第１の時系列パターン記憶ネットワークについて、前記時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定ステップと、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定ステップと、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成ステップと
を含むことを特徴とする生成方法。
時系列のデータである時系列データに対して、他の時系列データを生成する生成処理を、コンピュータに実行させるプログラムにおいて、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける１の前記第１の時系列パターン記憶ネットワークについて、前記時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定ステップと、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定ステップと、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成ステップと
を含むことを特徴とする生成処理を、コンピュータに実行させるプログラム。
時系列のデータである時系列データに対して、他の時系列データを生成する生成装置において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記第１の時系列パターン記憶ネットワークそれぞれについて、前記第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む前記時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定手段と、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定手段と、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成手段と
を備えることを特徴とする生成装置。
前記第１の時系列パターン記憶ネットワークどうしのノードも結合しており、
前記生成ノード決定手段は、
１の第１の時系列パターン記憶ネットワークのノードにおいて、前記１の第１の時系列パターン記憶ネットワークに対応するチャネルの前記サブ時系列データに最も適合する前記勝者ノード、
または、他の１の第１の時系列パターン記憶ネットワークにおいて、前記他の１の第１の時系列パターン記憶ネットワークに対応するチャネルの前記サブ時系列データに最も適合する前記勝者ノードとの結合が最強の、前記１の第１の時系列パターン記憶ネットワークのノード
との結合が最強の、前記第２の時系列パターン記憶ネットワークのノードを、前記生成ノードとして決定する
ことを特徴とする請求項３９に記載の生成装置。
時系列のデータである時系列データに対して、他の時系列データを生成する生成方法において、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記第１の時系列パターン記憶ネットワークそれぞれについて、前記第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む前記時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定ステップと、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定ステップと、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成ステップと
を含むことを特徴とする生成方法。
時系列のデータである時系列データに対して、他の時系列データを生成する生成処理を、コンピュータに実行させるプログラムにおいて、
前記時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである複数の第１の時系列パターン記憶ネットワークと、
前記他の時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークである１の第２の時系列パターン記憶ネットワークと
を有し、
前記第１の時系列パターン記憶ネットワークの前記ノードと、前記第２の時系列パターン記憶ネットワークの前記ノードとが結合されている
結合モデルにおける複数の前記第１の時系列パターン記憶ネットワークそれぞれについて、前記第１の時系列パターン記憶ネットワークの数と同一の数のチャネルのサブ時系列データを含む前記時系列データのうちの、対応するチャネルのサブ時系列データに最も適合するノードである勝者ノードを決定する勝者ノード決定ステップと、
前記第２の時系列パターン記憶ネットワークのノードの中から、前記勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定ステップと、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成ステップと
を含むことを特徴とする生成処理を、コンピュータに実行させるプログラム。